Yapay zekâda rekabet büyük modelden çıkarım verimliliğine kayıyor
Bir sonraki yapay zekâ yatırım döngüsünü tanımlayan soru artık kimin en büyük modeli geliştirdiği değil. En az kaynakla, en yüksek kaliteyi ve düşük maliyetli hizmeti kim sunabiliyor? Yapay zekâ sektörü, ilk trilyon dolarlık değerlemelerini “büyük modeller kazanır” varsayımıyla inşa etti. Ancak bu yaklaşım, artan maliyetlerin baskısıyla sarsılmaya başladı. Sektörde önde gelen şirketler, rekabette yeni bir eksene, yani çıkarım (inference) verimliliğine yöneliyor. Bu değişim, Microsoft’un Build 2026 etkinliğindeki duyurularında, Google’ın Gemini Flash fiyatlandırma stratejisinde ve kurumsal token bütçesi krizinde açıkça görülüyor. Perplexity CEO’su Aravind Srinivas, 3 Haziran 2026’da CNBC’ye yaptığı açıklamada, kazananın “kullanıcı başına watt başına en fazla değeri” sunan şirket olacağını söyledi. Ancak Srinivas’ın tanımladığı bu yarış, o ifadeyi kullanmadan çok önce başlamıştı.
Sektörde Ölçekten Verimliliğe Geçiş
Verimlilik odaklı bu dönüşüm tek bir şirketten gelmiyor; aynı anda birçok farklı noktadan ortaya çıkıyor. 2 Haziran’da Microsoft, Build 2026 geliştirici konferansında yedi yeni özel yapay zekâ modelini tanıttı. Amiral gemisi MAI-Thinking-1 modeli, ham kapasite yerine düşük token maliyetiyle öne çıkarıldı.
Microsoft, CNBC’ye yaptığı açıklamada, modellerini McKinsey için optimize ettikten sonra OpenAI’ın GPT 5-5 modeline kıyasla on kat daha iyi maliyet verimliliği sağladığını belirtti. Şirketin duyurusuna göre, MAI-Image-2-Efficient modeli maliyetleri %41 azaltırken, işlem hızını %22 artırdı. Microsoft’un stratejik motivasyonu da dikkat çekiyor: Kendi modellerini Azure altyapısında çalıştırarak OpenAI gibi üçüncü taraflara ödeme yapmaktan kaçınıyor ve böylece kâr marjını doğrudan artırıyor.
Alphabet ise benzer bir adımı farklı bir açıdan attı. Google, Google I/O 2026’da Gemini 3.5 Flash’ı tanıttı ve bu modeli kurumsal iş yükleri için daha düşük maliyetli, daha hızlı bir çıkarım seçeneği olarak konumlandırdı. Google’ın CEO’su, I/O sahnesinde şirketlerin “yıllık token bütçelerini çoktan aştığını” belirtti. Kurumsal yapay zekâ harcamalarının büyük kısmını kontrol eden iki şirketin aynı yönde hareket etmesi, tek bir CEO’nun açıklamasından daha güçlü bir sinyal olarak öne çıkıyor.
Yatırımcılar İçin Neden Önemli?
Bu değişim, değerlemeler açısından kritik öneme sahip. Anthropic Corporation bu hafta ABD’de halka arz için gizli başvuru yaptı ve özel piyasa değerlemesi yaklaşık 965 milyar dolar olarak bildirildi. CNBC’ye göre OpenAI’ın değerlemesi ise 850 milyar doları aştı. Her iki şirketin değerlemesi de sermaye yoğunluğu ve model büyüklüğünü ödüllendiren ölçek odaklı bir çerçeveye dayanıyor. Eğer verimlilik yeni standart haline gelirse, ham hesaplama harcamalarına verilen prim baskı altına girebilir.
Araştırma şirketi Artefact’ın aktardığı Ramp kurumsal harcama verilerine göre, milyon yapay zekâ token başına ortalama maliyet bir yıl içinde yaklaşık 10 dolardan 2,50 dolara düştü. Ancak kurumsal bütçeler küçülmüyor. Agentic yapay zekâ iş akışları, basit soru-cevap modellerine göre çok daha fazla token tüketiyor ve birim başına maliyet düşse de toplam hacim artıyor. Hem birim maliyeti hem de toplam tüketimi aynı anda azaltabilen şirketler, yapay zekâ harcamaları büyüdükçe yapısal bir avantaja sahip olacak.
Perplexity’nin Rolü ve Sınırları
Perplexity’nin bu tartışmaya katkısı gerçek ancak sınırlı. Şirket, 3 Haziran’da Personal Computer adlı ürünü piyasaya sürdü. Bu hibrit yerel-bulut yöneticisi, yapay zekâ görevlerini gerçek zamanlı olarak kullanıcının cihazı ile bulut modelleri arasında otomatik olarak yönlendiriyor. Ürün, basit iş yüklerini pahalı bulut altyapısından uzak tutarak görev başına hesaplama maliyetini düşürmeyi hedefliyor. Perplexity’nin özel piyasa değerlemesi son olarak 20 milyar dolar olarak bildirildi. Anthropic ve OpenAI ise bunun yaklaşık elli katı büyüklüğünde. Bu nedenle Srinivas’ın verimlilik vurgusu, aynı zamanda bir hayatta kalma stratejisi. Perplexity, sermaye harcama yarışını kazanamaz. Platformdan bağımsız yönlendirme modeli, rekabette kalabilmesi için en gerçekçi yol. Yatırımcılar, bu yaklaşımı kendi başına değerlendirmeli; bunun bağımsız bir piyasa analizi olarak tasarlanmadığını da göz önünde bulundurmalı.
Tüm yatırımcılar verimliliğin yapay zekâ değerlemelerinde ana unsur olacağına inanmıyor. Ölçek, geliştirici ekosistemleri, kurumsal benimseme ve veri ağı etkileriyle hâlâ önemli avantajlar sunuyor. OpenAI ve Anthropic’in değerlemeleri, sermaye piyasalarının artan işletme maliyetlerine rağmen pazar liderliğini ve büyüme potansiyelini ödüllendirmeye devam ettiğini gösteriyor. Bu senaryoda verimlilik, belirleyici unsurdan ziyade önemli bir rekabet faktörü olarak öne çıkıyor.
En Çok Yararlanan Altyapı Katmanı
Verimlilik odaklı bu değişim, model katmanına kıyasla altyapı katmanında daha net bir yatırım fırsatı sunuyor. Nvidia (NVDA), yapay zekâ hesaplamalarında merkezi rolünü koruyor. Ancak verimli yerel çıkarıma yönelik kalıcı eğilim, fırsat alanını genişletiyor. Microsoft’un MAI-Transcribe-1 modelinin, şirket açıklamalarına göre benzer üçüncü taraf alternatiflere kıyasla GPU maliyetini %50 azalttığı bildirildi. Investing.com’da yayımlanan bir analize göre, Google’ın özel Tensor İşlem Birimleri (TPU) Alphabet’e, OpenAI ve diğerlerinin kolayca kopyalayamayacağı yapısal bir maliyet avantajı sağlıyor.
Çıkarım gecikmesini ve güç tüketimini azaltan çip üreticileri ve ağ sağlayıcıları, şirketler deneysel yapay zekâ harcamalarından optimize edilmiş üretim uygulamalarına geçtikçe öne çıkacak. Bu verimlilik yarışı ne kadar uzun sürerse, amaca özel çıkarım donanımları genel amaçlı hesaplamalara göre o kadar değerli hale gelecek.
Sonuç
Yapay zekâda verimlilik yarışı, sektörün en büyük oyuncuları için giderek daha önemli bir stratejik odak haline geliyor. Bireysel yatırımcılar için asıl soru, hangi şirketin en iyi verimlilik metriğini bulduğu değil; yapay zekâ uygulamaları büyüdükçe hangi halka açık şirketlerin yapısal maliyet avantajına sahip olduğu. Microsoft’un özel model portföyü, Google’ın TPU altyapısı ve Nvidia’nın yeni nesil çıkarım platformları, bu avantajın en net örnekleri olarak öne çıkıyor. Perplexity ise özel bir şirket olarak çoğu bireysel yatırımcıya kapalı. Ancak CEO’sunun 3 Haziran’da ortaya koyduğu çerçeve, Anthropic’in potansiyel trilyon dolarlık halka arzı yaklaşırken ve verimlilik tartışması konferanslardan analist modellerine taşınırken, halka açık yapay zekâ hisselerini değerlendirmek için faydalı bir filtre sunuyor.
Bu içerik hazırlanırken faydalanılan kaynaklar: Benzinga