Bazı araştırmacılar, Openai’nin dev ve pahalı son modelinin, teknoloji şirketlerinin sürekli olarak ölçeklenerek ilerleme kaydetmeye devam edemeyeceğinin bir işareti olduğunu düşünüyor

GPT-4.5, Openai’nin en son Chatbot modelidir
Openai, en son AI modeli GPT-4.5’i tanıttı, ancak firmanın patronu, ona güç sağlamak için donanım bittiğini söylüyor. Daha büyük AI artık ölçeklendirilemezse, o zaman teknolojinin hızlı ilerlemesinin sonuna ve belki de bir balonun patlamasına bakıyor muyuz?
Kesinlikle Openai’de planlandığı gibi gitmediğine dair işaretler var. CEO Sam Altman, 12 Şubat kadar yakın bir tarihte, şirketin ürün teklifinin kafa karıştırıcı bir resim yarattığını – Openai’nin 15 farklı AI modeli sunduğunu ve bunun yerine “sihirli birleşik zekaya” dönme arzusunu dile getirdiğini kabul etti. Bu birleşik modelin GPT-5 olması amaçlanmıştı ve Openai’nin ödemeyen müşterileri bile sınırlı bir seviyede sunulacaktı.
Ancak dün bir lansman etkinliğinde Openai bunun yerine GPT-4’ün aşamalı olarak güncellenmiş bir sürümünü sundu. GPT-4.5 adlı bir şirket blog yazısı “henüz sohbet için en büyük ve en iyi modeli” olarak adlandırdı, ancak Altman, bilgi işlem kapasitesinin eksikliğinin sadece az sayıda müşteriye ürünü sunabileceği anlamına geldiğini söyledi. “Bu dev, pahalı bir model,” dedi Altman. “Çok büyüyoruz ve GPU’ların dışındayız (AI için bilgi işlem gücünü sağlayan işlemciler).”
Bunun bir sonucu olarak, Openai yeni modelini yüksek fiyatlandırıyor. GPT-4.5, 1.000.000 jeton girdi başına 75 $ ve çıktı başına 150 $ ‘dır. En ucuz modeli sırasıyla 0.15 $ ve 0.60 $ ‘dır.
Altman’ın yorumları, GPT-4.5’in GPT-4’ten 10 kattan daha verimli olmasına rağmen, önceki modellerden çok daha büyük olduğunu gösteriyor. Openai, yorum veya açıklama talebine yanıt vermedi.
Yapay zekada hızlı ilerleme sağlayan sürekli ölçeklendirme sonsuza dek devam edemez Sasha Luccioni’nin AI şirketi sarılma yüzünde diyor. “Mevcut eğitim ve LLM’leri (büyük dil modelleri) dağıtmanın yolu büyük ölçüde verimsizdir-aslında kaba zorlayıcı zeka. Tabii ki bu bir duvara çarpmak zorunda ”diyor.
Altman, GPT-4.5’in “daha önce hissetmediğim bir sihir” olduğunu iddia ederken, Luccioni ikna olmamıştı. Luccioni, “’Sihir’ ve ‘agi’ (yapay genel zeka) gibi terimleri kullanmak, bu modelleri yapan insanları tamamen güçlü gösteriyor” diyor. “Ama Altman’ın Oz büyücüsü olduğunu ve perdenin arkasına bakmamamız için bizi rahatsız ediyor.”
Gerçekten de, AI şirketleri, kısmen kurumsal sırların korunması nedeniyle, belki de eğitim verilerinin kaynaklarını ortaya çıkarmak istemedikleri için modellerini bilimsel çalışmaya açma konusunda isteksizdirler.
Tam donanım gereksinimlerini, enerji kullanımı veya maliyeti ortaya çıkarma konusunda da benzer şekilde cageey. Deepseek gibi detaylar yayınlandığında-en son modellerin performansını maliyet ve hesaplama gücünün bir kısmında eşleştirdiği iddia edilen Çin modeli-doğrulamak zor. Gerçekte, endüstri objektif analiz için aşılamaz.
İngiltere, Surrey Üniversitesi’ndeki Andrew Rogoyski, endüstrinin son beş yıldaki yaklaşımının, daha büyük büyümenin, daha fazla enerji tüketmenin ve daha fazla eğitim verisinde beslenmenin, kaçınılmaz olarak bir noktada kısıtlamalara çarpacağını, ancak bunların üstesinden gelme veya yan adım atma çabaları olduğunu söyledi. Rogoyski, “Maliyet çok yüksekse (ve) hesaplama gereksinimi çok yüksekse, o zaman onu bir iş olarak yaşayamaz hale getiriyor” diyor. “Yani bunu düşürmek herkesin çıkarına.”
Rogoyski mevcut LLM’leri AI’nın uzun vadeli geleceği olarak görmüyor. İşlevselliği korurken yapay zeka modellerini zayıflatan damıtma gibi teknikler, gelecekteki modelleri daha verimli ve daha ucuz hale getirebilir. Ancak ufukta, nöromorfik hesaplama, özel yapım silikon yongaları ve hatta kuantum bilgisayarlar da dahil olmak üzere mevcut modelleri daha hızlı çalıştırabilecek yeni mimariler de var.
Rogoyski, şirketlerin iş dünyasında kalacak kadar hızlı kalıp kalamayacağı “64 trilyon dolarlık soru” diyor. “Şu anda biraz Darwinci bir fikir çorbası ve hayatta kalan ve gelişen ve ölenler olacak.”