GPT-5'in mütevazı kazanımları AI ilerlemesinin yavaşladığını gösteriyor - Haberler

Openai’nin en son büyük dil modeli, performansda görünüşte ezici gelişmeler sağladı ve AI endüstrisinin mevcut tasarımlarıyla önemli gelişmeler yapıp yapamayacağı hakkında sorulara yol açtı.

GPT-5, Openai’nin büyük dil modelinin en son sürümüdür

AI’nın son adımı ileriye dönük bir shuffle kadar dev bir sıçrama değil. Openai, başarısı chatgpt’i dünya hakimiyetine yönlendiren GPT-4’ü piyasaya sürdükten iki yıl sonra en yeni AI modeli GPT-5’i yayınladı. Ancak, benzer bir kabiliyetin vaatlerine rağmen, GPT-5, diğer önde gelen AI modellerinde çok az iyileşme gösteriyor, bu da endüstrinin daha akıllı AI sistemleri oluşturmak için yeni bir yaklaşıma ihtiyaç duyabileceğini ima ediyor.

Openai’nin kendi açıklamaları, GPT-5’i şirketin önceki modellerinden “istihbaratta önemli bir sıçrama” olarak doludur ve programlama, matematik, yazma, sağlık bilgileri ve görsel anlayışta belirgin iyileştirmeler gösterir. Ayrıca daha az sık görülen halüsinasyonlar vaat eder, bu da bir AI’nın yanlış bilgi doğru olarak sunduğu zamandır. “Karmaşık, ekonomik olarak değerli bilgi çalışması üzerindeki performans” ölçümünde, Openai, GPT – 5’in “kanun, lojistik, satış ve mühendislik dahil 40 meslekleri kapsayan görevler arasında“ vakaların yaklaşık yarısındaki uzmanlarla karşılaştırılabilir veya daha iyi ”olduğunu söylüyor.

Bununla birlikte, GPT-5’in genel kriterdeki performansı, Antropic’in Claude veya Google’ın İkizleri gibi diğer AI şirketlerinden lider modellerden önemli ölçüde daha iyi değil. GPT-4’te gelişti, ancak birçok kriter için fark GPT-3’ten GPT-4’e Sıçrama’dan daha küçük. Birçok ChatGPT müşterisi de etkilenmedi, GPT-5 örnekleri, sosyal medyada yaygın dikkat çeken görünüşte basit sorguları cevaplayamadı.

İngiltere, Edinburgh Üniversitesi’nde Mirella Lapata, “Birçok insan bir atılım olacağını umuyordu ve bu bir atılım değil” diyor. “Bu bir yükseltme ve biraz artan hissettiriyor.”

GPT-5’in performansının en kapsamlı önlemleri Openai’den geliyor, çünkü sadece modele tam erişime sahip. Danimarka’daki Kopenhag Üniversitesi’nde Anna Rogers, iç ölçüt hakkında birkaç ayrıntı halka açık hale getirildi. “Dolayısıyla, bilimsel bir iddia olarak ciddi şekilde tartışılabilecek bir şey değil.”

Modelin lansmanından önce bir basın brifinginde, Openai CEO SAM Altman, “GPT-5, ilk kez, doktora düzeyinde bir uzman gibi herhangi bir konuda bir uzmanla konuşmak gibi hissettiriyor.” Ancak bu, kriterler tarafından desteklenmiyor, diyor Rogers ve bir doktora doktorasının daha genel olarak zeka ile nasıl ilişkili olduğu belirsiz. Rogers, “Oldukça zeki insanlar mutlaka doktora dereceleri yoktur ve böyle bir dereceye sahip olmak mutlaka yüksek zekayı garanti etmez” diyor Rogers.

GPT-5’in mütevazı iyileştirmeleri, AI geliştiricileri için daha geniş zorlukların bir işareti olabilir. Yakın zamana kadar, bu tür büyük dil modellerinin (LLM’ler) daha fazla eğitim verisi ve bilgisayar gücüyle daha fazla yetenekli olduğu düşünülüyordu. Görünüşe göre bu artık en son modellerin sonuçlarından kaynaklanmıyor ve şirketler ChatGPT’ye güç verenlerden daha iyi AI sistem tasarımları bulamadı. “Herkes şu anda aynı tarife sahip ve tarifin ne olduğunu biliyoruz,” diyor Lapata, büyük miktarda veri ile eğitim öncesi modeller sürecine atıfta bulunuyor ve daha sonra eğitim sonrası süreçlerle ayarlamalar yapıyor.

Bununla birlikte, LLM’lerin durgunlaşmaya ne kadar yakın olduğunu söylemek zordur, çünkü GPT-5 gibi modellerin nasıl tasarlandığını tam olarak bilmiyoruz, diyor Nikos Aletras, İngiltere, İngiltere Üniversitesi. “Büyük dil modellerinin bir duvara çarptığı hakkında genellemeler yapmaya çalışmak erken olabilir. Bu iddiaları teknik detaylar hakkında herhangi bir bilgi olmadan gerçekten yapamayız.”

Openai, GPT-5’in yeni yönlendirme sistemi gibi ürününü daha verimli hale getirmek için başka yollar üzerinde çalışıyor. İnsanların hangi AI modelini kullanacağını seçebilecekleri CHATGPT örneklerinden farklı olarak, GPT-5 artık istekleri tarar ve bunları uygun miktarda hesaplama gücü kullanacak belirli bir modele yönlendirir.

Lapata, bu yaklaşımın daha yaygın olarak benimsenebilir. “Akıl yürütme modelleri çok fazla (hesaplama) kullanıyor ve bu zaman ve para gerektiriyor” diyor. “Bunu daha küçük bir modelle cevaplayabilirseniz, gelecekte daha fazlasını göreceğiz.” Ancak hareket, bazı chatgpt müşterilerini kızdırdı ve Altman’ın şirketin yönlendirme sürecini iyileştirmeye çalıştığını söylemesini istedi.

Geçen ay elit matematiksel ve kodlama yarışmalarında altın madalya skorları elde eden ayrı bir Openai modelinde AI’nın geleceği için daha olumlu işaretler var, bu da en üst düzey AI modellerinin bir yıl önce yapamayacağı bir şey. Modellerin nasıl çalıştığına dair ayrıntılar tekrar yetersiz olsa da, Openai çalışanları başarısının sistemin daha genel akıl yürütme yeteneklerine sahip olduğunu gösterdiğini söyledi.

Bu yarışmalar, antrenmanları sırasında görmedikleri verilerdeki modelleri test etmek için yararlıdır, ancak Aletras, ancak hala dar zeka testleri. Bir modelin bir bölgedeki performansını artırmak da başkalarında daha da kötüleştirebilir, diyor Lapata, ki bu takip edilmesi zor olabilir.

GPT-5’in önemli ölçüde iyileştiği bir alan, şimdi diğer modellerden çok daha ucuz olan fiyatıdır-örneğin Antropic’in en iyi Claude modeli, yazma sırasında aynı sayıda isteği işlemek için yaklaşık 10 kat daha pahalıdır. Ancak bu, Openai’nin geliri yeni veri merkezleri oluşturmaya ve işletmeye taahhüt ettikleri büyük maliyetleri karşılamıyorsa, uzun vadede kendi sorunlarını sunabilir. Lapata, “Fiyatlandırma deli. Çok ucuz, bunu nasıl karşılayabileceklerini bilmiyorum” diyor.

En iyi AI modelleri arasındaki rekabet, özellikle diğerlerinden önce çekilecek ilk modelin pazar payının çoğunu alacağı beklentisiyle şiddetlidir. Lapata, “Tüm bu büyük şirketler, kazanan olmaya çalışıyorlar ve bu zor” diyor. “Üç ay kazanansın.”