Kuantum devreleri, yapay zekanın minimum yeni parametrelerle bellek sınırlamalarını aşmasına yardımcı oluyor - Haberler

Milyonlarca insan için büyük dil modelleri (LLM) tarafından desteklenen sohbet robotları artık günlük yaşamın önemli bir özelliğidir. Bu yapay zeka sistemleri hızlı bir şekilde büyüyor, ancak bunların ölçeklendirilmesi giderek daha maliyetli ve kaynak yoğun hale geliyor.

Yeni bir ön baskı aracılığıyla arXiv İspanya’nın San Sebastián kentindeki Multiverse Computing’den Borja Aizpurua liderliğindeki bir ekip olan sunucu, kuantum hesaplamayı kullanarak Yüksek Lisans Performansını artırmanın bir yolunu buldu. Onların yaklaşımı, soruna daha fazla donanım atmaktan ziyade daha akıllı bir alternatif sunabilir.

Parametre sorunu

ChatGPT ve Claude’a güç veren LLM’ler, modelin metni nasıl işlediğini ve ürettiğini birlikte belirleyen çok sayıda ayarlanabilir parametreyi öğrenerek çalışır. Bir model ne kadar çok parametreye sahip olursa, o kadar iyi performans gösterir.

Ancak her parametrenin depolanması için fiziksel bellek gerekir ve bu modeller büyüdükçe, bellek talepleri de onlarla birlikte büyür ve yönetimi giderek zor ve pahalı hale gelir. Örneğin GPT-5.5’in iki ila beş trilyon arasında parametre içerdiği tahmin ediliyor.

Kuantum devrelerine dönüş

Çoklu Evren Bilgi İşlem ekibi, bu kısıtlamaların üstesinden gelmek için kuantum hesaplamaya yöneldi. Çok sayıda yeni klasik parametre eklemek yerine, önceden eğitilmiş bir LLM’nin iç işleyişine küçük kuantum devre blokları yerleştirdiler.

Bu kuantum blokları karmaşık matematiksel ilişkileri son derece kompakt bir biçimde kodlayabildiğinden, normalde çok daha fazla geleneksel parametre gerektirecek şeyleri başarabilirler. Ortaya çıkan sistem bir hibrittir: orijinal Yüksek Lisans standart bir bilgisayarda çalışırken, kuantum bileşenleri IBM’in 156 kübitlik süper iletken kuantum işlemcisinde yürütülür.

Performansı artırma

Aizpurua’nın ekibi bu yaklaşımı Meta tarafından geliştirilen sekiz milyar parametreli bir model olan Llama 3.1 8B’ye uyguladığında, yalnızca 6.000 ekstra parametre eklerken şaşkınlıkta %1,4’lük bir azalma (bir modelin sıradaki bir sonraki kelimeyi ne kadar güvenilir bir şekilde tahmin ettiğinin önemli bir ölçüsü) elde etti. Bağlam açısından bu, yüzde on binde birden daha az bir artışı temsil ediyor.

Ekip ayrıca platformlarını, sistematik olarak çalışmanın daha kolay takip edilebilir olması nedeniyle seçilen 135 milyon parametreli daha küçük bir model olan SmolLM2 üzerinde de test etti. Burada, kuantum bileşenlerinin boyutu arttıkça performansın tutarlı bir şekilde arttığını ve kuantumla geliştirilmiş modelin, aynı modelin tamamen klasik iki versiyonunun yanlış yaptığı soruları doğru şekilde yanıtlayabildiğini buldular.

Gelecekteki işlemcilere hazırlanıyor

Şimdilik araştırmacılar, performans kazanımlarının mütevazı olduğunu ve mevcut kuantum donanımının yetenekleriyle sınırlı olduğunu kabul ediyor. Ancak kuantum geliştirmenin gerçek, yaygın olarak kullanılan bir model üzerinde işe yarayabileceğini gösterirken, sonuçları zaten umut verici.

Kuantum işlemciler daha güçlü ve güvenilir hale geldikçe ekip, iyileştirmelerin de buna göre ölçekleneceğine inanıyor; bu da muhtemelen alanın geleceğini belirlemeyi tehdit eden kontrolden çıkan altyapı maliyetleri olmadan daha yetenekli yapay zeka geliştirmek için temelde yeni bir yol açacak.

Sizin için yazarımız Sam Jarman tarafından yazılan, Gaby Clark tarafından düzenlenen ve Robert Egan tarafından doğrulukları kontrol edilen ve gözden geçirilen bu makale, insanların dikkatli çalışmasının sonucudur. Bağımsız bilim gazeteciliğini canlı tutmak için sizin gibi okuyuculara güveniyoruz. Bu raporlama sizin için önemliyse lütfen bağış yapmayı düşünün (özellikle aylık). Bir alacaksın reklamsız bir teşekkür olarak hesaplayın.

Bu hikayenin arkasında kim var?

Sam Jarman

Science X’e katkıda bulunan yazar; astrofizik, yeni malzemeler, tıbbi görüntüleme ve biyo-ilhamlı teknolojiyi kapsar.

Tam profil →

Gaby Clark

İngilizce Yüksek Lisans, 2021’den beri yüksek öğrenim ve sağlık içeriğinde deneyime sahip metin editörü. Güvenilir bilim haberlerine adanmıştır.

Tam profil →

Robert Egan

Matematiksel biyoloji alanında lisans, yaratıcı yazarlıkta yüksek lisans. Bilim ve dil üzerine eşsiz bakış açılarıyla çok seyahat ettim.

Tam profil →

Parametre sorunu

Kuantum devrelerine dönüş

Performansı artırma

Gelecekteki işlemcilere hazırlanıyor

Sam Jarman

Gaby Clark

Robert Egan

Yorum yapın Yanıtı iptal et