Milyonlarca insan için büyük dil modelleri (LLM) tarafından desteklenen sohbet robotları artık günlük yaşamın önemli bir özelliğidir. Bu yapay zeka sistemleri hızlı bir şekilde büyüyor, ancak bunların ölçeklendirilmesi giderek daha maliyetli ve kaynak yoğun hale geliyor.
Yeni bir ön baskı aracılığıyla arXiv İspanya’nın San Sebastián kentindeki Multiverse Computing’den Borja Aizpurua liderliğindeki bir ekip olan sunucu, kuantum hesaplamayı kullanarak Yüksek Lisans Performansını artırmanın bir yolunu buldu. Onların yaklaşımı, soruna daha fazla donanım atmaktan ziyade daha akıllı bir alternatif sunabilir.
Parametre sorunu
ChatGPT ve Claude’a güç veren LLM’ler, modelin metni nasıl işlediğini ve ürettiğini birlikte belirleyen çok sayıda ayarlanabilir parametreyi öğrenerek çalışır. Bir model ne kadar çok parametreye sahip olursa, o kadar iyi performans gösterir.
Ancak her parametrenin depolanması için fiziksel bellek gerekir ve bu modeller büyüdükçe, bellek talepleri de onlarla birlikte büyür ve yönetimi giderek zor ve pahalı hale gelir. Örneğin GPT-5.5’in iki ila beş trilyon arasında parametre içerdiği tahmin ediliyor.
Kuantum devrelerine dönüş
Çoklu Evren Bilgi İşlem ekibi, bu kısıtlamaların üstesinden gelmek için kuantum hesaplamaya yöneldi. Çok sayıda yeni klasik parametre eklemek yerine, önceden eğitilmiş bir LLM’nin iç işleyişine küçük kuantum devre blokları yerleştirdiler.
Bu kuantum blokları karmaşık matematiksel ilişkileri son derece kompakt bir biçimde kodlayabildiğinden, normalde çok daha fazla geleneksel parametre gerektirecek şeyleri başarabilirler. Ortaya çıkan sistem bir hibrittir: orijinal Yüksek Lisans standart bir bilgisayarda çalışırken, kuantum bileşenleri IBM’in 156 kübitlik süper iletken kuantum işlemcisinde yürütülür.
Performansı artırma
Aizpurua’nın ekibi bu yaklaşımı Meta tarafından geliştirilen sekiz milyar parametreli bir model olan Llama 3.1 8B’ye uyguladığında, yalnızca 6.000 ekstra parametre eklerken şaşkınlıkta %1,4’lük bir azalma (bir modelin sıradaki bir sonraki kelimeyi ne kadar güvenilir bir şekilde tahmin ettiğinin önemli bir ölçüsü) elde etti. Bağlam açısından bu, yüzde on binde birden daha az bir artışı temsil ediyor.
Ekip ayrıca platformlarını, sistematik olarak çalışmanın daha kolay takip edilebilir olması nedeniyle seçilen 135 milyon parametreli daha küçük bir model olan SmolLM2 üzerinde de test etti. Burada, kuantum bileşenlerinin boyutu arttıkça performansın tutarlı bir şekilde arttığını ve kuantumla geliştirilmiş modelin, aynı modelin tamamen klasik iki versiyonunun yanlış yaptığı soruları doğru şekilde yanıtlayabildiğini buldular.
Gelecekteki işlemcilere hazırlanıyor
Şimdilik araştırmacılar, performans kazanımlarının mütevazı olduğunu ve mevcut kuantum donanımının yetenekleriyle sınırlı olduğunu kabul ediyor. Ancak kuantum geliştirmenin gerçek, yaygın olarak kullanılan bir model üzerinde işe yarayabileceğini gösterirken, sonuçları zaten umut verici.
Kuantum işlemciler daha güçlü ve güvenilir hale geldikçe ekip, iyileştirmelerin de buna göre ölçekleneceğine inanıyor; bu da muhtemelen alanın geleceğini belirlemeyi tehdit eden kontrolden çıkan altyapı maliyetleri olmadan daha yetenekli yapay zeka geliştirmek için temelde yeni bir yol açacak.
Sizin için yazarımız Sam Jarman tarafından yazılan, Gaby Clark tarafından düzenlenen ve Robert Egan tarafından doğrulukları kontrol edilen ve gözden geçirilen bu makale, insanların dikkatli çalışmasının sonucudur. Bağımsız bilim gazeteciliğini canlı tutmak için sizin gibi okuyuculara güveniyoruz. Bu raporlama sizin için önemliyse lütfen bağış yapmayı düşünün (özellikle aylık). Bir alacaksın reklamsız bir teşekkür olarak hesaplayın.






