Araştırmacılar, sürdürülebilir üretken yapay zekanın yeni bir çağını başlatan optik üretken modellere öncülük ediyor - Haberler

Yapay Zeka (AI) ve fotonikler için büyük bir sıçrada, California Üniversitesi’ndeki araştırmacılar, Los Angeles (UCLA), geleneksel elektronik hesaplama yerine ışık fiziğini kullanarak yeni görüntüler üretebilen optik üretken modeller yarattı.

Yayınlandı DoğaÇalışma, üretken AI için, ölçeklenebilir, yüksek performanslı içerik oluşturma sağlarken enerji kullanımını önemli ölçüde azaltabilecek yeni bir paradigma sunuyor.

Difüzyon modelleri ve büyük dil modelleri de dahil olmak üzere üretken modeller, bugünün AI devriminin omurgasını oluşturur. Bu sistemler gerçekçi görüntüler, videolar ve insan benzeri metinler oluşturabilir, ancak hızlı büyümeleri dik bir maliyetle gelir: artan güç talepleri, büyük karbon ayak izleri ve giderek daha karmaşık donanım gereksinimleri. Bu tür modellerin yürütülmesi, büyük hesaplama altyapısı gerektirir ve uzun vadeli sürdürülebilirlikleriyle ilgili endişeleri artırır.

Profesör Aydogan Ozcan liderliğindeki UCLA ekibi farklı bir yol çizdi. Sadece dijital hesaplamaya güvenmek yerine, sistemleri üretken süreci optik olarak gerçekleştirir – tek bir geçişte görüntü üretmek için doğal paralelliği ve ışık hızını destekler. Bunu yaparak, ekip AI’nın en büyük darboğazlarından birini ele alıyor: performansı verimlilikle dengelemek.

Modeller, sığ bir dijital kodlayıcıyı bir sistem olarak eğitilmiş serbest alan kırılgan optik kod çözücü ile entegre eder. Rastgele gürültü ilk olarak uzamsal bir ışık modülatörüne yansıtılan ve lazer ışığı ile aydınlatılan “optik üretken tohumlar” olarak işlenir.

Bu ışık statik, önceden optimize edilmiş kırınma kod çözücü aracılığıyla yayılırken, hedef veri dağılımını istatistiksel olarak takip eden görüntüler üretir. Yüzlerce ila binlerce yinelemeli adım gerektiren dijital difüzyon modellerinin aksine, bu işlem bir anlık görüntüde görüntü üretimini elde ederek sığ bir dijital ağ ve hafif aydınlatma yoluyla ilk kodlamanın ötesinde ek bir hesaplama gerektirmez.

Yaklaşımlarını doğrulamak için ekip, çeşitli veri kümelerinde hem sayısal hem de deneysel sonuçlar gösterdi. Modeller, el yazısı rakamların, moda eşyalarının, kelebeklerin, insan yüzlerinin ve hatta Vincent Van Gogh’dan esinlenen sanat eserlerinin yeni görüntülerini üretti.

Optik olarak üretilen çıkışların, standart görüntü kalitesi metriklerine dayanan gelişmiş difüzyon modellerinden istatistiksel olarak karşılaştırılabilir olduğu gösterilmiştir. Ayrıca optik üretken AI yaklaşımının yaratıcı aralığının altını çizen çok renkli görüntüler ve yüksek çözünürlüklü van gogh tarzı sanat eserleri ürettiler.

Araştırmacılar iki çerçeve geliştirdiler: tek bir optik geçişte yeni görüntüler üreten anlık görüntü optik üretken modeller ve birbirini izleyen adımlar üzerinde çıkışları düzeltmek için dijital difüzyonu taklit eden yinelemeli optik üretken modeller. Bu esneklik, sadece kodlanmış tohumları ve önceden eğitilmiş kırılgan kod çözücüsünü güncelleyerek aynı optik donanım üzerinde birden fazla görevin gerçekleştirilmesine izin verir.

Ekip, verimlilik ve çok yönlülüğün ötesinde, optik üretken modellerin yerleşik gizlilik ve güvenlik sağlayabildiğini gösterdi. Rastgele gürültüden üretilen tek bir kodlanmış faz paterni, farklı dalga boyları ile aydınlatılabilir, her kanal sadece benzersiz bir şekilde eşleşen kırak yüzeyi ile çözülür.

Bu, dalga boyu çoğaltılmış içeriğin doğru kod çözücü olmadan erişilemediği güvenli, çoğullu görüntü üretimi oluşturur-çapraz konuşma nedeniyle standart serbest boşluk kod çözme ile mümkün olmayan bir özellik.

Bu fiziksel “anahtar kilit” mekanizması, yetkisiz izleyicilerin, bireysel yetkili kullanıcılara sunulan dalga boyu çok yönlü üretilen yeni içeriği yeniden yapılandıramamasını, güvenli iletişim, sahtecilikle mücadele ve kişiselleştirilmiş içerik sunumu için yeni fırsatlar sunamamasını sağlar.

Araştırmacılar ayrıca optik üretken modelleri kompakt, düşük güçlü tasarımların gerekli olduğu giyilebilir ve taşınabilir cihazlara entegre etme potansiyeline de işaret ediyor.

Hacimli modülatörleri nanofabrik pasif yüzeylerle değiştirerek veya entegre fotonik kullanılarak, bu modeller akıllı camlara, AR/VR kulaklıklara veya mobil platformlara gömülebilir. Bu tür uygulamalar, Giyilebilir ve Taşınabilir Sistemler aracılığıyla doğrudan kullanıcılara gelişmiş içerik oluşturma getirerek gerçek zamanlı, hareket halindeyken üretken yapay zeka sağlayacaktır.

Bu atılımın daha geniş etkileri önemlidir. Optik üretken modeller, AI’nın enerji ayak izini ölçekte düşürebilir, bu da ultra hızlı çıkarım hızlarının kilidini açarken sürdürülebilir dağıtımın mümkün olmasını sağlar. Potansiyel uygulamalar, düşük güç, dağıtılmış AI’nın giderek daha fazla ihtiyaç duyulduğu biyomedikal görüntüleme, teşhis, sürükleyici ortam ve kenar hesaplama arasında uzanır.

Çalışmanın kıdemli yazarı Profesör Aydogan Ozcan, “Çalışmalarımız optiklerin ölçekte üretken AI görevlerini yerine getirmek için kullanılabileceğini gösteriyor.” Dedi.

“Optik üretken modeller, ağır, yinelemeli dijital hesaplama ihtiyacını ortadan kaldırarak, günlük teknolojileri dönüştürebilecek enerji tasarruflu AI sistemleri anlık görüntüsüne kapıyı açıyor.”

İleriye baktığımızda, ekip nanofabrikasyon ve fotonik entegrasyondaki gelişmelerle etkinleştirilen kompakt, düşük maliyetli optik üretken cihazlar öngörüyor. Dijital darboğazlar olmadan çeşitli çıkışlar üretme yetenekleri, gelecekteki uygulamaları güvenli iletişim, gizliliği koruyan içerik sunumunda ve dağıtılmış AI sistemlerinde güçlendirebilir.

Bu çalışma ile UCLA araştırmacıları, makine yaratıcılığı için sürdürülebilir ve ölçeklenebilir bir geleceğe işaret ettiler, 21. yüzyılda hesaplamayı dönüştürebilecek fotonik ve yapay zekanın yakınsamasına işaret etti.

Çalışmanın yazarları arasında UCLA Samueli Mühendislik Okulu’ndan Dr. Shiqi Chen, Yuhang Li, Yuntian Wang, Hanlong Chen ve Dr. Aydogan Ozcan yer alıyor.