Bilimsel literatürün hacmi büyümeye devam ettikçe, araştırmacılar milyonlarca araştırma makalesini gözden geçirmek ve yeni materyallerin keşfini hızlandırabilecek içgörüleri ortaya çıkarmak için yapay zekaya yöneliyorlar.
ABD Enerji Bakanlığı’nın (DOE) Argonne Ulusal Laboratuvarı’ndaki süper bilgisayarların desteğiyle Jacqueline Cole ve Cambridge Üniversitesi’ndeki ekibi, yapılandırılmış malzeme veritabanları oluşturmak için otomatik olarak bilimsel dergi makalelerini çıkaran AI araçları geliştiriyor. Bu veri kümeleri daha sonra malzeme araştırmalarını kolaylaştırmak için tasarlanmış özel dil modellerini eğitmek için kullanılır.
Moleküler mühendislik başkanı olduğu Cambridge’deki Malzeme Fiziği Kraliyet Mühendislik Fiziği’nde Kraliyet Mühendislik Mühendislik Araştırma Profesörlüğünü elinde tutan Cole, “Amaç laboratuvarınızda dijital asistan gibi bir şey olması” dedi. “Bilim adamlarını soruları cevaplayarak ve deneyleri yönlendirmeye ve araştırmalarına rehberlik etmek için geri bildirim sunarak tamamlayan bir araç.”
Cole’un Argonne Liderlik Bilgi İşlem Tesisinde (ALCF) çalışmaları neredeyse on yıl önce başladı. 2016 yılında, tesisin simülasyon, veri bilimi ve makine öğreniminin kesişiminde iş yüklerine verdiği desteği genişleten bir girişim olan ALCF Veri Bilimi Programı kapsamında ilk projelerden biri verildi. Şimdi emekli olan program, AI odaklı bilim için ALCF kaynakları kullanan araştırmacılar topluluğunun büyümesine yardımcı oldu ve bu gelişmekte olan alanı desteklemek için personel uzmanlığı ve yeteneklerini genişletti.
AT AI ve Makine Öğrenimi ekibi baş lideri Venkat Vishwanath, “Ekibi, Makine öğrenimini veri odaklı malzeme araştırmalarını ilerletmek için simülasyonlar ve deneysel sonuçlarla birleştirmek için ALCF bilgi işlem kaynaklarını ilk kullananlar arasındaydı.” Dedi. “ChemDataExtractor metin madencilik aracını geliştirmekten, araştırma makalelerinden otomatik veritabanları oluşturmaya kadar, çalışmaları malzeme tasarımını ve keşfini hızlandırmak için yeni yollar açtı.”
Ekibin yenilikçi çalışmasını tanıyarak Cole ve işbirlikçileri kısa süre önce Kraliyet Kimya Derneği’nin 2025 Materyal Kimya Horizon Ödülünü “Tasarımdan Cihaz Yaklaşımı pankromatik ortak duyarlı güneş hücreleri sağlar.” Bu araştırmaya dayanan Cole, enerji uygulamalarında, ışık tabanlı teknolojilerde ve makine mühendisliğinde kullanılan yeni materyalleri aramanı hızlandırmayı amaçlayan AI araçları geliştirmek için ALCF süper bilgisayarlarını kullanmaya devam etmiştir.
Cole’un son çalışmaları, genellikle büyük dil modellerini (LLMS) sıfırdan eğitmek için gerekli olan devasa bilgi işlem maliyetleri olmadan, malzeme araştırmalarını desteklemek için daha küçük, daha hızlı ve daha verimli AI modelleri geliştirmeye odaklanmıştır.
LLM’ler, insan dilini işlemek ve üretmek için tasarlanmış AI modelleridir. Bir LLM oluşturmak, modelin genel dil kalıplarını öğrenmesine yardımcı olmak için metin topluluğu gibi büyük bir veri kümesinde ön ayarla başlar. Bu işlem tipik olarak önemli bilgi işlem gücü gerektirir. Model eğitildikten sonra, araştırmacılar daha sonra doğru ve alakalı cevaplar sağladığından emin olmak için daha küçük, daha hedefli veri kümeleri kullanarak ince ayar yaparlar.
Maliyetli önleme sürecini atlamak için Cole ve arkadaşları, alana özgü malzemeler verilerinden büyük, yüksek kaliteli bir soru-cevap (Soru-Cevap) veri kümesi oluşturmak için bir yöntem geliştirdiler ve sonuçları yayınladılar. Dijital keşif. Yeni algoritmalar ve ChemDataExtractor aracını kullanarak, bir fotovoltaik malzeme veritabanını yüz binlerce Soru -Cevap çiftine dönüştürdüler. Bilgi damıtma olarak bilinen bu süreç, hazır AI modellerinin kolayca yutabileceği bir biçimde ayrıntılı malzeme bilgilerini yakalar.
Cole, “Önemli olan, bu yaklaşımın bilgi yükünü dil modelinin kendisinden kaydırmasıdır.” Dedi. “Her şeyi ‘bilmek’ için modele güvenmek yerine, küratörlü, yapılandırılmış bilgiye sorular ve cevaplar şeklinde doğrudan erişim sağlarız. Bu, önyargıyı tamamen atlayabilir ve yine de alana özgü faydaya ulaşabiliriz.”
Cole’un ekibi, genel metin üzerinde eğitilmiş çok daha büyük modelleri eşleştirmek veya daha iyi performans gösteren ve alana özgü görevlerde% 20’ye kadar daha fazla doğruluk elde eden daha küçük dil modellerini ince ayarlamak için Soru-Cevap çiftlerini kullandı. Çalışmaları güneş-hücre malzemelerine odaklanırken, yaklaşım diğer araştırma alanlarına geniş ölçüde uygulanabilir.
Bu çalışmanın yanı sıra ekip, malzeme biliminin belirli alanlarına göre uyarlanmış dil modelleri geliştirmek için ilgili çalışmalar sürdürdü. Bir makalede yayınlanan Bilimsel verilerCole’un ekibi, havacılık ve otomotiv gibi makine mühendisliği alanlarında yaygın olarak kullanılan malzemeler için büyük bir stres-gerinim özellikleri veritabanı oluşturdu.
Araştırmacılar ayrıca, stres-gerinim özellikleri hakkında soruları cevaplamak için eğitilmiş ve stres altında malzeme davranışını tahmin etmede standart araçlardan daha iyi performans gösteren bir dil modeli olan Mechbert’i geliştirdiler. Bu çalışma şurada yayınlandı Kimyasal Bilgi ve Modelleme Dergisi.
Aynı dergide de yayınlanan bir başka çalışmada, ekip, performansdan ödün vermeden geleneksel eğitim yöntemlerinden% 80 daha az hesaplama gücü kullanarak dil modellerinin optoelektronik için nasıl uyarlanacağını gösterdi.
Bu çabalar, Cole’un ekibinin son on yılda ALCF desteği ile yayınladığı birçok çalışma ile birlikte, AI’nın materyal bilim araştırmalarını nasıl dönüştürdüğünü göstermektedir. Son zamanlarda soru-cevap veren veri kümelerine odaklanmasıyla ekip, AI modellerini daha geniş bir topluluk için daha erişilebilir hale getirerek, deneycilere daha hassas ve ilgili destek sağlayabilecek AI araçlarının yolunu açıyor.
Cole, “Belki bir ekip saat 3’te hafif bir kaynak tesisinde yoğun bir deney yapıyor ve beklenmedik bir şey oluyor.” Dedi. “Hızlı bir cevaba ihtiyaçları var ve tüm bilimsel literatürü gözden geçirmek için zamanları yok. Eğer ilgili materyaller üzerinde eğitilmiş alana özgü bir dil modeli varsa, verileri yorumlamaya, kurulumlarını ayarlamaya ve deneyleri yolda tutmaya yardımcı olacak sorular sorabilirler.”
Nihayetinde Cole, bu yaklaşımın Materyal Biliminde AI’nın daha fazla demokratikleştirilmesine yardımcı olabileceğine inanıyor. “Bir dil modeli uzmanı olmanıza gerek yok,” dedi. “Refef dışı bir dil modeli alabilir ve belirli malzeme alanınız için sadece birkaç GPU, hatta kendi kişisel bilgisayarınızla ince ayar yapabilirsiniz. AI kullanma işlemini çok daha verimli hale getiren bir tak ve oynatma yaklaşımıdır.”
ALCF’nin güçlü süper bilgisayarları üzerinde ağır kaldırma yaparak Cole’un ekibi, malzeme bilim adamlarının sürekli büyüyen literatüre ayak uydurmasına, daha iyi deneyler tasarlamalarına ve keşifleri daha hızlı hale getirmelerine yardımcı olan daha hedefli ve kullanıcı dostu AI araçlarının geliştirilmesini ilerletiyor.



