Yeni potansiyel bilimsel anlayışlar veya yönlendirmeler önermek için makine öğrenimi kullanıldığında, algoritmalar bazen fiziksel olarak sağlam olmayan çözümler sunar.
Örneğin, amino asit zincirlerinin 3 boyutlu protein yapılarına katlanacağı karmaşık yolları tahmin eden yapay zeka sistemi AlphaFold’u ele alalım. Sistem bazen, özellikle eğitim verilerinden önemli ölçüde farklı olan zincirler için kıvrımları tahmin etmesi istendiğinde “fiziksel olmayan” kıvrımlar (fizik yasalarına göre mantıksız olan konfigürasyonlar) önerir.
İlaç tasarımı alanında bu tür fiziksel olmayan sonuçları sınırlamak için Caltech’te Bren Bilgisayar ve Matematik Bilimleri Profesörü Anima Anandkumar ve meslektaşları, eğitimine basit bir fiziksel fikir katan ve algoritmanın performansını büyük ölçüde artıran NucleusDiff adlı yeni bir makine öğrenimi modeli tanıttı.
Anandkumar ve meslektaşları NucleusDiff’i, “Kimyada Makine Öğrenimi” özel özelliğinin bir parçası olarak ortaya çıkan bir makalede anlatıyorlar. Ulusal Bilimler Akademisi Bildirileri.
Yapı bazlı ilaç tasarımında amaç, biyolojik bir hedefe, genellikle bir proteine iyi bağlanarak aktivitede bir tür istenen değişikliğe neden olacak, ligand adı verilen küçük moleküller bulmaktır. İlaç tasarımı yapay zeka modelleri, bu tür protein-ligand eşleşmelerinin on binlerce örneğini içeren veri kümelerinin yanı sıra bağlanma afinitesi adı verilen önemli bir ölçüm olan birbirlerine ne kadar iyi bağlandıkları hakkındaki bilgiler üzerinde eğitilir. Ancak daha da önemlisi NucleusDiff bir adım daha ileri gidiyor.
Anandkumar şöyle açıklıyor: “Makine öğrenimi sayesinde model, iyi ciltlemeyi sağlayan birçok özelliği zaten öğreniyor ve şimdi tüm fiziksel olmayan şeyleri dışladığımızdan emin olmak için bazı basit fizikleri de dahil ediyoruz.”
NucleusDiff durumunda model, atomların üst üste binmesini veya çarpışmasını önleyen itici kuvvetler gibi fiziksel kavramları hesaba katarak atomların birbirlerinden uygun bir mesafede kalmasını sağlar.
Anandkumar, “Algoritmanın arkasında güzel bir fiziksel teori var ama aynı zamanda sezgisel” diyor. “Şaşırtıcı bir şekilde, bu kısıtlamalar olmadan, tüm bu yapay zeka modelleri çarpışma olduğunu ve atomların çok yaklaştığını tahmin etme eğiliminde. Basit fizik ekleyerek modelin doğruluğunu arttırdık.”
NucleusDiff, bir moleküldeki her bir atom çifti arasındaki mesafeyi hesaba katmak yerine (hesaplama açısından engelleyici bir şekilde pahalı olan bir görev), bir manifold veya zarfı tahmin eder; bu, atomların dağılımının ve moleküldeki elektronların olası konumlarının kaba bir tahminidir. Daha sonra bu manifold üzerinde izlenecek ana bağlantı noktaları oluşturarak atomların asla birbirine çok yaklaşmamasını sağlar.
Ekip, NucleusDiff’i, yaklaşık 100.000 protein-ligand bağlama kompleksi içeren CrossDocked2020 adlı bir eğitim veri seti üzerinde eğitti. Bunu bu komplekslerin 100’ü üzerinde test ettiler ve bağlanma afinitesi açısından son teknoloji ürünü modellerden önemli ölçüde daha iyi performans gösterdiğini ve aynı zamanda atomik çarpışma sayısını neredeyse sıfıra indirdiğini buldular.
Daha sonra araştırmacılar yeni modeli, eğitim veri setinde yer almayan daha yeni bir molekülün bağlanma afinitelerini tahmin etmek için kullandılar: COVİD-19 terapötik hedefi 3CL proteaz. Yine NucleusDiff, diğer önde gelen modellerle karşılaştırıldığında daha yüksek doğruluk ve atomik çarpışmalarda üçte iki oranında azalma gösterdi.
Bu çalışma, Anandkumar ve diğerlerinin AI4Science adlı bir girişim aracılığıyla, iklim tahmininden robotiğe, sismolojiden astrofizik modellemeye kadar çeşitli konular için oluşturulmuş veri odaklı yapay zeka modellerine daha fazla fizik entegre etme yönündeki kampüsteki daha büyük çabasına uyuyor.
Anandkumar, “Yalnızca eğitim verilerine güvenirsek, makine öğreniminin eğitim verilerinden önemli ölçüde farklı olan örnekler üzerinde iyi çalışmasını beklemiyoruz” diyor.
Aslında, çıktıların genellikle eğitim verilerinde sağlanan örneklerin kapsamına girmesinin makine öğreniminin standart bir ilkesi olduğunu söylüyor. Ancak ilaç tasarımı gibi birçok bilimsel alanda araştırmacılar yeni sonuçlar (örneğin yeni moleküller) arıyorlar.
Anandkumar, “Birçok makine öğreniminin, eğitim verilerinden farklı yeni örnekler üzerinde doğru sonuçlara ulaşmada başarısız olduğunu görüyoruz, ancak fiziği dahil ederek makine öğrenimini daha güvenilir hale getirebilir ve aynı zamanda çok daha iyi çalışabilir hale getirebiliriz” diyor.