Moleküler makine öğrenimi (ML), moleküler etkileşimleri ve özellikleri hızla tahmin ederek ilaç keşfi, malzeme bilimi ve katalizör optimizasyonundaki kritik iş akışlarını desteklemektedir. Örneğin, ilaç keşfinde, ML modelleri ilaç adayları ve biyolojik hedefler arasındaki etkileşimleri tahmin ederek verimliliği büyük ölçüde artırır ve keşfi hızlandırır.
Yardımcı programlarına rağmen, basitleştirilmiş grafikler, üç boyutlu koordinatlar, metinsel formatlar ve küresel tanımlayıcılar dahil olmak üzere geleneksel moleküler gösterimler doğal sınırlamalara sahiptir. Bu yöntemler sıklıkla moleküler özellikleri ve davranışları doğru bir şekilde yakalamak için gerekli olan önemli kuantum-mekanik detayları göz ardı eder.
Tahmin görevleri daha karmaşık hale geldikçe, kuantum düzeyinde moleküler bilgileri açıkça içeren temsiller geliştirmek giderek daha önemlidir.
İçinde Doğa Makinesi İstihbaratı, Gabe Gomes, Daniil Boiko ve işbirlikçileri, kuantum-kimyasal etkileşimleri içeren yeni bir moleküler ML temsili öneriyorlar.
Boiko, Doktora Kimya Mühendisliği Öğrencisi ve Carnegie Mellon Üniversitesi’nde kimya mühendisliği ve kimya yardımcı doçenti olan Gomes, daha az veri ve yorumlanabilir, kimya infüzyonlu bir yaklaşım kullanarak modelleri geliştirme yolunu göstermektedir. (Doğal bağ) orbitalleri ve etkileşimleri hakkında ek bilgi içeren temsilleri, standart moleküler grafiklerden daha iyi performans gösterir.
Hesaplamalı kimyagerler, bir moleküldeki elektronların yerini ve davranışını tanımlamak için orbitalleri kullanırlar. Stereoelektronik etkiler, moleküler geometriyi, reaktiviteyi, stabiliteyi ve diğer çeşitli fiziksel ve kimyasal özellikleri doğrudan etkileyen bir molekülün orbitalleri ile elektronik etkileşimleri arasındaki uzamsal ilişkilerden kaynaklanır.
Gomes, son on yıldır moleküler yapı ve reaktivite arasındaki ilişkiyi, özellikle stereoelektronik etkilerin geliştirilmesine ve uygulamalarına odaklanmaktadır. Boiko ile yaptığı son çalışması, stereoelektronik infüzyonlu moleküler grafikler (SIMGS) oluşturmak için stereoelektronik bilgileri moleküler bir ML modeline kodlar.
Orbitaller arasındaki etkileşimlerin hesaplanması hesaplama açısından pahalı olabilir, bu yöntemleri orta büyüklükteki moleküller için yavaş ve daha büyük moleküller için inatsız hale getirebilir. Bu sınırlamayı ele almak için Boiko ve Gomes, standart bir moleküler grafiğe dayanan genişletilmiş gösterimi hızlı bir şekilde üretebilen ek bir model geliştirdiler.
Saatler veya günler süren yöntemlerle karşılaştırıldığında, yeni model saniyeler içinde çalışır. Küçük moleküller üzerinde eğitilir ve daha büyük moleküller için genişletilmiş grafikleri doğru bir şekilde tahmin edebilir.
Boiko, “Bu model, tüm peptitler ve proteinler için olduğu gibi normal kuantum kimya hesaplamaları mümkün olmadığında uygulanabilir” diyor. Boiko ve Gomes, başka bir boru hattı kullanarak kuantum kimyası hesaplamalarının çıktılarına yaklaşarak modellerinin daha önce erişilemeyen kimyasal içgörü kilidini açacağını umuyor.
Modelleri geliştirirken, Boiko ve Gomes’in yeni temsillerinin moleküler ML ve genel kimya toplulukları tarafından kolayca yorumlanabilmesi önemliydi. Moleküllerin stereoelektronik etkileşimlerini hızlı bir şekilde analiz etmek için bir web uygulaması oluşturdular ve araç da yöntemlerini daha erişilebilir hale getiriyor.
Uygulama, bağlar hakkında bilinen bilgiler içeren basit bir moleküler grafik uzatır; Atom yükleri ve yalnız çiftler dahil olmak üzere farklı hedefleri hesaplar; Bond orbitallerinin bir tanımını sağlar; ve bir yörünge etkileşimleri haritası çıkarır.
Boiko, “Kimyada çok küçük veri setlerimiz var” diyor. “Bu veri ölçeğinde, molekülde olup bitenlerin daha açık bir şekilde gösterilmesi çok önemlidir.”
Boiko ve Gomes, mevcut moleküler gösterimleri geliştirerek ve yeni kuantumla dolu yeni grafiklerin hızlı bir şekilde üretilmesini sağlayarak, moleküler makine öğreniminin yeteneklerini önemli ölçüde ilerletmiştir. Ekip, temsilin kapsamını tüm periyodik tabloya genişletmek ve spektroskopiden katalize kadar sayısız uygulamayı göstermek için çalışıyor.



