İlaç geliştirme hattı maliyetli ve uzun bir süreçtir. Yüksek potansiyele, seçiciliğe ve olumlu metabolik özelliklere sahip olan yüksek kaliteli “hit” bileşiklerin en erken aşamalarda belirlenmesi, maliyetin azaltılması ve klinik araştırmalara giden yolun hızlandırılması açısından önemlidir. Son on yıldır bilim insanları bu ilk tarama sürecini daha verimli hale getirmek için makine öğrenimine yöneldiler.
Bilgisayar destekli ilaç tasarımı, hedef proteinle etkileşime giren bileşikleri hesaplamalı olarak taramak için kullanılır. Bununla birlikte, bu etkileşimlerin gücünü doğru ve hızlı bir şekilde tahmin etme yeteneği hala bir zorluktur.
Vanderbilt Üniversitesi Tıp Fakültesi Temel Bilimler Fakültesi farmakoloji yardımcı doçenti Dr. Benjamin P. Brown, “Makine öğrenimi, altın standarttaki fizik tabanlı hesaplama yöntemlerinin doğruluğu ile daha basit ampirik puanlama fonksiyonlarının hızı arasındaki boşluğu kapatmayı vaat etti” dedi.
“Maalesef potansiyeli şu ana kadar gerçekleşmedi çünkü mevcut makine öğrenimi yöntemleri, eğitimleri sırasında maruz kalmadıkları kimyasal yapılarla karşılaştıklarında tahmin edilemeyecek şekilde başarısız olabiliyor ve bu da onların gerçek dünyadaki ilaç keşfi için kullanışlılığını sınırlıyor.”
Brown bir kitabın tek yazarıdır. Ulusal Bilimler Akademisi Bildirileri Bu “genellenebilirlik açığını” ele alan “Yapı bazlı protein-ligand afinite sıralaması için genelleştirilebilir bir derin öğrenme çerçevesi” başlıklı makale.
Makalede, hedefe yönelik bir yaklaşım önermektedir: Brown, bir proteinin ve bir ilaç molekülünün tüm 3 boyutlu yapısından öğrenmek yerine, yalnızca atom çiftleri arasındaki mesafeye bağlı fizikokimyasal etkileşimleri yakalayan, yalnızca etkileşim alanlarının bir temsilinden öğrenmekle kasıtlı olarak sınırlandırılan, göreve özgü bir model mimarisi önermektedir.
Brown, “Modeli bu görüşle sınırlandırarak, eğitim verilerinde mevcut olan ve yeni moleküllere genelleştirilemeyen yapısal kısayollar yerine moleküler bağlanmanın aktarılabilir ilkelerini öğrenmeye zorluyor” dedi.
Brown’un çalışmasının önemli bir yönü geliştirdiği titiz değerlendirme protokolüydü. “Gerçek dünya senaryosunu simüle etmek için eğitim ve test çalışmalarımızı kurduk: Yarın yeni bir protein ailesi keşfedilirse modelimiz bunun için etkili tahminler yapabilir mi?” dedi.
Bunu yapmak için, tüm protein süper ailelerini ve bunlarla ilişkili tüm kimyasal verileri eğitim setinden çıkararak, modelin genelleme yeteneğinin zorlayıcı ve gerçekçi bir testini oluşturdu.
Brown’un çalışması bu alanla ilgili birkaç önemli fikir sunuyor:
- Göreve özgü uzmanlaşmış mimariler, günümüzün kamuya açık veri kümelerini kullanarak genelleştirilebilir modeller oluşturmak için açık bir yol sağlar. Ham kimyasal yapılardan ziyade moleküler etkileşimlerin temsilinden öğrenmeye zorlayan belirli bir “tümevarımsal önyargıya” sahip bir model tasarlayarak, daha etkili bir şekilde genelleme yapar.
- Titiz ve gerçekçi kıyaslamalar kritik öneme sahiptir. Makalenin doğrulama protokolü, standart ölçütlerde iyi performans gösteren çağdaş ML modellerinin, yeni protein aileleriyle karşılaşıldığında performansta önemli bir düşüş gösterebileceğini ortaya çıkardı. Bu, gerçek dünyadaki faydayı doğru bir şekilde ölçmek için alanda daha sıkı değerlendirme uygulamalarına olan ihtiyacın altını çiziyor.
- Geleneksel puanlama işlevlerine göre mevcut performans kazanımları mütevazıdır, ancak çalışma, tahmin edilemeyecek şekilde başarısız olmayan bir modelleme stratejisi için açık ve güvenilir bir temel oluşturmaktadır; bu, ilaç keşfi için güvenilir yapay zeka oluşturmaya yönelik kritik bir adımdır.
Protein Dinamikleri Yapay Zeka Merkezi’nin çekirdek öğretim üyesi Brown, yapılması gereken daha çok iş olduğunu biliyor. Mevcut projesi yalnızca yapıya dayalı ilaç keşif denkleminin yalnızca bir parçası olan puanlamaya (bileşiklerin hedef proteinle etkileşimlerinin gücüne göre sıralanması) odaklandı.
Brown, “Laboratuvarım temel olarak moleküler simülasyon ve bilgisayar destekli ilaç tasarımında ölçeklenebilirlik ve genelleştirilebilirlik ile ilgili zorlukların modellenmesiyle ilgileniyor. Umarım yakında bu ilkeleri geliştirmeyi amaçlayan bazı ek çalışmaları paylaşabiliriz” dedi.
Şimdilik önemli zorluklar devam ediyor, ancak Brown’ın yapı tabanlı bilgisayar destekli ilaç tasarımında makine öğrenimi için daha güvenilir bir yaklaşım oluşturmaya yönelik çalışması ileriye giden yolu açıklığa kavuşturdu.