Chris Maddison, sonunda AlphaGo olacak olan Go oynayan yapay zeka üzerinde çalışmaya başladığında henüz bir stajyerdi. On yıl sonra Lee Sedol’e karşı oynadığı maçtan ve sonrasında yaşananlardan bahsediyor

AlphaGo’nun zafer yayını TV’de
Mart 2016’da Google DeepMind’ın yapay zeka sistemi AlphaGo dünyayı şok etti. Antik Çin masa oyunu Go’nun beş maçlık çarpıcı serisinde yapay zeka, dünyanın en iyi oyuncusu Lee Sedol’u yendi; bu, milyonların önünde televizyonda yayınlanan ve birçok kişi tarafından yapay zekanın gelişiminde tarihi bir an olarak selamlanan bir an oldu.
Şu anda Toronto Üniversitesi’nde yapay zeka profesörü olan Chris Maddison, o zamanlar yüksek lisans öğrencisiydi ve projenin hayata geçmesine yardımcı oldu. Her şey daha sonra OpenAI’yi kuracak olan Ilya Sutskever’in iletişime geçmesiyle başladı…
Alex Wilkins: AlphaGo fikri ilk olarak nasıl ortaya çıktı?
Chris Maddison: Ilya (Sutskever) neden Go üzerinde çalışmamız gerektiğine dair bana şu argümanı verdi. Chris, sence uzman bir oyuncu Go tahtasına baktığında yarım saniye içinde en iyi hamleyi seçebilir mi? Yapabileceklerini düşünüyorsanız, bu, sinir ağını kullanarak en iyi hamleyi seçmek için oldukça iyi bir politika öğrenebileceğiniz anlamına gelir.
Bunun nedeni, yarım saniyenin, görsel korteksinizin bir ileri geçiş (bir işlem turu) yapması için geçen süredir ve biz zaten ImageNET’ten (önemli bir yapay zeka görüntü tanıma yarışması) görsel korteksinizin yalnızca bir ileri geçişini gerektiren şeyleri yaklaşık olarak tahmin etmekte oldukça iyi olduğumuzu biliyorduk.
Bu argümana inandım ve 2014 yazında (Google Brain) stajyer olarak katılmaya karar verdim.
AlphaGo oradan nasıl gelişti?
Katıldığımda DeepMind’da birlikte çalışacağım başka bir küçük ekip daha vardı; bunlar Go üzerinde çalışmaya başlayan Aja Huang ve David Silver’dı. Sinir ağlarını oluşturmaya başlamak temelde benim görevimdi. Bu bir rüyaydı.
Denediğimiz birçok farklı yaklaşım vardı ve ilk denediğimiz şeylerin çoğu başarısız oldu. Sonunda hayal kırıklığına uğradım ve en aptalca, en basit şeyi denedim; bu, bir uzmanın belirli bir yönetim kurulu pozisyonunda yapacağı bir sonraki hamleyi tahmin etmeye çalışmak ve bir sinir ağını büyük bir uzman oyunları külliyatı üzerinde eğitmekti. Ve bizi gerçekten ayağa kaldıran yaklaşımın bu olduğu ortaya çıktı.
Yazın sonunda, kendisini iyi bir Go oyuncusu olarak gören DeepMind’dan Thore Graepel ile küçük bir maça ev sahipliği yaptık ve ağlarım onu yendi. DeepMind daha sonra bunun gerçek bir şey olacağına ikna olmaya başladı ve bunun için kaynak ayırmaya ve etrafında büyük bir ekip oluşturmaya başladı.
Lee Sedol’u yenmek ne kadar zor bir mücadeleydi?
Hatırlıyorum, 2014 yazında Lee Sedol’un portresi hemen yanımızdaki masamızdaydı. Ben bir Go oyuncusu değilim ama Aja (Huang) öyle. Ne zaman yeni bir ağ kursam, biraz daha iyi hale gelirdi ve Aja’ya dönerek şöyle derdim: Tamam, biraz daha iyiyiz, Lee Sedol’e ne kadar yakınız? Ve Aja bana dönüp şöyle derdi: Chris, anlamıyorsun. Lee Sedol Tanrı’dan gelen bir taştır.
Büyük etkinlikten önce AlphaGo ekibinden ayrıldınız. Neden?
David (Silver) seni devam ettirmek istediğimizi ve bu projeyi gerçekten bir sonraki aşamaya taşımak istediğimizi söyledi ve geriye dönüp baktığımızda bu belki de verdiğim en aptalca kararlardan biriydi, onu geri çevirdim. Doktoraya odaklanmam gerektiğini düşündüğümü, özünde bir akademisyen olduğumu söyledim. Doktora programıma geri döndüm ve o noktadan sonra projeye gevşek bir şekilde danıştım. Sinir ağlarımı yenmelerinin biraz zaman aldığını söylemekten biraz gurur duyuyorum. Ama sonuçta Lee Sedol’ü canlandıran eser, büyük bir mühendislik çalışmasının ve büyük bir ekibin ürünüydü.
AlphaGo kazandığında Seul’deki atmosfer nasıldı?
O anda orada, Seul’de olmayı ifade etmek zordu. Çok duygusaldı. Çok yoğundu. Bir kaygı hissi vardı. Kendine güvenerek girersin ama asla bilemezsin. Tıpkı bir spor oyunu gibi. İstatistiksel olarak konuşursak, sen daha iyi bir oyuncusun ama işin nasıl sonuçlanacağını asla bilemezsin. Maçları oynadığımız otelde olduğumu ve pencereden dışarı baktığımı hatırlıyorum. Şehrin büyük kavşaklarından birine bakabileceğiniz kadar yüksek bir seviyedeydik. Maçımızı Times Meydanı’na benzeyen büyük bir ekranın gösterdiğini fark ettim. Sonra kaldırımlara baktım, insanlar sıraya girmiş ekrana bakıyorlardı. İlk maçı Çin’de yüz milyonlarca insanın izlediğini duymuştum ama o anı şöyle hatırlıyorum: Aman Tanrım, Doğu Asya’yı gerçekten durdurduk.
AlphaGo genel anlamda yapay zeka için ne kadar önemli?
Büyük dil modelleri (LLM’ler) dünyası hakkında yüzeysel düzeyde çok şey değişti; bunlar artık bazı açılardan AlphaGo’dan oldukça farklı, ancak aslında temelde değişmeyen bir teknolojik konu var.
Yani algoritmanın ilk kısmı bir sonraki hareketi tahmin etmek için bir sinir ağını eğitmektir. Günümüzün yüksek lisans eğitimleri, büyük ölçüde internette bulunan insan metninin büyük bir külliyatından bir sonraki kelimeyi tahmin etmek için ön eğitim dediğimiz şeyle başlıyor.
AlphaGo’nun ikinci adımında, bu sinir ağlarına sıkıştırılmış insan topluluğundan bilgi aldık ve sistemin davranışını oyun kazanma hedefine göre hizalamak için pekiştirmeli öğrenmeyi kullanarak geliştirdik.
Bir uzmanın bir sonraki hamlesini tahmin etmeyi öğrendiğinizde kazanmaya çalışır, ancak bir sonraki hamleyi açıklayan tek şey bu değildir. Belki en iyi hamlenin ne olduğunu anlamıyorlar, belki bir hata yaptılar, bu yüzden genel sistemi gerçek hedefiniz ile uyumlu hale getirmeniz gerekiyor, ki bu AlphaGo’nun durumunda kazanmaktı.
Büyük dil modellerinde ön eğitimden sonra da durum aynıdır. Ağlar, onları nasıl kullanmak istediğimizle uyumlu değil ve bu nedenle, ağları hedeflerimize göre hizalayan bir dizi pekiştirmeli öğrenme adımı uyguluyoruz.
Bazı açılardan pek bir şey değişmedi.
Bize yapay zekaların nerede başarılı olmasını bekleyebileceğimiz hakkında bir şeyler söylüyor mu?
Odaklanmayı seçtiğimiz şeyler açısından sonuçları vardır. Önemli sorunlarda ilerleme kaydetme konusunda endişeleniyorsanız endişelenmeniz gereken temel darboğazlar, ön eğitim yapmak için yeterli veriye sahip olup olmadığınız ve eğitim sonrasında gerçekleştirebileceğiniz ödül sinyallerinin olup olmadığıdır. Eğer bu bileşenlere sahip değilseniz, sizi yerden kaldıracak hiçbir zekice – bilirsiniz, bu algoritmaya karşı bu algoritma – yoktur.
Lee Sedol’e karşı herhangi bir sempati duydun mu?
Lee Sedol, 2014 yazında bu ulaşılamaz dönüm noktası olan bir idoldü. Sonra birdenbire bizzat orada olmak, maçları izlemek, stresi, kaygısı, onun belki de içeri girmeyi düşündüğünden çok daha değerli bir rakip olduğunun farkına varması çok stresliydi. Birini bu duruma sokmak istemezsin. Maçı kaybettiğinde insanlıktan özür diledi ve “Bu benim başarısızlığım, sizin değil” dedi. Bu çok trajikti.
Go’da rakibinizle maçı gözden geçirme geleneği de vardır. Birisi kazanır ya da kaybeder, ancak sonunda maçı gözden geçirirsiniz, oyunu gevşetirsiniz ve birbirinizin varyasyonlarını keşfedersiniz. Lee Sedol bunu yapamadı çünkü AlphaGo insan değildi, bunun yerine arkadaşlarının gelip maçı incelemesini sağladı ama bu aynı şey değil. Bunda yürek parçalayan bir şeyler vardı.
Ancak maçla ilgili insan-makine hikayelerini pek beğenmedim çünkü AlphaGo’yu insanlardan oluşan bir ekip geliştirdi. Bu, bir kabilenin insan oyununda mükemmelliğe ulaşabilecek bir eser inşa etme çabasıydı. Sonuçta bu, tüm kanımızın, terimizin ve gözyaşlarımızın aktığı bir eserdi.
Yapay zekanın daha fazla insan düşünme işi başarması nedeniyle dünyada hala insanlara yer olduğunu düşünüyor musunuz?
Go oyunu hakkında daha çok şey öğreniyoruz ve eğer bu oyunun güzel olduğunu düşünüyorsak, ki biz de öyle yapıyoruz ve yapay zekalar bize bu güzellik hakkında daha fazla şey öğretebilir, bunda da birçok doğal iyilik vardır. Hedefler ve amaçlar arasında bir fark vardır. Go oyununun amacı kazanmaktır ancak tek amacı bu değildir; amaçlarından biri eğlenmektir. Masa oyunları yapay zekanın varlığıyla yok edilmez; Satranç gelişen bir endüstridir. Bu sporun entrikasını ve insani başarısını hâlâ takdir ediyoruz.



