AlphaZero
2017 yılında Stockfish'in (dünyanın en güçlü satranç motoru) bir maçta mağlup olmasıyla satranç dünyası temelden sarsıldı. Bir insan tarafından değil, başka bir dünyaya aitmiş gibi görünen bilinmeyen bir bilgisayar programı olan AlphaZero tarafından mağlup edildi.
Bu güçlü satranç motoru hakkında daha fazlasını öğrenelim. AlphaZero hakkında bilmeniz gerekenler:
- AlphaZero Nedir?
- AlphaZero'nun Başarıları
- AlphaZero Ve Satranç Varyantları
- AlphaZero'nun Oyunları
- Sonuç
AlphaZero Nedir?
AlphaZero, Google tarafından satın alınan yapay zeka ve araştırma şirketi DeepMind tarafından geliştirildi. Nöral ağlarını eğitmek için yalnızca pekiştirmeli öğrenme ve kendi kendine maç yapma yöntemini kullanarak neredeyse düşünülemez bir oyun gücüne ulaşan bir bilgisayar programıdır. Başka bir deyişle, AlphaZero'ya yalnızca oyunun kuralları öğretildi ve milyonlarca kez kendisine karşı oynadı (DeepMind'e göre ilk dokuz saatte 44 milyon oyun).
AlphaZero, konumların son derece gelişmiş değerlendirmelerini yapmak için nöral ağlarını kullanıyor; bu da saniyede 70 milyondan fazla konuma bakma ihtiyacını ortadan kaldırıyor (Stockfish'in yaptığı gibi). DeepMind'a göre AlphaZero, Stockfish'i yenmek için gereken kriterlere yalnızca dört saat içinde ulaştı.
AlphaZero, bazılarının "Google Süper Bilgisayarı" olarak adlandırdığı özel bir donanımla çalışıyor; ancak DeepMind, AlphaZero'nun maçlarında dört tensör işlem birimiyle (TPU) çalıştığını açıkladı.
Aralık 2017'de DeepMind, AlphaZero'nun 100 oyunluk bir maçta Stockfish'i kolayca mağlup ettiğini açıklayan bir araştırma makalesi yayınladı. AlphaZero, 1.000 oyundan oluşan ikinci maçta Stockfish'i yenmeye devam edecekti; sonuçlar 2018'in sonlarında bir makalede yayınlandı.
Maalesef AlphaZero şekilde halka açık değil. Stockfish ve AlphaZero'nun inanılmaz oyunlarına karşı elde edilen maç sonuçları, çok sayıda açık kaynaklı nöral ağ satranç projesinin oluşturulmasına yol açtı. Leela Chess Zero, Leelenstein, Alliestein ve diğerleri AlphaZero'nun öğrenme ve oynama tarzını taklit etmeye çalışıyor. Stockfish bile kendine yeni nöral ağları ekledi.
DeepMind ve AlphaZero, 2020 yılında farklı satranç varyantlarıyla satranç dünyasına katkıda bulunmaya devam etti. DeepMind ve AlphaZero ekibi konuştuğunda tüm satranç dünyası onları dinler!
AlphaZero, sahneye çıktığı andan itibaren yeni nesil nöral ağ satranç motorları üreterek, satranç varyantlarına katkıda bulunarak ve üstün oyunlarıyla satrancı değiştirdi.
AlphaZero’nun Başarıları
Bahsettiğimiz gibi AlphaZero, Aralık 2017'de 100 oyunluk bir maçta dünyanın en güçlü satranç motoru Stockfish'i yendi (28 galibiyet, 72 beraberlik ve sıfır mağlubiyet). Halka bu maçtan 10 örnek oyun gösterildi ve satranç dünyası bu oyunlara gerçek değilmiş gibi bir şaşkınlıkla tepki verdi. GM Peter Heine Nielsen, AlphaZero'nun oyunlarını izlemeyi, üstün bir türün dünyaya ayak basıp bize nasıl satranç oynanacağını göstermesine benzetti:
Chess.com'a şunları söyleyen efsanevi GM Garry Kasparov da dahil olmak üzere diğer büyükustalar Nielsen'in düşüncelerini paylaştılar: "Bu çok ciddi bir başarı... Kaba kuvvet yerine Claude Shannon ve Alan Turing'in hayalini kurduğu 'Type B,' yani makine tipi satranca benziyor."
Diğerleri ise ilk maçta kullanılan donanımların farklılığı nedeniyle sonuçları sorguladı. Bazıları ayrıca Stockfish'in açılış kitabını ve oyun sonu veri tabanını kullanmasına izin verilmemesini haksız buldu.
GM Hikaru Nakamura şunları söyledi: "Sonuçlara çok fazla güvenilirlik atfetmiyorum çünkü benim anladığım kadarıyla AlphaZero temelde Google süper bilgisayarını kullanıyor ve Stockfish bu donanımla çalışmıyor; Stockfish temelde benim bilgisayarımın kullandığı donanımın aynısını kullanıyordu. "
İlk maçtan yaklaşık bir yıl sonra DeepMind, AlphaZero'nun güncellenmiş bir versiyonunun 1000 oyunluk bir maçta Stockfish'i mağlup ettiğini duyuran yeni bir makale yayınladı. Bu sefer Stockfish'in güncel sürümü (o zamanki sürüm 9) kullanıldı, Stockfish birçok oyunda güçlü bir açılış kitabı kullanabildi, zaman tempoları ayarlandı (Stockfish büyük zaman avantajlarına sahipti) ve Stockfish En İyi Satranç Motoru Şampiyonasında (TCEC) kullanılan aynı tip donanımla çalıştı.
Sonuçlar pek değişmedi; AlphaZero, Stockfish'i 155 galibiyet, 839 beraberlik ve 6 mağlubiyetle tekrar mağlup etti.
AlphaZero Ve Satranç Varyantları
2019 ve 2020'de GM Vladimir Kramnik, AlphaZero ve DeepMind ekibiyle satranç varyantlarını keşfetmek için biraz zaman geçirme fırsatı buldu ve yana hareket edebilen piyonlar, rok yapılmayan satranç, torpido satrancı (piyonlar istediği zaman iki kare hareket edebilir) dahil olmak üzere yeni satranç çeşitlerinin keşfi hakkında DeepMind ile birlikte bir makale yazdı.
Eylül 2020'de Chess.com, Kramnik ve DeepMind ekibinin üyeleriyle, varyantları ve diğer konuları tartıştıkları bir buluşmaya ev sahipliği yaptı. Videonun tamamını buradan izleyebilirsiniz:
Bu satranç türlerinin birçoğu (ve daha fazlası) Chess.com'a eklenmiştir. Bu makale yeni satranç çeşitlerini ve bunların nasıl oynanacağını özetlemektedir. Bu satranç çeşitlerinden herhangi birini kendiniz denemek istiyorsanız, Chess.com/variants adresine gidin veya farenizi menü çubuğundaki "Oyna" düğmesinin üzerine getirin ve "Varyantlar"ı seçin:
"Varyantlar"ı seçtikten sonra Satranç Varyantları Sayfasına yönlendirilirsiniz. Tek yapmanız gereken bir varyant seçip "Oyna"ya basmak.
AlphaZero'nun Oyunları
Bu ilk oyun örneğinde, AlphaZero'nun ilk maçta dünyayı şok ettiği oynayışının bir kısmını görüyoruz. AlphaZero açılışta bir piyon feda eder ve hemen saldırıya geçer. 19...Şxh6'dan sonra Stockfish bir taş önde ama şah güvende değil ve vezir kanadında tüm taşlar gelişmemiş durumda:
AlphaZero baskıyı sürdürüyor ancak taşın kompensasyonu biz ölümlüler için çoğunlukla belirsiz. Sadece geriye dönüp baktığımızda Siyah'ın birkaç taşının (en önemlisi a8 kalesi ve vezir atı) hiçbir zaman gerçekten oyunun bir parçası olmayacağını söyleyebiliriz. 36.Ve6'dan sonra pozisyon netleşti ve AlphaZero oyunu kazandı:
Bu ikinci oyun örneği, ikinci AlphaZero-Stockfish maçından. AlphaZero konumsal bir üstünlük kuruyor ve oyunsonunda 45.Fxe4'ten sonra fil çiftiyle birlikte Stockfish'e işkence ediyor. İşte oyunun tamamı:
Aşağıdaki videoda GM Robert Hess bu fantastik oyunu çok detaylı bir şekilde ele alıyor:
Sonuç
Artık AlphaZero'nun ne olduğunu, neler başardığını ve daha fazlasını biliyorsunuz. AlphaZero'nun oyunundan neler öğrenebileceğinizi merak ediyorsanız Chess.com'dan IM Danny Rensch'in hazırladığı bu harika video ders serisine göz atın.