Haberler
AlphaZero'nun Yeni Versiyonu 1,000 Oyunluk Maçta Stockfish'i Ezip Geçti
AlphaZero satranç dünyasını yeni sonuçlarla tekrar şok etmeyi başardı.

AlphaZero'nun Yeni Versiyonu 1,000 Oyunluk Maçta Stockfish'i Ezip Geçti

Pete
| 0 | Satranç Etkinlikleri Yayını

AlphaZero'nun geçtiğimiz Aralık ayındaki şok dalgasını anımsatan haberlerde, yapay zeka firması DeepMind makine öğrenimi satranç projesinin yeni versiyonunun olağanüstü sonuçlarını duyurdu.

Sonuçlar, bir kez daha AlphaZero'nun dünya üzerinde en güçlü satrancı oynadığı konusunda şüpheye yer olmadığını gösteriyor.

Yeni AlphaZero versiyonu yeni 1,000 oyunluk maçta +155 -6 =839 skor ile Stockfish 8'i ezip geçti. (Bu maçtan üç örnek oyunu Stockfish10 analizi ve GM Robert Hess'in video analizi ile inceleyin.)

AlphaZero Stockfish'i zaman dezavantajına sahip olduğu bir seri maçlarda da, zaman farkının bire on olduğu durumlarda bile geleneksel satranç analiz motorunu mağlup etti.

DeepMind'ın belirttiğine göre, gerçekleştirilen ek maçlarda, yeni AlphaZero Stockfish'in "en son versiyonunu" Stockfish8'e karşı oynadığı maçlardakine çok benzer sonuçlarla yendi. Makalenin 7 Aralık 2018 tarihli ön sürüm kopyası tam olarak hangi gelişim versiyonunun kullanıldığını belirtmiyor.

[Güncelleme: Bugün yayınlanan tam makalede maçın Stockfish'in 13 Ocak 2018 tarihli en son versiyonu yani Stockfish 9 olduğunu belirtiliyor.]

DeepMind'a göre, makine öğrenimine dayalı bu motor ayrıca "güçlü bir açılış kitabı kullanan bir Stockfish varyantına" karşı da tüm maçları kazandı. AlphaZero siyah taşlarla oynarken önemli sayıda oyun kazanan ancak yine de bunların maçı kazanması için yeterli olmayan Stockfish'e açılış kitabını eklemek yardımcı olmuş gibi görünüyor.

alphazero vs stockfish

AlphaZero'nun en son Stockfish ve açılış kitabına sahip Stockfish karşısındaki sonuçları (galibiyetler yeşil, mağlubiyetler kırmızı). Görüntü DeepMind tarafından Science dergisi aracılığıyla.

Sonuçlar merkezi Londra'da yer alan ve Google'ın firmalarından biri olan Alphabet'in sahip olduğu DeepMind tarafından Science dergisinde yayınlanacak olan bir makalede yayınlanacak olup, DeepMind tarafından seçili satranç haber kuruluşları ile paylaşıldı.

1,000 oyunluk maç 2018 yılının başlarında oynandı. Maçta, hem AlphaZero hem de Stockfish her oyunu üç saat süre ve hamle başına 15 saniye arttırmalı tempo ile oynadılar. Bu zaman kontrolü, geçtiğimiz yılın maçı sırasında ortaya atılan, 2017'deki zaman kontrolünün hamle başına bir dakika olmasının Stockfish'in aleyhine olduğu doğrultusundaki bazı argümanları çürüttü.

Üç saat artı hamle başına 15 saniye arttırmalı tempo ile böyle bir argüman yapılamıyor, çünkü bu herhangi bir bilgisayar analiz motoru için muazzam bir oyun süresi. Zaman dezavantajlı olduğu sürelerde ise, AlphaZero 1'e karşı 10 süreye kadar üstündü. Stockfish sadece zaman dezavantajı 30'a 1'e yükseldiğinde fark atmaya başlayabildi.

alphazero vs stockfish

AlphaZero'nun Stockfish 8 karşısında oynadığı zaman dezavantajlı maçların sonuçları (galibiyetler yeşil, mağlubiyetler kırmızı). Görüntü DeepMind tarafından Science dergisi aracılığıyla.

AlphaZero'nun zaman dezavantajına sahip olduğu maçlar, onun herhangi geleneksel satranç bir satranç analiz motorundan sadece çok daha güçlü olduğunu göstermekle kalmıyor. Aynı zamanda hamleleri çok daha verimli bir şekilde aradığını gösteriyor. DeepMind'a göre, AlphaZero bir Monte Carlo ağacı araması kullanıyor ve Stockfish'in 60 milyonuna karşı saniye başına yaklaşık 60,000 konum inceliyor.  

alphazero vs stockfish

AlphaZero'nun satranç hamlelerini nasıl aradığını gösteren bir grafik. Görüntü DeepMind tarafından Science dergisi aracılığıyla.

Bu sonuçlara baktıktan sonra bilgisayar satrancı fanları neler çıkarabilirler? AlphaZero dünyadaki elit satranç oyuncuları arasındaki statüsünü sağlamlaştırdı. Ancak eğer oyunun genel oynanışında ustalaşma konusunda yapay zekanın becerilerini takıp ediyorsanız sonuçlar çok daha ilgi çekici gelecektir.

Makaleye göre, güncellenmiş AlphaZero algoritması üç zorlu oyunda aynı: satranç, şogi ve go.  AlphaZero'nun bu versiyonu oyunun temel kurallarından başlayarak sadece bir kaç saatlik çalışma ile bu üç oyunun en iyi bilgisayar oyuncularını yenebildi.

Yeni AlphaZero'nun sonuçları DeepMind'ın satrancı sonsuza kadar değiştiren sürpriz AlphaZero - Stockfish maçının tarihi sonuçlarını açıklamasından tam bir yıl sonra açıklandı.

O zamandan beri, Lc0 adındaki açık kaynak bir proje AlphaZero'nun başarısını tekrar etmeye çalıştı ve proje çok sayıda satranç severi etkilemeyi başardı. Lc0 şimdi şampiyon Stockfish ile beraber, Chess.com Bilgisayar Satranç Şampiyonasında dünyanın en iyi satranç analiz motorlarına karşı yarışıyor.

Bilgisayar Satranç Şampiyonası takipçileri yeni AlphaZero'nun oyunlarından bazılarında rakiplerin konumunu kısıtlayan izole ilerlemiş piyonlar olduğunu gördüğüne sevinecektir. Belki de bu piyonların oluşturulması kritik bir kazanç stratejisidir çünkü AlphaZero ve Lc0 bunu birbirinden bağımsız bir şekilde öğrenmiş gibi görünüyor. 

DeepMind 1,000 oyunluk maçtan GM Matthew Sadler tarafından seçilen 20 örnek oyunu piyasaya sürdü. Chess.com bu oyunlardan üçünü seçerek Stockfish 10 aracılığıyla derin analiz yaptı ve GM Robert Hess ile bir video analizi hazırladı. Üçü Stockfish 10 ve dördü Lc0 tarafından analiz edilmiş olan 20 örnek oyunu bu makalenin sonundan indirebilirsiniz.

Güncelleme: Bu makalenin yayınlanmasının ardından, DeepMind buradan indirebileceğiniz 210 adet örnek oyun piyasaya sundu.

Stockfish 10 tarafından analiz edilen ilk oyun:

GM Robert Hess'in video analizi ile 1. oyun:

Stockfish 10 tarafından analiz edilen 2. oyun:

GM Robert Hess'in video analizi ile 2. oyun:

Stockfish 10 tarafından analiz edilen 3. oyun:

GM Robert Hess'in video analizi ile 3. oyun:

IM Anna Rudolf da örnek oyunlardan bir tanesinin video analizini yaptı. 

AlphaZero'nun yeni versiyonu satrancı kendi kendine yalnızca satranç kurallarından başlayarak makine öğrenimi tekniklerini devamlı olarak sinir ağlarını güncellemek sureti ile öğrendi. DeepMind'a göre kendi kendine oynadığı oyunların ilk seti için 5,000 TPU (Google'ın tensör işlemci birimi, yapay zeka için uygulamaya özel entegre edilmiş bir devre) ve ardından sinir ağlarını eğitmesi için ise 16 TPU kullanılmış.

Toplam satranç çalışma süresi ise başından sonuna kadar dokuz saatti. DeepMind'a göre, yeni AlphaZero'nun Stockfish'i geçmesi sadece dört saatlik bir çalışma aldı; dokuz saatte ise açık ara ile dünya-şampiyonu analiz motorunun önündeydi.

Oyunlara gelince, Stockfish 44 CPU (merkezi işlem birimi) çekirdeği kullandı ve AlphaZero ise dört TPU ve 44 CPU çekirdekli tek bir makina kullandı. Stockfish'in hash boyutu 32 GB'tı ve syzygy oyunsonu tablebaselerini kullandı.

alphazero vs stockfish

İnsanlar arasında en popüler açılışlarda AlphaZero-Stockfish sonuçları. Sol tarafta, AlphaZero Beyaz taşlarla; sağ tarafta, AlphaZero Siyah taşlarla.Görüntü DeepMind tarafından Science dergisi aracılığıyla. Daha büyük versiyon için görüntüye tıklayın. 

Piyasaya sürülen örnek oyunlar, bu oyunlara erişimi olan satranç profesyonelleri tarafından oldukça etkileyici bulundu. GM Robert Hess bu oyunları "son derece karışık" olarak kategorize etti.

DeepMind da dergideki makalesinde bu emsalsiz stilden şu şekilde bahsetti:

"Birkaç oyunda, AlphaZero uzun süreçli bir stratejik avantaj için, taş fedasında bulundu, bu önceki satranç programlarının kullandığı kural bazlı değerlendirmelerin aksine daha akıcı, duruma dayalı konumsal değerlendirmesinin olduğu anlamına geliyor." 

Yapay zeka firması aynı zamanda aynı AlphaZero versiyonunun üç farklı oyunda kullanıldığının önemine değinerek, bunun oyun oyunama zekasında genel anlamda bir dönüm noktası olduğunu belirtti.

DeepMind araştırmacıları bu durumu "Bu sonuçlar bizi yapay zekanın çoktandır devam eden hedefini gerçekleştirmeye bir adım daha yaklaştırıyor: herhangi bir oyunda ustalaşabilen genel bir oyun oyunama sistemi," sözleriyle belirtti.

DeepMind tarafından piyasaya sürülen 20 örnek oyunun Chess.com tarafından güçlü bir bilgisayarda Stockfish 10 kullanılarak gerçekleştirilmiş analizini aşağıdan indirebilirsiniz. İlk sette açılış kitabı kullanılmaksızın oynanmış 10 oyun ve ikinci sette ise 2016 TCEC'de (Top Chess Engine Championship -en iyi satranç motoru şampiyonası) kullanılan açılışlarla oynanmış 10 oyun bulunmaktadır.

PGN dosyaları:

Stockfish 10 tarafından analizler ile 20 oyun:

Lc0 tarafından analiz edilmiş 4 oyun:

AlphaZero'yu seviyor musunuz? AlphaZero'nun ilham verdiği makine öğrenimi satranç projesi Lc0'nun Bilgisayar Satranç Şampiyonasındaki oyunlarını takip edebillirsiniz.

Pete kullanıcısından daha fazla
Yeni Bilgisayar Satranç Şampiyonası Duyurusu

Yeni Bilgisayar Satranç Şampiyonası Duyurusu

Chess.com Bilgisayar Satranç Şampiyonası'nın Galibi Stockfish Oldu

Chess.com Bilgisayar Satranç Şampiyonası'nın Galibi Stockfish Oldu