EDIT”
@ unutbu'nun yorumdaki bağlantısı, iyi bir giriş okumasıdır.
AlphaZero için sağlam bir anlayış, büyük olasılıkla nicel bir derece gerektirir (Doktora?). AlphaZero'da hızlandırılmış bir kurs mu istiyorsunuz?
Lütfen zamanınızın önemli kadarını harcamazsanız, söyleyeceğim hiçbir şeyin işe yaramayacağını unutmayın. Her şeyi kapsayabilecek bir kitap yok. Çok çalışmanız gerekecek.
Hadi bir deneyelim. AlphaZero için hızlandırılmış kurs.
1. Makine öğreniminde temel anlayış
Sayısız kitap. Ancak zamanınız yoksa, Profesör Andrew Ng'nin Coursera'daki makine öğrenimi kurslarını tavsiye ederim.
Anahtar kelimeleriniz: eğitim setleri, test setleri, stokastik gradyan inişi, öğrenme oranı, GPU, maliyet fonksiyonu, çapraz entropi .
2. Derin tarafsız ağlar
Sinir ağlarını anlamanız gerekir. Ciddiyseniz Profesör Ian Goodfellow'un derin öğrenme kitabını tavsiye ederim. Vaktiniz yoksa, lütfen Profesör Andrew Ng'nin Coursera'daki çevrimiçi kursunu tekrar izleyin. Tüm bölümleri gözden geçirmeniz gerekmez (ama yapmanız gerekir!).
YouTube, sinir ağlarına birçok hızlı giriş sunar, bunları deneyin.
Anahtar kelimeleriniz: nöron , katmanlar, ağırlıklar, önyargı, mini parti, etkinleştirme .
3. Monte Carlo Ağaç Arama
Monte Carlo'nun ne olduğunu anlamalısınız dır-dir. Monte Carlo ile ilgili kitaplar Amazon'da her yerde. Zamanınız yoksa MCTS hakkındaki wikipedia 'ı okuyun.
Anahtar kelimeleriniz: örnekleme, genişletme, simülasyon, kullanıma sunma, geri yayınlama .
3. Pekiştirmeli öğrenme
Anahtar kelimeleriniz: politika gradyanı, gradyan iniş , öğrenme oranı
5. Satranç tahtası temsili
Kağıdın kendisi en basitidir. Model, pano durumunu (örneğin parçalar) bir dizi tek sıcak kodlama ikili değerleri olarak kodlar.
6. MCTS - alfa-beta