Soru:
AlphaGo / AlphaZero'da Ders / Kitap
ndbd
2017-12-10 18:09:47 UTC
view on stackexchange narkive permalink

AlphaGo'nun nasıl yanıt verdiğiyle çok ilgileniyorum. AlphaZero çalışıyor. Bana öyle geliyor ki, ilgili Google Belgeleri çok yoğun ve okunması kolay değil.

Her şeyin nasıl çalıştığını teknik düzeyde açıklayan herhangi bir ders kitabı veya ders var mı? Yani sinir ağları / derin öğrenme ile başlayarak, AlphaGo / AlphaZero'ya ulaşana kadar Monte Carlo Ağaç Arama?

Bilgisayar bilimlerinde ustam var, ancak yapay zeka / makine öğrenimi ile hiç çalışmadım.

Şu anda bana öyle geliyor ki, ilgili tüm bilgiler etrafa dağılmış durumda ve AlphaGo'yu anlamak için gerekli olanların belki de sadece% 10'unu içeren makine öğrenimi hakkında (çevrimiçi) dersleri dinleyecek vaktim yok ...

Biri beni doğru yönü gösterebilir mi?

[Google DeepMind's AlphaGo: Nasıl çalışır] (https://www.tastehit.com/blog/google-deepmind-alphago-how-it-works/)
bağlantı için teşekkürler, ancak bu sunum gerçekten yüzeysel
üç yanıtlar:
SmallChess
2017-12-10 20:09:59 UTC
view on stackexchange narkive permalink

EDIT”

@ unutbu'nun yorumdaki bağlantısı, iyi bir giriş okumasıdır.


AlphaZero için sağlam bir anlayış, büyük olasılıkla nicel bir derece gerektirir (Doktora?). AlphaZero'da hızlandırılmış bir kurs mu istiyorsunuz?

Lütfen zamanınızın önemli kadarını harcamazsanız, söyleyeceğim hiçbir şeyin işe yaramayacağını unutmayın. Her şeyi kapsayabilecek bir kitap yok. Çok çalışmanız gerekecek.

Hadi bir deneyelim. AlphaZero için hızlandırılmış kurs.

1. Makine öğreniminde temel anlayış

Sayısız kitap. Ancak zamanınız yoksa, Profesör Andrew Ng'nin Coursera'daki makine öğrenimi kurslarını tavsiye ederim.

Anahtar kelimeleriniz: eğitim setleri, test setleri, stokastik gradyan inişi, öğrenme oranı, GPU, maliyet fonksiyonu, çapraz entropi .

2. Derin tarafsız ağlar

Sinir ağlarını anlamanız gerekir. Ciddiyseniz Profesör Ian Goodfellow'un derin öğrenme kitabını tavsiye ederim. Vaktiniz yoksa, lütfen Profesör Andrew Ng'nin Coursera'daki çevrimiçi kursunu tekrar izleyin. Tüm bölümleri gözden geçirmeniz gerekmez (ama yapmanız gerekir!).

YouTube, sinir ağlarına birçok hızlı giriş sunar, bunları deneyin.

Anahtar kelimeleriniz: nöron , katmanlar, ağırlıklar, önyargı, mini parti, etkinleştirme .

3. Monte Carlo Ağaç Arama

Monte Carlo'nun ne olduğunu anlamalısınız dır-dir. Monte Carlo ile ilgili kitaplar Amazon'da her yerde. Zamanınız yoksa MCTS hakkındaki wikipedia 'ı okuyun.

Anahtar kelimeleriniz: örnekleme, genişletme, simülasyon, kullanıma sunma, geri yayınlama .

3. Pekiştirmeli öğrenme

Anahtar kelimeleriniz: politika gradyanı, gradyan iniş , öğrenme oranı

5. Satranç tahtası temsili

Kağıdın kendisi en basitidir. Model, pano durumunu (örneğin parçalar) bir dizi tek sıcak kodlama ikili değerleri olarak kodlar.

6. MCTS - alfa-beta

enter image description here

detaylı cevap için çok teşekkürler. Öyle görünüyor ki, maalesef basit bir kılavuz yok. Demek istediğim, elbette bir bilgisayar bilimi uzmanı olarak sinir ağlarını biliyorum, ancak Alpha * 'da kullanılan belirli türdeki derin ağları bilmiyorum. Bernd Brügmann tarafından tanıtıldığı şekliyle MCTS'yi kabaca biliyorum, ancak Alpha * için özel bir uyarlama türü bilmiyorum. Pekiştirmeli öğrenme için de aynı şey.Örneğin Andrew Ng'nin makine öğrenimi üzerine kursu çok geniş ve PCA / LDA gibi konuları kapsıyor, bildiğim kadarıyla burada tamamen alakasız.Ama sanırım bunu kendim halletmem gerekiyor ;-)
monk
2018-01-09 20:34:33 UTC
view on stackexchange narkive permalink

Yorum yapacak kadar itibarım yok, ancak AlphaGo Zero Explained In One Diagram oldukça iyi.

Bunu da gerçekten seviyorum eğitici.

İlk bağlantının düğümlerin ne zaman oluşturulacağını (genişletileceğini) açıklamadığını unutmayın. Bu kısım biraz kafa karıştırıcı olabilir. Bu bağlantı yardımcı olabilir.

Bu iyi. Bunu sevdim. +1.


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...