LC0 yazarları AlphaZero makalesini çok dikkatli bir şekilde incelediler, kendi deneylerini yaptılar ve aşağıdaki sonuca vardılar. AlphaZero, algoritmasına Monte Carlo ağaç araması adını vermesine rağmen (Tüm Monte Carlo yöntemleri tanım gereği açıkça rastgeledir), belirli sayıda hareketten sonra açık bir determinizm kullanmaz (bunun 15 hareket olduğuna inanıyorum).
MCTS'nin, hareket seçimine rastgelelik katabilecek iki farklı bölümü vardır.
-
Arama aşamasında, AlphaZero 2 faktöre göre araştırılacak hareketlerin ağırlıklarını atar: sinir ağı tarafından değerlendirilen kazanma olasılığı ve ayrıca bazı alt ağaç boyutu istatistikleri ebeveyn ve çocuk alt ağaçları hareket ettirir. İlk faktör, daha fazla gelecek vaat eden satırların önce değerlendirilmesini sağlar ve ikinci faktör, sonunda daha az umut verici satırların aranmasını sağlar. MCTS'nin doğal bir uygulamasında, bu ağırlıklı olasılıklar arasında ağırlıklı rastgele seçimler kullanacaktır. Gerçekte, AlphaZero her seferinde maksimum ağırlığı seçerek, tamamen belirleyici bir şekilde bunlar arasında seçim yapar. Bunu yapar çünkü bu adımdaki rastgelelik yardımcı olmaz ve ortalama olarak motoru daha önemli varyasyonlardan uzaklaştırır.
-
Taşıma aşamasında, arama aşaması tarafından hesaplanan derin ve doğru değerlendirmelere sahip olan hareket adayları arasında ağırlıklı bir seçim yapabilir. Buradaki fikir, oyuna çeşitlilik getirmeye çalışmak için biraz yetersiz hareketler yapmaktır, böylece her seferinde aynı oyunu oynamaz. Bu özellikle antrenman sırasında önemlidir, ancak aynı zamanda daha ilginç maç sonuçlarına yol açar. AlphaZero'nun bunu yalnızca ilk 15 hamle kadar yaptığı ve bundan sonra her zaman en iyi hamleyi seçtiği ortaya çıktı. Bu determinizmin, son derece doğru oyunsonu oyunu için gerekli olduğu ortaya çıkıyor, burada değerlendirmedeki küçük farklılıkların beraberlik ve galibiyet arasındaki fark olduğu ortaya çıkıyor.
Bu hem eğitim hem de değerlendirme sırasında geçerlidir.
Başka bir deyişle, açılıştan çıktığında, oyunu geleneksel bir motor kadar belirleyicidir.
Bununla birlikte, geleneksel motorlarla aynı türden çok iş parçacıklı ve zaman kontrollü non-determinizme sahip olacağına dikkat edin.