Alphago:谷歌阿爾法圍棋官網

Alphago(中文名稱為阿爾法圍棋或阿爾法狗)是由英國倫敦Google DeepMind開發的人工智慧圍棋程式,成為第一個不借助讓子,在全尺寸19×19的棋盤上擊敗職業圍棋棋手的電腦圍棋程式,也是人工智慧與人類智慧的一大挑戰。

Alphago:谷歌阿爾法圍棋官網

2016年3月在一場五番棋圍棋比賽中,AlphaGo於前三局均擊敗職業圍棋棋手李世乭,成為第一個不借助讓子而擊敗職業九段圍棋棋手的電腦圍棋程式。

專業術語上來說:AlphaGo其做法是使用了蒙地卡羅樹狀搜尋與兩個深度神經網路相結合方法,其中一個是以估值網路來評估大量的選點,而以走棋網路來選擇落子。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。

AlphaGo和之前的圍棋程式相比表現出顯著提升。在和Crazy Stone和Zen等其他圍棋程式的500局比賽中,AlphaGo(運行於一臺電腦上)僅輸一局。而在其後的對局中,AlphaGo(可運行於多臺電腦上)在500局比賽中全部獲勝,且對抗執行在單機上的 AlphaGo 有 77% 的勝率。2015年10月的分散式運算版本AlphaGo使用1,202塊CPU及176塊GPU。

然而 Google 並沒有公開解釋從2015十月到2016三月間的實力增強有什麼硬體或軟體的改進,所以在三月進行的競賽中可能進一步運用更多的硬體。

AlphaGo使用蒙特卡洛樹搜尋,藉助估值網路與走棋網路這兩種深度神經網路,通過估值網路來評估大量選點,並通過走棋網路選擇落點。AlphaGo最初通過模仿人類玩家,嘗試匹配職業棋手的過往棋局,其資料庫中約含3000萬步棋著。一旦它達到了一定的熟練程度,它開始和自己對弈大量棋局,使用強化學習進一步改善它。圍棋無法僅通過尋找最佳步來解決;遊戲一盤平均有150步,每一步平均有200種可選的下法,意味著有太多需要解決的可能性。

猜你喜歡

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *