fbpx
维基百科

Leela Zero

Leela Zero是由比利時程式設計師Gian-Carlo Pascutto英语Gian-Carlo Pascutto起頭所開發的電腦圍棋軟體,以及相關的運算計畫。專案在2021年2月15日已經中止,並推薦改參與SAIKataGo[3]

Leela Zero
原作者Gian-Carlo Pascutto
開發者Gian-Carlo Pascutto
初始版本2017年10月26日,​5年前​(2017-10-26
目前版本
  • 0.17 (2019年4月4日;穩定版本)[1]
源代码库github.com/leela-zero/leela-zero
编程语言C++
类型電腦圍棋
许可协议GPLv3
网站github.com/leela-zero/leela-zero
Leela Zero Server
原作者Jonathan Roy
開發者Jonathan Roy
初始版本2018年1月14日,​4年前​(2018-01-14
目前版本
  • 0.17 (2019年4月4日;穩定版本)[1]
源代码库github.com/leela-zero/leela-zero-server
编程语言Node.js
类型電腦圍棋
许可协议AGPLv3
网站zero.sjeng.org

簡介

Leela Zero是依照DeepMind在科學期刊《自然》上對於AlphaGo Zero所發表的論文《Mastering the game of Go without human knowledge[4]》所實做出的開源電腦圍棋程式[5],也就是不使用人類棋譜與累積的圍棋知識,僅實做圍棋規則,使用單一類神經網路從自我對弈中學習(不像AlphaGo以人類角度思考,設計了Policy Network與Value Network)。

軟體使用蒙特卡洛树搜索(MCTS)模擬與ResNet英语ResNet[5],在蒙特卡洛树搜索模擬與自我訓練時都採用Tromp–Taylor規則[6],這個規則的貼目雖然與中國規則相同,都是由黑棋貼7.5目,但在某些情境下可能會有差異。

程式碼部份,用戶端對弈的程式碼與訓練的程式碼以GPLv3授權公開[5],分散式運算的伺服器端程式則以AGPLv3授權公開[7];資料的部份,訓練對弈資料[8]以及訓練對弈的原始資料[9]也可以公開下載[註 1]

與論文的差異

初期時Leela Zero在確認演算法以及程式是否實做正確,所以對論文裡提到的部份參數進行調整,以加快驗證速度:

類神經網路的架構
AlphaGo Zero使用20 blocks或40 blocks,配上256 filters[4]
Leela Zero是逐步提昇類神經網路的大小(在近期的版本開始使用Net2Net,將舊的網路資料轉換到新的網路上[10]),一開始使用
  • 1 block x 8 filters(2017年11月10日,第0代),並逐步換成
  • 4 blocks x 32 filter(2017年11月17日,第2代,訓練約1.9萬盤時)、
  • 5 blocks x 64 filters(2017年11月21日,第5代,約13.7萬盤時)、
  • 6 blocks x 128 filters(2018年1月20日,第58代,約286萬盤時)、
  • 10 blocks x 128 filters(2018年3月5日,第92代,約481萬盤時)、
  • 15 blocks x 192 filters(2018年4月9日,第117代,約664萬盤時)、
  • 20 blocks x 256 filters(2018年7月28日,第158代,約872萬盤時),到目前使用的
  • 40 blocks x 256 filters(2018年9月4日,第174代,約997萬盤時)[8]
自我對戰訓練的盤數
AlphaGo Zero使用最新的50萬盤訓練[4]
Leela Zero在10 blocks前(不含10 blocks)使用最新的25萬盤自我對戰結果訓練[11](在2018年1月1號前因為有bug,導致只會使用最新的(約)16萬盤自我對戰結果進行訓練[12]),在10 blocks x 128 filters後改用最新的50萬盤自我對戰結果訓練[13]
蒙特卡洛树搜索(MCTS)的模擬的次數
AlphaGo Zero在論文裡提到自我訓練或正式對弈時,每一步都使用1600次模擬[4]
Leela Zero一開始使用與AlphaGo Zero的論文相同的1600次,但後來改為3200次[14]

這些調整是希望在比較小的網路與訓練盤數下快速確認程式的正確性[6]。在每個階段確認沒有重大問題以及bug後會重新評估調昇,並且正式公開向社群尋求運算資源[6]

另外作者發現在原論文裡有瑕疵:論文裡的第一層輸入只有17個,會導致白棋較容易看到棋盤邊緣(指類神經網路),這在Leela Zero內被修正為18個[5]

目標

早期Leela Zero剛出來時,Gian-Carlo Pascutto的目標是重製AlphaGo Zero的論文結果[5][15]。在後來受到更多關注後,有更多的計算資源與人力投入Leela Zero計畫之中,使得Leela Zero的強度迅速提昇,甚至已經超越先前開發的Leela以及其他對手[15]

現在的目標是希望在行動電話上也能夠有足夠強的圍棋軟體可以使用[15]

訓練

由於作者估算以當時的高階硬體(以NvidiaGeForce GTX 1080 Ti估算)大約需要1700年的計算量才能達到AlphaGo Zero自我學習2900萬盤的水平[16],所以在2017年十一月開始,讓自願者使用自己的硬體,透過作者群開發的AutoGTP程式參加分散式運算計畫(以GTP自動與伺服器溝通以取得計算工作)[8]

  • 在計畫啟動的34天後(2017年12月13日),自我對弈的訓練量超過100萬盤。
  • 59天後(2018年1月8日)超過200萬盤。
  • 74天後(2018年1月23日)超過300萬盤。
  • 100天後(2018年2月18日)超過400萬盤。
  • 119天後(2018年3月9日)超過500萬盤。
  • 138天後(2018年3月28日)超過600萬盤。
  • 166天後(2018年4月25日)超過700萬盤。
  • 218天後(2018年6月16日)超過800萬盤。
  • 261天後(2018年7月29日)超過900萬盤。
  • 299天後(2018年9月5日)超過1000萬盤。

2018年初,志願者申請到超級電腦的部份計算資源,印第安纳大学的Big Red II(申請到3360 cores,約該台超級電腦的10.7%資源)[17][18][註 2],另外自0.10版支援純CPU版本(不需GPU),現有演算法的最佳化以及新演算法的引入,這些因素大幅提昇了整體的計算速度。

Leela Zero官方曾鼓勵參與者使用Google Colaboratory所提供的免費運算資源幫助訓練[19],但後來因為文件裡的操作步驟過時而失效而移除文件[20]

在2019年十一月時,由於Gian-Carlo Pascutto英语Gian-Carlo Pascutto個人時間的限制,加上最近的50萬盤沒有推進,而且其他的專案有不錯的前景(包括SAIKataGo),宣佈先將訓練盤數加到75萬盤以確認是否到了極限,並暫定於2020年1月31日結束這次長達兩年的訓練[21]

合作

Minigo

Minigo同樣也是依照AlphaGo Zero論文所獨立實做出來的軟體[22],而Minigo專案取得Google贊助的計算資源[22],透過大量計算資源得到品質還不錯的訓練網路資料。因此Leela Zero的團隊與Minigo的團隊基於雙方的經驗,討論參數的調整能帶來的改善,以及雙方訓練資料共用的可能性[23]

ELF OpenGo

ELF OpenGoFacebook依照AlphaGo ZeroAlphaZero所實做出來的軟體[24],由於Facebook使用大量資源運算(使用2000顆GPU計算兩週)並公開訓練網路資料,Leela Zero團隊得以將資料轉換為Leela Zero可以使用的格式(Hash值為62b5417b[8]),並進行分析。

Leela Zero後來決定將ELF OpenGo的資料混入自我對弈,在2018年5月7日後引入了ELF OpenGo的資料[25][26]

成績

CGOS

CGOS(英語:Computer Go Server)上會有志願者將每次演化的版本掛上進行測試(19x19)[27]以比較與其他圍棋軟體的差距。

名稱

程式名稱會以LZLeelaZero之類的名稱命名。大致上有幾個不同的版本,像是使用訓練網路的Hash值為名(如LZ-d6f3a6-t1-p1600[28]),或是使用訓練世代的次數為名(如LZ-000-p1600-t1-r1[29])。

特例

有幾個特別的訓練網路不是自我訓練產生,而是透過人類頂尖棋手的對弈棋譜產生,用以作為階段性的指標。

名為LZ-HBest1-t1-p1600[30][註 3]的帳號是使用Leela Zero的程式加上以人類棋譜計算出的20 blocks x 256 filters訓練網路[32]所產生的的版本[33](BayesElo約2650分[34])。

另一個帳號是LZH256x20-t4-nolim[35],也是使用20 blocks x 256 filters訓練網路,但以CGOS的時間限制,找出Leela Zero的程式與人類棋譜訓練的網路可以達到的最高成績(BayesElo約3610分[34])。

分數

另外由於CGOS可以任意註冊名稱,有些人會拿較強的軟體摸魚混珠(而非使用Leela Zero),因此CGOS上面的數據需要確認後才有參考價值[36]。在CGOS上測試比較完整的基準參數是t1-p1600(Thread 1、Playouts 1600),但目前(2018年四月)已暫時沒有使用這個參數測試訓練網路:

  • LZ-c99f1a-t1-p1600[37](第36代,約136萬盤訓練)的BayesElo分數約1830分[34],超越CGOS的分數基準GNU Go(1800分),不過此時對GNU Go的勝率還不高。
  • LZ-097dee-t1-p1600[38](第41代,約146萬盤訓練)後可以穩定對GNU Go獲勝。此時BayesElo分數約2000分[34]
  • LZ-c83e1b-t1-p1600[39](第57代,約266萬盤訓練)的BayesElo分數約2480分[34],這是最後一個5 blocks x 64 filters的版本。
  • LZ-ed002c-t1-p1600[40](第58代,約286萬盤訓練)的BayesElo分數約2460分[34],這是第一個6 blocks x 128 filters的版本。
  • LZ-5773f4-t1-p1600[41](第65代,約314萬盤訓練)的BayesElo分數約2670分[34],是第一個在相同執行參數下,超越以人類棋譜訓練出的版本(即LZ-HBest1-t1-p1600[30]的2650分)。

野狐圍棋

2017年12月16日,贴吧上的志願者以alphaleela的帳號在野狐圍棋上開始測試,以快棋對弈為主,並隨時更新為最新版的訓練網路。於2017年12月30日(約150萬盤訓練)從級位升到一段,在2018年3月8日(約497萬盤訓練)升到九段[42]

2018世界人工智慧圍棋大賽

在預賽取得第三名,僅輸給PhoenixGo絕藝[43]

相關連結

  • AlphaGo Zero,Leela Zero所參考的論文所實做的電腦圍棋軟體。
  • ELF OpenGo,由Facebook團隊依照AlphaGo Zero論文所實做的開源電腦圍棋軟體,並將訓練的數據被Leela Zero團隊納入。
  • Leela,同作者的上一代電腦圍棋軟體。
  • Minigo,另外一套開源電腦圍棋軟體。
  • SAI,改自Leela Zero但支援動態貼目的圍棋軟體。
  • 電腦圍棋
  • 圍棋軟體

參考資料

  1. ^ 1.0 1.1 Release 0.17. 2019年4月4日 [2019年4月4日]. 
  2. ^ Releases · leela-zero/leela-zero. [2019-10-07]. (原始内容于2020-11-29) (英语). 
  3. ^ 引用错误:没有为名为leelazeroserver"的参考文献提供内容
  4. ^ 4.0 4.1 4.2 4.3 Mastering the game of Go without human knowledge. 自然 (期刊). 2017-10-18 [2017-12-18]. (原始内容于2018-04-12) (英语). 
  5. ^ 5.0 5.1 5.2 5.3 5.4 gcp/leela-zero: Go engine with no human-provided knowledge, modeled after the AlphaGo Zero paper.. [2017-12-18]. (原始内容于2021-01-06) (英语). 
  6. ^ 6.0 6.1 6.2 Frequently Asked Questions about Leela Zero. [2017-12-18]. (原始内容于2019-02-17) (英语). 
  7. ^ gcp/leela-zero-server: Server side code of the Leela Zero project. [2018-01-14]. (原始内容于2020-09-15) (英语). 
  8. ^ 8.0 8.1 8.2 8.3 8.4 Leela Zero. [2017-12-18]. (原始内容于2018-05-05). 
  9. ^ Raw training data · Issue #167 · gcp/leela-zero. [2018-01-09]. (原始内容于2019-10-18) (英语). 
  10. ^ net2net by Ttl · Pull Request #704 · leela-zero/leela-zero. [2019-04-06]. (原始内容于2019-10-18) (英语). 
  11. ^ Is Leelaz trained off all the the games, or just the more recent ones? · Issue #484 · gcp/leela-zero. 2017-12-24 [2017-12-27]. (原始内容于2019-02-17) (英语). 
  12. ^ How to find Information about the new best network · Issue #78 · gcp/leela-zero. 2018-01-01 [2018-01-03]. (原始内容于2020-11-09) (英语). 
  13. ^ 128x10 transition (6615567e) · Issue #965 · gcp/leela-zero. [2018-04-02]. (原始内容于2020-11-09) (英语). 
  14. ^ Update benchmark to -v3200. · gcp/leela-zero@bce0e3d. 2018-03-13 [2018-04-11]. (原始内容于2019-02-17) (英语). 
  15. ^ 15.0 15.1 15.2 Gian-Carlo Pascutto - The man behind LeelaZero. European Go Federation英语European Go Federation. 2018-05-24 [2018-06-02]. (原始内容于2018-07-06). 
  16. ^ Zero performance. 2017-10-20 [2017-12-18]. (原始内容于2020-01-18) (英语). 
  17. ^ feature request: upload games when time limit is reached · Issue #563 · gcp/leela-zero. [2018-01-08]. (原始内容于2019-02-17) (英语). 
  18. ^ Big Red II - Cray XK7 , Opteron 6276 16C 2.300GHz, Cray Gemini interconnect, NVIDIA K20 | TOP500 Supercomputer Sites. [2018-01-08]. (原始内容于2020-01-03) (英语). 
  19. ^ leela-zero/COLAB.md at 05c5187faad02fd679373f3f9be30ae537ffe8d9 · leela-zero/leela-zero. 2018-04-24 [2019-04-06]. (原始内容于2019-04-25) (英语). 
  20. ^ Remove COLAB Readme. · leela-zero/leela-zero@a1a4af8. 2018-10-23 [2019-04-06]. (原始内容于2019-04-29) (英语). 
  21. ^ . 2019-12-16 [2020-01-02]. (原始内容存档于2021-02-12) (英语). 
  22. ^ 22.0 22.1 tensorflow/minigo: An open-source implementation of the AlphaGoZero algorithm. [2018-02-02]. (原始内容于2020-11-09) (英语). 
  23. ^ Ideas from Minigo · Issue #785 · gcp/leela-zero. [2018-02-02]. (原始内容于2019-10-18) (英语). 
  24. ^ . [2018-05-06]. (原始内容存档于2018-05-06) (英语). 
  25. ^ Facebook open sources elf opengo · Issue #1311 · gcp/leela-zero. 2018-05-03 [2018-05-16]. (原始内容于2019-06-05) (英语). 
  26. ^ two best networks in ten hours, is it related with ELF games? · Issue #1362 · gcp/leela-zero. [2018-05-08]. (原始内容于2019-02-17) (英语). 
  27. ^ (CGOS) 19x19 Computer Go Server. [2017-12-20]. (原始内容于2017-12-22) (英语). 
  28. ^ Crosstable for LZ-d6f3a6-t1-p1600. 2018-02-09 [2018-02-25]. (原始内容于2020-07-10) (英语). 
  29. ^ Crosstable for LZ-000-p1600-t1-r1. [2018-02-25]. (原始内容于2018-03-15) (英语). 
  30. ^ 30.0 30.1 Crosstable for LZ-HBest1-t1-p1600. [2017-12-20]. (原始内容于2020-07-10) (英语). 
  31. ^ Version 0.10 released - Next steps · Issue #591 · gcp/leela-zero. [2018-01-14]. (原始内容于2019-10-18) (英语). 
  32. ^ Question: Is there a way to generate up to date ("stronger"?) weights.txt? · Issue #794 · gcp/leela-zero. [2018-02-02]. (原始内容于2019-02-17) (英语). 
  33. ^ LZ-HBest1-t1-p1600 -- human supervised learning network on CGOS : cbaduk. 2017-12-17 [2017-12-20]. (原始内容于2019-02-17) (英语). 
  34. ^ 34.0 34.1 34.2 34.3 34.4 34.5 34.6 19x19 All Time Ranks. [2018-02-02]. (原始内容于2018-01-17) (英语). 
  35. ^ Crosstable for LZH256x20-t4-nolim. 2018-02-19 [2018-03-14]. (原始内容于2020-07-10) (英语). 
  36. ^ Who's running bad LZ bots on CGOS? : cbaduk. [2018-01-05]. (原始内容于2019-02-17) (英语). 
  37. ^ Crosstable for LZ-c99f1a-t1-p1600. 2017-12-26 [2018-01-09]. (原始内容于2020-07-10) (英语). 
  38. ^ Crosstable for LZ-097dee-t1-p1600. 2017-12-31 [2018-01-01]. (原始内容于2020-07-10) (英语). 
  39. ^ Crosstable for LZ-c83e1b-t1-p1600. 2018-01-19 [2018-02-02]. (原始内容于2020-07-10) (英语). 
  40. ^ Crosstable for LZ-ed002c-t1-p1600. 2018-01-22 [2018-02-02]. (原始内容于2020-07-10) (英语). 
  41. ^ Crosstable for LZ-5773f4-t1-p1600. 2018-01-28 [2018-01-29]. (原始内容于2020-07-10) (英语). 
  42. ^ 腾讯围棋. [2018-03-09]. (原始内容存档于2018-03-08) (中文(中国大陆)). 
  43. ^ 贝瑞基因杯机机大战预赛战罢 绝艺五连胜出线. 2018-04-27 [2018-05-13]. (原始内容于2018-04-30) (中文(中国大陆)). 

註解

  1. ^ 目前的原始訓練資料超過150 GB,故透過BitTorrent的方式提供下載。
  2. ^ 此時是使用5 blocks x 64 filters,從本來約每小時1500局,增加至約每小時3000局,大約多一倍的速度。
  3. ^ Hash值為1e2b85cf611d5ede3f8d77ddc56a7bd79a7f1e51a647ddea428b92c00fdf2612[31],偶而會以1e2b85cf出現在Test Matches的Network Hashes上[8]

外部連結

  • Leela Zero的程式碼 (英文)
  • Leela Zero (页面存档备份,存于互联网档案馆),Leela Zero的訓練狀態頁。(英文)
  • leela-zero eval (0x0): Leela-Zero (eval with more cross play) (页面存档备份,存于互联网档案馆(英文)
  • Leela Zero (页面存档备份,存于互联网档案馆) on GitHub
  • Leela Zero (页面存档备份,存于互联网档案馆) on Sensei's Library
  • Play Leela Zero (页面存档备份,存于互联网档案馆) on ZBaduk

leela, zero, 是由比利時程式設計師gian, carlo, pascutto, 英语, gian, carlo, pascutto, 起頭所開發的電腦圍棋軟體, 以及相關的運算計畫, 專案在2021年2月15日已經中止, 並推薦改參與sai與katago, 原作者gian, carlo, pascutto開發者gian, carlo, pascutto初始版本2017年10月26日, 5年前, 2017, 目前版本0, 2019年4月4日, 穩定版本, 源代码库github, leela, zero, . Leela Zero是由比利時程式設計師Gian Carlo Pascutto 英语 Gian Carlo Pascutto 起頭所開發的電腦圍棋軟體 以及相關的運算計畫 專案在2021年2月15日已經中止 並推薦改參與SAI與KataGo 3 Leela Zero原作者Gian Carlo Pascutto開發者Gian Carlo Pascutto初始版本2017年10月26日 5年前 2017 10 26 目前版本0 17 2019年4月4日 穩定版本 1 源代码库github wbr com wbr leela zero wbr leela zero编程语言C 类型電腦圍棋许可协议GPLv3网站github wbr com wbr leela zero wbr leela zeroLeela Zero Server原作者Jonathan Roy開發者Jonathan Roy初始版本2018年1月14日 4年前 2018 01 14 目前版本0 17 2019年4月4日 穩定版本 1 源代码库github wbr com wbr leela zero wbr leela zero server编程语言Node js类型電腦圍棋许可协议AGPLv3网站zero wbr sjeng wbr org 目录 1 簡介 2 與論文的差異 3 目標 4 訓練 5 合作 5 1 Minigo 5 2 ELF OpenGo 6 成績 6 1 CGOS 6 1 1 名稱 6 1 2 特例 6 1 3 分數 6 2 野狐圍棋 6 3 2018世界人工智慧圍棋大賽 7 相關連結 8 參考資料 9 註解 10 外部連結簡介 编辑参见 AlphaGo Zero Leela Zero是依照DeepMind在科學期刊 自然 上對於AlphaGo Zero所發表的論文 Mastering the game of Go without human knowledge 4 所實做出的開源電腦圍棋程式 5 也就是不使用人類棋譜與累積的圍棋知識 僅實做圍棋規則 使用單一類神經網路從自我對弈中學習 不像AlphaGo以人類角度思考 設計了Policy Network與Value Network 維基教科書中的相關電子教程 Computer Go Tromp Taylor Rules軟體使用蒙特卡洛树搜索 MCTS 模擬與ResNet 英语 ResNet 5 在蒙特卡洛树搜索模擬與自我訓練時都採用Tromp Taylor規則 6 這個規則的貼目雖然與中國規則相同 都是由黑棋貼7 5目 但在某些情境下可能會有差異 程式碼部份 用戶端對弈的程式碼與訓練的程式碼以GPLv3授權公開 5 分散式運算的伺服器端程式則以AGPLv3授權公開 7 資料的部份 訓練對弈資料 8 以及訓練對弈的原始資料 9 也可以公開下載 註 1 與論文的差異 编辑初期時Leela Zero在確認演算法以及程式是否實做正確 所以對論文裡提到的部份參數進行調整 以加快驗證速度 類神經網路的架構 AlphaGo Zero使用20 blocks或40 blocks 配上256 filters 4 Leela Zero是逐步提昇類神經網路的大小 在近期的版本開始使用Net2Net 將舊的網路資料轉換到新的網路上 10 一開始使用 1 block x 8 filters 2017年11月10日 第0代 並逐步換成 4 blocks x 32 filter 2017年11月17日 第2代 訓練約1 9萬盤時 5 blocks x 64 filters 2017年11月21日 第5代 約13 7萬盤時 6 blocks x 128 filters 2018年1月20日 第58代 約286萬盤時 10 blocks x 128 filters 2018年3月5日 第92代 約481萬盤時 15 blocks x 192 filters 2018年4月9日 第117代 約664萬盤時 20 blocks x 256 filters 2018年7月28日 第158代 約872萬盤時 到目前使用的 40 blocks x 256 filters 2018年9月4日 第174代 約997萬盤時 8 自我對戰訓練的盤數 AlphaGo Zero使用最新的50萬盤訓練 4 Leela Zero在10 blocks前 不含10 blocks 使用最新的25萬盤自我對戰結果訓練 11 在2018年1月1號前因為有bug 導致只會使用最新的 約 16萬盤自我對戰結果進行訓練 12 在10 blocks x 128 filters後改用最新的50萬盤自我對戰結果訓練 13 蒙特卡洛树搜索 MCTS 的模擬的次數 AlphaGo Zero在論文裡提到自我訓練或正式對弈時 每一步都使用1600次模擬 4 Leela Zero一開始使用與AlphaGo Zero的論文相同的1600次 但後來改為3200次 14 這些調整是希望在比較小的網路與訓練盤數下快速確認程式的正確性 6 在每個階段確認沒有重大問題以及bug後會重新評估調昇 並且正式公開向社群尋求運算資源 6 另外作者發現在原論文裡有瑕疵 論文裡的第一層輸入只有17個 會導致白棋較容易看到棋盤邊緣 指類神經網路 這在Leela Zero內被修正為18個 5 目標 编辑早期Leela Zero剛出來時 Gian Carlo Pascutto的目標是重製AlphaGo Zero的論文結果 5 15 在後來受到更多關注後 有更多的計算資源與人力投入Leela Zero計畫之中 使得Leela Zero的強度迅速提昇 甚至已經超越先前開發的Leela以及其他對手 15 現在的目標是希望在行動電話上也能夠有足夠強的圍棋軟體可以使用 15 訓練 编辑由於作者估算以當時的高階硬體 以Nvidia的GeForce GTX 1080 Ti估算 大約需要1700年的計算量才能達到AlphaGo Zero自我學習2900萬盤的水平 16 所以在2017年十一月開始 讓自願者使用自己的硬體 透過作者群開發的AutoGTP程式參加分散式運算計畫 以GTP自動與伺服器溝通以取得計算工作 8 在計畫啟動的34天後 2017年12月13日 自我對弈的訓練量超過100萬盤 59天後 2018年1月8日 超過200萬盤 74天後 2018年1月23日 超過300萬盤 100天後 2018年2月18日 超過400萬盤 119天後 2018年3月9日 超過500萬盤 138天後 2018年3月28日 超過600萬盤 166天後 2018年4月25日 超過700萬盤 218天後 2018年6月16日 超過800萬盤 261天後 2018年7月29日 超過900萬盤 299天後 2018年9月5日 超過1000萬盤 2018年初 志願者申請到超級電腦的部份計算資源 印第安纳大学的Big Red II 申請到3360 cores 約該台超級電腦的10 7 資源 17 18 註 2 另外自0 10版支援純CPU版本 不需GPU 現有演算法的最佳化以及新演算法的引入 這些因素大幅提昇了整體的計算速度 Leela Zero官方曾鼓勵參與者使用Google Colaboratory所提供的免費運算資源幫助訓練 19 但後來因為文件裡的操作步驟過時而失效而移除文件 20 在2019年十一月時 由於Gian Carlo Pascutto 英语 Gian Carlo Pascutto 個人時間的限制 加上最近的50萬盤沒有推進 而且其他的專案有不錯的前景 包括SAI與KataGo 宣佈先將訓練盤數加到75萬盤以確認是否到了極限 並暫定於2020年1月31日結束這次長達兩年的訓練 21 合作 编辑Minigo 编辑 参见 Minigo Minigo同樣也是依照AlphaGo Zero論文所獨立實做出來的軟體 22 而Minigo專案取得Google贊助的計算資源 22 透過大量計算資源得到品質還不錯的訓練網路資料 因此Leela Zero的團隊與Minigo的團隊基於雙方的經驗 討論參數的調整能帶來的改善 以及雙方訓練資料共用的可能性 23 ELF OpenGo 编辑 参见 ELF OpenGo ELF OpenGo是Facebook依照AlphaGo Zero與AlphaZero所實做出來的軟體 24 由於Facebook使用大量資源運算 使用2000顆GPU計算兩週 並公開訓練網路資料 Leela Zero團隊得以將資料轉換為Leela Zero可以使用的格式 Hash值為62b5417b 8 並進行分析 Leela Zero後來決定將ELF OpenGo的資料混入自我對弈 在2018年5月7日後引入了ELF OpenGo的資料 25 26 成績 编辑CGOS 编辑 在CGOS 英語 Computer Go Server 上會有志願者將每次演化的版本掛上進行測試 19x19 27 以比較與其他圍棋軟體的差距 名稱 编辑 程式名稱會以LZ或LeelaZero之類的名稱命名 大致上有幾個不同的版本 像是使用訓練網路的Hash值為名 如LZ d6f3a6 t1 p1600 28 或是使用訓練世代的次數為名 如LZ 000 p1600 t1 r1 29 特例 编辑 有幾個特別的訓練網路不是自我訓練產生 而是透過人類頂尖棋手的對弈棋譜產生 用以作為階段性的指標 名為LZ HBest1 t1 p1600 30 註 3 的帳號是使用Leela Zero的程式加上以人類棋譜計算出的20 blocks x 256 filters訓練網路 32 所產生的的版本 33 BayesElo約2650分 34 另一個帳號是LZH256x20 t4 nolim 35 也是使用20 blocks x 256 filters訓練網路 但以CGOS的時間限制 找出Leela Zero的程式與人類棋譜訓練的網路可以達到的最高成績 BayesElo約3610分 34 分數 编辑 另外由於CGOS可以任意註冊名稱 有些人會拿較強的軟體摸魚混珠 而非使用Leela Zero 因此CGOS上面的數據需要確認後才有參考價值 36 在CGOS上測試比較完整的基準參數是t1 p1600 Thread 1 Playouts 1600 但目前 2018年四月 已暫時沒有使用這個參數測試訓練網路 在LZ c99f1a t1 p1600 37 第36代 約136萬盤訓練 的BayesElo分數約1830分 34 超越CGOS的分數基準GNU Go 1800分 不過此時對GNU Go的勝率還不高 在LZ 097dee t1 p1600 38 第41代 約146萬盤訓練 後可以穩定對GNU Go獲勝 此時BayesElo分數約2000分 34 在LZ c83e1b t1 p1600 39 第57代 約266萬盤訓練 的BayesElo分數約2480分 34 這是最後一個5 blocks x 64 filters的版本 在LZ ed002c t1 p1600 40 第58代 約286萬盤訓練 的BayesElo分數約2460分 34 這是第一個6 blocks x 128 filters的版本 在LZ 5773f4 t1 p1600 41 第65代 約314萬盤訓練 的BayesElo分數約2670分 34 是第一個在相同執行參數下 超越以人類棋譜訓練出的版本 即LZ HBest1 t1 p1600 30 的2650分 野狐圍棋 编辑 2017年12月16日 贴吧上的志願者以alphaleela的帳號在野狐圍棋上開始測試 以快棋對弈為主 並隨時更新為最新版的訓練網路 於2017年12月30日 約150萬盤訓練 從級位升到一段 在2018年3月8日 約497萬盤訓練 升到九段 42 2018世界人工智慧圍棋大賽 编辑 主条目 腾讯世界人工智能围棋大赛 在預賽取得第三名 僅輸給PhoenixGo與絕藝 43 相關連結 编辑AlphaGo Zero Leela Zero所參考的論文所實做的電腦圍棋軟體 ELF OpenGo 由Facebook團隊依照AlphaGo Zero論文所實做的開源電腦圍棋軟體 並將訓練的數據被Leela Zero團隊納入 Leela 同作者的上一代電腦圍棋軟體 Minigo 另外一套開源電腦圍棋軟體 SAI 改自Leela Zero但支援動態貼目的圍棋軟體 電腦圍棋 圍棋軟體參考資料 编辑 1 0 1 1 Release 0 17 2019年4月4日 2019年4月4日 Releases leela zero leela zero 2019 10 07 原始内容存档于2020 11 29 英语 引用错误 没有为名为leelazeroserver 的参考文献提供内容 4 0 4 1 4 2 4 3 Mastering the game of Go without human knowledge 自然 期刊 2017 10 18 2017 12 18 原始内容存档于2018 04 12 英语 5 0 5 1 5 2 5 3 5 4 gcp leela zero Go engine with no human provided knowledge modeled after the AlphaGo Zero paper 2017 12 18 原始内容存档于2021 01 06 英语 6 0 6 1 6 2 Frequently Asked Questions about Leela Zero 2017 12 18 原始内容存档于2019 02 17 英语 gcp leela zero server Server side code of the Leela Zero project 2018 01 14 原始内容存档于2020 09 15 英语 8 0 8 1 8 2 8 3 8 4 Leela Zero 2017 12 18 原始内容存档于2018 05 05 Raw training data Issue 167 gcp leela zero 2018 01 09 原始内容存档于2019 10 18 英语 net2net by Ttl Pull Request 704 leela zero leela zero 2019 04 06 原始内容存档于2019 10 18 英语 Is Leelaz trained off all the the games or just the more recent ones Issue 484 gcp leela zero 2017 12 24 2017 12 27 原始内容存档于2019 02 17 英语 How to find Information about the new best network Issue 78 gcp leela zero 2018 01 01 2018 01 03 原始内容存档于2020 11 09 英语 128x10 transition 6615567e Issue 965 gcp leela zero 2018 04 02 原始内容存档于2020 11 09 英语 Update benchmark to v3200 gcp leela zero bce0e3d 2018 03 13 2018 04 11 原始内容存档于2019 02 17 英语 15 0 15 1 15 2 Gian Carlo Pascutto The man behind LeelaZero European Go Federation 英语 European Go Federation 2018 05 24 2018 06 02 原始内容存档于2018 07 06 Zero performance 2017 10 20 2017 12 18 原始内容存档于2020 01 18 英语 feature request upload games when time limit is reached Issue 563 gcp leela zero 2018 01 08 原始内容存档于2019 02 17 英语 Big Red II Cray XK7 Opteron 6276 16C 2 300GHz Cray Gemini interconnect NVIDIA K20 TOP500 Supercomputer Sites 2018 01 08 原始内容存档于2020 01 03 英语 leela zero COLAB md at 05c5187faad02fd679373f3f9be30ae537ffe8d9 leela zero leela zero 2018 04 24 2019 04 06 原始内容存档于2019 04 25 英语 Remove COLAB Readme leela zero leela zero a1a4af8 2018 10 23 2019 04 06 原始内容存档于2019 04 29 英语 End of first training run next steps 2019 12 16 2020 01 02 原始内容存档于2021 02 12 英语 22 0 22 1 tensorflow minigo An open source implementation of the AlphaGoZero algorithm 2018 02 02 原始内容存档于2020 11 09 英语 Ideas from Minigo Issue 785 gcp leela zero 2018 02 02 原始内容存档于2019 10 18 英语 ELF Game Research Platform Facebook AI 2018 05 06 原始内容存档于2018 05 06 英语 Facebook open sources elf opengo Issue 1311 gcp leela zero 2018 05 03 2018 05 16 原始内容存档于2019 06 05 英语 two best networks in ten hours is it related with ELF games Issue 1362 gcp leela zero 2018 05 08 原始内容存档于2019 02 17 英语 CGOS 19x19 Computer Go Server 2017 12 20 原始内容存档于2017 12 22 英语 Crosstable for LZ d6f3a6 t1 p1600 2018 02 09 2018 02 25 原始内容存档于2020 07 10 英语 Crosstable for LZ 000 p1600 t1 r1 2018 02 25 原始内容存档于2018 03 15 英语 30 0 30 1 Crosstable for LZ HBest1 t1 p1600 2017 12 20 原始内容存档于2020 07 10 英语 Version 0 10 released Next steps Issue 591 gcp leela zero 2018 01 14 原始内容存档于2019 10 18 英语 Question Is there a way to generate up to date stronger weights txt Issue 794 gcp leela zero 2018 02 02 原始内容存档于2019 02 17 英语 LZ HBest1 t1 p1600 human supervised learning network on CGOS cbaduk 2017 12 17 2017 12 20 原始内容存档于2019 02 17 英语 34 0 34 1 34 2 34 3 34 4 34 5 34 6 19x19 All Time Ranks 2018 02 02 原始内容存档于2018 01 17 英语 Crosstable for LZH256x20 t4 nolim 2018 02 19 2018 03 14 原始内容存档于2020 07 10 英语 Who s running bad LZ bots on CGOS cbaduk 2018 01 05 原始内容存档于2019 02 17 英语 Crosstable for LZ c99f1a t1 p1600 2017 12 26 2018 01 09 原始内容存档于2020 07 10 英语 Crosstable for LZ 097dee t1 p1600 2017 12 31 2018 01 01 原始内容存档于2020 07 10 英语 Crosstable for LZ c83e1b t1 p1600 2018 01 19 2018 02 02 原始内容存档于2020 07 10 英语 Crosstable for LZ ed002c t1 p1600 2018 01 22 2018 02 02 原始内容存档于2020 07 10 英语 Crosstable for LZ 5773f4 t1 p1600 2018 01 28 2018 01 29 原始内容存档于2020 07 10 英语 腾讯围棋 2018 03 09 原始内容存档于2018 03 08 中文 中国大陆 贝瑞基因杯机机大战预赛战罢 绝艺五连胜出线 2018 04 27 2018 05 13 原始内容存档于2018 04 30 中文 中国大陆 註解 编辑 目前的原始訓練資料超過150 GB 故透過BitTorrent的方式提供下載 此時是使用5 blocks x 64 filters 從本來約每小時1500局 增加至約每小時3000局 大約多一倍的速度 Hash值為1e2b85cf611d5ede3f8d77ddc56a7bd79a7f1e51a647ddea428b92c00fdf2612 31 偶而會以1e2b85cf出現在Test Matches的Network Hashes上 8 外部連結 编辑Leela Zero的程式碼 英文 Leela Zero 页面存档备份 存于互联网档案馆 Leela Zero的訓練狀態頁 英文 leela zero eval 0x0 Leela Zero eval with more cross play 页面存档备份 存于互联网档案馆 英文 Leela Zero 页面存档备份 存于互联网档案馆 on GitHub Leela Zero 页面存档备份 存于互联网档案馆 on Sensei s Library Play Leela Zero 页面存档备份 存于互联网档案馆 on ZBaduk 取自 https zh wikipedia org w index php title Leela Zero amp oldid 71636650, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。