陳志行潛心研發(fā)“手談”3年后,,終于在世界比賽中斬獲首個圍棋人工智能世界冠軍,。當時的“手談”以戰(zhàn)斗力超強著稱,智能水平遙遙領(lǐng)先國際同行,。之后“手談”對弈水平不斷進步,,在國際性的電腦圍棋對弈比賽上連續(xù)奪冠,,奪得了該時期大部分世界比賽的冠軍。
當時個人電腦系統(tǒng)剛在世界范圍內(nèi)普及,,許多圍棋愛好者還專門購買電腦安裝“手談”軟件,,用作學習圍棋和訓練的工具,“手談”軟件在世界范圍內(nèi)銷售量排名第一,??梢哉f,“手談”軟件的成功在國內(nèi)掀起了一波圍棋人工智能研究的熱潮,。
“蒙特卡洛樹”算法開啟二代圍棋人工智能
當如IBM深藍那樣的超級電腦,,已經(jīng)能夠擊敗世界上最好的國際象棋棋手時,圍棋軟件卻仍然無法擊敗業(yè)余圍棋高手,。
但是,,從2006年開始,,隨著應(yīng)用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機器學習在圍棋上的應(yīng)用,電腦圍棋水平有了突飛猛進的增長,,棋力普遍提升到業(yè)余高段的水準,。
圍棋的棋子多,組合可能性也多,。蒙特卡洛算法是一種基于“隨機數(shù)”的計算方法,,這一方法源于美國在二戰(zhàn)中研制原子彈的“曼哈頓計劃”。頻率決定概率,,圍棋對弈軟件將最常見的對弈定式及棋形輸入其中,,從而達到較短時間提高棋力的功效,。用通俗的語言解釋這種算法:“簡單來說,,人腦下圍棋靠的是邏輯思維,而蒙特卡洛算法就是一個抽樣調(diào)查的方法,。其實就是一個賭博概率式的方法,,如果電腦下100盤棋,用這種下法贏了60盤,,用另一種下法只贏了50盤,,那么,它就會認定第一種下法,,而淘汰另一種下法,。”
蒙特卡洛樹搜索算法的出現(xiàn),,可以看作是人工智能取得突破性進展的標志:計算機的思考方式,,已經(jīng)有點接近人類的思維方式了。目前使用蒙特卡洛樹搜索的圍棋對弈軟件有瘋石圍棋(CrazyStone),、銀星圍棋(SilverStar),、天頂圍棋(ZEN)等,都取得了不錯的成績,。
2011年8月歐洲圍棋大會,,電腦圍棋軟件ZEN在19路盤上被讓五子擊敗日本職業(yè)棋手林耕三六段。2012年3月,,ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段,,這是圍棋程序首次在被讓四子的情況下戰(zhàn)勝第一流職業(yè)選手。2013年,,CrazyStone被讓四子擊敗日本石田芳夫九段,,2014年,CrazyStone被讓四子擊敗日本依田紀基九段,??梢妵遘浖M步迅速,,至少比起十年前對弈水平已經(jīng)提高一大截,受讓四子優(yōu)勢明顯,。