陳志行潛心研發(fā)“手談”3年后,,終于在世界比賽中斬獲首個圍棋人工智能世界冠軍,。當(dāng)時的“手談”以戰(zhàn)斗力超強著稱,,智能水平遙遙領(lǐng)先國際同行,。之后“手談”對弈水平不斷進(jìn)步,在國際性的電腦圍棋對弈比賽上連續(xù)奪冠,,奪得了該時期大部分世界比賽的冠軍,。
當(dāng)時個人電腦系統(tǒng)剛在世界范圍內(nèi)普及,許多圍棋愛好者還專門購買電腦安裝“手談”軟件,用作學(xué)習(xí)圍棋和訓(xùn)練的工具,,“手談”軟件在世界范圍內(nèi)銷售量排名第一,。可以說,,“手談”軟件的成功在國內(nèi)掀起了一波圍棋人工智能研究的熱潮,。
“蒙特卡洛樹”算法開啟二代圍棋人工智能
當(dāng)如IBM深藍(lán)那樣的超級電腦,,已經(jīng)能夠擊敗世界上最好的國際象棋棋手時,,圍棋軟件卻仍然無法擊敗業(yè)余圍棋高手。
但是,,從2006年開始,,隨著應(yīng)用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機器學(xué)習(xí)在圍棋上的應(yīng)用,電腦圍棋水平有了突飛猛進(jìn)的增長,,棋力普遍提升到業(yè)余高段的水準(zhǔn),。
圍棋的棋子多,組合可能性也多,。蒙特卡洛算法是一種基于“隨機數(shù)”的計算方法,,這一方法源于美國在二戰(zhàn)中研制原子彈的“曼哈頓計劃”。頻率決定概率,,圍棋對弈軟件將最常見的對弈定式及棋形輸入其中,,從而達(dá)到較短時間提高棋力的功效。用通俗的語言解釋這種算法:“簡單來說,,人腦下圍棋靠的是邏輯思維,,而蒙特卡洛算法就是一個抽樣調(diào)查的方法。其實就是一個賭博概率式的方法,,如果電腦下100盤棋,,用這種下法贏了60盤,用另一種下法只贏了50盤,,那么,,它就會認(rèn)定第一種下法,而淘汰另一種下法,?!?/p>
蒙特卡洛樹搜索算法的出現(xiàn),可以看作是人工智能取得突破性進(jìn)展的標(biāo)志:計算機的思考方式,,已經(jīng)有點接近人類的思維方式了,。目前使用蒙特卡洛樹搜索的圍棋對弈軟件有瘋石圍棋(CrazyStone)、銀星圍棋(SilverStar),、天頂圍棋(ZEN)等,,都取得了不錯的成績。
2011年8月歐洲圍棋大會,電腦圍棋軟件ZEN在19路盤上被讓五子擊敗日本職業(yè)棋手林耕三六段,。2012年3月,,ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段,這是圍棋程序首次在被讓四子的情況下戰(zhàn)勝第一流職業(yè)選手,。2013年,,CrazyStone被讓四子擊敗日本石田芳夫九段,2014年,,CrazyStone被讓四子擊敗日本依田紀(jì)基九段,。可見圍棋軟件進(jìn)步迅速,,至少比起十年前對弈水平已經(jīng)提高一大截,,受讓四子優(yōu)勢明顯。