圍棋人機對弈五十年：第一代圍棋AI是中國教授發(fā)明

小大

用微信掃描二維碼
分享至好友和朋友圈

掃描到手機×

2017-05-24 10:53:07 北京日報參與評論()人

　　AlphaGo2.0來到中國,， “人機大戰(zhàn)第二季”激戰(zhàn)正酣,。

但事實上,，AlphaGo已經(jīng)是圍棋人工智能的第三代,。在開發(fā)圍棋人工智能的道路上,，人類已經(jīng)艱難地探索了將近五十年。

第一代圍棋人工智能是中國教授發(fā)明

圍棋的英譯名Go是日語的發(fā)音譯來的，圍棋在日語里寫成“碁”(即Go的發(fā)音)，把圍棋譯成Go或者The game of go大概是最蹩腳的翻譯了,，尤其是在互聯(lián)網(wǎng)時代，把圍棋譯成Go非常不利于圍棋的推廣,，但AlphaGo的出現(xiàn)或能改變這個事實,。

棋類游戲是對人類智能的挑戰(zhàn)，自然也成了人工智能的標(biāo)志之一,。而圍棋一直被認(rèn)為是人工智能領(lǐng)域里的非常困難的挑戰(zhàn),。二戰(zhàn)還沒結(jié)束，圖靈就研究計算機下棋,，他于1947年編了第一個國際象棋下棋程序,，但直到1968年，最早的電腦圍棋程序才被編寫出來,。它是由阿爾伯特·索伯特開發(fā)的，引入了一個評估函數(shù)對棋局進行分析,，來估算雙方占空的大小,。然而，在相當(dāng)長的一段時間里,，業(yè)界的普遍觀點是電腦圍棋只能達(dá)到業(yè)余棋手的水準(zhǔn),。

真正意義上的第一代圍棋AI(人工智能)“手談”，是由已故中山大學(xué)化學(xué)系教授陳志行研發(fā)的圍棋程序,，從1993年到2002年共10次獲得電腦圍棋世界冠軍,，而“手談”這個名字也是圍棋除“弈”之外的別稱。

陳志行教授原本研究的是量子化學(xué),，但同時也是圍棋業(yè)余高手,。在1991年退休后，他才開始潛心研發(fā)電腦圍棋軟件,，雖然當(dāng)時的電腦軟件技術(shù)水平還非常低,，而圍棋棋盤大(19 19，一共有361點),，空間狀態(tài)多,，打劫、終局規(guī)則復(fù)雜,，一般程序員至少需要設(shè)計一兩年才可能讓電腦學(xué)會下圍棋,。但量子化學(xué)專業(yè)出身的陳志行，使用速度快但不太常用的匯編程序語言搭建圍棋框架和編寫圍棋對弈引擎，他潛心編寫的“Alpha-Beta搜索引擎”速度非?？?，在當(dāng)時領(lǐng)先其他同行幾個數(shù)量級，達(dá)到了13層搜索深度,，也就是說“手談”可以算清后面的13步棋,，而其他程序通常只能算七八步。陳志行編寫的“模式識別”專家系統(tǒng)在當(dāng)時也是無人能及,。

陳志行潛心研發(fā)“手談”3年后,，終于在世界比賽中斬獲首個圍棋人工智能世界冠軍。當(dāng)時的“手談”以戰(zhàn)斗力超強著稱,，智能水平遙遙領(lǐng)先國際同行,。之后“手談”對弈水平不斷進步，在國際性的電腦圍棋對弈比賽上連續(xù)奪冠,，奪得了該時期大部分世界比賽的冠軍,。

當(dāng)時個人電腦系統(tǒng)剛在世界范圍內(nèi)普及，許多圍棋愛好者還專門購買電腦安裝“手談”軟件,，用作學(xué)習(xí)圍棋和訓(xùn)練的工具,，“手談”軟件在世界范圍內(nèi)銷售量排名第一?？梢哉f,，“手談”軟件的成功在國內(nèi)掀起了一波圍棋人工智能研究的熱潮。

“蒙特卡洛樹”算法開啟二代圍棋人工智能

當(dāng)如IBM深藍(lán)那樣的超級電腦,，已經(jīng)能夠擊敗世界上最好的國際象棋棋手時,，圍棋軟件卻仍然無法擊敗業(yè)余圍棋高手。

但是,，從2006年開始,，隨著應(yīng)用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機器學(xué)習(xí)在圍棋上的應(yīng)用，電腦圍棋水平有了突飛猛進的增長,，棋力普遍提升到業(yè)余高段的水準(zhǔn),。

圍棋的棋子多，組合可能性也多,。蒙特卡洛算法是一種基于“隨機數(shù)”的計算方法,，這一方法源于美國在二戰(zhàn)中研制原子彈的“曼哈頓計劃”。頻率決定概率,，圍棋對弈軟件將最常見的對弈定式及棋形輸入其中,，從而達(dá)到較短時間提高棋力的功效。用通俗的語言解釋這種算法：“簡單來說,，人腦下圍棋靠的是邏輯思維,，而蒙特卡洛算法就是一個抽樣調(diào)查的方法,。其實就是一個賭博概率式的方法，如果電腦下100盤棋,，用這種下法贏了60盤,，用另一種下法只贏了50盤，那么,，它就會認(rèn)定第一種下法,，而淘汰另一種下法?！?/p>

蒙特卡洛樹搜索算法的出現(xiàn),，可以看作是人工智能取得突破性進展的標(biāo)志：計算機的思考方式，已經(jīng)有點接近人類的思維方式了,。目前使用蒙特卡洛樹搜索的圍棋對弈軟件有瘋石圍棋(CrazyStone),、銀星圍棋(SilverStar)、天頂圍棋(ZEN)等,，都取得了不錯的成績,。

2011年8月歐洲圍棋大會，電腦圍棋軟件ZEN在19路盤上被讓五子擊敗日本職業(yè)棋手林耕三六段,。2012年3月,，ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段，這是圍棋程序首次在被讓四子的情況下戰(zhàn)勝第一流職業(yè)選手,。2013年,，CrazyStone被讓四子擊敗日本石田芳夫九段，2014年,，CrazyStone被讓四子擊敗日本依田紀(jì)基九段?？梢妵遘浖M步迅速,，至少比起十年前對弈水平已經(jīng)提高一大截，受讓四子優(yōu)勢明顯,。

2015年10月,，同樣基于蒙特卡洛樹搜索的Google旗下人工智能公司DeepMind開發(fā)的AlphaGo，在沒有任何讓子的情況下,，以五戰(zhàn)全勝的成績擊敗了歐洲圍棋冠軍,、職業(yè)圍棋二段樊麾，這也是電腦圍棋程序首次擊敗圍棋職業(yè)棋手,，當(dāng)然也意味著圍棋AI新時代的來臨,。

AlphaGo、絕藝以及人機協(xié)作

圍棋AI之難,，難在這項運動本身的多重復(fù)雜性“最簡單的規(guī)則,，最復(fù)雜的變化”。在AlphaGo及其開發(fā)團隊DeepMind出現(xiàn)之前，幾乎所有研究者都認(rèn)為在十年內(nèi)人工智能戰(zhàn)勝圍棋大師的機會是渺茫的,。而在它出現(xiàn)以后,，幾乎所有人都在驚呼人工智能已破解了圍棋這一歷史難題，甚至在極短的時間內(nèi)兩次讓研究成果上了《自然》雜志的封面,。

據(jù)AlphaGo官方介紹,，AlphaGo采用了一種更加“通用”的人工智能方法，即采用將改進的蒙特卡洛決策樹算法與深度神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的方法構(gòu)建最終的學(xué)習(xí)系統(tǒng),。其包括兩個部分：策略網(wǎng)絡(luò)與價值網(wǎng)絡(luò),。策略網(wǎng)絡(luò)在當(dāng)前給定的棋局中，負(fù)責(zé)預(yù)測下一步的走棋,，并對下一步走棋的好壞進行打分,，策略網(wǎng)絡(luò)的作用好比“模仿”人類棋手的各種走法，以達(dá)到預(yù)測的效果,。然而僅憑模仿無法擊敗最頂級的人類高手,，AlphaGo又增加了價值網(wǎng)絡(luò)來判斷當(dāng)前的局面到底對哪一方有利，但圍棋程序的局勢評估相當(dāng)困難,，只能通過深度學(xué)習(xí)網(wǎng)絡(luò)之間自我訓(xùn)練的方法來達(dá)到良好的效果,。

2016年3月，AlphaGo以4:1戰(zhàn)勝世界圍棋名將李世石,，AlphaGo的實力首次被世人真正認(rèn)可,。AlphaGo 2.0版本的升級亮點是摒棄人類棋譜，即僅通過監(jiān)督學(xué)習(xí)和強化學(xué)習(xí),，再度進化出新的“圍棋機器人”,。

事實上，除了AlphaGo,，現(xiàn)在還有其他圍棋AI程序也已被證明達(dá)到甚至超過了人類棋手的一流水平,，比如騰訊AI Lab(騰訊人工智能實驗室)研發(fā)的圍棋人工智能程序“絕藝”(Fine Art)，它在今年首次參加UEC杯計算機圍棋大賽,，就以11連勝奪得了本屆UEC杯冠軍,，在隨后的人機大戰(zhàn)中完勝日本先鋒棋手一力遼。

AI作為工具,，被人類棋手“喂招”不斷進化后,，它也能“反哺”人類，棋手使用圍棋AI開展人機協(xié)同,，AI為人類棋手“蓄力”,，1+1>2的進化成為了新看點。隨著數(shù)據(jù)量的高速增長,，AI可以分析總結(jié),、自我學(xué)習(xí),，人則可以通過善用AI、人機協(xié)作,，開啟智慧時代,，改變現(xiàn)在以及未來的一切。(作者為《機器人產(chǎn)業(yè)》雜志副總編)

（原標(biāo)題：圍棋人機對弈五十年）

關(guān)鍵詞：圍棋人工智能

關(guān)閉

圍棋人機對弈五十年：第一代圍棋AI是中國教授發(fā)明

為您推薦：

人機大戰(zhàn)前瞻：人類向死而生機器另辟蹊徑

阿爾法狗對陣柯潔兩成受訪者擔(dān)心機器人統(tǒng)治人類

柯潔對戰(zhàn)阿爾法狗多數(shù)圍棋界人士不看好柯潔取勝

柯潔VS阿爾法狗：巔峰對決開啟:柯潔直言未來屬于人工智能

首戰(zhàn)失利,！圍棋人機大戰(zhàn)柯潔不敵AlphaGo(圖)

柯潔對戰(zhàn)阿爾法狗曾稱：有六成勝算讓風(fēng)暴來的猛烈點

柯潔首輪不敵阿爾法狗明知敗局已定依然下完全局

柯潔回應(yīng)首站惜敗AlphaGo：還沒有找到它的弱點

柯潔：AlphaGo令我震驚的一手輸?shù)脹]脾氣

人機圍棋對決AI再下一城結(jié)果無懸念,？

中華推薦

小編推薦

王傳福：我們絕不拉踩同行這是原則堅持長期主義

宣璐發(fā)文回應(yīng)走后門傳聞稱節(jié)目的剪輯掐頭去尾

今日熱點

馬斯克要創(chuàng)建美國新政黨？在線投票獲八成支持

特朗普：烏克蘭給了普京一個轟炸他們的理由

以色列襲擊不斷,！以黎?；饏f(xié)議或成一紙空談？