亚洲一卡2卡3卡4卡5卡6卡_99RE6在线观看国产精品_99欧美日本一区二区留学生_成人国产精品日本在线观看_丰满爆乳在线播放_免费国产午夜理论片不卡_欧美成 人影片 免费观看_日产中字乱码一二三_肉感饱满中年熟妇日本_午夜男女爽爽影院免费视频下载,民工把我奶头掏出来在线视频,日韩经典亚洲,国产精品JIZZ在线观看无码

當(dāng)前位置:新聞 > 自動(dòng)發(fā)布新聞 > 正文

圍棋人機(jī)對(duì)弈五十年:第一代圍棋AI是中國(guó)教授發(fā)明

2017-05-24 10:53:07    北京日?qǐng)?bào)  參與評(píng)論()人

  

  AlphaGo2.0來(lái)到中國(guó),, “人機(jī)大戰(zhàn)第二季”激戰(zhàn)正酣,。

但事實(shí)上,AlphaGo已經(jīng)是圍棋人工智能的第三代。在開(kāi)發(fā)圍棋人工智能的道路上,,人類已經(jīng)艱難地探索了將近五十年。

第一代圍棋人工智能是中國(guó)教授發(fā)明

圍棋的英譯名Go是日語(yǔ)的發(fā)音譯來(lái)的,,圍棋在日語(yǔ)里寫成“碁”(即Go的發(fā)音),,把圍棋譯成Go或者The game of go大概是最蹩腳的翻譯了,尤其是在互聯(lián)網(wǎng)時(shí)代,,把圍棋譯成Go非常不利于圍棋的推廣,,但AlphaGo的出現(xiàn)或能改變這個(gè)事實(shí)。

棋類游戲是對(duì)人類智能的挑戰(zhàn),,自然也成了人工智能的標(biāo)志之一,。而圍棋一直被認(rèn)為是人工智能領(lǐng)域里的非常困難的挑戰(zhàn)。二戰(zhàn)還沒(méi)結(jié)束,,圖靈就研究計(jì)算機(jī)下棋,,他于1947年編了第一個(gè)國(guó)際象棋下棋程序,但直到1968年,,最早的電腦圍棋程序才被編寫出來(lái),。它是由阿爾伯特·索伯特開(kāi)發(fā)的,引入了一個(gè)評(píng)估函數(shù)對(duì)棋局進(jìn)行分析,,來(lái)估算雙方占空的大小,。然而,在相當(dāng)長(zhǎng)的一段時(shí)間里,,業(yè)界的普遍觀點(diǎn)是電腦圍棋只能達(dá)到業(yè)余棋手的水準(zhǔn),。

真正意義上的第一代圍棋AI(人工智能)“手談”,是由已故中山大學(xué)化學(xué)系教授陳志行研發(fā)的圍棋程序,,從1993年到2002年共10次獲得電腦圍棋世界冠軍,,而“手談”這個(gè)名字也是圍棋除“弈”之外的別稱。

陳志行教授原本研究的是量子化學(xué),,但同時(shí)也是圍棋業(yè)余高手,。在1991年退休后,他才開(kāi)始潛心研發(fā)電腦圍棋軟件,雖然當(dāng)時(shí)的電腦軟件技術(shù)水平還非常低,,而圍棋棋盤大(19 19,,一共有361點(diǎn)),空間狀態(tài)多,,打劫,、終局規(guī)則復(fù)雜,一般程序員至少需要設(shè)計(jì)一兩年才可能讓電腦學(xué)會(huì)下圍棋,。但量子化學(xué)專業(yè)出身的陳志行,,使用速度快但不太常用的匯編程序語(yǔ)言搭建圍棋框架和編寫圍棋對(duì)弈引擎,他潛心編寫的“Alpha-Beta搜索引擎”速度非???,在當(dāng)時(shí)領(lǐng)先其他同行幾個(gè)數(shù)量級(jí),達(dá)到了13層搜索深度,,也就是說(shuō)“手談”可以算清后面的13步棋,,而其他程序通常只能算七八步。陳志行編寫的“模式識(shí)別”專家系統(tǒng)在當(dāng)時(shí)也是無(wú)人能及,。

陳志行潛心研發(fā)“手談”3年后,,終于在世界比賽中斬獲首個(gè)圍棋人工智能世界冠軍。當(dāng)時(shí)的“手談”以戰(zhàn)斗力超強(qiáng)著稱,,智能水平遙遙領(lǐng)先國(guó)際同行,。之后“手談”對(duì)弈水平不斷進(jìn)步,在國(guó)際性的電腦圍棋對(duì)弈比賽上連續(xù)奪冠,,奪得了該時(shí)期大部分世界比賽的冠軍,。

當(dāng)時(shí)個(gè)人電腦系統(tǒng)剛在世界范圍內(nèi)普及,許多圍棋愛(ài)好者還專門購(gòu)買電腦安裝“手談”軟件,,用作學(xué)習(xí)圍棋和訓(xùn)練的工具,,“手談”軟件在世界范圍內(nèi)銷售量排名第一??梢哉f(shuō),,“手談”軟件的成功在國(guó)內(nèi)掀起了一波圍棋人工智能研究的熱潮。

“蒙特卡洛樹”算法開(kāi)啟二代圍棋人工智能

當(dāng)如IBM深藍(lán)那樣的超級(jí)電腦,,已經(jīng)能夠擊敗世界上最好的國(guó)際象棋棋手時(shí),,圍棋軟件卻仍然無(wú)法擊敗業(yè)余圍棋高手。

但是,,從2006年開(kāi)始,,隨著應(yīng)用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機(jī)器學(xué)習(xí)在圍棋上的應(yīng)用,電腦圍棋水平有了突飛猛進(jìn)的增長(zhǎng),,棋力普遍提升到業(yè)余高段的水準(zhǔn),。

圍棋的棋子多,,組合可能性也多。蒙特卡洛算法是一種基于“隨機(jī)數(shù)”的計(jì)算方法,,這一方法源于美國(guó)在二戰(zhàn)中研制原子彈的“曼哈頓計(jì)劃”,。頻率決定概率,圍棋對(duì)弈軟件將最常見(jiàn)的對(duì)弈定式及棋形輸入其中,,從而達(dá)到較短時(shí)間提高棋力的功效,。用通俗的語(yǔ)言解釋這種算法:“簡(jiǎn)單來(lái)說(shuō),人腦下圍棋靠的是邏輯思維,,而蒙特卡洛算法就是一個(gè)抽樣調(diào)查的方法,。其實(shí)就是一個(gè)賭博概率式的方法,如果電腦下100盤棋,,用這種下法贏了60盤,,用另一種下法只贏了50盤,那么,,它就會(huì)認(rèn)定第一種下法,,而淘汰另一種下法?!?/p>

蒙特卡洛樹搜索算法的出現(xiàn),可以看作是人工智能取得突破性進(jìn)展的標(biāo)志:計(jì)算機(jī)的思考方式,,已經(jīng)有點(diǎn)接近人類的思維方式了,。目前使用蒙特卡洛樹搜索的圍棋對(duì)弈軟件有瘋石圍棋(CrazyStone)、銀星圍棋(SilverStar),、天頂圍棋(ZEN)等,,都取得了不錯(cuò)的成績(jī)。

2011年8月歐洲圍棋大會(huì),,電腦圍棋軟件ZEN在19路盤上被讓五子擊敗日本職業(yè)棋手林耕三六段,。2012年3月,ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段,,這是圍棋程序首次在被讓四子的情況下戰(zhàn)勝第一流職業(yè)選手,。2013年,CrazyStone被讓四子擊敗日本石田芳夫九段,,2014年,,CrazyStone被讓四子擊敗日本依田紀(jì)基九段??梢?jiàn)圍棋軟件進(jìn)步迅速,,至少比起十年前對(duì)弈水平已經(jīng)提高一大截,受讓四子優(yōu)勢(shì)明顯,。

2015年10月,,同樣基于蒙特卡洛樹搜索的Google旗下人工智能公司DeepMind開(kāi)發(fā)的AlphaGo,,在沒(méi)有任何讓子的情況下,以五戰(zhàn)全勝的成績(jī)擊敗了歐洲圍棋冠軍,、職業(yè)圍棋二段樊麾,,這也是電腦圍棋程序首次擊敗圍棋職業(yè)棋手,當(dāng)然也意味著圍棋AI新時(shí)代的來(lái)臨,。

AlphaGo,、絕藝以及人機(jī)協(xié)作

圍棋AI之難,難在這項(xiàng)運(yùn)動(dòng)本身的多重復(fù)雜性“最簡(jiǎn)單的規(guī)則,,最復(fù)雜的變化”,。在AlphaGo及其開(kāi)發(fā)團(tuán)隊(duì)DeepMind出現(xiàn)之前,幾乎所有研究者都認(rèn)為在十年內(nèi)人工智能戰(zhàn)勝圍棋大師的機(jī)會(huì)是渺茫的,。而在它出現(xiàn)以后,,幾乎所有人都在驚呼人工智能已破解了圍棋這一歷史難題,甚至在極短的時(shí)間內(nèi)兩次讓研究成果上了《自然》雜志的封面,。

據(jù)AlphaGo官方介紹,,AlphaGo采用了一種更加“通用”的人工智能方法,即采用將改進(jìn)的蒙特卡洛決策樹算法與深度神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的方法構(gòu)建最終的學(xué)習(xí)系統(tǒng),。其包括兩個(gè)部分:策略網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò),。策略網(wǎng)絡(luò)在當(dāng)前給定的棋局中,負(fù)責(zé)預(yù)測(cè)下一步的走棋,,并對(duì)下一步走棋的好壞進(jìn)行打分,,策略網(wǎng)絡(luò)的作用好比“模仿”人類棋手的各種走法,以達(dá)到預(yù)測(cè)的效果,。然而僅憑模仿無(wú)法擊敗最頂級(jí)的人類高手,,AlphaGo又增加了價(jià)值網(wǎng)絡(luò)來(lái)判斷當(dāng)前的局面到底對(duì)哪一方有利,但圍棋程序的局勢(shì)評(píng)估相當(dāng)困難,,只能通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)之間自我訓(xùn)練的方法來(lái)達(dá)到良好的效果,。

2016年3月,AlphaGo以4:1戰(zhàn)勝世界圍棋名將李世石,,AlphaGo的實(shí)力首次被世人真正認(rèn)可,。AlphaGo 2.0版本的升級(jí)亮點(diǎn)是摒棄人類棋譜,即僅通過(guò)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),,再度進(jìn)化出新的“圍棋機(jī)器人”,。

事實(shí)上,除了AlphaGo,,現(xiàn)在還有其他圍棋AI程序也已被證明達(dá)到甚至超過(guò)了人類棋手的一流水平,,比如騰訊AI Lab(騰訊人工智能實(shí)驗(yàn)室)研發(fā)的圍棋人工智能程序“絕藝”(Fine Art),它在今年首次參加UEC杯計(jì)算機(jī)圍棋大賽,,就以11連勝奪得了本屆UEC杯冠軍,,在隨后的人機(jī)大戰(zhàn)中完勝日本先鋒棋手一力遼,。

AI作為工具,被人類棋手“喂招”不斷進(jìn)化后,,它也能“反哺”人類,,棋手使用圍棋AI開(kāi)展人機(jī)協(xié)同,AI為人類棋手“蓄力”,,1+1>2的進(jìn)化成為了新看點(diǎn),。隨著數(shù)據(jù)量的高速增長(zhǎng),AI可以分析總結(jié),、自我學(xué)習(xí),,人則可以通過(guò)善用AI、人機(jī)協(xié)作,,開(kāi)啟智慧時(shí)代,,改變現(xiàn)在以及未來(lái)的一切。(作者為《機(jī)器人產(chǎn)業(yè)》雜志副總編)

(原標(biāo)題:圍棋人機(jī)對(duì)弈五十年)

關(guān)鍵詞:圍棋人工智能
關(guān)閉