■“人機(jī)大戰(zhàn)”首局李世石認(rèn)輸,,“它下了非人類(lèi)的一手”
■AlphaGo團(tuán)隊(duì)的下一個(gè)“野心”:智能識(shí)別腎病患者
晨報(bào)記者 陳 承 黃宇龍
這是一場(chǎng)會(huì)被載入全人類(lèi)史冊(cè)的圍棋比賽,。
2016年3月9日下午3點(diǎn)半,由谷歌公司開(kāi)發(fā)的圍棋程序AlphaGo (“阿爾法狗”),打敗圍棋世界冠軍李世石,,在五番棋比賽中拔得頭籌?!啊柗▏濉?,比想象中厲害?!表n國(guó)棋手李世石在首局告負(fù)后說(shuō)道,。
頂尖棋手預(yù)測(cè)幾乎一邊倒
一個(gè)多月前,AlphaGo在研發(fā)階段極端保密的情況下橫空出世,,宣布其在2015年10月以5:0比分橫掃人類(lèi)圍棋職業(yè)二段選手樊麾,。
這個(gè)消息震驚人類(lèi)社會(huì)。此前,,即便是最樂(lè)觀的估計(jì),,也認(rèn)為電腦圍棋程序要戰(zhàn)勝人類(lèi)職業(yè)選手,至少還需要十年左右的時(shí)間,。
“都說(shuō)AlphaGO走棋像人,,但在大局觀和棋子的價(jià)值判斷上,它的能力已經(jīng)超過(guò)人類(lèi)最頂尖的選手,?!崩钍朗蹲诱J(rèn)輸后不久,傅奇軒對(duì)晨報(bào)記者評(píng)論到,。
傅奇軒是上海一個(gè)圍棋愛(ài)好者社區(qū)App的創(chuàng)始人,。昨天下午,傅奇軒組織了多位上海知名的年輕職業(yè)棋手來(lái)到咖啡館,,一起觀摩這場(chǎng)人機(jī)大戰(zhàn),。與前輩相比,,這些年輕人對(duì)計(jì)算機(jī)算法的威力更顯敬畏。賽前,,無(wú)論是傅奇軒還是當(dāng)天在咖啡館評(píng)棋的職業(yè)三段葛凡帆,,在面對(duì)記者拋出的“誰(shuí)會(huì)贏”這個(gè)問(wèn)題時(shí),回答都顯得保守:勝負(fù)五五開(kāi),。
相比之下,,中國(guó)的頂尖選手,無(wú)論是現(xiàn)役的還是傳奇國(guó)手,,賽前幾乎都信誓旦旦地認(rèn)為:李世石的勝率是百分之百,。比賽結(jié)果讓國(guó)手們大跌眼鏡,同樣來(lái)自韓國(guó)的圍棋好手金成龍,,面對(duì)采訪的鏡頭沒(méi)了脾氣,,一再扶額長(zhǎng)嘆。
然而,,圍棋只是負(fù)責(zé)研發(fā)Al-phaGo的DeepMind團(tuán)隊(duì)一個(gè)小小的技術(shù)展示,。在他們的官網(wǎng)上,寫(xiě)滿的是野心:DeepMind下一步要做的,,是通過(guò)計(jì)算機(jī)幫助醫(yī)生判斷如何更科學(xué)地治療人類(lèi)疾病,。
DeepMind似乎要將人類(lèi)提前帶進(jìn)一個(gè)未知的未來(lái)世界。
“人工智能和人類(lèi)對(duì)弈,,基本沒(méi)什么機(jī)會(huì),。AlphaGo對(duì)抗李世石的結(jié)果是,,100%是李世石贏得圍棋勝利,。”這是聶衛(wèi)平賽前的判斷,,這句話幾乎能代表所有中國(guó)職業(yè)圍棋選手,。
只有中國(guó)圍棋隊(duì)的教練俞斌,捎來(lái)了“晴空萬(wàn)里下,,天邊的一朵烏云”,。賽前,他曾面色憂慮地對(duì)別人說(shuō),,從他“搞來(lái)的谷歌內(nèi)部消息表示,,李世石勝出的可能性為零”。相較之下,,DeepMind創(chuàng)始人兼谷歌副總裁戴密斯哈薩比斯,,則稍顯官樣地說(shuō):對(duì)3月9日舉行的人機(jī)大戰(zhàn)充滿自信。
“不知道白棋怎么就贏了”
然而,,人機(jī)大戰(zhàn)的第一回合,,其過(guò)程和結(jié)果并非像賽前兩邊預(yù)測(cè)得那么極端——雙方在較量3個(gè)半小時(shí)后,,李世石186手認(rèn)輸,AlphaGo 獲勝,。這個(gè)結(jié)果讓“人族”一片驚呼,,多位參與解說(shuō)或觀戰(zhàn)的圍棋國(guó)手都表示震驚。根據(jù)賽程,,雙方還分別將在3月10日,、12日、13日,、15日的北京時(shí)間12點(diǎn)進(jìn)行剩余4場(chǎng)比賽,。
按照規(guī)則,比賽用時(shí)每方2小時(shí),,1分鐘讀秒3次,。比賽采用中國(guó)規(guī)則,黑貼3又3/4子(黑貼7目半),。采用中國(guó)規(guī)則是因AlphaGO以中國(guó)規(guī)則為基礎(chǔ)開(kāi)發(fā),。
值得一提的是盤(pán)中兩個(gè)細(xì)節(jié)。
首先是李世石下的第七手,,這被評(píng)棋者認(rèn)為是“新手”,,此前未曾如此下過(guò)。他們猜測(cè),,李世石的這手“怪招”目的在于擾亂AlphaGo的思維,,把局面搞復(fù)雜,讓對(duì)手“看不懂”,。然而事實(shí)證明,,AlphaGo根本不吃這一套,依然穩(wěn)健地按照自己的判斷出招,。其次,,李世石在棋盤(pán)左下角相當(dāng)舒服地下成了“雙飛燕”,而這被評(píng)棋者認(rèn)為是不可想象的,。
“如果是人類(lèi)頂級(jí)選手,,恐怕絕不會(huì)允許李世石如此輕松地下成‘雙飛燕’?!甭殬I(yè)三段葛凡帆對(duì)晨報(bào)記者稱,,“可事后來(lái)看,AlphaGo 放棄局部抵抗,,從而贏得大局面上的優(yōu)勢(shì),,反而是正確的?!?/P>
以上兩個(gè)細(xì)節(jié),,被傅奇軒總結(jié)為AlphaGo具有超人的大局觀和價(jià)值判斷能力,,它不糾結(jié)于局部,有些被人類(lèi)認(rèn)為理所應(yīng)當(dāng)爭(zhēng)取的地方,,它會(huì)放棄,,而是選擇更實(shí)惠、穩(wěn)健的下法,。
事實(shí)證明,,這種下法不但讓李世石不適應(yīng),更讓評(píng)棋者一度“沒(méi)了方向”,。中盤(pán)階段,,在中國(guó)各大視頻直播平臺(tái)參與評(píng)棋的好手,都一致認(rèn)為李世石盤(pán)面占優(yōu),,然而風(fēng)向突然變了,,當(dāng)他們開(kāi)始點(diǎn)目(精算局面的勝負(fù))時(shí)才發(fā)現(xiàn),李世石的優(yōu)勢(shì)已經(jīng)化為烏有,。
“可以說(shuō),,AlphaGo是在不知不覺(jué)間戰(zhàn)勝李世石的,有幾手棋雖然當(dāng)時(shí)看顯得很無(wú)理,,但復(fù)盤(pán)后一看,,AlphaGo選擇是在目數(shù)上最實(shí)惠的下法,它不會(huì)在人類(lèi)認(rèn)為理所應(yīng)當(dāng)進(jìn)行對(duì)抗的地方與李世石對(duì)抗,,我們被這種下法深深震撼了,。”葛凡帆如是評(píng)論,。
賽后李世石說(shuō):“我對(duì)‘阿爾法圍棋’的表現(xiàn)感到吃驚,。事實(shí)上我一直認(rèn)為不會(huì)輸。但‘阿爾法圍棋’下得那么完美,,真沒(méi)想到,。我認(rèn)為因?yàn)樾虮P(pán)布局的失敗,,黑棋一直處境艱難,。還有,我今天有兩個(gè)方面很吃驚:第一個(gè)是序盤(pán)布局能力比想象厲害,;第二個(gè)是它會(huì)下勝負(fù)手,。它算法能力比較強(qiáng),實(shí)戰(zhàn)中它下了人類(lèi)想不到的一手,,讓我大吃一驚,。”
也有旁觀棋手認(rèn)為,,局面占優(yōu)時(shí),,李世石的心態(tài)明顯發(fā)生了變化,,右下角黑棋下得太保守,白棋左右逢源,,角部做活,,大龍也及時(shí)補(bǔ)棋,黑棋一無(wú)所得,,此前的優(yōu)勢(shì)消失殆盡,。不過(guò)幾位現(xiàn)場(chǎng)觀戰(zhàn)的棋手表示,電腦這種逆境下的回?fù)羰址ㄖ鴮?shí)讓人吃驚,,幾乎招招都是“最佳應(yīng)對(duì)”,。
對(duì)于第一盤(pán)棋的結(jié)果和過(guò)程,全程觀看的中國(guó)棋手柯潔表示,,心情有些復(fù)雜,,他原本認(rèn)為李世石可以5比0取勝,但看完今天的比賽,,覺(jué)得勝負(fù)已難料,。因?yàn)殡娔X在后半段雖然有小失誤,但計(jì)算穩(wěn)定,,李世石后半段失誤太多,。“李世石前半盤(pán)積攢的優(yōu)勢(shì),,不足以在后面揮霍,。”柯潔表示,,自己現(xiàn)在更傾向于AlphaGo5比0擊敗李世石,。
上海圍棋隊(duì)主教練劉世振則表示,從這盤(pán)棋看,,電腦與去年10月份相比有了巨大進(jìn)步,,至于后面的比賽勝負(fù),真的很難預(yù)料,。
“解決智能”挑戰(zhàn)“圖靈”
DeepMind官網(wǎng)首頁(yè)上,,兩個(gè)斗大的單詞占據(jù)頁(yè)面中心位置:解決智能(Solve Intelligence)。
稍微懂得計(jì)算機(jī)理論的人,,也許都會(huì)被這兩個(gè)單詞組成的短語(yǔ)深深迷住——因?yàn)锳lphaGo的橫空出世,,使得由DeepMind研發(fā)的計(jì)算機(jī)算法,幾乎通過(guò)了圖靈測(cè)試,。
圖靈測(cè)試,,是整整66年前由計(jì)算機(jī)科學(xué)的先驅(qū)阿蘭·圖靈所提出的理論。圖靈說(shuō),,讓一個(gè)人類(lèi)坐在被幕布攔住的電腦前,,而由電腦回答由人類(lèi)提出的問(wèn)題,,如果電腦的答案讓人類(lèi)認(rèn)為是由另一個(gè)人類(lèi)回答的,那這臺(tái)電腦就通過(guò)了圖靈測(cè)試,,從而可以被認(rèn)為是具有智能的,。
66年來(lái),計(jì)算機(jī)領(lǐng)域的專(zhuān)家多有試圖讓自己研發(fā)的計(jì)算機(jī)算法通過(guò)圖靈測(cè)試的野心,。而AlphaGo 在去年對(duì)弈樊麾和昨日對(duì)弈李世石時(shí)所展現(xiàn)的能力,,已讓人看不出這是電腦在下棋。
“幾乎就是一個(gè)真人在下棋,,下得還很‘正’,,有點(diǎn)復(fù)古幾十年前流行的圍棋棋局的味道?!备鸱卜珜?duì)晨報(bào)評(píng)論說(shuō),,“但AlphaGo沒(méi)有情緒波動(dòng),大局的形勢(shì)判斷又很準(zhǔn),,這又是人類(lèi)頂尖棋手所難以達(dá)到的,。”
“AlphaGo有點(diǎn)像巔峰時(shí)期的‘石佛’李昌鎬,,下棋時(shí)心如止水,,情緒波動(dòng)極少;又有點(diǎn)像邱鑫,,布局實(shí)在,、穩(wěn)當(dāng),但他實(shí)戰(zhàn)時(shí)往往畏懼復(fù)雜局面,,AlphaGo恰恰不怕李世石把盤(pán)面‘?dāng)嚋啞?,?fù)雜的局面也能展現(xiàn)強(qiáng)大的控制力?!备灯孳幷f(shuō),。
DeepMind為AlphaGo設(shè)計(jì)的計(jì)算機(jī)算法,被稱為“具備深度神經(jīng)網(wǎng)絡(luò)的先進(jìn)搜索樹(shù)算法”,,其特點(diǎn)是,,不像此前的圍棋程序試圖通過(guò)窮舉法計(jì)算下完每一步之后局面的變化(而依照現(xiàn)在的計(jì)算機(jī)能力,是無(wú)法完美實(shí)現(xiàn)的)來(lái)作出取舍,,而是從每一步落子后,,從理論上存在的平均200種選擇可能,,縮小到三四種得分最高的選擇,,接著判斷局面是否處于優(yōu)勢(shì),優(yōu)勢(shì)多大,。也就是說(shuō),,這個(gè)算法不會(huì)“死算”,,而是會(huì)智能地選擇需要計(jì)算的局面,這極大地減少了計(jì)算量,,提高了效率,。
更可怕的是,這個(gè)算法還有自我學(xué)習(xí)能力,。
DeepMind官網(wǎng)的一篇文章介紹說(shuō),,AlphaGo學(xué)習(xí)了3000萬(wàn)步人類(lèi)實(shí)戰(zhàn)的圍棋下法,學(xué)習(xí)完畢后,,甚至可以“左右互博”,,自己跟自己下棋,在下了幾千盤(pán)棋局后,,AlphaGo能從這些棋局中學(xué)習(xí)新的圍棋策略,,這個(gè)過(guò)程被Deep-Mind稱為“強(qiáng)化學(xué)習(xí)”。
另外,,AlphaGo與樊麾和李世石的實(shí)戰(zhàn)棋譜,,也是它自己學(xué)習(xí)的絕佳“教材”,在與樊麾對(duì)弈后至昨日,,AlphaGo在5個(gè)多月中,,棋力又能明顯增長(zhǎng)。
“這或許也是中國(guó)頂尖棋手不太理解的地方,,他們分析了Alpha-Go和樊麾對(duì)戰(zhàn)的棋譜,,認(rèn)為電腦有著各種不足,但沒(méi)考慮到它還能自己學(xué)習(xí),,在與樊麾和李世石對(duì)戰(zhàn)期間,,AlphaGo的棋力增長(zhǎng)不少,進(jìn)步之快讓人震驚,?!备灯孳幷f(shuō)
圍棋“僅僅是開(kāi)始”
來(lái)自中國(guó)著名選手古力的感慨,更值得仔細(xì)玩味,。
他說(shuō):“谷歌公司的研發(fā)團(tuán)隊(duì)并沒(méi)有圍棋高手,,我納悶他們?cè)趺醋龀鲞@么厲害的圍棋電腦……”
“看到這句話,只能說(shuō)圍棋好手真的不懂計(jì)算機(jī)科學(xué),?!痹诟灯孳幗M織觀賽的咖啡館內(nèi),一位供職于某IT企業(yè),、要求匿名的圍棋愛(ài)好者表示:“DeepMind的計(jì)算機(jī)算法實(shí)質(zhì)上是在模擬人類(lèi)的思維方式,,而不僅僅在于研究如何下棋。”
這位愛(ài)好者樂(lè)觀地認(rèn)為,,經(jīng)過(guò)此役,計(jì)算機(jī)全面戰(zhàn)勝人類(lèi)圍棋選手的時(shí)代,,已近在眼前,。而這背后,,是人類(lèi)文明可能會(huì)進(jìn)入新的時(shí)代。
這句看似只有在科幻片里才會(huì)出現(xiàn)的臺(tái)詞,,也許正是AlphaGo戰(zhàn)勝李世石所釋放的終極信息:昭示了人類(lèi)即將邁入依靠計(jì)算機(jī),去解決思考而非純計(jì)算問(wèn)題的未來(lái)世界,。
證據(jù)便是DeepMind官網(wǎng)所披露的一個(gè)野心勃勃的新項(xiàng)目:DeepMind Health,,它借助跟Al-phaGo類(lèi)似的計(jì)算機(jī)算法,試圖幫助醫(yī)生識(shí)別最具風(fēng)險(xiǎn)的腎病患者,。
DeepMind Health 目前推出了一個(gè)名為 Streams 的手機(jī)App,,它能幫助醫(yī)生在幾秒鐘內(nèi),,就能查看存在急性腎臟損傷風(fēng)險(xiǎn)的病人的驗(yàn)血結(jié)果,并優(yōu)化對(duì)病人的治療方案,。
“這種直接發(fā)出提示,,并對(duì)病人優(yōu)先級(jí)進(jìn)行排序的系統(tǒng)前所未有?!眳⑴c測(cè)試這個(gè)項(xiàng)目的英國(guó)皇家自由醫(yī)院醫(yī)生感慨說(shuō),。
這僅僅是開(kāi)始。MindDeep宣稱,,他們開(kāi)發(fā)人工智能的目的,,就是為了解決人類(lèi)社會(huì)面臨的最棘手的問(wèn)題,使得世界變得更好,。
圍棋人機(jī)大戰(zhàn)首盤(pán)結(jié)果讓很多人大吃一驚,,也讓很多賽前一直看好李世石的專(zhuān)業(yè)棋手措施不及。不過(guò),,面對(duì)這個(gè)結(jié)果,,一直從事圍棋人工智能研究的專(zhuān)家和學(xué)者卻顯得更為平靜,他們顯然已經(jīng)做好了迎接這一天的準(zhǔn)備,,盡管這一天的到來(lái)快得超出了大多數(shù)人的想象,。
一年多之前,來(lái)自北京郵電大學(xué)的人工智能專(zhuān)家劉知青教授和圍棋學(xué)者胡廷楣就開(kāi)始著手聯(lián)合撰寫(xiě)一本關(guān)于圍棋人工智能的書(shū),而當(dāng)谷歌人工智能AlphaGo橫空出世般出現(xiàn)在職業(yè)棋手面前時(shí),,這本書(shū)也進(jìn)入了赴印階段——對(duì)于人工智能擊敗人類(lèi)那一天,,書(shū)里實(shí)際上已經(jīng)有了預(yù)言,。