■“人機大戰(zhàn)”首局李世石認輸,“它下了非人類的一手”
■AlphaGo團隊的下一個“野心”:智能識別腎病患者
晨報記者 陳 承 黃宇龍
這是一場會被載入全人類史冊的圍棋比賽。
2016年3月9日下午3點半,,由谷歌公司開發(fā)的圍棋程序AlphaGo (“阿爾法狗”),打敗圍棋世界冠軍李世石,,在五番棋比賽中拔得頭籌?!啊柗▏濉?,比想象中厲害?!表n國棋手李世石在首局告負后說道,。
頂尖棋手預測幾乎一邊倒
一個多月前,AlphaGo在研發(fā)階段極端保密的情況下橫空出世,,宣布其在2015年10月以5:0比分橫掃人類圍棋職業(yè)二段選手樊麾,。
這個消息震驚人類社會。此前,,即便是最樂觀的估計,也認為電腦圍棋程序要戰(zhàn)勝人類職業(yè)選手,,至少還需要十年左右的時間,。
“都說AlphaGO走棋像人,但在大局觀和棋子的價值判斷上,,它的能力已經超過人類最頂尖的選手,。”李世石投子認輸后不久,,傅奇軒對晨報記者評論到,。
傅奇軒是上海一個圍棋愛好者社區(qū)App的創(chuàng)始人。昨天下午,,傅奇軒組織了多位上海知名的年輕職業(yè)棋手來到咖啡館,,一起觀摩這場人機大戰(zhàn)。與前輩相比,,這些年輕人對計算機算法的威力更顯敬畏,。賽前,無論是傅奇軒還是當天在咖啡館評棋的職業(yè)三段葛凡帆,,在面對記者拋出的“誰會贏”這個問題時,,回答都顯得保守:勝負五五開,。
相比之下,中國的頂尖選手,無論是現(xiàn)役的還是傳奇國手,,賽前幾乎都信誓旦旦地認為:李世石的勝率是百分之百,。比賽結果讓國手們大跌眼鏡,同樣來自韓國的圍棋好手金成龍,面對采訪的鏡頭沒了脾氣,,一再扶額長嘆。
然而,,圍棋只是負責研發(fā)Al-phaGo的DeepMind團隊一個小小的技術展示,。在他們的官網上,寫滿的是野心:DeepMind下一步要做的,,是通過計算機幫助醫(yī)生判斷如何更科學地治療人類疾病,。
DeepMind似乎要將人類提前帶進一個未知的未來世界。
“人工智能和人類對弈,,基本沒什么機會,。AlphaGo對抗李世石的結果是,100%是李世石贏得圍棋勝利,?!边@是聶衛(wèi)平賽前的判斷,這句話幾乎能代表所有中國職業(yè)圍棋選手,。
只有中國圍棋隊的教練俞斌,,捎來了“晴空萬里下,天邊的一朵烏云”,。賽前,,他曾面色憂慮地對別人說,從他“搞來的谷歌內部消息表示,,李世石勝出的可能性為零”,。相較之下,DeepMind創(chuàng)始人兼谷歌副總裁戴密斯哈薩比斯,,則稍顯官樣地說:對3月9日舉行的人機大戰(zhàn)充滿自信,。
“不知道白棋怎么就贏了”
然而,人機大戰(zhàn)的第一回合,,其過程和結果并非像賽前兩邊預測得那么極端——雙方在較量3個半小時后,,李世石186手認輸,AlphaGo 獲勝,。這個結果讓“人族”一片驚呼,,多位參與解說或觀戰(zhàn)的圍棋國手都表示震驚。根據賽程,,雙方還分別將在3月10日,、12日、13日,、15日的北京時間12點進行剩余4場比賽,。
按照規(guī)則,,比賽用時每方2小時,1分鐘讀秒3次,。比賽采用中國規(guī)則,,黑貼3又3/4子(黑貼7目半)。采用中國規(guī)則是因AlphaGO以中國規(guī)則為基礎開發(fā),。
值得一提的是盤中兩個細節(jié),。
首先是李世石下的第七手,這被評棋者認為是“新手”,,此前未曾如此下過,。他們猜測,李世石的這手“怪招”目的在于擾亂AlphaGo的思維,,把局面搞復雜,,讓對手“看不懂”。然而事實證明,,AlphaGo根本不吃這一套,,依然穩(wěn)健地按照自己的判斷出招。其次,,李世石在棋盤左下角相當舒服地下成了“雙飛燕”,,而這被評棋者認為是不可想象的。
“如果是人類頂級選手,,恐怕絕不會允許李世石如此輕松地下成‘雙飛燕’,。”職業(yè)三段葛凡帆對晨報記者稱,,“可事后來看,AlphaGo 放棄局部抵抗,,從而贏得大局面上的優(yōu)勢,,反而是正確的?!?/P>
以上兩個細節(jié),,被傅奇軒總結為AlphaGo具有超人的大局觀和價值判斷能力,它不糾結于局部,,有些被人類認為理所應當爭取的地方,,它會放棄,而是選擇更實惠,、穩(wěn)健的下法,。
事實證明,這種下法不但讓李世石不適應,,更讓評棋者一度“沒了方向”,。中盤階段,,在中國各大視頻直播平臺參與評棋的好手,都一致認為李世石盤面占優(yōu),,然而風向突然變了,,當他們開始點目(精算局面的勝負)時才發(fā)現(xiàn),李世石的優(yōu)勢已經化為烏有,。
“可以說,,AlphaGo是在不知不覺間戰(zhàn)勝李世石的,有幾手棋雖然當時看顯得很無理,,但復盤后一看,,AlphaGo選擇是在目數(shù)上最實惠的下法,它不會在人類認為理所應當進行對抗的地方與李世石對抗,,我們被這種下法深深震撼了,。”葛凡帆如是評論,。
賽后李世石說:“我對‘阿爾法圍棋’的表現(xiàn)感到吃驚,。事實上我一直認為不會輸。但‘阿爾法圍棋’下得那么完美,,真沒想到,。我認為因為序盤布局的失敗,黑棋一直處境艱難,。還有,,我今天有兩個方面很吃驚:第一個是序盤布局能力比想象厲害;第二個是它會下勝負手,。它算法能力比較強,,實戰(zhàn)中它下了人類想不到的一手,讓我大吃一驚,?!?/P>
也有旁觀棋手認為,局面占優(yōu)時,,李世石的心態(tài)明顯發(fā)生了變化,,右下角黑棋下得太保守,白棋左右逢源,,角部做活,,大龍也及時補棋,黑棋一無所得,,此前的優(yōu)勢消失殆盡,。不過幾位現(xiàn)場觀戰(zhàn)的棋手表示,電腦這種逆境下的回擊手法著實讓人吃驚,,幾乎招招都是“最佳應對”,。
對于第一盤棋的結果和過程,,全程觀看的中國棋手柯潔表示,心情有些復雜,,他原本認為李世石可以5比0取勝,,但看完今天的比賽,覺得勝負已難料,。因為電腦在后半段雖然有小失誤,,但計算穩(wěn)定,李世石后半段失誤太多,?!袄钍朗鞍氡P積攢的優(yōu)勢,不足以在后面揮霍,?!笨聺嵄硎荆约含F(xiàn)在更傾向于AlphaGo5比0擊敗李世石,。
上海圍棋隊主教練劉世振則表示,,從這盤棋看,電腦與去年10月份相比有了巨大進步,,至于后面的比賽勝負,,真的很難預料。
“解決智能”挑戰(zhàn)“圖靈”
DeepMind官網首頁上,,兩個斗大的單詞占據頁面中心位置:解決智能(Solve Intelligence),。
稍微懂得計算機理論的人,也許都會被這兩個單詞組成的短語深深迷住——因為AlphaGo的橫空出世,,使得由DeepMind研發(fā)的計算機算法,,幾乎通過了圖靈測試。
圖靈測試,,是整整66年前由計算機科學的先驅阿蘭·圖靈所提出的理論,。圖靈說,讓一個人類坐在被幕布攔住的電腦前,,而由電腦回答由人類提出的問題,如果電腦的答案讓人類認為是由另一個人類回答的,,那這臺電腦就通過了圖靈測試,,從而可以被認為是具有智能的。
66年來,,計算機領域的專家多有試圖讓自己研發(fā)的計算機算法通過圖靈測試的野心,。而AlphaGo 在去年對弈樊麾和昨日對弈李世石時所展現(xiàn)的能力,已讓人看不出這是電腦在下棋,。
“幾乎就是一個真人在下棋,,下得還很‘正’,,有點復古幾十年前流行的圍棋棋局的味道?!备鸱卜珜Τ繄笤u論說,,“但AlphaGo沒有情緒波動,大局的形勢判斷又很準,,這又是人類頂尖棋手所難以達到的,。”
“AlphaGo有點像巔峰時期的‘石佛’李昌鎬,,下棋時心如止水,,情緒波動極少;又有點像邱鑫,,布局實在,、穩(wěn)當,但他實戰(zhàn)時往往畏懼復雜局面,,AlphaGo恰恰不怕李世石把盤面‘攪渾’,,復雜的局面也能展現(xiàn)強大的控制力?!备灯孳幷f,。
DeepMind為AlphaGo設計的計算機算法,被稱為“具備深度神經網絡的先進搜索樹算法”,,其特點是,,不像此前的圍棋程序試圖通過窮舉法計算下完每一步之后局面的變化(而依照現(xiàn)在的計算機能力,是無法完美實現(xiàn)的)來作出取舍,,而是從每一步落子后,,從理論上存在的平均200種選擇可能,縮小到三四種得分最高的選擇,,接著判斷局面是否處于優(yōu)勢,,優(yōu)勢多大。也就是說,,這個算法不會“死算”,,而是會智能地選擇需要計算的局面,這極大地減少了計算量,,提高了效率,。
更可怕的是,這個算法還有自我學習能力,。
DeepMind官網的一篇文章介紹說,,AlphaGo學習了3000萬步人類實戰(zhàn)的圍棋下法,學習完畢后,,甚至可以“左右互博”,,自己跟自己下棋,,在下了幾千盤棋局后,AlphaGo能從這些棋局中學習新的圍棋策略,,這個過程被Deep-Mind稱為“強化學習”,。
另外,AlphaGo與樊麾和李世石的實戰(zhàn)棋譜,,也是它自己學習的絕佳“教材”,,在與樊麾對弈后至昨日,AlphaGo在5個多月中,,棋力又能明顯增長,。
“這或許也是中國頂尖棋手不太理解的地方,他們分析了Alpha-Go和樊麾對戰(zhàn)的棋譜,,認為電腦有著各種不足,,但沒考慮到它還能自己學習,在與樊麾和李世石對戰(zhàn)期間,,AlphaGo的棋力增長不少,,進步之快讓人震驚?!备灯孳幷f
圍棋“僅僅是開始”
來自中國著名選手古力的感慨,,更值得仔細玩味。
他說:“谷歌公司的研發(fā)團隊并沒有圍棋高手,,我納悶他們怎么做出這么厲害的圍棋電腦……”
“看到這句話,,只能說圍棋好手真的不懂計算機科學?!痹诟灯孳幗M織觀賽的咖啡館內,,一位供職于某IT企業(yè)、要求匿名的圍棋愛好者表示:“DeepMind的計算機算法實質上是在模擬人類的思維方式,,而不僅僅在于研究如何下棋,。”
這位愛好者樂觀地認為,,經過此役,,計算機全面戰(zhàn)勝人類圍棋選手的時代,已近在眼前,。而這背后,,是人類文明可能會進入新的時代。
這句看似只有在科幻片里才會出現(xiàn)的臺詞,,也許正是AlphaGo戰(zhàn)勝李世石所釋放的終極信息:昭示了人類即將邁入依靠計算機,,去解決思考而非純計算問題的未來世界,。
證據便是DeepMind官網所披露的一個野心勃勃的新項目:DeepMind Health,,它借助跟Al-phaGo類似的計算機算法,,試圖幫助醫(yī)生識別最具風險的腎病患者。
DeepMind Health 目前推出了一個名為 Streams 的手機App,,它能幫助醫(yī)生在幾秒鐘內,,就能查看存在急性腎臟損傷風險的病人的驗血結果,并優(yōu)化對病人的治療方案,。
“這種直接發(fā)出提示,,并對病人優(yōu)先級進行排序的系統(tǒng)前所未有?!眳⑴c測試這個項目的英國皇家自由醫(yī)院醫(yī)生感慨說,。
這僅僅是開始。MindDeep宣稱,,他們開發(fā)人工智能的目的,,就是為了解決人類社會面臨的最棘手的問題,使得世界變得更好,。
圍棋人機大戰(zhàn)首盤結果讓很多人大吃一驚,,也讓很多賽前一直看好李世石的專業(yè)棋手措施不及。不過,,面對這個結果,,一直從事圍棋人工智能研究的專家和學者卻顯得更為平靜,他們顯然已經做好了迎接這一天的準備,,盡管這一天的到來快得超出了大多數(shù)人的想象,。
一年多之前,來自北京郵電大學的人工智能專家劉知青教授和圍棋學者胡廷楣就開始著手聯(lián)合撰寫一本關于圍棋人工智能的書,,而當谷歌人工智能AlphaGo橫空出世般出現(xiàn)在職業(yè)棋手面前時,,這本書也進入了赴印階段——對于人工智能擊敗人類那一天,書里實際上已經有了預言,。