阿爾法狗再進(jìn)化碾壓舊狗 不再受人類(lèi)知識(shí)限制
原標(biāo)題:阿爾法狗再進(jìn)化自學(xué)3天就100:0碾壓李世石版舊狗
倫敦當(dāng)?shù)貢r(shí)間10月18日18:00(北京時(shí)間19日01:00),,AlphaGo再次登上世界頂級(jí)科學(xué)雜志——《自然》,。
一年多前,AlphaGo便是2016年1月28日當(dāng)期的封面文章,,Deepmind公司發(fā)表重磅論文,,介紹了這個(gè)擊敗歐洲圍棋冠軍樊麾的人工智能程序,。
今年5月,以3:0的比分贏下中國(guó)棋手柯潔后,,AlphaGo宣布退役,,但DeepMind公司并沒(méi)有停下研究的腳步。倫敦當(dāng)?shù)貢r(shí)間10月18日,,DeepMind團(tuán)隊(duì)公布了最強(qiáng)版AlphaGo ,,代號(hào)AlphaGo Zero。它的獨(dú)門(mén)秘籍,,是“自學(xué)成才”,。而且,是從一張白紙開(kāi)始,零基礎(chǔ)學(xué)習(xí),,在短短3天內(nèi),,成為頂級(jí)高手。
團(tuán)隊(duì)稱(chēng),,AlphaGo Zero的水平已經(jīng)超過(guò)之前所有版本的AlphaGo,。在對(duì)陣曾贏下韓國(guó)棋手李世石那版AlphaGo時(shí),AlphaGo Zero取得了100:0的壓倒性戰(zhàn)績(jī),。DeepMind團(tuán)隊(duì)將關(guān)于AlphaGo Zero的相關(guān)研究以論文的形式,,刊發(fā)在了10月18日的《自然》雜志上。
“AlphaGo在兩年內(nèi)達(dá)到的成績(jī)令人震驚?,F(xiàn)在,,AlphaGoZero是我們最強(qiáng)版本,它提升了很多,。Zero提高了計(jì)算效率,,并且沒(méi)有使用到任何人類(lèi)圍棋數(shù)據(jù),”AlphaGo之父,、DeepMind聯(lián)合創(chuàng)始人兼CEO戴密斯?哈薩比斯(DemisHassabis)說(shuō),,“最終,我們想要利用它的算法突破,,去幫助解決各種緊迫的現(xiàn)實(shí)世界問(wèn)題,,如蛋白質(zhì)折疊或設(shè)計(jì)新材料。如果我們通過(guò)AlphaGo,,可以在這些問(wèn)題上取得進(jìn)展,,那么它就有潛力推動(dòng)人們理解生命,并以積極的方式影響我們的生活,?!?/p>
不再受人類(lèi)知識(shí)限制,只用4個(gè)TPU
AlphaGo此前的版本,,結(jié)合了數(shù)百萬(wàn)人類(lèi)圍棋專(zhuān)家的棋譜,,以及強(qiáng)化學(xué)習(xí)的監(jiān)督學(xué)習(xí)進(jìn)行了自我訓(xùn)練。