AI碾壓星際爭霸2：AI玩家在連續(xù)10局中反復(fù)擊敗人類

小大

用微信掃描二維碼
分享至好友和朋友圈

掃描到手機(jī)×

2019-01-25 15:44:43 北晚新視覺參與評論()人

原標(biāo)題：AI碾壓星際爭霸2 網(wǎng)友：人工智能玩游戲有樂趣可言嗎,？

谷歌旗下DeepMind開發(fā)的人工智能AIphaStar在《星際爭霸2》（Starcraft II）中擊敗了兩位人類職業(yè)玩家，這是AI領(lǐng)域的新里程碑,。在YouTube和Twitch上播放的比賽中,，AI玩家在連續(xù)10局中反復(fù)擊敗人類。而在最后的對決中,，職業(yè)選手格里戈爾茲·“曼娜”·科明茲（Grzegorz “MaNa” Komincz）為人類贏得了唯一的勝利,。

AI碾壓星際爭霸2：AI玩家在連續(xù)10局中反復(fù)擊敗人類

去年12月份的比賽截圖顯示，AlphaStar與人類玩家TLO的對決

相比人類玩家,，AI的優(yōu)劣勢很明顯

與兄弟AI AIphago登頂?shù)膰逅煌氖?，《星際爭霸2》是不完美信息系統(tǒng)，有著阻礙信息順利獲取的戰(zhàn)爭迷霧,，除此之外,，操作的單位數(shù)量和頻率較大，且存在多線作戰(zhàn)，需要同時兼顧后方經(jīng)營,，和前方多線戰(zhàn)事,。顯然，在多線決策方面AI的優(yōu)勢要比線性思維的人類要大得多,。

DeepMind的研究聯(lián)席負(fù)責(zé)人戴維·西爾弗(David Silver)在賽后表示:“AI的歷史被打上了許多重大的、標(biāo)桿性勝利的印記,。盡管還有很多工作要做,，但我希望未來的人們在回顧(今天)時，認(rèn)為這是AI系統(tǒng)向前邁進(jìn)了一步的象征,?！?/p>

在視頻游戲里擊敗人類玩家似乎是AI開發(fā)過程中的一個小插曲，但這也是一個重大的研究挑戰(zhàn),?！缎请H爭霸2》這樣的游戲比圍棋之類棋盤游戲更難玩。在視頻游戲中,，AI無法通過觀察每個棋子的移動來計算下一步棋,，它們必須實(shí)時做出反應(yīng)。

這些因素似乎對DeepMind被稱為AlphaStar的AI系統(tǒng)并未構(gòu)成多大障礙,。首先,，它打敗了人類職業(yè)玩家達(dá)里奧·溫什(Dario Wunsch，即TLO),，然后將目標(biāo)對準(zhǔn)MaNa,。這些比賽最初是于去年12月份在DeepMind的倫敦總部舉行的，但該公司今天播放了AlphaStar與MaNa的最后一場比賽,，這是人類玩家唯一獲勝的比賽,。

《星際爭霸》的職業(yè)評論員形容AlphaStar的表現(xiàn)是“非凡的”、“超人的”,。在《星際爭霸2》中,，玩家在建立基地、訓(xùn)練軍隊和入侵?jǐn)橙祟I(lǐng)土之前,，會從相同地圖的不同側(cè)面展開行動,。AlphaStar尤其擅長所謂的“微操”，即在戰(zhàn)場上快速,、果斷地控制單個或少量部隊的能力,。

盡管人類玩家有時能夠訓(xùn)練出更強(qiáng)大的作戰(zhàn)單位，但AlphaZero還是能夠在近距離內(nèi)戰(zhàn)勝他們,。在一場游戲中,，AlphaStar用名為Stalker的快速移動單位騷擾MaNa。評論員凱文·范德庫伊(Kevin van der Kooi)將其描述為“非凡的單位控制能力，很不常見”,。MaNa在賽后表示:“如果我和任何人類比賽,，他們都不會將Stalker運(yùn)用得如此出神入化?！?/p>

這與我們在其他高級游戲AI中看到的行為相呼應(yīng),。當(dāng)OpenAI去年在《Dota 2》中與人類職業(yè)選手對決時，它們最后以失敗告終,。但專家們指出,，這些AI是以一種“清晰而精確”的方式進(jìn)行著游戲。對此,，我們無需感到奇怪,，快速做出沒有任何錯誤的決定是機(jī)器的天賦異能。

專家們已經(jīng)開始仔細(xì)分析這些比賽,，并就AlphaStar是否擁有任何不公平的優(yōu)勢展開辯論,。這些AI在某些方面依然顯得笨拙，例如,，AlphaStar的每分鐘點(diǎn)擊依然比人類低,。但與人類玩家不同的是，它每次都能夠查看整個地圖,，而不是手動導(dǎo)航,。

DeepMind的研究人員表示，這并沒有為AlphaStar提供真正的優(yōu)勢,，因為它在任何時間只關(guān)注地圖的某個特定部分,。但是，正如比賽所顯示的那樣,，這并沒有阻止AlphaStar同時熟練地控制三個不同區(qū)域的單位,。評論員們表示，這對人類來說是不可能的,。值得注意的是,，當(dāng)MaNa在直播比賽中擊敗AlphaStar時，AI使用的是受限的攝像頭視角,。

AlphaStar的另一個潛在痛點(diǎn)是,，人類玩家雖然是職業(yè)玩家，但卻不是世界冠軍的標(biāo)準(zhǔn),。TLO還必須扮演《星際爭霸2》中他不熟悉的三個種族之一,。

AI的重大進(jìn)步？

撇開這些不談,，專家們稱這場比賽是AI向前邁出的重要一步,。長期參與《星際爭霸》AI場景的AI研究人員戴夫·丘吉爾（Dave Churchill）表示:“我認(rèn)為AI取得了重大成就,，至少比我在AI研究人員中聽到的最樂觀猜測提前了一年?！比欢?，邱吉爾補(bǔ)充說，由于DeepMind尚未發(fā)布任何關(guān)于這項工作的研究論文,，因此很難說它是否顯示出任何技術(shù)上的飛躍,。他指出:“我還沒有讀過這篇博客文章，也沒有接觸過相關(guān)的論文或技術(shù)細(xì)節(jié),?！?/p>

佐治亞理工學(xué)院AI副教授馬克·里德爾(Mark Riedl)表示，他對結(jié)果并不那么驚訝,，AI獲得勝利只是“時間問題”。里德爾補(bǔ)充說,，他不認(rèn)為這些比賽表明《星際爭霸2》已經(jīng)被AI徹底掌控,。他表示：“在上一場直播比賽中，限制AlphaStar的某些能力確實(shí)消除了它的許多人為優(yōu)勢,。但我們看到的更大的問題是,，當(dāng)人們可以把AI推出舒適區(qū)時，它就會崩潰,?！?/p>

丹麥哥本哈根信息技術(shù)大學(xué)的塞巴斯蒂安·里斯(Sebastian Risi)表示：“這看起來是向前邁出的一大步。我們不知道這其間有多少創(chuàng)新,，但培訓(xùn)AI的方式似乎是關(guān)鍵,。”里斯的同事尼爾斯·賈斯特森（Niels Justesen）說:“我沒想到會發(fā)生這樣的事情,，尤其是因為之前的端到端學(xué)習(xí)《星際爭霸》的嘗試遠(yuǎn)遠(yuǎn)沒有達(dá)到人類的水平,。”

殘酷的強(qiáng)化學(xué)習(xí)AI競技場

最終,，這類工作的最終目標(biāo)不是利用AI在視頻游戲中擊敗人類,，而是改進(jìn)AI的訓(xùn)練方法，尤其是為了創(chuàng)建能夠在《星際爭霸》等復(fù)雜虛擬環(huán)境中運(yùn)行的系統(tǒng),。

為了訓(xùn)練AlphaStar,DeepMind的研究人員使用了被稱為強(qiáng)化學(xué)習(xí)的方法,。AI智能體基本上是通過反復(fù)嘗試才能達(dá)到某些目標(biāo)，比如贏球或者僅僅是生存下去,。它們首先通過模仿人類玩家來學(xué)習(xí),，然后在類似競技比賽中相互對決。最強(qiáng)的AI會存活下來,，最弱的則被淘汰,。DeepMind估計，其每個AlphaStar智能體都以這種方式積累了大約200年的游戲時間，游戲速度也在加快,。

DeepMind很清楚自己開展這項工作的目標(biāo),。AlphaStar項目聯(lián)合負(fù)責(zé)人奧里爾·維尼亞斯(Oriol Vinyals)說：“首先，也是最重要的,，DeepMind的任務(wù)是建立通用AI,，它可以執(zhí)行人類所能完成的任何心理任務(wù)。要實(shí)現(xiàn)這個目標(biāo),，最重要的就是對我們的AI智能體在各種任務(wù)中的表現(xiàn)進(jìn)行基準(zhǔn)測試,。”

科技媒體Engadget評論道,，谷歌旗下的AI子公司DeepMind已經(jīng)轉(zhuǎn)向電腦游戲,，其AI系統(tǒng)始終在進(jìn)行微調(diào)，以適應(yīng)《星際爭霸2》,。今天的《星際爭霸2》比賽,，是AlphaStar與職業(yè)玩家的第一次正面交鋒。在兩場五局的系列比賽中,，AlphaStar戰(zhàn)勝了職業(yè)選手TLO和MaNa,，贏得了10場勝利。而在連續(xù)十次失利后,，人類玩家終于贏得了最后一場比賽,。

DeepMind的野心

雖然游戲并不能很好地展示這項技術(shù)，但它確實(shí)描繪了DeepMind在理解人類行為方面取得的長足進(jìn)步,。最終,，這項技術(shù)可以被用于許多其他領(lǐng)域，如理論物理學(xué),，甚至醫(yī)學(xué),。紐約大學(xué)的朱利安·加里烏斯(Julian lius)表示：“我認(rèn)為《星際爭霸》就像是在經(jīng)營一家公司，尤其是后勤部門,。關(guān)鍵是要規(guī)劃研發(fā),，在正確的時間把產(chǎn)品送到正確的地方，避免瓶頸,?！?/p>

AlphaStar也可以幫助專業(yè)人士改善他們的策略。馬耳他大學(xué)的Georgios Yannakakis稱:“如果AI能夠找到最優(yōu)的游戲方式,，那將是非常令人興奮的,。這畢竟是人們構(gòu)建AI的原因之一。目前來說,，很多人都不想在任何游戲中遇到DeepMind的AI對手,，更不用說像《星際爭霸2》中與其進(jìn)行激烈對決了,。（選自：The Verge編譯：網(wǎng)易智能參與：小小）

延伸閱讀

人工智能是否威脅人類,？有人預(yù)測：每天在研究你,，幫你做婚姻選擇

2018年12月第一期《科學(xué)》雜志封面，向人們介紹了一位“數(shù)字神童”——史上最強(qiáng)棋圣“阿爾法零”,。作為兩年前驚艷亮相的人工智能“阿爾法圍棋”進(jìn)化版,，“阿爾法零”不但征服了圍棋，而且僅分別“自學(xué)”2小時和4小時后,，就擊敗最強(qiáng)的日本將棋和國際象棋人工智能程序,。

AI碾壓星際爭霸2：AI玩家在連續(xù)10局中反復(fù)擊敗人類

“阿爾法零”的飛速成長，代表了2018年人工智能的進(jìn)步,。在移動互聯(lián)網(wǎng),、大數(shù)據(jù)、超級計算和腦科學(xué)等新理論新技術(shù)的驅(qū)動下,，問世60余年,、遭遇多次質(zhì)疑的人工智能迎來新一輪發(fā)展熱潮，真正進(jìn)入了落地實(shí)踐階段：各國新政密集出臺,、科技巨頭紛紛布局、最新進(jìn)展日新月異……一個“新智能時代”正在到來,。

無所不在

“阿爾法”系列人工智能不僅在棋牌領(lǐng)域打遍人類無敵手,，最新的“阿爾法折疊”還能有效預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)，并在12月初的一個國際競賽中擊敗眾多對手奪冠,。研制“阿爾法”系列程序的英國“深層思維”公司發(fā)表聲明說,，這“證明人工智能可驅(qū)動和加速科學(xué)新發(fā)現(xiàn)”。

從科研成果看,，人工智能正在眾多領(lǐng)域“開疆辟土”,，醫(yī)療健康領(lǐng)域首當(dāng)其沖。過去一年,，從確定藥物分子結(jié)構(gòu)到提高藥物開發(fā)效率,，從早期癌癥診斷到預(yù)測腫瘤發(fā)展，都可以看到人工智能在發(fā)揮作用,。比如,，美國加州大學(xué)洛杉磯分校的一項人工智能成果，能比醫(yī)生診斷提早6年預(yù)測出阿爾茨海默??；美國斯坦福大學(xué)的物理學(xué)家開發(fā)出一種人工智能程序，只用幾個小時就“重新發(fā)現(xiàn)”了元素周期表,；科學(xué)家已經(jīng)開始利用人工智能研究地震,、海嘯的預(yù)防,。

在應(yīng)用上，美國醫(yī)療管理機(jī)構(gòu)已批準(zhǔn)了首個人工智能醫(yī)療器械,，用于篩查糖尿病性視網(wǎng)膜病變,；阿里云正利用人工智能幫助馬來西亞首都吉隆坡“治堵”；日本警方將對預(yù)防犯罪的人工智能系統(tǒng)進(jìn)行測試,；人工智能還成為體育界智囊,，幫助運(yùn)動員磨煉技能，提高比賽成績……

總體看,，超強(qiáng)的計算能力,、與日俱增的海量數(shù)據(jù)以及不斷涌現(xiàn)的優(yōu)秀算法三者結(jié)合，驅(qū)動人工智能加速發(fā)展,，逐漸“脫虛向?qū)崱?。知名咨詢公司普華永道發(fā)布的報告顯示，到2030年,，人工智能將給全球國內(nèi)生產(chǎn)總值帶來14%的增長,，相當(dāng)于15.7萬億美元。

專家們相信,，未來人工智能將會像水,、電一樣無所不在，顛覆和變革醫(yī)療,、金融,、運(yùn)輸、制造,、服務(wù),、體育和軍事等各個行業(yè)。

目前,，從美國的GAFA(谷歌,、蘋果、臉書,、亞馬遜)到中國的BAT（百度,、阿里巴巴、騰訊）,，都在人工智能上押下重注,。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏說：“未來沒有任何一家企業(yè)可以宣稱跟人工智能沒有關(guān)系,?！?/p>

大國爭先

“人工智能不僅是俄羅斯的未來，也是全人類的未來……誰成為這一領(lǐng)域的領(lǐng)導(dǎo)者,，誰就將是世界的主宰者,?！倍砹_斯總統(tǒng)普京曾這樣說。

不僅普京,，德國總理默克爾,、法國總統(tǒng)馬克龍和英國首相特雷莎·梅等多個大國的領(lǐng)導(dǎo)人都曾表達(dá)對人工智能的重視。2018年,，各個大國均把加快發(fā)展人工智能上升至國家戰(zhàn)略高度布局深耕,，以搶占新一輪科技革命和產(chǎn)業(yè)變革的制高點(diǎn)。

——3月,，馬克龍公布法國人工智能發(fā)展戰(zhàn)略,，計劃在2022年他的首任總統(tǒng)任期結(jié)束前投入15億歐元，將法國打造成人工智能研發(fā)世界一流強(qiáng)國,。

——5月,，美國白宮召開“美國產(chǎn)業(yè)人工智能峰會”，希望確保美國的“全球技術(shù)絕對優(yōu)勢”,。白宮還在2019財年預(yù)算申請中首次將人工智能列為政府研發(fā)重點(diǎn),。

——英國首相梅今年多次發(fā)表講話，宣布英國將在人工智能方面投入約10億英鎊,，爭當(dāng)這一領(lǐng)域的世界領(lǐng)頭羊,，其中一個重要目標(biāo)是利用人工智能技術(shù)，到2033年減少2萬名癌癥患者,。

——11月,，德國政府出臺《人工智能戰(zhàn)略》，計劃在2025年前投資30億歐元推動德國人工智能發(fā)展,。默克爾說，德國的目標(biāo)是讓“‘德國制造’也成為人工智能領(lǐng)域的一個品牌”,。

——中國也把新一代人工智能視為一個重要前沿,，并提出到2030年人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,，成為世界主要人工智能創(chuàng)新中心,。

業(yè)界普遍認(rèn)為，整體來看,，中美已成為全球人工智能發(fā)展的兩強(qiáng),。美國在人工智能研究方面占據(jù)領(lǐng)先位置，而中國在人工智能應(yīng)用方面的成就有目共睹,。業(yè)內(nèi)專家認(rèn)為,，未來很長一段時間內(nèi)兩國在這一領(lǐng)域可以優(yōu)勢互補(bǔ)。

人機(jī)協(xié)作

隨著“新智能時代”的到來,，許多人問,，人工智能將來到底會有多“智能”,？也有人擔(dān)心，人工智能未來會不會威脅到人類,？

其實(shí),，人工智能有強(qiáng)弱之分，當(dāng)前乃至未來很長一段時間,，人工智能都將處于“弱智能”階段,，還只能局限在特定的封閉領(lǐng)域，就好像“阿爾法圍棋”和“阿爾法零”只能下棋,，干不了其他工作,。

業(yè)界一致看法是，人工智能會延展人類的能力,，放大并提升人類智能,，但并非取代人類。人機(jī)協(xié)作,，大幅提高工作效率,，才是人工智能應(yīng)有的未來。

至于未來人工智能是否會達(dá)到所謂技術(shù)“奇點(diǎn)”形成獨(dú)立人格,，專家們認(rèn)為,，按照現(xiàn)有技術(shù)模式，這種可能性為零,，機(jī)器人革命甚至毀滅人類完全屬于好萊塢式的杞人憂天,。

人工智能局限性的一個原因在于，今天的機(jī)器尚不具備情景推理能力,，必須訓(xùn)練它們涵蓋所有可能發(fā)生的情況,，這不僅代價高昂，而且難以實(shí)現(xiàn),。也正因此,，2011年諾貝爾經(jīng)濟(jì)學(xué)獎得主、美國經(jīng)濟(jì)學(xué)家托馬斯·薩金特才表示,，人工智能不過是統(tǒng)計學(xué),。

雖無遠(yuǎn)慮，但對人工智能的一個現(xiàn)實(shí)“近憂”是,，它已經(jīng)在和人類搶工作,。但最新的系列研究認(rèn)為，人工智能對未來就業(yè)的影響并非如想象的那樣悲觀,。根據(jù)世界經(jīng)濟(jì)論壇發(fā)布的《2018未來就業(yè)》報告,，未來5年，盡管7500萬份工作將被機(jī)器取代,，但1.33億份新工作將同步產(chǎn)生,，這意味著凈增的新工作崗位多達(dá)5800萬,。

暢銷書《人類簡史》作者尤瓦爾·赫拉利預(yù)測，隨著人工智能和生物技術(shù)的飛速發(fā)展,，人機(jī)融合將在本世紀(jì)完全實(shí)現(xiàn),，人類未來生活將發(fā)生難以想象地巨變。

“未來,，機(jī)器將比你更了解你自己,，”赫拉利說，“人工智能程序在你出生后的每一天都在研究你,，從每一封郵件到每一秒心跳,，最終它完全可以在任何事情上幫你作出更有利的選擇，包括婚姻這種‘終身大事’,?！?br/>

(責(zé)任編輯：崔鳳璇 CN072)

關(guān)鍵詞：

關(guān)閉

AI碾壓星際爭霸2：AI玩家在連續(xù)10局中反復(fù)擊敗人類

相關(guān)報道:

相關(guān)新聞

AI碾壓星際爭霸2人類職業(yè)玩家

深圳一3歲男童被車碾壓搶救無效死亡

3歲男童被車碾壓身亡交警提示：牽住孩子的手

3歲男童被車碾壓身亡：走到馬路中間并坐在地上玩耍

3歲男童無人看管被碾壓身亡交警：牽住孩子的手

聯(lián)賽杯-碾壓!曼城9-0伯頓,，熱蘇斯兩度破門上演大四喜

中華推薦

小編推薦

全球第二大無源電子元件供應(yīng)商國巨擬本月 16 日開始協(xié)商收購芝浦電子！

于小彤自曝曾被誤診貧血性白血?。旱媒^癥不哭

今日熱點(diǎn)

美國加州州長威脅停繳稅款回應(yīng)聯(lián)邦撥款削減

覬覦公海礦產(chǎn)多年美國為何急于推動開采,？

哥倫比亞右翼總統(tǒng)候選人遭槍擊現(xiàn)場視頻曝光

AI碾壓星際爭霸2：AI玩家在連續(xù)10局中反復(fù)擊敗人類

相關(guān)報道:

王自如稱絕對不會帶貨 澄清工資與欠款問題

2025年5月份居民消費(fèi)價格同比下降0.1%

今起試行 中國單方面免簽“朋友圈”再增4國

俄稱向烏工業(yè)中心推進(jìn) 烏方稱俄散布謊言

這種病奪走過十幾萬人性命 夏季高發(fā) 一定要注意,！

事關(guān)泰柬邊境局勢，泰國總理佩通坦最新發(fā)聲

天津國際郵輪母港重回雙郵輪母港模式

首次,、突破、一流,！上個周末 大國工程好消息不斷

伊朗稱獲取的以色列“敏感文件”即將解密

特朗普命令強(qiáng)力“解放洛杉磯”

山西沁源一企業(yè)發(fā)生生產(chǎn)安全事故致1人死亡

礪劍蒼穹 從殲-10飛行員視角感受云巔之上

以軍在加沙一物資分發(fā)點(diǎn)附近開火 致70余人死傷

沖突不斷 特朗普派國民警衛(wèi)隊協(xié)助執(zhí)法后深夜發(fā)文

中國汽車業(yè),，如何破“卷”求“新”？

我國海洋能開發(fā)利用技術(shù)已邁入世界第一方陣

三桶水引發(fā)火災(zāi)！速查家里透光反光物品的擺放位置

上海醫(yī)院接診蛇咬傷事件增多 如何辨別是否為毒蛇

數(shù)萬網(wǎng)友追更,！“凌小蟄”又有好消息

相關(guān)新聞

中華推薦

小編推薦

今日熱點(diǎn)

美國加州州長威脅停繳稅款回應(yīng)聯(lián)邦撥款削減

覬覦公海礦產(chǎn)多年 美國為何急于推動開采,？

哥倫比亞右翼總統(tǒng)候選人遭槍擊 現(xiàn)場視頻曝光

王自如稱絕對不會帶貨澄清工資與欠款問題

今起試行中國單方面免簽“朋友圈”再增4國

這種病奪走過十幾萬人性命夏季高發(fā) 一定要注意,！

首次,、突破、一流,！上個周末大國工程好消息不斷

礪劍蒼穹從殲-10飛行員視角感受云巔之上

以軍在加沙一物資分發(fā)點(diǎn)附近開火致70余人死傷

沖突不斷特朗普派國民警衛(wèi)隊協(xié)助執(zhí)法后深夜發(fā)文

上海醫(yī)院接診蛇咬傷事件增多如何辨別是否為毒蛇

覬覦公海礦產(chǎn)多年美國為何急于推動開采,？

哥倫比亞右翼總統(tǒng)候選人遭槍擊現(xiàn)場視頻曝光