亚洲一卡2卡3卡4卡5卡6卡_99RE6在线观看国产精品_99欧美日本一区二区留学生_成人国产精品日本在线观看_丰满爆乳在线播放_免费国产午夜理论片不卡_欧美成 人影片 免费观看_日产中字乱码一二三_肉感饱满中年熟妇日本_午夜男女爽爽影院免费视频下载,民工把我奶头掏出来在线视频,日韩经典亚洲,国产精品JIZZ在线观看无码

當(dāng)前位置:新聞 > 社會(huì)新聞 > 社會(huì)新聞更多頁面 > 正文

AI碾壓星際爭霸2人類職業(yè)玩家

2019-01-25 15:15:01  網(wǎng)易智能    參與評論()人

原標(biāo)題:圍棋之后AI繼續(xù)碾壓《星際爭霸2》人類職業(yè)玩家

圍棋之后 AI繼續(xù)碾壓《星際爭霸2》人類職業(yè)玩家

在DeepMind的倫敦總部,,人們正在觀看DeepMind的AI與人類職業(yè)玩家對決

網(wǎng)易智能訊1月25日消息,,谷歌旗下DeepMind開發(fā)的人工智能AIphaStar在《星際爭霸2》(Starcraft II)中擊敗了兩位人類職業(yè)玩家,這是AI領(lǐng)域的新里程碑,。在YouTube和Twitch上播放的比賽中,,AI玩家在連續(xù)10局中反復(fù)擊敗人類,。而在最后的對決中,職業(yè)選手格里戈?duì)柶潯ぁ奥取薄た泼髌潱℅rzegorz “MaNa” Komincz)為人類贏得了唯一的勝利,。

相比人類玩家,,AI的優(yōu)劣勢很明顯

與兄弟AI AIphago登頂?shù)膰逅煌氖牵缎请H爭霸2》是不完美信息系統(tǒng),,有著阻礙信息順利獲取的戰(zhàn)爭迷霧,,除此之外,操作的單位數(shù)量和頻率較大,,且存在多線作戰(zhàn),,需要同時(shí)兼顧后方經(jīng)營,和前方多線戰(zhàn)事,。顯然,,在多線決策方面AI的優(yōu)勢要比線性思維的人類要大得多。

圍棋之后 AI繼續(xù)碾壓《星際爭霸2》人類職業(yè)玩家

Atari,、圍棋和星際爭霸2的比較

DeepMind的研究聯(lián)席負(fù)責(zé)人戴維·西爾弗(David Silver)在賽后表示:“AI的歷史被打上了許多重大的,、標(biāo)桿性勝利的印記。盡管還有很多工作要做,,但我希望未來的人們在回顧(今天)時(shí),,認(rèn)為這是AI系統(tǒng)向前邁進(jìn)了一步的象征?!?/p>

在視頻游戲里擊敗人類玩家似乎是AI開發(fā)過程中的一個(gè)小插曲,,但這也是一個(gè)重大的研究挑戰(zhàn)?!缎请H爭霸2》這樣的游戲比圍棋之類棋盤游戲更難玩,。在視頻游戲中,AI無法通過觀察每個(gè)棋子的移動(dòng)來計(jì)算下一步棋,,它們必須實(shí)時(shí)做出反應(yīng),。

圍棋之后 AI繼續(xù)碾壓《星際爭霸2》人類職業(yè)玩家

去年12月份的比賽截圖顯示,AlphaStar與人類玩家TLO的對決

這些因素似乎對DeepMind被稱為AlphaStar的AI系統(tǒng)并未構(gòu)成多大障礙。首先,,它打敗了人類職業(yè)玩家達(dá)里奧·溫什(Dario Wunsch,,即TLO),然后將目標(biāo)對準(zhǔn)MaNa,。這些比賽最初是于去年12月份在DeepMind的倫敦總部舉行的,,但該公司今天播放了AlphaStar與MaNa的最后一場比賽,這是人類玩家唯一獲勝的比賽,。

《星際爭霸》的職業(yè)評論員形容AlphaStar的表現(xiàn)是“非凡的”,、“超人的”,。在《星際爭霸2》中,,玩家在建立基地,、訓(xùn)練軍隊(duì)和入侵?jǐn)橙祟I(lǐng)土之前,,會(huì)從相同地圖的不同側(cè)面展開行動(dòng),。AlphaStar尤其擅長所謂的“微操”,,即在戰(zhàn)場上快速,、果斷地控制單個(gè)或少量部隊(duì)的能力。

盡管人類玩家有時(shí)能夠訓(xùn)練出更強(qiáng)大的作戰(zhàn)單位,,但AlphaZero還是能夠在近距離內(nèi)戰(zhàn)勝他們。在一場游戲中,,AlphaStar用名為Stalker的快速移動(dòng)單位騷擾MaNa。評論員凱文·范德庫伊(Kevin van der Kooi)將其描述為“非凡的單位控制能力,,很不常見”,。MaNa在賽后表示:“如果我和任何人類比賽,他們都不會(huì)將Stalker運(yùn)用得如此出神入化,?!?/p>

這與我們在其他高級(jí)游戲AI中看到的行為相呼應(yīng)。當(dāng)OpenAI去年在《Dota 2》中與人類職業(yè)選手對決時(shí),,它們最后以失敗告終,。但專家們指出,,這些AI是以一種“清晰而精確”的方式進(jìn)行著游戲,。對此,我們無需感到奇怪,,快速做出沒有任何錯(cuò)誤的決定是機(jī)器的天賦異能,。

專家們已經(jīng)開始仔細(xì)分析這些比賽,并就AlphaStar是否擁有任何不公平的優(yōu)勢展開辯論,。這些AI在某些方面依然顯得笨拙,例如,,AlphaStar的每分鐘點(diǎn)擊依然比人類低,。但與人類玩家不同的是,,它每次都能夠查看整個(gè)地圖,,而不是手動(dòng)導(dǎo)航,。

DeepMind的研究人員表示,,這并沒有為AlphaStar提供真正的優(yōu)勢,,因?yàn)樗谌魏螘r(shí)間只關(guān)注地圖的某個(gè)特定部分,。但是,,正如比賽所顯示的那樣,這并沒有阻止AlphaStar同時(shí)熟練地控制三個(gè)不同區(qū)域的單位。評論員們表示,,這對人類來說是不可能的,。值得注意的是,當(dāng)MaNa在直播比賽中擊敗AlphaStar時(shí),AI使用的是受限的攝像頭視角。

AlphaStar的另一個(gè)潛在痛點(diǎn)是,,人類玩家雖然是職業(yè)玩家,但卻不是世界冠軍的標(biāo)準(zhǔn),。TLO還必須扮演《星際爭霸2》中他不熟悉的三個(gè)種族之一。

圍棋之后 AI繼續(xù)碾壓《星際爭霸2》人類職業(yè)玩家

AlphaStar處理過程的圖形展示,,該系統(tǒng)從上到下能看到整個(gè)地圖,并預(yù)測哪些行為將幫助獲得勝利

AI的重大進(jìn)步,?

撇開這些不談,,專家們稱這場比賽是AI向前邁出的重要一步。長期參與《星際爭霸》AI場景的AI研究人員戴夫·丘吉爾(Dave Churchill)表示:“我認(rèn)為AI取得了重大成就,,至少比我在AI研究人員中聽到的最樂觀猜測提前了一年?!比欢?,邱吉爾補(bǔ)充說,,由于DeepMind尚未發(fā)布任何關(guān)于這項(xiàng)工作的研究論文,因此很難說它是否顯示出任何技術(shù)上的飛躍,。他指出:“我還沒有讀過這篇博客文章,,也沒有接觸過相關(guān)的論文或技術(shù)細(xì)節(jié)?!?/p>

佐治亞理工學(xué)院AI副教授馬克·里德爾(Mark Riedl)表示,,他對結(jié)果并不那么驚訝,AI獲得勝利只是“時(shí)間問題”,。里德爾補(bǔ)充說,他不認(rèn)為這些比賽表明《星際爭霸2》已經(jīng)被AI徹底掌控,。他表示:“在上一場直播比賽中,,限制AlphaStar的某些能力確實(shí)消除了它的許多人為優(yōu)勢。但我們看到的更大的問題是,,當(dāng)人們可以把AI推出舒適區(qū)時(shí),,它就會(huì)崩潰?!?/p>

丹麥哥本哈根信息技術(shù)大學(xué)的塞巴斯蒂安·里斯(Sebastian Risi)表示:“這看起來是向前邁出的一大步,。我們不知道這其間有多少創(chuàng)新,,但培訓(xùn)AI的方式似乎是關(guān)鍵?!崩锼沟耐履釥査埂べZ斯特森(Niels Justesen)說:“我沒想到會(huì)發(fā)生這樣的事情,,尤其是因?yàn)橹暗亩说蕉藢W(xué)習(xí)《星際爭霸》的嘗試遠(yuǎn)遠(yuǎn)沒有達(dá)到人類的水平?!?/p>

殘酷的強(qiáng)化學(xué)習(xí)AI競技場

最終,,這類工作的最終目標(biāo)不是利用AI在視頻游戲中擊敗人類,而是改進(jìn)AI的訓(xùn)練方法,,尤其是為了創(chuàng)建能夠在《星際爭霸》等復(fù)雜虛擬環(huán)境中運(yùn)行的系統(tǒng),。

為了訓(xùn)練AlphaStar,DeepMind的研究人員使用了被稱為強(qiáng)化學(xué)習(xí)的方法。AI智能體基本上是通過反復(fù)嘗試才能達(dá)到某些目標(biāo),,比如贏球或者僅僅是生存下去,。它們首先通過模仿人類玩家來學(xué)習(xí),然后在類似競技比賽中相互對決,。最強(qiáng)的AI會(huì)存活下來,,最弱的則被淘汰。DeepMind估計(jì),,其每個(gè)AlphaStar智能體都以這種方式積累了大約200年的游戲時(shí)間,,游戲速度也在加快。

DeepMind很清楚自己開展這項(xiàng)工作的目標(biāo),。AlphaStar項(xiàng)目聯(lián)合負(fù)責(zé)人奧里爾·維尼亞斯(Oriol Vinyals)說:“首先,,也是最重要的,DeepMind的任務(wù)是建立通用AI,,它可以執(zhí)行人類所能完成的任何心理任務(wù),。要實(shí)現(xiàn)這個(gè)目標(biāo),最重要的就是對我們的AI智能體在各種任務(wù)中的表現(xiàn)進(jìn)行基準(zhǔn)測試,?!?/p>

科技媒體Engadget評論道,谷歌旗下的AI子公司DeepMind已經(jīng)轉(zhuǎn)向電腦游戲,,其AI系統(tǒng)始終在進(jìn)行微調(diào),,以適應(yīng)《星際爭霸2》。今天的《星際爭霸2》比賽,,是AlphaStar與職業(yè)玩家的第一次正面交鋒,。在兩場五局的系列比賽中,AlphaStar戰(zhàn)勝了職業(yè)選手TLO和MaNa,,贏得了10場勝利,。而在連續(xù)十次失利后,人類玩家終于贏得了最后一場比賽。

DeepMind的野心

雖然游戲并不能很好地展示這項(xiàng)技術(shù),,但它確實(shí)描繪了DeepMind在理解人類行為方面取得的長足進(jìn)步,。最終,這項(xiàng)技術(shù)可以被用于許多其他領(lǐng)域,,如理論物理學(xué),,甚至醫(yī)學(xué)。紐約大學(xué)的朱利安·加里烏斯(Julian lius)表示:“我認(rèn)為《星際爭霸》就像是在經(jīng)營一家公司,,尤其是后勤部門,。關(guān)鍵是要規(guī)劃研發(fā),在正確的時(shí)間把產(chǎn)品送到正確的地方,,避免瓶頸,。”

AlphaStar也可以幫助專業(yè)人士改善他們的策略,。馬耳他大學(xué)的Georgios Yannakakis稱:“如果AI能夠找到最優(yōu)的游戲方式,,那將是非常令人興奮的。這畢竟是人們構(gòu)建AI的原因之一,。目前來說,,很多人都不想在任何游戲中遇到DeepMind的AI對手,更不用說像《星際爭霸2》中與其進(jìn)行激烈對決了,。(選自:The Verge編譯:網(wǎng)易智能 參與:小?。?/p>


(責(zé)任編輯:盧書敏 CN069)
關(guān)鍵詞:

相關(guān)報(bào)道:

    關(guān)閉
     

    相關(guān)新聞