2017年新年開局,,人工智能在與人類智慧對(duì)局上連下數(shù)城,先是升級(jí)版的阿爾法圍棋接連擊敗中韓等國頂尖高手,,近日又橫空殺出名為DeepStack的人工智能新算法,,在一對(duì)一無限注德州撲克中完美碾壓人類智商。
來自加拿大阿爾伯塔大學(xué)和捷克兩所高校的研究人員近日在阿奇夫論文預(yù)印本網(wǎng)站(arXiv)上提交論文,,介紹其研發(fā)的新算法DeepStack首次在一對(duì)一無限注德州撲克中擊敗人類職業(yè)撲克玩家,。
研究人員稱,這種人工智能算法是一種可用于撲克等不完整信息博弈的通用算法,。在與33位來自國際撲克聯(lián)合會(huì)的職業(yè)撲克選手進(jìn)行的4.4萬手撲克比賽中,,這種算法平均贏率超過450mbb/g。(mbb/g是衡量撲克玩家表現(xiàn)的指數(shù),,一般50mbb/g就被認(rèn)為是較大的優(yōu)勢,。)
德州撲克是人工智能的熱門挑戰(zhàn)領(lǐng)域。此前,被人工智能攻克的圍棋是一種完全信息公開的博弈,,玩家可以看到棋盤上的棋子,,并預(yù)測落子可能性;而德州撲克玩家手中的底牌是其他玩家看不到的,,是不完整信息博弈,,要求更復(fù)雜的推理能力,對(duì)人工智能更具挑戰(zhàn),。
一對(duì)一無限注德州撲克擁有超過10的160次方個(gè)決策點(diǎn),。研究人員稱,DeepStack在處理撲克中的信息不對(duì)稱性時(shí)用到了循環(huán)推理,,并使用分解法將計(jì)算集中在相關(guān)決策上,;它還運(yùn)用深度學(xué)習(xí)技術(shù)從自我對(duì)戰(zhàn)中自動(dòng)學(xué)習(xí)了一種關(guān)于任意牌的“直覺”。
這一研究成果無疑搶了卡耐基梅隆大學(xué)研究人員的風(fēng)頭,。他們也設(shè)計(jì)了一場類似于阿爾法圍棋挑戰(zhàn)李世石的人機(jī)對(duì)戰(zhàn),于當(dāng)?shù)貢r(shí)間11日在匹茲堡的賭場盛大啟幕,??突仿〈髮W(xué)的人工智能系統(tǒng)Libratus將在20天的時(shí)間內(nèi)與四位頂尖德州撲克選手玩12萬手一對(duì)一不限注的德州撲克,獎(jiǎng)金高達(dá)20萬美元,。據(jù)悉,,Libratus與DeepStack采用了相似的計(jì)算方法。
不過,,參與設(shè)計(jì)Libratus的卡耐基梅隆大學(xué)教授桑德霍爾姆在接受媒體采訪時(shí)就持有異議,,他認(rèn)為DeepStack并未與最頂尖的人類選手比賽,所以暫時(shí)不能說是超越了人類,。據(jù)新華社
原標(biāo)題:人工智能靠直覺戰(zhàn)勝撲克職業(yè)選手