2017年新年開局,人工智能在與人類智慧對局上連下數(shù)城,,先是升級版的阿爾法圍棋接連擊敗中韓等國頂尖高手,,近日又橫空殺出名為DeepStack的人工智能新算法,在一對一無限注德州撲克中完美碾壓人類智商,。
來自加拿大阿爾伯塔大學和捷克兩所高校的研究人員近日在阿奇夫論文預(yù)印本網(wǎng)站(arXiv)上提交論文,,介紹其研發(fā)的新算法DeepStack首次在一對一無限注德州撲克中擊敗人類職業(yè)撲克玩家,。
研究人員稱,這種人工智能算法是一種可用于撲克等不完整信息博弈的通用算法,。在與33位來自國際撲克聯(lián)合會的職業(yè)撲克選手進行的4.4萬手撲克比賽中,,這種算法平均贏率超過450mbb/g。(mbb/g是衡量撲克玩家表現(xiàn)的指數(shù),一般50mbb/g就被認為是較大的優(yōu)勢,。)
德州撲克是人工智能的熱門挑戰(zhàn)領(lǐng)域,。此前,被人工智能攻克的圍棋是一種完全信息公開的博弈,,玩家可以看到棋盤上的棋子,,并預(yù)測落子可能性;而德州撲克玩家手中的底牌是其他玩家看不到的,,是不完整信息博弈,,要求更復(fù)雜的推理能力,對人工智能更具挑戰(zhàn),。
一對一無限注德州撲克擁有超過10的160次方個決策點,。研究人員稱,DeepStack在處理撲克中的信息不對稱性時用到了循環(huán)推理,,并使用分解法將計算集中在相關(guān)決策上,;它還運用深度學習技術(shù)從自我對戰(zhàn)中自動學習了一種關(guān)于任意牌的“直覺”。
這一研究成果無疑搶了卡耐基梅隆大學研究人員的風頭,。他們也設(shè)計了一場類似于阿爾法圍棋挑戰(zhàn)李世石的人機對戰(zhàn),,于當?shù)貢r間11日在匹茲堡的賭場盛大啟幕??突仿〈髮W的人工智能系統(tǒng)Libratus將在20天的時間內(nèi)與四位頂尖德州撲克選手玩12萬手一對一不限注的德州撲克,,獎金高達20萬美元。據(jù)悉,,Libratus與DeepStack采用了相似的計算方法,。
不過,參與設(shè)計Libratus的卡耐基梅隆大學教授桑德霍爾姆在接受媒體采訪時就持有異議,,他認為DeepStack并未與最頂尖的人類選手比賽,,所以暫時不能說是超越了人類。據(jù)新華社
原標題:人工智能靠直覺戰(zhàn)勝撲克職業(yè)選手