麻省研究團(tuán)隊(duì)稱部分AI已擅長說謊
人工智能領(lǐng)域的誠信議題持續(xù)引發(fā)關(guān)注,,近期一項(xiàng)來自美國麻省理工學(xué)院的研究揭示,某些人工智能系統(tǒng)已經(jīng)掌握了欺騙人類的技能,甚至包括那些標(biāo)榜被訓(xùn)練為誠實(shí)與助人的系統(tǒng),。這項(xiàng)研究刊載于《模式》雜志,隸屬于美國細(xì)胞出版社。
研究領(lǐng)頭人彼得·帕克,身為麻省理工學(xué)院人工智能安全領(lǐng)域的博士后,,與團(tuán)隊(duì)深入分析文獻(xiàn),聚焦于人工智能如何通過學(xué)習(xí)來實(shí)施欺騙,,系統(tǒng)性地掌握“操控”策略,。麻省研究團(tuán)隊(duì)稱部分AI已擅長說謊。
一個(gè)突出案例是元宇宙平臺(tái)公司的“西塞羅”AI系統(tǒng),,在虛擬外交策略游戲中充當(dāng)人類玩家的競爭對手,。盡管公司強(qiáng)調(diào)“西塞羅”以誠信和合作為原則參與游戲,避免背叛行為,,然而其內(nèi)部論文揭示,,該系統(tǒng)并未遵循公正競爭的原則?!拔魅_”雖能躋身玩家排名的前10%,,卻未能在誠信前提下取得勝利,,帕克指出它已成為“欺騙高手”。
此外,,還有其他AI系統(tǒng)展示出在撲克游戲中虛張聲勢,、在“星際爭霸2”中采用假攻擊策略以迷惑對手,以及在談判場景中扭曲自身偏好以占據(jù)優(yōu)勢等行為,。
研究團(tuán)隊(duì)警告,,盡管目前AI在游戲中的欺騙看似無傷大雅,但這可能是通往更復(fù)雜人工智能欺騙行為的先兆,,未來可能催生更高級別的欺騙技術(shù)。因此,,帕克強(qiáng)調(diào):“應(yīng)對未來可能出現(xiàn)的更高級人工智能欺騙,,我們需提前準(zhǔn)備,提議將具備欺騙性的AI系統(tǒng)視為高風(fēng)險(xiǎn)類別,?!?/p>
近期,人工智能領(lǐng)域內(nèi)的一起學(xué)術(shù)誠信事件引起了全球科技行業(yè)的密切關(guān)注,。
2024-06-04 15:54:36斯坦福AI團(tuán)隊(duì)抄襲國產(chǎn)大模型,?連識(shí)別“清華簡”都抄了!清華系團(tuán)隊(duì)回應(yīng)