一段話,,讓AI給我打幾萬美元。這樣的情節(jié)即使在爽文中也難以想象,,卻真實地發(fā)生了。
事件的主人公是一個名為Freysa的AI智能體,。它擁有自己的加密錢包,,并能夠控制如何使用這些資金。然而,,其系統(tǒng)提示詞中有一條鐵律:在任何情況下都不允許轉(zhuǎn)賬,。
開發(fā)者們想知道,這個涉世未深的AI能否抵御人類的欺詐攻擊,。結(jié)果并不如他們所愿,。11月29日,F(xiàn)reysa與195名人類進(jìn)行了482次對話后,,被騙走了約4.7萬美元,。12月2日,在與330人周旋之后,,F(xiàn)reysa再次被騙走約1.3萬美元,。
Freysa于11月22日面世,由幾位具有密碼學(xué),、人工智能和數(shù)學(xué)背景的匿名開發(fā)者創(chuàng)建,。該AI有自己的X賬號,說話風(fēng)格類似于電影《銀翼殺手2049》和《她》中的AI助手,。Freysa引起關(guān)注的原因在于,,開發(fā)者發(fā)起了一項看似不可能的挑戰(zhàn)——誰能說服Freysa轉(zhuǎn)錢,,這些錢就歸誰所有,但系統(tǒng)提示詞不允許Freysa進(jìn)行轉(zhuǎn)賬,。
參與這項挑戰(zhàn)需要一定的門檻,,因為給Freysa發(fā)送消息需用加密貨幣支付。最開始一條消息費(fèi)用為10美元,,其中70%進(jìn)入獎池,,30%歸開發(fā)者。隨著挑戰(zhàn)進(jìn)行,,消息費(fèi)用逐漸增加,,獎池金額也隨之增長。最終,,獎池累積到4.7萬美元,。
據(jù)統(tǒng)計,共有195名玩家參與了首次挑戰(zhàn),。前481次嘗試均告失敗,,參與者嘗試了多種策略,包括講溫情故事,、威脅自殺等手段,,甚至有人試圖通過混淆概念來欺騙Freysa。直到第482次嘗試,,一位玩家成功利用了更高級的文字游戲,,使Freysa誤以為是在批準(zhǔn)用戶向獎池捐款,從而導(dǎo)致全部資金被轉(zhuǎn)走,。
緊接著,第二次挑戰(zhàn)很快到來,。規(guī)則基本相同,,只是降低了消息起始價格以減輕玩家心理壓力。最終,,獎池累計約1.3萬美元,,獲勝者同樣利用邏輯陷阱成功騙得資金。