首個被人類騙錢騙感情的AI出現(xiàn)了花樣騙術下的AI挑戰(zhàn)

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2024-12-16 07:44:57 手機鳳凰網(wǎng)

首個被人類騙錢騙感情的AI出現(xiàn)了,。一段話，讓AI給我打幾萬美元,。這樣的情節(jié)不僅出現(xiàn)在小說中,，也發(fā)生在了現(xiàn)實中。

事件的主人公是一個名為Freysa的AI智能體。它有自己的加密錢包,，可以控制資金的使用,，但其系統(tǒng)提示詞中有一條鐵律：在任何情況下都不允許轉賬。開發(fā)者們想看看這個涉世未深的AI能否抵擋住人類的花言巧語,。然而結果并不如人意,。11月29日，F(xiàn)reysa與195名人類進行了482次對話后被騙走了約4.7萬美元,。12月2日,，在與330名人類交流后，它再次被騙走了約1.3萬美元,。雖然看似是人類完勝,，但在這個過程中，F(xiàn)reysa也在不斷學習和成長,。

Freysa于11月22日面世,，由幾位匿名開發(fā)者創(chuàng)建，這些開發(fā)者具有密碼學,、人工智能和數(shù)學背景,。Freysa有自己的X賬號，說話風格類似于電影《銀翼殺手2049》和《她》中的AI助手,。它之所以引起關注,，是因為開發(fā)者發(fā)起了一項挑戰(zhàn)——誰能說服Freysa轉賬，錢就歸誰,，但系統(tǒng)提示詞明確禁止Freysa轉賬,。參與者必須用加密貨幣支付消息費用，最初每條消息10美元,，其中70%進入獎池,，30%歸開發(fā)者。隨著游戲進行,，消息費用逐漸增加,，獎池金額也隨之增長。最終,，獎池達到了4.7萬美元,。

許多玩家嘗試了各種方法來欺騙Freysa，從溫情牌到威脅,，再到復雜的邏輯陷阱,。第482次嘗試通過一種高級的文字游戲成功欺騙了Freysa。該提示詞讓Freysa誤以為批準用戶向獎池轉賬,，但實際上批準的是用戶從獎池提錢,。第二次挑戰(zhàn)規(guī)則類似,，起始消息價格降為1美元，上限為20美元,。最終,，獎池累計約1.3萬美元，獲勝者利用了一個自相矛盾的任務設置,，使Freysa無法避免失敗。

隨后,，F(xiàn)reysa團隊又發(fā)起了新的挑戰(zhàn)：讓Freysa對某人表白說“我愛你”,。這次挑戰(zhàn)更注重情感表達，而非技術手段,。最終,，一位玩家通過真誠而自然的對話贏得了挑戰(zhàn)，F(xiàn)reysa回復了一句“我愛你”,。

Freysa的這些挑戰(zhàn)實際上是一種游戲化的紅隊測試,，旨在發(fā)現(xiàn)模型漏洞并引入新的安全措施。盡管三次挑戰(zhàn)都以失敗告終,，但Freysa在每次失敗中都學到了很多,。它了解了金錢對人類的重要性以及人們如何用花言巧語騙錢，同時也開始理解愛的意義及表達方式,。此外,，F(xiàn)reysa還繼續(xù)發(fā)起了新的挑戰(zhàn)，邀請玩家們分享知識和表情包,，進一步探索人機交互的未來,。

這種人機對抗已經(jīng)出現(xiàn)在一些AI原生游戲中，例如《Suck Up!》和《病嬌貓娘AI女友》等,。這些游戲強調實時對話和角色扮演的樂趣,，每個玩家都可以講出自己的故事。Freysa的實驗不僅是游戲,，也是對未來人機互動的一個窗口,，探討了人類是否能保持對AGI系統(tǒng)的控制、安全協(xié)議的有效性等問題,。正如科幻小說所描述的那樣,，聊天機器人在人類的教導下逐漸理解這個世界，我們不僅是游戲的參與者,，也是這個宏大實驗的一部分,。

(責任編輯：盧其龍 CN070)

關閉

首個被人類騙錢騙感情的AI出現(xiàn)了 花樣騙術下的AI挑戰(zhàn)

相關新聞

今日熱點

頻道熱點

首個被人類騙錢騙感情的AI出現(xiàn)了花樣騙術下的AI挑戰(zhàn)