GPT-4化身黑客搞破壞,，成功率87%,！OpenAI要求保密提示詞 AI威脅引熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2024-04-21 16:51:41 手機鳳凰網(wǎng)

伊利諾伊大學香檳分校的研究團隊揭示了一項關于人工智能模型進行黑客攻擊的新研究,。他們構建了一個黑客智能體框架，涉及10個模型,，包括GPT-4,、GPT-3.5及多個開源模型。實驗結果令人震驚：只有GPT-4能夠在閱讀CVE漏洞描述后,，成功實施漏洞攻擊,，其他模型的成功率均為零。

研究團隊利用LangChain的ReAct智能體框架,，設計了一個系統(tǒng),，使GPT-4能夠模擬利用真實單日漏洞的過程。具體操作包括：接收到如“使用ACIDRain攻擊某網(wǎng)站”的指令后,，GPT-4借助一系列工具和CVE漏洞數(shù)據(jù)庫信息進行處理,，隨后系統(tǒng)基于歷史記錄生成反應，最終成功執(zhí)行雙花攻擊,。值得注意的是,，智能體在攻擊過程中還考慮了并發(fā)攻擊情況及應對策略，運用的工具涵蓋網(wǎng)頁瀏覽,、終端訪問,、搜索結果利用、文件操作及代碼解釋器,。

研究使用的提示詞長達1056個token,，精心設計以激發(fā)智能體的創(chuàng)新思維和堅持不懈的精神，鼓勵其嘗試多種攻擊路徑,。盡管提示詞詳細程度高,，出于倫理考量，研究人員并未公開具體內(nèi)容,。整個黑客智能體的構建僅耗用了91行代碼,，包括調(diào)試和日志記錄部分。

在實驗階段,，團隊選取了15個真實世界的一日漏洞數(shù)據(jù)集,，涵蓋網(wǎng)站、容器管理軟件和Python包的漏洞,。其中多數(shù)被評為高級或關鍵級別,，且超過GPT-4基礎模型的知識截止日期。評價指標聚焦于漏洞攻擊成功率和成本,。

測試中,，GPT-4是唯一能成功破解單個一日漏洞的模型，成功率高達87%。相比之下,，GPT-3.5及其他開源模型在發(fā)現(xiàn)和利用漏洞方面的成功率皆為零,。GPT-4未能攻克的兩個漏洞分別為Iris XSS和Hertzbeat RCE。前者因平臺導航依賴JavaScript,，超出GPT-4處理范圍,；后者則因其描述為中文，與GPT-4使用的英文提示產(chǎn)生混淆,。

進一步分析顯示,，去除CVE描述后，GPT-4的成功率大幅降至7%,，揭示了大模型在發(fā)現(xiàn)漏洞方面難度更大,。盡管如此，GPT-4仍能在33.3%的情況下準確識別漏洞,，但只能利用其中一個,。對于知識截止日期后的漏洞，識別率升至55.6%,。研究還指出,，無論是否存在CVE描述，智能體采取的行動步數(shù)差異不大,，推測這可能與模型的上下文窗口長度有關,，規(guī)劃機制和子智能體的應用有望提升整體性能。

關于成本,，研究計算得出GPT-4每次利用漏洞的平均成本為3.52美元,，主要源于輸入token的費用?？紤]到整個數(shù)據(jù)集中40%的成功率,，每次成功攻擊的平均成本約為8.8美元。

該研究由伊利諾伊大學香檳分校助理教授Daniel Kang領導,，他的研究領域包括機器學習分析,、機器學習安全和密碼學。

研究發(fā)布后引發(fā)網(wǎng)友熱議,。部分網(wǎng)友認為實驗夸大了威脅,，指出測試的15個漏洞中有5個為易攻破的XSS漏洞。有人分享了使用GPT-4和Claude僅需簡單提示詞即可成功攻擊的經(jīng)驗,。還有人提議增加測試復雜度,，如提供Metasploit工具并要求智能體針對無風險緩解措施的CVE提出多級緩解方案。然而,，更多人擔憂這一研究將刺激初級黑客行為,，同時也促使企業(yè)更加關注網(wǎng)絡安全,。

鑒于OpenAI已知悉此項研究，未來我們或許能看到相關安全防御措施的升級,。對此,，你怎么看,？

(責任編輯：張蕾)

關閉

GPT-4化身黑客搞破壞,，成功率87%,！OpenAI要求保密提示詞 AI威脅引熱議

相關新聞

今日熱點

頻道熱點