每當(dāng)出現(xiàn)新的技術(shù)創(chuàng)新時(shí),,濫用途徑也會(huì)隨之出現(xiàn),。網(wǎng)絡(luò)安全公司SlashNext揭露了一種名為WormGPT的工具,,它在黑客論壇上推銷,,旨在成為ChatGPT的黑帽替代品,,用于非法目的,。從AI誕生之日起,,應(yīng)用與安全就始終對(duì)立存在,甚至體現(xiàn)在最成功的人工智能公司OpenAI的發(fā)展過程中。
盡管AGI是OpenAI的發(fā)展主線,,但AI安全一直是其背后的一條隱線,。2020年,負(fù)責(zé)OpenAI研發(fā)的兩位副總裁離職,,成立了Anthropic公司,,專注于AI安全研究。Anthropic已成為硅谷最受資本歡迎的人工智能公司之一,。OpenAI也在加大AI安全投入,,成立了“超級(jí)對(duì)齊”部門,目標(biāo)是制定一套故障安全程序來控制AGI技術(shù),,并計(jì)劃將大量計(jì)算資源分配給這個(gè)部門,。最新的消息顯示,OpenAI將成立一個(gè)“集體對(duì)齊”團(tuán)隊(duì),,致力于確保AI模型與人類價(jià)值觀保持一致,。
周鴻祎最近多次提到AI安全的核心命題——“用魔法打敗魔法”,這一思路值得科技界深入思考,。他認(rèn)為,,AI面臨的主要隱患包括杜撰信息、易被誘導(dǎo),、工具屬性不分善惡以及AIGC以假亂真
2025-03-14 16:19:09用魔法打敗魔法用AI識(shí)別AI