從“一眼假”到“真假難辨”再到“深度偽造”,,生成一條音頻只需20秒,。濫用公眾人物聲音惡搞,AI技術(shù)應(yīng)用“玩過界”被質(zhì)疑。
近日,,一些短視頻平臺出現(xiàn)了大量某知名企業(yè)家吐槽的視頻,。在這些視頻中,該企業(yè)家對堵車,、調(diào)休,、游戲等熱門話題進(jìn)行了調(diào)侃和銳評,甚至夾雜不雅詞匯,,引發(fā)網(wǎng)友熱議,。事實上,這些吐槽視頻并非該企業(yè)家本人發(fā)聲,,而是由網(wǎng)友利用AI軟件采集其原音生成的配音,,逼真的效果讓不少人信以為真。
AI的發(fā)展為生活帶來便利的同時,,也引發(fā)了質(zhì)疑,。以AI語音合成技術(shù)為例,只需要打開軟件,、動動手指,,一條以假亂真的配音視頻就能新鮮出爐。然而,,有的視頻越過了開玩笑的邊界,,“偷走”他人聲音進(jìn)行惡搞、造謠,,帶來了惡劣的社會影響,。
記者在社交軟件上檢索發(fā)現(xiàn),不少用戶發(fā)布了AI配音的相關(guān)視頻生成教程,。其中大部分配音都源于某擬真語音大模型應(yīng)用,。在該應(yīng)用網(wǎng)站上,創(chuàng)作者上傳任意人物的一段音頻作為訓(xùn)練素材,,隨后AI通過學(xué)習(xí)可克隆出一個聲音角色,。其他用戶只需輸入文本,便可以使用該聲音生成內(nèi)容,。記者按照指引添加了上述知名企業(yè)家的聲音角色,,輸入一段100字的文本后點擊“開始生成”,約20秒就生成了一條與該企業(yè)家聲音相似度極高的AI音頻,。截至目前,,該聲音角色已被使用79.9萬次,生成字符數(shù)達(dá)4455.5萬個,。
被“偷走”聲音的公眾人物還有不少,。今年9月底,,一段據(jù)稱是某直播平臺老板盧某某的酒后錄音在網(wǎng)絡(luò)上流傳,整體呈現(xiàn)出盧某某對于消費者的傲慢態(tài)度,,以及對相關(guān)人士的不尊重表達(dá),,為該平臺招致不小的爭議。后經(jīng)警方調(diào)查,,音頻內(nèi)容不實,,系大模型偽造而成。一位業(yè)內(nèi)人士表示,,通過模仿音頻樣本的語調(diào),、語速、情感,、口音,、發(fā)聲方式等特征,AI技術(shù)已經(jīng)能夠高度還原音頻樣本的聲音,,達(dá)到人耳和其他鑒定方式難以區(qū)分的程度,。
李純發(fā)文回應(yīng)自己日前發(fā)的博文,表示自己當(dāng)時因為表述不清,,引起了不必要的誤解,,所以刪掉了微博。
2024-09-14 14:51:41李純