從“一眼假”到“真假難辨”再到“深度偽造”,生成一條音頻只需20秒。濫用公眾人物聲音惡搞,,AI技術應用“玩過界”被質疑,。
近日,一些短視頻平臺出現了大量某知名企業(yè)家吐槽的視頻,。在這些視頻中,,該企業(yè)家對堵車、調休,、游戲等熱門話題進行了調侃和銳評,,甚至夾雜不雅詞匯,,引發(fā)網友熱議。事實上,,這些吐槽視頻并非該企業(yè)家本人發(fā)聲,,而是由網友利用AI軟件采集其原音生成的配音,逼真的效果讓不少人信以為真,。
AI的發(fā)展為生活帶來便利的同時,,也引發(fā)了質疑。以AI語音合成技術為例,,只需要打開軟件,、動動手指,一條以假亂真的配音視頻就能新鮮出爐,。然而,,有的視頻越過了開玩笑的邊界,“偷走”他人聲音進行惡搞,、造謠,,帶來了惡劣的社會影響。
記者在社交軟件上檢索發(fā)現,,不少用戶發(fā)布了AI配音的相關視頻生成教程,。其中大部分配音都源于某擬真語音大模型應用。在該應用網站上,,創(chuàng)作者上傳任意人物的一段音頻作為訓練素材,,隨后AI通過學習可克隆出一個聲音角色。其他用戶只需輸入文本,,便可以使用該聲音生成內容,。記者按照指引添加了上述知名企業(yè)家的聲音角色,輸入一段100字的文本后點擊“開始生成”,,約20秒就生成了一條與該企業(yè)家聲音相似度極高的AI音頻,。截至目前,該聲音角色已被使用79.9萬次,,生成字符數達4455.5萬個,。
被“偷走”聲音的公眾人物還有不少。今年9月底,,一段據稱是某直播平臺老板盧某某的酒后錄音在網絡上流傳,,整體呈現出盧某某對于消費者的傲慢態(tài)度,以及對相關人士的不尊重表達,,為該平臺招致不小的爭議,。后經警方調查,音頻內容不實,系大模型偽造而成,。一位業(yè)內人士表示,,通過模仿音頻樣本的語調、語速,、情感,、口音、發(fā)聲方式等特征,,AI技術已經能夠高度還原音頻樣本的聲音,,達到人耳和其他鑒定方式難以區(qū)分的程度。
李純發(fā)文回應自己日前發(fā)的博文,,表示自己當時因為表述不清,引起了不必要的誤解,,所以刪掉了微博,。
2024-09-14 14:51:41李純