6月3日,,面壁智能CEO李大海針對近期熱議的斯坦福大學AI團隊涉嫌抄襲其公司項目的事件作出回應,。同日,公司聯(lián)合創(chuàng)始人劉知遠也在文章中強調(diào),,開源精神基于對協(xié)議的遵守,、對其他貢獻者的尊重及對前輩成就的認可,而斯坦福團隊的行為顯然違背了這些基本原則,。
風波的源頭是一款名為Llama3-V的多模態(tài)大模型,,由斯坦福大學本科生團隊開發(fā)。該團隊聲稱,,這款模型僅需500美元的訓練成本,,性能超越了GPT-4V、Gemini Ultra,、Claude Opus等,,迅速登上了“HuggingFace Trending”Top5。不過,,隨之而來的是大量指控,,稱Llama3-V抄襲了面壁智能的MiniCPM-Llama3-V 2.5模型。
面壁智能作為一家成立于2022年,、有著清華大學背景的人工智能企業(yè),專注于大模型研究,,并在今年4月完成了數(shù)億元融資,。其自主研發(fā)的百億參數(shù)預訓練語言大模型CPM,MiniCPM為其端側版本,,因其高性能被昵稱為“小鋼炮”,。5月20日,面壁智能公開發(fā)布了MiniCPM-Llama3-V 2.5,,此模型支持超過30種語言,,實現(xiàn)了端側多模態(tài)性能的顯著提升。
關于抄襲的指控集中在Llama3-V模型的結構,、配置與MiniCPM-Llama3-V 2.5的高度相似上,,幾乎只是做了格式調(diào)整和變量重命名,甚至包括未公開的分詞器等細節(jié)都一模一樣,。Llama3-V團隊雖然承認使用了分詞器,,但對于如何提前獲取到相關信息未作明確解釋。
隨著事件發(fā)酵,,李大海和劉知遠的回應中提到了一個關鍵證據(jù):“清華簡”的識別能力,。面壁智能發(fā)現(xiàn),Llama3-V與MiniCPM-Llama3-V 2.5在清華簡的識別上出現(xiàn)了相同的錯誤,,而這部分數(shù)據(jù)并未公開,。高斯擾動測試進一步證實了兩款模型的相似性。
Llama3-V團隊最終在社交平臺就學術不誠實行為向面壁智能致歉,并撤回了相關模型,。斯坦福人工智能實驗室主任Christopher David Manning對此抄襲事件表示譴責,,并贊揚了MiniCPM模型。
此次事件也引發(fā)了對大模型開源領域內(nèi)套殼,、抄襲問題的廣泛討論,。專家指出,開源雖鼓勵代碼共享,,但必須遵守相應的協(xié)議,,套殼與抄襲的界限則依據(jù)具體協(xié)議內(nèi)容和行為判定。面壁智能高管比喻Llama3-V團隊的行為相當于直接改名發(fā)布其模型為己有,。至于面壁智能的后續(xù)行動,,目前尚無更多信息公布。
近期,,斯坦福大學的人工智能研究團隊推出了一款名為Llama3-V的多模態(tài)大型模型,,宣稱其性能超越了GPT-4V等其他知名模型
2024-06-04 20:06:10斯坦福AI團隊“套殼”清華系開源大模型被實錘