抄襲面壁智能被錘斯坦福AI團隊“刪庫跑路”

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-06-05 13:34:26

6月3日,，面壁智能CEO李大海針對近期熱議的斯坦福大學AI團隊涉嫌抄襲其公司項目的事件作出回應。同日,，公司聯(lián)合創(chuàng)始人劉知遠也在文章中強調(diào)，開源精神基于對協(xié)議的遵守,、對其他貢獻者的尊重及對前輩成就的認可,，而斯坦福團隊的行為顯然違背了這些基本原則,。

風波的源頭是一款名為Llama3-V的多模態(tài)大模型，由斯坦福大學本科生團隊開發(fā)。該團隊聲稱,，這款模型僅需500美元的訓練成本，性能超越了GPT-4V,、Gemini Ultra,、Claude Opus等,，迅速登上了“HuggingFace Trending”Top5。不過,，隨之而來的是大量指控，稱Llama3-V抄襲了面壁智能的MiniCPM-Llama3-V 2.5模型,。

面壁智能作為一家成立于2022年,、有著清華大學背景的人工智能企業(yè)，專注于大模型研究,，并在今年4月完成了數(shù)億元融資,。其自主研發(fā)的百億參數(shù)預訓練語言大模型CPM，MiniCPM為其端側(cè)版本,，因其高性能被昵稱為“小鋼炮”,。5月20日，面壁智能公開發(fā)布了MiniCPM-Llama3-V 2.5,，此模型支持超過30種語言,，實現(xiàn)了端側(cè)多模態(tài)性能的顯著提升。

關(guān)于抄襲的指控集中在Llama3-V模型的結(jié)構(gòu),、配置與MiniCPM-Llama3-V 2.5的高度相似上,，幾乎只是做了格式調(diào)整和變量重命名，甚至包括未公開的分詞器等細節(jié)都一模一樣,。Llama3-V團隊雖然承認使用了分詞器,，但對于如何提前獲取到相關(guān)信息未作明確解釋。

隨著事件發(fā)酵,，李大海和劉知遠的回應中提到了一個關(guān)鍵證據(jù)：“清華簡”的識別能力,。面壁智能發(fā)現(xiàn)，Llama3-V與MiniCPM-Llama3-V 2.5在清華簡的識別上出現(xiàn)了相同的錯誤,，而這部分數(shù)據(jù)并未公開,。高斯擾動測試進一步證實了兩款模型的相似性。

Llama3-V團隊最終在社交平臺就學術(shù)不誠實行為向面壁智能致歉,，并撤回了相關(guān)模型,。斯坦福人工智能實驗室主任Christopher David Manning對此抄襲事件表示譴責,，并贊揚了MiniCPM模型。

此次事件也引發(fā)了對大模型開源領域內(nèi)套殼,、抄襲問題的廣泛討論,。專家指出,，開源雖鼓勵代碼共享，但必須遵守相應的協(xié)議,，套殼與抄襲的界限則依據(jù)具體協(xié)議內(nèi)容和行為判定。面壁智能高管比喻Llama3-V團隊的行為相當于直接改名發(fā)布其模型為己有。至于面壁智能的后續(xù)行動,，目前尚無更多信息公布。

(責任編輯：喬嬌 TT0002)

關(guān)閉

抄襲面壁智能被錘 斯坦福AI團隊“刪庫跑路”

相關(guān)新聞

今日熱點

頻道熱點

抄襲面壁智能被錘斯坦福AI團隊“刪庫跑路”