4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-04-08 16:56:25 新浪

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議！Meta剛發(fā)布了Llama 4,，緊接著就有高層請辭,。有消息稱,，經(jīng)過多次訓(xùn)練后，Llama 4未能達(dá)到頂尖水平,，與頂級大模型相比存在明顯差距,。為了短期內(nèi)提升指標(biāo)，高層甚至建議在后訓(xùn)練階段將多個基準(zhǔn)測試集混入訓(xùn)練數(shù)據(jù)中,。一位內(nèi)部員工dliudliu表示無法接受這種做法,，并在辭職信中明確要求不在Llama 4的技術(shù)報告中掛名。

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋

同時，扎克伯格給全員下達(dá)了死命令,，要求4月底前完成Llama 4的交付,。在這種高壓下，已有高管提出辭職,。網(wǎng)友Flavio Adamo使用相同的提示詞讓Llama 4 Maveric和GPT-4制作旋轉(zhuǎn)多邊形動畫。結(jié)果顯示,，Llama 4生成的多邊形不規(guī)則且沒有開口,，小球也不符合物理規(guī)律。相比之下,，GPT-4的動畫雖然不完美,，但表現(xiàn)更好。

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

還有人指出，Llama 4在LMarena上存在過擬合現(xiàn)象,，涉嫌作弊,。沃頓商學(xué)院教授Ethan Mollick認(rèn)為，經(jīng)常使用AI模型的人可以分辨出哪些是針對基準(zhǔn)測試優(yōu)化的,，哪些是真正的進步,。不過，另一位內(nèi)部員工表示并沒有遇到這種情況,，建議讓事情發(fā)展一段時間再看,。

4訓(xùn)練作弊爆出驚天丑聞，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

幾位AI研究人員在社交媒體上批評Meta在其公告中提到的LM Arena上的Maverick是一個“實驗性的聊天版本”,。在Llama官網(wǎng)的性能對比圖中，最下面一行寫著“針對對話優(yōu)化的Llama 4 Maverick”,，這讓人感到有些投機取巧,。這種區(qū)別對待使開發(fā)人員難以準(zhǔn)確預(yù)測模型在特定上下文中的表現(xiàn),。AI研究人員發(fā)現(xiàn)可公開下載的Maverick與LM Arena上托管的模型在行為上有顯著差異。

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

據(jù)報道，Llama 4內(nèi)部訓(xùn)練多次仍未能達(dá)到開源SOTA基準(zhǔn),。領(lǐng)導(dǎo)層決定在后訓(xùn)練過程中混合各種基準(zhǔn)測試集,，以期望在測試中取得好成績。爆料者可能來自Meta公司內(nèi)部,。此外,，Meta AI研究部副總裁Joelle Pineau申請5月底辭職，但她所在的FAIR組織實際上與負(fù)責(zé)Llama項目的GenAI獨立,。GenAI的副總裁Ahmad Al-Dahle并未辭職,。

4訓(xùn)練作弊爆出驚天丑聞，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

Llama 4發(fā)布一天后就出現(xiàn)這些負(fù)面消息,，未來顯得撲朔迷離。昨天網(wǎng)友實測時評論褒貶不一,，但更多測試后,，許多網(wǎng)友對Llama 4表示失望。Dr_Karminski發(fā)帖稱,，Llama-4-Maverick（總參數(shù)402B）在編碼能力方面大致只能與Qwen-QwQ-32B相當(dāng),，而Llama-4-Scout（總參數(shù)109B）大概與Grok-2或Ernie 4.5類似。其他用戶也表達(dá)了類似觀點,，認(rèn)為Llama 4的表現(xiàn)不符合預(yù)期,。Deedy稱Llama 4為“糟糕的編程模型”，并指出Scout (109B) 和Maverick (402B)在Kscores基準(zhǔn)測試中表現(xiàn)不如4o,、Gemini Flash,、Grok 3、DeepSeek V3和Sonnet 3.5/7,。網(wǎng)友anton認(rèn)為Llama 4令人失望,，不適用于輔助編碼，建議Meta推出性能優(yōu)秀的小模型而不是追求成為SOTA,。

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

(責(zé)任編輯：盧其龍 CN070)

關(guān)閉

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

相關(guān)新聞

今日熱點

頻道熱點