4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-04-08 16:56:25 新浪

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議！Meta剛發(fā)布了Llama 4,，緊接著就有高層請辭,。有消息稱，經(jīng)過多次訓(xùn)練后,，Llama 4未能達(dá)到頂尖水平,，與頂級大模型相比存在明顯差距。為了短期內(nèi)提升指標(biāo),，高層甚至建議在后訓(xùn)練階段將多個基準(zhǔn)測試集混入訓(xùn)練數(shù)據(jù)中,。一位內(nèi)部員工dliudliu表示無法接受這種做法，并在辭職信中明確要求不在Llama 4的技術(shù)報告中掛名,。

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職，代碼實測崩盤全網(wǎng)炸鍋

同時,，扎克伯格給全員下達(dá)了死命令,，要求4月底前完成Llama 4的交付,。在這種高壓下，已有高管提出辭職,。網(wǎng)友Flavio Adamo使用相同的提示詞讓Llama 4 Maveric和GPT-4制作旋轉(zhuǎn)多邊形動畫,。結(jié)果顯示，Llama 4生成的多邊形不規(guī)則且沒有開口,，小球也不符合物理規(guī)律,。相比之下，GPT-4的動畫雖然不完美,，但表現(xiàn)更好,。

4訓(xùn)練作弊爆出驚天丑聞，AI大佬憤而辭職,，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

還有人指出,，Llama 4在LMarena上存在過擬合現(xiàn)象，涉嫌作弊,。沃頓商學(xué)院教授Ethan Mollick認(rèn)為,，經(jīng)常使用AI模型的人可以分辨出哪些是針對基準(zhǔn)測試優(yōu)化的，哪些是真正的進(jìn)步,。不過,，另一位內(nèi)部員工表示并沒有遇到這種情況，建議讓事情發(fā)展一段時間再看,。

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

幾位AI研究人員在社交媒體上批評Meta在其公告中提到的LM Arena上的Maverick是一個“實驗性的聊天版本”,。在Llama官網(wǎng)的性能對比圖中,，最下面一行寫著“針對對話優(yōu)化的Llama 4 Maverick”，這讓人感到有些投機取巧,。這種區(qū)別對待使開發(fā)人員難以準(zhǔn)確預(yù)測模型在特定上下文中的表現(xiàn),。AI研究人員發(fā)現(xiàn)可公開下載的Maverick與LM Arena上托管的模型在行為上有顯著差異。

12 3 全文共 3 頁下一頁

關(guān)閉

4訓(xùn)練作弊爆出驚天丑聞,，AI大佬憤而辭職，代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議

相關(guān)新聞

今日熱點

頻道熱點