4訓(xùn)練作弊爆出驚天丑聞,,AI大佬憤而辭職,,代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議!Meta剛發(fā)布了Llama 4,,緊接著就有高層請辭,。有消息稱,,經(jīng)過多次訓(xùn)練后,Llama 4未能達(dá)到頂尖水平,,與頂級大模型相比存在明顯差距,。為了短期內(nèi)提升指標(biāo),高層甚至建議在后訓(xùn)練階段將多個基準(zhǔn)測試集混入訓(xùn)練數(shù)據(jù)中,。一位內(nèi)部員工dliudliu表示無法接受這種做法,,并在辭職信中明確要求不在Llama 4的技術(shù)報告中掛名。
同時,扎克伯格給全員下達(dá)了死命令,,要求4月底前完成Llama 4的交付,。在這種高壓下,已有高管提出辭職,。網(wǎng)友Flavio Adamo使用相同的提示詞讓Llama 4 Maveric和GPT-4制作旋轉(zhuǎn)多邊形動畫。結(jié)果顯示,,Llama 4生成的多邊形不規(guī)則且沒有開口,,小球也不符合物理規(guī)律。相比之下,,GPT-4的動畫雖然不完美,,但表現(xiàn)更好。
還有人指出,Llama 4在LMarena上存在過擬合現(xiàn)象,,涉嫌作弊,。沃頓商學(xué)院教授Ethan Mollick認(rèn)為,經(jīng)常使用AI模型的人可以分辨出哪些是針對基準(zhǔn)測試優(yōu)化的,,哪些是真正的進步,。不過,另一位內(nèi)部員工表示并沒有遇到這種情況,,建議讓事情發(fā)展一段時間再看,。
幾位AI研究人員在社交媒體上批評Meta在其公告中提到的LM Arena上的Maverick是一個“實驗性的聊天版本”,。在Llama官網(wǎng)的性能對比圖中,最下面一行寫著“針對對話優(yōu)化的Llama 4 Maverick”,,這讓人感到有些投機取巧,。這種區(qū)別對待使開發(fā)人員難以準(zhǔn)確預(yù)測模型在特定上下文中的表現(xiàn),。AI研究人員發(fā)現(xiàn)可公開下載的Maverick與LM Arena上托管的模型在行為上有顯著差異。
據(jù)報道,Llama 4內(nèi)部訓(xùn)練多次仍未能達(dá)到開源SOTA基準(zhǔn),。領(lǐng)導(dǎo)層決定在后訓(xùn)練過程中混合各種基準(zhǔn)測試集,,以期望在測試中取得好成績。爆料者可能來自Meta公司內(nèi)部,。此外,,Meta AI研究部副總裁Joelle Pineau申請5月底辭職,但她所在的FAIR組織實際上與負(fù)責(zé)Llama項目的GenAI獨立,。GenAI的副總裁Ahmad Al-Dahle并未辭職,。
Llama 4發(fā)布一天后就出現(xiàn)這些負(fù)面消息,,未來顯得撲朔迷離。昨天網(wǎng)友實測時評論褒貶不一,,但更多測試后,,許多網(wǎng)友對Llama 4表示失望。Dr_Karminski發(fā)帖稱,,Llama-4-Maverick(總參數(shù)402B)在編碼能力方面大致只能與Qwen-QwQ-32B相當(dāng),,而Llama-4-Scout(總參數(shù)109B)大概與Grok-2或Ernie 4.5類似。其他用戶也表達(dá)了類似觀點,,認(rèn)為Llama 4的表現(xiàn)不符合預(yù)期,。Deedy稱Llama 4為“糟糕的編程模型”,并指出Scout (109B) 和Maverick (402B)在Kscores基準(zhǔn)測試中表現(xiàn)不如4o,、Gemini Flash,、Grok 3、DeepSeek V3和Sonnet 3.5/7,。網(wǎng)友anton認(rèn)為Llama 4令人失望,,不適用于輔助編碼,建議Meta推出性能優(yōu)秀的小模型而不是追求成為SOTA,。
近日,,中國富商鐘仁海在新加坡設(shè)立的家族辦公室“熊貓企業(yè)”(Panda Enterprise)遭遇員工侵吞4億資產(chǎn)事件引起廣泛關(guān)注
2025-03-23 17:16:57浙江富豪被員工坑走4億資產(chǎn)盡管大家都知道,互聯(lián)網(wǎng)時代的信息傳播速度非???,但有時候,這種速度還是快得超出了一般人的想象,。比如這一次的易建聯(lián)疑似嫖娼事件
2024-10-18 16:45:15猝不及防的24小時,!易建聯(lián)被爆出丑聞12月14日,,韓國國會通過彈劾尹錫悅動議,。12月23日前,,尹錫悅需提交有關(guān)彈劾案的答辯。12月27日,,韓國憲法法院將舉行彈劾案首場聽證會,。
2024-12-18 00:35:09尹錫悅