4訓(xùn)練作弊爆出驚天丑聞,,AI大佬憤而辭職,,代碼實測崩盤全網(wǎng)炸鍋 Llama 4翻車引發(fā)熱議!Meta剛發(fā)布了Llama 4,,緊接著就有高層請辭,。有消息稱,經(jīng)過多次訓(xùn)練后,,Llama 4未能達(dá)到頂尖水平,,與頂級大模型相比存在明顯差距。為了短期內(nèi)提升指標(biāo),,高層甚至建議在后訓(xùn)練階段將多個基準(zhǔn)測試集混入訓(xùn)練數(shù)據(jù)中,。一位內(nèi)部員工dliudliu表示無法接受這種做法,并在辭職信中明確要求不在Llama 4的技術(shù)報告中掛名,。
同時,,扎克伯格給全員下達(dá)了死命令,,要求4月底前完成Llama 4的交付,。在這種高壓下,已有高管提出辭職,。網(wǎng)友Flavio Adamo使用相同的提示詞讓Llama 4 Maveric和GPT-4制作旋轉(zhuǎn)多邊形動畫,。結(jié)果顯示,Llama 4生成的多邊形不規(guī)則且沒有開口,,小球也不符合物理規(guī)律,。相比之下,GPT-4的動畫雖然不完美,,但表現(xiàn)更好,。
還有人指出,,Llama 4在LMarena上存在過擬合現(xiàn)象,涉嫌作弊,。沃頓商學(xué)院教授Ethan Mollick認(rèn)為,,經(jīng)常使用AI模型的人可以分辨出哪些是針對基準(zhǔn)測試優(yōu)化的,哪些是真正的進(jìn)步,。不過,,另一位內(nèi)部員工表示并沒有遇到這種情況,建議讓事情發(fā)展一段時間再看,。
幾位AI研究人員在社交媒體上批評Meta在其公告中提到的LM Arena上的Maverick是一個“實驗性的聊天版本”,。在Llama官網(wǎng)的性能對比圖中,,最下面一行寫著“針對對話優(yōu)化的Llama 4 Maverick”,這讓人感到有些投機取巧,。這種區(qū)別對待使開發(fā)人員難以準(zhǔn)確預(yù)測模型在特定上下文中的表現(xiàn),。AI研究人員發(fā)現(xiàn)可公開下載的Maverick與LM Arena上托管的模型在行為上有顯著差異。
近日,,中國富商鐘仁海在新加坡設(shè)立的家族辦公室“熊貓企業(yè)”(Panda Enterprise)遭遇員工侵吞4億資產(chǎn)事件引起廣泛關(guān)注
2025-03-23 17:16:57浙江富豪被員工坑走4億資產(chǎn)盡管大家都知道,,互聯(lián)網(wǎng)時代的信息傳播速度非常快,,但有時候,,這種速度還是快得超出了一般人的想象。比如這一次的易建聯(lián)疑似嫖娼事件
2024-10-18 16:45:15猝不及防的24小時,!易建聯(lián)被爆出丑聞12月14日,,韓國國會通過彈劾尹錫悅動議。12月23日前,,尹錫悅需提交有關(guān)彈劾案的答辯,。12月27日,韓國憲法法院將舉行彈劾案首場聽證會,。
2024-12-18 00:35:09尹錫悅