字節(jié)或損失千萬(wàn)美元
10月18日,,多個(gè)微信群流傳一則消息,稱(chēng)某頭部大廠的大模型訓(xùn)練被實(shí)習(xí)生入侵,,注入了破壞代碼,,導(dǎo)致其訓(xùn)練成果不可靠,可能需要重新訓(xùn)練,。據(jù)稱(chēng)遭到入侵的代碼影響了8000多張卡,,帶來(lái)的損失可能超過(guò)千萬(wàn)美元。
知情人士透露,,該頭部大廠為字節(jié)跳動(dòng),。事件發(fā)生在今年6月,起因是某高校的一名博士在字節(jié)跳動(dòng)商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí)時(shí),,因?qū)F(tuán)隊(duì)資源分配不滿,,使用攻擊代碼破壞了團(tuán)隊(duì)的模型訓(xùn)練任務(wù)。傳聞顯示,,這名田姓實(shí)習(xí)生利用了HF(huggingface)的漏洞,,在公司的共享模型里寫(xiě)入破壞代碼,導(dǎo)致模型的訓(xùn)練效果忽高忽低,,無(wú)法產(chǎn)生預(yù)期的效果,,且AML團(tuán)隊(duì)無(wú)法核查原因。但傳聞曝出后,,該實(shí)習(xí)生在某微信群里辟謠稱(chēng),,自己發(fā)完論文后就從字節(jié)跳動(dòng)離職,這個(gè)當(dāng)口有另一個(gè)人鉆漏洞改模型代碼,,把責(zé)任推到自己頭上。
字節(jié)跳動(dòng)內(nèi)部調(diào)查明確此事為田姓實(shí)習(xí)生所為,。目前,,該實(shí)習(xí)生已被辭退,公司同時(shí)將此事同步給行業(yè)聯(lián)盟和該實(shí)習(xí)生所在的學(xué)校,。盡管該實(shí)習(xí)生被辭退后到處“辟謠”甩鍋,,稱(chēng)是其他人所為,,但事實(shí)上他確實(shí)攻擊了商業(yè)化技術(shù)團(tuán)隊(duì)的模型訓(xùn)練任務(wù),影響了一些業(yè)務(wù)進(jìn)展,,但整體對(duì)公司造成的損失并沒(méi)有傳聞中的超過(guò)千萬(wàn)美元那么大,。
一位技術(shù)安全專(zhuān)家表示,HF漏洞產(chǎn)生的原因是單一性集中訓(xùn)練,,此事暴露了字節(jié)跳動(dòng)技術(shù)訓(xùn)練存在安全管理問(wèn)題,。公司既沒(méi)有做好權(quán)限隔離,也沒(méi)有做好共用代碼的審計(jì),。正常情況下,,每次大的代碼變動(dòng)必須做審計(jì),無(wú)論誰(shuí)操作都有痕跡記錄,,一個(gè)人想動(dòng)代碼是不可能的,。目前行業(yè)通用的做法是做三級(jí)隔離導(dǎo)向性部署,每一級(jí)只有鏡像,,每次先掃描,。調(diào)用按次計(jì)算、必須密鑰,。每一級(jí)完成后,,才能進(jìn)入下一級(jí),而上一級(jí)自動(dòng)刪除,,進(jìn)行分級(jí)訓(xùn)練,。
10月19日,字節(jié)跳動(dòng)官方發(fā)布聲明回應(yīng)此事,,確認(rèn)確有實(shí)習(xí)生發(fā)生嚴(yán)重違紀(jì)行為并已經(jīng)被辭退,,但相關(guān)報(bào)道也存在部分夸大及失實(shí)信息。涉事實(shí)習(xí)生惡意干擾商業(yè)化技術(shù)團(tuán)隊(duì)研究項(xiàng)目的模型訓(xùn)練任務(wù),,但并不影響商業(yè)化的正式項(xiàng)目及線上業(yè)務(wù),,也不涉及字節(jié)跳動(dòng)大模型等其他業(yè)務(wù)。網(wǎng)傳“涉及8000多卡,、損失上千萬(wàn)美元”嚴(yán)重夸大,。經(jīng)核實(shí),涉事人一直在商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí),,并沒(méi)有AI Lab實(shí)習(xí)經(jīng)歷,。該實(shí)習(xí)生已在8月被公司辭退。公司也將其行為同步給行業(yè)聯(lián)盟和所在學(xué)校,,交由校方處理,。字節(jié)或損失千萬(wàn)美元!
巴菲特也失算了?損失230億美元今年上半年,,“股神”巴菲特一直在狂拋蘋(píng)果公司的股票,。
2024-10-18 16:16:55巴菲特也失算了?損失230億美元