10月19日,,字節(jié)跳動(dòng)大模型訓(xùn)練遭到實(shí)習(xí)生攻擊的事件引起了廣泛關(guān)注,。據(jù)知情人士透露,今年6月,,字節(jié)跳動(dòng)某技術(shù)團(tuán)隊(duì)內(nèi)部發(fā)生了一起技術(shù)襲擊事件,,一名實(shí)習(xí)生因?qū)F(tuán)隊(duì)資源分配不滿(mǎn),使用攻擊代碼破壞了團(tuán)隊(duì)的模型訓(xùn)練任務(wù),。
該事件的主要涉事者是一名田姓實(shí)習(xí)生,。他利用Huggingface平臺(tái)的漏洞,在公司的共享模型中寫(xiě)入了破壞代碼,,導(dǎo)致模型訓(xùn)練效果不穩(wěn)定,,無(wú)法達(dá)到預(yù)期成果。一位前字節(jié)技術(shù)員工表示,,字節(jié)AI Lab的實(shí)習(xí)生權(quán)限和正職員工差異不大,,這為此次事件提供了機(jī)會(huì),并對(duì)此事可能帶來(lái)的負(fù)面影響表達(dá)了擔(dān)憂(yōu),。
消息曝光后,,涉事實(shí)習(xí)生試圖在社交平臺(tái)上辟謠,將責(zé)任推給他人,,但很快遭到接近字節(jié)跳動(dòng)人士的否認(rèn),。相關(guān)知情人士在GitHub上指出,田某在長(zhǎng)達(dá)兩個(gè)月的時(shí)間里對(duì)集群代碼進(jìn)行惡意攻擊,,對(duì)公司近30位各級(jí)員工造成巨大傷害,,使得同事一個(gè)季度的工作白費(fèi)。所有記錄和審查都證明這是不容置疑的事實(shí),。錄音中的對(duì)話(huà)顯示,,田某最初輸入的代碼本用于調(diào)試,但后來(lái)通過(guò)更新文件變成了攻擊代碼,,導(dǎo)致了一系列問(wèn)題,。田某在錄音中承認(rèn)了這一行為,并表示是因?yàn)槟承┰驅(qū)е铝藰O大的不滿(mǎn),。
雖然有傳聞稱(chēng)此次損失超過(guò)千萬(wàn)美元,,但內(nèi)部人士表示實(shí)際損失并沒(méi)有那么嚴(yán)重,。據(jù)了解,事件發(fā)生于今年6月底,,目前字節(jié)跳動(dòng)已辭退田姓實(shí)習(xí)生,,并將此事通報(bào)給相關(guān)行業(yè)聯(lián)盟和其所在的學(xué)校。不過(guò),,除了被辭退外,,田某未受到其他處罰。
多方消息顯示,,田姓實(shí)習(xí)生是國(guó)內(nèi)某高校在讀博士生,,自2021年9月起在字節(jié)AI Lab實(shí)習(xí)。其所在團(tuán)隊(duì)在今年4月與北大王立威團(tuán)隊(duì)提出了VAR研究,,在圖像生成質(zhì)量、推理速度,、數(shù)據(jù)效率和可擴(kuò)展性等方面均超過(guò)了DiT,,推理速度比傳統(tǒng)自回歸模型快約20倍。截至發(fā)稿時(shí),,字節(jié)跳動(dòng)方面仍未對(duì)此事進(jìn)行公開(kāi)回應(yīng),。
5月15日,,在火山引擎原動(dòng)力大會(huì)上,,字節(jié)跳動(dòng)正式推出了豆包大模型
2024-05-15 11:23:07字節(jié)跳動(dòng):豆包大模型每日生成圖片3000萬(wàn)張