10月19日,,字節(jié)跳動(dòng)大模型訓(xùn)練遭到實(shí)習(xí)生攻擊的事件引起了廣泛關(guān)注,。據(jù)知情人士透露,今年6月,,字節(jié)跳動(dòng)某技術(shù)團(tuán)隊(duì)內(nèi)部發(fā)生了一起技術(shù)襲擊事件,一名實(shí)習(xí)生因?qū)F(tuán)隊(duì)資源分配不滿,,使用攻擊代碼破壞了團(tuán)隊(duì)的模型訓(xùn)練任務(wù),。
該事件的主要涉事者是一名田姓實(shí)習(xí)生,。他利用Huggingface平臺(tái)的漏洞,,在公司的共享模型中寫入了破壞代碼,導(dǎo)致模型訓(xùn)練效果不穩(wěn)定,,無法達(dá)到預(yù)期成果。一位前字節(jié)技術(shù)員工表示,,字節(jié)AI Lab的實(shí)習(xí)生權(quán)限和正職員工差異不大,,這為此次事件提供了機(jī)會(huì),并對(duì)此事可能帶來的負(fù)面影響表達(dá)了擔(dān)憂,。
消息曝光后,,涉事實(shí)習(xí)生試圖在社交平臺(tái)上辟謠,,將責(zé)任推給他人,,但很快遭到接近字節(jié)跳動(dòng)人士的否認(rèn),。相關(guān)知情人士在GitHub上指出,,田某在長達(dá)兩個(gè)月的時(shí)間里對(duì)集群代碼進(jìn)行惡意攻擊,,對(duì)公司近30位各級(jí)員工造成巨大傷害,,使得同事一個(gè)季度的工作白費(fèi),。所有記錄和審查都證明這是不容置疑的事實(shí),。錄音中的對(duì)話顯示,,田某最初輸入的代碼本用于調(diào)試,但后來通過更新文件變成了攻擊代碼,,導(dǎo)致了一系列問題,。田某在錄音中承認(rèn)了這一行為,并表示是因?yàn)槟承┰驅(qū)е铝藰O大的不滿,。
雖然有傳聞稱此次損失超過千萬美元,,但內(nèi)部人士表示實(shí)際損失并沒有那么嚴(yán)重。據(jù)了解,,事件發(fā)生于今年6月底,,目前字節(jié)跳動(dòng)已辭退田姓實(shí)習(xí)生,,并將此事通報(bào)給相關(guān)行業(yè)聯(lián)盟和其所在的學(xué)校。不過,,除了被辭退外,田某未受到其他處罰,。
多方消息顯示,,田姓實(shí)習(xí)生是國內(nèi)某高校在讀博士生,自2021年9月起在字節(jié)AI Lab實(shí)習(xí),。其所在團(tuán)隊(duì)在今年4月與北大王立威團(tuán)隊(duì)提出了VAR研究,,在圖像生成質(zhì)量、推理速度,、數(shù)據(jù)效率和可擴(kuò)展性等方面均超過了DiT,,推理速度比傳統(tǒng)自回歸模型快約20倍。截至發(fā)稿時(shí),,字節(jié)跳動(dòng)方面仍未對(duì)此事進(jìn)行公開回應(yīng),。
5月15日,,在火山引擎原動(dòng)力大會(huì)上,字節(jié)跳動(dòng)正式推出了豆包大模型
2024-05-15 11:23:07字節(jié)跳動(dòng):豆包大模型每日生成圖片3000萬張