10月18日,,多個(gè)微信群流傳一則消息:某頭部大廠的大模型訓(xùn)練被實(shí)習(xí)生入侵,,注入了破壞代碼,導(dǎo)致其訓(xùn)練成果不可靠,,可能需要重新訓(xùn)練,。據(jù)稱遭到入侵的代碼影響了8000多張卡,帶來的損失可能超過千萬美元,。
知情人士透露,,該頭部大廠為字節(jié)跳動(dòng)。事件發(fā)生在2023年6月,起因是一名在字節(jié)跳動(dòng)商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí)的高校博士生對(duì)團(tuán)隊(duì)資源分配不滿,,使用攻擊代碼破壞團(tuán)隊(duì)的模型訓(xùn)練任務(wù),。
向字節(jié)跳動(dòng)求證此事時(shí),官方未進(jìn)行回應(yīng),。傳聞中提到,,這名田姓實(shí)習(xí)生利用HF(huggingface)的漏洞,在公司的共享模型里寫入破壞代碼,,導(dǎo)致模型訓(xùn)練效果不穩(wěn)定,,無法達(dá)到預(yù)期效果,且AML團(tuán)隊(duì)無法查明原因,。但該實(shí)習(xí)生在某微信群里辟謠,,稱自己發(fā)完論文后已從字節(jié)跳動(dòng)離職,此時(shí)有人鉆漏洞改模型代碼,,并將責(zé)任推到他頭上,。
據(jù)知情人士了解,字節(jié)跳動(dòng)內(nèi)部調(diào)查確認(rèn)此事確為田姓實(shí)習(xí)生所為,。目前,,該實(shí)習(xí)生已被辭退,字節(jié)跳動(dòng)將此事同步給陽光誠信聯(lián)盟和企業(yè)反舞弊聯(lián)盟,,以及該實(shí)習(xí)生所在的學(xué)校,。盡管如此,這名實(shí)習(xí)生被辭退后仍在四處“辟謠”,,堅(jiān)稱是他人所為,。
實(shí)際上,該實(shí)習(xí)生攻擊的是商業(yè)化技術(shù)團(tuán)隊(duì)的模型訓(xùn)練任務(wù),,而非豆包大模型,。這影響了該技術(shù)團(tuán)隊(duì)的一些業(yè)務(wù)進(jìn)展,但對(duì)公司造成的實(shí)際損失并未如傳聞中的那么嚴(yán)重,。
一位技術(shù)安全專家指出,,此次事件暴露出字節(jié)跳動(dòng)在技術(shù)訓(xùn)練方面存在安全管理問題。公司既沒有做好權(quán)限隔離,,也沒有進(jìn)行共用代碼的審計(jì)。正常情況下,,每次大的代碼變動(dòng)都必須經(jīng)過審計(jì),,確保操作有跡可循。行業(yè)通用的做法是采用三級(jí)隔離導(dǎo)向性部署,,每一級(jí)只有鏡像,,每次調(diào)用前需先掃描并使用密鑰,完成一級(jí)后才能進(jìn)入下一級(jí),而上一級(jí)則自動(dòng)刪除,。
5月15日,,在火山引擎原動(dòng)力大會(huì)上,字節(jié)跳動(dòng)正式推出了豆包大模型
2024-05-15 11:23:07字節(jié)跳動(dòng):豆包大模型每日生成圖片3000萬張