AI數(shù)據(jù)告急,,大廠盯上廉價年輕人
互聯(lián)網(wǎng)大廠正采取新策略獲取人工智能(AI)訓(xùn)練所需的新數(shù)據(jù):他們直接招募“AI錄音員”,,支付每次約300元的報酬,定制專屬的語料庫,。在北京,,某大廠從年初就開始邀請普通人參與,,每次需兩人一組,進行3小時的錄音,,其中包括自由聊天與有提示詞的對話,,確保內(nèi)容充實且符合要求。錄音過程中,,至少兩名員工會全程監(jiān)督,,以保證錄音質(zhì)量和信息含量,避免低質(zhì)量內(nèi)容,,并強調(diào)不能改動預(yù)設(shè)的提示詞,。
二線城市的如成都、太原,、貴州等地,,已成為字節(jié)跳動、百度,、阿里巴巴等企業(yè)構(gòu)建AI數(shù)據(jù)資源的外包中心,。據(jù)知情人士透露,這些公司過去招聘的數(shù)據(jù)標(biāo)注員和方言朗讀者門檻較低,,但現(xiàn)在更傾向于聘請來自頂尖高校的實習(xí)生來管理外包項目,。
AI大模型的發(fā)展依賴于數(shù)據(jù),、算法和算力,,其中,高質(zhì)量的數(shù)據(jù)是訓(xùn)練模型的基礎(chǔ),。然而,,公開可用的互聯(lián)網(wǎng)數(shù)據(jù)正面臨枯竭,預(yù)計在未來幾年內(nèi),,科技公司將耗盡可用于AI語言模型訓(xùn)練的數(shù)據(jù),。這迫使大模型團隊尋找創(chuàng)新途徑,以獲取能有效“喂養(yǎng)”模型的新數(shù)據(jù),。
為了避免因使用未授權(quán)數(shù)據(jù)引發(fā)的法律爭議,,一些大型科技公司開始自己動手制作數(shù)據(jù),力求數(shù)據(jù)的時效性和高質(zhì)量,。他們繞過第三方平臺,,直接參與設(shè)計AI所需的“劇本”,探索維持模型競爭力的新路徑,。
在社交媒體平臺上,,出現(xiàn)了標(biāo)價300元一次的AI錄音兼職廣告,吸引眾多求職者。盡管報酬誘人,,但這份工作并不輕松,。應(yīng)聘者需先提交樣音,通過嚴格篩選,,隨后參與長時間,、高要求的錄音環(huán)節(jié),包括自由聊天和依據(jù)特定提示詞的對話,。整個過程受到嚴密監(jiān)控,,任何影響錄音質(zhì)量的因素都需要糾正重錄。
青年就業(yè)現(xiàn)狀與趨勢深度觀察在當(dāng)今社會,青年群體的就業(yè)情況牽動著國家,、社會與家庭的未來
2024-07-09 16:30:10年輕人買車更傾向科技大廠