作為人工智能產(chǎn)業(yè)的下游端,“吳潘威們”對行業(yè)勃興的感知或許是最敏感的,。
“從去年起,一個個項目接踵而至,?!痹|說,“目前夢動所承接的項目幾乎囊括所有人工智能領(lǐng)域:圖片,、文本信息,、語音、視頻,、在線審核等,,其中圖片是最大的一塊?!?/p>
吳潘威已經(jīng)記不清標注過多少項目,,“五花八門,難以想象”,。無人售貨超市里,,商品種類數(shù)以萬計,光背包就有十幾種,;甚至有美甲店要求訓練能識別指甲區(qū)域的機器人,,那樣就不會把指甲油涂到指甲外……
6月29日,在夢動科技,,記者看到辦公室的柜子上擺放著幾十種可口可樂飲料,。項目組長蔣純潔介紹,標注員需要先記住所有產(chǎn)品的類別,、口味,、容積,同一款產(chǎn)品要仔細看包裝顏色和圖案細微的不同之處,,“否則標注的時候再去看就太慢了”,。
“最奇怪的是給貓臉和狗臉打點?!表椖恐鞴苜Z如松說,。兩個多月前,他們花了整整兩個星期給一萬多張貓和狗的圖片打點,,每張臉上要打34個點,,“想來想去也沒想明白這到底是用來干啥的”。
“大學生為什么要來做這個”
吳潘威是最早一批來夢動科技的實習生之一。做數(shù)據(jù)標注員兩年多,,當初和他一起實習的同學大多都離開了,;而在他實習期間,數(shù)不清的實習生來來往往,。他們抱怨工作枯燥乏味,,沒什么前途。
“大學生為什么要來做這個事情,?”吳潘威也不止一次問過自己,。
出生于1999年的陸森霖是貴州盛華職業(yè)學院計算機專業(yè)的大一學生,實習近3個月了,。學校離公司只有1公里左右,,這是學校在產(chǎn)教融合方面的部署。
陸森霖正在做的項目是語音識別,,每天的基本任務(wù)是將約1800秒的語音輸出成文字,,將重疊在一起的幾個音色分開,這會花費他五六個小時,;最麻煩的是專業(yè)術(shù)語,,不懂的名詞要上網(wǎng)查;做完之后由質(zhì)檢員核對,,如果有錯誤就會被打回來重新修改,。
來電顯示利益鏈 最近浙江尹先生發(fā)現(xiàn)自己手機號被軟件平臺標注成了“教育科研機構(gòu)”。而要查詢是被哪些軟件標注的,,需要花錢,,取消這個錯誤標注,要花更多的錢