在最初的大數(shù)據(jù)學(xué)習(xí)階段,,AI需要學(xué)習(xí)“正反語(yǔ)料”素材,,反語(yǔ)料通常包括網(wǎng)絡(luò)上搜集來(lái)的不雅詞匯或污言穢語(yǔ)等。有趣的是,,一些網(wǎng)絡(luò)新詞更迭速度過(guò)快反而成了程序員們當(dāng)下最棘手的難題,,“有些詞昨天聽(tīng)著還很正常,今天就變成了敏感詞匯,,比如2017年熱炒的的‘黃鱔女’,,出事之后,我們還不能對(duì)黃鱔這個(gè)詞一刀切地屏蔽,,因?yàn)榭赡軙?huì)傷害其本來(lái)意義,,但還得讓機(jī)器聰明地判斷出這個(gè)詞出現(xiàn)的場(chǎng)景和語(yǔ)義。這就要求我們的技術(shù)不斷更迭,。
亓超表示,,在數(shù)據(jù)搜集難題上,他也期待未來(lái)能夠和有關(guān)政府部門(mén)合作,,以便收集到更多的原始素材來(lái)提高機(jī)器快速學(xué)習(xí)的能力,。
由于擔(dān)心兒童成為網(wǎng)絡(luò)黃色暴力主要的受害群體,三角獸在其“兒童聊天引擎”的設(shè)計(jì)中也更加謹(jǐn)慎處理對(duì)內(nèi)容的把控,,使其內(nèi)容不良率降低到萬(wàn)分之零點(diǎn)六,。亓超告訴記者,在兒童應(yīng)用設(shè)備中他們會(huì)屏蔽過(guò)濾掉如戀愛(ài),、結(jié)婚,、懷孕等成人可接受,但不適合兒童接觸的用語(yǔ),,為兒童營(yíng)造一個(gè)安全和健康的聊天環(huán)境,。
AI鑒黃的準(zhǔn)確度和效率如何?
阿里巴巴安全部高級(jí)算法工程師威視對(duì)《環(huán)球時(shí)報(bào)》記者表示:AI鑒黃師每天可審核數(shù)億張圖片,,識(shí)別準(zhǔn)確率高于99.5%,。
“舉個(gè)例子,一天要審核4億張圖片的話(huà),,單純由人工來(lái)審,,一人一天審1萬(wàn)張,需要4萬(wàn)人,而AI鑒黃只需將其中20萬(wàn)張可疑的圖片篩出來(lái),,由人工再審一道,,只需要20人即可,?!?/p>
圖普科技姜澤榮告訴記者,AI完成鑒別分類(lèi)后,,只會(huì)把判斷結(jié)果和概率告訴使用方,,使用方再根據(jù)結(jié)果做對(duì)應(yīng)處理,比如自動(dòng)刪除,、或者人工接入復(fù)審,。
AI上崗后,人工鑒黃師都會(huì)下崗嗎,?
作為早期的人工鑒黃標(biāo)注師,,姜澤榮坦言人工鑒黃師其實(shí)是一個(gè)枯燥的體力活,就像“流水線(xiàn)上的工人,,遲早會(huì)被機(jī)器替代,。AI的出現(xiàn)讓人類(lèi)把這個(gè)體力活外包出去,然后投身到更有意義的工作中去,?!?/p>
打開(kāi)每個(gè)人心靈的窗口,,沐之以春風(fēng)、潤(rùn)之以細(xì)雨,,往往就能于無(wú)聲處成風(fēng)化人,、凝心聚力