AI鑒黃師如何培育起來(lái)的?
早在2014年圖普科技就開(kāi)始利用AI來(lái)識(shí)別靜態(tài)圖像里的色情元素,,但是早期的素材收集工作卻困難重重,。“公司剛成立時(shí),,一天起碼有六個(gè)小時(shí)都在搜集數(shù)據(jù),,簡(jiǎn)單說(shuō),就是看黃圖,、黃片,,然后把它們?nèi)拥綌?shù)據(jù)庫(kù)中。一開(kāi)始我們只能依靠自身力量搜集素材,,每天都在號(hào)召親友宅男貢獻(xiàn)出自己收藏的資源,,但是來(lái)源比較單調(diào),主要是大陸和島國(guó)片為主,。收集的關(guān)鍵全靠尋找‘對(duì)的人’,,只要找對(duì)了人,方能以一敵百,。直到后來(lái)有了客戶(hù)提供的海量數(shù)據(jù)才算真正走向正軌,。只有數(shù)據(jù)覆蓋場(chǎng)景越全面,模型才能越精準(zhǔn),?!?/p>
相比語(yǔ)音識(shí)別和圖像識(shí)別,不良信息在語(yǔ)義方面的識(shí)別則發(fā)展略晚,。相比之下,,它卻更能夠捕捉語(yǔ)言間細(xì)微的、不易被察覺(jué)的“軟色情”信號(hào),,而中文也是語(yǔ)義識(shí)別領(lǐng)域最難做的語(yǔ)言,。專(zhuān)注于AI語(yǔ)義識(shí)別的三角獸科技公司技術(shù)總監(jiān)亓超告訴《環(huán)球時(shí)報(bào)》記者,,該公司目前在語(yǔ)義方面的“鑒黃”主要體現(xiàn)在人工智能交互系統(tǒng)當(dāng)中,也就是常見(jiàn)的“人機(jī)對(duì)話(huà)”,。
▲2018年8月3日,,北京,油庫(kù)公司,,29歲的吉恒杉是一名人工智能標(biāo)注員,,他正在訓(xùn)練機(jī)器識(shí)別何為“接吻”鏡頭,因此也被戲稱(chēng)為“吻戲鑒定師”,。圖片:VCG
通俗點(diǎn)講,,當(dāng)你有意想要“調(diào)戲”AI的時(shí)候,它首先會(huì)識(shí)別你的輕佻言論,,其次能夠迅速捕捉言語(yǔ)間的“雷點(diǎn)”,并在毫秒內(nèi)做出反應(yīng)和判斷,,以巧妙的方式規(guī)避開(kāi)你的“調(diào)戲”,。對(duì)于一些低俗、污穢的詞句,,在人機(jī)對(duì)話(huà)中也會(huì)被自動(dòng)屏蔽掉,。
打開(kāi)每個(gè)人心靈的窗口,,沐之以春風(fēng),、潤(rùn)之以細(xì)雨,往往就能于無(wú)聲處成風(fēng)化人,、凝心聚力