AI鑒黃師如何培育起來的,?
早在2014年圖普科技就開始利用AI來識別靜態(tài)圖像里的色情元素,,但是早期的素材收集工作卻困難重重,。“公司剛成立時,,一天起碼有六個小時都在搜集數(shù)據(jù),簡單說,,就是看黃圖、黃片,,然后把它們?nèi)拥綌?shù)據(jù)庫中,。一開始我們只能依靠自身力量搜集素材,每天都在號召親友宅男貢獻出自己收藏的資源,,但是來源比較單調(diào),,主要是大陸和島國片為主。收集的關(guān)鍵全靠尋找‘對的人’,,只要找對了人,,方能以一敵百。直到后來有了客戶提供的海量數(shù)據(jù)才算真正走向正軌,。只有數(shù)據(jù)覆蓋場景越全面,,模型才能越精準?!?/p>
相比語音識別和圖像識別,,不良信息在語義方面的識別則發(fā)展略晚。相比之下,,它卻更能夠捕捉語言間細微的,、不易被察覺的“軟色情”信號,而中文也是語義識別領(lǐng)域最難做的語言,。專注于AI語義識別的三角獸科技公司技術(shù)總監(jiān)亓超告訴《環(huán)球時報》記者,,該公司目前在語義方面的“鑒黃”主要體現(xiàn)在人工智能交互系統(tǒng)當中,也就是常見的“人機對話”,。
▲2018年8月3日,,北京,,油庫公司,29歲的吉恒杉是一名人工智能標注員,,他正在訓(xùn)練機器識別何為“接吻”鏡頭,,因此也被戲稱為“吻戲鑒定師”。圖片:VCG
通俗點講,,當你有意想要“調(diào)戲”AI的時候,,它首先會識別你的輕佻言論,其次能夠迅速捕捉言語間的“雷點”,,并在毫秒內(nèi)做出反應(yīng)和判斷,,以巧妙的方式規(guī)避開你的“調(diào)戲”。對于一些低俗,、污穢的詞句,,在人機對話中也會被自動屏蔽掉。