原標題:揭秘:AI鑒黃師是怎么工作的,?如何培養(yǎng),?
網(wǎng)絡(luò)媒體的發(fā)展催生了一個充滿神秘色彩的職業(yè)——鑒黃師,,不少宅男心中的“夢想工作”,。
殊不知,鑒黃師實則是一個無比艱辛的工種:熬夜,、勞累,、枯燥……但即便像上了發(fā)條一樣地工作,他們依然越來越難滿足短視頻時代鑒黃堵漏的需求,。
今年四月,,快手、火山小視頻因傳播低俗信息被約談,。自此,,對互聯(lián)網(wǎng)色情內(nèi)容的打擊力度愈發(fā)升級。
人工智能鑒黃師(AI)便由此應(yīng)運而生,,AI的出現(xiàn)極大地解放了掙扎在鑒黃大業(yè)一線的人工鑒黃師們,。
目前在我國上線的“AI鑒黃師”,不僅能鑒別黃片黃圖,,連帶有情色信息的語音內(nèi)容也能夠快速捕捉,。近期上線公測的阿里巴巴AI語音鑒黃反垃圾服務(wù),不僅能支持中文,、日文,、英文等多國語言,還能識別東北話,、四川話,、廣東話等方言,就連無語義的呻吟聲也能識別出來,。
帶著滿滿的好奇,,《環(huán)球時報》記者采訪了AI智能鑒黃在圖片、語音和語義三大領(lǐng)域的領(lǐng)先技術(shù)團隊,,請他們揭開AI鑒黃師的神秘面紗,。
AI鑒黃師是怎么工作的?
在圖像鑒黃領(lǐng)域起步較早的圖普科技公司運營總監(jiān)姜澤榮介紹,,圖像鑒黃的原理首先是要制定色情圖片的分類標準,,然后收集大量素材,進行分類標注,,最后用這些標注好的素材去訓(xùn)練圖片,,讓機器去學(xué)習(xí)各個分類里面的特征,不斷調(diào)整自己模型的參數(shù),,并最終得到最佳的識別模型,。
當機器對圖像進行識別以后,這些圖像數(shù)據(jù)會轉(zhuǎn)化為數(shù)字化的信息,帶入到模型里面進行計算,,根據(jù)計算值將圖片標注為“正常,、性感、色情”三個類別,。如果在人工復(fù)核環(huán)節(jié)發(fā)現(xiàn)機器識別有誤,則會有針對性地對相同場景的圖片進行數(shù)據(jù)學(xué)習(xí),,并調(diào)整參數(shù),,直到錯誤率達到最低值。