原標題:揭秘:AI鑒黃師是怎么工作的,?如何培養(yǎng),?
網(wǎng)絡媒體的發(fā)展催生了一個充滿神秘色彩的職業(yè)——鑒黃師,不少宅男心中的“夢想工作”,。
殊不知,,鑒黃師實則是一個無比艱辛的工種:熬夜、勞累,、枯燥……但即便像上了發(fā)條一樣地工作,,他們依然越來越難滿足短視頻時代鑒黃堵漏的需求。
今年四月,,快手,、火山小視頻因傳播低俗信息被約談。自此,,對互聯(lián)網(wǎng)色情內(nèi)容的打擊力度愈發(fā)升級,。
人工智能鑒黃師(AI)便由此應運而生,,AI的出現(xiàn)極大地解放了掙扎在鑒黃大業(yè)一線的人工鑒黃師們。
目前在我國上線的“AI鑒黃師”,,不僅能鑒別黃片黃圖,,連帶有情色信息的語音內(nèi)容也能夠快速捕捉。近期上線公測的阿里巴巴AI語音鑒黃反垃圾服務,,不僅能支持中文,、日文、英文等多國語言,,還能識別東北話,、四川話、廣東話等方言,,就連無語義的呻吟聲也能識別出來。
帶著滿滿的好奇,,《環(huán)球時報》記者采訪了AI智能鑒黃在圖片,、語音和語義三大領域的領先技術團隊,請他們揭開AI鑒黃師的神秘面紗,。
AI鑒黃師是怎么工作的,?
在圖像鑒黃領域起步較早的圖普科技公司運營總監(jiān)姜澤榮介紹,圖像鑒黃的原理首先是要制定色情圖片的分類標準,,然后收集大量素材,,進行分類標注,最后用這些標注好的素材去訓練圖片,,讓機器去學習各個分類里面的特征,,不斷調(diào)整自己模型的參數(shù),并最終得到最佳的識別模型,。
當機器對圖像進行識別以后,,這些圖像數(shù)據(jù)會轉化為數(shù)字化的信息,帶入到模型里面進行計算,,根據(jù)計算值將圖片標注為“正常,、性感、色情”三個類別,。如果在人工復核環(huán)節(jié)發(fā)現(xiàn)機器識別有誤,,則會有針對性地對相同場景的圖片進行數(shù)據(jù)學習,并調(diào)整參數(shù),,直到錯誤率達到最低值,。