聲音是人類感知世界的重要渠道,然而在特定的無聲場景中,,聲音的傳播屬性被強(qiáng)制剝離,,形成信息真空,。將失去的聲音還原成信息流,并用文字可讀的方式再造場景成為迫切需要,,唇語識別技術(shù)由此而生,。
2017年3月29日,海云數(shù)據(jù)創(chuàng)始人兼CEO馮一村在亞洲大數(shù)據(jù)可視分析峰會上,,發(fā)布了重慶市公安科研所與海云數(shù)據(jù)共同研發(fā)的唇語識別技術(shù)成果。
【海云數(shù)據(jù)創(chuàng)始人,、CEO馮一村發(fā)言】
馮一村介紹:自2016年12月以來,,海云研究院經(jīng)過多項(xiàng)技術(shù)攻關(guān),結(jié)合海云數(shù)據(jù)業(yè)務(wù)形態(tài),、唇語識別的核心技術(shù)及應(yīng)用進(jìn)行了深度探索,,打破了原先只能識別英文的技術(shù)局限,開創(chuàng)了中文唇語識別模型的研究先河,,并取得了一定的成果,。經(jīng)過實(shí)踐評估,中文識別模型準(zhǔn)確率已達(dá)到70%,。
神奇卻不神秘的唇語識別
唇語識別并不神秘,,早在幾年前,國外就已提出相關(guān)概念,,但更多是存于構(gòu)想階段,。實(shí)質(zhì)上,唇語識別是一項(xiàng)集機(jī)器視覺與自然語言處理于一體的技術(shù),。唇語識別系統(tǒng)使用機(jī)器視覺技術(shù),,從圖像中連續(xù)識別出人臉,并提取此人連續(xù)的口型變化特征,,隨即將連續(xù)變化的特征輸入到唇語識別模型中,,識別出講話人口型對應(yīng)的發(fā)音,從而計(jì)算出可能性最大的表達(dá)語句,。