聲音是人類感知世界的重要渠道,然而在特定的無聲場(chǎng)景中,,聲音的傳播屬性被強(qiáng)制剝離,,形成信息真空。將失去的聲音還原成信息流,,并用文字可讀的方式再造場(chǎng)景成為迫切需要,,唇語識(shí)別技術(shù)由此而生。
2017年3月29日,,海云數(shù)據(jù)創(chuàng)始人兼CEO馮一村在亞洲大數(shù)據(jù)可視分析峰會(huì)上,,發(fā)布了重慶市公安科研所與海云數(shù)據(jù)共同研發(fā)的唇語識(shí)別技術(shù)成果。
【海云數(shù)據(jù)創(chuàng)始人,、CEO馮一村發(fā)言】
馮一村介紹:自2016年12月以來,,海云研究院經(jīng)過多項(xiàng)技術(shù)攻關(guān),結(jié)合海云數(shù)據(jù)業(yè)務(wù)形態(tài)、唇語識(shí)別的核心技術(shù)及應(yīng)用進(jìn)行了深度探索,,打破了原先只能識(shí)別英文的技術(shù)局限,,開創(chuàng)了中文唇語識(shí)別模型的研究先河,,并取得了一定的成果,。經(jīng)過實(shí)踐評(píng)估,中文識(shí)別模型準(zhǔn)確率已達(dá)到70%,。
神奇卻不神秘的唇語識(shí)別
唇語識(shí)別并不神秘,,早在幾年前,國(guó)外就已提出相關(guān)概念,,但更多是存于構(gòu)想階段,。實(shí)質(zhì)上,唇語識(shí)別是一項(xiàng)集機(jī)器視覺與自然語言處理于一體的技術(shù),。唇語識(shí)別系統(tǒng)使用機(jī)器視覺技術(shù),,從圖像中連續(xù)識(shí)別出人臉,并提取此人連續(xù)的口型變化特征,,隨即將連續(xù)變化的特征輸入到唇語識(shí)別模型中,,識(shí)別出講話人口型對(duì)應(yīng)的發(fā)音,從而計(jì)算出可能性最大的表達(dá)語句,。
但是,,成熟的唇語識(shí)別系統(tǒng)需要建立在大量人臉特征樣本的基礎(chǔ)之上,通過帶記憶的深度神經(jīng)網(wǎng)絡(luò)才能保證結(jié)果的最大準(zhǔn)確性,。鑒于人種的生物特征以及語言特征區(qū)別,,國(guó)外的系統(tǒng)并不能照搬照抄,因此海云數(shù)據(jù)攜手重慶公安研究所開始了中文唇語識(shí)別系統(tǒng)的研發(fā),。
唇語識(shí)別提升大數(shù)據(jù)應(yīng)用價(jià)值
在研發(fā)過程中,,海云數(shù)據(jù)一直在深挖唇語識(shí)別的實(shí)際應(yīng)用價(jià)值。結(jié)合多年公安大數(shù)據(jù)落地實(shí)踐經(jīng)驗(yàn)來看,,唇語識(shí)別技術(shù)能豐富海云數(shù)據(jù)現(xiàn)有的公共安全領(lǐng)域的大數(shù)據(jù)一站式解決方案,,更好的提高公安破案效率。
此前,,海云數(shù)據(jù)開發(fā)的大數(shù)據(jù)可視指揮決策平臺(tái)——智警,,能夠?qū)⒖谝曨l、警力分布,、警車GPS等相關(guān)數(shù)據(jù)放到空間,、地理維度進(jìn)行分析,并能夠有效的協(xié)助決策層認(rèn)知到警力是否充足,、警力調(diào)配是否合理,,從而有效的預(yù)防”兩搶一盜“等犯罪現(xiàn)象。可以預(yù)想,,加入唇語識(shí)別技術(shù)后,,公安人員可通過平臺(tái)鎖定視頻中犯罪嫌疑人的語言記錄,極大助力犯罪緝查工作的開展,。
這其實(shí)只是唇語識(shí)別技術(shù)的應(yīng)用場(chǎng)景之一,。在日常生活、社會(huì)公益,、體育賽事裁定等方面唇語識(shí)別有著更廣闊的空間,。譬如助力聾啞人、老年人交流,;唇語解鎖,;體育賽事的語言暴力等。一項(xiàng)新技術(shù)的誕生,,往往能夠給人類帶來無限的想象空間,。而率先掌握新技術(shù)的人則必將擁有打開。