胡郁現(xiàn)場演講圖
段建軍現(xiàn)場演講圖
中國網(wǎng)娛樂9月22日訊 對于不少“開車族”而言,,手機內的語音導航可謂是必不可少的行車神器,為了響應市場需求、增添語音導航的新鮮感,,部分導航類app更是邀請到林志玲,、郭德綱,、羅永浩等圈內明星為該款應用站臺“獻聲”,。有了這樣一款系統(tǒng),用戶不但能解決行車途中可能遇到的路況煩惱,,還可以享受到“私人訂制”的語音導航服務,。那么問題來了,語音導航如何做到識別每一條街道,、每一個地名,?錄制這樣一款復雜的語音系統(tǒng)需要耗費多長時間?在即將播出的新一期《未來架構師》中,,科大訊飛執(zhí)行總裁胡郁與“汽車行業(yè)領跑者”段建軍,,以“世界無邊界”為主題,帶領觀眾走進近未來的人機交互世界!
智能語音竟可“私人訂制” ,!“人機大戰(zhàn)”是否能捍衛(wèi)人類最后尊嚴,?
在本周日晚播出的第十期《未來架構師》中,科大訊飛執(zhí)行總裁胡郁就將在節(jié)目中與觀眾分享研發(fā)語音識別技術的艱辛成長史,。
中國有九大方言語系,,其中細分的方言有幾十甚至上百種,且由于地域的差異,,人們說話的方式更是南腔北調。最初,,科大訊飛為了讓機器人聽懂不同口音的人說話,,便設計出了一套名為訊飛語音的輸入法,人們只需將此輸入法裝在智能手機上,,就可以通過語音識別技術,,直接將其轉換成文字;可在當時,,輸入法的正確率僅僅只有百分之五十五,,面對這一問題,科大訊飛并沒有選擇放棄,,而是不斷的致力于提升語音識別技術,,通過不斷的努力,如今其系統(tǒng)已經(jīng)收集了成千上萬上億小時的數(shù)據(jù),,正確率可以達到百分之九十八,。
“我們所接觸到的所有漢語音節(jié)都是由特定的聲母、韻母和不同的調性組合組裝在一起的,,即使我們的語言千變萬化,,但常用的音節(jié)卻不超過三千個?!痹诒局苋胀聿コ龅牡谑凇段磥砑軜嫀煛分?,科大訊飛執(zhí)行總裁胡郁就關于“明星和藝人如何進行復雜的語音錄制”這一問題給出了相應的解釋;“我們的團隊根據(jù)此種情況,,專門設計了一個標準的‘庫’,,它能盡可能地覆蓋每個人在不同情況下的音,配音者只需要用一小時左右的時間,,把一篇文字按要求朗讀一遍,;我們的程序會通過機器去學習他們的嗓音,這樣就能夠得到一個可以講任意文字信息的語音系統(tǒng)了,?!焙粽f。