以發(fā)音口型為例,為生成真人聽感的發(fā)音,,京東云自研輕量級(jí)對(duì)抗語音合成技術(shù),,結(jié)合深度神經(jīng)網(wǎng)絡(luò)進(jìn)行個(gè)性化建模,達(dá)到音色豐富、特色鮮明的語音合成效果,,甚至可以模擬人的呼吸和停頓;為匹配準(zhǔn)確口型,,京東云基于大量語音數(shù)據(jù),,特意設(shè)計(jì)魯棒的語音特征,使其可以被不同音色、語言和語速的合成語音驅(qū)動(dòng),,保持準(zhǔn)確,、連貫的口型,。
面向未來,,京東云助力產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型
虛擬數(shù)字人正在實(shí)現(xiàn)不同領(lǐng)域的應(yīng)用落地,,從線下銀行的虛擬柜員,到線上購物的虛擬主播,、娛樂圈的虛擬偶像,,甚至元宇宙里的虛擬化身,虛擬數(shù)字人也將徹底顛覆我們對(duì)于生活,、工作、娛樂的體驗(yàn)方式,,成為人和人、人和物的交互載體,。通過數(shù)字人,以多模態(tài)創(chuàng)新的方式來生產(chǎn),、傳播內(nèi)容,也將建立數(shù)字內(nèi)容的新范式,。
京東云將基于深厚的產(chǎn)業(yè)數(shù)智化實(shí)踐應(yīng)驗(yàn),,推動(dòng)虛擬數(shù)字人與產(chǎn)業(yè)的深度融合,打造以虛擬數(shù)字人為載體,,以語音合成,、文本創(chuàng)作,、視頻加工,、批量合成,、智能審核等人工智能技術(shù)為依托,,創(chuàng)新,、高效的數(shù)智供應(yīng)鏈,,樹立人機(jī)交互發(fā)展,、應(yīng)用的新標(biāo)桿,助力實(shí)體經(jīng)濟(jì)高質(zhì)量發(fā)展,。