全球首位3D版AI合成主播
原標題:不是真人!全球首位3D版AI合成主播亮相:能隨時更改服裝,、變換發(fā)型
她能隨時變換發(fā)型,,她能隨時更改服裝,她能穿梭于演播室的不同虛擬場景中……
然而,,她卻不是真人,,她是全球首位人工智能驅(qū)動的3D版AI合成主播。
“大家好,,我叫新小微,,是由新華社聯(lián)合搜狗公司推出的全球首位3D版AI合成主播,我將為大家?guī)砣碌男侣勝Y訊體驗,?!?/p>
一段“未來感”十足的視頻播報畫面讓人眼前一亮,全球首位3D版AI合成主播在全國兩會開幕前夕正式亮相,,這是繼全球首位AI合成主播,、站立式AI合成主播、AI合成女主播,、俄語AI合成主播之后,,新華社智能化編輯部聯(lián)合搜狗公司最新研發(fā)的智能化產(chǎn)品。
“新小微”是如何誕生的,?
“新小微”的原型是新華社記者趙琬微,,采用最新人工智能技術(shù)“克隆”而成。
全球首位3D版AI合成主播
從外型上看,,“新小微”高度還原真人發(fā)膚,,在立體感、靈活度,、可塑性,、交互能力和應(yīng)用空間等方面,較前一代AI合成主播(2D形象)有了大幅躍升,。
在特寫鏡頭下,,甚至連頭發(fā)絲和皮膚上的毛孔都清晰可見。
3D版AI合成主播,,是如何誕生的,?
“‘新小微’的研發(fā),經(jīng)歷了極其復雜的過程,?!睋?jù)項目負責人介紹,研發(fā)人員進行了海量數(shù)據(jù)采集工作,。
趙琬微戴著數(shù)據(jù)采集頭盔,,幾百個攝像頭對其身體部位360度全方位“打點”掃描,,采集每一處細節(jié),并對其多種形態(tài)的表情和動作進行細致入微的捕捉記錄,。
“就像拼樂高一樣,,我們對‘新小微’的各個部位和表情進行了模塊化處理,然后重新組裝,?!表椖控撠熑私忉屨f,通過算法實時驅(qū)動,、渲染構(gòu)建出來的3D數(shù)字人物模型,,表情唇動、肢體動作和語言表達實現(xiàn)了高度契合,。
據(jù)介紹,,目前絕大部分“能動”的3D數(shù)字人,主要是靠真人驅(qū)動,。
而“新小微”采用的是人工智能驅(qū)動,,輸入文本后,AI算法便可實時驅(qū)動“新小微”,,生成的語音,、表情、唇動更接近于真人,。
“新小微”實現(xiàn)了哪些升級進化,?
和前一代AI合成主播相比,“新小微”實現(xiàn)了從單一景深機位到多機位多景深,、微笑播報到多樣化精微表情播報等進步,,播報形態(tài)可通過不同角度全方位呈現(xiàn),立體感和層次感明顯增強,。
“前一代AI合成主播只能在坐姿或站姿下做一些簡單的手勢,。‘新小微’不僅能走動和轉(zhuǎn)身,,還能擺出各種復雜動作和姿態(tài),,靈活性大大提升了?!表椖控撠熑私榻B。
此外,,“新小微”以其“微模塊化”的特性,,實現(xiàn)了靈活“變妝”。
她的發(fā)型,、服飾均能根據(jù)不同新聞和場景變換,,這些功能也是前一代AI合成主播所不具備的,。
“可以說,3D版AI合成主播在多方面都更加智能化了,,在人工智能的實時驅(qū)動下,,可實現(xiàn)功能持續(xù)自我更迭?!表椖控撠熑苏f,。
“新小微”將開啟怎樣的未來想象?
作為新聞界首位由人工智能驅(qū)動,、3D技術(shù)呈現(xiàn)的AI合成主播,,“新小微”在今年全國兩會期間可量化生產(chǎn)新聞播報視頻。
只需要在機器上輸入相應(yīng)文本內(nèi)容,,“新小微”就能播報新聞,,并根據(jù)語義生成相對應(yīng)的面部表情和肢體語言。
全球首位3D版AI合成主播
“隨著后期自我更迭和進化,,‘她’的工作空間會更大,。”項目負責人說,,隨著3D虛擬場景不斷拓展,,“新小微”將走出演播室,在不同場景中更好地滿足新聞呈現(xiàn)的多樣化需求,。
2018年11月7日,,新華社聯(lián)合搜狗公司發(fā)布全球首位AI合成主播,“克隆”出與真人主播擁有同樣播報能力的“分身”,。
此后又不斷迭代升級和擴容,,業(yè)界評論這是人工智能技術(shù)在新聞領(lǐng)域的開拓性應(yīng)用。
全球首位3D版AI合成主播
作為新華社AI合成主播家族的最新成員,,3D版AI合成主播在今年全國兩會期間將通過新華社客戶端為廣大網(wǎng)友帶來全新的新聞資訊體驗,,也將進一步助力新華社智能化編輯部建設(shè),推動媒體融合向縱深發(fā)展,,為新聞生產(chǎn)的“未來場景”開辟新空間,。
延伸閱讀
小伙用AI技術(shù)復原老北京街景視頻 網(wǎng)友驚呼穿越了
“這就是100年前的北京嗎?太逼真了,,好像穿越到那時候一樣,。”
近日,,一段經(jīng)過人工智能復原的北京100年前的影像視頻引起網(wǎng)友的興趣,。
視頻的發(fā)布者胡文谷告訴北京青年報記者,原始視頻是100年前外國人拍攝的北京街景,,是黑白的,,幀數(shù)也很低,。
他通過人工智能,讓整部視頻清晰度更高,,并上色成為彩色視頻,。
他表示,正收集上海的老視頻資料,,希望未來能夠再復原出上海等其他中國城市的樣貌,,讓大家愛上中國的歷史。
人工智能修復老北京街景影像
近日,,一段百年前北京市井的影像資料在社交媒體上“走紅”,。
視頻中,老石橋上車水馬龍人來人往,、集市上生意興隆,,身著長衫的人們互相作揖問好,甚至可以聽到商家的吆喝聲和京韻大鼓的唱段,。
更讓人驚喜的是,,與以往此類影像的黑白配色不同,整段視頻均為彩色的,,視頻的流暢度也與現(xiàn)代的視頻相似,,沒有老視頻那種“快進”的感覺。
有網(wǎng)友評論稱:“看到這段視頻,,感覺就好像穿越到了100年前的北京一樣,。”
這是歷史學家找到的全新影像嗎,?
11日上午,,北青報記者聯(lián)系到發(fā)布這段視頻的北京90后小伙兒胡文谷。
他表示,,這段視頻來自一個加拿大的數(shù)據(jù)庫,,其錄制時間為1920年到1926年,拍攝者應(yīng)該是一位當年曾來北京探訪的外國人,。
胡文谷說,,原視頻的幀數(shù)很低,每秒只有6到10幀,,如果按現(xiàn)在的播放速度來播放,,很容易給人“快進”的感覺。
此外,,原有的視頻受到當時的條件限制,,都是黑白的。
他發(fā)布的視頻無論是上色、補幀還是提高清晰度,,均是利用現(xiàn)代的人工智能實現(xiàn)的。
胡文谷回憶,,第一次看到這段視頻時,,他就感覺非常好奇,“雖然我從小就在北京長大,,但100多年前的北京到底是什么樣子,,也是看了原來的視頻才有了直觀的認識。
但這段視頻相比現(xiàn)在的視頻來說,,技術(shù)上太老了,,我正好接觸過一些利用人工智能復原老視頻的技術(shù),就想給這段視頻做一個復原,?!?/p>
補幀、上色,、提升清晰度由三款軟件完成
胡文谷介紹,,修復視頻先后用了3個人工智能軟件,“第一個是修復幀數(shù)的,,把原本6到10幀的視頻給修復成適合現(xiàn)代技術(shù)的60幀視頻,。第二個軟件負責加強一些關(guān)鍵幀的分辨率,第三軟件負責給原本的黑白視頻‘上色’,?!?/p>
胡文谷解釋說,人工智能就是模擬人類的大腦,,最開始的時候,,人工智能的“大腦”是空的,通過人類給人工智能圖片,、視頻等,,告訴這些軟件“狗是什么顏色”“衣服是什么顏色”“樹是什么顏色”,慢慢地,,人工智能就有了自己的“想象力”,,當我們把黑白視頻發(fā)給人工智能,它們就能代替我們的“大腦”,,將它想象的顏色復原到視頻里,,從而做出仿佛穿越到100年前北京的街景視頻?!捌鋵嵅徽撌巧仙?、補幀還是提高分辨率,人工智能應(yīng)用的原理都是差不多的,?!?/p>
胡文谷說,,相比人工進行修復,人工智能修復的速度要快得多,?!跋襁@樣的一段視頻,我前后花了幾天的時間制作,,而如果是人工來進行復原,,時間可能就至少要幾個星期了?!辈贿^胡文谷坦言,,目前這些人工智能軟件多是由外國人開發(fā)的,“他們沒有進行過老北京市井方面的學習,,所以一些地方上色后還是會讓人覺得不太對,,今后我會考慮培訓這些人工智能了解老北京的風土人情,讓這些復原的視頻更貼近北京的歷史原貌,?!?/p>
與百年前的北京人“相遇”很神奇
胡文谷家在北京宣武區(qū)虎坊橋一帶,從小他就對北京文化非常感興趣,。
近年來,,他在美國紐約工作,臨出國之前還特意去北京的幾處景點參觀,。
而網(wǎng)友對“老北京”的熱情也讓胡文谷非常意外,。“我當天把視頻發(fā)到網(wǎng)上后,,就去另一個房間健身了,,結(jié)果等我健身回來,發(fā)現(xiàn)轉(zhuǎn)發(fā)量已經(jīng)破萬了,,真是沒想到,。”
胡文谷介紹,,目前他正在收集一些上海的老視頻資料,,并跟一些上海的朋友請教,希望再復原一個上海的老視頻,,將更多中國的歷史復原給觀眾,。
同時,胡文谷也希望更多的人能夠參與到利用人工智能復原歷史的過程之中,。
5月22日,,據(jù)ASSC官方,谷愛凌獲頒亞洲協(xié)會南加州中心(Asia Society Southern California)2022年度“全球大使”稱號
2022-05-22 10:06:52谷愛凌成亞洲協(xié)會全球大使首位女性沉浸式感受溢出屏幕的霸氣。中國人民解放軍建軍95周年,,致敬人民子弟兵,!
2022-08-01 11:31:45這不是3D電影!這是人民軍隊,!