在一項(xiàng)人類評(píng)審盲測(cè)的對(duì)比實(shí)驗(yàn)中,,Octave的輸出在音質(zhì),、自然度以及語音生成與預(yù)期描述匹配度等方面均優(yōu)于ElevenLabs,表明其AI語音生成過程的可控性和質(zhì)量高于行業(yè)水準(zhǔn),。在推出Octave之前,Hume AI已推出了兩代自研的同理心語音界面(EVI),,聲稱EVI是第一個(gè)具有情商的對(duì)話式AI,。
當(dāng)前首發(fā)版本的Octave主要支持英語,,其次是西班牙語,,未來可能還會(huì)上線更多語種。該模型在Hume AI開發(fā)者平臺(tái)上的使用強(qiáng)度有一定限制,,現(xiàn)支持的音頻格式有MP3,、WAV和PCM,。
Octave不僅支持生成帶有人設(shè)和人類情感色彩的AI語音,,還將推出語音克隆功能。該模型不僅能理解單個(gè)句子內(nèi)的情感,,還能捕捉上下文之間的情感聯(lián)系,,從而更具表達(dá)力和細(xì)節(jié)度,。Octave能夠解析劇本或提示詞中的情節(jié)轉(zhuǎn)折,、情感暗示和角色特征,,并將其轉(zhuǎn)化為自然帶感情的語音,,聽起來就像演員在朗讀劇本一樣,。
基于提示詞或劇本,,Octave能夠生成各種設(shè)定的AI語音。它會(huì)自動(dòng)解析一段文字內(nèi)容的含義和風(fēng)格,,包括人稱代詞,、簡稱,、用詞等,,從而生成與角色相符的連貫語音內(nèi)容。用戶還可以通過具體的角色描述來引導(dǎo)Octave,,例如特定口音,、人設(shè)特征,、職業(yè)角色等,。此外,,用戶可以選擇跳過語音設(shè)計(jì)功能,,直接在Playground上即時(shí)生成語音,。
Octave還支持表演指令功能,可以基于現(xiàn)有語音類型,,進(jìn)一步用指定的情感或說話風(fēng)格來朗讀新劇本。Hume AI表示,,只需一段5秒的音頻,,Octave就能快速克隆出其語音,,但出于安全考慮,,涉及較為逼真的孩童語音和特定人物的模仿語音將受限。
8月23日,,消息透露,,70歲金融界領(lǐng)軍人物、摩根士丹利國際公司董事長喬納森·布魯默不幸離世,,他同時(shí)也是保險(xiǎn)集團(tuán)Hiscox的負(fù)責(zé)人
2024-08-25 09:47:44又一位金融大佬去世了推特前員工針對(duì)馬斯克及其社交平臺(tái)X(前身為推特)發(fā)起訴訟后,,X向法院提交的股東名單于周三公開
2024-08-23 15:54:51馬斯克的X重量級(jí)股東名單全曝光