Octave現(xiàn)已在platform.hume.ai平臺(tái)和Hume AI的API上線,。在線平臺(tái)上,,創(chuàng)作者和開(kāi)發(fā)者可以使用語(yǔ)音設(shè)計(jì),、表演指令、超過(guò)40種預(yù)設(shè)語(yǔ)音的語(yǔ)音庫(kù)以及用于生成有聲書(shū),、播客等長(zhǎng)篇內(nèi)容的項(xiàng)目界面(預(yù)覽版),。而在開(kāi)發(fā)者平臺(tái)上,,Octave可通過(guò)Python和TypeScript SDK訪問(wèn),,這些SDK處理身份驗(yàn)證并提供類(lèi)型化接口,,確保集成的可靠性。其命令行界面支持快速原型設(shè)計(jì),、測(cè)試及從終端批量處理。
目前,Hume AI的API允許開(kāi)發(fā)人員每分鐘對(duì)Octave模型發(fā)出最多50次請(qǐng)求,,文本長(zhǎng)度上限為5000個(gè)字符,,描述上限為1000個(gè)字符。每個(gè)請(qǐng)求最多可生成5個(gè)輸出,,支持的音頻格式包括MP3,、WAV和PCM。
Hume AI對(duì)Octave進(jìn)行了內(nèi)部評(píng)估,,將其與業(yè)內(nèi)領(lǐng)先的AI文生語(yǔ)音大模型ElevenLabs進(jìn)行對(duì)比,。基準(zhǔn)測(cè)試包含120個(gè)多樣化語(yǔ)音描述的樣本,,結(jié)果顯示,,Octave在音質(zhì)、自然度以及提示詞匹配度方面均略勝一籌,。
Hume AI目前采用訂閱制收費(fèi)方式,,分為免費(fèi)、Creator,、Creator Pro和Enterprise四大類(lèi),。免費(fèi)版每月提供1萬(wàn)個(gè)字符的文本轉(zhuǎn)語(yǔ)音,總時(shí)長(zhǎng)約10分鐘,;入門(mén)版每月3美元,,提供3萬(wàn)個(gè)字符,總時(shí)長(zhǎng)約30分鐘,;Creator版每月10美元,,提供10萬(wàn)個(gè)字符,總時(shí)長(zhǎng)約100分鐘,;專(zhuān)業(yè)版每月50美元,,提供50萬(wàn)個(gè)字符,總時(shí)長(zhǎng)約500分鐘,。規(guī)模,、商業(yè)和企業(yè)級(jí)接入使用收費(fèi)標(biāo)準(zhǔn)則有所不同。
Hume AI的新文生語(yǔ)音大模型Octave及其情感智能語(yǔ)音技術(shù)有望解決長(zhǎng)期以來(lái)AI語(yǔ)音應(yīng)答機(jī)械,、語(yǔ)調(diào)生硬,、音色千篇一律的問(wèn)題,使人機(jī)語(yǔ)音交互更接近人與人之間的溝通,。同時(shí),,Octave也可以為影視、視聽(tīng),、新媒體,、數(shù)字人等多個(gè)行業(yè)產(chǎn)出定制化配音,,加速AI語(yǔ)音的商業(yè)化落地。
推特前員工針對(duì)馬斯克及其社交平臺(tái)X(前身為推特)發(fā)起訴訟后,,X向法院提交的股東名單于周三公開(kāi)
2024-08-23 15:54:51馬斯克的X重量級(jí)股東名單全曝光