亞馬遜推出了新一代生成式AI語音模型Nova Sonic,,在人工智能語音領域取得了重大突破,。這款模型能夠處理語音輸入并生成自然流暢的語音輸出,其速度,、語音識別準確率和對話質量等核心性能指標已達到與OpenAI,、谷歌等科技巨頭尖端語音模型相媲美的水平。
Nova Sonic通過亞馬遜Bedrock開發(fā)者平臺提供服務,,采用創(chuàng)新的雙向流式API接口,,為企業(yè)級AI應用開發(fā)提供了強大支持。該模型在成本效益方面具有顯著優(yōu)勢,,價格比OpenAI的GPT-4便宜約80%,,成為市場上最具性價比的AI語音解決方案之一。
相比競爭對手,,Nova Sonic在將用戶請求路由到不同API方面表現(xiàn)出色,。它能夠判斷何時需要從互聯(lián)網(wǎng)獲取實時信息、解析專有數(shù)據(jù)源或在外部應用程序中采取行動,,并使用合適的工具完成任務,。在雙向對話中,Nova Sonic會等待合適的時機發(fā)言,,考慮到說話者的停頓和打斷等情況,。此外,該模型還能為用戶的語音生成文本記錄,,這些文本可以用于各種應用場景,。
亞馬遜AGI部門首席科學家羅希特·普拉薩德透露,Nova Sonic的部分技術已經(jīng)應用于升級版數(shù)字助手Alexa+,。該模型的推出是亞馬遜構建人工通用智能(AGI)戰(zhàn)略的重要一步,,未來還將推出支持多模態(tài)理解的AI模型,涵蓋圖像,、視頻及其他物理世界感知數(shù)據(jù),。
芯片巨頭英偉達正在拓展印度市場,,這是一個不斷增長的人工智能技術市場,。10月24日,英偉達在印度推出了一款輕量級人工智能模型,,該模型適用于廣泛使用的印地語
2024-10-24 20:46:00英偉達拓展印度市場OpenAI首席執(zhí)行官山姆·奧特曼當?shù)貢r間1月17日在社交媒體平臺X發(fā)文稱,,OpenAI已完成新推理AI模型o3 mini版本,將在幾周內推出
2025-01-18 11:24:13OpenAI將推出推理AI模型近日,,短視頻平臺上出現(xiàn)了大量“雷軍AI配音”的惡搞視頻。
2024-10-30 10:02:15媒體:“AI換聲”該管管了