谷歌DeepMind團(tuán)隊(duì)于5月27日宣布推出SignGemma,這是其迄今為止最強(qiáng)大的手語翻譯模型,,能夠?qū)⑹终Z轉(zhuǎn)化為口語文本,。該開源模型計(jì)劃在今年晚些時(shí)候加入Gemma模型家族,。SignGemma支持多語言功能,,但目前主要針對美國手語(ASL)和英語進(jìn)行了深度優(yōu)化,開發(fā)者可以自由使用并改進(jìn)它,。
DeepMind希望通過這項(xiàng)技術(shù)幫助手語使用者克服溝通障礙,,在工作、學(xué)習(xí)和社交中更加順暢地參與,。今年,,DeepMind還推出了Gemma 3n模型,可以從音頻,、圖像,、視頻及文本輸入生成智能文本,助力開發(fā)者打造實(shí)時(shí)互動(dòng)應(yīng)用,。
谷歌與佐治亞理工學(xué)院及Wild Dolphin Project合作,,基于巴哈馬大西洋斑點(diǎn)海豚的長期研究數(shù)據(jù)構(gòu)建了DolphinGemma模型,用于分析并生成海豚聲音,。此外,,MedGemma模型作為Gemma 3家族的新成員,專注于醫(yī)療AI領(lǐng)域,,支持臨床推理和醫(yī)學(xué)影像分析,,推動(dòng)醫(yī)療與人工智能的融合創(chuàng)新。