谷歌DeepMind團(tuán)隊(duì)于5月27日宣布推出SignGemma,,這是其迄今為止最強(qiáng)大的手語(yǔ)翻譯模型,,能夠?qū)⑹终Z(yǔ)轉(zhuǎn)化為口語(yǔ)文本,。該開(kāi)源模型計(jì)劃在今年晚些時(shí)候加入Gemma模型家族,。SignGemma支持多語(yǔ)言功能,,但目前主要針對(duì)美國(guó)手語(yǔ)(ASL)和英語(yǔ)進(jìn)行了深度優(yōu)化,,開(kāi)發(fā)者可以自由使用并改進(jìn)它,。
DeepMind希望通過(guò)這項(xiàng)技術(shù)幫助手語(yǔ)使用者克服溝通障礙,,在工作,、學(xué)習(xí)和社交中更加順暢地參與。今年,,DeepMind還推出了Gemma 3n模型,,可以從音頻、圖像,、視頻及文本輸入生成智能文本,,助力開(kāi)發(fā)者打造實(shí)時(shí)互動(dòng)應(yīng)用。
谷歌與佐治亞理工學(xué)院及Wild Dolphin Project合作,,基于巴哈馬大西洋斑點(diǎn)海豚的長(zhǎng)期研究數(shù)據(jù)構(gòu)建了DolphinGemma模型,,用于分析并生成海豚聲音。此外,,MedGemma模型作為Gemma 3家族的新成員,,專注于醫(yī)療AI領(lǐng)域,支持臨床推理和醫(yī)學(xué)影像分析,,推動(dòng)醫(yī)療與人工智能的融合創(chuàng)新,。