國內(nèi)各AI公司也在積極發(fā)力開源模型,。5月29日,DeepSeek宣布DeepSeekR1模型已完成小版本升級,,當(dāng)前版本為DeepSeek-R1-0528,。該模型在數(shù)學(xué)、編程與通用邏輯等多個(gè)基準(zhǔn)測評中取得了優(yōu)異成績,,并且在整體表現(xiàn)上已接近其他國際頂尖模型,。此次團(tuán)隊(duì)的開源倉庫(包括模型權(quán)重)仍然采用MIT License,并允許用戶利用模型輸出,、通過模型蒸餾等方式訓(xùn)練其他模型,。
5月14日晚,阿里正式開源通義萬相Wan2.1-VACE,,單一模型可同時(shí)支持文生視頻,、圖像參考視頻生成、視頻重繪等多種能力,。此前,,阿里亦于4月開源新一代混合推理模型Qwen 3(千問3)。截至4月底,,阿里通義已開源200余個(gè)模型,,全球下載量超3億次,千問衍生模型數(shù)超10萬個(gè),,成為全球最大的開源模型族群,。
智譜華章也在4月14日集中開源GLM-Z1-Air等模型,包括9B與32B尺寸,,涵蓋基座模型,、推理模型和沉思模型。這些開源模型可免費(fèi)用于商業(yè)用途,、自由分發(fā),,為開發(fā)者提供了最大的使用和開發(fā)自由度,。最新模型上線智譜開放平臺bigmodel后,當(dāng)天有超過6000家企業(yè)和開發(fā)者接入,,調(diào)用tokens日增幅超100%,。