國內(nèi)各AI公司也在積極發(fā)力開源模型。5月29日,,DeepSeek宣布DeepSeekR1模型已完成小版本升級,,當(dāng)前版本為DeepSeek-R1-0528。該模型在數(shù)學(xué),、編程與通用邏輯等多個基準(zhǔn)測評中取得了優(yōu)異成績,,并且在整體表現(xiàn)上已接近其他國際頂尖模型。此次團(tuán)隊的開源倉庫(包括模型權(quán)重)仍然采用MIT License,,并允許用戶利用模型輸出,、通過模型蒸餾等方式訓(xùn)練其他模型。
5月14日晚,,阿里正式開源通義萬相Wan2.1-VACE,,單一模型可同時支持文生視頻、圖像參考視頻生成,、視頻重繪等多種能力,。此前,,阿里亦于4月開源新一代混合推理模型Qwen 3(千問3)。截至4月底,,阿里通義已開源200余個模型,,全球下載量超3億次,千問衍生模型數(shù)超10萬個,,成為全球最大的開源模型族群,。
智譜華章也在4月14日集中開源GLM-Z1-Air等模型,包括9B與32B尺寸,,涵蓋基座模型,、推理模型和沉思模型。這些開源模型可免費用于商業(yè)用途,、自由分發(fā),,為開發(fā)者提供了最大的使用和開發(fā)自由度。最新模型上線智譜開放平臺bigmodel后,,當(dāng)天有超過6000家企業(yè)和開發(fā)者接入,,調(diào)用tokens日增幅超100%。