春節(jié)期間,,中國(guó)的大模型技術(shù)迎來(lái)了一波密集更新,。阿里云通義千問(wèn)超大規(guī)模的MoE模型Qwen2.5-Max正式上線,預(yù)訓(xùn)練數(shù)據(jù)超過(guò)20萬(wàn)億tokens,在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于DeepSeek V3,、Llama-3.1-405B以及閉源模型GPT-4o,。新模型發(fā)布后,阿里巴巴美股大漲6.76%,。此前一天,,通義千問(wèn)還開(kāi)源了全新的視覺(jué)模型Qwen2.5-VL,推出3B,、7B和72B三個(gè)尺寸版本,,能夠更準(zhǔn)確地解析圖像內(nèi)容,支持超1小時(shí)的視頻理解,,實(shí)現(xiàn)給指定朋友送祝福,、電腦修圖、手機(jī)訂票等操作,。
同樣在1月28日,,DeepSeek團(tuán)隊(duì)發(fā)布了兩款多模態(tài)框架——Janus-Pro和JanusFlow。其中,,Janus-Pro是統(tǒng)一多模態(tài)理解與生成的創(chuàng)新框架,,其在圖像生成基準(zhǔn)測(cè)試中的表現(xiàn)超越了OpenAI的“文生圖”模型DALL·E 3,并選擇了開(kāi)源,。
目前,,國(guó)內(nèi)外廠商在開(kāi)閉源路線上各有側(cè)重。例如,,OpenAI的GPT-4模型采用閉源模式,,而Meta選擇完全開(kāi)源。其他大模型公司則將低參數(shù)量的模型開(kāi)源,,高參數(shù)量的模型閉源,。DeepSeek和阿里云通義團(tuán)隊(duì)都是開(kāi)源路線的堅(jiān)持者,此次DeepSeek的成功也被認(rèn)為是開(kāi)源模型的勝利,。
Meta首席人工智能科學(xué)家Yann LeCun表示,,DeepSeek之所以一鳴驚人,是因?yàn)樗麄儚拈_(kāi)放研究和開(kāi)源中獲益,。他們的工作是公開(kāi)發(fā)布和開(kāi)源的,,每個(gè)人都可以從中受益,這就是開(kāi)放研究和開(kāi)源的力量,。一位大模型青年學(xué)者也認(rèn)為,,開(kāi)源和閉源路線各有特色,但開(kāi)源更能促進(jìn)行業(yè)發(fā)展,。云基礎(chǔ)設(shè)施廠商有望受益于這次開(kāi)源的勝利,,這也是阿里云通義大模型堅(jiān)持開(kāi)源路線的原因之一,。
除了基礎(chǔ)模型的更新,各色AI應(yīng)用也成為廠商比拼的焦點(diǎn),。百度智能云曦靈數(shù)字人推出了“飛帖賀新春”微信小程序功能,,用戶上傳一張自己的照片即可快速生成數(shù)字人拜年視頻。阿里云作為央視春晚云計(jì)算AI獨(dú)家合作伙伴,,為春晚直播提供了云基礎(chǔ)設(shè)施和通義大模型AI技術(shù)支持,,利用通義萬(wàn)相的AI生成能力制作了《在歲月里的花》、《方的言》,、《難忘今宵》等歌曲的舞美畫面,。宇樹科技的人形機(jī)器人H1也在春晚上表演扭秧歌,展示了AI驅(qū)動(dòng)全身運(yùn)動(dòng)控制技術(shù),。今年央視第四次開(kāi)展8K春晚直播,,“8K超高清+三維菁彩聲”公共信號(hào)全部采用國(guó)產(chǎn)裝備完成制作,科創(chuàng)板上市公司當(dāng)虹科技為其提供了技術(shù)支持,,通過(guò)“百城千屏”超高清傳播平臺(tái),,把8K畫面呈現(xiàn)在全國(guó)上百個(gè)城市、近千塊公共大屏上,。