春節(jié)期間,中國的大模型技術(shù)迎來了一波密集更新,。阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max正式上線,,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,在多個基準(zhǔn)測試中表現(xiàn)優(yōu)于DeepSeek V3,、Llama-3.1-405B以及閉源模型GPT-4o,。新模型發(fā)布后,阿里巴巴美股大漲6.76%,。此前一天,,通義千問還開源了全新的視覺模型Qwen2.5-VL,,推出3B,、7B和72B三個尺寸版本,,能夠更準(zhǔn)確地解析圖像內(nèi)容,支持超1小時的視頻理解,,實現(xiàn)給指定朋友送祝福,、電腦修圖、手機訂票等操作,。
同樣在1月28日,,DeepSeek團隊發(fā)布了兩款多模態(tài)框架——Janus-Pro和JanusFlow。其中,,Janus-Pro是統(tǒng)一多模態(tài)理解與生成的創(chuàng)新框架,,其在圖像生成基準(zhǔn)測試中的表現(xiàn)超越了OpenAI的“文生圖”模型DALL·E 3,,并選擇了開源,。
目前,國內(nèi)外廠商在開閉源路線上各有側(cè)重,。例如,,OpenAI的GPT-4模型采用閉源模式,而Meta選擇完全開源,。其他大模型公司則將低參數(shù)量的模型開源,,高參數(shù)量的模型閉源。DeepSeek和阿里云通義團隊都是開源路線的堅持者,,此次DeepSeek的成功也被認(rèn)為是開源模型的勝利,。
Meta首席人工智能科學(xué)家Yann LeCun表示,DeepSeek之所以一鳴驚人,,是因為他們從開放研究和開源中獲益,。他們的工作是公開發(fā)布和開源的,每個人都可以從中受益,,這就是開放研究和開源的力量,。一位大模型青年學(xué)者也認(rèn)為,,開源和閉源路線各有特色,但開源更能促進行業(yè)發(fā)展,。云基礎(chǔ)設(shè)施廠商有望受益于這次開源的勝利,,這也是阿里云通義大模型堅持開源路線的原因之一。
除了基礎(chǔ)模型的更新,,各色AI應(yīng)用也成為廠商比拼的焦點,。百度智能云曦靈數(shù)字人推出了“飛帖賀新春”微信小程序功能,用戶上傳一張自己的照片即可快速生成數(shù)字人拜年視頻,。阿里云作為央視春晚云計算AI獨家合作伙伴,,為春晚直播提供了云基礎(chǔ)設(shè)施和通義大模型AI技術(shù)支持,利用通義萬相的AI生成能力制作了《在歲月里的花》,、《方的言》,、《難忘今宵》等歌曲的舞美畫面。宇樹科技的人形機器人H1也在春晚上表演扭秧歌,,展示了AI驅(qū)動全身運動控制技術(shù),。今年央視第四次開展8K春晚直播,“8K超高清+三維菁彩聲”公共信號全部采用國產(chǎn)裝備完成制作,,科創(chuàng)板上市公司當(dāng)虹科技為其提供了技術(shù)支持,,通過“百城千屏”超高清傳播平臺,把8K畫面呈現(xiàn)在全國上百個城市,、近千塊公共大屏上,。
在華為全聯(lián)接大會期間,即9月19日至21日,,華為與科大訊飛的合作進一步升級,,雙方在通用大模型底座的構(gòu)建及應(yīng)用落地方面展現(xiàn)出顯著進展
2024-09-24 09:47:04華為科大訊飛深化大模型合作明天是春節(jié)小長假的最后一天。今天中午開始,,G40滬陜高速長江大橋往市區(qū)方向出現(xiàn)了緩行情況,。到了17時20分,長江大橋上的返程車流變得非常密集
2025-02-04 15:34:19直擊春節(jié)返程潮中國國產(chǎn)大模型Deepseek在硅谷引起了轟動,。從斯坦福到麻省理工,,Deepseek R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型
2025-01-27 15:33:19媒體揭秘國產(chǎn)大模型DeepSeek數(shù)據(jù)是寶貴的資源,,能夠幫助投資者減少煩惱。中國AI大模型市場正快速發(fā)展,。近日,,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 09:33:36DeepSeek出圈概念股曝光