春節(jié)期間,中國的大模型技術(shù)迎來了一波密集更新,。阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max正式上線,,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens,在多個基準(zhǔn)測試中表現(xiàn)優(yōu)于DeepSeek V3,、Llama-3.1-405B以及閉源模型GPT-4o,。新模型發(fā)布后,阿里巴巴美股大漲6.76%,。此前一天,,通義千問還開源了全新的視覺模型Qwen2.5-VL,推出3B,、7B和72B三個尺寸版本,,能夠更準(zhǔn)確地解析圖像內(nèi)容,支持超1小時的視頻理解,,實現(xiàn)給指定朋友送祝福,、電腦修圖、手機訂票等操作,。
同樣在1月28日,,DeepSeek團隊發(fā)布了兩款多模態(tài)框架——Janus-Pro和JanusFlow。其中,,Janus-Pro是統(tǒng)一多模態(tài)理解與生成的創(chuàng)新框架,,其在圖像生成基準(zhǔn)測試中的表現(xiàn)超越了OpenAI的“文生圖”模型DALL·E 3,并選擇了開源,。
目前,,國內(nèi)外廠商在開閉源路線上各有側(cè)重。例如,,OpenAI的GPT-4模型采用閉源模式,,而Meta選擇完全開源,。其他大模型公司則將低參數(shù)量的模型開源,高參數(shù)量的模型閉源,。DeepSeek和阿里云通義團隊都是開源路線的堅持者,,此次DeepSeek的成功也被認為是開源模型的勝利。
Meta首席人工智能科學(xué)家Yann LeCun表示,,DeepSeek之所以一鳴驚人,,是因為他們從開放研究和開源中獲益。他們的工作是公開發(fā)布和開源的,,每個人都可以從中受益,,這就是開放研究和開源的力量。一位大模型青年學(xué)者也認為,,開源和閉源路線各有特色,,但開源更能促進行業(yè)發(fā)展。云基礎(chǔ)設(shè)施廠商有望受益于這次開源的勝利,,這也是阿里云通義大模型堅持開源路線的原因之一,。
在華為全聯(lián)接大會期間,,即9月19日至21日,華為與科大訊飛的合作進一步升級,,雙方在通用大模型底座的構(gòu)建及應(yīng)用落地方面展現(xiàn)出顯著進展
2024-09-24 09:47:04華為科大訊飛深化大模型合作數(shù)據(jù)是寶貴的資源,,能夠幫助投資者減少煩惱,。中國AI大模型市場正快速發(fā)展,。近日,,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 09:33:36DeepSeek出圈概念股曝光中國國產(chǎn)大模型Deepseek在硅谷引起了轟動,。從斯坦福到麻省理工,Deepseek R1幾乎一夜之間成為美國頂尖大學(xué)研究人員的首選模型
2025-01-27 15:33:19媒體揭秘國產(chǎn)大模型DeepSeek