不只是百度大模型在調(diào)整到“開源與免費”的姿態(tài)。
2月初,OpenAI CEO Sam Altman 罕見承認 OpenAI 的閉源策略站在了「錯誤的一邊」,,同時小心翼翼地放出了有限度「免費+開源」的消息。
現(xiàn)在更進一步了,,2 月 18 日,,OpenAI CEO Sam Altman 在 X 平臺(原 Twitter)上詢問網(wǎng)友:
「對于我們的下一個開源項目,是做一個相當小巧但仍然需要在GPU上運行的o3-mini級別模型更有用,,還是做我們能做的最好的手機尺寸模型,?」
也可能全都要,在手機上運行o3mini水平模型,,圖/X
毫無疑問,,結(jié)合之前 OpenAI 在 DeepSeek 沖擊下放出的一系列消息,Sam Altman 不僅官宣了「開源項目」,,也是在暗示 OpenAI 開源計劃的兩個方向,。而在過去六年,OpenAI 一直堅守封閉策略(甚至因此被網(wǎng)友稱為CloseAI),,自 GPT-2 之后再未開源任何大模型,。
背后DeepSeek帶來的壓力顯而易見。
ChatGPT 問世后,,OpenAI 在閉源模型的基礎(chǔ)上通過「API+訂閱制」構(gòu)建起強大的商業(yè)護城河,,但 DeepSeek V3 和 R1 證明了開源大模型同樣可以媲美 GPT-4o 級別的能力,并且成本更低,、可本地部署,。
面對這一挑戰(zhàn),,OpenAI再也無法對開源陣營置之不理。過去,,企業(yè)幾乎只能依賴OpenAI或Google等大模型廠商提供的封閉API,,而現(xiàn)在,越來越多公司開始直接從云計算平臺或者部署DeepSeek等開源大模型,,大幅降低AI計算成本,。
也不僅僅是OpenAI,整個AI生態(tài)都在擁抱開源,,甚至一向推崇閉源的百度也宣布下一代文心大模型4.5系列將在6月底開源,。
而僅在2月18日一天,就有多個模型宣告開源:
-昆侖萬維宣布,,開源中國首個面向AI短劇創(chuàng)作的視頻生成模型SkyReels-V1,,以及基于視頻基座模型的表情動作可控算法SkyReels-A1。
-階躍星辰和吉利汽車聯(lián)合宣布,,將開源雙方合作的視頻生成模型階躍Step-Video-T2V和語音交互大模型階躍Step-Audio,。
- 逐際動力宣布,開源基于視頻生成大模型的具身操作算法(VideoGenMotion,,簡稱 LimX VGM),。
- 在剛剛發(fā)布 Grok 3 系列模型,馬斯克旗下 xAI 宣布,,上一代大模型 Grok 2 將照例在幾個月后開源,。
Grok 3 發(fā)布直播,圖/ xAI
在DeepSeek這只“鯰魚”的影響下,,開源正在撬動整個AI生態(tài),,而一場AI產(chǎn)業(yè)的「開源革命」也已然開始。
就在短短幾個月前,,關(guān)于AI的討論還集中在GPT(OpenAI)、Claude(Anthropic)和Gemini(Google)這樣的閉源模型上,,而現(xiàn)在,,DeepSeek幾乎以一舉之力扭轉(zhuǎn)了市場的注意力,將其迅速轉(zhuǎn)向開源陣營,。
除了之前就采用不同開源策略的Llama(Meta),、通義千問Qwen(阿里巴巴)以及Grok(xAI),開源陣營也迎來了不同方向的大模型,,
騰訊和字節(jié)就在早些時候開源了各自的視頻生成模型,,也包括昆侖萬維剛剛開源的SkyReels-V1視頻模型。
不同于其他視頻模型追求的通用性,,SkyReels-V1視頻可能是首個面向AI短劇生成的開源模型,,性能上號稱是最強的圖生視頻開源模型,。
圖/昆侖萬維
與此同時,階躍星辰和吉利汽車開源了面向座艙場景的階躍 Step-Video-T2V 視頻生成模型,,以及階躍 Step-Audio 語音交互大模型。另一邊是逐際動力在視頻生成大模型打造了一套從文本到視頻,,再到機器人運動和操作的算法 LimX VGM,,并將之開源給所有機器人開發(fā)者。
這場AI競賽,,已經(jīng)遠遠超出了最初的語言模型之爭,,開源正以燎原之勢,席卷整個AI生態(tài),,也在一定程度上意味著大模型迭代的范式轉(zhuǎn)變,。
最早,OpenAI以「開源」起家,,GPT-2甚至還曾完全開放權(quán)重,。但隨后OpenAI就徹底轉(zhuǎn)向閉源,并在基于GPT-3.5打造ChatGPT后迅速以API和訂閱制建立起商業(yè)模式,。
OpenAI轉(zhuǎn)變的核心邏輯在于,,訓(xùn)練大模型需要極高的算力成本,閉源可以確保盈利,,避免開源導(dǎo)致的「免費競爭」,。而通過API形式提供AI服務(wù),而不開放底層權(quán)重,,防止競品復(fù)制其技術(shù),。
圖/OpenAI
更重要的是,通過掌控用戶交互數(shù)據(jù),,持續(xù)迭代GPT模型和ChatGPT,,并維持市場領(lǐng)先地位。但OpenAI,,終究還是忽略了開源的魔力以及最核心的技術(shù)創(chuàng)新,。
如果回顧計算機技術(shù)史,實際上我們不難發(fā)現(xiàn),,開源未必會在早期占據(jù)最有利的位置,,但往往就像滾雪球一般:
越滾越大,最終勢不可擋,。
2008年,,Google決定對Android采取開源+商業(yè)化的策略,這一決定徹底改變了移動操作系統(tǒng)格局,。當時的iOS是封閉的,,而Android通過開源吸引了三星,、華為以及小米等全球硬件廠商的支持,迅速超越iOS,,成為全球市場占有率最高的移動系統(tǒng),。
Chromium也是如此,盡管它最初只是一個開源瀏覽器引擎,,但最終幾乎吞噬了整個瀏覽器市場,,就連微軟的Edge都不得不基于Chromium內(nèi)核重建。
今天AI領(lǐng)域在經(jīng)歷同樣的變革,。
閉源AI依然能賺到錢,,但隨著DeepSeek帶來的沖擊,市場已經(jīng)開始傾向于開源大模型的路線,。一個核心在于,,開源不僅降低了AI技術(shù)門檻,也給所有開發(fā)者和企業(yè)帶來了更多自由度——API接入,、云端調(diào)用,、本地部署,甚至是基于不同需求和數(shù)據(jù)進行重新訓(xùn)練,。
而這種自由,,正是OpenAI體系下難以提供的。
還是 2 月 18 日,,DeepSeek 在 X 平臺上發(fā)布了一篇技術(shù)論文,主要內(nèi)容是提出一種名為 NSA(Natively Sparse Attention,,原生稀疏注意力)的新型注意力機制,。核心是通過對硬件的友好與端到端訓(xùn)練,取得推理,、訓(xùn)練速度和任務(wù)表現(xiàn)的綜合平衡:
讓大模型在長上下文中兼具高效與高保真度,。
DeepSeek團隊新論文,圖/X
這不是DeepSeek第一次發(fā)布技術(shù)論文,,第一次為業(yè)界提供一種難題的解決思路,。但更重要的其實是不同于o1模型,DeepSeek此前用R1徹底揭開了OpenAI無論如何都想藏起來的——推理類模型「算法的秘密」,,給更多人,、更多廠商復(fù)制和超越o1的可能。
過去,,大模型行業(yè)默認接受了封閉模式——從GPT-3之后,,AI技術(shù)的進步被歸結(jié)為「資源游戲」,更大的算力、更貴的數(shù)據(jù),、更封閉的API,,塑造了AI的商業(yè)邏輯。
這種邏輯一度被認為是不可逆的,,畢竟 AI 訓(xùn)練的成本極高,,封閉系統(tǒng)能確保收益最大化,同時維持技術(shù)優(yōu)勢,。但 DeepSeek R1 徹底改變了這種假設(shè),。
圖/DeepSeek
相比更早之前發(fā)布的 OpenAI o1、Kimi k1,,DeepSeek R1 不僅是作為開源模型,,而是一種全新的思維方式——它讓 AI 的「思考過程」成為透明的,,讓所有開發(fā)者都能看到推理是如何發(fā)生的,。
更重要的是,它證明了AI進步不必依賴「算力堆疊」,,DeepSeek另辟蹊徑,,通過推理優(yōu)化,而不是純粹地算力擴展,,重新定義AI進步的路徑,。
這種開源路徑帶來的變化,不只是技術(shù)上的,,也是生態(tài)上的,。
在封閉體系下,企業(yè)只能被動接受 OpenAI,、Anthropic 這樣的巨頭定價,,而 DeepSeek R1 讓企業(yè)有了更低的成本、更靈活的選擇,,所有過去被封閉 AI 掌控的能力,,如今都可以在開源環(huán)境中自由演進。
這不僅提高了AI的普及度,,也讓整個行業(yè)面臨的壁壘大幅削減,,這也是為什么我們會看到,所有廠商似乎都在接入DeepSeek,。當然,,出于營銷目的的接入以及簡單粗暴的接入方式,也是這種變化中不可避免的一個過程,。
就在 Sam Altman 詢問開源模型方向的推文下,,有人依舊不滿于 OpenAI 的「開源策略」,并提出至少應(yīng)該開源 GPT-4——盡管由于成本和延遲早已不是主力,但依然是非推理類模型的一流性能水平,。
R1已經(jīng)證明,,不同于閉源的AI研究,開源的方式可以通過全球協(xié)作,、技術(shù)共享,,讓整個生態(tài)的進步速度加快。未來的AI可能也不會是少數(shù)巨頭的壟斷,,而是由大量參與者共同推進的技術(shù)體系,。
而 DeepSeek R1,正是這場「開源盛世」的開端,。
從這個角度來看,,DeepSeek和R1之所以重要,并不僅僅是它的性能,,而是它所開啟的AI未來,。開源不是封閉AI的備選方案,而是一條全新的康莊大道,。
1月15日,,MiniMax發(fā)布了新一代01系列模型,,并將其開源。該系列包括基礎(chǔ)語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01
2025-01-15 16:15:38MiniMax發(fā)布新一代開源模型微信最近推出了一項重要更新,,上線了“AI搜索”功能,,并開始灰度測試DeepSeek-R1模型提供的“深度思考”服務(wù)
2025-02-17 07:50:40MaaS模型即服務(wù)將要被顛覆了嗎