讓大模型在長上下文中兼具高效與高保真度,。
DeepSeek團(tuán)隊(duì)新論文,,圖/X
這不是DeepSeek第一次發(fā)布技術(shù)論文,,第一次為業(yè)界提供一種難題的解決思路。但更重要的其實(shí)是不同于o1模型,,DeepSeek此前用R1徹底揭開了OpenAI無論如何都想藏起來的——推理類模型「算法的秘密」,,給更多人、更多廠商復(fù)制和超越o1的可能,。
過去,,大模型行業(yè)默認(rèn)接受了封閉模式——從GPT-3之后,AI技術(shù)的進(jìn)步被歸結(jié)為「資源游戲」,,更大的算力,、更貴的數(shù)據(jù)、更封閉的API,,塑造了AI的商業(yè)邏輯,。
這種邏輯一度被認(rèn)為是不可逆的,畢竟 AI 訓(xùn)練的成本極高,,封閉系統(tǒng)能確保收益最大化,,同時(shí)維持技術(shù)優(yōu)勢(shì)。但 DeepSeek R1 徹底改變了這種假設(shè),。
圖/DeepSeek
相比更早之前發(fā)布的 OpenAI o1,、Kimi k1,DeepSeek R1 不僅是作為開源模型,,而是一種全新的思維方式——它讓 AI 的「思考過程」成為透明的,,讓所有開發(fā)者都能看到推理是如何發(fā)生的,。
更重要的是,它證明了AI進(jìn)步不必依賴「算力堆疊」,,DeepSeek另辟蹊徑,,通過推理優(yōu)化,而不是純粹地算力擴(kuò)展,,重新定義AI進(jìn)步的路徑,。
這種開源路徑帶來的變化,不只是技術(shù)上的,,也是生態(tài)上的,。
在封閉體系下,企業(yè)只能被動(dòng)接受 OpenAI,、Anthropic 這樣的巨頭定價(jià),,而 DeepSeek R1 讓企業(yè)有了更低的成本、更靈活的選擇,,所有過去被封閉 AI 掌控的能力,,如今都可以在開源環(huán)境中自由演進(jìn)。
這不僅提高了AI的普及度,,也讓整個(gè)行業(yè)面臨的壁壘大幅削減,,這也是為什么我們會(huì)看到,所有廠商似乎都在接入DeepSeek,。當(dāng)然,,出于營銷目的的接入以及簡單粗暴的接入方式,也是這種變化中不可避免的一個(gè)過程,。
1月15日,,MiniMax發(fā)布了新一代01系列模型,并將其開源,。該系列包括基礎(chǔ)語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01
2025-01-15 16:15:38MiniMax發(fā)布新一代開源模型微信最近推出了一項(xiàng)重要更新,上線了“AI搜索”功能,,并開始灰度測試DeepSeek-R1模型提供的“深度思考”服務(wù)
2025-02-17 07:50:40MaaS模型即服務(wù)將要被顛覆了嗎