DeepSeek發(fā)布了全球第二個(gè)推理大模型,,僅比OpenAI晚四個(gè)月。盡管雙方大模型性能相當(dāng),,但性價(jià)比相差二三十倍,,這歸功于DeepSeek的工程創(chuàng)新。然而,,這種漸進(jìn)式創(chuàng)新并不等同于從零到一的顛覆性創(chuàng)新,,有讀者對(duì)此表示失望,。其實(shí)不必失望,因?yàn)閺牧愕揭缓蛷囊坏揭话偻瑯又匾?。例如,,托馬斯·薩弗里發(fā)明了蒸汽機(jī),但詹姆斯·瓦特的重大改進(jìn)才使其普及并引發(fā)工業(yè)革命,。兩者的重要性不可忽視,。
這篇文章繼續(xù)探討創(chuàng)新規(guī)律。好奇心加上自由探索是DeepSeek創(chuàng)新的核心,。接下來將討論DeepSeek的創(chuàng)新力來源及六種代表性創(chuàng)新思想,。
DeepSeek非常低調(diào),外界對(duì)其知之甚少,,主要信息來自行業(yè)媒體《暗涌》對(duì)梁文峰的兩次專訪,。梁文峰1985年出生,2010年畢業(yè)于浙江大學(xué)信息與通信工程專業(yè)碩士,。2016年,,他創(chuàng)立了一家利用人工智能炒股的基金公司——幻方量化,賺取了豐厚利潤,。2022年11月,,OpenAI發(fā)布ChatGPT,引發(fā)了全球性的大模型浪潮,。2023年4月,,梁文峰宣布成立DeepSeek公司專注大模型開發(fā),同年5月首次接受《暗涌》專訪,。2024年5月,,DeepSeek發(fā)布V2,震動(dòng)業(yè)界,,7月第二次接受《暗涌》專訪,。
在采訪中,梁文峰強(qiáng)調(diào)創(chuàng)新首先是一種信念問題,。他認(rèn)為中國公司在過去30多年IT浪潮中基本沒有參與真正的技術(shù)創(chuàng)新,,習(xí)慣追隨而非創(chuàng)新。中國AI與美國的真正差距在于原創(chuàng)與模仿,。DeepSeek的使命是推動(dòng)技術(shù)前沿的發(fā)展,,促進(jìn)整個(gè)生態(tài)的成長。創(chuàng)新不僅是商業(yè)驅(qū)動(dòng),,還需要好奇心和創(chuàng)造的野心,。
DeepSeek團(tuán)隊(duì)成員充滿熱情和好奇心,背景各異且富有個(gè)性。他們對(duì)研究的渴望遠(yuǎn)超對(duì)金錢的關(guān)注,。招聘標(biāo)準(zhǔn)基于熱情和好奇心,,團(tuán)隊(duì)成員多為頂尖高校的應(yīng)屆生,、博士生甚至實(shí)習(xí)生以及一些有幾年經(jīng)驗(yàn)的年輕人,。
DeepSeek采用自下而上的管理模式,鼓勵(lì)自由發(fā)揮和試錯(cuò),。團(tuán)隊(duì)成員使用計(jì)算資源時(shí)不受限制,,可以隨時(shí)調(diào)用訓(xùn)練集群。公司扁平化管理,,沒有嚴(yán)格的層級(jí)架構(gòu)或部門壁壘,,團(tuán)隊(duì)成員可以自由協(xié)作。通過確保價(jià)值觀一致和企業(yè)文化來保持步調(diào)一致,,管理者以身作則,。
美國IT研究與顧問咨詢公司Gartner高級(jí)研究總監(jiān)方琦近日表示,,DeepSeek成功的關(guān)鍵在于其偏重研究的導(dǎo)向,而非追求短期盈利
2025-03-15 06:48:47DeepSeek成功的關(guān)鍵是什么本周,,中國互聯(lián)網(wǎng)上洋溢著喜悅的氣氛,。2017年,谷歌旗下“深層思維”公司戰(zhàn)勝中國頂尖圍棋選手,,展示了西方在人工智能領(lǐng)域的輝煌
2025-02-02 12:54:10一文看懂DeepSeek的中國式創(chuàng)新