DeepSeek發(fā)布了全球第二個推理大模型,僅比OpenAI晚四個月。盡管雙方大模型性能相當,,但性價比相差二三十倍,,這歸功于DeepSeek的工程創(chuàng)新。然而,,這種漸進式創(chuàng)新并不等同于從零到一的顛覆性創(chuàng)新,,有讀者對此表示失望。其實不必失望,,因為從零到一和從一到一百同樣重要,。例如,托馬斯·薩弗里發(fā)明了蒸汽機,,但詹姆斯·瓦特的重大改進才使其普及并引發(fā)工業(yè)革命,。兩者的重要性不可忽視。
這篇文章繼續(xù)探討創(chuàng)新規(guī)律,。好奇心加上自由探索是DeepSeek創(chuàng)新的核心,。接下來將討論DeepSeek的創(chuàng)新力來源及六種代表性創(chuàng)新思想。
DeepSeek非常低調,,外界對其知之甚少,,主要信息來自行業(yè)媒體《暗涌》對梁文峰的兩次專訪。梁文峰1985年出生,,2010年畢業(yè)于浙江大學信息與通信工程專業(yè)碩士,。2016年,他創(chuàng)立了一家利用人工智能炒股的基金公司——幻方量化,,賺取了豐厚利潤,。2022年11月,OpenAI發(fā)布ChatGPT,,引發(fā)了全球性的大模型浪潮,。2023年4月,梁文峰宣布成立DeepSeek公司專注大模型開發(fā),同年5月首次接受《暗涌》專訪,。2024年5月,,DeepSeek發(fā)布V2,震動業(yè)界,,7月第二次接受《暗涌》專訪,。
在采訪中,梁文峰強調創(chuàng)新首先是一種信念問題,。他認為中國公司在過去30多年IT浪潮中基本沒有參與真正的技術創(chuàng)新,,習慣追隨而非創(chuàng)新。中國AI與美國的真正差距在于原創(chuàng)與模仿,。DeepSeek的使命是推動技術前沿的發(fā)展,,促進整個生態(tài)的成長。創(chuàng)新不僅是商業(yè)驅動,,還需要好奇心和創(chuàng)造的野心,。
DeepSeek團隊成員充滿熱情和好奇心,背景各異且富有個性,。他們對研究的渴望遠超對金錢的關注,。招聘標準基于熱情和好奇心,團隊成員多為頂尖高校的應屆生,、博士生甚至實習生以及一些有幾年經驗的年輕人,。
DeepSeek采用自下而上的管理模式,鼓勵自由發(fā)揮和試錯,。團隊成員使用計算資源時不受限制,,可以隨時調用訓練集群。公司扁平化管理,,沒有嚴格的層級架構或部門壁壘,,團隊成員可以自由協(xié)作。通過確保價值觀一致和企業(yè)文化來保持步調一致,,管理者以身作則,。
11月26日下午,,廣東省十四屆人大常委會第十三次會議召開聯(lián)組會議,,討論省政府關于以科技創(chuàng)新引領現(xiàn)代產業(yè)高質量發(fā)展的工作情況
2024-11-27 22:22:25廣東科研失敗容錯機制美國IT研究與顧問咨詢公司Gartner高級研究總監(jiān)方琦近日表示,DeepSeek成功的關鍵在于其偏重研究的導向,,而非追求短期盈利
2025-03-15 06:48:47DeepSeek成功的關鍵是什么本周,,中國互聯(lián)網上洋溢著喜悅的氣氛。2017年,,谷歌旗下“深層思維”公司戰(zhàn)勝中國頂尖圍棋選手,,展示了西方在人工智能領域的輝煌
2025-02-02 12:54:10一文看懂DeepSeek的中國式創(chuàng)新