DeepSeek創(chuàng)始人17歲上浙大國(guó)產(chǎn)AI崛起震撼海外

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-28 09:41:03 每日經(jīng)濟(jì)新聞

幾乎是一夜之間，“來(lái)自東方的神秘力量”再次震撼了海外人士,。1月27日,，由國(guó)產(chǎn)大模型公司杭州深度求索開發(fā)的Deepseek應(yīng)用登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,，在美區(qū)下載榜上超越了ChatGPT。

據(jù)界面新聞報(bào)道,，1月27日,，DeepSeek官網(wǎng)顯示網(wǎng)頁(yè)/API不可用。前一天（26日）,，DeepSeek曾出現(xiàn)短時(shí)閃崩現(xiàn)象,。對(duì)此,，DeepSeek回應(yīng)稱,，當(dāng)天下午確實(shí)出現(xiàn)了局部服務(wù)波動(dòng)，但問(wèn)題在數(shù)分鐘內(nèi)得到解決,。此次事件可能是由于新模型發(fā)布后用戶訪問(wèn)量激增,，服務(wù)器一時(shí)無(wú)法滿足大量用戶的并發(fā)需求。

Deepseek來(lái)自量化巨頭幻方量化旗下的大模型公司,。1月20日,，該公司正式發(fā)布推理大模型DeepSeek-R1。一經(jīng)推出,，這款模型便憑借其“物美價(jià)廉”的特性在海外開發(fā)者社區(qū)中引發(fā)轟動(dòng),。今年1月20日，國(guó)務(wù)院總理李強(qiáng)主持召開專家,、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會(huì),，聽取對(duì)《政府工作報(bào)告（征求意見稿）》的意見建議。DeepSeek創(chuàng)始人梁文鋒參加了此次座談會(huì),。

在校期間,，梁文鋒對(duì)金融市場(chǎng)產(chǎn)生了濃厚興趣。特別是在2008年全球金融危機(jī)期間,，他帶領(lǐng)團(tuán)隊(duì)探索了機(jī)器學(xué)習(xí)技術(shù)在全自動(dòng)量化交易中的應(yīng)用潛力,，為日后職業(yè)生涯奠定了基礎(chǔ)。畢業(yè)后,，梁文鋒將目光轉(zhuǎn)向更廣闊的金融市場(chǎng),。2013年，他與浙大同學(xué)徐進(jìn)共同創(chuàng)立了杭州雅克比投資管理有限公司,，兩年后又成立了杭州幻方科技有限公司,，致力于通過(guò)數(shù)學(xué)和人工智能進(jìn)行量化投資。2015年的市場(chǎng)波動(dòng)中,，幻方依靠先進(jìn)的高頻量化策略取得了顯著成績(jī),。

2016年，幻方推出了首個(gè)基于深度學(xué)習(xí)的交易模型,，并實(shí)現(xiàn)了所有量化策略的AI化轉(zhuǎn)型,。2018年,，幻方確立了以AI為核心的發(fā)展戰(zhàn)略。然而,，隨著業(yè)務(wù)快速擴(kuò)展,，算力瓶頸逐漸顯現(xiàn)。為解決計(jì)算資源不足的問(wèn)題,，2019年,，梁文鋒帶領(lǐng)團(tuán)隊(duì)自主研發(fā)了“螢火一號(hào)”訓(xùn)練平臺(tái)，總投資近2億元,，搭載了1100塊GPU,。兩年后，“螢火二號(hào)”的投入增加到10億元,，搭載了約1萬(wàn)張英偉達(dá)A100顯卡,。

2021年，幻方的資產(chǎn)管理規(guī)模突破千億大關(guān),，躋身國(guó)內(nèi)量化私募領(lǐng)域的前列,。2023年，梁文鋒宣布進(jìn)軍通用人工智能領(lǐng)域,，并創(chuàng)辦了深度求索DeepSeek,，專注于做真正人類級(jí)別的人工智能。2024年5月,，DeepSeek發(fā)布混合專家語(yǔ)言模型DeepSeek-V2,。同年12月，DeepSeek-V3問(wèn)世,，這款性能優(yōu)越且性價(jià)比極高的大語(yǔ)言模型被硅谷同行譽(yù)為“來(lái)自東方的神秘力量”,。

DeepSeek之所以受到關(guān)注，在于DeepSeek-V3極大地降低了大模型訓(xùn)練和應(yīng)用的成本,。DeepSeek-V3訓(xùn)練成本僅557.6萬(wàn)美元,，而OpenAI訓(xùn)練ChatGPT-4o所花費(fèi)的成本高達(dá)7800萬(wàn)美元甚至是1億美元，雙方的成本差距至少是10倍,。在性能上,，DeepSeek-V3在數(shù)學(xué)、代碼能力和中文知識(shí)問(wèn)答方面超過(guò)了ChatGPT-4o,，行業(yè)震驚于這一性價(jià)比,，DeepSeek-V3開源給全世界的技術(shù)開發(fā)團(tuán)隊(duì)。

在團(tuán)隊(duì)配置上,，DeepSeek團(tuán)隊(duì)只有139名研發(fā)人員,，而ChatGPT的OpenAI團(tuán)隊(duì)有1200名研究人員，團(tuán)隊(duì)規(guī)模是DeepSeek的近乎9倍,。近期熱門話題“雷軍千萬(wàn)年薪挖95后天才AI少女”,，這位AI少女就是DeepSeek團(tuán)隊(duì)的研發(fā)人員,，但小米和當(dāng)事人并未就此回應(yīng)。

通過(guò)招聘網(wǎng)站注意到,，深度求索公司的北京子公司正在招人,，共放出了52個(gè)崗位，包括深度學(xué)習(xí)研究員,、核心系統(tǒng)研發(fā)工程師以及資深UI設(shè)計(jì)師等,，均為14薪。其中,，薪資最高的為核心系統(tǒng)研發(fā)工程師（校招）,，薪資范圍為6萬(wàn)元-9萬(wàn)元；除此之外,，大部分崗位的起薪在2萬(wàn)元及以上,。值得一提的是，該公司正在招聘實(shí)習(xí)生,，AGI大模型實(shí)習(xí)生的工資為500元/天-1000元/天，數(shù)據(jù)百曉生實(shí)習(xí)生為500元/天-510元/天,。

1月27日,，DeepSeek概念股表現(xiàn)強(qiáng)勢(shì)，每日互動(dòng),、華金資本,、浙江東方漲停，并行科技,、卓創(chuàng)資訊,、拓爾思等漲幅居前。消息面上,，此前AMD宣布已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,，該模型旨在與SGLang一起實(shí)現(xiàn)最佳性能。華經(jīng)產(chǎn)業(yè)研究院報(bào)告顯示,，2023年國(guó)內(nèi)智能體市場(chǎng)規(guī)模達(dá)59.81億元,，預(yù)計(jì)2024年突破百億元。中國(guó)工程院院士鄔賀銓表示,，2025年不僅是智能體的元年,，也將是AI終端的元年。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

DeepSeek創(chuàng)始人17歲上浙大 國(guó)產(chǎn)AI崛起震撼海外

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek創(chuàng)始人17歲上浙大國(guó)產(chǎn)AI崛起震撼海外