幾乎是一夜之間,“來(lái)自東方的神秘力量”再次震撼了海外人士,。1月27日,,由國(guó)產(chǎn)大模型公司杭州深度求索開(kāi)發(fā)的Deepseek應(yīng)用登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT,。
據(jù)界面新聞報(bào)道,,1月27日,DeepSeek官網(wǎng)顯示網(wǎng)頁(yè)/API不可用,。前一天(26日),,DeepSeek曾出現(xiàn)短時(shí)閃崩現(xiàn)象。對(duì)此,,DeepSeek回應(yīng)稱,,當(dāng)天下午確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問(wèn)題在數(shù)分鐘內(nèi)得到解決,。此次事件可能是由于新模型發(fā)布后用戶訪問(wèn)量激增,,服務(wù)器一時(shí)無(wú)法滿足大量用戶的并發(fā)需求。
Deepseek來(lái)自量化巨頭幻方量化旗下的大模型公司,。1月20日,,該公司正式發(fā)布推理大模型DeepSeek-R1。一經(jīng)推出,,這款模型便憑借其“物美價(jià)廉”的特性在海外開(kāi)發(fā)者社區(qū)中引發(fā)轟動(dòng),。今年1月20日,國(guó)務(wù)院總理李強(qiáng)主持召開(kāi)專家,、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會(huì),,聽(tīng)取對(duì)《政府工作報(bào)告(征求意見(jiàn)稿)》的意見(jiàn)建議。DeepSeek創(chuàng)始人梁文鋒參加了此次座談會(huì),。
在校期間,,梁文鋒對(duì)金融市場(chǎng)產(chǎn)生了濃厚興趣。特別是在2008年全球金融危機(jī)期間,他帶領(lǐng)團(tuán)隊(duì)探索了機(jī)器學(xué)習(xí)技術(shù)在全自動(dòng)量化交易中的應(yīng)用潛力,,為日后職業(yè)生涯奠定了基礎(chǔ),。畢業(yè)后,梁文鋒將目光轉(zhuǎn)向更廣闊的金融市場(chǎng),。2013年,,他與浙大同學(xué)徐進(jìn)共同創(chuàng)立了杭州雅克比投資管理有限公司,兩年后又成立了杭州幻方科技有限公司,,致力于通過(guò)數(shù)學(xué)和人工智能進(jìn)行量化投資,。2015年的市場(chǎng)波動(dòng)中,幻方依靠先進(jìn)的高頻量化策略取得了顯著成績(jī),。
2016年,,幻方推出了首個(gè)基于深度學(xué)習(xí)的交易模型,并實(shí)現(xiàn)了所有量化策略的AI化轉(zhuǎn)型,。2018年,,幻方確立了以AI為核心的發(fā)展戰(zhàn)略。然而,,隨著業(yè)務(wù)快速擴(kuò)展,,算力瓶頸逐漸顯現(xiàn)。為解決計(jì)算資源不足的問(wèn)題,,2019年,,梁文鋒帶領(lǐng)團(tuán)隊(duì)自主研發(fā)了“螢火一號(hào)”訓(xùn)練平臺(tái),總投資近2億元,,搭載了1100塊GPU,。兩年后,“螢火二號(hào)”的投入增加到10億元,,搭載了約1萬(wàn)張英偉達(dá)A100顯卡,。