在人工智能領(lǐng)域,一場激烈的競爭正在上演。去年12月,,國內(nèi)大模型公司“深度求索”推出的DeepSeek-V3以極低的訓(xùn)練成本實現(xiàn)了與GPT-4等頂尖模型相媲美的性能,,震驚了業(yè)界。不到一個月后,,DeepSeek再次震動全球AI圈,。
隨著新模型DeepSeek-R1的推出,1月27日,,Deepseek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費APP下載排行榜,,在美區(qū)下載榜上超越了ChatGPT。這一消息引起了廣大用戶對這款新興應(yīng)用的興趣,。DeepSeek的創(chuàng)始人梁文鋒也逐漸受到外界關(guān)注,。梁文鋒1985年出生于廣東省湛江市,17歲考入浙江大學(xué),。此外,,中國還有兩位AI領(lǐng)域的杰出人物也是廣東人:Kimi創(chuàng)始人楊植麟來自廣東汕頭,人工智能科學(xué)家何愷明來自廣東廣州,。
業(yè)內(nèi)稱梁文鋒是“極致的80后技術(shù)理想主義者”,,他每天的生活就是看論文,、寫代碼和參與小組討論。2002年,,梁文鋒考入浙江大學(xué)電子信息工程專業(yè),,并于2010年獲得信息與通信工程碩士學(xué)位。在校期間,,他對金融市場產(chǎn)生了濃厚興趣,,尤其是在2008年全球金融危機時,他帶領(lǐng)團隊探索了機器學(xué)習(xí)技術(shù)在全自動量化交易中的應(yīng)用潛力,,為日后職業(yè)生涯奠定了基礎(chǔ),。
畢業(yè)后,梁文鋒將目光轉(zhuǎn)向更廣闊的金融市場,。2013年,,他與浙大同學(xué)徐進共同創(chuàng)立了杭州雅克比投資管理有限公司,兩年后又成立了杭州幻方科技有限公司,,致力于通過數(shù)學(xué)和人工智能進行量化投資,。2015年的市場波動中,幻方依靠先進的高頻量化策略取得了顯著成績,。
2016年,,幻方推出了首個基于深度學(xué)習(xí)的交易模型,并實現(xiàn)了所有量化策略的AI化轉(zhuǎn)型,。2018年,,幻方正式確立了以AI為核心的發(fā)展戰(zhàn)略。隨著業(yè)務(wù)擴展,,算力瓶頸顯現(xiàn),。2019年,梁文鋒帶領(lǐng)團隊自主研發(fā)了“螢火一號”訓(xùn)練平臺,,總投資近2億元,,搭載了1100塊GPU。兩年后,,“螢火二號”的投入增加到10億元,,搭載了約1萬張英偉達A100顯卡。