2016年,,幻方推出了首個基于深度學(xué)習(xí)的交易模型,,并實現(xiàn)了所有量化策略的AI化轉(zhuǎn)型,。2018年,,幻方確立了以AI為核心的發(fā)展戰(zhàn)略,。然而,,隨著業(yè)務(wù)快速擴(kuò)展,,算力瓶頸逐漸顯現(xiàn),。為解決計算資源不足的問題,,2019年,,梁文鋒帶領(lǐng)團(tuán)隊自主研發(fā)了“螢火一號”訓(xùn)練平臺,總投資近2億元,,搭載了1100塊GPU,。兩年后,“螢火二號”的投入增加到10億元,,搭載了約1萬張英偉達(dá)A100顯卡,。
2021年,幻方的資產(chǎn)管理規(guī)模突破千億大關(guān),,躋身國內(nèi)量化私募領(lǐng)域的前列,。2023年,梁文鋒宣布進(jìn)軍通用人工智能領(lǐng)域,,并創(chuàng)辦了深度求索DeepSeek,,專注于做真正人類級別的人工智能。2024年5月,,DeepSeek發(fā)布混合專家語言模型DeepSeek-V2,。同年12月,DeepSeek-V3問世,,這款性能優(yōu)越且性價比極高的大語言模型被硅谷同行譽(yù)為“來自東方的神秘力量”,。
DeepSeek之所以受到關(guān)注,在于DeepSeek-V3極大地降低了大模型訓(xùn)練和應(yīng)用的成本,。DeepSeek-V3訓(xùn)練成本僅557.6萬美元,,而OpenAI訓(xùn)練ChatGPT-4o所花費(fèi)的成本高達(dá)7800萬美元甚至是1億美元,雙方的成本差距至少是10倍,。在性能上,DeepSeek-V3在數(shù)學(xué),、代碼能力和中文知識問答方面超過了ChatGPT-4o,,行業(yè)震驚于這一性價比,DeepSeek-V3開源給全世界的技術(shù)開發(fā)團(tuán)隊,。