5月14日,梁文鋒及其團(tuán)隊(duì)發(fā)布了一篇14頁(yè)論文,,詳述在DeepSeek-V3的研發(fā)過(guò)程中,,如何借助2048塊H800 GPU實(shí)現(xiàn)超大規(guī)模集群等效訓(xùn)練,。人們又開(kāi)始期待R2在架構(gòu)上的繼續(xù)升級(jí),而此次R1的發(fā)布顯得比較有策略,,既回應(yīng)了用戶(hù)期待,又給自己留足了升級(jí)架構(gòu)的時(shí)間,。
DeepSeek創(chuàng)始人梁文鋒的故事廣為人知,。他從小就展現(xiàn)出數(shù)學(xué)天賦,在浙江大學(xué)本碩畢業(yè)后,,對(duì)金融產(chǎn)生了濃厚興趣,,與同學(xué)組隊(duì)探索機(jī)器學(xué)習(xí)在全自動(dòng)量化交易中的應(yīng)用,并成功賺取了人生第一桶金,。隨后,,他創(chuàng)立了幻方量化,迅速在國(guó)內(nèi)量化投資領(lǐng)域嶄露頭角,。
梁文鋒很早就注意到AI模型,,2018年榮獲中國(guó)私募行業(yè)的最高獎(jiǎng)項(xiàng)——金牛獎(jiǎng),并在頒獎(jiǎng)典禮上首次系統(tǒng)闡述AI在量化投資中的廣闊前景,。他在演講中提到:“量化投資的未來(lái),,是用技術(shù)讓市場(chǎng)更有效率?!?/p>
中國(guó)AI初創(chuàng)公司深度求索(DeepSeek)在短短一個(gè)月內(nèi)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-27 19:35:39DeepSeek為何引發(fā)全球轟動(dòng)