DeepSeek創(chuàng)始人梁文鋒迅速在AI圈內(nèi)確立地位,。梁文鋒本碩均就讀于浙江大學(xué)信息與電子工程學(xué)專(zhuān)業(yè)。2015年,,他與校友共同創(chuàng)立幻方量化,。2021年,幻方量化成為國(guó)內(nèi)首家突破千億規(guī)模的量化私募大廠(chǎng),,被稱(chēng)為國(guó)內(nèi)量化私募“四大天王”之一,。早年,幻方量化開(kāi)始大規(guī)模布局AI算力,,搭建起“螢火一號(hào)”集群,。2021年,“螢火二號(hào)”落成,,為DeepSeek提供了快速發(fā)展的基礎(chǔ),。
DeepSeek團(tuán)隊(duì)在預(yù)訓(xùn)練方面貢獻(xiàn)巨大,包括超強(qiáng)的訓(xùn)練穩(wěn)定度,、深入使用fb8混合精度,、多詞同時(shí)預(yù)測(cè)、隱空間多注意力頭,、MOE混合專(zhuān)家等,,大大降低了訓(xùn)練成本。他們僅用600萬(wàn)美元就訓(xùn)練出了一個(gè)600B的大模型,,被視作工程上的奇跡,。
分析人士指出,DeepSeek用較低的成本訓(xùn)練出比肩OpenAI o1水平的模型R1,,而且R1還開(kāi)源,,這意味著算法有很大的提升空間,不需要那么多GPU和算力,。封鎖芯片和搞算力壁壘的思路行不通,,而依賴(lài)大量GPU堆砌效果的模式也受到挑戰(zhàn)。DeepSeek的出現(xiàn)可能導(dǎo)致許多購(gòu)買(mǎi)了數(shù)千塊NVIDIA芯片的AI初創(chuàng)公司破產(chǎn),,從而導(dǎo)致大量NVIDIA GPU流入二手市場(chǎng),。此外,一些運(yùn)營(yíng)數(shù)據(jù)中心并出租NVIDIA GPU的初創(chuàng)公司也可能受到影響,。
這可能刺激更多專(zhuān)用推理模型誕生,,創(chuàng)業(yè)公司和個(gè)人App可能會(huì)大幅減少在OpenAI API上的支出,轉(zhuǎn)向開(kāi)源,。評(píng)論人士稱(chēng),,DeepSeek整合搜索信息的能力強(qiáng)于某些現(xiàn)有模型,讓人對(duì)英偉達(dá)股價(jià)產(chǎn)生懷疑,。中美科技底層差距雖然大,,但中國(guó)擁有巨大的人才紅利,,有超過(guò)6000萬(wàn)工程師,超過(guò)美德日韓印總和,,這是繼續(xù)發(fā)展的底氣和希望,。
消息人士稱(chēng),,索尼早在數(shù)年前便啟動(dòng)了下一代游戲主機(jī)PS6的芯片招標(biāo)程序,,博通等公司被淘汰后,英特爾與AMD是最后兩位入圍決賽圈的選手,。
2024-09-18 13:43:03AMD擊敗Intel獲PS6芯片合同