DeepSeek的動作讓Meta的生成式AI團隊感到恐慌,。Meta CEO扎克伯格宣布加速研發(fā)Llama 4,,計劃投資650億美元擴建數據中心,并部署130萬枚GPU,,以確保2025年Meta AI成為全球領先模型,。
DeepSeek創(chuàng)始人梁文鋒迅速在AI圈內確立地位,。梁文鋒本碩均就讀于浙江大學信息與電子工程學專業(yè)。2015年,,他與校友共同創(chuàng)立幻方量化,。2021年,幻方量化成為國內首家突破千億規(guī)模的量化私募大廠,,被稱為國內量化私募“四大天王”之一。早年,,幻方量化開始大規(guī)模布局AI算力,,搭建起“螢火一號”集群,。2021年,“螢火二號”落成,,為DeepSeek提供了快速發(fā)展的基礎,。
DeepSeek團隊在預訓練方面貢獻巨大,包括超強的訓練穩(wěn)定度,、深入使用fb8混合精度,、多詞同時預測、隱空間多注意力頭,、MOE混合專家等,,大大降低了訓練成本。他們僅用600萬美元就訓練出了一個600B的大模型,,被視作工程上的奇跡,。
DeepSeek發(fā)布了新一代開源大模型DeepSeek-R1。該模型在數學,、代碼,、自然語言推理等任務上的性能與美國OpenAI公司的最新o1大模型相當
2025-01-21 22:05:22DeepSeek又有重大突破短短一個月內,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外短短一個月內,,中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型——DeepSeek-V3和DeepSeek-R1
2025-01-26 10:34:01DeepSeek讓Meta深陷恐慌硅谷正經歷由中國公司引發(fā)的重大變革,。全美都在擔憂全球人工智能的中心是否已經轉向中國,。此時,,全球范圍內掀起了復現DeepSeek模型的熱潮。正如LeCun所說:“這是開源對閉源的一次勝利
2025-01-26 16:20:37全球掀DeepSeek復現狂潮