DeepSeek宣布在開源周第三天開源了DeepGEMM,。這是一個專為簡潔高效的FP8通用矩陣乘法(GEMM)設(shè)計的庫,,具備細粒度縮放功能。DeepGEMM支持普通和混合專家(MoE)分組的GEMM,,采用CUDA編寫,,在安裝過程中無需編譯,而是通過輕量級的即時編譯(JIT)模塊在運行時編譯所有內(nèi)核,。該庫為V3/R1訓(xùn)練和推理提供了支持,。
北京時間2月27日10點5分,,DeepSeek發(fā)布了其“開源周”第四日的內(nèi)容,包括優(yōu)化的并行策略
2025-02-27 14:05:06DeepSeek宣布開源優(yōu)化并行策略每經(jīng)AI快訊,,2月28日,,DeepSeek開源周第五天,DeepSeek在官方X賬號宣布開源3FS,,它是所有Deepseek數(shù)據(jù)訪問的助推器
2025-02-28 11:52:14DeepSeek開源周第五天DeepSeek發(fā)布了新一代開源大模型DeepSeek-R1。該模型在數(shù)學(xué),、代碼,、自然語言推理等任務(wù)上的性能與美國OpenAI公司的最新o1大模型相當
2025-01-21 22:05:22DeepSeek又有重大突破