DeepSeek上周發(fā)布了開源模型DeepSeek-R1,并聲稱其性能可以與OpenAI的o1正式版相媲美,這一消息在海外AI業(yè)界引發(fā)了廣泛討論,。焦點在于,當(dāng)開源模型的能力達(dá)到甚至超越最新的閉源模型時,,可能會改變整個大模型的競爭格局。
根據(jù)DeepSeek的介紹,,DeepSeek-R1在Codeforces,、GPQA Diamond,、MATH-500、MMLU,、SWE-bench Verified等測試中的得分接近或超過o1正式版,。該模型在后訓(xùn)練階段大規(guī)模應(yīng)用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有少量標(biāo)注數(shù)據(jù)的情況下顯著提升了推理能力,。
Meta首席AI科學(xué)家Yann Lecun認(rèn)為,,DeepSeek-R1的發(fā)布意味著開源大模型正在超越閉源模型,而不是單純地表明中國公司在AI領(lǐng)域超越美國公司,。他表示,,DeepSeek將從開放研究和開源中受益,類似于Meta的PyTorch和Llama,。通過提出新想法并在他人工作的基礎(chǔ)上進(jìn)行實現(xiàn),由于這些工作是公開和開源的,,每個人都能從中獲益,,這就是開放研究和開源的力量。
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)發(fā)布了兩款大模型:DeepSeek-V3和DeepSeek-R1
2025-01-26 15:51:02DeepSeek新模型火到海外中國AI大模型市場規(guī)模正在快速發(fā)展。近日,,量化巨頭幻方量化旗下公司DeepSeek發(fā)布了推理大模型DeepSeek-R1
2025-01-27 08:58:14震動科技界