R1受到廣泛關(guān)注的原因之一是其以“開(kāi)放權(quán)重”形式發(fā)布,,這意味著其算法連接可供繼續(xù)使用,。科學(xué)家可以通過(guò)微調(diào)提高其在特定領(lǐng)域的性能,。孫教授表示,,只要有合適的數(shù)據(jù)集,,研究人員可以訓(xùn)練模型以改進(jìn)特定科學(xué)過(guò)程的編碼任務(wù)。
能夠下載并部署R1到本地系統(tǒng)也有助于保護(hù)隱私,,特別是在涉及敏感數(shù)據(jù)的醫(yī)學(xué)研究中,。舊金山人工智能公司Anthropic的聯(lián)合創(chuàng)始人Jack Clark表示,DeepSeek展示了改進(jìn)其他模型的方法,,通過(guò)將其推理能力傳授給其他大型語(yǔ)言模型,,例如Meta的Llama。
研究人員也在應(yīng)用強(qiáng)化學(xué)習(xí)技術(shù)來(lái)改進(jìn)具體任務(wù),。Lu去年參與創(chuàng)建了一個(gè)名為“AI Scientist”的模型,該模型可以執(zhí)行從文獻(xiàn)掃描到撰寫(xiě)論文的一系列研究任務(wù),。通過(guò)定義適當(dāng)?shù)莫?jiǎng)勵(lì)信號(hào),,科學(xué)家可以針對(duì)任何目標(biāo)訓(xùn)練模型。
然而,,DeepSeek-R1并非完美無(wú)缺,。例如,在一些簡(jiǎn)單的任務(wù)上,,如計(jì)算包含字母W的美國(guó)州名數(shù)量時(shí),,聊天機(jī)器人DeepThink未能成功完成。與其他中國(guó)模型一樣,,R1拒絕回答政治敏感問(wèn)題,,但尚不清楚這是內(nèi)置限制還是界面設(shè)置所致。