Sun的研究團(tuán)隊(duì)對(duì)R1進(jìn)行了初步測(cè)試,,結(jié)果顯示它在生物信息學(xué),、計(jì)算化學(xué)和認(rèn)知神經(jīng)科學(xué)等領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)任務(wù)中表現(xiàn)良好。兩種模型都正確解決了約三分之一的任務(wù),但R1的成本僅為o1的1/13,,雖然思考速度較慢。
在數(shù)學(xué)領(lǐng)域,,牛津大學(xué)的Frieder Simon發(fā)現(xiàn)R1在抽象泛函分析中的證明比o1更具前景,。但他也指出,研究人員需要具備分辨證明質(zhì)量的能力,,因?yàn)檫@些模型可能會(huì)犯錯(cuò),。
R1受到廣泛關(guān)注的原因之一是其以“開放權(quán)重”形式發(fā)布,這意味著其算法連接可供繼續(xù)使用,??茖W(xué)家可以通過微調(diào)提高其在特定領(lǐng)域的性能。孫教授表示,,只要有合適的數(shù)據(jù)集,,研究人員可以訓(xùn)練模型以改進(jìn)特定科學(xué)過程的編碼任務(wù)。
能夠下載并部署R1到本地系統(tǒng)也有助于保護(hù)隱私,,特別是在涉及敏感數(shù)據(jù)的醫(yī)學(xué)研究中,。舊金山人工智能公司Anthropic的聯(lián)合創(chuàng)始人Jack Clark表示,DeepSeek展示了改進(jìn)其他模型的方法,,通過將其推理能力傳授給其他大型語(yǔ)言模型,,例如Meta的Llama。
研究人員也在應(yīng)用強(qiáng)化學(xué)習(xí)技術(shù)來(lái)改進(jìn)具體任務(wù),。Lu去年參與創(chuàng)建了一個(gè)名為“AI Scientist”的模型,,該模型可以執(zhí)行從文獻(xiàn)掃描到撰寫論文的一系列研究任務(wù)。通過定義適當(dāng)?shù)莫?jiǎng)勵(lì)信號(hào),,科學(xué)家可以針對(duì)任何目標(biāo)訓(xùn)練模型,。
然而,DeepSeek-R1并非完美無(wú)缺,。例如,,在一些簡(jiǎn)單的任務(wù)上,,如計(jì)算包含字母W的美國(guó)州名數(shù)量時(shí),聊天機(jī)器人DeepThink未能成功完成,。與其他中國(guó)模型一樣,,R1拒絕回答政治敏感問題,但尚不清楚這是內(nèi)置限制還是界面設(shè)置所致,。
人工智能大語(yǔ)言模型的智慧通常與其接受的訓(xùn)練數(shù)據(jù)量成正比,,越多的數(shù)據(jù)往往造就更“聰明”的模型
2024-07-29 15:35:30Nature封面:AI訓(xùn)AI