科學家們對DeepSeek-R1表現出濃厚興趣,,這是一種價格低廉但功能強大的人工智能推理模型。自一家中國公司上周發(fā)布以來,美國股市因此出現上漲,。測試表明,DeepSeek-R1在解決數學和科學問題方面與OpenAI于9月發(fā)布的o1模型相當,。
盡管R1在某些任務上仍有不足,,但它為全球科學家提供了訓練定制推理模型的機會。俄亥俄州立大學的人工智能研究員Huan Sun表示,,由于其出色的性能和低成本,,更多科學家可以在日常研究中嘗試大型語言模型,而不必擔心成本,。她還提到幾乎所有從事人工智能工作的同事都在討論這個模型,。
對于研究人員來說,R1的低成本和開放性可能帶來巨大變革,。他們可以通過應用程序編程接口以較低成本查詢該模型,,或者免費使用其在線聊天機器人DeepThink。此外,,還可以將模型下載到自己的服務器上并免費運行和構建,,這在競爭對手的封閉模型如o1中是不可能實現的。
溫哥華不列顛哥倫比亞大學的人工智能研究員Cong Lu表示,,自1月20日R1推出以來,,許多研究人員一直在探索如何基于R1訓練自己的推理模型。Hugging Face的數據支持了這一點,,一周內記錄了超過300萬次不同版本的R1下載,。
Sun的研究團隊對R1進行了初步測試,結果顯示它在生物信息學,、計算化學和認知神經科學等領域的數據驅動任務中表現良好,。兩種模型都正確解決了約三分之一的任務,但R1的成本僅為o1的1/13,,雖然思考速度較慢,。
在數學領域,牛津大學的Frieder Simon發(fā)現R1在抽象泛函分析中的證明比o1更具前景,。但他也指出,,研究人員需要具備分辨證明質量的能力,,因為這些模型可能會犯錯。
R1受到廣泛關注的原因之一是其以“開放權重”形式發(fā)布,,這意味著其算法連接可供繼續(xù)使用,。科學家可以通過微調提高其在特定領域的性能,。孫教授表示,,只要有合適的數據集,研究人員可以訓練模型以改進特定科學過程的編碼任務,。
能夠下載并部署R1到本地系統(tǒng)也有助于保護隱私,,特別是在涉及敏感數據的醫(yī)學研究中。舊金山人工智能公司Anthropic的聯合創(chuàng)始人Jack Clark表示,,DeepSeek展示了改進其他模型的方法,,通過將其推理能力傳授給其他大型語言模型,例如Meta的Llama,。
研究人員也在應用強化學習技術來改進具體任務,。Lu去年參與創(chuàng)建了一個名為“AI Scientist”的模型,該模型可以執(zhí)行從文獻掃描到撰寫論文的一系列研究任務,。通過定義適當的獎勵信號,,科學家可以針對任何目標訓練模型。
然而,,DeepSeek-R1并非完美無缺,。例如,在一些簡單的任務上,,如計算包含字母W的美國州名數量時,聊天機器人DeepThink未能成功完成,。與其他中國模型一樣,,R1拒絕回答政治敏感問題,但尚不清楚這是內置限制還是界面設置所致,。
今年諾貝爾獎的公布讓谷歌成為了焦點,,其員工Geoffrey Hinton榮獲物理學獎,而DeepMind的兩位科學家Demis Hassabis和John Jumpe則摘得了化學獎桂冠
2024-10-14 06:08:28吃得少壽命長