今日有報道稱,李飛飛等斯坦福大學(xué)和華盛頓大學(xué)的研究人員以不到50美元的云計算費(fèi)用,,成功訓(xùn)練出了一個名為s1的人工智能推理模型,。該模型在數(shù)學(xué)和編碼能力測試中的表現(xiàn)與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
調(diào)查發(fā)現(xiàn),,s1模型并非從零開始訓(xùn)練,,而是基于阿里通義千問(Qwen)模型進(jìn)行微調(diào),。研究人員使用了從谷歌模型中提煉出來的1000個樣本,對千問模型進(jìn)行了監(jiān)督微調(diào),,最終形成了s1模型,。
一群年輕的工程師,大部分是剛畢業(yè)甚至還在讀的學(xué)生,,竟然能夠與硅谷那些頂尖且高薪的工程師們平手,,甚至超越他們,創(chuàng)造了讓最尖端AI領(lǐng)域都感到震驚的成就
2025-01-27 21:46:31胡錫進(jìn)談DeepSeek