亚洲一卡2卡3卡4卡5卡6卡_99RE6在线观看国产精品_99欧美日本一区二区留学生_成人国产精品日本在线观看_丰满爆乳在线播放_免费国产午夜理论片不卡_欧美成 人影片 免费观看_日产中字乱码一二三_肉感饱满中年熟妇日本_午夜男女爽爽影院免费视频下载,民工把我奶头掏出来在线视频,日韩经典亚洲,国产精品JIZZ在线观看无码

中華網(wǎng) china.com

新聞

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

關(guān)鍵詞:
2025-02-05 22:00:03  新浪新聞

科技圈從來不缺新聞,,但 DeepSeek-R1 的出現(xiàn)卻像一顆石子投入平靜的湖面,,激起了層層漣漪。這家來自中國的 AI 初創(chuàng)公司以其開源的推理大模型 R1 攪動了全球 AI 格局,。R1 不僅性能媲美甚至超越 OpenAI o1,,還以低廉的成本和開放的姿態(tài)贏得了全世界的關(guān)注。DeepSeek-R1 的開源策略和高效性能正在迫使整個行業(yè)重新思考 AI 的未來,。

中國計算機學(xué)會青年計算機科學(xué)與技術(shù)論壇(CCF YOCSEF)近期組織了一場研討會,,邀請了復(fù)旦大學(xué)邱錫鵬教授、清華大學(xué)劉知遠長聘副教授,、清華大學(xué)翟季冬教授以及上海交通大學(xué)戴國浩副教授四位專家,,從不同角度深入解析了 DeepSeek-R1 的技術(shù)突破與未來影響,。

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

要理解 R1 的突破,,需要從 o1 類推理模型說起。邱錫鵬認為當前人工智能領(lǐng)域正面臨一個重要轉(zhuǎn)折點,。此前 Ilya 稱“預(yù)訓(xùn)練時代可能即將結(jié)束”,,主要源于數(shù)據(jù)增長的停滯。OpenAI 開始轉(zhuǎn)向強化學(xué)習(xí)和推理式計算,,試圖通過增加推理長度來改進模型性能,,為下一代大模型的發(fā)展注入新動力。

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

o1 模型的訓(xùn)練在強化學(xué)習(xí)框架下進行,,大語言模型充當一個 Agent,,每個動作生成下一個 token,最終生成整個 step 或 solution,。o1 這類大型推理模型可以分為四個核心要素:策略初始化,、獎勵函數(shù)設(shè)計、搜索策略和學(xué)習(xí)過程,。策略初始化要求模型具備初始的類人推理行為能力,,包括問題理解、任務(wù)分解及驗證和修正錯誤的能力,。獎勵函數(shù)設(shè)計則涉及從環(huán)境中直接獲得獎勵信號或通過專家偏好數(shù)據(jù)訓(xùn)練獎勵模型,。搜索策略包括基于樹的搜索和基于順序修改的搜索。學(xué)習(xí)過程主要包括使用強化學(xué)習(xí)和其他方法優(yōu)化模型,,分為預(yù)熱階段和強化學(xué)習(xí)階段,。

R1 發(fā)布了兩個版本:R1-Zero 和 R1。R1-Zero 完全依靠強化學(xué)習(xí)驅(qū)動,,不經(jīng)過預(yù)熱階段,,沒有任何初始的人工調(diào)節(jié)。在訓(xùn)練過程中,,隨著步驟的增加,,模型逐漸展現(xiàn)出長文本推理能力,,尤其是長鏈推理,并表現(xiàn)出自我修正能力,。不過也存在一些問題,,如語言混合的問題。

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

R1 的訓(xùn)練分為四個關(guān)鍵階段:冷啟動階段,、推理導(dǎo)向的強化學(xué)習(xí)階段,、拒絕抽樣與監(jiān)督微調(diào)階段,以及全任務(wù)強化學(xué)習(xí)階段,。值得注意的是,,R1 并未采用傳統(tǒng)的過程監(jiān)督或蒙特卡洛樹搜索等技術(shù),而是通過 majority vote 大幅提高推理效果,。尤其令人意外的是,,R1 在寫作能力方面表現(xiàn)突出。

DeepSeek-R1 引起廣泛關(guān)注的原因在于其獨特的技術(shù)路線和開源策略,。劉知遠指出,,DeepSeek 是全球首個通過純強化學(xué)習(xí)技術(shù)成功復(fù)現(xiàn) o1 能力并開源相關(guān)技術(shù)細節(jié)的團隊。R1 基于 Deep Seek-V3 的基礎(chǔ)模型,,通過大規(guī)模強化學(xué)習(xí)增強推理能力,,并將強推理能力泛化到其他領(lǐng)域。此外,,DeepSeek 選擇了開源的道路,,這一決定具有深遠的戰(zhàn)略意義,展示了“有限算力+算法創(chuàng)新”的發(fā)展模式,。

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

除了算法層面的創(chuàng)新,,DeepSeek 降低訓(xùn)練成本的方法也是引起關(guān)注的重要原因。翟季冬從系統(tǒng)軟件層面分析了 DeepSeek 降低訓(xùn)練成本的方法,。DeepSeek 開發(fā)了并行訓(xùn)練框架 HAI-LLM,,采用了 16 路流水線并行、64 路專家并行 (跨越 8 個物理節(jié)點) 和基于 ZeRO-1 的數(shù)據(jù)并行方案,。DeepSeek 針對系統(tǒng)的負載均衡,、通信優(yōu)化、內(nèi)存管理和計算優(yōu)化進行了深度優(yōu)化,。

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

戴國浩從軟硬件協(xié)同視角分析了 DeepSeek 的未來方向,。他指出,了解硬件細節(jié),、極致底層優(yōu)化,、打通軟件硬件、聯(lián)合協(xié)同優(yōu)化是關(guān)鍵,。DeepSeek 的成功證明,,通過系統(tǒng)架構(gòu)的優(yōu)化結(jié)合國產(chǎn)芯片和硬件,,中國的 AI 技術(shù)完全可以逐步超越國際競爭者。

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

研討會上,,專家們討論了 MoE 架構(gòu)是否是當前最優(yōu)解的問題,。劉知遠認為這是一個開放性的問題,技術(shù)在不斷變化,。翟季冬強調(diào)技術(shù)在不停地變化,,新的技術(shù)可能會顛覆現(xiàn)有技術(shù)。戴國浩從歷史角度分析了神經(jīng)網(wǎng)絡(luò)的發(fā)展,,指出 MoE 在當前取得了不錯的效果,,但不是最優(yōu)解。

DeepSeek-R1 的出現(xiàn)標志著 AI 領(lǐng)域格局的重要轉(zhuǎn)變,。美國目前仍占據(jù)領(lǐng)先地位,,但形勢正在發(fā)生微妙變化。DeepSeek 展現(xiàn)的高效創(chuàng)新路徑或?qū)⒅匦露x AI 發(fā)展的范式,。

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

復(fù)旦教授談DeepSeek AI界的“鯰魚”效應(yīng)

(責任編輯:盧其龍 CN070)
關(guān)閉

小區(qū)火災(zāi)道閘未開 消防現(xiàn)場破門進入 物業(yè)解釋誤會原因

小區(qū)火災(zāi)道閘未開消防現(xiàn)場破門進入2025-02-05 21:58:49

安徽一中學(xué)被指提前開課 官方回應(yīng) 已上報調(diào)查處理

安徽一中學(xué)被指提前開課官方回應(yīng)2025-02-05 21:56:39

張本智和再次爆冷不敵國乒二線選手 連續(xù)失利引關(guān)注

張本智和再次爆冷不敵國乒二線選手2025-02-05 21:53:21

蓋茨為美國國際開發(fā)署醫(yī)療業(yè)務(wù)辯護 引發(fā)爭議與質(zhì)疑

蓋茨為美國國際開發(fā)署醫(yī)療業(yè)務(wù)辯護2025-02-05 20:25:30

特朗普讓美國盟友心寒 韓國對華風向也變了

特朗普讓美國盟友心寒 韓國對華風向也變了2025-02-05 16:45:31

小區(qū)火災(zāi)道閘未開 消防現(xiàn)場破門進入 物業(yè)解釋誤會原因

小區(qū)火災(zāi)道閘未開消防現(xiàn)場破門進入2025-02-05 21:58:49

小米SU7 Ultra今起正式到店 樣車抵達全國42城112店

小米SU7Ultra今起正式到店2025-02-05 21:19:35

民進黨視DeepSeek為洪水猛獸挨批 逆流而行自困井底

民進黨視DeepSeek為洪水猛獸挨批2025-02-05 20:36:18

張本智和再次爆冷不敵國乒二線選手 連續(xù)失利引關(guān)注

張本智和再次爆冷不敵國乒二線選手2025-02-05 21:53:21

餐館“清寡湯”要價68元 老板回應(yīng) 明碼標價石耳湯

餐館清寡湯要價68元老板回應(yīng)2025-02-05 21:28:19

海外研究者揭穿圍繞DeepSeek的謠言 澄清五大誤解

海外研究者揭穿圍繞DeepSeek的謠言2025-02-05 20:16:49

4歲男孩被偷32年回家母子相擁而泣 爸爸忘鎖門4歲兒子睡覺時被偷

4歲男孩被偷,4歲男孩被偷32年回家母子相擁而泣2025-02-05 21:25:25

賈玲恭喜《哪吒》 票房突破54億

賈玲恭喜哪吒2025-02-05 21:38:46

郭富城陪老婆回內(nèi)地拜年 天王接地氣引發(fā)熱議

郭富城陪老婆回內(nèi)地拜年2025-02-05 21:36:00

特朗普批聯(lián)合國“運作不善”遭反駁 聯(lián)合國反擊稱已推動多項改革

特朗普批聯(lián)合國運作不善遭反駁2025-02-05 16:43:53

特朗普停止接觸聯(lián)合國機構(gòu)目的何在 讓聯(lián)合國“聽命于美國”,?

特朗普停止接觸聯(lián)合國機構(gòu)目的何在2025-02-05 16:26:10

藝人經(jīng)紀公司簽下拜登有何目的 探索卸任后工作方向

藝人經(jīng)紀公司簽下拜登有何目的2025-02-05 16:13:29

南部戰(zhàn)區(qū):任何攪局南海的軍事活動盡在掌握 堅決捍衛(wèi)主權(quán)權(quán)益

南部戰(zhàn)區(qū),任何攪局南海的軍事活動盡在掌握2025-02-05 16:39:28

學(xué)者:特朗普盯上烏克蘭稀土和礦產(chǎn) 資源換取武器援助

學(xué)者,特朗普盯上烏克蘭稀土和礦產(chǎn)2025-02-05 20:14:04

開年車市:車企價格戰(zhàn)又將全面打響 新年首日再掀波瀾

開年車市,車企價格戰(zhàn)又將全面打響2025-02-05 21:33:43

歐洲媒體:科技制裁是一條錯誤的路 激發(fā)創(chuàng)新而非懶惰

歐洲媒體,科技制裁是一條錯誤的路2025-02-05 20:14:32

美媒:美政府效率部與聯(lián)邦機構(gòu)沖突加劇 政府效率部獲取敏感信息引發(fā)爭議

美媒:美政府效率部與聯(lián)邦機構(gòu)沖突加劇2025-02-05 16:33:29

羊群誤入高速交警變身牧羊人 緊急處置保平安

羊群誤入高速交警變身牧羊人2025-02-05 21:44:36

松下電視將成歷史 告別70年輝煌

松下電視將成歷史2025-02-05 21:14:26

男子駕車47小時返回廣東上班 毅力見證旅程

男子駕車47小時返回廣東上班2025-02-05 21:47:31

廣東省委書記盛贊DeepSeek 邊緣AI迎來新機遇

廣東省委書記盛贊DeepSeek2025-02-05 21:50:33

魯比奧當面威脅巴拿馬:離中國遠點,,結(jié)果施壓無果,!

魯比奧當面威脅巴拿馬:離中國遠點2025-02-05 16:30:59

抗議持續(xù)!塞爾維亞農(nóng)民開著拖拉機加入抗議活動 德約科維奇聲援學(xué)生

塞爾維亞農(nóng)民開著拖拉機加入抗議活動2025-02-05 16:36:29

禁DeepSeek,?名嘴批臺當局愚蠢 跟風美國自食惡果

禁DeepSeek名嘴批臺當局愚蠢2025-02-05 16:17:47

烏稱對伙伴開發(fā)有關(guān)礦產(chǎn)資源持開放態(tài)度

烏稱對伙伴開發(fā)有關(guān)礦產(chǎn)資源持開放態(tài)度2025-02-05 16:35:55

濟南迎來錯峰出游客流高峰 景區(qū)人頭攢動游玩熱情高

濟南迎來錯峰出游客流高峰2025-02-05 21:45:10

內(nèi)蒙古近百人因風吹雪被困 救援人員徒步行進解救

內(nèi)蒙古近百人因風吹雪被困2025-02-05 21:33:14

安徽一中學(xué)被指提前開課 官方回應(yīng) 已上報調(diào)查處理

安徽一中學(xué)被指提前開課官方回應(yīng)2025-02-05 21:56:39

專家:美菲“聯(lián)合巡航”是虛張聲勢 挑釁中國主權(quán)

專家,美菲聯(lián)合巡航是虛張聲勢2025-02-05 20:36:49

相關(guān)新聞