亚洲一卡2卡3卡4卡5卡6卡_99RE6在线观看国产精品_99欧美日本一区二区留学生_成人国产精品日本在线观看_丰满爆乳在线播放_免费国产午夜理论片不卡_欧美成 人影片 免费观看_日产中字乱码一二三_肉感饱满中年熟妇日本_午夜男女爽爽影院免费视频下载,民工把我奶头掏出来在线视频,日韩经典亚洲,国产精品JIZZ在线观看无码

中華網(wǎng) china.com

新聞

OpenAI喜提姚班學(xué)霸姚順雨

關(guān)鍵詞:
2024-08-02 16:17:29  搜狐網(wǎng)

OpenAI喜提姚班學(xué)霸姚順雨

清華姚班學(xué)霸姚順雨,,官宣加入了OpenAI,。

而就是這么一則簡短的消息,卻引來了圈內(nèi)眾人的圍觀和祝福,來感受一下這個(gè)feel:

其中不乏像OpenAI前沿研究主管,、美國IOI教練

Mark Chen

,以及AI領(lǐng)域的教授,、投資人等等,。

那么這位姚順雨,到底為何能夠引來如此關(guān)注,?

從他過往的履歷來看,,我們可以提煉出這樣幾個(gè)關(guān)鍵詞:

  • 清華姚班

  • 姚班聯(lián)席會(huì)主席

  • 清華大學(xué)學(xué)生說唱社聯(lián)合創(chuàng)始人

  • 普林斯頓計(jì)算機(jī)博士

△姚順雨,圖源:個(gè)人主頁

但除了較為亮點(diǎn)的履歷之外,,真正讓姚順雨步入公眾的視野,,還是因?yàn)樗亩囗?xiàng)科研成果:

  • 思維樹

    (Tree of Thoughts)

    :讓LLM反復(fù)思考,大幅提高推理能力,。

  • SWE-bench

    :一個(gè)大模型能力評(píng)估數(shù)據(jù)集,。

  • SWE-agent

    :一個(gè)開源AI程序員。

毫不夸張的說,,幾乎每項(xiàng)研究都在圈里產(chǎn)生了不小的漣漪,;并且非常明顯的一點(diǎn)是,它們都是深深圍繞著

大模型

而展開,。

這或許也正應(yīng)了姚順雨此次官宣里的一句話:

是時(shí)候?qū)⒀芯吭妇稗D(zhuǎn)變?yōu)楝F(xiàn)實(shí)了,。

至于這個(gè)“研究愿景”,我們繼續(xù)深入了解一下,。

研究關(guān)鍵詞:Language Agents

如果縱觀姚順雨的主頁,,尤其是論文研究部分,就不難發(fā)現(xiàn)有一個(gè)出鏡頻率極高的詞組——Language Agents

包括在他X主頁中的簡介,,第一句話上來也是Language Agents:

而這,,也正是他博士畢業(yè)論文的題目:

Language Agents: From Next-Token Prediction to Digital Automation

Language Agents,,即

語言智能體

,,是姚順雨提出來了一種新的智能體類別。

和傳統(tǒng)智能體不同的是,,這種方法是將語言模型用于智能體的推理和行動(dòng),,主打一個(gè)讓它們實(shí)現(xiàn)

數(shù)字自動(dòng)化

(Digital Automation)

至于具體的實(shí)現(xiàn)方法,,則有三個(gè)關(guān)鍵技術(shù)

(均有獨(dú)立的論文)

,,它們分別是:

  • ReAct

    :一種將推理和行動(dòng)相結(jié)合的方法,通過語言模型生成推理軌跡和行動(dòng),,來解決各種語言推理和決策任務(wù),。

  • 思維樹

    :一種基于樹搜索的方法,通過生成和評(píng)估多個(gè)思維路徑來解決復(fù)雜問題,,提高語言模型的推理能力,。

  • CoALA

    :一個(gè)概念框架,用于組織和設(shè)計(jì)語言代理,,包括內(nèi)存,、行動(dòng)空間和決策制定等方面。

以ReAct為例,,研究是將語言模型的動(dòng)作空間擴(kuò)充為動(dòng)作集和語言空間的并集,。

語言空間中的動(dòng)作

(即思維或推理軌跡)

不影響外部環(huán)境,但能通過對(duì)當(dāng)前上下文的推理來更新上下文,,可以支持未來的推理或行動(dòng),。

例如在下圖展示的對(duì)話中,采用ReAct的方法,,可以引導(dǎo)智能體把“產(chǎn)生想法→采取行動(dòng)→觀察結(jié)果”這個(gè)過程進(jìn)行循環(huán),。

如此一來,便可以結(jié)合推理的軌跡和操作,,允許模型進(jìn)行動(dòng)態(tài)的推理,,讓智能體的決策和最終結(jié)果變得更優(yōu)。

若是把ReAct的方法歸結(jié)為讓智能體

“reason to act”

,,那么下一個(gè)方法,,即

思維樹

,則重在讓智能體

“reason to plan”

,。

思維樹是把問題表示為在樹結(jié)構(gòu)上的搜索,,每個(gè)節(jié)點(diǎn)是一個(gè)狀態(tài),,代表部分解決方案,分支對(duì)應(yīng)于修改狀態(tài)的操作,。

它主要涉及四個(gè)問題:

  • 思維分解:將復(fù)雜問題分解為一系列中間步驟,,每個(gè)步驟都可以看作是樹的一個(gè)節(jié)點(diǎn)。

  • 思維生成:利用語言模型生成每個(gè)節(jié)點(diǎn)的潛在思維,,這些思維是解決問題的中間步驟或策略,。

  • 狀態(tài)評(píng)估:通過語言模型對(duì)每個(gè)節(jié)點(diǎn)的狀態(tài)進(jìn)行評(píng)估,判斷其在解決問題中的進(jìn)展和潛力,。

  • 搜索算法:采用不同的搜索算法

    (如廣度優(yōu)先搜索BFS或深度優(yōu)先搜索DFS)

    來探索思維樹,找到最優(yōu)的解決方案,。

將思維樹應(yīng)用到“24點(diǎn)”游戲中,,與此前的思維鏈

(CoT)

相比,準(zhǔn)確率有了明顯提高,。

至于Language Agents中的最后一個(gè)關(guān)鍵技術(shù),,即

CoALA

,則是一種用于組織和設(shè)計(jì)語言智能體的概念框架,。

從下面的結(jié)構(gòu)圖來看,,它大致分為信息存儲(chǔ)、行動(dòng)空間和決策制定三大模塊,。

信息存儲(chǔ)是指語言智能體將信息存儲(chǔ)在多個(gè)內(nèi)存模塊中,,包括短期工作記憶和長期記憶

(如語義記憶、情景記憶和程序記憶)

,。

這些內(nèi)存模塊用于存儲(chǔ)不同類型的信息,,如感知輸入、知識(shí),、經(jīng)驗(yàn)等,,并在智能體的決策過程中發(fā)揮作用。

除此之外,,CoALA將智能體的行動(dòng)空間分為外部行動(dòng)和內(nèi)部行動(dòng),;外部行動(dòng)涉及與外部環(huán)境的交互,如控制機(jī)器人,、與人類交流或在數(shù)字環(huán)境中執(zhí)行操作,。

內(nèi)部行動(dòng)則與智能體的內(nèi)部狀態(tài)和記憶交互,包括推理,、檢索和學(xué)習(xí)等操作,。

最終,語言智能體會(huì)通過決策制定過程選擇要執(zhí)行的行動(dòng),;而這個(gè)過程也是會(huì)根據(jù)各種因素,、反饋,從中找出最優(yōu)解。

除此之外,,還有像開源AI程序員的工作

SWE-agent

等,,也在圈里廣泛傳播。

但我們從姚順雨眾多的科研課題中,,除了Language Agents之外,,還能看到他所追求的另一個(gè)關(guān)鍵詞——

計(jì)算的思維

而這一點(diǎn),,其實(shí)在他念本科的時(shí)候便已經(jīng)有所透露,。

在即將奔赴普林斯頓大學(xué)攻讀計(jì)算機(jī)博士學(xué)位前,作為2015級(jí)學(xué)長,,姚順雨曾在清華2019年各類型自主選拔復(fù)試的開營儀式上向復(fù)試考生分享了本人在清華的學(xué)習(xí)成長經(jīng)歷,。

相關(guān)內(nèi)容記錄在他自己寫的名為“你在清華姚班學(xué)到了什么?姚順雨:足以改變世界”的文章中,。

當(dāng)時(shí)他從理論和實(shí)踐兩方面重點(diǎn)分享了計(jì)算的思維,,并透露覺得四年下來,

最大的收獲就是計(jì)算的思維

從理論上我們現(xiàn)在看到很多不可能做到的事情,。所謂理論指導(dǎo)實(shí)踐,,我覺得更多的是說,我們得從一個(gè)高度理解一個(gè)系統(tǒng)的能力極限和事情難易,,然后再選擇能做的,、有意義的事情去做。

和陽光開朗大男孩tag鎖死,,姚順雨還分享了因清華南方浸潤計(jì)劃項(xiàng)目,,前往阿根廷的經(jīng)歷:

我遇到了一群阿根廷的孩子……英語并不是世界通用的,阿根廷人說西班牙語,。我曾經(jīng)試圖學(xué)西班牙語,,但是我放棄了,因?yàn)槲覍W(xué)計(jì)算機(jī),,我拿出了谷歌翻譯,。我跟他們說北京的故宮和長城……

△來源:清華招生公眾號(hào)

在他看來,這個(gè)時(shí)代,,計(jì)算能和任何學(xué)科相結(jié)合,,而世界很大,在清華可以做你想做的事,。

說完姚順雨,,姚班還有哪些人在搞大模型?

爆火的大模型,,姚班還有誰在搞,?

不得不提的有

馬騰宇

陳丹琦

,。

倆人當(dāng)年是同班同學(xué),清華姚班2008級(jí)校友,,并且之后都拿了具有“諾獎(jiǎng)風(fēng)向標(biāo)”之稱的斯隆獎(jiǎng),。

馬騰宇博士就讀于普林斯頓大學(xué),導(dǎo)師是理論計(jì)算機(jī)科學(xué)家,、兩屆哥德爾獎(jiǎng)得主Sanjeev Arora教授,。

博士畢業(yè)后,MIT,、哈佛,、斯坦福等頂尖高校都給了他助理教授的Offer,馬騰宇最終選擇了斯坦福,。

去年年底,,馬騰宇還正式宣布大模型創(chuàng)業(yè)了——?jiǎng)?chuàng)立Voyage AI,透露將帶隊(duì)打造目前最好的嵌入模型,,還會(huì)提供專注于某個(gè)領(lǐng)域或企業(yè)的定制化模型。

斯坦福人工智能實(shí)驗(yàn)室主任Christopher Manning,、AI領(lǐng)域著名華人學(xué)者李飛飛等三名教授擔(dān)任Voyage AI的學(xué)術(shù)顧問,。

陳丹琦這邊,清華姚班完成本科學(xué)業(yè)后,,2018年又在斯坦福大學(xué)拿下博士學(xué)位,,主攻NLP,最終成為普林斯頓大學(xué)計(jì)算機(jī)科學(xué)系助理教授,、普林斯頓語言與智能項(xiàng)目副主任,,共同領(lǐng)導(dǎo)普林斯頓NLP小組。

其個(gè)人主頁顯示,,“這些天主要被開發(fā)大模型吸引”,,正在研究主題包括:

  • 檢索如何在下一代模型中發(fā)揮重要作用,提高真實(shí)性,、適應(yīng)性,、可解釋性和可信度。

  • 大模型的低成本訓(xùn)練和部署,,改進(jìn)訓(xùn)練方法,、數(shù)據(jù)管理、模型壓縮和下游任務(wù)適應(yīng)優(yōu)化,。

  • 還對(duì)真正增進(jìn)對(duì)當(dāng)前大模型功能和局限性理解的工作感興趣,,無論在經(jīng)驗(yàn)上還是理論上。

陳丹琦團(tuán)隊(duì)的大模型工作,,量子位也有持續(xù)關(guān)注,。

比如,,提出的大模型降本大法——數(shù)據(jù)選擇算法LESS,只篩選出與任務(wù)最相關(guān)5%數(shù)據(jù)來進(jìn)行指令微調(diào),,效果比用整個(gè)數(shù)據(jù)集還要好,。

而指令微調(diào)正是讓基礎(chǔ)模型成為類ChatGPT助手模型的關(guān)鍵一步。

提出爆火的“羊駝剪毛”大法——LLM-Shearing大模型剪枝法,,只用3%的計(jì)算量,、5%的成本取得SOTA,統(tǒng)治了1B-3B規(guī)模的開源大模型,。

除了這兩位,,業(yè)界、學(xué)術(shù)界姚班校友在搞大模型的還有很多,。

之前火爆全網(wǎng)的大模型原生應(yīng)用《完蛋,!我被大模型包圍了》及其續(xù)作《我把大模型玩壞了》,就是由姚班學(xué)霸帶隊(duì)開發(fā)的,。

游戲作者

范浩強(qiáng)

,,曠視6號(hào)員工。當(dāng)年以IOI金牌,、保送清華姚班,、高二實(shí)習(xí)等傳奇事跡被譽(yù)為天才少年。如今他已是曠視科技研究總經(jīng)理,,谷歌學(xué)術(shù)h-index 32的行業(yè)大佬,。

馬斯克xAI首個(gè)研究成果——Tensor Programs VI,共同一作中也有姚班校友的身影,。

Tensor Programs VI是xAI創(chuàng)始成員,、丘成桐弟子楊格

(Greg Yang)

之前Tensor Programs系列工作的延續(xù),論文重點(diǎn)探討了“如何訓(xùn)練無限深度網(wǎng)絡(luò)”,。

據(jù)說Tensor Programs相關(guān)成果,,在GPT-4中已有應(yīng)用。為解讀論文,,楊格本人當(dāng)時(shí)還專門在X上進(jìn)行了一場直播分享,。

共同一作

Dingli Yu

,本科畢業(yè)于清華姚班,,目前Dingli Yu也快要在普林斯頓計(jì)算機(jī)科學(xué)系博士畢業(yè)了,。

還有很多很多…………

說回這次姚順雨被挖到OpenAI,OpenAI這邊的招聘動(dòng)作還在繼續(xù),。

OpenAI工程師Karina Nguyen發(fā)布最新招聘帖:

OpenAI模型行為團(tuán)隊(duì)招人啦,!這是一個(gè)集設(shè)計(jì)工程與訓(xùn)練后研究于一體的夢(mèng)想職位,也是世界上最稀有的工作??

我們使用諸如RLHF/RLAIF等對(duì)齊方法定義模型核心行為,,以體現(xiàn)基本價(jià)值觀并提升AGI的創(chuàng)造性智能,。通過這些成果,,我們與產(chǎn)品+模型設(shè)計(jì)及工程團(tuán)隊(duì)共同開創(chuàng)AI界面和交互新模式,這將影響數(shù)百萬用戶……

有意思的是,,Karina Nguyen其實(shí)之前是Anthropic AI

(Claude團(tuán)隊(duì))

研究員,,去年五月還和思維鏈“開山論文”一作、OpenAI的Jason Wei一同在X

(原Twitter)

上進(jìn)行提示詞決斗,。

沒想到Karina Nguyen這么快就跳槽到了OpenAI……

順便提一嘴,,就在昨天有消息爆料,谷歌DeepMind研究員Thibault Sottiaux也被挖到了OpenAI,。

要知道,,Thibault Sottiaux在Gemini初代和Gemini 1.5等論文中都是核心貢獻(xiàn)者。

由此可見大模型賽道目前火爆程度,,各家搶賽道的搶賽道,,搶人的搶人。

One More Thing

跟姚順雨同年從清華畢業(yè)的,,還有2位姚順yu,!

清華大學(xué)官方在2019年三位姚順yu畢業(yè)時(shí),發(fā)了一條微博,,還曬了三人的合照,。

除了現(xiàn)已加入OpenAI的姚順雨,還有一個(gè)姚順雨是來自

人文學(xué)院

日語專業(yè)的一位女生,。

另一位姚順yu是姚順

,來自

物理系

,,他是2018年本科生特獎(jiǎng)得主,,本科期間就以第一作者在物理頂刊PRL

(Physical Review Letters)

上發(fā)表論文兩篇、PRB

(Physical Review B)

一篇,。

OpenAI喜提姚班學(xué)霸姚順雨,!

(責(zé)任編輯:盧其龍 CN070)
關(guān)閉

高溫下重慶現(xiàn)美麗云彩 絢麗晚霞扮靚山城

高溫下重慶現(xiàn)美麗云彩2024-09-09 17:13:54

教師節(jié)前夕班主任告知家長不要送禮 良心教育獲贊

教師節(jié)前夕班主任告知家長不要送禮2024-09-09 17:13:43

小米汽車二期工廠正24小時(shí)施工 加速提升產(chǎn)能應(yīng)對(duì)需求

小米汽車二期工廠正24小時(shí)施工2024-09-09 17:12:29

廢除老牌護(hù)衛(wèi)艦隊(duì),日本海上自衛(wèi)隊(duì)大整編用意何為,?

廢除老牌護(hù)衛(wèi)艦隊(duì),,日本海上自衛(wèi)隊(duì)大整編用意何為?2024-09-09 10:40:54

一越野車沙漠越野時(shí)出意外2人死亡 網(wǎng)紅打卡點(diǎn)安全引憂

一越野車沙漠越野時(shí)出意外2人死亡2024-09-09 17:01:24

美大使稱“中美戰(zhàn)區(qū)司令員將在未來幾周通話”

美大使稱“中美戰(zhàn)區(qū)司令員將在未來幾周通話”2024-09-09 09:35:45

成都上演“春熙不眠yeah音樂節(jié)” 百年慶典嗨翻春熙路

成都上演“春熙不眠yeah音樂節(jié)”2024-09-09 16:55:00

西方炒作“中國護(hù)衛(wèi)艦換柬埔寨海軍基地”

西方炒作“中國護(hù)衛(wèi)艦換柬埔寨海軍基地”2024-09-09 09:46:46

美國海軍想脫困,,得指望韓國日本,?

美國海軍想脫困,得指望韓國日本,?2024-09-09 09:34:24

高溫下重慶現(xiàn)美麗云彩 絢麗晚霞扮靚山城

高溫下重慶現(xiàn)美麗云彩2024-09-09 17:13:54

供烏武器收益大部分留在美國 軍工復(fù)合體最大限度獲利,!

供烏武器收益大部分留在美國 軍工復(fù)合體最大限度獲利!2024-09-09 10:03:56

外媒:美國眾議院共和黨人發(fā)布報(bào)告,,嚴(yán)厲批評(píng)拜登政府在阿富汗撤軍中失敗表現(xiàn)

外媒:美國眾議院共和黨人發(fā)布報(bào)告,,嚴(yán)厲批評(píng)拜登政府在阿富汗撤軍中失敗表現(xiàn)2024-09-09 10:34:40

越南北部一大橋垮塌多人落水 目擊者稱車輛人員墜河

越南北部一大橋垮塌多人落水2024-09-09 16:54:03

菲律賓保和省因登革熱進(jìn)入災(zāi)難狀態(tài) 病例超13萬

菲律賓保和省因登革熱進(jìn)入災(zāi)難狀態(tài)2024-09-09 16:57:00

美媒:裝備欠缺人數(shù)不足,,烏克蘭軍隊(duì)正面臨士氣低落和臨陣脫逃的困境

美媒:裝備欠缺人數(shù)不足,烏克蘭軍隊(duì)正面臨士氣低落和臨陣脫逃的困境2024-09-09 10:35:08

美媒破防:給烏克蘭M1A1坦克就是“浪費(fèi)”

美媒破防:給烏克蘭M1A1坦克就是“浪費(fèi)”2024-09-09 09:44:46

美國362斤博主曾帶呼吸機(jī)吃播

美國362斤博主曾帶呼吸機(jī)吃播2024-09-09 17:00:00

美國空軍“從頭開始”審查第六代戰(zhàn)斗機(jī)項(xiàng)目

美國空軍“從頭開始”審查第六代戰(zhàn)斗機(jī)項(xiàng)目2024-09-09 09:47:13

一公司被禁止參加軍隊(duì)采購活動(dòng)3年 串通投標(biāo)受重罰

一公司被禁止參加軍隊(duì)采購活動(dòng)3年2024-09-09 17:09:42

涉嫌“破壞北溪”,?烏克蘭軍官:如果真的是我們做的,,德國應(yīng)該停止調(diào)查

涉嫌“破壞北溪”?烏克蘭軍官:如果真的是我們做的,,德國應(yīng)該停止調(diào)查2024-09-09 09:54:59

普京態(tài)度突然變了

普京態(tài)度突然變了2024-09-09 09:31:32

美英情報(bào)高官首次聯(lián)合公開露面,,渲染“全球威脅”

美英情報(bào)高官首次聯(lián)合公開露面,渲染“全球威脅”2024-09-09 09:56:42

玉米地發(fā)現(xiàn)女嬰 警方以遺棄罪立案 女嬰現(xiàn)生命體征平穩(wěn)

玉米地發(fā)現(xiàn)女嬰 警方以遺棄罪立案2024-09-09 16:58:05

中國海警向《環(huán)球時(shí)報(bào)》記者講述南海上的故事:“屬于我們的藍(lán)色疆土,,必須守護(hù)守住”

中國海警向《環(huán)球時(shí)報(bào)》記者講述南海上的故事:“屬于我們的藍(lán)色疆土,,必須守護(hù)守住”2024-09-09 09:57:59

官方回應(yīng)學(xué)生在校死亡脖子現(xiàn)勒痕 警方介入調(diào)查中

官方回應(yīng)學(xué)生在校死亡脖子現(xiàn)勒痕2024-09-09 17:10:19

美軍艦維修到底有多難?美國海軍全球“求人”幫修船

美軍艦維修到底有多難,?美國海軍全球“求人”幫修船2024-09-09 10:01:29

小米汽車二期工廠正24小時(shí)施工 加速提升產(chǎn)能應(yīng)對(duì)需求

小米汽車二期工廠正24小時(shí)施工2024-09-09 17:12:29

媒體:中國男足亟待走出陰霾,,刮骨療毒刻不容緩

媒體:中國男足亟待走出陰霾2024-09-09 17:11:16

外媒:約旦河西岸與約旦交界的一陸路口岸發(fā)生槍擊,3名以色列人死亡,,內(nèi)塔尼亞胡發(fā)聲

外媒:約旦河西岸與約旦交界的一陸路口岸發(fā)生槍擊,,3名以色列人死亡,內(nèi)塔尼亞胡發(fā)聲2024-09-09 10:38:01

新爆料:跟烏克蘭搶F-16的,,還有美國海軍,!

新爆料:跟烏克蘭搶F-16的,還有美國海軍,!2024-09-09 09:40:22

韓國逾兩成員工遭遇過職場性騷擾 女性處境堪憂

韓國逾兩成員工遭遇過職場性騷擾2024-09-09 17:00:14

浙江男籃:王奕博體測時(shí)跟腱受傷,,預(yù)計(jì)傷停一月

浙江男籃:王奕博體測時(shí)跟腱受傷2024-09-09 16:56:00

孕婦在火車上突然分娩,73歲退休助產(chǎn)師挺身而出

孕婦在火車上突然分娩2024-09-09 16:59:02

教師節(jié)前夕班主任告知家長不要送禮 良心教育獲贊

教師節(jié)前夕班主任告知家長不要送禮2024-09-09 17:13:43

曝888元一桌婚宴魚是生的菜是臭的 賓客不滿引爭議

曝888元一桌婚宴魚是生的菜是臭的2024-09-09 17:01:35

相關(guān)新聞