華人科學(xué)家登上Nature:幾行代碼,,優(yōu)化復(fù)合AI系統(tǒng) TextGrad引領(lǐng)自動(dòng)優(yōu)化新浪潮,!斯坦福大學(xué)副教授 James Zou 領(lǐng)導(dǎo)的團(tuán)隊(duì)提出了 TextGrad,這是一種通過文本自動(dòng)化“微分”反向傳播大語言模型(LLM)文本反饋來優(yōu)化 AI 系統(tǒng)的方法,。目前,AI 領(lǐng)域的許多突破都是由多個(gè)大語言模型和其他專業(yè)工具協(xié)同工作的系統(tǒng)驅(qū)動(dòng),這些系統(tǒng)主要依賴領(lǐng)域?qū)<业氖止ぶ谱骱蛦l(fā)式調(diào)整,,而不是自動(dòng)優(yōu)化。
TextGrad 的靈感來源于人工神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,。在人工神經(jīng)網(wǎng)絡(luò)中,反向傳播和自動(dòng)分化技術(shù)的引入簡(jiǎn)化了優(yōu)化過程,,從而推動(dòng)了該領(lǐng)域的進(jìn)步,。同樣,TextGrad 通過反向傳播 LLM 生成的反饋來執(zhí)行優(yōu)化,,以改進(jìn)人工智能系統(tǒng),。只需幾行代碼,用戶就可以將用于分類數(shù)據(jù)的“逐步推理”提示轉(zhuǎn)換為更復(fù)雜的,、針對(duì)特定應(yīng)用的提示,。
TextGrad 是一個(gè)多功能框架,,基于三個(gè)原則構(gòu)建:一切皆為文本,,使用語言模型評(píng)估輸出、評(píng)論它們并更新輸入,。這個(gè)框架利用自然語言反饋對(duì)系統(tǒng)的任何部分提出改進(jìn)建議,,從提示到輸出,如分子或治療方案等,。相關(guān)研究論文發(fā)表在《Nature》上,,展示了如何在博士級(jí)問題解答和高難度編程問題中實(shí)現(xiàn) SOTA 性能,并通過優(yōu)化藥物發(fā)現(xiàn)的分子和治療方案來解決科學(xué)問題,。研究表明,,無需修改框架,TextGrad 即可在多個(gè)領(lǐng)域發(fā)揮作用,。
TextGrad 提供了一個(gè)遵循 PyTorch 語法的 API,允許用戶通過使用僅由語言模型提供的文本反饋來優(yōu)化任何提示或結(jié)果,。它還允許語言模型自我完善其響應(yīng),,評(píng)估由任何潛在的黑盒函數(shù)提供,例如語言模型本身或代碼解釋器的輸出,。研究團(tuán)隊(duì)在解法優(yōu)化,、代碼優(yōu)化、推理提示優(yōu)化,、放療計(jì)劃優(yōu)化以及復(fù)合人工智能系統(tǒng)優(yōu)化方面進(jìn)行了實(shí)驗(yàn),。在放射治療計(jì)劃優(yōu)化中,TextGrad 表現(xiàn)優(yōu)于臨床計(jì)劃,實(shí)現(xiàn)了更高的平均劑量和與規(guī)定劑量完全一致的 D95,,同時(shí)降低了對(duì)健康器官的劑量,。
此外,,TextGrad 還支持聯(lián)合優(yōu)化多模態(tài)任務(wù)的指令提示、解決方案及評(píng)估提示,,在空間推理數(shù)據(jù)集 HQH 上將準(zhǔn)確率提升了 9%,。實(shí)驗(yàn)表明,TextGrad 能夠靈活處理多變量,、長(zhǎng)鏈推理的復(fù)雜系統(tǒng),,顯著提升整體性能,為自動(dòng)化優(yōu)化多組件 AI 系統(tǒng)提供了通用框架,。
James Zou 本科畢業(yè)于杜克大學(xué),并于哈佛大學(xué)取得博士學(xué)位,,現(xiàn)為斯坦福大學(xué)生物醫(yī)學(xué)數(shù)據(jù)科學(xué)副教授,,曾獲斯隆獎(jiǎng)學(xué)金。他的研究工作主要集中在使機(jī)器學(xué)習(xí)更加可靠,、符合人類需求以及統(tǒng)計(jì)嚴(yán)謹(jǐn),,同時(shí)也涉及 AI 在人類疾病和健康方面的應(yīng)用。2023 年 8 月,,他和他的團(tuán)隊(duì)首次展示了利用 Twitter 數(shù)據(jù)開發(fā)“病理圖像-文本對(duì)應(yīng)”的自然語言-圖像預(yù)訓(xùn)練模型,。2024 年 4 月,他們推出了一個(gè)名為 SyntheMol 的生成式 AI 模型,,可以設(shè)計(jì)數(shù)十億種新的抗生素分子,。此外,James Zou 團(tuán)隊(duì)還構(gòu)建了一個(gè)名為 Virtual Lab 的多智能體系統(tǒng),,由一個(gè) AI 模型作為首席研究員,,帶領(lǐng)具有不同科學(xué)背景的 agent 和一名人類研究員共同協(xié)作。隨著人工智能范式的轉(zhuǎn)變,,自動(dòng)優(yōu)化器 TextGrad 將為訓(xùn)練大型復(fù)合 AI 模型開辟令人興奮的機(jī)會(huì),。