2025年2月19日星期三
梁文鋒帶領(lǐng)實(shí)習(xí)生袁景陽發(fā)表了一篇關(guān)于原生稀疏注意力(NSA)的技術(shù)論文。這篇論文于2月18日在海外社交平臺上發(fā)布,,主要介紹了NSA技術(shù)如何通過動態(tài)分層稀疏策略優(yōu)化傳統(tǒng)AI模型在長文本訓(xùn)練與推理中的表現(xiàn),,提升推理速度并降低預(yù)訓(xùn)練成本。
DeepSeek的新論文揭示了原生稀疏注意力技術(shù),,旨在優(yōu)化AI模型的訓(xùn)練與推理過程,,特別是提升長文本處理能力。這可能增強(qiáng)市場對AI領(lǐng)域公司的信心,,并推動行業(yè)向前發(fā)展,。相關(guān)企業(yè)的股價穩(wěn)定性與成長性有望得到正面審視,AI板塊的整體吸引力料將因此增強(qiáng),,對股市整體的技術(shù)創(chuàng)新氛圍產(chǎn)生積極影響,。
Meta宣布將在4月29日舉行首屆LlamaCon,這是專門面向生成式人工智能的開發(fā)者大會,。大會的名字源于Meta的開源AI模型Llama系列,。屆時公司將分享開源AI發(fā)展的最新動態(tài),幫助開發(fā)者構(gòu)建創(chuàng)新應(yīng)用和產(chǎn)品,。具體議程,、演講嘉賓及展示的技術(shù)細(xì)節(jié)尚未公布,但會在接下來幾周內(nèi)陸續(xù)公開,。
Meta首屆AI開發(fā)者大會LlamaCon聚焦生成式人工智能,,此舉可能提升市場對Meta在AI領(lǐng)域領(lǐng)導(dǎo)力的認(rèn)可。技術(shù)分享有望激發(fā)創(chuàng)新應(yīng)用開發(fā),,對AI板塊產(chǎn)生積極效應(yīng),。整體而言,此事件或增強(qiáng)投資者對高科技股的關(guān)注度,,為股市注入技術(shù)創(chuàng)新動力,,有利于提升市場對前沿技術(shù)企業(yè)的整體評價,。
OpenAI前首席技術(shù)官M(fèi)ira Murati成立了一家名為Thinking Machines Lab的新公司,專注于構(gòu)建支持“人機(jī)協(xié)作”的AI模型和產(chǎn)品,。新公司團(tuán)隊(duì)包括多位OpenAI前高管,,如首席科學(xué)家John Schulman、首席技術(shù)官Barret Zoph以及安全負(fù)責(zé)人Lilian Weng,。值得注意的是,,在公司近30名員工中,超過12人曾在OpenAI工作,。
OpenAI前高管聯(lián)手創(chuàng)辦Thinking Machines Lab,,專注人機(jī)協(xié)作AI領(lǐng)域,增強(qiáng)了市場對AI行業(yè)創(chuàng)新潛力的信心,。新公司集結(jié)行業(yè)精英,,預(yù)示AI板塊將迎來新的競爭格局。此舉可能提升投資者對AI企業(yè)長期價值的評估,,對整個股市的技術(shù)創(chuàng)新氛圍產(chǎn)生積極推動,,特別是在人機(jī)協(xié)作這一前沿領(lǐng)域的探索可能激發(fā)更多行業(yè)應(yīng)用和投資機(jī)會。