亚洲一卡2卡3卡4卡5卡6卡_99RE6在线观看国产精品_99欧美日本一区二区留学生_成人国产精品日本在线观看_丰满爆乳在线播放_免费国产午夜理论片不卡_欧美成人影片免费观看_日产中字乱码一二三_肉感饱满中年熟妇日本_午夜男女爽爽影院免费视频下载,民工把我奶头掏出来在线视频,日韩经典亚洲,国产精品JIZZ在线观看无码

中華網(wǎng) china.com

新聞

國(guó)內(nèi) 國(guó)際社會(huì) 體育專題軍事財(cái)經(jīng) 滾動(dòng) 政務(wù) 冬奧

Meta無(wú)限長(zhǎng)文本大模型來(lái)了：參數(shù)僅7B,，已開(kāi)源高效穩(wěn)定,，超越Transformer(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-04-18 12:57:16 搜狐網(wǎng)

論文詳細(xì)介紹了MEGALODON的技術(shù)創(chuàng)新，包括對(duì)MEGA架構(gòu)中關(guān)鍵組件的回顧及存在問(wèn)題的探討,。為解決MEGA面臨的表達(dá)能力受限,、架構(gòu)差異及無(wú)法大規(guī)模預(yù)訓(xùn)練等問(wèn)題，研究者創(chuàng)新提出CEMA,，將多維阻尼EMA擴(kuò)展至復(fù)數(shù)域,；引入時(shí)間步歸一化，通過(guò)計(jì)算累積均值與方差,，將組歸一化擴(kuò)展至自回歸情況,；定制歸一化注意力機(jī)制以提升穩(wěn)定性；并設(shè)計(jì)具有Two-hop殘差的預(yù)范數(shù)結(jié)構(gòu),，有效應(yīng)對(duì)模型規(guī)模擴(kuò)大帶來(lái)的預(yù)歸一化不穩(wěn)定問(wèn)題,。

實(shí)驗(yàn)結(jié)果顯示，MEGALODON在長(zhǎng)上下文序列建模的可擴(kuò)展性與效率上表現(xiàn)出色,。在相同訓(xùn)練token下,，MEGALODON-7B的負(fù)對(duì)數(shù)似然（NLL）優(yōu)于LLAMA2-7B，顯示出更高的數(shù)據(jù)效率,。在不同上下文長(zhǎng)度下的WPS（word/token per second）對(duì)比中,，MEGALODON-7B在處理長(zhǎng)上下文時(shí)速度明顯快于LLAMA2-7B，印證了其在長(zhǎng)上下文預(yù)訓(xùn)練中的計(jì)算效率優(yōu)勢(shì),。

在各項(xiàng)基準(zhǔn)測(cè)試中,，MEGALODON均展現(xiàn)出優(yōu)秀性能，無(wú)論是在短上下文任務(wù),，還是長(zhǎng)上下文任務(wù),，以及指令微調(diào)、中等規(guī)?；鶞?zhǔn)評(píng)估（如ImageNet-1K圖像分類與PG-19文本生成）等方面,，MEGALODON均取得優(yōu)異成績(jī)，部分甚至超越已使用RLHF進(jìn)行對(duì)齊微調(diào)的模型。這些成果充分驗(yàn)證了MEGALODON在無(wú)限長(zhǎng)上下文建模領(lǐng)域的先進(jìn)性與廣泛應(yīng)用潛力,。

首頁(yè)上一頁(yè)12共 2 頁(yè)

(責(zé)任編輯：張蕾)

關(guān)閉

瑞幸稱凱旋麥麥酒精度低于0.5度喝完勿開(kāi)車

瑞幸稱凱旋麥麥酒精度低于0.5度2024-07-02 11:10:38

當(dāng)27歲的阿斯塔納遇上23歲的上合,，一起找尋青春的氣息！

當(dāng)27歲的阿斯塔納遇上23歲的上合2024-07-02 11:09:23

什么是住房公積金年度結(jié)息,？

什么是住房公積金年度結(jié)息2024-07-02 11:07:47

湖南一工作人員防汛時(shí)被水沖走失聯(lián)

湖南一工作人員防汛時(shí)被水沖走失聯(lián)2024-07-02 11:01:36

菲律賓,，又傳來(lái)一個(gè)壞消息

菲律賓，又傳來(lái)一個(gè)壞消息2024-07-02 09:39:24

高三女生賣游戲ID反被騙900元

高三女生賣游戲ID反被騙900元2024-07-02 11:03:44

農(nóng)村學(xué)生營(yíng)養(yǎng)餐補(bǔ)貼不能成“唐僧肉”

媒體：學(xué)生營(yíng)養(yǎng)餐豈能成為唐僧肉2024-07-02 10:58:33

160萬(wàn)房降到39萬(wàn)可以不還房貸嗎,？樓市寒冬下的購(gòu)房者困境

160萬(wàn)房降到39萬(wàn)可以不還房貸嗎2024-07-02 11:03:43

匈牙利接任歐盟輪值主席國(guó)前夕,，歐爾班發(fā)文：歐盟領(lǐng)導(dǎo)層想與俄開(kāi)戰(zhàn)

匈牙利接任歐盟輪值主席國(guó)前夕，歐爾班發(fā)文：歐盟領(lǐng)導(dǎo)層想與俄開(kāi)戰(zhàn)2024-07-01 10:10:32

炒作所謂“間諜”風(fēng)險(xiǎn),，白宮欲對(duì)中國(guó)起重機(jī)加稅,，美港口群起反對(duì)！

炒作所謂“間諜”風(fēng)險(xiǎn),，白宮欲對(duì)中國(guó)起重機(jī)加稅,，美港口群起反對(duì)！2024-07-02 10:11:08

美國(guó)究竟有多少核彈頭,？最新數(shù)據(jù)

美國(guó)究竟有多少核彈頭,？最新數(shù)據(jù)2024-07-01 10:06:48

“寧愿死也不參軍！”以色列極端正統(tǒng)派上街抗議征兵

“寧愿死也不參軍,！”以色列極端正統(tǒng)派上街抗議征兵2024-07-02 10:03:15

平江暴雨為何洪水排不出去道路塌方引擔(dān)憂

平江暴雨為何洪水排不出去2024-07-02 10:59:18

法國(guó)“屏住呼吸”舉行議會(huì)選舉,！美媒：此次選舉可能“撼動(dòng)歐盟與北約”

法國(guó)“屏住呼吸”舉行議會(huì)選舉！美媒：此次選舉可能“撼動(dòng)歐盟與北約”2024-07-01 09:57:53

上?？崭劭诎度刖陈每蛿?shù)量持續(xù)增長(zhǎng) 外籍旅客增幅顯著

上?？崭劭诎度刖陈每蛿?shù)量持續(xù)增長(zhǎng)2024-07-02 11:00:02

以色列在加沙試點(diǎn)逐漸取代哈馬斯，被哈馬斯武力挫敗

以色列在加沙試點(diǎn)逐漸取代哈馬斯,，被哈馬斯武力挫敗2024-07-02 09:56:55

高?；貞?yīng)開(kāi)設(shè)"導(dǎo)彈維修技術(shù)"專業(yè)：是真的

高校回應(yīng)開(kāi)設(shè)導(dǎo)彈維修技術(shù)專業(yè)2024-07-02 11:04:09

議起復(fù)盤馬刺童話過(guò)于美好勇士三叉戟解體終究未能復(fù)制傳奇

議起復(fù)盤馬刺童話過(guò)于美好勇士三叉戟解體終究未能復(fù)制傳奇2024-07-02 11:00:19

大選辯論后,，拜登陷入“勸退”漩渦,！美媒刊文：“他已不是4年前的他了”

大選辯論后，拜登陷入“勸退”漩渦,！美媒刊文：“他已不是4年前的他了”2024-07-01 09:56:21

黨內(nèi)盟友涌向媒體,，千方百計(jì)轉(zhuǎn)移話題，拜登開(kāi)展危機(jī)公關(guān)救選情,！

黨內(nèi)盟友涌向媒體,，千方百計(jì)轉(zhuǎn)移話題，拜登開(kāi)展危機(jī)公關(guān)救選情,！2024-07-02 10:15:18

限制北約收集情報(bào),，威脅擊落美無(wú)人機(jī),！俄軍考慮在黑海設(shè)立禁飛區(qū)

限制北約收集情報(bào)，威脅擊落美無(wú)人機(jī),！俄軍考慮在黑海設(shè)立禁飛區(qū)2024-07-01 10:05:32

張志杰母親聽(tīng)聞噩耗病倒入院家庭支柱驟失引悲痛

張志杰母親聽(tīng)聞噩耗病倒入院2024-07-02 11:03:27

美媒炒作：盟友不是信不過(guò)拜登,，質(zhì)疑聲太多恐“便宜”了中俄

美媒炒作：盟友不是信不過(guò)拜登，質(zhì)疑聲太多恐“便宜”了中俄2024-07-01 10:09:25

央行今年多次提示長(zhǎng)債風(fēng)險(xiǎn) 債市"糾偏"行動(dòng)升級(jí)

央行今年多次提示長(zhǎng)債風(fēng)險(xiǎn)2024-07-02 10:59:42

國(guó)會(huì)請(qǐng)?jiān)妇W(wǎng)站一度癱瘓,！80萬(wàn)韓國(guó)網(wǎng)民要求“彈劾尹錫悅”

國(guó)會(huì)請(qǐng)?jiān)妇W(wǎng)站一度癱瘓,！80萬(wàn)韓國(guó)網(wǎng)民要求“彈劾尹錫悅”2024-07-02 10:19:06

新華社談張志杰離世：生命至上應(yīng)是賽場(chǎng)的最高規(guī)則

新華社談張志杰離世:生命至上2024-07-02 11:05:12

衛(wèi)星影像顯示山東艦抵菲附近海域，外媒猜測(cè)有“威懾”之意,？軍事專家解讀

衛(wèi)星影像顯示山東艦抵菲附近海域,，外媒猜測(cè)有“威懾”之意,？軍事專家解讀2024-07-01 09:53:57

中企高管菲律賓被撕票疑受邀前去考察

中企高管菲律賓被撕票疑受邀前去考察2024-07-02 11:06:39

什么是住房公積金年度結(jié)息,？

什么是住房公積金年度結(jié)息2024-07-02 11:07:47

瑞幸稱凱旋麥麥酒精度低于0.5度喝完勿開(kāi)車

瑞幸稱凱旋麥麥酒精度低于0.5度2024-07-02 11:10:38

當(dāng)27歲的阿斯塔納遇上23歲的上合，一起找尋青春的氣息,！

當(dāng)27歲的阿斯塔納遇上23歲的上合2024-07-02 11:09:23

中國(guó)一個(gè)“管理?xiàng)l例”,，又讓西方破了大防

中國(guó)一個(gè)“管理?xiàng)l例”，又讓西方破了大防2024-07-02 09:43:29

澤連斯基稱不排除與俄“迂回”談判,，烏媒：談判態(tài)度發(fā)生“180度大轉(zhuǎn)彎”,！

澤連斯基稱不排除與俄“迂回”談判，烏媒：談判態(tài)度發(fā)生“180度大轉(zhuǎn)彎”,！2024-07-02 10:20:00

百花獎(jiǎng)提名揭曉：《萬(wàn)里歸途》《封神》領(lǐng)銜競(jìng)爭(zhēng)激烈

百花獎(jiǎng)提名2024-07-02 11:04:04

“買家秀”,！塞爾維亞首次公開(kāi)展示紅旗-17AE防空系統(tǒng)

“買家秀”！塞爾維亞首次公開(kāi)展示紅旗-17AE防空系統(tǒng)2024-07-01 10:04:00

相關(guān)新聞

中國(guó)大模型登頂全球開(kāi)源第一,！
金融領(lǐng)域正成為大型模型應(yīng)用的重要潛在場(chǎng)景,。度小滿公司近期在金融大模型的實(shí)踐上取得顯著進(jìn)展，致力于解決該領(lǐng)域落地的實(shí)際難題,，并把握信息技術(shù)進(jìn)步帶來(lái)的機(jī)遇,，加速推進(jìn)大模型的研發(fā)與應(yīng)用，以強(qiáng)化其技術(shù)基礎(chǔ)
2024-06-27 13:34:44中國(guó)大模型登頂全球開(kāi)源第一
昆侖萬(wàn)維宣布天工3.0大模型開(kāi)啟公測(cè),，擁有4000億參數(shù)
4月17日,，昆侖萬(wàn)維發(fā)布重要消息：其自主研發(fā)的“天工3.0”基座大模型及“天工SkyMusic”音樂(lè)大模型已面向公眾開(kāi)放公測(cè)
2024-04-17 15:00:08昆侖萬(wàn)維宣布天工3.0大模型開(kāi)啟公測(cè)
Meta CEO扎克伯格最新采訪：最強(qiáng)開(kāi)源模型Llama 3憑什么值百億美金
Meta公司近日震撼發(fā)布開(kāi)源大語(yǔ)言模型Meta Llama 3，此舉被視為人工智能發(fā)展歷程中的重要里程碑,。Llama 3首批推出兩款版本,，分別擁有80億參數(shù)（Llama 3 8B）和700億參數(shù)（Llama 3 70B）。
2024-04-19 13:49:45Meta
昇騰社區(qū)回應(yīng)華為發(fā)布會(huì)被指造假：是讀取外部開(kāi)源大模型實(shí)時(shí)生成的圖片
5月16日,，昇騰社區(qū)就網(wǎng)傳發(fā)布會(huì)演示造假的質(zhì)疑做出回應(yīng),。在5月10日的鯤鵬昇騰開(kāi)發(fā)者大會(huì)上，他們展示了一項(xiàng)mxRAG SDK的功能,，旨在向開(kāi)發(fā)者證明僅需少量代碼就能快速開(kāi)發(fā)RAG應(yīng)用
2024-05-16 14:24:44昇騰社區(qū)回應(yīng)華為發(fā)布會(huì)被指造假：是讀取外部開(kāi)源大模型實(shí)時(shí)生成的圖片
美國(guó)最該尷尬的,，是今天中國(guó)開(kāi)源模型們重大的貢獻(xiàn) 通義大模型引領(lǐng)創(chuàng)新潮
5月9日的阿里云AI智領(lǐng)者峰會(huì)上,，阿里云首席技術(shù)官周靖人分享了通義大模型的最新應(yīng)用和服務(wù)數(shù)據(jù)。據(jù)統(tǒng)計(jì),，通義大模型通過(guò)阿里云已服務(wù)于超過(guò)9萬(wàn)家企業(yè),，而通過(guò)釘釘平臺(tái)，這一數(shù)字達(dá)到了220萬(wàn)
2024-05-11 21:21:50美國(guó)最該尷尬的
斯坦福AI團(tuán)隊(duì)“套殼”清華系開(kāi)源大模型被實(shí)錘,，被揭穿后全網(wǎng)刪庫(kù)跑路學(xué)術(shù)誠(chéng)信警鐘再響
近期,，斯坦福大學(xué)的人工智能研究團(tuán)隊(duì)推出了一款名為L(zhǎng)lama3-V的多模態(tài)大型模型，宣稱其性能超越了GPT-4V等其他知名模型
2024-06-04 20:06:10斯坦福AI團(tuán)隊(duì)“套殼”清華系開(kāi)源大模型被實(shí)錘

今日熱點(diǎn)

記者暗訪甲醛檢測(cè)行業(yè)造假黑幕：肆意篡改檢測(cè)結(jié)果

曝美國(guó)再次將核武部署至英國(guó) 北約核態(tài)勢(shì)重大轉(zhuǎn)變

曝美政府內(nèi)部越來(lái)越質(zhì)疑內(nèi)塔尼亞胡白宮擔(dān)憂加劇

上海地鐵老人為搶座坐男子腿上不文明行為引熱議

頻道熱點(diǎn)

主編郵箱
網(wǎng)上不良信息舉報(bào)電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動(dòng)態(tài)
版權(quán)所有中華網(wǎng)

<ruby id="dhnpx"></ruby>

<strong id="dhnpx"><menu id="dhnpx"><pre id="dhnpx"></pre></menu></strong>

<tr id="dhnpx"></tr>