教育部語言文字應(yīng)用管理司副司長王暉在新聞發(fā)布會上表示,,以深度求索等為代表的人工智能技術(shù)創(chuàng)新不斷取得突破性進展,。在此背景下,,國家提出建設(shè)新型國家語料庫的戰(zhàn)略部署,,凸顯了其重要性,、必要性和緊迫性,。
王暉進一步解釋說,在一些應(yīng)用領(lǐng)域,,尤其是語言的教育教學(xué)和研究領(lǐng)域,,已存在多個語料庫。但許多語料庫仍處于單一文本模式和領(lǐng)域應(yīng)用階段,,在建設(shè)理念,、技術(shù)方法、規(guī)模以及數(shù)據(jù)多樣性,、時效性方面存在不足,,難以滿足多元化、動態(tài)化特別是智能化的語言數(shù)據(jù)需求,。
他指出,,要立足人工智能時代大背景,突破傳統(tǒng)語料庫單一文本模式和領(lǐng)域應(yīng)用壁壘,,以大模型訓(xùn)練及性能評測,、智能計算為核心,建設(shè)具有新質(zhì)態(tài),、多模態(tài),、多語言、大規(guī)模,、全域性的語料庫,,為通用領(lǐng)域和細(xì)分領(lǐng)域的多場景應(yīng)用及創(chuàng)新發(fā)展提供規(guī)范、可信、高質(zhì)量的語言文化語料資源,。
近期,,教育部、國家語委和中央網(wǎng)信辦聯(lián)合印發(fā)的《關(guān)于加強數(shù)字中文建設(shè)推進語言文字信息化發(fā)展的意見》中提到,,到2027年,,國家數(shù)字中文建設(shè)行動將取得重要成效,語言文字?jǐn)?shù)據(jù)要素價值得到有效釋放,。屆時將基本形成政府主導(dǎo),、部門協(xié)同、社會參與,、共建共享的工作機制,;初步建成國家語言文字大數(shù)據(jù)中心和關(guān)鍵語料庫,增強語言文字信息化標(biāo)準(zhǔn),、前沿語言技術(shù),、優(yōu)質(zhì)語言資源、新型語言服務(wù)等基礎(chǔ)支撐能力,。
從2025年起,已經(jīng)啟動布局新型國家語料庫建設(shè)工作,。王暉介紹,,一是通過規(guī)范引領(lǐng),加強制度供給,,研制語料庫建設(shè)規(guī)范,,突出價值導(dǎo)向、應(yīng)用導(dǎo)向,、創(chuàng)新導(dǎo)向,,統(tǒng)籌質(zhì)量和安全,為語料庫建設(shè)提供基本原則和方法指引,。二是示范引導(dǎo),,開發(fā)建設(shè)“中華文脈新型語料庫”和“中華大閱讀體系語料庫”,這兩個示范庫分別瞄準(zhǔn)智慧教師和智慧學(xué)伴,,探索建設(shè)系列教育,、語言文化國家新型語料庫群,服務(wù)教育強國,、文化強國建設(shè),。
目前,教育部,、國家語委已支持建設(shè)30余項關(guān)鍵領(lǐng)域的語料庫,,作為新基建服務(wù)于大語言模型和生成式人工智能等技術(shù)前沿創(chuàng)新應(yīng)用。此外,還布局了五個領(lǐng)域的自主安全可控大語言模型建設(shè)項目,,下一步將根據(jù)需求穩(wěn)步擴大建設(shè)范圍,,提升建設(shè)成效。
教育部語言文字信息管理司司長劉培俊強調(diào),,要夯實機制,、標(biāo)準(zhǔn)、人才三個基礎(chǔ),,逐步建立健全語料共建共享新機制,,制定語言資源、語言數(shù)據(jù),、基礎(chǔ)語料以及大語言模型的技術(shù)和管理標(biāo)準(zhǔn),,并依托高校研究機構(gòu)推進多學(xué)科交叉融合,培養(yǎng)高素質(zhì)人才,,推動語言科技,、語料建設(shè)和人工智能創(chuàng)新應(yīng)用的發(fā)展。
11月11日,,教育部舉行新聞發(fā)布會,解讀《中華人民共和國學(xué)前教育法》并介紹教育系統(tǒng)學(xué)習(xí)宣傳貫徹落實法律有關(guān)情況
2024-11-11 14:43:00教育部回應(yīng)教育“搶跑”今天,,國家發(fā)展改革委宣布,,今年將有序開展高質(zhì)量戶外運動目的地建設(shè),,目標(biāo)是在2030年前建成約100個高質(zhì)量戶外運動目的地
2025-04-09 14:32:17國家將打造100個戶外運動目的地