如今,我們用手機,、電腦等電子設(shè)備處理中文信息已經(jīng)習(xí)以為常,而在40多年前,,這是一件難以想象的事情,。
系列報道《新中國的第一》帶您走近新中國第一個計算機中文信息處理系統(tǒng)——漢字激光照排。
四十多年前,,我國的計算機還主要用于科學(xué)運算和國防尖端工程,,系統(tǒng)里沒有精密漢字。報紙,、書刊主要用鉛制的活字排版印刷,,手工挑字、人工排版效率很低,。為此,,新中國在1974年8月設(shè)立國家重點科技攻關(guān)項目“748工程”,研發(fā)漢字信息處理系統(tǒng),。最難的一步,,就是讓精密漢字進入計算機。當(dāng)時還在北大當(dāng)教員的王選和妻子陳堃銶,,參與了這項工程的研究,。
北京大學(xué)王選計算機研究所教授 中國科學(xué)院與中國工程院院士王選夫人 陳堃銶: 英文有二十六個字母,大小寫共五十二個,。我們(漢字)常用字就有六七千,,至少有十幾種字號,還有不同的字體,,這樣一算至少有好幾千兆,。當(dāng)時我們用的計算機內(nèi)存外存加起來六兆多,這個存儲量當(dāng)時就是一個非常大的難題,。
1975年,王選用“參數(shù)表示規(guī)則筆畫,,輪廓表示不規(guī)則筆畫”這種獨一無二的方法,,把幾千兆的漢字字形信息,大大壓縮后存進了只有幾兆內(nèi)存的計算機,,這是新中國在世界上,,首次把精密漢字存入了計算機。經(jīng)過四年的連續(xù)攻關(guān),,王選團隊又采用當(dāng)時超前的激光照排技術(shù),,成功從計算機里輸出了漢字。
1979年7月,新中國誕生第一張用“計算機-激光漢字編輯排版系統(tǒng)”整張輸出的中文報紙,。此后,,從成功排出樣書《伍豪之劍》,,到在新華社中實用成功,,漢字激光照相排版系統(tǒng)成為新中國第一個計算機中文信息處理系統(tǒng),,后來不僅風(fēng)靡全國,,也出口到日本和歐美等發(fā)達國家。
陳堃銶: 他們?nèi)毡菊f為什么要買中國的,?就是覺得是最好,。我們中國人是很聰明的,真是,,就只要我們能夠踏踏實實地干,。王選有句話,要走向世界,,中國人有這個能力,。
改革開放40多年來,王選團隊自主研發(fā)的一系列高科技成果,,不僅顛覆性改造了新中國的新聞出版印刷行業(yè),,也在世界范圍內(nèi)推動了中文信息化的全面發(fā)展,電子書,、新聞類應(yīng)用軟件等廣泛應(yīng)用在日常生活中,。
北京大學(xué)王選計算機研究所所長 郭宗明: 在如今大數(shù)據(jù)、人工智能的時代,,我們研究跨媒體的檢索,、生成等技術(shù),讓中文信息處理插上了人工智能的翅膀,,使得人們的生活更加個性化,、智能化。
如今,,748工程已經(jīng)過去了40多年,,中文信息處理的研究已經(jīng)從用計算機處理和顯示漢字字形,轉(zhuǎn)向了用計算機對漢字語義的理解和再生成。根據(jù)深度學(xué)習(xí)算法,,計算機可以模仿手寫筆跡造字,,也可以寫文章、作詩,,還能把文字,、音頻、圖像,、視頻,,都轉(zhuǎn)化為同一標準的表達方式,中文信息處理邁入人工智能時代,。
原標題:波蘭交換生:我花很長時間才分清戊,、戌,、戍對外國漢語學(xué)習(xí)者來說,字詞是學(xué)習(xí)中文的敲門磚,,但要想盡快地掌握中文字詞卻需要付出相當(dāng)努力,。