至于“80后死亡率超70后”的說法,,李婷表示,,我國(guó)的人均預(yù)期壽命在穩(wěn)定上漲,在此背景下,,除非發(fā)生特殊情況,,否則不會(huì)出現(xiàn)這么大一個(gè)年齡組死亡率倒掛。
語料訓(xùn)練不足或致AI出錯(cuò)
中新健康記者發(fā)現(xiàn),,這條在網(wǎng)絡(luò)上廣為傳播的消息沒有任何權(quán)威信源,。李婷在自己撰寫的文章中也曾分析,這次這條流傳頗廣的誤導(dǎo)性消息最初來源很可能是和AI的對(duì)話所得,。
那么為何AI會(huì)產(chǎn)生這樣的偏差呢,?
“我個(gè)人推測(cè),,一方面是因?yàn)楹芏鄬W(xué)術(shù)期刊是閉源的,另一方面也是在這方面的語料不足,?!崩铈媒o出了個(gè)人看法。
她分析稱,,目前AI依賴于語料的訓(xùn)練,,但是在實(shí)際的學(xué)術(shù)應(yīng)用中,它對(duì)學(xué)術(shù)語料的獲取有一定的缺陷,,這個(gè)缺陷可能很大程度在于大量的學(xué)術(shù)資源是閉源的,,很難獲取到。現(xiàn)階段,,如果想讓AI提供一個(gè)較專業(yè)的學(xué)術(shù)文獻(xiàn),,經(jīng)常發(fā)現(xiàn)它會(huì)“編”出一些不存在的文獻(xiàn),這樣也就容易產(chǎn)生誤導(dǎo),。
“另外,,本身與‘死亡率’相關(guān)的人口研究,相對(duì)是比較冷門的,,不在日常語料中高頻出現(xiàn),,即便出現(xiàn),在大部分非專業(yè)人士的認(rèn)知里,,也分不清死亡率,、死亡概率(死亡比例)這些詞之間的差異,所以有可能造成網(wǎng)上有些資料將術(shù)語進(jìn)行混用,,出現(xiàn)概念混淆,。”李婷說,。