當(dāng)前位置：新聞 > 正文

ChatGPT能考上美國醫(yī)生嗎,？

2023-02-10 18:51:00 來源：新華網(wǎng) A+A-

新華社北京2月10日電美國執(zhí)業(yè)醫(yī)師資格考試以難度大著稱,，而美國研究人員發(fā)現(xiàn)，聊天機(jī)器人ChatGPT無需經(jīng)過專門訓(xùn)練或加強(qiáng)學(xué)習(xí)就能通過或接近通過這一考試,。對此,，有人對人工智能在臨床醫(yī)學(xué)的應(yīng)用充滿期待，有人則開始反思美國醫(yī)學(xué)教育及相關(guān)考試的不足,。

參與這項研究的人主要來自美國醫(yī)療保健初創(chuàng)企業(yè)安西布爾健康公司(AnsibleHealth),。他們在美國《科學(xué)公共圖書館·數(shù)字健康》雜志9日刊載的論文中說，他們從美國執(zhí)業(yè)醫(yī)師資格考試官網(wǎng)2022年6月發(fā)布的376個考題中篩除基于圖像的問題,，讓ChatGPT回答剩余350道題。這些題類型多樣,，既有要求考生依據(jù)已有信息給患者下診斷這樣的開放式問題,，也有諸如判斷病因之類的選擇題。兩名評審人員負(fù)責(zé)閱卷打分,。

2022年1月25日，醫(yī)務(wù)人員在意大利博洛尼亞一家醫(yī)院的新冠重癥監(jiān)護(hù)室工作,。新華社發(fā)

結(jié)果顯示,，在三個考試部分,，去除模糊不清的回答后，ChatGPT得分率在52.4%至75%之間,，而得分率60%左右即可視為通過考試,。值得注意的是，ChatGPT有88.9%的主觀回答包括“至少一個重要的見解”,，即見解較新穎,、臨床上有效果且并非人人能看出來。相比之下,，專門針對生物醫(yī)學(xué)領(lǐng)域文獻(xiàn)訓(xùn)練出來的一款大型語言模型PubMedGPT在類似測試中得分率剛過50%,。

研究人員說，“在這個出了名難考的專業(yè)考試中達(dá)到及格分?jǐn)?shù),，且在沒有任何人為強(qiáng)化（訓(xùn)練）的前提下做到這一點”,，這是人工智能在臨床醫(yī)學(xué)應(yīng)用方面“值得注意的一件大事”，顯示“大型語言模型可能有輔助醫(yī)學(xué)教育,、甚至臨床決策的潛力”,。

實際上，在這篇論文初稿寫作過程中,，ChatGPT就做出了“較大貢獻(xiàn)”,，與研究人員關(guān)系如同事般，而安西布爾健康公司的臨床醫(yī)生們也已在使用ChatGPT改寫一些術(shù)語繁多的報告,，以便患者理解,。

12 全文共 2 頁下一頁