九九九中文无码A∨|亚洲国产成人最新精品|国产AV无码精品色午夜|国产精品久久久久三级无码|日韩欧美一区国产二区在线|欧美另类精品一区二区三区|精品一区二区三区毛片视频网|中文字幕日韩精品一区二区三区

中國企業(yè)報集團主管主辦

中國企業(yè)信息交流平臺

微博 微信

網(wǎng)上問(wèn)醫斷病,這輪AI行不行?

2023-07-18 10:31 來(lái)源:科技日報 次閱讀
 
網(wǎng)上問(wèn)醫斷病,這輪AI行不行?

你在網(wǎng)上搜過(guò)“我哪哪疼是不是得了啥啥病”嗎?答案可能不盡如人意。但隨著(zhù)ChatGPT等大型自然語(yǔ)言模型(LLM)風(fēng)生水起,人們開(kāi)始嘗試用它來(lái)回答醫學(xué)問(wèn)題或醫學(xué)知識。

  不過(guò),靠譜嗎?

  就其本身而言,人工智能(AI)給出的答案是準確的。但英國巴斯大學(xué)教授詹姆斯·達文波特指出了醫學(xué)問(wèn)題和實(shí)際行醫之間的區別,他認為“行醫并不只是回答醫學(xué)問(wèn)題,如果純粹是回答醫學(xué)問(wèn)題,我們就不需要教學(xué)醫院,醫生也不需要在學(xué)術(shù)課程之后接受多年的培訓了?!?/p>

  鑒于種種疑惑,在《自然》雜志新近發(fā)表的一篇論文中,全球頂尖的人工智能專(zhuān)家們展示了一個(gè)基準,用于評估大型自然語(yǔ)言模型能多好地解決人們的醫學(xué)問(wèn)題。

  現有的模型尚不完善

  最新的這項評估,來(lái)自谷歌研究院和深度思維公司。專(zhuān)家們認為,人工智能模型在醫學(xué)領(lǐng)域有許多潛力,包括知識檢索和支持臨床決策。但現有的模型尚不完善,例如可能會(huì )編造令人信服的醫療錯誤信息,或納入偏見(jiàn)加劇健康不平等。因此才需要對其臨床知識進(jìn)行評估。

  相關(guān)的評估此前并非沒(méi)有。然而,過(guò)去通常依賴(lài)有限基準的自動(dòng)化評估,例如個(gè)別醫療測試得分。這轉化到真實(shí)世界中,可靠性和價(jià)值都有欠缺。

  而且,當人們轉向互聯(lián)網(wǎng)獲取醫療信息時(shí),他們會(huì )遭遇“信息超載”,然后從10種可能的診斷中選擇出最壞的一種,從而承受很多不必要的壓力。

  研究團隊希望語(yǔ)言模型能提供簡(jiǎn)短的專(zhuān)家意見(jiàn),不帶偏見(jiàn)、表明其引用來(lái)源,并合理表達出不確定性。

  5400億參數的LLM表現如何

  為評估LLM編碼臨床知識的能力,谷歌研究院的專(zhuān)家謝庫菲·阿齊茲及其同事探討了它們回答醫學(xué)問(wèn)題的能力。團隊提出了一個(gè)基準,稱(chēng)為“MultiMedQA”:它結合了6個(gè)涵蓋專(zhuān)業(yè)醫療、研究和消費者查詢(xún)的現有問(wèn)題回答數據集以及“HealthSearchQA”——這是一個(gè)新的數據集,包含3173個(gè)在線(xiàn)搜索的醫學(xué)問(wèn)題。

  團隊隨后評估了PaLM(一個(gè)5400億參數的LLM)及其變體Flan-PaLM。他們發(fā)現,在一些數據集中Flan-PaLM達到了最先進(jìn)水平。在整合美國醫師執照考試類(lèi)問(wèn)題的MedQA數據集中,Flan-PaLM超過(guò)此前最先進(jìn)的LLM達17%。

  不過(guò),雖然Flan-PaLM的多選題成績(jì)優(yōu)良,進(jìn)一步評估顯示,它在回答消費者的醫療問(wèn)題方面存在差距。

  專(zhuān)精醫學(xué)的LLM令人鼓舞

  為解決這一問(wèn)題,人工智能專(zhuān)家們使用一種稱(chēng)為設計指令微調的方式,進(jìn)一步調試Flan-PaLM適應醫學(xué)領(lǐng)域。同時(shí),研究人員介紹了一個(gè)專(zhuān)精醫學(xué)領(lǐng)域的LLM——Med-PaLM。

  設計指令微調是讓通用LLM適用新的專(zhuān)業(yè)領(lǐng)域的一種有效方法。產(chǎn)生的模型Med-PaLM在試行評估中表現令人鼓舞。例如,Flan-PaLM被一組醫師評分與科學(xué)共識一致程度僅61.9%的長(cháng)回答,Med-PaLM的回答評分為92.6%,相當于醫師作出的回答(92.9%)。同樣,Flan-PaLM有29.7%的回答被評為可能導致有害結果,Med-PaLM僅5.8%,相當于醫師所作的回答(6.5%)。

  研究團隊提到,結果雖然很有前景,但有必要作進(jìn)一步評估,特別是在涉及安全性、公平性和偏見(jiàn)方面。

  換句話(huà)說(shuō),在LLM的臨床應用可行之前,還有許多限制要克服。

◎本報記者 張夢(mèng)然

點(diǎn)贊()
上一條:上海德達醫院團隊受邀參加美國血管外科協(xié)會(huì )年會(huì )2023-07-11
下一條:美首例機器人肝移植手術(shù)成功2023-07-19

相關(guān)稿件

治療帕金森病常備藥多地斷供 網(wǎng)售價(jià)高出醫保價(jià)十余倍 2021-10-22
阿里大語(yǔ)言模型“通義千問(wèn)”亮相 引發(fā)市場(chǎng)關(guān)注 2023-04-12
王毅答記者問(wèn) 這十五句精彩回應 擲地有聲 2021-03-08
關(guān)愛(ài)“罕見(jiàn)” 點(diǎn)亮生命之光——我國加速破解罕見(jiàn)病診療和用藥保障之困 2023-03-01
ChatGPT來(lái)了 AI企業(yè)如何應對 2023-02-14
國務(wù)院國有資產(chǎn)管理委員會(huì ) 中國企業(yè)聯(lián)合會(huì ) 中國企業(yè)報 中國社會(huì )經(jīng)濟網(wǎng) 中國國際電子商務(wù)網(wǎng) 新浪財經(jīng) 鳳凰財經(jīng) 中國報告基地 企業(yè)社會(huì )責任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國網(wǎng) 天機網(wǎng) 中貿網(wǎng) 湖南經(jīng)濟新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國經(jīng)濟網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟網(wǎng) 華訊財經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當代金融家雜志 借貸撮合網(wǎng) 大公財經(jīng) 誠搜網(wǎng) 中國鋼鐵現貨網(wǎng) 證券之星 融易在線(xiàn) 2014世界杯 中華魂網(wǎng) 納稅人俱樂(lè )部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國國資報道 金融界 中國農業(yè)新聞網(wǎng) 中國招商聯(lián)盟 和訊股票 經(jīng)濟網(wǎng) 中國數據分析行業(yè)網(wǎng) 中國報道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng )新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國石油化工集團 中國保利集團公司 東風(fēng)汽車(chē)公司 中國化工集團公司 中國電信集團公司 華為技術(shù)有限公司 廈門(mén)銀鷺食品有限公司 中國恒天集團有限公司 濱州東方地毯集團有限公司 大唐電信科技股份有限公司 中國誠通控股集團有限公司 喜來(lái)健醫療器械有限公司 中國能源建設股份有限公司 內蒙古伊利實(shí)業(yè)集團股份有限公司 中國移動(dòng)通信集團公司 中國化工集團公司 貴州茅臺酒股份有限公司
南丹县| 板桥市| 博客| 新和县| 温泉县| 六枝特区| 静海县| 安西县| 即墨市| 富锦市| 永仁县| 龙岩市| 商河县| 永登县| 白水县| 牙克石市| 康乐县| 南丰县| 正宁县| 衡南县| 安龙县| 临夏县| 张掖市| 宣汉县| 宾阳县| 达拉特旗| 平定县| 大化| 台前县| 岑溪市| 普格县| 南投市| 武定县| 革吉县| 沙洋县| 嘉义市| 广德县| 南雄市| 衡东县| 手机| 辽阳市|