💎 查看市場今日表現最穩健公司立即開始

重大突破!ChatGPT首次通過神經科考試 研究人員:正確回答85%問題 未來肩負臨牀病學任務

發布 2023-12-12 上午11:55
© Reuters.  重大突破!ChatGPT首次通過神經科考試 研究人員:正確回答85%問題 未來肩負臨牀病學任務

FX168財經報社(香港)訊 OpenAI公司旗下最新研發的大型語言模型ChatGPT 4.0已通過臨牀神經學考試,在概念驗證研究中回答了85%的正確答案。研究作者認爲,經過一些微調,ChatGPT就可以在臨牀神經病學中具有「重大應用」。當前,人工智能(AI)已在爲阿斯利康尋找癌症治療方法,還有對抗香港抗生素的過度處方。

這項實驗結果由海德堡大學醫院和海德堡德國癌症研究中心的一組研究人員於12月7日發佈,該測試於5月31日進行,測試對象包括兩個大型語言模型,即ChatGPT 3.5及其更高版本ChatGPT 4.0。

(來源:CoinTelegraph)

研究人員使用了美國精神病學和神經病學委員會的神經病學考試題庫,以及歐洲神經病學委員會的一小部分問題。

舊版本的ChatGPT得分爲66.8%,正確回答了1956個問題中的1306個問題,而較新的版本ChatGPT 4.0得分爲85%,正確答案爲1662個。

值得關注的是,普通人類平均得分爲73.8%。這意味着,ChatGPT 4.0的能力已超越了人類平均。

(來源:JAMA Network)

ChatGPT 4.0在行爲、認知和心理相關問題上的表現優於人類用戶,並有效「通過」了神經學考試,因爲70%的正確答案通常被教育機構視爲及格分數。

然而,這兩種模型在需要「高階思維」的任務中的表現,都比僅需要「低階思維」的問題表現得更弱。

根據進行實驗的研究人員小組的說法,這些結果可以作爲在一些修改後在臨牀神經病學中使用ChatGPT的建議。

他們指出:「這些發現表明,通過進一步完善,大型AI語言模型可以在臨牀神經病學中具有重要的應用。」

研究人員指出,目前仍存在一些保留意見。儘管在文檔和決策支持系統中應用ChatGPT有一個明確的前景,但神經學家應該謹慎對待它們在實踐中的使用,因爲它們在高階認知任務方面仍然不完善。

該研究的作者之一Varun Venkataramani博士在接受採訪時表示:「我們將目前的研究更多地視爲對ChatGPT能力的概念驗證。」#ChatGPT火爆全網#

「AI語言模型仍然需要發展,甚至可能需要進行具體的微調,以使其正確適用於臨牀神經病學,」他補充道。

實際上,當前AI已經在致力於醫療保健領域的一些重大任務,例如爲阿斯利康尋找癌症治療方法,或是對抗香港抗生素的過度處方。

原文鏈接

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2024 - Fusion Media Limited保留所有權利