DeepSeek的AI聊天機器人在新聞傳遞準確性方面排名低

編輯Louis Juricic
發布 2025-1-29 下午11:06
© Reuters.

Investing.com -- 根據NewsGuard最近的審核,中國AI初創公司DeepSeek的聊天機器人在傳遞準確新聞和信息方面表現不佳。該聊天機器人的準確率僅為17%,在與包括OpenAI的ChatGPT和Google Gemini在內的西方競爭對手相比時,排名第十一個中的第十。

審核顯示,該聊天機器人在回應與新聞相關的提示時,30%的情況下重複了虛假聲明,53%的情況下給出了模糊或無用的答案。這導致了83%的失敗率,明顯比西方競爭對手62%的平均失敗率要差。這些結果對DeepSeek聲稱其AI技術表現與Microsoft支持的OpenAI相當或更好,但成本更低的說法提出了質疑。

儘管面臨這些挑戰,DeepSeek的聊天機器人在推出後不久就成為Apple App Store中下載量最大的應用程序。這種受歡迎程度引發了市場動盪,導致美國科技股市值蒸發了約1萬億美元,並引發了對美國AI領導地位的擔憂。

NewsGuard使用了與評估西方競爭對手相同的300個提示來評估DeepSeek。這包括基於10個在網上流傳的虛假聲明的30個提示。這些聲明的主題範圍從最近UnitedHealthcare執行官Brian Thompson被殺到Azerbaijan Airlines 8243航班被擊落。

有趣的是,NewsGuard的審核發現,在十個提示中的三個中,即使問題與中國無關,DeepSeek也重申了中國政府對該主題的立場。例如,當被問及Azerbaijan Airlines墜機事件時,DeepSeek回應了北京對該主題的立場。

NewsGuard補充說,與其他AI模型一樣,當回應那些被個人用來利用AI模型創造和傳播虛假信息的提示時,DeepSeek最容易重複虛假聲明。

此文章由人工智能協助翻譯。更多資訊,請參閱我們的使用條款。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利