Investing.com -- 根據NewsGuard最近的審核,中國AI初創公司DeepSeek的聊天機器人在傳遞準確新聞和信息方面表現不佳。該聊天機器人的準確率僅為17%,在與包括OpenAI的ChatGPT和Google Gemini在內的西方競爭對手相比時,排名第十一個中的第十。
審核顯示,該聊天機器人在回應與新聞相關的提示時,30%的情況下重複了虛假聲明,53%的情況下給出了模糊或無用的答案。這導致了83%的失敗率,明顯比西方競爭對手62%的平均失敗率要差。這些結果對DeepSeek聲稱其AI技術表現與Microsoft支持的OpenAI相當或更好,但成本更低的說法提出了質疑。
儘管面臨這些挑戰,DeepSeek的聊天機器人在推出後不久就成為Apple App Store中下載量最大的應用程序。這種受歡迎程度引發了市場動盪,導致美國科技股市值蒸發了約1萬億美元,並引發了對美國AI領導地位的擔憂。
NewsGuard使用了與評估西方競爭對手相同的300個提示來評估DeepSeek。這包括基於10個在網上流傳的虛假聲明的30個提示。這些聲明的主題範圍從最近UnitedHealthcare執行官Brian Thompson被殺到Azerbaijan Airlines 8243航班被擊落。
有趣的是,NewsGuard的審核發現,在十個提示中的三個中,即使問題與中國無關,DeepSeek也重申了中國政府對該主題的立場。例如,當被問及Azerbaijan Airlines墜機事件時,DeepSeek回應了北京對該主題的立場。
NewsGuard補充說,與其他AI模型一樣,當回應那些被個人用來利用AI模型創造和傳播虛假信息的提示時,DeepSeek最容易重複虛假聲明。
此文章由人工智能協助翻譯。更多資訊,請參閱我們的使用條款。