智通財經APP獲悉,IDC表示,在數據隱私保護條例不斷完善、國家大舉培育數據要素市場、數據流通持續改善的今天,IDC首次發布中國人工智能基礎數據服務市場追蹤報告。報告預測,到2025年,中國人工智能數據采標服務市場規模將達到123.4億元人民幣。市場的發展驅動力一方面來源于人工智能市場的迅猛發展,另一方面來源于行業用戶加大數據采集力度。
市場構成
從用戶需求來看,人工智能基礎數據采標服務市場需求主要來源于自動駕駛——包括車內駕駛艙以及車外道路環境感知等場景、AI技術提供商和智能安防。此外,互聯網行業、智能終端行業也依然是AI基礎數據服務的投資主體。隨着傳統行業對人工智能技術的引入,金融、醫療、工業領域也開始在垂深場景的AI應用中引入數據采標服務。發展到現在,市場對于AI基礎數據服務的需求已基本清晰:標注質量要高、標注效率要快、知識經驗要多、數據安全有保障、整體成本具有較高性價比。
市場生態
當前人工智能數據服務市場的産業鏈並不冗長,市場參與主體(下圖所示)主要爲已成規模的數據標注服務商。當然,在數據標注平台背後,還存在諸多提供數據采標服務的小型團隊。隨着傳統行業開始自研AI,傳統的人力資源服務商也開始參與市場競爭。隨着市場的競爭,規模化效應將更加突出——成規模的平台型廠商將占據越來越高的市場份額。
市場格局
根據IDC追蹤的人工智能基礎數據采標服務市場規模,在2020-2021H1的市場格局中,百度在中國AI基礎數據服務市場持續保證市場份額第一;其次是海天瑞聲。其他值得關注的廠商包括雲測、Appen、龍貓數據、數據堂、標貝數據等。
展望未來,人工智能行業發展不斷湧現出新技術新趨勢,例如聯邦學習、大模型等都對AI基礎數據采標服務提出新要求:
數據采標需求範圍更廣:數據采標服務需滿足的AI應用場景比以往明顯更加廣泛。
數據標注精度要求更高:在自動駕駛等諸多場景中,爲進一步提升AI系統的准確度,要求數據標注精度不斷提升。
交付效率要求更高:快速變化的市場環境要求企業必須提高研發效率,進而對AI基礎數據的交付效率也提出更高要求。
數據標注複雜度提升:隨着AI應用場景日益融合、複雜,對數據標注的難度和複雜度也帶來了一定的挑戰。有經驗有實力的企業才能適應這一市場變化。
數據安全相關風險:根據法律規章的更新要求,及時調整現行業務開展方式、數據安全管理體系等。
標注人員培養模式轉變:過去通過扶貧、再就業、産學研等方式快速降低了人工標注的成本,需要進一步探索職業教育、優化標注工具。
IDC中國助理研究總監盧言霞表示:“ 市場競爭瞬息萬變,引入AI基礎數據服務有助于幫助企業快速進入AI模型開發。在選擇外部數據采標服務時,確保基礎的數據安全保障的同時,亦應多考慮標注質量、標注效率、知識經驗的積累,也應考慮爲AI構建專有數據集管理系統。”