Rachel,金色財經
11月27日,趙長鵬在X上發文稱,AI 數據標注等任務非常適合通過區塊鏈完成,可借助全球低成本勞動力,並通過加密貨幣即時支付,打破地域限制。
數據標記是指對原始數據(如文本、圖像、音頻等)進行人工或自動化的標註,使其具有特定的結構化信息。 標記的數據用於訓練機器學習或人工智能模型,例如為文本標註情感類別(正面、負面、中立)就是一種數據標記。 而將區塊鏈用於人工智能數據標註,特別適用於需要高透明度、可信性和分布式協作的數據標註場景。 這不僅可以提升數據標註的效率和質量,還為全球協作和數據交易創造了新的可能性。
目前,這一賽道有哪些優質的項目? 賽道發展前景如何?
區塊鏈在AI數據標記中的作用
區塊鏈是一種去中心化的分布式賬本技術,具有透明性、不可篡改性和可追溯性等特點。 這些特點在數據標記中可以解決傳統方法中的以下問題:
- 數據真實性和防篡改:每次標記的記錄都被寫入區塊鏈,無法被隨意更改,保證了標註的可信度。
- 任務分配透明性:區塊鏈可以記錄任務的分發、執行和審核過程,防止任務分配不公平或結果篡改。
- 激勵機制:使用區塊鏈的智能合約技術,數據標註員可以通過完成任務自動獲得加密貨幣或其他獎勵。
- 數據溯源:每個標記的來源、標註員以及審核者的信息都可以被追蹤。
- 分布式標註:利用區塊鏈,將數據標註任務分配給全球的標註員,數據處理效率更高。
- 質量審核:多人標註結果通過區塊鏈技術進行對比與審核,確保標註準確性。
- 標註數據交易:標註好的數據可以在區塊鏈上交易,買賣雙方無需擔心數據的完整性或真實性。
- 隱私保護:使用區塊鏈對標註數據進行加密存儲,保證隱私數據安全。
- OORT DataHub:提供基於區塊鏈的去中心化數據標注服務,採用Proof of Honesty算法進行質量控制。 其平台通過智能合約分發任務、審核數據質量和支付報酬,吸引全球標註者加入,並確保標註數據的透明性和隱私保護。
社區獎勵:通過參與數據標註和分析,用戶可獲得 $OORT 代幣獎勵。 此外,還可能獲得與貢獻掛鉤的獨特 NFT,這些 NFT 提供額外權益,如提高年收益率 (APY) 的獎勵、設備折扣和 DAO 投票權。
任務抵押:參與者需抵押至少 210 個 $OORT 代幣,以表明對任務的承諾,完成任務後會返還代幣並發放獎勵。
銷售收益分成:部分 NFT 持有者還可從未來的數據銷售收入中分紅,進一步提升長期收益。
- PublicAI:Solana鍊上AI生態項目,旨在連接數據需求方和全球標註者,通過加密代幣激勵機制獎勵參與者,同時利用區塊鏈技術記錄標註過程的細節,保障數據安全和隱私。
社區獎勵:10%的Public代幣將用於用戶前期交互的空投獎勵,具體來說獲取空投的方法有三種,成為 AI Builder:收集高質量互聯網內容;成為 AI Validator:驗證收集的內容;成為 AI Developer:使用已驗證數據集訓練 AI 代理。
代幣分配:項目在 2024 年 1 月完成了 200 萬美元的種子輪融資,投資方包括 IOBC Capital、Foresight Ventures、Solana Foundation、everstate Capital 及多位人工智能學界知名院士教授等,目前具體的 PublicAI 代幣分配細節尚未明確。
面臨的挑戰
目前,幾大因素束縛該賽道的發展:一是是AI數據標記需要較高的計算和存儲資源;二是項目性能受制於區塊鏈的擴展性;三是技術標準化和監管尚不完善。
其中,第二點是或許是目前所面臨的最大的挑戰。 因為AI 數據標記和模型訓練通常需要大量的計算資源,而區塊鏈網絡中的節點計算能力有限。 如何在保證區塊鏈去中心化特性的前提下,有效地整合和利用分布式計算資源來滿足 AI 數據標記項目的計算需求,是一個亟待解決的問題。 據悉,幣安旗下的Greenfield 正在為這一賽道提供存儲支持,期待能有更多的存儲和計算資源在這一領域進行實踐。