新華社記者 嚴賦憬
記者20日從國家數據局了解到,我國七個數據標注基地數據標注規模再創新高,數據標注總規模達到17282TB,相當于中國國家圖書館數字資源總量的6倍左右。
數據標注是對數據進行添加標記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關鍵環節。我國七個數據標注基地分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同,目前已形成醫療、工業、教育等行業的高質量數據集335個;賦能121個國產人工智能大模型研發;引進和培育標注企業223家;標注從業人員達5.8萬人;帶動數據標注行業相關產值超過83億元。
國家數據局有關負責人表示,未來將進一步暢通數據采集、標注、人工智能應用產業鏈,重點推動工業、金融、醫療、交通、教育等幾大領域的高質量數據集建設,促進數據標注產業高質量發展。