zgzx1 |
|
等级:论坛骑士(三级) |
积分:2424分 |
注册:2009-5-20 |
发表:727(423主题贴) |
登录:1150 |
|
|
【解读】国家数据局:7个数据标注基地已建设数据集524个 |

国家数据局7月22日举行新闻发布会,介绍2025中国国际大数据产业博览会相关情况。国家数据局有关负责人表示,全面加速高质量数据集建设和应用落地,进一步推动数据要素市场化、价值化。
【什么是数据标注?】
数据标注是对数据进行添加标记、说明、解释、分类和编码的过程。数据标注,是提升人工智能算法、模型核心能力的关键环节。
【我国七个数据标注基地】分别位于四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同,目前已形成医疗、工业、教育等行业的高质量数据集524个;赋能一百多个国产人工智能大模型研发(目前是163个);带动数据标注行业相关产值超过100亿元。
国家数据局有关负责人表示,未来将进一步畅通数据采集、标注、人工智能应用产业链,重点推动工业、金融、医疗、交通、教育等几大领域的高质量数据集建设,促进数据标注产业高质量发展。
【什么是高质量数据集?】
高质量数据集是经过采集、加工等数据处理,可以直接用于开发和训练人工智能模型,能够有效地提升模型性能的高质量数据集合。
据介绍,国家数据局已组织开展高质量数据集典型案例征集和示范推广,挖掘医疗、工业、交通、地理、气象等重点领域标杆实践,还指导合肥、成都等7个城市建设数据标注基地,先行先试探索数据标注产业发展经验。截至今年上半年,7个数据标注基地已建设数据集524个,服务大模型也有163个。
当前数据标注产业发展仍面临一些问题,从供给端看,面临智能标注技术供给不足、产业基础薄弱、标准体系不健全、高水平人才短缺等问题;从需求端看,面临数据标注市场需求规模低的问题。数据标注基地作为数据标注产业发展的示范标杆,应从供需两端双向发力,“提升四类供给,释放两类需求”,为解决上述问题提供指引和路径。
国家数据局副局长余英表示,国家数据局全面加速高质量数据集建设和应用落地,组织开展生态培育专项行动。开展高质量数据集典型案例征集和示范推广,挖掘医疗、工业、交通等重点领域标杆实践;定期举办技术交流活动,围绕数据标注、合成、高质量数据集建设方法论等开展深度研讨;搭建常态化供需对接平台,促进数据供给方、技术提供方、场景应用方精准匹配。 下一步,国家数据局将着力打造“数据标注+高质量数据集+模型+应用场景+市场化价值化”的闭环生态,推进数据要素市场化配置改革和“人工智能+”行动同向发力、同频共振。
北京大学《数据资产管理与数据资本化策略》2025专题研修班招生
数据资产服务联盟暨北大数据资产研修班校友签约仪式6月在北京举行
10大国家试验区“破冰”数据确权,万亿级数据资产化进程加速!
【名单】全国数据资产全过程管理试点单位清单
【解读】稳定币是什么?由谁发行?与美元或人民币国家货币有什么关联和区别?中国政府啥态度?

|
|