国家市场监督管理总局主管    中国质量报刊社主办
  • 分享链接
  • 舆情秘书
您当前位置: >>新闻中心>>中国质量报>>第二版

《人工智能高质量数据集建设指南》正式发布

2025-09-02 14:50:24 中国质量报

本报讯 (记者何 可)近日,中国信息通信研究院(以下简称“中国信通院”)人工智能研究所联合清华大学计算社会科学与国家治理实验室、中国人工智能产业发展联盟数据委员会发布《人工智能高质量数据集建设指南》(以下简称《指南》),旨在为业界建设高质量数据集提供有实操价值的指导和参考。

随着大模型技术的迅猛发展,数据集作为人工智能核心三要素之一,在算法趋同、算力普惠的竞争环境中正在构建难以复制的差异化壁垒。人工智能发展正在进入“数据驱动”新阶段,高质量数据集的建设不仅是提升AI模型性能的关键,也是推动“人工智能+”行动落地的重要保障。然而现阶段,大量机构在高质量数据集建设中面临目标定位模糊化、实施路径碎片化与技术底座薄弱化三重挑战,不知道需要什么数据集、如何建设数据集、怎样评估数据集质量,制约了人工智能应用高效落地。

《指南》明确,高质量数据集是指用于训练、验证和优化人工智能大模型而收集、整理、标注形成的覆盖行业核心专业知识和生产经营活动信息的数据资源集合。《指南》还从政策、技术、产业层面介绍了当前高质量数据集建设的背景,梳理了高质量数据集的定义、特征、分类、建设主体以及“三大建设难点”,提出了人工智能数据工程的“五大核心要素”和企业建设高质量数据集“三步走”战略,分析了高质量数据集建设的核心技术,展示了科学、通信、交通、医疗、文化等领域高质量数据集建设实践,最后从工程能力、技术创新、质量评估、版权合规、基础制度创新等层面对未来高质量数据集建设的趋势进行了展望,并提出了对政府部门和企业机构的建议,为业界推进高质量数据集建设提供了有力支撑。

新闻快讯

(责任编辑:凌云)
查看往日报刊
相关网站导航