为深入贯彻落实国家数据局、河北省数据和政务服务局关于高质量数据集建设有关工作部署,坚持以用促建、价值优先、场景落地,加快构建全市高质量数据集开发利用体系,进一步发挥数据要素对“人工智能+”的赋能作用,现面向社会公开征集第二批高质量数据集,有关事项公告如下。
一、征集要求
(一)征集范围。重点围绕我市五大主导产业(生物医药、新一代电子信息、先进装备制造、现代食品、现代商贸物流)和重点特色产业集群,覆盖领域包括但不限于科学研究、工业制造、农业农村、智慧能源、交通运输、金融服务、医疗卫生、教育教学、商贸流通、人力资源、文化旅游、应急管理、气象服务、绿色低碳、公共安全、城市治理等重点行业领域,以及低空经济、智慧驾驶、具身智能、智慧海洋、生物制造等创新领域。
(二)数据集要求。
1.用途明确。数据集必须具备核心使用价值,可直接用于人工智能模型训练、智能体服务、行业提质增效等实际场景,与行业需求深度契合。
2.数据质量。经过采集、清洗、标注等数据处理环节,具备鲜活度、真实性、大样本、完整性、多样性和高知识密度等特征,可有效提升模型性能和智能体服务效能。数据集规模需达到一定量级,不低于50GB(非结构化数据)或10万行(结构化数据)。数据模态包括结构化数据、文本、图形图像、音频、视频等。
3.应用推广。数据集原则上应至少有1个已实际落地的应用场景,具备较强的推广价值;暂未落地的,应有较为明确的潜在应用场景。同时应具备一定先进性、创新性、示范性和定期更新机制。数据集为已建或在建的项目均可申报。
4.安全合规。数据集应符合国家数据安全与合规相关要求,不涉及国家秘密、商业秘密和个人隐私等。同时数据集持有单位应有明确的数据权属,流通和开发利用后可较为清晰地界定加工使用权、产品收益权,无产权纠纷。
(三)申报主体。申报单位应为在石家庄市内注册的独立法人单位,包括政府部门、企事业单位、科研院所、行业协会等。申报单位近三年经营状况良好,在信用、质量、安全等方面无不良记录。涉及多家单位的,可结合实际情况联合申报,并明确牵头单位。
(四)其他要求。申报单位报送的相关资料按照征集要求严格把关,提高案例质量,确保案例合规、真实,材料完整、可公开。
二、征集程序
(一)申报案例。请申报单位认真对照通知要求,填写《高质量数据集申报书》(详见附件),并将申报材料盖章扫描版和可编辑word版以“单位名称+高质量数据集”命名报送石家庄市数据局,申报单位涉及多个申报案例的,每个案例提交一份申报书,于6月16日前发送至邮箱sjzsjjsjk@163.com。
(二)遴选推广。石家庄市数据局择优推荐至河北省数据和政务服务局,争取政策支持,充分释放典型示范作用。对于存在交易需求的数据集,将依托数据交易平台进行产品化展示,以促进数据要素高效流通与合理利用。
三、联系方式
联系人:汤淼,联系电话:86688495
邮箱:sjzsjjsjk@163.com
联系地址:石家庄市数据局2101办公室(石家庄市中山东路216号)
石家庄市数据局
2026年5月26日