为进一步培育数据产业生态体系,提升高质量数据集开发与供给能力,赋能大模型快速迭代升级,加快建设具有全球影响力的人工智能创新策源地和产业高地,中关村科学城管委会拟支持建设高端数据标注示范基地,特发布此申报指南。
一、项目内容
完成高端数据标注示范基地功能空间建设,吸引数据标注优势企业落地,打造数据标注专业人才队伍;引入先进的自动化数据采集设备、智能化标注工具,提供数据标注平台、工具与服务,具备承接高端数据标注订单能力;聚焦智能驾驶、生物医药、医学影像、教育教学等领域,开发一批高质量数据集;培育高端数据标注及应用典型案例,打造示范基地建设样板。
二、建设周期
项目建设周期不超过1年(2025年6月至2026年6月)。
三、申报主体
申报主体需具有独立法人资格,无严重违法失信记录,并同时满足以下条件:
1.具备与高端数据标注示范基地建设运营相匹配的资金实力、团队规模和技术水平,自身或合作生态具备多模态标注工具开发、算法优化能力。
2.具有丰富的数据项目经验,近3年主导或参与的数据治理、数据基础设施建设或人工智能数据标注项目不低于3项。
3.具备较强的数据资源整合与技术协调能力,与高校、科研机构或数据头部企业建立稳定合作关系。
4.具有数据领域专业人才培训能力,具备数字工程师或人工智能训练师(数据标注员)培训体系或实践操作平台,具备人工智能数据标注领域通用和专业课程,包括理论学习与实操演练。
5.具有开展数据领域专业人才职业能力标准的研究和开发能力,近3年参与过相关团体或国家标准制定。
6.具备优质的产业空间条件和较强的园区运营能力,园区周边服务要素齐备。
四、支持方式
给予最高1亿元资金补贴,且项目自筹资金不低于补贴资金。补贴资金分两次拨付,立项后拨付首笔资金,完成考核指标、验收通过后拨付剩余资金。
五、考核指标
签订协议后一年内完成高端数据标注示范基地建设。
1.提供不少于3000平方米的数据标注空间,完成高端数据标注示范基地标注工作区、产教融合区、数据服务展示区等功能空间建设,配套不低于3000平方米的公共孵化空间、会议服务空间、展示交流空间,为数据企业入驻提供基建及设备设施改造提升条件。
2.引入不少于2家数据标注生态企业入驻并开展业务。
3.构建层次清晰、架构合理的高端数据标注人才梯队,形成不少于100人的专职标注人员队伍,其中本科及以上学历的高端标注人才占比不少于80%。
4.完成高端数据标注示范基地所需的平台开发工作:
(1)具备大模型自动标注、机器标注等功能,可以通过提示词技术实现少样本、零样本标注等高阶标注功能;
(2)提供算法模型服务,支持与标注工具打通实现数据预标注,具备多模态标注、批量导入等能力;
(3)针对数据标注场景开发大模型智能标注技术,探索机器生产新路径,在数据服务全流程不同环节可随时调用数据处理agent能力,实现数据合成,并与人工标注形成人机结合,提升标注效率和质量。
5.聚焦医疗、教育、泛互联网等重点领域,累计承接数据标注业务订单金额不低于1000万元。
六、实施方式
项目以公开征集的方式实施。
1.项目可单独申报,也可由多家主体联合申报(联合申报方不超过2家),申报方依据项目内容自愿申报并制定申报方案。
2.中关村科学城管委会组织对申报方案进行评审,确定项目承担单位,并与项目承担单位签订项目任务书。
3.项目承担单位应按照任务书约定指标实施项目,并按要求提交高端数据标注示范基地建设及绩效目标完成等情况报告;中关村科学城管委会对高端数据标注示范基地建设完成情况进行审核验收。
七、申报材料
1.通过专项资金平台在线申报,按要求填写基本信息并提交《高端数据标注示范基地建设项目申报书》及有关附件材料,同时提交一份纸质材料,纸质材料须从网上申报系统软件打印,书面申报材料与网上申报材料不一致将不予受理。纸质申报书应在封面加盖公章及骑缝章。申报材料一律使用A4纸张,并须标注连续页码。申报材料不予退还。
2.如申报材料不属实,中关村科学城管委会将按相关规定进行处理。
3.登录北京市人民政府门户网站“政策兑现”栏目(https://zhengce.beijing.gov.cn)选择相对应的项目进行申报。
八、申报时间及纸质材料报送地点
申报时间:2025年6月4日至6月10日
报送地点:海淀招商大厦东312