为深入贯彻落实《国务院关于深入实施“人工智能+”行动的意见》(国发〔2025〕11号)、《关于加快场景培育和开放推动新场景大规模应用的实施意见》(国办发〔2025〕37号)、《国家数据局等部门关于印发〈“数据要素×”三年行动计划(2024—2026年)〉的通知》(国数政策〔2023〕11号)等部署要求,深化全省数据要素市场化配置改革,发挥高质量数据集对于行业领域人工智能发展、应用场景培育等方面的重要作用,现举办广东省首届高质量数据集创新大赛(以下简称大赛)。有关事项通知如下:
深入贯彻落实国家有关部署要求,发挥广东数据资源丰富、产业体系完备等优势,聚焦高质量数据集的供给与利用,坚持“真实数据、真实应用、真实流通、真实推广”原则,面向工业制造、科技创新、医疗健康、应急管理、气象服务、现代农业、交通运输、金融服务、文化旅游、城市治理、商贸流通、绿色低碳等重点行业领域发展需求,通过“揭榜挂帅”赛事机制,推动高质量数据集的场景挖掘、建设供给、规范流通、创新应用与成果落地,促进人工智能发展和场景应用,挖掘培育数据企业与人才,构建协同共赢的数据产业生态,为全省经济社会高质量发展注入新动力。
广东省首届高质量数据集创新大赛
大赛采取“分期发榜、全年办赛;成熟一批、举办一期”的组织模式。由广东省政务服务和数据管理局联合相关单位成立大赛组委会,负责具体组织实施工作。组建大赛评审专家库。
鼓励省内有条件的地市结合本地产业特色与资源禀赋,积极承办比赛。
各赛题的比赛方案和评审规则,另行发布。
每期比赛,按照“1+3+N”机制组织实施。通过广东省首届高质量数据集创新大赛赛事服务平台(以下简称赛事平台,后续正式发布),统一开展赛题发布、报名参赛、线上比赛、公示监督、通知提醒等工作。具体包括:
(一)一套“发榜单”。广东省政务服务和数据管理局定期组织开展高质量数据集“发榜”单位征集工作。对于有意向的单位聚焦本行业、领域业务的痛点难点或场景需求提交的赛题,由广东省政务服务和数据管理局会同相关单位组织评审,定期公布“发榜”单位、赛题以及相应比赛方案等。
(二)三个阶段比赛。分为初赛、复赛和路演三个阶段。
1.初赛。采用线上形式,重点考察参赛团队加工处理行业原始数据集的能力。“发榜”单位通过赛事平台发布赛题,提供相应的基础数据资源、评审要求及应用场景说明。参赛团队通过赛事平台进入本赛题指定的可信空间进行比赛,按照比赛规则开展数据清洗、合成、标注、质检等处理活动,形成高质量数据集和相应的解题方案。允许参赛团队自带合法合规的数据参与比赛。按照评审分数由高至低顺序,确定各赛题晋级复赛的团队名单。
2.复赛。采取线下集中、线上比赛形式,重点考察参赛团队的实战能力。“发榜”单位通过赛事服务平台提供统一的、更具挑战性的数据资源。参赛团队在大赛组委会指定的比赛地点,进入本赛题指定的可信空间进行比赛,按照比赛规则进一步开展数据处理活动,并对初赛成果的有效性、科学性等进行验证。允许参赛团队自带合法合规的数据参与比赛。按照评审分数由高至低顺序,确定各赛题晋级路演环节的团队名单。
3.路演。采取线下比赛形式,重点考察参赛团队的数据解决方案路径与高质量数据集价值。参赛团队按照比赛规则进行现场路演及答辩。按照评审分数由高至低顺序,确定各赛题的等级奖及特色单项奖。
(三)N场供需对接会。分期组织获奖团队与“发榜”单位、产业链企业、投资机构、园区平台等进行产融对接等活动,搭建高质量数据集创新成果与产业需求的对接桥梁,打通“数据供给至场景应用”转化链路,促进成果落地应用。
(一)“发榜”单位要求。“发榜”单位应为广东省内依法注册的企业、事业单位、科研院所、高校等单位,具备应用场景开放、数据资源供给、平台支撑、市场价值转化等能力。鼓励产业链上下游联合申报“发榜”单位。每期比赛中,一个行业领域可以有多个“发榜”单位,每个“发榜”单位应对其发布赛题的真实性、数据资源的合法合规性、比赛平台的安全可控性、业内发动的及时充分性等负责。在公开“发榜”的同时,应制定本赛题比赛方案,报大赛组委会审核后公布。
(二)参赛团队要求。参赛团队的牵头单位,应为广东省内依法注册的企业、事业单位、科研院所、高校等独立法人单位。支持牵头单位与省内外机构联合组队参赛。鼓励产学研用一体化团队及跨领域协作团队参与。每个参赛团队的成员人数原则上不超过5人,对于同一赛题,每位参赛代表只能代表1个团队比赛。报名截止后,参赛代表不可更改。参赛单位需遵守大赛规则,对所有信息的准确性和真实性负责,一经发现虚假信息将取消参赛资格。参赛团队名称需符合法律法规、公序良俗等相关要求。被列入“信用中国”网站记录失信被执行人、重大税收违法案件当事人名单、政府采购严重违法失信行为记录名单,以及有重大违法记录等情形的单位或个人不得参赛。
(三)参赛要求。参赛团队应聚焦赛题,围绕高质量数据集构建、数据标注技术创新、数据要素应用等方向提出解题方案。解题方案应具有明确的场景适用性、技术可行性和社会经济效益。解题方案的名称由参赛团队自行拟定,应符合赛道和赛题要求,体现高质量数据集核心特征,符合法律法规、公序良俗等相关要求。参赛团队须按照大赛组委会的要求补充提交参赛项目有关材料。所有已提交的相关材料原则上不予退还。“发榜”单位、参赛单位均须承诺所提交的数据、解题方案或形成的应用成果不侵犯任何第三方合法权益,严禁使用未授权或来源不明的数据,且数据处理全过程应符合《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等相关法律法规要求。
大赛分为四个阶段进行。
(一)筹备启动阶段。广东省政务服务和数据管理局会同有关单位征集“发榜”单位,评审并发布赛题。成立大赛组委会及相关工作组。公布各赛题比赛方案。搭建大赛平台并完成技术安全测试等。组织开展大赛启动仪式。
(二)报名推广阶段。通过大赛平台、广东省政务服务和数据管理局官微、官网等渠道发布赛题及比赛方案,开放报名入口。组织开展线上线下宣讲,开展定向邀约,解读赛事要点,广泛发动参与。
(三)比赛阶段。大赛组委会负责组织初赛、复赛及路演,并对赛事结果进行公示。其中,初赛原则上自赛题发布后3个月内组织完成。复赛原则上自初赛结果公示后2个月内组织完成。路演原则上自复赛结果公示后1个月内组织完成。
(四)成果发布及推广应用阶段。大赛组委会发布获奖名单,牵头开展推广应用活动,落实赛事权益。
(一)政策激励。“发榜”单位和获奖团队按照广东省有关规定享受相应的支持政策,优先推荐数据领域项目试点、典型案例、宣传推广等。
(二)权益联动。联动“数据要素×”大赛、琶洲算法大赛等专业赛事,通过资源整合、优势互补,相互融入优质赛题资源与技术生态,依托更多的产业对接渠道与成果转化平台,推动赛事成果落地转化。
(三)人才支持。鼓励获奖团队成员申报广东省大数据工程技术人才职称评定,符合评价标准要求的相关项目及奖项可作为业绩成果参与评审。获奖团队成员可享受数据领域免费培训。
(四)成果转化。组织获奖团队与“发榜”企业、产业链企业、投资机构深度对接,推动高质量数据集开源共享或产业化应用。
(一)强化组织保障。广东省政务服务和数据管理局负责联合相关单位,做好赛题征集、组委会组建、比赛方案发布、比赛平台搭建、专家库组建、宣传发动、技术支撑、权益落地等组织保障工作。
(二)强化赛事监督。大赛坚持公平、公正、公开的原则,实行公示和举报制度,接受社会各界监督。对于未通过公示的团队,将取消获奖成绩。对于被举报并经大赛组委会核实的团队,将收回已获取的赛事权益。大赛初赛、复赛和路演均不得向参赛团队收取任何费用。
(三)强化赛事宣传。从企业高质量数据集建设需求、应用落地、产业转化等多方面,讲好高质量数据集创新赋能故事。组织策划对“发榜”企业、比赛过程、获奖团队等开展多维度宣传报道。依托大型活动平台展示大赛成果,营造全社会供数、治数、用数良好氛围。
(四)强化技术保障。建设统一赛事服务平台,提供报名注册、赛题发布、比赛可信空间、评审管理、安全合规等全流程技术支撑保障。
附件:广东省高质量数据集创新应用“发榜”单位征集表
广东省政务服务和数据管理局
2025年12月1日
联系方式:
李俊文:020-83134756
马晓镌:020-83134224
技术咨询:
穆帅先:15619404860
李 帅:18820137281
附件
广东省高质量数据集创新应用“发榜”单位征集表
| 单位名称 | |
| 联系人、职务及
联系方式 |
|
| 通讯地址 | |
| 场景名称 | |
| 所属行业/领域 | £工业制造 £现代农业 £商贸流通
£交通运输 £金融服务 £科技创新 £文化旅游 £医疗健康 £应急管理 £气象服务 £城市治理 £绿色低碳 £具身智能 £其他 |
| 场景背景与痛点 | 1.描述场景所在行业现状 2.明确指出当前存在的痛点、难点问题 |
| 预期目标 | 1.期望通过高质量数据集解决的具体问题 2.预期达成的技术指标和业务效果 |
| 创新价值 | 1. 经济价值(预期效益、成本节约等) 2. 社会价值(民生改善、治理提升等) 3. 产业价值(对产业链的带动作用) 4. 具有行业标杆效应(场景创新性、应用模式创新性、预期形成的行业标杆价值) 5. 可推广性和复制性 6. 其他 |
| 数据情况 | 数据类型: £结构化数据 £非结构化数据 £半结构化数据 数据描述:描述数据的来源、结构、格式、特征、质量及适用场景等核心信息,可让使用者清晰了解数据的背景、属性与价值,为数据共享、应用开发、决策分析等场景提供关键支撑。 主要的数据项(请列出3-5项): 数据集能否开放给参赛方: £可全部开放 £可部分开放(请说明范围:________) £可在安全可信空间内开放 £其他要求:______________ 是否需要融合第三方数据资源: £是 £否 如需融合,请描述具体需求: |
| 平台算力支撑 | 平台描述:描述平台的数据标注、数据汇聚、数据处理、数据分析、算法开发、模型训练等能力。
1.£自主构建 £依赖外部服务商 2.是否具备可信空间建设能力: £是 £否 3.是否提供数据标注工具: £是 £否 4.平台访问方式: £互联网访问 £特定网络环境下访问 £其他: 5.是否提供供参赛方使用的算力资源支持 £是 £否 |
| 其他补充说明 | 1.是否获得国家、省市相关高质量数据集建设典型案例或荣誉:
£是 £否 2.预期合作模式: £完全开放共享 £大赛期间授权使用 £成果转化后合作 |
| 申报单位声明:
本单位郑重承诺:以上所填内容真实、准确、完整,符合国家法律法规要求。所提供的赛题场景不涉及国家秘密、商业秘密和个人隐私,或已进行脱敏处理。如入选,我们将积极配合做好相关工作,共同推动高质量数据集建设与应用。 申报单位(盖章): 日期: 年 月 日 |
|
本文由 欧米网 整理编辑,版权归原作者所有,转载请注明来源!