科研

首页 - 学科 - 科研 - 关于举办广东省首届高质量数据集创新大赛的通知

关于举办广东省首届高质量数据集创新大赛的通知

为深入贯彻落实《国务院关于深入实施“人工智能+”行动的意见》(国发〔2025〕11号)、《关于加快场景培育和开放推动新场景大规模应用的实施意见》(国办发〔2025〕37号)、《国家数据局等部门关于印发〈“数据要素×”三年行动计划(2024—2026年)〉的通知》(国数政策〔2023〕11号)等部署要求,深化全省数据要素市场化配置改革,发挥高质量数据集对于行业领域人工智能发展、应用场景培育等方面的重要作用,现举办广东省首届高质量数据集创新大赛(以下简称大赛)。有关事项通知如下:

  一、大赛目标

  深入贯彻落实国家有关部署要求,发挥广东数据资源丰富、产业体系完备等优势,聚焦高质量数据集的供给与利用,坚持“真实数据、真实应用、真实流通、真实推广”原则,面向工业制造、科技创新、医疗健康、应急管理、气象服务、现代农业、交通运输、金融服务、文化旅游、城市治理、商贸流通、绿色低碳等重点行业领域发展需求,通过“揭榜挂帅”赛事机制,推动高质量数据集的场景挖掘、建设供给、规范流通、创新应用与成果落地,促进人工智能发展和场景应用,挖掘培育数据企业与人才,构建协同共赢的数据产业生态,为全省经济社会高质量发展注入新动力。

  二、大赛名称

  广东省首届高质量数据集创新大赛

  三、赛事组织

  大赛采取“分期发榜、全年办赛;成熟一批、举办一期”的组织模式。由广东省政务服务和数据管理局联合相关单位成立大赛组委会,负责具体组织实施工作。组建大赛评审专家库。

鼓励省内有条件的地市结合本地产业特色与资源禀赋,积极承办比赛。

各赛题的比赛方案和评审规则,另行发布。

  四、赛制设置

  每期比赛,按照“1+3+N”机制组织实施。通过广东省首届高质量数据集创新大赛赛事服务平台(以下简称赛事平台,后续正式发布),统一开展赛题发布、报名参赛、线上比赛、公示监督、通知提醒等工作。具体包括:

(一)一套“发榜单”。广东省政务服务和数据管理局定期组织开展高质量数据集“发榜”单位征集工作。对于有意向的单位聚焦本行业、领域业务的痛点难点或场景需求提交的赛题,由广东省政务服务和数据管理局会同相关单位组织评审,定期公布“发榜”单位、赛题以及相应比赛方案等。

(二)三个阶段比赛。分为初赛、复赛和路演三个阶段。

1.初赛。采用线上形式,重点考察参赛团队加工处理行业原始数据集的能力。“发榜”单位通过赛事平台发布赛题,提供相应的基础数据资源、评审要求及应用场景说明。参赛团队通过赛事平台进入本赛题指定的可信空间进行比赛,按照比赛规则开展数据清洗、合成、标注、质检等处理活动,形成高质量数据集和相应的解题方案。允许参赛团队自带合法合规的数据参与比赛。按照评审分数由高至低顺序,确定各赛题晋级复赛的团队名单。

2.复赛。采取线下集中、线上比赛形式,重点考察参赛团队的实战能力。“发榜”单位通过赛事服务平台提供统一的、更具挑战性的数据资源。参赛团队在大赛组委会指定的比赛地点,进入本赛题指定的可信空间进行比赛,按照比赛规则进一步开展数据处理活动,并对初赛成果的有效性、科学性等进行验证。允许参赛团队自带合法合规的数据参与比赛。按照评审分数由高至低顺序,确定各赛题晋级路演环节的团队名单。

3.路演。采取线下比赛形式,重点考察参赛团队的数据解决方案路径与高质量数据集价值。参赛团队按照比赛规则进行现场路演及答辩。按照评审分数由高至低顺序,确定各赛题的等级奖及特色单项奖。

(三)N场供需对接会。分期组织获奖团队与“发榜”单位、产业链企业、投资机构、园区平台等进行产融对接等活动,搭建高质量数据集创新成果与产业需求的对接桥梁,打通“数据供给至场景应用”转化链路,促进成果落地应用。

  五、参赛要求

  (一)“发榜”单位要求。“发榜”单位应为广东省内依法注册的企业、事业单位、科研院所、高校等单位,具备应用场景开放、数据资源供给、平台支撑、市场价值转化等能力。鼓励产业链上下游联合申报“发榜”单位。每期比赛中,一个行业领域可以有多个“发榜”单位,每个“发榜”单位应对其发布赛题的真实性、数据资源的合法合规性、比赛平台的安全可控性、业内发动的及时充分性等负责。在公开“发榜”的同时,应制定本赛题比赛方案,报大赛组委会审核后公布。

(二)参赛团队要求。参赛团队的牵头单位,应为广东省内依法注册的企业、事业单位、科研院所、高校等独立法人单位。支持牵头单位与省内外机构联合组队参赛。鼓励产学研用一体化团队及跨领域协作团队参与。每个参赛团队的成员人数原则上不超过5人,对于同一赛题,每位参赛代表只能代表1个团队比赛。报名截止后,参赛代表不可更改。参赛单位需遵守大赛规则,对所有信息的准确性和真实性负责,一经发现虚假信息将取消参赛资格。参赛团队名称需符合法律法规、公序良俗等相关要求。被列入“信用中国”网站记录失信被执行人、重大税收违法案件当事人名单、政府采购严重违法失信行为记录名单,以及有重大违法记录等情形的单位或个人不得参赛。

(三)参赛要求。参赛团队应聚焦赛题,围绕高质量数据集构建、数据标注技术创新、数据要素应用等方向提出解题方案。解题方案应具有明确的场景适用性、技术可行性和社会经济效益。解题方案的名称由参赛团队自行拟定,应符合赛道和赛题要求,体现高质量数据集核心特征,符合法律法规、公序良俗等相关要求。参赛团队须按照大赛组委会的要求补充提交参赛项目有关材料。所有已提交的相关材料原则上不予退还。“发榜”单位、参赛单位均须承诺所提交的数据、解题方案或形成的应用成果不侵犯任何第三方合法权益,严禁使用未授权或来源不明的数据,且数据处理全过程应符合《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等相关法律法规要求。

  六、推进步骤

  大赛分为四个阶段进行。

(一)筹备启动阶段。广东省政务服务和数据管理局会同有关单位征集“发榜”单位,评审并发布赛题。成立大赛组委会及相关工作组。公布各赛题比赛方案。搭建大赛平台并完成技术安全测试等。组织开展大赛启动仪式。

(二)报名推广阶段。通过大赛平台、广东省政务服务和数据管理局官微、官网等渠道发布赛题及比赛方案,开放报名入口。组织开展线上线下宣讲,开展定向邀约,解读赛事要点,广泛发动参与。

(三)比赛阶段。大赛组委会负责组织初赛、复赛及路演,并对赛事结果进行公示。其中,初赛原则上自赛题发布后3个月内组织完成。复赛原则上自初赛结果公示后2个月内组织完成。路演原则上自复赛结果公示后1个月内组织完成。

(四)成果发布及推广应用阶段。大赛组委会发布获奖名单,牵头开展推广应用活动,落实赛事权益。

  七、赛事权益

  (一)政策激励。“发榜”单位和获奖团队按照广东省有关规定享受相应的支持政策,优先推荐数据领域项目试点、典型案例、宣传推广等。

(二)权益联动。联动“数据要素×”大赛、琶洲算法大赛等专业赛事,通过资源整合、优势互补,相互融入优质赛题资源与技术生态,依托更多的产业对接渠道与成果转化平台,推动赛事成果落地转化。

(三)人才支持。鼓励获奖团队成员申报广东省大数据工程技术人才职称评定,符合评价标准要求的相关项目及奖项可作为业绩成果参与评审。获奖团队成员可享受数据领域免费培训。

(四)成果转化。组织获奖团队与“发榜”企业、产业链企业、投资机构深度对接,推动高质量数据集开源共享或产业化应用。

  八、工作要求

  (一)强化组织保障。广东省政务服务和数据管理局负责联合相关单位,做好赛题征集、组委会组建、比赛方案发布、比赛平台搭建、专家库组建、宣传发动、技术支撑、权益落地等组织保障工作。

(二)强化赛事监督。大赛坚持公平、公正、公开的原则,实行公示和举报制度,接受社会各界监督。对于未通过公示的团队,将取消获奖成绩。对于被举报并经大赛组委会核实的团队,将收回已获取的赛事权益。大赛初赛、复赛和路演均不得向参赛团队收取任何费用。

(三)强化赛事宣传。从企业高质量数据集建设需求、应用落地、产业转化等多方面,讲好高质量数据集创新赋能故事。组织策划对“发榜”企业、比赛过程、获奖团队等开展多维度宣传报道。依托大型活动平台展示大赛成果,营造全社会供数、治数、用数良好氛围。

(四)强化技术保障。建设统一赛事服务平台,提供报名注册、赛题发布、比赛可信空间、评审管理、安全合规等全流程技术支撑保障。

附件:广东省高质量数据集创新应用“发榜”单位征集表

广东省政务服务和数据管理局

2025年12月1日

联系方式:

李俊文:020-83134756

马晓镌:020-83134224

技术咨询:

穆帅先:15619404860

李   帅:18820137281

  附件

广东省高质量数据集创新应用“发榜”单位征集表

单位名称
联系人、职务及

联系方式

通讯地址
场景名称
所属行业/领域 £工业制造    £现代农业   £商贸流通

£交通运输    £金融服务   £科技创新

£文化旅游    £医疗健康   £应急管理

£气象服务    £城市治理   £绿色低碳

£具身智能    £其他

场景背景与痛点 1.描述场景所在行业现状
2.明确指出当前存在的痛点、难点问题
预期目标 1.期望通过高质量数据集解决的具体问题
2.预期达成的技术指标和业务效果
创新价值 1. 经济价值(预期效益、成本节约等)
2. 社会价值(民生改善、治理提升等)
3. 产业价值(对产业链的带动作用)
4. 具有行业标杆效应(场景创新性、应用模式创新性、预期形成的行业标杆价值)

5. 可推广性和复制性

6. 其他

数据情况 数据类型:
£结构化数据 £非结构化数据 £半结构化数据
数据描述:描述数据的来源、结构、格式、特征、质量及适用场景等核心信息,可让使用者清晰了解数据的背景、属性与价值,为数据共享、应用开发、决策分析等场景提供关键支撑。

主要的数据项(请列出3-5项):
1. ___________
2. ___________
3. ___________
数据规模预估:
£GB级       £TB级       £PB级

数据集能否开放给参赛方:

£可全部开放

£可部分开放(请说明范围:________)

£可在安全可信空间内开放

£其他要求:______________

是否需要融合第三方数据资源:

£是          £否

如需融合,请描述具体需求:

平台算力支撑 平台描述:描述平台的数据标注、数据汇聚、数据处理、数据分析、算法开发、模型训练等能力。

1.£自主构建     £依赖外部服务商

2.是否具备可信空间建设能力:

£是      £否

3.是否提供数据标注工具:

£是      £否

4.平台访问方式:

£互联网访问   £特定网络环境下访问

£其他:

5.是否提供供参赛方使用的算力资源支持

£是      £否

其他补充说明 1.是否获得国家、省市相关高质量数据集建设典型案例或荣誉:

£是     £否

2.预期合作模式:

£完全开放共享

£大赛期间授权使用

£成果转化后合作

申报单位声明:

本单位郑重承诺:以上所填内容真实、准确、完整,符合国家法律法规要求。所提供的赛题场景不涉及国家秘密、商业秘密和个人隐私,或已进行脱敏处理。如入选,我们将积极配合做好相关工作,共同推动高质量数据集建设与应用。

申报单位(盖章):

日期: 年 月 日

本文由 欧米网 整理编辑,版权归原作者所有,转载请注明来源!

关键词:,