2025“数据要素×”大赛全面启航。今年大赛的亮点之一是面向建设高质量垂直行业大模型数据集、推动大模型技术在垂直行业的融合应用,以及与公共数据、企业数据等各类型数据开发利用有关的新技术、新产品、新模式、新场景,专门设置了开放性创新赛道。该赛道不局限于特定行业领域,致力于发现与培育具有潜力的创新项目,为数据要素价值释放创造更加有利的市场和政策环境。
一、顺应数据要素市场发展趋势,为创新团队提供广阔舞台
2024年,国家数据局先后出台了关于数据产业高质量发展、企业数据资源开发利用、公共数据授权运营、可信数据空间发展等一系列政策,统筹推进数据要素市场化配置改革,培育了良好的数据产业创新生态。为强化价值引导和场景牵引,国家数据局围绕《“数据要素×”三年行动计划(2024—2026年)》工作安排,启动了2024年“数据要素×”大赛,会同多部门发布了两批共48个“数据要素×”典型案例,遴选出一批高价值的应用场景和解决方案,有效带动了数据要素高质量供给、合规高效流通。
经过一年多的努力,数据要素领域涌现出众多新技术、新产品、新模式、新场景,催生了一批富有创意、充满活力、具有潜力的创新团队。这些团队贴近市场、贴近应用,活跃在数据要素开发利用的最前沿。鼓励这些初创团队走到舞台中央,展示创新风采,支持这些初创团队做强做优做大,是推动数据要素市场化价值化的重要举措。开放性创新赛道的设置就是针对数据领域创新团队特点,旨在通过更加包容的评审机制和评审标准,聚焦面向未来的颠覆性创新,为多元化的创新主体拓展成长空间。
二、把握颠覆性创新内在规律,为数据产业打造非线性增长曲线
颠覆性创新往往会挑战现有价值体系、技术标准和商业规则,在发展初期难以得到主流市场认可,但其潜在的颠覆性力量一旦被激发,就会呈现出跃迁式的非线性增长。例如,DeepSeek通过从大规模通用数据集和高质量垂直领域知识库等数据中学习到强大的推理能力,并结合知识蒸馏技术实现了大模型的轻量化、小型化,一举打破了大参数、大算力和大投入决定大模型性能的行业路径依赖。借助颠覆性创新的力量,DeepSeek不仅创造了7天之内用户过亿的新增长纪录,也让芯片巨头公司英伟达创造了股价单日暴跌17%、市值缩水5890亿美元的美国上市公司单日最大损失纪录。
遵循颠覆性创新规律,开放性创新赛道弱化“实效性”“示范性”等评价指标,更加强调数据开发利用的创新性,更加包容创新探索的多样性与差异化,以帮助更多具有行业颠覆性的创新团队脱颖而出。开放性创新赛道将作为创新团队与市场与资本的桥梁,通过政策引导和市场化运作,帮助创新团队对接必要的资源与支持,跨越从创意到产业的“死亡之谷”,使其能够在技术创新和商业模式上实现持续突破,在未来实现非线性、爆发式增长。
三、建设行业高质量数据集,推动大模型与千行百业深度融合
建设高质量垂直行业大模型数据集是发展大模型技术、推动经济高质量发展的关键抓手。从技术演进维度看,垂直行业数据集凭借其场景特异性与领域专业性,能够有效填补通用大模型在细分领域的知识缺口,助力大模型突破 “领域适配瓶颈”,实现从通用智能向领域专长的跨越升级,显著提升大模型在专业场景下的决策精度与应用效能。例如,在制造行业,基于生产流程、设备运维数据构建的数据集,能训练出精准的质量检测、故障预警大模型,推动制造行业实现降本增效;在金融行业,利用信贷数据、市场行情数据训练的风控大模型,可优化风险评估体系,保障金融安全。此外,垂直行业高质量大模型数据集建设还能带动数据采集、标注、分析等上下游产业协同发展,形成新的经济增长点。
在开放性创新赛道中专门设置建设高质量垂直行业大模型数据集赛题,能够充分发挥我国海量数据规模与丰富应用场景的双重优势。一方面,能够引导更多行业领域打破数据壁垒,开放应用场景、共享训练数据、整合建设行业数据集,充分激活我国海量数据优势;另一方面,通过竞赛形式鼓励参赛者基于行业数据集,推动大模型技术在垂直行业的深度融合应用,针对细分应用场景开发更加精准、专业的解决方案,进一步释放91成人赋能实体经济的潜力,为产业转型升级和经济高质量发展注入新动能。
2025年“数据要素×”大赛开放性创新赛道的设立,是面向未来培育数据产业竞争力、发掘数据产业颠覆性创新的关键布局。通过包容多元的创新机制、精准聚焦的赛道设计和高效联动的资源对接,大赛将有效激发创新团队的活力与潜力,加速高质量垂直行业大模型数据集建设与应用落地,推动数据要素与大模型技术深度融合,重塑数据产业发展范式,为推进数据要素市场化配置改革、释放数据要素价值提供坚实支撑。
作者:孙 毅 中国科学院大学经济与管理学院教授
文件下载:
关联文件: