文 | 国家工业信息安全发展研究中心主任、党委副书记 江明涛
数据作为数字经济时代的基础战略性资源和核心创新引擎,逐步成为重塑经济发展模式、提升社会治理能力、增强国家核心竞争力的关键引擎。《全国数据资源调查报告(2025年)》显示,我国数据生产总量连续三年加速提升,智能算力、数据流通、开发利用等关键指标再上新台阶,为人工智能创新发展筑牢坚实底座。
一、数据资源供给质效同步跃升
数据资源规模和可用水平稳步提升。从生产看,2025年全国年度数据生产总量达52.26泽字节(ZB),同比增长27.28%,规模优势持续领跑。企业成为数据生产增量的重要来源。具身智能、低空经济等新兴领域数据生产增速分别达477.78%、75%,为数据生产体系拓展了全新空间。
从存储看,全国数据存储总量为2.53泽字节(ZB),其中,活跃数据量为1.67泽字节(ZB),同比增长28.46%,结构化数据、云存储数据同比增长分别为43.59%、53.13%,数据资源可获取性和可用性大幅提升。
数据流通效率和数据付费意愿同步提高。随着全国一体化数据市场建设持续推进,跨境、跨省数据流通更加活跃,同比增长达14.88%、19.01%,有效促进了全球合作和区域协同。
从主体看,企业成为数据流通的主力军,头部平台企业数据流通规模、购买数据量是其他企业的140倍、115倍,促进数据流通交易的枢纽作用明显。
从区域看,广东、浙江、江苏等经济大省数据辐射效应显著,北京、上海数据付费企业高于全国平均水平,数字经济发展高地的市场主体数据付费意识超前。
人工智能驱动数据价值释放路径逐渐明晰。2025年,用于人工智能的数据总量为199.48艾字节(EB),数据对人工智能创新发展的基础支撑作用愈发凸显。
在供给方面,各行业、领域高度关注高质量数据集建设,全国高质量数据集数量超11万个,数据量超908拍字节(PB),同比增长分别为61.13%、142.58%。
在应用方面,词元(Token)推动数据供给向价值释放的良性循环逐渐形成,全年词元(Token)调用量超2万万亿,跑出了指数级增长。
二、“三个转变”激发数据资源开发利用活力
数据生产从感知驱动向计算驱动转变。在2023、2024年度数据资源调查中,物联感知设备采集的海量数据是驱动数据资源规模快速增长的核心引擎。2025年,系统软件和人工智能产生的数据量首次超过物联感知数据量达到26.92泽字节(ZB),意味着合成数据、衍生数据等数据量大幅增长,数据生产向计算驱动转变。
人工智能从开发训练到规模落地转变。用于人工智能的数据量为199.48艾字节(EB),其中推理数据量首次超过训练数据量,达到101.34艾字节(EB),显示出人工智能从服务商加大力度投喂数据,向各行业基于现实场景应用人工智能转变,我国丰富应用场景优势进一步显现。从行业看,人工智能应用已经基本覆盖国民经济门类,各行业人工智能用数量增速均超10%。
企业从聚焦本领域数据向更大范围用数转变。从用数主体看,购数企业几乎覆盖了国民经济全部行业门类,购数费用较去年增长22.36%,头部平台企业在人工智能开发训练过程中使用的数据有近3/4为企业外部数据,购数、用数需求旺盛。
从数据类型看,公共数据流通量为440.32艾字节(EB),其中超九成流向企业,公共数据和企业数据融合应用不断深化。
三、下一步发展建议
2026年是“十五五”规划的开局之年,也是“数据要素价值释放年”。随着全国一体化数据市场建设持续推进,数据要素将加速融入经济价值创造过程。下一步建议以制度完善为基础、流通利用为关键、数智融合为牵引,推动我国数据资源规模优势加快向价值优势转化。
一是统筹资源管理,完善数据制度体系。明确国家数据资源体系建设的阶段性目标与实施路径,健全数据资源统计调查制度,建立全国数据资源“一本账”。围绕数据供给、流通、应用关键环节优化机制设计,用系统化制度供给保障数据要素市场的规范与活力。
二是畅通流通渠道,提升数据利用效能。加快全国一体化数据市场建设,发挥各类数据流通机构的枢纽作用,提高跨平台数据流通利用效能。研制一批产业急需的数据标准,打通跨行业、跨区域数据流通堵点。持续开展重点行业可信数据空间建设与应用,促进数据在更大范围流通利用。
三是推动双向赋能,构建数智协同生态。促进人工智能技术应用于数据清洗、治理、挖掘,提升数据处理效率。分行业、分领域打造高质量、标准化、可流通的行业数据集,建设人工智能语料库。加快推动行业智能体落地应用,以企业真实场景和数据带动技术落地,实现数据驱动智能升级、应用激活数据价值的良性循环。