高质量数据集典型案例 | “双碳”背景下天然气市场预测高质量数据集建设与应用

  • 2025.11.07
  • 来源:国家数据局
  • [ 打印 ]
“双碳”背景下天然气市场预测高质量数据集
建设与应用
  推荐单位:国家石油天然气管网集团有限公司
  申报单位:国家管网集团工程技术创新有限公司、国家管网集团福建公司
  一、背景
  在“双碳”目标与能源结构转型背景下,预测全国天然气市场需求对优化油气储运布局至关重要。通过整合六大类核心数据及155TB多源数据,依托“流程+数据+规则+算法+模型”模式,突破多颗粒度、多情景天然气市场预测难题,构建“资源市场一张图”,为管网战略规划与投资提供科学支撑,推动规划从经验驱动向数据驱动转型。
数据集构建方法
  二、方案和成效
  一是多维数据体系的创新性构建。
依托“ETL+OCR”采集技术、Z-score等异常值检测、基于Transformer等多种技术,建成覆盖2003—2070年、31省的标准化数据集,助力数据分析效率提升50%以上,年节省支出超400万元。
  二是智能特征工程与区域差异化建模。基于全国多源异构天然气市场预测数据,提出“双层筛选-动态加权”方法,构建“特征重要性-区域适配度”二维画像体系。通过深度挖掘与整合多层级数据,系统识别出工业主导型、城市消费型等差异化特征集合,实现从全国到市县级行政区划的影响因素精准画像,显著降低数据的噪声干扰,提升预测模型在复杂区域场景下的可解释性。
  三是多情景预测模型应用。秉持“影响因素+多情景模拟”的双轮驱动方法论,系统性纳入并结构化处理政策文本、宏观经济指标、技术参数等关键影响因素数据,支撑构建“双碳”约束下多模型融合天然气需求预测方法,增强基础设施布局的前瞻性与科学性,显著降低重大项目投资风险,潜在经济效益达千万元级。
  三、创新点
  一是建立智能数据治理体系。
融合ETL与OCR技术构建多维数据混合采集方式,构建基于Z-Score等算法的智能数据清洗方法,解决传统采集模式下的碎片化难题,实现省市级数据完整性提升至100%,突破传统数据碎片化瓶颈。
  二是构建区域差异化特征工程数据集。首创“特征重要性-区域适配度”二维画像体系,通过“双层筛选-动态加权”机制识别工业主导型、城市消费型等区域特征,实现多级行政区划精准画像,大幅提升预测精确度。
  三是构建“双碳”约束下的多模型融合预测方法。构建政策情景模拟与影响因素分析体系,通过多源数据标准化治理与情景模拟技术,深度解构政策、经济、技术等因素对能源供需影响,解决中长期预测的政策响应迟滞与趋势突变问题。
附件: