首页  >  业务频道  >  数字科技和基础设施

高质量数据集典型案例 | 中国全球海洋融合数据集1.0

中国全球海洋融合数据集1.0
  推荐单位:自然资源部
  申报单位:国家海洋信息中心
  一、背景
  高质量海洋数据产品是应对全球气候变化、防灾减灾、生态保护和经济发展的重要支撑。针对海洋环境数据多源异构、质量参差不齐、小样本贫信息问题严重等问题,本案例构建了“联合质控-智能融合-迁移重构”三位一体的数据融合技术流程,形成了长时序、高精度、高质量的中国全球海洋融合数据集。本数据集已在第三届联合国海洋大会公开发布,为全球应对气候变化和科学研究等提供中国海洋公共产品、中国技术和中国贡献。

中国全球海洋融合数据集1.0制作流程
  二、方案和成效
  一是研发多源海洋观测数据智能联合质控技术,提高多源海洋环境大数据的可用性。针对原始观测数据精度不足问题,研究多参数联合、多要素结合、多方法组合的最佳质量控制方案,实现多源异构海洋环境数据精细化联合质控,融合深度学习预测与传统统计分析方法的质控准确度提升了8.6%。
  二是设计多源海洋环境数据智能融合方法,有效提升数据融合物理合理性和可解释性。针对现有融合数据物理机制不足问题,研究基于控制方程、约束条件、先验知识和物理规律的损失函数,构建多源海洋环境数据融合深度学习模型,引入通道与空间注意力机制,平均融合精度相较于其最优的融合数据源提升20.77%。
  三是构建高质量特征迁移模型,解决历史海洋观测数据稀疏等小样本问题。针对多源海洋观测数据所存在的碎片化、断续以及时空分布严重不均等问题,提出基于迁移学习方法的稀疏观测数据融合重构技术,将观测资料丰富时空域内学习到的知识迁移到观测稀疏时空域,相比无数据特征补充,均方根误差大幅降低20%。
  三、创新点
  一是数据来源广。数据集几乎覆盖了国内外主流海洋观测数据、海洋卫星遥感数据、客观分析/再分析产品、模式模拟数据,并适当融入中国自主观测数据,数据总量超600TB。
  二是广泛应用人工智能技术。建立了“多源数据分析处理→智能融合→迁移重构”技术流程,采用先进AI技术进行数据的特征挖掘、关联分析和智能融合,创新攻关海洋环境多要素的时空特征分析和关联挖掘技术、数据与物理混合驱动的多源海洋数据融合技术和海洋稀疏观测数据迁移重构技术。
  三是数据集要素多、精度高。数据集涵盖了温度、盐度等10种关键海洋参数,平均时间累积长度超60年,空间分辨率为10公里,各要素产品平均融合精度相较于国际通用再分析产品,均有所提升。
附件: