地震监测预报预警多模态联合数据集
推荐单位:四川省数据局
申报单位:四川省地震局
一、背景
我国地震活动频发且致灾严重,用于地震监测预报预警数据源和产品种类较多,存在多源异构、时空分辨率不均、数据协议不统一、碎片化与敏感性并存等复杂问题,制约了人工智能技术在地震预测预警中的应用效能。我局以构建覆盖测震、地球物理、遥感等多模态数据的标准化联合数据集为目标,突破多源异构数据融合、深度学习模型构建、轻量化边缘计算等关键技术,解决数据分散存储、格式不统一等挑战,支撑地震大模型训练与多灾种实时预警技术突破。
地震监测预报预警多模态联合数据集
二、方案和成效
一是通过建立分层模块化架构,整合多源异构数据。底层整合地震事件记录,连续观测记录,地震震相数据产品和地震事件目录,涵盖形变观测、地下流体观测、MODIS红外遥感等地球物理等多类数据源;中层基于数据湖技术,统一地震数据格式、异常检测、并合理补全未知区域和时序的多模态地震数据;上层面向地震监测预报预警多场景输出预训练集与测试集(超过10万条)。
二是研发多模态数据融合算法,持续优化模型性能。采用轻量化模型蒸馏压缩参数部署技术,实现数据的高压缩,通过增量学习持续优化模型性能,支撑人工智能开展地震预警精准性提升、地震孕育机理研究、强震危险区识别。支撑震后强地面运动预测精度提升,已服务6.5级以上强震监测算法研发,推动地震预警盲区缩小,震相自动拾取准确率提升。
三是形成智能化分析闭环体系,形成精准服务能力。建立支持地震波、电磁、地下水等4种核心观测数据的融合处理机制,重点解决数据时空配准和特征提取问题,通过原型验证系统形成可复制的技术方案,为能源开采保障、水库安全评估及地质灾害防治提供基础资料。
三、创新点
一是构建“数据-模型-应用”协同创新链。开展多源多模态数据融合与自适应特征提取算法与迁移学习策略,突破时空配准瓶颈。
二是形成“脱敏共享+增强学习”双轮驱动机制。开发轻量化预处理模型,推理延迟控制在200毫秒以内,提升小样本条件下的泛化能力。
三是实现“数据驱动-模型优化-系统集成-示范验证”。形成可迭代的数据维护平台,通过标准化API接口促进多源数据共享;建立全生命周期质量管理体系,引入清洗与脱敏流程,确保数据完整性和合规性,增强可信度。