高质量数据集典型案例 | 广东省预防接种高质量数据集

  • 2025.10.09
  • 来源:国家数据局
  • [ 打印 ]
广东省预防接种高质量数据集
  推荐单位:国家疾控局
  申报单位:广东省疾病预防控制中心
  一、背景
  广东省2019年建成覆盖全省的疫苗流通与接种管理信息系统,连接21个地市、5000余家接种单位,建成公众服务平台“粤苗”,实现数据实时汇聚。系统集成接种档案、出入库记录等多模态数据,日均处理超100G,形成5年以上标准化高质量数据集。基于湖仓一体架构,构建动态管理体系,实现档案实时更新与异常数据智能核修。该系统支撑AI预测模型应用,显著提升疫苗调配效率与接种及时率,降低损耗与重卡率,成为公共卫生大数据应用典范。
架构图
  二、方案和成效
  一是横向业务汇聚,构建全覆盖业务库。
深度整合疾控机构和接种单位疫苗管理、预防接种等业务,建立了覆盖疫苗全生命周期的业务数据库,不仅消除了信息孤岛,更形成了完整的疫苗管理数据闭环。
  二是纵向全省统一,确保数据准确。采用省级集中部署模式,全省21个地市、5000余家接种单位统一使用同一平台。实现“纵向到底”的管理模式。
  三是大数据模型搭建“湖仓一体”架构。采用“湖仓一体”架构,支持疫苗流通数据“存算一体、按需治理”,为大数据模型提供高时效、高可靠的数据输入,实现“数据实时流动、模型动态迭代”的闭环。
  四是大模型数据利用智能分析与决策。深度挖掘数据价值,构建了多个智能分析模型。提升了公共卫生服务效能,优化了疫苗预警策略,实现了从数据到决策的价值转化。
  五是AI智能辅助大数据分析。AI智能外呼辅助大数据分析技术路线通过整合省政务云大数据计算能力,实现对流动儿童档案的精准识别与筛选。形成完整的数据采集、分析、应用的闭环流程。
  三、创新点
  一是多源异构数据融合引擎。
创新构建异构数据融合引擎,首创“多模数据库协同架构”,攻克多源异构数据(结构化、半结构化、时序流数据)实时融合难题。
  二是大数据与AI追踪体系。大数据建模精准定位未种/迟种目标人群,结合时空行为特征分析深挖未接种动因;部署AI智能外呼系统动态交互验证。构建“数据驱动+智能决策”的精准接种闭环。
  三是跨业务数据智能融合平台。电子预防接种证上线“粤省事”平台;疫苗接种信息与教育部门学籍信息深度融合;整合区域病毒性肝炎疫苗接种、筛查、治疗数据,构建乙肝“医防管”全链条数据体系。
附件: