高质量数据集典型案例 | 亿级多器官超声影像人工智能高质量数据集

  • 2025.10.21
  • 来源:国家数据局
  • [ 打印 ]
亿级多器官超声影像人工智能高质量数据集
  推荐单位:湖北省数据局
  申报单位:华中科技大学同济医学院附属协和医院
  一、背景
  针对中国超声医师缺口大、基层资源分布不均及AI研发“数据荒漠化”(存储缺失、标注不足、数据流失)三大痛点,本项目依托武汉协和医院日均10万份异构数据,成功构建亿级多器官超声人工智能训练资源库。项目突破海量数据实时整合、安全脱敏及专家级标注质控三大技术瓶颈,基于百万例患者、亿级影像数据,融合超10余家顶级三甲医院及13国的国际数据集资源,经深度治理,构建形成20余个高价值专病库与超200个标准化AI数据集。依托大规模高质量数据基座,驱动超声AI研发突破,奠基下一代智能诊疗,助推医疗普惠与基层水平提升。
亿级多器官超声影像人工智能高质量数据集四位一体建设框架
  二、方案和成效
  一是攻克海量异构数据实时整合瓶颈。
针对日均10万份多源异构超声影像,构建高性能存储与实时同步体系,采用DICOM原生像素级无损引擎,实现毫秒级落盘与极速调阅。
  二是构建安全高效数据治理闭环。自研40余套设备协议实现统一脱敏,构建“提取-加密-存储-验证”四重闭环,获GDPR等保三级双认证并确保数据血缘无损追溯;依托自研EchoMAP平台,实施“AI初筛-双医生独立盲审-权威终审仲裁”三级质控,完成超45万幅图像多维度精准智能标注。
  三是打造智能超声诊疗新体系。基于2.45亿影像预训练全球首个超声多模态大模型UltraUnion,实现70余种疾病精准诊断,甲状腺超声诊断达高年资医师水平,AI生成报告获专家认可;联合开发全球首台具身智能超声机器人,突破甲状腺、肝脏等6部位“扫-检-诊”全自动技术并开展三甲多中心临床验证;共建省级AI标准数据集加速审批,通过政府平台开放模型赋能中部医疗联盟;构建教学案例库赋能超声医学人才培养。
  三、创新点
  一是技术突破攻克数据治理难题。
建成全球首个跨国家、跨设备、跨病种泛化超声AI基建设施,系统整合国内十余家三甲医院及13国公开数据集的多中心、多设备异构数据,攻克了超声数据格式不一、标注体系复杂、隐私要求高等数据治理难题,为AI模型泛化应用奠定坚实基础。
  二是应用创新驱动数据赋能具身智能。实现“机械臂精准扫查+AI实时检诊”全流程无人化闭环,通过具身智能超声机器人将自动化硬件与超声AI大模型深度融合,释放数据核心价值,显著提升检查效率与标准化程度。
  三是机制建设促进数据生态流通。构建可持续的数据即服务(DaaS)生态,通过模型许可、设备嵌入、合规数据授权三级引擎形成商业闭环,驱动技术创新成果普惠化落地与行业生态升级,赋能更广泛医疗场景。
附件: