宫颈细胞AI辅助诊断高质量数据集
推荐单位:湖北省数据局
申报单位:武汉兰丁云医学检验实验室有限公司、武汉兰丁智能医学股份有限公司
一、背景
针对基层宫颈癌筛查中病理医生短缺、医疗资源不足、数据标准不一及偏远地区覆盖难等问题,构建总量超1400TB的大规模宫颈细胞数据集,研发4代智能筛查终端。建立“标准化采集→数据加工与管理→动态模型训练及推理→安全质控防护”全流程闭环体系,提升数据管理效率,支撑多类型高性能AI辅助诊断模型开发,应用于多样化场景。消除数据碎片化及互联互通障碍,填补基层病理诊断缺口,突破地域限制并推动宫颈癌筛查普惠化。
宫颈细胞AI辅助诊断高质量数据集技术架构图
二、方案和成效
一是构建超大规模多模态数据库,攻克数据整合难题。构建数据总量超1400TB,涵盖图像、细胞标签(超10亿)、临床元数据等多种模态的超大规模数据集。创新性解决多源异构数据标准化整合与互联互通难题,建立统一数据标准与安全协议,为AI训练提供高质量的数据基础。
二是打造全流程数据质控闭环,驱动产业价值转化。建立“标准化采集→数据加工、管理→动态模型训练及推理→安全质控防护”全链条智能化质控体系,确保数据高准确性与可靠性。在湖北省适龄妇女宫颈癌筛查项目中实现了湖北省103县、1430个乡镇社区标本制备及诊断全流程动态管理,近三年创造经济效益达数亿元,驱动了医疗产业创新。
三是创新数据采集终端与云端诊断新范式。研发4代场景化智能采集设备,集成高清扫描与物联功能。构建“智能设备+云诊断”一体化的癌症早筛服务体系,开创肿瘤细胞早期诊断的新模式。适配三甲医院至基层场景,在西藏山南等偏远地区部署便携设备突破服务壁垒。为西藏山南市近7万名妇女提供服务,有效克服当地特殊气候造成的医疗障碍。
三、创新点
一是数据驱动的临床闭环优化机制。以临床需求导向设计模型,建立上线后基于性能指标(AUC/F1)的动态监控与预警,自动触发再训练,适应人群与疾病谱变化,并通过“输入-模型-输出”三级质控形成可持续优化闭环。
二是海量筛查数据验证规模化应用成效。技术凭“融合”优势实现质变,在宫颈癌筛查中成效显著,于湖北、云南、山西等多地获好评。业务覆盖全国31省2000余机构,筛查近1300万例,以海量实践数据验证了其优异的可复制性与推广能力。
三是多病种数据融合拓展技术应用边界。技术已拓展至口腔癌等筛查领域,与武汉大学口腔医院合作建立国内首个口腔癌AI筛查实验室。通过技术下沉,推动宫颈癌筛查基层落地,已在湖北完成20个实验室试点,具备跨病种、跨区域的广泛应用潜力。