高质量数据集典型案例 | 高质量宫颈细胞数据集

  • 2025.10.29
  • 来源:国家数据局
  • [ 打印 ]
高质量宫颈细胞数据集
  推荐单位:宁波市数据局
  申报单位:宁波江丰生物信息技术有限公司
  一、背景
  宫颈癌发病率居女性恶性肿瘤第二位,我司针对我国宫颈癌筛查率低(不足40%)、基层服务薄弱(病理医生缺口高达80%)、诊断效率不足(传统报告周期15天以上)等核心问题,构建标准化、可追溯的“高质量宫颈细胞数据集”,通过将病理数据要素与人工智能技术深度融合,利用数据要素开发AI辅助诊断软件,结合远程会诊平台,创新打造数智化宫颈癌筛查新范式,显著提升公共卫生服务效能。

高质量宫颈细胞数据集全流程构建与应用示意图
  二、方案和成效
  一是实现病理切片数字化,形成病理数据集。依托高质量数字病理扫描技术,实现宫颈玻片全视野数字化转化,累计采集150万例筛查数据,构建标准化、可追溯的宫颈细胞图像数据集,完成病理数据要素从0到1的突破。
  二是实现病理数据要素有效运用,助力AI筛查。基于数据集融合深度学习算法,开发AI辅助诊断系统,实现可疑细胞精准识别与分类,推动筛查效率与准确性双提升:单日诊断量增长100%,阳性检出率由传统2%~3%提升至≥5%,报告周期从14天缩短至5天,为早诊早治赢得关键时间窗口。
  三是实现病理数据流通,服务远程诊断。通过数据流通赋能远程会诊,连接基层与三甲医院支持实时诊断,推动优质资源下沉。已在全国建立15个市级筛查实验室,覆盖两癌筛查等场景,入选工信部人工智能医疗器械创新任务揭榜项目,成为首个规模化应用于宫颈癌筛查的智慧病理解决方案。
  四是实现病理数据安全治理,构建全生命周期管理。建立覆盖数据采集、存储、处理、应用全生命周期的安全治理体系,采用分级加密、脱敏处理及权限管控技术,通过溯源追踪与安全审计实现全流程监管,支撑15个实验室安全运行,未发生数据泄露事故,推动病理数据在安全可控前提下高效流通与价值释放。
  三、创新点
  一是技术创新破局病理数字化瓶颈。通过高质量数字病理扫描技术实现宫颈玻片全视野数字化转化,突破传统显微镜阅片不可追溯瓶颈;系统化构建150万例宫颈细胞图像数据集及全周期健康档案库,完成病理数据从0到1的要素化突破,为AI模型训练奠定基础。
  二是模式创新驱动医疗资源下沉。依托远程会诊平台实现数据流通,有效解决基层病理医生缺口达80%的难题,构建数据驱动型智慧医疗范式,加速新质生产力在公共卫生领域的实践落地。
  三是机制创新驱动数据价值释放。构建贯穿数据全生命周期的安全合规治理体系与数据运营机制,在保障隐私前提下促进数据有序流动,形成“数据-模型-应用-反馈”的产业生态闭环,释放数据价值,助力公共卫生服务提质增效。
附件: