首页  >  专题  >  数据标注

数据标注优秀案例集之四十六 | AI数据标注助力中医药领域高质量发展

  • 2025.06.22
  • 来源:国家数据局
  • [ 打印 ]
AI数据标注助力中医药领域高质量发展
  申报单位:成都中医药大学
  推荐单位:四川省发展和改革委员会(四川省数据局)
  一、案例简介
  为解决中医药领域转型面临的数据标注效率低、标注标准不统一、跨模态数据融合难等问题。案例通过自研中医古籍机器标注系统、构建多模态数据治理工具链、引入联邦计算保障隐私安全等技术创新,实现中西医结合数据的自动化标注与高质量治理。建成2400TB高质量数据集,年均数据规模增长32%,标注效率提升60%,人力成本降低45%,支撑160余个智能算法模型研发,应用于中医诊疗、中药研发和慢病管理等场景,助力中医药行业数字化转型。
整体框架
  二、举措与成效
  一是构建智能标注系统,破解中医古籍文献标注难题。
针对中医古籍数字化标注效率低、专业性强的问题,研发中医古籍文献机器标注系统,基于大模型实现古籍文本的自动分词、实体识别和语义关联,并结合专家审核形成闭环。智能标注系统支持996册古籍的自动化标注,标注准确率达92%,效率较人工提升60%,为中医辨证模型训练提供高质量底层数据。
  二是采用联邦计算技术保障数据安全与合规共享。为解决医疗机构数据孤岛和隐私保护难题,采用分布式联邦计算架构,在不共享原始数据的前提下,实现医疗机构数据的联合标注与模型训练。通过公钥加密和中间结果交换,完成731TB临床数据的跨机构治理,模型训练精度提升25%,数据使用合规率达100%。
  三是通过多模态数据融合提升标注标准化水平。针对中医诊疗中图文影像、生物信息等多源异构数据标注标准不统一的问题,开发跨尺度数据治理工具链,集成机器标注、三级审核和溯源机制。完成了633个器官多维图像、15.4万张胸部CT、1000名老中医临床证候数据的结构化标注,构建中西医结合的标准化标签体系,标注错误率降至5%以下。
  三、特色亮点
  一是融合中医古籍机器标注与知识图谱构建。
基于ChatGLM-6B模型实现古籍生僻字识别与中医术语自动关联,构建包含“穴位-脏腑”、“证候-治法”等关系的知识图谱,标注速度提升3倍。
  二是共建中医药数智信创生态。打造“中医智慧平台”与信创算力底座,建成1MW级中医药数据中心,提供数据清洗、标注、存储一体化服务。
  三是赋能全生命周期健康管理。将标注数据应用于居家养老、慢病管理等场景,开发“健康360数字画像”系统,集成智能手表、环境传感器等多源数据,实现患者作息、饮食、生理指标的自动化标注与分析,推动中医药服务从治疗向健康管理延伸。
附件: