高质量数据集典型案例 | 铝合金材料金相组织图片数据集

  • 2025.11.21
  • 来源:国家数据局
  • [ 打印 ]
铝合金材料金相组织图片数据集
  推荐单位:中国铝业集团有限公司
  申报单位:中铝材料应用研究院有限公司
  一、背景
  微观组织决定金属材料的关键性能,其精确的定量表征数据是构建“成分-工艺-组织-性能”模型的基础。针对传统二值化方法易误判、一致性差,数据积累不足而制约AI模型开发的现状,构建铝合金材料金相组织图片数据集。包含11GB专家标注金相图片,支撑高精度AI模型开发。通过平台统一管理,年底将沉淀15GB推理数据,赋能材料研发。
铝合金材料金相组织图片数据集构建
  二、方案和成效
  一是构建半自动化标注体系,攻克数据制备效率瓶颈。
针对人工标注速度慢、一致性差的问题,采用“AI预标注+人工修正”模式优化标注流程,实现标注自动化率超80%,标注效率较传统方式提升3倍以上。结合Mosaic增强与自适应网格切分技术,建成11GB高质量训练集。
  二是创新双模型协同架构,突破复杂组织识别难点。针对色差相近显微组织误判率高的问题,在复杂场景采用中铝集团“坤安”大模型开发实例分割算法,突破传统二值化的多项局限,精准识别灰度相近、对比度低的组织;在简单场景下,则部署轻量化的OpenCV模型,有效压缩了计算成本。最终整体识别准确率达99.5%。
  三是建设智能化金相分析平台,打通数据应用闭环。针对分析链路割裂的问题,开发“金属智眼”平台,与实验室Lims系统链通,集成数据采集、模型推理与存储模块,实现单图分析耗时从3分钟压缩至0.6秒,日处理量超2000张,预计年底沉淀15GB可复用推理数据集。
  四是释放检测效能,实现资源优化配置,赋能金相分析领域降本增效。通过AI模型替代人工分析,人力成本降低90%以上,释放检测设备资源约30%,推动技术人员及设备资源向高价值任务聚焦。
  三、创新点
  一是创新开发半自动化标注模式。
利用改进型阈值分割算法实现组织边界的快速初标,通过微调后的高精度图像分割模型进行轮廓修正,辅以专家精细标注,效率提升3倍以上的同时保障了数据标注质量。
  二是首创多尺度特征融合的算法架构,攻克衬度相近组织识别难题。针对传统视觉检测中因显微组织衬度接近导致的误判难题,建立跨尺度特征关联模型,有效排除污渍、划痕等无关干扰。单张金相图检测耗时压缩至0.6秒,支持2000张/日的高通量处理能力。
  三是为成分设计及工艺优化提供精准数据支撑,驱动有色金属行业智能化转型。与实验室Lims系统链通,沉淀为“成分-工艺-组织-性能”的多模态数据集,为下一步材料研发及垂域大模型的训练奠定数据基础。
附件: