中国交建交通基础设施多维感知
安全监测数据集
推荐单位:中国交通建设集团有限公司
申报单位:中国公路工程咨询集团有限公司、中交一公局集团有限公司、中交基础设施养护集团有限公司、中交资产管理有限公司、中国交通信息科技集团有限公司
一、背景
我国交通基础设施建设规模持续扩大、服役年限增长,交通基础设施产生遥感影像、传感器时序等海量多源异构数据,针对原始数据质量参差不齐、标注效率低下、语义信息缺失等问题,本案例构建“数据采集-标注处理-AI模型适配-质检运维”“五位一体”技术体系,通过多源数据融合、智能标注、算法训练、全流程质控等关键技术,形成覆盖全生命周期的交通基础设施安全监测数据集。可支撑训练出系列前沿AI模型,实现设施病害自动化识别、风险动态预警等功能,显著提升监测效率与决策科学性。
交通基础设施多维感知安全监测数据集建设框架图
二、方案和成效
一是构建多源异构数据采集体系,夯实高质量数据底座。针对交通基础设施数据分散、采集效率低的问题,整合遥感影像、传感器时序、项目资料等多源数据,通过API接口与ETL工具实现自动化采集,形成清洗整合的多维度资源池。从60TB原始数据提炼10TB精准可用数据,形成一套涵盖12项多尺度数据集,覆盖公路、桥梁、隧道等全生命周期场景的交通基础设施监测数据集。
二是定制多策略数据标注方案,提升数据适配性。定制多策略标注方案,对无人机、遥感及车载等影像数据,用算法全自动/半自动生成标签,自动化标注覆盖率提升至75%,标注效率较传统人工方式提升6倍;运营期公路安全监测数据异常识别效率提升80%。依托时空基准统一框架,建成具备时空一致性的基础数据库,数据库涵盖20类核心要素,数据条目达5000万条,为机器学习模型训练提供适配数据。
三是建立分级数据标注与质控体系,保障数据精度。针对影像与时序数据标注难、质控弱的问题,采用算法自动生成+专家复核策略,建立“初标-质检-复核”三级质控体系。质控覆盖10TB精准数据中的98%以上条目,满足AI模型训练要求,支撑模型在病害识别等任务中的准确率提升25%,保障了数据的可靠性。
四是构建交通基础设施安全监测AI模型矩阵,提升监测效能。基于该数据集完成“交融大模型”训练,实现交通基础设施监测效率提升60%、遥感识别率提升30%,养护效率提升40%,外业周期缩短80%,为基础设施施工与运营安全提供科学依据。
三、创新点
一是技术创新驱动数据质量增强。首创海量影像虚拟无损管理、高可靠并行处理技术,攻克交通基建多源异构数据跨模态融合难题,构建行业首个10TB级交通大数据管理平台,实现“建-管-养-运”全生命周期智慧管理。
二是业务革新赋能管理模式升级。重构“移动巡检+云端协同”流程,通过智能车辆实现采集-分析-养护全流程自动化;打造“空间遥感筛查+无人机巡检+分布式AI推理”模式,联动勘察、施工、运营数据,推动风险管理从“事后应急”向“事前预防”转型。
三是管理优化促进数据全生命周期高效运转。建立“业务生产-数据清洗-集成更新”闭环模式,通过“中交蓝海”数据能力底座和“一张图”空间数据中台同步接入、分类登记、数据清洗,定期标注整合形成动态更新数据集,总结建立数据集清洗标注和模型训练技术应用规范,实现数据集全周期高可用应用管理。