无人机视角下人居环境数据集数据标注
申报单位:广东泰一高新技术发展有限公司
推荐单位:广东省政务服务和数据管理局
一、案例简介
在人居环境检测中,传统人工数据标注效率低、质量差且成本高,极大限制了模型训练效果。为此,案例创新运用“AI算法辅助+人工修正双循环迭代优化”方法,借助图文多模态大模型CLIP开展标注工作,有效推动了环境治理与人居环境检测行业发展。

整体框架
二、举措与成效
一是规范无人机视角下人居环境数据样本标注标准,增强算法识别力。详细界定顶棚、集装箱等地物标注对象,精准规范角度、尺寸、形状、颜色、面积等视觉特征,明确边界框标注标准,以适应复杂多样的场景。规范标注标准后所训练的算法模型,在不同环境下对目标的识别准确率从60%提高到85%。
二是AI助力标注,提升效率与精度。运用CLIP多模态模型检索无人机航拍照片寻找可能样本并利用BERT+CRF预训练模型进行预标注,并结合地物要素数据全生命周期来优化标注流程。应用后标注效率提升超30%,标注精度从85%提升至95%以上。
三是大模型检索数据,缓解样本稀缺。借助CLIP多模态模型,对324万张原始航拍照片进行赤膊房目标检索,生成33800张高置信度图像,为算法模型提供了1.6万多有效样本,降低约60%的人工筛选成本,有效缓解数据样本稀缺问题。
四是优化流程与质控,降低标注错误率。建立标准化标注流程,定期优化并简化操作步骤,构建包含自检、抽检、复查的多轮审核机制。具体实施后,标注错误率从12.3%降至3.8%,实现标注质量的全程追溯。
三、特色亮点
一是统一标注范式,打破数据阻碍。搭建人居环境5大要素分类框架,将属性标注细分至12个动态小类,形成统一的跨场景标注范式,让跨场景数据标注一致性超95%,减少跨场景检测时的重复标注成本。
二是创新标注协同,突破效率精度瓶颈。融合地物要素全生命周期模型,利用BERT+CRF预训练模型进行初标注,经过3轮人工质检迭代,F1值达到90%以上,标注速度提升30%以上,精度从85%大幅跃升至95%以上,实现AI与人工的高效协同。
三是大模型精准定位,破解样本稀缺难题。CLIP大模型凭借多模态对比学习和零样本检索能力,无需大量标注数据就能定位目标图像。在赤膊房识别工作中,处理324万张航拍切片,生成33800张目标图像,为标注工作提供充足样本 ,无需耗费大量人工时间过滤海量无关图像。因此,面对庞大的基础图像数据库,使用CLIP大模型可以7*24时不间断的从基础图像库中快速定位所需目标图像,从而解决样本稀缺难题。