数据标注优秀案例集之二十三 | 深挖数据处理价值构建城市级数据标注产业生态

  • 2025.05.30
  • 来源:国家数据局
  • [ 打印 ]
深挖数据处理价值构建城市级数据标注产业生态
  申报单位:昆玉市协盈数字科技有限公司
  推荐单位:新疆生产建设兵团数据局
  一、案例简介
  针对兵团数据标注产业空白、人才短缺、技术依赖内地等问题,昆玉市协盈数字科技有限公司通过自研技术、校企合作、标准化管理等措施,实现数据标注效率提升、成本优化及民族青年就业赋能。聚焦小语种标注、自动驾驶、无人零售等领域,累计解决当地2300余人就业问题,形成覆盖数据标注全流程的标准化体系。
图1交付流程
  二、举措与成效
  一是自研数据标注工具,提升标注效率。基于YOLOv5开发的图像标注工具,实现目标物体自动框选效率提升30%;基于BERT+CRF融合算法开发的文本标注工具,实现小语种关键词提取,准确率达92%。
  二是建设标注全流程质控体系,质量更高。按照客户及标注要求,按需配置标注团队,实现数据标注三级质控体系:即标注→质检员全检→质检员二审→组长抽审→客户验收,建立了数据标注基地全流程质控体系,数据标注的返工率由17%降至5%。
图2数据安全标准化体系
  三是打造数据标注领域标准规范,标准化运营。在数据标注工作和标准化数据交付流程过程中制定了《自动驾驶技术中的数据标注标准》《针对小语种语料库中的语音转写标准》《关于无人零售技术中的视觉动态审核标准》等5项数据标注标准,填补了兵团数据行业数据标注标准空白。
  三、特色亮点
  一是搭建新零售视频审核平台,整合更高效。
通过该平台,视频审核单任务人工工时从8小时降低至6.3小时,下降21%,年节省成本270万元;2023年新零售领域数据服务营收从300万元增加至2024年的750万元,增长150%;累计获4项零售专利、17项相关软著,知识产权估值增长240万元。
  二是培育城市数据标注生态,上下游俱全。数据标注基地通过就业促进直接创造1360个岗位,其中标注员1000人和技术岗360人,间接带动上下游产生250个岗位;并通过教育融合,与6所院校共建实训基地,年培养500人,并获新疆“人工智能训练师”工种鉴定,可培养五级到三级的数字职业技能人才。
  三是打造数据标注产业集聚区,标注联动。打造“1+N”数据产业群,形成跨区域规模化数据服务能力,包括数据采集、数据清洗、数据标注、数据训练全产业链的数据服务。目前已成功孵化4家数据标注企业、7个项目工作室,输出123类产品数据集。
附件: