数据标注优秀案例集之三十四 | 场景驱动高质量垂类数据标注人才培养

  • 2025.06.10
  • 来源:国家数据局
  • [ 打印 ]
场景驱动高质量垂类数据标注人才培养
  申报单位:大连金慧融智科技股份有限公司
  推荐单位:大连市数据局
  一、案例简介
  为解决高质量垂类多模态数据标注专业人才结构性短缺、培养周期长、技能与场景脱节问题,通过将垂类业务场景、自主研发的大模型智能标注平台与人才培养体系结合,推出场景化人机协同培养模式,案例已在多个业务基地落地实施,累计培养逾1万名专业标注人员,有效缩短人才培养周期20%,提升培训效率40%,培训后准确率提升8%。
图 1 人才建设体系框架
  二、举措与成效
  一是聚焦人才需求,构建全面培训体系。
针对人才专业能力不足问题,通过参与标准制定,贯彻“人工智能训练师”国家标准,以垂类多模态标注岗位技能图谱为依据,构建涵盖基础理论与垂类知识的全面培训体系,解决了人才成长周期长的痛点,通用标注员到垂类领域标注员的周期缩短20%。
  二是研发实训产品,赋能多垂类人才培养。针对垂类标注人才培养困难问题,通过自主研发智能标注平台及整合质量智能监测工具,解决了实训工具短缺的痛点,提升培训效率40%,实训后垂类场景新手准确率从90%提升至98%,达到成熟水平。
  三是深化产教融合,构建多层级人才评价体系。针对人才评价体系不完善问题,通过与国内多所院校建立产学研合作,建设实训平台,开展职业技能等级认定,分层次建设高质量人才库,解决人才评价标准单一的痛点,形成高质量标注团队超4000人。
  四是对标国际标准,强化人才数据安全意识。针对数据标注安全管理问题,通过遵循ISO27001、ISO9001、ISO22301及DCMM等国际认证要求,开展规范化的数据安全培训,解决了参训人员安全意识不足的痛点,保证了生产环境中的规模化高质量交付。
图 2 多模态慧标注平台框架
  三、特色亮点
  一是人机协同,深化场景应用。
采用“人机协同+场景模拟”模式,依托自主研发的智能标注平台,整合交通、金融、电商等垂类场景实训案例,构建学员沉浸式实操模式,形成可借鉴的垂类标注人才培养方案。
  二是技术迭代,优化全链流程。成功研发多模态标注、人机协同标注和智能审核的全链路AI高效标注平台,涵盖图像、文本、音频、视频、点云等全类型数据的多模态标注功能,支持多人多团队在线协作化,实现标注效率与人才培养效能的双重跃升。
  三是汇智共创,构建融合生态。与高校、职业院校、行业专家和企业多方合作,建立产教融合实训创新平台,已建设电商客服语音文本训练、语音ASR转写及优化等案例,形成“技术研发-标准制定-人才培养”合作体系。通过与地方政府合作,形成“人才孵化-产业培育-市场拓展”良性循环。
附件: