数据标注优秀案例集之二十 | 深挖政务热线数据标注产业赋能基层治理新场景

  • 2025.05.27
  • 来源:国家数据局
  • [ 打印 ]
深挖政务热线数据标注产业赋能基层治理新场景
  申报单位:辽宁省民心网、辽宁民心出版传媒有限公司、联通(辽宁)产业互联网有限公司
  推荐单位:辽宁省数据局
  一、案例简介
  辽宁省依托12345政务热线构建全省社情民意数据库,开展跨域数据联动,打造智能标注场景、拓展标注形态、完善后训练体系,汇聚高质量数据集。该成果为区域基层治理提供精准决策支撑,推动政务服务现代化升级。

整体框架
  二、举措与成效
  一是汇聚高质量数据集。对省域内各级各类诉求渠道数据归口化管理,与信访、人大、纪检、政法等多部门数据对接。诉求数据总量超4亿条,多模态数据总量达16T,年新增1400万条业务数据,月更新量15%-30%,数据可持续迭代能力持续提升。
  二是规范化数据治理体系。集成诉求位置信息、时间序列、事件类型、处置状态、整改效果等环节,形成“问题采集-标注分析-治理反馈”治理体系;围绕重点人物、事件、单位、领域等,编制48个行业领域、222项问题类型、4627项数据标签。
  三是高效化数据标注流程。运用数据加密、访问控制、数据脱敏、安全审计等方式,形成数据“加载-检测-去重-转换-缩放-编码-验证-导出”清洗链条。引入“数据清洗车间”“因果森林”等技术,解决传统数据标注效率低、精准度差问题。打造人机协同的后训练体系,日均处理数据6万余条,标注准确率90%以上,人力成本降低30%。
  三、特色亮点
  一是跨领域数据联动。构建“省-市-县-乡-村-网格”基层治理数据联动体系,与省级政务服务平台相融合,推动“一件事一次办”改革。相关经验向公共服务、城市治理等领域拓展,带动相关省市政务热线借鉴应用,形成“采集-标注-训练-应用”产业链。
  二是多层次标注形态。对诉求信息的时间序列、地理位置、情感趋势、历史偏好、反映频次等深度分析,构建因果关系链、明确逻辑架构、强化推理步骤,衍生多模态数据、时序数据、思维链数据等多种标注形态。
  三是多维度应用场景。运用情感语音模型构建社会情绪感知场景,成为社会情绪监测风向标。归集10大领域54种风险隐患,构建社会风险预警模型。对全省18025个小区楼盘构建多维度分析模型,动态生成小区宜居指数图谱。
  四是多元化标注模式。建立“自检-交叉核验-抽样复审”质检机制和“AI初筛-专业复核-交叉验证”动态评估模式,动员全省1400余名话务员与3.7万基层人员参与数据采集标注,打造“技术+行业+创新”复合型团队,并向专业数据标注工程师转型。
附件: