配电网智能规划多模态数据集
推荐单位:中国南方电网有限责任公司
申报单位:南方电网人工智能科技有限公司
一、背景
针对配电网规划依赖人工作业、数据壁垒严重、多模态数据协同困难等问题,本案例建立了“标准-技术-流程”三位一体数据集治理体系。通过整合规划文本、拓扑图、时序负荷等7类异构数据,构建了覆盖配电网规划业务全流程的多模态高质量数据集,有效支撑配电网规划大、小模型研发,显著提升南方五省区电网运行安全性、韧性与智能化水平。
配电网智能规划数据集整体框架
二、方案和成效
一是打造配电网规划数据集建设样板。面向配电网规划全流程,系统梳理业务需求与数据特性,采集并整合来自不同省份和业务系统的多源异构数据,覆盖规划文本、拓扑图等7类数据。在确保业务合规与安全的前提下,建立统一的配电网规划数据标准与管理体系。
二是构建智能化数据集治理与增强体系。建立“标准-技术-流程”三位一体数据集治理体系,融合混合智能标注、数据增强、跨模态关联等技术,全面提升数据质量与完整性。通过研发拓扑图自动校验、时序数据对齐、文本语义合规检测等功能模块,使数据可用率达99.2%。
三是支撑配电网规划模型高效训练。构建的多模态高质量数据集有力的支撑了负荷预测、网架问题诊断、规划方案生成等配电网规划核心模型的研发,将规划方案生成时间由数天缩短至10分钟,整体规划周期缩短95%,有效支撑配电网规划的快速决策与精准诊断。
四是形成可复制推广的行业创新标杆。首创电力行业多模态高质量数据集构建体系,实现数据标注一致性98%、生成方案100%符合行业规范,并推广至南方电网多省公司及其他新能源企业。
三、创新点
一是建立电力行业多模态数据集治理体系,彰显机制创新。构建业内首创的“标准—技术—流程”治理模式,实现文本、拓扑图、时序数据的跨省协同治理,数据互通率提升至90%,形成行业标杆治理经验。
二是研发知识驱动的跨模态增强技术,突出技术创新。通过大模型的语义重构能力自动生成合规规划方案,覆盖28类规划场景;结合电力导则知识库的GAN数据增强方法,确保数据100%符合行业标准,有效突破小样本训练的瓶颈。
三是创建数据管家协同运营模式,推动管理创新。构建“规划专家规则库—AI工程师智能建模—数据管家质量管控”的流水线机制,将数据标注一致性提升至98%,推动数据集治理从人工抽检向自动化闭环管理全面转型。