Processing math: 30%
高级检索

基于随机森林算法的配电网频繁停电预警技术研究

张宏伟

张宏伟. 基于随机森林算法的配电网频繁停电预警技术研究[J]. 农村电气化, 2025, (3): 1-6, 47. DOI: 10.13882/j.cnki.ncdqh.2412A040
引用本文: 张宏伟. 基于随机森林算法的配电网频繁停电预警技术研究[J]. 农村电气化, 2025, (3): 1-6, 47. DOI: 10.13882/j.cnki.ncdqh.2412A040
ZHANG Hongwei. Research on Distribution Network Frequent Outage Warning Technology Based on Random Forests Algorithm[J]. RURAL ELECTRIFICATION, 2025, (3): 1-6, 47. DOI: 10.13882/j.cnki.ncdqh.2412A040
Citation: ZHANG Hongwei. Research on Distribution Network Frequent Outage Warning Technology Based on Random Forests Algorithm[J]. RURAL ELECTRIFICATION, 2025, (3): 1-6, 47. DOI: 10.13882/j.cnki.ncdqh.2412A040

基于随机森林算法的配电网频繁停电预警技术研究

基金项目: 

国家电网有限公司科技项目(W23KJ2704011)。

详细信息
    作者简介:

    张宏伟(1976—),男,本科,高级工程师(教授级),研究方向为超特高压电网电磁特性及新能源并网特性,E-mail:gs_zhanghw@163.com

  • 中图分类号: TM744

Research on Distribution Network Frequent Outage Warning Technology Based on Random Forests Algorithm

  • 摘要:

    传统的频繁停电管控模式主要是人工多系统查询、手动计算等方式进行统计分析,工作量大,数据分析不全面,严重制约对配电网管理的科学性、先进性和精益化水平。文章将基础数据和频繁停电及停电线变户数据结构化、规范化,形成大数据生态归集和管理,挖掘“数字价值”,使用支持向量机和逻辑回归同时进行预测,减小分类出错的概率,使用随机森林算法加以改进。从客户实际用电体验的角度,研究了新客户电力供应敏感程度的分类模型和计算方法,并采用多种机器学习相结合的方法,基于客户敏感程度以及停电事件相关特征数据来对客户投诉的概率进行预测。

    Abstract:

    Traditional frequent power outage management mainly uses manual multi-system queries and manual calculations for statistical analysis, resulting in heavy workloads and incomplete data analysis, which severely restricts the scientificity, advancement, and lean level of distribution network management. This paper structures and standardizes fundamental data, frequent power outage data, and line-transformer-customer data related to power outages, forming big data ecological collection and management to mine ‘digital value’. It uses both Support Vector Machines (SVM) and Logistic Regression for simultaneous prediction to reduce classification error probability, with improvements made through Random Forest algorithm. From the perspective of customers’ actual electricity usage experience, new classification models and calculation methods for customers’ power supply sensitivity level are studied. A combined approach using multiple machine learning methods is adopted to predict customer complaint probability based on customer sensitivity and relevant characteristic data of power outage events.

  • 电网主要包括输电网和配电网,配电网一般是指35 kV及以下电压等级的电网[1-2]。按照有关规定,频繁停电是指电力客户2个月内出现3次及以上停电故障[3-4]。传统的频繁停电管控模式主要是人工多系统查询、手动计算等方式进行统计分析,工作量大,数据分析不全面,严重制约对配电网管理的科学性、先进性和精益化水平[5]。因此,采用统计分析技术,聚焦高风险区域,对配电线路、台区变压器以及电力客户的频繁停电进行分类,对高风险停电实现预警。

    随机森林算法(random forests)是集成学习(bagging)里最具有代表性的一个算法[6],对高维数据分类问题具有良好的可扩展性和并行性[7]。本文开展了基于Random Forests算法的配电网频繁停电预警技术研究,构建一套提升供电服务水平和客户体验评估指标体系的数据统计分析模型和数据库,全面排查频繁停电线路或供电台区,强化频繁停电管控、实现配网线路信息共享,对停电风险进行提前预警,提高配网故障研判、处置速度,为客户提供更加高效、快捷、优质的供电服务。

    本文研究的方法集成了营销服务系统、用电信息采集系统、设备(资产)运维精益管理系统(PMS)、地理信息系统(GIS)、调度管理系统(OMS)、调度自动化系统(EMS)、配电自动化系统(DMS)、故障指示系统、数据中台、全业务数据中心、供电服务底层支撑平台等多个系统/平台,通过收集整合数据中台、PMS系统、营销服务系统、95598供电服务系统中的停电信息、客户台账信息和客户的话务信息获得多维度数据,并通过供电台区编号和客户编号对系统内的数据进行关联。对区域内频繁停电的线路、台区及影响的客户进行多维度分析,对特定时间段内线路、台区及客户数据进行整合分析,再进行数据交互(多平台数据)分类分析并在地图上展示热点图[8]。通过中台业务实时运行数据支撑、数据即时同步更新的方法,对线路健康运行、设备及时监测、业务运行处置等进行全方位监督监测,提升数据分析效能。数据集构建关系见图1

    图  1  数据集构建图

    结合配电网线路、台区变压器、客户停电信息,应用大数据分析技术,建立基于大数据分析的停电风险预警模型[9],监测配电网停电地区分布情况、变化趋势,对风险区域进行识别,对停电风险提前预警。

    接入PMS系统、用电采集系统、EMS系统内计划检修停电、故障停电(线路失电、配变失电、0.4 kV低压分接箱失电、户表失电)等停电信息,建立全量线–变–户停电信息池。

    配网线路频繁停电查询功能包含所有停电类型,主要包括计划停电、临时停电、负荷转供停/限电、故障停电。按照频繁停电要求设定时间节点规则,将配网线路图导入系统,以图形定位的形式,通过线路图对线路名称、编号、位置等信息进行查询。查询单台变压器、分接箱、环网柜等设备时,点击配网线路图中所需查询的设备,可关联重复停电信息及客户信息。点击分段、分支开关,可查询对应的分段或分支线路信息,以及所带的设备重复停电信息及客户信息。

    关联所有停电类型(包括计划停电、临时停电、负荷转供停/限电、故障停电)及详细信息,配置频繁停电时间节点规则。输入查询线路名称或编号,自动检索重复停电线路及设备的停电类型、停电次数、停电时间、客户数量等详细停电信息。

    基于网络拓扑关系、运行状态海量数据和业务数据,实现对配网各层级(配电网馈线/分支线路/变压器)设备的在线监测、异常管控、数据质量检测等业务管控方面的全流程监督处置能力提升,对异常数据的多维度统计分析,异常设备提前预测闭环处理。技术架构见图2

    图  2  技术架构图

    电力客户感受可以用“影响较小”“影响较大”和“影响严重”来描述,并通过差异化阈值区分其严重程度,用指标θv1θv2来表示[10]

    供电台区的负荷特性决定着停电对电力客户影响程度[11],况且客户类型繁多,居民、非居民、商业等各类客户交叉。从台区96点负荷曲线来看,每个台区不同客户比例差别较大,当商业客户比例较大时,台区96点负荷曲线呈“单峰”状;商业和居民客户比例接近时,台区96点负荷曲线呈“双峰”状;当居民客户比例较大时,台区96点负荷曲线呈“三峰”状。台区负荷特性曲线见图3

    图  3  台区负荷特性曲线

    结合台区负荷特性曲线,规定高于日平均负荷的时段为高峰负荷时段,并根据停电台区或线路的负荷特性曲线和停电时间确定高峰时段停电比例。高峰停电时间比例的阈值θv1=25%θv2=60%,当高峰停电时段比例θv1<25%时,可界定为该停电对对客户的影响较小;当高峰停电时段比例θv2>60%时,则界定为对客户的影响较为严重。

    对某一时段内的停电线路进行统计,发现停电时长9~12 h的停电比例较大,12 h以上的停电比较较小,见图4

    图  4  某一时段停电时长统计图

    按照停、复电要求[3],设定评价指标阈值如下[12]

    停电时长为0~6 h时,即θv1,界定为影响较小;

    停电时长为6~12 h时,即 \theta_{{\rm v}1}\geqslant{4}{5\text%}{,}\theta_{{\rm v}2}< {4}{5\text%} ,界定为影响较大;

    停电时长大于12 h,即 \theta_{{\rm v}2}\geqslant{40}{\text%} ,界定为影响严重。

    频繁停电由停电间隔时长来确定阈值,根据频繁停电的认定标准[3-4],设定其评价指标为综合停电间隔时长T_{\rm POI} 如下:

    T_{\rm POI}{=0.6} \times {{t}}_{{1}}{+0.}{3}\times{{t}}_{{2}}{+0.}{1}{\times}{{t}}_{{3}} (1)

    式中:ti为相邻2次停电间隔的时长;i为停电次数,取值为1、2、3。

    通过阈值将停电对电力客户的影响进行量化,对阈值临界点附近的停电类型,可以建立隶属函数关系,通过元素隶属于不同集合的程度来表达。

    常用的隶属函数关系种类较多,有文献研究表明正态隶属函数能对集合的隶属度变化进行更准确的描述[13],因此,依据阈值及其曲线形式来描述正态隶属函数。以阈值的中位数作为正态分布均值μ,左右区间的均值按照相邻区间的正态分布的标准差和3 \sigma 计算。

    以阈值 \theta_{{\rm v}1} \theta_{{\rm v}2} 来划分3个区间,分别为Q1Q2Q3,其中Q1Q3对应隶属函数为半正态分布,其隶属函数参数计算公式如下:

    \left\{ \begin{gathered} {\mu _1} = {\mu _2} - 3{\sigma _2} \\ {\sigma _1} = \frac{{{\mu _2} - {\mu _1}}}{3} \\ \end{gathered} \right. (2)
    \left\{\begin{aligned}& {\mu }_{2}=\frac{\theta_{{\rm v}1}+\theta_{{\rm v}2}}{2}\\ &{\sigma }_{2}=\frac{2({\mu }_{2}-\theta_{{\rm v}1})}{3}\end{aligned}\right. (3)
    \left\{ \begin{gathered} {\mu _3} = {\mu _2} + 3{\sigma _2} \\ {\sigma _3} = {\sigma _2} \\ \end{gathered} \right. (4)

    式中:\mu _i 为以阈值的中位数的正态分布均值;\sigma _i 为区间的正态分布的标准差;\theta_{{\rm v}i} 为电力客户感受程度的阈值,i取值1、2、3。对应的隶属函数曲线见图5

    图  5  正态隶属函数曲线

    采集后的数据剔除多余特征,清洗非标准数据集后,选取综合性强的特征值做为训练集数据,见表1

    表  1  停电特征指标
    序号 特征指标 序号 特征指标
    1 是否频繁停电 7 同期停电时长
    2 停电时长 8 是否提前通知
    3 用电高峰时停电时长 9 所属台区
    4 是否周末 10 影响台区数总计
    5 停电类型 11 影响台区敏感度
    6 开始时间段 12 影响户数总计
    下载: 导出CSV 
    | 显示表格

    将训练集内的数据通过图表、表格、方程拟合、计算特征量等手段探索出相互间的规律、内在联系或逻辑关系,根据评价结果选取输出性能更优的特征数据搭建特征子集,并运用搭建的特征子集开展数据建模,确保模型算法精准、正确、可靠、可信、可用。

    业务应用数据均来源于数据中台,依托数据中台全量数据的完整性和及时性,通过基础数据抽取、业务数据融合、增量数据实时更新同步的方式进行数据管控业务支撑,包含设备台账信息、拓扑维护信息、停电信息报送、电力客户基础信息、线路运行信息、设备运行电压电流信息等相关数据,依托电网GIS平台同步GIS定位地理信息、地图位置及大数据平台数据。

    异常数据主要涉及缺失值、数据错误、度量标准错误、编码不一致等方面。当出现下列情况时,即判定为异常数据或者数据异常。

    1)数据值是空或显示错误值(如null、value、#DIV/0!)。

    2)端口或ETL数据抽取造成错误或源端数据库中的垃圾数据。

    3)由于度量标准错误造成的错误数据,如接入数据库中数据字段长度小于输入数据库的字段长度。

    4)提取的数据属于非标准度量单位,或度量单位不一致的值。

    数据训练、自学习过程中,对各个源端数据库导出的设备台账数据及营销侧客户信息等基础数据进行质量评估,发现上述异常数据时,自动将该数据剔除,并抽取多个相邻时刻正常数据的中位数来取代该异常数据,消除噪声影响。

    以数据平台全链路基础数据为依托,通过基础数据及时性监督、数据属性准确性对比等方式,将系统内原数据以中台数据为准进行更新、验证,针对相关数据缺失值、异常值等进行同步校正、处置,使之能全面支撑业务功能应用。数据清理逻辑和流程如下:

    1)初始化地图。进入系统后,初始化地图页面:以经度102.200277°(前台写死)、纬度38.53476°(前台写死)和地图层级18(前台写死)为初始化值初始化地图。地图层级为地图比例尺缩放级别,数字越大,搜索的范围越小,信息越详细。

    2)进入地图。按照10 kV线路、柱上变压器、分接箱、环网柜、分段线路、分支开关、线路故障等设备的类型,在地图对应接入点图标,根据图标提示即可绘制相应设备的草图。柱上变压器、分接箱、环网柜、分支开关根据特定图标在地图相应位置展示,展示图层为:柱上变压器为19层,分接箱和环网柜为17层,分支开关和分段线路为15层,10 kV线路、线路故障和分段线路为13层(当前页面展示范围内所有数据)。

    3)展示设备信息。点击地图上图标/绘制草图悬浮框,对应的设备详细信息将会逐一展示。

    配电网线路主要展示线路名称、起点电站、运行状态、电压等级、线路长度、运维单位。

    线路故障主要展示线路名称、起点电站、故障时间、影响配变数、运维单位。

    柱上变压器主要展示设备名称、所属线路、型号、额定容量、运行状态、电压等级、运维单位。

    环网柜主要展示设备名称、电压等级、站址、型号、运行状态、运维单位。

    分支开关主要展示设备名称、所属线路、所属杆塔、运行状态、开关类型、运维单位。分为4类展示:低压柱上隔离开关、柱上断路器、柱上隔离开关、柱上跌落式熔断器。

    源库字段在数据输入时,会根据需求对数据清洗接入所需字段以及排除掉错误字段。

    数据转换的主要目的是对所需的数据、文档、文件和附件等进行转换输入,使逻辑编写及数据查询迅速、快捷。业务应用过程中涉及到的非结构化数据,主要包括图像、附件文档、文本文件等,通过文件解析、定时验证、属性校验等方式进行处理,确保满足业务功能应用。针对无法及时验证处理的数据,根据供电服务指挥系统内数据结构要求,业务应用需求进行整体迁移处理,满足数据量纲及离散数据归一化要求。

    数据转换过程见图6

    图  6  数据转换逻辑关系图

    不同业务场景中应用的离散数据、不规范数据等,通过字段属性对比、数据质量验证、业务功能贯通等方式进行关联整合,针对多源数据不同数据集间关联方式、关联过程不一致导致的业务功能响应慢、操作流程不贯通等现象,通过统一建表管控、统一数据筛查的方式,制定宽表结构,满足多业务流程共享、共用。

    数据整合是将源数据进行关联查询并筛选错误字段,以及与其相关联源数据库查询之后得到的结果数据,多平台数据进行数据交互后,在目标数据库中建立单独的结果集数据表,提升后台代码处理数据的效率并改善应用过程中电力客户的体验。

    通过对数据及时研判分析,提升了数据准确性,降低设备异常率,增强用电服务能力。对挂接设备超负荷、平均停电时长超限值、异常问题超次数等作为故障问题进行全面管控;对线路敷设不规范、监测装置不合格、在线监测不准确等作为缺陷问题进行异常管控;对停复电事件频发、投诉事件高发、服务水平较低的区域判定为异常高发区域,并进行严格监测、管控。

    同时采集缺陷、停电、投诉、报修等全量数据,综合分析线路健康状况以地图、统计图的方式直观展示线路上的停电、缺陷、报修、敏感客户易发点。根据发生次数的多少改变标识点的大小,通过标识点的大小清晰准确地展示线路的故障/缺陷/异常的高发区域。

    通过配电线路电压、电流等实时监测数据、停/复电发生频次、重合闸成功率、掉电时长、影响客户数量等综合判定配电线路是否存在故障以及故障的严重程度,以日、周、月维度为配电线路运行管控基础,对不同时间段内线路重/过载、线路失电、影响客户数量进行全面分析,支撑配电线路状态评价。

    采用多棵决策树组合对数据进行自学习,并构建数据模型进行预测、诊断分析,对线路健康状况以地图、统计图等形式直观的展示出来,以地图、统计图等方式直观展示线路健康状况,包含线路实时运行数据(电压和电流值)、停/复电时长监测、重合闸成功率管控、影响范围、异常次数监督监测等[14]

    通过对计划停电、临时停电和故障停电等各类型停电台区数据进行分类管控、分析,对敏感台区的主要判定依据如下[15-17]

    当月内发生2次及以上的计划/临时停电的台区;

    当月停电事件影响客户数大于2000户的停电台区;

    当月发生3次及以上故障停电的台区;

    客户报修的故障停电事件未在30 min内答复或8 h内未恢复供电的台区;

    故障停电影响客户中包含关键客户/重点客户/重要客户/保电任务的台区;

    停电事件发生后,未发送任何停电通知,且导致发生投诉事件的台区。

    通过大数据分析及模型验证处理,管控触发敏感判定条件的台区,通过图形化标记展示,对敏感台区随时提醒告知。

    本文研究的方法将基础数据和频繁停电及停电线变户数据结构化、规范化,并且打通数据壁垒,形成大数据生态归集和管理,挖掘数字价值,助推线–变–户频繁停电信息管理效率提升。通过客户敏感程度分析及停电投诉预测技术,得到不同台区对停电事件的敏感程度,形成合理的客户敏感度分级方法;另一方面,基于客户敏感度的停电投诉预测细化突出了停电相关数据集中的主要特征,增大了训练数据集中的价值密度,对停电后客户的投诉倾向进行了预测,为合理安排停电计划和重点安抚敏感客户提供数据支持。

    通过搜集配电网缺陷、报修、投诉、停电等数据信息,对管辖区域频繁停电的线路或台区及其影响的客户进行多维度分析,多平台数据交互后展示在热点图上,聚焦频繁停运线路、设备、客户高风险区域,以中台实时数据为支撑,对配电线路、台区状态数据、业务运行处置等进行实时、在线、全面监测,对线路、台区和客户频繁停电进行精准分类,为实现精准、差异化供电服务提供有效支撑。

    以停电时长、高峰停电和近期密集停电等基础指标,结合历史停电数据分析,构建了指标差异化阈值,采用正态隶属函数构建了计划停电时客户体验的评估模型。通过数据共享,随时掌握配电网故障情况下停电范围和客户信息,实现停电信息快速、准确查询,为准确研判、处置配电网故障提供支撑。

    从客户的实际体验出发选取客户体验评估指标,通过差异化阈值构建了指标的模糊隶属函数来描述客户体验状态的不确定性,对客户体验的综合状态进行预测,形成了计划停电时客户用电体验的评估方法。

  • 图  1   数据集构建图

    图  2   技术架构图

    图  3   台区负荷特性曲线

    图  4   某一时段停电时长统计图

    图  5   正态隶属函数曲线

    图  6   数据转换逻辑关系图

    表  1   停电特征指标

    序号 特征指标 序号 特征指标
    1 是否频繁停电 7 同期停电时长
    2 停电时长 8 是否提前通知
    3 用电高峰时停电时长 9 所属台区
    4 是否周末 10 影响台区数总计
    5 停电类型 11 影响台区敏感度
    6 开始时间段 12 影响户数总计
    下载: 导出CSV
  • [1] 中国电力企业联合会.城市配电网规划设计规范:GB 50613—2010[S].北京:中国计划出版社,2011.
    [2] 张耀月.基于无线遥控技术的配电网带电作业工具[J].农村电气化,2022(1):82-86.
    [3] 国家发展和改革委员会.供电营业规则[Z].北京:中国电力出版社,2024.
    [4] 国家电网有限公司.95598客户服务业务管理办法[R].北京:国家电网有限公司,2020.
    [5] 舒容,黄清社.台区频繁停电原因分析与治理对策[J].农村电气化,2022(2):90-91.
    [6] 杜晓东,王立斌,刘科研,等.基于随机森林的配电网故障分布特征预测方法[J].电网与清洁能源,2023,39(1):70-77. doi: 10.3969/j.issn.1674-3814.2023.01.010
    [7] 沈赋,张微,徐潇源,等.基于随机森林和最大互信息系数关键特征选择的配电网拓扑辨识研究[J].电力系统保护与控制,2024,52(17):1-11.
    [8] 张宏伟.“五心”共享客户用电服务模式创新实践[J].农电管理,2024(10):20-22. doi: 10.3969/j.issn.1672-2450.2024.10.021
    [9] 张宏伟.基于大数据价值的配网精准投资管理[J].农电管理,2023(4):46-48. doi: 10.3969/j.issn.1672-2450.2023.04.019
    [10] 师璞,张罡帅,赵耀民,等.电力用户敏感程度分析及停电投诉预测[J].供用电,2019,36(10):67-72.
    [11] 林兼,台区负荷特性分析及基线负荷预测研究[D].北京:华北电力大学(北京),2017.
    [12] 马晓光,马瑞.基于随机模糊的配电网故障停电风险评估方法[J].电力科学与技术学报,2023,38(6):123-131.
    [13] 师璞,张罡帅,张帅,等.考虑客户体验的配电网计划停电优化方法[J].自动化技术与应用,2020,39(9):97-102,107. doi: 10.3969/j.issn.1003-7241.2020.09.023
    [14] 张宏伟.以客户满意为导向的供电服务体系建设[J].农电管理,2024(9):22-23. doi: 10.3969/j.issn.1672-2450.2024.09.024
    [15] 张宇轩,苏娟,贾涛,等.电力用户对供电可靠性敏感度的评价与分类方法[J].江苏大学学报(自然科学版),2021,42(5):575-581,608.
    [16] 王海燕,袁新平.基于态势感知的电网停电用户敏感度及投诉预测[J].电力需求侧管理,2023,25(2):107-111. doi: 10.3969/j.issn.1009-1831.2023.02.017
    [17] 王玮琳.基于大数据的停电感知预测模型分析研究[D].西安:西安理工大学,2021.
图(6)  /  表(1)
计量
  • 文章访问数:  29
  • HTML全文浏览量:  1
  • PDF下载量:  8
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-12-17
  • 修回日期:  2024-12-29
  • 刊出日期:  2025-03-09

目录

/

返回文章
返回