高级检索

基于大数据的衢州市台区负荷与气象关系的研究

倪孟啸, 徐冰, 吴海宝

倪孟啸, 徐冰, 吴海宝. 基于大数据的衢州市台区负荷与气象关系的研究[J]. 农村电气化, 2024, (10): 24-28. DOI: 10.13882/j.cnki.ncdqh.2407A088
引用本文: 倪孟啸, 徐冰, 吴海宝. 基于大数据的衢州市台区负荷与气象关系的研究[J]. 农村电气化, 2024, (10): 24-28. DOI: 10.13882/j.cnki.ncdqh.2407A088
NI Mengxiao, XU Bing, WU Haibao. Research on the Relationship between Load and Meteorology in Quzhou City Based on Big Data[J]. RURAL ELECTRIFICATION, 2024, (10): 24-28. DOI: 10.13882/j.cnki.ncdqh.2407A088
Citation: NI Mengxiao, XU Bing, WU Haibao. Research on the Relationship between Load and Meteorology in Quzhou City Based on Big Data[J]. RURAL ELECTRIFICATION, 2024, (10): 24-28. DOI: 10.13882/j.cnki.ncdqh.2407A088
倪孟啸, 徐冰, 吴海宝. 基于大数据的衢州市台区负荷与气象关系的研究[J]. 农村电气化, 2024, (10): 24-28. CSTR: 32400.14.ncdqh.2407A088
引用本文: 倪孟啸, 徐冰, 吴海宝. 基于大数据的衢州市台区负荷与气象关系的研究[J]. 农村电气化, 2024, (10): 24-28. CSTR: 32400.14.ncdqh.2407A088
NI Mengxiao, XU Bing, WU Haibao. Research on the Relationship between Load and Meteorology in Quzhou City Based on Big Data[J]. RURAL ELECTRIFICATION, 2024, (10): 24-28. CSTR: 32400.14.ncdqh.2407A088
Citation: NI Mengxiao, XU Bing, WU Haibao. Research on the Relationship between Load and Meteorology in Quzhou City Based on Big Data[J]. RURAL ELECTRIFICATION, 2024, (10): 24-28. CSTR: 32400.14.ncdqh.2407A088

基于大数据的衢州市台区负荷与气象关系的研究

详细信息
    作者简介:

    倪孟啸(1997—),男,本科,助理工程师,从事配电网运维检修及新技术的研究,E-mail:937255395@qq.com

    徐冰(1977—),男,本科,副高级工程师,从事电网规划与研究工作,E-mail:14362209@qq.com

    吴海宝(1986—),男,硕士,副高级工程师,从事配电网运检管理与研究,E-mail:267304258@qq.com

    通讯作者:

    倪孟啸(1997—),男,本科,助理工程师,从事配电网运维检修及新技术的研究,E-mail:937255395@qq.com

  • 中图分类号: TM73

Research on the Relationship between Load and Meteorology in Quzhou City Based on Big Data

  • 摘要:

    文章研究探索衢州市台区负荷与气象要素之间的关联性,并开发相应的数字化管理手段,以提高电力系统的安全和经济运行。研究背景基于全球气候变暖导致的极端天气事件频发,这些事件对电力系统造成了显著影响。研究方法涉及多源数据融合,包括电力数据和气象数据,并通过数据预处理来处理异常值和缺失值。在算法与模型设计方面,采用了LightGBM算法,模型训练采用了5折交叉验证法和早停法,并结合贝叶斯方法进行调优。研究成果显示,台区负荷与温度存在“马鞍型”关联,即在过高或过低的温度区间内,负荷达到高峰;风速对负荷的影响主要在冬季显著,而天气类型与负荷分布也存在一定的关联。基于这些发现建立大数据模型,并通过模型预测和预警监测,有效减少了衢州市2024年春节期间的台区重过载次数。

    Abstract:

    The aim of this project is to study and explore the correlation between the load and meteorological factors in Quzhou City, and to develop corresponding digital management methods to improve the safety and economic operation of the power system. The research background is based on the frequent occurrence of extreme weather events caused by global climate change, which have had a significant impact on the power system, especially in the Quzhou area. The research method involves multi-source data fusion, including electricity data and meteorological data, and handles outliers and missing values through data preprocessing. In terms of algorithm and model design, the LightGBM algorithm was adopted, and the model was trained using 5-fold cross validation and early stop methods, combined with Bayesian methods for optimization. The research results show that there is a saddle shaped correlation between the load and temperature in the substation area, that is, the load reaches its peak in the temperature range of too high or too low. The impact of wind speed on load is mainly significant in winter, and there is also a certain correlation between weather type and load distribution. Based on these findings, a big data model was established, and through model prediction and early warning monitoring, the number of heavy overloads in the platform area during the Spring Festival in 2024 is effectively reduced.

  • 近年来在全球气候变暖的背景下,衢州地区极端天气事件频发,例如,2022—2023年夏季超高温天气,2024年的春节前后气温“过山车”等现象,这些极端天气不仅对生活造成了直接影响,也引起大量配变过负荷运行,而重过载运行会降低设备寿命,甚至引起设备故障、火灾等,而衢州市供电服务一直苦于缺乏配变重过载方面的数字化管理手段,仍在人工经验化管理,因此亟须开展电力负荷随气象要素变化的规律研究和相关数字化手段探索,为电力系统的安全、经济运行服务。

    本课题研究主要包括3个目标:1)分析近年来衢州台区负荷与气象数据信息,探寻气象要素与电力负荷之间的变化规律;2)基于研究得到的电力负荷与气象要素的关联性开展算法模型的构建;3)基于模型开展台区负荷进行预警分析,为保供电相关工作提供依据。

    本次课题研究应用数据中台数据,主要范围是衢州市区的所有台区,台区负荷数据选取2020年1月—2023年12月每日有功值。

    气象数据由衢州市气象局提供,主要包括日平均气温、最高气温、最低气温、降水量、平均风速、平均相对湿度等气象要素的逐日观测数据,数据的时间跨度从2020年1月—2023年12月。

    1)数据预处理

    原始数据在实际分析中发现包含一些无法直接利用的异常值和缺失值。这些数据问题可能会严重影响分析的准确性和模型的性能。因此,进行有效的数据预处理,识别并处理这些异常值和缺失值,对于确保数据质量和提高分析结果的可靠性至关重要。

    2)异常值处理

    为了有效地识别和处理其中的异常值,采用箱线图的方法进行筛选,箱线图通过计算四分位数和内部围栏来确定异常值,通常被认为是箱体之外且距离四分位数一定距离的点。将2个典型台区的电力负荷数据绘制成箱线图(见图1),不仅直观展示了数据的分布情况,还清晰地标识出了异常值。

    图  1  箱线图法查找异常值

    识别出这些异常值后,发现其中60%是错误数据,40%为空值,是由采集装置故障引起,为确保数据的准确性和可靠性,选择将这部分数据置为空值。

    3)缺失值填补

    考虑到电力负荷数据呈现连续性和时间性,可以假设数据在缺失点之间是线性变化的,而且缺失值呈现偶然单点性,所以采用线性插值法填充数据中的空值。这种方法通过在2个已知数值点之间进行直线插值来估算缺失的数据点,主要好处在于其简单性和实用性,能有效地估计和填充缺失值,从而使数据集更完整,便于进一步地分析和处理。

    LightGBM是基于梯度提升树提出的一种决策树集成学习算法,LightGBM通过引入基于梯度的单边采样(gradient-based one-side sampling,GOSS)和互斥特征捆绑(exclusive feature bundling,EFB)方法,解决了传统GBDT在特征的分裂点需要遍历全部数据计算信息增益所造成的耗时问题。LightGBM模型采用Histogram(直方图)和带深度限制的叶子生长(leaf-wise)策略极大地提升了模型预测速度。

    直方图算法因其不需要额外存储预排序的结构,而是直接保存特征离散后的值,从而大大降低了内存的占用量,这也是直方图算法最大的优点,图2展示了直方图构建过程。

    图  2  直方图构建过程

    Leaf-wise是一种更为高效的叶子分裂成长策略,每次从当前所有叶子中,找到分裂增益最大的一个叶子再次分裂,如此循环,其分裂过程如图3所示。Leaf-wise策略的缺点是可能会长出比较深的决策树,导致过拟合。因此,LightGBM在Leaf-wise基础上增加了一个最大深度的限制,从而保证高效率的同时防止过拟合。

    图  3  leaf-wise树分裂过程

    训练数据:选取已经预处理完毕的电力负荷数据和气象数据,按照7天为一组的模式进行滑窗处理,转置后得到带有时间序列的负荷数据,以时间关键字段进行气象数据拼接,得到训练数据。

    训练方法:为了防止过拟合的情况,采用5折交叉验证法和早停法来评估模型的稳健性,并结合贝叶斯方法进行模型调优。5折交叉验证法将数据集均分为5个子集,每次用其中的4个子集进行训练,剩下的1个子集用于验证模型性能。这个过程会循环5次,每次都更换不同的训练和验证数据集,最终取5次验证结果的平均值作为模型性能的估计。这样不仅充分利用了数据,还通过重复的训练与验证过程,有效减少了模型因数据波动而产生的过拟合风险,使模型的预测性能更加可靠和稳定。

    通过台区负荷大数据筛选出极具代表性的台区(银桂公变),以该台区为例,取2020—2023年共4年的台区负载率和平均温度数据绘制关系走势图,见图4

    图  4  台区负载率和气温的走势图

    通过曲线图大致可以发现,在气温适宜(15~25 ℃)的时候,负载率偏低,但当气温飙升至27 ℃以上或是降至10 ℃以下时,负载率呈现骤升的现象。

    图5展示了历年负载率、最高温度和最低温度之间的关系。可以观察到负载率与温度之间存在明显非线性(“马鞍型”)关联,27 ℃以上和10 ℃以下的区间为非舒适区,在该区间内,温度每变化1 ℃,负载率平均变化3%~5%。

    图  5  负载率和气温的关系图

    用衢州市2023年的风速数据和典型台区负荷数据进行大数据分析,绘制相关热力图,见图6

    图  6  负载率和风速的关系系数热力图

    从总体数据来分析,通过图6的相关系数热力图可以发现风速和负荷没有任何关系,但是将数据具体至冬季的某天进行分析,如图7所示,风速的大小依然会对负荷产生影响。

    图  7  冬季典型时段负载率和风速的走势图

    图7为冬季典型时段的风速与负荷走势图。不难发现风速对于负荷的影响主要体现在冬季,因为当气温低于皮肤温度时,风能使机体散热加快进而降低体表温度,据统计风速每增加1 m/s,将使人体表感受气温下降1~2 ℃,在平均气温低于10 ℃的冬天,负载率平均增加9%。

    取2020—2023年共4年的台区负载率和天气类型数据绘制关箱线图,见图8

    图  8  天气类型和负载率的箱线图

    这个箱线图展示了不同天气状况下负载率的分布。从图中可以看出:多云(Cloudy)天气时,负载率的中位数约为0.98,负载率范围较小;晴天(Sunny)时,负载率的中位数稍低于多云天气,且分布范围和四分位距较多云天气更广,波动更大;小雨(Light Rain)天气下,负载率的中位数进一步下降,波动范围较晴天而言减小;大雨(Heavy Rain)时,负载率的中位数最低,波动范围最小。

    基于上述电力负荷大数据与气象大数据的分析结果,选择影响明显的因素作为模型新的特征值加入训练(风速的影响过于片面,为了防止干扰所以未采用),并结合5折交叉验证、早停法、贝叶斯调优方法训练模型,得到最终的大数据模型算法。

    模型预测未来的7天时间,以2024年1月14日—20日为例,均方根误差(rmse值)为0.0562,预测结果见图9

    图  9  负载率预测值和准确值的对比图

    图9随机选取4个台区进行预测并比对,图中的2条曲线一条代表实际值(蓝色),另一条代表预测值(红色),它们反映了2024年1月14日—20日之间的数据变化。整个时间段内,总体来看2条曲线大体走势相同,能够为实际工作提供辅助决策作用。

    为全面落实省委、市委经济工作会议精神,保证“重大项目不停工,重点企业不停产”,根据大数据模型开展重要台区负荷预测预警工作,采用将模型代码打包成可双击运行方式移交专业部门实际应用,据专业部门反馈:结合2023年台区重过载相关工作成果经验,在特殊时期(2024年春节)重点监测安仁镇公三台区、棠坂朱塘峰台区和航埠镇工业3号变等7个高发重过载台区,春节保电期间及时预警重过载次数8次,有效预警数5次,3次无效预警,春节期间衢州公司仅1台配变重载,重过载台区数和次数均大幅下降。

    通过大数据分析发现台区负荷与气象因素存在一定的联系,其中与温度呈现马鞍型关联,即温度处于过高或者过低区间时,负荷处于高峰区,因为过高(过低)的温度将导致制冷(制热)设备的耗电量激增,在该区间内,平均温度每变化1 ℃,负载率变化3%~5%;风速与台区负荷的关系主要体现在冬季,当气温低于皮肤温度时,风能使机体散热加快进而降低体表温度,平均风速每增加1 m/s,将使人体表感受气温下降1~2 ℃,将使负载率平均增加9%;天气类型与负荷的分布存在一定关联,台区负荷在晴天天气的分布范围较广,负荷波动较大,多云和小雨分布范围比较紧凑,负荷波动较小,大雨分布范围最小,负荷的波动最小。

    通过拟合气象数据与台区历史负荷数据,建立大数据模型算法,并利用模型算法提前进行预警监测,为特殊时期台区用电的运维提供数据支撑,2024年春节期间有效减少台区重过载5次。

  • 图  1   箱线图法查找异常值

    图  2   直方图构建过程

    图  3   leaf-wise树分裂过程

    图  4   台区负载率和气温的走势图

    图  5   负载率和气温的关系图

    图  6   负载率和风速的关系系数热力图

    图  7   冬季典型时段负载率和风速的走势图

    图  8   天气类型和负载率的箱线图

    图  9   负载率预测值和准确值的对比图

图(9)
计量
  • 文章访问数:  11
  • HTML全文浏览量:  5
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-07-29
  • 刊出日期:  2024-10-09

目录

/

返回文章
返回