摘要:本文基于群体算法及模糊聚类分析方法,建立相应的预测模型, 通过对电力负荷变化规律和影响因素的分析,提出了一种电力负荷预测模型。结果表明,该模型具有较高的预测精度。
关键词:群体算法;模糊聚类;预测模型;预测
中图分类号:TP301文献标识码:A
1前言
电力负荷预测是电力系统调度和计划部门安排购电计划和制定运行方式的基础,它对于电力系统规划、运行与控制有着重要的意义。为了提高电网运行的安全性和经济性,改善供电质量,负荷预测需要尽可能高的预测精度。随着分时电价的市场化营运,精度高、速度快的预测理论和方法愈显重要和迫切。
负荷预测已有很长的研究历史。早期的方法以时间序列法、回归分析法为主[1],这类方法计算量小,速度较快,但由于模型过于简单而无法模拟复杂多变的电力负荷。近年来,随着人工智能技术的迅猛发展,灰色理论法[2]、神经网络法[3]、相似日聚类[4],模糊聚类[5]在负荷预测领域得到广泛应用。它们较以前的方法更能处理负荷和影响因素之间的非线形关系,因而得到了较高的预测精度。但他们有各自的缺点,灰色预测模型从理论上讲可以适用于任何非线性变化的负荷指标预测,但其微分方程指数解比较适合于具有指数增长趋势的负荷指标,对于具有其他趋势的指标,则拟合灰度大,精度难以提高。利用神经网络进行电力负荷预测时,神经网络可以通过学习,从复杂的样本数据中拟合出输入输出之间高维、非线性的映射关系,从而进行较高精度的预测。但是,电力负荷受到多种因素的影响,电力负荷曲线的变化形态差异较大。
目前,针对电力负荷预测较好的方法是采用组合式预测模型-FCBP模型[6]。其原理是这样的:首先,采用模糊聚类分析方法,以每天的负荷数据、天气数据以及天类别数据为指标,将历史数据分成若干类别;然后对每一类别建立相应的神经网络预测模型;预测时找出与预测天相符的预测类别,利用相应的神经网络预测模型进行电力负荷预测,实践证明这种方法是有效的。
但是传统的模糊聚类算法有易陷入局部最优解,处理大量、高维的数据时,在时间性能上难以令人满意的缺陷。蚁群算法是最近几年才提出的一种新型的模拟进化算法,由意大利学者Dorigo,M[7]等人首先提出,用蚁群在搜索食物源的过程中所体现出来的寻优能力来解决一些离散系统优化中困难问题。已经用该方法求解了旅行商问题、指派问题、调度问题等,取得了一系列较好的实验结果。本文将蚁群算法引入此模型,用蚁群算法改进模糊聚类,并和神经网络组合,得到新型预测模型-AFCBP模型,经实验证明得到良好效果。
2理论分析
2.1蚁群算法优化理论
经过大量研究发现,蚂蚁个体之间是通过一种称之为外激素的物质进行信息传递,从而能相互协作,完成复杂的任务。蚂蚁在运动过程中,能够在它所经过的路径上留下该种物质,而且蚂蚁在运动过程中能够感知这种物质的存在及其强度,并以此指导自己的运动方向,蚂蚁倾向于朝着该物质强度高的方向移动。因此,由大量蚂蚁组成的蚁群的集体行为便表现出一种信息正反馈现象:某一路径上走过的蚂蚁越多,则后来者选择该路径的概率就越大。蚂蚁个体之间就是通过这种信息的交流达到搜索食物的目的。
以TSP问题为例说明基本蚁群算法的框架,设有m个城市,dij(i,j=1,2,…,n)表示城市i和j间的距离,τij(t)表示在t时刻城市i和j之间的信息量,用它模拟实际蚂蚁的外激素。设共有m只蚂蚁,用 表示在t时刻蚂蚁k由城市i转移到城市j的概率:
其中,U为蚂蚁已经搜索过的部分路径,S表示蚂蚁k下一步允许走过的城市的集合,a表示路径上的信息量对蚂蚁选择路径所起的作用大小, 表示为由城市i转移到城市j的期望程度,例如,可以取 。当a=0时,算法就是传统的贪心算法;而当b=0时,就成了纯粹的正反馈的启发式算法。经过n个时刻,蚂蚁可走完所有的城市,完成一次循环。每只蚂蚁所走过的路径就是一个解,此时,要根据下式对各路径上信息量作更新:
其中,Q为常数,Lk为蚂蚁k在本次循环中所走路径的长度。在经过若干次循环以后,可以根据适当的停止条件来结束计算。
由上述可知,蚁群算法的优化过程的本质在于:1) 选择机制,信息量越大的路径,被选择的概率越大;2) 更新机制,路径上面的信息量会随蚂蚁的经过而增长,而且同时也随时间的推移逐渐减小;3) 协调机制,蚂蚁之间实际上是通过信息量来互相通讯、协同工作的,这样的机制使得蚁群算法具有很强的发现较好解能力。
2.2模糊聚类基本原理
聚类分析算法可以描述为:给定m维空间R中的n个向量,把每个向量归属到m个聚类中的某一个,使得每一个向量与其聚类中心的距离最小。经常用的基于划分的聚类算法是c-均值算法,它把n个向量 (i= 1,2,…,n)分成m个类 (i=1,2,…,m),并求每类的聚类中心,使得非相似性(或距离)指标的目标函数达到最小。当选择第i个类 中向量 与相应的聚类中心 间的度量为欧基里德距离时,目标函数定义为:
这里p是循环计算的次数, 是类 内的目标函数, 表明参数确定属于哪个簇团。显然 的大小取决于聚类中心 和 的形状, 越小,表明聚类的效果越好。
c-均值算法的隶属度要么是1,要么是0,这种硬性的划分数据点属于某一类团不能反映数据点与簇团中心的实际关系。为了处理这个问题,人们引入了模糊集的概念。自1969年Ruspini首先提出第一个解析的模糊聚类算法以来,已经有很多人提出了许多的模糊聚类算法。基于模糊划分的模糊聚类算法,其主要思想是将经典划分的定义模糊化,可以认为数据点以某种隶属度属于一个簇团,又以某种隶属度属于其它簇团。
在众多的模糊聚类算法中,应用最广泛而且较成功的是1974年由Dunn提出并由Bezdek加以推广的模糊C-均值(fuzzy C-means,简称FCM)算法。同样,FCM算法是把n个向量 (I=1,2,…,n)分成m个模糊簇团 ,并求得每个簇团的聚类中心,使目标函数达到最小,FCM的目标函数定义为:
由于多约束优化问题的求解是一个NPC问题,常用的求解方法是分别对U和C进行偏优化的Fk-prototypes 算法[8],主要思想是:(1)先选择C的一个初始值,找到使 最小的U值;(2)然后固定U找到使 最小的C;(3)优化过程交替进行,直到前后目标函数的差值与目标函数的比小于ε为止。
这一算法的缺陷在于需要赋予不同的c值进行多次重复计算,且结果通常是局部最优解,同时运算时间是很大的,因为一次矩阵乘法所需要的时间为O(n3),实现算法的第一步的时间复杂度就达到O(n4logn)。
2.3用蚁群算法改进模糊聚类
提高模糊聚类计算速度的关键之一是隶属度矩阵的初始点的选取,如果能开始就得到每个参数点归于每个簇团的隶属度近似结果,那么将较大的改进模糊聚算法的速度,蚁群算法就可以实现这以功能。
其基本思想是将数据视为具有不同属性的蚂蚁,聚类中心看作是蚂蚁所要寻找的“食物源”[9],所以数据聚类就看作是蚂蚁寻找食物源的过程。具体过程如下:每只蚂蚁从各个聚类中心出发,在整个解空间中搜索到下一个样本点后;再从聚类中心出发,在整个解空间中搜索到另一个样本点,当搜索到样本点达到该聚类原来的样本点总数后,就认为蚂蚁完成了一个路径的搜索。为使蚂蚁在同一路径的搜索中不重复搜索同一个样本点,给每只蚂蚁设置禁忌表tabu(N)。规定:如果tabu(j)为1,则结点j是可以选择的搜索样本点,当蚂蚁选择了结点j后,就将tabu(j)置为0,此时蚂蚁就不能选择结点。
设 是待进行聚类分析的数据集合,τij(t)表示在t时刻数据 和 之间的信息量。当所有蚂蚁都完成了一次路径搜索后,称算法进行了一个搜索周期。第t个搜索周期内,路径选择概率:
其中 ,其他参数和上面说明一致。在i值确定下,从j=1到m,分析 ,找到最大值后,则 归并到到 领域。令 , 表示所有归并到 的数据集合,求出聚类中心当蚁群完成一个搜索周期后,根据 就得到了每个参数点归于某簇团的可能性,从而得到了模糊聚类隶属度矩阵的大体准确的初始值,并用 作为模糊聚类的初始中心。
由于蚁群算法本身也有一定的计算量,不宜在每次模糊聚类循环中使用蚁群算法,选用蚁群算法的策略是这样的:首先在步骤1的初始几个循环选用蚁群算法和确定初始值 (本文设为4个)和聚类的中心 ,然后根据公式4和5,模糊聚类自己循环迭代,当优化过程趋缓时,再采用一到两次蚁群算法进行优化,一直得到小于ε的结果为止。
2.4根据聚类结果建立神经网络预测模型
由于电力系统由各种因素强烈影响,存在着大量的非线性关系。其发展规律很难用一个显式的数学公式表示,许多文献利用神经网络对复杂非线性拟合能力的优点,构造预测模型。文献[6]采用了3层BP网络建立预测模型,文献[10]采用了径向基函数神经网络对电力负荷进行预测。本文经过比较和分析,发现采用MATLAB提供的动量BP神经网络计算结果比较好。由此,将历史数据聚成簇团以后,采用动量BP神经网络构造预测模型,此组合模型也称之为AFCBP模型。进行预测时,首先逐一计算预测天与各聚类中心的欧基里德距离,以距离最短的类别作为预测天的类别,再利用相应AFCBP模型进行预测。
3实际应用
3.1聚类分析
本文以某地区一年的电力负荷变化数据为对象进行实例分析, 把全年的366条负荷曲线的样本的负荷曲线作为测试样本以后,进行聚类分析。每一样本 由29个数据组成即为第i天最高温度和最低温度为对第i+1天的最高温度和最低温度的预报值为第i+1天的天类别值。
在采用蚁群算法优化(用 表示)的模糊聚类算法时,计算 的参数设为:ρ=0.7,a=1,b=1,η=1,ε=0.01, τij(0)=0。
3.2预测实例
采用上述方法建立预测模型以后,首先对负荷进行负荷预测。并与基于单一神经网络的预测模型和仅用模糊聚类的组合模型进行比较。这里用于对比的基于单一神经网络的预测模型采用MATLAB提供的动量BP神经网络,网络的样本简单地选取了预测天前4星期的负荷数据,统计误差结果如表1 所示。结果表明:预测任何种类的日负荷,采用AFCBP模型和FCBP模型要远远好于仅采用动量BP神经网络的预测模型,这充分说明了采用组合式神经网络预测模型的优势;AFCBP模型和FCBP模型在预测普通工作日的负荷都比较稳定,AFCBP模型仅比FCBP模型略好一些,这是因为聚类簇团中普通工作日样本数据较多,两种模型预测都比较好;在预测双休日和节假日时,AFCBP模型具有更好的预测精度,这是因为AFCBP模型聚类的效果更细致、更准确的结果。
然后分析两种模型对夏季典型日负荷预测的结果。如图1所示,可以发现采用AFCBP预测模型整体上要比FCBP预测模型效果要好,尤其在边缘点和变化剧烈区域预测结果较好。平均绝对百分误差 和最大绝对百分误差 的数值也反映了这一点。
图1:典型负荷预测结果比较
4结论
本文把蚁群算法和c-means算法相结合,把蚂蚁k由城市i转移到城市j的概率 作为隶属度矩阵的初值,计算出的中心作为FCM的初始中心,对模糊聚类进行改进,得到较好结果,并以每天的24 点负荷数据、天气数据以及天类别数据为指标,用改进后模糊聚类把历史数据聚分成若干簇团;然后,采用动量BP神经网络针对每一簇团建立相应的预测模型。对山东地区1年的实际负荷变化数据进行预测分析的结果表明,该模型不仅对普通工作日有较高的预测精度,对双休日、节假日和一些特殊情况(夏季典型日负荷)也有较好的预测精度。
参考文献:
[1] 周继芗. 实用回归分析[M]. 上海: 上海科学技术出版社,1990.
[2] Burke J J , et al . Power quality-two different perspectives [J]. IEEE Transaction on Power Delivery, 1990,(3).
[3] Verdelho P , et al . An active filter and unbalanced current compensator [J]. IEEE Transaction on Power Electronics , 1997(3).
[4] Gerbec D,Gasperic S,Smon I et al. An approach to customers daily load profile determination [C]. IEEE Power Engineering Society Summer Meeting,Chicago,IL USA,2002(1).
[5] Papadakis S E,Theocharis J B,Bakirtzis A G.A load curve based fuzzy modeling technique for short-term load forecasting.[J] Fuzzy Sets and Systems, 2003(2).
[6] 陈耀武, 汪乐宇, 龙洪玉等. 基于组合式神经网络的电力负荷预测模型[J]. 中国电机工程学报,2001(4).
[7] Dorigo, M., Maniezzo, V., Colorni, A., 1996. Ant system: optimizationby a colony of cooperating agents. IEEE Trans. Syst. Man Cybernet. B (1).
[8] 陈宁, 陈安, 周龙骧. 数值型和分类型混合数据的模糊K-Prototypes聚类算法[J]. 软件学报, 2001(8).
[9] 高坚. 基于并行多种群自适应蚁群算法的聚类分析[J]. 计算机工程与应用, 2003(25).
[10] 赵剑剑, 张步涵, 程时杰等. 一种基于径向基函数的负荷预测方法[J]. 电网技术, 2003(6).