您好, 访客   登录/注册

一种高效的基于数据流模型的电力系统实时安全评估算法

来源:用户上传      作者: 王鹤苓 唐玉平

  摘要:安全评估问题是电力系统规划和运行过程中的一个很重要的问题。它包括对电力系统进行安全评估及在需要的时候采取及时的应对措施。本文聚焦于该问题并将电力系统的实时安全评估问题抽象为一个数据流挖掘模型。VFDT利用Hoeffding不等式解决了数据流挖掘问题。Wang等的VFDTb利用线索化二叉树技术高效地解决了数据流挖掘中连续属性问题。在VFDT 和VFDTb的基础上,我们设计实现了一个基于AVL树的高效算法PPSDT,该算法的排序树的内部路径长度接近于最优的NlogN。总体上说,该算法在保持决策树精度的基础上,很好的提高了挖掘速度。
  关键词:VFDTVFDTbAVLPSSDT
  电力系统作为国民经济发展的基础支柱产业,作用和地位愈来愈凸现,其安全问题已成为关乎国家经济安全运行的问题。传统的基于经验和人工的安全保障方法已不能满足要求。随着信息技术水平和电力系统数字化水平的不断提高,如何评估其安全状态并实时采用有效的保障手段已成为理论研究和工程实践领域的研究焦点问题。作为一个非线性的物理系统,其系统复杂性在不断增加,导致电力系统的安全评估变得越来越困难。安全评估所需的数据是随着系统的运行不断产生的,其数据量很大,并且具有很强的实时性,具有数据流(Data Stream)的典型特征。令t表示任一时间戳,at表示在该时间戳到达的安全数据向量,数据流可以表示成{…,at-1,at,at+1,…}。区别于传统的数据模型,数据流模型具有以下3个特性:①数据高速到达,实时性要求高;②数据规模宏大,不可能把所有的数据都放入内存甚至是硬盘;③数据一经处理,除非特意保存,否则不能被再次取出处理,或者再次提取数据代价昂贵[2,7]。安全评估问题可以简化一个机器学习的分类模型:通过安全评估,将系统当前安全状态尽兴分类。分类是一种非常重要的机器学习技术,其目的是根据已有的数据集学习构造一个分类函数或分类模型,该分类模型能够将新到样本映射到一个具体的类别上。传统的分类模型包括决策树、决策规则、贝叶斯理论分类、反向传播法、关联分类法、K近邻分类器、SVM、范例式推理、进化算法、粗糙集法及模糊集合法等。其中决策树模型是最普遍的一种分类模型,它具有很好的可理解性。本文将通过对电力系统运行数据流进行处理,从而构造一个决策树分类模型以有效地解决电力系统安全评估问题。
  1 电力系统相关安全问题
  本文的讨论主要聚焦于电力系统的非线性特性所导致的安全问题。虽然这种安全问题不会经常发生,但其潜在的安全问题非常严重并可能导致系统的完全崩溃。
  1.1 操作状态分类 Liacco[1]将电力系统的安全状态分为:预安全状态、紧急状态、安全状态等几种状态。
  预安全状态主要考虑当系统处于常态时能否处理所有潜在的问题。如不能有效处理的话,预控制策略将把当前状态迁移到安全处理状态以尽兴处理。预判问题是非常困难且复杂的,因此预安全策略往往需要在费效比之间做出平衡。紧急状态主要考虑系统在出现紧急状态时能否有效工作,这是一个需要实时评估的过程。紧急状态安全策略应采取快速的动作以避免系统局部或全局中断。
  当预安全操作和紧急控制机制都没有凑效,本地自动安全装置应被启动以避免系统完全崩溃导致严重后果。
  1.2 安全问题的分类 引起电力系统安全问题的原因很多(电压过低,偏差过大等),所采取的应急措施也很多(重启系统,切断系统)。因此安全问题的分类也很复杂,安全问题根据时间可分为以下几类:①短暂稳定问题。短暂稳定考虑电力系统由于大的扰动导致电压不稳的同步恢复问题。该状况下,时间因素很重要,并受操作开关和控制器件(如高速阀门,高电压转化器,FACTS)和基于自动电压调整的电压支持及静电补偿器的性能的影响。该时间一般假设为系统在出现最严重问题时的恢复时间。②电压安全问题。电压安全问题经常性的是由瞬间电压突变引起的,其出现的几率甚至比同步丢失还要高。更多的短期电压不稳定安全问题,一般是指1到5分钟之内的电压不稳。该情况下,主要是通过邻近的自动变压器进行补偿。长时间的电压不稳大都是由负载需求的改变引起的,因此一般通过负载的重分布解决。③静态稳定。它主要考虑传输系统的过载问题,其可供解决问题的时间更长。比如,传输线路过载在气候良好的条件下也可以支持30到60分钟。
  2相关工作
  2.1VFDT VFDT(Very Fast Decision Tree)[3,5]是一种基于Hoeffding不等式针对数据流建立分类决策树的方法,它通过不断的将叶节点替换为分支节点而生成。其中每个叶节点都保存有关于属性值的统计信息,这些统计信息用于计算基于属性值的信息增益测试。当一个新样本到达后,在沿着决策树从上到下遍历的过程中,它在树的每个分支节点都进行判断,根据属性取值的不同进入不同的分支,最终到达树的叶节点。当数据到达叶节点后,节点上的统计信息就被更新,同时该节点基于属性值的统计测试就被重新计算。如果统计信息计算显示测试满足一定的条件,则该叶节点变为分支节点。新的分支节点根据属性的可能取值的数目产生相应数目的子女节点。分支节点只保存该节点的划分测试所需要的信息。
  2.2VFDTb 基于VFDT,Wang等设计并实现了一个VFDTb算法[6]。该算法利用排序二叉树有效处理了连续属性,并且使用了更高效的最佳划分节点选取方法,从而大大的提高了算法分类速度。
  3 算法设计及技术细节
  在VFDT和VFDTb的基础上,我们通过平衡二叉树(AVL树)技术实现了电力系统安全数据流的处理算法(PSSDT)。该算法在VFDT基础框架的基础上处理离散属性,通过平衡二叉树处理连续属性,能够有效解决电力系统的安全评估问题。
  3.1 算法框架 AVL树是具有附加平衡属性的二叉排序树,对树中的任意节点,左子树的高度和右子树的高度最多相差1。对于离散属性参照VFDT的方法解决。
  3.2 新样本到达时的属性树更新过程 PSSDT为每个连续属性i维持一个排序二叉树结构BST。排序二叉树的每个结点都维持一个关键码值keyValue(该值为样本的属性i的取值)和一个维度为k的用于记录经过该结点的样本数目的向量。向量classTotals[k]用于记录取值为keyValue类别为k的经过该结点的样本数。每个结点分别为其左右孩子(基于   4.3 连续属性数目对算法的影响 连续属性数目的大小直接影响了算法所处理数据量的大小,进而影响到算法的性能,算法在不同连续属性数目下性能如何,特别是内存占用如何?第三组实验结果说明算法的内存占用是趋于稳定的。
  5 结束语
  通过将电力系统的实时安全评估问题所涉及的描述属性转换为连续属性和离散属性,本文将该问题抽象为一个数据流模型。在VFDT和VFDTb的基础上,本文设计实现了高效的处理连续属性的AVL树,实验显示算法能够有效处理连续属性问题,并且在不同的噪声数据比率和连续属性项目情形下算法都具有很好的收敛性。
  电力系统的实时安全评估问题是个非常复杂的研究热点问题,本文在该方向做了有益的尝试,但安全评估问题涉及的要素很多,特别是电力系统的安全评估问题有其自身的特点,这需要我们在下一步的工作中加以研究解决。
  参考文献:
  [1]Wehenkel,L.,Machine learning approaches to power-system security assessment,Volume 12,Issue 5,1997 Page(s):60-72
  [2]B.Babcock,S.Babu,M.Datar,R.Motawani,and J.Widom.Models and Issues in Data Stream Systems.In PODS,2002.
  [3]P.Domingos and G.Hulten.Mining High-Speed Data Streams.In Proceedings of the Association for Computing Machinery Sixth International Conference on Knowledge Discovery and Data Mining,pages 71--80,2000.
  [4]J.Gama,R.Rocha and P.Medas.Accurate Decision Trees for Mining High-Speed Data Streams. Proceedings of the Ninth International Conference on Knowledge Discovery and Data Mining,Edited by P.Domingos and C.Faloutsos,ACM Press,2003.
  [5]G.Hulten,L.Spencer,and P.Domingos.Mining Time-Changing Data Streams.ACM SIGKDD 2001.
  [6]Tao Wang,Zhoujun Li,Xiaohua Hu,Yuejin Yan and Huowang Chen.A New Decision Tree Classification Method for Mining High-Speed Data Streams Based on Threaded Binary Search Trees. In Proceedings of High Performance Data Mining and Application (HPDMA`07),Workshop of PAKDD`07,Nanjing,China.Lecture Notes in Artificial Intelligence,Springer-Verlag,2007,pp.256-267.
  [7]王涛,李舟军,颜跃进,陈火旺.数据流挖掘分类技术综述. 计算机研究与发展,2007,44(11).


转载注明来源:https://www.xzbu.com/3/view-2697262.htm