您好, 访客   登录/注册

环境自动监测系统数据处理及分析

来源:用户上传      作者:

  摘要:当前我国环境污染情况日益严重,环境监测的任务也越来越重。为了保证环境监测结果的准确性,确保环境监测工作的质量,必须加强环境监测过程中的数据分析。本文重点论述环境自动监测系统数据分析方法,并介绍数据融合技术在环境监测数据分析中的应用,希望对提高环境监测质量有所帮助。
  关键词:环境监测;监测数据;数据融合;处理;分析
  中图分类号:B82-058 文献标识码:A 文章编号:
  当前建设资源节约型,环境友好型社会,促进生态文明建设是环保工作的主要任务。在环境保护工作不断深入发展的时期,环境监测的重要性日显凸出。环境监测的重要性在于能够准确的、及时、全面的反映环境质量现状以及发展趋势,为环境管理污染源控制,环境规划等提供科学依据。特别是近年来我国经济建设快速发展,环境污染日趋加重,因此,环境监测的任务也越来越重。但环境监测是一项技术性很强的工作,为了保证环境监测的质量,确保监测数据的科学性、客观性、准确性,就必须加强环境监测数据的分析,不断提高环境监测水平,这也是环境监测发展的根本所在。
  1 监测数据获取存在的问题
  环境监测是以环境为对象,运用物理的、化学的和生物的技术手段,对其中的污染物及其有关的组成成分进行定性、定量和系统的综合分析,以探索研究环境质量的变化规律。环境监测的重要性在于能够准确的、及时、全面的反映环境质量现状以及发展趋势,为环境管理污染源控制,环境规划等提供科学依据。监测数据作为环境监测工作的最终成果,对环境监测数据的要求是监测数据应具有代表性、准确性、精密性、可比性、完整性。但目前监测数据获取上仍存在不少问题,直接影响到了监测数据的质量。
  目前监测数据的获取上存在的问题主要有:
   (1)主观原因:监测人员本身业务素质较低,并不能将数据进行科学有效的分析和处理,使得部分数据丧失真实性,甚至不能用于评价工作。
  (2)客观原因:监测仪器配置和监测站点的布置过于陈旧,并未根据最新环境变化情况更新,使得环境监测数据不具有代表性,造成评价结果的偏差,无法进行科学的分析和处理。
  2 分析方法
  由于监测数据与污染物空间分布和持续时间等因素有关,故在分析数据时可将数据按周期性规律进行统计分析,从而得出浓度随时间变化的大致规律。同时再根据当地的水文条件、气象变化和地形特征等因素进行综合整理,生成更为详尽的浓度等值线图,便于数据的直观性统计与分析。
  2.1 离群数据的分析
  环境监测数据获取条件较为复杂,在实际工作中可能由于监测主体或条件变化产生离群值的产生,如何正确区分离群值产生的原因并科学有效地去除离群值,是正确进行评价的重要依据。
  2.1.1 Q检验法
  在同一组数据中,判断最大值或最小值是否为异常值时采用Q检验法【Dixon(狄克逊)检验法】:将数据从大到小进行排列,根据测定次数进行计算Q值:
  (1)
  (2)
  根据测定数据次数n和显著性水平,查Dixon检验统计表,将Q值与临界值比较,判断x1与xn是否为离群值:若Q≤Q0.05,则可疑值为正常值;若Q0.05<Q≤Q0.01,则可疑值为偏离值,可做保留处理;若Q>Q0.01,则可疑值应予剔除。但该检验方法仅将可疑值与相邻数据进行比较分析,具有一定的局限性。
  2.1.2 T检验法
  对于各组测定数据平均值的一致性检验可采用(Grubbs)格拉布斯检验法,即T检验法:将监测数据从大到小排列,并计算其算术平均值和标准偏差s,计算T值:
  (3)
  查T检验临界表得T的临界值,若T≥,则可疑数据x1或xn为异常值,应予剔除;反之则采取保留处理。依次反复计算直至无异常数据为止。
  2.2 分析结果准确度的检验
  2.2.1 平均值与标准值的比较
  用于检查监测方法或操作过程是否存在较大系统误差。对标样进行n次监测,再利用T检验法比较监测结果与标准值是否存在显著性差异。
  (4)
  式中:为标准值,为监测结果,s为标样测定的标准偏差,n为标样测定的次数。根据自由度和置信度P查得T值,与计算结果进行比较。若计算值大于T值,则存在系统误差;若小于则是由偶然误差引起的。环境监测中置信度一般为95%。
  2.2.2 两组平均值的比较
  针对同一样品的不同组数据产生平均值误差问题,先假设两组数据方差无明显差异(分别为和),计算T值:
  (5)
  (6)
  式中:s为合并方差,n为测定次数。用P=95%,f=n1+n2-2查表所得T值小于计算值,则存在显著性差异;若大于则无。
  2.3 分析结果精密度的检验
  用于比较两组数据方差s的一致性,又称F检验:求出两组数据标准方差的平均值和,计算,与F分布表中查得一定自由度下的F值进行比较,若大于计算值则存在显著性差异,若无则不存在。
  在进行F检验法检验两组数据的精密度是否有显著性差异时,应先确定其类型:单边检验指一组数据的方差不可能小于另一组数据的方差;而双边检验时,其显著性水平为单边检验时的2倍,置信度变为90%。
  2.4 等精度检验
  对于n个监测室,用同一标准方法对同一个标准样品作m次监测,测定结果用Cochran最大方差法检验。设各自标准偏差分别为s1,s2,…,sn,最大值记为smax,计算统计量:
  (7)
  根据给定的显著性水平α,实验室个数n,测定次数m,从数理统计表得最大方差检验临界值Ca:C≤C0.05时表明各实验室符合精密度要求;C>C0.01表明具有最大标准偏差的实验室精密度不符合要求;C0.05  2.5 精密度和准确度统计分析:
  2.5.1 标准差分析
  (1)对各组数据(x1,y1)分别进行求和Ti、求差Di。将和值用于计算各监测实验室数据分布的标准偏差,分母除以2是由于和值中包括两个类似样品的监测结果而含有两倍的误差。将差值用于计算随机标准偏差。
  若s=sr则表明实验室不存在系统误差。当s>sr时需进行方差分析:计算,根据显著性水平(0.05)和自由度查表,若F≤F0.05(f1,f2)时,表明在95%置信水平时,实验室的系统误差对分析结果的可比性无显著性影响;若F>F0.05(f1,f2)时,表明实验室的系统误差对分析结果的可比性具有显著性影响,应及时采取校正措施。
  3 数据融合技术的应用
  数据融合技术是指利用计算机对按时序获得的若干观测信息,在一定准则下加以自动分析、综合,以完成所需的决策和评估任务而进行的信息处理技术。
  人类通过人体器官感受外部信息,转换成生物电,并通过人的中枢神经传送到大脑进行综合分析处理,然后对外面环境进行判断和控制。而多传感器数据融合的基本原理就如同人脑综合处理所感受的信息:利用多个传感器感测外部环境信息,再把多个传感器的数据根据某种准则进行组合,以获得对被测对象的一致性解释和描述,从而得出更准确的可信的结论。
  面对大量的环境监测任务,如何科学有效地获取数据信息是最为关键的一步,融合技术为我们提供了强有力的支持,然而这些数据在采集、利用过程中,由于传感器采集数据的特征性差异,造成数据存在模糊性、互补性或矛盾性。如何有效并准确地处理传感器所采集的数据是以后研究的重点,而这必将为环境监测数据研究带来重大性突破。
  3.1 融合模型
  20世纪80年代,代表性的数据融合模型有:英国情报环模型、美国JDL模型和Boyd控制环模型。20世纪90年代提出的“改进的JDL模型”在军事领域应用十分广泛,还有将融合过程划分成观测、定位、决策、行动及传感器管理等阶段,并组成一个大循环的“综合模型”(Omnibus Model)等。但由于以上模型均未引入自学习和多级反馈机制,使得其自适应性和自我完善功能有待提高。
  目前融合算法主要有:Kalman滤波器的改进方法和“数值-语言”混杂条件下的“知识发现和数据挖掘”(KDDM)方法和面向分布式数据融合的支持向量机(SVM)方法等。
  3.2 应用举例
  由于Kalman滤波方法是解决最优化滤波问题的经典方法,故常用于从被噪声污染的观测信号中消除噪声影响,可将Kalman滤波方法用于环境采样数据真实值的估计,在此我们以大气监测为例,简单探讨Kalman滤波方法在环境监测方面的应用[。
  (1)建立大气变化状态转移矩阵。根据环境科学相关领域知识,结合传感器采集的大气参数,建立关于这些参数的大气参数状态转移矩阵。利用该矩阵,研究各项大气参数的变化情况。
  (2)根据(1)中得到的观测目标属性特征,对来自各传感器的,反映不同污染现象的观测数据进行分析,分解出反映各种不同的污染现象的参数向量值。
  (3)根据大气变化状态转移矩阵,利用各传感器采集的大气参数观察值,对各大气采样站点的环境进行最优化估计,得到各项参数的最优化估计值。
  4 结论
  总而言之,在环境污染日益加剧的今天,环境监测已成为环境保护中一项前瞻性、根本性的工作。只有认识到环境监测的重要性,加强环境监测数据的分析,不断应用先进的技术措施,才能确保监测数据的代表性、准确性、可比性、完整性,才能为环境保护工作打下坚实的基础,促进社会经济的可持续发展。
  参考文献
  [1] 叶付勇.有关环境监测数据的处理和分析[J].科技与企业,2012年02期
  [2] 叶剑军;叶倩;李景广;胡红波;邓天福;樊娜.室内环境自动监测系统的数据分析研究[J].绿色建筑,2010年02期

转载注明来源:https://www.xzbu.com/2/view-4189265.htm