摘要:多元统计学是水质数据分析的重要辅助工具。本研究共选取某盆地内2组浅层地下水样品,第一组包含的样品数为59个,第二组包含的样品数为44个,分别进行了水质数据的聚类分析和因子分析。聚类分析和水质评价标准两种方法的分析结果既有相似性也有一定的差异性,聚类分析和水质评价标准分成的三组相似度分别为90.48%、81.25%和82.35%;通过因子分析,8种水质因子提取出2个公共因子,保留了78.2%的原始信息,简化了数据结构。三种方法的讨论为多元统计学在水质数据分析方面的应用提供了参考。
关键词:水质状况、聚类分析、因子分析
水质和水量问题一直是威胁社会和经济发展的重要议题,已引起社会各界的广泛关注[[5 参考文献
[] Vega M.,Pardo R.,Barrado E.,et al. Assessment of seasonal and polluting effects on the quality of river water by exploratory data analysis[J]. Water Research,1998,32: 3581~3592.]-[[]Kannel P R.,Lee S.,Kanel S R.,et al. Chemometric application in classification and assessment of monitoring locations of an urban river system[J].Analytica Chimica Acta,2007,582: 390~399.]]。随着城镇化进程加速和现代经济迅速发展,由人为干扰引发的地表水和地下水污染问题日益突出[4,[[]Clement L,Thas O.Testing for trends in the violation frequency of an environmental threshold in rivers [J].Environmetrics, 2009, 20(1):53-67.]-[[]Kannel P R, Lee S, Kanel S R, et al. Chemometric application in classification and assessment of monitoring locations of an urban river system[J].Analytica Chimica Acta, 2007, 582(2):390-399.]]。众多水质监测项目产生了大量且复杂的水质数据,而分析和解释这些物理、化学和微生物等各种参数的潜在关系有着很大的难度[[[] Zhou F, Guo H, Liu Y, et al. Chemometrics data analysis of marine water quality and source identification in Southern Hong Kong[J]. Marine Pollution Bulletin, 2007, 54(6):745-756.]]。因此,用以简化数据结构、提取潜在信息的多元统计方法被大量应用在水质数据分析中。李俊霞等[[[]李俊霞,苏春利,谢先军,等.多元统计方法在地下水环境研究中的应用-以山西大同盆地为例[J].地质科技情报,2010,29(6):94-100.]]运用快速聚类和因子分析法对大同盆地原生高砷、高氟地下水的16个水化学指标进行了分析,把地下水分为6类不同水化学特征的地下水;张旋等[[[]张旋,王启山,于淼,等.多元统计分析技术在水质监测中的应用[J].中国给水排水,2010,26(11):120-122. ]]基于聚类分析(CA)和判别分析(DA)以香港新界南部和九龙的五条河溪为例探讨了水质空间差异的分析方法;富天乙[[[]富天乙,邹志红,王晓静.基于多元统计和水质标识指数的辽阳太子河水质评价研究[J].环境科学学报,2014,34(2):473-480.]]等通过因子分析、方差分析和聚类分析对辽阳太子河监测断面的水质指标进行综合评价和分类。
本研究选取某盆地内浅层地下水样品测试数据,进行聚类分析和因子分析,分析过程较为详细,从统计学方面解释数据分析结果,从而更有利于多元统计学与水质分析的结合。该盆地内存在两条大型的河流,所选取的59组浅层地下水水样多采集于河流阶地的潜水含水层,忽略地形地貌等自然因素的影响,只做多元统计方法在水质分析中应用的探讨。参与方法探讨的水质分析指标主要有电导率EC、总硬度(CaCO3)、Ca2+、Mg2+、K+(K++Na+)、Cl-、SO42-、HCO3-以及NO3-8种水质因子。
作者:何继山
水质分析中聚类分析和因子分析的应用
日期:2018-05-08 09:21 点击:337