北方伟业计量集团有限公司
在减少信息丢失的基础上降低预测模型的输入维度,首先利用PCA计算水质溶解氧主成分因子的累计方差贡献率,选择90%的累计方差贡献率为阈值,把方差贡献率的累加值超过90%的因子数作为特征变量的选取个数,如图2所示。从图2中可以看出,当第8个特征因子出现的时候,其总体的累计方差贡献率超过了90%,因此选取8个特征因子代替原变量作为预测模型的输入。再利用互信息分别求出14个影响因子与溶解氧之间的互信息值,可以得出溶解氧与各个水质指标的依赖程度较高,与空气中的污染物因素依赖程度较低。其重要影响因子依次为电导率、总磷、浊度、高锰酸钾指数、PH、氨氮、水温、总氮、PM2.5、NO2、PM10、O3、CO、SO2,如表1所示。
在选取的样本信息中,水质指标浊度与水温之间的相关系数为0.58>0.5,氨氮与电导率之间的相关系数为0.547>0.5,在99%的置信区间下,具有显著相关性。而互信息值0.7759(浊度)>0.6800(水温),0.7854(电导率)>0.7598(氨氮),因此选取电导率、总磷、浊度、高锰酸钾指数、PH、总氮等作为水质指标中影响溶解氧含量的特征变量。
由相关性分析得到污染物各因子间的相关系数如表2。由表2可以看出,污染物各指标因子之间具有强相关性甚至多重相关性,因环境系统是一个复杂的化学系统,指标间相互制约会引起一些冗余信息,最终会影响预测模型的精度,增大误差。
综上,本文最终选择了电导率、总磷、浊度、高锰酸钾指数、PH、总氮、PM2.5、O3等8个影响因子作为溶解氧的关键指标,此方法是通过筛选出合适的特征子集进行组合,对已有数据进行描述、建模,以达到优化目标函数的目的,有效解决变量间的冗余性在系统建模中的不良作用,避免预测模型出现过拟合现象。
基于GNIPSO-SVR的溶解氧预测模型是在Intel(R) Core(TM) i7-10510U(8核),内存12GB,Win10 64位操作系统,编程语言为MATLAB R2018a的开发环境中进行仿真实验。在GNIPSO算法中:wmax=0.9,wmin=0.4,种群规模大小为30,个体学习因子c1=1.7,社会学习因子c2=1.5,最大迭代次数为100。通过GNIPSO算法获得SVR模型的最优参数(cbest,gbest)=(39.0125,0.5013),将最优参数(cbest,gbest)代入预测模型中。
式(22)的均方误差(MSE)作为算法的适应度函数fitness,求得适应度曲线如图3所示,可以看出惯性权重非线性递减的PSO-SVR的适应度值始终小于标准的PSO-SVR,而且惯性权重非线性递减的PSO-SVR算法能较快的完成迭代且误差较小,该算法在全局寻优上具有较高的性能。
声明:本文所用图片、文字来源《信息与控制》,版权归原作者所有。如涉及作品内容、版权等问题,请与本网联系删除。
采集到的数据一般不直接采用,需经过数据的归一化处理。这是因为水质因子指标的范围比较大,不同的数据具有不同的量纲单位,为了消除水质指标彼此之间的量纲影响及保证这些数据之间具有可比性以及提高模型的运行速度和预测精度。本文采用MATLAB R2018a的map-maxmin函数进行归一化处理,如式(23)所示,“apply”模式是将数据指标转化到[-1,1]之间,便于对比预测,而“resver”模式可以将数据反归一化回去。
了解更多> >在选取的样本信息中,水质指标浊度与水温之间的相关系数为0.58>0.5,氨氮与电导率之间的相关系数为0.547>0.5,在99%的置信区间下,具有显著相关性。而互信息值0.7759(浊度)>0.6800(水温),0.7854(电导率)>0.7598(氨氮),因此选取电导率、总磷、浊度、高锰酸钾指数、PH、总氮等作为水质指标中影响溶解氧含量的特征变量。
了解更多> >综上所述,在研究水质指标溶解氧问题时选择的特征变量过少导致建模效果不佳,预测结果不具有代表性,特征变量多可以提供描述问题的更多信息,但数据中会存在无关和弱相关且冗余的特征变量,会降低模型的泛化性能。在对溶解氧预测实践中,PCA-MI特征选择方法选取的特征变量更具有代表性,能更有效的提高模型预测性能。
了解更多> >在解决水质指标溶解氧的预测问题时,将经过PCA和MI组合特征选择的溶解氧数据作为GNIPSO-SVR预测模型的输入,并与BP神经网络、SVR、PSO-SVR等预测模型进行对比分析。各个溶解氧预测模型的总体趋势与实际值都比较吻合,但本文提出的GNIPSO-SVR模型预测DO的曲线更接近实际值的曲线,PSO-SVR模型的预测效果次之,SVR的预测曲线与实际值曲线拟合度最差,尤其是对突变值的拟合情况,各个模型的预测值和实际值的拟合曲线的可视化结果如图4-图7所示。
了解更多> >本文利用主成分分析(PCA)、互信息(MI)、非线性惯性权重递减的粒子群优化算法(GNIPSO)和支持向量回归机(SVR),提出了一种基于高斯函数的非线性权重递减的粒子群算法优化支持向量回归机(GNIPSO-SVR)的预测模型,通过实验证明了GNIPSO算法优化SVR的参数优于标准的PSO算法和惯性权重线性递减的PSO算法。
了解更多> >通话对您免费,请放心接听
温馨提示:
1.手机直接输入,座机前请加区号 如13803766220,010-58103678
2.我们将根据您提供的电话号码,立即回电,请注意接听
3.因为您是被叫方,通话对您免费,请放心接听
登录后才可以评论