一、数据剖析

  首要剖析面源监测数据,一共有30个降雨日的数据,其间每个降雨日内都有降雨量,以及总氮、氨氮、总磷、COD这四种污染物的监测数据,且降雨数据与污染物数据数量级相差较大。进而根据污染物与降雨的联系,我认为在模仿污染物载荷时,应当考虑构建成降雨量作为自变量,其他四种污染物分别作为因变量的四个单变量函数。

  然后对数据进行标准化处理。但其实此处函数或者神经网络均为单变量,所以标准化的含义并不大。

【数据预测】综合比对线性拟合与BP算法预测结果

二、模型构建

(一)线性拟合

  接着在Excel中对数据进行简略的作图剖析,可以发现如下图所示,四组数据都是比较符合于线性分布。所以首要考虑选用线性模型进行拟合,拟合结果如下图所示。可以看到线性模型并不可以很好地拟合降雨量和四种污染载荷之间的联系,解释程度较高且拟合效果较差,因而本文将不选用线性拟合的方式!

【数据预测】综合比对线性拟合与BP算法预测结果

(二)神经网络模仿

  由线性拟合的经验可知,降雨量与四种污染载荷之间的联系并不杂乱,因而可以考虑选用较为简略的神经网络进行模仿,本文即选用BP神经网络进行拟合。

  考虑到BP神经网络存在陷入局部极小值的可能性,对拟合过程中易产生不确定性波动,咱们可对BP神经网络进行改善:针对输出结果差错进行断定,对符合要求的拟合输出,不符合则筛选掉,使输出的结果在必定较小范围的差错内。

  在设置BP神经网络的时候,咱们对隐含层设置为10层,函数分别为:logsig、purelin、traingdx、learngdm允许练习的最大步数设置为5000,练习目标的最小差错设置为0.00000001,学习率设置为0.0000001。

  本文中选用R2作为评价指标,把R2在0.998与1.002之间的练习网络进行存储(便于下次调用),这儿的R2计算公式:
SSR = SUM((真值 – 真值的均值)^2)
SST = SUM((猜测值 – 猜测值的均值)^2)
R2 = SSR/SST

【数据预测】综合比对线性拟合与BP算法预测结果

三.运用降水量为自变量

3.1 以降水量为自变量模仿总氨量与实在总氨量进行改善BP网络试验图

【数据预测】综合比对线性拟合与BP算法预测结果

3.2以降水量为自变量模仿氨氮量与实在氨氮量进行改善BP网络试验图

【数据预测】综合比对线性拟合与BP算法预测结果

3.3以降水量为自变量模仿总磷量与实在总磷量进行改善BP网络试验图

【数据预测】综合比对线性拟合与BP算法预测结果

3.4以降水量为自变量模仿COD值与实在COD值进行改善BP网络试验图

【数据预测】综合比对线性拟合与BP算法预测结果

总结

  归纳线性拟合模型和神经网络模仿的模仿效果来看,运用神经网络模型完全能胜任数据拟合使命,虽然神经网络的输出存在不稳定性,但是咱们可以对神经网络输出部分进行约束从而到达在必定很小的差错内波动,从而到达抱负值的要求。因而在本文中咱们选择运用改善的神经网络进行猜测是可以到达试验目的。

附录

源数据:

【数据预测】综合比对线性拟合与BP算法预测结果

结果对比数据:

【数据预测】综合比对线性拟合与BP算法预测结果

本文正在参与「金石方案 . 瓜分6万现金大奖」

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。