基于LS-SVM的养殖水体氨氮含量分析模型的优化

居锦武

(四川理工学院计算机学院,四川自贡643000)

摘要:水体氨氮浓度是水产养殖的关键水质指标,为了提高氨氮浓度的测量精度,减少测量过程中pH、温度、静置时间等因素对准确度的影响,使用最小二乘支持向量机 (LS-SVM)算法建立了分析预测模型,通过正交试验仿真测试,获取各因素的最佳优化组合为pH值10.5、反应温度35℃、静置时间20 min、检测光源波长380 nm。仿真结果表明,在设计在线式氨氮检测系统时,利用最佳优化组合对氨氮浓度分析模型进行优化,提高了氨氮浓度的测量精度。

关键词:支持向量机;水产养殖;氨氮;分析模型

水产养殖过程中,养殖水体中氨氮等物质浓度过高时,将导致养殖对象患病甚至死亡,严重影响水产品的质量和产量[1]。刘建魁等[2]研究表明,氨氮和非离子氨的浓度与史氏鲟幼鱼的健康状况呈正相关性。刘永士等[3]研究表明,凡纳滨对虾的生长与养殖池的氮、磷收支状况有密切关系。《渔业水质标准 (GB11607-89)》指出,氨氮浓度低于0.02 mg/L时,不会影响鱼类的生长,一般情况下,养殖水体中的氨离子浓度应低于5 mg/L。

养殖水体的氨氮浓度受多种因素的影响,如饲料、药物的残留及水体本体污染等,因此,需定期检测养殖水体的氨氮浓度。常用的检测手段是先进行水体采样,再到实验室进行分析。当水体范围广、检测量大且周期短时,这种传统手工检测方法的工作量非常大,可靠性较差。设计一种在线式氨氮检测系统,自动抽取水样,定时自动检测,网络上传结果数据,将极大地提高水体氨氮浓度检测工作的效率和质量。在线式氨氮检测系统[4]通常使用光度法,即将被测水样与纳氏试剂混合,试剂与水样中的氨氮发生反应,反应后的物质呈现红棕色,使用紫外光源照射,通过测量吸光度,进而计算水样的氨氮浓度。该方法由于所需试剂种类只需两种,而显色反应灵敏,吸光度测量简单,没有传感器损耗,特别适合长时间在线自动测量。

但基于纳氏试剂光度检测法设计在线式氨氮检测系统时,发现这种检测方法的测量误差虽然小于标准要求 (<±10%),但呈现一定的离散性,重复性误差需进行优化。光度检测法单次测量约需时30 min,测量数据量少,无法使用常规的数据处理手段来提高准确性。俞继梅[5]、薛红[6]分析了显色时间、显色温度、水样pH、水样预处理效果对测量结果的影响。但这些研究仅限于分析各单因素对测量结果的影响,未能进行量化分析。为了进一步减小光度法的测量误差,减小重复性误差,本研究中创新性地将最小二乘支持向量机 (LS-SVM)算法用于氨氮测量的优化,通过建立数据分析预测模型[7],分析各个单因素对最终测量结果的影响,利用正交试验完成在线式氨氮检测系统的设计优化。数据分析预测模型虽然可以使用神经网络[8-9]、支持向量机[10]等技术实现,但神经网络技术所需数据样本较多,不适合氨氮浓度分析,而支持向量机技术所需数据样本较少,适合用于建立氨氮浓度分析预测模型。

1 最小二乘支持向量机模型

支持向量机 (SVM)是一种机器学习方法,该方法基于统计学习理论,通过遵循结构风险最小原则,增强泛化能力,适合于小样本的情况下工作[11]。LS-SVM是在SVM基础上,设定新的约束条件、新的目标优化和风险控制函数,进一步改善了SVM的泛化能力[12-13]

设有内含N个样本的训练集D,可将D表示为

{(x1,y1),(x2,y2), …, (xN,yN)},

其中x和y分别为输入和输出。通过一个非线性映射φ,将样本数据从原空间映射到高维特征空间φ(x),即φ(x)=(φ(x1),φ(x2),…,φ(xN))。在φ(x)中设置最优决策函数y(x)=ωφ(x)+b+ ξk,其中ω和b分别为权值向量和阈值。

LS-SVM算法基于下式求解约束优化问题:

其中:C是正则化参数,需要动态设定;误差分量ξk≥0,k=1,2,…,N。采用Lagrange法[14]求解式 (1),即:

其中,αk(k=1,2,…,N)为 Lagrange乘子,分别对ω、b、ξ、α求偏导=0,即

设Ω为N×N对称方阵,即

定义核函数k(xi,xj),满足以下Mercer条件:

LS-SVM的回归模型[14]如下:

选择径向基核函数(RBF)作为核函数k(xi,xj),模型具有学习速度快的特点,其计算公式为

整个LS-SVM模型中,正规化参数C及核宽度参数σ是算法的可调参数,将影响分析预测模型的泛化性能和学习能力。

2 在线式氨氮检测系统

在线式氨氮检测系统,基于纳氏试剂光度检测法原理,系统结构框图如图1所示,图2为系统装置照片。检测系统装置由计算机、PLC控制器、触摸屏、光度计、加热器、反应器、计量器、微型水泵、八通阀和多种试剂等组成,加热器可控制反应器温度,计算机通过触摸屏显示软件运行界面,与操作人员交互,通过PLC控制器控制计量器和八通阀工作,通过光度计读取反应色度数据,经数据分析后,计算出氨氮浓度。整个检测过程如下:

(1)计算机控制八通阀和微型水泵,水样经计量器送入反应器。 (2)切换八通阀,掩蔽剂经计量器进入反应器。 (3)切换八通阀,纳氏试剂经计量器进入反应器。(4)静置反应等待10 min,读取光度计数据,获得测量光强。(5)切换八通阀,反应余液排入废液瓶。 (6)切换八通阀,蒸馏水进入反应器,读取光度计数据,获得参比光强。(7)切换八通阀,清洗废水排入废液瓶。

根据下式计算吸光度:

图1 系统设计结构图
Fig.1 Block structure diagram

3 单因素影响分析

基于纳氏试剂光度检测法的在线式氨氮检测系统,有4个主要因素影响最终测量结果的精度,即水样pH、反应温度、静置时间、检测光源波长。首先分析各单个因素对检测精度的影响,找出最优化的单因素工作范围,然后再进行L9(34)正交试验,获取氨氮浓度检测的因素最佳优化组合。

图2 系统装置照片
Fig.2 The system photos

3.1 水样pH

测定过程中,水样的pH对显色反应有明显影响。pH值低则显色反应不完全,pH值高易出现浊化,两种情况都将影响最终测定值的准确性。将浓度为5 mg/L的氨氮标准溶液分7份进行测量,调节其pH分别为7、8、9、10、10.5、11、12。设定反应温度为35℃、静置时间为10 min,使用波长为420 nm的检测光源。吸光度试验测量结果如图3所示,当pH为10~11时,吸光度最高。

图3 水样pH对吸光度的影响
Fig.3 Influence of water pH value on absorbance

3.2 反应温度

测定过程中,反应温度将影响纳氏试剂与氨氮的反应速度。同样对浓度为5 mg/L的氨氮标准溶液分8份进行测量,调节其pH为10.5,设定静置时间为10 min,使用波长为420 nm的检测光源,分别设定反应温度为10、15、20、25、30、35、40、45℃。吸光度试验测量结果如图4所示,当反应温度为30~40℃时,吸光度最高。

3.3 静置时间

测定过程中,静置时间也将影响最终的测量光度值。同样对浓度为5 mg/L的氨氮标准溶液分6份进行测量,调节其pH为10.5,设定反应温度为35℃,使用波长为420 nm的检测光源,分别设定静置反应时间为5、10、15、20、25、30 min。吸光度试验测量结果如图5所示,当静置时间为10~20 min时,吸光度的变化比较平稳。

图4 反应温度对吸光度的影响
Fig.4 Influence of reaction temperature on absorbance

图5 静置时间对吸光度的影响
Fig.5 Influence of static time on absorbance

3.4 检测光源波长

测定过程中,检测光源波长也会影响最终的测量光度值。同样对浓度为5 mg/L的氨氮标准溶液分4份进行测量,调节其pH为10.5,设定反应温度为35℃、静置反应时间为10 min,使用波长分别为365、375、395、420 nm的检测光源。吸光度试验测量结果如图6所示,当使用波长为420 nm的检测光源时,吸光度最高。

图6 检测光源波长对吸光度的影响
Fig.6 Influence of wave length on absorbance

4 氨氮含量分析模型的正交试验

根据以上试验结果,用水样pH、反应温度、静置时间、检测光源波长4因素,进行4因素3水平的L9(34)正交试验,表1为正交试验因素设计表,表2为方差分析表,表3为正交试验设计表及试验结果。

由极差分析 (表3)可知,影响氨氮浓度检测主要因素的顺序为pH>反应温度>静置时间>光源波长,最佳因素组合为 A3B3C3D1,即 pH值11、反应温度40℃、静置时间20 min、检测光源波长380 nm。由表2可见,pH和反应温度对试验影响极显著 (P<0.01),而静置时间和检测光源波长对试验影响不显著 (P>0.05)。

表1 正交试验因素设定表
Tab.1 Levels and factors in the orthogonal test

因素factor水平level B C D A pH反应温度/℃reaction temperature静置时间/min static time光源波长/nm wave length 1 10.0 30 10 380 2 10.5 35 15 400 3 11.0 40 20 420

表2 方差分析表
Tab.2 Table of variance analysis

方差来源source of variance平方和SS自由度df F值F value显著性0.003 2 0.11 <0.01反应温度 0.554 2 19.46 P<0.01静置时间 0.039 2 1.37光源波长significance pH 0.543 2 19.07 P

表3 正交试验设计及试验结果
Tab.3 Design and results in an orthogonal test

B试验号No. A C pH值pH value反应温度/℃reaction temperature静置时间/min static time D光源波长/nm wave length实测吸光度measured absorbance LS-SVM预测吸光度LS-SVM predicted absorbance预测误差prediction error 1 2.885 2.762 -4.276 2 1 2 2 2 2.782 2.710 -2.586 1 1 1 3 1 3.500 3.568 1.936 4 2 1 2 3 2.775 2.704 -2.560 1 3 3 5 3 2.943 2.831 -3.815 6 2 3 1 2 3.329 3.355 0.793 2 2 3 7 1 3.444 3.465 0.604 8 3 2 1 3 3.372 3.432 1.768 3 1 3 2 3.850 3.772 -2.026 K 9 3 3 2 1 3.056 3.035 3.195 3.226 K2 3.016 3.032 3.136 3.185 K3 3.555 3.560 3.296 3.216 R 1 0.539 0.528 0.160 0.041

5 预测模型的仿真与优化模型的验证

5.1 预测模型仿真

基于LS-SVM算法建立分析预测模型,选取pH、反应时间、静置时间、检测光源波长作为模型的输入,吸光度作为模型的输出。用LS-SVM算法预测的吸光度值与实测吸光度值的对比如表3所示,最大误差为4.28%,平均误差为2.73%,吸光度预测值与实测值拟合良好,显示预测模型结果可信。

5.2 仿真优化分析

根据正交试验分析,水样的pH和反应温度为主要影响因子,而静置时间和检测光源波长为次要因子,故使用仿真模型来精确确认两个主要因子的最佳取值。在反应温度为40℃、静置时间为20 min、光源波长为380 nm的情况下,运用LS-SVM预测模型在水样pH为9.5~11.5时进行仿真,吸光度曲线如图7所示,可得到最佳水样pH为10.5。

图7 水样pH对吸光度影响的仿真结果
Fig.7 Simulation influence of water pH value on absorbance

在pH为10.5、静置时间为20 min、光源波长为380 nm的情况下,运用LS-SVM模型在反应温度为33~36℃范围内进行仿真,吸光度曲线如图8所示,可得到最佳反应温度为35℃。

由此可知,基于纳氏试剂光度检测法的在线式氨氮检测系统,其各影响因素最佳优化组合为pH 值10.5、反应温度35℃、静置时间20 min、光源波长380 nm。如需加快测量过程,可将静置时间设定为10 min。

6 结语

图8 反应温度对吸光度影响的仿真结果
Fig.8 Simulation influence of reaction temperature on absorbance

本研究中,运用LS-SVM算法建立分析预测模型,分析了氨氮检测过程中的4个主要影响因素对测量吸光度的影响,并对各影响因素进行了正交试验分析,得到最佳优化组合为pH值10.5、反应温度35℃、静置时间20 min、检测光源波长380 nm。运用文中建立的数据分析模型,对在线式氨氮检测系统进行了设计优化,减小了重复性误差,提高了系统的测量精度。所设计的在线式氨氮检测系统,已在自贡天健生物科技有限公司污水处理工程中得到应用,取得了良好的效果。实际应用表明,文中基于LS-SVM算法建立了一种有效的数据分析预测模型,具有良好的预测能力,提高了系统的测量精度,在数据分析预测方面可以广泛应用。在线式氨氮检测系统需定期更换纳氏试剂和掩蔽剂,受限于原料及配制方法,这两种试剂的成分具有离散性,测量结果将受到影响,文中未能对此进行深入分析研究,这将是下一步的研究问题之一。此外,光度检测法在水质检测中应用广泛,如重金属、COD等,LS-SVM分析预测模型在这些领域的应用也将是下一步的研究问题。

参考文献:

[1] 张卫强,朱英.养殖水体中氨氮的危害及其检测方法研究进展[J].环境卫生学杂志,2012,2(6):324-327.

[2] 刘建魁,刘立志,赵文,等.非离子氨和氨氮对不同规格史氏鲟幼鱼的急性毒性及安全浓度评价[J].大连海洋大学学报,2014,29(2):175-178.

[3] 刘永士,臧维玲,侯文杰,等.凡纳滨对虾生长及养殖池氮、磷收支随养殖时间的变化[J].大连海洋大学学报,2013,28(2):143-147.

[4] 马淑勍,梁滨.利用自动分析仪测定水中氨氮的方法研究[J].山东化工,2015,44(4):62-64.

[5] 俞继梅.纳氏试剂测氨氮影响因素的分析和研究[J].江西化工,2013(4):41-45.

[6] 薛红.基于纳氏比色法的水中氨氮检测影响因素分析[J].工程技术:文摘版,2015(22):77,102.

[7] 曾燕,成新文,陈欲云,等.最小二乘支持向量机优化芹菜总黄酮提取工艺[J].食品研究与开发,2015,36(8):49-52,57.

[8] 童敏明,张愉,齐美星.基于BP神经网络的可燃混合气体分析方法的研究[J].计量学报,2006,27(2):169-171.

[9] 侯迪波,陈玥,赵海峰,等.基于RBF神经网络和小波分析的水质异常检测方法[J].传感器与微系统,2013,32(2):138-141.

[10] 黄苜,程小平.基于支持向量回归粒子滤波器的运动员实时跟踪方法[J].西南大学学报:自然科学版,2008,30(5):165-169.

[11] Suykens J A K,Vandewalle J.Least squares support vector machine classifiers[J].Neural Processing Letters,1999,9(3):293-300.

[12] Wen W,Hao Z F,Yang X W.A heuristic weight-setting strategy and iteratively updating algorithm for weighted least-squares support vector regression[J].Neurocomputing,2008,71(16-18):3096-3103.

[13] Suykens J A K,Vandewalle J.Recurrent least squares support vector machines[J].IEEE Transactions on Circuits and System I:Fundamental Theory and Applications,2000,47(7):1109-1114.

[14] 曾燕,成新文,王红旗,等.基于加权最小二乘支持向量机的下水道可燃气体分析[J].西南师范大学学报:自然科学版,2014,39(9):94-99.

Optimization of an ammonia nitrogen content analysis model in aquaculture water based on LS-SVM

JU Jin-wu
(School of Computer Science,Sichuan University of Science and Engineering,Zigong 643000,China)

Abstract:The least square support vector machine(LS-SVM)was used to establish an analytical prediction model of ammonia nitrogen concentration as a key water quality index in aquaculture in order to improve the measurement accuracy of ammonia nitrogen concentration,and the analytical prediction model was optimized to reduce the influence of pH value,temperature,static time and otherfactors during measurement process by an orthogonal simulation test.The results showed that the precise measurement of ammonia nitrogen concentration was observed under the conditions of pH value of 10.5,temperature of 35℃,static time of 20 min,and light source wave length of 380 nm using an on-line ammonia nitrogen detection system.

Key words:support vector machine;aquaculture;ammonia nitrogen;analysis model

中图分类号:TP391

文献标志码:A

DOI:10.16535/j.cnki.dlhyxb.2016.04.016

文章编号:2095-1388(2016)04-0444-05

收稿日期:2016-03-22

基金项目:四川省科技支撑计划项目 (15ZC0195);四川省院士 (专家)工作站基金资助项目 (2014YSGZZ01);企业信息化与物联网测控技术四川省高校重点实验室基金资助项目 (2014WYY01);泸州老窖奖学金资助项目 (15LJZK04)

作者简介:居锦武 (1976—),男,副教授。E-mail:jjwmail@163.com