摘要:以湖北地区番茄样品为研究对象,对获取的光谱特征信息进行分析。确定了矢量归一化法为最优光谱预处理方法:对各个信息的主成分因子进行了优化,通过主成分分析提取主成分得分向量构成模式识别的输入,利用BP神经网络方法建立番茄有机磷农药残留的无损检测模型。结果表明,当光谱信息主成分因子数为3时,建立的模型最优,预测的识别率达到0.96,训练误差为0.015,相关系数达到0.971。

关键词:番茄;近红外光谱;农药残留;神经网络

中图分类号:0657.33;TS207.5+3 文献标识码:A 文章编号:0439-8114(2010)04-0961-03

番茄是茄科中最重要的经济作物,以多汁浆果为产品。它甜酸可口,味道鲜美,是人们较喜爱的果蔬之一。番茄等鲜食农产品,在生长过程中易发生病虫害,使农药施用量加大。所使用的农药并不能全部被植物吸收,大部分仍残留在果实表面,加之采摘后立即食用,其残留的农药对人们身体健康的影响和危害更直接和严重。因此,研究农药残留的快速检测技术,在水果蔬菜上市之前对农药残留进行大量的快速抽检,确保人市产品安全无害具有重要意义。

目前,对果蔬等农产品农药残留的检测主要采用化学方法,一般是破坏性检测,它具有耗用有机试剂、制样繁琐且检测成本高等不利特点。而近红外光谱技术是近年来快速发展的一种新型光谱分析技术,具有快速、准确、无污染及非破坏性等优点。

周小芳等用激光波长为1 064 nm的近红外傅立叶变换拉曼光谱仪对常见水果和常用农药进行拉曼测试并获得了农药的特征拉曼谱,周向阳等首次采用傅立叶变换近红外光谱法(FT-NIR)对十字花科、旋药科、菊科、伞形花科、苋科等二十余种叶菜类中有机磷农药残留的鉴别进行了研究。但在基于近红外光谱的农药残留快速无损检测方面还存在很大研究空间。

该文通过对番茄整果样品的光谱分析,确定最优的光谱预处理方法,采用BP神经网络建立番茄整果有机磷农药残留的无损定性分析模型,并对该模型进行验证,为果蔬的无损检测提供依据。

1 材料及光谱图像的获取

1.1材料与试剂

番茄样品:以湖北省的主要品种且无农药污染的番茄为研究对象,收集105个番茄样品,80个作为建模集样品,25个作为预测集样品。

农药试剂:果蔬常用有机磷农药乐果,市购,用水稀释成浓度为1%的乐果溶液,乐果含量为0.4%。

1.2样品的制备

对番茄整果样品进行彻底清洗、晾干、编号和登记等操作,然后均匀完全的喷施乐果农药,放置阴凉处3 d晾干,建立有农药番茄的样品集。

1.3光谱采集 采用OceanOptics NIR256光谱仪,先后对未喷施和喷施农药的番茄样品进行光谱采集,得到番茄样品的原始光谱图(图1)。图1表明,原始光谱集中在波长900-2 500 nm,光谱噪音较大,重叠严重并且无农药污染和喷施农药的番茄的光谱图没有区分开来,需通过光谱预处理来消噪。提高模型的分析精确度。

2 光谱分析

2.1 农药乐果残留的NIR分析

含磷基团在NIR光区的表征是乐果得以快速检测的基础。近红外光谱属于振动光谱,是基频分子振动的倍频与组合频,主要反映含P-H基团的特征信息。为此,本文采用NIR光谱法,探讨鉴别有机磷农药残留的可能性。

2.2光谱预处理

分别采用常用的光谱预处理方法:一阶导、二阶导、矢量归一化和最大最小归一化进行消噪,并选择最佳的光谱预处理方法。通过不同预处理方法,建立BP网络判别模型,以模型的相关系数、训练误差、识别准确率为指标。选择最佳的预处理方法。

由表1可知,矢量归一化预处理模型为最优,训练误差、相关系数、识别准确率分别达到0.028、0.947、0.942。

2.3特征向量的提取

在模型建立过程中,应选取合适的主成分因子数。主成分因子数过大,会造成模型的鲁棒性,同时引入过多的冗余信息,使数据处理的时间加长。主成分因子数过少,信息损失过大,将会造成模型的识别率降低。

对不同预处理方法,通过主成分分析,提取不同数目的主成分因子作为特征变量,建立BP人工神经网络判别模型。以预测集中的识别率来衡量模型的优劣。主成分因子数对模型识别率的影响如图2所示,在不同预处理方法中选择最高点的因子数作为最佳主成分因子数。

由图2可得出不同预处理方法的最佳主成分因子数。通过PCA分析得到各预处理方法在最佳主成分因子数下的累积贡献率,如表2所示。

3 模型的建立

该研究采用基于BP人工神经网络的方法建立番茄有机磷农药残留的定性判别模型,BP神经网络是一个向前多层网络,利用误差反向传播算法对网络进行训练。其主要考虑网络输入层、输出层、传递函数和隐含层等网络特征参数。

1)网络输入层、输出层的设计。由于采用单一参数评价农药残留,因此输入神经元n=1,输出神经元m=1。

2)隐含层的设计。隐含层个数q=√n+m+C,式中:a――隐含层个数;n――输入层神经元数目;m――输出层神经元数目;C――1-10之间数。实际使用则根据上述公式确定隐含层神经元3-11,找出预测误差和训练误差最小的隐含层神经元作为最优个数。

3)传递函数的确定。根据输入和输出的特点,隐含层的传递函数用双正切S型传递函数tansig,输出层采用logsig函数。

4)网络的训练样本及测试样本。将先后获取的无农药污染和喷施农药的光谱数据各80个作为训练样本集,余下的无农药污染和喷施农药各25个作为测试样本集。

5)网络模型的建立。在MATLAB中,通过矢量归一化预处理对不同隐含层神经元个数的网络模型进行训练和测试。训练及测试结果如表3所示。由表3可知隐含层为3、7、9、11的模型识别率较高,相关系数分别为0.971、0.966、0.961、0.947,训练误差分别为0.015、0.017、0.021、0.028,所以当经过矢量归一化处理,神经元隐含层数为3时模型为最优。

4 小结

采用近红外光谱技术,进行光谱数据的提取和分析,选择了最优预处理方法、最佳主成分因子数和最优参数,当神经元隐含层数为3,通过矢量归一化预处理。累积贡献率可达到0.966,建立的判别番茄中乐果残留的BP人工神经网络模型为最优。样品的预测值和实际值之间的相关性达到0.971,训练误差为0.015和模型识别准确率达到0.96。表明近红外光谱技术可以无损检测有机磷农药的残留,为今后应用近红外光谱技术无损检测果蔬的农药残留提供了一种有效、快速、可靠的检测手段和方法。