用多维校正法提高近红外牛奶成分校正模型稳健性的研究

摘 要 乳品质量问题是制约乳品工业发展的瓶颈近红外光谱技术以其快速简便等优越性广泛应用于各个领域, 在乳品检测中有巨大的应用潜力和前景但样品温度对近红外分析模型的稳健性和检测结果会产生较大影响, 为获得较好的分析准确度, 文章提出了抑制温度影响的新方法———多维正交校正(NOSC)合多维偏最小二乘(NPLS)它将温度作为建模元素组成含温度信息的三维光谱矩阵, 先将三维光谱阵进行预处理, 运用 NOSC 方法滤除无关信息的干扰, 再采用 NPLS 方法建立牛奶成分与透射光谱的校正模型文章在 25 , 30, 35 40 四个温度点处做了研究, 波长范围为 1 100 1 700 nm通过常规法和多维校正法来减小温度的影响实验结果表明, 常规法无法抑制温度的影响, 而与其他方法相比, NOSC-NPLS 法建立的校正模型具有更好的预测能力和稳健性, 能更有效地消除温度的影响


引 言近年来, 由于乳制品质量控制不严而引起的中毒事件频频发生针对我国乳源产地分散以及即采即售为主的原料乳产销特点, 迫切需要开发一种简便快捷廉价的乳品质量检测仪, 以适应现场快速测定的需要, 乳品质量的控制已成为制约乳品工业发展的瓶颈” 。近红外(NIR)光谱技术作为一种快速简便非破坏性的定性和定量分析方法 , 已广泛应用于食品石油化工农业医药等领域[1] 它不仅可应用于实验室分析, 而且适用于现场快速检测和实时在线分


目前国内外已有的研究表明[ 2 ,3], 利用 NIR 分析技术检测牛奶成分是可行的, 但测量结果极易受到外界条件(如温压力等)的影响, 模型稳健性较差, 难以满足实际应用要温度作为影响模型稳健性的重要因素, 不仅影响样品的吸光度, 而且也影响波长位移导致谱带变形[ 4] 所以在实际应用过程中, 如何建立抗干扰能力强的近红外稳健分析模型显得颇为重要现有解决温度对 NIR 分析结果的影响方法主要有以下4 [ 5-9] :

(1)采用光谱预处理方法剔除光谱中温度的影响;

(2)选取对温度影响因素不敏感的波长建立稳健分析模型;

(3)建立全局校正模型;

(4)构建温度修正模型对温度的影响加以校正


本文采用NIR 光谱技术测量不同温度下牛奶中脂肪和蛋白质的含量, 围绕如何消除温度影响建立稳健校正模型问题进行研究在此基础上, 对得到的结果进行了分析和讨论


1 温度对光学参数的影响


在近红外牛奶成分分析中, 温度的差异会给测量带来极大干扰采用恒温下测量可以有效减少温度变化的影响, 此恒温式测量法首先被采用然而, 在实际应用中温度无法精确控制, 温度变化不仅会改变牛奶的微观状态, 也会引起测量光谱的变化牛奶作为一种典型的混浊介质, 是由水脂肪蛋白质乳糖等多种成分组成, 其中水脂肪和蛋白质是引起光子吸收和散射的主要因素随着温度的变化, 牛奶的光学特性也将发生改变, 即光学参数的变化Venyamino v [ 10] 指出,含水量大的物质, 温度变化会导致 OH 倍频区吸收的非线性变化 Fo rne s [ 11] 的研究表明, 水在近红外 1.8 2.3 μm 段中吸收峰的位置随温度的升高向短波方向移动常敏等[ 12] 利用双积分球装置得出:随温度升高, 不同波长下牛奶的约化散射系数显著下降, 吸收系数没有明显的变化规律,


微信图片_20190520142346_看图王.png

Fig.1 μa and μ′s change with the temperature


25 40 之间, 测量市售的鲜牛奶样品, 其中脂肪蛋白质和总固体含量分别约为 3.4 %, 2.9 %8.1%。结果表明, 牛奶约化散射系数减小 6.7 ×10-3 -1, 吸收系数没有固定的变化趋势温度对约化散射系数影响较大, 主要散射成分是存在于牛奶中的脂肪, 温度对脂肪的影响主要表现在牛奶溶液的粘度上:随着温度升高, 牛奶溶液的粘度下[ 13], 脂肪球分布越均匀, 进而使脂肪散射作用的影响减而吸收系数与温度关系难以得到, 这是由于牛奶中多种成分综合表现出来的复杂吸收效应的缘故上述分析表明,温度不仅是影响测量精度的主要因素之一, 也是提供测量过程中化学信息细节变化的重要参量


2 实验部分


2.1 仪器及光谱采集采用自行研制的 AOTF 近红外光谱仪, 如图 2 所示, 统装置包括 AOTF 分光系统温度控制样品池检测系统和传导光纤束光源为经 AOTF 分光后的 1 级近红外光, 采用透 射方式进行样品的光谱扫描 , 选择的波长范围为1 100 1 700 nm , 四个采样温度分别为 25 , 30, 35 40 ℃, 温度控制精度为±0.1 ℃, 采用蠕动泵自动进样系统, 光程长为0.5mm Fig.2 Schematic diagram of the measuring system


2.2 样品制备及数据分析64 个样品由北京牛奶中心提供, 牛奶中脂肪和蛋白质的参考值由丹麦 FOSS 公司生产的乳品综合成份指标分析仪测定通过 K-S 方法选取 46 个样品的光谱数据组成校正集,其余的 18 个样品的光谱数据组成验证集利用CAMO 公司的 Unscramble r7.8 软件建立 PLS 校正模型, 模型性能通过预测值与真实值的相关系数和预测均方根误差(RMS EP)来评价NOSC NPLS 算法程序, 均由Ma tlab2006 语言编制


3 结果与讨论


3.1 消除温度影响方法的分析常规方法是采用偏最小二乘(PLS)法对脂肪蛋白质进行回归首先对全部光谱数据进行预处理, 消除背景和噪声干扰;然后采用交互验证法确定最佳主成分数, 建立 PLS 正模型由上述分析可知, 温度的变化会直接影响到牛奶的光学特性, 导致光谱数据的变化, 对于在不同温度的样品光谱集, 它们是有差异的, 也就是说, 它们包含特定的温度信可见, 要想减小温度的影响, 最理想方法是把温度作为一个建模元素来考虑, 在建模时参与回归计算, 这样模型中就包含温度的变异信息, 有可能提高分析模型的预测能力为此, 组成含温度信息的三维光谱矩阵, 采用 NPLS 方法建立校正模型为扣除无关信息的干扰, 基于 PLS 法的二维扩展思想, OSC 扩展到三维数据的预处理中, 定义为 NOSC通过 NOSC NPLS 方法相结合, 建立牛奶成分的定量校正模型


3.2 常规方法采用 MSC OSC 25, 30 , 35, 40 四个温度点上光谱数据进行预处理, 然后采用 PLS 法建立脂肪蛋白质的校正模型, 其结果如表 1 所示

从表1 可以看出, 40 温度点上的预测结果较好, 肪和蛋白质 RMSEP 分别为0.113 %0.134 %, 相关系数分别为 0.990 0.988 这可能是由于散射体脂肪的熔点为 37[ 14], 37 以上时脂肪由固态变为液态, 使其对光的散射能力降低因而当温度高于 37 , 温度变化对测量结果的影响减小, 模型得到了较好的预测结果此外 , 同样条件下脂肪的预测精度明显好于蛋白质, 这说明温度对于样品中不同组分的近红外定量分析模型的影响是不同的, 因此需要单独研究利用 4 个不同温度下建立的 PLS 校正模型对全部的数据进行预测, 交叉检验的结果如表 2 所示由此可以看出,对于脂肪和蛋白质的预测结果, 处于对角线的数据是各行数据中最小的, 这说明单一温度校正模型对同一温度验证集样品的预测精度较高, 而对不同温度验证集样品的预测能力较, 同时也表明了单一温度校正模型无法抑制温度的影响



3.3 多维 NOSC-NPLS NOSC-NPLS 法用于建立近红外光谱校正模型的基本思想是首先对校正集样品的三维光谱阵进行 NOSC 处理, 滤除光谱中噪声及与测量浓度无关信息的干扰, 再通过 NPLS 法建立校正模型研究中选取特定温度组成的三维光谱阵 X(I ×J ×K ,其中 I 为校正集样品数目, J 为选取的温度个数, K 为波长点数)。NOSC 算法的原理是将三维立体阵进行三维分解, 传统 OSC 相同, 分解后的得分矩阵与浓度阵Y 进行正交, 通过迭代滤除与Y 无关的测量信息具体算法由校正和预测两部分组成校正部分:(1)对三维光谱阵 X 进行 Tucker3 分解[ 14] :[ Fac to rs, G] = Tucke r(X, PCs), [ A, B, C] = fac2le t(Facto rs), 其中 A 为原始光谱的得分矩阵, B C 为载荷矩阵,G 为核心矩阵, PCs 为主成分数;(2)t 初始化为 X 阵的第一个主成分得分向量, t =A(:, 1);(3)t Y 作正交处理,t =(I-Y(YY)-1Y′)t ;(4)计算权重向量, w=(AA)-1 Aw ;(5)计算新的得分向量 t =A w, 重复步骤(3)~ (5)直至 t收敛;(6)计算 载荷向 量, p =Xt/(tt ), p(k , j)=Ii =1X(i, j , k)t(i)/(t′(i)t(i));(7)X 阵中与Y 无关的测量信息滤除, X=X-tp′, 为矩阵的克罗内克积(Kro necker product)。预测部分:对未知样品光谱 Xun(I×J ×K)进行以下处理首先将三维阵 Xun进行 Tucker 3 分解提取得分矩Aun, 调用保存的 t ;然后再计算 t =Aunw , p =(Xun)′t/(tt);最后计算校正矩阵 Xun =Xun -tp′。3 表示出 NPLS 校正模型建立的过程


先将 NOSC 处理后的三维光谱阵展开后分解, 得到三线性模型为Aijk = Ff =1tif wJjf wKk f +eijk其中 F 为主成分数, t 为得分向量, wJ wk 为对应的两个载荷向量, eijk 为残差阵Fig.3 Schematic diagram of multi-way PLS(NPLS)method对光谱矩阵分解的同时, 也对浓度阵Y 进行分解, 建立校正模 型;然后再用 已建立 的校正模 型进行 预测分析NPLS 算法的详细过程参阅文献[ 15] 。采用展开 PLS(Unfold-PLS)方法进行定量校正时, 是将NOSC 预处理后的三维数据展开成二维矩阵, 再通过标准的二维 PLS 算法建立模型


3 列出了 NPLS , Unfold-PLS 以及文献[ 16] 中用于消除温度影响方法 PARAFAC-MLR 所建模型的预测结果果表明:(1)NOSC 方法能够明显改善模型分析精度对于脂肪和蛋白质的 NPLS Unfold-PLS 模型的预测结果, 预处理后模 型 的 RMS EP 均 比较 低;(2)通过 NOSC-NPLS NOSC-Unfold-PLS PARAFAC-MLR 方法, 都能建立有效的抗温度干扰分析模型;(3)由于 NPLS 方法可有效利用三线性数据结构优势, 因此, NOSC-NPLS 方法所建模型的预测能力优于 NOSC-Unfo ld-PLS , PARAFAC-M LR 方法;(4)与表 1 中不同温度下二维 PLS 模型预测结果相比, 三维NOSC-NPLS 模型能够得到更高的预测精度, 这是由于三维数据不只是二维数据的一个简单集合, 其各矩阵间存在着内在的关系


4 结 论模型稳健性问题是近红外光谱分析技术中一个关键的共性基础问题, 一直备受关注本文以牛奶样品为具体研究对, 针对近红外测量中存在的温度影响问题, 探讨了如何建立稳健校正模型的方法 实验结果表明, 常规方法无法抑制温度的影响, 而通过温度 T 波长 λ和样品 S 三维数据来建立稳健 模型是一种可行的 方式, NOSC-Unfold-PLS PARAFAC-M LR 法相比, NOSC-NPLS 建立的校正模型具有更强的预测能力和稳健性这种校正思想还有望解决近红外光谱分析中其他测量条件(压力时间)的影响问题, 该校正方法还可用于激发发射矩阵荧光仪(EX-EM)、 细管电泳仪(CE-DAD)、 色质联用仪(GC-MS LC-MS)仪器产生的矩阵类型数据的定性定量分析


参 考 文 献

[ 1] YAN Yan-lu , ZHAO Long-li an , H AN Dong-h ai, et al(严衍禄, 赵龙莲, 韩东海, ).P rin ciple and Application of Near Infrared S pectroscopy(近红外光谱分析基础与应用).Beijing :Light In du stry P ress of China(北京:中国轻工业出版社), 2005.

[ 2] WANG Li-jie, XU Ke-xin , GUO Ji an-ying(王丽杰, 徐可欣, 郭建英).J ournal of Opt oelectronics· Laser(光电子· 激光), 2004 , 15(4):468.[ 3] S asi c S , Ozaki Y .Appl .Spectrosc ., 2000 , 54:1327.

[ 4] Thygesen L G J .J.Near Infrared S pectros c., 2000 , 8:183.

[ 5] Kamal Y T , Vidi A S .Progress Report , 2000 , 3:2.

[ 6] H azen K H , Arnold M A , S mall G W.Applied S pectroscopy , 1994 , 48(4):477.

[ 7] Flo rian W, Wm Th Kok , Age K S.Anal.C hem ., 1998 , 70:1761.

[ 8] C HU Xi ao-li, YUAN H ong-fu , WANG Yan-bin , et al(褚小立, 袁洪福, 王艳斌, ).Spectroscopy an d S pectral Analysis(光谱学与光谱分析), 2004 , 24(6):666.[ 9] ZH ANG Jun , CH EN Hu a-cai , C HEN Xing-dan(张 军, 陈华才, 陈星旦).S pectroscopy and S pectral An aly sis(光谱学与光谱分析),2005 , 25(6):890.[ 10] Venyaminov S Yu , Prendergast F G .Anal.Bi ochem ., 1997 , 248:234.

[ 11] Fornes V , C hau ssidon J.J.C hem .Phys., 1978 , 68:4667.

[ 12] C HANG Min , PENG Dan , XU Ke-xin(常 敏, 彭 丹, 徐可欣).Act a Optica Sinica(光学学报), 2007 , 27(6):1080.

[ 13] h ttp:// w w w .f oodsci.u ogu elph .ca/dairyedu/ chem .html .

[ 14] An dersson C A , Bro R.Ch emometrics and In telligent Laborat ory Sy stems, 1998 , 42:93.

[ 15] B ro R.J.Chemometri os , 1996 , 10(1):47.

[ 16] Peinado A C , van den F Berg , Blanco M , et al.Chemometri cs an d Int elligen t Laboratory Systems, 2006 , 83:75.


service@china-ias.com
———————————————————————————————————————————————————————————————————————————————————————————
工作时间:08:30—17:30
联系电话:0510-81002996
江苏省无锡市城南路168号
科研大厦2楼
@2020  无锡迅杰光远科技有限公司