化學計量學方法及其在油脂識別分析中的應用
來源:環球糧機網發布時間:2015-04-29 21:39:29
化學計量學是一個化學分支,它利用數學和統計學方法進行設計和選擇最優的測量程序和實驗方案,并通過對化學數據的分析提供最大限度的化學信息。化學計量學是分析化學的前沿研究方向之一,是化學量測的基礎理論和方法學。
化學計量學的研究范圍極為廣泛,內容豐富。化學實驗設計與優化、定量校正理論、分析信號處理、化學模式識別、模型與參數估計、數據解析、過程模擬、人工智能、情報檢索、實驗室自動化等等都是化學計量學的研究范圍。其中,化學模式識別技術是糧油食品類別分析中應用較廣而且較有效的化學計量學方法。化學模式識別就是借助計算機來揭示隱含于化學量測數據內部規律的一種多元分析技術,它的任務就是要找出相同樣品具有某些共同性質的特征,進而根據這些特征去預報一些未知樣本的性質,來判別未知樣品屬于哪一個模式,也就是屬于哪一類或哪一種。
隨著計算機科學、應用數學和統計學方法在化學中應用的日益廣泛和深入,化學計量學理論和方法已滲透到化學中的各個領域。不像以往的分析工作者對研究過程中的預處理及實驗過程研究較多,而對方法選擇、數據處理及結果解釋方面研究較少,往往不能以最優的實驗設計去分析和處理問題,并盡可能多地提取有用的化學信息。而化學計量學正是以研究過程中的方法選擇、數據處理、信息提取及結果解釋為主要研究內容,它在實驗設計、數據處理、信號解析、化學分類決策及預報方面具有巨大的優勢,能夠解決傳統的化學研究方法難以解決的復雜問題,為此,它有著強大的生命力,得到了廣泛的應用。
1.常用的化學計量學方法
隨著化學計量學的發展人們越來越多地傾向于用模式識別技術處理食品中的有機成分實驗數據,以解決植物油分析和鑒別的難題,主成分分析法、判別分析、聚類分析、偏最小二乘法等受到普遍重視,還有其他化學計量學方法如人工神經網絡、多元線性回歸法、SIMCA法、校正變換矩陣法在油脂識別分析中也有應用。
1.1主成分分析(principalcomponentsanalysis,PCA)主成分分析是模式識別分析中最常用的一種性映射方法,這種方法是根據樣本點在多維模式空間的位置分布,以樣本點在空間中變化最大方向,即方差最大方向作為判別矢量。從概率統計觀點可知,一個隨機變量的方差越大,該隨機變量所包含的信息越多。所謂主成分就是原始數據的p個變量經線性組合(或映射)得到的變量,其方差為最大(第一主成分)。主成分之間是相互線性無關的,一般前幾個主成分可包括原變量的大部分信息。主成分分析是多元統計中的一種數據壓縮技術,在不丟失主要光譜信息的前提下選擇為數較少的新變量來代替原來較多的變量,解決了由于譜帶重疊而無法分析的困難。
1.2聚類分析(clusteranalysis,CA)聚類分析是按/物以類聚0的原則將特性相近的變量或觀察單位進行歸類。聚類分析是數理統計的一種方法,適用于對于樣本沒有類的先驗知識的情況。聚類分析可分為變量聚類和樣品聚類兩類,前者又稱指標聚類或R型聚類;后者又稱Q型聚類。用于近紅外光譜定性分析常用的方法有系統聚類分析法、K-均值聚類方法、模糊K-均值聚類方法、以及自組織(Kohonen)神經網絡。系統聚類法和K-均值聚類方法是目前聚類分析中應用最多的兩種方法,許多著名的統計軟件,如SAS、SPSS等都包含相應模塊。模糊K-均值聚類方法和自組織(kohonen)神經網絡方法是近幾年發展最快的聚類方法。聚類分析的重要組件為樣品間的距離、類間的距離、并類的方式和聚類數目的判定。對已知種類的樣品進行聚類分析的基本原理是近紅外光譜或其壓縮的變量(如主成分)組成一個多維的變量空間,通過化學計量學計算,反映出不同種類樣品間的差別,由于同類物質在該多維空間聚集于相近的位置,從而對樣品進行分類。
1.3判別分析(discriminantanalysis,DA)判別分析是判別樣品所屬類型的一種統計方法,是在已知研究對象分成若干類型(或組別)并已取得各種類型的一批已知樣品的觀測量數據的基礎上,根據某些準則建立判別式,然后對未知類型的樣品進行判別分析。
1.4人工神經網絡(artificialneuralnetwork,ANN)人工神經網絡又稱神經網絡,是通過對已知類別的訓練集的擬合,來建立識別模型對未知樣本進行分類和預測。人工神經網絡的算法就是給網絡各種訓練樣本,把網絡的實際輸出和正確的目標值相比較,然后根據偏差的情況修改各節點的連接權重,網絡不斷朝誤差減小的方向進行變化,直到輸出值與正確的目標值的偏差滿足工作所需要的精度。經過訓練的網絡把系統規則、預測能力、變量轉化等都以權值的形式隱含在網絡之上,然后向輸入層輸入信息,即可給出結果。它的學習算法稱為誤差反傳學習算法(backpropagationoferror,簡稱BP算法),這種網絡也稱為BP網絡。植物油脂的組成和含量信息復雜,難以用解析式表達,選用BP法校正則較為有效。
1.5SIMCA(softindependentmodelingofclassana-logy)SIMCA是一種有監督模式的識別方法,是一種二值判定方法。先對訓練集中每一類樣本的量測數據矩陣分別進行主成分分析,建立每一類主成分分析數學模型,然后在此基礎上對未知樣本進行分類。基于每一個類別訓練集的主成分分析建立的模型,計算未知樣本點與培訓集的主成分分析模型的距離,根據距離判別方法判別未知樣本的類別。
隨著糧油及其制品中研究因素的不斷增多,種類識別和摻偽分析趨于復雜,而化學計量學的應用為糧油種類的識別和摻偽分析提供了更簡單、更科學的數據處理方法。
2.計量學方法在油脂識別分析中的應用
油脂是一種復雜的混合物,其中含有的甾醇、維生素、胡蘿卜素等物質,可能對紅外光譜產生干擾,給解析譜圖增加了難度;甘三酯的立體結構的差異也會給紅外光譜的分析帶來一定的難度。用一種光譜分析法并不能完全地對各類油脂進行識別,需要將多種分析方法相結合。因此,不僅僅只根據單一的紅外圖譜來對油脂進行識別,而是將光譜法和計量學的方法相結合來對不同種類的油脂進行分析。
2.1計量學方法與紅外光譜法結合識別分析油脂Jefferson等人將偏最小二乘法(PLS)與人工神經網絡技術相結合,建立分析模型,對FTIR-ATR轉換及FT-NIR紅外光譜信息進行了分析處理,用于生物柴油混合物中甲酯含量的測定,研究結果表明所建模型的精確度高,分析結果理想。Vlachos等人將紅外光譜法與計算機軟件技術相結合,對摻有玉米油及芝麻油的橄欖油樣品進行了測定,通過紅外光譜3009cm-1處吸收峰的變化情況,分析出了理想的識別結果。Mossoba等人采用紅外光譜法,將植物油的紅外光譜進行二階導數運算后,選取導數光譜中966cm-1處的特征峰進行分析,檢測出了用氣相色譜沒能檢測出的飽和脂肪酸中的微量反式酸。Woodcock等[15]人采集了913個樣品的近紅外光譜圖,對光譜進行一階導數處理,結合主成分分析和偏最小二乘法建立了最好的識別模型,可以92.8%和81.5%識別利古里亞和非利古里亞橄欖油。Galtier等人應用偏最小二乘法分析125個橄欖油樣品的NIR光譜,區分法國橄欖油的產地及組成,得到滿意的結果,并表明此方法優于傳統的GC或HPLC方法。
zdemr等人用NIR光譜法檢測26個摻有葵花籽油和玉米油的橄欖油(摻偽體積分數4%~96%),多元校正模型通過遺傳反轉最小二乘法(GILS)建立,結果顯示,能夠識別橄欖油和葵花籽油的二重混合油預測值的平均標準誤差在2.49%~2.88%,橄欖油、葵花籽油和玉米油的三重混合油在1.42%~6.38%。Gurdeniz等人用主成分分析和偏最小二乘法分析紅外光譜檢測摻偽的橄欖油,主成分分析是通過小波壓縮進行降維,摻有玉米油和葵花籽油的橄欖油的檢出限為5%;通過直角信號正交(OSC)和小波壓縮處理光譜數據后進行偏最小二乘法分析,預測摻有玉米油-葵花籽油、棉籽油和菜籽油的橄欖油的誤差限分別為1.04、1.4和1.32;此外,經過建立的主成分分析模型和偏最小二乘法判別分析(PLS-DA)對不同類型的摻偽油脂,得到最低檢出限為10%。
Marini等人運用NIR結合化學計量學方法識別不同種類的橄欖油,最理想的模型中驗證Q2達到0.91~0.96,且平均預測誤差為5%~715%。Chen等人應用近紅外光譜技術結合遺傳算法完全正確分類不同來源的橄欖油,建立三層神經網絡模型可以100%識別30個未知橄欖油,提供了一個新識別油脂的方法。意大利Monica等人采集了195個利古里亞特級初榨橄欖油的近紅外光譜法,采用了位函數技術、SIMCA、二次不等判別分析和多元歸類建模技術對樣品進行識別分析,結果顯示,利古里亞橄欖油可以與其他油脂清晰的區分,并且應用多元歸類建模技術建立的橄欖油分類模型有很好的預測能力、高靈敏度和充足的特異性,結果指出NIR結合化學計量學方法對于檢測橄欖油是很好的方法。
2.2計量學方法與色譜法結合識別分析油脂
目前已經有化學計量學方法結合氣相色譜法在油脂識別分析中的報道。Rezanka等人用毛細管氣相色譜法測定了摩洛哥堅果油和其他植物油的脂肪酸含量和植物油中甘三酯的種類及含量,運用SPSS8.0.1統計學分析軟件的歐式距離和平方歐式距離的方法識別摩洛哥堅果油的摻偽,表明系統聚類分析能清楚地區別不同的植物油。Doutoglou等人用氣相色譜法提取了橄欖油和其他植物油的全部脂肪酸信息和1,3位脂肪酸信息,采用主成分分析的方法,建立了一種用于識別橄欖油摻偽的方法。研究表明,主成分分析三維圖用于識別橄欖油和其他植物油是可行的。Lee等[24]人用氣相色譜法測定了芝麻油、紫蘇油、大豆油、玉米油、卡諾拉油、菜籽油、橄欖油和椰子油中的脂肪酸和三酰甘油,并測定了摻有不同比例大豆油的芝麻油的脂肪酸組成和含量,以棕櫚酸、硬脂酸、油酸、亞油酸和亞麻酸的含量作為特征參數,運用主成分分析和判別分析的方法,完成了芝麻油真偽識別。
Voncina等人用氣相色譜測定植物油中的脂肪酸種類和含量,以棕櫚酸、硬脂酸、油酸、亞油酸、亞麻酸、花生酸和花生烯酸的含量作為特征參數,用主成分分析和基于神經網絡的聚類分析實現了植物油的分類,交互驗證準確率為95%,線性判別分析的判別準確率為96.84%,表明了氣相色譜技術結合化學計量學方法分析識別油脂是可行的。Hajimahmoodi等人用氣相色譜脂肪酸指紋圖譜法結合統計學中的最小二乘法模型,對含有棉籽油、橄欖油、大豆油、葵花籽油這4種植物油的混合油進行了同時測定,建立校正模型,測定結果的相對標準偏差低于10%。
結果表明,這種方法能用于識別這4種油的可能的摻偽。國內也有用氣相色譜法結合化學計量學方法的報道,馬亭等人根據食用油中脂肪酸、甾醇以及生育酚含量,應用校正轉換矩陣法對花生油摻偽進行了定量檢測,結果令人滿意。何小青等人建立了微波輔助衍生化GC-MS測定植物油中的脂肪酸含量,使用校正變換矩陣法對食用植物油的成分進行測定,可用于快速、準確測定食用油中各成分含量或定性、定量識別摻偽成分。化學計量學方法結合氣相色譜的方法在油脂識別分析方面有很大的優勢,是目前油脂識別分析方面發展的趨勢。但這方面的研究目前還處在起步階段,只是針對一種植物油脂的識別分析,還需要加大可靠樣品的分析,增加油脂樣品的品種,對其進行進一步深入的研究。化學計量學方法結合高效液相色譜對植物油脂進行識別分析的報道比較少,主要是測定各種甘三酯含量,然后結合化學計量學的方法對油脂進行識別分析。
3結束語
由于天然植物油脂是復雜的有機化合物,而不同的植物油脂組成的差異是多變量,傳統的數據分析方法很難用系統的方法表征多種油脂之間的差異,而化學計量學與計算機結合,通過數學計算達到了識別的目的,使得長期困擾學者的混合物波譜同時識別成為可能,不僅體現了綠色分析的優勢,而且拓寬了油脂識別分析思路。隨著各學科的發展,可以預期,化學計量學在油脂分析中的應用也將繼續得到更蓬勃的發展。