一種棉仁粉棉酚含量的近紅外測定方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及了一種農(nóng)副產(chǎn)品含量的測定方法,具體涉及到了一種棉仁粉棉酚含量 的近紅外測定方法,采用近紅外光譜技術(shù)和化學計量學多元校正技術(shù)進行測定。
【背景技術(shù)】
[0002] 棉籽是棉花的主要副產(chǎn)品,用途十分廣泛,其產(chǎn)量約相當于棉纖維產(chǎn)量的1.5倍, 全球年產(chǎn)棉籽量可達2800-3000萬噸,棉籽中富含大量的蛋白質(zhì)(27.83-45.60% )和脂肪 (28.24-44.05%),是潛在的蛋白質(zhì)和食用油資源。中國是世界上最大的棉籽生產(chǎn)國,每年 可生產(chǎn)棉籽800萬噸,可提取的棉籽油148萬噸,棉籽蛋白140萬噸。另外,棉籽蛋白中各氨基 酸含量組成合理,除蛋氨酸含量稍低外,其它7種必需氨基酸含量均豐富。棉籽中還富含多 種具有降血壓、降血脂的不飽和脂肪酸。因此,棉籽是巨大的潛在營養(yǎng)資源,亟待開發(fā)。然 而,由于棉籽中存在色素腺體,其中含有對人畜有毒的棉酚及其衍生物,長期以來,大量棉 籽營養(yǎng)物質(zhì)的綜合利用被嚴重限制。因此,準確測定棉籽中棉酚含量對開發(fā)利用棉籽副產(chǎn) 品和培育棉花新品種具有重要的意義。
[0003] 目前測定棉副產(chǎn)品中的棉酚含量的方法主要有:分光光度法和高效液相色譜法 等。分光光度法測定游離棉酚含量時,所用化學試劑毒性較大、對目標物質(zhì)的選擇性不強, 使與棉酚具有相似化學結(jié)構(gòu)的物質(zhì)同時測定,使得測定結(jié)果偏高,從而限制了這種測定方 法的使用;高效液相色譜法,雖然以其測定準確性高、重現(xiàn)性好等優(yōu)點,廣泛應用于化學物 質(zhì)的分離與測定中,但因其成本較高,操作繁瑣,難以應用于大量樣品的測定。近紅外光譜 (Near Infrared Spectroscopy,NIRS)分析技術(shù)是通過被分析物質(zhì)中的含氫基團如0-!1、〇 H、N-H、S-H等在近紅外區(qū)域表現(xiàn)有特征性的吸收峰,利用化學計量學的方法,對掃描的樣品 光譜和物質(zhì)含量信息進行一系列分析處理,最后完成該樣品有關(guān)成分的定量分析。近年來, 近紅外光譜技術(shù)發(fā)展迅速,在藥物、農(nóng)產(chǎn)品、生物醫(yī)藥和石油化工等眾多領(lǐng)域得到了廣泛的 應用,與其他分析技術(shù)相比,近紅外光譜技術(shù)具有顯著的優(yōu)越性:操作簡單,分析效率高;分 析對象范圍廣;可進行定性和定量分析;無損、綠色、環(huán)保、安全可靠。
[0004] 棉籽中棉酚含量是影響棉籽綜合利用的一個重要指標。按照常規(guī)方法測定棉酚 含量既費時又費力,且需要大量有毒的化學試劑,費用昂貴而且污染環(huán)境,因此,給棉籽營 養(yǎng)評價增加了難度。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是針對現(xiàn)有化學分析技術(shù)中存在的不足,提供了一種棉仁粉棉酚含 量的近紅外測定方法,采用近紅外光譜和化學計量學多元校正方法對棉仁粉中棉酚含量進 行快速測定,有效地解決了上述問題,為棉仁粉中棉酚含量的檢測提供了一種綠色、高效的 分析方法,具有便捷、準確、快速的優(yōu)點。
[0006] 本發(fā)明采用的技術(shù)方案是:
[0007] 1)制備不同年份、不同地區(qū)種植的不同品種的棉仁粉樣本:將棉籽進行預處理,棉 籽(棉花種子)脫絨、剝殼和烘干后,用磨樣機將棉仁磨成粉末,過80目篩,得到棉仁粉樣本;
[0008] 2)利用近紅外光譜儀采集棉仁粉樣本光譜;
[0009] 3)根據(jù)步驟2)中采集到的棉仁粉樣本近紅外光譜數(shù)據(jù),進行光譜預處理,消除非 目標因素的干擾,提高信噪比;
[0010] 4)利用變量選擇方法對步驟3)中的預處理光譜進行變量選擇,消除冗余變量,減 少輸入變量,降低模型復雜程度;
[0011] 5)通過高效液相色譜法(HPLC)測得棉仁粉樣本的棉酚含量,再結(jié)合步驟4)中變量 選擇獲得的近紅外光譜數(shù)據(jù),用多元校正回歸方法建立棉仁粉近紅外光譜數(shù)據(jù)與其棉酚含 量之間的多個近紅外光譜校正模型;
[0012] 6)從中選擇預測相關(guān)系數(shù)(R2)與剩余預測偏差(RPD)值最大且預測均方根誤差 (RMSEP)和交叉驗證均方根誤差(RMSECV)值最小的模型作為最優(yōu)棉籽棉酚含量近紅外校正 豐旲型;
[0013] 7)將待測棉仁粉樣本采用步驟2)所述相同方法采集其近紅外光譜數(shù)據(jù),用上述步 驟所構(gòu)建的最優(yōu)近紅外光譜校正模型檢測待測棉仁粉樣本,得到其棉酚含量。
[0014]所述步驟2)利用近紅外光譜儀采集棉仁粉樣本光譜具體為:將每份樣品經(jīng)四次裝 樣掃描后收集光譜數(shù)據(jù),即每份樣品收集到四份光譜數(shù)據(jù),計算每份樣品四次光譜數(shù)據(jù)的 平均光譜值,并轉(zhuǎn)化為l〇g(l/R),即得到棉仁粉樣本的近紅外吸收光譜;每次裝樣掃描均是 在25±0.5°C溫度條件下,用近紅外光譜儀,在波數(shù)為4000-10000cm- 1近紅外光譜范圍內(nèi),每 隔4CHT1采集反射強度(R),共計1501個光譜點,并重復掃描64次后取平均值。
[0015] 為減小裝樣誤差,進行四次裝樣再掃描獲得平均光譜值。
[0016] 所述每次裝樣掃描的上樣量為2g左右,樣品池為圓柱形,其直徑為lcm,圓柱形高 度為5cm〇
[0017] 所述步驟3)中的預處理采用變量標準化方法、Savitzky-Golay平滑方法和一階微 分法三者相結(jié)合的方法,具體是先利用變量標準化方法來消除棉籽顆粒大小、表面散射和 光程變化對光譜的影響,再通過Savitzky-Golay平滑消除光譜高頻隨機誤差、提高信噪比, 最后采用一階微分法進行光譜基線的偏移。
[0018]所述步驟4)中的變量選擇采用基于蒙特卡羅方法的無信息變量消除方法,用于消 除無效信息,減少模型的輸入變量,降低模型的復雜程度。
[0019]所述步驟7)中的最優(yōu)近紅外光譜校正模型采用基于蒙特卡羅無信息變量消除的 加權(quán)最小二乘支持向量機模型。
[0020] 所述的多元校正回歸方法包括:偏最小二乘法(PLS)、支持向量機(SVM)、最小二乘 支持向量機(LS-SVM)和加權(quán)最小二乘支持向量機(WLS-SVM)。
[0021] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
[0022]本發(fā)明利用Biichi NIR Flex-N500近紅外光譜儀(瑞士步琦公司)采集了棉籽的光 譜圖,研究了棉仁粉中棉酚含量的建模及應用方法,其光譜數(shù)據(jù)更加準確。本發(fā)明利用Β? chi NIR Flex-N500近紅外光譜儀,與現(xiàn)有的近紅外光譜儀相比其分辨率(4CHT1)更高,通過 該光譜儀采集的光譜點數(shù)更多,能更好地采集獲取棉仁粉樣本在近紅外光譜區(qū)的光譜特 征。
[0023]本發(fā)明利用蒙特卡羅無信息變量消除法,對全光譜變量進行的變量選擇,通過對 閥值大小的調(diào)整,得到77個有效變量,大大減少模型的輸入變量,簡化了模型的復雜程度。
[0024] 常規(guī)的LS-SVM算法過于依賴訓練樣本,穩(wěn)健性不足,少量異常樣本的引入就可能 完全破壞模型的預測性能,而本發(fā)明利用加權(quán)最小二乘支持向量機(WLS-SVM)建立了最優(yōu) 棉仁粉棉酚含量近紅外校正模型,WLS-SVM通過在建模過程中檢測并剔除異常樣本提高了 模型的穩(wěn)健性。
[0025] 綜合來說,本發(fā)明測定準確性很高,是一種綠色、高效、準確的測定方法,對于培育 棉花新品種、促進棉副產(chǎn)品的加工利用具有重要意義和價值。
【附圖說明】
[0026] 圖1是本發(fā)明方法中棉仁粉近紅外原始光譜圖。
[0027]圖2是本發(fā)明方法中棉仁粉近紅外預處理光譜圖。
[0028]圖3是本發(fā)明方法中蒙特卡羅無信息變量消除后光譜圖。
【具體實施方式】
[0029]下面結(jié)合附圖和實施例對本發(fā)明做進一步說明。
[0030]本發(fā)明的具體實施例如下:
[0031] 1)將棉籽進行預處理:棉籽脫絨、剝殼和烘干后、用磨樣機把棉仁磨成粉末,過80 目篩,得到棉仁粉樣品;取不同年份、不同生態(tài)區(qū)及不同品種的棉籽為樣本,按上述步驟冷 凍干燥后用磨樣機粉碎得到所述干粉樣本。
[0032] 樣本為2012、2013和2014年全國11個地區(qū)的棉籽,包括浙江杭州、安徽蕪湖、江蘇 鹽城、湖南澧縣等不同生態(tài)種植區(qū),多個品種,共404個棉籽樣本。
[0033] 2)樣本光譜采集
[0034]將棉仁粉樣品裝入樣品池中,每個樣本掃描四次,取光譜平均值。樣本原始光譜 圖,如圖1所示。
[0035]近紅外光譜采集方法:室溫25 ± 0.5°C條件下,用近紅外光譜儀,在波數(shù)為4000-lOOOOcnf1近紅外光譜范圍內(nèi),共計1501個光譜點,每隔4CHT 1采集反射強度(R)。每份樣品在 近紅外光譜儀內(nèi)重復掃描64次,貯存于計算機中