甘薯[Ipomoea batatas ( L. ) Lam]是典型的地下块根淀粉类作物,淀粉与糖类化合物含量占其块根干重 80%以上,是世界上重要的粮食、饲料和工业原料。2010 年中国甘薯种植面积约 4. 6 ×106hm2,约占世界甘薯种植面积的 50%,年产量约1. 0 × 108t,占世界甘薯总产量的 75. 3%[1-4]。近年来甘薯作为能源作物倍受关注,生产中其淀粉及糖类化合物含量对其酒精发酵效率、产率以及工艺有较大影响[5]。常规化学方法测定淀粉和糖类化合物含量不仅耗时耗力、实验结果误差大,而且产生的废液、废气等污染物也不符合“低碳科研”的要求,科研发展与社会进步需求一种技术或手段来弥补不足。
现代近红外光谱分析是利用化学物质在 NIR光谱区内的光学特性,快速测定样品中一种或多种化学成分含量和特性的新物理测定技术[6],具有样品用量少,样品无损失,分析速度快,同时测定多指标,无废物污染以及成本低、利用率高等常规法无法比拟的优点。该技术在农业领域中已较成熟地应用于水稻、小麦、玉米、油料作物、水果和大豆上[7-13]。
NIRS 法在甘薯上的应用李良等报道较早[14],Koji Ishiguro、Katayama K 等[15-16]、国际马铃薯中心Zum Felde Thomas 等[17]以及 Lu[18]等都做了大量探索性与开创性工作,认为 NIRS 技术在甘薯领域的发展有良好趋势与前景。但目前在中国甘薯领域应用还存在不少问题,如缺少组分含量变异范围大的建模样品,缺乏较好的化学分析知识和实验条件,所构建的模型实际适用性差、测定指标少、利用率低;或校正模型得不到及时维护和完善,不能适应甘薯科研的需要等。
针对目前 NIRS 技术在中国甘薯科研和生产应用中获得稳定、可靠的分析模型较少的现状,本研究以国家甘薯资源材料库为依托,筛选 248 份不同类型甘薯块根样品为定标与验证样品材料,确定样品光谱收集方法,获取有效的甘薯近红外光谱信息,并运用各种光谱数据预处理技术和统计方法进行校正与验证,确定各参数的最佳优化设置,初步建立甘薯淀粉及其糖类化合物含量预测模型,为进一步建立其他重要品质性状指标模型提供基础,以期为中国甘薯育种及资源品质改良研究提供高效、准确和快速的分析方法。
1、材料与方法
1. 1、材料
从江苏省徐州市国家甘薯种质资源库筛选遗传背景、生物性状与区域来源不同的定标样品 218 份,验证样品 30 份,主要包括国家审( 鉴) 定品种、国家区试材料、鉴定圃材料以及来自国际马铃薯中心等的引进材料。每份材料挑选大小均匀,无病虫害薯块,清洗、风干、去皮、切细条、分装,于 - 50 ℃ 真空冷冻干燥 72 h,通过 FOSS CT410 旋风磨粉机高速粉碎,过 80 目筛,密封保存备用。
1. 2、淀粉及糖含量常规测定
淀粉测定: 参照 McCleary 等酶法[19],略改,试剂盒购自 Megazyme 公司,每样品重复测定3 次。蔗糖、葡萄糖和果糖测定: 参照 GB/T 22221———2008食品中果糖、葡萄糖、蔗糖高效液相色谱法测定。
1. 3、光谱采集与预处理
本研究采用 VECTOR22/N 型傅立叶变换近红外反射光谱仪( 德国 BRUKER 光谱仪器公司制) 采集光谱。为保证仪器的稳定和采集光谱信息的准确,提高检测限,控制好信噪比,提高并稳定样品谱带信号强度,保持室内温度( 25 ± 1) ℃,湿度 50%左右。测量前仪器预热 30 min,仪器测试( 如峰和扩大信号等) 通过后,对背景进行扫描。通过不同样品量、扫描次数等对照,选择厚度约 5 mm 样品( 5g 左右) 盛于直径 50 mm 的旋转样品容器,扫描 64次,3 个重复。为保证测量环境和人工操作的一致性,光谱采集过程中每 30 个样品进行一次背景扫描以消除漂移。
为提高光谱质量与真实性,减少因仪器、环境、样品不均匀以及人工操作等造成的误差,利用配套软件采取移动、平均、平滑、数据筛选等对原始光谱进行预处理,选择常数偏移消除、矢量归一化、一阶导数、二阶导数、直线差值以及一阶导数 + 矢量归一化、一阶导数 + 直线差值等方法在光谱区范围优化光谱数据,以提高光谱质量; 选择偏最小二乘法( PLS) 作为建立数学模型的统计学方法。
1. 4、模型建立、校正与评价
光谱信息经适当处理后,建立与给定组分含量或特性之间相关关系,即为模型,利用 OPTIMIZE 程序自动优化处理,选择最佳建模条件,找出最佳主变数,程序中同时设置交叉检验,除去异常样品,得出最佳变量数; 以校正决定系数 R2cal、校正均方差( RM-SEE) 、主变数、交叉检验标准误 ( RMSECV) 和交叉检验决定系数( R2CV) 对近红外光谱模型的稳定性、准确性和可靠性进行数学评价; 同时也通过分析与验证样品集数据相关性评价其可靠性。
2、结果与分析
2. 1、常规化学分析
定标样品化学值的准确性决定数学模型的可靠性和准确性,含量的范围也决定模型适用性的好坏。筛选的218 份甘薯块根样品( 干基) 淀粉含量、糖类化合物含量如表1 所示,218 份样品所测指标差异很大,淀粉与糖类化合物含量呈极端值的样品数较少。对照国家甘薯资源库数据,样品中淀粉与糖类化合物含量范围基本代表了国内当前甘薯品种的情况。
表 1 校正与验证样品品质指标概况
2. 2、甘薯块根的 NIRS 分析
在 4 000 ~10 000 cm- 1谱区内,甘薯块根干粉近红外反射光谱曲线各区段表现出独特吸收特征( 图 1) ,这为块根干粉淀粉与糖类化合物含量的定量分析提供了丰富的信息基础。由图 1 可见,218份甘薯块根干粉在近红外光谱区吸收光谱特征基本一致,表明样品组分类别的相似性; 同时,由于样品的化学成分含量不完全相同,因此样品的吸收光谱也不完全重合,这为预测组分含量提供了可能。
2. 3、光谱的预处理、优化及模型的构建
淀粉吸收光谱以一阶导数和矢量归一法预处理最佳,获得1 个最佳光谱区,其他糖类光谱以一阶导数法处理最佳,各有两个理想谱区。用偏最小二乘法( PLS) 通过计算机自动回归分析,建立定标样品特定波长下的光谱数据与其已知化学测值间的相关关系( 表2) ,建立最优光谱与化学成分间关系模型( 图2 ~图5) 。从图2 至图5 可见,样品比较集中地分布在拟合线附近,模型 R2cal和 R2CV都达 0. 990 以上,RMSEE( 0.203 ~0. 431) 与 RMSECV ( 0.224 ~ 0. 489) 的范围较为理想,表明此模型具有较好的适用性。
图 1 甘薯块根干粉 NIRS 光谱图
表 2 甘薯淀粉及糖类物质含量校正模型的优化结果
图 2 甘薯块根淀粉含量化学测定值与模型校正预测值( A) 及化学值与内部交叉检验预测值( B) 的相关性
图 3 甘薯块根蔗糖含量化学测定值与模型校正预测值( A) 及化学值与内部交叉检验预测值( B) 的相关性
图 4 甘薯块根果糖含量化学测定值与模型校正预测值( A) 及化学值与内部交叉检验预测值( B) 的相关性
2. 4、模型可靠性评价与分析
利用建立的预测模型,对 30 个验证样品的组分含量进行预测,获得的预测值与测定值进行相关性分析,部分结果见表 3。结果表明,模型对样品 NIRS 预测值与其相应的化学测定值有较好的相关性,相关系数都达 0. 990 以上,均方差值较小,预测值的误差范围绝大多数小于 5% ,接近或小于常规分析方法的误差范围。以此模型预测甘薯块根淀粉与糖类化合物含量,结果较为准确,可替代常规化学分析方法。
图 5 甘薯块根葡萄糖含量化学值与模型校正预测值( A) 及化学值与内部交叉检验预测值( B) 相关性
表 3 对部分甘薯验证样品的模型可靠性检验
3、讨 论
本研究利用近红外光谱技术筛选了建模的最佳光谱预处理方法、谱区范围和主成分维数,选择偏最小二乘法( PLS) 建立甘薯淀粉及糖类化合物含量近红外光谱分析预测模型,并选择 30 份验证样品对模型预测结果的准确性进行评价,其预测值精度达到与常规法基本一致的水平,同时具有快速、无污染和测试效率高等优点。该技术在育种上的作用尤其明显,能成批筛选每一环节上的育种材料,提高品质鉴定效率,缩小育种规模,缩短育种年限,快速选择优良品系,提高育种效率。
近红外光谱技术是一种间接的定量分析技术,通过建立的预测模型来测定未知样品的成分,模型的质量受样品的代表性、化学分析测试数据以及光谱的准确性影响。本研究选择的样品来自国家甘薯资源库,组分梯度大,代表性强,增强了模型适用性;化学分析测试数据的准确性与可靠性将直接决定建立模型的可靠性与适用性。本研究过程中我们加强了与国际马铃薯中心品质营养分析中心科学家的交流与合作,改进常规测试方法,提高原始数据的准确度,很大程度上提高了模型预测结果准确度,拓宽其应用领域。同时,在光谱采集与预处理过程中,控制试验条件,减少系统误差,增加样品近红外光谱的真实性,提高了光谱模型的预测能力和适用性。中国国内市场上近红外光谱仪在设计和应用上都有差异,导致其自带模型有限的适用性和可转移性,而且,迄今未有一家仪器品牌建立甘薯等块根( 茎) 类作物品质性状预测模型,导致在中国甘薯领域应用NIRS 存在较多问题,如缺乏适用性好、可靠性高的模型,预测模型指标偏少,利用率低,模型未能及时校正和完善。近年我们利用材料资源与平台优势进行了一些研究,逐步建立并完善了适用于科研与生产上应用的甘薯主要品质性状预测模型[20-21]。