基于因子分析和Bayers判别的烤烟香型分类模型构建与验证

http://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-1-l.jpghttp://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-2-l.jpghttp://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-3-l.jpghttp://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-4-l.jpghttp://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-5-l.jpghttp://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-6-l.jpghttp://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-7-l.jpghttp://img1.qikan.com.cn/qkimages/yckx/yckx201603/yckx20160313-8-l.jpg
  摘要:为研究烤烟化学组成与其香型间的关系,通过抽样法收集了2011-2013年国内15省71市(县)500个烟叶样品。参照行业及文献相关标准测定影响其品质的114种化学指标,对各指标采用MFA(因子分析)降维处理,因子得分构建Bayes香型定量判别模型并验证。结果表明,原始指标可提出22个公因子,其对原变量的总方差解释率为80.459%;巨豆三烯酮(A、c)、His、假木贼碱、总细胞壁物质等是烟叶中普遍存在且能较好代表其品质特征的物质;定量判别模型能依据不饱合醛酮、氨基酸、碱、细胞壁物质等类物质的含量对烟叶样品香型进行较好的预测,回判及预测正确率I>83.3%。该判别模型使用简便、迅速,能简化烟叶香型的判别流程,快速和客观的评价烟叶品质。
  关键词:烤烟;化学组成;因子分析;判别分析
  中图分类号:TS41+1
  文章编号:1007-5119(2016)03-0072-07 DOI:10.1349 6/j.issn.1007-5119.2016.03.013
  烤烟烟叶根据其燃烧时所产生的香气风格可划分为清香、中间香和浓香型3个类别。烟叶香型很大程度上决定着不同卷烟的感官风格特征,是维护卷烟感官质量稳定的重要因素,也是工业生产与配方选用的要素之一。不同产地的烟叶通常具有各自独特的香型,烟叶香型往往受其化学成分所影响,所以,对不同香型烟叶的化学组成测定及特征剖析一直以来都是科技工作者的研究热点。目前,关于烤烟香型与其影响因素之间关系的研究报道较多,研究内容大多集中于不同香型烟叶的化学组成差异,以及不同部位烟叶特征与化学成分的相互关系。关于烤烟香型化学组成评价的相关情况虽有一定报道,但存在所采集的样本数量不足,分析方法片面单一,未验证数理模型的适用性,研究不够深入等问题。对于香型的定量判别模型研究则尚未见报道。所以,笔者基于MFA(因子分析)模型判定并筛选适合的变量,并与多种统计方法联用,对不同类型烟叶香型进行评价,为不同香型烤烟选择性育种及卷烟配方设计选用提供理论依据。
  1.材料与方法
  1.1材料
  采用经典抽样方法,从国内15个省份71市(县)采集2011-2013年的烤烟烟叶样品,总计500个样品。其中,2011年采集样品数为137个,2012年采集样品数为169个,2013年采集样品数为194个,根据其不同的香型风格特征经过感官评吸判断可划分为:清香型烤烟烟叶样品161个,中间香型烤烟烟叶样品168个,浓香型烤烟烟叶样品172个,所有香型烟叶均分别采集上、中和下部烟叶。具体见表1。
  1.2方法
  1.2.1烤烟化学成分检测方法主要对3种不同香型烤烟中16种常规化学成分(氯、钾、总氮、总植物碱、总糖、还原糖、纤维素、葡萄糖、果糖、蔗糖、石油醚提取物、挥发碱、挥发酸、硝酸根、硫酸根、磷酸根);8种金属元素(铁、锰、铜、锌、硼、钙、镁和钠);3种多酚(绿原酸、莨菪亭和芸香苷);8种有机酸(草酸、丙二酸、苹果酸、棕榈酸、硬脂酸、柠檬酸、亚油酸、亚麻酸);20种氨基酸;45种中性致香成分(例如β-大马酮、香叶基丙酮、β-紫罗兰酮、降茄二酮、巨豆三烯酮4种立体异构体、二氢猕猴桃内酯等;胡萝卜素与叶黄素;6种生物碱(烟碱、降烟碱、麦斯明、假木贼碱、新烟草碱、2,3-联吡啶);以及6种细胞壁物质(总细胞壁物质、果胶、木质素、全纤维素、α-纤维素、半纤维素)共计114种指标根据现行相关的行业标准及文献方法进行定量检测。
  1.2.2统计方法采用SPSS 22.0统计学软件(SPSS Inc.)的数据处理模块对不同烟叶样品各化学指标及其与香型的关系进行分析。采用因子分析(MFA)和Bayes判别分析方法来探索不同烟叶样品香型的物质基础。
  2.结果
  2.1不同香型烟叶各指标的因子分析(MFA)
  对不同烟叶样本进行MFA分析,由于各指标间量纲及数值差异较大,所以从相关阵出发,采用主成分提取方法,并进行最大方差法旋转,迭代29次收敛。对取样足够度进行Kaiser-Meyer-Olkin及Bartlett检验,如表2可知,KMO=0.885>>0.5,且Bartlett sig.<0.0001,呈1%以下显著性水平,说明样本非常适于进行因子分析。114个指标共可提取22个共同因子,其所能解释原指标的累积方差贡献率为80.459%。
  通过因子得分系数矩阵可列出不同烟叶各原始指标通过线性组合而成的22个公因子的表达式,如公式(1),公式中Xi为样本中各指标变量的标准化值,yi为因子的得分系数,Fi为各因子的因子得分,i的取值范围均为(1,114)。据公式计算各样本的因子得分,并保存为新变量Fi,j=1~22,可以用来代表原指标衡量烟叶的化学组成和品质特征。
  采用因子旋转方法(最大方差法)来对22个公因子的实际意义进行解释,如表3,以方差解释率最高的前10个公因子为例来说明相应因子的实际意义。由于每个因子所拟合的原变量数较多(114个指标),所以在旋转载荷阵中,对10个公因子的载荷均小于0.695的指标予以省略,表明公因子对这部分指标的解释力较弱。公因子对原始指标的解释能力各不相同。例如,对于因子1.糠醛、苯甲醛、苯乙醛、异佛尔酮、氧化异佛尔酮、藏花醛、B.大马酮、5,6-环氧-β-紫罗兰酮、二氢猕猴桃内酯、巨豆三烯酮的四个异构体(A、B、c、D)的载荷均>0.803,其中,异佛尔酮、氧化异佛尔酮、藏花醛、β-大马酮和二氢猕猴桃内酯的载荷均>0.900,说明因子1对于含有环酮,烯酮,烯醛结构的化合物的解释能力很强,可命名为“酮醛因子”;对于因子2,Asn、His、Gin、GABA、Phe、Trp的载荷均>0.850,说明因子2对于酰胺类、芳香类、碱性氨基酸类物质的解释能力很强,可以命名为“氨基酸因子”。以此类推,4-10号公因子分别能对应解释环柠檬醛、碱、细胞壁、还原糖、多环酮、氯、呋喃酮和锌类物质,可命名为各自相应的因子。