葡萄酒的评价
摘 要
本文分析了葡萄酒质量与酿酒葡萄、葡萄酒的理化指标之间的联系,建立相应的数学模型,对各因素之间的关系作了深入研究。
对于问题1,首先将所给的两组评酒员对红、白葡萄酒的评价结果进行了预处理,然后分别对每一组的所有评酒员对红、白葡萄酒各个样品的总评分取均值,得到两组红、白葡萄酒的综合评价得分。利用数据统计假设检验知识,建立T检验模型,得到两组评酒员对红、白葡萄酒的评价无显著性差异。令外,再将每一个评酒员对所有红、白葡萄酒的总评分取均值,得到两组每一个评酒员对红、白葡萄酒的综合评价得分,然后运用方差分析的方法对两组评价结果的可信度进行论证。经过比较得出,第二组的评分结果比较可信。
对于问题2,对二级指标的舍去和对某些理化指标多次测量的数值取平均值后得到二次数据,将二次数据进行标准化处理后作主成分分析,将主成分分析得到的主要影响因子结合问题1中第二组评酒员对每个样品的综合得分进行聚类分析,据此作出相应的分级,即:红葡萄酒酿酒葡萄可分为三个等级,白葡萄酒酿酒葡萄可分为四个等级。
对于问题3,为了更好的分析酿酒葡萄与葡萄酒的理化指标之间的联系,首先将附件2中的酿酒葡萄和葡萄酒的相对应的理化指标挑选出来并进行了分析,然后运用MATLAB软件计算出葡萄酒和酿酒葡萄相对应物质的理化指标的相关系数,同时作出红、白葡萄的理化指标的走势图。利用灰色关联分析的方法,将求出的理化指标的相关系数和理化指标图相结合来分析说明葡萄酒和酿酒葡萄理化指标之间的联系,进而建立葡萄酒和酿酒葡萄对应的理化指标之间的线性方程。
对于问题4,运用SPSS软件进行多元回归分析,给出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的关系。运用回代检验的方法,将葡萄酒质量与所得非标准化预测值作差值,对结果进行分析发现,可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:T检验 方差分析 主成分分析 聚类分析 多元回归分析
1.问题的重述
1.1背景:
随着经济的发展,葡萄酒已进入人们的日常生活,葡萄酒的质量一般是通过有资质的评酒员进行品评,每个评酒员在对葡萄酒品尝后进行分类指标打分,然后得到其总分,以此确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
1.2问题:
(1)分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2.问题的分析
2.1问题1的分析
附件1中包含两组品酒员评价红葡萄酒与白葡萄酒的数据,要分析两组评酒员的评价结果有无显著性差异,需要比较两组品酒员对红葡萄酒的评价结果及对白葡萄酒的评价结果。由于数据表中未给出品酒员对每个酒种的具体评价结果,可以得到每个品酒员对某一酒种的各项指标相加得到总分,再将全组品酒员对此酒种的总分进行平均,分别得到27种红葡萄酒的综合得分,再用同样的方法得到另一组评酒员对27组红葡萄酒的综合得分。同步处理白葡萄酒的相关数据。以此通过均值运用T检验来检测两组品酒员评价结果是否有无显
著性差异,运用方差分析来确定那一组结果更可信。
2.2问题2的分析
由于同一样品的葡萄酒的一种理化指标有多个,一级理化指标包含多个数据,因此可以将同一理化指标有多个数据的进行均值处理,将二级理化指标舍去,简单处理后得到二次数据,以后的步骤均在二次数据的基础上进行。要通过酿酒葡萄的理化指标和葡萄酒的质量对葡萄进行分级,由于分类情况未知,所以选择聚类分析来分类。运用聚类分析可将含量相近的葡萄归为一类。由于原始数据量较大,且多个变量之间具有一定的相关性,对数据结构不能做出明确分类,所以需要对数据进行降维处理。主成分分析法是以最少的信息丢失将众多原有变量浓缩成少数几个因子来实现酿酒葡萄的理化指标数据的简单化。并且原始数据指标变量的量纲不同,为了使这些数据能够放在一起加以比较,需要对原始数据标准化处理,以便于主成分分析。
2.3问题3的分析
要分析酿酒葡萄与葡萄酒的理化指标之间的关系,需要将酿酒葡萄与葡萄酒相对应的理化指标放在一起比较。运用相关系数反映酿酒葡萄和葡萄酒的理化指标之间的关联程度。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。再选出相关系数矩阵中相关系数大于0.8的理化指标,作出他们之间的走势图,观察他们的变化关系。
2.4问题4的分析
要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,即分析葡萄酒质量随酿酒葡萄和葡萄酒的理化指标的变化而变化的规律。考虑到葡萄酒质量
受多个酿酒葡萄和葡萄酒的理化指标的影响。建立多元回归分析模型然后计算出葡萄酒质量与“非标准化预测值”的差值,可以把绝对差值大于0.8视为不符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。将绝对差值小于0.8视为符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
3.模型的假设与符号说明
3.1模型的假设
(1)所有数据完全真实可靠。
(2)酿酒方式及酿酒过程对葡萄酒的质量无影响。
(3)评酒员的嗜好、习惯、情绪、经验等因素对葡萄酒的评分无影响。
(4)评酒员葡萄酒的评分分数具有较高的准确性和公正性
3.2符号的说明
m 红葡萄酒
n 白葡萄酒
mi 红葡萄酒的第i种样品
ni 白葡萄酒的第i种样品
p 评分分数
p1mi 第一组每个评酒员对第i种红葡萄酒的评分分数
p2mi 第二组每个评酒员对第i种红葡萄酒的评分分数
p1ni 第一组每个评酒员对第i种白葡萄酒的评分分数
p2ni 第二组每个评酒员对第i种白葡萄酒的评分分数
p1mi 第一组所有评酒员对第i种红葡萄酒的平均评分分数
p2mi 第二组所有评酒员对第i种红葡萄酒的平均评分分数
p1ni 第一组所有评酒员对第i种白葡萄酒的平均评分分数
p2ni 第二组所有评酒员对第i种白葡萄酒的平均评分分数
p1m 第一组某个品酒员对所有红葡萄酒的平均评分分数
p2m 第二组某个品酒员对所有红葡萄酒的平均评分分数
p1n 第一组某个品酒员对所有白葡萄酒的平均评分分数
p2n 第二组某个品酒员对所有白葡萄酒的平均评分分数
4.模型的建立与求解
4.1问题1的模型建立与求解
在对附件1的数据,我们将每个品酒员对每种酒中的分类指标相加得到每个品酒员对每个酒中的综合得分,得到四组数据:第一组每个品酒员对每种红葡萄酒评分分数p1mi,第一组每个品酒员对每种白葡萄酒评分分数p1ni,第二组
每个品酒员对每种红葡萄酒评分分数p2mi,第二组每个品酒员对每种白葡萄酒
评分分数p2ni。然后再对每一组数据的横向与纵向求平均值,分别得到某组所
有评酒员对第i种红白葡萄酒的平均评分分数与某个品酒员对所有红或白葡萄酒的平均评分分数。(见附录1)
下面我们分别对红葡萄酒和白葡萄酒进行分析。对处理后的两组红葡萄酒综合评分数据p1mi,p2mi运用MATLAB软件作出概率密度函数图形(如图1):
Normal Probability Plot
ProbabilityData
图1 红葡萄酒评分数据概率分布
由图1可知,红葡萄酒评分数据概率分布呈直线型,所以可认为此两组数据近似服从正态分布。
用同样的方法对两组白葡萄酒综合评分数据p1ni ,p2ni做出概率密度函数
图形(如图2):
Normal Probability Plot
ProbabilityData
图2 白葡萄酒评分数据概率分布
可以看出这两组数据同样近似服从正态分布。
对这两对服从正态分布的数据进行假设性检验,假设两组评酒员分别对红白葡萄酒的每种样品的综合平均得分相同,通过MATLAB软件进行T检验分别得出如下返回值:
h = 0 sig = 0.1183 ci =[-0.6735 5.7846]
h = 0 sig =0.0536 ci =[-4.5795 0.0366]
结果检验:两组数据的h均为0,表示不可以拒绝假设,说明提出的假设两组品酒员分别对红白葡萄酒的每种样品的综合平均得分相同。所以,两组品酒员的评价结果无显著性差异。
图3和图4是两组品酒员对红白葡萄酒每个样品的综合平均得分散点图形:
图3 红葡萄酒综合平均得分
图4 白葡萄酒综合平均得分
由图3,图4可以看出两组数据变化波动基本相同,结合上面检验结果,我们可以得到:两组品酒员的评价结果无显著性差异。
通过两组品酒员对所有红酒综合平均得分数据分别得出两组品酒员对红葡萄酒品评结果的方差,同样方法同步白葡萄酒数据,得出以下结果(表1):
表1数据明显显示出第二组品酒员评分方差小于第一组,即第二组品酒员总评分波动性较小,说明第二组品酒员评分结果比较可信。
4.2问题2的模型建立与求解
在经过对二级指标舍去,多次理化指标求平均值后得到二次数据。因为二次数据指标变量的量纲不同或数量级相差很大,为了使这些数据能放在一起比较,需要进行数据标准化处理,选择zscores即标准化变换的方法通过SPSS软件实现对数据的标准化,因为变换后数据的均值为0,标准差为1,消除了量纲的影响,当抽样样本改变时仍能保持其稳定性。但二次数据标准化后酿酒葡萄的理化指标仍然很多,无疑会增加分析问题的难度与复杂性。而且每个指标都在不同程度上反映了所研究问题的信息,并且各个指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。为了将许多相关性很高的变量转化成个数较少、能解释大部分原始数据方差且彼此互相独立的几个新变量,我们对原始数据进行了主成分分析(通过SPSS软件实现)。 表2为红葡萄酒酿酒葡萄主成分分析结果:
表2 红葡萄酒酿酒葡萄主成分
提取主成分(因子)的方法:根据特征根的数值(Total),系统默认的是1。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1,则所有方差大于等于1的主成分将被保留,其余舍弃。经过取舍得到八个主要影响红葡萄酒的酿酒葡萄理化指标的主要影响因子:氨基酸总量,蛋白质,VC含量,花色甘鲜重,酒石酸,苹果酸,柠檬酸,多酚氧化酶活力,(见附录2)。
用同样的方法对白葡萄酒酿酒葡萄理化指标做主成分分析,得到得到九个主要影响白葡萄酒的酿酒葡萄理化指标的主要影响因子:氨基酸总量,蛋白质,VC含量,花色甘鲜重,酒石酸,苹果酸,柠檬酸,多酚氧化酶活力,褐变度,
(见附录2)。
用经过主成分分析得到综合影响理化指标结合葡萄酒的质量对其分级。葡萄酒的质量是根据问题一所有评酒员对每个样品的得分之和来得到,由于问题一得出第二组的品酒员比较可靠,所以作为衡量葡萄酒质量的标准。用综合理化指标及葡萄酒的质量作为影响因素在SPSS软件中实现系统聚类分析,两种葡萄酒酿酒葡萄聚类图分别如图5、图6所示:
图5 红葡萄酒酿酒葡萄聚类图
图6 白葡萄酒酿酒葡萄聚类图
由图5,图6可以看出,红葡萄酒可分为三个等级,白葡萄酒可分为四个等级(表3):
表3 葡萄酒等级划分
4.3问题3的模型建立与求解
由于酿酒葡萄和葡萄酒的理化指标不同,所以首先挑选出了他们含有相同的理化指标,对于红酿酒葡萄和红葡萄酒共有9对,而对于白酿酒葡萄和白葡萄酒共有8对。通过对这些理化指标的分析,首先利用MATLAB软件中corrcoef程序语句,对每一个对应的理化指标所构成的两列数据进行计算,得出他们之间的相关系数,结果如下:
对于红酿酒葡萄和红葡萄酒中对应的理化指标: (1)花色苷的相关系数
ans = 1.0000 0.9226 b = 14.3347 0.9226 1.0000 2.3683 因为相关系数是0.9226(大于0.8),所以他们之间存在很强的相关性,由此得出线性方程为:
y14.33472.3683x
然后在MATLAB中作出了花色苷这一理化指标在各个样品酒中的走势图如下:
[***********][1**********]00
图7
采用灰色关联度法同时结合相关系数,说明了红酿酒葡萄和红葡萄酒的花色苷的理化指标有很强的相关性,即红酿酒葡萄的花色苷这一理化指标在很大程度上影响着红葡萄酒的花色苷这个理化指标。 (2)单宁的相关系数 ans = 1.0000 0.7180 0.7180 1.0000
因为相关系数是0.7180(小于0.8),所以他们之间的相关性并不显著。 然后在MATLAB中作出了单宁这一理化指标在各个样品酒中的走势图如下:
图8
由图8,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的单宁这一理化指标之间没有很强的联系。 (3)总酚的相关系数
ans = 1.0000 0.8752 b = 1.3620 0.8752 1.0000 0.3333
因为相关系数是0.8752(大于0.8),所以他们之间存在很强的相关性,由此我们得出线性方程为:
y1.36200.3333x
然后在MATLAB中作出了总酚这一理化指标在各个样品酒中的走势图如下:
图9
采用灰色关联度法同时结合相关系数,说明了红酿酒葡萄和红葡萄酒的总酚的理化指标有很强的相关性,即红酿酒葡萄的总酚这一理化指标在很大程度上影响着红葡萄酒的总酚这个理化指标。 (4)酒总黄酮的相关系数
ans = 1.0000 0.8228 b = 0.7626 0.8228 1.0000 0.5032
因为相关系数是0.8228(大于0.8),所以他们之间存在很强的相关性,由此我们得出线性方程为:
y0.76260.5032x
然后在MATLAB中作出了黄酮这一理化指标在各个样品酒中的走势图如下:
25
20
15
10
5
图10
采用灰色关联度法同时结合相关系数,说明了红酿酒葡萄和红葡萄酒的黄酮的理化指标有很强的相关性,即红酿酒葡萄的黄酮这一理化指标在很大程度上影响着红葡萄酒的黄酮这个理化指标。 (5)白藜芦醇的相关系数
ans = 1.0000 0.0135
0.0135 1.0000
因为相关系数是0.0135(远小于0.8),所以他们之间几乎没有相关性。 然后在MATLAB中作出了白藜芦醇这一理化指标在各个样品酒中的走势图如下:
30
25
20
15
10
5
图11
由图11,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的白藜芦醇这一理化指标之间没有很强的联系。 (6)DPPH半抑制体积的相关系数 ans = 1.0000 0.7778 0.7778 1.0000
因为相关系数是0.7778(小于0.8),所以他们之间不存在显著的相关性。 然后在MATLAB中作出了DPPH半抑制这一理化指标在各个样品酒中的走势图如下:
图12
由图12,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的DPPH半抑制体积这一理化指标之间没有很强的联系。 (7)色泽的相关系数 色泽L*(D65)的理化指标 ans = 1.0000 0.4937 0.4937 1.0000
因为相关系数是0.4937(小于0.5),所以他们之间几乎不存在相关性。 然后在MATLAB软件中作出了色泽L*(D65)这一理化指标在各个样品酒中的走势图如下:
图13
由图13,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的色泽L*(D65)这一理化指标之间没有很强的联系。
色泽a*(D65)的理化指标 ans = 1.0000 -0.5420 -0.5420 1.0000
因为相关系数是-0.5420(绝对值大于0.5),所以他们之间相关性不强。 然后在MATLAB中作出了色泽a*(D65)这一理化指标在各个样品酒中的走势图如下:
70
60
50
40
30
20
10
图14
由图14,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的色泽a*(D65)这一理化指标之间没有很强的联系。 色泽b*(D65)的理化指标
ans = 1.0000 0.0255
0.0255 1.0000
因为相关系数是0.0255(远小于0.5),所以他们之间几乎不存在相关性。 然后在MATLAB中作出了色泽b*(D65)这一理化指标在各个样品酒中的走势图如下:
图15
由图15,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的色泽b*(D65)这一理化指标之间没有很强的联系。
对于白酿酒葡萄和白葡萄酒中对应的理化指标的分析,我们也采用了同样的方法对它的各项理化指标进行了分析得出了图和相关系数(见附录3)。 4.4问题4的模型建立与求解
将附件2与附件3中葡萄和葡萄酒的理化指标(见附录4)整理后作为影响因素,变量葡萄酒的质量是根据第一题第二组所有评酒员对每个样品的得分之和来得到。建立多元回归模型:
yb0b1x1b2x2bkxke
然后在SPSS软件中实现多元回归分析,得出如下结果(其他结果见附录4):
表6 多元回归结果
把表6中“非标准化回归系数”栏目中的“B”列系数代入上式得到回归方程为:
y729.6110.001x10.035x21.393x24,
从方差分析表中得知:F统计量为2.7,显著性概率为为0.225。说明回归较显著。此方程即为酿酒葡萄和白葡萄酒的理化指标与葡萄酒质量的关系。
对红葡萄酒及酿酒葡萄理化指标数据实行同样步骤,得出多元回归方程为:
y37.5820.041x10.010x20.118x16,
从方差分析表中得知:F统计量为3.025,显著性概率为0.039,说明回归效果很显著。此方程即为酿酒葡萄和红葡萄酒的理化指标与葡萄酒质量的关系
将葡萄酒质量“y”与所得结果“非标准化预测值”的作差值,将结果筛选出大于0.8和小于0.8的数据。绝对差值大于0.8视为不符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。绝对差值小于0.8视为符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。然后通过对大于0.8和小于0.8的数据进行统计得出小于0.8的概率较大的结果。所以可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
5.模型的分析与评价
对问题二,在酿酒葡萄多指标的统计分析中,运用降维的思想对指标进行主成分分析法,用新指标样本代替原样本进行统计分析,消除原始变量间存在的共线性,克服由此造成的运算不稳定、矩阵病态等问题,使问题更加简化。 对问题三,在分析联系的过程中,运用相关系数法和灰色关联度分析曲线对酿酒葡萄和葡萄酒的理化指标的相关性进行分析。这样可以明确的得到每个指标的关联程度。在此基础上,又对显著性相关的理化指标进行回归分析,直观显示出酿酒葡萄和葡萄酒的理化指标的的线性接近程度。
对问题四,将酿酒葡萄和葡萄酒的理化指标和葡萄酒质量按一定标准分为多级,用分级尺度代换较大的数字,更能揭示酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的关系,效果比采用数量值统计方法有明显的提高,在实际应用中具有一定的现实意义。
6.模型的推广与应用
通过相关系数和多元回归等方法得出酿酒葡萄和葡萄酒的质量的关系,可以运用到水果的处理或是各种水果成分提取问题的研究,通过酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,在实际工程中可以侧重主要指标的提取,忽略部分指标,实现最大的效益,还可推广到水果质量的评定、水果主成分提取、以及水果各影响指标的标准的评定等问题。
参考文献
[1] 姜启源. 数学模型(第三版)[M]. 北京:高等教育出版社,1999. [2] 韩中庚. 数学建模方法及其应用(第二版)[M]. 北京:高等教育出版社,2009.
[3] 李华,刘署东,王华,张予林.葡萄酒感官评价结果的统计分析方法研究[N].中国食品学报,2006.
[4] 张振强.基于逐步回归分析的财政收入模型研究[J].经济研究导刊.2009,(5):94-96.
[5] 李运,李记明,姜忠军.统计分析在葡萄糖质量评价中的应用[J].酿酒科技,2009,(4):79-82.
[6] 王金甲,尹涛等.基于物理化学性质的葡萄酒质量的可视化评价研究[J].燕山大学学报,2010,34,(2):133-137.
[7] 陈雁, 李栋高. 颜色感觉的评价方法[J]. 纺织学报 , 2005,(02) [8] 许春兰. 因子分析的研究[J]. 内蒙古石油化工 , 2005,(02)
21
附录1
第一问数据处理结果:
22
23
24
检验正态分布概率密度函数图形程序:
x=[82 74.2 85.3 79.4 71 68.4 77.5 71.4 72.9 74.3 72.3 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3 77.9 75.8
75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6]; normplot(x)
假设性T检验程序:
x=[62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9 74.6 73 58.7 74.9 79.3 59.9 78.6 79 77.1 77.2 85.6 78 69.2 73.8 73 ];
y=[68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 8.8 2.6 5.7 69.9 4.5 5.4 2.6 5.8 2.2 1.6 7.1 1.5 8.2 2 1.5; [h,sig,ci] = ttest2(x,y)
x=[82 74.2 85.3 79.4 71 68.4 77.5 71.4 72.9 74.3 72.3 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3];
y=[77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6]; [h,sig,ci] = ttest2(x,y)
附录2
25
26
27
28
氨基酸总
红葡萄样品 量
花色苷鲜
蛋白质 VC含量 重
多酚氧化红葡萄酒
酒石酸 苹果酸 柠檬酸 酶活力
质量
29
30
红葡萄酒聚类分析结果:
提取主成分(因子)的方法:根据特征根的数值,系统默认的是1。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1,则所有方差大于等于1的主成分将被保留,其余舍弃。
白葡萄酒聚类分析结果:
31
32
附录3
附录3图形 图3-1:
987654321白葡萄的葡萄酒和酿酒葡萄单宁的理化指标
图3-2
[**************]白葡萄的葡萄酒和酿酒葡萄总酚的理化指标
图3-3
33
白葡萄的葡萄酒和酿酒葡萄总黄酮的理化指标
[1**********]0
图3-4
白葡萄的葡萄酒和酿酒葡萄白藜芦醇的理化指标
4.543.532.521.510.500
[1**********]
图
3-5
白葡萄的葡萄酒和酿酒葡萄DPPH的理化指标
0.450.40.350.30.250.20.150.10.05
00
[1**********]
图3-6
34
[***********]3020白葡萄的葡萄酒和酿酒葡萄色泽L*(D65)的理化指标
图
3-7
白葡萄的葡萄酒和酿酒葡萄色泽b*(D65)的理化指标
25
20
15
10
5
图3-8
1086420-2-4-6-8白葡萄的葡萄酒和酿酒葡萄色泽a*(D65)的理化指标
附录4
白葡萄酒和酿酒葡萄的理化指标:
35
36
37
红葡萄酒及酿酒葡萄的理化指标:
38
39
40
41
42
红葡萄酒多元回归分析结果:
43
系数
非标准化系数
模型 1
(常量) 蛋白质 花色苷 褐变度 DPPH自由基 总酚 单宁 总黄酮 黄酮醇 果梗比 出汁率 果皮颜色l 果皮颜色a 酒总黄酮
B 标准 误差
标准系数 试用版
t Sig. a
44
酒白藜芦醇 酒DPPH半抑制 酒色泽
a. 因变量: VAR00001
45
葡萄酒的评价
摘 要
本文分析了葡萄酒质量与酿酒葡萄、葡萄酒的理化指标之间的联系,建立相应的数学模型,对各因素之间的关系作了深入研究。
对于问题1,首先将所给的两组评酒员对红、白葡萄酒的评价结果进行了预处理,然后分别对每一组的所有评酒员对红、白葡萄酒各个样品的总评分取均值,得到两组红、白葡萄酒的综合评价得分。利用数据统计假设检验知识,建立T检验模型,得到两组评酒员对红、白葡萄酒的评价无显著性差异。令外,再将每一个评酒员对所有红、白葡萄酒的总评分取均值,得到两组每一个评酒员对红、白葡萄酒的综合评价得分,然后运用方差分析的方法对两组评价结果的可信度进行论证。经过比较得出,第二组的评分结果比较可信。
对于问题2,对二级指标的舍去和对某些理化指标多次测量的数值取平均值后得到二次数据,将二次数据进行标准化处理后作主成分分析,将主成分分析得到的主要影响因子结合问题1中第二组评酒员对每个样品的综合得分进行聚类分析,据此作出相应的分级,即:红葡萄酒酿酒葡萄可分为三个等级,白葡萄酒酿酒葡萄可分为四个等级。
对于问题3,为了更好的分析酿酒葡萄与葡萄酒的理化指标之间的联系,首先将附件2中的酿酒葡萄和葡萄酒的相对应的理化指标挑选出来并进行了分析,然后运用MATLAB软件计算出葡萄酒和酿酒葡萄相对应物质的理化指标的相关系数,同时作出红、白葡萄的理化指标的走势图。利用灰色关联分析的方法,将求出的理化指标的相关系数和理化指标图相结合来分析说明葡萄酒和酿酒葡萄理化指标之间的联系,进而建立葡萄酒和酿酒葡萄对应的理化指标之间的线性方程。
对于问题4,运用SPSS软件进行多元回归分析,给出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的关系。运用回代检验的方法,将葡萄酒质量与所得非标准化预测值作差值,对结果进行分析发现,可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:T检验 方差分析 主成分分析 聚类分析 多元回归分析
1.问题的重述
1.1背景:
随着经济的发展,葡萄酒已进入人们的日常生活,葡萄酒的质量一般是通过有资质的评酒员进行品评,每个评酒员在对葡萄酒品尝后进行分类指标打分,然后得到其总分,以此确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
1.2问题:
(1)分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2.问题的分析
2.1问题1的分析
附件1中包含两组品酒员评价红葡萄酒与白葡萄酒的数据,要分析两组评酒员的评价结果有无显著性差异,需要比较两组品酒员对红葡萄酒的评价结果及对白葡萄酒的评价结果。由于数据表中未给出品酒员对每个酒种的具体评价结果,可以得到每个品酒员对某一酒种的各项指标相加得到总分,再将全组品酒员对此酒种的总分进行平均,分别得到27种红葡萄酒的综合得分,再用同样的方法得到另一组评酒员对27组红葡萄酒的综合得分。同步处理白葡萄酒的相关数据。以此通过均值运用T检验来检测两组品酒员评价结果是否有无显
著性差异,运用方差分析来确定那一组结果更可信。
2.2问题2的分析
由于同一样品的葡萄酒的一种理化指标有多个,一级理化指标包含多个数据,因此可以将同一理化指标有多个数据的进行均值处理,将二级理化指标舍去,简单处理后得到二次数据,以后的步骤均在二次数据的基础上进行。要通过酿酒葡萄的理化指标和葡萄酒的质量对葡萄进行分级,由于分类情况未知,所以选择聚类分析来分类。运用聚类分析可将含量相近的葡萄归为一类。由于原始数据量较大,且多个变量之间具有一定的相关性,对数据结构不能做出明确分类,所以需要对数据进行降维处理。主成分分析法是以最少的信息丢失将众多原有变量浓缩成少数几个因子来实现酿酒葡萄的理化指标数据的简单化。并且原始数据指标变量的量纲不同,为了使这些数据能够放在一起加以比较,需要对原始数据标准化处理,以便于主成分分析。
2.3问题3的分析
要分析酿酒葡萄与葡萄酒的理化指标之间的关系,需要将酿酒葡萄与葡萄酒相对应的理化指标放在一起比较。运用相关系数反映酿酒葡萄和葡萄酒的理化指标之间的关联程度。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。再选出相关系数矩阵中相关系数大于0.8的理化指标,作出他们之间的走势图,观察他们的变化关系。
2.4问题4的分析
要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,即分析葡萄酒质量随酿酒葡萄和葡萄酒的理化指标的变化而变化的规律。考虑到葡萄酒质量
受多个酿酒葡萄和葡萄酒的理化指标的影响。建立多元回归分析模型然后计算出葡萄酒质量与“非标准化预测值”的差值,可以把绝对差值大于0.8视为不符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。将绝对差值小于0.8视为符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
3.模型的假设与符号说明
3.1模型的假设
(1)所有数据完全真实可靠。
(2)酿酒方式及酿酒过程对葡萄酒的质量无影响。
(3)评酒员的嗜好、习惯、情绪、经验等因素对葡萄酒的评分无影响。
(4)评酒员葡萄酒的评分分数具有较高的准确性和公正性
3.2符号的说明
m 红葡萄酒
n 白葡萄酒
mi 红葡萄酒的第i种样品
ni 白葡萄酒的第i种样品
p 评分分数
p1mi 第一组每个评酒员对第i种红葡萄酒的评分分数
p2mi 第二组每个评酒员对第i种红葡萄酒的评分分数
p1ni 第一组每个评酒员对第i种白葡萄酒的评分分数
p2ni 第二组每个评酒员对第i种白葡萄酒的评分分数
p1mi 第一组所有评酒员对第i种红葡萄酒的平均评分分数
p2mi 第二组所有评酒员对第i种红葡萄酒的平均评分分数
p1ni 第一组所有评酒员对第i种白葡萄酒的平均评分分数
p2ni 第二组所有评酒员对第i种白葡萄酒的平均评分分数
p1m 第一组某个品酒员对所有红葡萄酒的平均评分分数
p2m 第二组某个品酒员对所有红葡萄酒的平均评分分数
p1n 第一组某个品酒员对所有白葡萄酒的平均评分分数
p2n 第二组某个品酒员对所有白葡萄酒的平均评分分数
4.模型的建立与求解
4.1问题1的模型建立与求解
在对附件1的数据,我们将每个品酒员对每种酒中的分类指标相加得到每个品酒员对每个酒中的综合得分,得到四组数据:第一组每个品酒员对每种红葡萄酒评分分数p1mi,第一组每个品酒员对每种白葡萄酒评分分数p1ni,第二组
每个品酒员对每种红葡萄酒评分分数p2mi,第二组每个品酒员对每种白葡萄酒
评分分数p2ni。然后再对每一组数据的横向与纵向求平均值,分别得到某组所
有评酒员对第i种红白葡萄酒的平均评分分数与某个品酒员对所有红或白葡萄酒的平均评分分数。(见附录1)
下面我们分别对红葡萄酒和白葡萄酒进行分析。对处理后的两组红葡萄酒综合评分数据p1mi,p2mi运用MATLAB软件作出概率密度函数图形(如图1):
Normal Probability Plot
ProbabilityData
图1 红葡萄酒评分数据概率分布
由图1可知,红葡萄酒评分数据概率分布呈直线型,所以可认为此两组数据近似服从正态分布。
用同样的方法对两组白葡萄酒综合评分数据p1ni ,p2ni做出概率密度函数
图形(如图2):
Normal Probability Plot
ProbabilityData
图2 白葡萄酒评分数据概率分布
可以看出这两组数据同样近似服从正态分布。
对这两对服从正态分布的数据进行假设性检验,假设两组评酒员分别对红白葡萄酒的每种样品的综合平均得分相同,通过MATLAB软件进行T检验分别得出如下返回值:
h = 0 sig = 0.1183 ci =[-0.6735 5.7846]
h = 0 sig =0.0536 ci =[-4.5795 0.0366]
结果检验:两组数据的h均为0,表示不可以拒绝假设,说明提出的假设两组品酒员分别对红白葡萄酒的每种样品的综合平均得分相同。所以,两组品酒员的评价结果无显著性差异。
图3和图4是两组品酒员对红白葡萄酒每个样品的综合平均得分散点图形:
图3 红葡萄酒综合平均得分
图4 白葡萄酒综合平均得分
由图3,图4可以看出两组数据变化波动基本相同,结合上面检验结果,我们可以得到:两组品酒员的评价结果无显著性差异。
通过两组品酒员对所有红酒综合平均得分数据分别得出两组品酒员对红葡萄酒品评结果的方差,同样方法同步白葡萄酒数据,得出以下结果(表1):
表1数据明显显示出第二组品酒员评分方差小于第一组,即第二组品酒员总评分波动性较小,说明第二组品酒员评分结果比较可信。
4.2问题2的模型建立与求解
在经过对二级指标舍去,多次理化指标求平均值后得到二次数据。因为二次数据指标变量的量纲不同或数量级相差很大,为了使这些数据能放在一起比较,需要进行数据标准化处理,选择zscores即标准化变换的方法通过SPSS软件实现对数据的标准化,因为变换后数据的均值为0,标准差为1,消除了量纲的影响,当抽样样本改变时仍能保持其稳定性。但二次数据标准化后酿酒葡萄的理化指标仍然很多,无疑会增加分析问题的难度与复杂性。而且每个指标都在不同程度上反映了所研究问题的信息,并且各个指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。为了将许多相关性很高的变量转化成个数较少、能解释大部分原始数据方差且彼此互相独立的几个新变量,我们对原始数据进行了主成分分析(通过SPSS软件实现)。 表2为红葡萄酒酿酒葡萄主成分分析结果:
表2 红葡萄酒酿酒葡萄主成分
提取主成分(因子)的方法:根据特征根的数值(Total),系统默认的是1。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1,则所有方差大于等于1的主成分将被保留,其余舍弃。经过取舍得到八个主要影响红葡萄酒的酿酒葡萄理化指标的主要影响因子:氨基酸总量,蛋白质,VC含量,花色甘鲜重,酒石酸,苹果酸,柠檬酸,多酚氧化酶活力,(见附录2)。
用同样的方法对白葡萄酒酿酒葡萄理化指标做主成分分析,得到得到九个主要影响白葡萄酒的酿酒葡萄理化指标的主要影响因子:氨基酸总量,蛋白质,VC含量,花色甘鲜重,酒石酸,苹果酸,柠檬酸,多酚氧化酶活力,褐变度,
(见附录2)。
用经过主成分分析得到综合影响理化指标结合葡萄酒的质量对其分级。葡萄酒的质量是根据问题一所有评酒员对每个样品的得分之和来得到,由于问题一得出第二组的品酒员比较可靠,所以作为衡量葡萄酒质量的标准。用综合理化指标及葡萄酒的质量作为影响因素在SPSS软件中实现系统聚类分析,两种葡萄酒酿酒葡萄聚类图分别如图5、图6所示:
图5 红葡萄酒酿酒葡萄聚类图
图6 白葡萄酒酿酒葡萄聚类图
由图5,图6可以看出,红葡萄酒可分为三个等级,白葡萄酒可分为四个等级(表3):
表3 葡萄酒等级划分
4.3问题3的模型建立与求解
由于酿酒葡萄和葡萄酒的理化指标不同,所以首先挑选出了他们含有相同的理化指标,对于红酿酒葡萄和红葡萄酒共有9对,而对于白酿酒葡萄和白葡萄酒共有8对。通过对这些理化指标的分析,首先利用MATLAB软件中corrcoef程序语句,对每一个对应的理化指标所构成的两列数据进行计算,得出他们之间的相关系数,结果如下:
对于红酿酒葡萄和红葡萄酒中对应的理化指标: (1)花色苷的相关系数
ans = 1.0000 0.9226 b = 14.3347 0.9226 1.0000 2.3683 因为相关系数是0.9226(大于0.8),所以他们之间存在很强的相关性,由此得出线性方程为:
y14.33472.3683x
然后在MATLAB中作出了花色苷这一理化指标在各个样品酒中的走势图如下:
[***********][1**********]00
图7
采用灰色关联度法同时结合相关系数,说明了红酿酒葡萄和红葡萄酒的花色苷的理化指标有很强的相关性,即红酿酒葡萄的花色苷这一理化指标在很大程度上影响着红葡萄酒的花色苷这个理化指标。 (2)单宁的相关系数 ans = 1.0000 0.7180 0.7180 1.0000
因为相关系数是0.7180(小于0.8),所以他们之间的相关性并不显著。 然后在MATLAB中作出了单宁这一理化指标在各个样品酒中的走势图如下:
图8
由图8,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的单宁这一理化指标之间没有很强的联系。 (3)总酚的相关系数
ans = 1.0000 0.8752 b = 1.3620 0.8752 1.0000 0.3333
因为相关系数是0.8752(大于0.8),所以他们之间存在很强的相关性,由此我们得出线性方程为:
y1.36200.3333x
然后在MATLAB中作出了总酚这一理化指标在各个样品酒中的走势图如下:
图9
采用灰色关联度法同时结合相关系数,说明了红酿酒葡萄和红葡萄酒的总酚的理化指标有很强的相关性,即红酿酒葡萄的总酚这一理化指标在很大程度上影响着红葡萄酒的总酚这个理化指标。 (4)酒总黄酮的相关系数
ans = 1.0000 0.8228 b = 0.7626 0.8228 1.0000 0.5032
因为相关系数是0.8228(大于0.8),所以他们之间存在很强的相关性,由此我们得出线性方程为:
y0.76260.5032x
然后在MATLAB中作出了黄酮这一理化指标在各个样品酒中的走势图如下:
25
20
15
10
5
图10
采用灰色关联度法同时结合相关系数,说明了红酿酒葡萄和红葡萄酒的黄酮的理化指标有很强的相关性,即红酿酒葡萄的黄酮这一理化指标在很大程度上影响着红葡萄酒的黄酮这个理化指标。 (5)白藜芦醇的相关系数
ans = 1.0000 0.0135
0.0135 1.0000
因为相关系数是0.0135(远小于0.8),所以他们之间几乎没有相关性。 然后在MATLAB中作出了白藜芦醇这一理化指标在各个样品酒中的走势图如下:
30
25
20
15
10
5
图11
由图11,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的白藜芦醇这一理化指标之间没有很强的联系。 (6)DPPH半抑制体积的相关系数 ans = 1.0000 0.7778 0.7778 1.0000
因为相关系数是0.7778(小于0.8),所以他们之间不存在显著的相关性。 然后在MATLAB中作出了DPPH半抑制这一理化指标在各个样品酒中的走势图如下:
图12
由图12,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的DPPH半抑制体积这一理化指标之间没有很强的联系。 (7)色泽的相关系数 色泽L*(D65)的理化指标 ans = 1.0000 0.4937 0.4937 1.0000
因为相关系数是0.4937(小于0.5),所以他们之间几乎不存在相关性。 然后在MATLAB软件中作出了色泽L*(D65)这一理化指标在各个样品酒中的走势图如下:
图13
由图13,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的色泽L*(D65)这一理化指标之间没有很强的联系。
色泽a*(D65)的理化指标 ans = 1.0000 -0.5420 -0.5420 1.0000
因为相关系数是-0.5420(绝对值大于0.5),所以他们之间相关性不强。 然后在MATLAB中作出了色泽a*(D65)这一理化指标在各个样品酒中的走势图如下:
70
60
50
40
30
20
10
图14
由图14,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的色泽a*(D65)这一理化指标之间没有很强的联系。 色泽b*(D65)的理化指标
ans = 1.0000 0.0255
0.0255 1.0000
因为相关系数是0.0255(远小于0.5),所以他们之间几乎不存在相关性。 然后在MATLAB中作出了色泽b*(D65)这一理化指标在各个样品酒中的走势图如下:
图15
由图15,采用灰色关联度法同时结合相关系数,可以清晰的看出在红酿酒葡萄和红葡萄酒中的色泽b*(D65)这一理化指标之间没有很强的联系。
对于白酿酒葡萄和白葡萄酒中对应的理化指标的分析,我们也采用了同样的方法对它的各项理化指标进行了分析得出了图和相关系数(见附录3)。 4.4问题4的模型建立与求解
将附件2与附件3中葡萄和葡萄酒的理化指标(见附录4)整理后作为影响因素,变量葡萄酒的质量是根据第一题第二组所有评酒员对每个样品的得分之和来得到。建立多元回归模型:
yb0b1x1b2x2bkxke
然后在SPSS软件中实现多元回归分析,得出如下结果(其他结果见附录4):
表6 多元回归结果
把表6中“非标准化回归系数”栏目中的“B”列系数代入上式得到回归方程为:
y729.6110.001x10.035x21.393x24,
从方差分析表中得知:F统计量为2.7,显著性概率为为0.225。说明回归较显著。此方程即为酿酒葡萄和白葡萄酒的理化指标与葡萄酒质量的关系。
对红葡萄酒及酿酒葡萄理化指标数据实行同样步骤,得出多元回归方程为:
y37.5820.041x10.010x20.118x16,
从方差分析表中得知:F统计量为3.025,显著性概率为0.039,说明回归效果很显著。此方程即为酿酒葡萄和红葡萄酒的理化指标与葡萄酒质量的关系
将葡萄酒质量“y”与所得结果“非标准化预测值”的作差值,将结果筛选出大于0.8和小于0.8的数据。绝对差值大于0.8视为不符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。绝对差值小于0.8视为符合,即能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。然后通过对大于0.8和小于0.8的数据进行统计得出小于0.8的概率较大的结果。所以可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
5.模型的分析与评价
对问题二,在酿酒葡萄多指标的统计分析中,运用降维的思想对指标进行主成分分析法,用新指标样本代替原样本进行统计分析,消除原始变量间存在的共线性,克服由此造成的运算不稳定、矩阵病态等问题,使问题更加简化。 对问题三,在分析联系的过程中,运用相关系数法和灰色关联度分析曲线对酿酒葡萄和葡萄酒的理化指标的相关性进行分析。这样可以明确的得到每个指标的关联程度。在此基础上,又对显著性相关的理化指标进行回归分析,直观显示出酿酒葡萄和葡萄酒的理化指标的的线性接近程度。
对问题四,将酿酒葡萄和葡萄酒的理化指标和葡萄酒质量按一定标准分为多级,用分级尺度代换较大的数字,更能揭示酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的关系,效果比采用数量值统计方法有明显的提高,在实际应用中具有一定的现实意义。
6.模型的推广与应用
通过相关系数和多元回归等方法得出酿酒葡萄和葡萄酒的质量的关系,可以运用到水果的处理或是各种水果成分提取问题的研究,通过酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,在实际工程中可以侧重主要指标的提取,忽略部分指标,实现最大的效益,还可推广到水果质量的评定、水果主成分提取、以及水果各影响指标的标准的评定等问题。
参考文献
[1] 姜启源. 数学模型(第三版)[M]. 北京:高等教育出版社,1999. [2] 韩中庚. 数学建模方法及其应用(第二版)[M]. 北京:高等教育出版社,2009.
[3] 李华,刘署东,王华,张予林.葡萄酒感官评价结果的统计分析方法研究[N].中国食品学报,2006.
[4] 张振强.基于逐步回归分析的财政收入模型研究[J].经济研究导刊.2009,(5):94-96.
[5] 李运,李记明,姜忠军.统计分析在葡萄糖质量评价中的应用[J].酿酒科技,2009,(4):79-82.
[6] 王金甲,尹涛等.基于物理化学性质的葡萄酒质量的可视化评价研究[J].燕山大学学报,2010,34,(2):133-137.
[7] 陈雁, 李栋高. 颜色感觉的评价方法[J]. 纺织学报 , 2005,(02) [8] 许春兰. 因子分析的研究[J]. 内蒙古石油化工 , 2005,(02)
21
附录1
第一问数据处理结果:
22
23
24
检验正态分布概率密度函数图形程序:
x=[82 74.2 85.3 79.4 71 68.4 77.5 71.4 72.9 74.3 72.3 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3 77.9 75.8
75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6]; normplot(x)
假设性T检验程序:
x=[62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9 74.6 73 58.7 74.9 79.3 59.9 78.6 79 77.1 77.2 85.6 78 69.2 73.8 73 ];
y=[68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 8.8 2.6 5.7 69.9 4.5 5.4 2.6 5.8 2.2 1.6 7.1 1.5 8.2 2 1.5; [h,sig,ci] = ttest2(x,y)
x=[82 74.2 85.3 79.4 71 68.4 77.5 71.4 72.9 74.3 72.3 63.3 65.9 72 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3];
y=[77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6]; [h,sig,ci] = ttest2(x,y)
附录2
25
26
27
28
氨基酸总
红葡萄样品 量
花色苷鲜
蛋白质 VC含量 重
多酚氧化红葡萄酒
酒石酸 苹果酸 柠檬酸 酶活力
质量
29
30
红葡萄酒聚类分析结果:
提取主成分(因子)的方法:根据特征根的数值,系统默认的是1。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1,则所有方差大于等于1的主成分将被保留,其余舍弃。
白葡萄酒聚类分析结果:
31
32
附录3
附录3图形 图3-1:
987654321白葡萄的葡萄酒和酿酒葡萄单宁的理化指标
图3-2
[**************]白葡萄的葡萄酒和酿酒葡萄总酚的理化指标
图3-3
33
白葡萄的葡萄酒和酿酒葡萄总黄酮的理化指标
[1**********]0
图3-4
白葡萄的葡萄酒和酿酒葡萄白藜芦醇的理化指标
4.543.532.521.510.500
[1**********]
图
3-5
白葡萄的葡萄酒和酿酒葡萄DPPH的理化指标
0.450.40.350.30.250.20.150.10.05
00
[1**********]
图3-6
34
[***********]3020白葡萄的葡萄酒和酿酒葡萄色泽L*(D65)的理化指标
图
3-7
白葡萄的葡萄酒和酿酒葡萄色泽b*(D65)的理化指标
25
20
15
10
5
图3-8
1086420-2-4-6-8白葡萄的葡萄酒和酿酒葡萄色泽a*(D65)的理化指标
附录4
白葡萄酒和酿酒葡萄的理化指标:
35
36
37
红葡萄酒及酿酒葡萄的理化指标:
38
39
40
41
42
红葡萄酒多元回归分析结果:
43
系数
非标准化系数
模型 1
(常量) 蛋白质 花色苷 褐变度 DPPH自由基 总酚 单宁 总黄酮 黄酮醇 果梗比 出汁率 果皮颜色l 果皮颜色a 酒总黄酮
B 标准 误差
标准系数 试用版
t Sig. a
44
酒白藜芦醇 酒DPPH半抑制 酒色泽
a. 因变量: VAR00001
45