葡萄酒质量的评价分析
摘要
该文针对葡萄酒质量的评价问题建立了相应的数学模型,通过酿酒葡萄的好坏与所酿葡萄酒的质量的关系,利用葡萄酒和酿酒葡萄检测的理化指标,对葡萄酒的质量进行合理的评价与分析。
问题一,酒样品都是一样的,只是品酒人员不同,关键是人主观因素的差异性对酒的品性起了决定性作用。因此把每种红、白葡萄酒样品的分类指标的标准差之和作为样本数据,然后对两组的红、白葡萄酒的样本数据分别进行秩和检验,结果表明:两组评价结果具有显著性差异。再利用方差分析得出第二组结果更可信。
问题二,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,又由于酿酒葡萄的理化指标对葡萄酒质量的影响还没有明确的参数。可以利用问题一的结果,取可信度较高的评分结果得到每种葡萄酒的总分,把酿酒葡萄的理化指标作为决定葡萄酒质量的因素,通过相关系数法减少酿酒葡萄的理化指标,利用多元回归得到多项式系数,建立葡萄酒总分与酿酒葡萄理化指标一般化模型,从而再利用葡萄酒的得分来划分酿酒葡萄的级别,结果见表1、2。
问题三,对某些理化指标的数据有多组值的取其平均值,作为该理化指标的标准数据。由于酿酒葡萄的理化指标较多,且部分指标间存在从属关系,利用主成分分析法求得酿酒葡萄的理化指标的主成分。利用多元回归方法,求得葡萄酒的理化指标与酿酒葡萄主成分之间的函数关系,并求得葡萄酒理化指标的理论值,和实际值作误差分析,平均误差越小的指标之间的联系越紧密,反之,关联性越小。
问题四,利用二次多元回归分别求得葡萄酒质量与这两个因素之间的函数关系表达式,然后根据理论值与实际值平均误差的大小来判断这两个因素对葡萄酒质量的影响大小,通过归纳论证得到可以用葡萄理化指标与葡萄酒理化指标来评价葡萄酒的质量。此外,赋予根据这两个因素得到的葡萄酒质量分数相应的权重,从而得到葡萄酒的质量的综合得分。以红葡萄酒为例,求得的葡萄酒质量的理论值与实际值的平均误差为0.01,则证明能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:数学模型;MATLAB ;主成分分析;多元回归;葡萄酒评价
一 问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。数学模型讨论下列问题:
问题一,分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 问题二,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 问题三,分析酿酒葡萄与葡萄酒的理化指标之间的联系。
问题四,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 萄和葡萄酒的理化指标来评价葡萄酒的质量?
二 问题分析
首先将葡萄酒分为红葡萄酒和白葡萄酒,其中红葡萄酒有27组样品,白葡萄酒有28组样品。通过聘请一批有资质的评酒员进行品评,品尝后每个评酒员再对葡萄酒的各分类指标打分,满分100分。品酒员又分为两组,每组10人,得到葡萄酒的评价结果附件一。附件2和附件3分别给出了这些葡萄酒的和酿酒葡萄的成分数据,用来综合和分析评价葡萄酒的质量。该文为了做出对葡萄酒的质量评价,共设了如下四个问题 问题一,酒样品都是一样的,只是品酒人员不同,从而得到各组酒各类指标的不同的评价。问题在于是人主观因素的差异性对酒质量的好坏起了决定性作用,因此我们要根据评分结果分析两组评酒员的差异,从而判断出哪组评酒员的结果更可信。 问题二,假设葡萄酒的质量与制作过程及方式无关,即酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,又由于酿酒葡萄的理化指标对葡萄酒质量的影响还没有明确的参数。可以利用问题一的结果,取可信度较高的评分结果得到每种葡萄酒的总分,把酿酒葡萄的理化指标作为决定葡萄酒质量的因素,通过相关系数法减少酿酒葡萄的理化指标,再利用多元回归得到多项式系数,建立葡萄酒总分与酿酒葡萄理化指标一般化模型,从而用葡萄酒的得分来划分酿酒葡萄的级别。
问题三,对某些理化指标的数据有多组值的取其平均值,作为该理化指标的标准数据。由于酿酒葡萄的理化指标较多,且部分指标间存在从属关系,利用主成分分析法对得到酿酒葡萄的理化指标的主成分。经行多元回归求得葡萄酒的理化指标与酿酒葡萄主成分之间的函数关系,求得葡萄酒理化指标的理论值,用理论值与实际值作误差分析,平均误差越小之间的联系越紧密,反之,关联性越小。
问题四,在分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响时,需找到葡萄酒的质量分别与这两个指标的联系,通过此联系求得葡萄酒质量的理论值,求得平均误差,易知平均误差越大,两个指标对葡萄酒质量的影响越小,反之,影响越大,则理化指标在一定的程度上越能反映葡萄酒的质量。对根据两个指标求得的葡萄酒的质量理论分数赋予相应的权重,把两个指标在相应应权重下分数之和作为葡萄酒的质量的综合得
分,以某一葡萄为例,利用该评价指标得到的理论值与实际值的平均误差来判断是否可以用理论指标评价酒的质量。
三 模型假设
(1) 品酒的先后顺序对打分没有影响;
(2) 葡萄酒的质量与制作过程及制作方式无关; (3) 不同种类酿酒葡萄的成分数据具有统一标准; (4) 不同种类葡萄酒的成分数据具有统一标准; (5) 品酒员打分互不影响。
四 符号说明
(1) a ijk :第一组评价结果中第i 个红葡萄酒样品的第j 个指标的第k 个分数
(k , j =1,2,...,10; i =1,2,...,27);
(2) b ijk :第二组评价结果中第i 个红葡萄酒样品的第j 个指标的第k 个分数
i =(k , j =1, 2,...,10; 1, 2,..., 27);
(3) c ijk :第一组评价结果中第i 个白葡萄酒样品的第j 个指标的第k 个分数
i =(k , j =1, 2,...,10; 1, 2,..., 28);
(4) d ijk :第二组评价结果中第i 个白葡萄酒样品的第j 个指标的第k 个分数
(k , j =1,2,...,10; i =1,2,...,28);
(5) S 1ij :第一组评价结果中第i 个红葡萄酒样品的第j 个指标的标准差
(j =1,2,...,10; i =1,2,...,27);
(6) S 2ij :第二组评价结果中第i 个红葡萄酒样品的第j 个指标的标准差
(j =1,2,...,10; i =1,2,...,27);
(7) W 1ij :第一组评价结果中第i 个白葡萄酒样品的第j 个指标的标准差
i =(j =1, 2,... , 10; 1, 2,... );, 28
(8) W 2ij :第二组评价结果中第i 个白葡萄酒样品的第j 个指标的标准差
(j =1,2,...,10; i =1,2,...,28);
(9) R :红酿酒葡萄的指标矩阵为;
W :白酿酒葡萄的指标矩阵为;
(10) g 1、g 2:任意红、白葡萄酒质量的得分。
五 模型的建立与求解
5.1 问题一模型的建立与求解
酒样品都一样,只是评酒的人群不一样,如果假设所有评酒员的评分都是标准的,没有人有误差,那么所有人的评分都一样。但人为因素使得各指标得分与各指标实际的得分标准值都有差异,而人为差异性的大小是确定哪组可信的关键。葡萄酒的每项指标得分的标准差衡量评分波动大小,标准差越大,评分的波动就越大,则此品酒员的可信度就越低。由于所给数据存在部分异常,要经处理,如单指标得分77,根据该指标上限分8把77改成7,对于没有得分的项,取该指标下其余得分的均值填补上。综上采用每个酒样品各指标标准差之和对两组评酒员的评价结果进行比较。 5.1.1 红葡萄酒的两组评价结果比较
第一组评价结果中第i 个红葡萄酒样品的各指标标准差
S 1ij =
10
k , j =1,2, ,10; i =1,2, ,27) (1)
第i 个红葡萄酒样品的各指标标准差之和
S 1i =∑S 1ij (j =1,2, ,10; i =1,2, ,27) (2)
j =1
第二组评价结果中第i 个红葡萄酒样品的各指标标准差
S 2ij =
10
k , j =1,2, ,10; i =1,2, ,27) (3)
第i 个红葡萄酒样品的各指标标准差之和
S 2i =∑S 1ij (j =1,2, ,10; i =1,2, ,27) (4)
j =1
设
X 1=[S 11, S 12, , S 126, S 127] Y 1=[S 21, S 22, , S 27, S 228]
X 1和Y 1可看做红葡萄酒的两个评价样本,对这两个样本进行秩和检验
[p , h ]=ranksum (X 1, Y 1, alpha )
求得h =1,表明两组评价结果有显著性差异。 又因为
A =∑S 1i =313.5451
i =1
27
B =∑S 2i =151.7423
i =1
28
A >B , 即第二组评酒员的平均标准差较小,所以红葡萄酒的第二组评价结果更可信。
5.1.2 白葡萄酒的两组评价结果比较
第一组评价结果中第i 个白葡萄酒样品的各指标准差
W 1ij =
10
k , j =1,2, ,10; i =1,2, ,28) (5)
第i 个白葡萄酒样品的各指标标准差之和
W 1i =∑S 1ij (j =1,2, ,10; i =1,2, ,28) (6)
j =1
第二组评价结果中第i 个白葡萄酒样品的各指标准差
W 2ij =
10
k , j =1,2, ,10; i =1,2, ,28) (7)
第i 个白葡萄酒样品的各指标标准差之和
W 2i =∑S 1ij (j =1,2, ,10; i =1,2, ,28) (8)
j =1
设
X 2=[W 11, W 12, , W 126, W 127] Y 2=[W 21, W 22, , W 27, W 228]
X 2和Y 2可看做白葡萄酒的两个评价样本,对这两个样本进行秩和检验
[p , h ]=ranksum (X 2, Y 2, alpha )
求得h =1,表明两组评价结果有显著性差异。 又因为
C =∑W 1i =388.7435
i =128
D =∑W 2i =292.6077
i =1
28
C >D , 即第二组评酒员的评分平均标准差较小,所以白葡萄酒的第二组评价结果
更可信。 5.1.3 可信度比较
经上述综合分析可知:对于红、白两种葡萄酒,两组评酒员的评价结果均有显著性差异,且第二组的评价结果更可信。 5.2 问题二模型的建立与求解 5.2.1 模型的建立
利用相关系数法减少理化指标的个数,得到新的指标矩阵。设红酿酒葡萄的指标矩阵为R ,白酿酒葡萄的指标矩阵为W 。把第二组评酒员对各类葡萄酒各分类指标的总分的平均值,作为葡萄酒质量的得分,即得到每种红葡萄酒的得分矩阵G 1,每种白葡萄酒的得分矩阵G 2。设G 1、G 2关于W 、R 的系数矩阵为α和β(指标矩阵R 、W ,得分矩阵G 1、G 2,系数矩阵α、β的具体表达式参看附录1),利用二次多元回归求得多项式系数矩阵α(a 1, a 2, , a 27),β(b 1, b 2, , b 28),建立葡萄酒质量与酿酒葡萄理化指标的一般化模型。可得任意红、白葡萄酒质量的得分g 1、g 2。
5.2.2 模型的求解
10,2110,11
⎧2
⎪g 1=∑a j W i +∑a j W i +a 1
i =1j =12i =1, j =2⎪⎨10,2110,11
2⎪g =b j W i +∑b j W i +a ∑2
⎪i =1j =12i =1, j =2⎩
(9)
由第一问可知第二组的评价结果可信度较高,故以下数据均以以第二组的数据作为
依据,利用每个评酒员在对各葡萄酒各分类指标的总分的平均值,作为葡萄酒的质量评价的得分G 1i ,利用回归模型得到每种红白葡萄酒的模型求解得分g 1i 、g 2j (得分参看附件2)。部分符号说明如下:
G 1i (i =1,2,...,27):评酒员对第i 个红葡萄酒样品质量的实际得分; G 2i (i =1,2,...,28):评酒员对第i 个白葡萄酒样品质量的实际得分;
g 1i (i =1,2,...,27):利用回归模型求得的第i 个红葡萄酒样品质量的理论得分; g 2j (j =1,2,...,28):利用回归模型求得的第j 个白葡萄酒样品质量得理论得分。 5.2.3 误差分析
利用建立的葡萄酒质量与酿酒葡萄理化指标的一般化模型,通过公式(9)求得每个葡萄
酒样品质量的理论得分。设红葡萄酒的平均误差ϕ,白葡萄酒的平均误差φ,则有
2728
ϕ=∑(G 1i -g 1i )/27=0.021φ=∑(G 2i -g 2i )/28=0.0097
i =1
i =1
通过理论
得分与实际得分的平均误差分析可知误差很小,即通过相关系数法降低指标个数后,再利用二次多元回归建立的葡萄酒质量与酿酒葡萄理化指标的一般化模型具有可行性。 5.2.4 等级划分
利用常规划分思想将葡萄酒的质量分为5个级别,即相应的酿酒葡萄也分为5个级别,级别划分情况参看表1。
表1 级别划分表
(10)
根据上述级别划分,可以得到所给红、白两种酿酒葡萄的级别,每种酒样品所属级别情况参看表2。
表2 红、白两种酿酒葡萄的级别
5.3 问题三模型的建立与求解
根据上述分析,对酿酒葡萄的理化指标进行主成分分析并计算累计贡献率可知, 11个主成分的累计贡献率已超过86% ,即这11个主成分基本可以表达绝大部分指标的信息。
设葡萄酒的理化指标构成矩阵Y , 11个主成分构成矩阵X , Y 的每一列对X 进行二次多元回归。利用MATLAB 软件求得红葡萄酒回归方程的系数矩阵为R 1, 白葡萄酒回归方程的系数矩阵为R 2(R 1和R 2的值参看附录3)。
通过回归解出葡萄酒理化指标的理论值,再求出葡萄酒理化指标的理论值和实际值的平均误差,具体情况参看表3、4。
表3 红葡萄酒各理化指标的平均误差
由表3可以看出,白藜芦醇的平均误差为0. 361,误差较大,而其它理化指标的平均误差相对较小。因此可得出结论:红葡萄酒的理化指标白藜芦醇与酿酒葡萄的理化指标无太大联系,而其它指标与酿酒葡萄的理化指标联系较大。
表4 白葡萄酒各理化指标的平均误差
由表4可以看出,酒总黄酮的平均误差为0. 967,白藜芦醇的平均误差为0. 5856,误差较大,而其它理化指标的平均误差相对较小。所以可得出结论:白葡萄酒的理化指标酒总黄酮与酿酒葡萄的理化指标几乎无联系,白藜芦醇与酿酒葡萄的理化指标关联也很小,而其它指标与酿酒葡萄的理化指标联系较大。 5.4 问题四模型的建立与求解 5.4.1 两种指标对葡萄酒质量的影响
在问题二中已求得葡萄酒质量与酿酒葡萄的理化指标的函数关系。且红葡萄酒实际值与理论值的平均误差
ϕ=0.021
白葡萄酒实际值与理论值的平均误差
φ=0.0097
由上可知,红、白两种葡萄酒的平均误差都很小,所以,酿酒葡萄的理化指标对葡萄酒质量的影响很大。
利用回归模型求得葡萄酒的质量关于葡萄酒的理化指标的二次多元回归方程系数,进而得到这两者之间的函数关系表达式,根据多元回归模型求R 3, R 4(参看附录4)
得的理论值与实际值的平均误差。
红葡萄酒的实际值与理论值的平均误差ϕ1=0.021, 白葡萄酒的实际值与理论值的平均误差φ1=0.02。
由上可知,红、白两种葡萄酒的质量得分理论值与实际值平均误差都很小,所以,
葡萄酒的理化指标对葡萄酒质量的影响也比较大。 5.4.2 两种指标对葡萄酒质量的评价
设E 为对酿酒葡萄的理化指标进行回归后葡萄酒质量的得分,F 为对葡萄酒的理化指标进行回归后葡萄酒质量的得分,K 为葡萄酒质量的总得分。根据两种指标下葡萄酒平均误差的大小可知,酿酒葡萄的理化指标比葡萄酒的理化指标对葡萄酒质量的影响稍强,应用层次分析法的思想可求得两指标对应的葡萄酒质量得分的权重之比为
E :F =3:2
即在葡萄酒质量的评价中E 所占的权重为0.6,F 所占的权重为0.4。则葡萄酒质量新的评价标准为
W =0.6E +0.4F
以红葡萄酒为例(白葡萄酒情况类似),对上述新的评价标准进行验证,理论值与实际值的对比情况参看表5。
表5 红葡萄酒的理论值与实际值的对比情况
根据上表,计算得出新的评价标准下,葡萄酒质量的平均误差为0.01,可认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
六 模型评价与推广
该文通过建立回归模型在较小的误差范围内得到了葡萄酒质量与酿酒葡萄和葡萄酒的理化指标相应理化指标之间的关系表达式,使大量数据呈现出一定的函数关系,便于问题的解决。
由于附件3中给出了每个葡萄和葡萄酒样品的芳香物质,而经计算芳香物质对葡萄酒样品的质量影响甚小,在数据处理时将芳香物质指标排除,但数据仍然具有一定完整性。使得数据处理更加简洁,方便。
该文所得到的数学模型具有一般性,可以用到矿石质量检测,食品安全检测等实际工作中去,给这些检测工作提供理论支持。
参考文献
[1] 姜启源, 数学模型,北京:高等教育出版社,1993年8月第2版 [2] 王沫然, MTLAB与科学计算(第2版),北京:电子工业出版社,2003 [3] 刘崃福,曾文艺,数学模型与数学建模,北京:北京师范大学出版社,1997 [4] 周义仓,数学建模试验,西安:西安交通大学出版社,2007.2
附录1:
⎛71.4131⎫ ⎪⎛82.4184⎫ -0.1578⎪ ⎪ 0.3370⎪ 0.4044⎪ ⎪ 1.0622⎪⎛68.1⎫
⎪ ⎪ 1.6784⎪
74⎪ -0.9367⎪ -1.2831⎪
74.6⎪ 1.2282⎪ ⎪ ⎪ -0.5298 ⎪ ⎪ 71.2⎪ 2.4568 ⎪ -1.0996⎪ 72.1⎪
2.6010⎪ ⎪ ⎪
⎪ 66.3⎪ 0.9465⎪
0.0134⎪ 65.3⎪ -1.4382⎪ ⎪ ⎪ ⎪ 66⎪ -0.4115⎪
-0.3776⎪ 78.2⎪ -2.2158⎪ ⎪ ⎪ ⎪α= 0.3857⎪ ⎪68.8 1.8080 ⎪ ⎪ 0.0268⎪β= 0.6673⎪
61.6⎪
⎪ ⎪ 68.3⎪ -0.1108⎪ 0.0157⎪ ⎪ -0.3171⎪ -0.2944⎪ 68.8⎪ ⎪ ⎪G 1= 72.6⎪
⎪ 0.1603⎪ -0.1468⎪65.7 ⎪ 0.6881⎪ -0.0409⎪ 69.9⎪ ⎪ ⎪ ⎪
0.4123⎪ 0.0751⎪ 74.5⎪ ⎪ ⎪ ⎪ 0.7033⎪ 0.0033 65.4⎪ ⎪
-0.2657⎪ 72.6⎪ -0.0937⎪ ⎪ ⎪ ⎪ 75.8⎪ -0.1903⎪ 0.0024 ⎪ 72.2⎪ 1.2648⎪ -0.0792⎪ ⎪ ⎪⎝⎭ 71.6⎪
0.1468⎪ -1.5386⎪⎝⎭
⎛77.9⎫
⎪ 75.8⎪ 75.6⎪ ⎪ 76.9⎪ 81.5⎪ ⎪⎛-4.8462 1.4065 0.4682 3.1150 0.3600 -3.2349 -1.3455 0.7159 2.5916 -0.4939⎫ 75.5⎪ ⎪
-4.1337 -0.2892 1.4610 -1.1474 -0.8768 -0.0245 -1.4353 -0.2950 1.0350 -0.5249 ⎪ 74.2⎪
-3.9474 3.4653 -0.2357 -3.1384 0.8179 2.5817 1.0173 -2.2153 -0.1761 1.2724⎪ ⎪ ⎪
72.3⎪ 4.3052 -1.9145 1.9297 -0.8657 -5.1254 17.9876 -20.1232 -12.5712 -26.8705 10.8321⎪ 80.4⎪ 0.4721 -1.6566 -0.3060 -0.8574 -2.6288 0.3144 -0.9540 -1.4886 -2.8330 1.0168⎪ ⎪ ⎪
0.7165 3.2565 -2.9300 -0.2228 3.0815 -6.7914 6.3415 3.3080 9.4448 -4.9073⎪ 79.8⎪ 2.0150 2.4865 -0.7085 1.0301 0.6998 2.4098 -3.1162 -0.8248 -2.5032 0.8254⎪ ⎪ ⎪71.4 ⎪ -2.7655 0.1497 0.4656 5.2648 -0.5821 1.3349 1.4448 -2.2479 -1.6907 0.4558⎪
72.4⎪ -5.3135 -1.8250 2.5177 -2.2950 0.4007 -1.0890 -0.4281 0.5364 -1.9715 -0.5048⎪
⎪ ⎪
2.6010 -3.7462 2.6197 0.0056 3.8928 0.3561 -1.0084 -1.2534 0.4403 3.0070⎪ 73.9⎪ ⎪ 77.1⎪ 4.9115 6.2842 10.3215 -0.0961 0.7718 -4.4246 2.3165 -2.0928 1.5927 -1.8715⎪⎪G 2= 3.5869 1.7926 -0.7346 -1.3683 -4.6215 11.1057 -13.2497 -9.3218 -16.8607 7.9523⎪
78.4⎪ ⎪
0.3446 -1.4663 2.0591 -1.0619 0.6245 1.1934 0.4330 -0.3355 1.1303 -1.8114⎪ 67.3⎪ ⎪R = -1.4878 -0.5880 1.1897 2.1427 -0.9990 1.9008 0.7614 -1.4084 -0.7035 0.4229⎪ ⎪ 80.3⎪ 0.5876 2.1874 -1.6183 1.6417 4.1697 -10.7838 11.4287 8.1235 12.5514 -6.1102⎪
⎪ 0.3822 -0.2915 2.8160 0.6252 -2.0525 3.5671 -4.8911 -0.4111 -5.2743 2.6936⎪ 76.7⎪ ⎪
0.8213 0.7566 -2.7182 -0.7830 -0.0442 -3.9554 3.1824 -0.0201 2.1954 -0.4694⎪ 76.4⎪ ⎪ ⎪
1.4605 4.9935 -2.2493 1.2328 5.5446 -15.8776 16.2871 10.5900 22.7547 -10.9324⎪
76.6⎪ -0.0196 -1.0321 0.6023 -0.4358 0.1833 4.0664 -3.4555 -2.9836 -3.7006 0.2577⎪ 79.2⎪ ⎪ ⎪ 3.2215 -2.0081 1.1008 -2.0523 -3.0817 4.5585 -5.8588 -4.7741 -6.6587 2.8874⎪79.4 ⎪ -1.5989 3.1806 1.3588 -1.5169 1.1843 -1.7575 4.9879 4.3163 3.2795 -1.5231⎪
77.1⎪ ⎪ 77.4⎪ 1.1375 1.0105 1.4272 -0.5907 -2.9827 8.4217 -10.5352 -6.0156 -11.4399 4.9571⎪ ⎪ ⎪ -2.1690 -1.8197 0.3650 -1.0979 0.8038 -1.2327 -2.0200 -3.4939 -3.5292 0.0869⎪ 71.5⎪ 76.1⎪ ⎪ ⎪ ⎪ 1.2816 -0.4914 -0.7209 -0.6729 -1.5332 -0.5585 -0.9068 -0.3261 -1.9436 2.1644⎪68.279.5 ⎪ ⎪ ⎪
3.5293 -3.1368 0.2088 0.3238 1.6454 0.3425 -0.0978 -0.6795 -2.2979 -1.0386⎪ 72⎪ 74.3⎪ 2.8553 -3.5223 1.5091 -0.3343 -3.4272 0.4735 0.0950 -0.4974 1.1124 0.1580⎪
⎪ ⎪ ⎪ 77⎪⎝71.5⎭⎝ 3.1643 -0.7778 1.3039 0.6426 -1.2763 4.2449 -3.3867 -2.6980 -5.0837 1.4254⎭ 79.6⎪⎝⎭
⎛0.2872 0.2530 6.5336 -1.2651 -0.0868 1.0755 2.1427 -1.4002 -0.9040 -2.2545 2.2967⎫
⎪ 4.6388 1.9893 3.1961 0.1793 -1.8244 -2.8278 -0.4200 -0.9896 -0.6345 -3.2802 0.2742⎪ 4.6674 1.5161 1.4683 2.7337 -4.3416 0.3863 0.2097 0.9764 0.1216 -2.4765 2.8720⎪ ⎪ 6.8441 2.5099 6.9881 -0.7582 -3.3657 -0.9792 0.3738 -0.4213 2.2093 -2.7121 1.0555⎪ 8.4784 1.8345 5.9569 1.6239 -4.2108 -1.1935 2.6865 -0.5877 -0.2085 -3.2274 -0.6700⎪ ⎪ 3.7085 -1.5321 4.8423 0.6031 -3.6127 -0.5343 -0.5188 -1.0567 -0.0433 -1.2263 -0.1590⎪ 3.8009 -2.8703 5.0135 0.4009 -3.4752 -1.3158 0.7303 -2.8399 3.2257 -3.3129 0.6168⎪ ⎪ -1.2125 4.4553 3.1465 0.5303 -2.0934 -3.2067 2.5090 1.4593 1.7575 0.1956 0.8492⎪ 5.6909 3.5016 2.0115 -0.2166 -2.5715 0.3309 1.5566 -0.3585 2.4239 -2.4725 0.7685⎪ ⎪ 4.9135 0.3105 3.9627 -0.1284 -0.1489 -0.2073 1.3236 -0.6012 0.7825 -1.0550 0.9082⎪ ⎪ 2.7090 0.9849 2.8205 -1.8747 -3.5344 -2.6005 0.3042 1.8681 1.3992 -2.4646 0.9024⎪ 3.6188 -0.0359 1.6228 -0.9459 0.1067 -1.2802 0.1274 0.5420 0.7894 -3.4482 -1.2299⎪ ⎪ -1.5673 -3.5274 2.7776 -2.1833 -2.7411 2.7789 -0.1305 -0.2257 0.5021 -4.7876 -1.1074⎪ 5.6958 1.0080 6.7735 -0.9345 -2.1357 -3.1686 1.9414 -1.0326 1.9906 -3.2338 -0.0857⎪
⎪W =
0.5630 -2.3966 2.5235 2.2776 -2.1127 -2.4372 -1.3538 -1.6655 -1.1254 -3.0181 0.6274⎪ -1.2532 3.6732 1.5427 -0.1670 -2.7044 -1.2008 1.8542 -3.5976 1.2068 -2.5181 1.2783⎪ ⎪ 3.4360 3.5931 6.1643 -2.1350 -4.8662 0.2061 -1.8192 -0.8364 -0.0167 -1.5346 0.5222⎪ ⎪ 2.1913 -1.9685 5.3358 0.8498 -2.9990 -2.9363 0.5699 -0.7687 1.6298 0.5824 0.4281⎪ 0.9301 3.5039 -1.2200 -0.0800 -1.7574 -0.9488 0.6216 -0.9487 -0.2293 -2.1647 -0.1970⎪ ⎪ 5.9003 1.4330 5.3724 0.8860 -3.4675 0.3661 2.9260 -1.2991 -0.5970 -1.8153 -1.3224⎪ 7.4246 2.9269 8.5546 -2.2902 -3.1610 -3.6377 2.0902 -0.5258 -0.5863 -2.9279 2.2867⎪ ⎪ 3.4487 3.2818 2.0618 -1.7938 -2.1262 0.4359 -1.1518 -2.1194 0.7033 -0.3697 -0.6298⎪ 7.7066 3.0996 5.4620 -1.1861 -3.3282 -3.4856 0.4545 -1.4092 0.0342 -2.6643 1.0984⎪ ⎪ 5.7028 -2.9311 1.5625 -0.3865 0.5237 0.2370 0.3012 -0.0642 0.6490 -0.9027 1.4557⎪ ⎪ 4.3161 1.8798 0.8360 0.4998 -0.9289 -1.8895 2.0056 -0.8379 -0.1756 -0.7022 0.4028⎪ 7.6345 2.2561 2.8175 -0.8154 -0.6079 -1.1602 -0.9461 -2.0458 1.4372 -2.7677 1.0519⎪ ⎪ 5.7961 -6.3437 -2.2381 -4.9454 -5.7922 0.5316 1.6996 -2.5288 -0.4965 -3.4670 0.3132⎪ 9.3657 1.4036 5.0201 0.6585 -4.6715 -0.2098 1.0771 -2.0718 1.9825 -4.2628 1.3449⎪⎝⎭
附录2:
附录3:R1
R2:
附录4:
附录5:
%白酒质量
%第一组红酒标准差
a=xlsread('C:\Documents and Settings\Administrator\桌面\qh1.xls'); for k=1:10:270 c=a(k:k+9,:);
h1(k,:)=sum(nanstd(c')); end
c=find(h1~=0); h1=h1(c,:);
%第二组红酒评价及质量
a=xlsread('C:\Documents and Settings\Administrator\桌面\qh2.xls'); for k=1:10:270 c=a(k:k+9,:);
h2(k,:)=std(sum(c)); h3(k,:)=mean(sum(c)); end
c=find(h2~=0); h2=h2(c,:); c=find(h3~=0); h3=h3(c,:);
%第一组白酒标准差
a=xlsread('C:\Documents and Settings\Administrator\桌面\qb1.xls'); for i=1:10:280 c1=a(i:i+9,:);
b1(i)=sum(std(c1')); end
c1=find(b1~=0); b1=b1(c1)
%第二组白酒标准差及质量
a=xlsread('C:\Documents and Settings\Administrator\桌面\qb2.xls'); for k=1:10:280 c=a(k:k+9,:);
b3(k,:)=sum(std(c')); b4(k,:)=mean(sum(c)); end
c=find(b3~=0); b2=b3(c,:); c=find(b4~=0); b4=b4(c,:);
%红酒葡萄主成分分析
a=xlsread('C:\Documents and Settings\Administrator\桌面\h.xls'); for k=1:30
a(:,k)=(a(:,k)-mean(a(:,k)))./std(a(:,k)); end
r=corrcoef(a); [u,v]=eig(r);
v=flipud(diag(v))./sum(diag(v)); v1=cumsum(v); u=fliplr(u); u=u(:,1:10); p=a*u;
%白、红酒等级 for k=1:28
if b4(k)>=90
disp([num2str(k),'一']); elseif b4(k)>=80
disp([num2str(k),'二']); elseif b4(k)>=70
disp([num2str(k),'三']); elseif b4(k)>=60
disp([num2str(k),'四']); else
disp([num2str(k),'五']); end end
%白酒葡萄主成分分析
a=xlsread('C:\Documents and Settings\Administrator\桌面\b.xls'); for k=1:30
a(:,k)=(a(:,k)-mean(a(:,k)))./std(a(:,k));
r=corrcoef(a); [u,v]=eig(r);
v=flipud(diag(v))./sum(diag(v)); v1=cumsum(v); u=fliplr(u); u=u(:,1:11); p=a*u;
%红葡萄理化指标和红葡萄酒质量 syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x1^2+beta(13)*x2^2+beta(14)*x3^2+beta(15)*x4^2+beta(16)*x5^2+beta(17)*x6^2+beta(18)*x7^2+beta(19)*x8^2+beta(20)*x9^2+beta(21)*x10^2; for k=1:27 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10); y1(k)=subs(y); end
double(mean(abs(y1-h3')./h3'));
%白葡萄酒理化指标和白葡萄酒质量 syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x1^2+beta(13)*x2^2+beta(14)*x3^2+beta(15)*x4^2+beta(16)*x5^2+beta(17)*x6^2+beta(18)*x7^2+beta(19)*x8^2+beta(20)*x9^2+beta(21)*x10^2; for k=1:27 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10); y1(k)=subs(y);
double(mean(abs(y1-b4')./b4'));
%红葡萄理化指标与红葡萄酒理化指标 rstool(p,a1(:,1),'linear',0.05);
a1=xlsread('C:\Documents and Settings\Administrator\桌面\hj.xls'); syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x11+beta(13)*x1^2+beta(14)*x2^2+beta(15)*x3^2+beta(16)*x4^2+beta(17)*x5^2+beta(18)*x6^2+beta(19)*x7^2+beta(20)*x8^2+beta(21)*x9^2+beta(22)*x10^2+beta(23)*x11^2;
for k=1:28 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10); x11=p(k,11); y1(k)=subs(y); end
double(mean(abs(y1-a1(:,1)')./a1(:,1)')) %白葡萄理化指标与白葡萄酒理化指标 rstool(p,a1(:,1),'linear',0.05);
a1=xlsread('C:\Documents and Settings\Administrator\桌面\bj.xls'); syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x11+beta(13)*x1^2+beta(14)*x2^2+beta(15)*x3^2+beta(16)*x4^2+beta(17)*x5^2+beta(18)*x6^2+beta(19)*x7^2+beta(20)*x8^2+beta(21)*x9^2+beta(22)*x10^2+beta(23)*x11^2;
for k=1:28 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10);
x11=p(k,11); y1(k)=subs(y); end
double(mean(abs(y1- a1(:,1)'). a1(:,1)'));
葡萄酒质量的评价分析
摘要
该文针对葡萄酒质量的评价问题建立了相应的数学模型,通过酿酒葡萄的好坏与所酿葡萄酒的质量的关系,利用葡萄酒和酿酒葡萄检测的理化指标,对葡萄酒的质量进行合理的评价与分析。
问题一,酒样品都是一样的,只是品酒人员不同,关键是人主观因素的差异性对酒的品性起了决定性作用。因此把每种红、白葡萄酒样品的分类指标的标准差之和作为样本数据,然后对两组的红、白葡萄酒的样本数据分别进行秩和检验,结果表明:两组评价结果具有显著性差异。再利用方差分析得出第二组结果更可信。
问题二,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,又由于酿酒葡萄的理化指标对葡萄酒质量的影响还没有明确的参数。可以利用问题一的结果,取可信度较高的评分结果得到每种葡萄酒的总分,把酿酒葡萄的理化指标作为决定葡萄酒质量的因素,通过相关系数法减少酿酒葡萄的理化指标,利用多元回归得到多项式系数,建立葡萄酒总分与酿酒葡萄理化指标一般化模型,从而再利用葡萄酒的得分来划分酿酒葡萄的级别,结果见表1、2。
问题三,对某些理化指标的数据有多组值的取其平均值,作为该理化指标的标准数据。由于酿酒葡萄的理化指标较多,且部分指标间存在从属关系,利用主成分分析法求得酿酒葡萄的理化指标的主成分。利用多元回归方法,求得葡萄酒的理化指标与酿酒葡萄主成分之间的函数关系,并求得葡萄酒理化指标的理论值,和实际值作误差分析,平均误差越小的指标之间的联系越紧密,反之,关联性越小。
问题四,利用二次多元回归分别求得葡萄酒质量与这两个因素之间的函数关系表达式,然后根据理论值与实际值平均误差的大小来判断这两个因素对葡萄酒质量的影响大小,通过归纳论证得到可以用葡萄理化指标与葡萄酒理化指标来评价葡萄酒的质量。此外,赋予根据这两个因素得到的葡萄酒质量分数相应的权重,从而得到葡萄酒的质量的综合得分。以红葡萄酒为例,求得的葡萄酒质量的理论值与实际值的平均误差为0.01,则证明能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 关键词:数学模型;MATLAB ;主成分分析;多元回归;葡萄酒评价
一 问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。数学模型讨论下列问题:
问题一,分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 问题二,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 问题三,分析酿酒葡萄与葡萄酒的理化指标之间的联系。
问题四,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 萄和葡萄酒的理化指标来评价葡萄酒的质量?
二 问题分析
首先将葡萄酒分为红葡萄酒和白葡萄酒,其中红葡萄酒有27组样品,白葡萄酒有28组样品。通过聘请一批有资质的评酒员进行品评,品尝后每个评酒员再对葡萄酒的各分类指标打分,满分100分。品酒员又分为两组,每组10人,得到葡萄酒的评价结果附件一。附件2和附件3分别给出了这些葡萄酒的和酿酒葡萄的成分数据,用来综合和分析评价葡萄酒的质量。该文为了做出对葡萄酒的质量评价,共设了如下四个问题 问题一,酒样品都是一样的,只是品酒人员不同,从而得到各组酒各类指标的不同的评价。问题在于是人主观因素的差异性对酒质量的好坏起了决定性作用,因此我们要根据评分结果分析两组评酒员的差异,从而判断出哪组评酒员的结果更可信。 问题二,假设葡萄酒的质量与制作过程及方式无关,即酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,又由于酿酒葡萄的理化指标对葡萄酒质量的影响还没有明确的参数。可以利用问题一的结果,取可信度较高的评分结果得到每种葡萄酒的总分,把酿酒葡萄的理化指标作为决定葡萄酒质量的因素,通过相关系数法减少酿酒葡萄的理化指标,再利用多元回归得到多项式系数,建立葡萄酒总分与酿酒葡萄理化指标一般化模型,从而用葡萄酒的得分来划分酿酒葡萄的级别。
问题三,对某些理化指标的数据有多组值的取其平均值,作为该理化指标的标准数据。由于酿酒葡萄的理化指标较多,且部分指标间存在从属关系,利用主成分分析法对得到酿酒葡萄的理化指标的主成分。经行多元回归求得葡萄酒的理化指标与酿酒葡萄主成分之间的函数关系,求得葡萄酒理化指标的理论值,用理论值与实际值作误差分析,平均误差越小之间的联系越紧密,反之,关联性越小。
问题四,在分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响时,需找到葡萄酒的质量分别与这两个指标的联系,通过此联系求得葡萄酒质量的理论值,求得平均误差,易知平均误差越大,两个指标对葡萄酒质量的影响越小,反之,影响越大,则理化指标在一定的程度上越能反映葡萄酒的质量。对根据两个指标求得的葡萄酒的质量理论分数赋予相应的权重,把两个指标在相应应权重下分数之和作为葡萄酒的质量的综合得
分,以某一葡萄为例,利用该评价指标得到的理论值与实际值的平均误差来判断是否可以用理论指标评价酒的质量。
三 模型假设
(1) 品酒的先后顺序对打分没有影响;
(2) 葡萄酒的质量与制作过程及制作方式无关; (3) 不同种类酿酒葡萄的成分数据具有统一标准; (4) 不同种类葡萄酒的成分数据具有统一标准; (5) 品酒员打分互不影响。
四 符号说明
(1) a ijk :第一组评价结果中第i 个红葡萄酒样品的第j 个指标的第k 个分数
(k , j =1,2,...,10; i =1,2,...,27);
(2) b ijk :第二组评价结果中第i 个红葡萄酒样品的第j 个指标的第k 个分数
i =(k , j =1, 2,...,10; 1, 2,..., 27);
(3) c ijk :第一组评价结果中第i 个白葡萄酒样品的第j 个指标的第k 个分数
i =(k , j =1, 2,...,10; 1, 2,..., 28);
(4) d ijk :第二组评价结果中第i 个白葡萄酒样品的第j 个指标的第k 个分数
(k , j =1,2,...,10; i =1,2,...,28);
(5) S 1ij :第一组评价结果中第i 个红葡萄酒样品的第j 个指标的标准差
(j =1,2,...,10; i =1,2,...,27);
(6) S 2ij :第二组评价结果中第i 个红葡萄酒样品的第j 个指标的标准差
(j =1,2,...,10; i =1,2,...,27);
(7) W 1ij :第一组评价结果中第i 个白葡萄酒样品的第j 个指标的标准差
i =(j =1, 2,... , 10; 1, 2,... );, 28
(8) W 2ij :第二组评价结果中第i 个白葡萄酒样品的第j 个指标的标准差
(j =1,2,...,10; i =1,2,...,28);
(9) R :红酿酒葡萄的指标矩阵为;
W :白酿酒葡萄的指标矩阵为;
(10) g 1、g 2:任意红、白葡萄酒质量的得分。
五 模型的建立与求解
5.1 问题一模型的建立与求解
酒样品都一样,只是评酒的人群不一样,如果假设所有评酒员的评分都是标准的,没有人有误差,那么所有人的评分都一样。但人为因素使得各指标得分与各指标实际的得分标准值都有差异,而人为差异性的大小是确定哪组可信的关键。葡萄酒的每项指标得分的标准差衡量评分波动大小,标准差越大,评分的波动就越大,则此品酒员的可信度就越低。由于所给数据存在部分异常,要经处理,如单指标得分77,根据该指标上限分8把77改成7,对于没有得分的项,取该指标下其余得分的均值填补上。综上采用每个酒样品各指标标准差之和对两组评酒员的评价结果进行比较。 5.1.1 红葡萄酒的两组评价结果比较
第一组评价结果中第i 个红葡萄酒样品的各指标标准差
S 1ij =
10
k , j =1,2, ,10; i =1,2, ,27) (1)
第i 个红葡萄酒样品的各指标标准差之和
S 1i =∑S 1ij (j =1,2, ,10; i =1,2, ,27) (2)
j =1
第二组评价结果中第i 个红葡萄酒样品的各指标标准差
S 2ij =
10
k , j =1,2, ,10; i =1,2, ,27) (3)
第i 个红葡萄酒样品的各指标标准差之和
S 2i =∑S 1ij (j =1,2, ,10; i =1,2, ,27) (4)
j =1
设
X 1=[S 11, S 12, , S 126, S 127] Y 1=[S 21, S 22, , S 27, S 228]
X 1和Y 1可看做红葡萄酒的两个评价样本,对这两个样本进行秩和检验
[p , h ]=ranksum (X 1, Y 1, alpha )
求得h =1,表明两组评价结果有显著性差异。 又因为
A =∑S 1i =313.5451
i =1
27
B =∑S 2i =151.7423
i =1
28
A >B , 即第二组评酒员的平均标准差较小,所以红葡萄酒的第二组评价结果更可信。
5.1.2 白葡萄酒的两组评价结果比较
第一组评价结果中第i 个白葡萄酒样品的各指标准差
W 1ij =
10
k , j =1,2, ,10; i =1,2, ,28) (5)
第i 个白葡萄酒样品的各指标标准差之和
W 1i =∑S 1ij (j =1,2, ,10; i =1,2, ,28) (6)
j =1
第二组评价结果中第i 个白葡萄酒样品的各指标准差
W 2ij =
10
k , j =1,2, ,10; i =1,2, ,28) (7)
第i 个白葡萄酒样品的各指标标准差之和
W 2i =∑S 1ij (j =1,2, ,10; i =1,2, ,28) (8)
j =1
设
X 2=[W 11, W 12, , W 126, W 127] Y 2=[W 21, W 22, , W 27, W 228]
X 2和Y 2可看做白葡萄酒的两个评价样本,对这两个样本进行秩和检验
[p , h ]=ranksum (X 2, Y 2, alpha )
求得h =1,表明两组评价结果有显著性差异。 又因为
C =∑W 1i =388.7435
i =128
D =∑W 2i =292.6077
i =1
28
C >D , 即第二组评酒员的评分平均标准差较小,所以白葡萄酒的第二组评价结果
更可信。 5.1.3 可信度比较
经上述综合分析可知:对于红、白两种葡萄酒,两组评酒员的评价结果均有显著性差异,且第二组的评价结果更可信。 5.2 问题二模型的建立与求解 5.2.1 模型的建立
利用相关系数法减少理化指标的个数,得到新的指标矩阵。设红酿酒葡萄的指标矩阵为R ,白酿酒葡萄的指标矩阵为W 。把第二组评酒员对各类葡萄酒各分类指标的总分的平均值,作为葡萄酒质量的得分,即得到每种红葡萄酒的得分矩阵G 1,每种白葡萄酒的得分矩阵G 2。设G 1、G 2关于W 、R 的系数矩阵为α和β(指标矩阵R 、W ,得分矩阵G 1、G 2,系数矩阵α、β的具体表达式参看附录1),利用二次多元回归求得多项式系数矩阵α(a 1, a 2, , a 27),β(b 1, b 2, , b 28),建立葡萄酒质量与酿酒葡萄理化指标的一般化模型。可得任意红、白葡萄酒质量的得分g 1、g 2。
5.2.2 模型的求解
10,2110,11
⎧2
⎪g 1=∑a j W i +∑a j W i +a 1
i =1j =12i =1, j =2⎪⎨10,2110,11
2⎪g =b j W i +∑b j W i +a ∑2
⎪i =1j =12i =1, j =2⎩
(9)
由第一问可知第二组的评价结果可信度较高,故以下数据均以以第二组的数据作为
依据,利用每个评酒员在对各葡萄酒各分类指标的总分的平均值,作为葡萄酒的质量评价的得分G 1i ,利用回归模型得到每种红白葡萄酒的模型求解得分g 1i 、g 2j (得分参看附件2)。部分符号说明如下:
G 1i (i =1,2,...,27):评酒员对第i 个红葡萄酒样品质量的实际得分; G 2i (i =1,2,...,28):评酒员对第i 个白葡萄酒样品质量的实际得分;
g 1i (i =1,2,...,27):利用回归模型求得的第i 个红葡萄酒样品质量的理论得分; g 2j (j =1,2,...,28):利用回归模型求得的第j 个白葡萄酒样品质量得理论得分。 5.2.3 误差分析
利用建立的葡萄酒质量与酿酒葡萄理化指标的一般化模型,通过公式(9)求得每个葡萄
酒样品质量的理论得分。设红葡萄酒的平均误差ϕ,白葡萄酒的平均误差φ,则有
2728
ϕ=∑(G 1i -g 1i )/27=0.021φ=∑(G 2i -g 2i )/28=0.0097
i =1
i =1
通过理论
得分与实际得分的平均误差分析可知误差很小,即通过相关系数法降低指标个数后,再利用二次多元回归建立的葡萄酒质量与酿酒葡萄理化指标的一般化模型具有可行性。 5.2.4 等级划分
利用常规划分思想将葡萄酒的质量分为5个级别,即相应的酿酒葡萄也分为5个级别,级别划分情况参看表1。
表1 级别划分表
(10)
根据上述级别划分,可以得到所给红、白两种酿酒葡萄的级别,每种酒样品所属级别情况参看表2。
表2 红、白两种酿酒葡萄的级别
5.3 问题三模型的建立与求解
根据上述分析,对酿酒葡萄的理化指标进行主成分分析并计算累计贡献率可知, 11个主成分的累计贡献率已超过86% ,即这11个主成分基本可以表达绝大部分指标的信息。
设葡萄酒的理化指标构成矩阵Y , 11个主成分构成矩阵X , Y 的每一列对X 进行二次多元回归。利用MATLAB 软件求得红葡萄酒回归方程的系数矩阵为R 1, 白葡萄酒回归方程的系数矩阵为R 2(R 1和R 2的值参看附录3)。
通过回归解出葡萄酒理化指标的理论值,再求出葡萄酒理化指标的理论值和实际值的平均误差,具体情况参看表3、4。
表3 红葡萄酒各理化指标的平均误差
由表3可以看出,白藜芦醇的平均误差为0. 361,误差较大,而其它理化指标的平均误差相对较小。因此可得出结论:红葡萄酒的理化指标白藜芦醇与酿酒葡萄的理化指标无太大联系,而其它指标与酿酒葡萄的理化指标联系较大。
表4 白葡萄酒各理化指标的平均误差
由表4可以看出,酒总黄酮的平均误差为0. 967,白藜芦醇的平均误差为0. 5856,误差较大,而其它理化指标的平均误差相对较小。所以可得出结论:白葡萄酒的理化指标酒总黄酮与酿酒葡萄的理化指标几乎无联系,白藜芦醇与酿酒葡萄的理化指标关联也很小,而其它指标与酿酒葡萄的理化指标联系较大。 5.4 问题四模型的建立与求解 5.4.1 两种指标对葡萄酒质量的影响
在问题二中已求得葡萄酒质量与酿酒葡萄的理化指标的函数关系。且红葡萄酒实际值与理论值的平均误差
ϕ=0.021
白葡萄酒实际值与理论值的平均误差
φ=0.0097
由上可知,红、白两种葡萄酒的平均误差都很小,所以,酿酒葡萄的理化指标对葡萄酒质量的影响很大。
利用回归模型求得葡萄酒的质量关于葡萄酒的理化指标的二次多元回归方程系数,进而得到这两者之间的函数关系表达式,根据多元回归模型求R 3, R 4(参看附录4)
得的理论值与实际值的平均误差。
红葡萄酒的实际值与理论值的平均误差ϕ1=0.021, 白葡萄酒的实际值与理论值的平均误差φ1=0.02。
由上可知,红、白两种葡萄酒的质量得分理论值与实际值平均误差都很小,所以,
葡萄酒的理化指标对葡萄酒质量的影响也比较大。 5.4.2 两种指标对葡萄酒质量的评价
设E 为对酿酒葡萄的理化指标进行回归后葡萄酒质量的得分,F 为对葡萄酒的理化指标进行回归后葡萄酒质量的得分,K 为葡萄酒质量的总得分。根据两种指标下葡萄酒平均误差的大小可知,酿酒葡萄的理化指标比葡萄酒的理化指标对葡萄酒质量的影响稍强,应用层次分析法的思想可求得两指标对应的葡萄酒质量得分的权重之比为
E :F =3:2
即在葡萄酒质量的评价中E 所占的权重为0.6,F 所占的权重为0.4。则葡萄酒质量新的评价标准为
W =0.6E +0.4F
以红葡萄酒为例(白葡萄酒情况类似),对上述新的评价标准进行验证,理论值与实际值的对比情况参看表5。
表5 红葡萄酒的理论值与实际值的对比情况
根据上表,计算得出新的评价标准下,葡萄酒质量的平均误差为0.01,可认为能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
六 模型评价与推广
该文通过建立回归模型在较小的误差范围内得到了葡萄酒质量与酿酒葡萄和葡萄酒的理化指标相应理化指标之间的关系表达式,使大量数据呈现出一定的函数关系,便于问题的解决。
由于附件3中给出了每个葡萄和葡萄酒样品的芳香物质,而经计算芳香物质对葡萄酒样品的质量影响甚小,在数据处理时将芳香物质指标排除,但数据仍然具有一定完整性。使得数据处理更加简洁,方便。
该文所得到的数学模型具有一般性,可以用到矿石质量检测,食品安全检测等实际工作中去,给这些检测工作提供理论支持。
参考文献
[1] 姜启源, 数学模型,北京:高等教育出版社,1993年8月第2版 [2] 王沫然, MTLAB与科学计算(第2版),北京:电子工业出版社,2003 [3] 刘崃福,曾文艺,数学模型与数学建模,北京:北京师范大学出版社,1997 [4] 周义仓,数学建模试验,西安:西安交通大学出版社,2007.2
附录1:
⎛71.4131⎫ ⎪⎛82.4184⎫ -0.1578⎪ ⎪ 0.3370⎪ 0.4044⎪ ⎪ 1.0622⎪⎛68.1⎫
⎪ ⎪ 1.6784⎪
74⎪ -0.9367⎪ -1.2831⎪
74.6⎪ 1.2282⎪ ⎪ ⎪ -0.5298 ⎪ ⎪ 71.2⎪ 2.4568 ⎪ -1.0996⎪ 72.1⎪
2.6010⎪ ⎪ ⎪
⎪ 66.3⎪ 0.9465⎪
0.0134⎪ 65.3⎪ -1.4382⎪ ⎪ ⎪ ⎪ 66⎪ -0.4115⎪
-0.3776⎪ 78.2⎪ -2.2158⎪ ⎪ ⎪ ⎪α= 0.3857⎪ ⎪68.8 1.8080 ⎪ ⎪ 0.0268⎪β= 0.6673⎪
61.6⎪
⎪ ⎪ 68.3⎪ -0.1108⎪ 0.0157⎪ ⎪ -0.3171⎪ -0.2944⎪ 68.8⎪ ⎪ ⎪G 1= 72.6⎪
⎪ 0.1603⎪ -0.1468⎪65.7 ⎪ 0.6881⎪ -0.0409⎪ 69.9⎪ ⎪ ⎪ ⎪
0.4123⎪ 0.0751⎪ 74.5⎪ ⎪ ⎪ ⎪ 0.7033⎪ 0.0033 65.4⎪ ⎪
-0.2657⎪ 72.6⎪ -0.0937⎪ ⎪ ⎪ ⎪ 75.8⎪ -0.1903⎪ 0.0024 ⎪ 72.2⎪ 1.2648⎪ -0.0792⎪ ⎪ ⎪⎝⎭ 71.6⎪
0.1468⎪ -1.5386⎪⎝⎭
⎛77.9⎫
⎪ 75.8⎪ 75.6⎪ ⎪ 76.9⎪ 81.5⎪ ⎪⎛-4.8462 1.4065 0.4682 3.1150 0.3600 -3.2349 -1.3455 0.7159 2.5916 -0.4939⎫ 75.5⎪ ⎪
-4.1337 -0.2892 1.4610 -1.1474 -0.8768 -0.0245 -1.4353 -0.2950 1.0350 -0.5249 ⎪ 74.2⎪
-3.9474 3.4653 -0.2357 -3.1384 0.8179 2.5817 1.0173 -2.2153 -0.1761 1.2724⎪ ⎪ ⎪
72.3⎪ 4.3052 -1.9145 1.9297 -0.8657 -5.1254 17.9876 -20.1232 -12.5712 -26.8705 10.8321⎪ 80.4⎪ 0.4721 -1.6566 -0.3060 -0.8574 -2.6288 0.3144 -0.9540 -1.4886 -2.8330 1.0168⎪ ⎪ ⎪
0.7165 3.2565 -2.9300 -0.2228 3.0815 -6.7914 6.3415 3.3080 9.4448 -4.9073⎪ 79.8⎪ 2.0150 2.4865 -0.7085 1.0301 0.6998 2.4098 -3.1162 -0.8248 -2.5032 0.8254⎪ ⎪ ⎪71.4 ⎪ -2.7655 0.1497 0.4656 5.2648 -0.5821 1.3349 1.4448 -2.2479 -1.6907 0.4558⎪
72.4⎪ -5.3135 -1.8250 2.5177 -2.2950 0.4007 -1.0890 -0.4281 0.5364 -1.9715 -0.5048⎪
⎪ ⎪
2.6010 -3.7462 2.6197 0.0056 3.8928 0.3561 -1.0084 -1.2534 0.4403 3.0070⎪ 73.9⎪ ⎪ 77.1⎪ 4.9115 6.2842 10.3215 -0.0961 0.7718 -4.4246 2.3165 -2.0928 1.5927 -1.8715⎪⎪G 2= 3.5869 1.7926 -0.7346 -1.3683 -4.6215 11.1057 -13.2497 -9.3218 -16.8607 7.9523⎪
78.4⎪ ⎪
0.3446 -1.4663 2.0591 -1.0619 0.6245 1.1934 0.4330 -0.3355 1.1303 -1.8114⎪ 67.3⎪ ⎪R = -1.4878 -0.5880 1.1897 2.1427 -0.9990 1.9008 0.7614 -1.4084 -0.7035 0.4229⎪ ⎪ 80.3⎪ 0.5876 2.1874 -1.6183 1.6417 4.1697 -10.7838 11.4287 8.1235 12.5514 -6.1102⎪
⎪ 0.3822 -0.2915 2.8160 0.6252 -2.0525 3.5671 -4.8911 -0.4111 -5.2743 2.6936⎪ 76.7⎪ ⎪
0.8213 0.7566 -2.7182 -0.7830 -0.0442 -3.9554 3.1824 -0.0201 2.1954 -0.4694⎪ 76.4⎪ ⎪ ⎪
1.4605 4.9935 -2.2493 1.2328 5.5446 -15.8776 16.2871 10.5900 22.7547 -10.9324⎪
76.6⎪ -0.0196 -1.0321 0.6023 -0.4358 0.1833 4.0664 -3.4555 -2.9836 -3.7006 0.2577⎪ 79.2⎪ ⎪ ⎪ 3.2215 -2.0081 1.1008 -2.0523 -3.0817 4.5585 -5.8588 -4.7741 -6.6587 2.8874⎪79.4 ⎪ -1.5989 3.1806 1.3588 -1.5169 1.1843 -1.7575 4.9879 4.3163 3.2795 -1.5231⎪
77.1⎪ ⎪ 77.4⎪ 1.1375 1.0105 1.4272 -0.5907 -2.9827 8.4217 -10.5352 -6.0156 -11.4399 4.9571⎪ ⎪ ⎪ -2.1690 -1.8197 0.3650 -1.0979 0.8038 -1.2327 -2.0200 -3.4939 -3.5292 0.0869⎪ 71.5⎪ 76.1⎪ ⎪ ⎪ ⎪ 1.2816 -0.4914 -0.7209 -0.6729 -1.5332 -0.5585 -0.9068 -0.3261 -1.9436 2.1644⎪68.279.5 ⎪ ⎪ ⎪
3.5293 -3.1368 0.2088 0.3238 1.6454 0.3425 -0.0978 -0.6795 -2.2979 -1.0386⎪ 72⎪ 74.3⎪ 2.8553 -3.5223 1.5091 -0.3343 -3.4272 0.4735 0.0950 -0.4974 1.1124 0.1580⎪
⎪ ⎪ ⎪ 77⎪⎝71.5⎭⎝ 3.1643 -0.7778 1.3039 0.6426 -1.2763 4.2449 -3.3867 -2.6980 -5.0837 1.4254⎭ 79.6⎪⎝⎭
⎛0.2872 0.2530 6.5336 -1.2651 -0.0868 1.0755 2.1427 -1.4002 -0.9040 -2.2545 2.2967⎫
⎪ 4.6388 1.9893 3.1961 0.1793 -1.8244 -2.8278 -0.4200 -0.9896 -0.6345 -3.2802 0.2742⎪ 4.6674 1.5161 1.4683 2.7337 -4.3416 0.3863 0.2097 0.9764 0.1216 -2.4765 2.8720⎪ ⎪ 6.8441 2.5099 6.9881 -0.7582 -3.3657 -0.9792 0.3738 -0.4213 2.2093 -2.7121 1.0555⎪ 8.4784 1.8345 5.9569 1.6239 -4.2108 -1.1935 2.6865 -0.5877 -0.2085 -3.2274 -0.6700⎪ ⎪ 3.7085 -1.5321 4.8423 0.6031 -3.6127 -0.5343 -0.5188 -1.0567 -0.0433 -1.2263 -0.1590⎪ 3.8009 -2.8703 5.0135 0.4009 -3.4752 -1.3158 0.7303 -2.8399 3.2257 -3.3129 0.6168⎪ ⎪ -1.2125 4.4553 3.1465 0.5303 -2.0934 -3.2067 2.5090 1.4593 1.7575 0.1956 0.8492⎪ 5.6909 3.5016 2.0115 -0.2166 -2.5715 0.3309 1.5566 -0.3585 2.4239 -2.4725 0.7685⎪ ⎪ 4.9135 0.3105 3.9627 -0.1284 -0.1489 -0.2073 1.3236 -0.6012 0.7825 -1.0550 0.9082⎪ ⎪ 2.7090 0.9849 2.8205 -1.8747 -3.5344 -2.6005 0.3042 1.8681 1.3992 -2.4646 0.9024⎪ 3.6188 -0.0359 1.6228 -0.9459 0.1067 -1.2802 0.1274 0.5420 0.7894 -3.4482 -1.2299⎪ ⎪ -1.5673 -3.5274 2.7776 -2.1833 -2.7411 2.7789 -0.1305 -0.2257 0.5021 -4.7876 -1.1074⎪ 5.6958 1.0080 6.7735 -0.9345 -2.1357 -3.1686 1.9414 -1.0326 1.9906 -3.2338 -0.0857⎪
⎪W =
0.5630 -2.3966 2.5235 2.2776 -2.1127 -2.4372 -1.3538 -1.6655 -1.1254 -3.0181 0.6274⎪ -1.2532 3.6732 1.5427 -0.1670 -2.7044 -1.2008 1.8542 -3.5976 1.2068 -2.5181 1.2783⎪ ⎪ 3.4360 3.5931 6.1643 -2.1350 -4.8662 0.2061 -1.8192 -0.8364 -0.0167 -1.5346 0.5222⎪ ⎪ 2.1913 -1.9685 5.3358 0.8498 -2.9990 -2.9363 0.5699 -0.7687 1.6298 0.5824 0.4281⎪ 0.9301 3.5039 -1.2200 -0.0800 -1.7574 -0.9488 0.6216 -0.9487 -0.2293 -2.1647 -0.1970⎪ ⎪ 5.9003 1.4330 5.3724 0.8860 -3.4675 0.3661 2.9260 -1.2991 -0.5970 -1.8153 -1.3224⎪ 7.4246 2.9269 8.5546 -2.2902 -3.1610 -3.6377 2.0902 -0.5258 -0.5863 -2.9279 2.2867⎪ ⎪ 3.4487 3.2818 2.0618 -1.7938 -2.1262 0.4359 -1.1518 -2.1194 0.7033 -0.3697 -0.6298⎪ 7.7066 3.0996 5.4620 -1.1861 -3.3282 -3.4856 0.4545 -1.4092 0.0342 -2.6643 1.0984⎪ ⎪ 5.7028 -2.9311 1.5625 -0.3865 0.5237 0.2370 0.3012 -0.0642 0.6490 -0.9027 1.4557⎪ ⎪ 4.3161 1.8798 0.8360 0.4998 -0.9289 -1.8895 2.0056 -0.8379 -0.1756 -0.7022 0.4028⎪ 7.6345 2.2561 2.8175 -0.8154 -0.6079 -1.1602 -0.9461 -2.0458 1.4372 -2.7677 1.0519⎪ ⎪ 5.7961 -6.3437 -2.2381 -4.9454 -5.7922 0.5316 1.6996 -2.5288 -0.4965 -3.4670 0.3132⎪ 9.3657 1.4036 5.0201 0.6585 -4.6715 -0.2098 1.0771 -2.0718 1.9825 -4.2628 1.3449⎪⎝⎭
附录2:
附录3:R1
R2:
附录4:
附录5:
%白酒质量
%第一组红酒标准差
a=xlsread('C:\Documents and Settings\Administrator\桌面\qh1.xls'); for k=1:10:270 c=a(k:k+9,:);
h1(k,:)=sum(nanstd(c')); end
c=find(h1~=0); h1=h1(c,:);
%第二组红酒评价及质量
a=xlsread('C:\Documents and Settings\Administrator\桌面\qh2.xls'); for k=1:10:270 c=a(k:k+9,:);
h2(k,:)=std(sum(c)); h3(k,:)=mean(sum(c)); end
c=find(h2~=0); h2=h2(c,:); c=find(h3~=0); h3=h3(c,:);
%第一组白酒标准差
a=xlsread('C:\Documents and Settings\Administrator\桌面\qb1.xls'); for i=1:10:280 c1=a(i:i+9,:);
b1(i)=sum(std(c1')); end
c1=find(b1~=0); b1=b1(c1)
%第二组白酒标准差及质量
a=xlsread('C:\Documents and Settings\Administrator\桌面\qb2.xls'); for k=1:10:280 c=a(k:k+9,:);
b3(k,:)=sum(std(c')); b4(k,:)=mean(sum(c)); end
c=find(b3~=0); b2=b3(c,:); c=find(b4~=0); b4=b4(c,:);
%红酒葡萄主成分分析
a=xlsread('C:\Documents and Settings\Administrator\桌面\h.xls'); for k=1:30
a(:,k)=(a(:,k)-mean(a(:,k)))./std(a(:,k)); end
r=corrcoef(a); [u,v]=eig(r);
v=flipud(diag(v))./sum(diag(v)); v1=cumsum(v); u=fliplr(u); u=u(:,1:10); p=a*u;
%白、红酒等级 for k=1:28
if b4(k)>=90
disp([num2str(k),'一']); elseif b4(k)>=80
disp([num2str(k),'二']); elseif b4(k)>=70
disp([num2str(k),'三']); elseif b4(k)>=60
disp([num2str(k),'四']); else
disp([num2str(k),'五']); end end
%白酒葡萄主成分分析
a=xlsread('C:\Documents and Settings\Administrator\桌面\b.xls'); for k=1:30
a(:,k)=(a(:,k)-mean(a(:,k)))./std(a(:,k));
r=corrcoef(a); [u,v]=eig(r);
v=flipud(diag(v))./sum(diag(v)); v1=cumsum(v); u=fliplr(u); u=u(:,1:11); p=a*u;
%红葡萄理化指标和红葡萄酒质量 syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x1^2+beta(13)*x2^2+beta(14)*x3^2+beta(15)*x4^2+beta(16)*x5^2+beta(17)*x6^2+beta(18)*x7^2+beta(19)*x8^2+beta(20)*x9^2+beta(21)*x10^2; for k=1:27 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10); y1(k)=subs(y); end
double(mean(abs(y1-h3')./h3'));
%白葡萄酒理化指标和白葡萄酒质量 syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x1^2+beta(13)*x2^2+beta(14)*x3^2+beta(15)*x4^2+beta(16)*x5^2+beta(17)*x6^2+beta(18)*x7^2+beta(19)*x8^2+beta(20)*x9^2+beta(21)*x10^2; for k=1:27 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10); y1(k)=subs(y);
double(mean(abs(y1-b4')./b4'));
%红葡萄理化指标与红葡萄酒理化指标 rstool(p,a1(:,1),'linear',0.05);
a1=xlsread('C:\Documents and Settings\Administrator\桌面\hj.xls'); syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x11+beta(13)*x1^2+beta(14)*x2^2+beta(15)*x3^2+beta(16)*x4^2+beta(17)*x5^2+beta(18)*x6^2+beta(19)*x7^2+beta(20)*x8^2+beta(21)*x9^2+beta(22)*x10^2+beta(23)*x11^2;
for k=1:28 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10); x11=p(k,11); y1(k)=subs(y); end
double(mean(abs(y1-a1(:,1)')./a1(:,1)')) %白葡萄理化指标与白葡萄酒理化指标 rstool(p,a1(:,1),'linear',0.05);
a1=xlsread('C:\Documents and Settings\Administrator\桌面\bj.xls'); syms x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11
y=beta(1)+beta(2)*x1+beta(3)*x2+beta(4)*x3+beta(5)*x4+beta(6)*x5+beta(7)*x6+beta(8)*x7+beta(9)*x8+beta(10)*x9+beta(11)*x10+beta(12)*x11+beta(13)*x1^2+beta(14)*x2^2+beta(15)*x3^2+beta(16)*x4^2+beta(17)*x5^2+beta(18)*x6^2+beta(19)*x7^2+beta(20)*x8^2+beta(21)*x9^2+beta(22)*x10^2+beta(23)*x11^2;
for k=1:28 x1=p(k,1); x2=p(k,2); x3=p(k,3); x4=p(k,4); x5=p(k,5); x6=p(k,6); x7=p(k,7); x8=p(k,8); x9=p(k,9); x10=p(k,10);
x11=p(k,11); y1(k)=subs(y); end
double(mean(abs(y1- a1(:,1)'). a1(:,1)'));