葡萄级别 Z值范围 优质 较好 0.4~0,不含0.4 普通 0~-0.5,不含0 劣质 ?0.4 ?-1.5
从而分级如下:
红葡萄:优质----样品8,23,3,1
较好----样品2,17,9,11,14,5,24,12
普通----样品22,20,6,26,21,19,18,16,13,15,27,4,7
劣质----样品25,10
白葡萄:优质----样品5,27,20,28,25,3
较好----样品23,7,26,14,12,10,9
普通----样品6,24,22,21,15,23,2,19,4,16 劣质----样品18,8,1,17,11.13
5.2.3 结论的进一步分析
综合以上两种方法所得出的结果,我们可以发现:葡萄的总糖、还原糖、蛋白质、氨基酸含量越高,等级越优。
5.3 问题3的模型建立与求解 5.3.1模型的建立
要求分析酿酒葡萄和葡萄酒的理化指标之间的关系,可以分别研究红、白葡萄酒,多方面、多层次地建立相关性系数模型。
根据相关性分析法理论基础可知:对有多个变量的关系,可设其中任意两个随机变量X与Y,对其进行了n次随机试验,得到的观测值分别为 (XiYi)(i=1,2,???n),
X、Y:分别为各自的平均值,R为随机变量和Y对于以上样本的相关性系数,称之为样本相关系数。在实际中,常常用样本相关系数R作为相关系数r的估计值。
根据以上理论知识可建立以下相关性系数模型:
对有多个变量间的关系,其中随机变量X和Y可表示其中任意两个随机变量。
11
对这个问题,首先,研究葡萄酒各理化指标与酿酒葡萄成分的相关性;
然后,结合问题2中的结论,进一步研究酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的相关性。
5.3.2模型的求解
Step1:分析葡萄酒各理化指标与酿酒葡萄理化指标的相关性 以红葡萄为例:
1) 使用Excel,对葡萄酒各理化指标与酿酒葡萄理化指标间的关系进行很好的相关性分析,所得结果见表5.8(详细见附录五)。
表5.8 酿酒葡萄的理化指标与葡萄酒理化指标间的相关系数列表(红葡萄)
酒 花色色泽色泽单宁 ...... 葡萄 苷 a* b* 氨基酸 0.106 0.496 -0.100 0.356 ...... 蛋白质 0.296 0.471 -0.033 0.047 ...... ...... ...... ...... ...... ...... ...... 苹果酸 0.693 0.298 -0.559 -0.310 ...... 果皮颜色a* -0.369 -0.298 -0.542 -0.064 ...... 果皮颜色b* -0.129 -0.121 -0.626 0.025 ......
2) 通过纵向比较,可以得出葡萄酒各理化指标与酿酒葡萄理化指标的联系: (1) 红葡萄酒花色苷与酿酒葡萄各理化指标的相关性分析
从分析结果的第一列中,我们可以看出酿酒葡萄的花色苷成分与葡萄酒的花色苷呈显著正相关,且相关系数绝对值最大,联系最为密切;葡萄的苹果酸、褐变度、自由基、总酚、单宁也与葡萄酒的花色苷呈正相关。 (2) 红葡萄酒单宁与酿酒葡萄各理化指标的相关性分析
由上表第二列可知,酿酒葡萄的花色苷、总酚、单宁、葡萄总黄酮、黄酮醇均
与葡萄酒的单宁呈显著正相关,其中总酚和单宁与之联系最密切;葡萄的色泽L*与葡萄酒的单宁呈负相关。
(3) 红葡萄酒总酚与酿酒葡萄各理化指标的相关性分析
由上表第三列可知,葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒的总酚呈显著正相关,其中葡萄总酚的相关系数绝对值最大,联系最为密切;色泽L*与之呈负相关。
(4) 红葡萄酒的酒总黄酮与酿酒葡萄各理化指标的相关性分析
由上表第四列可知,葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒的总酚呈显著正相关,其中葡萄总黄酮的相关系数绝对值最大,联系最为密切;色泽L*与之呈负相关。
(5) 红葡萄酒的白藜芦醇与酿酒葡萄各理化指标的相关性分析
由上表第四列可知,葡萄总黄酮与葡萄酒的白藜芦醇呈正相关,但值得注意的
是,葡萄的白藜芦醇含量与葡萄酒的白藜芦醇含量并无显著关系。
(6) 红葡萄酒的DPPH半抑制体积与酿酒葡萄各理化指标的相关性分析
由上表第四列可知,葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒的DPPH半抑制体积呈显著正相关,其中葡萄总酚的相关系数绝对值最大,联系最为密切;
12
(7) 红葡萄酒的色泽与酿酒葡萄各理化指标的相关性分析
葡萄的花色苷、自由基、总酚、单宁、葡萄总黄酮与葡萄酒的色泽L*呈显著负相关,其中花色苷的相关系数绝对值最大,联系最为密切;葡萄果皮颜色L*、a*、b*呈正相关,其中色泽a*的相关系数绝对值较大,联系较为密切;
葡萄的苹果酸、果皮颜色b*与葡萄酒色泽a*呈显著负相关;葡萄的还原糖与葡萄酒的色泽b*呈显著正相关; Step2:分析酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的相关性
1) 综合以上7条具体分析,我们还可以做适当总结归纳:葡萄的花色苷、自由基、总
酚、单宁、葡萄总黄酮之间的相关性很强,所以可以将之归为一类,从而将葡萄的理化指标降维,将多变量化为少变量,从而优化了模型三,对应的葡萄酒各理化指标与酿酒葡萄质量的相关系数,见表5.9。
表5.9 酿酒葡萄质量与葡萄酒理化指标间
的相关系数列表(红葡萄)
葡萄酒DPPH花色酒总白藜色泽理化指单宁 总酚 半抑制a* b* 苷 黄酮 芦醇 L* 标 体积 酿酒葡-0.490.140.634 0.704 0.698 0.633 0.171 0.579 -0.586 萄质量 6 0 由表5.9可知,葡萄酒的花色苷、单宁、总酚、酒总黄酮、DPPH半抑制体积与酿酒红葡萄的综合评价指标呈明显正相关,其中单宁的相关系数绝对值最大,联系最为密切;白藜芦醇、色泽b*与之呈正相关,但联系不大;色泽L*、a*与酿酒葡萄的综合评价指标呈明显负相关。
2同理,白葡萄酒的各理化指标与酿酒葡萄的综合评价指标的相关系数关系,见○表5.10。
表5.10 酿酒葡萄质量与葡萄酒理化指标间
的相关系数列表(白葡萄)
DPPH半酒总白藜芦色泽单宁 总酚 抑制体黄酮 醇 L* 积 葡萄酒理化指标 a* b* 酿酒葡萄0.271 0.286 0.322 -0.023 0.038 -0.482 -0.190 0.466 质量 由表5.10可知,,葡萄酒的单宁、总酚、酒总黄酮、色泽b*与酿酒白葡萄的综合评价指标呈正相关,其中单宁的相关系数绝对值最大,联系最为密切;DPPH体积抑制比也与之呈正相关,但联系不大;白藜芦醇、色泽L*、a*与酿酒葡萄的综合评价指标呈负相关,其中色泽L*与之联系最密切。
13
5.4 问题4的模型建立与求解 5.4.1第一小问模型的建立
欲分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,可对酿酒葡萄、葡萄酒的理化指标与葡萄酒质量做回归分析,建立回归模型。也可用SPSS或Matlab对酿酒葡萄、葡萄酒的理化指标与葡萄酒质量进行相关性分析。
多元线性回归模型如下:
Y??0??1X1??2X2?......??pXp??对于n组观测值,其方程组形式为
Y?X???即
Y表示因变量,Xi(i=1,?,p)表示自变量,ε表示随机误差项。
模型假设: ⑴零均值假设:
E??i??0⑵同方差:
i=1,2,?,n
Var??i???2⑶无自相关:
⑷误差与自变量不相关:
Cov?Xik,?i??0 i=1,2,?,n, k=0,1,?,p
⑸自变量之间无多重共线性
rank?X??p?1
此题,采用两种方法来分析。
14
方法一:回归分析法
首先,进行数据预处理。运用SPSS软件结合因子分析法简化指标,得到相应的自变量和因变量,对其做回归分析,建立回归模型;
然后,运用SPSS软件对其进行数据拟合分析。设定其多元线性回归模型为:
W?70.515?1.149X1?0.378X2?...?0.076X8?1.172Y1?0.519Y2
运用SPSS软件对此进行拟合调试与分析,由于测试数据存在不全面及缺漏现象,这将会影响到整体的拟合优度,所以在建立回归模型时,分别采用强迫引入法、逐步回归法、强迫剔除法、向后逐步法、向前逐步法进行多元线性回归尝试,通过分析其拟合优度、回归方程显著性、回归系数显著性,选择最佳模型;
接着,比较分析,确定最佳模型。将降维后的各因子得分作为葡萄样本的分析数据,做上述5种方法的尝试,比较得出效果最好的模型。
最后,检验模型。分别进行回归方程的拟合优度R2的检验、回归方程的显著性F与回归系数显著性sig的检验、残差检验。 方法二:综合评价法(和问题2的方法二类似)
确定降维后各因素的权重,再建立综合评价模型。 首先,运用matlab对数据指标进行归一化处理;
然后,运用因子分析法结合SPSS软件来用较少的相互独立的因子变量来代替原来指标的大部分信息;
接着,运用层次分析法(AHP)结合matlab软件来排出各新指标的影响力顺序和对应的的权重,设权重系数向量为W;
接着,对权重系数向量Q进行一致性检验;
最后,构建综合评价指标W,W?K*Q,K表示新指标数值向量,即有
W?k1q1?k2q2?...?kiqi
第一小问模型的求解 方法一:回归分析法
1数据预处理 ○
分析酿酒葡萄和葡萄理化指标对葡萄酒质量的影响,因附件2中的各理化指标过多,所以用SPSS软件用因子分析法将酿酒葡萄的理化指标(一级指标)简化得8个因子X1、X2…X8,葡萄酒的理化指标(一级指标)简化得2个因子Y1、Y2,因此得到10个自变量,与应变量葡萄酒质量W。
2运用SPSS软件对其进行数据拟合分析 ○
设定其多元线性回归模型为:
W?k?a1X1?a2X2?...?a8X8?b1Y1?b2Y2
15