聚类分析图示(二)
根据图表内容,将酿酒红葡萄分为4类:
(2)对酿酒白葡萄进行分类: 同3(1),在SPSS中运行程序,得到如下图表(详见附录一): Cluster Membership
4 Clus
Case ters 1:葡萄样品1 1 2:葡萄样品2 1
9
3:葡萄样品3 1 4:葡萄样品4 1 5:葡萄样品5 1 6:葡萄样品6 1 7:葡萄样品7 1 8:葡萄样品8 2 9:葡萄样品9 1 10:葡萄样品10 3 11:葡萄样品11 1 12:葡萄样品12 4 13:葡萄样品13 3 14:葡萄样品14 4 15:葡萄样品15 1 16:葡萄样品16 2 17:葡萄样品17 1 18:葡萄样品18 1 19:葡萄样品19 2 20:葡萄样品20 1 21:葡萄样品21 1 22:葡萄样品22 2 23:葡萄样品23 1 24:葡萄样品24 3 25:葡萄样品25 2 26:葡萄样品26 1 27:葡萄样品27 3 28:葡萄样品28 1
根据图表内容,将酿酒白葡萄分为4类:
5.3 分析酿酒葡萄与葡萄酒的理化指标之间的联系
5.3.1 计算酿酒葡萄与葡萄酒的理化指标的相关系数—偏相关系数 1.偏相关的有关概念
在研究多个变量之间的相关关系时,由于变量间常常是相互影响的,因而两个变量间的简单相关(直线相关)系数往往不能正确确定两个变量间的真正关系,有时甚至是假象。只有在排除其他变量影响的情况下,计算它们之间的偏相关系数(partial correlation coefficient),才能真正地解释他们之间的内在联系。偏相关系数是在多元相关分析中说明当某个自变量在其他自变量固定不变时,分别同因变量线性相关程度指标。偏相关系数的取值范围亦在-1到+1之间。
10
2.建立模型
(1)偏相关系数的计算公式:
当有一个控制变量z时,变量x与y的偏相关公式(或称零阶相关系数)为:
rxy,z=
?1?r??1?r?22xzyzrxy?rxzryz
当有两个控制变量z1,z2时,变量x与y的偏相关公式如下:
rxy,z1z2=
r?1?r??1?rxy?z121r?rxz?z2xz2?z1yz2?z12yz2?z1?
(2)对相关系数的检验方法
再偏相关分析中,由于两个变量之间相关系数是在固定(控制)了一个或某几个变量后进行的,考虑到这种因素及抽样误差的影响,其检验统计量为:
?knrt=
1?r?22
3.模型求解:
(1)分析酿酒红葡萄与红葡萄酒的理化指标之间的偏相关系数:
通过SPSS,利用相关分析,计算出酿酒红葡萄与红葡萄酒的理化指标之间的相关系数,如表:
酿酒葡萄与葡萄酒的理化指标之间的相关系数--红葡萄
酒-DPPH半抑制体积(IV50) 1/IV50(L*(Da*(DuL) 65) 65) .400 -.236 -.100
氨基酸总量mg/100gfw 蛋白质mg/100g VC含量(mg/L) 花色苷mg/100g鲜重 酒石酸(g/L) 苹果酸(g/L) 柠檬酸(g/L) 多酚氧化酶活力E(A/min·g·
酒-花色苷(mg/L) .106 酒-单宁(mmol/L) .496 酒-总酚(mmol/L) .336 酒总黄酒-白藜酮芦醇(mmol/L) (mg/L) .201 .334 b*(D65) .356 .296 .471 .435 .438 -.099 .709 -.005 -.028 .200 .384 -.484 -.033 -.122 .122 .047 -.089 -.092 -.129 .923 .720 .774 .107 -.368 .671 -.834 -.349 -.240 .034 .693 .380 .481 .281 .298 .145 .142 .271 .353 .139 .154 .157 .267 -.082 .124 .218 -.186 -.204 -.128 .237 -.243 .010 .462 .246 -.346 -.559 -.310 .018 -.254 -.269 -.015 .074 -.411 -.007 .102 11
ml) 褐变度ΔA/g*g*min*ml DPPH自由基1/IC51(g/L) 总酚(mmol/kg) 单宁(mmol/kg) 葡萄总黄酮(mmol/kg) 白藜芦醇(mg/kg) 总糖g/L 还原糖g/L 可溶性固形物g/l PH值 可滴定酸(g/l) 固酸比 干物质含量g/101g 果穗质量/g 百粒质量/g 果梗比(%) 出汁率(%) .767 .445 .459 .443 -.095 .381 -.564 -.335 -.244 .567 .753 .814 .764 .421 .778 -.707 -.123 -.055 .613 .661 .441 .817 .718 .684 .875 .743 .815 .883 .701 .823 .459 .315 .567 .874 -.754 -.168 .055 .701 -.677 -.093 -.204 .813 -.609 -.067 .048 -.035 .052 -.068 .190 -.019 .049 .320 .410 .235 .076 .193 .236 .144 .047 .193 -.015 .248 .285 -.180 .323 .245 -.237 -.248 .298 .482 .014 .155 -.003 .007 .179 .109 -.093 .076 .076 -.045 .192 .257 .073 .162 -.449 -.110 .376 .567 .248 .018 .074 .067 .392 .265 -.061 -.185 .077 .017 -.200 .313 -.147 -.178 .232 -.135 -.087 -.061 .198 .266 .087 -.007 -.216 -.066 -.115 .315 .230 .238 .415 .239 .296 .217 -.246 -.435 .330 -.204 -.249 -.196 -.229 .021 .309 -.104 -.267 -.184 -.263 -.329 -.255 .501 .328 .473 .360 .401 .398 .223 -.037 .150 -.176 .333 -.473 -.063 -.090 .423 -.440 -.008 -.100 我们规定两者的相关系数绝对值大于0.6时,认为两者的相关性显著。从而筛选出与红葡萄酒理化指标相关性显著的酿酒红葡萄的理化指标。
从表中可以发现:
1酿酒红葡萄中的花色苷、苹果酸、褐变度、总酚、单宁与红葡萄酒中的○
花色苷的相关性较为显著;
2酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮与红葡○
萄酒中的单宁的相关性较为显著;
3酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮与红葡○
萄酒中的总酚的相关性显著;
4酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮与红葡○
萄酒中的酒总黄酮的相关性显著;
5酿酒红葡萄中葡萄总黄酮与红葡萄酒中白藜芦醇的相关性显著; ○
6酿酒红葡萄中的花色苷、DPPH自由基、总酚、单宁与葡萄酒中的DPPH○
半抑制积的相关性显著;
7酿酒红葡萄中花色苷、DPPH自由基、总酚、单宁葡萄总黄酮与红葡萄酒○
中色泽L*呈现较大相关性;
12
8酿酒红葡萄中苹果酸与红葡萄酒色泽A*的相关性较为显著; ○
9酿酒红葡萄中还原糖与红葡萄酒色泽B*的相关性较为显著。 ○
(2)分析酿酒白葡萄与白葡萄酒的理化指标之间的联系:
同上,通过SPSS,利用相关分析,计算出酿酒白葡萄与白葡萄酒的理化指标之间的相关系数,如表(见附录二):
我们规定两者的相关系数绝对值大于0.5时,认为酿酒白葡萄中的某项理化指标与白葡萄酒中的某种成分的相关性显著。从而筛选出与白葡萄酒理化指标相关性显著的酿酒白葡萄的理化指标。
我们发现:
1酿酒白葡萄中的单宁、葡萄总黄酮与白葡萄酒中的单宁的相关性显著; ○
2酿酒白葡萄中的单宁、葡萄总黄酮、总酚与白葡萄酒中的总酚的相关性○显著;
3酿酒白葡萄中的蛋白质、总酚、葡萄总黄酮与白葡萄酒中的酒总黄铜的○
相关性显著;
4酿酒白葡萄中的可溶性固形物、干物质含量与白葡萄酒中的色泽L*的相○
关性显著;
5酿酒白葡萄中的果梗比、果穗与白葡萄酒中的色泽A*的相关性显著; ○
6酿酒白葡萄中的可溶性固形物、干物质含量、出汁率与白葡萄酒中的色○
泽B*的相关性显著。
5.3.2分析酿酒葡萄与葡萄酒的理化指标之间的联系———回归分析模型(多元线性回归)
1.多元线性回归分析概念
多元线性回归分析是多元回归分析(multiple regression analysis)中最为简单而又最常用的一种分析方法。其原理与直线回归分析的完全相同,但是要涉及到一些新概念,在计算上要复杂得多,当自变量较多时要借助于电脑进行计算。许多非线性回归(no-linear regression)问题都可转变为线性回归来解决。进行多元线性回归分析的基本任务是根据各自变量的实现观察值建立依变量与各自变量之间的线性回归方程,以揭示依变量与各自变量之间的具体线性联系形式,其目的在于所建立的线性回归方程进行预测和控制。
2.模型建立
(1)多元线性回归方程的建立
设变量?1,?2,?,?m,?有n组观察数据,其中?1,?2,?,?m为自变量,
?为依变量。第k组观察值(k=1,2,?,n)可表示为(
k?,?1k2k,?,?mk,
?),是m+1维空间中的一个点。 如果依变量?同时受到m个自变量
?,?,?,?12m的影响,且这m个自变
量都与?成线性关系,则这m+1个变量的关系就形成m元线性回归。因此,一个m元线性回归的数学模型为
??a?a??a?式中,a,a,a,?,ak011k22k???am?mk??k
1?k2?1,2,?,n
m?012m为m?1个待估参数;
13
?,?,?,?为可精确测