好文档 - 专业文书写作范文服务资料分享网站

2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文

天下 分享 时间: 加入收藏 我要投稿 点赞

典型相关分析原理是预测两组变量之间相关程度的一种多元统计方法。本题研究的是酿酒葡萄与葡萄酒的理化性质之间的联系。因此,运用典型相关分析解决问题。由于葡萄的理化指标与葡萄酒的理化指标的数量都较大,所以本文只选取相对比较重要的葡萄与葡萄酒的的理化指标进行分析。

任意选取几组数据,利用MATLAB程序,做出两组变量之间的散点图,如图1。由图形可以看出该两组变量呈线性相关。

图1 两个变量之间的关系

记:X??x1,x2,x3,x4,x5,x6? ,Y??y1,y2,y3,y4,y5,y6? 即原始矩阵为:

?x11x12?x1py11y12?y1q??x?x?xyy?y22p21222q??21

??????xx?xyy?y?n2npn1n2nq??n1?其中样本容量为n=27(红葡萄酒)或28(白葡萄酒),附录中的数据用SPSS 软件计算得十二个变量之间的相关矩阵如下

R = ??R11?R21R12? ?R22? 11

其中R11,R22分别为酿酒葡萄和葡萄酒的理化指标的变量的相关矩阵,

R12?R21'为酿酒葡萄理化特性的变量和葡萄酒理化指标的相关系数。

计算矩阵

A?R?111R12R?122R21B?R?122R21R?111R12

?2和特征向量 特征值?i??R?1RR?1R12 ?(i):BD1?222111?(i)?D?1(D??(i)) ?(i)?D1?1(D1??(i)),?推出 ?22写出27个(28个)样本的典型变量:

?(1)Y???????(1)X,VU11?(2)Y???????(2)X,VU22 ?(P)Y???????(P)X,VUPP首先,检验第一对典型变量的相关系数,即

??0,H:???0 H0:?111它的似然比统计量为

p?2)(1???2).........(1???2)??2) ?1?(1???(1??12Pij?1则统计量

1Q1??[n?2?(p?q?1)]ln?1

2,查表得x2?,若Q1?x2?。则否定H0,认为第一对典型

给定显著性水平?变量相关,否则不相关。如果相关则依次逐个检验其余典型相关系数,直到某一

?k(k=2,?,个相关系数?p)检验为不显著为止,用SPSS得出的结果只能

说明两组变量之间的相关程度高,并不能准确的反映两者的关系。因此建立多元

回归模型来准确分析其中的关系。 5.3.2模型三的求解

对红葡萄与红葡萄酒的处理:利用问题二中在红葡萄的理化指标中筛选出来的六种理化指标花色苷、干物质含量、顺式白藜芦醇苷、山萘酚、谷氨酸、固酸比作为红葡萄理化指标的一组代表。然后,利用主成分分析法和SPSS软件对红葡萄酒的量化指标进行筛选,选出总酚、酒总黄酮、白藜芦醇、DPPH半抑制体积、色泽H(D65)、色泽C(D65)作为对葡萄酒理化指标的另一组代表。(见附录

12

3.1)

用SPSS软件得出的结果只能说明两组变量之间的相关程度高,并不能准确的反映两者的关系。因此建立多元回归模型来准确分析其中的关系。 5.3.3模型三的检验

多元线性回归分析的模型为

??y=?0+?1x1+???+?mxm+ (14) ?2~N0,?????式中?0,?1,???,?m,?2都是与x1,x2,???,xm无关的未知参数,其中?0,?1,???,?m称为回归系数。

现得到n个独立观测数据?yi,xi1,???,xim?,i=1,???,n,n>m,由得由?14?得

??yi=?0+?1xi1++?mxim+i (15) ?2??i~N?0,??,i=1,,n记

?1x11X=????1xn1=?1x1m??y1??, Y=?? (16) ????xnm???yn??n?T,?=??0?1?m?

T式(16)可表示为

??Y=X?+ (17) ?2~N0,?E?n???其中En为n阶单位矩阵。 多元二项式回归分析模型为:

y=?0+?1x1+???+?mxm???jjxj2 (18)

j?1m式中?0,?1?,??,m?,?11,mm?都是与x1,x2,???,xm无关的未知参数,其中

?0,?1,???,?m,?11,?mm称为回归系数。

现有n个独立观测数据?yi,xi1,???,xim?,i=1,???,n,n>m,由得由(14)得

yi=?0+?1xi1+???+?mxim???jjxij2 (19)

j?1m记

13

?1x11?X=??1xn1?x1mxnmx112xn12x1m2??y1???? (20) Y=, ???2??xnm??yn??,?m,?11,,?mm?T?=??0,?1,

通过问题二本文确定了影响酿酒葡萄质量的因素有总氨酸、固酸比、总酚、

单宁、花色苷,以下分别以数字编号1~5表示。确定的葡萄酒的理化指标有单宁、总酚、酒总黄酮以下分别以数字编号1~4表示。利用经过筛选的数据建立模型如下(以白葡萄酒的理化指标对酿酒葡萄最重要因素为例):

??y=?0+?1x1+???+?4x4+ (21) ?2~N0,?????现有25个独立观测数据?yi,xi1,???,xi4?,i=1,???,25,由得由(14)得

??yi=?0+?1xi1++?4xi4+i ?2??i~N?0,??,i=1,,25记

?1x11X=????1x251=?125x14??y1??, Y=?? (22) ????x254???y25???T,?=??0?1?4?,xij表示第i种葡萄的第j种因素的值。yiT表示第i种葡萄最重要因素值。

?22?式表为

??Y=X?+ ? (23) 2??~N?0,?E25?其中E25为25阶单位矩阵。

将题目中的数据代入上述公式,经过Matlab求解得:

y1?0.0193?0.556x1?0.0573x3?0.0301x4

利用同样的方法求得y2,y3,y4,y5的表达式如下:

y2?0.0164?0.9294x1?0.5377x2?0.0659x3?0.1579x4;y3?0.0277?11.2907x1?11.5177x2?0.0486x3?0.0423x4;y4?0.0013?0.7596x1?0.1667x2?0.0019x3?0.0039x4; y5?0.0165?2.1468x1?2.0311x2?0.3416x3?0.0106x4; 14

利用28组数据建立多元二次回归模型如下(以白葡萄酒的理化指标对酿酒葡萄最重要因素为例):

y=?0+?1x1+???+?4x4???jjxj2 (24)

j?14现有n个独立观测数据?yi,xi1,???,xi4?,i=1,???,25,由得由(14)得

yi=?0+?1xi1+???+?4xi4???jjxij2 (25)

j?14记

?1x11?X=??1x251?x14x25mx112x2512x142??y1????(26) Y=, ???2??x254??y25??,?44?T?=??0,?1,,?4,?11,

将28组数据代入上述模型利用Matlab求解结果如下:

Y1?0.019?26.3259x1?26.9798x2?0.2487x3?0.0365x4?557.6351x?559.5212x2?0.822x3?0.3655x4通过Matlab拟合得到的多元线性回归方程(以y1为例)为:

21222

y1?0.0193?0.556x1?0.0573x3?0.0301x4

二次曲线回归模型:

Y1???1X1??2X12??3X13

通过Matlab拟合得到回归方程:

Y1?0.019?26.3259x1?26.9798x2?0.2487x3?0.0365x4?557.6351x?559.5212x2?0.822x3?0.3655x421222

对于y1由Matlab程序求解得出残差S12?0.0001;对于Y1由Matlab求解得

S22?0.0064,则线性回归模型优于二次回归模型。

综合比较两残差的平方和的大小可以确定一次回归模型较为理想,因此,本文选取多元线性回归模型描述酿酒葡萄与葡萄酒的理化指标之间的联系,其结果如下:

15

2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文

典型相关分析原理是预测两组变量之间相关程度的一种多元统计方法。本题研究的是酿酒葡萄与葡萄酒的理化性质之间的联系。因此,运用典型相关分析解决问题。由于葡萄的理化指标与葡萄酒的理化指标的数量都较大,所以本文只选取相对比较重要的葡萄与葡萄酒的的理化指标进行分析。任意选取几组数据,利用MATLAB程序,做出两组变量之间的散点图,如图1。由图形可以看出该两组
推荐度:
点击下载文档文档为doc格式
7jeui5qj6p1klhl34qpy
领取福利

微信扫码领取福利

微信扫码分享