好文档 - 专业文书写作范文服务资料分享网站

对葡萄酒的评价分析-2012年全国大学生数学建模竞赛A题

天下 分享 时间: 加入收藏 我要投稿 点赞

对葡萄酒的评价分析

摘要

本文主要应用数理统计中的t检验法,回归分析法等方法对葡萄酒的评价的相关问题进行了分析,建立相应的模型。

针对问题一,首先,对样本进行K-S检验得出数据取自的总体服从正态分布,进而运用成对数据t检验法进行检验,得出两组评酒员对每种葡萄酒的总评分有显著差异;在此基础上,采用两种方法分别判断哪组评酒员的可信度更高。方法一是计算出每组评酒员对每种葡萄酒的总评分的置信区间,评分处于置信区间内的人次百分比较高的一组可信度较高;方法二是比较两组评酒员对每种葡萄酒的总评分的方差的大小,总体方差分布较小的一组,可信度较高。两种方法均得出了同一结论,即第二组评酒员的结果更可信。

针对问题二,基于问题一得到的结论,建立了酿酒葡萄品质的综合评价模型。首先,对数据指标进行归一化处理,并计算出酿酒葡萄与各指标因素间的相关系数。然后,分别用层次分析法和因子分析法确定了各指标因素的权重。最后,利用确定的权重,建立了酿酒葡萄品质的综合评价模型,对葡萄进行分级。如,优质的红葡萄样品是8、23、3、1。

针对问题三,从两个层次建立相关性系数模型。首先,运用Excel软件分析葡萄酒各理化指标与酿酒葡萄成分的相关性;然后,进一步分析酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的联系。得出结论:酿酒葡萄的花色苷成分与葡萄酒的花色苷呈显著正相关。

针对问题四,分别建立回归分析模型和综合评价模型,其中综合评价模型建立方法同问题二,回归分析模型则先将葡萄和葡萄酒的各理化指标进行因子分析法降维后得数量较少的因子变量,对简化后的新指标进行回归分析,此处尝试用SPSS软件的回归分析中5种回归拟合方法,继而选取拟合度最佳的模型,得回归系数,建立多元线性回归方程分析各理化指标对葡萄酒质量的影响;将新指标得分带入方程,可求得线性拟合后的葡萄酒质量评分。进一步引入芳香物质作为评判指标,同样建立线性回归模型求得葡萄酒质量评分,将有无引入芳香物质作为指标的质量评价结果分别与可信度较高的评酒员对葡萄酒的评价结果进行回归模型检验比较和差值平方和比较,得到结论用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是完全可行的,但加入芳香物质作为评价指标更能准确合理地评价葡萄酒的质量。

关键词:葡萄酒评价;层次分析法;综合评价模型;因子分析法;SPSS;回归模型

1

一.问题重述

葡萄酒质量一般由每个评酒员对葡萄酒进行品尝后的得分来评判。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。由附件1某一年份一些葡萄酒的评价结果,附件2和附件3该年份这些葡萄酒的和酿酒葡萄的成分数据,现要求建立数学模型分析以下问题: 1. 附件1中两组评酒员的评价结果有无显著性差异,并判断可信度。 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

二. 问题分析

1. 欲尽量减小分析工作量和评分员主观因素的影响,应先进行数据预处理。 2. 欲判定两组评酒员的评价结果的差异是否显著,可用统计学的t检验方法,从而需要对样本数据进行正态性检验;比较可信度,需利用置信区间或方差。

3. 欲对酿酒葡萄分级,可建立综合评价模型,其中需要进行权重分配。可运用相关性系数基础上的层次分析法(AHP)结合matlab软件,也可运用因子分析法结合SPSS软件。

4. 欲分析酿酒葡萄与葡萄酒的理化指标之间的联系,可以直接对各指标进行相关性分析,也可以在此基础上进行优化,将葡萄的综合评价得分与葡萄酒的理化指标进行相关性分析。

三.模型的基本假设与说明

1. 假设第一级理化指标影响比第二级理化指标更为显著,那么可以只考虑第一级理化指标的影响 ;

2.假设给两组评酒员提供的同种葡萄酒样品是从同一瓶葡萄酒中同时取出的;

3.用K-S检验出一组样本呈正态分布后,因另一组样本与之品质相同,故可假设这组样品也呈正态分布;

4. 假设所有的关联程度均是线性关系的体现。

2

四.符号说明

X1 、Y1 两组评酒员对每种红葡萄酒的平均评分的样本 两组评酒员对每种红葡萄酒的平均评分的样本平均值 第一组评酒员对每种白葡萄酒的平均评分的样本 两组评酒员对每种白葡萄酒的平均评分的样本平均值 样本X的数据个数 样本Y的数据个数 置信度 判断矩阵的最大特征值 判断矩阵的最大特征值的特征向量 权重系数向量 指标数值向量 综合评价指标Z?k1?w1?k2?w2????ki?wi

X1、Y1 X2、Y2 X2、Y2 m n ?

?max ? W K

Z 五.模型的建立与求解

5.1 问题1的模型建立与求解

5.1.1第一小问模型的建立

欲判断两组评酒员的评价结果的差异是否显著,应建立两组评酒员的非参数检验模型,横向比较,验证样本服从正态分布后,对两组评酒员的评分进行t检验。

首先,对数据进行预处理、选择样本,并运用SPSS软件检验其正态分布性; 然后,用matlab计算两个样本X、Y的平均值。当两个平均值相差不大时,统计量

T=X-Y应该服从自由度为m+n-2的t分布; 11Sw?mn3

?(m?1)Sx2?(n?1)Sy2?Sw?m?n?1??1m?(Xi?X)2?Sx??m?1i?1??1n(Yi?Y)2?Sy??n?1i?1??

接着,使用函数[h,sig,ci]=ttest2(X,Y,?,tail) 进行此种检验,先默认tail=0进行双边检验,若h=0, 则根据X-Y的理论值所在的1-?区间来判定tail为1或-1,继续进行单边检验;

最后,若检验得出接受备选假设,那么,两样本的差异显著。

第一小问模型的求解

步骤:

1对数据进行预处理,剔除异常数据,如第一组第7名评酒员对第三种白葡萄酒口○

感分析的评分异常(见表5.1),将其总分剔除 。

表5.1 第一组评酒员对白葡萄酒的样品三的持久力的评分 第一组评酒员序 号 对白葡萄酒样品3的持久性评分 1 2 3 4 5 6 7 8 9 10 7 5 7 5 6 7 77 5 6 7 再对数据进行正态性检验,利用SPSS中的K-S检验功能,例如取第二小组的红葡萄评分为例。输入SPSS软件后,进行分析,得到如下输出:

得到P值为0.801,P>0.05,即数据具有正态性。同理,数据处理后,得到两组评分

4

均按正态分布。

以红葡萄酒为例,运用Excel软件,计算出每组评酒员对每种红葡萄酒的总评分的平均值,并统计数据构成2组样本X1、Y1,即两组评酒员对每种葡萄酒的平均评分,运用matlab编程(见附录一),得出两组样本的平均值,即X1=73.0556,Y1=70.5148。

2发现两个样本X1、Y1的平均值相差不大,故,统计量T=○

X-Y应该服从自11Sw?mn由度为52的t分布。(m=27,n=27,则,m+n-2=52) 3使用函数[h,sig,ci]=ttest2(X1,Y1)(见附录一),得出结果h=0,sig=0.1200,ci= ○

-0.6842 5.7657 。

其中,“h=0”说明不能在显著水平?=0.05时拒绝原假设X1=Y1(即可以考虑接受原假设);

“sig=0.1200”说明只有12.00%的可能统计量T?0,表明不能接受原假设X1=Y1; “ci= -0.6842 5.7657”说明X1-Y1的理论值所在的1-?区间是[-0.6842

5.7657],可信度为95%。这个区间不对称,偏向大于0的方向。

以上三条中有2条指示不能接受原假设:X1=Y1,应该考虑接受备选假设X1>Y1。 4使用函数[h,sig,ci]=ttest2(X1,Y1,?,tail)进行单边检验(见附录一) ○

得出结果h=0,sig=0.0600,ci= -0.8448 Inf。

其中,“h=0”说明不能在显著水平a=0.02时拒绝原假设X1>Y1(即可以考虑接受原假设);

“sig=0.0600”说明只有6.00%的可能统计量T?0,表明应该接受备选假设X1=Y1; “ci=-0.8448 Inf ”说明X1=Y1的理论值所在的1-?区间是[-0.8448 +∞],可信度为98%。这个区间不对称,偏向大于0的方向。

以上三条中有2条指示不能接受原假设:X1=Y1,应该考虑接受备选假设X1=Y1。 5同理,可得出白葡萄酒的两样本X2、Y2的平均值X○

2、Y2,并判断出 X2>Y2。

结论:两组评酒员的评价结果有显著性差异。

5.1.2第二小问模型的建立

欲判断哪组评价结果的可信度更高,应建立两组评酒员的可信度检验模型。分开考虑两组,纵向分析,有两种方法。

方法一:

5

对葡萄酒的评价分析-2012年全国大学生数学建模竞赛A题

对葡萄酒的评价分析摘要本文主要应用数理统计中的t检验法,回归分析法等方法对葡萄酒的评价的相关问题进行了分析,建立相应的模型。针对问题一,首先,对样本进行K-S检验得出数据取自的总体服从正态分布,进而运用成对数据t检验法进行检验,得出两组评酒员对每种葡萄酒的总评分有显著差异;在此基础上,采用两种方法分别判断哪组评酒员的可信度更高。方法一是计算出每
推荐度:
点击下载文档文档为doc格式
83sad1mzin9x6b742rz56u75f0b43501d94
领取福利

微信扫码领取福利

微信扫码分享