2013高教社杯全国大学生数学建模竞赛
承 诺 书
我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名):
(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容
请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。)
日期: 年 月 日 赛区评阅编号(由赛区组委会评阅前进行编号):
2013高教社杯全国大学生数学建模竞赛
编 号 专 用 页
评 阅 人 评 分 备 注 赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
2
葡萄酒的评价
摘 要
本文是关于葡萄酒评价方面的问题,具体分析阐述了对评酒员评价结果的分析检验和酿酒葡萄的分级,应用matlab,excel,spss等软件,结合F检验、聚类分析、典型相关分析等各种统计学方法,研究了葡萄、葡萄酒的理化指标及葡萄酒质量之间的联系。
针对问题一,本文利用excel软件对各组评酒员的评分进行了整理和分析。在此基础上,对各个样品计算两组评价员评分的样本方差S2和方差D,运用F检验公式:
S2F?1检验是否有显著性差异,结果为:两组评酒员对红葡萄酒样品5、17、24的
2S2评价结果有显著性差异,其它样品无显著性差异;对白葡萄酒样品2、、5、6、8、14、18、27的评价结果有显著性差异,对其它样品无显著性差异;且第二组评酒员的结果更加可信。
针对问题二,考虑到葡萄酒的质量受酿酒葡萄的直接影响,我们首先根据葡萄酒的得分通过聚类分析得到初步排名,之后集合主成分分析法和相关性分析得出影响葡萄酒质量的主要理化指标加权求和得到新的排名,结合两个方面结果是,红酒中好酒有3、9、23差酒有10、25;白葡萄酒中好酒有5、28差酒有16、13、8。
针对问题三,我们先使用spss软件对各个理化指标进行典型相关性分析,筛选出有较大相关性的成分,然后运用matlab软件进行一元线性回归,得到一元回归模型:
Y3?0.2835?X13?2.328Y?41.85?X6?52.71 1 Y1?0.5227?X9?76.35Y3?0.3333?X12?1.362
Y7??0.1989?X4?62.05 Y1?14.01?X12?24.07 Y?0.0218?X?3.968Y7??2.184?X12?71.4234
即葡萄的理化指标X与葡萄酒的理花指标Y之间的线性关系。
针对问题四,可以与三题相似的方法,即典型相关性分析,找出理化指标中与葡萄酒的质量有较大相关性的物质,然后用这些物质与葡萄酒的质量进行多元线性回归, 得到如下回归函数:
并且通过验证,我们认为可以用葡萄的蛋白质、DPPH自归基、葡萄总黄酮、PH值、果皮颜色a、果皮颜色b和葡萄酒的总黄酮、白藜芦醇、DPPH半抑制体来评价葡萄酒的质量。
关键词:F检验;K-均值分类;主成分分析;典型相关性分析;一元线性回归;多元线性回归;
一 问题重述
这次论文要解决的问题是葡萄酒的评价问题,葡萄酒的评价是个很抽象和模糊的概
念,没有固定的指标可以测量,每个人对同一种葡萄酒的评价都会不一样,而且,这对一个人的味觉要求特别高,必须要经过一定的训练才能掌握这样技巧,于是,评酒员这一职业就诞生了,实际生活中,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。有了以上数据以后,需要我们完成以问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二 基本假设
1、 所有的葡萄均正常,没有腐烂变质的现象。 2、 所有葡萄酒在由相同工艺酿制而成。 3、 所有葡萄酒都储存在相同材料的容器中。 4、 所有的理化指标均测量无误。
三 符号说明
X1~X33 Y1~Y9
F
葡萄中各理化指标 葡萄酒中各理化指标
F检验
D 方差 样本方差
s2
四 问题分析
葡萄酒的评价是一个复杂的过程,需要综合考虑不同评价员的评分,而且葡萄酒和
2
葡萄的组成成分非常复杂,它们也要影响葡萄酒的质量,对如此繁多的数据,我们就必须依靠计算机工具,运用数学统计学知识对它们进行处理,并找出各个含量之间的关系,联系生活实际,对葡萄酒作出有理有据的评价。
对于问题一:要想得到两组评价员的评价结果有无显著差异,并对它们的可靠性作出判断,我们首先就应该将两组评价员的对27组红葡萄酒和28组白葡萄酒的评价结果整理出来,再运用统计学中的F检验进行假设与检验,再通过计算各组评价员的评价结果的方差和区分度,进而判断谁的结果更加可信。
对于问题二:需要对葡萄进行分级,由于葡萄酒的质量与酿酒葡萄的好坏有直接关系,所以我们可以根据葡萄酒的质量对酿酒葡萄做一个简单的分级,之后,我们用主成分分析法算出每一组样本葡萄的哪些指标该葡萄的主成分,然后通过数据分析判断出这些成分哪些对葡萄酒的质量作出了贡献,筛选出主要成分后,对不同葡萄的成分做加权求和,以此作为葡萄分级的另一个依据。
对于问题三:要想得到葡萄与葡萄酒的指标间的联系,即得到它们之间的函数关系表达式,我们必须对各种指标进行插值和拟合处理。但是,由于它们各自的指标太多,也不知道互相之间谁与谁有关系,有什么样的关系,所以不能草率地进行拟合。为此,首先必须要对数据进行筛选和比较,为此可以采用spss软件进行典型相关性分析,找出酿酒葡萄内部和葡萄酒内部各指标之间的相关性,和酿酒葡萄的指标与葡萄酒的指标间的相关性,从而选出具有代表性的指标进行拟合,得到一元线性回归方程。
对于问题四:题中想要求出理化指标对质量的影响,即各理化指标与质量的线性或非线性关系,但是,由于理化指标太多,并且并非没个理化指标都会对葡萄酒的质量造成影响,所以首先必须进行数据的筛选,这里我们使用spss软件进行典型相关性分析,找出哪些指标与质量有较大的关系,然后将这些指标设为自变量,将质量设为因变量,对它们进行多元线性拟合,最后得到一个多元表达式以后,我们就可以通过这个方程来对葡萄酒的质量进行验证,如果验证的结果与评价员打分的结果基本吻合的话,就说明可以用葡萄与葡萄酒的理化指标来对葡萄酒的质量进行评价。
五 模型的建立与求解
5.1 模型的准备
为了方便下面模型的建立与求解,我们需要对附件中的数据进行预处理,计算出下面需要用到的数据,例如,各个数据的平均值,方差,样本方差等,并制成表格,对于葡萄的分级,我们可以上网参考一下国家标准或者国外葡萄酒工业发达国家的标准进行分级。
5.2 问题1模型的建立与求解
根据题一的要求,要求得两组评价员的评价结果有无显著性差异,就必须求出两组评价员的评价结果。
对于红葡萄酒样品一,我们先求出第一组评价员的所打分数的平均值,如下表所示:
3
2012年数学建模A题范文



