全国大学生数学建模竞赛优秀论文评析
第二十一篇 葡萄酒质量的影响因素分析
2012年A题 葡萄酒的评价
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
附件1:葡萄酒品尝评分表(含4个表格); 附件2:葡萄和葡萄酒的理化指标(含2个表格); 附件3:葡萄和葡萄酒的芳香物质(含4个表格); 原题详见2012年全国大学生数学建模竞赛A题。
葡萄酒质量的影响因素分析
摘要:本文针对葡萄酒和葡萄质量的评价问题,通过t检验、模糊聚类分析、相关性分析等多种方法,综合分析了评酒员葡萄酒品尝评分结果、葡萄和葡萄酒的理化指标以及葡萄和葡萄酒的芳香物质数据,建立了葡萄和葡萄酒的理化指标对葡萄以及葡萄酒质量的影响关系多元线性回归数学模型,运用EXCEL、Matlab软件得出了酿酒葡萄和葡萄酒之间的理化关系。最后,将模型结果和实际酿酒过程相结合,做出了根据酿酒葡萄和葡萄酒理化指标对葡萄酒质量进行评价的模型,对如何固化葡萄酒质量评判标准提出了相关可行性方案。
针对问题一,根据评酒员对葡萄酒品尝评分结果数据,分别对红葡萄和白葡萄,首先运用t检验分析建立了显著性差异的成对数据t检验模型,分析出两组评酒员的评酒结果具有显著性差异;再运用方差分析建立了方差分析模型,分析出第二组评酒员的评价结果更为可信。
针对问题二,首先运用相关性分析,确认出葡萄酒与酿酒葡萄之间的一一对应关系。再结合问
*
*
本文获2012年全国一等奖。队员:苏钰,胡金晶,陈成,指导教师:李勇。
306
第二十一篇 葡萄酒质量的影响因素分析
题一中分析得出的第二组评酒员的评价结果可信度更高的结论,依据评酒员的评分结果,运用模糊聚类分析法对葡萄酒质量进行等级评估。最后,结合酿酒葡萄的理化指标数据,建立了红、白葡萄理化指标分级模型。为了方便相关技术人员对葡萄进行迅速分类,本文同时建立了一个葡萄理化指标的快速分级模型。
针对问题三,根据葡萄和葡萄酒的理化指标以及葡萄和葡萄酒的芳香物质数据,运用EXCEL软件对这些数据加以整理分析,分别得出了红、白葡萄经过发酵变成葡萄酒之后,各项理化指标的变化情况以及变化幅度。同时,结合葡萄酿造的理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系。
针对问题四,首先运用多元线性回归模型做出葡萄酒质量和葡萄、葡萄酒的理化性质之间的线性关系,通过理化性质指标的系数来分析酿酒葡萄和葡萄酒理化指标对葡萄酒质量的影响。然后,运用模糊综合评价模型分别按照葡萄和葡萄酒的理化性质对葡萄酒质量进行排名。最后将二者的综合排名与评酒员评的实际排名进行比较,从而论证出能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
本文通过综合运用上述t检验分析、方差分析、相关性分析、聚类分析以及线性回归分析等方法,给出了较为完善的葡萄质量理化指标判别模型以供相关技术人员对提供的葡萄进行等级分类,给出了葡萄酒和葡萄理化指标判别模型对葡萄酒质量进行分类的理论依据。同时本文通过对数学模型的推广,分析了在其他领域的应用,并且综合评价了模型的优缺点。
关键词:葡萄;葡萄酒质量;t检验;模糊聚类;回归分析;Matlab
21.1 问题的重述
21.1.1 背景知识
1.葡萄酒
⑴白葡萄酒:用白葡萄或皮红肉白的葡萄分离发酵制成。酒的颜色微黄带绿,近似无色或浅黄、禾秆黄、金黄。
⑵红葡萄酒:采用皮红肉白或皮肉皆红的葡萄经葡萄皮和汁混合发酵而成。酒色呈自然深宝石红、宝石红、紫红或石榴红。
葡萄的营养很高,而以葡萄为原料的葡萄酒也蕴藏了多种氨基酸、矿物质和维生素,这些物质都是人体必须补充和吸收的营养品。目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。葡萄酒的营养价值由此也得到了广泛的认可。
2.葡萄酒的酿造
在葡萄酒发酵过程中主要经过下述四个阶段:第一阶段:葡萄糖磷酸化,生成活泼的1,6-二磷酸果糖。第二阶段:1,6-二磷酸果糖分裂为二分子磷酸丙糖。第三阶段:3-磷酸甘油醛经氧化(脱氢),并磷酸化,生成1,3-二磷酸甘油酸,然后将高能磷酸键转移给ADP,以产生ATP,再经磷酸基变位,和分子内重排,又给出一个高能磷酸链,而后变成丙酮酸。第四阶段:酒精的生成。酵母菌在无氧条件下,将丙酮酸继续降解,产生乙醇。
3.葡萄酒的质量
⑴外观:一般而言,白酒在它年轻时是无色的,但随着陈年时间的增长,颜色会逐渐由浅黄并略带绿色反光;到成熟的麦杆色、金黄色,最后变成金铜色。若变成金铜色时,则表示已经太老不适合饮用了。红酒则相反,它的颜色会随着时间而逐渐变淡,年轻时是深红带紫,然后会渐渐转为正红或樱桃红,再转为红色偏橙红或砖红色,最后呈红褐色。
307
全国大学生数学建模竞赛优秀论文评析
⑵香气:葡萄酒的香气极其丰富和复杂,不同的葡萄品种会产生一些独特的果香。好的葡萄酒香气饱满、充沛、浓郁,所以葡萄酒的香气能够比较真实、准确地反应葡萄酒的内在质量。
⑶口感:小酌一口,并以半漱口的方式,让酒在嘴中充分与空气混合且接触到口中的所有部位;当你捕捉到红葡萄酒的迷人香气时,酒液在你口腔中是如珍珠般的圆滑紧密,如丝绸般的滑润缠绵,让你不忍弃之。此时可归纳、分析出单宁、甜度、酸度、圆润度、成熟度。 21.1.2 相关数据
1.葡萄酒品尝评分表(详见原题附件1); 2.葡萄和葡萄酒的理化指标(详见原题附件2); 3.葡萄和葡萄酒的芳香物质(详见原题附件3)。 21.1.3 要解决的问题
1.问题一:根据附件1中两组评酒员的评价结果,分析其是否有显著性差异;如果有的话,那么哪一组的评分结果更为可靠。
2.问题二:在问题一中葡萄酒质量的评分结果之上,结合附件2中的酿酒葡萄的理化指标,建立定量的酿酒葡萄分级标准,从而对酿酒葡萄进行分级。
3.问题三:综合附件2、3的资料,从定量和定性两方面综合分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.问题四:分别分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
21.2 问题的分析
21.2.1 对问题的总体分析
葡萄酒的评价是一个涉及到葡萄酒外观、香气、口感等诸多方面的问题,同时评酒员的个人偏好也会对评价结果产生影响,因此对某种葡萄酒的评价具有很多的不确定性。随着当今世界人们对高品质生活的追求,葡萄酒的销量越来越庞大,对一种确定性的、不以人的意志为转移的葡萄酒质量评价方法的需求也越来越迫切。因此,本文考虑从葡萄酒和酿酒葡萄的理化指标角度入手,综合分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证用其理化指标来评价葡萄酒质量的可靠性。最终,建立起一个以葡萄和葡萄酒的理化指标来判断其质量等级的数学模型,为判断酿酒葡萄和葡萄酒质量提供一个相对完善的理化评判标准。 21.2.2 对具体问题的分析
1.对问题一的分析
根据附件1中的葡萄酒品尝评分表,分析这两组评酒员的评价结果有无显著性差异,并分析哪一组结果更可信。将问题分成两个小问来解决。对于两组评酒员的评价结果有无显著性差异这一问题,采用成对数据t检验来判定两组评酒员评价结果的平均值的差异是否显著。对于哪一组的结果更可信这一问题,采用方差分析检验来判定哪一组的评价结果更可信。
2.对问题二的分析
根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒的葡萄进行分级。首先采用相关性分析法分析葡萄酒序号与酿酒的葡萄序号之间是否有一一对应的关系。其次对葡萄酒和对应葡萄的理化指标评价结果运用模糊C均值聚类分析法进行评价分级。再结合葡萄的理化指标,分别得到红、白葡萄的量化分级标准。最后为了方便葡萄酒公司对买到的大量葡萄进行快速分级,本文分别为红、白
308
第二十一篇 葡萄酒质量的影响因素分析
葡萄建立了一个葡萄快速分类法。
3.对问题三的分析
通过对酿酒葡萄和葡萄酒理化指标的研究,建立模型分析这两者之间的联系。附件2、3中给出了红、白葡萄和葡萄酒的理化指标数据和芳香物质数据,对这些数据加以统计分析,分别得出了红、白葡萄发酵后,各项理化指标的变化情况以及变化幅度。同时,结合理化知识,对整体变化情况加以分析。最终,从定量和定性两个方面,较为完善的分析了酿酒葡萄和葡萄酒的理化指标之间的联系情况。
4.对问题四的分析
根据所给数据分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证了能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。首先,本文建立葡萄酒质量评价值与葡萄和葡萄酒各个理化指标之间的多元线性关系,用各指标的系数分析其影响;然后建立模糊综合评价模型分别根据葡萄和葡萄酒理化指标做出葡萄酒的质量排名,将综合排名与评酒员评价得出的排名顺序相比较,进一步评估用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是否合理。
21.3 模型的假设
1.各类型葡萄酒的酿造流程正常且正规;
2.葡萄和葡萄酒理化指标中未给出检测值的理化指标,含量视为零;
3.本文中的葡萄酒都为全汁葡萄酒,而非半汁葡萄酒,即都是100%葡萄汁酿制而成; 4.红、白葡萄酒分别由红、白葡萄酿造而成,且葡萄和这种葡萄酿制的葡萄酒的序号一一对应(已在问题二中论证,符合假设基本原理);
5.附件3中没有显示数据的地方表示仪器没有检测到样品该成分,即该成分含量微小,视为零。
21.4 名词解释与符号说明
21.4.1 名词解释
1.可信度:指评酒员对葡萄酒质量评分结果的可信程度;
2.显著性差异:统计学上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体,而是来自于具有差异的两个不同总体;
3.模糊聚类分析:聚类分析是数理统计中的一种多元分析方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。 21.4.2 符号说明
序号 1 2 3 4 5 6 7
符号 xi yi zj ui vi
符号说明
第一组待评价葡萄酒样品 第二组待评价葡萄酒样品 评酒员评酒的各个评价指标
第一组葡萄酒样品的评价总分 第二组葡萄酒样品的评价总分
第一组第m个评酒员对于第i个葡萄酒样品第j个评价指标的mxij
评价值 myij 第二组第m个评酒员对于第i个葡萄酒样品第j个评价指标的
309
全国大学生数学建模竞赛优秀论文评析
8 9 10 11 12 13 评价值 第一组葡萄酒样品中十个评酒员对于每个指标zj的平均评价值 xij yij 第二组葡萄酒样品中十个评酒员对于每个指标zj的平均评价值 第一组葡萄酒样品评酒员评价值的方差和 第二组葡萄酒样品评酒员评价值的方差和 各指标的权数 第i个方案的综合评价值 Sx Sy wi Fi 21.5 模型的建立与求解
21.5.1 问题一的分析与求解
1.对问题的分析
根据附件1中的葡萄酒品尝评分表分析这两组评酒员的评价结果有无显著性差异,并分析哪一组结果更可信。将问题划分成两个小问题:一是分析两组评酒员的评价结果有无显著性差异。对于这个问题采用成对数据t检验来判定两组评酒员评价结果的平均值的差异是否显著,通过比较p双尾概率与之前规定的显著性水平?的大小来判断是否拒绝原假设,拒绝则有显著性差异;二是判断两组评酒员的评价结果哪一组更可信。对于这个问题采用方差分析法来判定,通过EXCEL软件中的数据分析工具做出方差分析表,然后算出每个样品的平均方差,最后对平均方差进行汇总,分别比较红、白葡萄酒两组评酒员评价结果的平均方差和的大小,方差和小的评价结果更可信。最后,对红、白两种葡萄酒评价值的判定结果进行综合分析,得出两组中哪组的评分结果更可信。
2.对问题的求解 模型Ⅰ t检验模型 ⑴建模思路
首先,针对红、白葡萄酒分别求出两组评酒员对所有葡萄酒的各项评价指标去掉最高分和最低分后的平均评分值,以每个指标的所有评酒员的平均评价值为各个样本,利用Excel软件对两组评酒员每个指标的平均值样本进行t检验:平均值的成对二样本分析,根据最后得出的概率p,判断其是否小于假设的?值,若小于则拒绝原假设,即存在显著性差异,否则两组评酒员的评价结果之间无显著性差异。
⑵模型的建立
问题要求对两组评酒员的评价结果分析有无显著性差异。由于所有评酒员没有专业上的水平差异,故以红葡萄酒为例(白葡萄酒与其处理方法相同),将其每个指标求取平均值,因而采用主要用于检验两个处理平均数差异是否显著的t检验对问题予以求解。
①提出假设
a.无效假设H0:?1??2,即两组评酒员每个指标的平均值相等
b.备择假设HA:?1??2,即两组评酒员每个指标的平均值不相等,亦即两组评酒员的评价结果存在显著性差异。
②确定显著性水平
定义1 显著性水平:能否定H0的人为规定的概率标准称为显著性水平,记作?。 依据小概率原理,规定显著性水平??0.05。
③选定检验方法,计算检验统计量,确定概率值作出推断 选用平均值的成对二样本分析进行检验:
310