2012年电子科技大学中山学院优秀论文
葡萄酒等级划分体系模型的探究
摘 要
针对目前葡萄酒评价体系不完善的现状,本文对葡萄酒评价体系作出探究。
对于问题一,运用单因素方差分析法,利用Matlab软件,以Anoval函数求解。求出p-value,显著性水平取0.05作为标准来判断那组有显著性,以及通过比较方差来判断那组数据更加可信。
对于问题二,在问题一中得到第二组评分更可信,因此根据该组的评分进行分级,通过用Matlab软件的Corrcoef和Regress函数对该组成分进行相关性验证和用EXCEL画出图表进行分析,找出影响葡萄酒分级的成分,然后在酿酒葡萄数据中找出与影响葡萄酒分级相同的成分,再结合葡萄酒评分对葡萄样品进行分级,得出葡萄样品成分的排列,结合成分的量和葡萄酒分级得出影响酿酒葡萄分级成分的范围。
对于问题三,通过问题二的解答,可以知道葡萄酒和酿酒葡萄的划分级别,利用附件二的资料,对每一种理化指标的数据,根据对应的含量建立模型,运用matlab软件拟合数据,作出拟合线性图,并采用多元回归分析法进行回归分析,最后根据拟合线性图和回归系数来分析两类理化指标之间的关系。
对于问题四,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。结合题目给出芬香物质的数据,对感官指标和理化指标进行综合分析,用MABTLE拟合感官指标和理化指标的数据,得出结论:需要结合葡萄酒的理化指标和感官指标对葡萄酒的质量进行综合评价。
关键字:方差分析法 分级 理化指标 线性相关 回归分析
1
一、问题的重述
随着我国经济的快速发展,葡萄酒市场竞争也异常激烈和无序“三精一
水”、假年份、假产地酒、假酒庄,影响消费者的健康,虽然我国的GB15037-2006《葡萄酒》国家标准对葡萄酒的质量作了规定,但由于相应规范的制定工作限制,我国关于葡萄酒质量等级分划的标准还未完善,国家迫切需要制定统一的质量等级制度。
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,文章给出了某一年份一些葡萄酒的评价结果及该年份这些葡萄酒的和酿酒葡萄的成分数据。本文尝试解决以下问题:
问题一: 由于评酒师对葡萄酒的评分存在主观性,需对评酒师的分数进行客观分析,分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
问题二:葡萄酒的质量离不开原料酿酒葡萄的质量,所以酿酒葡萄的理化指标至关重要。需根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
问题三:酿酒葡萄与葡萄酒的理化指标之间的联系可能影响着葡萄酒质量,所以需建立模型,酿酒葡萄与葡萄酒的理化指标之间的联系。
问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,能否综合感官指标和理化指标,建立模型,来评价葡萄酒的质量是问题关键所在。
二、模型假设
1.品酒员打分相互之间没有影响;
2.品酒员对样品的给的总分是他对该样品所有方面评分的总和,并且该样品的最终得分可认为是10位品酒员打分的平均值; 3.题目所给的数据真实可靠;
4.酿酒方式及酿酒过程对葡萄酒的质量没有影响; 5.不同种类葡萄酒的成份数据值统一标准没有差异 ; 6.所有样品的酿造过程相同。
三、符号说明
n r A
2
测试数量 测试水平量 因素 SS Df MS F P SA 各类数据源的平方和 各类数据相应的自由度 各类的均方值 统计量 大于F的概率 各组均值对总方差的偏差平方和 各组数据对均值偏差平方和的总和 SE
四、问题分析
问题一的分析
我们要根据附件1的数据可知:评酒员对红酒27组样品,和白酒28组样品
进行评分,每件样品都进行了两次评分,即是有两组评分数据,题目要求分析两组评酒员的评分结果有无显著性差异,以及那一组数据更加可信,对于显著性的判断,我们采用单因素方差分析法(Analysis Of Variance)。对于每件样品,评酒员对外观,香气,口感,及其整体评价进行打分,每一组的每件样品都有十名品酒员进行评分,故求每个品酒员对样品酒的总分,之后求出这十名品酒员给的总分的平均分,此平均分就是该样品的总分,葡萄酒分为白酒和红酒,我们对第一组的红酒和第二组的红酒进行方差分析法,运用matlab软件中的anova1函数可得出p-value,及F值,通过分析就可知道那组更加具有显著性。方差是考察数据的波动性的,方差小就说明数据比较稳定,方差大就是波动性比较大 ,故通过比较两组数据的方差大小,就知道那一组数据更加可信。
问题二的分析 根据问题一可知,第二组的评酒员的评酒分数更可靠,所以选择第二组葡萄酒的数据进行处理。从评酒员对葡萄酒评分的分数入手,用逆向思维反推葡萄的等级。首先将第一问中第二组的白葡萄酒和红葡萄酒的每一种样品的评分进行分等级,依次分为四个等级,然后用EXCEL将每个等级的样品酒的理化指标画成曲线图,忽略异常数据点,观察各等级间的理化指标有没有相关性,如果有相关性,找出影响葡萄酒质量的相关因素,跟酿酒葡萄的理化指标数据进行对照,得出酿酒葡萄的分级依据。
问题三的分析
3
结合葡萄酒和酿酒葡萄的理化指标,作出每两个理化指标间的直观趋势图,观
察两者之间的大体关系,根据曲线拟合的方法得出两者间的函数关系。
问题四的分析
由第三问求解可得出酿酒葡萄与葡萄酒的理化指标之间是呈线性相关的,因此我们要证明酿酒葡萄和葡萄酒的理化指标对葡萄酒质量是有影响的,只需证明酿酒葡萄的理化指标对葡萄酒质量是有影响。在综合附录3给出的芬香物质,用MABTLE拟合出理化指标和感官指标的关系图呈相关性,所以要综合葡萄酒的理化指标和感官指标一起来评价葡萄酒的质量。
五、模型建立与求解
5.1问题一的模型建立和求解
对于两组评酒员的评价结果有无显著性差异,我们采用单因素方差分析法去解决。
单因素方差分析法:
只考虑一个因素A 对所关心的指标的影响,A 取几个水平,在每个水平上作若干个试验,试验过程中除A 外其它影响指标的因素都保持不变(只有随机因素存在),我们的任务是从试验结果推断,因素A 对指标有无显著影响,即当A 取不同水平时指标有无显著差别。A 取某个水平下的指标视为随机变量,判断A 取不同水平时指标有无显著差别,相当于检验若干总体的均值是否相等。
设 A取n 个水平A1,A2,A3,...An,在水平Ai下总体xi 服从正态分步N(ui,?2),i=1,...,n,这里u,?2未知,ui可以互不相同,但假定xi有相同的方差,又设在每个水平Ai下作了ni次独立试验,即从中抽取容量为ni的样本,记作
xij,j?1,...,nj,xij服从N(ui,?2),i=1,…,n,j=1,…, ni且且相互独立。将这些数据列成表1(单因素试验数据表)的形式。
表5.1 单因素试验数据表 分值 第一组红酒 第二组红酒 第一组白酒 A1 X12 X21 X12 A2 X21 X22 X21 ..... A3 第二组白酒 X21 X22 X31 X32 X31 X32 根据上述理论,首先我们对数据进行处理,附件1里有四组数据:红葡萄酒和白葡萄酒各有两组数据,每种酒都有两组人进行对其进行评分,每件样品酒有十名
4
品酒员号打分,采用单因素方差分析法,我们将样品酒的总分作为唯一考虑的因素A,运用matlab软件编程求出品酒员对每组样品打的总分的平均分,见下表:
表5.2组样品红酒和白酒的总分
第一组红葡萄第一组白葡萄第二组红葡第二组白葡
样品号 酒品尝综合得酒品尝综合得萄酒品尝综萄酒品尝综
分评分 分评分 合得分评分 合得分评分
1 62.7 82 68.1 77.9 2 80.3 74.2 74 75.8 3 80.4 79.7 74.6 75.6 4 68.6 79.4 71.2 76.9 5 73.3 71 72.1 81.5 6 72.2 68.4 66.3 75.5 7 71.5 77.5 65.3 74.2 8 72.3 71.4 66 72.3 9 81.5 72.9 78.2 80.4 10 74.2 74.3 68.8 79.8 11 70.1 72.3 61.6 71.4 12 53.9 63.3 68.3 72.4 13 74.6 65.9 68.8 73.9 14 73 72 72.6 77.1 15 58.7 72.4 65.7 78.4 16 74.9 74 69.9 67.3 17 79.3 78.8 74.5 80.3 18 59.9 73.1 65.4 76.7 19 78.6 72.2 72.6 76.4 20 79.5 77.8 75.8 76.6 21 77.1 76.4 72.2 79.2 22 77.2 71 71.6 79.4 23 85.6 75.9 77.1 77.4 24 78 73.3 71.5 76.1 25 69.2 77.1 68.2 79.5 26 73.8 81.3 72 74.3 27 73 64.8 71.5 77 28 81.3 79.6 对这四组数据,我们将白酒和红酒分开来判断其有无显著性,即第一组红酒与第二组红酒,第一组白酒和第二组白酒比较。
运用matlab软件对数据处理编程得出以下结果,标准ANOVA表分析见下表:
5