编辑: 向日葵8AS | 2013-04-26 |
2 1. 问题重述 评价葡萄酒质量的好坏通常采用由专业的评酒员在品尝葡萄酒之后对其各 项指标进行打分的方法, 总分越高表明葡萄酒的质量越好.现在附件
1 中给出了 两组评酒员对27种红葡萄酒样品以及 28种白葡萄酒样品进行分项指标打分的结 果, 题目要求判断这两组评酒员打分的结果是否存在显著性差异,以及哪一组的 结果更加可靠. 附件
2 和附件
3 给出了酿酒葡萄的理化指标及芳香物质信息, 题目要求根据 这些理化指标并结合之前评酒员对葡萄酒的打分结果,对27 种不同的红酿酒葡 萄和
28 种不同的白酿酒葡萄进行分级. 除了给出酿酒葡萄的理化指标外, 题目同样在附件
2 和附件
3 中给出了葡萄 酒的理化指标及芳香物质信息. 现需要建立酿酒葡萄与葡萄酒的理化指标之间的 联系. 虽然由专业的评酒员对葡萄酒进行打分是一种广泛使用的评价葡萄酒质量 好坏的方式, 然而其评价结果毕竟会受到评酒员个人喜好的影响, 不具有客观性. 那么, 能否利用酿酒葡萄以及葡萄酒的理化指标直接去评价葡萄酒的质量便成为 题目最后的问题.回答此问题前,应先分析理化指标对葡萄酒质量的影响程度. 2. 问题分析 如题所述, 对葡萄酒质量的评判由两组有资质的评酒员品评打分确定.假设 评酒员随机分到两组, 由于评酒员都是经过专业训练的资深人士,则两组评酒员 水平大致相当,且在评酒过程中存在的环境因素、主观因素、评酒员身体状况等 不确定因素变化较小, 可认为两组情况相同.如此可假设两组评酒员的评价结果 来自同一总体,而后对该假设进行检验.在对多种检验方法进行筛选时,我们注 意到题目并未明确说明两组评分的分布特征,因而我们首先避开 t 检验、U 检验 等以正态分布为前提的检验方法,选择秩和检验来验证这一假设. 由于两组评论员对葡萄酒的评分均为依据感官体验所得的主观评判, 因而仅 凭两组评酒员对27组红葡萄酒和 28组白葡萄酒的打分很难说明哪组结果更为可 信. 由于葡萄酒的质量受葡萄酒理化指标的影响,并且直接影响评酒员的感官体 验, 从而影响评分, 因此我们将附件
2 和附件
3 经科学测量葡萄酒的理化指标与 评酒员的评分结果进行拟合,拟合结果所得总偏差最小的组即为更可信的组. 作为酿制葡萄酒的最主要原料, 酿酒葡萄的理化指标对所酿葡萄酒质量有一 定影响, 葡萄酒的优劣反过来也会影响酿酒葡萄的价值.从而在对酿酒葡萄进行 分级时,除了葡萄自身的理化指标,还要以所酿葡萄酒的质量为评判指标,这里 我们以评酒员的评分作为葡萄酒质量的参考值. 我们首先对附件
2 及附件
3 中有 关酿酒葡萄的大量数据进行合理筛选、主成分分析,然后将所得主成分与相对样 品葡萄酒的分数进行拟合,最后通过聚类分析将酿酒葡萄分级. 酿酒葡萄和葡萄酒的理化指标通过实验测定数据体现. 附件提供了大量有关
3 酿酒葡萄和葡萄酒的理化指标的数据,指标类别众多,且都存在多重相关性,为 了找出它们之间的相互依赖关系,我们可以采用偏最小二乘回归法,对其进行分 析. 由第三问的分析我们知道, 葡萄酒的理化指标可由酿酒葡萄的理化指标线性 表出, 因而在分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响时,我们仅 选取酿酒葡萄的理化指标数据进行分析. 我们可以利用主成分分析法从相关度较 高的酿酒葡萄理化指标数据中提取出彼此不相关的若干主成分, 然后以评酒员评 分为葡萄酒质量的参考值, 对提取出的主成分和相对应的葡萄酒分数进行多元回 归分析, 从而得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,也就能进 一步论证能否用葡萄和葡萄酒的指标来评价葡萄酒的质量. 3. 模型假设 1. 评酒员的专业水平大致相当,没有严重的个人偏好,并且他们随机分到两个 组内的 2. 葡萄酒样品是由相同编号的酿酒葡萄酿成的 3. 葡萄酒的香味受其中芳香物质总量的影响 4. 酿酒葡萄的分级仅依据题目给出信息有关,不考虑其他因素 4. 符号说明 第k组红葡萄酒样品 i 得分总体 第k组白葡萄酒样品 j 得分总体 标准化后指标取值 第p个主成分取值 酒样品 i 的得分平均值 主成分拟合系数 相关系数矩阵第 m 个特征值对应的特征向量 第p个主成分的累计贡献率 自变量组的 n 次标准化观测数据阵 因变量组的 n 次标准化观测数据阵