好文档 - 专业文书写作范文服务资料分享网站

商务智能与数据挖掘课程考试开放考核试题及规范

天下 分享 时间: 加入收藏 我要投稿 点赞

商务智能与数据挖掘课程考试开放考核试题

一、简答题(每题30分,9选1,根据学号以9为周期依次选题)

1、结合实例描述数据挖掘的流程及各个部分需要处理的内容?

2、什么是数据探索?结合实例描述数据探索的方法?

3、什么是数据清洗,结合实例介绍数据清洗的方法?

4、为什么要进行数据集成?结合实例描述数据规范化的过程(注意分析数据规范化前后的效果)

5、逻辑回归的原理是什么,结合实例描述逻辑回归的实现过程?(注意需给出逻辑回归的最后输出结果)

6、什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤

7、什么是决策树?决策树的主要算法有哪些,通过实例详细描述其中一种算法的实现过程。

8、介绍关联规则模型及相关算法有哪些,通过实例详细描述其中一个算法的实现过程。

9、简单介绍人工神经网络的发展史,并通过实例说明BP神经网络的实现过程。

二、综合分析建模题(70分,五选一完成,学号尾数为1和6选第一题,尾号为2和7选择第二题,尾号为3和8选第三题,尾号为4和9选第四题,尾号为5和0选第五题)

试题一 商品零售购物篮分析 背景:

现代商品种类繁多,顾客往往会由于需要购买的商品众多而变得疲于选择,且顾客并不会因为商品选择丰富而选择购买更多的商品。繁杂的选购过程往往会给顾客疲惫的购物体验。对于某些商品,顾客会选择同时购买,如面包与牛奶、薯片与可乐等,当面包与牛奶或者薯片与可乐分布在商场的两侧,且距离十分遥远时,顾客购买的欲望就会减少,在时间紧迫的情况下顾客甚至会放弃购买某些计划购买的商品。相反,把牛奶与面包摆放在相邻的位置,既给顾客提供便利,提升购物体验,又提高顾客购买的概率,达到了促销的目的。许多商场以打折方式作为主要促销手段,以更少的利润为代价获得更高的销量。打折往往会使顾客增加原计划购买商品的数量,对于原计划不打算购买且不必要的商品,打折的吸引力远远不足。而正确的商品摆放却能提醒顾客购买某些必需品,甚至吸引他们购买感兴趣的商品。

因此,为了获得最大的销售利润,清楚知晓销售什么样的商品、采用什么样的促销策略、商品在货架上如何摆放以及了解顾客的购买习惯和偏好等对销售商尤为重要。通过对商场销售数据进行分析,得到顾客的购买行为特征,并根据发行的规律二采取有效的行动,制定商品摆放、商品定价、新商品采购计划,对增加销量并获取最大利润有重要意义。

需求:

1、构建零售商品的FP-Tree模型探索商品间的关联关系,从而建立商品零售购物篮关联规则模型;

2、结合实际情况,根据模型结构给出销售策略,提升商品销售量;

试题二 基于空气有害气体的含量建立空气质量评价模型 背景:

我国环境质量评价工作是年代后才逐步发展起来的。发展至今,在评价指标体系及评价理论探索等方面均有较大进展。但目前我国环境评价实际工作中,所采用的方法通常是一些比较传统的评价方法,往往是从单个污染因子的角度对其进行简单评价。然而对某区域的环境质量如水质、大气质量等的综合评价一般涉及较多的评价因素,且各因素与区域环境整体质量关系复杂,因而采用单项污染指数评价法无法客观准确地反映各污染因子之间相互作用对环境质量的影响。

基于上述原因,要客观评价一个区域的环境质量状况,需要综合考虑各种因素之间以及影响因素与环境质量之间错综复杂的关系,采用传统的方法存在着一定的局限性和不合理性。因此,从学术研究的角度对环境评价的技术方法及其理论进行探讨,寻求能更全面、客观、准确反映环境质量的新的理论方法具有重要的现实意义。

有人根据空气中SO2、NO、NO2、NOX、PM10和PM2.5值的含量,建立分类预测模型,实现对空气质量进行评价。在某地实际监测的部分原始样本数据经预处理后如下表所示。请采用C4.5决策树进行模型构建,并评价模型效果。

SO2 0.031 0.022 0.017 0.026 0.018 0.019 0.022 0.023 0.022 0.017 NO 0 0 0 0 0 0 0 0.01 0.012 0.007 NO2 0.046 0.053 0.029 0.026 0.027 0.052 0.059 0.085 0.066 0.037 NOx 0.047 0.053 0.029 0.026 0.027 0.053 0.06 0.099 0.084 0.048 PM10 0.085 0.07 0.057 0.049 0.051 0.06 0.064 0.07 0.073 0.069 PM2-5 0.058 0.048 0.04 0.034 0.035 0.04 0.042 0.044 0.042 0.04 空气等级 I II I I I II II II II I 需求:

(1) 对数据的特征进行分析,然后构建空气评价模型; (2) 描述模型的实现过程;

(3) 对构建的模型进行评价,评价模型对于空气质量的识别效率

试题三 家用热水器用户行为分析与事件识别 背景:

随着国内大家电品牌的进入和国外品牌的涌入,电热水器相关技术在过去20年间得到了快速发展,屡屡创新。首次提出封闭式电热水器的概念到水电分离技术的研发。漏电保护技术的应用及出水断电技术和防电墙技术专利的申请突破。如今高效能技术颠覆了业内对电热水器“高能耗”的认知。当下的热水器行业也并非一片太平盛世,行业内正在上演一幕弱肉强食的“丛林法则”戏码,市场份额逐步向龙头企业集中,尤其是那些在资金、渠道和品牌影响力等方面拥有实力的综合家电品类巨头,正在不断蚕食鲸吞市场蛋糕。要想在该行业立足,只能走产品差异化的路线,提升技术实力和产品质量,在功能卖点、外观等方面做出自身特色。

国内某热水器生产商新研发了一种高端智能热水器,在状态发生改变或者有水流状态时,会采集各监控指标数据。。然后基于热水器采集的时间序列数据,根据水流量和停顿时间间隔,将顺序排列的离散用水事件时间节点划分为不大同大小的时间区间,每个区间都是一个可理解的一次完整的用水事件,并以热水器一次完整用水事件作为一个基本事件,将时间序列数据划分为独立的用水事件,并识别出其中属于洗浴的事件。

需求:

1) 根据热水器采集到的数据,划分一次完整用水事件; 2) 在划分好的一次完整用水事件,建立识别出洗浴事件模型;

3) 由于可能出现两次或多次连续洗浴事件的发生,如何对模型进行优化,

实现对连续洗浴事件的识别,提高模型识别精确度。

试题四 电子商务网站用户行为分析及服务推荐 背景:

某法律网站是北京一家电子商务类的大型法律资讯网站,致力于为用户提供丰富的法律信息与专业咨询服务,本案例主要是为律师与律师事务所提供互联网整合营销解决方案。

随着企业经营水平的提高,其网站访问量逐步增加,随之而来的数据信息量也在大幅增长。带来的问题是用户在面对大量信息时无法快速获取需要的信息,使得信息使用效率降低。用户在浏览搜寻想要的信息过程中,需要花费大量的时间,这种情况的出现造成了用户的不断流失,对企业造成巨大的损失。

需求:

1) 根据用户的兴趣偏好,分析用户的需求和行为,引导用户发现需求信息,构建智能推荐模型,

2) 根据智能推荐模型实现将长尾网页准确的推荐给所需用户,帮助用户发现他们感兴趣但很难发现的网页信息。

3) 优化智能模型并实现个性化的服务,改善用户浏览体验,增加用户黏度,从而使用户与企业之间建立稳定交互关系,实现客户链式反应增值。 4) 如何通过模型实现对新用户的信息的智能推荐,(如年龄,性别,爱好等)

商务智能与数据挖掘课程考试开放考核试题及规范

商务智能与数据挖掘课程考试开放考核试题一、简答题(每题30分,9选1,根据学号以9为周期依次选题)1、结合实例描述数据挖掘的流程及各个部分需要处理的内容?2、什么是数据探索?结合实例描述数据探索的方法?3、什么是数据清洗,结合实例介绍数据清洗的方法?4、为什么要进行数据集成?结合实例描述数据规范化的过程(注
推荐度:
点击下载文档文档为doc格式
6ag9q613tl371qz5d0ci05ej21u0yu00k0z
领取福利

微信扫码领取福利

微信扫码分享