编辑: 被控制998 2017-12-23
第三届泰迪杯全国大学生数据挖掘竞赛试题 说明:

1、参赛选手可从下述试题中任选一题作答,并在论文报告中标明

2、论文等级会综合考虑论文质量和难度系数 试题 试题 试题 试题一 一一一基于电商平台家电设备的消费者需求及产品数据挖掘 基于电商平台家电设备的消费者需求及产品数据挖掘 基于电商平台家电设备的消费者需求及产品数据挖掘 基于电商平台家电设备的消费者需求及产品数据挖掘分析 分析 分析 分析( ( ( (难度系数 难度系数 难度系数 难度系数: : : :1.

0) ) ) ) 试题来源: 背景 背景 背景 背景: : : : 随着互联网与移动互联网的快速发展,截止2014 年6 月,我国的网民规模达6.32 亿, 互联网普及率为46.9%,2015 年中国网民的渗透率将接近50%.2014 年天猫双十一的交易 额达571 亿,网上购物将成为人民生活的一部分.网民在电商平台上浏览和购物,产生了海 量的数据,如何利用好这些碎片化、非结构化的数据,将直接影响到企业产品在电商平台上 的发展,也是大数据在实际企业经营中的应用.对于用户在电商平台上留下的评论数据,运 用文本分析方法,了解用户的需求、抱怨,购买原因以及产品的优点、缺点,对于改善家电 设备产品及用户体验有着重要的意义. 据观研天下行业分析:近年来我国家电设备销量增长迅速,以电热水器为例,2011 年 电热水器市场销量比2010 年增长2.29%, 销售额增长5.23%;

2013 年热水器零售量达到2842 万台,零售额达到459 亿元,2014 年热水器整体规模向上,但增速较2013 年有所回落,零 售量达到2985 万台,零售额达到504 亿元. 需求 需求 需求 需求: : : :

1、分析用户对于热水器/净水器产品的个性化需求;

2、分析现有电商热水器/净水器的产品劣势(用户抱怨点)及产品优势(用户赞点) ;

3、分析各品牌的产品间的差异,进行差异化卖点提炼;

4、分析用户购买的原因;

5、对用户的购买行为进行分析挖掘(搜索关键字、购买时关注点、购买步骤、使用、 评价) (此部分可选择来做) . 提示 提示 提示 提示: : : :

1、在电商平台进行评论数据抓取(可用火车头采集器进行评论爬虫) ;

2、对评论数据进行预处理(处理掉水军及随意发表的评论数据) ;

3、可分品类进行细化分析(热水器:电热热水器、燃气热水器;

净水器:净水机、 纯水机) ;

4、对评论数据进行文本分析(好评、差评、中文分词、词频统计、情感分析、语义 网络) ;

5、可利用百度指数、淘宝指数等互联网工具对热水器和净水器的消费人群及搜索关 注点进行分析;

6、建议在国内外相关文献的基础上尽量选择新技术手段进行挖掘,比如基于深度学 习理论模型完成情感分析,参见文献: 《基于深度学习的微博情感分析》 、 《基于深 度学习的文本情感分类研究》等. 说明 说明 说明 说明: : : :

1、附件一 附件一 附件一 附件一_电热水器及净水器评论数据集 电热水器及净水器评论数据集 电热水器及净水器评论数据集 电热水器及净水器评论数据集.zip 是电热水器和净水器的评论数据,参赛 者也可去电商平台进行数据爬虫,爬取最新的评论数据(若自行爬取的数据,提 交论文成果时请一并提交) ;

2、参赛者可以选择热水器或者净水器任一一个品类进行分析挖掘;

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题