编辑: JZS133 | 2015-08-25 |
5 个数据科学家案例解析 II 本书配备非常实用的示例和代码片段,以确保读者能够很好地掌握用于解决实际 问题的数据科学方法.本书在介绍统计和概率的基本概念之后,详细描述在实际应用 中使用最为普遍的四项技术的基本原理,这些技术分别是回归技术、时间序列、聚类 方法和分类模型.每一项技术的内容构成一章,具体讲解都是从一个具有明确定义的 业务问题案例研究开始,通过整合案例情节和 Python 代码片段来决定最佳解决方案, 极具易读性、实用性和可操作性,将理论和实践有机地结合在一起.另外,为了加深读 者对各种方法的理解,作者将练习贯穿于各章,使读者能够对所学概念反复动手练习. 在这里要感谢清华大学出版社的编辑, 他们为本书的翻译投入了巨大的热情并付 出了很多心血.没有你们的帮助和鼓励,本书不可能顺利付梓. 对于这本实用力作,由于涉及知识面广,内容丰富,术语量大,翻译难度可想而 知,译者本着 诚惶诚恐 的态度,在翻译过程中力求专业性、准确性和通俗性,但 是鉴于译者水平有限,错误和失误在所难免,如有任何意见和建议,请不吝指正.感 激不尽!本书全部章节由潘海为和张春新翻译,参与翻译的还有尹淇、杨彬、于杰瑶、 王亚楠、韩坤、边晓菲、孙明、李俭、任春友、李鹏等. 译者2018 年4月于哈尔滨 作者简介 Danish Haroon 目前领导 Market IQ Inc 的数据科学团 队, 该团队专注于从情感转折点中剔除可操作实时情报的专 利预测分析平台.他获得了卡拉奇学校(karachi School)商业 与领导学院的 MBA 学位,曾为公司客户及其数据分析要求 提供服务.最近,他开始领导 PredictifyME 的数据商业化团 队, 这家初创公司专注于为美国市场的需求规划和房地产市 场提供预测分析. 他目前的研究主要集中在用于改善客户体 验(Customer Experiences,CX)的数据科学混合物上. 致谢我想感谢我的父母和可爱的妻子,感谢他们在这个启蒙旅程中不断地给予我 支持. 技术审校者简介 Somil Asthana 拥有印度理工学院的通信管理学士学位 和美国布法罗纽约州立大学的计算机科学硕士学位. 他是一名 企业家、机器学习向导、大数据专家,还为 Sprint、Verizon、 HPE 和Avaya 等财富
500 强公司提供咨询服务.他经营着一 家初创公司,为电子商务、内容/媒体领域的数据驱动行业提 供大数据解决方案和数据战略. 前言本书涵盖了机器学习方法和 Python, 可以自动呈现对业务问题的丰富见解和解决 方案.本书使用基于案例研究的实践方法来破解真实世界的应用,里面涉及的机器学 习概念再适合不过. 这些更智能的机器将使你的业务流程以最短的时间和最少的资源 获得更高的效率. 本书将引导你逐步完善业务流程,帮助你发现构建公司战略的关键点.你将阅读 可以为产品和服务提供支持的机器学习技术. 本书还突出了这些机器学习概念的优缺 点,以帮助你决定哪一个最适合你的需求. 通过逐步的编码方法,你将能够理解机器学习过程中模型选择背后的基本原 理.本书配备了实用的示例和代码片段,以确保你了解用于解决实际问题的数据 科学方法. 本书可以帮助来自技术和非技术背景的人们将机器学习技术应用于现实世界问 题.每一章都从一个具有明确定义的业务问题的案例研究开始,然后通过整合案例情 节和代码片段来决定最佳解决方案. 练习贯穿于整个章节, 使所学概念得以动手实现. 每章最后都以现实世界应用的亮点为结尾,这些概念可以应用到实践中.以下简要概 述各章的内容: 第1章介绍统计和概率的概念. 第2章讨论回归技术和方法以微调模型. 第3章向读者展示时间序列模型,并详细介绍平稳的性质. 第4章使用聚类方........