编辑: 施信荣 | 2017-09-22 |
C (2)效率而非精确;
C (3)相关而非因果. 《大数据技术基础》 厦门大学计算机科学系 林子雨 [email protected] 2013年9月第一版 ? 人类社会的数据产生方式大致经历了3 个阶段,而正是数据产生方式 的巨大变化才最终导致大数据的产生. ? 运营式系统阶段 C 数据库的出现使得数据管理的复杂度大大降低 ,数据往往伴随着一定的 运营活动而产生并记录在数据库中的 ,这种数据的产生方式是被动的 ? 用户原创内容阶段 C 数据爆发产生于Web 2.0 时代,而Web 2.0 的最重要标志就是用户原创 内容 C 以博客、微博为代表的新型社交网络的出现和快速发展 C 以智能手机、平板电脑为代表的新型移动设备的出现 C 这个阶段数据的产生方式是主动的 ? 感知式系统阶段 C 感知式系统的广泛使用 C 人类社会数据量第三次大的飞跃最终导致了大数据的产生 大数据的产生 《大数据技术基础》 厦门大学计算机科学系 林子雨 [email protected] 2013年9月第一版 大数据的应用 《大数据技术基础》 厦门大学计算机科学系 林子雨 [email protected] 2013年9月第一版 大数据作用 ? 变革价值的力量 C 让我们从前10年的意义混沌时代,进入未来10年意义 明晰时代 ? 变革经济的力量 C 大数据帮助我们从消费者这个源头识别意义,从而帮 助生产者实现价值.这就是启动内需的原理 ? 变革组织的力量 C 大数据将推动网络结构产生无组织的组织力量 《大数据技术基础》 厦门大学计算机科学系 林子雨 [email protected] 2013年9月第一版 1.4 大数据与大规模数据、海量数据的差别 ? 从对象角度看,大数据是大小超出典型数据库软件采集、储存、管理 和分析等能力的数据集合.大数据并非大量数据的简单无意义的堆积 ,数据量大并不意味着一定具有可观的利用前景.数据间是否具有结 构性和关联性,是 大数据 与 大规模数据 的重要差别. ? 从技术角度看,大数据技术是从各种各样类型的大数据中,快速获得 有价值信息的技术及其集成. 大数据 与 大规模数据 、 海量 数据 等类似概念间的最大区别,就在于 大数据 这一概念中包含 着对数据对象的处理行为.为了能够完成这一行为,从大数据对象中 快速挖掘更多有价值的信息,使大数据 活起来 ,就需要综合运用 灵活的、多学科的方法,包括数据聚类、数据挖掘、分布式处理等, 而这就需要拥有对各类技术、各类软硬件的集成应用能力.可见,大 数据技术是使大数据中所蕴含的价值得以发掘和展现的重要工具. ? 从应用角度看,大数据是对特定的大数据集合、集成应用大数据技术 、获得有价值信息的行为.正由于与具体应用紧密联系,甚至是一对 一的联系,才使得 应用 成为大数据不可或缺的内涵之一. 《大数据技术基础》 厦门大学计算机科学系 林子雨 [email protected] 2013年9月第一版 1.5 典型的大数据应用实例 ? 从谷歌流感趋势看大数据的应用价值 谷歌有一个名为 谷歌流感趋势 的工具,它通过跟踪搜 索词相关数据来判断全美地区的流感情况(比如患者会搜 索流感两个字) 《大数据技术基础》 厦门大学计算机科学系 林子雨 [email protected] 2013年9月第一版 1.6 从数据库到大数据 ? 池塘捕鱼(数据库)vs.大海捕鱼(大数据) ?
1、数据规模: 池塘 的处理对象通常以MB 为基本单位,而 大海 则常常以GB,甚至是TB、PB 为基本处理单位. ?