编辑: 山南水北 2015-02-14

3 值了. 这个速度要求是大数据处理技术和传统的数据挖掘技术最大的 区别. 由此,业界将大数据的特点归纳为

4 个 V ――Volume(大量)、 Velocity(高速)、Variety(多样)、Veracity(精确). 什么是大数据思维? [2] 《大数据时代》一书的作者维克托?迈尔-舍恩伯格认为,1-需要 全部数据样本而不是抽样;

2-关注效率而不是精确度;

3-关注相关性 而不是因果关系. 阿里巴巴的王坚对于大数据也有一些独特的见解,比如, 今天的数据不是大,真正有意思的是数据变得在线了,这个恰 恰是互联网的特点. 非互联网时期的产品,功能一定是它的价值,今天互联网的产 品,数据一定是它的价值. 你千万不要想着拿数据去改进一个业务,这不是大数据.你一 定是去做了一件以前做不了的事情. 特别是最后一点,充分说明了大数据的真正价值在于创造,在于 填补无数个还未实现过的空白. 有人把数据比喻为蕴藏能量的煤矿.煤炭按照性质有焦煤、无烟 煤、 肥煤、 贫煤等分类, 而露天煤矿、 深山煤矿的挖掘成本又不一样. 与此类似,大数据并不在 大 ,而在于 有用 .价值含量、挖掘成 本比数量更为重要. 大数据的分类 [3] 大数据可分成大数据技术、大数据工程、大数据科学和大数据应 用等领域.目前人们谈论最多的是大数据技术和大数据应用.工程和 科学问题尚未被重视.大数据技术指从各种各样类型的数据中,快速 获得有价值信息的能力;

大数据工程指大数据的规划建设运营管理的 系统工程;

大数据科学关注大数据网络发展和运营过程中发现和验证 信息参考

4 大数据的规律及其与自然和社会活动之间的关系. 大数据的实践[2] 互联网的大数据 互联网上的大数据很难清晰的界定分类界限, 我们先看看二巨头 的大数据: 阿里巴巴拥有交易数据和信用数据.这两种数据更容易变现, 挖 掘出商业价值. 除此之外阿里巴巴还通过投资等方式掌握了部分社交 数据、移动数据.如微博和高德. 腾讯拥有用户关系数据和基于此产生的社交数据. 这些数据可以 分析人们的生活和行为,从里面挖掘出政治、社会、文化、商业、 健 康等领域的信息,甚至预测未来. 在信息技术更为发达的美国,除了行业知名的类似 Google, Facebook 外,已经涌现了很多大数据类型的公司,它们专门经营数 据产品,比如: Metamarkets:这家公司对 Twitter、支付、签到和一些与互联 网相关的问题进行了分析,为客户提供了很好的数据分析支持. Tableau:他们的精力主要集中于将海量数据以可视化的方式展 现出来.Tableau 为数字媒体提供了一个新的展示数据的方式.他们 提供了一个免费工具, 任何人在没有编程知识背景的情况下都能制造 出数据专用

图表.这个软件还能对数据进行分析,并提供有价值的建 议. ParAccel:他们向美国执法机构提供了数据分析,比如对

15000 个有犯罪前科的人进行跟踪, 从而向执法机构提供了参考性较高的犯 罪预测.他们是犯罪的预言者. QlikTech:QlikTech 旗下的 Qlikview 是一个商业智能领域的自 主服务工具,能够应用于科学研究和艺术等领域.为了帮助开发者对 信息参考

5 这些数据进行分析,QlikTech 提供了对原始数据进行可视化处理等 功能的工具. GoodData:GoodData 希望帮助客户从数据中挖掘财富.这家创 业公司主要面向商业用户和 IT 企业高管,提供数据存储、性能报告、 数据分析等工具. TellApart:TellApart 和电商公司进行合作,他们会根据用户 的浏览行为等数据进行分析, 通过锁定潜在买家方式提高电商企业的 收入. DataSift:DataSift 主要收集并分析社交网络媒体上的数据, 并帮助品牌公司掌握突发新闻的舆论点,并制定有针对性的营销方 案.这家公司还和 Twitter 有合作协议,使得自己变成了行业中为数 不多可以分析早期 tweet 的创业公司. Datahero:公司的目标是将复杂的数据变得更加简单明了,方便 普通人去理解和想象. 政府的大数据 美国麦肯锡全球研究院

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题
大家都在看的话题