编辑: 枪械砖家 | 2015-06-17 |
2017 年第
3 期 总第
38 期 主办单位: 山东省经济和信息化发展研究院 山东省经济和信息化专家咨询委员会 山东省科学院情报研究所 经信词典 大数据
2 专题综述 大数据究竟是什么?
3 深度解析 大数据不在于 大 ,在于是否 恰当
16 业界新闻 大数据立法 贵阳走在前列 京津冀大数据中心将投入运营 西海岸大数据发展规划:创建国家级综合试验区
19 20
21 行业分析 深度解析制约大数据发展的三大因素
2017 年大数据发展十大趋势
22 25 ―
2 ― 【经信词典】 大数据 大数据(big data) ,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的 数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、 高增长率和多样化的信息资产.
大数据的 4V 特点:Volume(大量) 、Variety(多样) 、Velocity (高速) 、Veracity(真实性) . 大数据 首先是指数据体量(Volume)大,指大型数据集,一般 在10TB 规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了 PB 级的数据量;
其次是指数据类别(Variety)大, 数据来自多种数据源, 数据种类和格式日渐丰富, 已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据;
接着是数据处理 速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理;
最后一个特 点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的 兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性. 大数据 是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海 量、高增长率和多样化的信息资产.从数据的类别上看, 大数据 指的是无法使用传统流程 或工具处理或分析的信息.它定义了那些超出正常处理范围和大小、迫使用户采用非传统处 理方法的数据集.亚马逊网络服务(AWS) 、大数据科学家 John Rauser 提到一个简单的定义: 大数据就是任何超过了一台计算机处理能力的庞大数据量.研发小组对大数据的定义: 大数 据是最大的宣传技术、是最时髦的技术,当这种现象出现时,定义就变得很混乱. Kelly 说: 大数据是可能不包含所有的信息,但我觉得大部分是正确的.对大数据的一部分认知在于, 它是如此之大,分析它需要多个工作负载,这是 AWS 的定义.当你的技术达到极限时,也就 是数据的极限. 不论大数据如何定义,最重要的是如何使用.最大的挑战在于哪些技术能更 好的使用数据以及大数据的应用情况如何.这与传统的数据库相比,开源的大数据分析工具 的如 Hadoop 的崛起,这些非结构化的数据服务的价值在哪里. 现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切, 生活也越来越方便,大数据就是这个高科技时代的产物.阿里巴巴创办人马云来台演讲中就 提到,未来的时代将不是 IT 时代,而是 DT 的时代,DT 就是 Data Technology 数据科技,显 示大数据对于阿里巴巴集团来说举足轻重. 有人把数据比喻为蕴藏能量的煤矿.煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类, 而露天煤矿、 深山煤矿的挖掘成本又不一样. 与此类似, 大数据并不在 大 , 而在于 有用 . 价值含量、挖掘成本比数量更为重要.对于很多行业而言,如何利用这些大规模数据是赢得 竞争的关键.大数据的价值体现在以下几个方面: 1) 对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;