编辑: 木头飞艇 2014-01-27

图表一:英特尔? Hadoop 发行版 (Intel Distribution) 软件 Intel? Manager for Hadoop*软件 部署、配置、监控、警报和安全性 Pig* 脚本 Hive* 类SQL 查询 HBase* 分列存储 Zookeeper* 协调 Sqoop 数据交换 Flume 日志收集器 MapReduce 分布式处理框架 HDFS* Hadoop 分布式文件系统 客户自助服务计费请求 详单查询系统 Apache Hadoop* 够查询并在线支付话费,准确实时查询 六个月内的电话详单.英特尔解决方案 只以当前 RISC(精简指令集计算机) 平台价格的一小部分就实现了这一功能,但在规模上却以经济的方式扩展到 数亿个用户.这种实时电话详单查询功 能可让中国移动广东公司收集手机基站 性能(中断次数、每个基站掉线呼叫数 量)、用户电话设备偏好/性能和客户习 惯(他们可利用此信息开展有针对性的 营销和促销)等分析数据. 商业收益 硬件.解决方案性能因此显著提高,使团 队的整体硬件投资减少,提高能源效率, 并提供了一个未来升级路径,成本明显低 于基于RISC的旧系统.

图表二:英特尔基于大数据量优化的软硬件解决方案使中国移动广东公司的个人用户能 够查询并在线支付话费,准确实时查询六个月内的电话详单. 本文档及其信息供英特尔客户的便利之用, 按现状 提供,不作任何明示或暗示的担保,包括任何可销售、适用于特定目的以及不违反知识产权的暗示保证.收到或拥有本文档不代表授予任何由 此所描述、显示或包含的知识产权.英特尔?产品未计划用于医学、救生、生命维持、关键控制、安全系统或核设施应用. ? 2012英特尔公司.保留所有权利.英特尔、英特尔标识和英特尔至强是英特尔公司在美国和/或其他国家或地区的商标. *文中涉及的其它名称及商标术语各自所有者资产. 0912/EMM/PMG/XXPDF 327967-001CN 存储.为提高扩展能力,Intel? Distribution 的分布式数据库组件 (HBase) 将详细的计 费信息保存在一个大型 HBase 表中;

而HBase 集群提供了详细的数据写入和查询 服务.当整个系统需要扩容时,可以增 加数据节点,系统会自动实时地将新的服 务器匹配到整个阵列.HBase 的大表自动 分割数据表,并将数据表的访问服务部署 到集群的所有数据节点.因此,新的帐单 明细查询系统将实现经济实惠的 向上扩 展 ,为中国移动广东公司轻松扩容. 性能.虽然广东分公司目前侧重于结构化 数据,但Hadoop 表现得完美无缺,引进 了一个平台来处理未来的非结构化数据 需求.在提高海量数据处理性能方面, Intel Distribution 支持从 HBase 数据库引擎 对不同的服务器节点进行分布式数据访 问.由于集群分配服务的总体网络带宽 高,这个解决方案带来了高速的 HBase 数 据库访问.此外,HBase 的 无共享 框 架消除了数据库文件访问带宽和联锁的瓶 颈.数据库访问吞吐量增加了几倍甚至几 百倍,从而带来非常高的数据吞吐量.中 国移动广东公司的账单明细检索查询速度 是3 00000份账单/秒,插入速度是800000 份账单/秒.该系统目前每月无缝处理30tb 的用户计费数据,每个表支持数十亿份账 单.查询性能提高了30倍,从而大大提高 了新系统的处理性能,即使有数百万用户 查询系统. 可靠性.正常运行时间与灾难恢复已获得 大........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题