十大理由:Hadoop成大数据分析首选平台

在过去的三年时间里,大数据批量处理平台Apache Hadoop获得长足发展。当然,它占据了“天时”的优势:Web 2.0公司运营规模不断壮大;传统IT部署从试用单点部署迈向大规模产品部署。另外,网络、存储和整合服务的迅猛发展使得Hadoop也成为了企业和应用扩展至更大规模的首先平台。下面,我们为大家介绍,为何Hadoop将成为大数据分析的首选平台。

一、Hadoop在实时应用程序中应用更多

Hadoop可以在可用的计算机集簇间分配数据并完成计算任务,当然也可以实现实时数据分析。Hadoop 完全基于成本效益而构建的海量数据集分析,因此,这种实时应用平台中将会更多地采用Hadoop。

二、Hadoop将帮助节省成本

Hadoop对于海量数据处理支撑模型预测分析具有举足轻重的作用。在未来,将有越来越多的企业使用 这些应用来获得更高的收益。


十大理由:Hadoop成大数据分析首选平台
三、其他大数据分析平台无法取代Hadoop

Hadoop与MongoDB、Cassandra、Couchbase和其他众多NoSQL具有显著区别。与相互割裂的处理方式不 同的是,Hadoop提供了统一的海量的API(包括MapReduce、查询语言和数据库访问,而且更易于整合 各种领先的分析和搜索平台),能够与现有的生态系统扩展提供更为丰富的服务。

十大理由:Hadoop成大数据分析首选平台
Hadoop服务器角色

四、Hadoop技术人才及需求都在不断增长

数据科学家和运营人才的需求增长迅猛,但目前的增长还不能满足需要。目前各大人才招聘站点的数 据科学家和技术人才岗位供不应求。

五、针对Hadoop的SQL工具不断扩展

结构化查询语言技能和人才的积累,将会驱动Hadoop对SQL的支持。基于SQL语言比如HiveQL和DrQL, 就是其中可以帮助Hadoop访问大规模SQL社区的工具。

六、HBase成为大文件主流平台
HBase最能施展的舞台空间之一就是二进制大型对象(BLOB),HBase是Hadoop的开源、非关系型分布 式数据模型。这些二进制大型对象包括图片、音频等多媒体对象,它们要求有支持快速检索的大型数 据仓库。

七、硬件会针对Hadoop进行优化

不仅仅是Hadoop是一款强大分布式数据处理平台,而且在企业数据中心也会根据Hadoop进行部署、整合方面的硬件优化。

八、HBase助力轻量化在线事务处理

HBase是一个构建在Hadoop分布式文件系统(HDFS)之上的大规模、分布式数据库。整合了信息、聊天和邮件到实时会话系统的Facebook Messages,是Facebook首个采用HBase的产品。未来,将会有更多 基于HBase的部署在轻量化OLTP在线事务处理平台。


十大理由:Hadoop成大数据分析首选平台
常见业务流程(含HDFS、MapReduce各个模块)

九、企业在Hadoop集群扩展更多应用

随着Hadoop的不断普及和应用,企业将利用Hadoop集群扩展更多应用,尤其是在多租户和跨用户、管理员共享集群的平台上吸引人们更多的注意力。

十大理由:Hadoop成大数据分析首选平台
Hadoop集群示意图

十、Hadoop将成为云端杀手级应用

Hadoop将成为云部署的杀手级应用。由众多云供应商提供的Hadoop集群,将会随着企业对Hadoop的应用而不断拓展。

本文固定链接: http://www.ccsbbs.com.cn/archives/5628.html | 极限手指

该日志由 极限手指 于2013年02月18日发表在 编程开发 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: 十大理由:Hadoop成大数据分析首选平台 | 极限手指

十大理由:Hadoop成大数据分析首选平台:等您坐沙发呢!

发表评论

您必须 [ 登录 ] 才能发表留言!