|
查看: 834|回复: 0
|
Hadoop学习相关资料
[复制链接]
|
|
|
看到有人发Hadoop的贴,这里一些资料给大家叁考:
Hadoop Ecosystems概括了IT三大领域:System、Database和Programming。
HDFS属於System,相当于整个Hadoop的OS。HDFS涵盖了四种Cluster最主要功能:Storage cluster、HA、Load Balance和performance。
YARN、MapReduce v1、Spark涉及到Programming和Database两部份。它支援Java、Python、Ruby等语言。Pig是Hadoop自创的,比起其它的语言,它易学易懂。它们主要用来分析处理从DB里取来的资料。Hive、Flume、Sqoop之类是和DB沟通的中介程式。HBase、Hive、BeeHive是Hadoop里开发的NoSQL。
Hadoop v1 是往non-relational DB方向开发,随着涉及领域越来越大,Hadoop v2 开始尝试兼容SQL,如HiveQL就是用来与RDBMS沟通的。Hadoop自身的SQL也在研发中,如Hortonworks的Stinger、Cloudera的Impala,MapR的Drill,都是准备取代传统SQL的。
Hadoop v2是从2013年八月投入市场,学Hadoop的朋友可以直接忽略之前的版本,因为功能相差太多。
学习Hadoop可以从Hortonworks的Sandbox开始,对一些基本架构会有所认识,但一般建构Hadoop系统至少是50架Servers,所以想得到更好的经验必须到MNC里去看。另外建议先学概念,Hadoop现下还没进入成熟期,很多公司、产品会逐渐被取代、淘汰,暂时仍以Hortonworks、Cloudera和MapR三家公司居先。
懂Hadoop不一定能找到好工作机会,美国家例外。亚洲除中国外应该很少会提到Hadoop。
|
评分
-
查看全部评分
|
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|