佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

查看: 834|回复: 0

Hadoop学习相关资料

[复制链接]
发表于 17-12-2014 10:17 PM | 显示全部楼层 |阅读模式
看到有人发Hadoop的贴,这里一些资料给大家叁考:

Hadoop Ecosystems概括了IT三大领域:System、Database和Programming。

HDFS属於System,相当于整个Hadoop的OS。HDFS涵盖了四种Cluster最主要功能:Storage cluster、HA、Load Balance和performance。

YARN、MapReduce v1、Spark涉及到Programming和Database两部份。它支援Java、Python、Ruby等语言。Pig是Hadoop自创的,比起其它的语言,它易学易懂。它们主要用来分析处理从DB里取来的资料。Hive、Flume、Sqoop之类是和DB沟通的中介程式。HBase、Hive、BeeHive是Hadoop里开发的NoSQL。

Hadoop v1 是往non-relational DB方向开发,随着涉及领域越来越大,Hadoop v2 开始尝试兼容SQL,如HiveQL就是用来与RDBMS沟通的。Hadoop自身的SQL也在研发中,如Hortonworks的Stinger、Cloudera的Impala,MapR的Drill,都是准备取代传统SQL的。

Hadoop v2是从2013年八月投入市场,学Hadoop的朋友可以直接忽略之前的版本,因为功能相差太多。

学习Hadoop可以从Hortonworks的Sandbox开始,对一些基本架构会有所认识,但一般建构Hadoop系统至少是50架Servers,所以想得到更好的经验必须到MNC里去看。另外建议先学概念,Hadoop现下还没进入成熟期,很多公司、产品会逐渐被取代、淘汰,暂时仍以Hortonworks、Cloudera和MapR三家公司居先。

懂Hadoop不一定能找到好工作机会,美国家例外。亚洲除中国外应该很少会提到Hadoop。

评分

参与人数 1人气 +5 收起 理由
nick_khor + 5 谢谢分享

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT


本周最热论坛帖子本周最热论坛帖子

ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2023 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 10-11-2025 11:48 PM , Processed in 0.134811 second(s), 29 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表