Hadoop分布式大数据平台

1.什么是hadoop

分布式大数据平台

mysql 工作原理:架构cs/bs

通过网络发送

server          client

通过软件编写一个数据库

服务端server

客户端client

如此建立的数据库的弊端:无法扩容内存,数据只存储在server,抗压能力弱

因此hadoop分布式大数据平台是更好的选择

2.hadoop里面有那些主件

hdfs-----分布式文件系统

hive-----数据仓库

HBase------分布式数据库

(1)搭建hadoop

master   -----主节点     ------内存4500MB    CPU---1     硬盘40G

  svlave -----从节点     ------内存2500MB    CPU---1     硬盘40G


yum install wget
wget http://public-repo-1.hortonworks.com/ambari/centos6/2.x/updates/2.0.1/ambari.repo