Hadoop Pseudo-Distributed Setup
偽分布式模式(Pseudo-Distributed Mode)
- 在單個集群上運行Hadoop
- 所有的Hadoop daemon皆運行在不同的Java process
- 在單機模式上增加了程式調適功能,並允許檢查以下狀態:
- 記憶體使用情況
- HDFS的輸出/輸入
- 與其他daemon的交互情況,如namenode,datanode,secondarynamenode,jobtracer,tasktrace
部署流程
基本訊息
- OS: CentOS 6.5 64bit
- Hadoop: 2.8.1
- JDK: 8u144
新增Hadoop user
|
|
設置Hadoop目錄
- Hadoop壓縮包來源可以是:
- 透過Hadoop source code自行編譯
- Hadoop官網下載
|
|
建立Hadoop目錄軟連結
|
|
設置環境變量
|
|
確認ssh service狀態
|
|
配置Hadoop user與ssh信任關係
|
|
配置Hadoop Pseudo-Distributed文件
Hadoop官方建議配置123456789101112131415[hadoop@hadoop-01 hadoop]$ vi etc/hadoop/core-site.xml<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property></configuration>[hadoop@hadoop-01 hadoop]$ vi etc/hadoop/hdfs-site.xml<configuration> <property> <name>dfs.replication</name> <value>1</value> </property></configuration>
HDFS格式化與啟動Hadoop
|
|