ClouderaApacheHadoop培訓及認證幫助您進階大數(shù)據(jù)知識及技能。
  Cloudera大學為期4天的Hadoop管理員培訓將幫助學員綜合理解并全面掌握通過ClouderaManager對Hadoop集群的運維管理,包括:安裝,配置、負載平衡及性能調(diào)優(yōu)等。通過該培訓,Hadoop系統(tǒng)管理員將能準備好應對實際運維中遇到的挑戰(zhàn)。  一.培訓內(nèi)容       通過講師在課堂上的講解,以及實操練習,學員將學習以下內(nèi)容:       ●  ClouderaManager管理集群的特性,諸如日志匯總、配置管理、資源管理、報告、報警及服務管理等。       ●  YARN、MapReduce、Spark及HDFS的工作原理。       ●  如何為你的集群選取合適的硬件和架構。       ●  如何將Hadoop集群和企業(yè)已有的系統(tǒng)進行無縫集成。       ●  如何使用Flume進行實時數(shù)據(jù)采集以及如何使用Sqoop在RDBMS和Hadoop集群之間進行數(shù)據(jù)導入導出。       ●  如何配置公平調(diào)度器為Hadoop上的多用戶提供服務級別保障。       ●  產(chǎn)品環(huán)境中Hadoop集群的運維實踐。       ●  Hadoop集群排錯、診斷問題和性能調(diào)優(yōu)。  二.培訓對象及學員基礎        面向系統(tǒng)管理員和IT經(jīng)理,需具備Linux經(jīng)驗,無需ApacheHadoop基礎。  三.認證  結束本課程培訓后,我們建議學員準備并注冊參加CCAHadoop管理員考試。通過并獲取該證書是向公司及客戶證明個人在Hadoop領域的技術和專長的有力依據(jù)。  四.課程大綱       1.  ApacheHadoop介紹             ●  Hadoop的創(chuàng)建動機             ●  基本概念             ●  Hadoop核心部件       2.  Hadoop集群安裝             ●  集群管理方案             ●  ClouderaManager特性             ●  Clouderamanager安裝             ●  Hadoop(CDH)安裝       3.  Hadoop分布式文件系統(tǒng)(HDFS)             ●  HDFS特性             ●  讀寫文件             ●  NameNode內(nèi)存考慮             ●  HDFS安全簡介             ●  HDFSWebUI             ●  使用HDFSShell       4.  YARN上的MapReduce和Spark             ●  計算平臺在Hadoop里扮演的角色             ●  YARN:集群資源管理器             ●  MapReduce概念             ●  ApacheSpark概念             ●  Yarn上的計算平臺             ●  通過WebUI及Shell觀察YARN應用             ●  YARN應用運行日志       5.  Hadoop配置及服務運行日志             ●  ClouderaManager配置管理機制             ●  定位配置參數(shù)及進行配置變更             ●  管理角色實例及添加服務             ●  配置HDFS服務             ●  配置Hadoop服務運行日志             ●  配置YARN服務       6.  HDFS數(shù)據(jù)導入             ●  使用Flume從外部數(shù)據(jù)源實時             ●  導入數(shù)據(jù)             ●  使用Sqoop從關系數(shù)據(jù)庫導入數(shù)據(jù)             ●  REST接口             ●  導入數(shù)據(jù)的實踐       7.  Hadoop集群規(guī)劃             ●  規(guī)劃考慮因素             ●  硬件選擇             ●  虛擬化選項*             ●  網(wǎng)絡因素             ●  節(jié)點配置       8.  Hive,Impala及Pig安裝及配置             ●  Hive             ●  Impala             ●  Pig       9.  Hadoop客戶端及Hue             ●  什么是Hadoop客戶端             ●  安裝及配置Hadoop客戶端             ●  安裝及配置Hue             ●  使用Hue進行身份驗證及授權      10.  集群高級配置             ●  高級配置參數(shù)             ●  Hadoop端口配置             ●  HDFS機柜感知配置             ●  HDFS高可靠性配置      11.  Hadoop安全             ●  Hadoop安全的重要性             ●  Hadoop安全性概念             ●  Kerberos簡介             ●  使用Kerberos保護Hadoop集群             ●  其他安全概念      12.  資源管理             ●  使用靜態(tài)服務池配置Linuxcgroup             ●  公平調(diào)度器             ●  配置動態(tài)資源池             ●  YARN內(nèi)存及CPU設置             ●  Impala查詢調(diào)度      13.  集群維護             ●  檢查HDFS狀態(tài)             ●  集群間復制數(shù)據(jù)             ●  添加/移除集群節(jié)點             ●  集群數(shù)據(jù)負載平衡             ●  目錄快照             ●  集群升級      14.  集群監(jiān)控及排錯             ●  ClouderaManager監(jiān)控特性             ●  監(jiān)控Hadoop集群             ●  Hadoop集群排錯             ●  常見配置不當問題      15.  結論
Cloudera大數(shù)據(jù)課程體系
