
大數(shù)據(jù)分析培訓(xùn)
第一階段:大數(shù)據(jù)前沿知識及hadoop入門
1.大數(shù)據(jù)前沿知識介紹
2.課程介紹
3. Linux及unbuntu系統(tǒng)基礎(chǔ)
4.hadoop的單機(jī)和偽分布模式的安裝配置
第二階段:Hadoop部署進(jìn)階
1.Hadoop集群模式搭建
2. Hadoop分布式文件系統(tǒng)HDFS深入剖析
3.使用hdfs提供的api進(jìn)行hdfs文件操作
4. Mapreduce概念及思想
第三階段:大數(shù)據(jù)導(dǎo)入與存儲
1.mysql數(shù)據(jù)庫基礎(chǔ)知識
2.hive安裝部署與案例
3.sqoop安裝及使用
第四階段:Hbase理論及實(shí)戰(zhàn)
1. hbase簡介
2.安裝及配置
第五階段:Spark配置及使用場景
1. spark簡介、安裝及配置
2.scala簡介、安裝及語法講解
第六階段:spark大數(shù)據(jù)分析原理
1.Spark內(nèi)核:基本定義、Spark任務(wù)調(diào)度
2.Spark Streaming 實(shí)時(shí)流計(jì)算
3.Spark MLlib 機(jī)器學(xué)習(xí)
4.Spark SQL 實(shí)戰(zhàn)
第七階段:hadoop+Spark大數(shù)據(jù)分析
1.實(shí)戰(zhàn)案例深入解析
2.hadoop+Spark的大數(shù)據(jù)分析之分類