
大數據分析培訓
第一階段:大數據前沿知識及hadoop入門
1.大數據前沿知識介紹
2.課程介紹
3. Linux及unbuntu系統基礎
4.hadoop的單機和偽分布模式的安裝配置
第二階段:Hadoop部署進階
1.Hadoop集群模式搭建
2. Hadoop分布式文件系統HDFS深入剖析
3.使用hdfs提供的api進行hdfs文件操作
4. Mapreduce概念及思想
第三階段:大數據導入與存儲
1.mysql數據庫基礎知識
2.hive安裝部署與案例
3.sqoop安裝及使用
第四階段:Hbase理論及實戰
1. hbase簡介
2.安裝及配置
第五階段:Spark配置及使用場景
1. spark簡介、安裝及配置
2.scala簡介、安裝及語法講解
第六階段:spark大數據分析原理
1.Spark內核:基本定義、Spark任務調度
2.Spark Streaming 實時流計算
3.Spark MLlib 機器學習
4.Spark SQL 實戰
第七階段:hadoop+Spark大數據分析
1.實戰案例深入解析
2.hadoop+Spark的大數據分析之分類
3.Logistic回歸與主題推薦