
大數據中的R語言編程培訓
第1講:R語言介紹
1.1 R語言介紹。什么是R語言?如何下載安裝R語言環境?以及簡單的R語言編程實例。
第2講:創建數據集 - 數據集的概念
2.1 數據集的概念。數據集的構成,如何在R語言環境中創建、使用數據集。
第3講: 數據結構中的向量與矩陣
2.2 向量與矩陣的定義,以及如何在R語言環境中使用這兩種數據結構。
第4講:數據結構中的數組和數據框、因子與列表,數據的輸入與數據集的標注
2.3.1 數組和數據框。數組是可以在兩個以上的維度存儲數據的R數據對象;數據框是可以將不同的數據類型組合在一起的數據結構。
2.3.2 其他數據結構,因子和列表。因子是R中用于對數據進行分類,并將其存儲為級別的數據對象;列表是可以包含多個不同數據元素的數據對象。
2.4 數據的輸入和數據集標注。數據輸入包括從鍵盤輸入、從多源數據導入等,數據集標注包括添加變量標簽、值標簽等。
第5講:圖形初階
3.1 創建和保存圖形,圖形參數。了解R中作圖的函數,及其使用方法。
3.2 圖形的修改及組合。添加文本、自定義坐標軸、添加刻度線、圖例和標注等;并學習如何使用par函數和layout函數進行圖形的組合。
第6講:數據的管理
4.1 基礎數據管理。介紹數據是什么?如何對數據進行管理。
4.2 變量、缺失值和日期值。對數據的類型進行討論,在數據處理之前要先對數據進行清洗、整理。得到規范的數據以方便后續的分析工作。
4.3 數據的排序、合并。介紹基本的排序方法以及數據的合并方法,子集以及使用SQL語句操作數據框等。
第11講:統計分析
7.1 基本統計分析
7.2 相關性
第7講:高級數據管理 -- 數學函數、統計函數和字符處理函數
5.1 數學函數與統計函數
5.2 字符處理函數
第8講:一個數據處理實例
5.3 一個數據處理實例。將學生的各科期末考試成績組合為單一的成績衡量指標,并基于相對名次(前20%,后20%等)給出A到F的評分,按照學生的姓氏和名字的首字母排序后輸出。
5.4 控制流語句
5.5 自定義函數
第9講:數據的可視化 -- 條形圖和餅狀圖
6.1 條形圖和餅狀圖
第10講:數據的可視化 -- 基本圖形中的直方圖、核密度圖、箱型圖和點圖
6.2 直方圖、核密度圖、箱型圖和點圖
第12講:回歸分析
8.1 簡單線性回歸、多項式回歸以及多元線性回歸的理解與實戰
第13講:實戰案例分析
9.1 實戰案例分析(一)
9.2 實戰案例分析(二)