
R語(yǔ)言數(shù)據(jù)挖掘與商業(yè)分析建模培訓(xùn)
R語(yǔ)言數(shù)據(jù)挖掘與商業(yè)分析建模
第0講 數(shù)據(jù)分析基本概念
0.1 商業(yè)數(shù)據(jù)分析的本質(zhì)
0.2 商業(yè)數(shù)據(jù)分析中心建設(shè)
0.3 商業(yè)數(shù)據(jù)分析的階段與行業(yè)運(yùn)用
0.4 商業(yè)數(shù)據(jù)分析在銀行中的運(yùn)用
0.5 商業(yè)數(shù)據(jù)挖掘通用方法論
0.6 課程安排
第1講 準(zhǔn)備知識(shí)
1.1.0 引言與課程介紹
1.1.1 Capital One的故事
1.1.2 風(fēng)險(xiǎn)管理的理解
1.1.3 巴塞爾協(xié)議介紹
1.1.4 三大類風(fēng)險(xiǎn)
1.1.5 信用評(píng)分卡類型
1.1.6 信用風(fēng)險(xiǎn)IT系統(tǒng)
1.2.1 數(shù)據(jù)挖掘方法分類
1.2.2 分類模型示例
1.3.1 R的身世和特點(diǎn)1
1.3.2 安裝R和包
1.4 數(shù)據(jù)分析流程演示
1.5 參考資料講解
第2講 R語(yǔ)言編程基礎(chǔ)與數(shù)據(jù)整合(分開(kāi)2)
2.1.1 R的基本數(shù)據(jù)類型
2.1.2 R的數(shù)據(jù)結(jié)構(gòu)
2.1.3 R程序控制
2.1.4_1 R的函數(shù)與包
2.1.4_2 R的函數(shù)與包
2.1.5 R的時(shí)間與日期類型
2.1.6 在R中讀取數(shù)據(jù)
2.2.1 背景介紹
2.2.2 數(shù)據(jù)庫(kù)基礎(chǔ)知識(shí)
2.2.3 數(shù)據(jù)介紹
2.3.1 SQL語(yǔ)句介紹
2.3.2 縱向連接表
2.3.3 橫向連接表
第3講 描述性統(tǒng)計(jì)分析基礎(chǔ)
3.1 描述性統(tǒng)計(jì)與探索型數(shù)據(jù)分析-1
3.1 描述性統(tǒng)計(jì)與探索型數(shù)據(jù)分析-2
3.2 APPLY函數(shù)族
3.3 制圖原理-1
3.3 制圖原理-2
3.4 R基礎(chǔ)繪圖包
3.5 GGPLOT2繪圖
3.6 使用SQL進(jìn)行匯總
3.7_1 使用描述性方法做貸款違約特征探索_1
3.7_2 使用描述性方法做貸款違約特征探索_2
3.7_3 使用描述性方法做貸款違約特征探索_3
第4講 數(shù)據(jù)清洗與信息壓縮(分開(kāi)2)
4.1 FRM提取行為變量
4.2 數(shù)據(jù)重組
4.3 抽樣知識(shí)
4.4.0 信息壓縮(概述)
4.4.1 分類變量重編碼(概化)
4.4.2 基于目標(biāo)變量的轉(zhuǎn)換-WOE
4.5.1 主成分分析
4.5.2_1 變量聚類
4.5.2_2 變量聚類
4.6 臟數(shù)據(jù)或數(shù)據(jù)不正確
4.7 數(shù)據(jù)重復(fù)
4.8 缺失值處理
4.9 噪聲值處理
第5講 統(tǒng)計(jì)推斷基礎(chǔ)
5.1 參數(shù)估計(jì)
5.2 假設(shè)檢驗(yàn)與單樣本T檢驗(yàn)
5.3 兩樣本T檢驗(yàn)
5.4 方差分析
5.5 相關(guān)分析
5.6 卡方檢驗(yàn)
第6講 客戶價(jià)值預(yù)測(cè)_線性回歸模型與診斷
6.0 內(nèi)容介紹
6.1 相關(guān)性分析
6.2.1 簡(jiǎn)單線性回歸_1
6.2.1 簡(jiǎn)單線性回歸_2
6.2.1 簡(jiǎn)單線性回歸_3
6.2.2 模型解釋
6.2.3 多元線性回歸
6.2.4 多元線性回歸的變量篩選
6.3.0 線性回歸的診斷介紹
6.3.1 殘差分析
6.3.2 強(qiáng)影響點(diǎn)分析
6.3.3 多重共線性分析
6.4 數(shù)值預(yù)測(cè)評(píng)估原理
6.5.0 正則化方法介紹
6.5.1 嶺回歸
6.5.2 LASSO算法
6.6 附錄:估計(jì)方法
第7講 用邏輯回歸作申請(qǐng)?jiān)u分信用評(píng)級(jí)
7.0 內(nèi)容介紹
7.1 分類變量的相關(guān)關(guān)系
7.2 邏輯回歸
7.3 模型評(píng)估_1決策類
7.3 模型評(píng)估_2排序類介紹
7.3 模型評(píng)估_3ROC
7.3 模型評(píng)估_4其它排序類
7.3 模型評(píng)估_5R的實(shí)現(xiàn)
7.4 因果關(guān)系建模與取數(shù)邏輯
7.5 附錄:邏輯回歸估計(jì)方法
第8講 用決策樹(shù)做可表述的模式
8.1 決策樹(shù)建模思路
8.2 決策樹(shù)建模基本原理
8.3 Quinlan系列決策樹(shù)建模原理_1
8.3 Quinlan系列決策樹(shù)建模原理_2
8.4 CART決策樹(shù)建模原理_1
8.4 CART決策樹(shù)建模原理_2
8.5 模型修剪—以CART為例
8.7 組合算法與隨機(jī)森林
8.8 汽車貸款違約的模式表述
第9講 用神經(jīng)網(wǎng)絡(luò)做行為信用評(píng)級(jí)
9.0 前言
9.1 基本概念
9.2 人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
9.3 感知器與BP網(wǎng)絡(luò)_1
9.3 感知器與BP網(wǎng)絡(luò)_2
9.3 感知器與BP網(wǎng)絡(luò)_3
9.3 感知器與BP網(wǎng)絡(luò)_4
9.4 徑向基神經(jīng)網(wǎng)絡(luò)_1
9.4 徑向基神經(jīng)網(wǎng)絡(luò)_2
9.4 徑向基神經(jīng)網(wǎng)絡(luò)_3
第10講 分類器入門(mén)與支持向量機(jī)
10.1.0 分類器的概念
10.1.1 KNN算法_1
10.1.1 KNN算法_2
10.1.2 樸素貝葉斯_1
10.2.1 支持向量機(jī)概述
10.2.2 支持向量機(jī)詳述_1
10.2.2 支持向量機(jī)詳述_2
10.2.2 支持向量機(jī)詳述_3
第11講 客戶聚類與聚類后畫(huà)像
11.1 基本概念
11.2 層次聚類_1
11.2 層次聚類_2
11.3.1 K-means聚類_1
11.3.1 K-means聚類_2
11.3.1 K-means聚類_3
11.3.2使用決策樹(shù)做聚類后客戶畫(huà)像
第12講 使用推薦算法提升客戶價(jià)值
12.1 廣告推薦介紹
12.2 購(gòu)物籃分析與運(yùn)用_1
12.2 購(gòu)物籃分析與運(yùn)用_2
12.3 相關(guān)性在推薦中的運(yùn)用
12.4.1 協(xié)同過(guò)濾介紹
12.4.2 基于物品的協(xié)同過(guò)濾
12.5 基于內(nèi)容的推薦
12.6 附錄:矩陣奇異值分解(SVD)在協(xié)同過(guò)濾中的運(yùn)用
第13講 使用時(shí)間序列(ARIMA)分析做銷售量預(yù)測(cè)
13.1 認(rèn)識(shí)時(shí)間序列
13.2 簡(jiǎn)單時(shí)間序列分析法:平滑算法_1
13.2 簡(jiǎn)單時(shí)間序列分析法:平滑算法_2
13.2 簡(jiǎn)單時(shí)間序列分析法:平滑算法_3
13.2 簡(jiǎn)單時(shí)間序列分析法:平滑算法_4
13.3 平穩(wěn)時(shí)間序列(ARMA)模型設(shè)定與識(shí)別_1
13.3 平穩(wěn)時(shí)間序列(ARMA)模型設(shè)定與識(shí)別_2
13.3 平穩(wěn)時(shí)間序列(ARMA)模型設(shè)定與識(shí)別_3
13.4 非平穩(wěn)時(shí)間序列(ARIMA)模型_1
13.4 非平穩(wěn)時(shí)間序列(ARIMA)模型_2
13.5 實(shí)際數(shù)據(jù)時(shí)間序列建模步驟_1
13.5 實(shí)際數(shù)據(jù)時(shí)間序列建模步驟_2
13.5 實(shí)際數(shù)據(jù)時(shí)間序列建模步驟_3
第14講 汽車金融申請(qǐng)信用評(píng)級(jí)模型案例
案例1.1 業(yè)務(wù)理解
案例1.2 數(shù)據(jù)理解
案例1.3.1 拒絕推斷_1
案例1.3.1 拒絕推斷_2
案例1.3.1 拒絕推斷_3
案例1.3.2 變量粗篩
案例1.3.3 變量細(xì)篩與數(shù)據(jù)清洗_1
案例1.3.3 變量細(xì)篩與數(shù)據(jù)清洗_2
案例1.3.3 變量細(xì)篩與數(shù)據(jù)清洗_3
案例1.3.4 連續(xù)變量分箱WOE轉(zhuǎn)換
案例1.4 建模與模型評(píng)估
案例1.5 模型監(jiān)測(cè)