數據挖掘是近幾年來一個在IT領域非常活躍的實用性技術學科,由于其廣泛的應用,極為出彩的實際應用效果,對于各行業幾乎都可以無門檻地進行分析和挖掘部署,受到了越來越多的關注。數據挖掘是一門綜合學科,它包括了數據庫技術、統計學、信息科學、機器學習、可視化、以及其他學科的部分內容。
在互聯網行業大行其道的今天,越來越多的傳統行業受到了沖擊,而在這一切競爭的背后,數據都被認為是能夠戰勝對手使企業脫穎而出的利器,從數據中學習知識已經是眾多大型企業的共識,而在各行業中的領頭羊企業的數據挖掘水平也常被稱道,如阿里巴巴的大數據挖掘,百度的深度學習等等
數據挖掘工程師作為一個職業,有著非常好的前景和巨大的職位缺口,有志向職位發展的同學急不可急于求成,要扎實地打好基礎,學習數據挖掘算法,有一定的行業知識了解,清楚各行業分析過程中更為看重的目標是什么。
第一部份 數據挖掘算法體系與常用挖掘軟件
第二部份 K-NN算法與建立模型
第三部份 樸素貝葉斯算法與交叉驗證
第四部份 零售行業的客戶挖掘
第五部份 教育行業的關聯推薦算法
第六部份 醫療主題的聚類算法學習
第七部份 文本挖掘:垃圾郵件檢測
第八部份 文本挖掘:語言識別與客戶反饋分析
第九部份 基于天體物理學和醫療行業的特征選擇和分類學習
第十部份 基于生物醫療行業的建模學習
第十一部份 異常檢測和實例選擇
第十二部份 元建模學習和特征選擇以及參數優化