掌握數據分析的方法,掌握數據挖掘中常用的分類分析、關聯分析、聚類分析,掌握數據挖掘應用的開展流程和要點,了解電子渠道領域實際數據挖掘案例
時間安排 | 大綱 | 課程內容 | 課程收獲 |
**天上午 | 破冰開場 | 1. 開篇故事:阿里巴巴的秘密武器 2. 課程收益 3. 組建學習團隊 4. 達成共識 | l 破冰 l 激發學習興趣 l 培訓紀律 |
**天上午 | 數據挖掘引論 | 1. 數據化運營 1.1. 現代營銷理論的發展 1.1.1. 從4P到4C 1.1.2. 從4C到3P3C 1.2. 數據化運營的主要內容 1.3. 為什么要數據化運營 1.4. 數據化運營的必要條件 2. 數據分析與數據挖掘 2.1. 什么是數據分析? 2.2. 什么是數據挖掘? 2.3. 數據挖掘的起源 2.4. 數據挖掘的任務 2.5. 數據挖掘主要成熟技術 2.5.1. 決策樹 2.5.2. 神經網絡 2.5.3. 回歸分析 2.5.4. 關聯規則 2.5.5. 聚類分析 2.5.6. 貝葉斯分類方法 2.5.7. 支持向量機 2.5.8. 主成分分析 2.5.9. 假設檢驗 2.6. 電信及互聯網行業數據挖掘應用的特點
| l 了解數據挖掘的主要用途 l 了解數據挖掘的概念、流程、主要技術 |
**天上午 | 電子渠道數據分析工具 | 1. 數據類型 1.1. 屬性與度量 1.2. 數據集的類型 2. 數據質量 3. 數據預處理 3.1. 聚集 3.2. 抽樣 3.3. 特征創建 3.4. 離散化和二元化 3.5. 變量變換 4. 匯總數據 4.1. 頻數和眾數 4.2. 百分位數 4.3. 位置度量:均值和中位數 4.4. 散布度量:極差和方差 4.5. 多元匯總方法 4.6. 其他匯總數據的方法 5. 數據可視化 5.1. 可視化一般概念 5.2. 可視化技術 5.3. 可視化高維數據 6. OLAP和多維數據分析 6.1. 多維數據一般情況 6.2. 分析多維數據
| l 掌握數據分析的基本概念、方法 l 掌握數據探索的基本方法 l 掌握可視化和OLAP的基本方法 |
**天下午 | 分類分析的方法與技術 | 1. 解決分類問題的一般方法 2. 決策樹歸納法 2.1. 決策樹的工作原理 2.2. 如何建立決策樹 2.3. 選擇佳劃分的度量 2.4. 決策樹歸納算法 3. 模型的過分擬合 4. 評估分類器的性能 5. 基于規則的分類器 6. 近鄰分類器 7. 貝葉斯分類器 8. 人工神經網絡 9. 支持向量機 10. 組合方法 11. 不平衡類問題 12. 多類問題 13. 案例:分類分析案例
| l 掌握分類分析的方法和技術 |
第二天 | 關聯分析的方法與技術 | 1. 問題定義 2. 頻繁項集的產生 3. 規則產生 4. 頻繁項集的緊湊表示 5. FP增長算法 6. 關聯模式的評估 7. 處理分類屬性 8. 處理連續屬性 9. 處理概念分層 10. 序列模式 11. 子圖模式 12. 案例:關聯分析案例
| l 掌握關聯分析的方法與技術 |
第三天 | 聚類分析的方法與技術 | 1. 聚類分析的概念 2. K均值 3. 凝集層次聚類 4. DBSCAN聚類算法 5. 簇評估 6. 數據和簇特征 7. 基于原型的聚類 8. 基于密度的聚類 9. 基于圖的聚類 10. 可伸縮的聚類算法 11. 案例:聚類分析案例
| l 掌握聚類分析的方法和技術 |
第四天上午 | 數據挖掘應用要點 | 1. 數據挖掘是跨專業款團隊的合作 1.1. 數據分析團隊與業務團隊的分工和定位 1.2. 數據分析團隊與業務團隊的協同作業 1.3. 案例:阿里巴巴數據挖掘團體架構 2. 數據分析師是分析團隊的靈魂 2.1. 數據分析師常見錯誤觀念 2.1.1. 輕視業務論 2.1.2. 技術萬能論 2.1.3. 技術尖端論 2.1.4. 建模與應用兩段論 2.1.5. 機器萬能論 2.2. 數據分析師品質和思維模式培養 2.2.1. 態度決定一切 2.2.2. 商業意識是核心 2.2.3. 一個基本的方法論 2.2.4. 大膽假設,小心求證 2.2.5. 結構化思維 2.2.6. 主觀與客觀的結合 2.3. 數據挖掘的質量保障制度與流程 2.3.1. 業務需求的收集 2.3.2. 評估需求的優先級 2.3.3. 課題組的成立及前期摸底 2.3.4. 提交正式課題計劃書 2.3.5. 數據挖掘課題展開 2.3.6. 提交結論報告及業務落地應用建議書 2.3.7. 效果監控反饋
| l 理解數據分析團隊的特點 l 理解數據分析的要求 l 掌握數據分析應用的開展流程 |
第四天上午 | 電子商務數據分析與挖掘工具 | 1. SPSS數據文件的建立和管理 2. SPSS數據的預處理 2.1. 數據的排序 2.2. 變量計算 2.3. 數據選取 2.4. 計數 2.5. 分類匯總 2.6. 數據分組 3. SPSS基本統計 3.0.1. 頻數統計 3.0.2. 計算基本統計量 3.0.3. 交叉分組統計 3.0.4. 多選項分析 3.0.5. 比率分析 4. SPSS的參數檢驗 5. SPSS的方差分析 6. SPSS的相關分析與線性回歸分析 7. SPSS的聚類分析 7.1. 一般聚類 7.2. 層次聚類 7.3. K-Means聚類
| l 掌握SPSS的基本用法 |
第四天下午 | 電子商務常見數據挖掘項目 | 1. 目標客戶的預測/響應/分類模型 2. 用戶路徑分析模型 3. 交叉銷售模型 4. 信息/用戶質量模型 5. 服務保障模型 6. 用戶/買家/賣家分層模型 7. 交易模型 8. 信用風險模型 9. 用戶流失模型 10. 商品推薦模型
| l 掌握常見數挖掘項目的要點 |
第四天下午 | 電子商務數據挖掘案例 | 1. 基于數據挖掘的電子渠道分類模型 2. 基于數據挖掘技術的通信行業電子渠道營銷平臺設計與實施 3. 阿里巴巴數據挖掘經典案例全程演示——免費會員成熟度分析及付費用戶轉化 | l 了解電子渠道數據挖掘案例 |