傅一航,傅一航講師,傅一航聯系方式,傅一航培訓師-【中華講師網】
    大數據 數據分析 數據挖掘 數據建模
    54
    鮮花排名
    0
    鮮花數量
    傅一航:大數據挖掘工具:SPSS Modeler入門與提高
    2017-03-22 3046
    對象
    業務支撐、信息技術部、IT系統部、數據分析部等對數據挖掘有較高要求的相關專業人員。
    目的
    掌握大數據挖掘項目,探索數據,數據預處理,數據建模
    內容

    IBM SPPS Modeler是一個數據流處理工具,適用于數據探索與數據挖掘,包括數據預處理、數據探索、數據可視化、數據建模、數據模型優化。


    第一部分:數據挖掘基礎知識(基礎,決定你的高度)

    1、數據挖掘工具簡介

    ?  EXCEL規劃求解(數據建模工具)

    ?  SAS統計分析系統

    ?  SPSS統計產品與服務解決方案

    2、數據挖掘概述

    案例:宜家IKE如何通過數據挖掘來降低營銷成本提升利潤?


    3、數據挖掘的標準流程(CRISP-DM)

    ?  商業理解

    ?  數據準備

    ?  數據理解

    ?  模型建立

    ?  模型評估

    ?  模型應用

    案例:通信客戶流失分析及預警模型


    4、數據建模示例

    案例:客戶匹配度建模—找到你的準客戶


    第二部分:數據理解與數據準備(Modeler實操)

    1、數據挖掘處理的一般過程

    ?  數據源-->數據理解-->數據準備-->探索分析-->數據建模-->模型評估

    2、數據讀入

    ?  讀入文本文件

    ?  讀入Excel電子表格

    ?  讀入SPSS格式文件

    ?  讀入數據庫數據

    3、數據集成

    ?  變量合并(增加變量)

    ?  數據追加(添加記錄)

    4、數據理解

    ?  取值范圍限定

    ?  重復數據處理

    ?  缺失值處理

    ?  無效值處理

    ?  離群點和極端值的修正

    ?  數據質量評估

    5、數據準備:數據處理

    ?  數據篩選:數據抽樣/選擇(減少樣本數量)

    ?  數據精簡:數據分段/離散化(減少變量的取值)

    ?  數據平衡:正反樣本比例均衡

    ?  其它:排序、分類匯總

    6、數據準備:變量處理

    ?  變量變換:原變量值更新

    ?  變量派生:生成新的變量

    ?  變量精簡:降維,減少變量個數

    7、基本分析

    ?  單變量:數據基本描述分析

    ?  雙變量:相關性分析

    ?  變量精簡:特征選擇、因子分析

    8、特征選擇

    ?  特征選擇方法:選擇重要變量,剔除不重要的變量

    ?  從變量本身考慮

    ?  從輸入變量與目標變量的相關性考慮

    9、因子分析(主成分分析)

    ?  因子分析的原理

    ?  因子個數如何選擇

    ?  如何解讀因子含義

    案例:提取影響電信客戶流失的主成分分析


    第三部分:因素影響分析(特征重要性分析)

    問題:如何判斷一個因素對另一個因素有影響?

    比如營銷費用是否會影響銷售額?產品價格是否會影響銷量?產品的陳列位置是否會影響銷量?

    1、常用特征重要性分析的方法

    ?  特征選擇(減少變量個數):相關分析、方差分析、卡方檢驗

    ?  因子分析(減少變量個數):主成分分析

    ?  確定變量個數參考表

    2、相關分析(數值+數值,相關程度計算)

    問題:這兩個屬性是否會相互影響?影響程度大嗎?

    ?  相關分析概述

    ?  相關系數計算公式

    ?  相關性假設檢驗

    例:通信基本費用與開通月數的相關分析


    3、方差分析(分類+數值,影響因素分析)

    問題:哪些才是影響銷量的關鍵因素?

    ?  方差分析原理

    ?  方差分析的步驟

    ?  方差分析適用場景

    案例:開通月數對客戶流失的影響分析


    4、列聯分析(分類+分類,影響因素分析)

    ?  列聯表的原理

    ?  卡方檢驗的步驟

    ?  列聯表分析的適用場景

    案例:套餐類型對對客戶流失的影響分析


    第四部分:分類預測模型分析

    1、分類概述

    ?  分類的基本過程

    ?  常見分類預測模型

    2、邏輯回歸分析模型

    問題:如果評估用戶是否購買產品的概率?

    ?  邏輯回歸分析

    ?  邏輯回歸的原理

    案例:客戶購買預測分析(二元邏輯回歸)


    3、決策樹分類

    問題:如何提取客戶流失者、拖欠貨款者的特征?如何預測其流失的概率?

    ?  決策樹分類的原理

    ?  決策樹的三個關鍵問題

    ?  決策樹算法

    ?  如何評估分類模型的性能(查準率、查全率)

    案例:識別銀行欠貨風險,提取欠貨者的特征

    案例:客戶流失預警與客戶挽留模型


    4、神經網絡

    ?  神經網絡概述

    ?  神經元工作原理

    ?  神經網絡的建立步驟

    ?  B-P反向傳播網絡(MLP)

    ?  徑向基函數網絡(RBF)

    5、支持向量機

    ?  SVM基本原理

    ?  維災難與核函數

    6、樸素貝葉斯分類

    ?  條件概率

    ?  樸素貝葉斯

    ?  TAN貝葉斯網絡

    ?  馬爾科夫毯網絡


    第五部分:市場細分與客戶細分

    1、客戶細分常用方法

    2、聚類分析(Clustering)

    問題:如何對市場進行細分?如何提取客戶特征,從而對產品進行市場定位?

    ?  聚類方法原理介紹

    ?  聚類方法適用場景

    ?  如何細分客戶群,并提取出客戶群的特征?

    ?  K均值聚類(快速聚類)

    ?  兩步聚類

    案例:移動三大品牌細分市場合適嗎?

    演練:寶潔公司如何選擇新產品試銷區域?


    3、RFM模型分析

    ?  RFM模型,更深入了解你的客戶價值

    ?  RFM模型與市場策略

    ?  RFM模型與活躍度

    案例:淘寶客戶價值評估與促銷名單


    第六部分:其他市場營銷分析方法

    1、關聯分析(Association)

    問題:購買面包的人是否也會購買牛奶?他們同時購買哪些產品?

    ?  關聯規則原理介紹

    ?  關聯規則適用場景:交叉銷售、捆綁營銷、產品布局

    案例:超市商品交叉銷售與布局優化(關聯分析)


    結束:課程總結與問題答疑。


    全部評論 (0)

    Copyright©2008-2025 版權所有 浙ICP備06026258號-1 浙公網安備 33010802003509號 杭州講師網絡科技有限公司
    講師網 m.transparencyisgood.com 直接對接10000多名優秀講師-省時省力省錢
    講師網常年法律顧問:浙江麥迪律師事務所 梁俊景律師 李小平律師

    主站蜘蛛池模板: 怡红院一区二区三区| 色偷偷av一区二区三区| 久久99国产一区二区三区| 国产第一区二区三区在线观看| 久久青青草原一区二区| 国产乱人伦精品一区二区在线观看| 国产乱码精品一区三上| 久久99热狠狠色精品一区| 精品人妻系列无码一区二区三区 | 99精品一区二区三区无码吞精| 97久久精品无码一区二区| 日本一区中文字幕日本一二三区视频 | 琪琪see色原网一区二区| 肥臀熟女一区二区三区 | 尤物精品视频一区二区三区 | 一区二区三区影院| 亚洲乱码一区二区三区国产精品| 免费高清在线影片一区| 国产一区二区精品尤物| 97人妻无码一区二区精品免费 | 99久久人妻精品免费一区| 国产成人无码aa精品一区| 国99精品无码一区二区三区| 少妇一晚三次一区二区三区| 中文字幕不卡一区| 玩弄放荡人妻一区二区三区| 国产伦精品一区二区三区| 成人久久精品一区二区三区| 国产精品免费一区二区三区四区| 亚州AV综合色区无码一区| 丝袜无码一区二区三区| 成人精品一区二区不卡视频| 久久国产精品一区免费下载| 国产一区二区影院| 日韩在线一区二区| 久久精品视频一区| 国产91一区二区在线播放不卡 | 亲子乱av一区二区三区| 无码人妻精一区二区三区| 蜜桃无码一区二区三区| 中文字幕永久一区二区三区在线观看|