如何對用戶進(jìn)行聚類分析
需要搜集用戶的哪些特征,?
聚類分析變量選擇的原則是:在哪些變量組合的前提,,使得類別內(nèi)部的差異盡可能的小,即同質(zhì)性高,,類別間的差異盡可能的大,即同質(zhì)性低,,并且變量之間不能存在高度相關(guān),。
常用的用戶特征變量有:
① ?
人口學(xué)變量:如年齡、性別,、婚姻,、教育程度、職業(yè),、收入等,。通過人口學(xué)變量進(jìn)行分類,了解每類人口的需求有何差異,。
② ?
用戶目標(biāo):如用戶為什么使用這個(gè)產(chǎn)品,?為什么選擇線上購買?了解不同使用目的的用戶的各自特征,,從而查看各類目標(biāo)用戶的需求,。
③ ?
用戶使用場景:用戶在什么時(shí)候,什么情況下使用這個(gè)產(chǎn)品,?了解用戶在各類場景下的偏好/行為差異,。
④ ?
用戶行為數(shù)據(jù):如使用頻率,使用時(shí)長,,客單價(jià)等,。劃分用戶活躍等級,用戶價(jià)值等級等,。
⑤ ?
態(tài)度傾向量表:如消費(fèi)偏好,,價(jià)值觀等,看不同價(jià)值觀,、不同生活方式的群體在消費(fèi)取向或行為上的差異,。
需要多少樣本量?
沒有限制,,通常情況下與實(shí)際應(yīng)用有關(guān),,如果非要加一個(gè)理論的限制,通常認(rèn)為,,樣本的個(gè)數(shù)要大于聚類個(gè)數(shù)的平方,。
①如果需要聚類的數(shù)據(jù)量較少(1000),應(yīng)該考慮選擇快速聚類別法或者兩步聚類法進(jìn)行,。
③如果數(shù)據(jù)量在100~1000之間,,理論上現(xiàn)在的計(jì)算條件是可能滿足任何聚類方法的要求的,但是結(jié)果的展示會比較困難,,例如不可能再去直接觀察樹狀圖了,。
應(yīng)用定量方法還是定性方法,?
聚類分析是一種定量分析方法,但對聚類分析結(jié)果的解釋還需要結(jié)合定性資料討論,。
1.聚類分析的定義與用途
聚類分析(Cluster Analysis)是一種探索性的數(shù)據(jù)分析方法,,根據(jù)指標(biāo)/變量的數(shù)據(jù)結(jié)構(gòu)特征,對數(shù)據(jù)進(jìn)行分類,,使得類別內(nèi)部的差異盡可能的小,,即同質(zhì)性高,類別間的差異盡可能的大,,即同質(zhì)性低,。
2.聚類分析的方法
①層次聚類法(Hierarchical),也叫系統(tǒng)聚類法,。既可處理分類變量,,也可處理連續(xù)變量,但不能同時(shí)處理兩種變量類型,,不需要指定類別數(shù),。聚類結(jié)果間存在著嵌套,或者說層次的關(guān)系,。
②K-均值聚類法(K-Means Cluster),,也叫快速聚類法。針對連續(xù)變量,,也可處理有序分類變量,,運(yùn)算很快,但需要指定類別數(shù),。K-均值聚類法不會自動(dòng)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,,需要先自己手動(dòng)進(jìn)行標(biāo)準(zhǔn)化分析。
③兩步聚類法(Two-Step Cluster):可以同時(shí)處理分類變量和連續(xù)變量,,能自動(dòng)識別最佳的類別數(shù),,結(jié)果比較穩(wěn)定。如果只對連續(xù)變量進(jìn)行聚類,,描述記錄之間的距離性時(shí)可以使用歐氏(Euclidean)距離,,也可以使用對數(shù)似然值(Log-likelihood),如果使用前者,,則該方法和傳統(tǒng)的聚類方法并無太大區(qū)別,;但是若進(jìn)行聚類的還有離散變量,那么就只能使用對數(shù)似然值來表述記錄間的差異性,。當(dāng)聚類指標(biāo)為有序類別變量時(shí),Two-Step Cluster出來的分類結(jié)果沒有K-means cluster的明晰,,這是因?yàn)镵-means算法假定聚類指標(biāo)變量為連續(xù)變量,。
3.聚類分析的步驟
①確定研究目的:研究問題關(guān)注點(diǎn)有哪些,、是否有先驗(yàn)分類數(shù)…
②問卷編制:態(tài)度語句李克特項(xiàng)目、有序類別…
③確定分析變量:問卷變量的類型,,連續(xù)or分類,,有序類別or無序類別、是否納入后臺數(shù)據(jù),,變量間相關(guān)性低…
④聚類分析:聚類分析方法選擇,、數(shù)據(jù)標(biāo)準(zhǔn)化方法、聚類類別數(shù)確定…
⑤結(jié)果檢驗(yàn):類別間差異分析,、是否符合常理…
⑥聚類結(jié)果解釋:類別的命名,、類別間的差異、結(jié)合定性資料解釋…
本網(wǎng)站文章僅供交流學(xué)習(xí) ,不作為商用,, 版權(quán)歸屬原作者,,部分文章推送時(shí)未能及時(shí)與原作者取得聯(lián)系,若來源標(biāo)注錯(cuò)誤或侵犯到您的權(quán)益煩請告知,,我們將立即刪除.