聚類分析法的概述
例如,,我們可以根據(jù)各個銀行網(wǎng)點的儲蓄量,、人力資源狀況,、營業(yè)面積,、特色功能、網(wǎng)點級別,、所處功能區(qū)域等因素情況,,將網(wǎng)點分為幾個等級,再比較各銀行之間不同等級網(wǎng)點數(shù)量對比狀況,。
1,、基本思想:我們所研究的樣品(網(wǎng)點)或指標(變量)之間存在程度不同的相似性(親疏關系——以樣品間距離衡量)。于是根據(jù)一批樣品的多個觀測指標,,具體找出一些能夠度量樣品或指標之間相似程度的統(tǒng)計量,以這些統(tǒng)計量為劃分類型的依據(jù),。把一些相似程度較大的樣品(或指標)聚合為一類,,把另外一些彼此之間相似程度較大的樣品(或指標)又聚合為另一類,直到把所有的樣品(或指標)聚合完畢,,這就是分類的基本思想,。 在聚類分析中,通常我們將根據(jù)分類對象的不同分為Q型聚類分析和R型聚類分析兩大類,。
R型聚類分析是對變量進行分類處理,,Q型聚類分析是對樣本進行分類處理。
R型聚類分析的主要作用是: 1,、不但可以了解個別變量之間的關系的親疏程度,,而且可以了解各個變量組合之間的親疏程度。
2,、根據(jù)變量的分類結果以及它們之間的關系,,可以選擇主要變量進行回歸分析或Q型聚類分析。
Q型聚類分析的優(yōu)點是: 1,、可以綜合利用多個變量的信息對樣本進行分類,; 2、分類結果是直觀的,,聚類譜系圖非常清楚地表現(xiàn)其數(shù)值分類結果,; 3、聚類分析所得到的結果比傳統(tǒng)分類方法更細致,、全面,、合理,。
為了進行聚類分析,首先我們需要定義樣品間的距離,。 常見的距離有 : ① 絕對值距離 ② 歐氏距離 ③ 明科夫斯基距離 ④ 切比雪夫距離
本網(wǎng)站文章僅供交流學習 ,不作為商用,, 版權歸屬原作者,部分文章推送時未能及時與原作者取得聯(lián)系,,若來源標注錯誤或侵犯到您的權益煩請告知,,我們將立即刪除.