【營(yíng)銷調(diào)研中】多元回歸的目的、效果判斷和應(yīng)用
現(xiàn)代統(tǒng)計(jì)學(xué)
1.因子分析(Factor Analysis)
因子分析的基本目的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,,即將相關(guān)比較密切的幾個(gè)變量歸在同一類中,,每一類變量就成為一個(gè)因子(之所以稱其為因子,是因?yàn)樗遣豢捎^測(cè)的,,即不是具體的變量),,以較少的幾個(gè)因子反映原資料的大部分信息。
運(yùn)用這種研究技術(shù),,我們可以方便地找出影響消費(fèi)者購(gòu)買,、消費(fèi)以及滿意度的主要因素是哪些,以及它們的影響力(權(quán)重)運(yùn)用這種研究技術(shù),,我們還可以為市場(chǎng)細(xì)分做前期分析,。
2.主成分分析
主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,,用主成分分析來(lái)分析數(shù)據(jù),,讓自己對(duì)數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,,了解數(shù)據(jù),。(screening the data),b,和cluster analysis一起使用,c,,和判別分析一起使用,,比如當(dāng)變量很多,,個(gè)案數(shù)不多,直接使用判別分析可能無(wú)解,,這時(shí)候可以使用主成份發(fā)對(duì)變量簡(jiǎn)化,。(reduce dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),,還可以用來(lái)處理共線性,。
******************************************************************************************************************
主成分分析和因子分析的區(qū)別
1、因子分析中是把變量表示成各因子的線性組合,,而主成分分析中則是把主成分表示成個(gè)變量的線性組合,。
2、主成分分析的重點(diǎn)在于解釋個(gè)變量的總方差,,而因子分析則把重點(diǎn)放在解釋各變量之間的協(xié)方差。
3,、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè),。因子分析的假設(shè)包括:各個(gè)共同因子之間不相關(guān),特殊因子(specific factor)之間也不相關(guān),,共同因子和特殊因子之間也不相關(guān),。
4、主成分分析中,,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時(shí)候,,的主成分一般是獨(dú)特的;而因子分析中因子不是獨(dú)特的,,可以旋轉(zhuǎn)得到不同的因子,。
5、在因子分析中,,因子個(gè)數(shù)需要分析者指定(spss根據(jù)一定的條件自動(dòng)設(shè)定,,只要是特征值大于1的因子進(jìn)入分析),而指定的因子數(shù)量不同而結(jié)果不同,。在主成分分析中,,成分的數(shù)量是一定的,一般有幾個(gè)變量就有幾個(gè)主成分,。
和主成分分析相比,,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢(shì),。大致說(shuō)來(lái),,當(dāng)需要尋找潛在的因子,并對(duì)這些因子進(jìn)行解釋的時(shí)候,,更加傾向于使用因子分析,,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋,。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾乎帶有原來(lái)所有變量的信息)來(lái)進(jìn)入后續(xù)的分析,則可以使用主成分分析,。當(dāng)然,,這中情況也可以使用因子得分做到。所以這中區(qū)分不是絕對(duì)的,。
總得來(lái)說(shuō),,主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,,用主成分分析來(lái)分析數(shù)據(jù),,讓自己對(duì)數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,,了解數(shù)據(jù),。(screening the data),b,和cluster analysis一起使用,c,,和判別分析一起使用,,比如當(dāng)變量很多,個(gè)案數(shù)不多,,直接使用判別分析可能無(wú)解,,這時(shí)候可以使用主成份發(fā)對(duì)變量簡(jiǎn)化。(reduce dimensionality)d,在多元回歸中,,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),,還可以用來(lái)處理共線性。
在算法上,,主成分分析和因子分析很類似,,不過(guò),在因子分析中所采用的協(xié)方差矩陣的對(duì)角元素不在是變量的方差,,而是和變量對(duì)應(yīng)的共同度(變量方差中被各因子所解釋的部分),。
******************************************************************************************************************
3.聚類分析(Cluster Analysis)
聚類分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,,將性質(zhì)差別較大的歸入不同的類的分析技術(shù) ,。
在市場(chǎng)研究領(lǐng)域,聚類分析主要應(yīng)用方面是幫助我們尋找目標(biāo)消費(fèi)群體,,運(yùn)用這項(xiàng)研究技術(shù),,我們可以劃分出產(chǎn)品的細(xì)分市場(chǎng),并且可以描述出各細(xì)分市場(chǎng)的人群特征,,以便于客戶可以有針對(duì)性的對(duì)目標(biāo)消費(fèi)群體施加影響,,合理地開(kāi)展工作。
4.判別分析(Discriminatory Analysis)
判別分析(Discriminatory Analysis)的任務(wù)是根據(jù)已掌握的1批分類明確的樣品,,建立較好的判別函數(shù),,使產(chǎn)生錯(cuò)判的事例最少,,進(jìn)而對(duì)給定的1個(gè)新樣品,判斷它來(lái)自哪個(gè)總體,。
根據(jù)資料的性質(zhì),,分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準(zhǔn)則,,又有費(fèi)歇,、貝葉斯、距離等判別方法,。
費(fèi)歇(FISHER)判別思想是投影,,使多維問(wèn)題簡(jiǎn)化為一維問(wèn)題來(lái)處理。選擇一個(gè)適當(dāng)?shù)耐队拜S,使所有的樣品點(diǎn)都投影到這個(gè)軸上得到一個(gè)投影值,。對(duì)這個(gè)投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,,而不同類間的投影值所形成的類間離差盡可能大。
貝葉斯(BAYES)判別思想是根據(jù)先驗(yàn)概率求出后驗(yàn)概率,,并依據(jù)后驗(yàn)概率分布作出統(tǒng)計(jì)推斷,。所謂先驗(yàn)概率,就是用概率來(lái)描述人們事先對(duì)所研究的對(duì)象的認(rèn)識(shí)的程度;所謂后驗(yàn)概率,,就是根據(jù)具體資料、先驗(yàn)概率,、特定的判別規(guī)則所計(jì)算出來(lái)的概率,。它是對(duì)先驗(yàn)概率修正后的結(jié)果。
距離判別思想是根據(jù)各樣品與各母體之間的距離遠(yuǎn)近作出判別,。即根據(jù)資料建立關(guān)于各母體的距離判別函數(shù)式,,將各樣品數(shù)據(jù)逐一代入計(jì)算,得出各樣品與各母體之間的距離值,,判樣品屬于距離值最小的那個(gè)母體,。
5.對(duì)應(yīng)分析(Correspondence Analysis)
對(duì)應(yīng)分析是一種用來(lái)研究變量與變量之間聯(lián)系緊密程度的研究技術(shù)。
運(yùn)用這種研究技術(shù),,我們可以獲取有關(guān)消費(fèi)者對(duì)產(chǎn)品品牌定位方面的圖形,,從而幫助您及時(shí)調(diào)整營(yíng)銷策略,以便使產(chǎn)品品牌在消費(fèi)者中能樹(shù)立起正確的形象,。
這種研究技術(shù)還可以用于檢驗(yàn)廣告或市場(chǎng)推廣活動(dòng)的效果,,我們可以通過(guò)對(duì)比廣告播出前或市場(chǎng)推廣活動(dòng)前與廣告播出后或市場(chǎng)推廣活動(dòng)后消費(fèi)者對(duì)產(chǎn)品的不同認(rèn)知圖來(lái)看出廣告或市場(chǎng)推廣活動(dòng)是否成功的向消費(fèi)者傳達(dá)了需要傳達(dá)的信息。
6.典型相關(guān)分析
典型相關(guān)分析是分析兩組隨機(jī)變量間線性密切程度的統(tǒng)計(jì)方法,,是兩變量間線性相關(guān)分析的拓廣,。各組隨機(jī)變量中既可有定量隨機(jī)變量,也可有定性隨機(jī)變量(分析時(shí)須F6說(shuō)明為定性變量),。本法還可以用于分析高維列聯(lián)表各邊際變量的線性關(guān)系,。
******************************************************************************************************************
注意:
1.嚴(yán)格地說(shuō),,一個(gè)典型相關(guān)系數(shù)描述的只是一對(duì)典型變量之間的相關(guān),而不是兩個(gè)變量組之間的相關(guān),。而各對(duì)典型變量之間構(gòu)成的多維典型相關(guān)才共同揭示了兩個(gè)觀測(cè)變量組之間的相關(guān)形式,。
2.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求
要求兩組變量之間為線性關(guān)系,即每對(duì)典型變量之間為線性關(guān)系,;
每個(gè)典型變量與本組所有觀測(cè)變量的關(guān)系也是線性關(guān)系,。如果不是線性關(guān)系,可先線性化:如經(jīng)濟(jì)水平和收入水平與其他一些社會(huì)發(fā)展水之間并不是線性關(guān)系,,可先取對(duì)數(shù),。即log經(jīng)濟(jì)水平,log收入水平,。
3.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求
所有觀測(cè)變量為定量數(shù)據(jù),。同時(shí)也可將定性數(shù)據(jù)按照一定形式設(shè)為虛擬變量后,再放入典型相關(guān)模型中進(jìn)行分析,。
******************************************************************************************************************
7.多維尺度分析(Multi-dimension Analysis)
多維尺度分析(Multi-dimension Analysis) 是市場(chǎng)研究的一種有力手段,,它可以通過(guò)低維空間(通常是二維空間)展示多個(gè)研究對(duì)象(比如品牌)之間的聯(lián)系,利用平面距離來(lái)反映研究對(duì)象之間的相似程度,。由于多維尺度分析法通常是基于研究對(duì)象之間的相似性(距離)的,,只要獲得了兩個(gè)研究對(duì)象之間的距離矩陣,我們就可以通過(guò)相應(yīng)統(tǒng)計(jì)軟件做出他們的相似性知覺(jué)圖,。
在實(shí)際應(yīng)用中,,距離矩陣的獲得主要有兩種方法:一種是采用直接的相似性評(píng)價(jià),先所有評(píng)價(jià)對(duì)象進(jìn)行兩兩組合,,然后要求被訪者所有的這些組合間進(jìn)行直接相似性評(píng)價(jià),,這種方法我們稱之為直接評(píng)價(jià)法;另一種為間接評(píng)價(jià)法,,由研究人員根據(jù)事先經(jīng)驗(yàn),,找出影響人們?cè)u(píng)價(jià)研究對(duì)象相似性的主要屬性,然后對(duì)每個(gè)研究對(duì)象,,讓被訪者對(duì)這些屬性進(jìn)行逐一評(píng)價(jià),,最后將所有屬性作為多維空間的坐標(biāo),通過(guò)距離變換計(jì)算對(duì)象之間的距離,。
******************************************************************************************************************
多維尺度分析的主要思路是利用對(duì)被訪者對(duì)研究對(duì)象的分組,,來(lái)反映被訪者對(duì)研究對(duì)象相似性的感知,這種方法具有一定直觀合理性,。同時(shí)該方法實(shí)施方便,,調(diào)查中被訪者負(fù)擔(dān)較小,很容易得到理解接受,。當(dāng)然,,該方法的不足之處是犧牲了個(gè)體距離矩陣,,由于每個(gè)被訪者個(gè)體的距離矩陣只包含1與0兩種取值,相對(duì)較為粗糙,,個(gè)體距離矩陣的分析顯得比較勉強(qiáng),。但這一點(diǎn)是完全可以接受的,因?yàn)閷?duì)大多數(shù)研究而言,,我們并不需要知道每一個(gè)體的空間知覺(jué)圖,。
******************************************************************************************************************
******************************************************************************************************************
多元統(tǒng)計(jì)分析是統(tǒng)計(jì)學(xué)中內(nèi)容十分豐富、應(yīng)用范圍極為廣泛的一個(gè)分支,。在自然科學(xué)和社會(huì)科學(xué)的許多學(xué)科中,,研究者都有可能需要分析處理有多個(gè)變量的數(shù)據(jù)的問(wèn)題。能否從表面上看起來(lái)雜亂無(wú)章的數(shù)據(jù)中發(fā)現(xiàn)和提煉出規(guī)律性的結(jié)論,,不僅對(duì)所研究的專業(yè)領(lǐng)域要有很好的訓(xùn)練,,而且要掌握必要的統(tǒng)計(jì)分析工具。對(duì)實(shí)際領(lǐng)域中的研究者和高等院校的研究生來(lái)說(shuō),,要學(xué)習(xí)掌握多元統(tǒng)計(jì)分析的各種模型和方法,,手頭有一本好的、有長(zhǎng)久價(jià)值的參考書(shū)是非常必要的,。這樣一本書(shū)應(yīng)該滿足以下條件:首先,,它應(yīng)該是“淺入深出”的,也就是說(shuō),,既可供初學(xué)者入門,,又能使有較深基礎(chǔ)的人受益。其次,,它應(yīng)該是既側(cè)重于應(yīng)用,又兼顧必要的推理論證,,使學(xué)習(xí)者既能學(xué)到“如何”做,,而且在一定程度上了解“為什么”這樣做。最后,,它應(yīng)該是內(nèi)涵豐富,、全面的,不僅要基本包括各種在實(shí)際中常用的多元統(tǒng)計(jì)分析方法,,而且還要對(duì)現(xiàn)代統(tǒng)計(jì)學(xué)的最新思想和進(jìn)展有所介紹,、交代。
******************************************************************************************************************
******************************************************************************************************************
因子分析
主成分分析通過(guò)線性組合將原變量綜合成幾個(gè)主成分,,用較少的綜合指標(biāo)來(lái)代替原來(lái)較多的指標(biāo)(變量),。在多變量分析中,某些變量間往往存在相關(guān)性,。是什么原因使變量間有關(guān)聯(lián)呢,?是否存在不能直接觀測(cè)到的,、但影響可觀測(cè)變量變化的公共因子?因子分析(Factor Analysis)就是尋找這些公共因子的模型分析方法,,它是在主成分的基礎(chǔ)上構(gòu)筑若干意義較為明確的公因子,,以它們?yōu)榭蚣芊纸庠兞浚源丝疾煸兞块g的聯(lián)系與區(qū)別,。
例如,,隨著年齡的增長(zhǎng),兒童的身高,、體重會(huì)隨著變化,,具有一定的相關(guān)性,身高和體重之間為何會(huì)有相關(guān)性呢,?因?yàn)榇嬖谥粋€(gè)同時(shí)支配或影響著身高與體重的生長(zhǎng)因子,。那么,我們能否通過(guò)對(duì)多個(gè)變量的相關(guān)系數(shù)矩陣的研究,,找出同時(shí)影響或支配所有變量的共性因子呢,?因子分析就是從大量的數(shù)據(jù)中“由表及里”、“去粗取精”,,尋找影響或支配變量的多變量統(tǒng)計(jì)方法,。
可以說(shuō),因子分析是主成分分析的推廣,,也是一種把多個(gè)變量化為少數(shù)幾個(gè)綜合變量的多變量分析方法,,其目的是用有限個(gè)不可觀測(cè)的隱變量來(lái)解釋原始變量之間的相關(guān)關(guān)系。
因子分析主要用于:1,、減少分析變量個(gè)數(shù),;2、通過(guò)對(duì)變量間相關(guān)關(guān)系探測(cè),,將原始變量進(jìn)行分類,。即將相關(guān)性高的變量分為一組,用共性因子代替該組變量,。
1. 因子分析模型
因子分析法是從研究變量?jī)?nèi)部相關(guān)的依賴關(guān)系出發(fā),,把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法。它的基本思想是將觀測(cè)變量進(jìn)行分類,,將相關(guān)性較高,,即聯(lián)系比較緊密的分在同一類中,而不同類變量之間的相關(guān)性則較低,,那么每一類變量實(shí)際上就代表了一個(gè)基本結(jié)構(gòu),,即公共因子。對(duì)于所研究的問(wèn)題就是試圖用最少個(gè)數(shù)的不可測(cè)的所謂公共因子的線性函數(shù)與特殊因子之和來(lái)描述原來(lái)觀測(cè)的每一分量。
因子分析模型描述如下:
(1)X = (x1,,x2,,…,xp)¢是可觀測(cè)隨機(jī)向量,,均值向量E(X)=0,,協(xié)方差陣Cov(X)=∑,且協(xié)方差陣∑與相關(guān)矩陣R相等(只要將變量標(biāo)準(zhǔn)化即可實(shí)現(xiàn)),。
(2)F = (F1,,F(xiàn)2,…,,F(xiàn)m)¢ (m<p)是不可測(cè)的向量,,其均值向量E(F)=0,協(xié)方差矩陣Cov(F) =I,,即向量的各分量是相互獨(dú)立的,。
(3)e = (e1,e2,,…,,ep)¢與F相互獨(dú)立,且E(e)=0, e的協(xié)方差陣∑是對(duì)角陣,即各分量e之間是相互獨(dú)立的,,則模型:
x1 = a11F1+ a12F2 +…+a1mFm + e1
x2 = a21F1+a22F2 +…+a2mFm + e2
………
xp = ap1F1+ ap2F2 +…+apmFm + ep
稱為因子分析模型,,由于該模型是針對(duì)變量進(jìn)行的,各因子又是正交的,,所以也稱為R型正交因子模型,。
其矩陣形式為: x =AF + e .
其中:
x=,A=,,F(xiàn)=,,e=
這里,
(1)m £ p,;
(2)Cov(F,e)=0,,即F和e是不相關(guān)的;
(3)D(F) = Im ,,即F1,F2,…,Fm不相關(guān)且方差均為1;
D(e)=,,即e1,e2,…,ep不相關(guān),,且方差不同。
我們把F稱為X的公共因子或潛因子,,矩陣A稱為因子載荷矩陣,,e 稱為X的特殊因子。
A = (aij),aij為因子載荷,。數(shù)學(xué)上可以證明,,因子載荷aij就是第i變量與第j因子的相關(guān)系數(shù),反映了第i變量在第j因子上的重要性,。
2. 模型的統(tǒng)計(jì)意義
模型中F1,,F(xiàn)2,…,,F(xiàn)m叫做主因子或公共因子,,它們是在各個(gè)原觀測(cè)變量的表達(dá)式中都共同出現(xiàn)的因子,是相互獨(dú)立的不可觀測(cè)的理論變量,。公共因子的含義,,必須結(jié)合具體問(wèn)題的實(shí)際意義而定。e1,,e2,,…,ep叫做特殊因子,,是向量x的分量xi(i=1,2,…,p)所特有的因子,,各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨(dú)立的。模型中載荷矩陣A中的元素(aij)是為因子載荷,。因子載荷aij是xi與Fj的協(xié)方差,,也是xi與Fj的相關(guān)系數(shù),它表示xi依賴Fj的程度,??蓪ij看作第i個(gè)變量在第j公共因子上的權(quán),aij的絕對(duì)值越大(|aij|£1),,表明xi與Fj的相依程度越大,,或稱公共因子Fj對(duì)于xi的載荷量越大。為了得到因子分析結(jié)果的經(jīng)濟(jì)解釋,,因子載荷矩陣A中有兩個(gè)統(tǒng)計(jì)量十分重要,,即變量共同度和公共因子的方差貢獻(xiàn)。
因子載荷矩陣A中第i行元素之平方和記為hi2,,稱為變量xi的共同度,。它是全部公共因子對(duì)xi的方差所做出的貢獻(xiàn),反映了全部公共因子對(duì)變量xi的影響,。hi2大表明x的第i個(gè)分量xi對(duì)于F的每一分量F1,,F(xiàn)2,…,,F(xiàn)m的共同依賴程度大,。
將因子載荷矩陣A的第j列( j =1,2,…,m)的各元素的平方和記為gj2,稱為公共因子Fj對(duì)x的方差貢獻(xiàn)。gj2就表示第j個(gè)公共因子Fj對(duì)于x的每一分量xi(i=1,2,…,p)所提供方差的總和,,它是衡量公共因子相對(duì)重要性的指標(biāo),。gj2越大,表明公共因子Fj對(duì)x的貢獻(xiàn)越大,或者說(shuō)對(duì)x的影響和作用就越大,。如果將因子載荷矩陣A的所有g(shù)j2 ( j =1,2,…,m)都計(jì)算出來(lái),,使其按照大小排序,就可以依此提煉出最有影響力的公共因子,。
3. 因子旋轉(zhuǎn)
建立因子分析模型的目的不僅是找出主因子,,更重要的是知道每個(gè)主因子的意義,以便對(duì)實(shí)際問(wèn)題進(jìn)行分析,。如果求出主因子解后,,各個(gè)主因子的典型代表變量不很突出,還需要進(jìn)行因子旋轉(zhuǎn),,通過(guò)適當(dāng)?shù)男D(zhuǎn)得到比較滿意的主因子,。
旋轉(zhuǎn)的方法有很多,正交旋轉(zhuǎn)(orthogonal rotation)和斜交旋轉(zhuǎn)(oblique rotation)是因子旋轉(zhuǎn)的兩類方法,。最常用的方法是最大方差正交旋轉(zhuǎn)法(Varimax),。進(jìn)行因子旋轉(zhuǎn),就是要使因子載荷矩陣中因子載荷的平方值向0和1兩個(gè)方向分化,,使大的載荷更大,,小的載荷更小。因子旋轉(zhuǎn)過(guò)程中,,如果因子對(duì)應(yīng)軸相互正交,,則稱為正交旋轉(zhuǎn);如果因子對(duì)應(yīng)軸相互間不是正交的,,則稱為斜交旋轉(zhuǎn),。常用的斜交旋轉(zhuǎn)方法有Promax法等。
4.因子得分
因子分析模型建立后,,還有一個(gè)重要的作用是應(yīng)用因子分析模型去評(píng)價(jià)每個(gè)樣品在整個(gè)模型中的地位,,即進(jìn)行綜合評(píng)價(jià)。例如地區(qū)經(jīng)濟(jì)發(fā)展的因子分析模型建立后,,我們希望知道每個(gè)地區(qū)經(jīng)濟(jì)發(fā)展的情況,,把區(qū)域經(jīng)濟(jì)劃分歸類,哪些地區(qū)發(fā)展較快,,哪些中等發(fā)達(dá),,哪些較慢等。這時(shí)需要將公共因子用變量的線性組合來(lái)表示,,也即由地區(qū)經(jīng)濟(jì)的各項(xiàng)指標(biāo)值來(lái)估計(jì)它的因子得分,。
設(shè)公共因子F由變量x表示的線性組合為:
Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m
該式稱為因子得分函數(shù),由它來(lái)計(jì)算每個(gè)樣品的公共因子得分,。若取m=2,,則將每個(gè)樣品的p個(gè)變量代入上式即可算出每個(gè)樣品的因子得分F1和F2,并將其在平面上做因子得分散點(diǎn)圖,,進(jìn)而對(duì)樣品進(jìn)行分類或?qū)υ紨?shù)據(jù)進(jìn)行更深入的研究,。
但因子得分函數(shù)中方程的個(gè)數(shù)m小于變量的個(gè)數(shù)p,所以并不能精確計(jì)算出因子得分,,只能對(duì)因子得分進(jìn)行估計(jì),。估計(jì)因子得分的方法較多,常用的有回歸估計(jì)法,,Bartlett估計(jì)法,,Thomson估計(jì)法。
(1)回歸估計(jì)法
F = X b = X (X ¢X)-1A¢ = XR-1A¢ (這里R為相關(guān)陣,,且R = X ¢X ),。
(2)Bartlett估計(jì)法
Bartlett估計(jì)因子得分可由最小二乘法或極大似然法導(dǎo)出。
F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X
(3)Thomson估計(jì)法
在回歸估計(jì)法中,,實(shí)際上是忽略特殊因子的作用,,取R = X ¢X,若考慮特殊因子的作,,此時(shí)R = X ¢X+W,,于是有:
F = XR-1A¢ = X (X ¢X+W)-1A¢
這就是Thomson估計(jì)的因子得分,使用矩陣求逆算法(參考線性代數(shù)文獻(xiàn))可以將其轉(zhuǎn)換為:
F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢
5. 因子分析的步驟
因子分析的核心問(wèn)題有兩個(gè):一是如何構(gòu)造因子變量,;二是如何對(duì)因子變量進(jìn)行命名解釋,。因此,因子分析的基本步驟和解決思路就是圍繞這兩個(gè)核心問(wèn)題展開(kāi)的,。
(i)因子分析常常有以下四個(gè)基本步驟:
(1)確認(rèn)待分析的原變量是否適合作因子分析,。
(2)構(gòu)造因子變量。
(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性,。
(4)計(jì)算因子變量得分,。
(ii)因子分析的計(jì)算過(guò)程:
(1)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)量級(jí)和量綱上的不同,。
(2)求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)矩陣,;
(3)求相關(guān)矩陣的特征值和特征向量;
(4)計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率,;
(5)確定因子:
設(shè)F1,,F(xiàn)2,…, Fp為p個(gè)因子,,其中前m個(gè)因子包含的數(shù)據(jù)信息總量(即其累積貢獻(xiàn)率)不低于80%時(shí),,可取前m個(gè)因子來(lái)反映原評(píng)價(jià)指標(biāo),;
(6)因子旋轉(zhuǎn):
若所得的m個(gè)因子無(wú)法確定或其實(shí)際意義不是很明顯,這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義,。
(7)用原指標(biāo)的線性組合來(lái)求各因子得分:
采用回歸估計(jì)法,,Bartlett估計(jì)法或Thomson估計(jì)法計(jì)算因子得分。
(8)綜合得分
以各因子的方差貢獻(xiàn)率為權(quán),,由各因子的線性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù),。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此處wi為旋轉(zhuǎn)前或旋轉(zhuǎn)后因子的方差貢獻(xiàn)率。
(9)得分排序:利用綜合得分可以得到得分名次,。
******************************************************************************************************************
******************************************************************************************************************
在采用多元統(tǒng)計(jì)分析技術(shù)進(jìn)行數(shù)據(jù)處理,、建立宏觀或微觀系統(tǒng)模型時(shí),需要研究以下幾個(gè)方面的問(wèn)題:
· 簡(jiǎn)化系統(tǒng)結(jié)構(gòu),,探討系統(tǒng)內(nèi)核,。可采用主成分分析,、因子分析,、對(duì)應(yīng)分析等方法,在眾多因素中找出各個(gè)變量最佳的子集合,,從子集合所包含的信息描述多變量的系統(tǒng)結(jié)果及各個(gè)因子對(duì)系統(tǒng)的影響,。“從樹(shù)木看森林”,,抓住主要矛盾,,把握主要矛盾的主要方面,舍棄次要因素,,以簡(jiǎn)化系統(tǒng)的結(jié)構(gòu),,認(rèn)識(shí)系統(tǒng)的內(nèi)核。
· 構(gòu)造預(yù)測(cè)模型,,進(jìn)行預(yù)報(bào)控制,。在自然和社會(huì)科學(xué)領(lǐng)域的科研與生產(chǎn)中,探索多變量系統(tǒng)運(yùn)動(dòng)的客觀規(guī)律及其與外部環(huán)境的關(guān)系,,進(jìn)行預(yù)測(cè)預(yù)報(bào),,以實(shí)現(xiàn)對(duì)系統(tǒng)的最優(yōu)控制,是應(yīng)用多元統(tǒng)計(jì)分析技術(shù)的主要目的,。在多元分析中,,用于預(yù)報(bào)控制的模型有兩大類。一類是預(yù)測(cè)預(yù)報(bào)模型,,通常采用多元線性回歸或逐步回歸分析,、判別分析、雙重篩選逐步回歸分析等建模技術(shù),。另一類是描述性模型,,通常采用聚類分析的建模技術(shù),。
· 進(jìn)行數(shù)值分類,構(gòu)造分類模式,。在多變量系統(tǒng)的分析中,,往往需要將系統(tǒng)性質(zhì)相似的事物或現(xiàn)象歸為一類。以便找出它們之間的聯(lián)系和內(nèi)在規(guī)律性,。過(guò)去許多研究多是按單因素進(jìn)行定性處理,以致處理結(jié)果反映不出系統(tǒng)的總的特征,。進(jìn)行數(shù)值分類,,構(gòu)造分類模式一般采用聚類分析和判別分析技術(shù)。
如何選擇適當(dāng)?shù)姆椒▉?lái)解決實(shí)際問(wèn)題,,需要對(duì)問(wèn)題進(jìn)行綜合考慮,。對(duì)一個(gè)問(wèn)題可以綜合運(yùn)用多種統(tǒng)計(jì)方法進(jìn)行分析。例如一個(gè)預(yù)報(bào)模型的建立,,可先根據(jù)有關(guān)生物學(xué),、生態(tài)學(xué)原理,確定理論模型和試驗(yàn)設(shè)計(jì),;根據(jù)試驗(yàn)結(jié)果,,收集試驗(yàn)資料;對(duì)資料進(jìn)行初步提煉,;然后應(yīng)用統(tǒng)計(jì)分析方法(如相關(guān)分析,、逐步回歸分析、主成分分析等)研究各個(gè)變量之間的相關(guān)性,,選擇最佳的變量子集合,;在此基礎(chǔ)上構(gòu)造預(yù)報(bào)模型,最后對(duì)模型進(jìn)行診斷和優(yōu)化處理,,并應(yīng)用于生產(chǎn)實(shí)際,。
本網(wǎng)站文章僅供交流學(xué)習(xí) ,不作為商用, 版權(quán)歸屬原作者,,部分文章推送時(shí)未能及時(shí)與原作者取得聯(lián)系,,若來(lái)源標(biāo)注錯(cuò)誤或侵犯到您的權(quán)益煩請(qǐng)告知,我們將立即刪除.