數(shù)據(jù)分析方法怎么寫?
一、描述性統(tǒng)計
描述性統(tǒng)計是一類統(tǒng)計方法的匯總,,揭示了數(shù)據(jù)分布特性,。它主要包括數(shù)據(jù)的頻數(shù)分析、數(shù)據(jù)的集中趨勢分析,、數(shù)據(jù)離散程度分析、數(shù)據(jù)的分布以及一些基本的統(tǒng)計圖形。
1,、缺失值填充:常用方法有剔除法、均值法,、決策樹法,。
2、正態(tài)性檢驗:很多統(tǒng)計方法都要求數(shù)值服從或近似服從正態(tài)分布,,所以在做數(shù)據(jù)分析之前需要進行正態(tài)性檢驗,。常用方法:非參數(shù)檢驗的K-量檢驗、P-P圖,、Q-Q圖,、W檢驗、動差法,。
二,、回歸分析
回歸分析是應(yīng)用極其廣泛的數(shù)據(jù)分析方法之一。它基于觀測數(shù)據(jù)建立變量間適當?shù)囊蕾囮P(guān)系,,以分析數(shù)據(jù)內(nèi)在規(guī)律,。
1. 一元線性分析
只有一個自變量X與因變量Y有關(guān),X與Y都必須是連續(xù)型變量,,因變量Y或其殘差必須服從正態(tài)分布,。
2. 多元線性回歸分析
使用條件:分析多個自變量X與因變量Y的關(guān)系,X與Y都必須是連續(xù)型變量,因變量Y或其殘差必須服從正態(tài)分布,。
3.Logistic回歸分析
線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,,且自變量和因變量呈線性關(guān)系,而Logistic回歸模型對因變量的分布沒有要求,,一般用于因變量是離散時的情況,。
4. 其他回歸方法:非線性回歸、有序回歸,、Probit回歸,、加權(quán)回歸等。
三,、方差分析
使用條件:各樣本須是相互獨立的隨機樣本,;各樣本來自正態(tài)分布總體;各總體方差相等,。
1. 單因素方差分析:一項試驗只有一個影響因素,,或者存在多個影響因素時,只分析一個因素與響應(yīng)變量的關(guān)系,。
2. 多因素有交互方差分析:一頊實驗有多個影響因素,,分析多個影響因素與響應(yīng)變量的關(guān)系,同時考慮多個影響因素之間的關(guān)系
3. 多因素無交互方差分析:分析多個影響因素與響應(yīng)變量的關(guān)系,,但是影響因素之間沒有影響關(guān)系或忽略影響關(guān)系
4. 協(xié)方差分祈:傳統(tǒng)的方差分析存在明顯的弊端,,無法控制分析中存在的某些隨機因素,降低了分析結(jié)果的準確度,。協(xié)方差分析主要是在排除了協(xié)變量的影響后再對修正后的主效應(yīng)進行方差分析,,是將線性回歸與方差分析結(jié)合起來的一種分析方法。
四,、假設(shè)檢驗
1. 參數(shù)檢驗
參數(shù)檢驗是在已知總體分布的條件下(一股要求總體服從正態(tài)分布)對一些主要的參數(shù)(如均值,、百分數(shù)、方差,、相關(guān)系數(shù)等)進行的檢驗 ,。
2. 非參數(shù)檢驗
非參數(shù)檢驗則不考慮總體分布是否已知,常常也不是針對總體參數(shù),,而是針對總體的某些一般性假設(shè)(如總體分布的位罝是否相同,,總體分布是否正態(tài))進行檢驗。
適用情況:順序類型的數(shù)據(jù)資料,,這類數(shù)據(jù)的分布形態(tài)一般是未知的,。
1)雖然是連續(xù)數(shù)據(jù),但總體分布形態(tài)未知或者非正態(tài),;
2)總體分布雖然正態(tài),,數(shù)據(jù)也是連續(xù)類型,,但樣本容量極小,如10以下,;
主要方法包括:卡方檢驗,、秩和檢驗,、二項檢驗,、游程檢驗、K-量檢驗等,。
本網(wǎng)站文章僅供交流學習 ,不作為商用,, 版權(quán)歸屬原作者,部分文章推送時未能及時與原作者取得聯(lián)系,,若來源標注錯誤或侵犯到您的權(quán)益煩請告知,,我們將立即刪除.