2010年4月21日 星期三

[教學] 單因子變異數分析(One Way ANOVA)

單因子變異數分析(One Way ANOVA)


我們經常使用統計來檢定兩個母體的平均數是否相同,但是若同時要比較多個母體,擇必須兩兩比較,如此非常的耗時且過程複雜。ANOVA Analysis OVariances的縮寫,是由R. A. Fisher所提出的統計方法,可解決同時檢定兩個或兩個以上樣本平均數的顯著性。變異數分析可運用的領域非常的廣泛,同樣以官方學習R不錯的電子書-SimpleR Using R for Introductory Statistics (作者John Verzani),第89(資料在90)的例子來用Rcmdr做分析吧!!
一樣先建立我們所要的資料(資料輸入方法),資料是一個學校所聘請來的評審,要對於某樣東西進行評分,而要確保這些評審所給的分數標準是一樣的,才不至於造成不公平的現象,因此必須必較多個評審所做的評分是否有所差異,確認其所給的分數是同樣的評分標準。作者沒有使用全部的資料,是節錄了3評審各7個資料,輸入一下吧(1)!!


1、資料輸入(SimpleR Using R for Introductory Statistics90)



一開始所鍵入資料,在Rcmdr中建立的資料是分開的三筆(三個物件),現在我們要將各筆資料集中在scores的物件下,這樣我們才可以同時進行三個評審的變異數分析檢定,到命令列->資料->動作資料->stack variables in active data set(2),會出現圖3的對話框,將集成的資料集命名(Name for stacked data set)scores,變數名稱(Name for Variable)依照90頁取名為values,因子(Name for factor)則叫做ind,這些動作完成後我們就可以進行單因子變異數分析囉!!


2、將各筆資料集中成一個物件,到命令列->資料->動作資料->stack variables in active data set


3、集成的資料集對話框。

在進行變異數分析前,我們要先將資料進行模式配適(圖4亦即統計建模),模式配適,命令列->統計->模式配適->直線模式。變異數分析用以比較兩個或兩個以上的樣本平均數差異,如果使用T檢定的方式兩兩比較,可能會徒增一型(Type I error)與二型(Type II error)誤差的可能性,因此必須用以嚴苛的條件限制,才能避免誤差在進行分析時無謂的增加。直線配適的對話框中,模式(Formula)中用滑鼠左鍵雙擊選取values ~ ind(5),接著按下OK鍵,模式配適的工作就完成啦。這次主題的主角,變異數分析(One Way ANOVA)命令列->模式分析->假說檢定->變異數分析(ANOVA table)(6)。接著在輸出視窗中,就可以看到變異數分析的結果,來解讀一下吧!! ANOVA table顯示ind與殘差的Sum sq.分別為1.7516.25,變異數檢定的F直為1.1308P值為0.3417>顯著性水準(α=0.05) (7),因此接受虛無假設,三組資料是擁有相同的平均值,亦即評審所給的分數標準是一樣的。
4、模式配適,命令列->統計->模式配適->直線模式。
5、直線模式配適視窗,建立values ~ ind模式。
6命令列->模式分析->假說檢定->變異數分析(ANOVA table)





7ANOVA table


                                                                         Yearend


沒有留言:

張貼留言