貓貓水族工坊

貓貓水族工坊

9.12.08

統計學 1125、1202

1125
單組樣本的假設檢定

何謂假設
假設是一個關於母體參數的陳述,使用資料與計算機驗證這陳述是否合理

母體參數的假設例子為:
對於系統分析師的平均月收Z

假設檢定(Hypothesis testing)
基於樣本證據與機率理論來判斷假設是否合理而要接受,或是假設不合理而要拒絕的過程。

假設檢定的五個步驟
建立虛無假設與對立假設
選擇一個顯著水準
決定檢定統計量
制定決策法則
取得樣本並做出決策~
1.不拒絕虛無假設
2.拒絕虛無假設與接受對立假設

步驟一
虛無假設 (Null hypothesis) H0 \ Ha
關於母體參數值的假設性敘述

對立假設 (Alternate hypothesis) H1 \ Hb
當樣本資料提供足夠證明虛無假設不為真時,接受的對立敘述就是對立假設

母體平均數的假設檢定有三種情形
1.H0:u = 0 ; H1:u =/= 0
2.H0:u <=0 ; H1:u > 0
3.H0:u >=0 ; H1:u < 0
記得虛無假設有個等於~

型I誤差TypeIError
當虛無假設H0為真時卻被拒絕,用alpha表示

型II誤差TypeIIError
當虛無假設不正確時卻被接受,用beta表示


步驟二:選擇顯著水準 Level of significance

虛無假設 接受 拒絕
為真 正確決策 型I誤差
為假 型II誤差 正確決策

顯著水準~通常可以容忍的誤差


單尾檢定
當對立假設H1,表示一個方向時,即為單尾檢定
例如H1:全職員工的年終獎金超過$35,000,u>35,000(右尾)
行駛在公路上的卡車每小時小於69英里,u<60(左尾)
H1對於加油的顧客,付現的人數少於20%

0.5-0.05=0.45 面積的時候 查表~1.65
臨界值criticle value:滿足臨界水準時候的z值


比例p的檢定
z= p-π/ √ π(1-π)/n

範例4
慈善事業中15%是透過劃撥方式,現在有一種新的方式,抽200位民眾,其中45位說願意使用這種方式捐款,在0.05顯著水準下,我們可以說新的方法有效嗎?
使用z統計量
建立決策法則:若z大於1.65,則拒絕虛無假設
z=2.97 落在危險區域,接受對立假設
即超過15%將會使用新的方式捐款

比較兩組母體
進行兩組樣本的假設檢定

若兩組樣本均超過30個觀測資料,我們使用z分配
不需要假設母體的形態
從獨立的.....

z= Xbar1- Xbar2 / √ s1^2/n1+ s2^2/n2

範例1
a城和b城中間用c河隔開,在a市40個家庭為樣本,其平均家庭收入為38,000,其標準差是6,000。在b市35個家庭的平均收入為35,000,以及標準差為7,000,在0.01的顯著水準之下,我們可以說a市的收入較高嗎?
建立虛無假設與對立假設
Ho:μB小於等於μA,
H1: μA>μB

樣本大小都超過30我們使用z分配當檢定統計量
決定決策法則:
若z大於2.33則拒絕虛無假設

38000-35000/ √ 6K^2/40 + 7K^2/35 =

P(z>1.98)=0.5000-0.4761=0.239

兩祖母體比例的假設檢定
我們有的時候也想了解,兩祖母體抽選出來的兩組樣本比例是否相等

當樣本個數小於30則使用t分配檢定
抽樣的兩祖母體需服從常態分配
從兩組獨立的母體當中分別抽取樣本
兩組母體的標準差相等
Sp^2=(n1-1)S1^2+ (n2-1)S2^2 / n1+n2-2
t= Xbar1-Xbar2 / 根號 Sp^2 (1/n1+ 1/n2)

進口車與國產車比較
15部國產車為樣本,平均數為33.7 mpg,標準差2.4
Ho: muD>=muI
H1: muD
若12+15-1=25 自由度
顯著水準用0.05
t<-1.708則拒絕Ho

Sp^2=(n1-1)S1^2+ (n2-1)S2^2 / n1+n2-2
Sp^2=9.918

t=Xbar1-Xbar2 / 根號 Sp^2 (1/n1+ 1/n2)
=33.7-35.7 / 根號 9.918(1/12+1/15)
=-1.640

不拒絕Ho
樣本證據不足以宣稱進口車的耗油量比較高

相依樣本
相依樣本為成對或相關資料的樣本
獨立樣本為兩組樣本間完全不相干
t= dbar / Sd/根號n
其中自由度是n-1

Ho: mu=0, H1:mu不等於0
若t大於或小於2.365則拒絕Ho
自由度7

d=價錢的差,再sigma
dbar=sigma d/n=8.0/8=1

Sd=根號[sigma d^2 – (sigmad)^2/n ]/n-1=3.1623
sd=根號 78-8^2/8 /8-1= 根號10

獨立樣本T檢定~
兩獨立小樣本均數檢定(變異數相同)
兩獨立小樣本均數檢定(變異數不同)

t=



1202
Analysis of Variance 變異數分析
簡稱 ANOVA
兩組以上的變異分析
進行三個或三個以上的處理平均數之間的假設檢定
F分配是一個家族

比較兩組母體變異數
較大的變異數放在分子
F=S1^2/S2^2

例1
標準差3.9
標準差3.5
Ho: sigma1^2<=sigma2^2
H1: S1^2> S2^2
顯著水準為0.05
檢定統計量為F分配
若F>3.68則拒絕Ho,分子自由度為9,分母自由度為7
F的值~
3.9^2/3.5^2=1.2416
不拒絕H0

虛無假設的母體平均數都相等
對立假設至少有一個平均數不同
檢定統計量為F分配
決策法則為若檢定統計量的值大於F值,則拒絕虛無假設

若從K組母體抽取樣本,則分子自由度為k-1
若有n個觀測資料,則分母的自由度為n-k
檢定統計量的計算公式為F=SST/(k-1) / SSE/ (n-k)

SS total:每個觀測值與總平均數間差異平方的總和
SS total= ∑X^2-(∑X)^2/n
SST Sum of square for treatment 代表處理間的變異或處理平方和
SST=∑(Tc^2/nc^2)-(∑X)^2/n
Tc為行總和,nc為行個數

SSE Sum of square for error 代表處理內的變異或誤差平方和
SSE= SS total - SST
在SPSS中使用 Between Groups 「群組間」代表「處理間」這個術語,
以及Within Groups 「群組內」代表「誤差」

Tc 51 46 85
nc 4 4 5
SS total
∑X^2-(∑X)^2/n=2634-182^2/13=86
SST=∑(Tc^2/nc^2)-(∑X)^2/n
=51^2/4+46^2/4+85^2/5-182^2/13
=76.25
SSE=SS total-SST=86-76.25
H0: u1=u2=u3
H1: 處理平均數不同
若F>4.10
分子自由度n-1=3-1=2,
分母自由度n-k=13-3=10
F=[SST/(k-1)]/[SSE/(n-k)]=(76/2)/(9.75/10)
結論為拒絕虛無假設

變異來源 平方和 自由度 均方 F
處理 SST k-1 SST/(k-1)=MST MST/MSE
誤差 SSE n-k SSE/(n-k)=MSE
----------- -------
總和 SS total n-1

並不用每次去查表取得臨界值,只需看變異數分析上顯著性是否小於所指定的alpha值即可,
若顯著性小於alpha,即應放棄每組均數相等的虛無假設

沒有留言: