貓貓水族工坊

貓貓水族工坊

12.10.08

統計學 1007

1007
[[平均數的特徵]]
算數平均數是最常使用與出現的集中趨勢測量尺度
平均數就是將所有的數值加總後,再除以資料的總次數
1.資料必須至少是區間尺度的資料
2.所有的數值都被使用在平均數的計算中
3.一組資料只有一個平均數
4.每個資料值與平均數之間差異的總和一定為0 ★★★

母體平均數 ★★★★★
母體平均數就是將母體中所有的數值加總後,再除以資料的總個數
μ= ( ∑ X) / N

其中
μ 代表母體平均數
N 是母體中所有資料的個數
X 是代表任何特定的資料值
∑ 表示進行加法運算
∑X 是所有X資料值的總和

[[參數 Parameter]]
是母體資料特徵的測量值
範例一
K家有四部車,每部車所行駛的里程數是 56,000、23,000、42,000、73,000
μ= ( ∑ X) / N=56,000+....+73,000 / 4 = 48,500

樣本平均數
樣本平均數是樣本資料庫的總和除以樣本資料的總個數
x̅= ( ∑ X) / n
其中n為樣本中所有觀測資料的總個數

[[統計量 Statistic]]
是樣本資料特徵的測量值
範例二
有五位高階主管收到的獎金
14、15、16、17、15
x̅=( ∑ X) / n=14+....+15 / 5 = 77 / 5 = 15.4

算數平均數的性質
1.每一組區間尺度或比例尺度的資料都有一個平均數
2.所有的數值都必須包含在平均數的計算中
3.一組資料只有一個平均數,平均數是獨一無二的

範例三
3、8、4的平均數為5
(3-5)+(8-5)+(4-5)=0


[[加權平均數 Weighted Mean ]]
加權平均數是算數平均數的一個特例。他使用在好幾個觀察資料具有相同數值時,通常X1、X2、X3...Xn
與相對應的權重 W1、W2、W3,計算公式為
x̅w=(W1X1+W2X2+...+WnXn)/ (W1+...+Wn)

範例四
速食店賣出50杯飲料~
0.5元5杯
0.75元15杯
0.9元15杯
1.15元15杯
x̅w=(W1X1+W2X2+...+WnXn)/ (W1+...+Wn)
=[ 5(0.5) + 15(0.75) + 15(0.9) + 15 (1.15) ] / 5+15+15+15= 44.5/50=0.89

[[中位數 Median]]
1.將一組數值由小排列到大或是由大排列到小之後,中間的數值就是中位數。
2.大於和小漁中位數的資料值個數一樣多。
3.對於偶數個資料值,中位數將是兩個資料值的平均數。

中位數的主要特徵
1.就像平均數一樣,中位數也是唯一的,也是一組資料只有一個中位數。
2.中位數不受極大值或極小值的影響,因此在資料中出現了極端值時,中位數是一個適合用來表示資料的集中趨勢的測量值。
3.中位數可以用來計算比例尺度、區間尺度及順序尺度的資料。

眾數
在觀測資料中次數出現最多的數值
一組資料可以有超過一組眾數

對稱分配
在中心點左右兩側有相同圖形的分配圖


偏斜分配
圖形偏離中心點而往左側或右側傾斜的不對稱分配
可以是正偏、負偏,或是雙峰分配

零偏態
圖形呈現 mean平均數=median中位數=mode眾數的分配圖,也即是對稱分配
Photobucket


正偏分配
圖形呈現平均數>中位數>眾數的分配圖,也稱為右偏分配
Photobucket

負偏分配
圖形呈現 平均數<中位數<眾數的分配圖,也稱為左偏分配
Photobucket


幾何平均數 GEOMETRIC
為一組包含n個正數的資料,計算幾何平均數的方式為將n個正數相乘之後開n次方根
GM=n√(X1)(X2)(X3)...(XN)

三項債券的利率為5%,41%與4%
幾何平均數為
GM=3√(1.05)(1.41)(1.04)/3=1.157
算數平均數為1.1667

幾何平均數的第二個應用
GM=n√(某段時間結束的值/某段時間開始的值)-1

美國女性大學就讀人數由755,000人增加至833,000人
因此增加的幾何平均是 GM=n√(835000/755000) -1=0.0101

分散趨勢 Dispersion
是一組資料中所有數值的離散程度
分散趨勢的測量方法有:全距、平均差、變異數、標準差

全距 Range
是最簡單的離散量數,他是在一組資料中最大值與最小值中的差距
1.在計算全距值只使用到兩個資料值
2.非常容易受極端值所影響
3.容易計算與了解

平均差 Mean Deviation
計算母體或樣本中所有數值與算數平均數間差距的平均數
平均差的特性有:
1.他不易受極端值所影響
2.缺點在於絕對值不容易運算
3.在計算平均差的過程中使用了所有數值
MD=∑ | x - x̅ | / n

範例11
一家書店計算了幾箱樣本書的重量
103, 97, 101, 106, 103
全距=106-97=9
平均重量 x̅=∑ x /n=510/5=102
平均差 MD= |103-102| + ....+ |103-102| / 5= 1+5+1+4+5 / 5=2.4

Variance 變異數

★★★★★
母體變異數 Population Variance
為計算個數值與平均數差距、取平方後的算數平均數
μ=∑(X-μ)^2 / N


樣本變異數公式 Sample Variance
計算母體變異數的公式如下
S^2=∑(x-x̅)^2 / n-1

範例12
D家人的年齡分別為2,18,34,42
計算母體變異數
x̅=∑ x /n=96/4=24
σ=∑(X-μ)^2 / N=(2-24)^2+....+(42-24)^2 / 4 = 944/4=236

母體標準差σ為母體變異數開平方根
對於範例12,母體標準差為15.19,由
σ=√σ^2

範例13
五個學生樣本的時薪為 7,5,11,8,6
計算變異數
barX =∑X /n= 37/5=7.4
s^2=∑(x-x̅)^2 / n-1=(7-7.4)^2+....+ /5-1 =5.30

樣本標準差為樣本變異數的開平方根
在範例13中樣本標準差為2.30

s=√s^2=√5.30=2.30


標準差的使用與解釋
柴比雪夫經驗法則
1.在對稱的鐘形次數分配中,約有68%的數值落在平均數間減1個標準差的範圍內
2.約有95%的數值位於平均數加減2個標準差的範圍內
3.幾乎全部(99.7%)之數值位於平均數加減3個標準差的範圍內

Photobucket

沒有留言: