490 likes | 716 Views
第三章 資料的描述:數值的測量. 目標 在學習完本章之後,你將能夠:. 1. 計算算術平均數、中位數、眾數、加權平均數和幾何平均數。. 2. 解釋每一種集中程度測量方法的特徵、使用方式、優點與缺點。. 3. 判斷算術平均數、中位數、眾數,在對稱及偏斜分配中的相對位置。. 第三章 資料的描述:數值的測量. 目標 在學習完本章之後,你將能夠:. 4. 計算與解釋全距、平均差、變異數及標準差。. 5. 解釋每一種離散程度測量方法的特徵、使用方式、優點與缺點。. 6. 透過柴比雪夫定理和經驗法則來了解觀測資料的分佈。. 平均數的特徵.
E N D
第三章 資料的描述:數值的測量 目標 在學習完本章之後,你將能夠: 1.計算算術平均數、中位數、眾數、加權平均數和幾何平均數。 2.解釋每一種集中程度測量方法的特徵、使用方式、優點與缺點。 3.判斷算術平均數、中位數、眾數,在對稱及偏斜分配中的相對位置。
第三章 資料的描述:數值的測量 目標 在學習完本章之後,你將能夠: 4.計算與解釋全距、平均差、變異數及標準差。 5.解釋每一種離散程度測量方法的特徵、使用方式、優點與缺點。 6.透過柴比雪夫定理和經驗法則來了解觀測資料的分佈。
平均數的特徵 • 算術平均數是最常使用與出現的集中趨勢測量尺度。 • 平均數就是將所有的數值加總後,再除以資料的總次數
平均數的主要特徵 • 1.資料必須至少是區間尺度的資料。 • 2.所有的數值都被使用在平均數的計算中。 • 3.一組資料只有一個平均數。 • 4.每個資料值與平均數之間差異的總和一定為0。
母體平均數 • 母體平均數就是將母體中所有的數值加總後,再除以資料的總個數: 其中, μ是希臘的小寫字母“mu”,代表母體平均數。 Ν 是母體中所有資料的個數。 Χ是代表任何特定的資料值。 Σ 是希臘大寫字母“sigma”,表示進行加法運算。 ΣΧ是所有Χ資料值的總和。
範例 1 • Kiers 家一共擁有四部汽車。每一部汽車的目前行駛的里程數如下所示: • 56,000, 23,000,42,000,73,000 • 請計算平均數: • 56,000, 23,000, 42,000, 73,000
樣本平均數 • 樣本平均數是樣本資料值的總和除以樣本資料的總個數: • 其中 n為樣本中所有觀測資料的總個數。
範例 2 • 下表列示5位高階主管所收到的獎金 ($000): • 14.0, 15.0, 17.0, 16.0, 15.0
算術平均數的性質 • 1.每一組區間尺度或比例尺度的資料都有一個平均數。 • 2.所有的數值都必須包含在平均數的計算中。 • 3.一組資料只有一個平均數,平均數是獨一無二的。 • 4.算術平均數非常便於進行二個以上不同母體間的比較。 • 5.每個資料值與算術平均數之間差異的總和一定為0。
範例 3 • 3、8和4的平均數為5 。 • 解釋第五個性質。
加權平均數 • 加權平均數是算術平均數的一個特例。它使用在好幾個觀察資料具有相同數值時。 通常X1, X2, ..., Xn,與 相對應的權重 w1, w2, ...,wn。 計算公式為:
範例 4 • 例如,若速食店賣出50杯飲料。其中價格為$0.5的有5杯,價格為$0.75的有15杯,價格為$0.9的有15杯,價格為$1.15的有15杯。使用公式找出這50杯飲料的平均價格。
中位數 • 中位數:將一組數值由小排列到大或是由大排列到小之後,中間的數值就是中位數。 • 大於和小於中位數的資料值個數一樣多。 • 對於偶數個資料值,中位數將是兩個中間資料值的平均數。
範例 5 • 五位大學生之年齡如下所示: • 21, 25, 19, 20, 22 • 以降羃的順序排列: 19、20、21、22、25。因此中位數為21。
範例 6 四位籃球選手的身高為: 76, 73, 80, 75英吋 • 以降羃的順序排列: 73、75、76、80。因此中位數為 75.5,即(75+76)/2。
中位數的主要特徵 • 1.就像平均數一樣,中位數也是唯一的 • 亦即一組資料只有一個中位數。 • 2.中位數不受極大值或極小值所影響。因此, • 在資料中出現了極端值時,中位數是一個適 • 合用來表示資料的集中趨勢的測量值。 • 3.中位數可以用來計算比例尺度、區間尺度及順序尺度的資料。
眾數 • 眾數:在觀測資料中次數出現最多的數值。 • 範例 7:十位學生的考試分數為: 81、93、84、75、8、 87、81、75、81、87。 因為81分最多,所以為眾數。 • 一組資料可以有超過一個眾數.
對稱分配:在中心點左右兩側有相同圖形的分配圖對稱分配:在中心點左右兩側有相同圖形的分配圖
偏斜分配:圖形偏離中心點而往左側或右側傾斜的不對稱分配.可以是正偏,負偏或是雙峰分配偏斜分配:圖形偏離中心點而往左側或右側傾斜的不對稱分配.可以是正偏,負偏或是雙峰分配
零偏態:圖形呈現 平均數=中位數=眾數 的分配圖,也即是對稱分配
正偏分配:圖形呈現 平均數>中位數>眾數 的分配圖,也稱為右偏分配
負偏分配:圖形呈現 平均數<中位數<眾數 的分配圖,也稱為左偏分配
幾何平均數 • 幾何平均數 (GM)為一組包含n個正數的資料,計算幾何平均數的方式為將n個正數相乘後,開n次方根。 • 幾何平均數(geometric mean)適合用在計算百分比、比例、指數或成長率的平均數。
範例 8 • 三項債券的利率為 5%、41%與4%。 • 幾何平均數為
範例 8 continued • 算術平均數為 (1.05+1.41+1.04)/3 =1.1667 • 幾何平均數計算出來的利率較低,因為41%在開方根之後所占的比重不大。
幾何平均數 • 幾何平均數的第二個應用是,計算一段時間內平均百分比的增加率。 ( 某段期間結束時的值 = - GM 1 n 某段期間開始的值
範例 9 • 美國女性就讀大學的人數由1992 年的755,000 人增加至2002年的 835,000 人。因此M增加的幾何平均數比率為 1.01%。
分散趨勢(Dispersion)是一組資料中所有數值的離散程度分散趨勢(Dispersion)是一組資料中所有數值的離散程度 • 分散趨勢的測量方法有:全距, 平均差, 變異數, 標準差
全距 • 全距是最簡單的離散量數。它是在一組資料中最大值與最小值之間的差距。 • 在計算全距時只使用到兩個資料值 • 非常容易受極端值所影響 • 容易計算與瞭解.
平均差 • 平均差(Mean Deviation) 計算母體或樣本中所有數值與算術平均數間差距的平均數。
平均差 平均差的特性有: • 它不易受極端值所影響。 • 在計算平均差的過程中使用了所有數值。 • 缺點在於絕對值不容易運算。
平均差 • 公式為:
範例 10 • 一家書店計算了幾箱樣本書的重量 (單位英鎊 ) 為: • 103, 97, 101, 106, 103 • 計算全距與平均差 全距 = 106 – 97 = 9
範例 11 • 計算平均差時,需先找出平均重量。
範例 11 continued • 平均差為:
母體變異數 • 母體變異數為計算各數值與平均數差距、取平方後的算術平均數。
母體變異數 • 在計算中使用了所有的數值 • 不易受極端值所影響 • 單位的意義不容易解釋,其為原來單位的平方。 主要的特徵為:
母體變異數公式 • 計算母體變異數的公式如下:
樣本變異數公式 • 計算樣本變異數的公式如下:
範例 12 • Dunn 家人的年齡分別為: 2, 18, 34, 42 • 試計算母體變異數
母體標準差 • 母體標準差 σ為母體變異數開平方根。 • 對於範例12,母體標準差為15.19,由
範例 13 • 五位學生的樣本中,其時薪分別為: • $7, $5, $11, $8, $6. • 請計算變異數
樣本標準差 • 樣本標準差為樣本變異數的開平方根。 • 在範例 13中,樣本標準差為2.30
標準差的使用與解釋 • 柴比雪夫定理:對於任何觀測資料組(無論是母體還是樣本),落在算術平均數加減k個標準差範圍內數值的比例,至少佔所有數值比例的1-1/k2。 其中,k為任何大於1的常數。
標準差的使用與解釋 • 經驗法則: • 在對稱的鐘形次數分配中,約有68%的數值落在平均數加減1個標準差的範圍內; • 約有95%的數值位於平均數加減2個標準差的範圍內; • 幾乎全部(99.7%)之數值位於平均數加減3個標準差的範圍內。
在平均數與變異數間的關係,以鐘型分配解釋:在平均數與變異數間的關係,以鐘型分配解釋: - . m-2s m-1s m m+1s m+2s m+ 3s m-3s