教學演示教材
This presentation is the property of its rightful owner.
Sponsored Links
1 / 42

教學演示教材 : 〈 信賴區間與信心水準的解讀 〉 PowerPoint PPT Presentation


  • 66 Views
  • Uploaded on
  • Presentation posted in: General

教學演示教材 : 〈 信賴區間與信心水準的解讀 〉. 一、常態分布. 為何成績單只要有個人成績加上 平均數 、 標準差 ,就足夠估計學生大約的名次? 例: A 生成績 ( 全班 40 人 ). 全班成績直方圖. 常態曲線函數圖. 平均數、標準差決定常態分布曲線函數. A 生名次的約估. p. 標準常態分配累積機率表. z p. 0. 標準常態分配.

Download Presentation

教學演示教材 : 〈 信賴區間與信心水準的解讀 〉

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


6871079

教學演示教材:〈信賴區間與信心水準的解讀〉


6871079

一、常態分布

  • 為何成績單只要有個人成績加上平均數、標準差,就足夠估計學生大約的名次?

  • 例:A生成績(全班40人)


6871079

全班成績直方圖


6871079

常態曲線函數圖


6871079

平均數、標準差決定常態分布曲線函數


6871079

A生名次的約估


6871079

p

標準常態分配累積機率表

zp

0

標準常態分配

  • 上面的標準常態累積機率表,是由標準常態分配機率密度函數(上圖中的 f (x)),計算從-∞到 zp曲線下的面積而得,通常記作F(zp),因此上表可以寫成 F(zp)= p。


6871079

0.975

0

1.96

標準常態分配累積機率表

  • 以右圖為例

    F(1.96) 0.975,所以在平均值前後 1.96 個標準差的機率為0.975−0.025 = 0.95。


6871079

大學聯考的統計資料

 已知 X≒54.63 s≒13.73


6871079

  • 某生國文成績為 24.7 分

  • 這個分數距離平均值 1.96 個標準差:

  • 利用常態分配表推知他的百分等級是 2.5%,

    但由大考中心資料得知他實際的百分等級是 4%


6871079

二、信賴區間

  • 92年7月19日,某報就『成年人對公立大學學費是否太貴』的議題進行調查,於20日報導:『成功訪問了871位成年人。在百分之九十五的信心水準下,有46%民眾認為學費太貴,抽樣誤差在正負3.3%之內』,而該調查是以台灣地區住宅電話為母體作尾數兩位隨機抽樣。

  • 這代表信賴區間為(0.46-0.033,0.46+0.033)

  • 我們每次做抽樣調查時都可以做出一個區間估計,例如上例的區間為(0.427,0.499) ,而所謂百分之九十五的信心水準,即指每次做出的區間會涵蓋實際比例的機率為95%。

  • 但是,這些區間與 95% 如何求出?


6871079

信賴區間的實驗

  • 老師為全班每個同學各準備一籤筒,事先不讓學生知道籤筒裡放了幾支籤,內含若干有獎籤,然後做實驗:讓每個同學在籤筒內抽取一支籤,記錄是否為有獎籤後放回,連續抽取20次。(類似於民調中成功訪問了20人)

  • 如果抽出7支有獎籤,則推估有獎籤的比例為 ,你有多少信心支持自己的推估正確?


6871079

樣本比例的抽樣分布

  • 每個同學的 雖然在變動,但中央極限定理告訴我們, 只要n夠大,這些 可以被常態分布描繪的相當接近


6871079

  • 前面提到常態分配中:約有95%的資料會在期望值±1.96個標準差的範圍中,所以大約有95%的機會,我們每個人所求出的區間

    會包含真正的有獎籤比例 p


6871079

信賴區間的計算

  • 將每位同學的中獎比例代入下列公式:


6871079

區間公式對照表( n =20 )


6871079

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

信賴區間圖

  • 右圖中,全班 40 個學生每個人都得到一個區間,如果老師事先知道 p = 0.6,那麼從圖中可知有36 個區間包含真實的 p值。

  • 全班 40 個學生包含 p值區間個數的期望值為 40  0.95 = 38 個


6871079

區間比較圖

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

1

0.9

n =20 n = 40


N 20 n 40

n = 20 與 n = 40 的區間估計的差異

因區間半徑等於 ,

所以較大的 n值具有較小的區間半徑,也意味著有較佳區間估計的效果。


6871079

信賴區間的解讀

  • 全班依照這樣的區間公式求出的 40 個區間,由模擬的實驗結果,可以發現並非一定有 95% 的區間會涵蓋實際值 p。

  • 全班執行這個實驗,正如 40 個學生每人都在擲一枚出現正面機率為 0.95 的硬幣,我們只知道此實驗出現正面個數的期望值為 40  0.95 = 38 個,並不能保證一定出現 38 個正面。其實出現38個的機率只有

  • 每個學生一旦做出區間,就只可能有兩種情形:包含真實 p值,或不包含真實 p值。因此一旦做出區間後,並不能說「真實 p值在此區間的機率為 95%」


6871079

回顧抽樣調查的例子

  • 92年7月19日,某報就『成年人對公立大學學費是否太貴』的議題進行調查,於20日報導:『成功訪問了871位成年人。在百分之九十五的信心水準下,有46%民眾認為學費太貴,抽樣誤差在正負3.3%之內』,而該調查是以台灣地區住宅電話為母體作尾數兩位隨機抽樣。

  • 這是否代表「認為公立大學學費太貴的民眾比例在(0.427,0.493)這個區間範圍內」?

  • 所謂百分之九十五的信心水準下,你可以說明出其涵義嗎?


6871079

例題1

  • A工廠生產的A飲料經隨機抽樣,得平均容量為330.04cc,在95% 的信心水準下,抽樣誤差為1.54cc;而B工廠生產的B飲料經隨機抽樣,得平均容量為329.56cc,在95% 的信心水準下,抽樣誤差為1.24cc,今隨機抽出一罐A飲料測量後告訴大家,再隨機抽出一罐B飲料,試問下列何者正確?(1)B飲料的容量必在[328.32,330.80](2)A飲料的容量有95%的機率在[328.50,331.58]中(3)A飲料的容量大於B飲料的容量(4)假若兩種飲料罐子皆標示容量330cc,則這兩 種飲料都不能說其標示不實

  • Ans:(4)說明:A的信賴區間[328.50,331.58],B的信賴區間[328.32,330.80]


6871079

相關知識探討

  • 中央極限定理

  • 區間半徑的由來

  • 信心水準的改變

  • 民意調查樣本數1068的由來


6871079

中央極限定理


N 20 n 401

n=20與n=40之抽樣分布圖形

人數

n=20

人數

n=40


6871079

例題2

  • 假設上頁兩個圖為某校300人一起做實驗,每個人均從已知籤筒(內有 5 支籤,其中 3 支是有獎籤)抽籤 n次,每次取出一支籤,取出後須放回。第一圖是 n = 20 時,每人抽中有獎籤比率與人數的分佈圖,第二圖則是 n =40 的分佈圖。試以此兩圖選出下列正確的敘述:


6871079

  • (1)在 n = 20 的實驗裡,一學生抽中有獎籤比率正好是 0.6 的機率 為

  • (2)在 n = 20 的實驗裡,95%的信心水準下,將每位同學的有獎 籤比例 代入區間半徑公式 ,則 的同學 其區間半徑最長

  • (3)在95%的信心水準下,因為信賴區間半徑公式為 ,所以n=20比n=40的區間半徑長,所以n=20時,其信賴區間 有較大的機會涵蓋真正的有獎比例0.6

  • (4)如果我們再做一次實驗,將n改為100,人數同樣為300人,則抽中有獎籤比例在[0.55,0.65]範圍內的人數必超過200人

  • Ans:(1)(2)(4)[說明](2)利用二次式求最大值或算幾不等式不難求出答案(3)在n變大時,其求得的 會更易靠近真正值,所以半徑 雖變短,但95% 還是95% (4) n變的越大,其圖形越集中於0.6


6871079

用機率為 0.6 的二項分佈說明中央極限定理

  • 執行抽到有獎籤機率為 0.6 的實驗 20 次,設抽到有獎籤 k 次,則此機率為

    而此實驗中籤機率的期望值為 0.6 ,變異數為

    引進函數 ,而將此兩機率函數畫圖於下:


6871079

  • 介於期望值 0.6 前後 1.96 個標準差是指中籤比例在

    之間,因二項分配是一離散型的隨機變數,所以更正確的說法是中籤比例在0.4~0.8 之間,且發生此事件機率為

    經計算此值約為 0.963,與常態分配的 0.950 僅差距0.013


6871079

  • 介於期望值 0.6 前後 1.96 個標準差是指中籤比例在

    之間,因二項分配是一離散型的隨機變數,所以更正確的說法是中籤比例在0.4~0.8 之間,且發生此事件機率為

    經計算此值約為 0.963,與常態分配的 0.950 僅差距0.013


6871079

上述討論若用常態分配去近似二項分配,96.3% 將近似成 95%,而每次實驗所得 可作出區間

而真實 p值落在此區間的機率約為 0.963(用常態分配近似時,會宣稱此機率約為 0.95),此區間我們稱為信賴區間,此機率我們稱為信心水準。


6871079

區間半徑的由來

  • 區間半徑其實就是1.96個標準差

  • 求二項分配的標準差


6871079

二項分配的期望值與標準差

  • 首先介紹隨機變數 X:

    定義 X的期望值

    變異數

    舉例:若 X 是一中獎機率為 p 的二項分配:

    可得 E(X) = p1+(1-p)0 = p,

    Var(X) = p(1-p)2+(1-p)(0-p)2

    = p(1-p)。


6871079

介紹兩個小引理:

  • 引理一:若 X、Y 是獨立的隨機變數且 a、b 為常數,則 E(X+Y) = E(X) +E(Y)且 E(aX+b) = a E(X) +b

  • 引理二:若 X、Y 是獨立的隨機變數且 a、b 為常數,則 Var (X+Y) = Var (X) +Var (Y)且

    Var (aX+b) = a2 Var (X)


6871079

計算 n次二項分配平均的期望值與標準差


6871079

真實的信心水準

實驗 n值為 20 ,如果區間取

則實際的信心水準是 96.3% 。

但是本次實驗中,區間為

則實際的信心水準是 92.8% 。


95 90

標準常態分配累積機率表

信賴區間由95%改成90%


6871079

例題3

  • A工廠生產的飲料經隨機抽樣,得平均容量為330.04cc,在95% 的信心水準下,抽樣誤差為1.54cc,試求在90%的信心水準下,其抽樣誤差為何?


N 1068

民意調查的樣本數n = 1068是如何得到?


6871079

民意調查的意義


6871079

謝謝大家的聆聽!


  • Login