440 likes | 735 Views
第五章. 連續 型隨機變數. 5.1 機率密度函數及期望值. 5.2 常態分布. 5.3 其他連續分布. 5.1 機率密度函數及期望值. 連續型隨機變數的機率密度函數 f (x) 必須滿足下列條件:. 5.1 機率密度函數及期望值. 例 5.1-1 是否滿足機率密度函數的條件,其圖形如圖 5.1-2 所示。. 從圖 5.1-2 中我們可以看出 1. f ( x ) ≥ 0 對於所有的 x 都成立, 2. f ( x ) 之下所圍出的梯形區域面積為 1 。 所以 f (x) 滿足作為一個機率密度函數的條件。.
E N D
第五章 連續型隨機變數
5.1 機率密度函數及期望值 5.2 常態分布 5.3其他連續分布
5.1 機率密度函數及期望值 連續型隨機變數的機率密度函數f (x) 必須滿足下列條件:
5.1 機率密度函數及期望值 例 5.1-1 是否滿足機率密度函數的條件,其圖形如圖5.1-2 所示。 從圖5.1-2 中我們可以看出 1. f (x) ≥ 0對於所有的x都成立, 2. f (x)之下所圍出的梯形區域面積為1。 所以f (x)滿足作為一個機率密度函數的條件。
5.1 機率密度函數及期望值 以幾何意義來說,P(a < X < b)指的是在f (x)圖形之下、x 軸之上,並且在x = a和x = b兩條垂直x 軸的直線之間所圍出的區域之面積。
5.1 機率密度函數及期望值 例 5.1-2 假設某個隨機變數X 的機率分布如圖5.1-1 所示,求下列機率: (a) P(1 < X <1.5)。 (b) P(1.3 < X < 2)。 我們把圖5.1-1 複製在下方,並在圖(a) 和(b) 中分別用淺藍色標示出(a) 和(b) 小題所求機率對應之區域。
5.1 機率密度函數及期望值 例 5.1-2 (a) 從(a) 圖可看出, P(1 < X <1.5) 對應的是在f (x) 之下、x 軸之上, 且x 介於1 跟1.5 之間所圍出的三角形區域面積,此三角形區域的底為0.5,而高為f (1.5) = 2.1.5 - 2 =1,所以其面積為 (b) 從(b) 圖可看出, P(1.3 < X < 2) 對應的是在f (x) 之下、x 軸之上,且x 介於1.3 跟2 之間所圍出的梯形區域面積,這個梯形的上底為f (1.3) = 2.1.3- 2 = 0.6、下底為2,而高為2 -1.3 = 0.7,所以其面積為(0.6 + 2).0.7 / 2 = 0.91。
5.1 機率密度函數及期望值 例 5.1-4 假設有一個隨機變數的機率分布如下圖所示,問此隨機變數的期望值為何? 連續型隨機變數的期望值定義為 ,假設某個連續分布是左右對稱的,它的期望值就會在這個分布的中心位置,也就是對稱中心。 因為圖5.1-3 所顯示的機率分布是對稱的,所以它的期望值就會在這個分布的中心位置,也就是E(X ) = µ = 3。
5.1 機率密度函數及期望值 例 5.1-5 假設下圖代表某隨機變數的機率密度函數,則此隨機變數的期望值為何? 圖5.1-4 所顯示的機率分布是對稱的,所以它的期望值就會在這個分布的中心位置,也就是E(X ) = µ = -2。
5.2 常態分布 一般而言,在統計學裡面最常用到的連續型機率分布就是常態分布(normal distribution) 了。常態分布可以用來描述許多我們日常生活裡的數據,例如某種昆蟲的身長或者是某些考試的分數。常態分布的機率密度 函數是鐘型的,並且對稱於其平均數 µ,它的定義域包含了所有實數。常態分布之機率密度函數的形狀是由兩個參數: µ及 σ所決定的,它的中心位置就在 µ,而它的離散程度則是由標準差σ的大小所決定。
5.2 常態分布 假設X 的分布為常態,平均數是 µ 、變異數是,則我們可以用符號表示為X ~ N(µ,)。已知X ~ N(µ,),則大約有68% 的數據會落在(µ - σ , µ + σ )這個區間內,約有95% 的數據會落在(µ - 2 σ , µ + 2 σ )這個區間內,並且有99.7% 的數據會落在(µ - 3 σ , µ + 3 σ )這個區間內。 有人稱此為68-95-99.7 規則。實際上,68% 應該是68.26%,95% 應該是95.44%,把小數點四捨五入後,此規則會比較好記。
5.2 常態分布 教科書裡面都會提供常態分布表,列出各種機率,我們只要學習如何查表,就可以得到想要計算的機率。教科書列出的都是有關標準常態分布的機率,至於其他的常態分布,經過簡單處理就可以把它「變」成標準常態分布。
5.2 常態分布 本書表4 裡面所提供的數字,代表的是標準常態隨機變數Z 的累積分布函數F(z)之值,也就是F(z)= P(Z ≤ z)之值。比如我們若想要知道Z 會小於或等於2.15 的機率,就可以直接查表4,過程一共有三個步驟: 1. 先從表的最左邊那一行,也就是標明z 的那一行由上往下看,直到找出2.1 為止。 2. 接著再從表的最上面那一列,也就是標明z 的那一列由左向右看,直到找出0.05 為止。 3. 找出步驟1 裡的那一列與步驟2 裡的那一行相交的位置,所得到的數字就是我們所要求的機率。 所以,P(Z ≤ 2.15) = 0.9842。
5.2 常態分布 例 5.2-1 假設Z 的分布為標準常態, 求 (a) P(Z ≤1.73) (b) P(Z ≤ 0.2)(c) P(Z < -1.58)。 (a) P(Z ≤1.73) = 0.9582 (b) P(Z ≤ 0.2) = 0.5793 (c) P(Z < -1.58) = 0.0571
5.2 常態分布 例 5.2-2 假設Z 的分布為標準常態,求 (a) P(0.81 < Z < 1.23)(b) P (-2.9 ≤ Z ≤1.35)(c) P(Z > - 1.72)。 (a) P(0.81 < Z <1.23) = P(Z <1.23) - P(Z ≤ 0.81) = 0.8907 - 0.791 = 0.0997 (b) P(-2.9 ≤ Z ≤1.35) = P(Z ≤1.35) - P(Z < -2.9) = 0.9115 - 0.0019 = 0.9096 (c) P(Z > -1.72) =1- P(Z ≤ -1.72) =1- 0.0427 = 0.9573
5.2 常態分布 X 的分布屬於常態一族,卻不是標準常態時,則我們就沒有表可以查。此時只要先將X 標準化之後,就可以查表4 了。標準化的意思,是減去平均數之後,再除以標準差,而X 在標準化之後,它的分布會變成標準常態分布:
5.2 常態分布 例 5.2-3 (a) 已知X ~ N(2, 9),將隨機變數X 標準化成為標準常態隨機變數。 (b) 已知X ~ N(- 3, 16),將隨機變數X 標準化成為標準常態隨機變數。 因為µ = 2,σ = 3,所以 是標準常態隨機變數。 (b) 因為µ = -3,σ = 4,所以 是標準常態隨機變數。
5.2 常態分布 例 5.2-4 已知X ~ N(1, 4),求下列機率: (a) P(2.4 < X < 3.2) (b) P(0.5 < X < 1.8) (c) P(X > 2) 因為X 並非標準常態,所以必須先將X 標準化後再查表。此題的µ =1, σ = 2。
5.2 常態分布 例 5.2-5 假設某大學工學院的大一學生微積分期中考成績呈常態分布,並知其平均為62 分,標準差為15 分。若隨機從這所大學的工學院裡選出1位大一學生,求以下事件發生的機率: (a) 該生微積分期中考成績介於70 分和80 分之間。 (b) 該生微積分期中考有考及格。 (c) 若某生考得比91.92% 的學生好,則他考了幾分?
5.2 常態分布 假設 Z 為標準常態隨機變數,則z 滿足機率式:P(Z> z ) = ;也就是說,隨機變數Z 會大於z 這個數字的機率是 。 α α α α α 例 5.2-6 查表找出(a) z 和 (b) z 的值。 0.2 0.008
5.3其他連續分布 假設隨機變數X 在區間[a, b] 上呈現均勻分布,我們用符號表示為X ~ U(a, b);叫做均勻分布是因為對於任何一個在[a, b] 區間內的x,其f (x) 的值都一樣。如果X ~ U(a, b),則X的機率密度函數可用以下式子表示:
5.3其他連續分布 任何一個均勻分布的隨機變數X 之機率密度函數圖形都是水平線,如圖5.3-1 所示:
5.3其他連續分布 假設某隨機變數X 在區間[a, b] 上呈均勻分布,而我們想知道此隨機變數X 介於c 和d 兩個數字之間的機率(a ≤c < d ≤b);因為這個機率所對應的是圖5.3-2裡所示淺藍色長方形的面積,因此明顯可知
5.3其他連續分布 例 5.3-1 假設X ~U(2 , 6),求以下機率: P(3 < X < 5)。 (b) P(X > 4)。 (c) P(X < 2.5)。 如果需要計算機率的範圍超出區間 [a, b] 之外的話,首先要把它調整到 [a, b] 範圍之內,然後才來計算,因為在 [a, b] 以外f (x)的值是0,所以在計算P(c < X < d)時,我們只考慮區間(c, d) 和區間 [a, b] 的交集部分。
5.3其他連續分布 例 5.3-3 王小美平日都是在信義新生站搭乘642 路公車去上學,假設642 路公車的等候時間( 分鐘) 呈均勻分布(a = 0, b = 12)。某天早上,王小美要去上學,試求: (a) 王小美等候642 路公車的時間會超過10 分鐘的機率。 (b) 王小美等候642 路公車的時間不到5 分鐘的機率。 (c) 王小美等候642 路公車的時間介於8 到15 分鐘之間的機率。
5.3其他連續分布 假設隨機變數X 呈現指數分布,參數為λ ( 唸做「lambda」,是一個大於0 的常數),我們用符號表示為X ~ exp(λ ),而它的機率密度函數如下:
5.3其他連續分布 指數分布的形狀取決於參數λ 的值,圖5.3-3 裡所顯示的三條曲線分別是對應不同的λ 值所畫出之機率密度函數,藍色曲線對應λ = 0.5,灰色曲線對應λ =1,而黑色曲線則對應λ = 2。
5.3其他連續分布 如果隨機變數X ~ exp(λ ),則,也就是說,圖5.3-4 裡的藍色區域之面積 ,由於機率密度函數之下的總面積等於1,因此可知 。若要計算X介於a 跟b 兩個數字之間的機率,則我們可以由P(X < a) = 推得
5.3其他連續分布 例 5.3-4 假設隨機變數X ~ exp(0.5),求 (a) X 的期望值及標準差。 (b) P(X < 5)。 (c) P(2 < X < 6)。
5.3其他連續分布 例 5.3-5 假設某速食店的外帶窗口前後兩位顧客抵達的間隔時間( 分鐘) 是呈指數分布(λ = 0.5)。如果有一位顧客剛剛離開外帶窗口,求以下事件發生的機率: (a) 下一位顧客在至少5 分鐘之後抵達。 (b) 下一位顧客在3 分鐘之內抵達。 (c) 下一位顧客在2 到4 分鐘之間抵達。 令X 為下一位顧客抵達時距離前一位顧客離開所經過的時間,
5.3其他連續分布 接著介紹的連續型機率分布叫做卡方分布(chi-square distribution),它的定義域是所有的正實數,有一個參數叫做自由度(degrees of freedom, 簡寫d.f.)。如果隨機變數X 呈卡方分布,且自由度為k,則我們用符號表示為 卡方分布在統計裡面很常用到(其應用將出現在第十一章),它和常態隨機變數也有密切的關係如下:假設有k個隨機變數 均為標準常態分布,且互相獨立,則 會呈現自由度為k 的卡方分布。
5.3其他連續分布 卡方分布的形狀決定於其自由度k,它的機率密度函數形狀呈現右偏,當自由度增加時,機率密度函數的圖形會漸漸趨向於對稱。圖5.3-5裡所示的三條曲線分別是對應不同自由度的機率密度函數,藍色曲線其自由度是5,灰色曲線其自由度是10,而黑色曲線其自由度是20。由圖5.3-5 中我們可以看出當卡方分布的自由度增加時,其對應的機率密度函數之圖形會漸漸趨於對稱。
5.3其他連續分布 和常態分布一樣,卡方分布的相關機率也有表可以查。若隨機變數X 的分布為自由度k 的卡方,本書卡方分布機率表提供的是機率密度函數右尾面積等於α時所對應之 值;也就是說, 會滿足 ,如圖5.3-6 所示:
5.3其他連續分布 例 5.3-4 假設隨機變數X ~ exp(0.5),求 (a) X 的期望值及標準差。 (b) P(X < 5)。 (c) P(2 < X < 6)。
5.3其他連續分布 例 5.3-7
5.3其他連續分布 例 5.3-9 如果X ~,求以下機率: (a) P(X < 3.49)。 (b) P(2.18 ≤ X ≤ 20.09)。 (a) 由表5得知P(X > 3.49) = 0.9,所以P(X < 3.49) =1- 0.9 = 0.1。 (b) P(2.18 ≤ X ≤ 20.09) = P(X ≥ 2.18) - P(X > 20.09) = 0.975 - 0.01 = 0.965
5.3其他連續分布 因為卡方分布機率表提供的是對應特定α值的 ,所以我們想要知道的機率值未必能在表中找到。這時只能找到機率的範圍,我們用下個例子說明。 例 5.3-10 假設X ~ ,利用表5,求下列機率的範圍: (a) P(X >10)。 (b) P(X >18)。 (a) 因為P(X > 11.07) <P(X > 10) < P(X > 9.236),而根據表5 得知 P(X > 9.236) = 0.1、P(X > 11.07) = 0.05,所以0.05 < P(X > 10) < 0.1。 (b) 因為P(X > 18) < P(X > 16.748),而P(X > 16.748) = 0.005,所以 P(X > 18) < 0.005。
5.3其他連續分布 本節介紹的第四種連續型機率分布,叫做F 分布(F distribution),它的定義域是所有的正實數。符合F 分布的隨機變數通常是這樣建構出來的:假設某個隨機變數 ,而另外一個隨機變數 ,且 X 和Y 互相獨立,則 呈現F 分布,其分子的自由度為m、分母的自由度為 n,我們將它的自由度以 表示,而將其分布用符號表示為 ;此分布的應用將出現在第十三章。
5.3其他連續分布 F 分布的形狀取決於其分子和分母的自由度,它的機率密度函數形狀呈現右偏。圖5.3-7 裡所示的三條曲線分別是對於不同的分子和分母自由度所畫出之機率密度函數,藍色曲線其df= (3, 5),灰色曲線其df= (5,25),黑色曲線其df= (20, 15)。
5.3其他連續分布 表6 裡的最上面一列是F 分布的分子自由度,最左邊一行是F 分布的分母自由度,而其機率密度函數的右尾α標明於表的最上方。假設某個隨機變數X ~ F3, 12,而我們想要查f 3, 12, 0.01 之值,查表的步驟如下: 1. 先找出標明α = 0.01的F 機率表。 2. 從表的最上面一列由左向右看,找出自由度為3 的那一行。 3. 從表的最左邊一行由上往下看,找出自由度為12 的那一列。 4. 找出步驟1 裡的那一行與步驟2 裡的那一列相交的位置,所得到的數字就是我們要查的值,所以 f 3, 12, 0.01 = 5.95。
5.3其他連續分布 例 5.3-11 利用表6 查出f 10, 15, 0.01、f3, 20, 0.05,以及f 7, 10, 0.025 之值。 f10, 15, 0.01 = 3.80、f 3, 20, 0.05 = 3.10、f7, 10, 0.025 = 3.95。
5.3其他連續分布 例 5.3-12 假設X ~ F2, 17,查表求下列機率的範圍: (a) P(X > 4.28)。 (b) P(X > 8.73)。 因為P(X > 4.62) < P(X > 4.28) < P(X > 3.59),而根據表6 得知P(X > 4.62) = 0.025、P(X > 3.59) = 0.05,所以0.025 < P(X > 4.28)< 0.05。 (b) 因為P(X > 8.73) < P(X > 6.11),而P(X > 6.11) = 0.01,所 以P(X >8.73) < 0.01。