1.36k likes | 1.5k Views
一些機率與統計的概念. 黃文璋 國立高雄大學應用數學系. 1. 前言. 宇宙的運轉,穿插著 必然性 及 隨機性 。 銅板以自由落體方式落下。 ◇高度固定,落地所需時間為定值 ( 必然性 ) 。 ◇那一面朝上?無法預知 ( 隨機性 ) 。 必然性:下次日蝕、月蝕、哈雷慧星來? 隨機性:颱風走向? . 數學裡多半是必然性的問題: ◇ 0.3 + 0.2 = 0.5 , ◇三角形內角和必為 180 ° , ◇ ,當 ,無非零整數解。 統計裡多半是隨機性的問題, ◇一成不變就非隨機,
E N D
一些機率與統計的概念 黃文璋 國立高雄大學應用數學系
1. 前言 • 宇宙的運轉,穿插著必然性及隨機性。 • 銅板以自由落體方式落下。 ◇高度固定,落地所需時間為定值(必然性) 。 ◇那一面朝上?無法預知(隨機性)。 • 必然性:下次日蝕、月蝕、哈雷慧星來? • 隨機性:颱風走向?
數學裡多半是必然性的問題: ◇ 0.3+0.2=0.5, ◇三角形內角和必為180°, ◇ ,當 ,無非零整數解。 • 統計裡多半是隨機性的問題, ◇一成不變就非隨機, ◇連機率值都可能改變。
在隨機世界裡,不能以數學中的必然性來思考問題。在隨機世界裡,不能以數學中的必然性來思考問題。 • 物理學裡用到不少數學,但學物理主要不是在學數學。 • 從機率與統計的課程裡,是要學到隨機性,而非只欣賞數學。
在隨機世界裡,我們接觸到的是 數據(data), • 在必然世界裡,我們接觸到的是 數字(number)。
數據是有內涵包含資訊的數字。 • 2.29與1.16為兩個數字,並未顯示任何資訊。 • 台灣地區民國70年之出生率為 2.29%,民國90年之出生率為1.16%,此二數據除了含有一些資訊(如二十年來出生率下降等)外,我們可能會想到諸如 ◇如何求出? ◇是否正確? ◇學校會不會招不到學生? 而不是單純地視為兩個數字。
數字是數學上的問題, 數據是統計上的問題。 • 數字是一成不變, 數據就會有變異(variation)。
什麼是data? ◇資料、數據,從調查、實驗或研究中獲 得資訊。 ◇ A general term for observations and measurements collected during any type of scientific investigation 。
在Conan Doyle著 The Celebrated Cases of Sherlock Holmes (福爾摩斯) The Adventure of the Copper Beeches一章 中: Data! data! data! he cried impatiently. I can't make bricks without clay.
做決策不能沒有data,算命者所倚賴的也是data: ◇要收集很多人的命運, 並按面相、八字 等分類。 • 算命是在做統計實務。 • 我們常說讓數據說話。但是否真能了解數據所說的話呢?
你交了一新朋友。問他“有幾個小孩”,他說“有兩個”。問他“有女孩嗎?”他答“有”。你交了一新朋友。問他“有幾個小孩”,他說“有兩個”。問他“有女孩嗎?”他答“有”。 問:他亦有一男孩之機率為何? 解.兩個小孩的性別: 男男、男女、女男、女女。 已知有一女孩: 男女、女男、女女。 會有男孩: 男女,女男。 另一小孩為男孩之機率為2/3, 另一小孩為女孩之機率為1/3。
很多人不相信此結果,以模擬來說明。 • 產生1,000,000組(i, j),i , j=0,1。 1表女孩,0表男孩。 無女孩:250,820組, 有女孩:749,180組, 有二女孩:249,131組。
回答“沒有” 兩個小孩皆為男孩。 • 若問“有男孩嗎?”回答“有” 另一個小孩為女孩之機率亦為2/3。 • 小孩是男是女的可能性皆為1/2: 事前機率。 • 獲得一些資訊(知道其中有一女孩)後,另一小孩是男或是女的機率改變了: 事後機率。 • 不少家庭都是兩個小孩。若知道其中一個是男孩,則猜另一個是女孩;若知其中一個為女孩,便猜另一個是男孩: 猜中的比率很容易超過一半。
問:不論問有男孩或有女孩,只要答“有”, 另一小孩為異性之機率皆為2/3,合理嗎? 問:如果問題改為「老大是女孩嗎?」 結果有何不同? • 回到前述圖片,跪著那小孩是女孩之機率為何? • 福爾摩斯根據一些蛛絲馬跡來推測,一張清晰的圖片,是會顯示一些資訊。
機率的意義為何? • 有二銅板: 銅板 A 出現正面之機率為0.3, 銅板 B 出現正面的機率為0.2。 問: ◇0.3是什麼意思?丟10次會得到3次正面? 丟10,000次得到3,000次正面? ◇0.3>0.2,若二銅板各丟10次, 銅板A之正面數>銅板B? ◇兩銅板各丟一次, 得到一正面之機率為 0.3+0.2=0.5?
好賭是人的天性 • 周伯通與歐陽鋒賭是否能真能把海上鯊魚全部殲滅。 • 黃眉僧與段延慶下圍棋,為搶先手,要段延慶猜他七十歲後,兩腳足趾是奇是偶。 • 越戰獵鹿人中,左輪手槍裡放一子彈,兩人輪流對自己頭部發射。 問:先發射者是否較不利?
有位婦女很想生個女兒,她已連生7個兒子,朋友都鼓勵她再生, 因為那有運氣那麼壞的 ?賭個運氣吧! • 事實上約有一半的人賭成功,約有一半的人賭失敗。這一半賭失敗者,其中有些人還會再賭一次,然後又有約一半的人賭成功。 • 這是為什麼有很高比例的人,相信連生7個兒子後,是較容易生出一個女兒。
公正賭局 玩法.投擲一公正銅板,正面出現則賭徒贏, 否則莊家贏。 策略. 每次賭注加倍,直至贏一次便停止。 結果. 設第一次賭注為a元,且銅板在第n次投 擲才首度出現正面。則 前n-1次共輸 a+2a+…+2n-2a=(2n-1 -1)a(元)。 第n次賭注 2n-1a(元) 淨贏a元。
玩法.投擲一公正銅板,直至出現一正面才停 止,若停止是在第r次,則得2r元。 期望所得. 問:1. 賭徒每次玩該付莊家多少錢,此才為 一公正賭局? 2.若所得2r元改為1.95r元,有何改變?
大部分的人連隨機性及機率的意義都不甚了解,因此才會沈迷於賭博,猜測明牌,或懷疑開獎之公正性。大部分的人連隨機性及機率的意義都不甚了解,因此才會沈迷於賭博,猜測明牌,或懷疑開獎之公正性。 • 賭應只是一種遊戲。去KTV唱歌、去看表演 ,都只是為了樂趣。從金錢上來看當然都是付出。
賭戲對賭客並不公平,何以許多人一上了賭台就下不來?賭戲對賭客並不公平,何以許多人一上了賭台就下不來? • 情況不利 那有運氣那麼壞,該轉運了,不能就此打住。 ◇再玩若仍輸 下次更該贏了。 ◇若幸運贏了 開始翻身了。 • 若情況有利 手氣正順,怎可停止? • 除非是一直輸贏不太多(此機率並不大),讓人覺得此賭戲沒趣,否則不少人不論手氣好壞,都缺乏當機立斷的決心。
以投擲銅板為例 • 持續投擲一公正銅板10,000次,令
以布朗運動的結果來估計: 其中 Z 有 分佈, 表一標準的布朗運動。
仍以布朗運動的結果來估計: 當x=0.993,機率約為
底下為五個模擬圖,橫軸為n, 縱軸為Sn,其中Si > 0表正面領先,Si < 0表反面領先。 構成一隨機漫步(random walk)。 注意
新聞媒體多半只報導有人樂透彩中大獎,或在賭場大贏的新聞。新聞媒體多半只報導有人樂透彩中大獎,或在賭場大贏的新聞。 • 人有選擇性記憶的傾向。在賭之前向神明祈求,大部分的時候沒有效果。但若贏了,可能真覺得神明聽了自己的祈求。
2. 你了解隨機嗎? • 民國92年1月1日起,環保署實施第二階段的塑膠袋限用政策,塑膠業者與民眾均感到困擾。 • 中國時報92年1月1日有一則投書: 昨天筆者支援採訪此則新聞, 經“隨機採樣” 受訪者,…。 而「平口,無提把」塑膠袋可用的細節幾乎都能“隨機”答出。 …。 於是筆者又鍥而不捨的“隨機”多問了許多間店家,…。
隨機與隨便的意思一樣嗎? • 容不容易做到隨機採樣(或隨機抽樣)呢? • 隨機點名,會不會每次都點不同的人?
再引一段文字。 • 我代替電視節目出征,站在路邊訪問經過的路人,隨機抽樣,盡量毫不偏私地呈現社會大眾的心聲。… (91年4月14日中國時報39版,作者黃明堅,題目為活到一百一十四歲如何?)
在機率裡: 事先不能預知結果的試驗,便稱隨機試驗。 • 隨機抽樣裡,說將10個球隨機地放進10個箱子中,此處之隨機便含有獨立及均勻分佈的意思。 • 均勻的骰子,將撲克牌洗得很均勻。 • 在隨機現象裡,均勻大致表出現之機率相等,而非出現之頻率相等。
例1. n個球隨機地放進n箱中,每箱各有一球的機率: ◇n=2,約1/2; ◇n=3,約2/9; ◇n=10,約0.00036288。 • 每箱各有一球,不是應最易發生嗎?
取n=10。令a=每箱各有一球的機率。 恰有i空箱的機率: (i) 1空箱:45a。 (ii) 2空箱:375a。 第三大 (iii) 3空箱:980a。 最大 (iv) 4空箱:(7609/8)a。 次大 (v) 5空箱:(2835/8)a。 第四大 (vi) 6空箱:(6821/144)a。 (vii) 7空箱:(311/168)a。 (viii) 8空箱:(511/40320)a。 (xi) 9空箱:a/9!。
在紅樓夢的第八回,賈寶玉去探望薛寶釵,正在閒聊。一語未了,忽聽外面的人說:『林姑娘來了。』話猶未完,黛玉已搖搖擺擺的進來,一見寶玉,便笑道:『哎喲! 我來的不巧了!』寶玉等忙起身讓坐。 寶釵笑道:『這是怎麼說?』 黛玉道:『早知他來,我就不來了。』 寶釵道:『這是什麼意思?』 黛玉道:『什麼意思呢? 來呢,一齊來,不來,一個也不來。今兒他來,明兒我來,間錯開了來,豈不天天有人來呢? 也不至太冷落,也不至太熱鬧。姐姐有什麼不解的呢?』
從10n個有編號的球中,依序隨機取n球,每次取出後放回。會有重複的機率:從10n個有編號的球中,依序隨機取n球,每次取出後放回。會有重複的機率: ◇ n=20,約0.05; ◇ n=30,約0.098; ◇ n=300,約0.777; ◇ n→∞, 趨近至1。 隨機下的後果,往往是不均勻!
在電影沈默的羔羊裡: Doesn't this random scattering site seem desperately random, like an elaboration of bad liar. 這些隨機散佈的地點,不是極度地隨機嗎? 就像差勁的騙子精心設計的謊言。 • 看起來隨機,反而會像精心設計的謊言! • 隨機點名,很難每次點不同的人。 • 做芝蔴餅,隨機灑,芝蔴散布不易均勻。 均勻分佈並非均勻散佈!
有時我們會懷疑事件之隨機性,因看到過多的巧合。以樂透彩為例,從每期開出的6個頭獎號碼,要找到一些特殊的組合,並非太困難。有時我們會懷疑事件之隨機性,因看到過多的巧合。以樂透彩為例,從每期開出的6個頭獎號碼,要找到一些特殊的組合,並非太困難。
例2. 在42取6的樂透彩裡,偶數共有21個。故6碼全為偶數之機率: 每期頭獎號碼全為偶數,全為奇數,全在1 至21,或全在22至42,機率約
6碼全為3的倍數,全不為3的倍數,…,每期開出的6碼中,總能找到一些有趣的現象。6碼全為3的倍數,全不為3的倍數,…,每期開出的6碼中,總能找到一些有趣的現象。 • 當期數夠多後,更易從其間找到一些有趣的現象(如北銀樂透彩39號曾連續5期出現)。 • 除非經過統計檢定,否則不要輕易判定號碼並非隨機地出現。 • 有些我們以為不容易發生的事件,其發生的機率其實並沒有想像中的小。
例3.在n取r的樂透彩中,頭獎號碼會有連號的機率:例3.在n取r的樂透彩中,頭獎號碼會有連號的機率: 在42取6,機率: 因此看到連號不用太驚訝。 問:簽注連號,中頭獎的機率是否較大?
例4.對北銀發行的樂透彩,假設每期簽5注 ,連續50年,至少會中一次的機率為何? 解.50年間至少中一次頭獎之機率: 50年間共簽了 5‧5,200=26,000(注), 佔全部注數 利息不計,共花了一百三十萬元。
有志者事竟成。花50年的歲月,中頭獎之機率的確是不小。有志者事竟成。花50年的歲月,中頭獎之機率的確是不小。 • 在一個人的一生中,自己或認識的人裡,有中頭獎(或發生很特殊的事件)者,是不太稀奇的。
夢幻七部車 • 民國90年12月,新開幕的京華城購物中心,推出一百名休旅車抽獎活動,每天抽10部,購物每滿2,000元可兌換一張抽獎券。 • 一對夫婦合計抽中7部車,他們共花三百多萬元,換來1,500餘張抽獎券。 • 活動期間,共投進十四、五萬張彩券。不知每天箱內有多少張彩券,不易求中7部車的機率。 利用波松近似估計此機率約萬分之一。
從新聞的觀點,只要有一這類幸運發生皆會引起注意。從新聞的觀點,只要有一這類幸運發生皆會引起注意。 • 一件事若發生在每個人身上的機率為百萬分之一,則台灣兩千三百萬人,每天發生二十餘件是毫不稀奇的。