1 / 52

別讓數字騙了你 --- 由統計觀點來看賽制中的排名

別讓數字騙了你 --- 由統計觀點來看賽制中的排名. 李 美 賢. Outline and Motivation. There are three kinds of lies: lies, damned lies, and statistics. — Benjamin Disraeli. 統計學的目的就是從數據中尋找訊息。 這個數據,是具有「上下文」的數據,配合著上下文,就可以和常識銜接上、也可以輔助我們做判斷 統計數字都是人創造出來的 數字會說話、也會說謊 數據的產生 — Garbage in garbage out.

neil
Download Presentation

別讓數字騙了你 --- 由統計觀點來看賽制中的排名

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 別讓數字騙了你---由統計觀點來看賽制中的排名別讓數字騙了你---由統計觀點來看賽制中的排名 李 美 賢

  2. Outline and Motivation • There are three kinds of lies: lies, damned lies, and statistics. — Benjamin Disraeli. • 統計學的目的就是從數據中尋找訊息。 • 這個數據,是具有「上下文」的數據,配合著上下文,就可以和常識銜接上、也可以輔助我們做判斷 • 統計數字都是人創造出來的 • 數字會說話、也會說謊 • 數據的產生— Garbage in garbage out. • 數據的量度與整合 — 百分比、平均、中位數、統計圖表 • 由數據做推論 —如何分辨?

  3. 巧合?!需要嘖嘖稱奇嗎?

  4. 巧合?!需要嘖嘖稱奇嗎? • 是巧合?還是常理? • 大型醫院的太平間都是在最底層 • 電梯急墜到最底層會剛好停在太平間那個樓層的機率是? • 大家來找碴 • 聯合報新聞:「電梯從廿一樓墜落到地下四樓,總共花了十秒鐘。為避免禁忌,醫院通常略去四樓樓層,因此電梯從廿一樓急速下墜到地下四樓,實際是急墜廿四層樓,而非廿五層樓。」 • 二十一樓到一樓隔了二十層樓的高度,再扣掉四樓的話是「十九層樓」的高度,地上十九層加上地下四層共「二十三層樓」,不是「二十四層樓」。 • 記者,請加油,好嗎?

  5. 數據的產生 • 在第二次世界大戰的時候,聯軍請美國哥倫比亞大學的統計學家沃爾德(Abraham Wald)協助改善機體,因為當時的飛機只能部份加強機體。而沃爾德教授在統計了許多飛機後,發現飛機最容易中彈的是機翼,而最少被擊中的是飛行員的座艙跟機尾。後來他的報告出來後,作戰指揮官說:「根據這份報告,我們應該加強機翼的裝甲。」,但是沃爾德卻持相反的意見:「我所分析的樣本只有順利返回基地的飛機。從統計的觀點來看,我認為機翼被擊中的飛機,似乎還是能安全返航。而飛行員座艙跟機尾中彈少的原因是因為一中彈就很難安全返航。」於是兩派意見堅持不下,後來皇家空軍採用沃爾德的建議,結果真的大大降低飛機被擊落的比例。後來英國軍方用敵後工作人員,蒐集了部份墜毀在德國境內的聯軍飛軍,發現大部份都是在駕駛艙跟機尾中彈。

  6. 數據的產生 • Call in 節目 • 支持馬英九還是謝長廷? • 相信TVBS還是三立的民調? • 某些新聞台/電台的特定族群比重太重、某些族群的比重太輕 • 問卷回覆 • XX家庭問題的專欄作家詢問讀者:「如果可以重來一次,妳還要生小孩嗎?」 • 近千份的讀者回覆信中,接近70%都說:「不要」 • 70%的父母都後悔有了小孩嗎? • 自發性回應樣本 / 方便樣本 →特定族群且對議題有強烈感覺的人 →高度偏差的樣本 • 對於整個人口來說,這些人並不構成具有代表性的樣本。

  7. 菜英文 • 台灣英文落後 日本、韓國、 泰國、越南; 贏過中國大陸。

  8. 菜英文 • 台灣英文輸給 中國大陸、 韓國、香港; 贏了日本、蒙古 、北韓、越南等國

  9. 菜英文 • 托福與IELTS都是自願受測的考試 • 用自願受測的成績推論各國英文能力高低,至少需要知道各國參加測驗的人數,佔該國人口的比例,考試族群為何,是否為英語系國家,這樣才具有可比較性。 • 2005年9月至2006年12月之間,台灣參加托福考試的人數有10022人,占25-29歲人口的0.5048%,受測比例排名第二,僅低於南韓。 • 平均分數排名第一且英語為第一語言的新加坡,受測者只有144人,只佔25-29人口的0.0420%,比例上不到台灣的十分之一。 • 托福平均分數前20名的國家中,13個國家的受測者人數都在千人以下,表中的28個國家中,有22個國家的受測人數佔人口比例低於0.1%。 • 很多國家可能只有菁英能留學,只有菁英才會去考托福;台灣是很多大學硬性要求要考托福,所以平均成績會比只有極少數人能出國的國家差。 • 大學生變多之後,大學生的「平均分數」會下降,英文程度相同的兩個國家,考托福人數較多的國家,平均分數也有可能會比較低。

  10. 菜英文 • IELTS平均分數與應考比例趨勢圖。 • 左高右低的趨勢線顯示:應考比例越高、平均分數越低 • 位於趨勢線上方,離趨勢線越遠,代表英文越強,反之則越弱。 • 觀察到,趨勢線上方幾乎是被英美殖民過的國家;下方幾乎為母語非英文的國家。 • 台灣非常靠近趨勢線,台灣的英文能力在母語非英文的國家中贏過日本、阿聯、泰國、越南、尼泊爾跟大陸。 • 測驗的平均成績不能直接代表該國的語言能力

  11. 數據會唬人---百分比不當的使用和比較 • 1995年XX期刊:「美國自從1950年開始,孩童遭到槍殺的人數,每年增加一倍。」 • 哪裡有問題? • 若1950年有一名孩童遭槍殺,則1951年就有兩名孩童遭槍殺,1952年有4名、1953年有8名…至1960年就有1024名遭到槍殺、1965年有32768名,到1980年總數將超過十億人(為當年度美國總人口數的四倍);1995年此文章發表時,當年受害的人數將高達三十五兆人(已超出地球經推算最多能容納的人類數1100億) • 事實上是--- • 1994年,兒童保護基金會:「自從1950年以來,每年美國孩童遭到槍殺的數目,至今已增加了一倍。」 • 這段期間內美國總人口數增加了百分之七十三。

  12. 數據會唬人---容易使人誤解的數據 (百分比) • 幾十年前,約翰霍浦金斯打破傳統,允許女學生進入大學,過不久,傳出此校有33.33%的女學生與教授結婚。 • 事實上是:當年僅有三位女生註冊,其中一位與教授結婚。 • 某小鎮殺人案件比去年增加 60% • 事實上是:去年殺人案件為五件、今年增加到八件---60%的增加 • 為何造成誤解?比較的基準選擇不當! • 面對過度簡化的數據 →數據如何製造?

  13. 數據會唬人---容易使人誤解的數據 (百分比) • 誰製造了統計數字? • 統計數字的製造目的為何? • 統計數字的製造過程為何? • 以兒童保護基金會的統計數字為例: • 數字的來源為何?是誰在計算孩童的槍殺死亡人數?如何計算?「孩童」的定義為何?「槍殺死亡」指的又是什麼?自殺?意外?他殺? • 如果討論的只有受害的孩童,精確的統計應該控制兩個年度相對的孩童人數。同時,也要確定計算孩童遭到槍殺人數的方式,此外,也要確定在兩個時間點統計方式是否相同。

  14. 數據會唬人---容易使人誤解的數據 (平均) • XX職業籃球隊12位球員的平均年薪為六十萬美元。 五位球員的年薪是二十萬美元, 六位球員年薪是五十萬美元, 一位超級巨星是三百二十萬美元。 • 中位數:五十萬美元。 (一半的觀測值比中位數小、另一半比中位數大) • 眾數:五十萬美元 (觀測值中出現最頻繁的數字)

  15. 數據會唬人---容易使人誤解的數據 (平均) • 某公司宣稱:「生產部門員工每小時平均薪資為225元」 • 事實上是:平常上班每小時150元、加班每小時225元,假日加班 每小時300元,平均工資每小時為:(150+225+300) ÷ 3=225 • 平常加班、假日加班的時數和正常上班的時數不一樣多,可以這樣算嗎? • 公司裡的一位主管和兩位員工,同時各調薪5%、10%和15%,所以這一次調薪的平均為: (5+10+15) ÷3=10 (%),對嗎? • 事實上是:這三人的薪水各為100000, 20000, 和10000 (合計130000元),加薪後成為105000, 22000, 11500 (合計138500元),所以調薪幅度應為: [(138500-130000) ÷130000] ×100% = 6.5% • 計算平均數時,需還原成實際數字再計算。

  16. 奇怪的數據 • Journal of Experimental Medicine 醫學實驗期刊 有六組老鼠,每組老鼠各20隻,實驗成功的比率為: • 奇怪在哪裡? • 數據與常理是否一致? • 過份精確?太有規律? → 偽造的數據

  17. 容易使人誤解的統計圖表

  18. 容易使人誤解的統計圖表

  19. 容易使人誤解的統計圖表

  20. 容易使人誤解的統計圖表

  21. 因果推論 • 2004年「美國臨床營養期刊」指出:一個人若每天喝超過一杯以上的咖啡,則罹患心臟病的機會,將會比別人高許多。 • 事實上是:研究人員找來近3000名身體健康、且沒有心血管疾病的成人,讓他們填寫問卷,看他們每天喝多少咖啡,同時抽取血液樣本,查看其發炎因子含量的高低」 • 根據目前的研究已知:當發炎因子多的時候,體內的血液循環系統會有問題。 • 因此推論:咖啡喝得越多、對心臟越不好。 • 邏輯上的問題 • 咖啡喝得多,血液中發炎因子含量高,兩者呈現正相關。 • 咖啡喝多「導致」發炎因子含量偏高? • 會不會是咖啡喝多的人,有某些共同的特質,如:熬夜、加班、壓力大、飲食睡眠不正常,而導致發炎因子偏高?

  22. 因果推論 • 經由蒐集資料發現:一個國家電視機的數目,和這個國家人民的平均壽命有關;電視機多的國家,平均壽命越高。 • 電視機的多寡和平均壽命的長短,存在正相關。 • 電視機多,所以「使得」人民的平均壽命變高? • 很有可能是:一個國家有錢,所以電視機多,因此人民生活品質好,醫療進步,因此容易長命。

  23. M型社會 • 商業週刊第986期封面故事:M型社會來了— 2006.10.16 「歡迎來到新世界!」這是日本趨勢專家大前研一最近送給台灣人的一句話;你別再以為,只要咬牙忍一忍,好日子還會回來,你可能已經從中產階級淪落到「下層社會」而不自知

  24. M型社會 • 代表富裕與安定的中產階級,目前正快速消失中,其中大部分向下沈淪為中、下階級,導致各國人口的生活方式,從倒U型轉變為M型社會。 大前研一斷言: 「台灣社會已經出現日本當初的徵兆,成為M型社會!」

  25. M型社會 • 所謂的M型社會,指的是在全球化的趨勢下,富者在數位世界中,大賺全世界的錢,財富快速攀升;另一方面,隨著資源重新分配,中產階級因失去競爭力,而淪落到中下階層,整個社會的財富分配,在中間這塊,忽然有了很大的缺口,跟「M」的字型一樣,整個世界分成了三塊,左邊的窮人變多,右邊的富人也變多,但是中間這塊,就忽然陷下去,然後不見了。 —摘自商業週刊

  26. 哪有什麼都是M型 • M是一個分佈 • 「M型」的分布代表資料已經違反了「常態分布」的兩邊較低、中間高的山形,成為異常的M型。 • M型社會指的不是單純的貧富差異,而是「中產階級的消失」,因此,只要「中間的族群還是一大塊」,則不具備M型分佈的基本要件。 • 「M型」不等於「不均」,M型應該是「不均」的「極端化」 • 找到兩個極端值≠M型;常態分配下的極端值≠M型 • 光是極端現象,是呈現不出「M型」的分佈狀態,

  27. M型社會?M型新聞產生器! • 治攝護腺肥大也M型化 有人用雷射 有人導尿DIY  【自由時報╱記者徐夏蓮/台中報導】 2008-10-03 06:00 銀髮族也嚴重「M型化」!一樣是攝護腺肥大、尿不出來,有人採用自費需16萬元的綠光雷射治療,導尿管只要插置半天或隔天就可移除,順利自行排尿;但是也有修腳踏車師傅竟然就地取材、拿根管子當導尿管,自己導尿DIY,奇怪的是,竟也導尿成功,連醫師都喊:「佩服!」 不過這名修車師傅後來也不堪長期自行導尿之苦而就醫治療。 中國醫藥大學附設醫院泌尿部主任張兆祥昨天指出,該院2年前引進綠光雷射,迄今已有一百廿多例採用,從中也可看出現今社會呈現M型化,在銀髮族間尤甚。 張兆祥醫師也曾診治一名攝護腺肥大的修理腳踏車老師傅,抱怨常常尿不出來,以致得導尿。他都是就地取材自己DIY,用的導尿管竟是修理腳踏車常用來打氣的小管子,並沒人幫他,長期下來也很吃不消,決定接受健保有給付的經尿道攝護腺刮除術治療。 不過這也是張兆祥醫師見過的唯一特例。

  28. M型社會?M型新聞產生器! • 化妝品搞M型 愈貴賣愈好 【聯合報╱記者徐文玲/台北報導】2008.10.07 04:02 am 經濟不景氣,化妝品的M型化越來越明顯,金字塔頂端的貴婦品牌或系列,今年一至九月業績較去年同期成長一至兩位數字,相對於衰退的中價位品牌,頂級表現搶眼,嬌蘭、海洋拉娜、la prairie、DARPHIN新品趁勝追擊 。 嬌蘭傳媒經理李凌玲表示,頂級系列從一月至今成長20%、la prairie行銷經理潘逸文也說,品牌今年比去年有近10%成長。推測原因,貴婦較不受景氣影響,出手依然大方。

  29. M型社會?M型新聞產生器! • 消費市場M型化 13萬元大衣熱賣 【經濟日報╱記者陳翌函/台北報導】 2008.09.28 02:35 am  台灣消費市場的M型化日趨嚴重,訂購一件MaxMara近13萬元的限量款大衣、一套10幾萬GIEVES & HAWKES的客製化西裝,客人依舊趨之若鶩。 義大利時尚品牌MaxMara的秋冬大衣全球知名,十年前的編號101801的經典款大衣,已銷出15萬件。代理該品牌的華敦國際廣告推廣經理高方莉指出,今年推出編號101 88的限量大衣款,全球限量888件,台灣僅分配到45件,一件售價128,600元。日前才上市銷售,就已賣出一半。

  30. M型社會?M型新聞產生器! • 病房M型化 5星級1晚萬元 【聯合晚報╱記者李樹人、林進修/台北報導 】 2008.10.01 02:59 pm 三軍總醫院的單人病房每人每天需自付差額3500元病房費,雙人病房為1500元,而台北榮民總醫院單人病房費用差不多要三千多元,雙人病床為1800元。至於台大醫院的收費標準較為複雜,最貴的單人房一晚得需自費差額7000元;最便宜的單人房則只要2080元,雙人房則要自費1600元。 最貴的病房則出現在振興醫院,設備媲美五星級飯店的病房一個晚上費用得 要一萬元;台安醫院單人特等病房是6000 元,單人病房4650元,雙人病房是2000元。

  31. 台灣真的那麼M嗎?M在哪裡? • M如何畫出來? • M型社會:所得分佈呈現雙峰型態 • x軸代表有錢的程度,y軸是人數,M型是指窮人跟有錢人很多,中間的人很少,所以會畫出一個M 。 • 有錢的程度如何衡量? • 採用行政院主計處的資料: 「一個家庭的可支配所得」,也就是一家一年扣掉稅收之後的收入 。

  32. 台灣真的那麼M嗎?M在哪裡?

  33. 台灣真的那麼M嗎?M在哪裡? • M如何畫出來? • M型社會:所得分佈呈現雙峰型態 • x軸代表有錢的程度,y軸是人數,M型是指窮人跟有錢人很多,中間的人很少,所以會畫出一個M 。 • 有錢的程度如何衡量? • 採用行政院主計處的資料: 「一個家庭的可支配所得」,也就是一家一年扣掉稅收之後的收入 。 • 收入變多就代表變有錢嗎?不一定,還要看物價。 • 為了去掉物價變動的因素,將年收入除以台灣地區的消費者物價指數,來代表實際的有錢狀況。

  34. 台灣真的那麼M嗎?M在哪裡?

  35. 台灣真的那麼M嗎?M在哪裡? • 大前研一「M型社會」: 縱軸表各所得組別家戶數 佔總戶數百分比, 橫軸表各所得組別。

  36. 台灣真的那麼M嗎?M在哪裡?

  37. 台灣真的那麼M嗎?M在哪裡?

  38. 加工的M型 • 一個班級的成績分布如下:

  39. 加工的M型 • 經由擠壓…

  40. 又見驚聳的推論

  41. 選舉理論 • 假如 15 位同學負責籌辦一場同樂會,因為經費和人力的限制,他們決定只提供一種冰飲。至於要提供哪一種,則有三種意見僵持不下:冰紅茶 (用 T 表示)、啤酒 (用 B 表示) 還是雞尾酒 (用 C 表示)。於是他們決定要用最民主的方式解決紛爭:不記名投票。大家不假思索地舉行了最常見的選舉模式:一人一票、投給自己認為最適當的飲料、以獲得最高票數的飲料獲勝。開票的結果是 T:B:C = 6:5:4,冰紅茶獲勝。 摘自單維彰 [選舉的數學理論]

  42. 選舉理論 • 可是,有人說:「畢竟有 9 個人不喜歡冰紅茶啊」。 • 有人提議說他聽說過另一種投票方法,比較『公平』,那就是所謂的「兩輪制」:把第一輪投票結果中最好的兩名取出來,所有人對這兩個候選飲料再投一次票。如果能夠幫助大家和和氣氣地達成共識,再投一次票也無妨,於是他們就做了。第二輪的投票結果,竟然就是 B:T = 9:6,啤酒獲勝。 • 這樣的結果真的解決歧見了嗎? • 喜歡喝茶的人一票也沒有動搖,但是那些失去了雞尾酒選項的人全部改去支持啤酒了 摘自單維彰 [選舉的數學理論]

  43. 選舉理論 • 又有一個人提議,請大家拋棄成見,再來一次。這一次,他提議一個「最科學」的作法:請每個人給每種飲料一個分數,最喜歡的給兩分,次喜歡的給一分,不喜歡的不給分。然後計算每種飲料得到的分數總和,最高分的飲料獲勝。這聽起來畢竟是一個新奇的作法,雖然大家意興闌珊,還是勉強同意了。 • 15 個人很小心地在選票上填寫了分數,計算的結果是 C:B:T = 19:14:12,雞尾酒獲勝。 • 有人哀號「怎麼會三次結果都不一樣?」 摘自單維彰 [選舉的數學理論]

  44. 選舉理論 • 為什麼三次投票得到三種結果?是有人搞鬼嗎?有一些人要和另外一些人作對嗎? • 可能這並不是那 15 個人的錯,而是不同的選舉程序會造成不同的結果。 • 究竟有沒有最『公道』的選舉程序?回答這個問題之前,當然要先討論:什麼叫做『公道』? • 15個同學心目中對於 選擇對象的優先順序

  45. 圍棋的賽制 • 瑞士賽程編排 • 第一場編排方式:1號對2號、3號對4號、以此類推,若遇奇數個人參加比賽,則安排最後一號輪空。 • 第二場以後之各場編排原則: A. 先排最多勝者,以戰績相同者依序由前面號碼往後配對。 B. 已對過的對手不再配對 C. 若遇戰績相同,有一位無法有相同戰績者配對,則需由最前面號碼 中戰績多一敗者排出配對。 D. 不同戰績配對以一次為限。 • 瑞士制成績計算方式: • 主分:勝的場數和 • 主分高者排名在前,主分若相同則依以下之輔分順序排名 • 第一輔分:為所有交戰對手之主分和 • 第二輔分:負的對手之輔分和 • 第三輔分:彼此交戰之成績 • 若第三輔分仍無法排名時,則並列名次,若名次無法並列的話,則加賽快棋或以抽籤方式決定之。

  46. 圍棋的賽制 • 以32人比賽5場為例: 五勝1人、四勝5人、三勝10人、二勝10人、一勝5人、零勝1人 • 若有32人參加比賽,A為參賽者中最強的,B為第二位。 很不幸地,第一場比賽B就遇到A,且B敗北。 第二場B與另一個零勝一敗的對手交戰,B勝。 第三場B與另一個兩勝一負的對手交戰,B勝。 第四場B與另一個三勝一負的對手交戰,B勝。 第五場B與另一個四勝一負的對手交戰,B勝。 • A則是五戰全勝,獲得冠軍。

More Related