440 likes | 684 Views
資料讀取中 …. 假帳剋星. 組長:林楷恩 組員:郭泓圻、徐子閎、楊智堯 指導老師:黃國矩 老師. 工作分配表. 林楷恩:撰寫報告、統計資料。 楊智堯:統計資料、製作簡報檔 。 徐子閎:撰寫報告、統計資料 。 郭泓圻:統計資料、製作簡報檔 。. 研究動機. 最近在新聞及報章雜誌上常看到許多政治人物及企業家貪污或報假帳的消息,像是「國務機要費案」、「市長特別費案」、「力霸掏空案」等等,於是並心血來潮的向老師討論「如何求証帳款的真偽」,在老師的協助下我們知道了 Benford law〈 班佛定律〉可以證實,所以我們就以這個為主題加以討論,更深入的認識班佛定律。.
E N D
假帳剋星 組長:林楷恩 組員:郭泓圻、徐子閎、楊智堯 指導老師:黃國矩 老師
工作分配表 林楷恩:撰寫報告、統計資料。 楊智堯:統計資料、製作簡報檔。 徐子閎:撰寫報告、統計資料。 郭泓圻:統計資料、製作簡報檔。
研究動機 最近在新聞及報章雜誌上常看到許多政治人物及企業家貪污或報假帳的消息,像是「國務機要費案」、「市長特別費案」、「力霸掏空案」等等,於是並心血來潮的向老師討論「如何求証帳款的真偽」,在老師的協助下我們知道了Benford law〈班佛定律〉可以證實,所以我們就以這個為主題加以討論,更深入的認識班佛定律。
研究目的 透過數據統計,認識如何運用及證實班佛定律,將這定律用來檢查本校合作社的帳款資料(進貨表和試算表),以達到「假帳剋星」的功用,再用相關的知識來做延伸的資料,並把班佛定律運用於日常生活中雨量與報紙的統計資料,以期望可以減少人為的疏失,導致重要資料蒐集不正確,影響政府與公司的運作。
班佛定律簡介 班佛定律〈Benford‘s Law〉,是關於首位數〈如:15首位數就是1,856首位數就是8,以此類推〉的一種定律,在日常生活中就可發現,你可以隨意拿起一隻尺,隨意量量在你身邊的物品的尺寸,一般而言,我們對隨機抽樣的認知應該是數字1到9的出現機率應該一樣是11%,首位數也是如此,但依照班佛定律,並不是如此,各首位數出現的機率可在下一頁看到,我們會發現各個數字的出現機率不但不相同,將這些機率畫成圖後,還會呈現出一段弧線。
首位數字 出現機率 1 30.1 ﹪ 2 17.6 ﹪ 3 12.5 ﹪ 4 9.7 ﹪ 5 7.9 ﹪ 6 6.7 ﹪ 7 5.8 ﹪ 8 5.1 ﹪ 9 4.6 ﹪ 班佛定律曲線圖
班佛定律的歷史 探討班佛定律的歷史,1881年,天文學家西蒙·紐康伯發現對數表包含以1起首的數那首幾頁較其他頁破爛,便著手研究,是第一個發表這個理論的人,但並沒有具體的證據。1938年,物理學家法蘭克·班佛重新發現這個現象,還通過了檢查許多數據來證實這點。
班佛定律的運用範圍 班佛定律是個神奇的自然現象,但並非所有的數字都符合班佛定律,要符合這個定律,必須要具備下列兩點:1.要為自然出現的數,如雨量,不可以是經過人為的特別排列。2.數字不可以有上限,如金錢的支出與收入,像氣溫就不符合,因為氣溫最高只能到攝氏30幾度,那40以上的數字就統計不到了。 因為符合了這兩點,就會符合班佛定律,所以我們可以用它來幫助我們證實一些數據的真偽。
班佛定律的應用 班佛定律在台灣雖然沒什麼知名度,但在國外是被廣泛使用了,像是美國就常常拿班佛定律來查帳,因為偽造的數字是人為而非自然出現的,所以極少會符合班佛定律,所以只要看是否合乎班佛定律,並可知道帳的真偽。2001年,透過班佛定律,查出美國最大的能源公司---安然〈Enron〉的作假帳醜聞,震驚了全球,也難怪班佛定律會被稱作「假帳剋星」。
研究方法 由於我們是第一次接觸班佛定律,不免抱著懷疑的心態,我們決定去找數據來試試看,於是便從日常生活中尋找,發現報紙是個很好的數據來源,生活中隨處可得,在理論上又會符合班佛定律,我們從報紙中找數據,統計下來,用電腦來繪圖。 而我們覺得只有報紙太少了,想到我們有參與水質監測的活動,想起雨量也會符合班佛定律,便到中央氣象局的雨量統計,把18個主要城市的2006年年雨量的首位數統計下來,繪製成圖。
各地雨量 我們到中央氣象局的網站,把基隆、台北、桃園、新竹、苗栗、台中、彰化、雲林、嘉義、台南、高雄、屏東、台東、花蓮、宜蘭、澎湖、金門、馬祖等18個縣市的雨量抓下來,把它放入Excel中,整理並統計首位數,最後算出比例,與班佛定律應有的曲線一起繪製成圖,來做比較。
報紙 我們蒐集了國語日報96/1/24到96/1/30共7天和聯合報96/1/27到961/29共三天的報紙來做統計,而統計的方式就是一頁一頁的數報紙上的數字,接著把統計完畢的數字打進電腦中,換算各首位數出現的機率,與班佛定律的曲線一起繪製成圖來做比較。
數據與班佛定律對照〈國語日報96/1/24到96/1/30〉數據與班佛定律對照〈國語日報96/1/24到96/1/30〉
合作社 我們得到本校合作社民國93-95年的試算表和進貨表的資料,並分別將資料作成圖表,來加以分析。
結論 我們把統計的資料,加以分析,發現有些數據不符合班佛定律,原因可能如下: 1. 資料筆數過少 2. 人為計算疏失 3. 有心人士造假
未來展望 因為班佛定律是有關數字的首位數,我以我們希望能看看數字的第二位數(例如15第二位數是5)是否也符合班佛定律的曲線,於是我們便找了美國職籃NBA的2006-2007球季(10月到3月)來做,結果如圖。 但由於數據來源不夠多,所以無法認定是否符合班佛定律,所以我們未來的目標,是統計更多的數據,來找出第二位數的規律。
參考文獻 • Lawrence M. Leemis, Bruce W. Schmeiser, and Diane L. • Evans, “Survival Distributions Satisfying Benford’s • Law”,(2000)。 • 2. 黃國矩,「以Benford’s Law探討石門水庫流量數據正 • 確性」,海峽兩岸水利科技研討會論文(2005)。 • 3. 經濟部水利署,(2005),「水文水資源資料管理供 • 應系統」,http://gweb.wra.gov.tw/wrweb/ • 4. 新竹市立育賢國中,「合作社報表資料2004~2006」。 • 5. 國語日報,2007年1月24日~1月30日