700 likes | 865 Views
統計數量分析幾個重要的觀念. 陳順宇 教授. 1. 常態分佈重要性. 中央極限定理. IQ 成績直方圖. IQ 成績常態分佈圖. 中央極限定理. 2. p 值的意義與應用. 決策的錯誤機率,型 I 誤差. 座標與面積之關係. 3. 抽樣樣本數之決定. (a) 民意調查 (b) 滿意度調查 (c) 實驗設計 (d) 統計檢定. (b) 滿意度問卷調查. 如果是 5 分制的施政滿意度調查, 則問卷資料最大標準差是 當有一半人填最滿意 (5 分 ) , 另一半人填最不滿意 (1 分 ) 時,. 故最大標準差是. 例如 e = 0.1 ,則.
E N D
統計數量分析幾個重要的觀念 陳順宇 教授
1.常態分佈重要性 • 中央極限定理
2. p值的意義與應用 • 決策的錯誤機率,型I誤差
3.抽樣樣本數之決定 • (a)民意調查 • (b)滿意度調查 • (c)實驗設計 • (d)統計檢定
(b)滿意度問卷調查 • 如果是5分制的施政滿意度調查, • 則問卷資料最大標準差是 • 當有一半人填最滿意(5分), • 另一半人填最不滿意(1分)時,
在有限母體的情形下抽樣,所需樣本數n的公式為在有限母體的情形下抽樣,所需樣本數n的公式為
分析方法 • (a)離散對離散:卡方檢定(列聯表)。 • (b)離散對連續:F檢定 (ANOVA)。 • (c)連續對連續:迴歸分析。 • (d)連續對離散:區別分析、羅吉斯迴歸。 • (e)離散、連續對連續:ANCOVA、 • 啞變數。
檢定參數=0, • F檢定、t檢定 • P值小,顯著
適合度檢定 • 資料適合某種分配(如常態分配) • 提出模式是否合適 • 卡方檢定,P值大,不顯著
6.相關與因果關係的差異 • 兩變數間有相關並不一定有因果關係。 • 例如:某人收集過去20年台灣地區 • 每年冰淇淋銷售量與每年犯罪人數, • 結果發現兩者間的相關係數是0.5
偏相關(Partial Correlation) • 收入與血壓的關係 r(x,y)=0.667
相關係數=0, • 不表示兩個變數間是沒有相關的
7.迴歸分析與變異數分析(ANOVA)的差異 • 迴歸分析或變異數分析都是探討因果關係 • 果都是連續型
迴歸分析的因是計量的 • 變異數分析的因是分類的 • 分類的自變數也可以定義啞變數變成 • 連續型資料 • 然後以一般迴歸式對參數做估計
某化學工廠想知道溫度(x)對某化學品產量(y)的影響某化學工廠想知道溫度(x)對某化學品產量(y)的影響 • 溫度有4個水準, • 分別為150oC, 200oC, 250oC, 300oC, • 在每一種溫度下各做三次實驗, • 共得到12筆數據(y值), • 其數據如下表
既然發現產量y受溫度x的影響, • 接著我們想知道兩者之間的關係式如何,設其關係是一次式, • 即做產量y對溫度x的簡單性迴歸
做線性迴歸的適合度檢定 • 適合度檢定(Goodness of fit) • 或稱缺適度檢定(Lack of fit)
教學法 • 假設收集了150位,在三種教學法下的 • 數學成績(x)(學習前)與統計學成績(y) • (學習後)如下: