1 / 48

例題 1 單預測變數之數學熟練度

例題 1 單預測變數之數學熟練度 美國教育測驗服務社 ( Educational Testing Service Study ) 的 America Smallest School: The Family (美國最小的學校:家庭,引用文獻 11.8 )調查了學生的教育成就與其家庭環境的關聯。雖然先前的研究檢驗了教育成就與家庭社經地位(如父母教育、家庭所得、父母職業)之關聯,此研究使用了更多家庭環境的直接指標。明確地說,研究了八年級學生數學上的教育成就與下列五個解釋擴數的關聯: 家長 ( X1 )── 八年級學生與家長同住的比例

marah-paul
Download Presentation

例題 1 單預測變數之數學熟練度

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 例題1 單預測變數之數學熟練度 美國教育測驗服務社(Educational Testing Service Study) 的America Smallest School: The Family(美國最小的學校:家庭,引用文獻11.8)調查了學生的教育成就與其家庭環境的關聯。雖然先前的研究檢驗了教育成就與家庭社經地位(如父母教育、家庭所得、父母職業)之關聯,此研究使用了更多家庭環境的直接指標。明確地說,研究了八年級學生數學上的教育成就與下列五個解釋擴數的關聯: 家長(X1)──八年級學生與家長同住的比例 居家閱讀(X2)──八年級學生在家閱讀三種以上書籍的比例(書、百 科全書、報章雜誌) 閱讀(X3)──八年級學生每天讀書超過十頁的比例 看電視時數(X4)──八年級學生每天看電視超過六小時或以上的比例 缺課(X5)──八年級學生近一個月缺課三天或以上的比例   所示的部分資料(見表11.4)為八年級學生平均數學熟練度(MATHPROF)與家庭環境變數,取自1990在37州、哥倫比亞區、關島及維京群島所做的「國家教育進展評估」。   首先使用迭代再加權最小平方法在穩健迴歸只含有一個預測變數,居家閱讀(X2),這時可見簡單的資料分配圖與配適迴歸函數。

  2. 圖11.5a呈現資料散佈圖與最小平方法和 Lowess 法的配適迴歸線。對大多數州而言,家庭閱讀資源和平均數學熟練度間的關聯是直線的,但有三個點顯然是離群點。哥倫比亞區與維京群島是對數學熟練度 (Y) 離群,而關島似乎是對數學熟練度與可取的閱讀資源 X 離群。圖11.5b由圖11.5a的第一階配適模型而來,顯示殘差對 X 的圖形。此圖顯示明顯有三個 Y離群個案。又由殘差圖知道有六個具較低的閱讀資源水準的州成一群,介於 68 和 73 之間,其平均數學熟練度都在配適的迴歸線上方。這顯示可能第二階多項式模型會合適。   第二階模型(8.2): 將會使用最小平方來配適。回想此模型計算時將預測變數置中 與平方項 ,第二階配適圖形放在此資料的散佈圖上,見圖11.5c。雖然有改善,但配適仍舊不佳:有六個資料點落在第一階模型上方,同時也落在第二階模型上方,迴歸線很明顯受到上方三個離群值的影響。對第二階模型的Cook距離測量見圖11.5d,此圖驗證了關島與維京群島的影響。

  3. 顧及離群個案,我們將穩健配適第二階模型(8.2),採用迭代再加權最小平方法與Huber加權函數(11.44)。在此以個案1(阿拉巴馬)例示其計算。要配適的迴歸模型為第一階模型,以普通最小平方法配適此模型得:顧及離群個案,我們將穩健配適第二階模型(8.2),採用迭代再加權最小平方法與Huber加權函數(11.44)。在此以個案1(阿拉巴馬)例示其計算。要配適的迴歸模型為第一階模型,以普通最小平方法配適此模型得: 阿拉巴馬州的殘差為 e1=-2.4109。此殘差顯示於表11.5中的第一個欄位。這40個殘差的中位數為 median{ei} = 0.7063。故e1- median{ei} = -2.4109- 0.7063 = -3.1172,而絕對離差為∣e1- median{ei} = 3.1172∣。此40個絕對離差之中位數為 故(11.46)的MAD估計量為 因此,阿拉巴馬的尺度調整殘差(11.47)為:

  4. 尺度調整殘差列於表11.5之第二個欄位。因∣u1∣ = .5146 ≦1.345,阿拉巴馬之起始Huber權值為 w1 = 1.0。起始權值列於表11.5第三個欄位。為解釋這些權值,回想普通最小平方法可視為加權最小平方法的特例,其所有個案之權值皆為1。在第三個欄位中注意個案8, 11和36(哥倫比亞區和維京群島)的起始權值縮減幅度很大,而其他有些州也略有縮減。   第一次迭代之加權最小平方程序採用第三個欄位的起始權量,得下列配適的迴歸模型: (11.50) 此配適的迴歸函數與(11.49)採普通最小平方法配適結果有些差異。當曲線項由先前的b22 = 0.06491略改為b22 = 0.06463時,x2的係數由b2 = 1.8327遞減到 b2 = 1.6701。對於較小的X2值,這允許增加估計迴歸函數,且迴歸函數比先前的配適更接近六個值。   第二次迭代是使用表11.5第四個欄位的殘差值,改變它們的比例與求得校正後的Huber加權,以求得第二次迭代的加權最小平方估計值。第八

  5. 次迭代之權量與第七次迭代之權量相比其差異甚小,故此迭代程序於第七次迭代後終止。最後的權量如表11.5第五個欄位所示。注意到在第二次和第七次迭代之間,其權量僅有小幅變化。採用第五個欄位的權量得最後的配適模型: 最後配適值所生成的殘差列於表11.5的第八個欄位。只有第二次迭代與第七次迭代的加權適當地改變,所以殘差在第二次迭代之後的變化僅在某個小範圍內。注意曲線項的係數由 b22 = .06463 改變為 b22 = .08016 。 圖11.5e顯示散佈圖及IRLS第二次配適的迴歸函數,圖11.5f顯示最後迭代的加權指標圖。穩健配適對37州配適地相當不錯,而且比先前迴歸配適那六個案例都來得更合適。最後加權值的圖形見圖11.5f顯示的相當清楚只有三點離群值。    我們結論由圖11.5e顯示穩健配適,可以很清楚看到在州的層級,閱讀資源的可用性可能和其他與數學熟練度有凹向上的關係,當然這並不一定表示有因果關係。閱讀資源可用性可能與其他變數有正向關係,而這些變數導致與數學熟練度有關聯。

  6. 例題二 五個預測變數之數學熟練度 我們可以用敘述透視法探索平均數學熟練度以及五個變數之間的關係。圖11.6a顯示由MINITAB所繪出的散佈矩陣圖以及圖11.6b的相關矩陣圖,散佈矩陣圖亦可顯示Lowess無母數迴歸配適,其中q = .9使用於局部配適位置(定義鄰域的比率)。

  7. 由散佈圖矩陣的第一列可看出數學熟練度和五個解釋變數中每一個都有關,而且有三個明顯的離群點。此三點如11.3 節看到的,即哥倫比亞區、關島及維京群島。由 Lowess 配適結果可看出家長居家閱讀及閱讀有正效應,而缺課有負效應。由於離群點的緣故,看電視時數的 Lowess 配適結果受到扭曲。若忽略離群點,則關聯應是負的。相關矩陣顯示平均數學熟練度和缺課之外的所有解釋變數都有相當強的線性關聯,而缺課的線性關聯強度是中等的。   在圖11.6a 所發現之數學熟練度的關聯必須小心解釋。由散佈圖矩陣的其他部份及因11.6b 的相關矩陣可知解釋變數間互有相關,且有些相當強。另外,有些解釋變數和其他本研究未考慮之重要變數也有相關。例如:雙親都在家的學生百分比和家庭所得有關。

  8. 為了簡化起見,在此只考慮第一階模型,所以我們以普通最小平方法對此資料配適第一階模型。配適結果如下:為了簡化起見,在此只考慮第一階模型,所以我們以普通最小平方法對此資料配適第一階模型。配適結果如下: 除了b5外,迴歸係數的正負號都符合預期。此模型之複判定係數為 R2= .86,表示這些解釋變數和平均數學熟練度有強烈關聯。   表 11.6 呈現配適模型 (11.52) 的一些診斷結果:槓桿值 hii、去點t化殘差ti 及 Cook 距離 Di。我們看到哥倫比亞區、關島、德州及維京群島具槓桿值等於或超過 2 p/n = 12/40 = .30。又看到維京群島對 Y值離群;其去點t化殘差t36 = 5.21超過 Bonferroni 在 α= .05 的臨界值 t (1 - α/2n ;n -p -1) = t (.99938;33) = 3.53。在這些離群個案中,維京群島由 Cook 距離來看顯然具影響力,而哥倫比亞區及關島也有些影響力;F(6, 34)分布的第50百分位數為 .91,而第25百分位數為 .57。   對每一解釋變數及每一交叉乘積項的殘差圖(未列出)顯示無強烈曲線效應或交互作用或離群點之外的誤差變異數不固定等指示訊息。由於解釋變數間相互有相關,這產生是否可用一個較簡單而幾乎和包含所有五個解釋變數描述能力相近之模型的疑問。圖11.7展現 MINITAB 最佳子集迴歸的輸出,每一 X變數個數顯示 R2 最高的兩個模型。我們看到三變數(p = 4 個參數)的兩個最佳模型依 Cp 準則具有相對較小的偏誤並且其 R2和五個變數的模型差不多。

  9. 我們現在探討兩模型中包含居家閱讀、閱讀及看電視時數的模型。由於有離群個案,我們使用 IRLS 穩健迴歸配合Huber 加權函數(11.44)。在八次迭代後其權量改變極小,因此迭代程序在第八次迭代後停止。最後的穩健配適迴歸函數為: 迴歸係數的正負號符合預期。為做比較,列出普通最小平方配適之迴歸函數如下: 注意穩健迴歸導致不再強調 X3(閱讀),而其他係數保持幾乎相同。   為得到穩健迴歸模型 (11.53) 對八年級學生平均數學熟練度與其三個家庭環境變數間關聯描述得如何好的指標,將四十個州依其平均數學熟練分數及依其配適值分別排序。兩組等級間的簡單相關係數,稱為Spearman等級相關係數,得 .945。這指出此三個解釋變數在區分平均數學熟練度很高或很低的州別時有相當好的能力

  10. 此處所展現表11.4數學熟練度資料集的分析,並非毫無遺漏。我們並未探討可能合理可用的其他子集。我們並未考慮各州精確度可能因其資料根據不同大小之樣本而變,也未考慮其他和數學熟練度相關的其他解釋變數如:父母教育及家庭所得。並且,我們分析的是州平均,這可能隱藏對家庭等級變數間關聯的重要觀察力。此處所展現表11.4數學熟練度資料集的分析,並非毫無遺漏。我們並未探討可能合理可用的其他子集。我們並未考慮各州精確度可能因其資料根據不同大小之樣本而變,也未考慮其他和數學熟練度相關的其他解釋變數如:父母教育及家庭所得。並且,我們分析的是州平均,這可能隱藏對家庭等級變數間關聯的重要觀察力。 • 說明 • 穩健迴歸需要對迴歸函數的了解。當迴歸函數不清楚時,無母數迴歸可能 有用。無母數迴歸將在11.4節討論。 • 2. 當利用一次去除一個個案的診斷策略發現有多個離群點時,穩健迴歸可用於辨認離群點。最後權值相對小的個案為離群的。 • 3. 如數學熟練度之例所示,穩健迴歸常有助於確認普通最小平方結果的合理性。若穩健迴歸得到與普通最小平方相似的結果(如殘差相似),即是獲得普通最小平方法不受離群個案過度影響的保證。

  11. 穩健迴歸的一個限制是估計的迴歸係數之精確度評價比普通最小平方法複雜。已有一些大樣本結果(引用文獻11.5),但若有離群值其表現可能並不好。自重抽法(將在11.5節討論)也可用來估計穩健迴歸結果的精確度。穩健迴歸的一個限制是估計的迴歸係數之精確度評價比普通最小平方法複雜。已有一些大樣本結果(引用文獻11.5),但若有離群值其表現可能並不好。自重抽法(將在11.5節討論)也可用來估計穩健迴歸結果的精確度。 • 5. 當Huber、雙平方及其他加權函數是以 (11.47)的尺度調整殘差為依據時,表示其主要目的是降低 Y離群值的影響力。若希望穩健迴歸配適對於在 X 值上離群的個案較敏感,可用(10.20)的 t化殘差或(10.24) 的去點t化殘差取代 (11.47) 的尺度調整殘差。同樣地, 可用(11.46)的MAD取代,以期在計算 t化或去點 t化殘差時有較佳的抵抗性與穩健性。 • 此外,可修訂由加權函數計算出的權量以直接減少 X 槓桿值較大個案之影響力。一個建議是將權量 wi乘以 ,其中 hii 定義於(10.18),是第 i個案的槓桿值。 •   降低對 X 值離群個案之影響力的方法,稱為限制影響迴歸(bounded influence regression)。

  12. 11.4 無母數迴歸:Lowess法與迴歸樹 • Lowess 法 • 距離量數 (11.55) • 加權函數 (11.56) • 局部配適

  13. 例題 我們將對第10章中壽險之例配適一無母數回歸函數。第二組18位經理的部份資料列於表11.7的第一個欄位到第三個欄位。想探討的是壽險保額(Y)和所得(X1)及風險規避性(X2)的關聯。 資料是屬於30至39歲組的經理。因可用個案數不多。局部配適將採(6.1 )的第一階模型。由於相同的理由,定義鄰域的比率定為q=.5;換言之,每一鄰域由半數個案構成。 表11.7 在Xh1=30,Xh2=3處之無母數回歸配適的Lowess計算一壽險案例

  14. 圖11.8 Lowess無母數迴歸之等高線及檢查圖-壽險。

  15. 反應曲面的探索自Xh1= 30, Xh2 = 3 開始。為取得Xh1 = 30, Xh2 = 3 處的局部配適值,需要每一個案對這點的歐氏距離。由於兩預測變數量測單位不同,在計算歐氏距離之前我們將以其樣本標準差做變數標準化。樣本標準差為s1 = 14.739及s2 = 2.3044。對個案一來說,它與Xh1 = 30, Xh2 = 3的歐氏距離如下: 此歐氏距離列於表11.7第四個欄位。在 q = .5之下,以其歐氏距離排序,Xh1 = 30, Xh2 = 3 鄰域距離最遠的是第九個個案,得 dq = 1.653。因 d1 = 3.013 > 1.653,個案一的權值為 w1 = 0。對個案二,其歐氏距離為 d2 = 1.143。由於此值小於1.653,故個案二的權值為: 權值列於表11.7的第五個欄位。

  16. 使用這些權值配適的第一階迴歸函數為: 因此Xh1 = 30, Xh2 = 3處的配適值為:   同樣方式可計算其他 Xh1 及 Xh2 值對應的局部配適值。因11.8a 為配適的反應曲面之等高線圖。此曲面顯然隨X1增加而升高,但X2的效應則較難由等高線圖看出。從表11.8b在X2值是低、中、高三個水準時,Y 對X1 的條件效應圖較易看出X2的效應。圖11.8b的條件效應圖,又稱兩變數檢查圖(two-variable conditioning plots)。注意在每一風險規避(X2)水準,期望的壽險投保額都隨所得(X1)增加而增加。在X2 = 3 及X2 = 6 時反應函數大約呈直線。而X2 = 9 時反應函數左邊下沉的部分,可能是交互作用或受干擾資料及不適當的平滑所致。又由圖11.8b得知,在高所得水準時,期望的壽險投保額當風險規避水準很高時有所增加。

  17. 說明 • 如同簡單迴歸,配適的無母數反應曲面可用於檢驗配適的參數化迴歸模型的適當性。若配適的無母數反應曲面落在 (6.60) 參數化迴歸函數的信賴帶之內,表示無母數配適支持參數化迴歸函數的適當性。 • 2. 引用文獻11.10討論了一個幫助選擇定義鄰域之比率 q的程序。同時作者也描述了如何近似求得 Lowess 無母數複迴歸配適值 的精確度。 • 3. Lowess無母數程序所要求的誤差項為常態分配且變異數固定的假設可用一般方式檢查。要計算殘差,首先對每一個案配適Lowess無母數迴歸函數,然後計算 。這些殘差並不具總和為零的最小平方性質,但可對之檢驗常態性及變異數固定性。殘差也可用來辨認未能以標準診斷程序發現的離群值。 • 4. 引用文獻11.14是有關於Lowess平滑程序之一些優點的討論。

  18. 表11.8 資料集與5區塊迴歸樹之配適-膽固醇。

  19. 圖11.9 配適迴歸樹,殘差圖與迴歸樹圖解法-膽固醇。 • 迴歸樹 • 單預測變數樹:以類固醇為例 • 迴歸樹的生長 • 決定區塊數r

  20. 圖11.10 迴歸樹的生長,以膽固醇為例。

  21. 圖11.11 迴歸樹的生長-兩個預測變數。

  22. 例題 利用迴歸樹來解釋大學入學資料,其資料見附錄C.4。我們配適新生期末 (Y) 的GPA當成ACT入學測驗成績 (X1) 與高中排名 (X2) 的函數,共有705筆資料,由其中隨機選取出 n* = 353 筆資料。圖11.12a 顯示MSPR與區塊數目(端點數)的關係圖。此圖顯示當 r = 5 前,節點增加預測能力也增加,其MSPR = .318 (MSE = .322)。當r > 5,預測能力反應視為區塊數目的增加而消減。MSE 的圖形也包含在內,預期 MSE 隨著迴歸樹的大小做單調遞減,配適迴歸樹的表面見圖11.12b,而且所對應的迴歸樹圖解法見圖11.12c。 殘差對應預測值的圖形見圖11.12d,注意殘差變異數某些出現為常數,而且指示著未來可能不必再做區分。 從本質上比較配適的迴歸樹去使用標準的迴歸方法,有其正面意義。使用一個完全第二階模型所導出函數: 第二階迴歸模型的 MSPR 為 .296,比迴歸樹所得值 ( .318) 稍微好一些。第二階迴歸模型的MSE值 ( .333) 與迴歸樹的MSE值 ( .322) 是相差無幾的。

  23. 上這些預測變數的變異數的分斷相當小。 • 說明 • 區塊數r有時可利用複雜成本準則(cost complexity criterion)的極小化做選擇: • 由兩個部分組成:殘差平方和與附加項 r。參數λ≧ 0決定了迴歸樹的大小與適合度的平衡。大的λ值代表有較小的迴歸樹,注意此準則又稱為不均最小平方法(penalized least squares),在11.2節這也能使用找脊迴歸估計值。不均最小平方法經常與類神經網路連結。一個最佳的λ值一般由篩選資料而得。 • 2. 當反應變數 Y 是質性資料,迴歸樹就經常被使用。例如,在 Xh 預測一個反應數等同決定 Xh 在哪個反應類別。這是分類的問題而且迴歸樹的結果可視為分類樹,詳見引用文獻11.11及11.15。

  24. 11.5 非標準情況精確度計算的矯正策略-自重抽法11.5 非標準情況精確度計算的矯正策略-自重抽法 • 一般程序 • 自重抽之抽樣 (11.57) 這些自重抽Y*值對原始X變數以和最初相同的程序做迴歸而取得自重抽估計 。

  25. 自重抽之信賴區間 (11.58a) (11.58b)  對 的近似   信賴區間: (11.59)

  26. 例題 我們以兩個實例說明自重抽法。第一個例子有標準的解析解,而自重抽法只是在顯示它能獲得相似的結果。第二個例子,其估計程序複雜,自重抽法提供評估其估計值精確度的一個方法。 例題1 Tolica公司 我們以表1.1的 Toluca 公司之例說明自重抽法如何近似標準解析結果。在第2章得到斜率β1 之估計值 b1= 3.5702,其精確度之估計值為s{b1} = .3470,而 β1 的 95% 信賴區間為2.85≦β1≦4.29。   為了求自重抽法求估計值 b1 = 3.5702 的精確度,我們將使用固定 X抽樣。此處簡單線性迴歸函數對資料配適良好,誤差變異數看來是常數,並且考慮一個批量都相同的重複研究是合理的。一部分批量 (X) 與工時 (Y) 的資料重複列於表11.9 的第一個欄位及第二個欄位。原樣本獲得的配適值及殘差由表1.2 取出置於表中第三個欄位及第四個欄位。表11.9的第五個欄位為第一個大小為 n的自重抽殘差樣本 ,由第四個欄位以放還法抽選。最後第六個欄位所示為第一個自重抽樣本 觀測值。例如:由(11.57)得 = 347.98 -19.88 = 328.1。

  27. 表11.9 用固定X抽樣的自重抽法-Toluca公司。

  28. 圖11.13 自重抽估計  的直方圖-Toluca公司。

  29. 當第六個欄位 的值對第一個欄位的諸 X 值是根據簡單線性迴歸模型(2.1)做迴歸時,得 = 3.7564。以同樣方式,另選出999個自重抽樣本並對每一樣本計算 。圖11.13是1,000個自重抽 估計值的直方圖。注意此自重抽的抽樣分配相當對稱且似乎接近常態分配。由圖11.13我們也看到這1,000個估計 的標準差為 s*{ }= .3251,相當接近解析的估計s{b1}= .3470。 為了以自重抽反射法獲得 β1的近似 95% 信賴區間,由圖11.13得自重抽的抽樣分配第 2.5 及第 97.5 百分位數分別為 (.025) = 2.940及 (.975) = 4.211。利用(11.58),得: d1=3.5702-2.940=.630 d2=4.211-3.5702=.641 最後由(11.59)得信賴界限3.5702  .630 = 4.20及3.5702-.641 = 2.93,故β1之一近似95%信賴區間為: 2.93 ≦ β1 ≦4.20 注意上列界限相當靠近解析方法得到的信賴界限2.85與4.29。

  30. 例題二 血壓在表11.1之例,分析者承認誤差變異數不等而採用加權最小平方法,並配適一標準差函數以估計未知權量。分析者用以估計其估計的迴歸係數bw1= .59634 精確度及求得β1 之信賴區間的標準推論程序只是近似的。為檢驗此項近似是否良好,我們將承認權量的不精確性,以自重抽法評量此估計迴歸係數之精確度。因 X 變數(年齡)可能需視為隨機並且誤差變異數隨 X值而變,故將採用隨機 X抽樣。表11.10第一個欄位及第二個欄位重複列出表11.1中年齡 (X) 及舒張血壓 (Y) 原始資料。第三個欄位及第四個欄位為自第一個欄位及第二個欄位以放還法抽出之第一個自重抽樣本的( , )觀測值。以普通最小平方法做Y* 對 X* 的迴歸,得配適的迴歸函數: 此配適函數之殘差列於第五個欄位。以這些殘差絕對值對 X* 做迴歸,得配適的標準差函數為: 配適值 列於第六個欄位。最後,權量 = 1/( )2見第七個欄位所示。例如: = 1/(10.64)2 = .0088。最後將 Y* 對 X*以第七個欄位的權量做迴歸,得自重抽估計 = .838。

  31. 將上述程序重複1,000次,得1,000個自重抽 值,其直方圖如圖 11.14,看來是近似常態分配。此1,000個自重抽值的標準差列於圖 11.14,其值為 s*{ } = .0825。與採用 (11.13) 近似的結果相比:.0825對 .07924,我們發現承認權量是估計的只使此例的估計標準差略增。因此,bw1的變異性和權量中使用估計的變異數並沒有太大的關聯,而標準推論程序提供了一個良好的近似結果。   利用圖11.14的百分位數 (.025) = .4375及 (.975) = .7583,由(11.59)可得β1 的 95% 自重抽信賴區間。近似 95%信賴界限為(由(11.20)知 bw1 = .59634): bw1-d2=.59634-(.7583-.59634)=.4344 bw1+d1=59634+(.59634-.4375)=.7552 故β1之信賴區間為: .434≦ β1≦.755 注意此信賴區間幾乎和原先由標準推論程序得到的(.437≦ β1≦.755)相同。這再度確證此例使用標準推論程序適當,雖然權量是估計的。

  32. 說明 b1(α/2 )≤ b1≤b1(1-α/2) (11.60) 其中b1(α/2)及b1(1-α/2) 表示b1之抽樣分配的第(α/2)100及第(1-α/2)100百分位數。現在將這些百分位數以對抽樣分配平均數E{b1}=β1之距離表示: D1=β1-b1(α/2) D2=b1 (1-α/2)-β1 (11.61) 而得 b1 (α/2) =β1-D1 b1 (1-α/2)=-β1 +D2 (11.62) 將(11.62)代入(11.60)並重新排列不等式,使得β1在中間,則: b1 –D2≤ β1 ≤ b1+D1 將信賴區間(11.59)的D1及D2代之以d1及d2,此亦即用自重抽之抽樣分配百分位數估計b1抽樣分配之百分位數,並以b1為其抽樣分配平均數β1之估計。 在 (11.59) 中d1和信賴上界相關聯而d2和信賴下界相關聯的理由是b1之抽樣分配的第 (1-α/2)100百分位數 確定了β1的 信賴下限。 而其第(α/2)100百 分位數確定了信賴上限。要明白這點,考慮b1的抽樣分配,我們可宣稱b1有1-α的機率落在區間

  33. 11.6 以MNDOT交通估計之案例 • AADT資料庫 • 發展模型

  34. 圖11.19 最後的加權最小平方迴歸配適之殘差圖-MNDOT交通估計。

  35. 加權最小平方估計  為評估此模型在估計AADT的有效性,於是建立了典型鄉村、郊區及都市路段之平均交通量近似95%信賴區間。這些路段的預測變數水準在表11.12第一個欄位至第三個欄位。估計的平均交通量在第四個欄位。在每一種路段估計的平均反應之近似的估計標準差列於第五個欄位,是利用(11.13)的s2{bw}由(6.58)式計算得到: (11.63)  其中向量Xh定義如(6.53)。

More Related