1.14k likes | 1.33k Views
測量的三個程序. (1)選擇 可觀察 的「 個體或事物 」(即「 對象 」 (2)以數字或符號代表事件的特性,即 數值系統( numerical system) (3) 依據「 指派規則 」 賦予觀察值一個符號或數字 ,此種「規則」就是 操作型定義 。. 問題. 學習成效的觀察 … 0~10 or 0~100 or A 、 B 、 C 、 D…. 測量程序範例 1. 研究方法課程學習成效 — 考試成績 成績為介於 0~100 之正整數 根據答題正確率給予對等比例分數. 出席人員滿意程度. 觀察對象. 參觀人員性別. 數值係統. (M , F).
E N D
測量的三個程序 • (1)選擇可觀察的「個體或事物」(即「對象」 • (2)以數字或符號代表事件的特性,即數值系統(numerical system) • (3)依據「指派規則」賦予觀察值一個符號或數字,此種「規則」就是操作型定義。 測量
問題 • 學習成效的觀察… • 0~10 or 0~100 or A、B 、 C 、 D… 測量
測量程序範例1 • 研究方法課程學習成效—考試成績 • 成績為介於0~100之正整數 • 根據答題正確率給予對等比例分數 測量
出席人員滿意程度 觀察對象 參觀人員性別 數值係統 (M,F) (1-5) 分派法則 非常滿意5 滿意4 沒意見3 不滿意2 非常不滿意1 若為男性M 若為女性F 測量程序範例2 測量
數值系統可分四大類1 • 1.名目(nominal)資料:此種變數可做「分類」。沒有大小沒有距離。例如性別 • 2.順序(ordinal)資料:此種變數可比大小及前後,但前後距離不等。只有大小沒有距離。例如5>4,但5-4≠1。例如,研究者常用Likert五點計分量表所得數據,可能是1~5分,亦可能是-2~+2分,這種資料屬於順序變數。 測量
數值系統可分四大類2 • 3.區間(interval)資料:具有前兩者的資料特性,且可以比較差距。前後距離相等,但沒有倍數關係,所以沒有絕對的0(有距離,但沒有絕對的零點,例如,時間、溫度…)。例如5-4=1, 但4≠2×2。 • 例如,早上3點到6點經過的時間等於早上4點到7點,但早上6點不為早上3點倍數。 • 比例(ratio)資料:具有前三者的資料特性,且可以做倍數比較。有距離,有絕對的零點。例如,4=2×2。 測量
各種尺度適用的敘述性統計 測量
幾何平均數 vs. 算數平均數1 • 幾何平均數(geometric mean)適用於比例、變動率或對數分配之平均數的求算。 • 若一數列成「等比級數」,則其幾何平均數最具代表性。 • 項數相同的兩群數值,各相對應項之比的幾何平均數等於此兩群數值的幾何平均數之比。 測量
幾何平均數 vs. 算數平均數2 • 例如,某公司近五個月的營業額為3、6、12、24、48百萬元 • 算數平均數=(3+6+12+24+48)/5=18.6 • 幾何平均數=(36122448)1/5=12 測量
所有多變量分析方法 是 是否分成準則變數和預測變數 否 相依方法 獨立方法 多變量分析之分類 測量
相依方法的分類 測量
獨立方法 變數 事物 研究的重點是變數或事物? 相依方法 (因素分析) (多元尺度法) 相似分析 (集群分析) 獨立方法的分類 測量
計量變項與非計量變項可使用的統計(Subhash Sharma,1996)1 • 計量(metric)變項 • 區間尺度 • 比率尺度 • 非計量(nonmetric)變項 • 名目尺度 • 順序尺度 測量
計量變項與非計量變項可使用的統計(Subhash Sharma,1996)2 依變項 自變項 測量
問題 • 學習成效與年齡的關係? • 年齡為開放式問題由受訪者填 vs. 年齡為每十歲一個級距由受訪者勾選 • A班與B班的學習成效是否有差異? • 消費者可支配所得與產品價格的關係? • 不同教育程度在工作滿意度上是否有差異? • 組織氣候與工作滿意度之關係? 測量
測量誤差 • 指「真正差異」以外,任何引起測量分數的差異。測量誤差(誤差分數)的來源有二大類: • 系統性誤差:它會對測量結果產生一致性固定的影響。 • 隨機性誤差:主要是來自受訪者身心狀況(情緒、性格、動機…)、情境因素(噪音、太太在場、趕飛機、太熱…)、及測量試題(內容太長、太難…)的干擾影響 測量
系統性誤差 • 系統性誤差(systemtic errors)只要使用測量工具,它就會產生。系統性誤差對個案間及研究間的影響方式都是「固定」不變的。換言之,對相同情境受訪者或不同情境受訪者的同一位受訪者,均產生同樣的影響。例如:測量儀器偏誤,量表設計偏差… 測量
隨機性誤差 • 每一次以「不同」方式來影響測量工具的使用。 測量
案例 • 本次研究方法考試,因問題太難,全班都不及格…(系統性誤差) • 小花說:「這次小考,我唸的老師都沒出…。」(隨機性誤差) 測量
測量誤差之主要來源1 • 受測者誤差 • 因受測者本身特質(如隨和性)不同、當時個人的情緒好壞,都會導致測量結果的不同。 • 例如:受測者之地位、社群、階級、生理因素、心理因素、不願表示負面意見… 測量
誤差之主要來源2 • 情境因素 • 訪談時任何外力的影響 • 施測者誤差 • 例如,訪談者的解釋、重述、語氣、態度和藹可親、肢體動作、草率的資料處理…等等。 • 量表的使用方式 • 是由訪問員代填,還是受訪者親自填答。 • 資料的分析處理之影響 測量
誤差之主要來源3 • 測量工具誤差 • 測量工具內容:混淆(區別效度不佳)、語意不清(信度不佳)、編排不良(建構效度不佳)…等; • 測量項目不足,未能涵蓋所欲測量的特性(即內容效度不佳)、項目的篩選 • 有沒有引導作答的嫌疑…等等。 測量
測量工具誤差—範例 • 您認為手機的品質是否重要? 不重要 普通 很重要(語意不清) • 繳交學習心得報告,作為研究方法課程之學期成績評定依據…(測量項目) • 老師,您希望上課時教室一遍死寂嗎?(引導) • 律師性格與國家領導…(引導) 測量
測量工具的評量準則 • 效度(validity):該測量工具是否真能測量到我們欲衡量的特性。 • 信度(reliability):該測量工具所衡量的結果是否具有穩定性、一致性。 • 您認為自己的英文程度為:初級、中級、高級 • 敏感度(sensitivity):事物起了變化,該測量工具是否能顯現出差異。 • 實用性(practicality):即考量該測量工具的經濟性、便利性、可解釋性。 測量
與改制前相比,學校的組織氣候變差了。 不同意 大致不同意 不知道 大致同意 同意 與改制前相比,現在同事們較常邀請同事到家裏小聚。 不同意 大致不同意 不知道 大致同意 同意 範例 • 效度:… • 信度:no • 敏感度:no • 實用性:no • 效度:yes • 信度:yes • 敏感度:yes • 實用性:yes 測量
問題 • 教學評量問卷的敏感性 測量
效度的分類―分類一 • 內部效度(internal validity):指測量工具的設計能得出其所欲測量的特質 • 外部效度(external validity):指研究成果概化(generalization)的能力 • 英文成績 vs. 全民英檢 • 新、舊TOEFL考試的外部效度… 測量
範例 • 採用考試評定學生之學習成效 • 內部效度:yes • 外部效度:無法證實 測量
效度的分類―分類二 • 內容效度(content validity):指測量工具內容的適切性 • 例如,律師性格與國家領導 • 效標關聯效度(criterion-related validity):指測量工具的內容具有預測或估計的能力,而其有效程度則依據測量結果與效標的關聯程度而定 • 構念效度(construct validity):指測量工具的內容,能推論或衡量一些抽象的概念或特質的能力 測量
效度的分類―分類三 • 測量效度:反應現實現象的程度 • 例如,學習成效之評定:A、B、C、D區間等第vs. 0~100之正整數 • 設計效度:指研究設計中,變數關係是否如預期的,不受外來變數的影響,可透過控制外生變數來提升該設計效度 • 分析效度:進行統計分析後,所發現的結果是否如預期 • 推論效度:即外部效度 測量
內容效度 • 抽樣(sampling)效度:量表所包含的項目是否能代表母體構念的項目。內容效度的高低,端賴項目(item)取樣代表性之大小而定。 • 表面(face)效度:是指量表項目和形式上,給人的主觀印象,如果該量表從外表來看,似乎確實可適切地測量其欲測的特質或行為,便稱它具有表面效度。 測量
效標關聯效度1 • 又稱實用效度或實証效度,意指這種效度應建立在實証資料之上。效標關聯效度並不涉及構念的問題。依據效標不同,效標關聯效度可分為同時(concurrent)效標及預測(predictive)效標。 • 「效標」是用來顯示測量工具所欲測量(或預測)的特質之獨立量數,以作為檢定效度的參考標準。 測量
範例 • 世新大學資管系畢業生的成就表現… • 效標―大學畢業生平均薪資、資訊軟體系統類碩士生平均薪資… • 本系近三年畢業生平均薪資與效標進行T檢定… 測量
效標關聯效度2 • 同時效標:是指測量工具與效標同時出現。例如,以「口袋中零用錢」(屬測量工具)衡量受訪者的「所得」(屬效標)高低,假如兩者相關很高,則「同時效度」高。又如:心理測驗、星座、血型、行為之人格分析… • 預測效標:指測量工具出現效標之前。例如,民意調查可正確預測選舉結果… 測量
構念效度(建構效度) • 指「量表能測量理論上某概念或特質的程度」,即構念是否能真實反應實際狀況。 • 建構效度有二類:收歛(convergent)效度及區別(discriminant)效度 測量
收歛效度(convergent validity) • 收歛效度是指來自相同構念的這些項目,彼此之間相關性要高。例如,若要衡量相同的東西(筆試、口試),則所得分數(結果)應相同(筆試與口試成績之相關要高) 測量
區別效度(discriminant validity) • 區別效度是指測量工具中描述某一構念的項目與其他構念的相關性. • 將不同的兩個概念進行量測,量測之過程不管是使用相同的方法或是不同的方法,若結果進行相關分析,而其相關程度很低,即代表兩個研究之概念量測之構面具有區別效度。 測量
構念效度之檢定方法 • 收歛效度及區別效度常用的「統計檢定」有三種方法: • (1)相關分析 • (2)因素分析:求量表各項目之因素結構矩陣,再由結構矩陣所表列之因素負荷量大小來判定建構效度好壞。 • (3)多特質多方法(multi-traits multi-methods, MTMM) 測量
多特質多方法 • 用一個「異質的特質」測量工具,以不同方法(例如,自評法 vs. 同伴評分法 vs. 投射測驗驗;調查法 vs. 觀察法…)對同一批樣本進行測驗。 • 此法乃檢定重測信度及建構效度最嚴謹的方法,但因資料蒐集時間冗長,且須受訪者長期配合,故經濟性及便利性較差。 測量
多特質多方法—範例1 • 某研究者以自陳量表、投射測驗、同伴評分三種不同方法,對同一批15名受訪者,分別觀察測量其依賴性、社會性、成就動機三種異質的特質… 測量
多特質多方法—範例2 測量
多特質多方法—範例3 • *代表p<0.05 • 白字為重測信度(r值應最大) • 藍字為收歛效度(不同方法測相同特質,r值應第二大) • 黃字為區別效度(相同方法測不同特質,r值應第三大) • 綠字為不同方法不同特質,r值應最小 測量
效度之檢定順序 • 首先評估有那些項目可作為測量工具之理論基礎(內容效度) • 定義內容母體的項目,再從中抽取具有代表性樣本(建構效度) • 觀察資料回收後,評估測量工具與外在效標(標準測驗)之相關,以衡量該測量工具的經驗(預測)效度 測量
影響效度的因素 • 樣本性質:樣本多樣性、代表性愈高,測量工具效度就愈高。 • 測驗信度:若信度太低,則效度亦低 • 干擾(moderator)變數:它是指存在於測驗所欲測特質及其效標之外,但卻與兩者間具有某種相關程度的變數。例如,年齡層、性別、環境背景…等。 • 範例 • 台北市與高雄市之民眾對政黨偏好之差異. 測量
問題討論 • 數位課程之行銷策略―隨機抽三所大學發放問卷… • 到麥當勞發問卷... • 樣本之代表性? 測量
效度評估摘要 測量
信度1 • 信度(reliability)是指一個測量工具包含「變數誤差」的程度。 • 指測量結果是否具有一致性或穩定性的程度。 • 即在任何一次測量中,觀察值之間呈現之不一致、或是採用相同測量工具,然而對特定單位施測,每次所得結果都不一樣。 • 信度是指測量資料的可靠性,即一個測量工具在測量某持久性心理特質(態度)的「一致性」或「穩定性」 測量
信度2 σ x2- σe2 σt2 σe2 信度= = =1- σx2 σx2 σx2 X:觀察所得分數 t:真實分數 e:誤差分數 測量
「研究方法」之授課老師是位好老師 非常不同意 不同意 沒意見 同意 非常同意 「研究方法」之授課老師會製作教學投影片 未缺課 定期測驗 作業批改無誤… 範例 測量
信度種類1 • 等值性(equivalence):又稱「複本法」,專門為檢定同一測驗中不同複本上分數的一致。 • 複本信度(alternate forms):不同研究者運用同一量表,對不同一批的樣本施測,結果的一致性。 測量