640 likes | 886 Views
第二部份 SPSS æ“作程åºèˆ‡æ–¹æ³•. 資料處ç†èˆ‡æ•¸æ“šæŸ¥æ ¸. 閱讀範åœ. 邱皓政著 é‡åŒ–ç ”ç©¶èˆ‡çµ±è¨ˆåˆ†æž Chapter 4 原始資料的電腦化 Chapter 6 SPSS 統計軟體之é‹ç”¨ Chapter 7 資料的æè¿°èˆ‡å‘ˆç¾ é™³æ™¯å ‚è‘— çµ±è¨ˆåˆ†æž SPSS for Windows 入門與應用 SPSS 使用 (Chapter 2~4) è³‡æ–™çš„è½‰æ› (Chapter 7) 資料æè¿°ã€çµ±è¨ˆé‡æ•¸ (Chapter 6 〠8). 1. 原始資料的電腦化. Computerized Raw Data. 課程目標. 了解資料電腦化的一般原則
E N D
第二部份SPSS操作程序與方法 資料處理與數據查核
閱讀範圍 • 邱皓政著 量化研究與統計分析 • Chapter 4 原始資料的電腦化 • Chapter 6 SPSS統計軟體之運用 • Chapter 7 資料的描述與呈現 • 陳景堂著 統計分析SPSS for Windows入門與應用 • SPSS使用(Chapter 2~4) • 資料的轉換 (Chapter 7) • 資料描述、統計量數 (Chapter 6、8)
1. 原始資料的電腦化 Computerized Raw Data
課程目標 • 了解資料電腦化的一般原則 • 了解編碼系統與編碼表的功能與內容 • 了解並能操作文字資料的計量處理 • 了解廢卷處理的概念與程序 • 了解資料輸入的方法與程序 • 了解特殊題型的處理方式
原始資料的電腦化 • 原始資料(raw data): 反應受測者在問卷實際填答情形的資料型態 • 紙本原始資料(raw data on paper) • 電腦化原始資料(computerized raw data) • 編碼或過錄(coding): • 由紙本原始資料轉換成電腦化原始資料的過程 • 編碼與工具發展應同步進行 • 編碼是一套資料處理之模式包含 • 資料架構(framework):資料格式、符號特徵、內容廣度、遺漏處理 • 處理流程(procedure) :資料分類、轉換、合併、刪除
文字資料的編碼與過錄 • 步驟一:依編碼系統進行分類與計量 • 步驟二:以虛擬化變項(dummy variable)方式,進行資料備整 • 虛擬化:資料收集完成後,以人為方式進行資料整理賦予數量符號之過程 • 如將文字轉為數字:將每個類別賦予一個特定數字,如宗教信仰的調查,將天主教賦予1、基督教賦予2、道教賦予3等 • 虛擬化的問題 • 解釋上的困難:數字本身未具有特定數學邏輯與概念意義 • 編碼的繁複性與主觀性 • 分析方法的問題
編碼簿(Codebook) • 目的:記錄資料數量化之所有格式與內容,詳述資料處理步驟。 • 功能 • 提供標準化的作業流程 • 溝通的功能 • 工作憑據的建立與工作記憶的留存 • 內容 • 變項名稱與標籤(說明用) • 變項數值與標籤(說明用) • 遺漏值處理 • SPSS可利用公用程式來確認編碼表
題號順序 遺漏值處理方式 變項的名稱、數值內容與標籤
廢卷處理 • 回收控制與登錄 • 遺漏與補漏處理 • 不良答題型態的處理 • 反應心向的處理
原始資料的電腦處理 • 純文字資料檔(ASCII files) • 視窗環境的資料輸入 • SPSS軟體的使用 • 直接輸入法 • 間接輸入法 • 轉檔功能的使用 • 編輯功能的使用 • 類別變項的加權輸入模式
資料電腦化的處理原則 • 資料輸入以編碼系統為依歸 • 充分的訓練 • 良好的作業環境與流程安排 • 資料保密工作的落實 • 工作記憶的保留
上機練習 1 . SPSS使用練習 (陳景堂著 課本第二章) 2 .資料定義與輸入練習(陳景堂著 課本第三、四章)
特殊題型之處理程序-複選題 • 1. 資料輸入(以個別題目型態輸入) • 2. 定義集群 • 點選統計分析→複選題分析→定義集合 • 定義集內的變數 • 3. 完成虛擬複選題變項 • 4. 次數分配表分析 • 5. 交叉表分析
【例】下列為了解青少年人際網路與影響力之題組【例】下列為了解青少年人際網路與影響力之題組 複選變相矩陣型態資料
複選題分析對話框1 需先行定義集合才會浮現次數分配與交叉表之功能
每個選項只有被選與不選兩種可能,將被選紀錄為1,不選紀錄為 0 複選題分析對話框2
複選題分析:次數分配表結果輸出 反應百分比 人次百分比
特殊題型之處理程序-排序題 • 1. 資料輸入(以個別題目型態輸入) • 2. 定義集群 • 點選統計分析→複選題分析→定義集合 • 定義集內的變數(定義時需依不同的順位進行多次的集內變數定義) • 3. 完成虛擬複選題變項 • 4. 分析:針對不同順位虛擬變數進行次數分配表分析或交叉表分析
【例】下列為了解青少年使用網路工具之偏好排名,為一種排序題【例】下列為了解青少年使用網路工具之偏好排名,為一種排序題 相關對應表格如下:
排序題分析: 次數分配表結果輸出 Group $ Order 1 第一順位
上機練習 1. 複選題練習 2. 特殊題型排序題練習
2. SPSS統計軟體之運用 Usage of the SPSS software
SPSS程式的基本操作流程 • 一、資料定義(data definition) • 使電腦能夠正確的辨認量化的數據,並對於數據賦予正確的意義。 • 變項名稱指定(變項標籤)、變項數值的標籤、變項的格式類型、遺漏值的設定。 • 資料定義必需與編碼表配合,將適當的變項名稱與數據的意義加以標註,並設定適當的遺漏值,方能使後續的資料處理與分析能夠正確有效的進行。
SPSS程式的基本操作流程 • 二、資料轉換(data transformation) • 進行資料分析前的一些校正與轉換的工作 • 如反向題的反向計分,出生年月變項轉變成年齡之新變項的創造。 • 廢卷處理、資料備便、遺漏值的補漏檢查等作業,也是在此一階段進行。SPSS軟體提供的觀察值選擇、重新編組或四則運算等指令,皆能協助轉換工作的進行。 • 一旦轉換完成後,此一資料庫已可稱為乾淨的(clean and clear)的資料。
資料轉換指令 • 量化研究的資料處理包括多種的資料整理的程序,例如COMPUTE、COUNT、 RECODE、 RANK、 SORT、SAMPLE、N等。
四則(邏輯)運算指令COMPUTE • 提供使用者將資料進行各種邏輯運算處理 • 四則運算的表現則依一般數學關係式的模式(先乘除後加減),可配合函數來進行運算。 • 語法為 COMPUTE 新變項=原有變項之四則運算
Recode • RECODE(轉換)指令的用途非常廣,可以將變項的數值進行各種轉換。如反向題轉換、分組類別的調整。 • 語法如下: • RECODE 變項名(舊數值=新數值) • 範例: • RECODE X2 (1=5)(2=4)(4=2)(5=1). 反向題轉換 • RECODE X2 X8 X12 X25 (1=5)(2=4)(4=2)(5=1).(若有多題類似情形時) • RECODE EDU (1=1)(2=2)(3=3)(4=3)(5=4)(6=4).(教育程度重新分組) • VALUE LABELS EDU 1”國小及以下” 2 “國中” 3 “高中職” 4 大學及以上”.
COUNT(計數) • COUNT指令用於計算一組變項當中,重複出現某一個數值的次數,並將此一次數指定為一個新變數的數值。 • 例如,民意調查用十個指標去評估行政院長的施政滿意度,受訪者在十個題目上回答相當不滿意(1)、不滿意(2)、滿意(3)、非常滿意(4),施測完畢之後,每一位受訪者在十題的反應中,出現幾個滿意、幾個不滿意,可以用COUNT指令來計數 • 語法如下 • COUNT 新變項=舊變項名(某數值) • COUNT Y=I1 TO I10 (4) 計算受訪者在十題回答非常滿意的次數,放入新變項Y) • COUNT Z=I1 TO I10 (lowest thru 2) 計算受訪者在十題回答不滿意與非常 不滿意的次數,放入新變項Z) • COUNT MISS=I1 TO I10 (MISSING) 計算受訪者在十題回答遺漏的次數放入MISS新變項)
條件化邏輯指令IF、PROCESS IF、SELECT IF • 在限定特定條件下,來進行新變項的創造 • IF指令為一般性條件指令,只有符合括弧內條件關係的情形下,才會執行後方的四則運算式。 • 語法如下: • IF (條件式) 新變項=邏輯運算 • 範例: • IF ((A+B) LT 100) P=1. (當A+B大於10時,新變項P為1) • IF (SYSMIS(GENDER)) S=0. (當GENDER為遺漏值時,S為0) • IF (CITY=”TPE” AND GROUP=1) K=1. (CITY為字串變項)
PROCESS IF 與 SELECT IF • PROCESS IF 與 SELECT IF則是條件化的條件化指令。也就是在IF條件式的功能下,附加對於IF指令的操作條件。 • PROCESS IF對於資料的限定化處理是暫時性的,SELECT IF對於資料的限定化處理是永久性的。 • 完整的PROCESS IF與SELECT IF指令應包含兩行指令, • 條件式 • 動作式 • 每一筆資料經過PROCESS IF的二行指令處理完成後,才進行其他的指令。 • 語法如下: • PROCESS IF (條件式).
RANK • RANK指令能將某一個變項的數值,產生等級、百分等級、常態分數等類型的分數。 • 語法如下 • RANK 變項 /RANK INTO 新變項名(產生等級變數於新變項) • /NTILES(組數) INTO 新變項名(產生百分等級) • /NORMAL INTO 新變項名(產生常態等級) • /RFRACTION INTO 新變項名 (產生比率等級) • /SAVAGE INTO 新變項名(產生指數分數)
SAMPLE與N • SAMPLE的功能在從資料庫中隨機抽取一定比率的樣本,而N指令則是抽取特定位置的樣本。 • 語法如下: • SAMPLE 百分比. • SAMPLE 樣本數FROM 總筆數 • N n • 範例: • SAMPLE .25. (隨機取用某百分之25之樣本) • SAMPLE 500 FROM 5000 (自總筆數5000當中隨機抽取500筆資料) • N 100 (抽取前100筆資料作為樣本)
上機練習 • 資料的轉換練習(陳景堂課本第七章)
SPSS程式的基本操作流程 • 三、資料分析(data analysis) • 依操作者的指令,進行各種的統計分析或統計圖表的製作。 • 操作者必須具備良好的統計基本知識,才能在數十種統計指令當中選擇適合的統計方法來分析資料。 • 操作者必須能夠閱讀分析之後的報表數據,從不同的指數與指標當,尋求關鍵且正確的數據來作為研究報告撰寫的根據。
3. 資料的呈現與描述 Description and Graphing of the Data
社會科學研究: 資料處理的角色與內容 研究計劃: 方法設計與執行 • 資料分析前置作業流程 工具發展 問卷與編碼表 資料輸入 電腦化原始資料 (.sav) 資料查核 資料轉換 備便資料檔.sav 語法檔.sps (資料定義與轉換) 結果輸出檔 .spo 資料呈現描述 資料的統計分析與報告
資料呈現與描述 • 資料呈現: • 運用次數分配來整理並描繪變數數值分佈情形 • 次數分配表 • 次數分配圖 • 利用統計圖表來表現出數據的特性與分佈情形 • 摘要統計: • 透過描述統計的統計量運算,建立初步的統計指標,作為後續統計分析的基礎。
類別資料的次數分配表 類別資料由於缺乏計量單位數值的種類較少,最適合使用次數分配表
連續資料通常需要先計算全距再決定組數與組距,並定義各組上下限連續資料通常需要先計算全距再決定組數與組距,並定義各組上下限 程度測量的次數分配表 連續變項的次數分配表
類別資料的次數分配圖 長條圖