280 likes | 433 Views
第 13 章 資料的編碼與分析. 本章大綱. 前言 資料編碼與輸入 統計假設檢定之基本觀念 基礎資料分析 假設檢定 因素分析 迴歸分析. 前言. 在蒐集完問卷後,研究者必須做適當的問卷品質控制,初步排除一些品質不良的問卷,以減少問卷資料分析結果的誤差。 在問卷品質控制與編碼之後,就是統計資料分析了。資料分析的方法其實非常多,從一般的統計分析到多變量統計分析等都屬之,而其相關應用軟體也非常地多,常見的有 SAS 、 SPSS 、 MINITAB ,以及 EXCEL 等。
E N D
本章大綱 • 前言 • 資料編碼與輸入 • 統計假設檢定之基本觀念 • 基礎資料分析 • 假設檢定 • 因素分析 • 迴歸分析
前言 • 在蒐集完問卷後,研究者必須做適當的問卷品質控制,初步排除一些品質不良的問卷,以減少問卷資料分析結果的誤差。 • 在問卷品質控制與編碼之後,就是統計資料分析了。資料分析的方法其實非常多,從一般的統計分析到多變量統計分析等都屬之,而其相關應用軟體也非常地多,常見的有SAS、SPSS、MINITAB,以及EXCEL等。 • 在行銷實務界,大部份的行銷研究報告都以應用基礎統計方法為主,因為基礎統計方法可以清楚點出資料之間的關係,而且好的基礎統計資料分析往往也能把行銷問題重點分析出來,閱讀報告者也會清楚知道報告內容。 • 在進行資料分析時,應著重在資料意義的真實分析,而不是賣弄研究者統計技巧的高深。
資料編碼與輸入(1/2) • 第一步驟:問卷品質控制 • 在問卷問題回答的邏輯上,必須去檢查是否因為受訪者不用心填答,而導致前後答案矛盾或相互衝突。對於無法重新訪問、難以追蹤或追蹤不到的樣本問卷,則應視為廢卷。 • 第二步驟:問卷編碼 • 是將問卷的填答用數字方式輸入資料頁面,研究者需對每個題項進行編號,若發現有開放性問題(非結構式開放性問題),應該參考所有答案進行內容分析歸類,再做編碼的動作。
資料編碼與輸入(2/2) • 第三步驟:資料的輸入 • 是個garbage-in、garbage-out的問題,若抽樣品質管制的結果發現錯誤百出,便必須重新輸入問卷,否則,就會導致錯誤資料出現,因此,輸入資料的品質管制也很重要,不可輕忽。 • 第四步驟:資料的初探 • 在SPSS中,透過「敘述性統計」、「次數分配表」的指令,可看到各題目受訪者回答的分配、平均數、變異數等,進而大致瞭解受訪者填答題目時,有多少百分比是填答在哪一個答案之中。而這也是資料偵錯的重要步驟。
統計假設檢定之基本觀念(1/5) • 母體與樣本的關係 • 假設檢定是希望透過樣本來推論母體的一種方法。 • 研究者必須確定樣本代表性問題,也就是樣本是否能真正代表所要研究的母體;若樣本不能代表所要研究的母體,則不管樣本數目的多寡,在推估時一定會產生偏誤。 • 許多研究者以為抽樣愈多就愈能夠代表研究的母體,此觀念必須加以澄清;不應只追求樣本的量,在抽樣時,樣本的母體代表性是非常重要的一個觀念。
統計假設檢定之基本觀念(2/5) • 問卷量表尺度與可進行的統計分析 • 因為研究問卷的量表不同,所能進行的統計分析方法也會不一樣。 • 如果要分析變數的問卷量表皆屬於區間(Interval)或比率(Ratio)尺度的話,可以進行一般的有母數統計檢定。 • 要分析變數的問卷量表有任何一方是屬於名目(Nominal)與順序(Ordinal)尺度時,就只能使用無母數的統計檢定去分析。 • 一般而言,在其他情況不變下,有母數的統計方法檢定力比較強,所以,很多行銷研究者在設計問卷時,往往會傾向於使用比率或者區間尺度。
統計假設檢定之基本觀念(3/5) • 顯著性檢定 • 顯著性檢測第一個要決定的α值,也就是顯著水準(型一誤差),一般α值是設定在5個百分點。以統計學單尾t檢定為例,研究者會透過公式來計算樣本的t值是否超過5個百分點的t值臨界點,如果超過α=5%的t值顯著臨界點時表示檢定是顯著,若低於α=5%的t值顯著臨界點時表示不顯著。
統計假設檢定之基本觀念(4/5) • 現今市面上的統計軟體,除了實際計算樣本的t值之外,也會提供估算的p值。p值已經把計算出來的t值轉換成顯著性的百分比了,所以,透過p與α的比較就可以清楚地瞭解檢定是否顯著。使用者只要從報表找出p值的大小就可以馬上確定是否顯著。
統計假設檢定之基本觀念(5/5) • 在假設檢定時,如果假設是有方向性的,比如要去檢測某一個母體之平均值是否顯著大於另一個母體的平均值,便須進行單尾檢定,也就是將α值放在一個單尾之上;但當假設檢定不具方向性,比如要去檢定兩個母體的平均值是否一樣時,則須將α值平分在常態分配的兩邊。
基礎資料分析(1/3) • 平均數的交叉表 • 平均數的交叉表是看某一個變項在不同的群組裡的平均數是否不同。 • 次數分配的交叉表 • 此方法與平均數的交叉表一致,若題目答項是屬於名目尺度或順序尺度,無法算平均數,就使用百分比的次數表。 • 相關分析 • 若資料是區間或比率尺度,研究者也可以運用相關分析來進行初步分析。
基礎資料分析(2/3) • SPSS實例演示 • 新增檔案 • 資料輸入視窗簡介 • 變數檢視畫面 • 定義變數程序: • 輸入名稱 • 設定數值類型 • 註解 • 設定數值 • 設定遺漏值
基礎資料分析(3/3) • 設定欄寬 • 對齊 • 設定量度 • 輸入資料 • 儲存資料 • 統計分析 • 次數分配 • 描述性統計 • 相關 • 交叉分析──卡方檢定
假設檢定 • SPSS實例 • 平均數T檢定 • 單因子變異數
因素分析 • 前言 • 理論基礎 • 因素分析的理論模式 • 是否適合因素分析 • 因素轉軸
因素分析之分類 • 探索性因素分析 • 應用在探索潛在構念上,研究問項與構念間的關係還沒有被完全驗證。 • 驗證性因素分析 • 驗證已經被發展出來的變項是否如同過去研究的因素結構。 • 整體而言,行銷實務應用比較多的是探索性因素分析,而行銷學術論文應用比較多的則是驗證性因素分析。
理論基礎 • 因素分析主要是想透過外顯性的問項(indicator)來找到潛在心理的構面,也就是萃取出潛在構念。 • 其最大的功能在於縮減資料的空間與維度。所以,因素分析是很重要的資料構面刪減的方式。 • 因素分析假設個體在變數上之分數,係由兩個部份組成: • 潛在因素(Common or latent factor) :各變數共有的成分。 • 獨特因素(Unique factor) :各變數獨有的成分。 • 因素分析就是要抽取出此潛在因素。
因素分析的理論模式 Zj=ajF+ajF+ajF+ajF+…+ajmFm+Uj Where Zj:為第j個外顯性變項的標準化分數。 Fi:潛在因素。 m:萃取的潛在因素的數目。 Uj:變項Zj的獨特因素。 aji:因素負荷量,代表第i個潛在因素對j個變項變異量之貢獻。
是否適合因素分析 • 進行因素分析之前,一般皆會進行是否適合因素分析的檢定,而最常用的方法 • KMO(Kaiser-Meyer-Olkin measure of sampling adequacy)法 • Bartlett球形檢定(Sphericity test)
因素轉軸 • 大部份探索性因素分析會做因素轉軸的動作,以使潛在因素在各個變項的負荷量(loading)更加地簡潔。 • 因素轉軸的方法 • 最大變異法(Varimax) • 斜交轉軸(oblique rotations)
迴歸分析(1/3) • 在統計分析中,一項很重要的功能,就是去預測某一些應變數,也就是用自變數或預測變數來解釋一些準則變數或應變數。 • 迴歸的主要目的是做預測,也就是發展一種能以一個或多個預測變數的數值來作為應變數預測的方法;換句話說,就是要找出變數間的關係式。 • 迴歸分析的估計 • 迴歸分析一般會利用OLS (ordinary least squares)來估計迴歸係數。
迴歸分析(2/3) • 迴歸模型的基本假設為: • 應變數與自變數的相關是直線關係 • 誤差變異數維持不變 • 誤差間彼此獨立且為常態分配 • 自變數若相關程度高,有可能有共線性問題,此時,可透過VIF值來測定共線程度的嚴重性。
迴歸分析(3/3) • 自變數的選擇 • 強迫進入法 • 順向法(forward solution) • 逐步法(Stepwise solution) • 殘差項檢驗 • 極端值分析 • Normality與hetroskedasticity • SPSS實例