1 / 154

통계특강 SPSS 교육

통계특강 SPSS 교육. 통계학과 김좌겸. SPSS 소개. SPSS ( Statistical package for the Social Sciences) 는 1968 년 시카고 대학교의 국민여론연구서에서 사회과학자료의 분석을 위하여 개발한 통계 패키지인데 , 그 후 다양한 형태의 자료분석에 적합하도록 확대 개편되었다 .

jerry-cook
Download Presentation

통계특강 SPSS 교육

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 통계특강 SPSS 교육 통계학과 김좌겸

  2. SPSS 소개 • SPSS ( Statistical package for the Social Sciences)는 1968년 시카고 대학교의 국민여론연구서에서 사회과학자료의 분석을 위하여 개발한 통계 패키지인데, 그 후 다양한 형태의 자료분석에 적합하도록 확대 개편되었다. • SPSS의 기능은 크게 자료의 입력(Data Entry), 자료관리(Data Management), 통계분석(statistical Analysis) 그리고 보고서(Report) 작성 등으로 구분할 수 있다. • 여기서는 SPSS의 최신 한글판 버전 17.0을 가지고 SPSS의 사용법과 기초 통계분석방법에 대해 배워보도록 한다.

  3. SPSS 기능

  4. SPSS 기능

  5. 1단계 2단계 3단계 4단계 SPSS로 데이터를 불러들인다. 메뉴로부터 작업을 선택한다. 분석에 사용할 변수들을 선택한다. 결과를 검토한다 SPSS 개요 • [설문지-Stat.sav] • 성별: 1) 남 2) 여 • (성별이 ‘남’인 경우) 군복무를 마쳤습니까? 1) 예 2) 아니오 • 종교: 1) 기독교 2) 불교 3) 천주교 4) 기타종교 5) 종교 없음 • 아버지의 키: ( )Cm • 본인의 키 : ( )Cm • 여성이 결혼 전까지 순결을 지키는 편이 좋다고 생각합니까? • 1) 매우 반대 2) 반대 3) 보통 4) 찬성 5) 매우 찬성

  6. 척도의 종류 • 명목척도(nominal scale)변수 • 위의 조사표에서 항목 1,2,3에 해당되는 변수로서 변수 값이 범주형으로 주어지며 범주간에 서열을 부여 할 수 없다. 또한 명목척도로 측정된 변수에서는 4칙연산이 의미가 없다. • 순서척도(ordinal scale)변수 • 항목 6과 같은 변수로 변수값이 범주형으로 주어지며 범주간에 서열이 있는 변수이다. 교육정도(무학,중졸,고졸,대졸이상),생활정도(대,중,소)와 3점척도, 5점척도, 7점척도로 답하는 변수들이 이에 해당되며 인접한 두 변수 값들의 차이가 일정하지는 않으나 서열이 있다.

  7. 척도의 종류 • 구간척도(interval scale)변수 • 구간척도로 측정된 변수 값은 상호간의 서열뿐 아니라 의미 있는 차이(distance)를 가진다. 즉, 인접한 두 변수 값의 차이가 일정하다. 그러나 기준 값 0이 ‘없음’을 나타내지 않으므로 두 변수 값의 비(ratio)는 의미가 없다. 섭씨 또는 화씨로 측정된 온도는 이 척도에 속한다. • 비율척도(ratio scale)변수 • 항목 4,5의 키는 비율척도로 측정된 변수이다. 기준 값 0이 ‘없음’을 나타내며 변수값 상호간의 서열, 차이, 비율이 의미 있다. 따라서 이 척도로 측정된 변수는 실수의 모든 성질을 만족한다. [참고] 일반적으로 구간척도와 비율척도를 엄격하게 구분하지 않고 합해서 구간,비율척도라고 부른다. 또한 SPSS에서는 구간,비율척도 변수를 간단히 척도변수라고 부른다.

  8. 데이터파일의 작성

  9. 데이터파일의 작성

  10. 데이터파일의 작성 • ‘이름’ 열 • 첫 번째 열 ‘이름’아래에 각 변수의 이름을 입력한다. 변수의 이름은 다음의 규칙을 따라 만들어야 한다. • A. 변수명의 길이는 최대 8자(한글4자)까지 가능, 문자로 시작해야 한다. • B. 첫 글자 이후의 부분에서는 문자,숫자,마침표,부호(@,#,_,$)등을 사용할 수 있다. 그러나 마침표로 끝날 수는 없다. • C. 변수명은 중복될 수 없고 대소문자를 구별하지 않는다. • D. 변수명 안에 공백과 특수문자(!,?,’,* 등)를 사용할 수 없다. • E. 다음의 예약어(reserved keyword)는 변수명으로 사용할 수 없다. • ( ALL, BY, WITH, TO, GE, LE, NE, EQ, GT, LT, NOT, AND, OR) • F. SPSS에서 취급할 수 있는 변수의 수에는 제한이 없다.

  11. 데이터파일의 작성 데이터에 대해 ‘id’, ‘sex’, ‘army’, ‘religion’, ‘fatherh’, ‘myheight’, ‘virgin’을 입력한다. 입력할 때마다 변수에 대한 모든 열의 디폴트 정보가 나타난다. 이 디폴드 정보를 해당셀을 눌러서 수정가능.

  12. 데이터파일의 작성 2. ‘유형’ 이 열의 셀에서는 숫자유형을 선택. 다음 중에서 하나를 선택하고, ‘자리수’ 칸에는 변수가 들어가기에 충분한 컬럼수를 , ‘소수점이하 자리수’ 칸에는 변수의 소수점 이하의 자리수를 입력하고 확인을 누른다.

  13. 데이터파일의 작성

  14. 데이터파일의 작성 3. ‘설명’ 이 열에서는 각 변수의 레이블을 준다. 변수 이름은 8글자까지만 사용할 수 있으나 변수 설명은 최대 256자까지 가능하며 대, 소문자를 구분한다.

  15. 데이터파일의 작성 4. ‘값’ 셀을 눌러서 나타나는 변수값 설명 대화상자에서 변수의 각 범주값에 대한 레이블을 준다. 최대 60자까지 가능하며 대,소문자를 구분한다.

  16. 데이터파일의 작성 4. ‘결측값’ 데이터를 수집하는 과정에서 어떤 관찰 단위에 대해서는 특정한 변수에 대한 정보가 없거나 관측하지 못하는 경우가 발생할 수가 있다. 이러한 경우 공백으로 두면 SPSS는 시스템 결측치로 간주한다. 그러나 사용자가 해당되는 변수의 값에 별도의 코드를 부여하여 그 값이 결측(missing)되어 있음을 나타낼 수도 있다. 이를 사용자에 의해 정의된 결측치(user-define missing value)라고 하며 그 값을 ‘결측값’칸에 입력하여 정의한다.

  17. 데이터파일의 작성 4. ‘열’ ‘데이터보기’ 시트에서 보이는 각 변수의 폭(컬럼수). 숫자인 경우 디폴트 값은 8. 5. ‘맞춤’ 왼쪽, 오른쪽, 가운데 맞춤이 있다. 디폴트 설정은 숫자는 오른쪽, 문자열은 왼쪽 맞춤. ‘측도’ 각 변수의 측정척도를 설정한다. 척도(구간이나 비율척도인 경우), 순서(순서척도), 명목(명목척도) 중 해당되는 하나를 선택한다. ‘id’, ‘sex’, ‘army’, ’religion’변수는 명목, ‘fatherh’, ’myheight’는 척도, ‘virgin’변수는 순서를 선택.

  18. 데이터파일의 작성 ‘데이터보기’ 탭을 눌러 확인하면 변수이름으로 변경되어 있는 것을 볼 수 있다.

  19. 데이터파일의 불러오기 • SPSS프로그램에 직접 데이터 입력을 하지 않고 아래한글이나 메모장과 같은 • 에디터를 이용하여 자료를 입력하는 방법에 대해 설명하고자 한다. • 자유형식: 구분자(공백, 콤마 등)를 사용하여 변수(항목)들을 구분하여 입력하는 방법이다. 구분자로 변수를 구분하기 때문에 변수들이 고정된 열에 있을 필요가 없다. 이 방법은 주로 데이터 양이 작은 경우에 보다 간편하게 읽기 위해 사용한다. • 고정형식: 구분자를 두지 않고 모두 붙여서 입력하되, 변수(항목)들을 고정된 열에 맞춰서 입력하는 방법이다. 이 방법은 주로 데이터 양이 큰 경우(변수 개수가 많거나 케이스 수가 많은 경우)에 데이터 입력시간을 줄일 수 있어 편리하다.

  20. 데이터파일의 불러오기 자유형식의 경우 (stat.dat) 파일열기 대화상자가 나타나면 파일의 위치를 찾아 파일을 불러온다. 텍스트 가져오기 마법사가 실행되고 총 6단계로 이루어 진다. 파일-열기-데이터

  21. 데이터파일의 불러오기 1단계 [텍스트 파일이 사전 정의된 형식과 일치합니까?]에 디폴트 답 ‘아니오’를 선택된 대로 두고 다음버튼을 눌러 2단계 대화상자를 연다.

  22. 데이터파일의 불러오기 2단계 구분자에 의한 배열을 선택, 변수이름이 파일의 처음에 있습니까?에서 ‘아니오’선택

  23. 데이터파일의 불러오기 3단계 데이터의 첫 번째 케이스가 시작하는 줄(행)과 한 케이스가 한 줄에 입력되어 있는지 여부, 데이터의 일부만 가져올 것인지를 묻는다.

  24. 데이터파일의 불러오기 4단계 사용한 구분자가 무엇인지 나타내고, ‘데이터 미리보기’를 보여준다.

  25. 데이터파일의 불러오기 5단계 변수이름과 데이터 형식을 변경할 수 있다.

  26. 데이터파일의 불러오기 6단계 텍스트데이터를 SPSS로 가져오기 위해 정의한 파일형식을 후에 사용할 수 있도록 저장할 것인지를 묻고, 이 작업을 SPSS명령문 형태로 나타낼지 묻는다.

  27. 데이터파일의 불러오기 2. 고정형식의 경우(stat1.dat) 자유형식과 동일하게 [텍스트 가져오기 마법사 6단계]를 통해서 데이터를 불러온다.

  28. 데이터파일의 불러오기 1단계 [텍스트 파일이 사전 정의된 형식과 일치합니까?]에 디폴트 답 ‘아니오’를 선택된 대로 두고 다음버튼을 눌러 2단계 대화상자를 연다.

  29. 데이터파일의 불러오기 2단계 고정너비로 배열을 선택, 변수이름이 파일의 처음에 있습니까?에서 ‘아니오’선택

  30. 데이터파일의 불러오기 3단계 데이터의 첫 번째 케이스가 시작하는 줄(행)과 한 케이스가 한 줄에 입력되어 있는지 여부, 데이터의 일부만 가져올 것인지를 묻는다.

  31. 데이터파일의 불러오기 4단계 마우스를 통해 직접 변수 구분선을 수직선으로 넣는 작업을 한다.

  32. 데이터파일의 불러오기 5단계 변수이름과 데이터 형식을 변경할 수 있다.

  33. 데이터파일의 불러오기 6단계 텍스트데이터를 SPSS로 가져오기 위해 정의한 파일형식을 후에 사용할 수 있도록 저장할 것인지를 묻고, 이 작업을 SPSS명령문 형태로 나타낼지 묻는다.

  34. 엑셀파일(.xls)의 불러오기 • SPSS는 스프레드시트 데이터를 다음과 같은 방식으로 읽는다. • 행은 케이스이고 열은 변수이다. • 각 변수의 첫 번째 데이터 셀의 유형(숫자, 문자)과 너비가 변수 전체의 유형과 너비를 결정한다. • 숫자변수에서 빈 셀은 결측값으로 변환되고 문자변수에서 빈 셀은 유효한 Blank문자로 취급된다. • 스프레드시트 데이터에서 변수명이 포함되어 있지 않은 경우, SPSS는 변수명으로 알파벳 문자 a,b,c,d …를 붙여준다.

  35. 엑셀파일(.xls)의 불러오기

  36. 엑셀파일(.xls)의 불러오기 파일-열기-데이터 파일형식(.xls)선택. Stat.xls을 읽어 들인다. 엑셀파일에서 첫 행에 변수명이 포함되어 있으므로 ‘데이터 첫 행에서 변수 이름 읽어오기’를 선택한다.

  37. 데이터 변환(변수계산) 변환-변수계산 사용자자 기존의 자료들을 이용하여 새로운 변수를 만들거나 실제 관측값을 다른 값으로 변경하고자 할 때 사용한다.

  38. 데이터 변환(변수계산) • 새로운 변수명을 8자 이내로 만들어 ‘대상 변수’ 난에 입력하고 ‘숫자표현식’ 난에 수식을 입력한다. • 대상 변수가 새로운 변수이면 그 내용이 실행 파일의 데이터에 추가되며, 대상 변수가 기존의 변수이면 해당되는 변수에 대한 내용이 변경된다. • 대상 변수의 유형과 변수 설명은 대상 변수 아래에 있는 유형 및 설명 단추를 선택하여 입력한다. • 산술식에서 사용되는 연산자( +, -, *, /, **) • 산술식에서 사용되는 함수에는 여러 유형이 있으나 많이 사용하는 몇 가지를 살펴보면 다음과 같다.

  39. 데이터 변환(변수계산)

  40. 데이터 변환(실습1) • 실습1 • 다음 ‘아들과 아버지 키의 차이에 대한 변수’‘diff’를 만들어 보자. • 남자인 경우(sex=1)는 diff = myheight – fatherh로 계산하고, • 여자인 경우(sex=2)는 결측치로 둔다. • 2. 다음 ‘아버지 키의 로그변환 값’인 ‘logfath’변수를 만들어 보자 • logfath= log(fatherh)

  41. 데이터 변환(실습1_1)

  42. 데이터 변환(실습1_2)

  43. 데이터 변환(코딩변경) 데이터 값이나 범주를 변경하거나 수정할 수 있다. 몇 개 범주를 합치거나 조합할 때 특히 유용하며 기존 변수 내 값의 코드를 변경하거나 기존 변수 값의 코딩변경으로 새로운 변수를 만들 수 있다. 1. 같은 변수로 코딩변경 ( 변환-같은 변수로 코딩변경 )

  44. 데이터 변환(코딩변경) [참고] 같은 변수로 코딩변경을 하면 데이터 편집기에서 기존변수 값이 사라지기 때문에 이 명령을 실행하기 전에 기존변수 값이 없어져도 괜찮은지 주의할 필요가 있다. 따라서 기존변수를 유지하면서 새로운 변수를 만드는 ‘새로운 변수로 코딩변경’이 일반적으로 사용한다.

  45. 데이터 변환(코딩변경) 2. 새로운 변수로 코딩변경 ( 변환- 다른 변수로 코딩변경 )

  46. 데이터 변환(코딩변경) [참고] 기존값 및 새로운 값 대화상자에서 변경을 원하는 않는 변수값들을 한꺼번에 처리할 수 있다. ‘기존값’에서 ‘0 기타 모든값’을 선택하고, ‘새로운 값’ 에서 ‘0 기존값 복사’를 선택한 후 추가를 선택한다.

  47. 데이터 변환(실습2) • 실습2 • 본인 키(myheight)를 3개의 범주(155이하, 156-165, 166이상)변수로 바꾸기 위해 코딩변경을 해보자. • 2. 성 의식 변수는 5점척도(매우반대, 반대, 보통, 찬성, 매우찬성)로 되어있다. ‘virgin1’로 변수명을 생성하여 3점척도(반대, 보통, 찬성)로 변경해보자. • (단, 변수보기 탭에서 변수값도 수정)

  48. 데이터 변환(실습2_1)

  49. 데이터 변환(실습2_2)

  50. 데이터 변환(결측값 대체) 자료분석에서 결측값(무응답)의 문제가 발생될 경우 결측값을 해당변수의 평균값 등으로 대체할 수 있다. 변환-결측값 대체

More Related