200 likes | 542 Views
Explotación de Datos con Programación en SPSS. Elaborado por: Ing. Romy E. Rodríguez Ravines Julio del 2,000. EL SPSS.
E N D
Explotación de Datos con Programación en SPSS Elaborado por: Ing. Romy E. Rodríguez Ravines Julio del 2,000
EL SPSS El SPSS es un paquete estadístico de Análisis de datos con más de 20 años de aplicación en la investigación de las ciencias sociales y económicas. Contiene programas capaces de realizar desde un simple análisis descriptivo hasta diferentes tipos de análisis multivariante de datos, como pueden ser: análisis discriminante, análisis de regresión, cluster, análisis de varianza, etc... También permite analizar series temporales, obtener tablas de frecuencias, realizar gráficos, ...
POR QUE USAR Syntax? • Más opciones: • Uso de una variable más de una vez • Presentación de los totales • Varias tablas en un solo comando • Menor tiempo • Orden y precisión • Conservar y Repetir el trabajo
CASO ILUSTRATIVO Encuesta a 678 hogares y 3189 personas del país Los datos se encuentran en 03 archivos: • Data01.sav: Características Generales del hogar (Ubicación, Miembros, Ingreso, Gasto) • Data02.sav: Características de los miembros (Edad, Estado Civil, Nivel de Educación) • Data03.sav: Otras Características del hogar (Tipo de vivienda, Pared, Piso, Artefactos)
PARTES DEL PROGRAMA • LEER DATOS • Qué tipo de archivo de datos? • Dónde está? • Qué contiene? • Datos etiquetados? • SELECCIONAR Y/O MODIFICAR DATOS • Todos o algunos datos? • Nuevas variables? • Nuevas categorías de variables? • Valores perdidos? • PROCEDIMIENTO ESTADISTICO • Qué procedimiento? • Qué opciones? • GUARDAR DATOS • Conservar los cambios en la data?
EJEMPLO DE PROGRAMA * Este es un ejemplo de Programa Spss. Get file 'C:\Curso\Data01.sav' Var lab Ubigeo Código de Dpto, Prov y Dist Area Area de Residencia. Val lab area '1' Urbana '2' Rural. String dpto(a2). ComputeDpto=substr(ubigeo,1,2). Execute. Var lab Dpto Departamento. Table /Gbase=Cases /Ptotal t1 'Total' t2 'Total' /Table=t1 + Dpto By t2 + area /Statistics cpct( area( f5.1 ) '':area ) /Title 'EJEMPLO 01:' /Caption ')Date'. Save Outfile 'C:\Curso\Ejemplo01.sav' /comp.
REGLAS GENERALES • Se inicia con un comando (p.e.TABLES) • Los subcomandos se separan por / • Todo comando termina en un punto. • Los nombres de las variables se escriben completos • Se pueden usar varias líneas • Los signos igual son opcionales • El punto se utiliza como separador de decimales • Los comentarios comienzan con un asterisco (*) • En muchos casos es necesario EXECUTE.
USO FRECUENTE • VARIABLE LABEL Nombre completo a las variables (120 caracteres) VAR LAB MIEPERHO Número de Miembros INGHOG1D Ingreso Trimestral DOMINI01 Dominio • VALUE LABEL Nombre a los valores de las variables (60 caracteres) VAL LAB ESTRAT01 • Ciudades capitales • Grandes ciudades • Resto urbano • Rural • Resto rural
USO FRECUENTE • RECODE Recodifica una variable. HAY DOS OPCIONES: • Reemplazar valores RECODE domini01 (1,2,3=1) (4,5,6=2)(7=3)(8=4). RECODE hnbi (sysmis =0). EXECUTE. • Crear una nueva variable RECODE estrat01 (1 thru 3=1) (4,5 =2) INTO area. RECODE nbicount (1 thru higest=1) (0=2) into nbi. EXECUTE.
USO FRECUENTE • COMPUTE Calcula variables nuevas Operaciones y funciones COMPUTE gasmali=(gru11hd+gru12hd+gru13hd/3). COMPUTE gasmpc=(gashog2d/(mieperho*3). COMPUTE Lningm=Ln((inghog1d/3)). Execute. Casos seleccionados IF(area=1) urbana=1. IF(percepho>=2) percep=1. EXE. Se debe escribir dos veces IF(mieperho >= 1 & mieperho <= 4) miemb=1. IF(mieperho > 4) miemb =2. EXE.
USO FRECUENTE • SELECT IF Selección permanente de casos USE ALL. FILTER OFF. SELECT IF (p203=1). EXE. • FILTER BY Selección temporal de casos USE ALL. COMPUTE filtro = (p203=1). FILTER BY filtro. EXE.
USO FRECUENTE • SPLIT FILES Divide el archivo de datos en subgrupos que pueden ser analizados simultáneamente. • SORT CASES Reordena los casos en el archivo de datos basado en una o más variables. • AGGREGATE Crea un nuevo archivo con variables calculadas. Puede ser un archivo de hogares a partir de un archivo de personas • MERGE FILES Sirve para juntar dos archivos • RANK CASES Se usa para la formación de deciles, quintiles, etc.
SPSS Tables Creación de tablas sofisticadas, de fina presentación. Con más de 35 estadísticos capaces de ser incluidos en estas tablas. Que permite hacer? • Utilizar más de 35 estadísticos para celdas y resúmenes. • Presentar datos de respuestas múltiples efectivamente: calcula porcentajes sobre respondentes o respuestas para interpretación y análisis mas sencillo • Manejar los valores perdidos (missing values) y cambiar sus etiquetas y formatos
Ejemplo de SPSS Tables Syntax TABLES /GBASE=CASES /FTOTAL= t2 "Total" t1 "Total" /TABLE=estrat01 + t2 BY nbicount + t1. TABLES /GBASE=CASES /pTOTAL= t2 "Total" t1 "Total" /TABLE= t2 + estrat01 BY t2 + nbicount /STATISTICS cpct(nbicount(f5.1) '':estrat01) /TITLE 'Ejemplo 01 ' + ' )DATE'.
TIPOS DE SUBCOMANDOS Subcomando Descripción AUTOLABEL Crea etiquetas para todas las tablas BASE Determina la base de los porcentajes para las variable categóricas FTOTAL, PTOTAL Crea variables para los totales de una tabla GBASE Determina la base de los porcentajes para las variables de respuesta múltiple MDGROUP, MRGROUP Crea variables de respuesta múltiple MISSING Determina el tratamiento de los valores perdidos OBSERVATION Declara las variables que serán “resumidas” al interior de la tabla Subcomandos GLOBALES Subcomandos LOCALES
TIPOS DE VARIABLES • Categorías CATEGORY, default Los valores de esta variable se usan para clasificar la data • Observación OBSERVATION Los valores de esta variable se presentan en el contenido de la tabla a través de estadísticas (media, varianza, etc.) • Respuesta Múltiple MRGROUP: Multiple response Son variables que se crean a partir de variables individuales en la data. • Total al final FTOTAL: Following Total En esta variable se calculan las estadísticas para el total de la fila o columna. Se presenta luego de la variable en estudio. • Total al comienzo PTOTAL: Preceding Total Es similar al anterior, pero se presenta antes de la variable en estudio.
RELACION ENTRE VARIABLES • Dimensiones:BY Se usa para separar las variables o combinaciones de variables según serán asignadas a las dimensiones de la tabla (filas, columnas, capas) Filas BY Columnas BY Capas • Apilar:+ Se usa para presentar dos variables en la misma dimensión de la tabla (una a continuación de la otra) Var1 + Var2 BY Var3 • Anidar: > Se usa para presentar todos los valores de una variable (variable anidada) respecto a cada uno de los valores de otra variable (variable de control) Var1 > Var2 BY Var3 • Combinar Apilar y Anidar: ( ) Se usa para tablas deonde se desea Apilar y Anidar a la vez. (Var1 + Var2) > Var3 BY Var4