Professional Documents
Culture Documents
Con la colaboracin de los profesores de la asignatura: Juan Botella Ausina Ludgerio Espinosa Gil Manuel Suero Sue
El objetivo de estas prcticas es familiarizar a los alumnos con las herramientas informticas que harn posible la aplicacin de las tcnicas de anlisis de tipo descriptivo que han aprendido en la asignatura Anlisis de datos en Psicologa I. Como se ha podido comprobar en la resolucin de problemas en clase, los clculos a mano e incluso con calculadora son muy costosos cuando se manejan amplias muestras de sujetos. De ah la necesidad de utilizar computadoras que los agilicen y nos permitan la interpretacin de los resultados, que es lo que ms nos interesa. Existen diversos programas informticos que pueden emplearse para analizar datos. Por ejemplo, el SPSS, el SAS, el STATGRAPHICS, el SYSTAT o incluso una hoja de clculo de EXCEL. Se ha seleccionado el programa SPSS porque es uno de los ms conocidos y empleados en la prctica profesional y porque se encuentra disponible en las aulas de informtica de la Facultad. En un primer momento se pretende que el alumno se familiarice con la estructura y las principales funciones que el SPSS ofrece. En el tema 1 trataremos de cubrir este objetivo. No obstante, el verdadero propsito de estas prcticas es que el alumno aprenda a realizar los principales anlisis estudiados en clase mediante el ordenador. En el tema 2 se resumen los anlisis descriptivos con una variable (distribuciones de frecuencias, ndices de tendencia central, de variabilidad, etc.) y en el tema 3 los de dos variables (ndices de asociacin lineal, combinacin lineal de variables y anlisis de regresin lineal). Por ltimo, se pretende que el alumno sepa cmo interpretar los resultados obtenidos a partir del SPSS. Para ello, no es suficiente conocer cmo funciona el programa sino que se precisa una comprensin de los contenidos explicados en clase. Las prcticas consisten en analizar los datos reales correspondientes a 200 candidatos a un puesto de trabajo que respondieron un cuestionario (las 16 variables del cuestionario se describen en el anexo II). A partir de estos datos, realizaremos diferentes anlisis descriptivos y extraeremos conclusiones sobre la muestra. Los datos se incluyen en el anexo III y se proporcionarn en soporte informtico (fichero practica.sav que el alumno habr de descargar de la pgina web de la asignatura y grabarlo en un disquete 3 , que traer a cada clase). En las clases prcticas slo realizaremos un tipo concreto de anlisis, a modo de ejemplo, pero el alumno debe acudir al aula de informtica por su cuenta y experimentar nuevos anlisis con los datos. Con este fin se ha incluido un ejercicio prctico integrado en el anexo IV, que se resuelve con otro fichero diferente (ejercicios.sav que tambin se puede descargar de la pgina web de la asignatura). Para realizar las prcticas es necesario un conocimiento elemental del manejo del ordenador: copiar archivos, disquetes, entorno Windows, entrar y salir de los programas, etc. Debido al amplio tamao de los grupos y las limitaciones de espacio en las aulas de informtica, para impartir las clases prcticas cada grupo de alumnos se desdoblar en dos subgrupos (por ejemplo el grupo 12 se desdoblar en el subgrupo 12A y el 12B). Es importante que cada alumno sepa a qu subgrupo pertenece y dnde y cundo recibir cada clase prctica. En el tabln de anuncios de cada clase se incluir dicha informacin. Asimismo, los alumnos pueden conectarse a la pgina http://www.uam.es/personal_pdi/psicologia/carmenx/practicas.html donde encontrarn dicho listado y toda la informacin relativa a las prcticas (ficheros de datos, ejercicios, etc.). Las prcticas influirn sobre la calificacin final de la asignatura. La parte prctica del examen de Anlisis de datos en Psicologa I (calificada sobre 7 puntos) se puntuar junto a una prctica en la que el alumno/a podr obtener de 0 a 3 puntos. El aprendizaje del SPSS no termina en este curso sino que tendr continuidad en otras asignaturas de segundo curso: Anlisis de datos en Psicologa II e Introduccin a la Psicometra. Asimismo, muchas de las prcticas de otras asignaturas requieren el manejo de datos con el SPSS. Por tanto, todo lo aprendido ser necesario para una comprensin adecuada de stas.
NDICE
Tema 1. Introduccin al SPSS
1.1. Estructura del SPSS ................................................................................................... 1 El editor de datos ....................................................................................................... 1 El visor de resultados ................................................................................................ 2 1.2. Barra de mens y de herramientas ............................................................................. 2 Mens generales ......................................................................................................... 2 Men Analizar ............................................................................................................ 3 Men Ayuda ................................................................................................................ 3 1.3. Cmo manejar archivos de datos ................................................................................ 4 Elaborar archivos nuevos ........................................................................................... 4 Definir variable ........................................................................................................ 4 Guardar ................................................................................................................... 6 Abrir archivos de datos existentes .............................................................................. 6
Tema 2. Anlisis descriptivos con una variable
2.1. Distribuciones de frecuencias .................................................................................... 8 Tablas de frecuencias ................................................................................................. 8 Representaciones grficas ........................................................................................ 10 2.2. Medidas de posicin y de tendencia central ............................................................. 13 Los centiles, los deciles y los cuartiles ..................................................................... 13 Media, mediana y moda ........................................................................................... 13 2.3. Medidas de variacin ................................................................................................ 15 Varianza y desviacin tpica ..................................................................................... 15 Diagramas de cajas ....................................................................................... 16 2.4. Puntuaciones tpicas y escalas derivadas .................................................................. 16 2.5. Asimetra y curtosis .................................................................................................. 19 Ejercicios ......................................................................................................................... 20
Tema 3. Anlisis descriptivos con ms de una variable
3.1. ndices de asociacin lineal ...................................................................................... 21 La matriz de varianzas-covarianzas ......................................................................... 21 La matriz de correlaciones ....................................................................................... 22 3.2. Combinacin lineal de variables .............................................................................. 23 3.3. Anlisis de regresin lineal simple .......................................................................... 25 Diagrama de dispersin ............................................................................................ 25 Ecuacin de regresin .............................................................................................. 26 Bondad de ajuste del modelo .................................................................................... 30 3.4. Anlisis de regresin lineal mltiple ....................................................................... 34 3.5. Distribuciones de frecuencias y representaciones grficas ...................................... 36 Ejercicios ......................................................................................................................... 40
ANEXOS: ANEXO I: Notacin cientfica ......................................................................................... 41 ANEXO II: Cuestionario ................................................................................................... 42 ANEXO III: Datos para las prcticas ................................................................................. 43 ANEXO IV: Ejercicio prctico .......................................................................................... 49
El editor de datos La primera pantalla que aparece al entrar en el SPSS es la ventana del editor de datos, la cual ofrece el siguiente aspecto:
Figura 1.1.
Esta ventana es donde deben encontrarse los datos empleados en el anlisis. Pueden darse varias situaciones, aunque nosotros solo veamos dos: 1. Los datos fueron introducidos previamente; probablemente en una sesin anterior de trabajo y slo es necesario recuperar el archivo. Para ello se selecciona el men Archivo o se pulsa en el icono . 2. Los datos no fueron introducidos previamente y queramos hacerlo. La forma de introducir los datos es muy similar a las tablas de datos que hemos empleado en clase. Como se observa en la figura 1.1., la ventana editor de datos contiene una tabla donde las filas se refieren a los n sujetos u observaciones de la muestra y las columnas a las J variables X1, X2, ..., XJ. El resultado final es una matriz de n sujetos x J variables.
*
Si el icono no est disponible en el Escritorio, pulsar en Inicio -> Programas -> SPSS o buscar su ubicacin con el Explorador de Windows.
El Visor de resultados Una vez se solicite un anlisis con los datos que se encuentran en el editor de datos, los resultados obtenidos se muestran en la ventana visor de resultados, cuyo aspecto es el siguiente:
Pulsar con el botn izdo. del ratn para volver a la ventana Editor de datos
Figura 1.2.
En la parte derecha se muestran los resultados obtenidos (tablas, grficos, etc.) y en la parte izquierda (donde dice Resultados) aparece una lista con los ttulos de los contenidos mostrados en la ventana Visor de resultados.* Si se desea pasar de la ventana de resultados a la de datos se selecciona con el ratn la barra de botones de Windows que aparece sealada en la figura 1.2. en la parte inferior de la pantalla. 1.2. Barra de mens y de herramientas Como se observa en las figuras 1.1. y 1.2., en cada una de las ventanas descritas aparecen dos barras en la parte superior. Por ejemplo, en la ventana Editor de datos su aspecto es el siguiente:**
Barra de mens Barra de herramientas
La barra de la parte superior consta de una serie de mens (Archivo, Edicin, Ver, Datos, etc.). Si se selecciona con el ratn cada una de ellas aparece un men desplegable donde se ofrecen otros submens, cada uno de los cuales tiene a su vez un cuadro de dilogo. Algunos de estos sub-mens (los ms utilizados) pueden definirse en la barra inferior. En lugar de mens, sta consta de una serie de botones cada uno de ellos con un icono dibujado (p.e. : abrir archivo; : guardar archivo; etc.) y se denomina barra de herramientas. Mens generales Entre los mens de la barra de mens se encuentran los que son comunes a todos los programas de tipo Windows: Archivar, Editar, Ver, Ventana, etc. En el SPSS, los que ofrecen mayores diferencias son los mens Datos, Transformar y Analizar, los cuales permiten realizar operaciones con los datos. Dichos mens sern revisados en detalle en los temas 2 y 3.
* **
Para ver ejemplo ir a pginas 9 y 10. Cada ventana tiene su propia barra de mens y de herramientas, aunque son bastante similares.
Figura 1.3.
Decimos que es el men ms importante porque desde aqu es donde indicaremos al SPSS el tipo de anlisis que queremos realizar con los datos. Cada fila (terminada en una punta de flecha: ) ofrece a su vez otros mens, cada uno con su correspondiente cuadro de dilogo que es el lugar donde se especifica el nmero de variables que entran en el anlisis y otra serie de detalles que veremos ms adelante. En estas prcticas slo veremos los mens que se corresponden con las tcnicas estudiadas en la asignatura Anlisis de datos en Psicologa I. En concreto, los mens Estadsticos descriptivos, Correlaciones y Regresin. En las asignaturas troncales de segundo curso: Anlisis de datos en Psicologa II e Introduccin a la Psicometra, se vern muchos otros de los restantes mens. Y en la asignatura optativa Proceso de datos se profundiza mucho ms en el manejo del programa. Men Ayuda Por ltimo, el men que aparece con la expresin ? se refiere a la ayuda que ofrece el programa y que ser muy til en todo momento para el usuario. Puede accederse a l desde la ventana Editor de datos y Visor de resultados y en ambos casos ofrece el siguiente aspecto:
Figura 1.4.
Desde Temas puede escribirse un tipo de anlisis (por ejemplo Frecuencias) y el SPSS muestra una descripcin de sus opciones. Tambin es posible obtener ayuda pulsando el botn derecho del ratn. Por ejemplo, si nos encontramos en el cuadro de dilogo en el que se calculan los estadsticos descriptivos y se quiere saber la definicin de curtosis, basta con seleccionarlo y pulsar el botn derecho del ratn.
3
1.3. Cmo manejar archivos de datos En este apartado aprenderemos a manejar la ventana Editor datos y a leer y almacenar en un archivo los datos necesarios para realizar un anlisis. El objetivo que se persigue es que el alumno aprenda estas operaciones para finalmente saber manejar los datos de la prctica. Los datos de la prctica se corresponden con un cuestionario que fue administrado por un equipo de investigacin en psicologa diferencial a 200 candidatos a un puesto de trabajo en una empresa. Dicho cuestionario consta de 16 preguntas. Cada una de ellas constituye una variable medida en diferentes niveles. Por ejemplo, la primera variable, sexo, est medida a nivel nominal y la cuarta, estatura, a nivel de razn (ver anexo II para una descripcin detallada de cada variable). Aqu trabajaremos con las respuestas correspondientes a una muestra de 200 sujetos. Por tanto, la interpretacin de los anlisis realizados se referir tan solo a esta muestra de sujetos. Los datos empleados aparecen en el anexo III. Puesto que constan de 200 casos y su grabacin sera muy costosa, dichos datos sern facilitados en un archivo (practica.sav) que se puede descargar desde la direccin: http://www.uam.es/personal_pdi/psicologia/carmenx/practicas.html. Es tarea del alumno descargar este archivo, grabarlo en un disquete de 3 y traerlo a cada una de las clases prcticas. Elaborar archivos nuevos Cuando recogemos datos de n sujetos en J variables, lo primero que hay que hacer es introducirlos en el SPSS. Para ello hay que situarse en la ventana Editor de datos de la figura 1.1. Esta ventana contiene una matriz de n sujetos x J variables. Veamos cmo se introducen datos a partir de un ejemplo prctico. Supongamos que tenemos los siguientes datos:
Sujeto 1 2 3 4 5 Sexo 0 1 1 0 0 Inteligencia 101 83 95 89 107 Nivel cultural 2 1 2 1 2 Estrs 4 5 6 4 7
Los datos corresponden a 5 sujetos medidos en cuatro variables: Sexo (0: mujer y 1: varn), nivel cultural (1: bajo y 2: alto), inteligencia y estrs. Por tanto, tenemos que elaborar una matriz de 5 filas por cuatro columnas. Los datos se introducen colocando un sujeto en cada fila y una variable en cada columna. Para ello, simplemente se escriben las puntuaciones correspondientes a cada caso. Para moverse de una celda a otra se pulsan las teclas marcadas con flechas. En nuestro ejemplo, los datos de los 5 primeros sujetos se colocan del siguiente modo:
Aqu se muestra el contenido de la casilla donde est situado el cursor. En este ejemplo en el primer caso para var00001
Una vez introducidos los datos es necesario dar nombre a las variables. Como se observa en la figura superior, el SPSS ha dado por defecto los nombres var00001, var00002, var00003 y var00004. Asimismo, ha escrito los valores numricos con dos decimales. Si se desea cambiar el nombre de una variable y definir sus caractersticas (por ejemplo nivel de medida, etiquetas de valores, formato de columna, definicin de valores perdidos, etc.) hay que pulsar con el ratn en la solapa Vista de variables. A continuacin aparece una ventana que contiene tantas filas como variables haya definidas en el editor de datos:
Figura 1.5.
En cada fila se da la posibilidad de: modificar el nombre de la variable (teniendo en cuenta que no puede tener ms de 8 caracteres de largo) adems de otras propiedades como el tipo (numrico, cadena, etc.), la anchura, el nmero de decimales, la etiqueta, el significado de los valores que admite, los valores perdidos, la alineacin del texto, etc. Basta posicionar el ratn o el cursor en cada casilla y escribir la informacin deseada. En nuestro ejemplo, llamemos a las variables: sexo, intelig, nc, y estres. Algunas de las casillas de la ventana Vista de variables incorporan su propio cuadro de dilogo que se activa al seleccionarlas. Por ejemplo, al pulsar en Valores aparece lo siguiente:
Desde este cuadro de dilogo se puede dar etiqueta a los valores de una variable. Por ejemplo en nc el valor 1 significa nivel cultural bajo y el valor 2, nivel cultural alto. Cada vez que se introduzca la etiqueta de un valor se pulsa la tecla Aadir. Para terminar se pulsa en Aceptar.
Una vez definidas todas las caractersticas de las variables, para volver a visualizar los datos numricos se pincha en la solapa Vista de datos. El resultado para nuestro ejemplo es el siguiente:
Figura 1.6.
Guardar Para guardar la informacin introducida en el editor de datos se selecciona el men Archivo de la barra de herramientas, se elige Guardar y aparece el correspondiente cuadro de dilogo:
Figura 1.7.
El SPSS guarda los archivos de datos con la extensin "sav" por tanto basta con dar un nombre a los datos (ejemplo) y por defecto se grabarn en un archivo con la extensin sav (aqu le hemos llamado: a:\ejemplo.sav). Tambin es posible guardar archivos de resultados. Para ello nos situamos en la ventana Visor de resultados seleccionamos el men 'Guardar' de la figura 1.2. y aparece un cuadro de dilogo idntico al de la figura 1.7. El procedimiento a seguir es exacto al de archivar datos con la nica diferencia de que la extensin de este tipo de archivos es "spo". Por tanto, los archivos SPSS con la extensin sav contienen datos y los de la extensin spo resultados. Veamos ahora cmo se procede en el caso de no tener introducidos los datos de las prcticas. Aqu trabajaremos con un fichero que contiene las respuestas de 200 candidatos a un puesto de trabajo a un cuestionario de 16 preguntas (ver anexo II para una descripcin de cada variable). Por tanto, tenemos las respuestas de 200 sujetos en 16 variables. Para introducirlas en el SPSS hay que situarse en la ventana Editor de datos y elaborar una matriz de 200 filas x 16 columnas. En este caso la ventana Vista de variables tiene 16 filas, una para cada variable considerada.* En cada fila existe la posibilidad de modificar sus caractersticas (nombre, etiqueta, decimales, valores, etc.). El resultado obtenido es igual al de la tabla de datos que se incluye en el anexo III. Abrir archivos de datos existentes Cuando el archivo de datos se encuentra ya introducido en el ordenador o en un disquete, bastar simplemente con abrirlo. Para ello, se selecciona el men Abrir de la figura 1.7. y la unidad donde se encuentra el archivo. En la figura 1.8. aparece el cuadro de dilogo correspondiente a Abrir. Nuestros datos se encuentran grabados en el archivo a:\practica.sav. Para acceder a ellos los seleccionamos y pulsamos en el botn abrir.
*
En este caso las variables son: sexo, edad, peso, estatura, prov, idprov, rama, licen, inteli, compren, orient, extra, respon, emocio, sincer y fumar. 6
El archivo tambin puede abrirse si se selecciona con el ratn y se pulsa dos veces con el botn izquierdo sobre el mismo
Desde aqu puede indicarse el tipo de formato que tiene el archivo que se desea abrir (por ejemplo, si es Excel, sera un archivo con extensin xls)
Figura 1.8.
Una vez completada esta operacin aparecen los datos en el Editor de datos. A continuacin se muestra un ejemplo para los 5 primeros sujetos en las siete primeras variables:*
Figura 1.9.
Siempre que se desee iniciar una sesin con el SPSS en la que se lleve a cabo uno o ms anlisis de datos, es necesario que el archivo donde se encuentran los datos a analizar est abierto en el Editor de datos del SPSS. Como veremos ms adelante, los mens donde se encuentran las diferentes opciones de anlisis no estn activos a no ser que el editor de datos tenga algn tipo de contenido. Para que el SPSS realice algn tipo de anlisis estadstico, no basta con que los datos estn grabados en un archivo, es necesario que dicho archivo est abierto.
*
El SPSS es capaz de leer datos no slo de tipo *.sav (el formato de SPSS) sino tambin de otros formatos, por ejemplo archivos de tipo EXCEL. Para abrir un archivo de tipo EXCEL (por ejemplo, el fichero practica.xls) se selecciona la opcin Tipo de archivos de la figura 1.8 y Excel (*.xls). Sin embargo los ficheros de datos de tipo *.sav slo pueden leerse con el programa SPSS.
Figura 2.1.
Para realizar anlisis descriptivos univariados basta con los tres primeros procedimientos (Frecuencias, Descriptivos y Explorar). A continuacin se presenta una explicacin detallada del cuadro de dilogo correspondiente a cada una de ellos. Para ello, seguiremos el mismo orden de contenidos que el que aparece en el libro de la asignatura. 2.1. Distribuciones de frecuencias Con el SPSS pueden confeccionarse distribuciones de frecuencias para organizar los datos correspondientes a una variable. En este apartado veremos cmo se construyen las tablas de frecuencias y cmo se realizan algunas de las representaciones grficas vistas en clase. Ambas cuestiones se llevan a cabo desde el cuadro de dilogo correspondiente al procedimiento Frecuencias de la figura 2.1. Tablas de frecuencias El cuadro de dilogo Frecuencias ofrece el siguiente aspecto:
Trasladar aqu las variables sobre las que se quiera obtener la distribucin de frecuencias
Figura 2.2.
En el cuadro izquierdo aparece el listado de variables de que consta el archivo de datos que est abierto. El cuadro derecho est vaco pues est esperando a que le indiquemos qu variables queremos analizar. Dichas variables se trasladan de un cuadro a otro mediante el botn . Por defecto, la opcin mostrar tablas de frecuencias est activada pero si no queremos que aparezca puede desactivarse. Veamos un ejemplo con la variable Edad. Para ello hay que trasladarla al cuadro de la derecha de la figura 2.2. y pulsar en el botn Aceptar para que se ejecute la orden. Los resultados obtenidos aparecen en el Visor de resultados:
En esta ventana aparecen los ttulos de los contenidos del visor de resultados. Para movernos de uno a otro basta pulsar con el ratn en el ttulo deseado. En el ejemplo nos encontramos en la tabla titulada Edad (que no se muestra completa).
Figura 2.3.
La tabla de frecuencias tiene el mismo aspecto que las que hemos empleado en clase. En la primera columna aparecen los valores de la variable en sentido ascendente (de 22 a 46); en la segunda ('Frecuencia') sus frecuencias absolutas: ni; en la tercera ('Porcentaje') las frecuencias relativas en porcentaje: Pi; y en la ltima ('Porcentaje acumulado') las relativas acumuladas en porcentaje: Pa. Representaciones grficas Desde el cuadro de dilogo de la figura 2.2. tambin es posible pedir al SPSS que realice tres tipos de grficos para observar las frecuencias de los datos:
Permite confeccionar el grfico con las frecuencias absolutas (ni) o con las relativas (Pi)
Figura 2.4.
Como se observa, se puede obtener un histograma (con el ajuste a la curva normal), un diagrama de barras y un diagrama de sectores (o pictograma). Desde este cuadro de dilogo slo es posible seleccionar uno de los grficos. Si se quisiera obtener los tres hay que repetir la operacin tres veces. Seguimos con el ejemplo de la variable Edad. Vamos a pedir al SPSS que nos muestre los tres tipos de grficos de la distribucin de frecuencias para la edad.* Si pulsamos en continuar volvemos automticamente al men de la figura 2.2.
*
En realidad puesto que la Edad es una variable cuantitativa el grfico ms adecuado es el histograma pero aqu veremos todos a modo de ejemplo.
Para ir de un resultado a otro puede utilizarse la parte izquierda de la pantalla, donde aparece el listado de resultados obtenidos (en el ejemplo: EDAD e Histograma). Situndose con el ratn en cada uno de ellos puede accederse automticamente al resultado correspondiente. En la figura 2.5. se muestra el histograma para la variable edad.*
Para ir de un resultado a otro (por ejemplo a la tabla de frecuencias o al histograma) nos situamos con el ratn en el ttulo correspondiente (en el ejemplo, Histograma).
Figura 2.5.
Edad
22 23 24 25 26 27 28
30
34 33
Frecuencia
20
32 31 30
10
29
0
22 24 26 28 30 32 34 36 38 41 46
Figura 2.6.
Como se observa, no es posible elaborar el grfico de sectores, pues al ser una variable cuantitativa, hay demasiadas categoras. En todas las grficas la mayor parte de los sujetos tienen entre 25 y 30 aos, estando el promedio en 29 aos y la moda en 28. Sin embargo, el 29% de los sujetos superan los 30 aos (Ejercicio: realizar cada uno de los grficos que mejor describa a las variables: sexo, estatura, licen e inteli). Otra de las representaciones que hemos aprendido para reflejar distribuciones de frecuencias es el diagrama de tallo y hojas. Para confeccionarlo se utiliza el men Analizar -> Estadsticos descriptivos -> Explorar (ver figura 2.1.), cuyo cuadro de dilogo es el siguiente:
*
Si de desea cambiar alguna de las opciones puede hacerse pulsando dos veces con el botn izquierdo del ratn y se entra en el editor de grficos desde el que puede cambiarse tanto el aspecto como la disposicin del grfico.
10
Trasladar aqu la variable o variables para las que se desee obtener un anlisis descriptivo (tienen que ser cuantitativas)
Figura 2.7a.
Este cuadro de dilogo ofrece diferentes posibilidades de anlisis de datos. Por el momento nos centraremos tan slo en la que nos interesa, que es elaborar un diagrama de tallo y hojas. Para ello, en primer lugar se seleccionan las variables para las que se desee elaborar este tipo de diagrama y se trasladan al cuadro Dependientes mediante el botn . A continuacin se selecciona el botn de la opcin grficos y aparece el siguiente cuadro de dilogo:
Figura 2.7b.
Veamos un ejemplo con la variable peso. Los resultados obtenidos son los siguientes:
Peso Stem-and-Leaf Plot Frequency Stem 2.00 3 8.00 4 32.00 4 32.00 5 38.00 5 41.00 6 20.00 6 13.00 7 5.00 7 6.00 8 3.00 Extremes Stem width: Each leaf: & . . . . . . . . . .
Tallo (en decenas)
Leaf 99 00112223 55555555555666677777777778999999 00000011111112222222233333334444 55555555566666667777777778888888899999 00000000000000011111122223333333333444444 55556666666677888999 0011333333333 Valores extremos: 3 sujetos pesan 56688 ms de 84 Kg. 023333 (>=85)
10.00 1 case(s)
11
Desde aqu le hemos dicho al SPSS que slo queremos analizar a los varones (sexo = 1). Los restantes casos, las mujeres (sexo = 0), han quedado filtrados, aunque tambin podran haberse eliminado del fichero.
Figura 2.8.
Si activamos las opciones seleccionadas en la figura 2.8 (pulsando en Aceptar, como en cualquier men), ntese que se crea automticamente la variable filter_$ (con etiqueta sexo = 1 (FILTER)).* Mientras esta opcin est activada, todos los anlisis solicitados se referirn tan slo a los varones. Por ejemplo, si se solicita la distribucin de frecuencias para edad, se obtiene lo siguiente:
Edad Frecuencia 5 8 15 8 22 14 11 8 7 6 2 2 1 3 2 1 1 2 1 119 Porcentaje 4.2 6.7 12.6 6.7 18.5 11.8 9.2 6.7 5.9 5.0 1.7 1.7 .8 2.5 1.7 .8 .8 1.7 .8 100.0 Porcentaje vlido 4.2 6.7 12.6 6.7 18.5 11.8 9.2 6.7 5.9 5.0 1.7 1.7 .8 2.5 1.7 .8 .8 1.7 .8 100.0 Porcentaje acumulado 4.2 10.9 23.5 30.3 48.7 60.5 69.7 76.5 82.4 87.4 89.1 90.8 91.6 94.1 95.8 96.6 97.5 99.2 100.0
Vlidos
24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 40 41 42 46 Total
Para quitar el filtro y volver a analizar todos los casos, se puede: 1) volver al men de la figura 2.8 y activar la opcin Seleccionar todos los casos, 2) o bien entrar en la solapa Vista de variables y borrar la nueva variable que se ha creado automticamente (denominada filter_$).
*
Para utilizar ms de un criterio de seleccin (por ejemplo, varones fumadores) se indica: (sexo = 1) & (fumar = 1).
12
2.2. Medidas de posicin y de tendencia central Los estadsticos de posicin y tendencia central para las variables definidas en el editor de datos pueden obtenerse desde diferentes cuadros de dilogo. A continuacin veremos los procedimientos ms empleados para cada una de ellas. Los centiles, los deciles y los cuartiles Los centiles y otros cuantiles pueden obtenerse desde el procedimiento Frecuencias (ver figura 2.2.). En la parte inferior de este cuadro de dilogo hay un botn llamado Estadsticos. Si se selecciona se obtiene el siguiente cuadro de dilogo:
Si se desea obtener los deciles indicar 10 grupos, los cuartiles 4 y los centiles 100
Esta opcin es especfica para los centiles y permite definir el centil (entre 1 y 99) que se desee obtener. Para indicar varios escribir el nmero y pulsar en el botn Aadir sucesivamente.
Figura 2.9.
Desde aqu puede indicarse que se obtengan diferentes tipos de cuantiles: los cuartiles o los percentiles. Se puede indicar el nmero exacto del centil que se desee obtener e irlo aadiendo a la lista inferior. Continuemos con nuestro ejemplo de la variable edad. Si le pedimos que nos d los cuartiles y los centiles 10, 30, 60 y 90 se obtiene lo siguiente:
Estadsticos Edad N Vlidos 200 Perdidos 0 10 25.00 25 27.00 30 27.00 Percentiles 50 29.00 60 29.60 75 31.00 90 34.00
Como se observa, hay un 75% de sujetos que tienen 31 aos o menos y solo el 10% superan los 34 aos de edad. Media, mediana y moda Estos estadsticos pueden obtenerse prcticamente desde cualquier cuadro de dilogo del men Analizar de la figura 2.1. Uno de los ms empleados es el del cuadro de dilogo Frecuencias ya que cuando se elabora una tabla de frecuencias normalmente tambin se desea obtener las medidas de posicin. Para ello se pulsa en el botn Estadsticos del cuadro de dilogo de la figura 2.2. y aparece el cuadro de dilogo de la figura 2.9. Aqu puede seleccionarse las opciones media, mediana y moda y el SPSS calcula estos tres estadsticos para el listado de variables seleccionadas en el cuadro derecho de la figura 2.2. La media que se obtiene se corresponde con la media aritmtica, la mediana con el valor central cuando los datos se ordenan en modo creciente y la
13
moda con el valor que obtiene la frecuencia absoluta mayor. Continuando con el ejemplo para la variable edad los resultados obtenidos son los siguientes:
Estadsticos Edad N Vlidos 200 Perdidos 0 Media 29.35 Mediana 29.00 Moda 28
Para conocer los estadsticos descriptivos de las variables tambin puede seleccionarse el procedimiento Descriptivos de la figura 2.1. Este procedimiento presenta un cuadro de dilogo muy parecido al del procedimiento Frecuencias -> Estadsticos. Ms especficamente:
Figura 2.10.
Para obtener los estadsticos descriptivos, primero se trasladan las variables correspondientes al cuadro variables y ms tarde se pulsa en Opciones:
Figura 2.11.
En este caso, solamente est disponible el estadstico de tendencia central media que, como antes, ofrece la media aritmtica para las variables seleccionadas. Veamos un ejemplo para algunas variables del fichero:
Estadsticos descriptivos N Media Edad 200 29.35 Peso 200 58.2950 Estatura 200 1.6756 N vlido (segn lista) 200
14
2.3. Medidas de variacin Las medidas o estadsticos de variacin se obtienen de forma muy similar y desde los mismos mens y cuadros de dilogo que las de posicin y tendencia central. Las ms empleadas, la varianza y la desviacin tpica, aparecen por defecto en muchos mens del SPSS y en aquellas opciones que se denominan descriptivos sin especificar exactamente a qu se refieren. Varianza y desviacin tpica La varianza y desviacin tpica pueden obtenerse a partir del procedimiento Frecuencias (ver figura 2.2.) en el botn Estadsticos (ver figura 2.9.). Desde aqu puede pedirse que se calcule: la desviacin tpica, la varianza y la amplitud total o rango de las puntuaciones en las variables seleccionadas.
*
Conviene tener en cuenta que el programa SPSS tiene la peculiaridad de que proporciona la cuasivarianza. Es decir, cuando se le pide que nos d la varianza y la desviacin tpica, lo que da exactamente es el resultado de las frmulas:
S'
2 x
(X =
X) 2
n1
S =
' x
(X
X) 2
n 1
Otra forma de proceder para obtener medidas de variacin es desde el men Analizar -> Estadsticos descriptivos -> Descriptivos (ver figura 2.10.) o desde el men Analizar -> Explorar (y el botn Estadsticos) de la figura 2.7. Desde ambos procedimientos se ofrecen exactamente las mismas opciones (desviacin tpica, varianza y amplitud total). Veamos un ejemplo para algunas variables de las prcticas. Desde cualquiera de los cuadros de dilogo sealados se obtienen los siguientes resultados:*
Estadsticos descriptivos Edad Peso Estatura N vlido (segn lista) N 200 200 200 200 Rango 24 53.00 .41 Desv. tp. 3.88 10.3520 8.413E-02 Varianza 15.033 107.164 7.077E-03
Diagramas de cajas El SPSS tambin ofrece la posibilidad de elaborar los grficos que expresan la dispersin de los datos en una variable. En concreto, desde el men Analizar -> Explorar (y el botn Grficos) de la figura 2.7b. puede definirse un diagrama de cajas para una variable. Este tipo de diagramas ofrecen informacin sobre el rango de la variable y los cuartiles. Veamos un ejemplo para la variable estatura:
Ver anexo I para la interpretacin de resultados en notacin cientfica (p.e. desviacin tpica para estatura = 8.413E-02 significa que la desviacin tpica de la variable estatura adopta el valor 0,0841)
15
Estatura
Figura 2.12.
Como se observa en la figura 2.12., la estatura oscila entre 1,52 y 1,93 metros estando la mediana en 1,66 m. y el 75% de los sujetos por debajo de los 1,71 m. Los valores superiores indican valores atpicos en los datos. En este caso hay ocho sujetos que miden ms de 1,85 m. 2.4. Puntuaciones tpicas y escalas derivadas El SPSS ofrece la posibilidad de obtener las puntuaciones tpicas para cada uno de los sujetos en cada una de las variables. Para solicitarlas se seala la opcin Guardar valores tipificados como variables del cuadro de dilogo del procedimiento Descriptivos:
Figura 2.13.
zi =
Xi X
' SX
Los resultados aparecen como nuevas columnas en el editor de datos (y se denominan zvar). Ejercicio: Tomar como ejemplo la variable edad, seguir los pasos para obtener las puntuaciones tpicas y una vez obtenida la nueva columna de datos (a la que el SPSS ha denominado zedad) comprobar que su media es 0 y su desviacin tpica 1 mediante el men Analizar -> Estadsticos descriptivos -> Descriptivos (Opciones) de la figura 2.10.
16
Las escalas derivadas son aquellas construidas a partir de las puntuaciones tpicas. Se definen a partir de la expresin: Ti = a zi + b; donde la media de T es b y la varianza a2. A partir del SPSS es posible construir escalas derivadas. Para ello es imprescindible aprender a manejar el men Transformar de la barra de mens del Editor de Datos de SPSS. Como se comprobar a medida que el alumno se familiarice con el uso del SPSS este men es bastante til en la prctica. Para definir la escala derivada hay que situarse en la ventana Editor de datos y seleccionar con el ratn el men Transformar cuyo aspecto es el siguiente:
Figura 2.14.
A continuacin veremos los procedimientos Calcular y Recodificarde este men en detalle. El procedimiento Calcular Desde este procedimiento puede indicarse la operacin que define la escala derivada. Por ejemplo, supngase que queremos crear una escala derivada a partir de las puntuaciones tpicas que hemos obtenido en edad (cuya etiqueta era zedad) y la definimos como: Ti = 10 zi + 50. Para indicar al SPSS la definicin de Ti, hay que entrar en el cuadro de dilogo calcular variable:
Aqu se define la expresin numrica. Para escalas derivadas: Ti = a zi + b
Listado de variables
Smbolos para definir las operaciones (suma, resta, producto, cociente, etc.)
Figura 2.15.
En el recuadro variable de destino se indica el nombre de la nueva variable (por ejemplo Tedad) y en el recuadro expresin numrica la operacin de la que resulta. Para ello, pueden seleccionarse las variables del recuadro inferior de la izquierda y trasladarse a la expresin numrica con la tecla . Los smbolos del centro indican la operacin que se desea realizar (p.e. +: sumar, -: restar, *: multiplicar y /: dividir). Se recomienda poner parntesis cada vez que se incluya una operacin para una variable. En nuestro ejemplo: Tedad = (10 * zedad) + 50. Es decir:
17
Ejecutar la seleccin
Figura 2.16.
Una vez definida la nueva variable se ejecuta la orden en el botn Aceptar y el resultado aparece como una nueva columna al final del editor de datos del SPSS. Con esta nueva variable pueden calcularse los estadsticos descriptivos siguiendo las instrucciones dadas en los apartados anteriores y comprobar que la media es 50 y la desviacin tpica 10. Asimismo, tambin se puede calcular la puntuacin tpica correspondiente a T (ver figura 2.13.) y comprobar que su media es cero y su desviacion tpica 1. El procedimiento Recodificar Otra opcin importante dentro del men Transformar (ver figura 2.14.) es la que permite codificar los valores originales de una variable en otros diferentes. El resultado puede reemplazar al de la variable original o puede grabarse en otra variable distinta. En caso de optar por la primera opcin se perdern los valores originales; y en caso de optar por la segunda, la nueva variable aparecer en el editor de datos con el nombre que le asignemos. El cuadro de dilogo correspondiente a esta segunda opcin tiene el siguiente aspecto:
Figura 2.17.
En el recuadro Var. numrica -> Var. de resultado se indica cul es la variable original que se quiere recodificar y cmo se llama la variable resultante. Supngase que queremos recodificar los valores de la variable inteli para resumirlos. Los valores de esta variable oscilan entre 1 y 30. La recodificacin consiste en llamar ahora 1 a los valores entre 1 y 10 (nivel bajo); 2 a los valores entre 11 y 20 (nivel medio) y 3 a los valores entre 21 y 30 (nivel alto). Para ello trasladamos la variable inteli al recuadro derecho. En el recuadro Nombre hay que etiquetar a la variable resultado (llammosla por ejemplo nueva). Finalmente pulsamos en cambiar. En el recuadro tiene que aparecer inteli -> nueva. Para indicar los nuevos valores seleccionamos la opcin
18
valores antiguos y nuevos y desde el cuadro de dilogo correspondiente indicamos cada uno de ellos. Puesto que en nuestro ejemplo los valores antiguos sern agrupados en intervalos, hay que utilizar la opcin Rango. Por ejemplo, en la primera recodificacin, el valor antiguo se define en Rango desde 1 hasta 10; y el valor nuevo es 1. Una vez especificado el cambio, se pulsa en Aadir. Hay que repetir la operacin para cada uno de los cambios. El cuadro final tiene que tener el siguiente aspecto:
Poner aqu el valor menor (en el ejemplo, 1) y a la derecha (en hasta) el mayor (en el ejemplo, 10)
Figura 2.18.
2.5. Asimetra y curtosis La asimetra y la curtosis pueden obtenerse a partir del men Analizar -> Frecuencias (ver figura 2.2.) pulsando el botn Estadsticos (ver figura 2.9.) y desde el men Analizar -> Estadsticos descriptivos -> Descriptivos (ver figura 2.12.). Desde ambos cuadros de dilogo se ofrecen exactamente las mismas opciones: el ndice de asimetra de Fisher para cada variable y el ndice de curtosis. Asimismo, adems del valor del estadstico tanto para la asimetra como para la curtosis, el SPSS proporciona informacin sobre el error tpico en el clculo de estos ndices (este es un tema que no hemos estudiado en la asignatura anlisis de datos I). Las frmulas para ambos estadsticos tambin son insesgadas. Por ejemplo, la de la asimetra es: *
As =
n z i3 (n 1)(n 2)
Veamos un ejemplo para algunas variables de las prcticas. Desde cualquiera de los cuadros de dilogo sealados se obtienen los siguientes resultados:
Estadsticos descriptivos N Estadstico 200 200 200 200 Asimetra Estadstico Error tpico 1.205 .172 .584 .172 .775 .172 Curtosis Estadstico Error tpico 2.270 .342 .245 .342 .659 .342
Los resultados tambin muestran una columna que no hemos visto en clase (el error tpico asociado a cada estadstico). Los estadsticos encontrados en el ejemplo indican que casi todas las variables presentan asimetra positiva y distribuciones leptocrticas.
*
No se incluye la frmula de la estimacin insesgada de la curtosis porque es poco til para la estadstica descriptiva y es compleja de calcular.
19
EJERCICIOS:
Para afianzar lo aprendido en este tema en cuanto al manejo del SPSS para anlisis descriptivos con una variable, es bueno acudir al aula de informtica (por cuenta propia) y comprobar si se es capaz de responder a las siguientes preguntas, todas ellas referidas a los datos del fichero practica.sav: 1. Cul es la estatura mnima y mxima de los sujetos de la muestra? Y la de los varones? Y la de las mujeres? 2. Qu porcentaje de sujetos mide menos de 1,65 m.? 3. Cul es el valor central de la variable estatura? y de la variable peso? 4. Obtenga el valor del peso que es superado por el 15% de los sujetos de la muestra: 5. Cuntos sujetos fuman? 6. Cuntos sujetos son de provincias de Andaluca? 7. En cul de las cuatro caractersticas de personalidad (extraversin, responsabilidad, estabilidad emocional o sinceridad) han obtenido los sujetos menores puntuaciones? 8. Obtenga la representacin grfica ms adecuada para las siguientes variables: Sexo, estatura, inteli y rama 9. Qu porcentaje de varones obtiene en extraversin una puntuacin de ms de 40 puntos? 10. Confeccione el diagrama de tallo y hojas en la variable estatura para la muestra de varones, para la de mujeres y para la muestra total y trate de interpretar el resultado 11. Confeccione la grfica que considere ms adecuada para la variable licen 12. Sabiendo que para que los sujetos sean seleccionados por la empresa es necesario que obtengan en responsabilidad como mnimo una puntuacin de 52 Cuntos sujetos de la muestra total sern seleccionados? 13. Quines obtienen mayores puntuaciones en estabilidad emocional, los varones o las mujeres? 14. Son los sujetos de humanidades igual de homogneos en la variable Orientacin espacial que los de enseanzas tcnicas? 15. Obtenga los estadsticos descriptivos univariados y la representacin grfica ms adecuada para la variable sinceridad en la muestra total, en la de varones y en la de mujeres. 16. Elabore una escala derivada con media 60 y desviacin tpica 10 para la variable estabilidad emocional y su representacin grfica. 17. Confeccione el diagrama de tallo y hojas para la variable edad en la muestra total, en la de varones y en la de mujeres y comente los resultados obtenidos en cada grupo. 18. Elabore un informe descriptivo sobre la variable Edad expresada en meses. En dicho informe tienen que aparecer los estadsticos de tendencia central, de variabilidad, las propiedades de la distribucin y una representacin grfica.
______
*
20
Para obtener los ndices de asociacin lineal con variables cuantitativas que hemos estudiado en la asignatura Anlisis de Datos en Psicologa I (la covarianza, Sxy y el coeficiente de correlacin de Pearson, rxy) se selecciona el men Analizar -> Correlaciones -> Bivariadas:
Figura 3.1.
Figura 3.2.
La matriz de varianzas-covarianzas
La matriz de varianzas-covarianzas no aparece por defecto en el men general de la figura 3.2. sino que hay que definirla desde el botn Opciones. Si se pulsa este botn, aparece el cuadro de dilogo de la figura 3.3. Desde aqu puede indicarse que se muestren los estadsticos descriptivos (media y desviacin tpica) para cada una de las variables seleccionadas y tambin la matriz de varianzas-covarianzas (seleccionar la opcin Productos cruzados y covarianzas).
21
Figura 3.3.
S
La matriz de correlaciones
' xy
x y
i =1 i
n 1
Desde el cuadro de dilogo de la figura 3.2., una vez se asignan las variables seleccionadas al cuadro Variables, si se pulsa en Aceptar aparece la matriz de correlaciones de Pearson entre todas las posibles variables seleccionadas en el visor de resultados. Veamos cmo se resuelve en el SPSS alguno de los ejemplos que hemos calculado manualmente en clase. Por ejemplo, tomemos el ejemplo que aparece en la tabla de la pgina 145 del libro. En este ejemplo aparecen los datos de 15 sujetos para dos variables; X: inteligencia e Y: rendimiento. Como siempre, lo primero de todo es introducir los datos en el SPSS. En este caso tenemos una matriz de 15 sujetos x 2 variables. Una vez introducidos los datos y grabados en un archivo (en a:\correlacion.sav), se selecciona el men Analizar -> Correlaciones y se siguen los pasos indicados en las figuras 3.4. y 3.5. Finalmente se pulsa en el botn Aceptar de la figura 3.4. Los resultados obtenidos son los siguientes:
Correlaciones X
Sig. (bilateral) se ver en la asignatura Anlisis de Datos II
X Y
Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N
Se ha sealado el coeficiente de Pearson con un crculo. Como se observa, se obtienen los mismos resultados que en el libro: X = 8 e Y = 3; rxy = 0,868* y Sxy = 3,929* (ver pg. 154).
*
En este cuadro tambin aparece la prueba de significacin estadstica para cada una de las correlaciones de Pearson. Sus resultados se expresan mediante asteriscos (* **) y el SPSS marca en amarillo las correlaciones significativas. En este curso no hemos aprendido a interpetar este dato pero se ver el prximo ao en Anlisis de datos II.
22
Veamos un ejemplo a partir de los datos de las prcticas. Obtengamos el coeficiente de correlacin y la covarianza de las variables estatura y peso. Los resultados obtenidos son los siguientes:
Correlaciones Peso Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N Peso 1.000 . 21325.595 107.164 200 .857** .000 148.490 .746 200 Estatura .857** .000 148.490 .746 200 1.000 . 1.408 7.077E-03 200
Los cuadrados incluyen la varianza de peso y estatura y los crculos la correlacin y covarianza entre peso y estatura
Estatura
Como se observa, el SPSS ofrece una salida que organiza los resultados en una tabla J x J (en este caso 2 x 2 pues hay dos variables). La salida incluye la correlacin y la covarianza entre estatura y peso, peso y estatura, peso y peso y estatura y estatura. Su valor no cambia con el orden de las variables (es decir Sxy = Syx; rxy = ryx). En este caso existe una relacin lineal alta positiva entre estatura y peso (r = 0,86). Cuando se trata de las mismas variables la correlacin es siempre 1 y la covarianza es la varianza (es decir Sxx = S2x; rxx = 1). Por tanto, esta salida de SPSS incluye tanto la matriz de correlaciones como la matriz de covarianzas pues adems de ofrecer la correlacin y la covarianza entre la variables ofrece sus varianzas. Por ejemplo, la varianza de peso es 107,64.
3.2. Combinacin lineal de variables
En este apartado veremos cmo se realizan transformaciones lineales con los datos de dos o ms variables para obtener nuevas puntuaciones (p.e. Ti = Xi + Yi; Ti = AXi + BYi; etc) y cmo se cumplen las propiedades sobre la media y la varianza de estas nuevas variables. Lo primero es definir la nueva variable: Ti. Para ello se utiliza el men Transformar -> Calcular, que vimos en el apartado 2.4. Con los datos de las prcticas, crearemos una combinacin lineal de las cuatro facetas de personalidad (extra, respon, emocio y sincer). A la variable resultante la llamaremos PERSONA. El cuadro de dilogo de la figura 2.15. ha de quedar del siguiente modo:
Figura 3.4.
23
La nueva variable es del tipo Ti = Xi + Yi + Vi + Wi. Obtengamos ahora sus estadsticos descriptivos univariados desde el men Analizar -> Estadsticos descriptivos -> Descriptivos y las covarianzas desde Analizar -> Correlaciones -> Bivariadas (Opciones). El resultado es el siguiente:
Estadsticos descriptivos N Media Varianza Extraversin 200 41.3600 18.483 Responsabilidad 200 46.1250 21.979 Estabilidad emocional 200 48.6250 24.748 Sinceridad 200 23.1900 23.682 PERSONA 200 159.3000 164.693
Correlaciones EXTRA Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N Correlacin de Pearson Sig. (bilateral) Suma de cuadrados y productos cruzados Covarianza N EXTRA 1.000 . 3678.080 18.483 200 .467** .000 1875.000 9.422 200 .396** .000 1685.000 8.467 200 .177* .012 735.320 3.695 200 RESPON .467** .000 1875.000 9.422 200 1.000 . 4373.875 21.979 200 .422** .000 1956.375 9.831 200 .186** .008 845.250 4.247 200 EMOCIO .396** .000 1685.000 8.467 200 .422** .000 1956.375 9.831 200 1.000 . 4924.875 24.748 200 .092 .193 445.250 2.237 200 SINCER .177* .012 735.320 3.695 200 .186** .008 845.250 4.247 200 .092 .193 445.250 2.237 200 1.000 . 4712.780 23.682 200
RESPON
EMOCIO
SINCER
**. La correlacin es significativa al nivel 0,01 (bilateral). *. La correlacin es significante al nivel 0,05 (bilateral).
Como se observa la media en la nueva variable es 159,30; valor que se corresponde exactamente con el resultado de la suma de las medias en las cuatro variables originales ( T = X + Y + V + W ). En cuanto a la varianza, el resultado es 164,69. Puede comprobarse que se llega al mismo resultado 2 2 2 2 mediante: ST = S2 X + SY + SV + SW + 2 ( S XY + S XV + S XW + SYV + SYW + SVW ) ; o lo que es lo mismo, la suma del total de los elementos de la matriz de varianzas-covarianzas (aqu las correlaciones se han rodeado con crculos, las covarianzas con cuadrados y las varianzas con cuadrados en lnea discontinua). Veamos otro ejemplo. Supngase que queremos crear una nueva variable con los datos de las prcticas que se define como el cociente entre el peso (en kilogramos) y la estatura al cuadrado (en metros). A este cociente se le denomina ndice de masa corporal. Si el valor resultante se encuentra entre 20 y 25 quiere decir que la persona est en su peso normal. Si est entre 25 y 28 30 indica que tiene sobrepeso. Si est por encima de 28 30 indica que existe un problema de
24
obesidad y si est por debajo de 20, de excesiva delgadez. Nuestra nueva variable se definira como Ti = Xi / Yi2. Para indicar al SPSS la definicin de esta nueva variable se utiliza el procedimiento Calcular variable. Llamemos a la variable resultante IMC:
Figura 3.5.
Una forma rpida de interpretar los resultados en la nueva variable (IMC) es representando grficamente el histograma. Para ello basta ir al men Analizar -> Frecuencias y pulsar el botn Grficos (ver figura 2.2.). El resultado obtenido con nuestra muestra es el siguiente:
20
Frecuencia
10
N = 200.00
17 16 19 18 21 20 23 22 25 24
IMC
Como se observa, la mayor parte de los sujetos tienen un peso normal (IMC entre 20 y 25), ninguno tiene tendencia a la obesidad, aunque hay un sector de sujetos considerable que punta por debajo de 20, por lo que est por debajo del peso normal.
3.3. Anlisis de regresin lineal simple
El anlisis de regresin lineal es una tcnica estadstica que se utiliza para estudiar la relacin entre variables. En la investigacin psicolgica suele emplearse para pronosticar valores en una variable criterio (Y) desde las puntuaciones en una variable predictora (X). En esta asignatura solamente hemos estudiado la regresin lineal con una sola variable predictora (regresin simple) sin embargo, la regresin tambin puede efectuarse a partir de 2 o ms variables predictoras (X1, X2, etc.). A medida que vayamos entrando en las opciones del SPSS para regresin simple, veremos de forma intuitiva cmo se procede para la regresin con ms de un predictor (regresin mltiple).
Diagrama de dispersin
La primera aproximacin a la relacin entre dos variables (X e Y) puede hacerse a partir de un diagrama de dispersin. Por ejemplo, tomemos el ejemplo a) del cuadro 10.2. del libro (pgina
25
195). Como en otros ejemplos previos, tendremos que introducir los datos correspondientes a los 4 sujetos en las dos variables en un archivo nuevo del editor de datos. Una vez introducidos los datos (en el fichero a:regresion.sav) para realizar el diagrama de dispersin se selecciona el men Grficos y se elige el procedimiento Dispersin. El cuadro de dilogo correspondiente es el siguiente:
Variable Criterio: eje de ordenadas Variable Predictora: eje de abcisas
Figura 3.6.
Con esta definicin se obtiene el siguiente diagrama de dispersin simple en el visor de resultados:
6 5 4 3 2 1 0 0
10
12
Como se observa, este diagrama es idntico al de la figura 10.4.a) de la pgina 196 del libro. Su forma indica que los puntos en el diagrama no estn perfectamente alineados pero se acercan a una hipottica lnea recta.
Ecuacin de regresin
Podran trazarse diferentes rectas para realizar pronsticos de una variable a partir de la otra (por ejemplo de Y a partir de X en una regresin de Y sobre X). Las rectas de regresin tienen una frmula muy simple: Yi ' = AYX + BYX X i El objetivo es encontrar aquella recta que minimice la distancia entre lo encontrado (Y) y lo pronosticado (Y). Es decir, que minimice la expresin:
(Yi Yi ' ) 2 n
26
Para ello calculamos los coeficientes del modelo mediante las frmulas:
BYX =
n X i Yi
2 i
nX
X Y -( X )
i 2 i
A YX = Y - B YX X
Veamos cmo se procede en el SPSS para calcular dichos coeficientes, obtener la recta de regresin y valorar la bondad del modelo. Se selecciona el men Analizar -> Regresin -> Lineal:
Figura 3.7.
El cuadro de dilogo correspondiente al procedimiento Regresin lineal aparece en la figura 3.8. Como en otros cuadros de dilogo del SPSS, lo primero es seleccionar las variables. En este caso hay que distinguir entre Dependiente e Independiente (o independientes si se trata de una regresin mltiple). Como siempre, las variables se trasladan mediante el botn .
Figura 3.8.
Dentro de este men hay otras opciones. Por el momento, la que nos interesa es la que se encuentra en el botn Estadsticos, cuyo cuadro de dilogo aparece en la figura 3.9. Desde aqu podemos solicitar que se ofrezcan las estimaciones de la pendiente y el origen de la recta de regresin (segn
27
el mtodo de mnimos cuadrados), la matriz de covarianzas para las variables, el ajuste del modelo (coeficiente de Pearson al cuadrado o coeficiente de determinacin) y los estadsticos descriptivos (media y varianza):
Figura 3.9.
Otra opcin relevante del men regresin lineal es la de Guardar (ver figura 3.10.).* Desde su correspondiente cuadro de dilogo es posible indicar que se guarden los valores pronosticados por el modelo (las Y i) y los residuos (las Yi - Y i) en el editor de datos:
Seleccionar si se desea guardar los valores pronosticados por el modelo (las Yi) para cada uno de los sujetos.
Seleccionar si se desea guardar lo no explicado por el modelo (las Yi -Yi): los residuos para cada uno de los sujetos.
Figura 3.10.
Veamos cul es el resultado para el ejemplo del cuadro 10.2.a) del libro. Si indicamos todas estas instrucciones, el resultado que ofrece el SPSS es el siguiente (ntese que se ofrecen muchas tablas de resultados. Aqu explicaremos slo las ms importantes y aquellas que el alumno de psicologa de primero puede manejar con soltura):
*
No vamos a entrar en las restantes opciones del men Regresin lineal porque la mayora requieren conocimientos de estadstica inferencial, que el alumno an no posee. Dichas opciones se vern en detalle en las prcticas de la asignatura de segundo Anlisis de Datos en Psicologa II.
28
Regresin
Estadsticos descriptivos Y X Media 2.75 6.00 Desviacin tp. 1.71 3.65 N 4 4
Correlaciones Correlacin de Pearson Sig. (unilateral) N Y X Y X Y X Y 1.000 .535 . .233 4 4 X .535 1.000 .233 . 4 4
b Variables introducidas/eliminadas
Modelo 1
Variables introducidas Xa
Variables eliminadas .
Mtodo Introducir
Modelo 1
R .535a
ANOVAb Modelo 1 Suma de cuadrados 2.500 6.250 8.750 gl 1 2 3 Media cuadrtica 2.500 3.125 F .800 Sig. .465a
Los coeficientes A y B del modelo pronosticado en directas se ven en esta columna: siendo A = 1,25 y B = 0,25. Luego: Yi = 1,25 + 0,25 Xi
Modelo 1
(Constante) X
a. Variable dependiente: Y
En esta columna aparece el modelo en tpicas: zY = rxy zX (en el ejemplo: zY = 0,535 zX)
29
Como se observa, el SPSS ofrece muchas tablas de datos como resultado de la regresin. Por el momento solamente nos fijaremos en dos: La primera se refiere a los coeficientes del modelo y la segunda a su bondad. En cuanto a la primera, se toman los coeficientes no estandarizados. En este caso el mejor modelo para pronosticar Yi a partir de Xi es Yi = 1,25 + 0,25 Xi
Bondad de ajuste del modelo
Adems de la frmula de la recta de regresin, resulta necesario disponer de informacin sobre el grado en que el modelo se ajusta a los datos observados (nube de puntos). Una primera aproximacin es la interpretacin grfica del problema. Para elaborar la grfica del ajuste de la recta a los datos observados se pulsa el men Grficos -> Interactivos -> Diagramas de dispersin.
Lo primero es definir la variable del criterio (en el eje de ordenadas) y la variable predictora (en el eje de abcisas) desde la solapa Asignar variables. A continuacin se selecciona el mtodo regresin desde la solapa Ajuste. El cuadro de dilogo desde el que se hacen estas selecciones tiene el siguiente aspecto:
Figura 3.11.
10
Como se observa, los puntos se alejan bastante de la recta, luego no hay un buen ajuste.
30
Adems de la interpretacin grfica del problema, la forma de cuantificar la bondad del modelo es mediante el coeficiente de determinacin, r2xy. Se trata de una medida estandarizada que toma valores entre 0 y 1 y cuya interpretacin es muy sencilla: representa la proporcin de varianza explicada de la variable del criterio a partir de la predictora. En nuestro ejemplo, r2xy = 0,286 por lo que el modelo no es adecuado para hacer pronsticos de Y a partir de X. La bondad del modelo tambin puede valorarse a partir del anlisis de los errores en los pronsticos, frecuentemente llamados residuos (Yi - Yi). Ntese que ejecutando las rdenes indicadas en el anterior apartado han resultado dos nuevas variables en el editor de datos (la variable pre_1 que se corresponde con las Yi y lleva la etiqueta Unstandardized predicted value y la variable res_1 que se refiere a las Yi - Yi y lleva la etiqueta Unstandardized residual). Teniendo los datos para Yi, Yi e (Yi - Yi) podemos evaluar la bondad del modelo a partir de la descomposicin de la varianza del criterio (S2Y = S2Y + S2Y-Y). Para ello entramos en el men Analizar -> Estadsticos descriptivos -> Descriptivos: Opciones (ver figuras 2.11 y 2.12) e indicamos en el cuadro de dilogo que se calcule la varianza para estas tres variables (Y, pre_1 y res_1). Los resultados obtenidos en el visor son los siguientes:
Estadsticos descriptivos Y Unstandardized Predicted Value Unstandardized Residual N vlido (segn lista) N 4 4 4 4 Varianza 2.917 .833 2.083
Como se comprueba, la varianza del criterio (S2Y = 2,917) se descompone en la varianza de los pronsticos (S2Y = 0,833) y la de los errores (S2Y-Y = 2,083). Veamos ahora un ejemplo a partir de los datos de las prcticas. Supngase que queremos predecir la variable peso a partir de la variable estatura. Para ello construimos la recta de regresin pesoi = A + B estaturai. La definicin del modelo en el SPSS es la siguiente:
Figura 3.12.
31
Los resultados obtenidos para el modelo planteado son los siguientes (slo se muestran las tablas necesarias para la interpretacin):
Variables introducidas/eliminadas Modelo 1 Variables introducidas Estatura a Variables eliminadas .
b
Mtodo Introducir
Resumen del modelo Modelo 1 R R cuadrado .857a .734 R cuadrado corregida .733 Error tp. de la estimacin 5.3510
Coeficientesa Coeficientes no estandarizados B Error tp. -118.375 7.565 105.437 4.509 Coeficientes estandarizados Beta .857
Modelo 1
(Constante) Estatura
t -15.648 23.384
El modelo resultante es: pesoi = -118,375 + 105,437 estaturai. Como se observa, el coeficiente de determinacin (R al cuadrado) es 0,734 por lo que el modelo es adecuado para explicar la relacin entre la variable estatura y la variable peso. Es decir, la variable estatura tiene una alta capacidad predictiva para explicar la variable del criterio, el peso. El grfico obtenido definiendo las opciones del diagrama de dispersin interactivo de la figura 3.11. es el siguiente:
90 80 70 60 50 40
W W
W W WW W W W W W WW W W W WW W W W WW W W W W WW W W WW W W W W W W W W WW WW W W W W W W W W W WW W W W W W W WW W W W W WW W W W W WW W W W WW WW W W W W W W W W W W W W W W W W W W WW W W W W W W W W W W W W W W W W W W W W WW W WW W W WW WW WW W W
Peso
1.60
1.70
1.80
1.90
Estatura
El grfico muestra que existe un buen ajuste. No obstante, encontrar un resultado similar a ste con variables psicolgicas no es frecuente. Para comprobarlo a continuacin haremos una regresin de la
32
variable Responsabilidad sobre la variable Estabilidad emocional, que son dos variables psicolgicas del fichero practica.sav. Los resultados que ofrece el SPSS son los siguientes:
b Variables introducidas/eliminadas
Modelo 1
Variables eliminadas .
Mtodo Introducir
a. Todas las variables solicitadas introducidas b. Variable dependiente: Responsabilidad Resumen del modelo Modelo 1 R R cuadrado .422a .178 R cuadrado corregida .174 Error tp. de la estimacin 4.2621
Modelo 1
t 9.031 6.541
Como puede observarse, en este caso la correlacin de Pearson entre las variables es 0,42 y la bondad del modelo tan slo alcanza el valor 0,18. Sin embargo, los psiclogos del equipo podran concluir que existe un buen ajuste para el modelo que predice la responsabilidad a partir de la estabilidad emocional, pues as lo indican las pruebas inferenciales (que no se han estudiado en esta asignatura pero se vern en la asignatura Anlisis de Datos en Psicologa II). El grfico inferior muestra el ajuste para el modelo estimado. La comparacin con el grfico de la pgina anterior pone de manifiesto que las correlaciones entre variables psicolgicas adoptan un rango muy inferior al de otras variables observadas, como son el peso y la estatura.
60
W W W W W W
W W W WW W W W W W W
W W
50
W
W W
40
W
W W
W W W
Responsabilidad
W W
W WW W W WW W W W
W W
WWW
40
45
50
55
60
Estabilidad emocional
33
Una alternativa a la situacin de poco ajuste es incluir una variable predictora adicional (o ms de una) y observar si su inclusin produce algn cambio en R cuadrado. Si consideramos dos variables predictoras estamos planteando el siguiente modelo: Yi = A + B1Xi1 + B2Xi2. Veamos si el ajuste al modelo de regresin de responsabilidad sobre estabilidad emocional mejora al aadir la variable extraversin como segunda variable predictora. El modelo planteado es: responi = A + B1 emocioi + B2 extravi. La primera aproximacin al problema puede hacerse a partir del grfico de dispersin (ver figura 3.8.). En este caso puede elaborarse un grfico 3-D para observar la relacin entre las dos predictoras y el criterio y tambin el grfico simple para observar la relacin entre respon y extra:
60
70
R e 60 s p 50 o n
40 70 60
Responsabilidad
50
40
60
50
Emocio
40
30
40
50
Extrav
30 20
30
40
50
60
Extraversin
En el grfico tridimensional puede verse que en el plano respon-emocio se observa como los puntos indican una relacin con tendencia lineal positiva. La grfica de la derecha muestra el plano respon-extra. Los puntos indican que la variable extraversin tiene una tendencia a la relacin lineal positiva con la variable responsabilidad. Comparndola con la grfica en la que veamos el diagrama de dispersin entre respon y emocio, en sta los puntos estn algo ms alineados, por lo que cabe esperar que la inclusin de la variable extra en el modelo mejore la bondad de ajuste. Para obtener los coeficientes del modelo y valorar su ajuste se selecciona el men Analizar -> Regresin -> Lineal. De forma similar a la regresin simple, primero se traslada la variable respon a la casilla Dependiente y a continuacin las variables emocio y extra a la casilla Independientes. Al ejecutar el anlisis, en primer lugar aparece la tabla que informa sobre la especificacin de las variables en el modelo:
Variables introducidas/eliminadasb Modelo 1 Variables introducidas Extraversin, a Estabilidad emocional Variables eliminadas . Mtodo Introducir
A continuacin se muestra la tabla que incluye el coeficiente de determinacin y ms abajo la tabla de resultados con los coeficientes del modelo (A, B1 y B2):
34
Resumen del modelo Modelo 1 R .534a R cuadrado .285 R cuadrado corregida .278 Error tp. de la estimacin 3.9848
Modelo 1
Como se observa, el modelo simple explicaba un 17,8 % de varianza de la variable responsabilidad y el modelo mltiple explica el 28,5 %. Por tanto, el modelo resultante (definido mediante: responi = 17,2 + 0,26 emocioi - 0,39 extrai) aporta un 11% ms en la explicacin de la variable del criterio. En este caso tambin es posible elaborar el grfico tridimensional con el ajuste del plano de regresin es el siguiente desde la figura 3.11, activando la opcin Coordenada 3-D. El resultado es el siguiente:
Se deja como ejercicio comprobar que al aadir la variable edad al modelo de regresin de peso sobre estatura, el ajuste mejora un 0,10%.
35
En este apartado veremos cmo se obtienen distribuciones conjuntas de frecuencias y su representacin grfica para dos o ms variables de diversos tipos.
Dos variables cualitativas:
Para describirlas hay que elaborar una Tabla de contingencia. La forma de proceder en el SPSS es desde el men Analizar -> Estadsticos descriptivos -> Tablas de contingencia:
Figura 3.13.
Si se selecciona el procedimiento Tablas de contingencia aparece el cuadro de dilogo de la figura 3.14). Supongamos que queremos conocer la distribucin conjunta de frecuencias de las variables fumar y sexo con los datos de las prcticas. Para indicar al SPSS esta instruccin, primero se seleccionan las variables. Por ejemplo, las categoras de la variable sexo pueden ser las filas de la tabla de frecuencias y las de la variable fumar las columnas. Este cuadro de dilogo tambin permite obtener una representacin grfica para las dos variables.
Figura 3.14
80 60 40 20 0 Mujer Varn
Tabaquismo
No fumador Fumador
Sexo Total
Mujer Varn
Sexo
En la tabla de resultados aparecen las distribuciones conjuntas (nij) y marginales (ni y nj) de las variables y la representacin grfica del diagrama de barras conjunto. Como se observa, de los 200 sujetos de la muestra 62 fuman y 138 no fuman. De los fumadores, la mayora son mujeres y de los no fumadores, varones. Hay 100 no fumadores que son varones y 19 varones que son fumadores. Las distribuciones conjuntas tambin pueden obtenerse en frecuencias relativas o porcentajes para ambas variables (filas y columnas). Para ello se selecciona el botn Casillas del cuadro de dilogo de la figura 3.14). cuyo aspecto es el siguiente:
Sealar si se desea obtener las frecuencias conjuntas relativas para las filas, las columnas y para el total
Figura 3.15
Seleccionando las opciones sealadas se obtienen los mismos resultados que antes pero expresados en porcentajes respecto a distintos totales:
Tabla de contingencia Sexo * Tabaquismo Tabaquismo No fumador Fumador 38 43 46.9% 53.1% 27.5% 69.4% 19.0% 21.5% 100 19 84.0% 16.0% 72.5% 30.6% 50.0% 9.5% 138 62 69.0% 31.0% 100.0% 100.0% 69.0% 31.0%
Sexo
Mujer
Varn
Total
Recuento % de Sexo % de Tabaquismo % del total Recuento % de Sexo % de Tabaquismo % del total Recuento % de Sexo % de Tabaquismo % del total
Total 81 100.0% 40.5% 40.5% 119 100.0% 59.5% 59.5% 200 100.0% 100.0% 100.0%
Globalmente, los resultados indican que la mayor parte de los sujetos son varones y no fuman (el 50%). Veamos ahora ejemplos de interpretacin de distribuciones condicionales. Como se observa, hay un 27,5% de los no fumadores que son mujeres (frente al 53,1% de las fumadoras); y de los
37
varones el 84% son no fumadores. En cuanto a las mujeres, el 46,9% son no fumadoras y dentro de los fumadores el 69,4% son mujeres. Las tablas de contingencia slo tienen sentido para variables de tipo cualitativo (o categricas). Si se desea representar la distribucin conjunta de dos variables cuantitativas es necesario agrupar los valores de cada una de dichas variables en intervalos de la misma amplitud (para ello puede utilizarse el men Transformar -> Recodificar). Una vez obtenidos los intervalos para X e Y puede elaborarse la tabla de contingencia siguiendo el mismo procedimiento que si las variables fueran cualitativas. El grfico ms adecuado para dos variables cuantitativas es el diagrama de dispersin, como vimos en el apartado de anlisis de regresin lineal (ver figura 3.8. en pgina 26).
Una variable cualitativa y otra cuantitativa
Si queremos cruzar una variable cualitativa con una cuantitativa, se procede igual excepto que para resumir los datos de la cuantitativa hay que emplear estadsticos (p.e. sumas, medias, etc.). Veamos un ejemplo. Tomemos la variable Fumar (cualitativa con 2 categoras) y la variable peso que por ser cuantitativa la resumimos mediante su MEDIA. Para describir conjuntamente estas variables podemos elaborar un grfico desde el men Grficos -> Lneas -> Simple (Resmenes para grupos de casos):
Figura 3.16
Media Peso
58 58 57 57
No fumador
Fumador
Tabaquismo
Este grfico representa la media de la variable peso para fumadores y no fumadores. Como se observa, los sujetos fumadores tienden a tener un promedio de peso menor (57 kg.) que los que no fuman (59 kg.).
38
Es frecuente la representacin de una variable dependiente cuantitativa en funcin de dos independientes de tipo cualitativo. En estos casos tambin se puede representar grficamente la relacin entre estas tres variables. Veamos un ejemplo igual al anterior (variable cualitativa Fumar: 2 categoras y variable cuantitativa peso que se expresa mediante su MEDIA) pero aadiendo la variable sexo (cualitativa con 2 categoras). Para describir conjuntamente estas tres variables podemos elaborar un grfico desde el men Grficos -> Lneas -> Mltiple (Resmenes para grupos de casos). Es decir:
Figura 3.17
70
Media Peso
60
Sexo
50
40
No fumador Tabaquismo
Con la grfica anterior observbamos que los sujetos no fumadores de la muestra tienen un peso medio mayor que los fumadores. Lo que nos indica esta nueva grfica es lo mismo pero segmentado para la muestra de varones (lnea continua) y la de mujeres (lnea discontinua). Como puede observarse, en las mujeres se observa que efectivamente el promedio del peso es menor para las fumadoras. Sin embargo, en los varones se produce el efecto contrario. Es decir, los fumadores tienen un promedio en peso mucho mayor que los no fumadores. Por tanto, de no haber elaborado esta grfica, se hubiera concluido algo errneo para la muestra de varones. De todos modos, esta interpretacin es solamente descriptiva pues para concluir que el gnero afecta al peso de los fumadores y no fumadores, sera necesario emplear pruebas inferenciales. En el prximo curso se estudiarn las pruebas estadsticas que determinan si cada variable independiente (y ambas en interseccin) tiene algn efecto sobre la variable dependiente.
39
EJERCICIOS:
1. Se desea comparar las caractersticas fsicas de los sujetos evaluados (todos ellos Espaoles) con las de los Norteamericanos. Para ello, utilizaremos algunos datos de las prcticas: la variable estatura y la variable peso. El objetivo es comparar nuestros datos descriptivos en estas variables con los de una muestra norteamericana de similares caractersticas. Tenemos el problema de que en Estados Unidos el peso y la estatura se miden en escalas diferentes a las nuestras. En concreto, el peso en libras y la estatura en pulgadas, donde:
1 LIBRA = 453,6 gramos 1 PULGADA= 2,54 cm
Lo primero es obtener los datos de ambas variables en la escala de medida norteamericana. Despus hay que elaborar un informe con los estadsticos descriptivos. EL INFORME ha de incluir lo siguiente a) La media y la varianza de las variables estatura y peso en la escala norteamericana b) Un grfico que d cuenta de la variabilidad en cada una de las variables para los varones y las mujeres c) Informacin sobre la forma de la distribucin (asimetra y curtosis) d) Las puntuaciones tpicas para la variable estatura e) Una escala derivada T con media 100 y desviacin tpica 20 para la variable estatura y su representacin grfica f) La covarianza entre ambas variables (calcularlo en formato espaol y norteamericano). 2. Calcule la media y la varianza para la variable que resulta de la suma de las variables Inteligencia, comprensin verbal y orientacin espacial. 3. Se desea predecir las puntuaciones en estabilidad emocional (emocio) a partir de una de las siguientes variables: inteligencia, extraversin, responsabilidad y sinceridad. Seleccione la variable ms apropiada como predictora, justificando la eleccin. a) Represente grficamente la relacin entre la variable predictora escogida y el criterio. b) Obtenga la ecuacin de regresin correspondiente (en directas, diferenciales y tpicas). c) Descomponga la varianza del criterio para el modelo anterior e interprete la bondad del modelo (de forma descriptiva y con el grfico interactivo). d) Cul es la proporcin de varianza explicada de la variable estabilidad emocional a partir de la variable predictora? e) Si un sujeto obtiene una puntuacin de 6 en la variable predictora, Cul es su puntuacin pronosticada en estabilidad emocional?. f) Si se quisiera predecir las puntuaciones en estabilidad emocional a partir de dos variables, cul aadira? por qu?. Cunto mejorara la bondad del nuevo modelo?. 4. Obtenga la tabla de frecuencias conjuntas para las variables sexo y rama y la grfica de barras con ambas variables. 5. Cul es el porcentaje de sujetos que son varones y de humanidades? y el de los que dentro de los de enseanzas tcnicas, son mujeres? 6. Elabore la misma tabla de frecuencias que en 4. pero separando entre fumadores y no fumadores 7. Confeccione una grfica en la que aparezca la distribucin de frecuencias para la variable edad en varones y mujeres e interprete los resultados. 8. Repita lo mismo que en los ejercicios 4 a 7 con las variables fumar y rama e interprete los resultados obtenidos. 9. Confeccione una grfica que represente la relacin entre las variables rama, sexo y responsabilidad.
______
*
40
En muchas ocasiones las tablas de resultados del SPSS incluyen datos en la denominada notacin cientfica, debido a que los nmeros escritos de esta forma ocupan menos espacio que en la notacin tradicional. Por ejemplo:
Estadsticos descriptivos Peso Estatura N 200 200 Mnimo 39.00 1.52 Mximo 92.00 1.93 Media 58.2950 1.6756 Desv. tp. 10.3520 8.413E-02
La notacin cientfica se utiliza para sealar la posicin del primer valor decimal. Por ejemplo, la desviacin tpica para la variable Estatura aparece escrita en notacin cientfica: 8.413E-02. Esta expresin significa lo siguiente en notacin tradicional:
8.413E - 02 = 8.413 10 - 2 =
41
7. Rama: variable nominal que indica el rea de conocimiento: (0): ciencias experimentales y de la salud, (1): Ciencias sociales y jurdicas, (2): enseanzas tcnicas, (3): humanidades y (4) otros/varios. 8. Licen: variable nominal que indica la titulacin del sujeto (licenciado en derecho, etc.). 9. Intelig: inteligencia general: capacidad cognitiva para resolver problemas en general. 10. Compren: comprensin verbal (o capacidad para comprender los mensajes transmitidos verbalmente). 11. Orient: orientacin espacial (o capacidad para situarse en el espacio respecto a alguna referencia). 12. Extra: extraversin (valora la cantidad e intensidad de las relaciones personales). 13. Respon: responsabilidad (grado de organizacin y motivacin de la conducta del sujeto). 14. Emocio: estabilidad emocional (refleja el nivel de ajuste emocional de la persona). 15. Sincer: sinceridad (o grado en que responde con honestidad). * 16. Fumar: variable nominal que indica si el sujeto fuma (1) o no fuma (0).
Las variables 9, 10, 11, 12, 13, 14 y 15 se consideran aqu como puntuaciones (variables cuantitativas).
42
inteli 21.00 11.00 18.00 13.00 22.00 11.00 22.00 23.00 18.00 13.00 15.00 16.00 20.00 25.00 15.00 23.00 20.00 16.00 20.00 22.00 15.00 18.00 12.00 11.00 23.00 28.00 20.00 16.00 28.00 16.00 21.00 24.00 18.00 16.00 16.00 23.00
compren 24.00 25.00 26.00 28.00 29.00 25.00 26.00 30.00 29.00 17.00 24.00 23.00 31.00 27.00 24.00 26.00 25.00 20.00 31.00 21.00 25.00 30.00 23.00 18.00 30.00 29.00 30.00 23.00 26.00 28.00 29.00 29.00 30.00 21.00 24.00 25.00
orient 29.72 64.72 13.27 10.07 27.20 36.65 109.24 29.82 16.77 90.01 110.37 20.67 24.28 15.40 72.14 86.93 21.92 106.99 8.77 10.38 85.80 80.28 88.11 102.41 14.23 13.86 79.69 12.83 15.62 13.82 31.04 47.74 16.80 49.12 13.39 46.26
extra 38.00 42.00 36.00 41.00 42.00 41.00 43.00 40.00 36.00 42.00 40.00 35.00 43.00 39.00 43.00 33.00 40.00 44.00 42.00 44.00 41.00 39.00 47.00 45.00 39.00 50.00 37.00 30.00 36.00 42.00 39.00 41.00 42.00 37.00 39.00 44.00
respon emocio sincer fumar 51.00 49.00 22.00 1 46.00 60.00 21.00 1 43.00 49.00 26.00 0 49.00 45.00 27.00 0 44.00 51.00 25.00 0 52.00 54.00 32.00 1 49.00 52.00 20.00 0 43.00 40.00 24.00 1 42.00 44.00 26.00 0 47.00 46.00 17.00 0 46.00 46.00 24.00 0 37.00 44.00 23.00 0 51.00 52.00 26.00 0 46.00 47.00 27.00 0 41.00 55.00 20.00 0 44.00 46.00 30.00 1 41.00 45.00 24.00 1 41.00 43.00 17.00 0 53.00 42.00 21.00 0 49.00 48.00 27.00 1 43.00 46.00 26.00 1 46.00 46.00 24.00 0 52.00 48.00 21.00 1 47.00 51.00 25.00 1 53.00 56.00 17.00 1 45.00 56.00 32.00 0 43.00 49.00 24.00 0 36.00 60.00 12.00 0 42.00 46.00 13.00 1 44.00 42.00 17.00 0 40.00 53.00 21.00 1 41.00 48.00 25.00 1 51.00 50.00 28.00 0 43.00 54.00 25.00 0 41.00 42.00 17.00 0 54.00 47.00 13.00 1
43
Cuaderno de prcticas de SPSS para Anlisis de Datos I 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 0 1 0 0 1 1 0 0 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 0 1 1 0 0 0 0 1 1 0 0 1 1 1 27 32 31 29 38 26 32 29 24 31 28 25 31 31 28 37 26 30 26 28 30 33 29 30 29 28 30 42 25 34 23 29 35 26 30 24 41 32 28 49 63 49 57 64 58 39 53 50 53 66 45 60 61 55 55 63 63 64 52 45 53 59 59 61 47 56 57 47 55 49 43 66 60 56 50 60 57 66 1.66 1.72 1.66 1.75 1.73 1.66 1.54 1.70 1.66 1.60 1.75 1.60 1.68 1.69 1.62 1.62 1.71 1.71 1.72 1.58 1.60 1.69 1.66 1.66 1.68 1.62 1.62 1.63 1.62 1.71 1.64 1.57 1.73 1.66 1.72 1.65 1.66 1.62 1.72
VALLADOLID ASTURIAS ASTURIAS VALLADOLID MADRID PONTEVEDRA MADRID BURGOS BURGOS BALEARES MADRID MADRID MADRID MADRID VALLADOLID MADRID ASTURIAS MADRID MADRID VALLADOLID MADRID BURGOS VALLADOLID MADRID ASTURIAS MADRID BURGOS MADRID MADRID MADRID MADRID MADRID MADRID MADRID ASTURIAS MADRID ASTURIAS VALLADOLID ASTURIAS
28 12 12 28 46 43 46 22 22 44 46 46 46 46 28 46 12 46 46 28 46 22 28 46 12 46 22 46 46 46 46 46 46 46 12 46 12 28 12
22.00 16.00 21.00 15.00 14.00 23.00 21.00 13.00 14.00 25.00 21.00 17.00 20.00 22.00 16.00 12.00 16.00 17.00 16.00 19.00 16.00 24.00 24.00 17.00 22.00 24.00 12.00 24.00 16.00 15.00 15.00 14.00 26.00 19.00 18.00 28.00 19.00 18.00 14.00
30.00 31.00 31.00 22.00 22.00 28.00 30.00 8.00 19.00 31.00 32.00 29.00 24.00 24.00 25.00 16.00 26.00 29.00 24.00 27.00 26.00 32.00 25.00 25.00 18.00 29.00 17.00 25.00 32.00 19.00 16.00 23.00 30.00 25.00 28.00 30.00 21.00 31.00 21.00
84.55 13.36 31.98 86.08 13.79 6.90 39.79 125.98 114.18 9.44 15.24 12.63 18.77 35.92 38.11 52.67 37.72 8.48 8.52 10.72 104.50 21.88 14.74 52.75 13.06 29.17 113.11 8.64 37.70 86.18 18.59 73.35 10.71 35.59 42.52 10.77 31.30 14.67 56.26
43.00 49.00 41.00 41.00 32.00 43.00 40.00 44.00 39.00 42.00 39.00 49.00 38.00 38.00 41.00 36.00 40.00 41.00 46.00 43.00 43.00 46.00 36.00 39.00 38.00 44.00 47.00 47.00 46.00 46.00 45.00 43.00 41.00 44.00 45.00 31.00 40.00 50.00 44.00
44.00 54.00 46.00 43.00 42.00 51.00 45.00 45.00 40.00 44.00 46.00 45.00 44.00 41.00 47.00 34.00 43.00 45.00 46.00 49.00 44.00 50.00 47.00 38.00 46.00 48.00 48.00 43.00 57.00 56.00 50.00 53.00 42.00 48.00 51.00 48.00 41.00 55.00 35.00
47.00 58.00 47.00 49.00 39.00 54.00 45.00 43.00 46.00 45.00 49.00 56.00 48.00 45.00 47.00 43.00 47.00 47.00 47.00 50.00 50.00 53.00 47.00 47.00 37.00 47.00 42.00 53.00 57.00 57.00 41.00 49.00 47.00 49.00 49.00 56.00 46.00 54.00 36.00
22.00 34.00 25.00 24.00 24.00 23.00 29.00 25.00 20.00 24.00 18.00 22.00 13.00 25.00 27.00 24.00 22.00 21.00 25.00 30.00 20.00 24.00 24.00 13.00 18.00 26.00 25.00 27.00 33.00 40.00 22.00 22.00 17.00 23.00 24.00 12.00 20.00 19.00 23.00
1 0 1 1 0 0 1 1 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0
44
Cuaderno de prcticas de SPSS para Anlisis de Datos I 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 0 1 1 1 1 1 0 0 1 1 1 1 0 1 1 1 0 0 1 1 1 1 0 0 1 1 1 1 0 1 1 0 1 0 1 1 1 1 1 31 29 27 24 25 32 29 31 30 28 26 26 22 29 29 29 30 28 38 42 28 37 27 35 33 27 30 31 27 28 29 23 25 24 24 26 30 33 29 57 60 60 67 56 63 51 52 63 63 64 64 52 58 52 59 52 52 66 60 60 60 40 42 60 61 62 58 40 59 60 53 67 53 68 62 66 57 70 1.73 1.65 1.65 1.73 1.60 1.68 1.66 1.67 1.68 1.68 1.68 1.68 1.67 1.61 1.54 1.62 1.67 1.67 1.70 1.63 1.63 1.63 1.53 1.55 1.63 1.63 1.64 1.59 1.52 1.60 1.61 1.67 1.69 1.67 1.70 1.63 1.67 1.56 1.71
MADRID LEON ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS LEON ASTURIAS MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID BARCELONA MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID MADRID VIZCAYA VIZCAYA ZAMORA
46 23 12 12 12 12 12 12 12 12 12 23 12 46 46 46 46 46 46 46 46 46 46 30 46 46 46 46 46 46 46 46 46 46 46 46 52 52 29
10.00 18.00 15.00 19.00 16.00 22.00 17.00 16.00 23.00 15.00 16.00 14.00 18.00 19.00 19.00 14.00 22.00 11.00 13.00 14.00 15.00 19.00 20.00 15.00 13.00 17.00 24.00 23.00 26.00 25.00 14.00 26.00 24.00 18.00 13.00 26.00 17.00 20.00 20.00
19.00 12.00 22.00 32.00 30.00 29.00 30.00 25.00 24.00 32.00 24.00 17.00 28.00 28.00 20.00 26.00 30.00 28.00 29.00 23.00 27.00 32.00 25.00 27.00 25.00 20.00 30.00 23.00 29.00 29.00 23.00 29.00 27.00 28.00 17.00 28.00 31.00 25.00 23.00
91.69 91.57 10.91 14.93 5.97 9.01 35.31 109.89 17.02 72.51 19.42 18.45 142.29 25.67 38.32 17.41 13.53 77.23 69.92 14.98 13.29 8.84 117.38 55.62 10.63 50.09 12.79 9.29 74.67 8.13 10.37 24.93 11.64 19.99 101.06 11.62 15.09 29.45 17.60
43.00 48.00 34.00 39.00 36.00 40.00 37.00 45.00 40.00 41.00 47.00 40.00 39.00 48.00 48.00 45.00 41.00 45.00 42.00 41.00 34.00 37.00 40.00 38.00 37.00 39.00 40.00 41.00 44.00 42.00 39.00 42.00 47.00 43.00 46.00 53.00 39.00 47.00 36.00
48.00 45.00 42.00 46.00 42.00 41.00 45.00 48.00 50.00 45.00 48.00 46.00 33.00 39.00 45.00 45.00 47.00 47.00 45.00 51.00 41.00 45.00 45.00 47.00 43.00 53.00 42.00 49.00 45.00 47.00 42.00 44.00 44.00 47.00 53.00 54.00 43.00 50.00 45.00
54.00 51.00 46.00 37.00 50.00 50.00 47.00 52.00 51.00 43.00 54.00 44.00 46.00 55.00 48.00 58.00 46.00 54.00 48.00 54.00 49.00 43.00 45.00 53.00 44.00 55.00 43.00 52.00 53.00 56.00 46.00 51.00 53.00 51.00 50.00 59.00 45.00 45.00 48.00
31.00 28.00 24.00 26.00 21.00 25.00 26.00 26.00 29.00 25.00 27.00 26.00 27.00 20.00 22.00 20.00 22.00 23.00 20.00 25.00 21.00 24.00 20.00 19.00 16.00 18.00 24.00 24.00 28.00 22.00 21.00 29.00 22.00 23.00 23.00 31.00 23.00 22.00 26.00
0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
45
Cuaderno de prcticas de SPSS para Anlisis de Datos I 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 1 0 1 1 1 1 1 0 1 0 1 1 1 1 0 1 0 0 1 0 0 1 0 0 1 1 1 1 0 1 1 1 1 1 0 0 0 0 1 28 34 29 29 29 28 25 30 46 40 28 26 40 32 31 32 28 29 27 28 29 25 24 30 26 29 27 33 30 33 29 30 27 32 32 31 29 27 30 65 41 60 71 68 63 75 42 65 55 57 70 63 58 45 66 58 47 69 47 41 73 54 48 65 56 66 63 61 64 73 73 83 83 50 50 51 51 57 1.65 1.53 1.59 1.71 1.67 1.61 1.88 1.54 1.83 1.69 1.71 1.86 1.77 1.71 1.57 1.80 1.72 1.59 1.83 1.59 1.52 1.87 1.67 1.60 1.77 1.66 1.77 1.73 1.75 1.73 1.83 1.83 1.93 1.93 1.62 1.62 1.63 1.63 1.62
ZAMORA MADRID MADRID VALLADOLID VALLADOLID VALLADOLID VALLADOLID BARCELONA MURCIA ALICANTE PALENCIA MADRID NAVARRA VALLADOLID BURGOS BURGOS BURGOS BURGOS MADRID BARCELONA BURGOS BURGOS MADRID BURGOS ASTURIAS ASTURIAS ASTURIAS LAS PALMAS LAS PALMAS LAS PALMAS SANTA CRUZ SANTA CRUZ BALEARES LEON LEON MADRID MADRID LEON LEON
29 46 46 28 28 28 28 30 48 35 24 46 49 28 22 22 22 22 46 30 22 22 46 22 12 12 12 13 13 13 14 14 44 23 23 46 46 23 23
23.00 14.00 10.00 25.00 13.00 21.00 21.00 13.00 20.00 18.00 14.00 19.00 11.00 25.00 21.00 16.00 21.00 12.00 17.00 17.00 22.00 13.00 18.00 24.00 20.00 20.00 20.00 18.00 13.00 20.00 19.00 17.00 23.00 16.00 23.00 18.00 10.00 17.00 21.00
29.00 19.00 22.00 22.00 24.00 21.00 28.00 32.00 20.00 26.00 26.00 29.00 19.00 26.00 27.00 30.00 28.00 30.00 18.00 31.00 19.00 21.00 25.00 27.00 29.00 32.00 26.00 22.00 25.00 25.00 27.00 24.00 30.00 29.00 31.00 20.00 27.00 23.00 24.00
9.89 48.41 102.72 16.66 15.66 15.70 84.72 46.94 19.77 93.36 12.38 9.05 85.72 15.05 76.81 37.34 83.78 30.45 6.34 71.44 80.90 23.74 21.85 23.66 45.13 86.94 17.02 23.72 23.51 9.64 19.28 34.84 40.44 17.49 17.80 87.70 80.15 86.35 24.91
47.00 39.00 39.00 44.00 44.00 38.00 40.00 39.00 40.00 38.00 40.00 42.00 35.00 42.00 39.00 45.00 38.00 38.00 36.00 47.00 40.00 40.00 47.00 40.00 29.00 47.00 48.00 40.00 47.00 37.00 40.00 41.00 39.00 42.00 41.00 53.00 42.00 43.00 33.00
55.00 49.00 44.00 56.00 41.00 47.00 52.00 45.00 45.00 42.00 44.00 50.00 42.00 48.00 45.00 45.00 43.00 50.00 43.00 52.00 45.00 42.00 46.00 45.00 44.00 52.00 53.00 38.00 46.00 44.00 46.00 45.00 46.00 42.00 44.00 54.00 49.00 49.00 43.00
58.00 43.00 43.00 50.00 46.00 51.00 47.00 50.00 51.00 41.00 42.00 50.00 37.00 46.00 46.00 45.00 47.00 47.00 44.00 56.00 44.00 45.00 46.00 51.00 50.00 60.00 60.00 46.00 47.00 46.00 44.00 51.00 48.00 60.00 44.00 59.00 51.00 46.00 44.00
22.00 19.00 25.00 29.00 17.00 34.00 24.00 21.00 30.00 28.00 25.00 24.00 24.00 26.00 23.00 26.00 24.00 24.00 25.00 17.00 25.00 26.00 25.00 29.00 20.00 29.00 18.00 17.00 26.00 24.00 23.00 23.00 24.00 25.00 19.00 22.00 18.00 27.00 23.00
0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0
46
Cuaderno de prcticas de SPSS para Anlisis de Datos I 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 0 0 1 0 1 1 1 1 1 0 0 0 0 0 0 1 0 1 0 0 0 1 0 1 0 1 1 1 1 1 1 0 0 1 1 1 0 0 0 29 32 37 37 36 28 34 29 31 30 29 29 30 28 28 27 30 24 26 28 25 26 25 25 25 30 34 31 31 28 27 25 26 25 33 30 29 28 26 45 58 57 46 69 65 73 73 73 60 62 57 51 51 52 86 59 69 53 53 47 76 47 76 47 73 71 80 83 73 78 60 55 85 68 83 49 49 49 1.56 1.71 1.62 1.57 1.75 1.70 1.79 1.78 1.78 1.73 1.75 1.69 1.62 1.62 1.63 1.93 1.71 1.73 1.64 1.64 1.57 1.81 1.57 1.81 1.57 1.77 1.74 1.83 1.85 1.73 1.78 1.72 1.66 1.86 1.66 1.83 1.59 1.59 1.59
LEON VALENCIA ASTURIAS ASTURIAS MADRID ASTURIAS ASTURIAS ASTURIAS BARCELONA ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS MADRID MADRID ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS ASTURIAS MADRID ASTURIAS MADRID ASTURIAS MADRID ASTURIAS ASTURIAS
23 37 12 12 46 12 12 12 30 12 12 12 12 12 12 12 12 12 12 12 12 12 12 46 46 12 12 12 12 12 12 12 46 12 46 12 46 12 12
20.00 15.00 27.00 29.00 9.00 26.00 18.00 24.00 26.00 21.00 15.00 19.00 15.00 21.00 17.00 17.00 11.00 16.00 19.00 14.00 17.00 18.00 23.00 19.00 26.00 19.00 15.00 20.00 21.00 20.00 21.00 24.00 16.00 15.00 27.00 25.00 16.00 14.00 20.00
28.00 28.00 31.00 28.00 25.00 29.00 24.00 31.00 30.00 31.00 26.00 20.00 23.00 27.00 17.00 29.00 17.00 21.00 26.00 30.00 29.00 25.00 26.00 32.00 30.00 29.00 27.00 31.00 27.00 18.00 25.00 26.00 26.00 24.00 31.00 29.00 32.00 23.00 27.00
114.86 121.23 41.25 62.63 14.66 18.02 32.66 13.60 9.61 46.77 46.57 38.36 109.19 22.62 53.51 17.02 104.56 15.61 49.23 98.59 29.01 9.50 49.60 7.80 29.81 32.27 101.57 11.65 14.35 30.40 13.68 85.70 22.16 10.94 23.18 12.49 55.12 102.19 78.66
46.00 47.00 40.00 40.00 42.00 37.00 47.00 46.00 35.00 41.00 39.00 36.00 43.00 40.00 46.00 45.00 39.00 51.00 49.00 40.00 40.00 42.00 45.00 46.00 34.00 46.00 37.00 41.00 41.00 37.00 37.00 46.00 45.00 35.00 33.00 35.00 44.00 36.00 40.00
58.00 39.00 42.00 52.00 44.00 44.00 50.00 50.00 43.00 41.00 43.00 49.00 46.00 44.00 55.00 41.00 43.00 55.00 46.00 43.00 49.00 49.00 59.00 54.00 46.00 52.00 37.00 52.00 48.00 45.00 42.00 48.00 53.00 41.00 45.00 50.00 46.00 50.00 41.00
51.00 49.00 44.00 50.00 43.00 43.00 59.00 57.00 48.00 44.00 45.00 57.00 44.00 44.00 56.00 47.00 45.00 54.00 47.00 47.00 50.00 52.00 47.00 51.00 45.00 46.00 48.00 52.00 52.00 50.00 43.00 49.00 45.00 44.00 44.00 49.00 51.00 45.00 44.00
25.00 16.00 20.00 13.00 19.00 24.00 15.00 23.00 24.00 26.00 25.00 29.00 31.00 28.00 43.00 22.00 27.00 29.00 20.00 25.00 24.00 25.00 14.00 20.00 13.00 26.00 22.00 34.00 23.00 27.00 24.00 23.00 23.00 24.00 14.00 15.00 26.00 22.00 14.00
1 0 0 0 0 0 1 1 1 0 0 1 0 0 1 1 0 1 1 0 0 1 0 1 0 1 1 1 1 1 1 0 0 1 1 1 1 0 0
47
Cuaderno de prcticas de SPSS para Anlisis de Datos I 193 194 195 196 197 198 199 200 0 1 1 0 1 0 1 0 27 26 26 25 24 26 24 27 56 92 73 50 82 51 78 45 1.67 1.93 1.73 1.60 1.82 1.61 1.78 1.54
ASTURIAS ASTURIAS ASTURIAS ALAVA ASTURIAS ASTURIAS ASTURIAS MADRID
12 12 12 50 12 12 12 46
0 1 1 0 1 0 0 0
48
_____________________________________________________________________________
En este anexo se incluyen 2 prcticas que se realizarn en las clases prcticas de Anlisis de Datos en Psicologa I con el SPSS. Cuando tu profesor te lo indique, tendrs que llevar a clase este documento y contestar a las preguntas que se incluyen en l. La prctica se refiere a UN CUESTIONARIO diferente al que estamos utilizando en las clases prcticas. Se trata de una Encuesta sobre Ocio y Tiempo libre que consta de 20 preguntas y fue contestada por 717 jvenes. Las preguntas de dicho cuestionario se incluyen en este anexo y los datos correspondientes se encuentran en el fichero ejercicios.sav que se puede descargar desde:
http://www.uam.es/personal_pdi/psicologia/carmenx/Practicas2.html
Para resolver esta prctica en las clases, es imprescindible que lleves este documento y tu diquette 3 con el fichero ejercicios.sav.
y
IMPORTANTE: Antes de contestar a cada pregunta de las prcticas debes leer detenidamente la denominacin (en maysculas) y descripcin de cada pregunta del cuestionario (ver las dos siguientes pginas). Por ejemplo, la variable OCIO oscila entre 1 y 6 (Donde 2: hacer deporte, 6: leer, etc.). No debe confundirse con la variable HORAS, que se refiere a las horas destinadas al ocio por semana.
CUESTIONARIO
Durante el ao 1999, se realiz una Encuesta sobre la Juventud Espaola. La muestra era de 10.000 jvenes, de la que hemos seleccionado tan slo aquellos entrevistados con estudios universitarios (717 sujetos). De las 60 preguntas de que constaba el cuestionario, el archivo de datos (ejercicios.sav) slo recoge las 16 preguntas que aparecen a continuacin, tal como se plantearon a los entrevistados. Los nombres que tienen las variables en el archivo de datos aparecen EN MAYSCULA y NEGRITA.
A partir de la prctica n 2, el alumno recibir una hoja con una serie de preguntas que tendr que responder, utilizando SPSS, y que versarn sobre los conceptos utilizados en dicha prctica.
OCIO P.1 Para empezar y refirindonos a lo que haces en tus das de ocio, quisiramos saber cul es la actividad que ms te gusta hacer fuera de casa cuando dispones de tiempo libre? - Beber, ir de copas, bailar - Hacer deporte - Viajes, excursiones - Ir al cine, al teatro - Ir a museos, ir a conciertos - Leer 1 2 3 4 5 6
OCIO
P.2 En total, cuntas horas libres tienes a la semana para tu ocio o diversin? _______ HORAS
P.3 Aproximadamente y por trmino medio, cuntas horas semanales dedicas a ver la televisin? __________ FAMILIA P.4 Cmo diras que ha sido tu infancia, la definiras como... - La etapa ms feliz de tu vida - Una etapa ms feliz que otras - Una etapa igual de feliz que otra - Una etapa menos feliz que otras - La etapa menos feliz de tu vida 1 2 3 4 5 TV
INFANCIA
P.5 Podras decirme cul es tu grado de dedicacin en las siguientes tareas de tu hogar? 1. No suelo hacerlo nunca 2. Slo lo hago en ocasiones 3. Comparto esta tarea con otra/s personas 4. Recae en m toda la responsabilidad, y suelo hacerlo siempre - Hacer la cama - Limpiar la casa - Cuidar de los hijos o hermanos pequeos P.6 Cuntos hijos crees que llegars a tener? P.7 Y en el plano ideal, cuntos hijos te gustara llegar a tener? Llegar a tener 1 2 3 HIJOS1 4 5 0 Le gustara 1 2 3 HIJOS2 4 5 0 1 2 3 4 1 2 3 4 1 2 3 4 CAMA LIMPIAR NIOS
P.8 En cul de las siguientes situaciones te encuentras? - Tienes novio/a formal - Ahora no tienes novio/a formal - Hasta ahora slo has tenido relaciones afectivas pasajeras - Nunca has tenido una relacin afectiva especial con un chico/a 1 2 3 4 AMOR
49
PRACTICAS SPSS.
ANALISIS DE DATOS I.
CULTURA P. 9 Vamos a hablar ahora de tus estudios. En qu centro realizaste la totalidad o la mayor parte de tus estudios? - En un centro estatal, pblico - En un centro privado no religioso - En un centro privado religioso 1 2
COLEGIO 3
P.10 Excluyendo los libros de texto, cuntos libros has ledo en los ltimos doce meses? ____________ LIBROS
ACTITUDES P.11 Cmo te defines en materia religiosa? - Catlico practicante 1 - Catlico no practicante 2 - Creyente de otra religin 3 - No creyente 4 - Indiferente 5
RELIGION
P.12 Cuando se habla de poltica se utilizan normalmente las expresiones izquierda y derecha. En qu casilla te colocaras? ESCALA +---------------------------------------+ Izda. | | | | | | | | | | | Dcha. +---------------------------------------+ 01 02 03 04 05 06 07 08 09 10
INGRESOS P.13 Qu cantidad aproximadamente de dinero (en miles de pesetas) ingresas al mes por cada uno de los conceptos siguientes? Ingresos personales ________________ INGRESO1 Ingresos de tu pareja ________________ INGRESO2 Aportaciones familiares _______________ INGRESO3
P.14 Actualmente, entre todos los miembros de tu hogar y por todos lo conceptos, de cuntos ingresos netos (sin descuentos) disponis por trmino medio en tu hogar al mes? - Menos o igual a 50.000 pts. - De 50.001 a 100.000 pts. - De 100.001 a 150.000 pts. - De 150.001 a 200.000 pts. - De 200.001 a 300.000 pts. - De 300.001 a 400.000 pts. - De 400.001 a 500.000 pts. - De 500.001 a 750.000 pts. - De 750.001 a 1 Milln de pts. - Ms de 1 Milln de pts. 01 02 03 04 05 06 07 08 09 10
INGRESOT
1 2
GENERO
50
1. Cuntas variables tiene el archivo de datos? ___________________________________________ 2. Qu variable ocupa el lugar n 10? ___________________________________________________ 3. Cuntos sujetos forman parte de la muestra? ____________________________________ 4. Qu puntuacin obtuvo el sujeto n 24 en la variable ESCALA? ____________________ 5. Indique el nivel de medida de las siguientes variables (para responder consulte la descripcin de la pregunta correspondiente en el cuestionario, pues en la vista de variables del SPSS no se muestra correctamente): OCIO ________________________________________________________ HORAS ________________________________________________________ INGRESOT ________________________________________________________ 6. Escriba el nombre de una variable, distinta a las tres anteriores medida a nivel Nominal _____________________________________________________ Ordinal _____________________________________________________ Cuantitativa discreta ___________________________________________________ Cuantitativa continua ___________________________________________________ 7. Elabore la distribucin de frecuencias de la variable INGRESOT 7.1 Cuntas familias tienen ingresos de cmo mximo 200.000 pts?________________________ 7.2 Qu % de familias tienen ingresos entre 200.001 y 400.000 pts? ________________________ 7.3 Cuntas familias tienen ingresos superiores a 500.000 pts? ____________________________ 8. Elabore la distribucin de frecuencias de la variable EDAD slo para las mujeres de la muestra 8.1 Cuntas mujeres tienen cmo mximo 26 aos?________________________ 8.2 Qu % de mujeres tienen entre 21 y 27 aos? ________________________ 9. Elabore un grfico de barras para cada una de las variables de la pregunta 5 del cuestionario. 9.1 A qu variable corresponde el siguiente grfico?
60 50 Porcentaje 40 30 20 10 0
lo S C N o o el su R ae ec r pa om lo go ha n nu en
to
rlo ce ha
ta es
en as oc
a o sp re
a re ta
51
10. Qu % de entrevistados tienen o han tenido algn tipo de relacin afectiva? (pregunta 8 del cuestionario) 11. Conteste a las siguientes preguntas, todas ellas referidas a la variable TV (pregunta 3 del cuestionario)
11.10 Qu valores, en el grupo de varones, comprende el 5 tallo del diagrama de tallo y hojas?
11.11 Qu grupo (varones o mujeres) es ms heterogneo? _____________________________ En qu indicador de variabilidad se ha basado para responder? ___________________
11.12 Represente grficamente la variabilidad en TV para varones y mujeres.
12. Qu porcentaje de entrevistados nacieron antes del ao 1978? ____________________________________ 13. Con las variables de la pregunta 13 del cuestionario (INGRESO1, INGRESO2, INGRESO3) elabore la nueva variable TOTALES = INGRESO1 + INGRESO2 + INGRESO3. 13.1 La media de la nueva variable TOTALES es: ____________ y la varianza es: ____________ . 13.2 Compruebe, mediante las propiedades de la media, si la media en TOTALES resulta igual si se calcula a partir de las medias en las variables INGRESO1, INGRESO2 e INGRESO3.
13.3 Convierta la variable TOTALES (que est en pesetas) en la variable EUROS (1 euro = 166,386 pts) y diga cul es la media de EUROS: ________________________________________
52
I. ABRIR ARCHIVO
Archivo > Abrir > Datos
Cada variable del fichero corresponde a cada pregunta del cuestionario. Por ejemplo, la variable ocio corresponde a la pregunta 1, que tiene 6 opciones de respuesta, la variable horas a la pregunta 2, que es una pregunta abierta en la que se indica el nmero de horas que se dedican al ocio, etctera. Es conveniente, tener el cuestionario delante para comprobar a qu variable se refiere cada pregunta, pues el cuestionario indica en maysculas la variable de SPSS que corresponde a cada pregunta.
53
II. FRECUENCIAS
Analizar > Estadsticos Descriptivos > Frecuencias
54
III. DESCRIPTIVOS
Analizar > Estadsticos Descriptivos > Descriptivos
IV. EXPLORAR
Analizar > Estadsticos Descriptivos > Explorar
55
2.4. Compruebe cmo se obtendra la correlacin de Pearson entre INGRESO1 e INGRESO2 si solo se utilizan los datos que aparecen en la matriz de varianzas-covarianzas obtenida en el apartado 2.2.
3.2. Calcule a partir de la matriz de varianzas-covarianzas entre las variables INGRESO1 e INGRESO2 (obtenida en el apartado 2.2.), el valor de la varianza de la variable INPAREJA.
56
4.5. Descomponga la varianza del criterio. Segn lo obtenido, la varianza explicada es: __________________ y la no explicada es: ___________________________.
5.1.
5.2. Elabore la distribucin marginal de porcentajes de la variable AMOR 5.3. Elabore la distribucin condicional, en porcentajes, de la variable OCIO respecto a los que tienen novio formal en la variable AMOR 5.4. Elabore la distribucin condicional, en porcentajes, de la variable situacin afectiva (AMOR) respecto a los que en su tiempo de ocio se dedican a viajar (OCIO) 6. INTERPRETACIN DE TABLAS DE CONTINGENCIA Elabore una tabla de contingencia con las variables RELIGIN (columna) y COLEGIO (fila). RELIGIN COLEGIO Elabore las tablas de distribuciones condicionales (% columna y % fila) entre ambas variables y conteste a las siguientes preguntas: 6.1. % de entrevistados que se declaran no-creyentes ___________________________________________ 6.2. % de entrevistados que han cursado estudios en un colegio pblico _____________________________ 6.3. % de no-creyentes que han cursado estudios en un colegio privado religioso _____________________ 6.4. % de alumnos de un colegio pblico que se declaran creyentes de otra religin ____________________
57
I. CORRELACIONES
Archivo > Correlaciones > Bivariadas
58
III. REGRESIN
Analizar > Regresin > Lineal
59
60