You are on page 1of 20

PUNTUACIONES INDIVIDUALES

A.Gonzlez Galn Dpto. MIDE. Uned OBJETIVOS Aprender a elaborar una matriz de datos Codificar adecuadamente los datos procedentes de un estudio Identificar e interpretar correctamente las puntuaciones directas Reconocer cundo es necesario transformar una puntuacin directa Calcular e interpretar correctamente las puntuaciones diferenciales, porcentuales, tpicas, cuantiles y normalizadas Comprender el concepto de distribucin normal Utilizar adecuadamente las tablas de la curva normal Aplicar el modelo de curva normal al clculo de probabilidades asociadas a las puntuaciones individuales

ESQUEMA 1. INTRODUCCIN 2. LA CODIFICACIN DE LAS PUNTUACIONES INDIVIDUALES: PUNTUACIONES DIRECTAS (XI) 3. PROBLEMAS DE INTERPRETACIN DE LAS PUNTUACIONES DIRECTAS: TRANSFORMACIONES PERMISIBLES 3.1. PUNTUACIONES PROPORCIONALES Y PORCENTUALES 3.2. LAS PUNTUACIONES DIFERENCIALES 3.3. LAS PUNTUACIONES TPICAS 3.4. PUNTUACIONES TIPIFICADAS O ESCALAS DERIVADAS 3.5. LAS PUNTUACIONES CUANTILES 4. LAS PUNTUACIONES TPICAS EN LA CURVA NORMAL 4.1. LAS PUNTUACIONES INDIVIDUALES NORMALIZADAS BIBLIOGRAFA

---------------------------

Introduccin
Como hemos visto, la medicin es uno de los problemas ms graves en educacin y en psicologa. Cuando medimos la altura o el peso de un sujeto, realizamos una medida exacta de dichas caractersticas. Pero, cuando lo que medimos son caractersticas como la inteligencia, el rendimiento o la personalidad, obtenemos tambin medidas exactas? La respuesta es negativa. En este tipo de medidas, se acepta que se comete algn tipo de error de medida. Pensemos que

nos estamos enfrentando en muchas ocasiones a la medida de lo que se denominan constructos, es decir, caractersticas de las personas que no son directamente mensurables. Lo que medimos son las manifestaciones observables que atribuimos a dichos constructos. As, por ejemplo, cuando medimos la inteligencia a travs de un test, lo que medimos son las manifestaciones observables que tericamente atribuimos a la inteligencia, como la capacidad verbal, numrica, abstracta, etc. que son ms fcilmente mensurables. Se sigue el mismo procedimiento para medir el rendimiento acadmico, la memoria, la capacidad de resolucin de problemas, las aptitudes, las actitudes, etc. En la investigacin psico-educativa tambin se utilizan variables que permiten una medicin exacta como la edad, el curso escolar o el nmero de hermanos. Si realizramos una investigacin sobre la ansiedad ante los exmenes, tambin podramos obtener medidas fiables como el ritmo cardaco o la presin arterial. Lo que debe quedar claro es que necesitamos uno o varios instrumentos adecuados para recoger los datos que iluminen la investigacin. Una vez elaborados los instrumentos de medida, se aplican a la muestra, se recogen los datos (puntuaciones de los sujetos) y se elabora la matriz de datos. La matriz de datos es simplemente una tabla de doble entrada en la que las filas representan a los sujetos y las columnas a las distintas variables medidas. Los noveles pueden configurarla en cualquier hoja de clculo, aunque lo ms usual en la investigacin es utilizar programas estadsticos avanzados como el SPSS. Veamos un ejemplo: Esta matriz de datos, construida con una conocida hoja de clculo, muestra 23 sujetos (las filas)

a los que se les ha aplicado cinco pruebas distintas (las cinco ltimas columnas; la primera es el nmero de identificacin de cada sujeto). La primera fila contiene los nombres de las variables (EF1, EF2, etc.). Por tanto, el sujeto 1 tiene una puntuacin de 37,04 en la primera prueba (EF1), de 3 en la segunda (EF2) y no realiz las tres siguientes. Pues bien, esta ser siempre la forma de realizar la matriz de datos, ya sean los datos numricos o alfanumricos (caracteres): las filas son los sujetos y las columnas las variables.

2. Codificacin de las puntuaciones individuales: directas (Xi)


Una puntuacin directa (Xi), es la puntuacin que obtiene un sujeto tras aplicarle un instrumento de medida (una pregunta, un test, una escala, etc.). Segn hemos podido ver en captulos anteriores, existen distintos tipos de niveles de medida de las variables (nominal, ordinal, intervalo, etc.). El nivel de medida de las variables tiene repercusiones en la forma de codificar los datos. La codificacin consiste en la asignacin de nmeros o caracteres a los valores de la variable. As, por ejemplo, cuando tenemos un grupo de alumnos medidos en distintas variables, podemos encontrarnos que algunas de ellas son de tipo clasificatorio (nivel nominal), como el sexo y el grupo o el centro al que pertenecen, y otras con nivel de medida de intervalo como las puntuaciones obtenidas en distintas pruebas objetivas. Cuando tenemos variables con nivel de medida nominal podemos codificarlas con nmeros, con letras o de forma alfanumrica (letras y nmeros). Es decir, cuando asignemos los posibles valores de la variable a la variable sexo, podremos asignarle indistintamente cualquier letra o nmero a dichos valores: Valores de la variable y nombre Codificacin o asignacin de nmeros o (etiquetas) de los valores caracteres a los valores Hombre 0 1 A A1 SEXO Mujer 1 0 B A2 Verdaderamente, cuando utilizamos una variable de clasificacin, como su valor no indica magnitud, tenemos cualquier posibilidad de asignacin de nmeros a los valores de la variable. Sin embargo, cuando nos enfrentamos con variables con nivel de medida ordinal, de intervalo o de razn, debemos transcribir la puntuacin obtenida por el sujeto en la variable (un 110 en cociente intelectual, un 8,5 en rendimiento, un 18 en actitud, 4 hijos, etc.), ya que dicho valor le sita a lo largo de un continuo que indica la magnitud o el grado de presencia de dicha caracterstica en el sujeto. Variable El proceso de codificacin de las variables debe hacerse antes de la aplicacin de los instrumentos, de modo que puede llegar a construirse el denominado libro de cdigos. En el libro de cdigos aparecen las variables en el mismo orden en el que aparecern en la matriz de datos (fichero de datos). En primer lugar se pone el nombre de la variable tal y como aparecer en el fichero de datos y que generalmente no podr superar los ocho caracteres (limitacin de los programas de anlisis). A continuacin, si es necesario, se le asigna una etiqueta, es decir, un nombre ms largo o una descripcin breve de la variable. Por ejemplo, EF1 podra ser el nombre de la variable, y Evaluacin formativa n 1 su etiqueta. Posteriormente se anotan los posibles valores de la variable (cdigos) y, si procede, se les asigna tambin una etiqueta a dichos valores. En el caso de variables continuas basta con escribir el recorrido de la escala (por ejemplo 5-20).

Si tuviramos, por tanto, la variable nivel socioeconmico medida con un nivel ordinal (alto, medio y bajo), podramos codificarla del siguiente modo: Cdigos Etiqueta Valores 1 bajo Nivel NSOCEC 2 medio socioeconmico 3 alto Despus hay que asignar el nmero correspondiente a los valores perdidos o valores missing. Un valor perdido es el un valor en una variable desconocido para un sujeto particular, bien porque no se le ha podido medir en dicha variable, bien porque el sujeto no haya contestado a lo que se le pregunta por despiste o deliberadamente. En la codificacin de los valores perdidos (especialmente en las encuestas) puede distinguirse entre no contesta, dejando la casilla en blanco, valor que suele llamarse missing del sistema y no sabe, valor al que se le asigna un nmero fijo (tiene que ser un valor fuera del recorrido de la variable, frecuentemente un 9 o un 99) y recibe el nombre de missing del usuario. Una vez que hayamos aplicado los instrumentos de medida, partiendo del libro de cdigos, debemos construir el fichero de datos, fichero que contiene la matriz de datos. La matriz de datos no proporciona gran informacin con un simple golpe de vista, menos an cuando tenemos muchos sujetos y muchas variables. Por tanto, procede ordenar y categorizar los datos, de modo que podamos apreciar mejor las caractersticas del grupo en cada una de las variables. Este primer anlisis recibe el nombre de estadstica descriptiva, y nos referiremos a l posteriormente. En cualquier caso, para explicar otro tipo de puntuaciones individuales, tenemos que referirnos necesariamente a los dos ndices ms importantes utilizados para describir un grupo de sujetos: la media aritmtica y la desviacin tpica. Nombre Etiqueta

X=

Suma de todas las puntuaciones Nmero total de puntuaciones

X=

xi N

Generalmente, para describir a un grupo de sujetos, primero se estudia su tendencia central, es decir, hacia qu puntuacin tiende. El ndice ms conocido es la media aritmtica, que se calcula sumando todas las puntuaciones y dividiendo dicha suma por el nmero total de puntuaciones. Su smbolo es x (si se trata de un estadstico) o (si se trata de un parmetro). Despus de aplicar la frmula, podramos obtener que el cociente intelectual medio (la media aritmtica) de un grupo de cuatro sujetos es 104. Sin embargo, este dato por s solo nos proporciona suficiente informacin como para hacernos una idea del grupo. La mayora de los sujetos tiene unas puntuaciones cercanas a 104 o hay sujetos con puntuaciones muy altas y muy bajas? En otras palabras, nos estamos preguntando si el grupo es homogneo en torno a la media (la mayora de las puntuaciones estn cerca de 103) o heterogneo (muchas puntuaciones distan considerablemente de la media, tanto por arriba como por abajo). Dicho de otra forma, hay o no hay dispersin de las puntuaciones en torno a la media aritmtica?

Veamos un ejemplo sencillo. Supongamos que tenemos dos grupos de cuatro sujetos cada uno a los que pasamos un test de inteligencia. Los resultados son los siguientes: La media aritmtica es la misma en los dos grupos y, sin embargo, son grupos muy diferentes. Por esta razn, el ndice de tendencia central debe ir acompaado por un ndice de dispersin o variabilidad que indique en qu medida las puntuaciones de los Grupo 1 Grupo 2 sujetos se dispersan o varan en torno a la media aritmtica. Este X1= 104 X1= 80 ndice (existen otros) se denomina desviacin tpica y se X2= 104 X2= 80 representa por s (estadstico) o (parmetro). Como podr X3= 104 X3= 128 deducirse, la desviacin tpica del primer grupo ser igual a cero puesto que el grupo es absolutamente homogneo, no hay ninguna X4= 104 X4= 128 desviacin de la media aritmtica. Otro ndice muy utilizado para x = 104 x = 104 expresar la variabilidad de los grupos es la varianza (s2 o 2). Conceptualmente se interpreta exactamente igual que la desviacin tpica. Su clculo se realiza elevando al cuadrado la desviacin tpica. Veamos la frmula para su clculo:
s= (Suma de las diferencias entre cada puntuacin directa y la media aritmtica) 2 , esto es, Nmero total de sujetos

s=

(x i x ) 2 N

Como puede verse, el numerador expresa las distancias de cada puntuacin directa a la media aritmtica. Dichas distancias se elevan al cuadrado para evitar la distorsin que provocaran las diferencias negativas. Pongamos un ejemplo: Se ha utilizado una terapia para reducir la agresividad en cierto tipo de pacientes. Para probar la efectividad de la terapia, se han formado dos grupos: el grupo experimental (al que se le aplica la terapia) y el grupo de control (al que no se le aplica la terapia). Despus de la aplicacin de la terapia al grupo experimental, se utiliza un instrumento para medir el grado de agresividad (supongamos una escala 0 50 puntos) en los dos grupos. Los resultados son los siguientes: GRUPO GRUPO DE EXPERIMENTAL CONTROL x = 28 x = 41 s=7 s = 12 N = 50 N = 50 Este tipo de tablas es muy frecuente encontrarlas en informes y artculos de investigacin. En sta puede observarse que cada grupo est formado por 50 sujetos. Comparando las medias aritmticas se deduce que la terapia parece haber producido un efecto beneficioso para reducir la agresividad, puesto que los sujetos del grupo experimental presentan una media 13 puntos ms baja que los del grupo de control, que no han sido sometidos al tratamiento. Por otra parte, la desviacin tpica es ms baja en el grupo experimental, lo que nos indica que los sujetos estn

ms igualados entre s en cuanto al nivel de agresividad que los del grupo de control, en donde habr mayores diferencias inter-individuales. Una vez comprendidos los conceptos de media y desviacin, podemos pasar a explicar la transformacin de las puntuaciones directas en otro tipo de puntuaciones.

3. Problemas de interpretacin transformaciones permisibles

de

las

puntuaciones

directas:

Una puntuacin directa (Xi) es la puntuacin que obtiene un sujeto al aplicarle un instrumento de medida. Supongamos que hemos elaborado una prueba objetiva de 40 preguntas o tems para evaluar el rendimiento de los alumnos en Literatura. Un sujeto obtiene una puntuacin directa de 18 puntos (X1 = 18). En un momento posterior del curso, elaboramos una segunda prueba objetiva, esta vez de 20 tems, en la que este alumno obtiene la misma puntuacin (X2 = 18). Son comparables estas dos puntuaciones directamente? Parece claro que no, puesto que el recorrido de la variable rendimiento en Literatura es distinto en las dos pruebas (0-40 frente a 0-20 respectivamente). En el primer caso sera una puntuacin medio-baja, mientras que en el segundo sera una puntuacin excelente. En consecuencia, necesitamos transformar las puntuaciones X1 y X2 para poderlas comparar correctamente. Veamos distintas posibilidades de transformacin. 3.1. Puntuaciones proporcionales y porcentuales

Una forma rpida y sencilla de comparar aquella Xi = 18 en las dos pruebas es convertirla en una proporcin (n de respuestas correctas / n total de preguntas) de respuestas correctas o un porcentaje de respuestas correctas (multiplicando la proporcin por cien). De este modo, este sujeto ha tenido en el primer test una proporcin de respuestas correctas de 0,45 (18/40), frente a una proporcin de 0,9 (18/20) en el segundo. O lo que es lo mismo, un 45 % de aciertos en la primera prueba frente a un 90 % en la segunda. Evidentemente, ahora se pueden comparar los resultados en ambas pruebas, concluyendo que el resultado ha sido mucho mejor en la segunda prueba que en la primera. Sin embargo, no siempre es posible ni pertinente hacer esta transformacin. Por ejemplo, si hemos construido un instrumento para evaluar la calidad de un profesor a partir de la opinin de los alumnos u otro para evaluar la actitud hacia el estudio, no se puede hablar de respuestas correctas e incorrectas. Si tenemos una escala de actitud hacia el estudio con un recorrido de 0 a 50 puntos, una Xi de 30 puntos manifiesta cierta actitud hacia el estudio, pero no es transformable en un porcentaje de respuestas correctas. Por otra parte, cuando decamos anteriormente que un sujeto que obtiene un 45 % de respuestas correctas en una prueba objetiva se corresponde con un resultado medio-bajo o que un 90 % implica un resultado excelente es discutible. Por qu? La respuesta es sencilla. Podra ocurrir que el test hubiese sido tan difcil, que el sujeto que obtuvo un 45 % de aciertos fue el mejor de su grupo. Entonces, quizs podramos interpretar que esta puntuacin no fue tan mala. En el caso

de la actitud hacia el estudio, una puntuacin de 30 puntos puede parecer una puntuacin media teniendo en cuenta el recorrido de la variable. Pero probablemente podramos interpretar mejor dicha puntuacin si la comparamos con las puntuaciones del grupo al que hemos aplicado el instrumento de medida. 3.2. Las puntuaciones diferenciales

Una puntuacin diferencial (x) es una puntuacin individual relativa a la media aritmtica del grupo de referencia. Por tanto, para calcular una puntuacin diferencial es necesario haber aplicado un instrumento de medida a un grupo de sujetos. Para calcularla, simplemente se le resta a la puntuacin directa del sujeto la media aritmtica del grupo al que pertenece. Por tanto, una puntuacin directa superior a la media aritmtica ser una puntuacin diferencial

x = xi - x
positiva, mientras que si es inferior a la media, ser negativa. Siguiendo con el ejemplo anterior, si en la primera prueba la x = 23 y en la segunda x = 9, tendramos que las puntuaciones diferenciales del sujeto en cada prueba son, respectivamente,

x1 = x1 - x = 18 23 = -5

x2 = x2 - x = 18 9 = 9
Ahora bien, una puntuacin diferencial slo nos permite saber si una puntuacin est por encima o por debajo de la media aritmtica, pero de nuevo nos encontramos con el mismo problema que en las puntuaciones directas. Son comparables dos puntuaciones diferenciales que proceden de distintos instrumentos de medida? Una puntuacin diferencial de 2 en la primera prueba significa lo mismo que esa misma puntuacin en la segunda prueba? Evidentemente, no es lo mismo separarse dos puntos de la media cuando tenemos un recorrido de 5 puntos que cuando el recorrido es de 100 puntos. Necesitamos, por tanto, una puntuacin que permita situar a un sujeto con respecto a su grupo de referencia y que permita hacer comparaciones independientemente de la amplitud del instrumento del que procedan las puntuaciones directas que deseamos comparar. Consecuentemente, las puntuaciones diferenciales no son muy utilizadas como puntuaciones individuales. Sin embargo, s son muy utilizadas en el clculo de otras puntuaciones (las puntuaciones tpicas) y de algunos ndices, como los ndices de variabilidad. Ntese que el numerado de la frmula de la desviacin tpica hay una puntuacin diferencial. 3.3. Las puntuaciones tpicas

Una puntuacin tpica (z) indica el nmero de desviaciones tpicas que se desva una puntuacin directa de la media aritmtica. Las dos propiedades ms importantes de las puntuaciones tpicas

es que la media de dichas puntuaciones es igual a cero y la desviacin tpica igual a uno. Trataremos de clarificar esta definicin y sus propiedades en los prrafos siguientes. Las puntuaciones tpicas son un tipo de puntuaciones muy utilizadas porque nos permiten comparar cualquier puntuacin entre s, independientemente del instrumento de medida o de la amplitud de la escala utilizada. Sigamos con el ejemplo anterior: tenemos dos tests de rendimiento en Literatura, uno de 40 preguntas y otro de 20. Si en ambos tests un sujeto obtiene una Xi = 18, esta puntuacin no significa lo mismo. Sin embargo, s podemos compararlas si las convertimos en puntuaciones tpicas, que son unas puntuaciones relativas a la media y la desviacin tpica del grupo, tal y como se ve en la frmula siguiente:

Z =

Xi - x s

Z =

x s

De ella se desprende, como en las puntuaciones diferenciales (numerador de la frmula), que a toda puntuacin directa superior a la media le corresponder una puntuacin tpica positiva, y si es inferior a la media, negativa. La media aritmtica siempre coincide con una Z = 0. Por tanto, si en el test de 40 preguntas, la media es 23 y la desviacin tpica 5, y en el de 20 preguntas la media es 9 y la desviacin tpica 3, para comparar una puntuacin directa de 18 en los dos tests, podemos calcular su puntuacin tpica en ambos aplicando la frmula anterior:

Z =

18 - 23 = 1 5

Z =

18 - 9 =3 3

Esto indica que ha destacado mucho ms respecto al grupo en el primer test (se aleja 3 desviaciones tpicas por encima de la media) que en el segundo (se aleja una desviacin tpica por debajo de la media, puesto que la z es negativa). Debe entenderse que una puntuacin tpica, como hemos dicho, es una puntuacin que depende tanto de la media como de la variabilidad del grupo. En consecuencia, las puntuaciones tpicas variarn dependiendo de la homogeneidad o heterogeneidad del grupo. Si un grupo es muy homogneo, su desviacin tpica ser pequea y, por tanto, a una puntuacin que no se aleje mucho de la media le puede corresponder una puntuacin tpica mucho mayor que la que le correspondera si el grupo fuese heterogneo. Por ejemplo, supongamos que se ha pasado un examen a dos grupos. En ambos la media es de 5,5. El primer grupo es bastante homogneo (todos sacan puntuaciones cercanas a la media), por lo que su desviacin tpica es de s = 0,4. en el segundo grupo la desviacin tpica es de s = 2,5. Qu puntuacin tpica le corresponde en cada grupo a un sujeto que ha sacado un 7 en el examen? En el primer caso la Z = 3,75, mientras que en el segundo la Z = 0,6. Es decir, en el primer grupo, un sujeto con una Xi = 7 se aleja 3,75 desviaciones tpicas (3,75 0,4 = 1,5 puntos) por encima de la media del grupo ( x = 5,5), mientras que en el segundo grupo, un sujeto con la misma puntuacin directa slo se desva 0,6 desviaciones tpicas por encima de la media del grupo. En este sentido se podra decir que la obtencin de un 7 en el primer grupo tiene ms valor o destaca ms (mayor puntuacin tpica) que esa misma puntuacin en el segundo grupo.

Como veremos posteriormente, una de las utilidades ms importantes de las puntuaciones tpicas, tanto es estadstica descriptiva como inferencial, es la correspondencia que existe entre estas puntuaciones y la distribucin normal. De esta forma, se podr saber qu probabilidad existe de obtener determinada puntuacin. 3.4. Puntuaciones tipificadas o escalas derivadas

Las puntuaciones tipificadas consisten en una simple transformacin de las puntuaciones tpicas, creadas con el nimo de evitar las puntuaciones decimales y las negativas. La transformacin se reduce a multiplicar por una constante a la puntuacin tpica, valor que se convertir en la nueva desviacin tpica y sumarle otra constante, valor que se convertir en la nueva media de las puntuaciones tipificadas: T = a z + b, donde b = x , a = s y z = puntuacin tpica

Entre las puntuaciones tipificadas ms usadas, se encuentran las siguientes: T = 10 z + 50 S=2z+5 Entonces, un sujeto con una puntuacin directa igual a la media tendr una puntuacin T = 50 y una S = 5. 3.5. Las puntuaciones cuantiles Un cuantil indica el porcentaje de sujetos que deja por debajo de s una puntuacin determinada. La puntuaciones cuantiles ms utilizadas son los percentiles, que dividen una distribucin de frecuencias en cien partes, de modo que el percentil 85 corresponde a aquella puntuacin directa que deja por debajo de s al 85 % de los sujetos de su grupo. Otros cuantiles utilizados son los deciles (diez divisiones) y los cuartiles (cuatro divisiones). Como podr suponerse, el percentil 75 (P75) es igual al cuartil 3 (Q3), o que el percentil 50 (P50) se corresponde con el decil 5 (D5) y el cuartil 2 (Q2). Como vemos, un cuantil es una medida relativa al grupo de referencia. Es decir, un sujeto puede encontrarse en el P90 y tener una mala puntuacin en valor absoluto. Supongamos que un profesor pone un examen y por diversas razones el grupo no ha estudiado. Un alumno que tuviera un 4 (en una escala 0-10) podra superar al 90 % de los sujetos de su grupo, sin que esto signifique haber sacado una buena nota. Los percentiles son utilizados para construir los baremos de los tests estandarizados. Los tests que encontramos en las casas comerciales y que son utilizados en los centros escolares y los gabinetes psicopedaggicos para la orientacin y el diagnstico, ofrecen siempre la transformacin de las puntuaciones directas en percentiles, con el fin de que podamos

interpretar mejor las puntuaciones. Estos baremos estn construidos con muestras grandes de sujetos, generalmente muestras que pueden considerarse representativas de la poblacin. De este modo, cuando aplicamos un test a un sujeto y transformamos su puntuacin directa en un percentil segn los baremos del test, simplemente estamos situando al sujeto en una posicin (de 1 a 100) en referencia al grupo normativo. Es decir, lo comparamos con lo que es normal en la poblacin. En consecuencia, si nos encontramos entre los percentiles 40 y 60 en cociente intelectual, podemos considerar que tenemos una inteligencia normal en comparacin con el grupo normativo. Existen dos formas de obtener los percentiles. La forma ms sencilla es el clculo de percentiles por el procedimiento denominado clculo directo, esto es, los percentiles correspondientes a cada una de las puntuaciones directas que obtienen los sujetos en el test (si el grupo no es grande los sujetos no obtendrn todas las puntuaciones posibles). Estos percentiles se obtienen directamente al realizar la distribucin de frecuencias y multiplicar por cien las frecuencias relativas a las frecuencias acumuladas (fr 100 / N). Veamos, no obstante, un ejemplo sencillo: ACT1_01 Puntuacin directa 7 6 5 4 3 2 1 Total Frecuencia absoluta 266 131 108 128 107 93 179 1012 Frecuencia relativa * 100 26,3 12,9 10,7 12,6 10,6 9,2 17,7 100,0 Frecuencia acumulada 1012 746 615 507 379 272 179 Porcentaje acumulado 100,0 73,7 60,8 50,1 37,5 26,9 17,7 Percentil Pc 100 74 61 50 38 27 18

El ejemplo que mostramos procede de un estudio sobre las actitudes sociales de los adolescentes (Moraleda, Glez. Galn y G-Gallo1, 1998). Los resultados que se muestran proceden de la respuesta al primer tem de la escala construida al efecto (ACT1_01), cuya formulacin es la siguiente: Cuando un compaero viene a m contndome algo desagradable que le ha pasado, me gusta escucharle y comprenderle. Las respuestas posibles estn escaladas desde 1 (no se da nada en mi) hasta 7 (se da muchsimo en mi). Como vemos, en la primera columna empezando por la izquierda aparecen las puntuaciones directas, es decir, la respuesta numrica elegida por los sujetos. En la segunda columna aparece la frecuencia absoluta. As, la respuesta 1 ha sido elegida por 179 sujetos, la 2 por 93 y as sucesivamente. El nmero total de sujetos que han respondido a la pregunta se halla sumando todas las frecuencias absolutas (N=1012). En la tercera columna aparece la frecuencia relativa multiplicada por cien ((fi /N)*100). Esto nos indica que la respuesta 1 ha sido elegida por el 17,7 % de los sujetos, la respuesta 2 por el 9,2
1

MORALEDA, M.; GLEZ. GALN, A. y G-GALLO, J. (1998): AECS: Actitudes y Estrategias Cognitivas Sociales. Ed. TEA. Madrid.

10

%, etc. La columna siguiente muestra las frecuencias acumuladas. Por fin, el porcentaje acumulado (frecuencia acumulada relativa [fac/N] multiplicada por cien) nos indica el porcentaje de sujetos que deja por debajo de s el lmite superior (puntuacin directa ms 0,5) de una puntuacin determinada. As, por ejemplo, un sujeto con una Xi = 5 supera casi a un 61 % de los sujetos de su grupo. En este caso, los percentiles corresponden a la ltima columna redondeando los decimales. Es decir, un sujeto que obtenga una puntuacin directa de 6 est en el percentil 74. Los percentiles suelen mostrarse ordenados de mayor a menor. En algunas ocasiones hay que calcular percentiles que no aparecen en la distribucin de frecuencias. Por ejemplo, para calcular la mediana (puntuacin de tendencia central que deja por encima y por debajo de s al 50 % de los sujetos de la muestra) necesitamos saber el percentil 50, o para calcular la desviacin semi-intercuartlica (medida de dispersin, ver captulo siguiente) necesitamos los percentiles 25 y 75 (cuartiles 1 y 3). El clculo de estos percentiles se denomina clculo por interpolacin, siendo los nicos percentiles que se expresan con decimales. Este clculo es tambin sencillo. Por ejemplo, para hallar el P25 se puede utilizar la frmula siguiente:

cN fa 100 Pc = L inf(i +1) + i f i (i +1)

25 1012 179 100 P = 1,5 + 1 = 2,5 + 0,80 = 2,3 25 93

En esta frmula, lo primero que se resuelve es el numerador del segundo trmino, que indica el nmero de sujetos correspondientes al percentil 25, esto es, una simple regla de tres. Si 1012 sujetos son el 100 % de la muestra, cuntos sujetos son el 25 %? 25 1012 /100 = 253. Esta cifra debemos buscarla en la columna de las frecuencias acumuladas, quedndonos con las ms alta que no supere dicha cifra, que en nuestro caso es 179, que corresponde a la Xi = 1. Restamos dicha frecuencia al dato anterior (253-179 = 74), para ver cuntos sujetos nos faltan a partir de este intervalo para llegar a los 253 que necesitamos. Este valor lo dividimos por la frecuencia absoluta del intervalo superior (fi = 93) para coger una parte proporcional de la puntuacin de dicho intervalo (nuestra distribucin de frecuencias tiene intervalos de un punto, por lo que el intervalo siguiente, que corresponde a Xi = 2, va de 1,5 a 2,5), por tanto 74/93 = 0.80. Esta cifra se multiplica por el valor del intervalo. En este caso i=1. Una vez aqu, le sumamos el lmite inferior del intervalo en el que se encuentra esta frecuencia absoluta, es decir, el lmite inferior de Xi = 2, que es 1,5 (la puntuacin directa menos 0,5), y ya tenemos el P25 = 1,5 + 0,8 = 2,3. 4. Las puntuaciones tpicas en la curva normal Acabamos de ver un ejemplo de una distribucin de frecuencias. Una distribucin de frecuencias puede representarse grficamente, como vimos en el captulo 15, mediante un polgono de frecuencias, donde el eje de las x representa las puntuaciones obtenidas por los sujetos y el eje de las y indica las frecuencias. De este modo, la distribucin de frecuencias anterior puede representarse del modo siguiente:

11

Este polgono muestra cmo gran parte de los sujetos se sita en torno a las dos puntuaciones extremas, el 1 y el 7. Pues bien, entre las distintas formas que pueden adoptar las distribuciones de frecuencias en distintas variables, se descubri que muchas variables adoptan un tipo de distribucin caracterstica que se denomina distribucin normal o campana de Gauss. La curva normal es una distribucin terica, simtrica y asinttica, en la que los puntos de inflexin corresponden con las puntuaciones tpicas 1 y donde la media, la mediana y la moda (puntuacin que ms se repite) coinciden (por tanto, la ACT1_01 z en este punto es cero):
300 200 100

Frecuencia

Polgono de frecuencias absolutas

x = Md = Mo
Curva normal Parece ser que los primeros que llegaron a describir el modelo terico de distribucin normal fueron De Moivre en 1733, en el contexto de los juegos de azar y, por otra parte, Laplace y Gauss entre finales del XVII y principios del XVIII en el contexto de las matemticas y la astronoma. Las aplicaciones de la distribucin normal y otras distribuciones tericas como la binomial, t, F, 2, etc. (ver captulo 23) son fundamentales en el campo de la inferencia estadstica, donde reciben el nombre de distribuciones muestrales. Como se podr ver en el captulo 23, estas distribuciones nos permiten conocer cundo una diferencia (por ejemplo, entre dos medias aritmticas en rendimiento correspondientes a dos grupos que han seguido dos mtodos de enseanza diferentes) es o no es explicable por efecto del azar. Muchas variables educativas, psicolgicas y biolgicas se distribuyen segn el modelo normal, sobre todo si contamos con muestras grandes de sujetos: rendimiento acadmico, inteligencia, peso, altura, etc. La distribucin viene a indicar cmo la mayora de las personas nos encontramos en torno a los valores medios de la distribucin, y segn nos alejamos hacia valores extremos, el nmero de sujetos existentes va disminuyendo progresivamente. Es decir, la mayora de los sujetos somos medianamente inteligentes (normales), pero cuanto ms nos alejamos de estas puntuaciones vamos encontrando menos sujetos muy inteligentes o muy poco inteligentes. La reiterada observacin emprica de la distribucin de estas variables permiti crear un modelo

12

matemtico terico que responda a dicha distribucin, de modo que es posible conocer la probabilidad asociada a cada uno de los valores de la curva, con lo cual podemos saber si la obtencin de un valor procedente de cualquier medicin es ms o menos probable que aparezca, es decir, si se parece mucho o poco a lo que entendemos como normal. Para realizar este tipo de interpretaciones, debemos asumir necesariamente (aunque sea desde un punto de vista terico) que la distribucin poblacional de la variable de estudio es normal. Precisamente, para poder llevar a efecto dichas interpretaciones, necesitamos una unidad de medida universal, por lo que las tablas de la curva normal estn construidas a partir de las puntuaciones tpicas, de modo que podamos establecer la equivalencia con cualquier sistema de puntuaciones directas. En casi todos los textos de Estadstica se pueden encontrar las tablas de la curva normal con las probabilidades asociadas a cada puntuacin tpica. La interpretacin de las tablas es muy sencilla. Tenemos que pensar que una puntuacin tpica divide la curva normal en dos partes: una grande y otra pequea (excepto z = 0 que la divide en dos partes iguales). En este caso, hemos utilizado la puntuacin tpica 1,25. Si trazamos una lnea vertical a partir de dicha Z, el rea de la curva normal queda dividida en dos partes. El rea mayor, lgicamente, es el rea ms grande que queda al realizar dicha divisin, es decir, desde la lnea gruesa hasta - .

Por tanto, una puntuacin tpica igual a 1,25 tiene una probabilidad acumulada de aparicin de p = 0,8944, esto es, el 89,44 % obtienen una puntuacin Z 1,25. Consecuentemente, en este caso, el rea menor indica la probabilidad de obtener una puntuacin Z 1,25 (p = 0,1056). Tambin podemos saber cul es la probabilidad de obtener una puntuacin entre la media y Z = 1,25 (p = 0,3944 = 0,5 - 0,1056). Si la puntuacin tpica hubiera sido Z = - 1,25, qu probabilidad existe de obtener una puntuacin igual o inferior a dicha Z [p(Z1,25)]? En este caso, puesto que la distribucin normal es simtrica, consultaramos el rea menor de Z = 1,25 (p = 0,1056). Veamos un ejemplo de la curva normal con algunas puntuaciones tpicas y sus probabilidades asociadas de obtener una puntuacin mayor o menor a s mismas (pgina siguiente). Evidentemente, la probabilidad de obtener una puntuacin superior a la media es de p= 0,5, es decir, en la curva normal el 50 % de los sujetos se encuentran por encima de la media y el otro 50 % por debajo (recordemos que en las puntuaciones Z la media siempre es igual a cero). Por poner otro ejemplo, el 84,14 % (rea de la parte mayor; p= 0,8414) de los sujetos obtienen una puntuacin tpica inferior a 1, por lo que el 15,87 % restante la obtienen superior a 1. Con estos valores, tambin

13

p = 0,5 p = 0,8413 p 0,025

p = 0,5 p = 0,1587 p = 0,025 p = 0,005

z
-1,96

1,96

2,57

xi
x 1,96 s

x + 1s

x + 2,57 s

Puntuaciones tpicas y probabilidades asociadas en la curva normal podemos deducir que entre la Z=0 y la Z=1 se encuentra el 34,13 % de los sujetos (0,5-0,1587), y el mismo porcentaje encontraremos entre Z=0 y Z= -1, puesto que la curva es simtrica. En el grfico siguiente podemos hacernos una idea de la distribucin de sujetos a lo largo de la curva normal, de modo que prcticamente todas las puntuaciones (el 99,74 %) se encuentran entre las Z = 3.

0,9974 0,9544 0,6426

p = 0,0013

z xi

-3

-2

-1

60

70

80

x = 90

100

110

120

Como vemos, cuando tenemos una distribucin normal, la obtencin de una puntuacin tpica superior a 2 o inferior a 2 puede considerarse una puntuacin extrema, ya que es obtenida solamente por menos del 5 % de los sujetos. La probabilidad de obtener una puntuacin tpica igual o superior a 3 es de p = 0,0013, esto es, en 1,3 casos de cada mil. En trminos porcentuales, podemos decir que entre las puntuaciones tpicas de 1 se encuentra el 64 % de los sujetos, entre 2 el 95 % y entre 3 casi el 100 % (el 99,7 %).

14

Del mismo modo, si tenemos una distribucin de frecuencias con puntuaciones directas y sabemos que dicha distribucin es normal, nos basta saber su x y su s (desviacin tpica) para extrapolar las aplicaciones de la curva normal. Supongamos que tenemos un test de aptitud numrica (cuyas puntuaciones se distribuyen normalmente) con una x = 90 y una s = 10. Mediante una simple transformacin podemos saber que la puntuacin directa que corresponde a Z = 1 (se aleja una desviacin tpica por encima de la media) es Xi = 100 (90 + 1 10; tambin se llega aqu despejando de la frmula Z=(xi- x )/s) y que un sujeto con esta puntuacin superar al 84 % de los sujetos de su grupo (rea mayor p= 0,8413) y es superado por el 16 %. Este sujeto se encontrar, por tanto, en el percentil 84. 4.1. Las puntuaciones individuales normalizadas

En algunas ocasiones se utiliza un tipo de puntuaciones individuales denominadas puntuaciones normalizadas. La puntuacin normalizada es la puntuacin individual que le corresponde a un sujeto si la distribucin de frecuencias original es una distribucin normal. En el caso de que no lo sea, esta transformacin estar tanto ms distorsionada cuanto ms se diferencie dicha distribucin de la normal. Concretamente suelen utilizarse cuando en un test conocemos la media y la desviacin tpica, pero carecemos de los baremos. Si hemos aplicado un test en estas condiciones y sabemos o es razonable suponer que la distribucin de frecuencias del test original era una distribucin normal, entonces a partir de estos datos podemos construir fcilmente nuestros propios baremos. Supongamos que queremos aplicar un test de inteligencia y sabemos que este test fue aplicado anteriormente a una muestra grande de sujetos, obtenindose una distribucin normal de las puntuaciones directas. Conocemos tambin que en aquella aplicacin se obtuvo una media aritmtica de 100 puntos y una desviacin tpica de 15. Cmo construir los baremos para interpretar las puntuaciones al aplicar nosotros el test? Como sabemos que la distribucin es normal, nos bastara mirar en las tablas para saber a qu percentil corresponde cada puntuacin tpica. Por ejemplo, el P10 es aquella puntuacin que deja por debajo de su lmite superior al 10 % de los sujetos, por tanto, a una proporcin de 0,01 sujetos. Buscamos en las tablas de la curva normal p = 0,01 en el rea de la parte menor y encontramos que corresponde a una Z = - 2,33 (esta es la Z normalizada, es decir, la puntuacin tpica correspondiente a dicho percentil si la distribucin es normal). Ahora basta con aplicar la frmula para saber la puntuacin directa equivalente al P10.

- 2,33 =

X i - 100 X i = 65,05 15

Por tanto, una puntuacin directa de 65 equivale al percentil normalizado P10. Si la muestra es de 150 sujetos, a cuntos sujetos superara uno que obtiene una puntuacin directa de 65? Simplemente multiplicamos el nmero de sujetos (N=150) por la probabilidad de

15

obtener una Xi 65; p (Xi 65) = 0,01 n = 1500,01 = 1,5 2 sujetos. Aproximadamente 2 sujetos de los 150 sacaran una puntuacin igual o inferior a 65. Finalmente, a veces se utiliza otro tipo de puntuaciones normalizadas consistentes en una agrupacin por intervalo de las puntuaciones tpicas, utilizando la desviacin tpica como unidad de agrupacin. As, por ejemplo, los pentas son unas puntuaciones que dividen a la curva normal en cinco partes (ver grfico), de modo que cada puntuacin penta (excepto los extremos 1 y 5) contiene una desviacin tpica. Tambin existen los eneatipos o estaninos que dividen a la curva normal en nueve partes, por lo que cada uno contiene media desviacin tpica. Del mismo modo se puede construir la escala 20 (los intervalos comprenden 0,25 desviaciones tpicas, excepto los extremos) o cualquier divisin que creamos oportuna. La utilizacin de estas puntuaciones en vez de los percentiles se justifica en muchas ocasiones porque los instrumentos de medida que utilizamos no son tan precisos como para pensar que los sujetos son clasificables en torno a 100 categoras ordenadas, por lo que resulta ms coherente disminuir el nmero de categoras de clasificacin. De este modo, basta mirar en las tablas para saber que el estanino 5 comprende desde el P40 al P60 (desde Z = -0,25 a Z = 0,25).

-3

-2

-1,5

-1

-0,5

0
3

0,5

1,5

Pentas Estaninos
1

1 2

2 3 4

4 6 7 8

5 9

Como vemos, cuando consideramos que una distribucin es normal, podemos deducir algunas conclusiones basndonos en dicha distribucin terica. 1. Es posible saber, como hemos visto, el porcentaje de sujetos que deja por encima y por debajo de s una puntuacin individual o, lo que es lo mismo pero dicho en trminos proporcionales, la probabilidad de aparicin de una puntuacin igual o superior e igual o inferior a una puntuacin individual. Para ello basta con consultar las tablas de la curva normal. 2. En la curva normal (y slo cuando la distribucin es normal), existe una correspondencia directa entre las puntuaciones tpicas y los percentiles y dems cuantiles. Un percentil indica el porcentaje de sujetos que deja por debajo de s

16

una puntuacin individual determinada. Por tanto, dada una puntuacin tpica, basta mirar el rea que deja a su izquierda para transformarla en un percentil multiplicando dicha rea por cien y redondeando el valor obtenido. As, un sujeto con una Z = -2 (p = 0,0228) estara en el percentil 2 (P2), con una Z = 0 en el P50 y con una Z = 2 en el P98. 3. Si tenemos una muestra de sujetos cuya distribucin de frecuencias es una distribucin normal, nos basta con saber el nmero de sujetos de la muestra, su media aritmtica y su desviacin tpica para saber cuntos sujetos se encuentran por encima o por debajo de una puntuacin directa o entre dos puntuaciones directas. Basta multiplicar la probabilidad encontrada por el nmero de sujetos de la muestra. BIBLIOGRAFA BOTELLA, J., LEN, G. O. y SAN MARTN, R. (1993): Anlisis de datos en Psicologa I. Madrid, Pirmide. FERNNDEZ DAZ, M. J., GARCA RAMOS, J. M., FUENTES VICENTES, A. y ASENSIO MUOZ, I. (1990): Resolucin de problemas de estadstica aplicada a las ciencias sociales. Gua prctica para profesores y alumnos. Madrid, Sntesis. GONZLEZ GALN, A. (en prensa). La investigacin en Educacin Especial. En R. Fernndez, E. Ceballos, T. Feliz y A. Gonzlez Galn Bases Psicopedaggicas de la Educacin Especial. Universidad de Alcal. Madrid. MORALES, P. (2000). Estadstica descriptiva aplicada a las Ciencias Sociales. Universidad Pontificia Comillas Madrid. Documento de trabajo indito. PEREZ JUSTE, R. (1998). Estadstica descriptiva. Universidad Nacional de Educacin a Distancia. Madrid.

EJERCICIOS A) Preguntas de interpretacin


1. En las puntuaciones tpicas la media es cero y la desviacin tpica 1: A. Siempre B. Slo cuando la distribucin es normal 2. Si un sujeto se encuentra en el percentil 75 en una prueba de Ingls y en el 50 en una prueba de francs, se puede concluir que sabe ms ingls que francs... A. S, sin duda B. S, si la distribucin del grupo de referencia es normal

17

C. No o faltan datos para afirmar esto 3. Si un sujeto se encuentra en la percentil 95, significa que le supera el 5% del grupo de referencia A. Verdadero B. S, si la distribucin del grupo de referencia es normal C. Falso 4. Si en un test ests en el percentil 45, tu puntuacin tpica es negativa: A. Siempre B. Slo si la distribucin es normal C. Falso o faltan datos 5. Una puntuacin tpica expresa cuntas preguntas se desva la puntuacin de un sujeto de la media. A. Verdadero B. S, si la distribucin del grupo de referencia es normal C. Falso 6. Cuando la media aritmtica de un grupo es muy baja, puede haber puntuaciones tpicas superiores a la media con signo negativo. A. Verdadero B. S, si la distribucin del grupo de referencia es normal C. Falso 7. Si tenemos una muestra de 500 sujetos cuya distribucin de frecuencias es asimtrica positiva, cuntos sujetos dejar por debajo de s un individuo con una puntuacin tpica igual a cero? A. Ninguno B. 500 C. 250 D. No lo podemos saber con estos datos 8. Si sabemos que un grupo tiene una x = 35 y una s = 3, qu puntuacin directa le corresponder a un sujeto con una z = -3: A. 32 B. -3 C. 26 D. 44 E. No lo podemos saber con estos datos

9. Una Z A. B. C.

normalizada coincide con la puntuacin tpica cuando: Siempre Cuando la distribucin es normal Depende de los casos

18

10. Si en una distribucin normal queremos saber la probabilidad de obtener una puntuacin igual o menor a una puntuacin tpica negativa, bastar con: a) Mirarlo en el rea de la parte mayor de las tablas correspondiente a dicha puntuacin b) Mirarlo en el rea de la parte menor de las tablas correspondiente a dicha puntuacin c) Transformarla en una puntuacin directa y hacer una regla de tres d) Calcular la z normalizada y mirar el rea de la parte mayor en las tablas

B) Problema
Un director de un centro educativo decide implantar un aula de alto rendimiento en segundo de Bachillerato. Para ello se pone en contacto con el pedagogo del Departamento de Orientacin y le pide que seleccione a los doce alumnos con mayor potencial acadmico. El pedagogo aplica una batera de tests a los 150 alumnos de 1 de Bachillerato para realizar la seleccin de cara al curso prximo. Despus de la aplicacin de la batera, se obtiene una puntuacin global para cada sujeto en una escala que va desde 25 a 150 puntos. Tras realizar la distribucin de frecuencias, se comprueba que la distribucin es normal. La media aritmtica del grupo es de 81 puntos y la desviacin tpica de 16,8. a) Qu puntuacin directa debe obtener un sujeto para ser seleccionado? b) A qu percentil corresponde dicha puntuacin? c) Qu probabilidad existe de encontrar una puntuacin mayor que 140 puntos? d) Entre qu puntuaciones tpicas y directas se encuentra el 50 % central de la distribucin?

SOLUCIONES
A) Preguntas de interpretacin 1. A 2. C. No lo podemos saber porque depende de las puntuaciones de las puntuaciones del grupo en ambas pruebas. 3. A 4. B. En una distribucin asimtrica negativa, el P45 puede estar por encima de la media, y por tanto su puntuacin tpica ser positiva. Sin embargo, en la distribucin normal el P50 (Z=0) siempre coincide con la media, y por tanto cualquier puntuacin tpica inferior a dicho percentil ser negativa. 5. C. Expresa cuntas desviaciones tpicas se desva de la media, no cuntas preguntas. 6. D. Al ser asimtrica, necesitaramos conocer la distribucin de frecuencias para responder. Si la distribucin hubiera sido normal, la respuesta habra sido la C. 7. C 8. C 9. A 10. B

19

B) Problema a) El director nos pide seleccionar para el aula especial 12 sujetos de un total de 150. Se trata, por tanto, del 8 % de la muestra o, lo que es lo mismo, una proporcin de 0,08. Como sabemos que la distribucin es normal, en primer lugar tenemos que buscar la puntuacin tpica que deja por encima de s al 8 % (p = 0,08, rea menor) o por debajo al 92 % (rea mayor p= 0,92). Encontramos en las tablas que dichas proporciones corresponden a una Z = 1,41. Como preguntan por la puntuacin directa, despejamos de la frmula de las puntuaciones tpicas:

1,41 =

X i - 81 X i = 104,69 105 16,8

b) Como hemos dicho, esta puntuacin deja por debajo de s al 92 % de los sujetos, luego le corresponde el percentil normalizado P92. c) Convertimos la Xi = 140 en una puntuacin tpica y posteriormente miramos la probabilidad en el rea menor:

Z =

140 - 81 Z = 3,51; p( Z 3,51) = 0,0002 16,8

d) Acotamos el 50 % central de la distribucin. Tendremos una puntuacin tpica negativa que deja por debajo de s al 25 % de la muestra. La Z simtrica positiva dejar por encima de s el otro 25 %. Por tanto, buscamos la Z correspondiente a p = 0,25, a saber, Z = 0,67. Transformamos dichas puntuaciones en directas y obtenemos que el 50 % de la distribucin se encuentra entre las puntuaciones Xi= 69,74 y Xi= 92,26. Veamos el problema representado grficamente:

50% p = 0,25 p = 0,08

p = 0,0002

z xi

-0,67

0,67

1,41

3,51

70

81

92

105

140

Pc
25

20
50 75 92 99

You might also like