Professional Documents
Culture Documents
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin de los datos en estudio, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad de las observaciones en estudio se usa:
2 ) Varianza
La varianza (tambin denominada variancia, aunque esta denominacin es menos utilizada) es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadrticas de las
Bioestadstica I
Ao 2013-
puntuaciones respecto a su media aritmtica. Suele ser representada con la letra griega
o una V (x)
2 =
(X
i =1
)2
Varianza poblacional ; Ec. (2.1)
Propiedades
Bioestadstica I
Ao 2013-
3) Varianza muestral
En muchas situaciones es preciso estimar la varianza de una poblacin a partir de una muestra. Si se toma una muestra de n valores de la poblacin , se puede dar el caso que la muestra sea pequeo o grande , entonces existen dos casos a considerar.
S2 =
( X
i =1
X )2
; cuando n > 30
Cuando n < 30
(Cuando est dividido por n y cuando lo est por n-1) se los denomina varianza muestral. Difieren ligeramente y, para valores grandes de n, la diferencia es irrelevante. El primero traslada directamente la varianza de la muestra al de la poblacin y el segundo es un estimador insesgado de la varianza de la poblacin.
4 ) COEFICIENTE DE VARIACIN
En estadstica el coeficiente de variacin (de Pearson), es una medida de dispersin til para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Sirve para comparar variables o grupos que estn a distintas escalas pero que estn correlacionadas estadsticamente y sustantivamente con un factor en comn. Es decir, ambas variables tienen una relacin causal con ese factor. Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a diferencia de la
Bioestadstica I
Ao 2013-
desviacin tpica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media de por tanto un valor positivo. A mayor valor de C.V. mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V.. Exigimos que: Se calcula:
C.V . = S x100 X
5) ASIMETRA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes ( ver figura), cada uno de los cuales se define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra, viene definido:
As = X X
I
mo
Bioestadstica
Ao 2013-
Los resultados pueden ser los siguientes: As = 0 (distribucin simtrica; existe la misma concentracin de valores a la derecha y a la izquierda de la media) As > 0 (distribucin asimtrica positiva; existe mayor concentracin de valores a la derecha de la media que a su izquierda) As < 0 (distribucin asimtrica negativa; existe mayor concentracin de valores a la izquierda de la media que a su derecha)
6) CURTOSIS El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. Mide la deformacin vertical. Se definen 3 tipos de distribuciones segn su grado de curtosis: a) Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). b) Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.
c) Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.
El Coeficiente de Curtosis viene definido por los cuartiles y con la siguiente frmula:
Bioestadstica I
Ao 2013-
FORMULA K = (Q3 Q1) /( 2 ( P90 P10)) Los resultados pueden ser los siguientes: K = 0 (distribucin mesocrtica) . K > 0 (distribucin leptocrtica ). K < 0 (distribucin platicrtica) . EJEMPLO TABLA 2.1 Distribucin de frecuencias de nmeros de hijos por
familia ( solucin en Excel) o manualmente
0 1 2 3 4 total
3 4 8 6 2 23
0 4 16 18 8 46
y = M ( y) =
y f
i =1
i i
46 =2 23
yi 0 1 2 3 4 total
fi yf 3 0 4 4 1 8 6 1 6 8 2 8 2 3
(y ) -2 -1 0 1 2
(y )2 4 1 0 1 4
f(y -
y
2 12 4 0 6 8 30
Bioestadstica I
Ao 2013-
varianza S2
1.30
Interpretacin: S2 = 1.30 es la variabilidad de las observaciones de numero de hijos por familia respecto a la su media. La distribucin de nmeros de hijos por familia no es tan disperso.
Determinar
GRUPO TB
12
a) Interpretar las varianzas obtenidas por grupos separados. b) Que grupo tiene mejor variabilidad en sus puntuaciones?
7.2 )
Teniendo
TAREA 02:
en cuenta los datos del archivo EVALUACIN
PROFESIONALES.sav (laboratorio n 3) que corresponde a un estudio echo en base a una muestra de 200 profesionales, se construyo la siguiente tabla para la variable ESTATURA:
Tabla N 01
i 1
y 'i 1 , y 'i
1.50,1.55
yi
1.525
fi
9
Fi
9
hi
0.045
Hi
0.045
hi 100%
4.5
H i 100%
4.5
Bioestadstica I
Ao 2013-
1.55,1.60
20 54 44 38 16 10 5 4 200
15 42 64 83 91 96 98 100
1.60,1.65
1.65,1.70
1.70,1.75
1.75,1.80
1.80,1.85
1.85,1.90
1.90,1.95
TOTAL
7.3 ) TAREA N 03
Bioestadstica I
Ao 2013-
Bioestadstica I
Ao 2013-