Professional Documents
Culture Documents
VARIABILIDAD: DATOS NO
AGRUPADOS
INTRODUCCION
Las medidas de tendencia central dan
informacin acerca de puntos particulares
de un conjunto de datos.
Existen herramientas adicionales llamadas
medidas de variabilidad, que describen la
dispersin de un conjunto de datos.
Con el uso de medidas de variabilidad en
conjuncin con medidas de tendencia
central es posible obtener una descripcin
numrica ms completa de los datos.
Algunas
consideraciones
1. Variacin, se refiere a la cantidad en
que los datos u observaciones varan
entre si, esta variacin puede medirse.
2. Los datos que estn relativamente
cercanos entre si, tienen bajas
medidas de variabilidad, mientras que
los que estn mas alejados entre si
tienen medidas de variacin mas
grandes,
Trminos equivalentes
Menor dispersin = ms homogneo
Mayor dispersin = menos homogneo
Menor dispersin = menos heterogneo
Mayor dispersin = ms heterogneo
MEDIDAS DE
DISPERSION
Definicin 1
Una medida de dispersin de un
conjunto de datos, mide cuan
esparcidos se encuentran estos o
que tan heterogneos son.
MEDIDAS DE DISPERSION
Se ver siete medidas de
variabilidad para datos no
agrupados:
rango,
rango
intercuartil, desviacin media
absoluta, varianza, desviacin
estndar, valor de Z y
coeficiente de variacin.
Rango
El rango es la diferencia entre el valor ms grande
de un conjunto de datos y el valor ms pequeo.
Una ventaja del rango es su facilidad de calculo.
Un uso importante del rango es en aseguramiento
de la calidad, donde el rango se emplea para
construir graficas de control.
Una desventaja del rango es que, como se calcula
con los valores que estn en los extremos de los
datos, stos son afectados por los valores
extremos. Por tanto, su aplicacin como medida de
variabilidad es limitada.
Ejemplo 1
Ante la pregunta sobre nmero de hijos
por familia, una muestra de 12 hogares,
marc las siguientes respuestas:
2 1
2
4
1
3
2 3
2
0
5
1
Calcule el rango de la variable
Solucin
El Rango es R =5 0 = 5
Rango intercuartil
El rango intercuartil es el rango
de valores entre el primero y
tercer cuartiles. En esencia, es el
rango de 50% central de los datos
y se determina al calcular el valor
de Q3 Q1.
El rango intercuartil se utiliza en
la construccin de graficas de
caja y bigote.
DESVIACION MEDIA
ABSOLUTA
La desviacin media absoluta (MAD) es el
promedio de los valores absolutos de las
desviaciones alrededor de la media para
un conjunto de nmeros.
MAD = / x-u /
N
La varianza
n
s2
2
(
x
x
)
i
i 1
n 1
Muestral
Poblacional
2
(
x
)
i x
i 1
VARIANZA
La varianza es el promedio del
cuadrado de desviaciones alrededor
de la media aritmtica para un
conjunto de nmeros.
La varianza de poblacin est
denotada por 2
Ejemplo 2
Calcule la varianza para los datos del
ejemplo 1
2 1 2 4 1 3 2 3
2 0 5
1
Solucin:
s 1,9697
2
DESVIACION ESTANDAR
La desviacin estndar es la raz cuadrada de la
varianza. La desviacin estndar poblacional se
denota con .
Una caracterstica de la desviacin estndar que la
distingue de una varianza es que la desviacin
estndar se expresa en las mismas unidades que
los datos sin procesar, mientras que la varianza se
expresa en el cuadrado de esas unidades.
Se utiliza como entidad separada y como parte de
otros anlisis, por ejemplo para calcular intervalos
de confianza y en pruebas de hiptesis.
Desviacin estndar
n
(x
i 1
Muestral
x )2
n 1
Poblacional
2
(
x
)
i x
i 1
Ejemplo 3
Calcule la desviacin estndar para los datos
del ejemplo 1
Solucin:
s 1, 4035
Significado de desviacin
estndar
Es posible entender la nocin del concepto
de desviacin estndar al ver la manera
en que se aplica.
Regla Emprica
Regla Emprica
En una distribucin normal:
El 68 % de las observaciones se encuentra entre
1.
El 95 % de las observaciones se encuentra entre
2 .
El 99.7 % de las observaciones se encuentra entre
68% de los datos
3 .
Valores z
Representan
el
numero
de
desviaciones estndar que un valor
(x) est arriba o abajo de la media de
un conjunto de nmeros cuando los
datos
estn
normalmente
distribuidos.
Valores z
Coeficiente de Variacin
El coeficiente de variacin es un
estadstico dado por la razn entre la
desviacin estndar y la media
expresada en porcentajes y se
denota como CV.
Coeficiente de
variacin
Compara la variabilidad de series de datos
que tengan unidades diferentes.
No tiene unidades de medida.
Se calcula para variables medidas en escala
de razn
Muestral
Poblacional
S
CV 100%
x
CV 100%
Ejemplo 4
Calcule el coeficiente de variabilidad
para los datos del ejemplo 1
Solucin:
1,4035
cv
x100 64,7759%
2,1667