You are on page 1of 25

MEDIDAS DE

VARIABILIDAD: DATOS NO
AGRUPADOS

INTRODUCCION
Las medidas de tendencia central dan
informacin acerca de puntos particulares
de un conjunto de datos.
Existen herramientas adicionales llamadas
medidas de variabilidad, que describen la
dispersin de un conjunto de datos.
Con el uso de medidas de variabilidad en
conjuncin con medidas de tendencia
central es posible obtener una descripcin
numrica ms completa de los datos.

Algunas
consideraciones
1. Variacin, se refiere a la cantidad en
que los datos u observaciones varan
entre si, esta variacin puede medirse.
2. Los datos que estn relativamente
cercanos entre si, tienen bajas
medidas de variabilidad, mientras que
los que estn mas alejados entre si
tienen medidas de variacin mas
grandes,

Trminos equivalentes
Menor dispersin = ms homogneo
Mayor dispersin = menos homogneo
Menor dispersin = menos heterogneo
Mayor dispersin = ms heterogneo

MEDIDAS DE
DISPERSION
Definicin 1
Una medida de dispersin de un
conjunto de datos, mide cuan
esparcidos se encuentran estos o
que tan heterogneos son.

MEDIDAS DE DISPERSION
Se ver siete medidas de
variabilidad para datos no
agrupados:
rango,
rango
intercuartil, desviacin media
absoluta, varianza, desviacin
estndar, valor de Z y
coeficiente de variacin.

Rango
El rango es la diferencia entre el valor ms grande
de un conjunto de datos y el valor ms pequeo.
Una ventaja del rango es su facilidad de calculo.
Un uso importante del rango es en aseguramiento
de la calidad, donde el rango se emplea para
construir graficas de control.
Una desventaja del rango es que, como se calcula
con los valores que estn en los extremos de los
datos, stos son afectados por los valores
extremos. Por tanto, su aplicacin como medida de
variabilidad es limitada.

Ejemplo 1
Ante la pregunta sobre nmero de hijos
por familia, una muestra de 12 hogares,
marc las siguientes respuestas:
2 1
2
4
1
3
2 3
2
0
5
1
Calcule el rango de la variable

Solucin
El Rango es R =5 0 = 5

Rango intercuartil
El rango intercuartil es el rango
de valores entre el primero y
tercer cuartiles. En esencia, es el
rango de 50% central de los datos
y se determina al calcular el valor
de Q3 Q1.
El rango intercuartil se utiliza en
la construccin de graficas de
caja y bigote.

Desviacin media absoluta, varianza y


desviacin estndar

Estas medidas no tienen sentido a


menos que los datos sean por lo
menos de nivel de intervalo.
La varianza y desviacin estndar se
utilizan ampliamente en estadstica.

DESVIACION MEDIA
ABSOLUTA
La desviacin media absoluta (MAD) es el
promedio de los valores absolutos de las
desviaciones alrededor de la media para
un conjunto de nmeros.

MAD = / x-u /
N

Debido a que se calcula con el uso de valores absolutos, la


desviacin media absoluta es menos til en estadstica que
otras medidas de dispersin.

La varianza
n

s2

2
(
x

x
)
i
i 1

n 1

Muestral

Poblacional

2
(
x

)
i x
i 1

VARIANZA
La varianza es el promedio del
cuadrado de desviaciones alrededor
de la media aritmtica para un
conjunto de nmeros.
La varianza de poblacin est
denotada por 2

Ejemplo 2
Calcule la varianza para los datos del
ejemplo 1
2 1 2 4 1 3 2 3
2 0 5
1
Solucin:

s 1,9697
2

DESVIACION ESTANDAR
La desviacin estndar es la raz cuadrada de la
varianza. La desviacin estndar poblacional se
denota con .
Una caracterstica de la desviacin estndar que la
distingue de una varianza es que la desviacin
estndar se expresa en las mismas unidades que
los datos sin procesar, mientras que la varianza se
expresa en el cuadrado de esas unidades.
Se utiliza como entidad separada y como parte de
otros anlisis, por ejemplo para calcular intervalos
de confianza y en pruebas de hiptesis.

Desviacin estndar
n

(x
i 1

Muestral

x )2

n 1

Poblacional

2
(
x

)
i x
i 1

Ejemplo 3
Calcule la desviacin estndar para los datos
del ejemplo 1
Solucin:

s 1, 4035

Significado de desviacin
estndar
Es posible entender la nocin del concepto
de desviacin estndar al ver la manera
en que se aplica.

Dos modos de aplicar la desviacin


estndar son la regla emprica y el
teorema de Chebyshev.

Regla Emprica

La regla emprica es una importante


regla practica que se usa para
expresar el porcentaje aproximado que
est dentro de un numero dado de
desviaciones estndar desde la media
de un conjunto de datos, si los datos
estn distribuidos normalmente.
La regla emprica se usa slo para tres
veces la desviacin estndar: 1, 2 y
3.

Regla Emprica
En una distribucin normal:
El 68 % de las observaciones se encuentra entre
1.
El 95 % de las observaciones se encuentra entre
2 .
El 99.7 % de las observaciones se encuentra entre
68% de los datos
3 .

95% de los datos


99.7% de los datos
20

Valores z
Representan
el
numero
de
desviaciones estndar que un valor
(x) est arriba o abajo de la media de
un conjunto de nmeros cuando los
datos
estn
normalmente
distribuidos.

Valores z

Si el valor z es negativo, el valor sin procesar (x) est


debajo de la media. Si el valor z es positivo, el valor sin
procesar (x) esta arriba de la media.

Por ejemplo, para un conjunto de datos que est


normalmente distribuido con una media de 50 y una
desviacin estndar de 10, supongamos que un experto en
estadstica desea determinar el valor z para uno de 70, el
cual seria (x=70) que est 20 unidades arriba de la media,
de modo que el valor z es +2,00.

Este valor z significa que 70 est dos desviaciones estndar


arriba de la media.

Coeficiente de Variacin
El coeficiente de variacin es un
estadstico dado por la razn entre la
desviacin estndar y la media
expresada en porcentajes y se
denota como CV.

Coeficiente de
variacin
Compara la variabilidad de series de datos
que tengan unidades diferentes.
No tiene unidades de medida.
Se calcula para variables medidas en escala
de razn

Muestral

Poblacional

S
CV 100%
x

CV 100%

Ejemplo 4
Calcule el coeficiente de variabilidad
para los datos del ejemplo 1
Solucin:

1,4035
cv
x100 64,7759%
2,1667

You might also like