You are on page 1of 17

M e d i d a s d e d i s p e r s i n

Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin.

Las medidas de dispersin son:

Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.

Desviacin media
La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica.

Di = x - x

La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media .

La desviacin media se representa por

Ejemplo

Calcular la desviacin media de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados


Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

Ejemplo

Calcular la desviacin media de la distribucin:

|x xi fi xi fi |x - x| fi

x|

[10, 12.5 15) 3 37.5 9.286 27.858

[15, 17.5 20) 5 87.5 4.286 21.43

[20, 22.5 25) 7 157.5 0.714 4.998

[25, 27.5 30) 4 110 5.714 22.856

[30, 32.5 35) 2 65 10.174 21.428

21

457.5

98.57

Varianza
La varianza es la media aritmtica del cuadrado de las

desviaciones respecto a la media de una distribucin estadstica.

La varianza se representa por

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla:

xi

fi

xi fi

xi2 fi

[10,

15

15

225

20)

[20, 25 30) 8 200 5000

12 [30,40) 35 10 350 250

[40, 45 50) 9 405

18 225

24 [50, 60 55 8 440 200

16 [60,70) 65 4 260 900

[70, 75 80) 2 150

11 250

1 42 820

88 050

Propiedades de la varianza

1 La varianza ser siempre un valor positivo o cero , en el caso


de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se les suma un nmero la


varianza no vara.

3 Si todos los valores de la variable se multiplican por un


nmero la varianza queda multiplicada por el cuadrado de dicho nmero.

Si

tenemos

varias

distribuciones

con

la

misma

media

conocemos sus respectivas varianzas se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza

1 La varianza, al igual que la media, es un ndice muy sensible a


las puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco ser


posible hallar la varianza.

3 La varianza no viene expresada en las mismas unidades que


los datos, ya que las desviaciones estn elevadas al cuadrado.

Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.

Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin.

La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para

simplificar

el

clculo

vamos

utilizar

las

siguientes

expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Ejercicios de desviacin tpica

Calcular la desviacin tpica de la distribucin:

9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviacin tpica de la distribucin de la tabla:

xi

fi

xi fi

xi2 fi

[10, 20)

15

15

225

[20, 30)

25

200

5000

[30,40)

35

10

350

12 250

[40, 50)

45

405

18 225

[50, 60)

55

440

24 200

[60,70)

65

260

16 900

[70, 80)

75

150

11 250

42

1 820

88 050

Propiedades de la desviacin tpica


1 La desviacin tpica ser siempre un valor positivo o cero,
en el caso de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se les suma un nmero la


desviacin tpica no vara.

3 Si todos los valores de la variable se multiplican por un


nmero la desviacin tpica queda multiplicada por dicho nmero.

Si

tenemos

varias

distribuciones

con

la

misma

media

conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total.

Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica

1 La desviacin tpica, al igual que la media y la varianza, es


un ndice muy sensible a las puntuaciones extremas.

2 En los casos que no se pueda hallar la media tampoco ser


posible hallar la desviacin tpica.

3 Cuanta ms pequea sea la desviacin tpica mayor ser la


concentracin de datos alrededor de la media.

MEDIDAS DE DISPERSIN
En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribucin, puesto que otro aspecto que debe se tomar en cuenta es la variabilidad de las observaciones. Con el propsito de medir la dispersin o variabilidad, se discutirn en este apartado las medidas de: Amplitud (llamada tambin rango o recorrido), Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin tpica) y Coeficiente de Variacin.

Amplitud o recorrido
La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numrico en el mismo. Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide tres veces al da y que cierto da los registros de dos pacientes muestran: Paciente 1: 73 77 74 Paciente 2: 64 90 73 Cul es la Amplitud en pulsaciones para cada paciente? Para calcular la amplitud de los datos necesario identificar el valor ms grande y el valor ms pequeo del conjunto de datos de cada uno de los pacientes. Para el Paciente 1: A = 77 73 = 4

Para el Paciente 2: A = 90 64 = 26

La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:

En su clculo slo intervienen dos elementos del conjunto. Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.

Desviacin media, desviacin estndar y varianza


Para presentar la desviacin estndar, que es por mucho la medida generalmente ms til de la dispersin, obsrvese que la dispersin de un conjunto de datos es pequea si los valores se agrupan en forma cerrada en torno a su media y es grande si los valores se dispersan ampliamente en torno a su media. Por tanto, parecera razonable medir la dispersin de un conjunto de datos en trminos de las cantidades en las cuales difieren los valores individuales de su media. Si se tiene un conjunto de nmeros:

que constituyen una poblacin con una media

, las diferencias entre:

se denominan las desviaciones de la media y esto sugiere que se podra usar el promedio de estas desviaciones como medida de dispersin en la poblacin. A menos que las X sean todas iguales, algunas de las desviaciones sern positivas y otras negativas, la suma de todas las desviaciones de la media

y en consecuencia tambin su promedio es siempre cero.

Como realmente se est interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variacin en trminos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiramos entre N, se obtendra la media estadstica que se denomina desviacin media y se representa por:

Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades tericas en problemas de inferencia y rara vez se usa. Un mtodo alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que tambin esto eliminar el efecto de los signos. Los cuadrados de nmeros reales no pueden ser negativos y pueden tomar el valor de cero. Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviacin estndar de la poblacin.

sta medida de variacin se representa por medio de sigma minscula ( ) y al expresar literalmente lo que se ha hecho aqu de manera matemtica, tambin se conoce como la raz de la desviacin cuadrada media. A su cuadrado de se le llama Varianza de la poblacin.

Quiz parezca lgico utilizar la misma frmula con n y sustituidas por N y , para la desviacin estndar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviacin estndar de la muestra, que se denota con s como

Su cuadrado s2, se llama la Varianza de la muestra. Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se dividiera entre n y se utilizara s2 como estimacin de es decir, se utilizara la varianza de una muestra para determinar la varianza de la poblacin de la cual provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n-1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es prctico para definir s como se hizo.

Coeficiente de variacin
Las medidas de dispersin anteriores son todas medidas de variacin absolutas. Una medida de dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el coeficiente de variacin. El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa como muestra y para la poblacin. para una

Los coeficientes de variacin tienen las siguientes caractersticas:

Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medicin. Debido a la propiedad anterior el CV es la cantidad ms adecuada para comparar la variabilidad de dos conjuntos de datos. En reas de investigacin donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisin de un experimento, comparando en CV del experimento en cuestin con los valores del mismo en experiencias anteriores.

Ejemplo: En seis sbados consecutivos un operador de taxis recibi 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su servicio. Calcule:
a. b. c. d. e. f.

Amplitud. Media. Desviacin media. Desviacin estndar. Varianza. Coeficiente de variacin.

a) Para calcular la amplitud. Valor mximo 13 Valor mnimo 7 A = 13 7 = 6

b) Para calcular la media.

c) Para calcular la desviacin media

d) Para calcular la desviacin estndar

Se puede utilizar la siguiente tabla:

9 7 11 10 13 7

-0.5 -2.5 1.5 0.5 3.5 -2.5 0.0

0.25 6.25 2.25 0.25 12.25 6.25 27.50

Al sustituir los valores se obtiene:

e) Para calcular la varianza:

f) Para calcular el coeficiente de variacin:

Clculo de la varianza en una tabla de frecuencias


Para calcular la varianza de una tabla de frecuencias se utiliza la siguiente frmula:

Donde: k es el nmero de intervalos de clase Xi es el valor medio de cada clase fi es el valor de la frecuencia absoluta

Al retomar el ejemplo de la tabla de distribucin de frecuencias de Precipitacin pluvial promedio anual en Baja California 1905 a 1994 en pulgadas.

intervalos (07.7 , 11.7]

Punto medio de clase (mi) 9.7

Conteo ||||| ||||| ||||| |||

fi 18

fAi 18

FRi

FRAi

18/90 18/90

(11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]

13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL

||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| ||| |||| |

13 24 17 13 0 4 1 90

31 55 72 85 85 89 90 90

13/90 31/90 24/90 55/90 17/90 72/90 13/90 85/90 0/90 4/90 1/90 85/90 89/90 90/90

90/90 90/90

Calcular s2 y s.

mi 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL 94.09 187.69 313.29 470.89 660.49 882.09 1135.69 1421.29 #####

fi 18 13 24 17 13 0 4 1 90

fimi 174.6 178.1 424.8 368.9 334.1 0 134.8 37.7 1653.0 1693.62 2439.97 7518.96 8005.13 8586.37 0 4542.76 1421.29 34208.10

You might also like