Professional Documents
Culture Documents
Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin.
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
Desviacin media
La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica.
Di = x - x
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media .
Ejemplo
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo
|x xi fi xi fi |x - x| fi
x|
21
457.5
98.57
Varianza
La varianza es la media aritmtica del cuadrado de las
Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Ejercicios de varianza
9, 3, 8, 8, 9, 8, 9, 18
xi
fi
xi fi
xi2 fi
[10,
15
15
225
20)
18 225
11 250
1 42 820
88 050
Propiedades de la varianza
Si
tenemos
varias
distribuciones
con
la
misma
media
Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.
Para
simplificar
el
clculo
vamos
utilizar
las
siguientes
9, 3, 8, 8, 9, 8, 9, 18
xi
fi
xi fi
xi2 fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60)
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
Si
tenemos
varias
distribuciones
con
la
misma
media
conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total.
MEDIDAS DE DISPERSIN
En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribucin, puesto que otro aspecto que debe se tomar en cuenta es la variabilidad de las observaciones. Con el propsito de medir la dispersin o variabilidad, se discutirn en este apartado las medidas de: Amplitud (llamada tambin rango o recorrido), Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin tpica) y Coeficiente de Variacin.
Amplitud o recorrido
La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numrico en el mismo. Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide tres veces al da y que cierto da los registros de dos pacientes muestran: Paciente 1: 73 77 74 Paciente 2: 64 90 73 Cul es la Amplitud en pulsaciones para cada paciente? Para calcular la amplitud de los datos necesario identificar el valor ms grande y el valor ms pequeo del conjunto de datos de cada uno de los pacientes. Para el Paciente 1: A = 77 73 = 4
Para el Paciente 2: A = 90 64 = 26
La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:
En su clculo slo intervienen dos elementos del conjunto. Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.
se denominan las desviaciones de la media y esto sugiere que se podra usar el promedio de estas desviaciones como medida de dispersin en la poblacin. A menos que las X sean todas iguales, algunas de las desviaciones sern positivas y otras negativas, la suma de todas las desviaciones de la media
Como realmente se est interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variacin en trminos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiramos entre N, se obtendra la media estadstica que se denomina desviacin media y se representa por:
Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades tericas en problemas de inferencia y rara vez se usa. Un mtodo alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que tambin esto eliminar el efecto de los signos. Los cuadrados de nmeros reales no pueden ser negativos y pueden tomar el valor de cero. Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviacin estndar de la poblacin.
sta medida de variacin se representa por medio de sigma minscula ( ) y al expresar literalmente lo que se ha hecho aqu de manera matemtica, tambin se conoce como la raz de la desviacin cuadrada media. A su cuadrado de se le llama Varianza de la poblacin.
Quiz parezca lgico utilizar la misma frmula con n y sustituidas por N y , para la desviacin estndar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviacin estndar de la muestra, que se denota con s como
Su cuadrado s2, se llama la Varianza de la muestra. Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se dividiera entre n y se utilizara s2 como estimacin de es decir, se utilizara la varianza de una muestra para determinar la varianza de la poblacin de la cual provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n-1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es prctico para definir s como se hizo.
Coeficiente de variacin
Las medidas de dispersin anteriores son todas medidas de variacin absolutas. Una medida de dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el coeficiente de variacin. El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa como muestra y para la poblacin. para una
Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medicin. Debido a la propiedad anterior el CV es la cantidad ms adecuada para comparar la variabilidad de dos conjuntos de datos. En reas de investigacin donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisin de un experimento, comparando en CV del experimento en cuestin con los valores del mismo en experiencias anteriores.
Ejemplo: En seis sbados consecutivos un operador de taxis recibi 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su servicio. Calcule:
a. b. c. d. e. f.
9 7 11 10 13 7
Donde: k es el nmero de intervalos de clase Xi es el valor medio de cada clase fi es el valor de la frecuencia absoluta
Al retomar el ejemplo de la tabla de distribucin de frecuencias de Precipitacin pluvial promedio anual en Baja California 1905 a 1994 en pulgadas.
fi 18
fAi 18
FRi
FRAi
18/90 18/90
(11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]
||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| ||| |||| |
13 24 17 13 0 4 1 90
31 55 72 85 85 89 90 90
13/90 31/90 24/90 55/90 17/90 72/90 13/90 85/90 0/90 4/90 1/90 85/90 89/90 90/90
90/90 90/90
Calcular s2 y s.
mi 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL 94.09 187.69 313.29 470.89 660.49 882.09 1135.69 1421.29 #####
fi 18 13 24 17 13 0 4 1 90
fimi 174.6 178.1 424.8 368.9 334.1 0 134.8 37.7 1653.0 1693.62 2439.97 7518.96 8005.13 8586.37 0 4542.76 1421.29 34208.10