Professional Documents
Culture Documents
i1
18
46.6%
2. Mediana.
- Ordenamos los datos de menor a mayor
40 40 40 45 45 45 45 45 48 48 48 48 48 50 50 50 50 55
- Cmo el nmero de datos es par, entonces el valor de la mediana estar dado
por la semisuma de los datos centrales.
Luego. Me = 48%
3. Moda.
Existen varias modas, porque varios de los datos diferentes se repiten, por lo
tanto no tiene sentido considerar este indicador.
Indicadores de dispersin.
1. Longitud de recorrido.
LoR = 55 - 40 = 15%
2. Desviacin Media.
18
DeM
x
i 1
18
Interpretacin.
Observando la columna de las
que 10 datos se alejan de la
que es equivalente a que el 55%
Lic. Mara A. Zacaras Daz
Pgina 43
46.6 %
xi
xi
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
50
55
6.6
6.6
6.6
1.6
1.6
1.6
1.6
1.6
1.4
1.4
1.4
1.4
1.4
3.4
3.4
3.4
3.4
8.4
56.8
3.15 %
desviaciones, xi , tenemos
media en menos de 3.15 o lo
de los datos se aleja de la media
10 datos se alejan
de la media en
menos de 3.15
puntos
en menos de 3.15 lo que podramos interpretar como que los datos no estn muy
dispersos.
3. Varianza.
X
2
i1
(a)
X2
i1
2 X xi
i 1
X2
N X
N
(b)
Por lo tanto, el valor de la varianza puede ser obtenido a partir de las frmulas a o b.
Para el ejemplo utilizaremos la frmula b.
Clculos segn (a)
Clculos segn (b)
xi
( xi )
( xi ) 2
xi
xi2
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
50
55
840
-6.6
-6.6
-6.6
-1.6
-1.6
-1.6
-1.6
-1.6
1.4
1.4
1.4
1.4
1.4
3.4
3.4
3.4
3.4
8.4
43.56
43.56
43.56
2.56
2.56
2.56
2.56
2.56
1.96
1.96
1.96
1.96
1.96
11.56
11.56
11.56
11.56
70.56
270.08
40
40
40
45
45
45
45
45
48
48
48
48
48
50
50
50
50
55
840
1600
1600
1600
2025
2025
2025
2025
2025
2304
2304
2304
2304
2304
2500
2500
2500
2500
3025
39470
15 datos se
alejan de la
media en
menos de
15.004
puntos, es
decir la
mayora.
X2
270.08
15.004 % 2
18
X2
39470
(46.6) 2 21.217 % 2
18
4. Desviacin estndar.
X 3.874 %
X 4.6 %
15%<CoV<25%
25%<CoV
Tendencia Central
Me
Mo
46.6%
48%
-
LoR
15%
Dispersin
DeM
2
56.8%
21.21% 4.61%.
CoV
0.099
Interpretacin.
El CoV = 0.099 nos dice que la dispersin de los datos es baja, ahora observamos los
indicadores de tendencia central, como no existe mucha diferencia entre el valor de la
media y el valor de la mediana, se elige la media aritmtica como indicador de
tendencia central, luego concluimos que la mayora de los datos estn en torno a la
meda, es decir, en la mayora de los cursos el avance del Silabo est en torno al 46.6 %
a mitad del periodo acadmico, es decir hay un ligero atraso.
Calculo de los diferentes indicadores de Tendencia Central y Dispersin, cuando se
tiene ms de 30 datos.
Ejemplo
La profesora del curso de estadstica I, grupo 4 Sem. 2003 I, de la EAP de
Estadstica, FCM, generalmente, al finalizar el semestre obtiene el porcentaje de
asistencia de cada uno de sus alumnos, para posteriormente ver si hubo o no relacin
con la nota que obtuvieron. Los datos se dan a continuacin:
0.4
8
0.1
0.6
1
0.3
5
0.7
1
0.1
0.4
2
0.7
4
0.3
2
0
0.7
4
0.6
1
0.2
6
0.4
5
0.7
1
0.1
3
0.3
9
0.5
5
0.0
6
0.8
1
0.6
5
0.1
6
0.6
8
0.6
5
0.8
4
0.0
6
0.7
7
0.5
5
0.1
9
0.7
4
0.7
4
0.2
3
0.6
1
0.2
6
0.7
1
0.5
5
Cmo estos datos, son datos poblacionales y N > 30, entonces las frmulas a utilizar
para hallar los indicadores son los siguientes:
1. Clculo de la media aritmtica, la varianza y la desviacin estndar y el
coeficiente de variacin.
La variable es X: Porcentaje de asistencia a clases.
Tipo de variable cuantitativa continua.
UE: El alumno del curso de Estadstica I del grupo 4 del Perodo Acadmico 2003-I.
Previo al clculo de los indicadores de tendencia central y dispersin, se construye la
tabla de frecuencias y el polgono de frecuencias, dado qu, el observar el
comportamiento de la variable ayuda a visualizar la tendencia central
'
X i 1 X 'i
0.6
0.19
0.32
0.45
0.19
0.32
0.45
0.58
Xi
fi
0.125
0.255
0.385
0.515
6
4
4
5
6
10
X i fi
i 1
Xi
fi
0
Xi
Xi
fi
Xif i
0.19
0.32
0.45
0.58
0.71
- 0.84
0.125
0.255
0.385
0.515
0.645
0.775
6
4
4
5
6
10
35
0.75
1.02
1.54
2.575
3.87
7.75
17.505
'
i 1
0.7
0.20
0.33
0.46
0.59
0.71
Luego:
0.48037
'
= 0.5%
= 0.0577222 %2
2
X
X
i 1
2
i i
N
X i f 2i
0.09375
0.2601
0.5929
1.326125
2.49615
6.00625
10.775275
= 0.2403 %
CoV =
2. Clculo de la mediana.
Procedimiento.
a. Se construye la tabla de frecuencias acumuladas ( absolutas o relativas)
'
X i 1
0.6
0.19
0.32
0.45
0.58
0.71
b.
'
Xi
- 0.19
- 0.32
- 0.45
- 0.58
- 0.71
- 0.84
Fi
6
10
14
19
25
35
d.
`
Utilizando la frmula, Me X 3 A4
0.5N F3
, obtenemos el valor de
F4 F3
Me
0.5 %
0.541%
Mo1
0.125%
Mo2
0.775%
Dispersin
LoR
2
2
0.78%
0.0577% 0.24%
CoV
0.48
Interpretacin.
El coeficiente de Variacin, CoV, como es superior a 0.45 nos dice que los datos estn
dispersos, y al ver los valores de tendencia central la media y la mediana estos son
diferentes, aparentemente estn cerca el uno del otro, pero al observar la tabla de
frecuencias y el polgono de frecuencias vemos que hay dos valores frecuentes, 0125 y
0.775 en torno a los cuales se acumulan los datos es decir existen 2 modas, por lo que la
media aritmtica ni la mediana no son los adecuados para representar a los datos.
Del anlisis hecho al problema anterior concluimos, que no basta contar con los
indicadores, siempre es conveniente complementar el anlisis con la representacin
grfica de la distribucin de los datos o comportamiento de la variable.
PROPIEDADES DE LA MEDIA ARITMTICA Y LA VARIANZA
1. Si los datos asociados a una variable son todos iguales, entonces:
La media aritmtica es igual al valor que toma la variable, y la varianza es igual a
cero.
2
2. Sean la media, X , y la varianza, X , de la variable X, si se define una nueva
variable, digamos Y, donde Y = k + X, entonces:
2
2
La media aritmtica de Y es : Y X k y la varianza es Y X
2
3. Sean la media, X , y la varianza, X , de la variable X, si se define una nueva
variable, digamos Y, donde Y = k ( X) entonces:
2
2 2
La media aritmtica de Y es : Y k X , y la varianza es: Y k X
Ejemplo
Se tiene informacin respecto al peso de los alumnos ingresantes a la facultad de
Medicina de la Universidad AAA.
Medidas Resumen Alumnas
45 kg.
X
3 kg.
X
Lic. Mara A. Zacaras Daz
Pgina 48
Alumnos
70 Kg.
6 kg.
Posteriormente se supo que la balanza estaba malograda y que daba en exceso un peso
adicional de 3 kg. Al obtener los indicadores correctos, las autoridades concluyeron que
el peso de las alumnas es muy bajo. Es cierto lo que dicen las autoridades?
Solucin.
Sea la variable X: peso de la alumna.
2
Donde X = 45 kg. y X = 9 kg2
Sea la variable Y: peso correcto de la alumna, que esta definida como:
Y = X - 3
Por propiedades de la media y la varianza, tenemos que:
Y X 3 = 45 - 3 = 42 kg.
Y2 X2 = 9
Y 3 kg
Y2 k 2 X2 = 50.82 kg2
Y = 7.13 kg
C0V = 0.1154
Si bien las alumnas han incrementado su peso pero la variabilidad de los pesos tambin
se a incrementado, ya que el CoV = 0.11 > 0.071
DESVIACIN TIPICA O ESTANDAR.
La varianza se expresa en unidades que son el cuadrado de la unidad de la variable, que
no tiene significado real, por ello es preferible utilizar otra medida de dispersin y esta
es la desviacin tpica o estndar que se define como la raz cuadrada positiva de la
varianza.
Lic. Mara A. Zacaras Daz
Pgina 49
2
Cuando el polgono de frecuencias es simtrico o casi simtrico, la desviacin estndar
permite clasificar a las unidades estadsticas en cinco categoras e indicar el porcentaje
de individuos de cada categora.
Las categoras y el porcentaje son las siguientes:
Valores de la
variable
3
2
2
2
2
3
Nombre de la
categora
Muy malo
Malo
Regular
Bueno
Muy bueno
Porcentaje de
Unid. Estad.
2.5
13.5
68
13.5
2.5
Ejemplo.
El polgono de frecuencias del porcentaje de avance de los cursos semestrales es casi
simtrico, por lo que podemos usar la desviacin estndar para clasificar a los cursos:
Porcentaje de avance
32.77
37.38
41.99
51.21
55.82
37.38
41.99
51.21
55.82
60.43
Nombre de la
Categora
Avance muy bajo
Avance bajo
Avance regular
Avance Alto
Avance muy alto
Porcentaje de
cursos
Ningn curso
16.6
77.7
5.5
Ningn curso
Podemos observar que no hay ningn curso cuyo avance sea calificado como muy bajo
o muy alto, y en cuanto al porcentaje de cursos dentro de cada categora, difiere en
cuanto a lo establecido, debido a que el polgono es casi simtrico no es simtrico y
porque son pocos los datos.
VARIABLES ESTANDARIZADAS O TIPIFICADAS
Una variable puede tomar varias apariencias numricas, dependiendo de la unidad en la
cual es medida. Por ejemplo si se registra el ingreso de los trabajadores en soles o
dlares, la media aritmtica y la varianza con cada una de las unidades es diferente,
pero si se da en su forma estandarizada, las medias y las varianzas sern iguales en una
u otra unidad.
Una variable estandarizada se denota con Z y su definicin es:
X X
Z
X
Donde: X es la media y X es la desviacin estndar de X
xi X
, mide, en cuanto, un dato xi se aleja de
X
su media en trminos de su desviacin estndar.
Esta definicin indica que un dato, zi
Z2
X2
1
X2
Ejemplo
La nota media y la varianza del primer examen parcial del curso de clculo I de un
grupo de estudiantes es:
X = 10 puntos
X2 = 4 puntos2
Donde X: Nota de clculo I.
Un alumno obtuvo 11 de nota En unidades estndar a cuanto equivale su nota?
Rpta.
Nota
x = 11 puntos
En unidades estndar:
z
x X 11 10
0.5
X
2
Ejemplo.
La siguiente tabla muestra informacin estadstica, respecto a las notas del primer
examen parcial del curso de Estadstica, de todos los alumnos del curso, los cuales
estn divididos en dos grupos
Grupo
Nota media
1
2
13
13
Varianza
9
4
Comparando estas notas estandarizadas, que la nota de Rosa es menor que la nota de
Juan, entonces Juan esta en mejor posicin.