Professional Documents
Culture Documents
Matemtica
Estadstica
21
Introduccin.
No se sabe con exactitud cundo se comenz a utilizar la estadstica, los datos ms antiguos
son, al parecer, los censos chinos que se realizaron hace unos 4.000 aos.
Desde esa poca, diversos estados realizaron estudios sobre algunas caractersticas de sus
poblaciones, sus riquezas, posesiones, etc.
Hasta el siglo XVII la estadstica se limitaba a describir ordenando datos y dando informacin
sobre los hechos en estudio.
En 1662, Jhon Graunt (1620 1674), un mercader ingls, public un libro sobre los nacimientos
y defunciones ocurridos en Londres entre 1601 y 1664; el libro contena conclusiones acerca ce
ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el
punto de partida de la estadstica moderna.
La palabra estadstica comenz a usarse en el siglo XVIII, en Alemania, en relacin a estudios
donde los grandes nmeros, que representaban datos, eran de importancia para el estado.
Sin embargo, la estadstica moderna se desarroll en el siglo XX a partir de los estudios de
Kart Pearson. Hoy, la estadstica tiene importancia no solo porque presenta informacin, sino
adems permite interpretar y predecir lo que va a ocurrir, y por lo tanto, es una herramienta
fundamental a la hora de tomar decisiones de importancia.
1. Conceptos Bsicos.
En chile, cada 10 aos se hace un censo para estudiar caractersticas de la poblacin en
diversos planos, tales como: el econmico, cultural, educacional, salud, etc. A travs del
censo se determina tambin la cantidad de personas que habitan el pas.
Realizar un censo implica para el Estado una fuerte inversin econmica, por lo que en
muchas ocasiones, para llevar a cabo una investigacin se hacen encuestas, las cuales son
dirigidas a una muestra representativa de la poblacin.
Leccin 21
PREUJOVEN
Matemtica
Leccin 21
PREUJOVEN
Matemtica
Para representar a una poblacin a travs de un valor, se utilizan las llamadas medidas de
tendencia central, estas son: la media, la mediana y la moda.
La media ( x ): Tambin conocida como media aritmtica. Se calcula sumando todos los datos
obtenidos y dividiendo la suma por la cantidad total de datos. Tambin se le conoce como
promedio.
x=
x +x +x
1
+ ... + x n
n
n
x=
x
i =1
Leccin 21
PREUJOVEN
Matemtica
A veces es necesario saber si los datos obtenidos se concentran en torno a un valor o son muy
dispersos. Para ello existen los indicadores de dispersin, estos son rango, desviacin media y
desviacin tpica o estndar.
Rango: Es la diferencia entre el valor mnimo y el valor mximo en un grupo de nmeros.
x x
i
, de cada elemento,
x x
DM =
i =1
Desviacin tpica (s): Tambin conocida como desviacin estndar, es una medida de
dispersin para variables de razn y de intervalo, de gran utilidad en la estadstica
descriptiva. Es una medida que informa de la media de distancias que tienen los datos
respecto de su media aritmtica, expresada en las mismas unidades que la variable.
n
( x x )
n
i =1
2. Tablas y Grficos.
Frecuencia absoluta (
frecuencia absoluta.
Frecuencia relativa (
total de datos.
Leccin 21
PREUJOVEN
Matemtica
frecuencia relativa.
Si el nmero de datos es grande la variable es continua, los datos se agrupan en intervalos o
clases. Todas las clases deben tener la misma amplitud.
Marca de clase: Es el valor que est al centro del intervalo.
2.1 Tablas.
Una tabla estadstica sirve para presentar de forma ordenada las distribuciones de
frecuencias.
A) Tablas tipo I: Cuando el tamao de la muestra y el recorrido de la variable son pequeos,
por ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer
nada especial, simplemente anotarlas de forma ordenada en filas y columnas:
Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45
B) Tablas tipo II: Cuando el tamao de la muestra es grande y el recorrido de la variable es
pequeo, por lo que hay valores de la variable que se repiten. Por ejemplo, si preguntamos el
nmero de personas activas que hay en 50 familias, obtenemos la siguiente tabla:
Personas Activas en 50 familias
2
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que
precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla:
Leccin 21
Personas Activas
Nmero de Familias
16
20
Total
50
PREUJOVEN
Matemtica
C) Tablas tipo III: Cuando el tamao de la muestra y el recorrido de la variable son grandes,
ser necesario agrupar en intervalos los valores de la variable.
Los intervalos sern siempre cerrados por la izquierda y abiertos por la derecha.
Ejemplo:
Construccin de una tabla de datos agrupados.
Datos:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1) Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.
2) Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible
por el nmero de intervalos que queramos poner.
Es conveniente que el nmero de intervalos oscile entre 6 y 15.
En este caso, 48 3 = 45. Incrementamos el nmero hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al
intervalo, pero el lmite superior no pertenece al intervalo, se cuenta en el siguiente
intervalo.
ci
fi
Fi
hi
Hi
[0, 5)
2.5
0.025
0.025
[5, 10)
7.5
0.025
0.050
[10, 15)
12.5
0.075
0.125
[15, 20)
17.5
0.075
0.200
[20, 25)
22.5
11
0.075
0.2775
[25, 30)
27.5
17
0.150
0.425
[30, 35)
32.5
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
42.5
38
0.100
0.950
[45, 50)
47.5
40
0.050
40
Leccin 21
PREUJOVEN
Matemtica
2.2 Grficos.
Podemos representar los datos en muchos tipos de grficos, pero los principales son:
histogramas, polgono de frecuencia y grfico de sectores.
Histograma: Usado para variables continuas. En el eje de las abscisas se sealan los extremos
de los intervalos. Se construyen unos rectngulos de base la amplitud del intervalo y de altura
la frecuencia absoluta.
Polgono de frecuencias: Se obtiene uniendo los puntos medios de los segmentos superiores
de los rectngulos del diagrama.
Leccin 21
PREUJOVEN
Matemtica
Para calcular la media, a partir de los datos expuestos en una tabla, primero se
debe multiplicar cada marca de clase por su correspondiente
, luego se
i
Atencin
suman los resultados y por ltimo la suma se divide por el total de datos.
3. Promedio Ponderado.
En muchas ocasiones, las observaciones recolectadas no tienen la misma importancia relativa.
Para hacer presente este hecho en la bsqueda de un centro que represente a los datos, es
necesario asignar a cada uno de estos, una ponderacin (peso o coeficiente) que represente su
importancia dentro de la muestra.
A modo de ejemplo, considrese un sistema de calificacin de de un curso en que las pruebas
tienen distinto coeficiente, segn su importancia en el proceso de evaluacin del trabajo
del alumno. En este caso, no resulta apropiado el promedio simple. Cada nota parcial debe ser
multiplicada por su coeficiente, para luego sumar estos resultados y dividirlos por la suma de
los coeficientes respectivos.
Definicin:
Sean
w 0;
i
x , x , x ,..., x
1
, n datos y
w , w , w ,..., w
1
PREUJOVEN
Matemtica
n
w x w x + w x + ... + w x
=
x=
w + w + ... + w
w
i =1
n
i =1
Ejemplos:
1) Si un alumno obtiene un 5,5 en una prueba de coeficiente 1 y un 4,9 en otra de coeficiente
2. Cul es la nota promedio de estas dos pruebas?
En este caso, los coeficientes son diferentes, por lo tanto no debe usarse el promedio simple
sino uno ponderado en que las ponderaciones son 1 y 2 respectivamente. En consecuencia, la
suma del numerador est dada por 5, 5i1 + 4, 9i2 = 15, 3 . El denominador, que consiste en la
suma de de las ponderaciones, est dado por 1 + 2 = 3. En consecuencia, el promedio
ponderado es 15,3/3 = 5,1.
2) En el colegio, el promedio anual de un alumno se calcula sumando la nota final de cada
asignatura y dividiendo el resultado por el nmero total de estas, as todas las asignaturas
tienen igual importancia.
En la educacin superior, por lo general las notas de los ramos tienen distinta importancia; un
ramo tiene ms valor o importancia, si el tiempo de dedicacin que se exige es mayor.
Felipe hizo una tabla, calcul cul sera su promedio ponderado:
Asignaturas
Promedio (p)
Horas (h)
pxh
Lenguaje
4,3
25,8
Ingls
5,7
22,8
Filosofa
6,4
12,8
Historia
5,4
21,6
Matemtica
5,2
31,2
Biologa
5,6
22,4
Artes
6,8
13,6
Educacin Fsica
6,7
13,4
Fsica
5,3
21,2
Matemtica superior
5,5
22
Promedio final
5,7
38
5,4
4,3i6 + 5, 7i4 + 6, 4i2 + 5, 4i4 + 5, 2i6 + 5, 6i4 + 6,8i2 + 6, 7i2 + 5,3i4 + 5,5i4
= 5, 4
38
Leccin 21
PREUJOVEN
Matemtica
s=
fi
[0 - 10[
45
[10 - 20[
76
[20 - 30[
145
[30 - 40[
98
[40 - 50[
29
[50 - 60[
16
Fi
hi = fi / n
Leccin 21
10
PREUJOVEN
Matemtica
Mar Montaa Campo Mar Ro Mar Lago Mar Montaa Mar Campo
Mar lago Mar Mar Ri Campo Montaa Mar Lago Lago Mar Mar
Mar Montaa Campo Mar Lago
i) Completa la siguiente tabla:
Lugar
fi
hi = fi / n
Campo
Lago
Mar
Montaa
Ro
Total
11
PREUJOVEN
Matemtica
156
176
170
150
185
172
166
157
154
189
159
167
170
175
169
161
169
173
160
173
185
182
173
175
171
186
170
174
177
173
192
169
168
178
179
167
166
180
163
170
172
169
164
162
172
165
170
172
158
180
164
171
159
166
167
174
163
184
168
171
163
183
174
155
168
174
172
171
174
173
HOMBRE
2
53
60
25
MUJER
3
60
37
18
Ni
7
10
15
13
18
21
16
10
Leccin 21
12
PREUJOVEN
Matemtica
Ingresa al Campus Virtual para hacer consultas e interactuar con tus compaeros de
curso. Comparte con tus amigos este material, invitndolos a inscribirse
gratuitamente en
www.preujoven.cl
Leccin 21
13