Professional Documents
Culture Documents
2011
ESTADISTICA
Presentación
A través de estas páginas te invito a descubrir diferentes desafíos, podrás explorar, aprender y construir
nuevos conceptos y aplicarlos para resolver diversas situaciones, actividades y problemas relacionados
con la estadística descriptiva.
Sabías que…
La estadística es una teoría general aplicable a cualquier campo científico en el cual se hacen
observaciones. El estudio y aplicación de los métodos estadísticos son necesarios en todos los campos
del saber, sean estos de nivel técnico o científico.
Se entiende como Estadística a una agrupación de datos ordenados en forma sistemática, en cuadros
y/o gráficos. Los datos son medidas, valores o características susceptibles de ser observados y
contados.
En la Estadística está la “variable” que es una característica que puede tener diferentes valores en los
distintos elementos o individuos de un conjunto.
Se diferencian dos usos del método estadístico: Estadística Descriptiva y Estadística Inferencial. La
Estadística descriptiva es el método para obtener, de un conjunto de datos, conclusiones sobre los
mismos y que no sobrepasen el conjunto de conocimientos que proporcionan estos datos. Su estudio
incluye el de las técnicas de colectar, presentar, analizar e interpretar los datos. Estadística inferencial es
el método o conjunto de técnicas que se utilizan para obtener conclusiones que sobrepasen los limites
de los conocimientos aportados por los datos.
Por lo tanto el método estadístico es una herramienta utilizada por el hombre para comprender los
hechos de la vida real.
Las aplicaciones de la Estadística se dan en casi todos los campos de la investigación tales como:
ciencias naturales, sociales, económicas, etc.
Problema 1:
Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que
la delgadez sea sinónimo de éxito social.
Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos, artistas o por la
publicidad comercial.
Durante el mes de marzo del año 2006, en el colegio “Alcántara” de la ciudad de Talca, después de las
vacaciones de verano, se observó con precaución a 27 alumnos con síntomas de anorexia,
registrándose los siguientes signos visibles:
2
Dieta Severa Miedo a Engordar Hiperactividad
Uso de Ropa Holgada Dieta Severa Uso de Laxantes
Miedo a Engordar Dieta Severa Uso de Ropa Holgada
Dieta Severa Uso de Ropa Holgada Dieta Severa
Dieta Severa Dieta Severa Uso de Ropa Holgada
Hiperactividad Uso de Laxantes Miedo a Engordar
Uso de Laxantes Dieta Severa Uso de Ropa Holgada
Uso de Laxantes Hiperactividad Uso de Laxantes
Uso de Ropa Holgada Hiperactividad Dieta Severa
a) ¿Podrías ordenar o resumir la información presentada? Y saber ¿Qué porcentaje representa cada
signo visible?
b) ¿Se puede representar gráficamente la información anterior?
c) ¿Cuál es el signo visible más común entre los jóvenes que presentan síntomas de anorexia?
Solución:
a) Respuesta:
f i
= n i
= frecuencia absoluta
n = total de datos
Ej: Del signo visible: Dieta severa:
9
f i
= =
27
= 0, 3 → 0,333333 x 100 = 33,3
2º Tabla de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio
Alcántara de la ciudad de Talca durante el mes de marzo del año 2006.
3
b) Respuesta:
Gráfico de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio
Alcántara de la ciudad de Talca durante el mes de marzo del año 2006.
c) Respuesta:
Interpretación: El signo visible que se observa con mayor frecuencia es el de una dieta severa.
Siendo la única medida posible de determinar: la moda, que en este caso corresponde al signo visible
dado por la dieta severa. (9 de 27 jóvenes lo presenta)
Se puede apreciar en la tabla, en la segunda columna; es la frecuencia absoluta que más se repite.
También se puede apreciar en el gráfico, el mayor porcentaje.
Problema 2:
Se realizo una encuesta a 30 familias de una cierta población sobre la duración de las ampolletas; la
información que se obtuvo fue la siguiente:
4
i) ¿Cómo ordenarías esta información en una tabla de distribución?
ii) ¿Cuánto duran en promedio las ampolletas? Interprete ese resultado.
iii) ¿cual es la duración de las ampolletas que más mencionan las familias?
Solución:
i) Respuesta:
n=30
ii) Respuesta:
La interpretación que se le puede dar es que el control de calidad de las ampolletas no debe permitir que
las ampolletas duren menos de 37 días. Para ser aceptadas deben durar más de 37 días.
iii) Respuesta:
La Moda:
5
Problema 3:
Un investigador estaba realizando un estudio sobre el ingreso per cápita mensual de una cierta cantidad
de familias en EEUU, pero accidentalmente dio vuelta la taza de café sobre su informe, perdiendo
algunos datos. Después de secar la hoja de papel, se podían distinguir de una tabla de distribución
simétrica de frecuencias la siguiente información sobre el ingreso per cápita en dólares de 150 familias.
x 4
= 7000, n
3
= 24, f 1
= 0,08, I = 7, F 4
= 0,62, n x = 48.000
i i
Solución:
i) Respuesta:
x' i−1
– x'1 x i n i N i f i
F i nxi i
n = 150
x 1
= 4000 pues n = 0,08 * 150 = 12 = n
7 1
(simetría)
Si x 4
= 7000 Se calcula c = amplitud del intervalo
4000 + 3c = 7000
c = 1000
ii) Respuesta:
Calculamos el promedio:
6
1050000
x = = 7000 x = 7000 Ingreso per cápita promedio de las familias.
150
iii) Respuesta:
36 − 24
Mo = 6500 + * 1000
[36 − 24] + [24 − 36]
12
Mo = * 1000 Mo = 7000 ingreso per cápita más recurrente.
24
iv) Respuesta:
Se calcula Me
Me =
Es decir el 50% inferior de las familias tiene un ingreso per cápita entre 3.500 y 7.000 dólares y el otro 50
% superior tiene un ingreso per cápita entre 7.000 y 10.500 dólares.
7
VERIFICANDO DISCO
Recuerda que:
Este texto pretende brindarte las posibilidades de emplear contenidos matemáticos en distintos contextos
para que logres la comprensión de los mismos.
¿Qué…? En este breve texto, encontrarás una parte de la estadística descriptiva, denominada Medidas
de Tendencia Central: Media Aritmética ó Promedio - Mediana y Moda.
¿Para qué…? Después de obtener, leer y analizar información de un conjunto de datos, de una tabla de
frecuencia o de un gráfico, podrás calcular e interpretar las medidas de tendencia central ya
mencionadas, desarrollando, al mismo tiempo, tu pensamiento y construyendo nuevos conocimientos a
través de la resolución de problemas, además y especialmente, para desarrollar tus habilidades y
pensamiento lógico ¿Cómo…? trabajando ya sea en forma individual o en equipo.
8
III.- CÓMO LO HARÍAS…
Ejercicio 1:
Marcos y su papá van a salir de cazar conejos el fin de semana, para lo cual compraron 25 cajas de
municiones, cada una contenía 48 proyectiles. Pero antes de salir, decidieron revisar su contenido y se
encontraron con que el número de proyectiles en mal estado en cada caja fue:
3 4 1 2 1 2 3 2 2 2 3 0 1 0 3 5 0 1 3 4 1 2 2 2 1
a) ¿Cómo podrían clasificar los resultados para saber el promedio por caja de proyectiles
defectuosos?
b) ¿En cuantas cajas encontraron el mayor numero de proyectiles defectuosos?
c) ¿Cuántos proyectiles defectuosos están por debajo de la mitad de cajas?
Ejercicio 2
Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación reportadas
aparecen en la siguiente tabla de frecuencias.
Edades Frecuencias
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1
Ejercicio 3:
En una encuesta sobre los ingresos anuales en miles de soles de un grupo de familias, en la ciudad de
Lima, se obtuvo la siguiente información:
9
[Li − Ls ) ni
10 – 30 20
30 – 50
50 – 70
70 - 90 20
Además, x = 54 y n /n
2 3
= 1/5,
Ejercicio 1:
En una importante empresa láctea hay 600 empleados que cobran $300.000, 500 que cobran $400.000,
100 que cobran $600.000 y 5 socios que perciben $3.000.000 cada uno. ¿Cuál es el ingreso promedio
de los empleados? ¿Puedes calcular la mediana de los ingresos? ¿Cuál es el ingreso que más recibido
por los empleados?
Discuta con sus compañeros, cual medida de tendencia central estima mejor el sueldo de los empleados
de la empresa.
Ejercicio 2:
El entrenador de un equipo de natación debe elegir a uno de sus integrantes para la próxima
competencia de estilo libre. Según los tiempos en segundos que obtuvieron los postulantes de las cinco
últimas carreras de 100 m de estilo libre, ¿qué nadador le conviene elegir?
Analiza y discute con tus compañeros, y fundamenten su respuesta, respecto a que nadador debe elegir
el entrenador, mencionando y explicando que procedimiento y/o operaciones realizaron para
determinarlo.
Ejercicio 3:
En una cierta empresa de 80 empleados, 60 de ellos ganan 500.000 pesos al mes y los 20 restantes
ganan 700.000 pesos al mes, a cada uno de ellos. Se pide:
10
b) ¿Sería igual la respuesta si los primeros 60 empleados ganaran un sueldo medio de 500.000 pesos y
los otros 20 un sueldo medio de 700.000 pesos?
c) Comentar si ese sueldo medio es o no representativo.
IV MIRO MI ENTORNO
Problema 1
Es común enterarse por la prensa del día lunes de algún grave accidente de tránsito ocurrido los fines de
semana, en los cuales los jóvenes son los protagonistas.
Generalmente los jóvenes creen que nada malo les va a pasar y piensan que tener un accidente o no
depende del azar. Por eso no toman conciencia de las horas sin dormir y el alcohol, entre otras puede
traerle consecuencias graves.
a) ¿En que hora del día sábado, ocurren más accidentes de tránsito?
b) ¿Cuál es el promedio de accidentes durante todo el fin de semana?
c) ¿Sobre el 50% de los accidentes que ocurren el día Viernes, en que horario se encuentran?
Problema 2
La obesidad en el mundo
Los últimos cálculos de la OMS indican que en 2005 había en todo el mundo:
11
Además, la OMS calcula que en 2015 habrá aproximadamente 2300 millones de adultos con sobrepeso
y más de 700 millones con obesidad.
En 2005 había en todo el mundo al menos 20 millones de menores de 5 años con sobrepeso.
Aunque antes se consideraba un problema exclusivo de los países de altos ingresos, el sobrepeso y la
obesidad están aumentando espectacularmente en los países de ingresos bajos y medios, sobre todo en
el medio urbano.
En un centro medico se está estudiando a la población infantil con sobrepeso, para lo cual se anotó en
una tabla los siguientes datos, de un total de 150 niños evaluados.
Problema 3:
Tabaquismo en chile
Chile, es uno de los países con más alto consumo de cigarrillos en la región de las Américas. En los
últimos 30 años se ha producido un aumento progresivo del consumo de tabaco.
Los 14 mil millones de cigarrillos que se fuman anualmente en nuestro país estarían liberando al
ambiente aproximadamente 20 toneladas de nicotina, 185 toneladas de material particulado respirable y
814 toneladas de monóxido de carbono.
La población del país, se presenta pequeñas diferencias respecto al consumo de tabaco según la región
en que viven. El estudio CONACE 20047 muestra que en la V Región se fuma más que en el resto del
país, alcanzando en ese momento al 45,19% de su población y en la IX Región fumaría el 36,
9%, de los habitantes entre 12 y 64 años, lo que los convierte en la región menos fumadora.
Se realizo una encuesta 250 fumadores, mayores de edad, de la ciudad de Arica, en un conocido mall,
preguntándoles cuantos cigarrillos se fumaban al día; las respuestas están resumidas en la siguiente
tabla:
12
Cantidad de cigarrillos Nº De fumadores
1–5 40
5 – 10 39
10 – 15 65
15 - 20 70
+ de 20 46
a) ¿Cuál es la cantidad más frecuente del consumo de cigarrillos entre los fumadores de Arica?
b) ¿En promedio, cuántos cigarros al día se fuman estas personas?
c) La mitad superior de esta muestra cuantos cigarrillos se fuman al día?
Ejercicio 1:
Se han anotado las tallas, en centímetros, de los 40 alumnos de una clase y se han obtenido los
siguientes resultados:
160, 167, 163, 148, 151, 158, 166, 166, 157, 153, 151, 151, 150, 155, 164, 162, 166, 171, 167, 165, 152,
150, 147, 152, 162, 155, 158, 158, 158, 164, 157, 155, 160, 154, 153, 156, 160, 159, 159, 158, 163, 161.
Ejercicio 2:
Dos amigos decidieron comprobar cuanto duraba realmente la carga de batería de sus mp4 por lo que
han estado anotando, cuidadosamente, varias veces, la duración, en minutos, de escuchar música
continuamente y han obtenido:
40, 44, 42, 47, 41, 42, 47, 43, 48, 44, 49, 41, 46, 43, 47, 42, 46, 44, 54, 53, 47,
43, 40, 48, 54, 68, 66, 59, 51, 53, 49, 45, 52, 57, 63, 67
a) ¿cuántos minutos promedio pueden escuchar música en sus mp4, en forma continua?
b) ¿Qué cantidad de minutos se repite más, en estas observaciones?
c) ¿Cuál es la el intervalo más aceptado de duración para escuchar música continuamente?
Ejercicio 3:
En un estacionamiento cobran por cada minuto que está estacionado el vehículo $ 10. La ocupación del
estacionamiento durante la semana pasada fue la siguiente:
13
Tiempo de estacionamiento (min.) nº de vehículos
0 – 60 1240
60 -120 3575
120 -180 746
180 – 240 327
240 - 300 218
300 - 360 44
Las medidas de centralización son unos parámetros que representan la muestra. Son útiles porque
hacen una estimación que indica alrededor de que valores se aglutinan los datos. Es decir, son los datos
de la variable que se encuentran más cerca del resto de los datos.
Se denominan, también, estadígrafos de tendencia central.
Las principales medidas centrales son: la media aritmética ( x ), la moda (Mo) y la mediana (Me).
Veamos en que consiste cada una de ellas:
a) MEDIA ARITMÉTICA ( X )
La media aritmética también se llama “media” o “promedio aritmético” y es lo que siempre has ocupado
para calcular el promedio de notas.
La media aritmética se calcula dependiendo de cómo vengan los datos, pero en general es la suma de
todos los datos dividida por el número total de datos.
14
Donde:
k x = Promedio o Media
∑x i k
x= i =1
∑x i = sumatoria de elementos
n i =1
i) En el primer caso se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos
productos, y el resultado dividirlo por la suma de los datos, esto es:
Ejemplo:
15
Por lo tanto su media es:
ii) En el segundo caso se define la marca de clase de un intervalo como la media aritmética entre los
extremos de él.
Ejemplo:
La tabla de distribución siguiente nos muestra la duración en días que tuvieron un total de 30 ampolletas
20 – 26 23 7 0,233
27 – 33 30 8 0,266
34 – 40 37 5 0,166
41 – 47 44 4 0,133
48 – 54 51 2 0,066
55 – 61 58 3 0,10
62 - 68 65 1 0,033
n=30
16
ii)
1)
Solución:
==
2)
Solución:
3)
4)
5) Promedio Total
Si tenemos tres conjuntos de observaciones de los cuales el primero tiene n1 elementos y promedio X1
el segundo tiene n2 elementos y promedio X2 y el tercero tiene n3 elementos con promedio X3 entonces
la media aritmética de los tres conjuntos es:
17
Generalizando
b) LA MODA (Mo)
Se define como aquel valor de la variable que representa la mayor frecuencia en una distribución. Es
decir, La moda es el valor de la variable que más se repite.
Ejemplo:
2; 4; 5; 2; 3; 4; 6; 4; 7
La moda es 4 pues hay tres trabajadores con la calificación 4 que es una moda unimodal, pero si
tenemos 2, 1, 2, 4, 5, 4, 7 la moda es 2 y 4 que es una moda bimodal, por lo tanto la moda no es única.
Si tenemos una tabla de distribución con intervalos la moda la calculamos de la siguiente forma:
Primero debemos saber en que intervalo se encuentra, para ello se ubica la mayor frecuencia absoluta y
luego aplicamos la formula.
d1 = |n1- ni-1|
d2 = |ni-1 – ni|
Ejemplo:
Consideremos la siguiente tabla de frecuencia, que nos muestra el nº de palabras que lee un niño de
segundo básico por minuto. El estudio fue realizado en un curso de 40 alumnos.
18
x' i−1
– x'
1 x i n i N i f F i f % F i
%
i i
Hallar la moda
Solución:
Para encontrar la moda, primero debemos saber en que intervalo esta para ello la mayor frecuencia
absoluta es 11 por lo tanto la moda esta en el intervalo 90 – 110
Así
c) LA MEDIANA (Me)
Se define como el valor central de un conjunto de observaciones que ha sido ordenado en forma
creciente o decreciente, es decir, deja el mismo número de observaciones bajo él, que sobre él (es el
50% de los casos).
Ejemplo:
Solución:
En cambio si tuviéramos
3, 5, 9, 14, 15, 18, 19, 21
La mediana es
Antes de poder calcular la mediana debemos saber en que intervalo se encuentra. Para ello se toma la
mitad del tamaño de la muestra y se ve en la columna de las frecuencias absolutas acumuladas (Ni),
cual es el menor valor que la contiene y este valor nos indica el intervalo donde esta la mediana.
19
Luego se aplica la siguiente formula para calcular la mediana:
Me =
Donde:
Nja = es la frecuencia absoluta acumulada anterior al valor que contenía a n/2.
nj = n i
frecuencia absoluta del intervalo donde esta la mediana.
Ejemplo: Calcule la mediana observando la siguiente tabla de distribución. La cual indica el pago de
impuestos (en UF) de 40 contribuyentes. De un exclusivo condominio del sector oriente.
Solución:
Y en la columna de los Ni el menor valor que lo contiene es 25, por lo tanto el intervalo
donde esta Me, es 90 – 110.
Entonces Me =
Luego Me =
Me = 100,9
20
VII.- ¿QUÉ APRENDÍ?
Ejercicio 1:
Algunas décadas atrás la gente moría por la tubercololis, enfermedad hoy ya casi erradicada, La tabla
siguiente muestra la composición por edad, sexo y trabajo de un grupo de personas con tuberculosis
pulmonar en la provincia de Vizcaya en el año 1979:
14-19 2 1 3 25 40 65 27 41 68
19-24 10 4 14 20 36 56 30 40 70
24-29 32 10 42 15 50 65 47 60 107
29-34 47 12 59 13 34 47 60 46 106
34-39 38 8 46 10 25 35 48 33 81
39-44 22 4 26 7 18 25 29 22 51
a) ¿Cuál es la edad en la que se observa con mayor frecuencia que no trabajan los varones? ¿Y las
mujeres? Determinar asímismo la edad más frecuente (sin distinción de sexos ni ocupación).
b) ¿Por debajo de qué edad está el 50% de los varones?
c) ¿Por encima de qué edad se encuentra el 50% de las mujeres?
Ejercicio 2:
Una empresa grande de equipos deportivos está probando el efecto de dos planes publicitarios sobre las
ventas de los últimos 4 meses. Dadas las ventas que se ven aquí, ¿cuál programa de publicidad parece
producir el crecimiento promedio más alto en ventas mensuales?
21
Ejercicio3:
Las ganancias diarias de los establecimientos de un centro comercial se presentan en una tabla de
frecuencias con 6 intervalos de clase y se sabe que: la mínima ganancia es de $6, el rango es 36, el
promedio de ganancias diarias es $25.14, el 50% de los establecimientos ganan más de 25.58 dólares
diarios, F2=0.15, N2=120, f3=0.25, F5=0.93, n4=304, n2=2n1. ¿Se puede reconstruir la distribución de
todas las frecuencias y hallar la ganancia más frecuente y la ganancia promedio?
22
VIII.- ¿CUÁNTO SÉ?
Evaluación 1
PROBLEMA
8 2 10 17 15
10 17 8 2 10
15 15 2 1 17
2 8 8 15 15
Coloca la puntuación que corresponda, según las respuestas dadas (sí, más o menos, no)
SI MÁS O MENOS NO
3 2 1
Puntuación
Ordene los datos en una tabla de
Frecuencia (de cada uno de los problemas)
Use los datos de la tabla de
Distribución para resolver el problema.
Esta correcto el resultado de cada una de las medidas
De tendencia central solicitada
Total
23
¿Qué logré?
Autoevaluación:
Según todo lo visto en este capitulo y la cantidad de ejercicios que pudiste resolver contesta lo siguiente:
24
IX.- SINTESIS
VERIFICANDO DISCO
Completa el siguiente esquema con las formulas y los puntos más relevantes de cada una de las
medidas de tendencia central:
Estadística Descriptiva
∑x i
x= i =1
25
X.- PRÓXIMO DESAFIO…
Ejercicio 1:
Una empresa tenía a finales del pasado año mil seiscientos cincuenta accionistas distribuidos de la
siguiente forma:
Nº de acciones Nº de accionistas
0-20 1030
20-60 380
60-100 150
100-500 80
500-1000 10
¿Cuál es el promedio de acciones que tiene cada accionista? ¿Qué dispersión presenta con respecto a
ese promedio?
Ejercicio 2:
Ejercicio 3:
En un diagnóstico de educación física se pidió a los alumnos de los cuartos medios que hicieran
abdominales durante 3 minutos. Se obtuvieron los siguientes resultados:
4º A: 45 38 43 29 34 60 54 27 32 33 23 34 34 28 56 62 56 57 45 47 48 54
33 45 44 41 34 36 34 54
4º B: 43 45 44 38 34 46 43 42 43 45 57 44 38 38 37 43 61 38 37 45 28 42
41 49 40 37 34 44 41 43
¿Cuál de los dos cursos tiene el rendimiento más parejo? ¿Qué distribución estadístico permite comparar
la distribución de este tipo de datos?
26
ANEXOS
GLOSARIO
Estadística: es la rama de la matemática que nos permite recoger, organizar y analizar datos.
Existen dos conceptos importantes dentro de la estadística que nos permiten analizar y estudiar
dichos datos, estos son: población y muestra.
Gráfica: es una representación de la relación entre variables, muchos tipos de gráficos aparecen
en estadística, según la naturaleza de los datos involucrados y el propósito de la gráfica, es la de
representar los valores tabulados obtenidos de los muestreos o los datos del total de la
población.
27
SOLUCIONARIO
III.1.- Inténtalo tú
Ejercicio 1:
x i n i N i f i
F i f i
% F i
%
0 3 3 0,12 0,12 12 12
1 6 9 0,24 0,36 24 36
2 8 17 0,32 0,68 32 68
3 5 22 0,20 0,88 20 88
4 2 24 0,08 0,96 8 96
5 1 25 0,04 1,00 4 100
Ejercicio 1:
Me= 400.000
Mo = 300.000
Dado que se trata de una distribución tan asimétrica, la mediana es la medida más recomendable.
Ejercicio 1:
28
6360
a) x = = 159
40
b) Mo = 158 La talla que más se repite está entre 155 y 160
c) Me = 158.75 Los de menor talla están entre 145 y 158,75 y los de mayor talla están entre 158,75 y
los 175 cm.
Ejercicio 2
Muestra 1 Muestra 2
x x
x f m
[ 4 0 ,4 5 ) 13 4 2 ,5 media 4 9 ,4 1
[ 4 5 ,5 0 ) 11 4 7 ,5 moda 4 2 .5
[ 5 0 ,5 5 ) 6 52 ,5 mediana 4 2 .5
[ 5 5 ,6 0 ) 2 57,5 rango 28
[ 6 0 ,6 5 ) 1 6 2 ,5 varianza 6 3 ,6 4
[ 6 5 ,7 0 ] 3 6 7 ,5
36
29