You are on page 1of 29

Laura Paz Millao Becerra

2011
ESTADISTICA

MEDIDAS DE TENDENCIA CENTRAL

Presentación

A través de estas páginas te invito a descubrir diferentes desafíos, podrás explorar, aprender y construir
nuevos conceptos y aplicarlos para resolver diversas situaciones, actividades y problemas relacionados
con la estadística descriptiva.

Sabías que…

La estadística es una teoría general aplicable a cualquier campo científico en el cual se hacen
observaciones. El estudio y aplicación de los métodos estadísticos son necesarios en todos los campos
del saber, sean estos de nivel técnico o científico.

Se entiende como Estadística a una agrupación de datos ordenados en forma sistemática, en cuadros
y/o gráficos. Los datos son medidas, valores o características susceptibles de ser observados y
contados.

En la Estadística está la “variable” que es una característica que puede tener diferentes valores en los
distintos elementos o individuos de un conjunto.

Se diferencian dos usos del método estadístico: Estadística Descriptiva y Estadística Inferencial. La
Estadística descriptiva es el método para obtener, de un conjunto de datos, conclusiones sobre los
mismos y que no sobrepasen el conjunto de conocimientos que proporcionan estos datos. Su estudio
incluye el de las técnicas de colectar, presentar, analizar e interpretar los datos. Estadística inferencial es
el método o conjunto de técnicas que se utilizan para obtener conclusiones que sobrepasen los limites
de los conocimientos aportados por los datos.

Por lo tanto el método estadístico es una herramienta utilizada por el hombre para comprender los
hechos de la vida real.
Las aplicaciones de la Estadística se dan en casi todos los campos de la investigación tales como:
ciencias naturales, sociales, económicas, etc.

I Exploremos un Contexto Global

Problema 1:

Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que
la delgadez sea sinónimo de éxito social.
Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos, artistas o por la
publicidad comercial.
Durante el mes de marzo del año 2006, en el colegio “Alcántara” de la ciudad de Talca, después de las
vacaciones de verano, se observó con precaución a 27 alumnos con síntomas de anorexia,
registrándose los siguientes signos visibles:

2
Dieta Severa Miedo a Engordar Hiperactividad
Uso de Ropa Holgada Dieta Severa Uso de Laxantes
Miedo a Engordar Dieta Severa Uso de Ropa Holgada
Dieta Severa Uso de Ropa Holgada Dieta Severa
Dieta Severa Dieta Severa Uso de Ropa Holgada
Hiperactividad Uso de Laxantes Miedo a Engordar
Uso de Laxantes Dieta Severa Uso de Ropa Holgada
Uso de Laxantes Hiperactividad Uso de Laxantes
Uso de Ropa Holgada Hiperactividad Dieta Severa

a) ¿Podrías ordenar o resumir la información presentada? Y saber ¿Qué porcentaje representa cada
signo visible?
b) ¿Se puede representar gráficamente la información anterior?
c) ¿Cuál es el signo visible más común entre los jóvenes que presentan síntomas de anorexia?

Solución:

a) Respuesta:

1º Calculamos porcentaje de cada signo visible:


f i
= frecuencia relativa

f i
= n i
= frecuencia absoluta

n = total de datos
Ej: Del signo visible: Dieta severa:

9
f i
= =
27
= 0, 3 → 0,333333 x 100 = 33,3

2º Tabla de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio
Alcántara de la ciudad de Talca durante el mes de marzo del año 2006.

Signo Visible Número de alumnos ( n)


i
Porcentaje de alumnos f i
x 100

Dieta severa 9 33,3


Miedo a engordar 3 11,1
Hiperactividad 4 14,8
Uso de laxantes 5 18,5
Uso de ropa holgada 6 22,2
Total 27 100,0

3
b) Respuesta:

Gráfico de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio
Alcántara de la ciudad de Talca durante el mes de marzo del año 2006.

c) Respuesta:

Interpretación: El signo visible que se observa con mayor frecuencia es el de una dieta severa.
Siendo la única medida posible de determinar: la moda, que en este caso corresponde al signo visible
dado por la dieta severa. (9 de 27 jóvenes lo presenta)
Se puede apreciar en la tabla, en la segunda columna; es la frecuencia absoluta que más se repite.
También se puede apreciar en el gráfico, el mayor porcentaje.

Problema 2:

Se realizo una encuesta a 30 familias de una cierta población sobre la duración de las ampolletas; la
información que se obtuvo fue la siguiente:

7 familias dijeron que les duraban entre 20 y 26 días


8 dijeron entre 27 y 33 días
5 dijeron entre 34 y 40 días
2 dijeron entre 48 y 54 días
3 dijeron entre 55 y 61 días, y una familia dijo que le duro más de 62 días.

4
i) ¿Cómo ordenarías esta información en una tabla de distribución?
ii) ¿Cuánto duran en promedio las ampolletas? Interprete ese resultado.
iii) ¿cual es la duración de las ampolletas que más mencionan las familias?

Solución:

i) Respuesta:

Intervalos Marca de Frecuencia Frecuencia


clase Absoluta Relativa
x' i−1
– x' 1 x i n i f i
20 – 26 23 7 0,233
27 – 33 30 8 0,266
34 – 40 37 5 0,166
41 – 47 44 4 0,133
48 – 54 51 2 0,066
55 – 61 58 3 0,10
62 - 68 65 1 0,033

n=30

ii) Respuesta:

La interpretación que se le puede dar es que el control de calidad de las ampolletas no debe permitir que
las ampolletas duren menos de 37 días. Para ser aceptadas deben durar más de 37 días.

iii) Respuesta:

La Moda:

La mayor frecuencia absoluta es 8. Luego la moda esta en el intervalo 27 – 33 y la moda es:

5
Problema 3:

Un investigador estaba realizando un estudio sobre el ingreso per cápita mensual de una cierta cantidad
de familias en EEUU, pero accidentalmente dio vuelta la taza de café sobre su informe, perdiendo
algunos datos. Después de secar la hoja de papel, se podían distinguir de una tabla de distribución
simétrica de frecuencias la siguiente información sobre el ingreso per cápita en dólares de 150 familias.

x 4
= 7000, n
3
= 24, f 1
= 0,08, I = 7, F 4
= 0,62, n x = 48.000
i i

i) ¿Puede reconstruir la tabla de distribución con los datos que tiene?


ii) ¿Cuál es el ingreso per cápita promedio de las familias?
iii) ¿Cuál es el ingreso per cápita más recurrente?,
iv) ¿Entre cuánto se encuentra el ingreso per cápita del 50% inferior de las familias?

Solución:

i) Respuesta:

x' i−1
– x'1 x i n i N i f i
F i nxi i

3500 - 4500 4000 12 12 0,08 0,08 48.000


4500 - 5500 5000 21 33 0,14 0,22
5500 - 6500 6000 24 57 0,16 0,38
6500 - 7500 7000 36 93 0,24 0,62
7500 - 8500 8000 24 117 0,16 0,78
8500 - 9500 9000 21 138 0,14 0,52
9500 – 10.500 10.000 12 150 0,08 1,00

n = 150

x 1
= 4000 pues n = 0,08 * 150 = 12 = n
7 1
(simetría)

Si x 4
= 7000 Se calcula  c = amplitud del intervalo

4000 + 3c = 7000

c = 1000

ii) Respuesta:

Calculamos el promedio:

4000 * 12 + 5000 * 21 + 6000 * 24 + 7000 * 36 + 8000 * 24 + 9000 * 21 + 10000 * 12


x =
150

6
1050000
x = = 7000 x = 7000  Ingreso per cápita promedio de las familias.
150

iii) Respuesta:

36 − 24
Mo = 6500 + * 1000
[36 − 24] + [24 − 36]

12
Mo = * 1000  Mo = 7000  ingreso per cápita más recurrente.
24

iv) Respuesta:

Se calcula Me

Me =

Es decir el 50% inferior de las familias tiene un ingreso per cápita entre 3.500 y 7.000 dólares y el otro 50
% superior tiene un ingreso per cápita entre 7.000 y 10.500 dólares.

7
VERIFICANDO DISCO

Recuerda que:

Tablas de frecuencia: Es un tipo de representación que permite organizar datos.


Frecuencia Absoluta n : Es el número de veces que se repita un dato, incluidos en un determinado
i
intervalo.
Frecuencia Absoluta Acumulada N i : Es la suma de las frecuencias absolutas de los valores menores
o iguales al valor de la variable en cuestión. El último valor
de ésta debe ser igual al nº total de datos.
Frecuencia relativa f i
: Es el cociente entre la frecuencia absoluta y el nº total de datos o tamaño de la
muestra.
Frecuencia relativa acumulada (o porcentual) F i
: Es el porcentaje de la frecuencia absoluta con
respecto al tamaño de la muestra.

Intervalos Marca de Frecuencia Frec. Frecuencia Frecuencia


clase Absoluta Absoluta Ac. Relativa Relativa %
x' i −1
– x'
1 x i n i N i f i
F i

II ¿QUÉ, PARA QUÉ Y CÓMO?

Este texto pretende brindarte las posibilidades de emplear contenidos matemáticos en distintos contextos
para que logres la comprensión de los mismos.

¿Qué…? En este breve texto, encontrarás una parte de la estadística descriptiva, denominada Medidas
de Tendencia Central: Media Aritmética ó Promedio - Mediana y Moda.

¿Para qué…? Después de obtener, leer y analizar información de un conjunto de datos, de una tabla de
frecuencia o de un gráfico, podrás calcular e interpretar las medidas de tendencia central ya
mencionadas, desarrollando, al mismo tiempo, tu pensamiento y construyendo nuevos conocimientos a
través de la resolución de problemas, además y especialmente, para desarrollar tus habilidades y
pensamiento lógico ¿Cómo…? trabajando ya sea en forma individual o en equipo.

8
III.- CÓMO LO HARÍAS…

III.1.- Inténtalo tú…

Ejercicio 1:

Marcos y su papá van a salir de cazar conejos el fin de semana, para lo cual compraron 25 cajas de
municiones, cada una contenía 48 proyectiles. Pero antes de salir, decidieron revisar su contenido y se
encontraron con que el número de proyectiles en mal estado en cada caja fue:

3 4 1 2 1 2 3 2 2 2 3 0 1 0 3 5 0 1 3 4 1 2 2 2 1

a) ¿Cómo podrían clasificar los resultados para saber el promedio por caja de proyectiles
defectuosos?
b) ¿En cuantas cajas encontraron el mayor numero de proyectiles defectuosos?
c) ¿Cuántos proyectiles defectuosos están por debajo de la mitad de cajas?

Ejercicio 2

Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación reportadas
aparecen en la siguiente tabla de frecuencias.

Edades Frecuencias
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1

a) ¿Cuál es la edad promedio que tiene los directores ejecutivos?


b) ¿Cuál es la edad más reportada, que presentan los ejecutivos?
c) ¿Sobre el 50% de los ejecutivos, que edad presenta este grupo?

Ejercicio 3:

En una encuesta sobre los ingresos anuales en miles de soles de un grupo de familias, en la ciudad de
Lima, se obtuvo la siguiente información:

9
[Li − Ls ) ni
10 – 30 20
30 – 50
50 – 70
70 - 90 20

Además, x = 54 y n /n
2 3
= 1/5,

¿Cuál es el número de familias con ingreso no menos de 50 mil soles?

III.2.- Inténtalo con tus compañeros

Ejercicio 1:

En una importante empresa láctea hay 600 empleados que cobran $300.000, 500 que cobran $400.000,
100 que cobran $600.000 y 5 socios que perciben $3.000.000 cada uno. ¿Cuál es el ingreso promedio
de los empleados? ¿Puedes calcular la mediana de los ingresos? ¿Cuál es el ingreso que más recibido
por los empleados?

Discuta con sus compañeros, cual medida de tendencia central estima mejor el sueldo de los empleados
de la empresa.

Ejercicio 2:

El entrenador de un equipo de natación debe elegir a uno de sus integrantes para la próxima
competencia de estilo libre. Según los tiempos en segundos que obtuvieron los postulantes de las cinco
últimas carreras de 100 m de estilo libre, ¿qué nadador le conviene elegir?

Diego 61,7 61,7 62,3 62,9 63,1


Tomás 61,5 62,9 62,9 63,7 63,7
Sergio 60,7 62,4 62,7 62,7 63,2

Analiza y discute con tus compañeros, y fundamenten su respuesta, respecto a que nadador debe elegir
el entrenador, mencionando y explicando que procedimiento y/o operaciones realizaron para
determinarlo.

Ejercicio 3:

En una cierta empresa de 80 empleados, 60 de ellos ganan 500.000 pesos al mes y los 20 restantes
ganan 700.000 pesos al mes, a cada uno de ellos. Se pide:

a) Determinar el sueldo medio

10
b) ¿Sería igual la respuesta si los primeros 60 empleados ganaran un sueldo medio de 500.000 pesos y
los otros 20 un sueldo medio de 700.000 pesos?
c) Comentar si ese sueldo medio es o no representativo.

IV MIRO MI ENTORNO

Problema 1

Jóvenes protagonizan 25% de accidentes de tránsito.

Es común enterarse por la prensa del día lunes de algún grave accidente de tránsito ocurrido los fines de
semana, en los cuales los jóvenes son los protagonistas.
Generalmente los jóvenes creen que nada malo les va a pasar y piensan que tener un accidente o no
depende del azar. Por eso no toman conciencia de las horas sin dormir y el alcohol, entre otras puede
traerle consecuencias graves.

Nº de accidentes de tránsito los fines de semana, según horas del día

Horario Viernes sábado Domingo


01:00 a 04:00 231 467 364
04:00 a 07:00 255 565 733
07:00 a 10:00 995 642 508
10:00 a 13:00 1014 904 674
13:00 a 16:00 1214 1098 939
16:00 a 19:00 1482 1204 1068
19:00 a 22:00 1190 1107 1116
22:00 a 01:00 621 824 692

a) ¿En que hora del día sábado, ocurren más accidentes de tránsito?
b) ¿Cuál es el promedio de accidentes durante todo el fin de semana?
c) ¿Sobre el 50% de los accidentes que ocurren el día Viernes, en que horario se encuentran?

Problema 2

La obesidad en el mundo

Los últimos cálculos de la OMS indican que en 2005 había en todo el mundo:

• Aproximadamente 1600 millones de adultos (mayores de 15 años) con sobrepeso.


• Al menos 400 millones de adultos obesos.

11
Además, la OMS calcula que en 2015 habrá aproximadamente 2300 millones de adultos con sobrepeso
y más de 700 millones con obesidad.

En 2005 había en todo el mundo al menos 20 millones de menores de 5 años con sobrepeso.
Aunque antes se consideraba un problema exclusivo de los países de altos ingresos, el sobrepeso y la
obesidad están aumentando espectacularmente en los países de ingresos bajos y medios, sobre todo en
el medio urbano.

En un centro medico se está estudiando a la población infantil con sobrepeso, para lo cual se anotó en
una tabla los siguientes datos, de un total de 150 niños evaluados.

Kilos de sobrepeso Nº de niños


2–6 59
6 – 10 38
10 - 14 25
14 -18 16
18 – 22 10
22 o más 2

a) ¿Cuál es la cantidad de kilos de sobrepeso más frecuente entre estos niños?


b) ¿Cuál es el sobrepeso promedio en este grupo de niños?
c) La primera mitad del grupo de niños, entre cuantos kilos de sobrepeso se encuentran?

Problema 3:

Tabaquismo en chile

Chile, es uno de los países con más alto consumo de cigarrillos en la región de las Américas. En los
últimos 30 años se ha producido un aumento progresivo del consumo de tabaco.

Los 14 mil millones de cigarrillos que se fuman anualmente en nuestro país estarían liberando al
ambiente aproximadamente 20 toneladas de nicotina, 185 toneladas de material particulado respirable y
814 toneladas de monóxido de carbono.
La población del país, se presenta pequeñas diferencias respecto al consumo de tabaco según la región
en que viven. El estudio CONACE 20047 muestra que en la V Región se fuma más que en el resto del
país, alcanzando en ese momento al 45,19% de su población y en la IX Región fumaría el 36,
9%, de los habitantes entre 12 y 64 años, lo que los convierte en la región menos fumadora.

Se realizo una encuesta 250 fumadores, mayores de edad, de la ciudad de Arica, en un conocido mall,
preguntándoles cuantos cigarrillos se fumaban al día; las respuestas están resumidas en la siguiente
tabla:

12
Cantidad de cigarrillos Nº De fumadores
1–5 40
5 – 10 39
10 – 15 65
15 - 20 70
+ de 20 46

a) ¿Cuál es la cantidad más frecuente del consumo de cigarrillos entre los fumadores de Arica?
b) ¿En promedio, cuántos cigarros al día se fuman estas personas?
c) La mitad superior de esta muestra cuantos cigarrillos se fuman al día?

V.- VERIFICANDO MI PROGRESO

Ejercicio 1:

Se han anotado las tallas, en centímetros, de los 40 alumnos de una clase y se han obtenido los
siguientes resultados:

160, 167, 163, 148, 151, 158, 166, 166, 157, 153, 151, 151, 150, 155, 164, 162, 166, 171, 167, 165, 152,

150, 147, 152, 162, 155, 158, 158, 158, 164, 157, 155, 160, 154, 153, 156, 160, 159, 159, 158, 163, 161.

a) ¿cómo determinarías la talla promedio de esos 40 alumnos?


b) ¿Cuál es la talla que más se repite entre los alumnos?
c) ¿Entre que tallas se encuentra la mitad más baja y entre que tallas se encuentra la mitad más
alta?

Ejercicio 2:

Dos amigos decidieron comprobar cuanto duraba realmente la carga de batería de sus mp4 por lo que
han estado anotando, cuidadosamente, varias veces, la duración, en minutos, de escuchar música
continuamente y han obtenido:
40, 44, 42, 47, 41, 42, 47, 43, 48, 44, 49, 41, 46, 43, 47, 42, 46, 44, 54, 53, 47,
43, 40, 48, 54, 68, 66, 59, 51, 53, 49, 45, 52, 57, 63, 67

a) ¿cuántos minutos promedio pueden escuchar música en sus mp4, en forma continua?
b) ¿Qué cantidad de minutos se repite más, en estas observaciones?
c) ¿Cuál es la el intervalo más aceptado de duración para escuchar música continuamente?

Ejercicio 3:

En un estacionamiento cobran por cada minuto que está estacionado el vehículo $ 10. La ocupación del
estacionamiento durante la semana pasada fue la siguiente:

13
Tiempo de estacionamiento (min.) nº de vehículos

0 – 60 1240
60 -120 3575
120 -180 746
180 – 240 327
240 - 300 218
300 - 360 44

¿Cual es el tiempo medio de estacionamiento, el más frecuente y el mediano?

VI.- PARA GRABAR EN MI DISCO

MEDIDAS DE TENDENCIA CENTRAL

Las medidas de centralización son unos parámetros que representan la muestra. Son útiles porque
hacen una estimación que indica alrededor de que valores se aglutinan los datos. Es decir, son los datos
de la variable que se encuentran más cerca del resto de los datos.
Se denominan, también, estadígrafos de tendencia central.
Las principales medidas centrales son: la media aritmética ( x ), la moda (Mo) y la mediana (Me).
Veamos en que consiste cada una de ellas:

a) MEDIA ARITMÉTICA ( X )
La media aritmética también se llama “media” o “promedio aritmético” y es lo que siempre has ocupado
para calcular el promedio de notas.

La media aritmética se calcula dependiendo de cómo vengan los datos, pero en general es la suma de
todos los datos dividida por el número total de datos.

Media aritmética de datos no agrupados

La media x de n datos corresponde al resultado de la expresión:

14
Donde:

k x = Promedio o Media
∑x i k
x= i =1
∑x i = sumatoria de elementos
n i =1

x = Marca de clase o valor de la variable


i

n = total de muestra o datos

k : número de elementos con distinto valor.


Ejemplo

Gonzalo ha obtenido las siguientes notas en Ciencias:

6,0 – 5,8 – 7 – 6,8 – 5,6

Su media aritmética o promedio es:

Lo que se redondea al décimo como 6,2.

Media de datos en una tabla de frecuencia y/o agrupados en intervalos

i) En el primer caso se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos
productos, y el resultado dividirlo por la suma de los datos, esto es:

∑x i ⋅ ni Donde ni es la frecuencia o número de veces que se repite un


i =1
x= valor. También ni puede ser la ponderación de cada valor xi.
n

Ejemplo:

Se ha lanzado un dado 40 veces obteniéndose los siguientes resultados:

15
Por lo tanto su media es:

ii) En el segundo caso se define la marca de clase de un intervalo como la media aritmética entre los
extremos de él.

Si llamamos a la marca de clase de un intervalo: , entonces la media de un conjunto de datos


agrupados en intervalos es:

Ejemplo:

La tabla de distribución siguiente nos muestra la duración en días que tuvieron un total de 30 ampolletas

Rango de días días Frecuencia Frecuencia


absoluta relativa
x'i−1
– x'
1 x i n i f i

20 – 26 23 7 0,233
27 – 33 30 8 0,266
34 – 40 37 5 0,166
41 – 47 44 4 0,133
48 – 54 51 2 0,066
55 – 61 58 3 0,10
62 - 68 65 1 0,033

n=30

16
ii)

Propiedades del Promedio

1)

Solución:

==

2)

Solución:

3)

4)

5) Promedio Total
Si tenemos tres conjuntos de observaciones de los cuales el primero tiene n1 elementos y promedio X1
el segundo tiene n2 elementos y promedio X2 y el tercero tiene n3 elementos con promedio X3 entonces
la media aritmética de los tres conjuntos es:

17
Generalizando

Con n el número total de observaciones.

b) LA MODA (Mo)

Se define como aquel valor de la variable que representa la mayor frecuencia en una distribución. Es
decir, La moda es el valor de la variable que más se repite.

Ejemplo:

Sean las calificaciones que obtiene un grupo de trabajadores de una empresa:

2; 4; 5; 2; 3; 4; 6; 4; 7

La moda es 4 pues hay tres trabajadores con la calificación 4 que es una moda unimodal, pero si
tenemos 2, 1, 2, 4, 5, 4, 7 la moda es 2 y 4 que es una moda bimodal, por lo tanto la moda no es única.

Si tenemos una tabla de distribución con intervalos la moda la calculamos de la siguiente forma:

Primero debemos saber en que intervalo se encuentra, para ello se ubica la mayor frecuencia absoluta y
luego aplicamos la formula.

L.I. = limite inferior del intervalo

d1 = |n1- ni-1|
d2 = |ni-1 – ni|

c = amplitud del intervalo

Ejemplo:

Consideremos la siguiente tabla de frecuencia, que nos muestra el nº de palabras que lee un niño de
segundo básico por minuto. El estudio fue realizado en un curso de 40 alumnos.

18
x' i−1
– x'
1 x i n i N i f F i f % F i
%
i i

50 70 60 5 5 0,125 0,125 12,5 12,5


70 90 80 9 14 0,225 0,350 22,5 35
90 110 100 11 25 0,275 0,625 27,5 62,5
110 130 120 8 33 0,20 0,825 20 82,5
130 150 140 7 40 0,175 1,00 17,5 100

Hallar la moda

Solución:

Para encontrar la moda, primero debemos saber en que intervalo esta para ello la mayor frecuencia
absoluta es 11 por lo tanto la moda esta en el intervalo 90 – 110

Así

c) LA MEDIANA (Me)

Se define como el valor central de un conjunto de observaciones que ha sido ordenado en forma
creciente o decreciente, es decir, deja el mismo número de observaciones bajo él, que sobre él (es el
50% de los casos).

Ejemplo:

Si tenemos el conjunto de valores 3, 9, 5, 18, 15, 14, 19.


Hallar la mediana.

Solución:

La mediana se obtiene ordenando.


3. 5, 9, 14, 15, 18, 19 y es el valor central, es decir, 14

En cambio si tuviéramos
3, 5, 9, 14, 15, 18, 19, 21

La mediana es

La mediana para datos agrupados (intervalos)

Antes de poder calcular la mediana debemos saber en que intervalo se encuentra. Para ello se toma la
mitad del tamaño de la muestra y se ve en la columna de las frecuencias absolutas acumuladas (Ni),
cual es el menor valor que la contiene y este valor nos indica el intervalo donde esta la mediana.

19
Luego se aplica la siguiente formula para calcular la mediana:

Me =

Donde:
Nja = es la frecuencia absoluta acumulada anterior al valor que contenía a n/2.
nj = n i
frecuencia absoluta del intervalo donde esta la mediana.

Ejemplo: Calcule la mediana observando la siguiente tabla de distribución. La cual indica el pago de
impuestos (en UF) de 40 contribuyentes. De un exclusivo condominio del sector oriente.

UF Contribuyentes Frec. Ac.


x' i−1
– x'1 x i n i N i
50 70 60 5 5
70 90 80 9 14
90 110 100 11 25
110 130 120 8 33
130 150 140 7 40

Solución:

Y en la columna de los Ni el menor valor que lo contiene es 25, por lo tanto el intervalo
donde esta Me, es 90 – 110.

Entonces  Me =

Luego Me =

Me = 100,9

20
VII.- ¿QUÉ APRENDÍ?

Ejercicio 1:

Algunas décadas atrás la gente moría por la tubercololis, enfermedad hoy ya casi erradicada, La tabla
siguiente muestra la composición por edad, sexo y trabajo de un grupo de personas con tuberculosis
pulmonar en la provincia de Vizcaya en el año 1979:

Edad Trabajadores No trabajadores Totales

Varón Mujer Total Varón Mujer Total Varón Mujer Total

14-19 2 1 3 25 40 65 27 41 68

19-24 10 4 14 20 36 56 30 40 70

24-29 32 10 42 15 50 65 47 60 107

29-34 47 12 59 13 34 47 60 46 106

34-39 38 8 46 10 25 35 48 33 81

39-44 22 4 26 7 18 25 29 22 51

a) ¿Cuál es la edad en la que se observa con mayor frecuencia que no trabajan los varones? ¿Y las
mujeres? Determinar asímismo la edad más frecuente (sin distinción de sexos ni ocupación).
b) ¿Por debajo de qué edad está el 50% de los varones?
c) ¿Por encima de qué edad se encuentra el 50% de las mujeres?

Ejercicio 2:

Una empresa grande de equipos deportivos está probando el efecto de dos planes publicitarios sobre las
ventas de los últimos 4 meses. Dadas las ventas que se ven aquí, ¿cuál programa de publicidad parece
producir el crecimiento promedio más alto en ventas mensuales?

Mes Plan 1 Plan 2


Enero 1657,0 4735,0
Febrero 1998,0 5012,0
Marzo 2267,0 5479,0
Abril 3432,0 5589,0

21
Ejercicio3:

Las ganancias diarias de los establecimientos de un centro comercial se presentan en una tabla de
frecuencias con 6 intervalos de clase y se sabe que: la mínima ganancia es de $6, el rango es 36, el
promedio de ganancias diarias es $25.14, el 50% de los establecimientos ganan más de 25.58 dólares
diarios, F2=0.15, N2=120, f3=0.25, F5=0.93, n4=304, n2=2n1. ¿Se puede reconstruir la distribución de
todas las frecuencias y hallar la ganancia más frecuente y la ganancia promedio?

22
VIII.- ¿CUÁNTO SÉ?

Evaluación 1

CALCULAR MEDIA MODA MEDIANA

PROBLEMA

Al comenzar el invierno en Chile, durante el primer


día de lluvia, los pluviómetros de 20 ciudades
recogieron la siguiente información sobre las
2
cantidades en l/m de agua caída:

8 2 10 17 15
10 17 8 2 10
15 15 2 1 17
2 8 8 15 15

b) En sus inicios como empresario Sebastián


Piñera, comenzó comprando 20 acciones a $
15 dólares cada una, 50 acciones a $20
dólares cada una, 100 acciones a $30 dólares
cada una y 75 acciones a $35 dólares cada
una, de una determinada empresa ¿Cuál es el
precio promedio por acción?

c) De una central telefónica salieron 70 llamadas


de menos de 3 minutos promediando 2.3
minutos, 40 llamadas de menos de 10
minutos pero no menos de 3 minutos,
promediando 6.4 minutos, y 10 llamadas de al
menos 10 minutos promediando 15 minutos.
Calcular la duración promedio de todas las
llamadas.

Coloca la puntuación que corresponda, según las respuestas dadas (sí, más o menos, no)

SI MÁS O MENOS NO
3 2 1

Puntuación
Ordene los datos en una tabla de
Frecuencia (de cada uno de los problemas)
Use los datos de la tabla de
Distribución para resolver el problema.
Esta correcto el resultado de cada una de las medidas
De tendencia central solicitada
Total

23
¿Qué logré?

Autoevaluación:

Según todo lo visto en este capitulo y la cantidad de ejercicios que pudiste resolver contesta lo siguiente:

Marca según tu apreciación No lo entendí Lo entendí Puedo Explicarlo

Extraer y analizar datos en tablas


de frecuencias

Puedo calcular e interpretar la


Media (de pocos datos)

Puedo calcular e interpretar la


Media (de muchos datos –
intervalos - )

Puedo calcular e interpretar la


Moda (de pocos datos)

Puedo calcular e interpretar la


Moda (de muchos datos –
intervalos)

Puedo calcular e interpretar la


Mediana (de pocos datos)

Puedo calcular e interpretar la


Mediana (de muchos datos –
intervalos -)

24
IX.- SINTESIS

VERIFICANDO DISCO

Completa el siguiente esquema con las formulas y los puntos más relevantes de cada una de las
medidas de tendencia central:

Estadística Descriptiva

Medidas de tendencia central

MEDIA MODA MEDIANA

* Para calcular promedio de


pocos datos

∑x i
x= i =1

* Para calcular moda de una


muestra con muchos datos
(intervalos)

25
X.- PRÓXIMO DESAFIO…

Ejercicio 1:

Una empresa tenía a finales del pasado año mil seiscientos cincuenta accionistas distribuidos de la
siguiente forma:

Nº de acciones Nº de accionistas
0-20 1030
20-60 380
60-100 150
100-500 80
500-1000 10

¿Cuál es el promedio de acciones que tiene cada accionista? ¿Qué dispersión presenta con respecto a
ese promedio?

Ejercicio 2:

Sean las siguientes muestras de las estaturas de 5 personas de diferentes etnias:


Etnia A) 170, 160, 155, 175, 145, 185
Etnia B) 160, 170, 165, 170, 160, 165
a) ¿Cuál es el promedio de estatura de cada etnia? y ¿Cuál es la varianza de ambas muestras?
b) ¿Qué muestra es más dispersa? Razona tu respuesta.

Ejercicio 3:

En un diagnóstico de educación física se pidió a los alumnos de los cuartos medios que hicieran
abdominales durante 3 minutos. Se obtuvieron los siguientes resultados:

4º A: 45 38 43 29 34 60 54 27 32 33 23 34 34 28 56 62 56 57 45 47 48 54
33 45 44 41 34 36 34 54
4º B: 43 45 44 38 34 46 43 42 43 45 57 44 38 38 37 43 61 38 37 45 28 42
41 49 40 37 34 44 41 43

¿Cuál de los dos cursos tiene el rendimiento más parejo? ¿Qué distribución estadístico permite comparar
la distribución de este tipo de datos?

26
ANEXOS

GLOSARIO

Estadística: es la rama de la matemática que nos permite recoger, organizar y analizar datos.
Existen dos conceptos importantes dentro de la estadística que nos permiten analizar y estudiar
dichos datos, estos son: población y muestra.

Población: es el conjunto de datos que caracteriza el fenómeno que se desea estudiar.

Muestra: es un subconjunto de la población a estudiar, el cual es necesario que sea


representativo de toda la población.

Gráfica: es una representación de la relación entre variables, muchos tipos de gráficos aparecen
en estadística, según la naturaleza de los datos involucrados y el propósito de la gráfica, es la de
representar los valores tabulados obtenidos de los muestreos o los datos del total de la
población.

Distribución de frecuencia: Al resumir grandes colecciones de datos, es útil distribuirlos en


clases o categorías, y determinar el número de individuos que pertenecen a cada clase llamado
frecuencia de clase. Una disposición tabular de los datos por clases junto con las frecuencias
correspondientes de clase se llaman distribuidores de frecuencia o tablas de frecuencia.

Medidas de dispersión: Describen la cantidad de dispersión o variabilidad que se encuentra


entre los datos. Datos bastante agrupados poseen valores relativamente pequeños, y datos mas
dispersos tienen valores más grandes. El agrupamiento mas extenso ocurre cuando los datos
carecen de dispersión.

27
SOLUCIONARIO

III.1.- Inténtalo tú

Ejercicio 1:

x i n i N i f i
F i f i
% F i
%

0 3 3 0,12 0,12 12 12
1 6 9 0,24 0,36 24 36
2 8 17 0,32 0,68 32 68
3 5 22 0,20 0,88 20 88
4 2 24 0,08 0,96 8 96
5 1 25 0,04 1,00 4 100

III.2.- Inténtalo con tus compañeros

Ejercicio 1:

x = (600x300.000 + 500x400.000 + 100x600.000 + 5x3.000.000)/(600 + 500 + 100 + 5) =


455.000.000/1205 = 377.593,361

Me= 400.000

Mo = 300.000

Dado que se trata de una distribución tan asimétrica, la mediana es la medida más recomendable.

V.- VERIFICANDO MI PROGRESO

Ejercicio 1:

variable Marca de Frecuencia Frecuencia


clase ab. relativa f i
* x i

[145,150) 147,5 2 2 295,0


[150,155) 152,5 9 11 1372,50
[155,160) 157,5 12 23 1890,00
[160,165 162,5 10 33 1625,00
165,170) 167,5 6 39 1005,00
170,175] 172,5 1 40 172,50
6360, 0 total

28
6360
a) x = = 159
40
b) Mo = 158 La talla que más se repite está entre 155 y 160

c) Me = 158.75 Los de menor talla están entre 145 y 158,75 y los de mayor talla están entre 158,75 y
los 175 cm.

X.- PROXIMO DESAFIO…

Ejercicio 2

Muestra 1 Muestra 2
x x

170 media 165 160 media 165


160 varianza 210 170 varianza 20
155 165
175 170
145 160
185 165

x f m
[ 4 0 ,4 5 ) 13 4 2 ,5 media 4 9 ,4 1
[ 4 5 ,5 0 ) 11 4 7 ,5 moda 4 2 .5
[ 5 0 ,5 5 ) 6 52 ,5 mediana 4 2 .5
[ 5 5 ,6 0 ) 2 57,5 rango 28
[ 6 0 ,6 5 ) 1 6 2 ,5 varianza 6 3 ,6 4
[ 6 5 ,7 0 ] 3 6 7 ,5
36

29

You might also like