You are on page 1of 6

Departamento de Matemticas UNIDAD 7: Estadstica

UNIDAD 7: ESTADSTICA
QU ES LA ESTADSTICA

Desde hace mucho tiempo se han elaborado cmputos, tablas, censos,


empadronamientos, etc. Parece ser que los datos ms antiguos que se conocen son los censos
chinos ordenados por el emperador Tao hacia el ao 2200 a.C. Pero el tratamiento matemtico
de los datos acumulados es ms reciente: se inici en el siglo XIX y se perfeccion en el XX.
El nombre de Estadstica alude al enorme inters de esta rama de las Matemticas
para los asuntos del Estado. Podemos definirla como la ciencia que se ocupa de la recogida de
datos, su organizacin y anlisis, as como de las predicciones que, a partir de estos datos,
pueden hacerse.

Procesa la masa de datos que


provienen de observaciones y
Estadstica descriptiva experimentos, calculando unos
parmetros que resumen la
informacin.

ESTADSTICA

Obtiene conclusiones y
predicciones. Utiliza el clculo de
Inferencia estadstica probabilidades para determinar
el grado de confianza de dichas
conclusiones.

POBLACIN Y MUESTRA. VARIABLE ESTADSTICA

Poblacin es el conjunto de todos los elementos que existen para el estudio de un


determinado fenmeno. A cada elemento de la poblacin lo llamaremos individuo.

Muestra es un subconjunto o parte de la poblacin. Al nmero de elementos de la


muestra se le llama tamao de la muestra.

Cuando el estudio se hace sobre una muestra para inferir datos de la poblacin, es un
estudio estadstico; mientras que si estudiamos toda la poblacin, estamos realizando un
censo.

Ej.) Se desea realizar un estudio sobre la opinin que tienen los vecinos sobre la
gestin de su ayuntamiento. La poblacin es el conjunto de vecinos empadronados. La muestra
es el grupo de vecinos al que se pregunta. Para que la muestra sea representativa, debe
contener vecinos de distintas zonas, distinto nivel social y econmico, distinta edad

Variable estadstica es la caracterstica objeto de estudio.

Pgina 1 de 6
Departamento de Matemticas UNIDAD 7: Estadstica

CUALITATIVA Ej.) marcas de coches


(no toma valores numricos)

VARIABLE ESTADSTICA
DISCRETA
(toma valores determinados)
Ej.) nmero de hermanos
CUANTITATIVA
(toma valores
numricos)
CONTINUA
(toma cualquier valor de un
intervalo dado)
Ej.) altura de los alumnos

TABLAS DE FRECUENCIAS

Los datos estadsticos se organizan en tablas en las que aparecen los valores de la
variable (xi) y las frecuencias correspondientes

Frecuencia absoluta (fi) de un dato es el nmero de veces que aparece en la muestra

Frecuencia relativa (hi) de un dato es el cociente entre la frecuencia absoluta y el nmero


de datos (N)

Frecuencia porcentual o porcentaje (pi) de un dato es la frecuencia relativa multiplicada


por 100

En las tablas tambin pueden aparecer las frecuencias anteriores de forma acumulada
(Fi , Hi y Pi , respectivamente)

Ej.) En una encuesta sobre el nmero de hermanos de los alumnos de la clase, hemos
obtenido los siguientes datos: 2, 3, 3, 2, 2, 3, 3, 1, 1, 2, 2, 3, 1, 1, 4, 2, 2, 3, 4, 2, 1, 2, 4, 2, 5.

N de Frecuencia absoluta Frecuencia relativa Porcentaje


hermanos:
Fi Hi Pi
xi fi hi = fi /N pi = hi * 100
(acumulada) (acumulada) (acumulado)

1 5 5 5/25 = 0,2 0,2 20 20


2 10 15 10/25 = 0,4 0,6 40 60
3 6 21 6/25 = 0,24 0,84 24 84
4 3 24 3/25 = 0,12 0,96 12 96
5 1 25 1/25 = 0,04 1 4 100
N = fi = 25 hi = 1 pi = 100

Pgina 2 de 6
Departamento de Matemticas UNIDAD 7: Estadstica

Cuando existen muchos valores diferentes de la variable estadstica o sta es continua,


agrupamos los datos en intervalos o clases. El punto medio del intervalo se llama marca de
clase y se toma habitualmente como valor de la variable estadstica (se desprecia el error
cometido)

Ej.) Anlisis de la albmina circulante, medida en gramos, en 30 hombres entre 25 y


30 aos:

110 132 142 124 124 140 123 116 122 121
115 144 139 123 133 109 126 138 130 120
127 139 105 145 114 125 131 125 137 112

Marca Frecuencia absoluta Frecuencia relativa Porcentaje


de
Intervalo
clase: fi Fi hi = fi /N Hi pi = hi * 100 Pi
xi
) ) ) )
[105,113) 109 4 4 4/30 = 0,13 0,13 13,3 13,3
) ) ) )
[113,121) 117 4 8 4/30 = 0,1 3 0,26 13,3 26,6
) )
[121,129) 125 10 18 10/30 = 0,3 0,6 33,3 60
) ) ) )
[129,137) 133 4 22 4/30 = 0,1 3 0,73 13,3 73,3
) )
[137,145] 141 8 30 8/30 = 0,26 1 26,6 100
N = fi = 30 hi = 1 pi = 100

GRFICOS ESTADSTICOS MS HABITUALES

Diagrama de barras

Se asocia a una tabla de frecuencia con datos no agrupados en intervalos. En cada uno de
los valores se levanta una barra estrecha de longitud igual o proporcional a la frecuencia
absoluta.

Ej.) Notas de 60 alumnos. xi 1 2 3 4 5 6 7 8 9 10


fi 4 6 5 6 10 9 6 7 3 4

fi 10

8
Se llama polgono de frecuencias
6
a la lnea quebrada que une los
4 puntos medios de los lados
superiores de las barras.
2

0 xi
1 2 3 4 5 6 7 8 9 10

Pgina 3 de 6
Departamento de Matemticas UNIDAD 7: Estadstica

Histograma

Se asocia a una tabla de frecuencias con datos agrupados en intervalos. En cada uno de los
intervalos se levanta una franja tan ancha como el intervalo y de altura igual o proporcional a
la frecuencia absoluta.

Ej.) Peso de 30 alumnos.

Intervalo [40,45) [45,50) [50,55) [55,60) [60,65) [65,70) [70,75)


fi 1 3 10 9 4 2 1

fi 10 (Aqu tambin se puede


considerar el polgono de
8 frecuencias)

0
xi
40 45 50 55 60 65 70 75

Diagrama de sectores

Es una representacin grfica que se construye en un crculo, dividindolo en sectores de


amplitud directamente proporcional a la frecuencia absoluta. Este diagrama se puede utilizar
con cualquier tipo de datos, pero se utiliza especialmente en datos cualitativos.

Ej.) Representa en un diagrama de sectores el color de un determinado modelo de


coches:

Colores N de Amplitud
(xi) coches (fi) (en o)
20
Rojo 20 360 o = 72 o 36o 72o
100
30
Blanco 30 360 o = 108 o
100 144o
108o
40
Gris 40 360 o = 144 o
100
10
Azul 10 360 o = 36 o
100
Total: 100

Pgina 4 de 6
Departamento de Matemticas UNIDAD 7: Estadstica

PARMETROS ESTADSTICOS

PARMETROS ESTADSTICOS

MEDIDAS DE MEDIDAS DE
CENTRALIZACIN DISPERSIN
Son valores que Indican el grado de
determinan dnde est el dispersin de los valores
centro de la distribucin respecto del centro

MEDIA RECORRIDO O RANGO


MODA VARIANZA
MEDIANA DESVIACIN TPICA

Medidas de centralizacin

La media aritmtica ( x ) es la suma de todos los valores de la variable


estadstica dividida entre el nmero total de ellos:
n

x i fi
x= i =1

N
La moda (Mo) es el valor que presenta mayor frecuencia absoluta. La moda no
tiene por qu ser nica (hay distribuciones bimodales, trimodales)

La mediana (Me) es el valor que ocupa la posicin central al ordenar los datos.
Si el nmero de datos es par, la mediana es la semisuma de los datos centrales
y si es impar, la mediana es el valor central.

OBSERVACIN: Si los datos estn agrupados en intervalos, trabajaremos por


aproximacin tomando como xi la marca de clase.

Ej.) Una encuesta realizada a 10 pilotos, en la que se les preguntaba sobre el nmero
de vuelos semanales, muestra los siguientes datos: 0, 1, 1, 3, 1, 2, 2, 1, 0, 2

Pgina 5 de 6
Departamento de Matemticas UNIDAD 7: Estadstica

N de vuelos (xi) fi Fi xi fi
0 2 2 0
1 4 6 4
2 3 9 6
3 1 10 3
N= f = 10
i x i f i = 13

13
Media: x = = 1,3 Moda: M0 = 1
10
Mediana: Ordenamos los datos: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3
10 xpos .5 + xpos 6 1 + 1
= 5 Me = = =1
2 2 2
Para obtener los datos que estn en las posiciones centrales a partir de la tabla (posiciones
5 y 6), utilizamos la columna de frecuencia absoluta acumulada (Fi)

En este ejemplo, la informacin obtenida de los parmetros de centralizacin es:


Por trmino medio, el nmero de vuelos es 1,3. Es decir, la media es que los pilotos
vuelen entre 1 y 2 veces
Lo ms frecuente es hacer 1 vuelo
Hay tantos pilotos que vuelan 1 o ms veces como pilotos que lo hacen 1 vez o menos.

Medidas de dispersin
Existe un chascarrillo que dice: si la mitad de una poblacin come dos veces al da y la otra
mitad no come nada, la media es una comida diaria por persona. Esto nos ayuda a entender que
las medidas de centralizacin pueden no ser representativas de la distribucin que se est
estudiando. Por ello, necesitamos parmetros que nos indiquen cmo estn agrupados los datos
en torno a la media: estamos hablando de los parmetros de dispersin.

Recorrido o rango (R) es la diferencia entre el mayor y el menor valor de los datos.
Varianza (2) es la media de los cuadrados de las desviaciones respecto a la media:
(x i x )2 f i x i2 f i 2
=
2
= x
N N
Desviacin tpica () es la raz cuadrada de la varianza: = 2

Ej.) Las notas de 5 alumnos son: 4, 5, 5, 5 y 6. Calcula las medidas de dispersin.


25
x= =5 R =64= 2
xi (NOTAS) fi xi fi x fi
2
i 5
4 1 4 16
2
=
x 2
i fi
x2 =
127
5 2 = 0,4
5 3 15 75 N 5
6 1 6 36
= = 0,4 = 0,632
2

Total 5 25 127
Observamos que los parmetros obtenidos son
pequeos, es decir, las notas estn situadas alrededor de la media (5), hay poca dispersin.

Pgina 6 de 6

You might also like