Professional Documents
Culture Documents
INTRODUCCION
Hace más de 100 años H. G. Wells, escritor e historiador inglés, dijo que “el conocimiento
estadístico será algún día tan necesario para ser un buen y eficiente ciudadano, como
la aptitud de poder leer y escribir”.
HISTORIA DE LA ESTADÍSTICA
El término Estadística que se utilizó hasta el siglo XVII como una abreviatura de la ciencia
descriptiva de los Estados, se identificó cada vez más, en el siglo XIX, con las cifras
cuantitativas. Hacia 1830, en Francia e Inglaterra, el término ya fue usado de forma general
como sinónimo de la ciencia numérica de la sociedad. Este cambio de significado se debió
a que, desde 1800, los gobiernos de Europa Occidental y de Estados Unidos comenzaron a
recopilar y publicar sistemáticamente una gran cantidad de registros de censos y de otros
tipos de tablas.
Aunque a lo largo del siglo XIX la teoría de la probabilidad había sido desarrollada por
matemáticos tales como Jacob Bernoulli, Karl Friedich Gauss y Pierre Simon Laplace, su
aplicación al estudio de hechos estadísticos fue casi inexistente, ya que la mayor parte de
los estadísticos sociales de la época se contentaban con dejar que los datos hablaran por sí
mismos. En particular, en esa época los estadísticos no estaban interesados en sacar
inferencias a partir de individuos, más bien se centraban en la sociedad en su totalidad. Por
consiguiente, no estaban preocupados por el muestreo sino que intentaban obtener censos
de la población al completo. Como resultado, la inferencia probabilística sobre la población
a partir de muestras era prácticamente desconocida en las estadísticas sociales del siglo
XIX
1
Apuntes de clase Estadística General
No fue hasta finales de este siglo cuando los estadísticos empezaron a preocuparse por
inferir conclusiones a partir de los datos numéricos. El movimiento comenzó con los trabajos
de Francis Galton sobre el análisis de la influencia de la herencia a través de la utilización
de técnicas que actualmente se conocen como análisis de regresión y correlación, que
alcanzaron su mayor auge con los trabajos de Karl Pearson. Éste, que desarrolló los
contrastes de bondad de ajuste, fue el primer director del laboratorio Galton, fundado por
Galton en 1904. Allí, Pearson lideró un programa de investigación con el objetivo de
desarrollar nuevos métodos en los que la Estadística se utiliza con fines inferenciales. Su
laboratorio potenció que investigadores provenientes de distintas áreas de la ciencia y la
industria aprendieran los métodos estadísticos que podían tener aplicación en sus campos.
Uno de los primeros estudiantes que acudió a su laboratorio fue W. S. Gosset químico de
formación, que demostró su devoción por Pearson y publicó sus propios trabajos bajo el
seudónimo de Student. Existe una famosa leyenda que mantiene que Gosset temía publicar
sus trabajos, bajo su propio nombre por miedo a que, en la fábrica de cerveza Guinnes,
donde laboraba, sus jefes descubrieran que uno de sus químicos realizaba investigaciones
estadísticas. Gosset es famoso por el desarrollo de los contrastes de t.
Dos de las áreas más importantes de aplicación de la Estadística a principios del siglo XX
fueron la biología y la agricultura; todo ello gracias al interés de Pearson y de otros
investigadores de su laboratorio, y también a los logros del científico inglés Ronald A. Fisher.
La teoría de la inferencia desarrollada por estos investigadores pioneros – y otros entre los
que se encuentran Egon Pearson, hijo de Karl Pearson, y el estadístico matemático polaco
Jersy Neyman- fue lo suficiente general como para tratar una amplia gama de problemas
cuantitativos prácticos. Como resultado, tras los primeros años del siglo XX, aumentó muy
rápidamente el número de personas, procedente de la ciencia, los negocios y la
administración, que empezaron a considerar la Estadística como una herramienta capaz de
suministrar soluciones cuantitativas a una gran variedad de problemas científicos y prácticos.
La Estadística puede considerarse (i) como el estudio de las poblaciones, (ii) como el estudio
de las variaciones y (iii) como el estudio de los métodos de reducción de datos (Fisher, 1925).
2
Apuntes de clase Estadística General
Nos topamos con ella en el lenguaje cotidiano. En realidad posee dos significados: En su
acepción más común, la estadística se refiere a información numérica. Algunos ejemplos
son: el sueldo inicial de los graduados de Universidad, el número de muertos provocados
por el alcoholismo el año pasado, el número de goles en un partido de futbol etc. En estos
ejemplos las estadísticas se refieren a un valor o porcentaje.
ESTADISTICA.-
CLASIFICACION DE LA ESTADISTICA
3
Apuntes de clase Estadística General
ESTADÍSTICA DESCRIPTIVA
Por ejemplo, cuando se hace una encuesta para estudiar la opinión del público sobre la
calidad y el precio posible de un nuevo producto, con la aplicación de la estadística
descriptiva sería posible, entre otras cosas, clasificar las respuestas de modo tal que sea
posible tener una idea general de la opinión del público; con las respuestas sobre el precio
evaluar su promedio y la variabilidad de las respuestas; construir cuadros, tablas y gráficos
que permitan evaluar visualmente el comportamiento de la información..
RECOPILAR
IDENTIFICAR, CONOCER
DESCUBRIR,RESUMIR
ESTADISTICA INFERENCIAL
INFERIR
ANALIZAR
POBLACION MUESTRA
DATOS
4
Apuntes de clase Estadística General
La estadística como ciencia tiene como objetivo desarrollar procedimientos que permitan
obtener conclusiones acerca de los parámetros de una población a partir de los datos
muéstrales captados.
a.- Definición del problema.- En esta etapa se determina con claridad el estudio por realizar
los objetivos de la investigación. Además, se debe establecer cuál es la población en
estudio, se debe identificar las variables de interés, se deben formular hipótesis y se debe
establecer el plan de tabulación de datos. Esto último constituye un conjunto de modelos
de cuadros que se pretenden formar con la información captada.
b.- Formulación del plan de recopilación de datos.- En esta etapa se precisa si se trabaja
con la población o si se trabaja con una muestra, es decir, si se realizará el censo o
muestreo, para lo cual será necesario formular un plan de recopilación de datos que
permitan alcanzar los objetivos de la investigación. Si se realiza un censo, el plan de
recopilación de datos se denominará plan censal. Si se lleva a cabo un muestreo, el plan
de recopilación de datos se llamará plan de muestreo.
c.- Recopilación de datos.- En esta etapa se recogen los datos de acuerdo con los planes
establecidos en la etapa anterior, teniendo cuidado en controlar la calidad de la
información que se recopila. El éxito de una investigación de pende de gran parte de la
calidad de los datos captados.
CONCEPTOS BASICOS
POBLACION
Una población es el conjunto de todas las unidades elementales que poseen características
o factores que son de interés para un estudio.
Por ejemplo, si se desea estudiar la realidad socioeconómica de las familias de un lugar, las
características de interés pueden ser el ingreso mensual, la cantidad de hijos la tenencia de
agua y desagüe, etc. Es decir se tiene una realidad que es desconocida y sobre la cual se
desea conocer cómo se comportan los elementos que la conforman
5
Apuntes de clase Estadística General
Según sea el número de elementos, la población puede considerarse como finita o infinita.
Es una población finita cuando el número de elementos que la compone es limitado; es
infinita cuando consta de ilimitado número de elementos
Por ejemplo
MUESTRA
Ejemplo
CLASES DE MUESTRAS
Dependiendo de la forma como se eligen las unidades, las muestras pueden ser aleatorias
o no aleatorias
MUESTRAS ALEATORIAS
Son aquellas cuyos elementos son elegidos usando algún criterio probabilístico. En este
caso, todos los elementos tienen alguna posibilidad de salir elegidos. En algunos casos,
todos los elementos tienen la misma posibilidad de ser elegidos en otros casos no.
MUESTRAS NO ALEATORIAS
Son aquellas cuyos elementos son elegidos mediante criterios no probabilísticos. En este
caso, existen elementos de la población que no tienen posibilidad alguna de ser elegidos.
La ventaja de las muestras aleatorias respecto de las muestras no aleatorias, es que brindan
una mayor confianza en que los datos recopilados no estén afectados por sesgos o factores
extraños a la investigación.
Por otro lado, para que un análisis estadístico basado en muestras sea objetivo y eficiente,
es necesario que la muestra sea representativa de la población de donde se eligieron sus
elementos; es decir, es necesario que todas las características importantes existente en la
población se vean reflejadas de alguna manera en la muestra que será utilizada para realizar
el análisis
UNIDAD ELEMENTAL
6
Apuntes de clase Estadística General
Es todo elemento que está asociado a una característica o factor que se desea estudiar en
la población o muestra. Por ejemplo:
OBSERVACION
VARIABLE
Se refieren a las características o propiedades que pueden tomar diferentes valores. Las
variables son características observables, susceptibles de adoptar distintos valores o ser
expresados en varias categorías.
Puede ser una característica medible (talla, edad, ingresos, etc) o una cualidad no medible
(sexo, grado de instrucción, estado civil, etc.), las variables surgen de los objetivos de la
investigación.
Ejemplo:
CLASIFICACION DE VARIABLE
Ejemplo:
7
Apuntes de clase Estadística General
Es cuando la variable que se estudia aparece en forma numérica, expresan una cantidad.
Puede ser discreta y continúa.
- Variable cuantitativa discreta, es aquella que adopta solo ciertos valores y existe
vacío entre ellos, ejemplo:
UNIDIMENSIONALES
Ejemplo.- Clasificar a los trabajadores de una empresa por lugar de procedencia, edad,
estatura, etc.
BIDIMENSIONALES
PLURIDIMENSIONALES
8
Apuntes de clase Estadística General
Son aquellas que no dependen de otra u otras variables dentro de un contexto determinado.
Las variables independientes son las que traducen o explican las causas o razones de las
variaciones de la variable dependiente
Son aquellas que dependen de otra u otras variables dentro de contexto determinado
Son aquellas que se explican por otra variable, son los efectos o resultados respecto a los
cuales hay que buscar un motivo, causa o razón de ser.
Es la variable que traduce la consecuencia del efecto de una o varias razones o causas, de
otras variables
Son aquellas que van a especificar las condiciones o requisitos para que las variables X e
Y tomen su correspondientes valores
Ejemplo:
El bajo nivel de instrucción, es uno de los factores que posibilita el poco interés de los
padres, en el control de crecimiento y desarrollo de los niños de familias de estrato socio
económico bajo
Tipos de variables
9
Apuntes de clase Estadística General
Cualitativas Cuantitativas
Discreta Continua
-Marca de PC
- Estado civil
-Color del cabello -Hijos por familia - Peso de un alumno
- Alumnos por - Estatura de un
aula alumno
Los datos se clasifican por niveles dentro de una escala de medición. La escala de medición
de los datos rige los cálculos que se llevan a cabo con el fin de resumir y presentar los datos.
También determina las pruebas estadísticas que se deben realizar.
Por ejemplo, si se compra una caja de lentejas de dulce, encontramos que hay seis colores.
Suponga que se le asigna 1 al café, 2 al amarillo, 3 al azul, 4 al naranja, 5 al verde y 6 al
rojo. Sume la cantidad de lentejas que hay en la caja, la divide entre el número de lenteja e
informa que el color promedio es 3.56. ¿Significa que el color promedio es azul o
anaranjado? Desde luego que no.
Otro ejemplo, en la pista atlética hay ocho competidores para una carrera de 400 metros.
Para indicar el orden en que llegan a la meta se dice que la media es de 4.5 ¿Qué revela
este promedio? Nada. En ambos casos, no se empleó adecuadamente en nivel de medición.
La escala de medición más baja o primaria corresponde al nivel ordinal. La más alta o el
nivel que proporciona la mayor información relacionada con la observación es la medición
de razón.
VARIABLES NOMINALES
Es el nivel más simple de medición, las variables en escala nominal son de naturaleza
cualitativa, solamente permite categorizarla variable sin establecer orden.
Ejemplo:
VARIABLES ORDINALES
10
Apuntes de clase Estadística General
Son aquellas variables que implican orden entre sus categorías pero no grados de distancia
iguales entre ellas, en esta escala las variables son de naturaleza cualitativa.
Ejemplo:
Nivel socio económica, grado de instrucción, grado de simpatía, orden de mérito, etc.
Es el nivel más alto de medición, las variables en escala de medición de razón son de
naturaleza cuantitativa y comprenden todos los casos anteriores. Clasificación, orden,
distancia y origen único natural (la unidad de medida necesariamente tiene que partir del
valor cero) Ejemplo:
- Edad: Un obrero puede tener 25 años de edad, pero para llegar a esa edad,
necesariamente ha tenido que partir de cero años.
- Estatura
- Tiempo de servicio, etc.
Razón 0 absoluto
11
Apuntes de clase Estadística General
PARAMETRO:
ESTADISTICO O ESTIMADOR
Los valores que se obtienen al aplicar los estimadores o estadísticos a una muestra particular
son llamados estimados de los parámetros. Es decir, si para una muestra se obtiene:
Estos valores son los estimados, de los parámetros definidos como media poblacional (µ),
variancia poblacional (𝜎 2 ), y moda poblacional (Mo) respectivamente.
DESCRIPCIÓN DE DATOS
12
Apuntes de clase Estadística General
Las partes de un cuadro estadístico son: 1 Número del cuadro; 2 Título; 3 Cuadro
propiamente dicho; 4 Las notas explicativas o calce; 5 Fuente
a.- SER COMPLETO: Un título completo debe indicar claramente cuál es el contenido
del cuadro estadístico. Debe responder a las preguntas: Qué, Cómo, Dónde y
Cuándo
QUE: A qué se refiere la tabla que se estudia. Cuál es el universo que se investiga.
Ejemplo: Alumnos matriculados
b.- SER CONCISO.- El título debe ser breve, lo más conciso posible, aunque no debe
sacrificarse la claridad a la concisión.
3.- CUADRO PROPIAMENTE DICHO.- Es la parte del cuadro que contiene la información y
consta de un conjunto de casillas o celdas, dispuestas en columnas y filas. Sus
elementos esenciales son: encabezamiento de las columnas, columna principal o matriz
y cuerpo.
13
Apuntes de clase Estadística General
4.- NOTAS EXPLICATIVAS O CALCE O NOTA DE PIE O LLAMADAS: Se usa para aclarar
algunos términos o siglas también para indicar que elementos están o no incluidos en
algunos de los conceptos del cuadro.
5.- FUENTE.- Sirve para nombrar la publicación, entidad, estudio o fuente de donde se
obtuvieron los datos utilizados para construir el cuadro.
TABLA DE FRECUENCIAS
Frecuencia
Frecuencia Frecuencia
relativa
Absoluta Relativa
Variable porcentual
𝒇𝒊 𝒉𝒊
𝒉𝒊 𝟏𝟎𝟎%
Característica A 𝑓𝐴 ℎ𝐴 100ℎ𝐴 %
Característica B 𝑓𝐵 ℎ𝐵 100ℎ𝐵 %
Característica Z 𝑓𝑍 ℎ𝑍 100ℎ𝑍 %
Totales N 1 100%
Tabla de frecuencia de los vehículos vendidos por VEHICULOS SAC, el mes pasado.
Tipo de Número de
automóvil automóviles
14
Apuntes de clase Estadística General
Doméstico 50
De importación 30
Tabla de frecuencia relativa de vehículos vendidos por VEHICULOS SAC el mes pasado
Una característica distintiva de la gráfica de barras es que existe una distancia o espacio
entre las barras. Es decir que, como la variable de interés es de naturaleza cualitativa, las
barras no son adyacentes. Por consiguiente, una gráfica de barras es una representación
gráfica de una tabla de frecuencias mediante una serie de rectángulos de anchura uniforme,
cuya altura corresponde a la frecuencia de clase
Gráfica No 1 Vehículos vendidos por tipo el mes pasado por VEHICULO SAC.
70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
Doméstico De importación
GRAFICA DE PASTEL
15
Apuntes de clase Estadística General
Gráfica que muestra la parte o porcentaje que representa cada clase del total de
números de frecuencia
37.50% Doméstico
62.50%
De importación
Ejemplo:
La empresa STAT.S.A llevó a cabo un estudio sobre el empleo de los habitantes de una
región. Entre las inquietudes que motivaron el estudio se tenía interés por conocer los
sectores que generan mayor empleo. Para realizar el estudio se eligieron al azar 200
personas a las cuales se les preguntó, entre otras cosas, sobre el sector económico en el
cual se desenvuelve la institución por la cual trabajan. Luego de clasificar las respuestas
observadas, se ha obtenido por un proceso de conteo los siguientes resultados.
DIAGRAMA DE BARRAS
Grafico Característica
. Los datos de cada categoría se representan por una barra rectangular
(vertical u horizontal)
Barras . La altura del rectángulo es proporcional a la frecuencia de la categoría
. Si la escala es ordinal deben aparecer en su “orden natural”
. Las barras aparecen separadas
. Son apropiadas para variables cualitativas que no tengan muchas categorías
. Los datos de cada categoría se representan por un sector circular
Circular . El ángulo central de cada sector es proporcional a la frecuencia relativa
expresada porcentualmente
. Si el gráfico toma forma tridimensional se denomina de “pastel” o “torta”
16
Apuntes de clase Estadística General
17
Apuntes de clase Estadística General
Ejemplo:
Frecuencia Frecuencia
Porcentaje
Sectores Sexo Absoluta relativa
%
𝒇𝒊 𝒉𝒊
Agricultura Femenino 36 0,35294 35,294
Masculino 37 0,37755 37,755
Comercio Femenino 15 0,14706 14,706
Masculino 20 0,20408 20,408
Educación Femenino 35 0,34314 34,314
Masculino 19 0,19388 19,388
Industria Femenino 6 0,05882 5,882
Masculino 20 0,20408 20,408
Turismo Femenino 10 0,09804 9,804
Masculino 2 0,02041 2,041
Total Femenino 102 1,00000 100,00
Masculino 98 1,00000 100,00
18
Apuntes de clase Estadística General
En este caso, como puede apreciarse, es conveniente adicionar una leyenda para indicar el
color que representa a cierta información. Por otro lado, también puede observarse que
existe una separación entre cada grupo de barras verticales equivalente a la mitad del ancho
de cada grupo. Se debe tener en cuenta que si los nombres o etiquetas de las categorías
son grandes, es preferible utilizar el grafico de barras horizontales, cuya construcción es
similar a lo indicado anteriormente.
Del mismo modo, para mejorar la presentación, se suele utilizar gráficos en tres
dimensiones. Los gráficos anteriores pueden ser presentados de la siguiente manera.
Ante todo es conveniente familiarizarnos con ciertos símbolos que se usan tanto en la
variable discreta como en la variable continua.
19
Apuntes de clase Estadística General
N N Tamaño de la muestra
N N Tamaño de la población o universo
Identificación para cada valor observado (minúscula en la
𝑿𝒊 𝒙𝒊
muestra)
𝒇𝒊 𝒏𝒊 Frecuencias absolutas
𝒇𝒊⁄ 𝒉𝒊 Frecuencias relativas
𝒏
𝑭𝒊 𝑵𝒊 Frecuencias absolutas acumulativas
𝑯𝒊 𝑯𝒊 Frecuencias relativas acumulativas
𝒙𝒊 𝒚𝒊 Identifica la variable discreta o las marca de clase en la
continua
𝑿′𝒊 −𝟏 − 𝑿′𝒊 𝒚′𝒊 −𝟏 − 𝒚′𝒊 Identifica a ala variable continua con sus intervalos
I C Amplitud del intervalo
M M Numero de valores de la variable o de intervalo
𝑋1 ═ 10 𝑋2 ═ 8 𝑋3 ═ 4 𝑋4 ═ 6 𝑋5 ═ 5 𝑋6 ═ 8 𝑋7 ═ 10 𝑋8 ═ 3
𝑋9 ═ 7 𝑋10 ═ 3 𝑋11 ═ 6 𝑋12 ═ 7 𝑋13 ═ 2 𝑋14 ═ 8 𝑋15 ═ 2 𝑋16 ═ 3
𝑋17 ═ 9 𝑋18 ═ 7 𝑋19 ═ 8 𝑋20 ═ 1 𝑋21 ═ 9 𝑋22 = 10 𝑋23 ═ 5 𝑋24 ═ 6
𝑋25 ═ 4 𝑋26 ═ 6 𝑋27 ═ 7 𝑋28 ═ 5 𝑋29 ═ 7 𝑋30 ═ 3 𝑋31 ═ 5 𝑋32 ═ 8
Clasificación.- En este caso se identifican los distintos valores que tiene 𝑋𝑖 y ubicamos el
mayor y menor valor: 𝑋𝑚𝑖𝑛 = 1 𝑦 𝑋𝑚á𝑥 = 10
Los diferentes valores que toma la variable 𝑋𝑖 los vamos a denotar por 𝑌𝑖
𝑌1 = 1 𝑌2 = 2 𝑌3 = 4 𝑌4 = 2 𝑌5 = 4 𝑌6 = 4 𝑌7 = 5 𝑌8 = 5 𝑌9 = 2 𝑌10 = 3
No de Tarjas Frecuencia
Flores 𝒀𝒊 𝒇𝒊
1 / 1
2 // 2
3 //// 4
4 // 2
5 //// 4
6 //// 4
7 ///// 5
8 ///// 5
8 // 2
10 /// 3
Total 32
20
Apuntes de clase Estadística General
CLASES.- (m, K)
Se llaman clases a cada uno de los grupos en los que se divide el conjunto de datos. No
hay una regla fija para determinar el número de clases.
4
K= 2, 5 √𝑛
K = 1 + 3, 3 log n
5 ≤ 𝐾 ≤ 20
RANGO. - (R)
Diferencia entre la observación que tiene el valor máximo y la observación que tiene el valor
minino, también se conoce como recorrido ó amplitud total.
R= 𝑋𝑀 − 𝑋𝑚
FRECUENCIA ABSOLUTA ( 𝒇𝒊 )
Llamada también frecuencia absoluta simple, es el número de veces que se repite los valores
dentro de las diferentes clases (intervalo) en la que está dividida la información.
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑢𝑡𝑎 𝑑𝑒 𝑦𝑖 𝑓𝑖
ℎ𝑖 = =
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑛
𝐹𝑚 = 𝑓1 + 𝑓2 + 𝑓3 + … … + 𝑓𝑚
Entonces tenemos
21
Apuntes de clase Estadística General
1
F1 = f j = f1
j 1
2
F2 = f j = f1 + 𝑓2
j 1
3
F3 = f j = f1 + 𝑓2 + 𝑓3
j 1
4
F4 = f j = f1 + 𝑓2 + 𝑓3 + 𝑓4
j 1
5
F5 = f j = f1 + 𝑓2 + 𝑓3 + 𝑓4 + 𝑓5
j 1
Y así sucesivamente
Se llama frecuencia relativa acumulada del valor 𝑦𝑖 a la frecuencia relativa total de las
observaciones menores o iguales a 𝑦𝑖 . Se denota como “ 𝐻𝑖 “
Entonces tenemos:
1
H1 = h j = h1
j 1
2
H 2 = h j = h1 +ℎ2
j 1
3
H 3 = h j = h1 +ℎ2 + ℎ3
j 1
4
H 4 = h j = h1 +ℎ2 + ℎ3 + ℎ4
j 1
5
H 5 = h j = h1 +ℎ2 + ℎ3 + ℎ4 + ℎ5
j 1
Así sucesivamente
𝒀′𝒊 –𝟏 – 𝒀′𝒊 𝒀𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
𝑌0′ – 𝑦1′ 𝒀𝟏 𝑓1 ℎ1 𝐹1 𝐻1
𝑌1′ – 𝑦2′ 𝒀𝟐 𝑓2 ℎ2 𝐹2 𝐻2
𝑌2′ – 𝑦3′ 𝒀𝟑 𝑓3 ℎ3 𝐹3 𝐻3
𝑌𝑚′ –1 – 𝑦𝑚
′
𝒀𝒎 𝑓𝑚 ℎ𝑚 𝐹𝑚 𝐻𝑚
22
Apuntes de clase Estadística General
1.- Las frecuencias absolutas y las frecuencias acumuladas absolutas son siempre enteros
no negativos.
𝑓𝑖 ≥ 0 y 𝐹𝑖 ≥ 0 para i = 1, 2, 3,……., m
2.- La suma de todas las frecuencias absolutas es igual al número total del conjunto de
observaciones.
f
j 1
j
= f1 + 𝑓2 + ⋯ … 𝑓𝑚 = 𝑛
3.- Las frecuencias relativas y las frecuencias relativas acumuladas son siempre número
fraccionados no negativos, no mayores de uno.
0≤ ℎ𝑖 ≤ 1 0≤ 𝐻𝑖 para i= 1, 2,……., m
m
Fm = f
i 1
i =1
m
Hm = h
i 1
i =1
𝑓1 = 𝐹1 ≤ 𝐹2 ≤ ⋯ … . ≤ 𝐹𝑚 Para i = 1, 2,……, m
ℎ1 = 𝐻1 ≤ 𝐻2 ≤ ⋯ … . ≤ 𝐻𝑚 Para i = 1, 2,………, m
23
Apuntes de clase Estadística General
3,3 3,3 3,7 3,9 3,9 3,9 4,0 4,1 4,1 4,2
4,2 4,2 4,3 4,3 4,3 4,3 4,4 4,4 4,5 4,5
4,5 4,5 4,5 4,7 4,7 4,7 4,7 4,7 4,7 4,8
4,8 4,8 4,9 4,9 5,0 5,0 5,1 5,1 5,3 5,3
5,3 5,3 5,4 5,6 5,6 5,8 5,8 6,0 6,1 6,1
El rango será:
R = 6,1 – 3,3= 2,8
El número de clases o intervalos será:
4
K = m = 2,5√50 = 6,64 → 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑚𝑜𝑠 𝑎 7 𝑐𝑙𝑎𝑠𝑒𝑠
La amplitud del intervalo será:
2,8
C= = 0,42 = 0,4
6,64
A continuación calculamos:
Es la semi suma de los límites de clase. Es decir límite inferior más límite superior entre dos.
Frecuencia relativa (𝒉 𝒊 )
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑢𝑡𝑎 𝑑𝑒 𝑦𝑖 𝑓𝑖
ℎ𝑖 = =
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑛
Así sucesivamente
𝑓1 3 𝑓2 6
ℎ1 = = = 0,06 ℎ2 = = = 0,12 𝑓3 14 𝑓4 11
𝑛 50 𝑛 50 ℎ3 = = = 0,28 ℎ4 = = = 0,22
𝑛 50 𝑛 50
𝑓5 8 𝑓6 3 𝑓7 5
ℎ5 = = = 0,16 ℎ6 = = = 0,06 ℎ7 = = = 0,10
𝑛 50 𝑛 50 𝑛 50
Interpretación
24
Apuntes de clase Estadística General
𝐹𝑚 = 𝑓1 + 𝑓2 + 𝑓3 + … … + 𝑓𝑚
Y así sucesivamente.
Interpretación.-
𝐹2 = 9 Significa que hay 9 genotipos de papa cuyo rendimiento es mayor a 3,7 pero igual o
menor a 4,1 toneladas por hectárea.
Se llama frecuencia relativa acumulada del valor 𝑦𝑖 a la frecuencia relativa total de las
observaciones menores o iguales a 𝑦𝑖 . Se denota como “ 𝑯𝒊 “
25
Apuntes de clase Estadística General
3
H 3 = h j = h1 +ℎ2 + ℎ3 = 0,06 + 0,12 + 0,28 = 0,46
j 1
4
H 4 = h j = h1 +ℎ2 + ℎ3 + ℎ4 = 0,06 + 0,12 + 0,28 + 0,22 = 0,68
j 1
5
H 5 = h j = h1 +ℎ2 + ℎ3 + ℎ4 + ℎ5 = 0,06 + 0,12 + 0,28 + 0,22 + 0,16 = 0.84
j 1
Así sucesivamente
Interpretación:
Así sucesivamente.
𝒀′𝒊 –𝟏 – 𝒀′𝒊 𝒀𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
3,3 − 3,7 3,5 3 0,06 3 0,06
3,7 − 4,1 3,9 6 0,12 9 0,18
4,1 − 4,5 4,3 14 0,28 23 0,46
4,5 − 4,9 4,7 11 0,22 34 0,68
4,9 − 5,3 5,1 8 0,16 42 0,84
5,3 − 5,7 5,5 3 0,06 45 0,90
5,7 − 6,1 5,9 5 0,10 50 1
HISTOGRAMA DE FRECUENCIA
Grafica en la que las clases se señalan en el eje horizontal y las frecuencias de clase en el
eje vertical. Las frecuencias de clase se representan por medio de las alturas de barras,
estas se dibujan de manera adyacente.
Un histograma que utiliza las frecuencias relativas de cada una de las clases, en lugar de
usar la frecuencia absoluta se conoce como histograma de frecuencias relativas. Este
26
Apuntes de clase Estadística General
POLIGONO DE FRECUENCIAS
También muestra la forma que tiene una distribución y es similar a un histograma. Consiste
en segmentos de recta que conectan los puntos formados por las intersecciones de los
puntos medio de clase y las frecuencias de clase
16
14
12
10
8
6
4
2
0
5.6 7 8.4 9.8 11.2 12.6 14 15.1 16.5
El polígono también se puede construir con las frecuencias relativas, a esta figura se le
conoce como polígono de frecuencias relativas.
b.- El área de cada rectángulo, en relación con el resto, muestra la proporción del número
total de observaciones que se encuentran en esa clase.
b.- Traza con más claridad el perfil del patrón de los datos.
c.- El polígono se vuelven cada vez más liso y parecido a una curva conforme aumentamos
el número de clases y el número de observaciones.
Grafica que resulta de la unión de las frecuencias acumulativas con las marcas de
clase. Nos permite ver cuántas observaciones están por encima de ciertos valores.
27
Apuntes de clase Estadística General
60
50
40
30
20
10
0
5.6 7 8.4 9.8 11.2 12.6 14 15.4
Gráfico Característica
. Apropiadas para variable discretas
Barras
. Las barras aparecen separadas
. Son barras rectangulares contiguas
. Son apropiadas para variables cuantitativas continuas agrupadas
en intervalo
Histograma . La base de cada barra es proporcional a la amplitud del intervalo
. El punto medio de cada barra coincide con la marca de clase
. La altura de la barra es proporcional a su frecuencia
. Se obtiene uniendo con segmentos de recta los puntos medios de
Polígono de
las bases superiores de las barras de un histograma con su
frecuencias frecuencia.
Es otra técnica para construir cuadros de frecuencias para datos continuos. Consiste en
realizar primero una ordenación de datos. La ordenación consiste en formar el llamado “tallo”
con los primeros dígitos significativo de los datos. Luego, las “hojas” se forman con los otros
dígitos. Después, se puede hacer una representación gráfica preliminar en la que se pueden
observar ciertos detalles que pudieron estar o no previstos.
Ejemplo
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1 5,3 6,2
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3 9,1 8,6
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6 7,0 7,7
8,3 7,5 9,8 7,5
Para elaborar una representación tallo – hoja es recomendable, primero, ordenar los datos
en forma ascendente, con lo cual se obtiene lo siguiente:
28
Apuntes de clase Estadística General
5,2 5,3 5,4 5,7 6,2 6,4 6,5 6,6 6,6 6,8
7,0 7,0 7,1 7,1 7,2 7,3 7,5 7,5 7,7 7,8
7,8 7,8 8,1 8,2 8,2 8,3 8,3 8,4 8,5 8,6
8,7 9,0 9,1 9,2 9,4 9,6 9,8 10,1 10,2 10,2
El siguiente paso consiste en formar tallos. Teniendo en cuenta que los precios varían
entre 5,2 y 10,2, los tallos se pueden formar con los dígitos de las unidades. Es decir, se
tendrá:
Tallos
5.
6.
7.
8.
9
10.
A continuación, se forman las hojas de cada tallo colocando a su lado derecho los dígitos
menos significativos que forman cada uno de los datos.
Tallo Hojas
5, 2 3 4 7
6, 2 4 5 6 6 8
7, 0 0 1 1 2 3 5 5 7 8 8 8
8, 1 2 2 3 3 4 5 6 7
9, 0 1 2 4 6 8
10, 1 2 2
También se puede agregar segmentos lineales partiendo de la última hoja de cada tallo para
obtener una aproximación al polígono de frecuencias, obteniéndose lo siguiente.
Tallo Hojas
5, 2 3 4 7
6, 2 4 5 6 6 8
7, 0 0 1 1 2 3 5 5 7 8 8 8
8, 1 2 2 3 3 4 5 6 7
9, 0 1 2 4 6 8
10, 1 2 2
DIAGRAMA DE PARETO
En una representación gráfica que se utiliza usualmente para controles de calidad y que
permite tomar acciones correctivas necesarias.
Ejemplo
29
Apuntes de clase Estadística General
No. De veces
Defecto Porcentaje
Que aparecen
Cabeza rota 22 26,2
Tamaño inadecuado de cabeza 10 11,9
Enroscado imperfecto 7 8,3
Longitud imperfecta 12 14,3
Dureza fuera de la especificación 29 34,5
Otros 4 4,8
Total 84 100,0
No. De veces
Defecto Porcentaje
Que aparecen
Dureza fuera de la especificación 29 34,5
Cabeza rota 22 26,2
Longitud imperfecta 12 14,3
Tamaño inadecuado de cabeza 10 11,9
Enroscado imperfecto 7 8,3
Otros 4 4,8
Total 84 100,0
Este grafico permite determinar el orden que se debe seguir para la corrección de los
defectos. Así tenemos que el primer defecto que se debe corregir es la dureza fuera de las
30
Apuntes de clase Estadística General
Cuando se recoge la información hay que distinguir datos para un corte transversal en el
tiempo y datos correspondientes a una serie del tiempo. El primero de ellos se refiere a
información coleccionada en un determinado momento; así por ejemplo se tiene la
información recogida sobre las utilidades netas obtenidas en el año 2000 por cincuenta
empresas. Los datos para serie del tiempo se refieren a información recogida para una o
más variables a intervalos regulares de tiempo.
Estos intervalos regulares de tiempo pueden ser días, semanas, meses, bimestres,
semestres, año, etc. Así por ejemplo, se tiene la información sobre el producto nacional bruto
periodo 1991 – 2000.
Los datos en serie de tiempo para una variable determinada se pueden representar
gráficamente en dos formas. La primera mediante barras, una barra para cada intervalo o
periodo de tiempo con una altura proporcional al valor que le corresponde a la variable de
interés. La segunda, mediante líneas que unen los puntos que tienen como componente el
periodo de tiempo y el valor de la variable.
Ejemplo
Año 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Volumen
12 15 19 25 26 28 30 28 24 22
De ventas
DESCRIPCCION DE DATOS
31
Apuntes de clase Estadística General
LA MEDIA ARITMÉTICA.-
MEDIA POBLACIONAL:
n
X
i 1
i
µ=
N
En la cual.
MEDIA MUESTRAL
n
X
i 1
i
X=
n
En la cual:
𝑋 = Media muestral
1.- Todo conjunto de datos de nivel de intervalo o de nivel de razón posee una media.
4.- Si todos los valores observados X1, X2,……….𝑋𝑛 son iguales a b (donde b es una
constante) entonces la media de una constante es la misma constante.
M(x) = M (b) = b
5.- Si a cada valor de las observaciones X1, X2,………Xn se le suma (o se resta) una
constante, la media del nuevo conjunto transformado yi= xi b; es la media aritmética del
conjunto original más (o menos) la constante. Es decir:
32
Apuntes de clase Estadística General
𝑌 = M (Y)= 𝑀(𝑋) ± 𝑏
6.- Si cada valor de un conjunto X1, X2,………….,Xn se multiplica por una constante diferente
de cero, la media aritmética del conjunto transformado Yi = aXi, donde i= 1, 2,……,n
es la media aritmética del conjunto original multiplicado por la constante. O sea:
𝑋 = 𝑀(𝑌) = 𝑎𝑀(𝑋)
7.- La suma algebraica de las desviaciones de cada valor observado X1, X2, X3,….Xn con
respecto a su media es cero. Esta propiedad significa que:
X
i 1
i Xi = 0
f Y Y 0
i 1
i i
m = número de clases
9.- En casos especiales, esto es cuando es apropiado hacerlo, la media aritmética se puede
utilizar para estimar la cantidad total de una población. Esta propiedad indica que:
Total = N X
MEDIA PONDERADA
x w i i
Xw i 1
n
w
i 1
i
33
Apuntes de clase Estadística General
MEDIANA
𝑛+1
Ubicación de la mediana ═
2
Si hay cinco datos, entonces la ubicación de la mediana (n+1)/2 será igual a (5+1)/2 igual a
3. Al ordenar los datos de menor a mayor, se obtiene el valor del tercer elemento, que es 7,
la mediana.
Número de elemento 1 2 3 4 5
Valor del elemento 2 4 7 8 15
Mediana
En el siguiente ejemplo hay seis elementos de manera que (n+1)/2 será igual a (6+1)/2
igual a 3,5 Después de ordenar los datos de menor a mayor se encuentra la semi suma de
los valores 3 y 4. Luego la mediana será 31.
Numero de elemento 1 2 3 4 5 6
Valor del elemento 25 29 30 32 35 35
31
Mediana
2.- No es difícil determinar la mediana para datos no agrupados. Tan solo se necesita
ordenarlos de menor a mayor o viceversa, y encontrar el valor del elemento central.
3.- No se ve afectada por valores muy grandes o muy pequeños y por tanto, es una medida
valiosa de tendencia central cuando ocurre este tipo de valores.
MODA
Valor de la observación que aparece con mayor frecuencia.
La moda puede determinarse para todos los niveles de datos: nominales, ordinales, de
intervalo y de razón. La moda también tiene la ventaja de no verse afectada por valores muy
altos o muy bajos.
Hay muchos conjuntos de datos que no tienen moda, porque ningún valor figura más de una
vez. Pero también existen conjunto de datos que tiene más de una moda.
34
Apuntes de clase Estadística General
Ejemplo:
Supóngase que las utilidades obtenidas por una compañía constructora en cuatro proyectos
fueron de 3, 2, 4 y 6% respectivamente ¿Cuál es la media geométrica de las ganancias?
𝑛
M.G. ═ √(𝑋1 )(𝑋2 )(𝑋3 ) … … . . (𝑋𝑛 )
4 𝟒
M.G. ═√(3)(2)(4)(6) ═ √𝟏𝟒𝟒 ═ 3,46%
Ejemplo
Supongamos que un capital de 50 000 sea colocado a una tasa anual del 24% el primero de
Enero del 2013. Si se capitaliza los días primero de Enero de cada año, calcule el promedio
del dinero invertido entre el 31 de Diciembre del 2013 y 31 de Diciembre del 2016
AÑOS 𝑿𝒊 log 𝑿𝒊
2013 50 000 4,698970
2014 62 000 4,792392
2015 76 880 4,885813
2016 93 331,2 4,979235
∑ 19,356410
𝑛
M.G. ═ √(𝑋1 )(𝑋2 )(𝑋3 ) … … . . (𝑋𝑛 )
n
log X i
log M .G. i 1
19,356410
log M.G. = = 4,8391025
4
M.G. = antilog 4, 8391025
𝑿 ≥ 𝑿g
35
Apuntes de clase Estadística General
La media geométrica para datos agrupados en clases, es la raíz n-ésima del producto
de las marcas de clase elevadas a sus respectivas frecuencias.
𝑛𝑓 𝑓 𝑓
𝑀. 𝐺. = 𝑋g = √𝑌′1 1 𝑌′2 2 … … . 𝑌′𝑚 𝑚
2.- Está limitado para valores positivos para que pueda ser interpretado.
3.- Si algún valor de la variable es cero, la media geométrica será igual a cero.
Es decir:
1 n
𝑿𝒉 = 𝑴𝒉 = n =
1 n
i 1 xi
x
1
i 1 i
n
Ejemplo
VENTAJAS Y DESVENTAJAS
1.- La media armónica se basa en todas las observaciones por lo que está afectado por los
valores extremos. Pero da a los valores grandes un peso menor que el que da la media
geométrica; mientras que a los valores pequeños, le da un peso mayor que el que da la
media aritmética y la media geométrica.
36
Apuntes de clase Estadística General
2.- Cuando se presenta una relación inversa entre las variables implícitas, como por
ejemplo:
e=p x t
- La velocidad y el tiempo
e=v x t
Donde: e= espacio v = velocidad t= tiempo
Ejemplos
1.- Suponga que ha gastado usted, un sol por 3 docenas de naranjas en una tienda, otro
sol por 4 docenas de naranjas en una segunda tienda y otro sol más por 5 docenas en
una tercera tienda. Determinar el precio promedio por una docena de naranjas.
Solución:
1 n 3
𝑿𝒉 = 𝑴𝒉 = n
1
= n
= 1 1 1 = 0,25
x
i 1
x
1 + +
1/3 1/4 1/5
i i 1 i
n
2.- Cinco secretarias tienen las siguientes velocidades 40, 36, 28, 40, y 35 palabras por
minuto. Si cada una de ellas escribe un mismo texto, calcule la velocidad media
n
𝑋ℎ = 𝑀ℎ = n
1
x
i 1 i
5
𝑋ℎ = 𝑀ℎ = 1 1 1 1 1 = 35,196 palabras/minuto
+ + + +
40 36 28 40 35
37
Apuntes de clase Estadística General
X
i 1
i i f
µ=
N
Media o promedio muestral
n
X i fi
X i 1
n
Para datos continuos
Si los datos han sido clasificados en m clases en una tabla de frecuencia con marca de clase
Yi y frecuencia absoluta 𝒇𝒊 = 1,2,…….., m, la media aritmética de estos datos está definida
por:
Y f
i 1
i i
µ=
N
Media o promedio muestral:
n
Y f i i
X i 1
n
𝒀′𝒊 –𝟏 – 𝒀′𝒊 𝒀𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
Y f i i
X i 1
38
Apuntes de clase Estadística General
𝒏
𝟐
−𝑭𝒊−𝟏
Me = 𝒚′𝒊−𝟏 + 𝒄𝒋 [ ]
𝑭𝒊 − 𝑭𝒊−𝟏
Donde:
n = número de observaciones.
′
𝑦𝑖−1 = Límite inferior de la clase mediana.
𝒀′𝒊 –𝟏 – 𝒀′𝒊 𝒀𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
𝒏
−𝑭𝒊−𝟏
𝟐
Me = 𝒚′𝒊−𝟏 + 𝒄𝒋 [ ]
𝑭𝒊 − 𝑭𝒊−𝟏
100
2
−45
𝐌𝐞 = 9,9 +1,29[ ] = 10,158
70 − 45
𝒇𝒊 − 𝒇𝒊−𝟏
Mo= 𝒀′𝒊−𝟏 + 𝒄𝒋 [(𝒇 ]
𝒊 − 𝒇𝒊−𝟏 )+ (𝒇𝒊 − 𝒇𝒊+𝟏)
Donde:
39
Apuntes de clase Estadística General
𝒀′𝒊 –𝟏 – 𝒀′𝒊 𝒀𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
6,3 - 7,5 6,9 14 0,14 14 0,14
7,5 - 8,7 8,1 18 0,18 32 0,32
8,7 - 9,9 9,3 13 0,13 45 0,45
9,9 - 11,1 10,5 25 0,25 70 0,70
11,1 - 12,3 11,7 13 0,13 83 0,83
12,3 - 13,5 12,9 8 0,08 91 0,91
13,5 - 14,7 14,1 5 0,05 96 0,96
14,7 - 15,9 15,3 4 0,04 100 1
𝑓𝑖 − 𝑓𝑖−1
′
Mo = 𝑌𝑖−1 + 𝑐𝑗 [(𝑓 ]
𝑖 − 𝑓𝑖−1 )+ (𝑓𝑖 − 𝑓𝑖+1)
25−13
Mo = 9,9 + 1,2 [ ] ═ 10,5
(25−13)+ (25− 13)
𝑋 = 𝑀𝑒 = 𝑀𝑜
2.- Si la distribución tiene la forma acampanada, es unimodal, pero no tiene simetría, las tres
medidas toman valores diferentes, y la mediana queda comprendida generalmente entre
la moda y la media aritmética.
En una distribución asimétrica positiva (o con sesgo positivo) la media aritmética es el mayor
de los tres promedios. Esto se debe a que en la media influye más que en la mediana y la
moda, los valores sumamente altos.
3 (𝑚𝑒𝑑𝑖𝑎𝑛𝑎)−𝑚𝑜𝑑𝑎
Media =
2
2 (𝑚𝑒𝑑𝑖𝑎)+ 𝑚𝑜𝑑𝑎
Mediana =
3
40
Apuntes de clase Estadística General
¿Toma en ¿Es
¿Qué tan cuenta afectada
Medida común Existencia cada por los Ventajas/
es? Valor? valores Desventajas
extremos?
“Promedio Es el de mayor uso,
Siempre
Media más Si Si sensible a los
existe
conocido” valores extremos
Apropiada cuando
Valor en el Siempre
Mediana No No hay valores
medio existe
extremos
Apropiada para
Valor más Podría no
Moda No No variables en escala
frecuente existir
nominal
Los cuantiles más usados son los cuartiles, 𝑄𝑗 , los deciles, Dj y los percentiles, 𝑃𝑗 .
PERCENTILES
El p – ésimo percentil es un valor tal que, a lo sumo, p por ciento de las observaciones son
menores o iguales que este valor y, a lo sumo, (100 – p) por ciento de las observaciones son
mayores o iguales que este valor.
3.- Si k no es entero, se redondea. El valor del entero inmediato superior que k indica la
posición del i – ésimo percentil.
Si k es entero, el i – ésimo percentil es el promedio de los valores de los datos
ubicados en los lugares k y k + 1.
Ejemplo
53 55 70 58 64 57 72 53 69 57 68 53
Solución
Para percentil 30
𝑖 30
K= [ ]n = [ ] 12 = 3.6
100 100
Para percentil 75
42
Apuntes de clase Estadística General
𝑖 75
k= [ ]n = [100] 12 = 9
100
𝑖𝑛
1.- Se calcula , donde i = 1, 2,3,………..,99
100
Donde:
′
𝑌𝑖−1 = Límite inferior de la clase que contiene a 𝑃𝑖
Ejemplo
𝒀′𝒊−𝟏 − 𝒀′𝒊 𝒇𝒊 𝑭𝒊
30 – 40 1 1
40 – 50 3 4
50 – 60 11 15
60 – 70 21 36
Determine la edad mínima 70 – 80 43 79 del 25% de las personas
de más edad 80 – 90 32 111
90 - 100 9 120
Solución
La edad minina del 25% de las personas de más edad es el percentil 75, en ese sentido
tenemos que encontrar las frecuencias acumuladas
𝑖𝑛 75 𝑥 120
1.- Se calcula = = 90
100 100
43
Apuntes de clase Estadística General
90−79
𝑃75 = 80 + 10 [ ] = 83.44
32
CUARTILES.-
Dividen a la masa de datos en cuatro grupos iguales. El primer cuartil, 𝑄1 deja el 25% de
los datos ordenados a su izquierda, y el otro 75% a su derecha. El segundo cuartil, 𝑄2 , deja
el 50% de los datos a su izquierda y el otro 50% a su derecha, este valor coincide con la
mediana, mientras que el tercer cuartil, 𝑄3 deja el 75% de los datos ordenados a su izquierda
y el otro 25% a su derecha.
Ejemplo
Los siguientes datos representan los sueldos mensuales para una muestra de 12 Ingenieros
Agrónomos.
2850 2950 3050 2880 2755 2710 2890 3130 2940 3325 2920 2880
Determine el 𝑄1 𝑦 𝑄3
Solución
Cuartil uno, 𝑸𝟏
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
2.- Calcular el 𝑄1 es igual que calcular el 𝑃25 , en ese sentido se calcula el índice K
𝑖 25
k= [ ]n = [ ] 12 = 3
100 100
44
Apuntes de clase Estadística General
Cuartil tres, 𝑸𝟑 :
𝑖 75
k= [ ]n = [ ] 12 = 9
100 100
𝑄1 𝑄2 𝑄3
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
𝒏
− 𝑭𝒌−𝟏
𝟐
𝑸𝟐 = 𝒀′𝒊−𝟏 + 𝒄𝒋 [ ]
𝒇
3𝑛
− 𝐹𝑘−1
4
𝑸𝟑 = 𝒀′𝒊−𝟏 + 𝒄𝒋 [ ]
𝑓
Donde:
𝑛 = Número de datos
Ejemplo
45
Apuntes de clase Estadística General
Una empresa decide evaluar a sus empleados. La clasificación se lleva a cabo mediante la
aplicación de un test que arroja los siguientes puntajes:
𝒀′𝒊−𝟏 − 𝒀′𝒊 𝒇𝒊
0 - 20 94
20 - 40 140
40 - 60 160
60 - 80 98
80 - 100 8
Determine:
𝑛
− 𝐹𝑘−1
𝑸𝟏 = 𝒀′𝒊−𝟏 + 𝒄𝒋 [4 ]
𝑓
Luego
𝑛 500
El lugar del cuartil 1 es la posición = = 125. Es decir, que el cuartil está ubicado
4 4
en la clase 20 – 40. Por lo tanto:
𝑛
− 𝐹𝑘−1
4
𝑄1 = 𝑌𝑖−1
′ + 𝑐𝑗 [ ]
𝑓
𝟏𝟐𝟓−𝟗𝟒
𝑄1 = 20 + 20 [ 𝟏𝟒𝟎
] = 24.43
Esto quiere decir que el 75% de los trabajadores tienen una calificación mayor a 24.43
b.- La puntuación que supera a las puntuaciones del 75% de los trabajadores, corresponde
al valor del tercer cuartil.
46
Apuntes de clase Estadística General
3𝑛 3 𝑥 500
El lugar del tercer cuartil es la posición = = 375. Es decir, que el cuartil está
4 4
ubicado en la clase 40 - 60. Por lo tanto
3𝑛
− 𝐹𝑘−1 375 − 234
4
𝑄3 = 𝑌𝑖−1
′ + 𝑐𝑗 [ ] = 40+ 20 [ ] = 57.625
𝑓 160
Esto quiere decir que el 25% de los trabajadores tiene una puntuación mayor a 57.625
Existen varias razones por la cual se debe estudiar la dispersión en un conjunto de datos
1.- Al aplicar una medida de dispersión es posible evaluar la confiabilidad del promedio que
se está utilizando. Una dispersión pequeña indica que los datos se encuentran
acumulados cercanamente, por ejemplo, alrededor de la media aritmética. Por tanto, la
media se considera bastante representativa de los datos. Esto es: la media es un
promedio confiable. Por el contrario, una dispersión grande indica que la media no es muy
confiable, es decir no es muy representativa de los datos.
2.- Una medida de dispersión permite apreciar cuán dispersas están dos o más
distribuciones. Por ejemplo veamos la siguiente figura
A continuación se muestran dos series de datos, ambos tienen la misma media aritmética
pero se observa que tienen diferente dispersión alrededor de ella.
Se tiene dos series de datos:
a.- 48, 49, 49, 50, 50, 50, 51, 51,52
b.- 40, 47,47, 50, 50, 50, 53, 53,60
47
Apuntes de clase Estadística General
La media aritmética de ambas series es la misma. Un análisis de las cifras individuales revela
sin embargo un gran contraste. En la serie B hay una gran variación entre los valores, siendo
40 el valor menor y 60 el valor mayor. En la serie A el número menor es 48 y el mayor es 52.
En resumen podremos decir que en la serie B hay valores muy altos y muy bajos., mientras
que en la serie A los valores están más concentrados alrededor del promedio.
Se trata de la diferencia entre los valores mayor (o más alto) y menor ó más bajo) de un
conjunto de datos
1.- Es fácil de calcular y sus unidades son las mismas que las de la variable.
4.- El rango aumenta con el número de observaciones o bien se queda igual. En cualquier
caso nunca disminuye.
DESVIACIÓN MEDIA:
Denominada también desviación promedio de los valores absolutos de las desviaciones con
respecto a la media aritmética.
n
X i X
D.M . i 1
Donde:
La desviación media tiene dos ventajas. Utiliza en su cálculo el valor de cada uno de los
elementos de un conjunto de datos, y es fácil de comprender; y es el promedio en que los
valores se desvían con respecto de la media.
Ejemplo
Los pesos de una muestra de cajas listas para embarcarse a Italia son (en kilogramos): 103,
97, 101, 106 y 103
48
Apuntes de clase Estadística General
X
i 1
i 103+97+101+106+103
X= = = 102 Kg
n 5
|103−102|+|97−102|+|101−102|+|106−102|+|103−102|
D.M. =
5
D.M.═ 2,4 Kg
VARIANCIA.-
Variancia de población:
n
(X i )2
𝜎2 = i 1
N
Variancia de la muestra:
2
n
n n X
i 1
i n
(Xi X ) X nX 2
2 2 2
X i i
n
𝑠 2 = i 1 = i 1 = i 1
n 1 n 1 n 1
f Y
i i
2
n
fiYi 2 nX 2
S 2 i 1 i 1
n 1 n 1
PROPIEDADES DE LA VARIANZA
2.- La varianza de una constante es cero. Esto significa que si X1 = X2 =……..= Xn= b
entonces:
V (b) = 0
49
Apuntes de clase Estadística General
V (y) = V (x ± b) = V(x)
4.- Si a cada valor de un conjunto X1,X2,……Xn, se multiplica por una constante a, la varianza
del nuevo conjunto de valores Y1,Y2,…………Yn, donde Yi = aXi, i= 1,2,…,n es igual a la
varianza del conjunto original multiplicada por el cuadrado de la constante. Es decir:
V (y) = a2 V(X)
n1 1 S12 n2 1 S22 n1 X1 X n2 X 2 X
2
2
S =
n 1
DESVIACION ESTANDAR
DESVIACIÓN ESTANDAR
CV = × 100
MEDIA ARITMETICA
𝜎
POBLACION CV = [ 𝑥 100]
𝜇
𝑠
MUESTRA CV = [ 𝑥 100]
𝑥
50
Apuntes de clase Estadística General
3.- Se afecta su valor cuando se suma una constante K a cada observación de un conjunto
de datos.
4.-No cambia de valor cuando se multiplica por una constante K a cada una de las
observaciones.
Coeficiente de
Grados de variabilidad
variabilidad (%)
0 Datos Completamente homogéneos
0 < 𝐶𝑉 < 10 Datos muy homogéneos
10 < 𝐶𝑉 < 15 Datos regularmente homogéneos
15 < 𝐶𝑉 < 20 Datos regularmente variables
20 < 𝐶𝑉 < 25 Datos variables
CV> 25 Datos muy variable
TEOREMA DE CHEBYSHEV.-
Una desviación estándar pequeña para un conjunto de valores indica que éstos se
encuentran localizados cerca de la media. Por el contrario una desviación estándar grande
revela que las observaciones están muy dispersas con respecto a la media.
51
Apuntes de clase Estadística General
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRIA.
Las medidas de asimetría tienen como facilidad elaborar un indicador que permita
establecer el grado de simetría o asimetría, que presenta una distribución, sin necesidad de
llevar a cabo su representación gráfica.
𝑥 − 𝑀𝑜
𝑠𝑘 =
𝑠
También existen otras fórmulas alternativas para el cálculo del coeficiente de asimetría.
3(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝑠𝑘 =
𝑆
Asimismo, el coeficiente de asimetría nos describe la forma de un conjunto de datos, es
decir, la manera como se distribuyen, comparando la media y la mediana. Si ambas medidas
son iguales, por lo general, se considera que los datos son simétricos (o con sesgo cero, es
decir, el coeficiente de asimetría es cero). Por lo contrario, los datos o su distribución es
asimétrica o sesgada, es decir, si la media excede a la mediana, los datos se describen
como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetría es positivo).
Si la mediana excede a la media, los datos suelen llamarse sesgados a la izquierda, o con
sesgo negativo (el coeficiente de asimetría es negativo).
El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco
usuales: el sesgo negativo ocurre cuando la media se reduce debido a algunos valores muy
pequeños. Los datos son simétricos cuando en realidad no hay valores extremos en ninguna
dirección, de tal manera que los valores grandes y pequeños se equilibran.
Simetría Relación
Simétrica o insesgada Media = Mediana = Moda
Sesgo positivo o a la derecha Media > Mediana > Moda
Sesgo negativo o a la izquierda Media < Mediana < Moda
52
Apuntes de clase Estadística General
Analiza el grado de concentración que presentan los valores alrededor de la zona central de
la distribución, es decir, estudia la distribución de frecuencias en la zona central. La mayor
o menor concentración de frecuencias alrededor de la media y en la zona central de la
distribución, dará lugar a una distribución más o menos apuntada.
Si el valor de la curtosis es positivo, se dice que los datos tienen una distribución leptocúrtica
(es más apuntada o puntiaguda que la distribución normal); en caso contrario, si la curtosis
es negativa, se dice que los datos tienen una distribución platicúrtica (es menos apuntada o
puntiaguda que la distribución normal). Si la curtosis es cero, entonces los datos se
distribuyen siguiendo una distribución normal, y se dice que en este caso la distribución
mesocúrtica.
(X i X )4 1 𝑄3 − 𝑄1
K i 1
3 k= [ ]
nS x4 2 𝑃90 −.𝑃10
Donde
3.- No le afecta las operaciones de suma y multiplicación por una constante c aplicada a
n
(X i X )4
cada observación. K i 1
3
nS x4
53
Apuntes de clase Estadística General
(X i X )4 288
K i 1
3 = - 3 = -1.875
nS 4
x
(4)(64)
Ejemplo
Una muestra de digitadoras de texto reveló que su rapidez media de tecleo es de 87 palabras
por minuto, con una media de 73. La desviación estándar es de 16.9 palabras por minuto.
¿Cuál es el coeficiente de asimetría? Interprete su respuesta.
Solución
3(𝑀𝑒𝑑𝑖𝑎−𝑀𝑒𝑑𝑖𝑎𝑛𝑎) 3(87−73)
Reemplazando 𝑠𝑘 = = = 2,49
𝑠 16.9
PROBABILIDAD
EXPERIMENTO:
54
Apuntes de clase Estadística General
RESULTADO:
Ejemplos
Cuanto más se acerca una probabilidad a 0, es más improbable que suceda el evento al que
se asocia. Cuanto más se acerca la probabilidad a 1, tanto más seguros estamos que
sucederá.
ENFOQUES DE LA PROBABILIDAD:
Se analizarán dos enfoques de la teoría probabilística que son dos puntos de vista: objetivo
y subjetivo.
PROBABILIDAD CLASICA:
55
Apuntes de clase Estadística General
Ejemplo:
1
Probabilidad de un dos:
6
MUTUAMENTE EXCLUYENTES
La ocurrencia de un evento significa que ningún otro puede ocurrir al mismo tiempo.
COLECTIVAMENTE EXHAUSTIVO,
PROBABILIDAD SUBJETIVA
Posibilidad (probabilidad) de que suceda un evento, asignado por una persona con base en
cualquier información de que disponga.
Ejemplo.-
1.- Estimar la probabilidad de que el equipo del JUAN AURICH, salga campeón en el
campeonato de futbol profesional.
2.- Estimar la posibilidad de que usted tenga una calificación de 20 en este curso.
REGLA DE LA ADICION
Ejemplo
En el experimento de tirar un dado, el evento "un número par" y el evento "un número impar"
son mutuamente excluyentes. Si se observó un número par, no podría caer un número impar
al mismo tiempo.
56
Apuntes de clase Estadística General
Es la probabilidad que mide la posibilidad de que dos o más eventos ocurran en forma
simultánea:
Ejemplo
𝒏𝒐 de
Clasificación empleados
Supervisores 120
Mantenimiento 50
Producción 1460
Gerencia 302
Secretaria 68
Total 2000
Solución
Sean los siguientes eventos:
B = El empleado seleccionado al azar es de mantenimiento.
302
b) P (D') = 1- P (D) = 1- = 0.849
2000
REGLA DE LA MULTIPLICACION
57
Apuntes de clase Estadística General
P (A y B) = P(A). P (B)
P (A ∩ B) = P(A). P (B)
P (A ∩ B ∩ C) = P(A).P (B).P(C)
P (A\B) = P (A) ó
P (B \ A) = P (B)
Ejemplo
Una moneda es lanzada dos veces al aire, ¿cuál es la probabilidad de que las dos veces se
obtenga cara?
Solución:
1 1
P (A) = P (B) =
2 2
1 1 1
P (A ∩ B) = P(A) · P (B) = × =
2 2 4
Ejemplo
Peso del
Probabilidad
paquete
Insuficiente 0.025
58
Apuntes de clase Estadística General
Satisfactorio 0.900
Excedido 0.075
P (F) = 0.025
P (F ∩ F ∩ F) = 0.000015625
b) Descubrir que a los tres paquetes les falte peso es poco probable.
Observación
Si dos eventos no son independientes, se dice que son dependientes. Con un ejemplo
ilustraremos esta idea:
Supongamos que hay 10 rollos de película fotográfica en una caja y se sabe que tres están
defectuosos. Se selecciona uno:
3
P (D) = Probabilidad de que sea defectuoso.
10
7
P (D') = Probabilidad de que no sea defectuoso.
10
Después se elige un segundo rollo de la caja, sin devolver el primero, la probabilidad de que
este sea defectuoso dependerá si el primero lo fue, de ser así es:
2
P (𝐷2 ) = Probabilidad de que el segundo rollo extraído sea
9
defectuoso dado que el primero lo fue.
7
P (𝐷2′ ) = Probabilidad de que el segundo rollo extraído no sea
9
defectuoso dado que el primero fue bueno.
Este tipo de análisis nos ayuda a definir la probabilidad condicional.
PROBABILIDAD CONDICIONAL
Es la probabilidad de que ocurra un evento en particular dado que otro evento ha ocurrido.
P (A ∩ B) = P (A). P (B\A)
𝑷 ( 𝑨 𝒚 𝑩)
P (B \ A) = ó
𝑷 (𝑨 )
59
Apuntes de clase Estadística General
𝑷 ( 𝑨 ∩ 𝑩)
P (B \ A) =
𝑷 (𝑨 )
P (A ∩ B) = P (A) P (B\A)
3 2
P (A ∩ B) = 10 × 9
= O.067
Donde:
Ejemplo
Solución:
Pero esta es solo una parte, el total de posibilidades será una permutación de ellas, pero es
una permutación con repetición ya que las espadas se repiten dos veces y los corazones
también dos veces, entonces:
13 12 13 12 13 5!
P (𝐸1 ∩ 𝐸2 ∩ 𝐶1 ∩ 𝐶2 ∩ 𝐷) = ( 52 × × × × ) = 0.0304
51 50 49 48 2 ! 2 !
TABLAS DE CONTINGENCIA
Una tabla de contingencia es una distribución, una matriz, en cuyas filas y columnas los
individuos de una población se clasifican en función de dos variables. También se le conoce
con el nombre de tabla de doble entrada.
Por ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han
clasificado según el sexo y por su adicción al tabaco.
Fumadores No Total
Hombres 120 fumadores
60 180
Mujeres 50 70 120
Total 170 130 300
60
Apuntes de clase Estadística General
Las tablas de contingencia nos ayudan a calcular los valores de probabilidad. Una tabla de
probabilidad puede crearse dividiendo cada valor de las casillas por el total, que en el
ejemplo anterior sería 300.
Fumadores No Total
Hombres 120/300 fumadores
60/300 180/300
Mujeres 50/300 70/300 120/300
Total 170/300 130/300 300/300
Fumadores No Total
Hombres 0.4 fumadores
0.2 0.6
Mujeres 0.1667 0.2333 0.4
Total 0.5667 0.4333 1
Los valores en los márgenes de la tabla se llaman probabilidades marginales. Por ejemplo,
elegida una persona al azar la probabilidad de que esta sea hombre es P (H) = 0.6 y la
probabilidad de seleccionar una mujer es P (M) = O.4
𝑃 (𝑀 ∩ 𝐹) 0.1667
P (M \ F) = = = 0.2942
𝑃 (𝐹) 0.5667
Por lo tanto, hay una probabilidad del 29.42% de que sea mujer dado que es fumador la
persona elegida.
Es una representación gráfica útil para organizar cálculos que abarcan varios datos. Cada
segmento en el árbol es una etapa del problema.
Ejemplo
61
Apuntes de clase Estadística General
Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140 clientes.
Estado Civil
Edad Civil
Soltero Casado Total
Menor de 30 77 14 91
Mayor o igual a 30 28 21 49
Total 105 35 140
Solución:
S = Cliente soltero.
C = Cliente casado.
Probabilidad Probabilidad
condicionada conjunta
P(S/A)
77 91 77
S p(A ∩ S) = P(A)P(S/A)
= × = 0.55
91
140 91
91 A C P(A ∩ C) = P(A)P(C/A) 91 14 = 0.10
140 14 = ×
140 91
91
14
91
28 S P (B ∩ S) = P(B)P(S/B) 49 28 = 0.20
49
B
49 = ×
140 49
140
21 C P (B ∩ C) = P(B)P(C/B) 40 21 = 0.15
= ×
49 140 49
77
a.-P (A ∩ S) = 140 = 0.55 Probabilidad de que un cliente sea menor de 30 y soltero
77
b.- P (S \ A) = 91 = 0.85 Probabilidad de que un cliente sea soltero dado que es menor
de 30 años.
También se puede asociar a cada diagrama de árbol una tabla de contingencia Y viceversa.
Para el ejemplo se tiene:
62
Apuntes de clase Estadística General
Estado Civil
Edad CivilIVIL
Soltero Casado Totales
A P (A ∩ S) P (A ∩ C) P (A)
B P (B ∩ S) P (B ∩ C) P (B)
Totales P(S) P(C) 1
Los datos obtenidos en el diagrama de árbol los reemplazamos en la tabla, esto es:
Estado civil
Edad Civil
Soltero Casado Totales
A 0.55 0.1 0.65
B 0.2 0.15 0.35
Totales 0.75 0.25 1
TEOREMA DE BAYES
PROBABILIDAD A PRIORI
PROBABILIDAD A POSTERIORI
TEOREMA DE BAYES
𝑷 (𝑨𝟏 )𝑷(𝑩⁄𝑨 )
𝟏
P (A¡\B) =
𝑷(𝑨𝟏 ) 𝑷( ⁄𝑨 )+ 𝑷(𝑨𝟐 )𝑷( ⁄𝑨 )+ ………….+𝑷(𝑨𝒌 )𝑷(𝑩⁄𝑨 )
𝑩 𝑩
𝟏 𝟐 𝒌
63
Apuntes de clase Estadística General
Ejemplo
La Dra. Blanquita ha estado enseñando Estadística Básica durante muchos años. Se sabe
que el 80% de los estudiantes terminarán los problemas asignados. Determinó, que de los
estudiantes que cumplen con su trabajo el 90% aprobará el curso. De aquellos estudiantes
que no lo hacen así, el 60% será aprobado. Eduardo López tomó Estadística durante el
último semestre con la profesora Blanquita y recibió una calificación aprobatoria. ¿Cuál es
la probabilidad de que sí haya hecho sus tareas?
Solución:
Sea:
A = Estudiante que cumple con su trabajo.
P(𝐵′ ) = 0.1
′
P(A) =0.8 P(A ∩ 𝐵′ ) = 𝑃(𝐴)𝑃(𝐵 ⁄𝐴)
P(B) =0.6
P(𝐴′ ∩ B ) = 𝑃(𝐴′ )𝑃(𝐵⁄𝐴′ )
P(𝐵′ ) = 0.4
′
P(𝐴′ ∩ 𝐵′ ) = 𝑃(𝐴′ )𝑃(𝐵 ⁄𝐴′ )
64
Apuntes de clase Estadística General
𝑃 (𝐴 ∩ 𝐵)
P (𝐴⁄𝐵 ) =
𝑃(𝐵)
𝑃 (𝐴 )𝑃 (𝐵⁄𝐴)
P (𝐴⁄𝐵 ) =
𝑃(𝐵 )
Tener en cuenta que P (B) no es discernible de inmediato. Aquí es donde participa el teorema
de Bayes. Existen dos razones por las que Eduardo López haya aprobado el curso. Puede
haber hecho los trabajos asignados y aprobar el curso o puede no haber hecho los trabajos
asignados y también aprobar el curso, es decir:
P (B) = P (A y B) +P (A’ y B)
A P(A)P(𝐵⁄𝐴)
P =
B 𝑃(𝐴) 𝑃(𝐵⁄𝐴)+ 𝑃(𝐴′ )𝑃(𝐵⁄𝐴′ )
A 0.72
P =
B 0.72 +0.12
A 0.72
P = = 0.86 = 86%
B 0.84
Por lo tanto, hay un 86% de probabilidad de que Eduardo López haya hecho sus tareas
dado que recibió una calificación aprobatoria.
Ejemplo
Ejemplo:
Supóngase que se está interesado en el número de caras que caen al lanzar tres veces una
moneda. Este es el experimento. Los posibles resultados son cero, uno, dos y tres caras.
¿Cuál es la distribución de probabilidades para el número de caras?
65
Apuntes de clase Estadística General
Solución.
VARIABLE ALEATORIA
Cantidad que es resultado de un experimento aleatorio que, debido al azar, puede tomar
distintos valores
Variable que sólo puede tener ciertos valores claramente separados y que es el resultado
de contar algún elemento de interés.
Ejemplos:
- El número de caras que se presentan en tres lanzamientos de una moneda
- El número de estudiantes que sacaron 15 en un examen
- El número de empleados ausentes en una fábrica determinada
Es aquella que puede tomar uno de una cantidad infinitamente grande de valores, dentro de
ciertas limitaciones
66
Apuntes de clase Estadística General
Ejemplos:
- La duración de cada canción en el último álbum de Corazón Serrano
- El peso de cada estudiante de esta clase
- La temperatura ambiente al momento que lee estos apuntes
MEDIA:
n
𝝁 = 𝑬(𝑿) = XP X
i 1
Sirven para comparar la variación en dos distribuciones que tengan la misma media, pero
diferente dispersión.
n
X μ P X
2
𝝈𝟐 =
i 1
Un vendedor, Juan Pérez vende automóviles nuevos para una empresa. Generalmente
negocia el mayor número de autos los sábados. Ha establecido la siguiente distribución de
probabilidad para el número de autos que espera vender en un sábado en particular.
Número de
automóviles Probabilidad
Vendidos P(x)
X
0 0,10
1 0,20
2 0,30
3 0,30
4 0,10
Total 1,00
67
Apuntes de clase Estadística General
Ejemplo:
Una segunda característica de una distribución binomial es que los datos recopilados son
resultado de conteos.
𝒏!
P(X) = 𝑝 𝑥 𝑞 𝒏−𝒙
𝒙!(𝒏 –𝒙)!
Donde:
n: es el número de ensayos.
µ ═ np
𝝈𝟐 = 𝒏𝒑𝒒
Ejemplo:
68
Apuntes de clase Estadística General
𝒏!
a.- P(X) = 𝑝 𝑥 𝑞 𝒏−𝒙
𝒙!(𝒏 –𝒙)!
𝟖!
P(X= 3) = 0,853 0,15𝟖−𝟑
𝟑!(𝟖 –𝟑)!
𝒏!
b.- P(X) = 𝑝 𝑥 𝑞 𝒏−𝒙
𝒙!(𝒏 –𝒙)!
𝟖!
P(X= 3) = 0,153 0,85𝟖−𝟑
𝟑!(𝟖 –𝟑)!
8! 8!
𝑷(𝑿≥𝟐) = 1− [𝑃(𝑋 =0) = 0,150 0,858−0 + 𝑃(𝑋=1) = 0,151 0,858−1 ]
0!(8 –0)! 1!(8 –1)!
La distribución de Poisson da un modelo para variables de tipo de conteo, donde los conteos
se refieren al registro del número de un evento de interés en una unidad de tiempo o espacio
dados (horas, minutos, 𝑚2 , 𝑚3 , etc).
Lleva ese nombre en honor a SIMON POISSON, quien la estudió y dio a conocer en 1837.
Con frecuencia se denomina ley de eventos improbables, lo cual significa que la
probabilidad p que suceda un evento específico es bastante pequeña. Esta es una
distribución de probabilidades discreta.
69
Apuntes de clase Estadística General
Es una distribución de probabilidades usada cuando n es muy grande, por lo general mayor
de cincuenta, y p, la probabilidad de éxito de un suceso, se acerca a cero, mientras que q
la probabilidad del fracaso se aproxima a 1, de tal manera que el producto de np, simbolizado
por lambda 𝝀, sea menor o igual a 5
- La distribución de llamadas telefónicas que llegan a un conmutados por hora, minuto, etc,
etc
- La demanda (necesidades) de los pacientes que requieren servicio en una institución de
salud
- Las llegadas de camiones y automóviles a una caseta de peaje por hora, día, etc
- Número de accidentes registrados en una intersección de calles por día, semana, mes, etc
Estos ejemplos tienen en común un elemento: pueden ser descritos mediante una variable
aleatoria discreta que toma valores enteros (0, 1, 2, 3, etc.).
Otros ejemplos:
- Número de huevos de un insecto en una ovoposición
- Número de bacterias en una muestra de agua
- Número de semillas defectuosas, observadas en una cinta transportadora por minuto.
- Número de nematodos por unidad de volumen de suelo
- El número de palabras mal escritas por página en un periódico
- El número de llamadas telefónicas por hora que recibe la secretaria de la Facultad
- El número de vehículos vendidos por día por la marca Toyota en la ciudad de Lambayeque
- El número de goles en un encuentro de fútbol escolar
- Número de pulgones por planta
𝝁𝑿 𝒆−𝝁 𝝁𝑿
P(X) = O bien P(X) =
𝑿! 𝑿!𝒆𝝁
𝝀𝑿 𝒆−𝝀
P(X) =
𝑿!
Donde:
70
Apuntes de clase Estadística General
𝝁 = 𝒏𝒑
𝝈𝟐 = np
Ejemplo
Si el 1% de las bombillas fabricadas por una compañía son defectuosas, hallar la
probabilidad de que, en una muestra de 100 bombillas, 3 sean defectuosas
𝝀𝑿 𝒆−𝝀
P(X) =
𝑿!
𝝀 = 𝒏𝒑
𝜆 = 100 (0,01) = 1
13 2,71828−1
P(X) = = 0, 06121 = 6,13%
3!
Ejemplo:
1.- Se sabe que el número medio de errores por factura se estimó en 0,3. ¿Cuál es la
probabilidad de no encontrar errores en una factura seleccionada al azar? ¿Cuál es la
probabilidad de hallar exactamente un error?
2.- Si el número promedio de picaduras de gorgojos por semilla es 0,2 (de cada 100 semillas
20 se encuentran picadas) ¿Cuántas de 100 semillas no tendría picaduras?, ¿Cuántas 1
picadura? Y ¿Cuántas 2 ó más?
Ejemplo
71
Apuntes de clase Estadística General
Los registros de una empresa muestran que la probabilidad de que falle cierto tipo de foco
en las primeras 100 horas de uso es p = 0,0005. Determine la probabilidad de que, de un
lote de 1 000 focos, cuando mucho 2 fallen en las primeras 100 horas de uso a) usando la
distribución Poisson b) usando la Binomial
Solución:
µ = np = 1 000(0,0005) =0,5
𝑛!
P(X) = 𝑝 𝑥 𝑞 𝑛−𝑥
𝑛!(𝑛 −𝑥)!
1 000!
P(X =0) = (0,0005)0 (0,9995)1000 = 0,6065
0!(1 000 −0)!
1 000!
P(X =1) = (0,0005)1 (0,9995)999 = 0,3034
1!(1 000 −1)!
1 000!
P(X =2) = (0,0005)2 (0,9995)998 = 0,07581
2!(1000 −2)!
Luego la probabilidad de que fallen cuando mucho 2 focos, según distribución Binomial
72
Apuntes de clase Estadística General
Luego la mitad del área bajo la curva se encuentra a un lado (o por encima del valor
central) y la otra mitad al otro lado (o por debajo).
3.- La curva normal decrece uniformemente en ambas direcciones a partir del valor central.
Es asintótica, lo cual significa que la curva se acerca cada vez más al eje X, pero nunca
llega a tocarlo. Esto es, los puntos extremos de la curva se extienden indefinidamente en
ambas direcciones.
0,5 0,5
50% 50%
%
𝜇 = es la media de la distribución
1.- Aproximadamente el 68% del área bajo la curva normal está dentro más una y menos
una desviación estándar respecto de la media. Esto se expresa así µ ± 1σ
2.-Aproximadamente el 95,5 % del área bajo la curva normal está dentro más dos y menos
dos desviaciones estándar respecto de la media. Esto se expresa así µ ± 2σ
3.- Aproximadamente el 99,7 % del área bajo la curva normal está dentro más tres y menos
tres desviaciones estándar respecto de la media. Esto se expresa así µ ± 3σ
73
Apuntes de clase Estadística General
Estos conceptos pueden expresarse de manera algo distinta: el área bajo la curva normal
dentro de más y menos una desviación estándar respecto de la media, es 0,6826. El área
dentro de más y menos dos desviaciones estándar respecto de la media, es de 0,9544. El
área dentro de tres desviaciones estándar respecto de la media vale 0,9974
Ejemplo
Solución:
𝑿−𝝁
a.- Z=
𝝈
4,4 − 3,9
Z=
0,35
Z= 1,43 A (0,4263)
74
Apuntes de clase Estadística General
𝑿−𝝁
b.- Z=
𝝈
3,2 − 3,9
Z=
0,35
Z= −2 A (0,4773)
𝑿−𝝁
c.-- Z=
𝝈
3,0 − 3,9
Z=
0,35
Z= −2,57 A (0,4949)
P(X≥ 3) = 99,49%
Ejemplo
Una máquina expendedora de gaseosa se ajusta para servir 7,00 onzas de líquido por vaso.
La desviación estándar es de 0,10 onzas ¿Cuál es la probabilidad de que la máquina sirva:
Distribución de probabilidad que consta de todas las posibles medias de las muestran de un
determinado tamaño de muestra de la población y la probabilidad de ocurrencia asociada
con cada media muestral
Teorema:
75
Apuntes de clase Estadística General
𝜇𝑋 = 𝜇
n
(X i )2
𝜎𝑥2 = i 1
𝜎𝑥 = √𝜎𝑥2
𝜎
Pero: 𝜎𝑋 = Para una población infinita
√𝑛
𝜎 𝑁 −𝑛
𝜎𝑋 = X√ Para una población finita
√𝑛 𝑁 −1
𝑁 −𝑛
√ = Factor de corrección finita
𝑁 −1
OBSERVACION
𝜎 𝑛
Se puede usar 𝜎𝑋 = en una población finita, pero siempre y cuando <0,05
√𝑛 𝑁
Ejemplo
El tiempo de servicio de los empleados (POBLACION) a nivel de ejecutivo de la empresa
“LA PONDEROSA” es:
Años de
Nombre
servicio
JUAN 20
DIANA 22
ROSA, 24
EDUARDO 26
HUGO 28
n
X i
2
20+22+24+26+28
𝜇 = i 1
= =24
N 5
n
(X i )2 (20−24)(22−24)(24−24)(26−24)(28−24)
𝜎2 = i 1
= =8
N 5
𝜎 = √𝜎 2 = √8 = 2,8284
Ahora
a.-Formar muestras tamaño 2
76
Apuntes de clase Estadística General
Solución:
Años de Media Años de Media
servicio (n muestral servicio muestral
= 2) 𝒙 (n = 2) 𝒙
20, 22 21 22, 24 23
20, 26 23 22, 28 25
20, 24 22 26, 24 25
20, 28 24 26, 28 27
22, 26 24 24, 28 26
∑𝑥 21+23+⋯….+26
𝑥= = = 24
𝑛 16
Luego: 𝝁 = 𝒙
(X
i 1
i µ )2
𝝈𝒙 =
N
(21−24)2 + (23 −24)2 +⋯………..+(26 −24)2
𝝈𝒙 = √ = √3 = 1,7320
10
𝜎 𝑁 −𝑛
𝜎𝑋 = X√𝑁 −1 Para una población finita
√𝑛
2,8284 5 −2
𝜎𝑋 = X√
√2 5 −1
𝝈𝑿 = 𝟏, 𝟕𝟑𝟐𝟎
𝑿 – 𝝁𝑿
Z=
𝝈𝒙
Ejemplo:
77
Apuntes de clase Estadística General
Se sabe que la producción de pollos de una determinada granja tiene un peso promedio de
3,50 Kg. Y una desviación estándar de 0,18 Kg. ¿Cuál es la probabilidad de que una muestra
aleatoria de 100 pollos de esta población pesen entre 3,53 y 3,56 Kg?
𝑿 – 𝝁𝑿 𝑋 – 𝜇𝑋
Z= = 𝜎
𝝈𝒙 ⁄ 𝑛
√
3,56 −3,50
𝒁= 0,18 = 3,33
⁄
√100
Z3,33 A (0,4996)
𝑿 – 𝝁𝑿 3,53 −3,50
Z= 𝝈𝒙
= 0,18 =
⁄
√100
1,66
Z1,66 A (0,4515)
Ejemplo
𝑋 – 𝜇𝑋 𝑋 – 𝜇𝑋
Z= = 𝜎
𝜎𝑥
√𝑛
2,700 −2,800
Z= 280 = − 2,14
√36
𝒁𝟐,𝟏𝟒 A( 0,4838)
Ejemplo
78
Apuntes de clase Estadística General
𝑿 – 𝝁𝑿 𝑋 – 𝜇𝑋
Z= = 𝜎
𝝈𝒙 ⁄ 𝑛
√
1,60 −1,50
𝒁= 0,25 = 2,40
⁄
√36
Z2,40 A (0,4918)
𝑵−𝒏
√
𝑵−𝟏
𝝈 𝑵 −𝒏
𝝈𝒙 = √
√𝒏 𝑵 − 𝟏
Ejemplo
𝑋 – 𝜇𝑋 𝑋 – 𝜇𝑋
Z= =
𝜎𝑥 𝜎 𝑁 −𝑛
√
√𝑛 𝑁 −1
1,60 −1,50
Z= = 2,51
0,25 400 −36
√
√36 400 −1
𝒁𝟐,𝟓𝟏 A( 0,4940)
Ejemplo:
Un fabricante declara que la duración de las bujías que él fabrica sigue una distribución
normal con media de 36 000 Km y una desviación estándar de 4 000 Km Para una muestra
79
Apuntes de clase Estadística General
aleatoria de dieciséis bujías se obtuvo una duración media de 34 500 Km. ¿Cuál es la
probabilidad de obtener una media muestral tan pequeña como esta o menor?
Es una distribución probabilística que consta de todos los valores posibles que pueda
tomar 𝑝 de un tamaño de muestra dado, junto a su probabilidad de ocurrencia.
𝜇𝑝̂ =P= 𝜋
𝑃𝑄
𝜎𝑝̂ ═ √
𝑛
𝜇𝑝̂ =P= 𝜋
𝑃𝑄 𝑁−𝑛
𝜎𝑝 = 𝜎𝑝̂ = √ √
𝑛 𝑁 −1
𝑁−𝑛
√ Recibe el nombre factor de corrección para una población finita
𝑁 −1
𝑝 −𝜋 𝑝 −𝜋
Z= =
𝜎𝑝 𝜋(1−𝜋)
√
𝑛
Ejemplo
Se tiene que el 4% de las piezas producidas por cierta maquina es defectuosa, ¿Cuál es la
probabilidad de que en un grupo de 200 piezas, el 3% o más sean defectuosas.?
𝑝 −𝜋 𝑝 −𝜋
Z= =
𝜎𝑝
√𝜋(1−𝜋)
𝑛
0,03 −0,04
Z=
0,04 𝑥 0,96
√
200
𝑍 = −0,71
80
Apuntes de clase Estadística General
Z (0,71) = A (0,2612)
Ejemplo
Se desea estudiar una muestra de 49 personas para saber la proporción de las personas
mayores de 40 años, sabiendo que la proporción en la población es 0,4. ¿Cuál es la
probabilidad de que la proporción en la muestra sea menor de 0,5?
𝑝 −𝜋 𝑝 −𝜋
Z= =
𝜎𝑝
√𝜋(1−𝜋)
𝑛
0,5 −0,4
Z= = 1,43
0,4 𝑥 0,6
√
49
Z (1,43) = A (0,4236)
Ejemplo
Cuarenta y seis por ciento de los sindicatos del país están en contra de comercializar con la
China Continental; ¿Cuál es la probabilidad de que una encuesta a 100 sindicatos muestre
que más del 52% tenga la misma posición?
𝑝 −𝜋 𝑝 −𝜋
Z= 𝜎
𝑝
=
√𝜋(1−𝜋)
𝑛
0,52 −0,46
Z= = 1,21
0,44 𝑥 0,54
√
100
Z (1,21) = A (0,3869)
Ejemplo
Se ha estimado que el 43% de los Ingenieros Agrónomos consideran que es muy importante
que se imparta el curso de Ética en la Facultad de Agronomía para inculcar valores morales
a los estudiantes. Halle la probabilidad de que más de la mitad de los 80 Ingenieros
Agrónomos de una muestra opinen de este modo.
81
Apuntes de clase Estadística General
(𝑋 1 − 𝑋2 ) − (𝜇1 −𝜇2 )
Z=
𝜎 2𝜎 2
√ 1+ 2
𝑛1 𝑛2
Se puede aplicar esta distribución cuando no se conocen las varianzas poblacionales las
cuales pueden ser sustituidas por variancias muestrales siempre que sean mayores de 30.
La fórmula será:
Ejemplo
1.- Se obtiene una muestra aleatoria de 100 elementos de una población normal que tiene
media 50 y desviación estándar 8. Luego se selecciona otra muestra aleatoria de 400
elementos de una población normal, que tiene media 40 y desviación estándar 12.
Encontrar la probabilidad de que
SOLUCION
𝜇𝑋 = 50 𝜇𝑌 = 40 𝜎𝑋 = 8 𝜎𝑌 = 12 𝑛1 = 100 𝑛2 = 400
82
Apuntes de clase Estadística General
8 − (50 −40)
Z= = −2
64 144
√ +
100 400
𝑍=2 A(0,4772)
12 − 10
b.- Z= = 2
64 144
√ +
100 400
𝑍=2 A(0,4772)
−12 − 10
Z= = −22
64 144
√ +
100 400
𝑍2 = −22 A(0,5)
Luego
Ejemplo
83
Apuntes de clase Estadística General
(X − Y) − (μX − μY )
Z=
σ2X σ2Y
√ +
nX nY
𝑍1,75 = A(0,4599)
𝑍11,82 = A(0,4999)
A= 0,4999+0,4599=0,9598
P = 1−0,9598= 0,0402=4,01%
Ejemplo
(𝑿 − 𝒀) − (𝝁𝑿 − 𝝁𝒀 )
𝒁=
𝝈𝟐 𝝈𝟐
√ 𝒙 + 𝒚
𝒏𝒙 𝒏𝒚
5 − (0)
Z= = 1,12
144 576
√ + 36
36
𝑍1,12 = A(0,3686)
P = 0,5−0,9598= 0,1314=13,14%
84
Apuntes de clase Estadística General
(𝑝1 − 𝑝2 ) − ( 1 2 )
Z=
𝑃 𝑄 𝑃2 𝑄2
√ 1𝑛 1 + 𝑛
1 2
Ejemplo
(𝑝1 – 𝑝2 ) – ( 1 2 )
Z=
𝑃1 𝑄1 𝑃2 𝑄2
√ 𝑛 + 𝑛
1 2
0,01 −0,02
𝑍= = − 1,33
(0,07 ×0,93) (0,05 ×0,95)
√ +
2000 2000
Z= −1,33 A (0,4082)
−0,01 −0,02
Z= =−4
(0,07×0,93) (0,05 ×0,95)
√ +
2000 2000
Z= −4 A (0,5)
Ejemplo
Consideremos dos máquinas que producen un determinado artículo; la primera produce por
término medio un 14% de artículos defectuosos , en tanto que otra, produce el 20% de
artículos defectuosos; si se obtienen muestras de 200 unidades en la primera y 100 unidades
en la segunda,¿Cuál es la probabilidad de que difiera A de B en 8% o más?
(𝑝1 – 𝑝2 ) – ( 1 2 )
Z=
𝑃1 𝑄1 𝑃2 𝑄2
√ 𝑛 + 𝑛
1 2
85
Apuntes de clase Estadística General
0,08 −(−0,06)
𝑍= = 2,98
(0,14)(0,86) (0,2)(0,8)
√ + 100
200
Z= 2,98 A (0,4986)
DISTRIBUCION DE t
Esta distribución se expresa en forma acampanada y simétrica, pero más achatada y con
más área en los extremos, es decir las áreas que corresponden a las regiones críticas o de
rechazo. Se puede considerar que no hay una distribución de “t”, sino más bien una familia
de distribuciones “t” dado que las deviaciones estándar se modifican a medida que se va a
aumentando el tamaño de la muestra, acercándose a la normal.
Grados de libertad, esta expresión fue introducida por Fisher, dice que los grados de
libertad de un conjunto de observaciones, están dados por el número de valores que pueden
ser asignados arbitrariamente, antes de que el resto de las variables queden completamente
determinadas. Ejemplo: Si tengo cuatro valores: 8 +10 + 6 + 20 = 44, se observa que puedo
asignar tres (3) valores arbitrariamente: 16 + 4 + 10 +14= 44, pero el cuatro debe ser 14 y
no lo puedo asignar libremente pues la suma debe ser 44. Por la tanto 𝜈 = n – 1 = 4 - 1 = 3.
“𝜈” se lee “nu” o “niu” y se emplea para simbolizar los grados de libertad
Toda inferencia que se haga sobre una población tendrá necesariamente, que basarse en
estadísticos muestrales, esto es, en funciones de la información muestral. La elección
apropiada de estos estadísticos dependerá de cuál sea el parámetro de interés de la
población. El verdadero parámetro será desconocido, y un objetivo será estimar su valor.
PARÁMETROS Y ESTADÍSTICOS
86
Apuntes de clase Estadística General
ESTIMACIÓN PUNTUAL
Se dice que:
Salario ¿Programa de
anual ($) Adiestramiento gerencial?
𝒙𝟏 9 094,3 Si
𝒙𝟐 3 263,9 Si
𝒙𝟑 9 643,5 Si
𝒙𝟒 9 984,9 Si
𝒙𝟓 7 621,6 No
𝒙𝟔 5924,0 Si
𝒙𝟕 9 092,3 No
𝒙𝟖 1 404,4 Si
𝒙𝟗 3 957,7 No
𝒙𝟏𝟎 5 109,7 No
n
87
Apuntes de clase Estadística General
(X
i 1
i X )2
S2 = = 9.09
n 1
S ═√9,09 = 3.01
4
𝑃= = 0,4
10
Luego para una muestra de 10 trabajadores de una fábrica, el estimado puntual de 𝝁 es
de $ 6 509.63 nuevos soles, el de σ es de 3.01 y el de p es 0,4
INSESGO:
EFICIENCIA.
Suponga que se puede usar una muestra aleatoria simple de “n” elementos para obtener
dos estimadores puntuales del mismo parámetro poblacional. En este caso, preferiríamos
usar el estimador puntual con la menor desviación estándar, porque tiende a proporcionar
estimados más cercanos al parámetro poblacional. Se dice que el estimador puntual con la
menor desviación estándar tiene una mayor eficiencia relativa que el otro.
CONSISTENCIA.
Supongamos que tenemos una muestra aleatoria de “n” observaciones procedentes de una
población con distribución normal con una media µ y una varianza . Si es conocida y
el valor observado de la media muestral es , entonces el intervalo de confianza del 100 (1-
para la media poblacional, viene dada por:
{ 𝑿 − 𝐙𝝈𝒙 ≤ μ ≤ 𝑿 + 𝐙 𝝈𝒙}= 1- ∝
88
Apuntes de clase Estadística General
ERROR MUESTRAL
Para el caso en el que la media de una muestra estima a una media poblacional, el error
muestral es:
E = |𝑿 − 𝝁|
Ejemplo.-
1.- Un proceso de envase de bolsas de azúcar refinada. El peso del contenido de estas
bolsas tiene una distribución normal con desviación estándar de 15 gramos. Los
contenidos de una muestra aleatoria de 25 bolsas tienen un peso medio de 100 gramos.
Calcule un intervalo de confianza del 95% para el verdadero peso medio de todas las
bolsas de azúcar producidas por el proceso.
𝜎 𝜎
{𝑥 − 𝑧 ≤ 𝝁 ≤ 𝑥+ 𝑧 } = 1– α
√𝑛 √𝑛
15 15
{100– 1,96
√25
≤ 𝜇 ≤ 100 + 1,96 √25
}=0,95
89
Apuntes de clase Estadística General
𝑺 𝑺
{𝑿– 𝐙 𝒏 ≤ 𝝁 ≤ 𝒙 +𝐙 }= 1–α
√ √𝒏
1-- Se extrajo una muestra aleatoria de 172 estudiantes de Agronomía y se les pidió que
evaluasen unas determinadas condiciones de trabajo en una escala de 1 (no importante)
a 5 (extremadamente importante). La “seguridad de trabajo “recibió una calificación
media de 4,38 con una desviación estándar muestral de 0,70. Calcule un intervalo de
confianza del 99% para la media poblacional.
𝑺 𝑺
{𝑿– 𝐙 𝒏 ≤ 𝝁 ≤ 𝒙 +𝐙 }= 1–α
√ √𝒏
0,70 0,70
{4.38 – 2.576 ≤ 𝜇 ≤ 4.38 + 2.576 } = 0.95
√172 √172
Solución
𝑠 =2,30 n= 60 𝑋 = 8,60
𝒔 𝑠
{𝑋 − 𝑍(1 − 𝛼⁄ ≤ 𝝁 ≤ 𝑋 + 𝑍(1 − 𝛼⁄ }=1−𝛼
2) √𝒏 2) √𝑛
2,30 2,30
{8,60 − 2,576 ≤ 𝝁 ≤ 8,60 + 2,576 } = 0,99
√60 √60
90
Apuntes de clase Estadística General
Una estimación puntual para una proporción poblacional se obtiene dividiendo el número de
éxitos de una muestra entre el número total muestreado.
Mientras que para encontrar los intervalos de confianza debemos tener en cuenta lo
siguiente:
{𝒑 – 𝐳 𝝈𝒑 ≤ 𝝅 ≤ 𝒑 + 𝒛 𝝈𝒑 } = 1 –∝
Como 𝜋 no se conoce
𝑝(1 − 𝑝)
𝜎𝑝 = √
𝑛
Donde
𝑧∝ =Valor asignado por el nivel de confianza
= = p= es la proporción muestral
n = es el tamaño de la muestra
Ejemplo.-
1.- En una muestra aleatoria de 900 votantes, el 55% prefiere al candidato demócrata de
presidente. Halle un intervalo de confianza aproximado para la proporción de todos los
votantes que prefieren al candidato demócrata con un nivel de confianza del 90%
{𝒑 – 𝐳 𝝈𝒑 ≤ 𝝅 ≤ 𝒑 + 𝒛 𝝈𝒑 } = 1 –∝
𝑝(1−𝑝) 0,55(1−0,55)
𝜎𝑝 = √ =√ ═ 0.0165
𝑛 900
{0.5229 ≤ 𝜋 ≤ 0,5771 } = 1 – ∝
2.-Se realizó una investigación de mercado para estimar la proporción de amas de casa que
puedan reconocer la marca de un limpiador con base en la forma y el color del recipiente.
De 1400 personas 420 pudieron reconocer (identificar) la marca del producto. Si se utiliza
el grado de confianza del 99% ¿Cuál serán los intervalos de confianza?
91
Apuntes de clase Estadística General
{𝒑 – 𝐳 𝝈𝒑 ≤ 𝝅 ≤ 𝒑 + 𝒛 𝝈𝒑 } = 1 –∝
420
P = 1400 = 0,30
𝑝(1−𝑝) 0,30(1−0,30)
𝜎𝑝 = √ =√ ═ 0.0122
𝑛 1400
{0.2686≤ 𝑃 ≤ 0,3314 } = 1 –∝
3.- María Tang considera ser candidata para la alcaldía de su pueblo natal. Antes de
presentar su candidatura, decide realizar un sondeo de electores en dicho lugar. Una
muestra de 400 reveló que 300 ciudadanos la apoyarían en la elección. Calcule el
intervalo de confianza del 99% para la proporción de votantes en la población que
apoyaría a la Sra., Tang.
Solución:
300 100
n= 400 p= = 0,75 q= = 0,25
400 400
𝑝 (1 −𝑝) 𝑝 (1−𝑝)
{ p − 𝑍(1 − 𝜎) √ 𝑛
≤ 𝝅 ≤ P + 𝑍(1 − 𝜎) √ 𝑛
} =1– 𝛼
2 2
= 0,99
{ 0,75 − 0,056 ≤ 𝝅 ≤ 0,75 + 0,056} = 0,99
4.- De 900 consumidores que se entrevistaron, 414 señalaron que están muy entusiasmados
con un nuevo proyecto de decoración para el hogar. Elabore el intervalo de confianza del
99% para la proporción de la población.
Solución:
414 486
n= 400 p = 900 = 0,46 q = 900 = 0,54
𝑝 (1 −𝑝) 𝑝 (1−𝑝)
{ p − 𝑍(1 − 𝜎) √ 𝑛
≤ 𝝅 ≤ P + 𝑍(1 − 𝜎) √ 𝑛
} =1– 𝛼
2 2
92
Apuntes de clase Estadística General
5.- Un banco tiene 650 clientes con cuenta de cheque. Una muestra reciente de 50 de ellos
mostró que 26 poseen la tarjeta de crédito que maneja el banco. Fije un intervalo de
confianza del 99% para la proporción de clientes con cuenta de cheques que disponen
de la tarjeta de crédito citada.
Solución:
26 24
n= 650 p = 50 = 0,52 q = 50 = 0,48
𝑝 (1 −𝑝) 𝑝 (1−𝑝)
{ p − 𝑍(1 − 𝜎) √ 𝑛
≤ 𝝅 ≤ P + 𝑍(1 − 𝜎) √
𝑛
} =1– 𝛼
2 2
Las producciones promedio en una planta química que usa materias primas suministradas
por dos proveedores diferentes.
Pero si n1 y n2 son grandes (mayores de 30) y 𝝈𝟐𝟏 , 𝝈𝟐𝟐 no se conocen, el estimador del
estadístico será:
93
Apuntes de clase Estadística General
En caso de que las muestras sean grandes (mayores de 30) y 𝜎12 , 𝜎22 no se conocen, el
intervalo se podrá calcular de la siguiente manera:
𝒔𝟐 𝒔𝟐𝟐 𝒔𝟐 𝒔𝟐𝟐
{(𝐱𝟏 − 𝐱𝟐 ) – 𝐳 √𝒏𝟏 + 𝒏𝟐
≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝐱𝟏 − 𝐱𝟐 ) + 𝐳 √𝒏𝟏 + 𝒏𝟐
}= 1-𝜶
𝟏 𝟏
Ejemplo:
LLANTA 1 LLANTA 2
𝑋1 = 26400 𝑀𝑖𝑙𝑙𝑎𝑠 𝑋2 = 25100 𝑚𝑖𝑙𝑙𝑎𝑠
𝑆12 = 144000 𝑆22 = 1960000
Estime (µ1 - µ2), la diferencia en la media de millas hasta el completo desgaste, usando un
intervalo de confianza del 99%. ¿Hay diferencia en el promedio de calidad de desgaste para
los dos tipos de llantas?
Solución:
𝜎12 𝜎22
El error estándar = √ +
𝑛1 𝑛2
𝑠12 𝑠12
Que se puede estimar como = √ +
𝑛1 𝑛2
1440 000 1960 000
=√ + = 184,4 millas
100 100
𝑠2 𝑠22 𝑠2 𝑠2
{(x1 − x2 ) – z √𝑛1 + ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (x1 − x2 ) + z √𝑛1 + 𝑛2 }=1-𝛼
1 𝑛2 1 2
94
Apuntes de clase Estadística General
𝑃1 𝑄1 𝑃2 𝑄2
El error estándar es=√ +
𝑛1 𝑛2
𝑝1 𝑞1 𝑝2 𝑞2
Que se estima como = √ +
𝑛1 𝑛2
𝒑𝟏 𝒒𝟏 𝒑𝟐 𝒒𝟐 𝒑𝟏 𝒒𝟏 𝒑𝟐 𝒒𝟐
{(𝒑𝟏 – 𝒑𝟐 ) – 𝐭√ 𝒏𝟏
+ 𝒏𝟐
≤ 𝝅𝟏 − 𝝅𝟐 ≤ (𝒑𝟏 – 𝒑𝟐 ) + 𝐭√ 𝒏𝟏
+ 𝒏𝟐
}= 1 – ∝
Ejemplo:
1.- La propuesta de un bono para la construcción de una escuela será enviada a los votantes
en la siguiente elección municipal. Una parte importante del dinero derivado de esta
emisión de bonos se empleará en construir escuelas en una zona de rápido desarrollo de
la ciudad y lo demás se usará para renovar y actualizar los edificios escolares del resto
de ésta. Para evaluar la viabilidad de la propuesta de un bono, a una muestra aleatoria
de 𝑛1 = 50 residentes de la zona de rápido desarrollo y 𝑛2 = 100 de las otras partes de
la ciudad, se les preguntó si piensan votar por la propuesta. Los resultados se dan a
continuación:
Sección en Resto de
desarrollo la ciudad
Tamaño muestral 50 100
Número a favor de la propuesta 38 65
95
Apuntes de clase Estadística General
(p1 –p2) = 0, 76 – 0, 65 = 0, 11
𝑝1 𝑞1 𝑝2 𝑞2 (0.76)(0,24) (0,65)(0,35)
√ + =√ + = 0, 0770
𝑛1 𝑛2 50 100
𝒑 𝟏 𝒒𝟏 𝒑𝟐 𝒒𝟐 𝒑𝟏 𝒒𝟏 𝒑𝟐 𝒒𝟐
{(𝒑𝟏 – 𝒑𝟐 ) – 𝐙√ + ≤ 𝝅𝟏 − 𝝅𝟐 ≤ (𝒑𝟏 – 𝒑𝟐 ) + 𝐙√ + }=1 –∝
𝒏𝟏 𝒏𝟐 𝒏𝟏 𝒏𝟐
2.- En una muestra al azar de 200 y 300 adolescentes que veían cierto programa de
televisión, 50 adultos y 150 adolescentes dijeron que les gustaba. Hallar los límites de
confianza del 95% para la diferencia de proporción de adultos y adolescentes que ven
televisión.
Solución:
𝑝1 𝑞2 𝑝1 𝑞2 𝑝1 𝑞2 𝑝1 𝑞2
{(𝑝1 − 𝑝2 ) − 𝑧√ + ≤ 𝜋1 − 𝜋2 ≤ (𝑝1 − 𝑝2 ) + 𝑧√ + } = 1−∝
𝑛1 𝑛2 𝑛1 𝑛2
50 150
𝑝1 = 200 = 0,25 𝑝2 = 200 = 0,50
b.- Cuando 𝑛1 𝑦 𝑛2 ≤ 30
Solución:
96
Apuntes de clase Estadística General
𝑝1 𝑞2 𝑝1 𝑞2 𝑝1 𝑞2 𝑝1 𝑞2
{(𝑝1 − 𝑝2 ) − 𝑡√ + ≤ 𝝅𝟏 − 𝝅𝟐 ≤ (𝑝1 − 𝑝2 ) + 𝑡√ + } = 1−∝
𝑛1 𝑛2 𝑛1 𝑛2
16 10
𝑝1 = 26 = 0,62 𝑝2 = 18 = 0,55
Cuando la población bajo estudio tiene una distribución normal, o aproximadamente normal,
pero no se conoce la desviación estándar de la población, y el tamaño de la muestra es
menor de 30, no podemos usar la distribución normal para determinar intervalos de
confianza para la media de la población. En este caso usaremos la distribución t se Student.
𝒙−𝝁
t= 𝑺⁄
√𝒏
97
Apuntes de clase Estadística General
4.- La distribución t es más extendida y menos aguda en el centro, que la distribución Z. Sin
embargo a medida que “n” aumenta la curva de la distribución t se aproxima a la
distribución normal estandarizada.
El intervalo de confianza para la media poblacional usando la distribución t, está dado por:
{𝑥̂ − 𝑡(𝑛−1) 𝑠𝑋 ≤ 𝜇 ≤ 𝑥 + 𝑡(𝑛−1) 𝑠𝑥 } =1−𝛼
𝑆 𝑆
{𝑥̂ − 𝑡(𝑛−1) ≤ 𝜇 ≤ 𝑥 + 𝑡(𝑛−1) } =1−𝛼
√𝑛 √𝑛
Ejemplo.-
1.- Una tienda está interesada en conocer los gastos en prendas de vestir de los estudiantes
universitarios en el primer mes del ciclo académico. La media y la desviación estándar
de una muestra aleatoria de nueve alumnos fueron de $ 15 782 y $ 3889,
respectivamente. Suponiendo que la población sigue una distribución normal, calcule el
intervalo de confianza del 95% para el gasto medio poblacional
{ – t(n-1) 𝑠𝑥 ≤ μ ≤ x + t(n−1) 𝑠𝑥 }= 1 –∝
𝑆 𝑆
{ – t (n−1) ≤ 𝜇 ≤ 𝑋 +𝑡(𝑛−1) } = 1 –∝
√𝑛 √𝑛
3889 3889
{15782–2.3060 ≤ 𝜇 ≤ 15782+2.3060 }=
√9 √9
1−𝛼
{12792.65554≤ 𝜇 ≤ 188771,3446} = 1 –
2.- Una muestra aleatoria de 26 observaciones tiene una media de 65 y una desviación
estándar de 4,2. Se piden los límites de confianza del 95%
{ – t(n-1) 𝑠𝑥 ≤ μ ≤ x + t(n−1) 𝑠𝑥 }= 1 –∝
98
Apuntes de clase Estadística General
𝑆 𝑆
{ – t (n−1) ≤ 𝜇 ≤ 𝑋 +𝑡(𝑛−1) } = 1 –∝
√𝑛 √𝑛
4,2 4,2
{65 − 2,0595 ≤ 𝜇 ≤ 65 + 2,0595 } = 0,95
√25 √25
Solución:
𝑠 = 0,86 n= 22 𝑋 = 15,2
𝑆 𝑆
{𝑋 − 𝑡(1 − 𝛼⁄ ≤ 𝝁 ≤ 𝑋 + 𝑡(1 − 𝛼⁄ }=1−𝛼
2)(𝑛−1) √𝑛 2)(𝑛 −1) √𝑛
0,86 0.86
{15,2 − 2,08 ≤ 𝝁 ≤ 15,2 + 2,08 } = 0,95
√22 √22
4.- Una muestra de 25 llamadas a una red de amigos psíquicos revela un costo promedio de
$ 23,87. Si la desviación estándar es $ 9,56 ¿Cuál es la estimación con un intervalo del
98% para su costo promedio de todos los que llaman para conocer su futuro?
Solución:
𝑠 = 9,56 n= 25 𝑋 = 23,87
𝑆 𝑆
{𝑋 − 𝑡(1 − 𝛼⁄ ≤ 𝝁 ≤ 𝑋 + 𝑡(1 − 𝛼⁄ }=1−𝛼
2)(𝑛−1) √𝑛 2)(𝑛 −1) √𝑛
9,56 9,56
{23,87 − 2,492 ≤ 𝝁 ≤ 𝟐𝟑, 𝟖𝟕 + 2,492 } = 0,98
√25 √25
5.- Los pesos de 25 paquetes enviados a través de SERPOST tuvieron una media de 3,7
libras y una desviación estándar de 1,2 libras. Halle el intervalo de confianza del 95% para
estimar el peso promedio de todos los paquetes. Los pesos de los paquetes están
distribuidos normalmente.
Solución:
99
Apuntes de clase Estadística General
𝑠 = 1,2 n= 25 𝑋 = 3,7
𝑆 𝑆
{𝑋 − 𝑡(1 − 𝛼⁄ ≤ 𝝁 ≤ 𝑋 + 𝑡(1 − 𝛼⁄ }=1−𝛼
2)(𝑛−1) √𝑛 2)(𝑛 −1) √𝑛
1,2 1,2
{3,7 − 2,064 ≤ 𝝁 ≤ 𝟐𝟑, 𝟖𝟕 + 2,064 } = 0,95
√25 √25
(𝒏𝟏 −𝟏)𝑺𝟐 𝟐
𝟏 +(𝒏𝟐 −𝟏)𝑺𝟐 𝟏 𝟏 (𝒏𝟏 −𝟏)𝑺𝟐 𝟐
𝟏 +(𝒏𝟐 −𝟏)𝑺𝟐 𝟏 𝟏
{(𝐱𝟏 − 𝐱𝟐 ) – 𝐭 √ √𝒏 + 𝒏 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝐱𝟏 − 𝐱𝟐 ) + √ √𝒏 + 𝒏 } =1−𝜶
𝒏𝟏 +𝒏𝟐 −𝟐 𝟏 𝟐 𝒏𝟏 +𝒏𝟐 −𝟐 𝟏 𝟐
Ejemplo
En un experimento llevado a cabo para medir la efectividad de dos abonos en dos parcelas,
de 10 hectáreas cada una cultivada con maíz, se obtuvieron las siguientes medias, para la
primera parcela abonada con el producto A, 81,7 Kg. por hectárea; en la segunda parcela,
88,3 Kg. por hectárea con el B y las desviaciones estándar de 0,7 y 0,8 respectivamente.
¿Cuáles son los límites de confianza para la diferencia de los promedios con una
probabilidad de 95%?
(𝒏𝑿 −𝟏)𝑺𝟐 𝟐
𝑿 +(𝒏𝒀 −𝟏)𝑺𝒀 𝟏 𝟏 (𝒏𝑿 −𝟏)𝑺𝟐 𝟐
𝑿 +(𝒏𝒀 −𝟏)𝑺𝒀 𝟏 𝟏
{(𝑿 − 𝒀) – 𝐭 √ √𝒏 + 𝒏 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ (𝐱𝟏 − 𝐱𝟐 ) + 𝐭√ √𝒏 + 𝒏 } =1−𝜶
𝒏𝑿 +𝒏𝒀 −𝟐 𝑿 𝒀 𝒏𝑿 +𝒏𝒀 −𝟐 𝑿 𝒀
9(0,49)+9(0,64) 9(0,49)+9(0,64)
{(81,7 − 88,3) − 2,10√ 10+10−2
≤ 𝝁𝑿 − 𝝁𝐘 ≤ (81,7 − 88,3) + 2,10√ 10+10−2
} = 1−∝
{−7,31 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ −𝟓, 𝟖𝟗 } = 0, 95
100
Apuntes de clase Estadística General
𝟏𝟔 10
p1 = 𝟐𝟔 = 0,62 𝑝2 = 18 = 0,55
t (26+18−2)(0,05) = 2,018
𝑝1 𝑞1 𝑝2 𝑞2 𝑝1𝑞1 𝑝2 𝑞2
{(𝑝1 – 𝑝2 )– t√ 𝑛1
+
𝑛2
≤ 𝝅𝟏 − 𝝅𝟐 ≤ (𝑝1 – 𝑝2 ) + t√
𝑛1
+
𝑛2
}=1–∝
{−0,24 ≤ 𝝅𝟏 − 𝝅2 ≤ 0,38}
Solución:
𝑝1 𝑞2 𝑝1 𝑞2 𝑝1 𝑞2 𝑝1 𝑞2
{(𝑝1 − 𝑝2 ) − 𝑡√ + ≤ 𝝅𝟏 − 𝝅𝟐 ≤ (𝑝1 − 𝑝2 ) + 𝑡√ + } = 1−∝
𝑛1 𝑛2 𝑛1 𝑛2
16 10
𝑝1 = = 0,62 𝑝2 = = 0,55
26 18
Cuando una variable aleatoria sigue una distribución de Chi cuadrado con (n-1). Este
resultado es clave para construir un intervalo de confianza para la varianza poblacional
cuando se toman muestras de una población
(𝒏−𝟏)𝑺𝟐
𝑿𝟐 =
𝝈𝟐
101
Apuntes de clase Estadística General
(𝒏 − 𝟏)𝑺𝟐 𝟐
(𝒏 − 𝟏)𝑺𝟐
≤ 𝝈 ≤
𝒙𝟐 (𝒏−𝟏)𝜶⁄ 𝒙𝟐 (𝒏−𝟏)𝟏−𝜶⁄
𝟐 𝟐
Ejemplo
1.- Un fabricante quiere estimar la variabilidad de los niveles de impurezas de los envíos de
materia prima de un determinado proveedor. Extrae para ello una muestra de quince
envíos y comprueba que la desviación estándar muestral en la concentración de los
niveles de impurezas es de 2,36%. Supóngase que la población es normal.
Solución
a.- n═ 15 g.l.═ 14
═0.05
(𝒏 −𝟏)𝑺𝟐 (𝒏−𝟏)𝑺𝟐
≤ 𝝈𝟐 ≤
𝒙𝟐 (𝒏−𝟏)𝜶⁄ 𝒙𝟐 (𝒏−𝟏)𝟏−𝜶⁄
𝟐 𝟐
(14)(2,36) (14)(2,36)
≤ 𝜎2 ≤
26,12 5,63
2.99 13.85
Por lo tanto, diremos que el intervalo de confianza del 95% para la variabilidad de
impurezas discurre entre 2.99% y 13.85%
b.- El intervalo de confianza del 99% para la varianza poblacional será más ancho
(𝑛 −1)𝑆 2 (𝑛 −1)𝑆 2
{𝑋 2 ≤ 𝝈𝟐 ≤ } = 1 –𝛼
𝛼 𝑋 2𝛼
(1 − ,𝑛−1) ( ,𝑛−1)
2 2
102
Apuntes de clase Estadística General
3.-Un trabajador tiene como objetivo cubrir con una capa de plástico una superficie metálica.
Se extrae una muestra aleatoria de nueve observaciones correspondientes al grosor de
dicha capa de plástico. Los valores obtenidos (en milímetros) son los siguientes:
19,8 21,2 18,6 20,4 21,6 19,8 19,9 20,3 20,8
Suponiendo que la población es normal, halle un intervalo de confianza del 90% para la
varianza poblacional
Solución:
(𝑛 −1)𝑆 2 (𝑛 −1)𝑆 2
{𝑋 2 ≤ 𝝈𝟐 ≤ } = 1 –𝛼
𝛼 𝑋 2𝛼
(1 − ,𝑛−1) ( ,𝑛−1)
2 2
(9 −1)0,7875 (9 −1)0,7875
{ 2 ≤ 𝝈𝟐 ≤ } = 0,90
𝑋(0,975 ,8) 𝑋(20,025,8)
(8)0,7875 (8)0,7875
{ ≤ 𝝈𝟐 ≤ } = 0,90
15,51 2,73
Problema VARIANCIA
No importa el tamaño de
Muestra grande Muestra pequeña
la muestra
n> 30 n< 30
Se utiliza Z
Se utiliza Z Se utiliza t
𝑋 −𝑌 𝑿 −𝒀
z= 𝑋 −𝑌 𝑡=
z= 𝟐 𝟐
2 𝜎2 √ 𝑺𝒄 + 𝑺𝒄
√𝜎𝑥 + 𝑦 2 𝑆2 𝒏𝟏 𝒏𝟐
𝑛1 𝑛2 √ 𝑆𝑥 +
𝑦
𝑛1 𝑛2 ∑(𝒙 − 𝒙)𝟐 + ∑(𝒚 − 𝒚)𝟐
UE ES UNA MUESTRA PROBABILISTICA? 𝑺𝟐𝒄 =
𝒏𝟏 + 𝒏𝟐 − 𝟐
103
Apuntes de clase Estadística General
MUESTRA PROBABILÍSTICA.-
Muestra que se selecciona de modo que cada integrante de la población en estudio tenga
una probabilidad conocida (no igual a cero) de ser incluido en la muestra
Cuando se quiere determinar el tamaño de una muestra se debo tomar en cuenta los
siguientes factores: el tipo de muestreo, el parámetro a estimar el error muestral admisible,
la variancia poblacional.
Parámetro.- es una medida de resumen que describe una característica de toda una
población
Estadístico.- es una medida de resumen que se calcula para describir una característica de
la muestra
ERROR DE MUESTREO
NIVEL DE CONFIANZA
104
Apuntes de clase Estadística General
𝒁𝟐 𝝈 𝟐 𝒁𝟐 𝝈 𝟐
n═ 𝟐 ═
(𝑿−𝝁) (𝒆)𝟐
Donde:
Z = Puntuación de acuerdo a α
𝑥 = Promedio muestral
µ = Promedio de población
𝑥 − 𝜇 = e = error
Ejemplo
1.- El gerente de personal de una empresa grande desea estimar, con una confianza del
95%, el tiempo promedio de capacitación que recibieron los empleados de la compañía y
desea que el error de estimación no rebase la 0,5 media hora (30 minutos): Con base en
resultados de estudios anteriores, estima que la desviación estándar del tiempo de
capacitación de los empleados es de 3 horas .Cual será el tamaño de muestra para el
estudio.
𝑍2 𝜎2
n═ 2
(𝑋−𝜇)
𝑍2𝜎2 1,962 32
n═ (𝑒)2
= = 138,30
0,52
2.-Una famosa cadena de hoteles desea desarrollar un intervalo de confianza del 99% para
estimar el número promedio de habitaciones ocupadas cada noche en sus sucursales
de toda la nación. ‘¿Cuántas noches deben incluirse en la muestra si se puede tolerar
un error de 50 habitaciones y una muestra piloto revela una desviación estándar de 165
habitaciones?
𝑍2𝜎2
n= 2
(𝑋−𝜇)
2,582 𝑥 1652
n= = 73 noches
502
𝑁𝑍 2 𝜎 2
n=
𝑒 2 (𝑁 −1)+ 𝑍 2 𝜎 2
105
Apuntes de clase Estadística General
Ejemplo
Un gerente de personal de una empresa que tiene 3 000 empleados desea estimar el tiempo
promedio que les lleva a sus trabajadores trasladarse entre sus casas y la empresa. Desea
construir un intervalo de confianza de 95% y que la estimación esté dentro de un minuto
alrededor de la media verdadera: a través de una muestra piloto se sabe que la varianza de
los tiempos es de 30 minutos. Determine el tamaño de la muestra que se requiere para la
estimación.
𝑁𝑍 2 𝜎 2
n=
𝑒 2 (𝑁 −1)+ 𝑍 2 𝜎 2
3000(1,96)2 (30)
n= = 111,02
12 (3000 −1)+(1,96)2 (30)
a.- Para caso de estimar una proporción de sujetos que posee una característica a través
de estudios previos
𝒛𝟐 𝒑𝒒
n═
(𝒑−𝑷)𝟐
Donde:
Z = Puntuación de acuerdo a α
P = porcentaje estudiado
q = 100 - p
p – P = e = error permitido
Ejemplo:
¿Cuántos sujetos debe tener una muestra si se desea estimar la proporción de sujetos que
opinan de una determinada manera al nivel de confianza del 99% y un error de estimación
del 5% sabiendo que p es el 25%?
z2 pq
n═
(p−P)2
106
Apuntes de clase Estadística General
2,962 (25)(75)
𝑛= = 657,12 = 658
52
q= 0,50
EJEMPLO:
¿Qué número de sujetos debe tener una muestra si se desea estimar la proporción de
sujetos que posee una determinada característica al nivel de confianza del 99,7% y error
admitido del 2 %?
z2 pq
n═
(p−P)2
2,962 (50)(50)
n= = 5476
22
DETERMINACION DEL TAMAÑO DE MUESTRA PARA POBLACIONES FINITAS
(MENOS DE 100 000 INDIVIDUOS)
𝑍 2 𝑝𝑞𝑁
n=
(𝑝 −𝑃)2 (𝑁 −1) + 𝑍 2 𝑃𝑄
Donde
N = Es el tamaño de la población
Z = Puntuación correspondiente a α
P= Porcentaje estudiado
Q= 100 – P
(p – P) =e = Error permitido
.Ejemplo
Se desea calcular el número de sujetos necesarios para realizar una investigación en una
provincia en la que 60 000 alumnos terminaron tercero de secundaria. Se establece un nivel
de confianza del 95,44% y el margen de error es del 3% Estudios anteriores indican que el
50% de los alumnos del tercero de secundaria optan por la Universidad
𝑍 2 𝑝𝑞𝑁
n═
(𝑝 –𝑃)2 (𝑁 −1) + 𝑍 2 𝑃𝑄
107
Apuntes de clase Estadística General
4 𝑥 50 𝑥 50 𝑥 60000
n═
9(60000−1)+4 𝑥50 𝑥 50
n= 1090,93 =1091
Bibliografía:
- Alvarado Pintado Luis y Agurto Mejía Hugo. (2009) Estadística para Administradores
y Economía con aplicaciones en Excel. Editorial San Marcos E.I.R.L. Perú
- Di Rienza Julio Alejandro, Casanoves Fernando, Gonzales Laura Alicia, Tablada
Elena Margot, Diza María del Pilar, Robledo Carlos Walter, Balzarini Mónica Graciela
(2008) Estadística para las ciencias agropecuarias. Séptima edición. Argentina
- Toma Inafuko Jorge (2014) Estadística aplicada segunda parte. Segunda edición.
Universidad del Pacifico. Lima
- Martínez Bencardino Ciro (2013) Estadística y Muestreo. Décima tercera edición.
Bogotá
108