You are on page 1of 20

PRINCIPIOS DE ESTADSTICA

PROGRAMACIN

INGENIERA EN INNOVACIN Y TECNOLOGA AGRCOLA

OBJETIVOS

INSTITUCIONAL.- Utilizar los fundamentos tericos del pensamiento estadstico


aplicados a problemas relacionados con la actividad agronmica bajo estudio de
casos.

- Comprender los principios de la Estadstica.


- Aportar las herramientas estadsticas bsicas para analizar datos con el fin
de abordar hiptesis.
- Proponer -propiciar- un anlisis crtico de la realidad, en la que la
agronoma est inmersa e implicada, con base en los datos y en el
desarrollo de la Estadstica. Llevar a una reflexin.

INTRODUCCIN

1. La importancia de la Estadstica
2. Fundamento del Mtodo Cientfico Experimental.

UNIDAD I.- Manejo de datos

1.1. Conceptos de estadstica y su clasificacin


1.2. Recopilacin de datos
1.3. Distribucin de frecuencias. Histogramas, polgonos de frecuencia, ojivas.

UNIDAD II.- Medidas de tendencia central

2.1. Medidas de tendencia central para un conjunto de datos y datos agrupados


2.1.1. Media, media ponderada.
2.1.2. Mediana.
2.1.3. Moda.
2.1.4. Relacin entre media, mediana y moda.

UNIDAD III.- Medidas de dispersin

3.1. Medidas de dispersin para un conjunto de datos y datos agrupados.


3.1.1. Rango
3.1.2. Desviacin media.
3.1.3. Varianza.
3.1.4. Desviacin estndar
3.2. Coeficiente de variacin.
3.3. Coeficiente de asimetra de Pearson.

UNIDAD IV.- Distribuciones aleatorias discretas.

4.1. Binomial.
4.1.1. Propiedades: media, varianza y desviacin estndar.
4.2. Poisson.
4.2.1. Propiedades: media, varianza y desviacin estndar.
4.3. Hipergeomtrica.
4.3.1. Propiedades: media, varianza y desviacin estndar.

UNIDAD V.- Distribuciones aleatorias continuas.

5.1. Normal
5.1.1. Propiedades: media, varianza y desviacin estndar.
5.2. Aproximacin de la normal a la binomial.
5.2.1. Propiedades: media, varianza y desviacin estndar.
INTRODUCCIN

- Presentacin y lluvia de ideas. Recoleccin de las ideas.

- Metodologa y evaluacin. Correos y dropbox.

1. Fundamento del Mtodo Cientfico Experimental.


-Contextualizacin. Formacin y contribucin en la ciencia.
- Videos de acercamiento.

2. La importancia de la Estadstica
-Lectura: Los retos de la cultura estadstica. BAT iANERO, Carmen.
Ensayo, mapa conceptual, glosario.
-Aplicaciones de la Estadstica: en la vida diaria, en la Agronoma.
* Participacin en clase e investigacin. Mapa mental.
-Investigacin general sobre la estadstica. (Artculos, noticias)
*Exposicin profesor (despus de compartir lectura y de ambos
trabajos de investigacin).

UNIDAD I.- Manejo de datos

1.1. Conceptos de estadstica y su clasificacin


a) Es la ciencia de los datos. Posibilita su anlisis e interpretacin.
b) Ciencia que se encarga de planear estudios y experimentos, obtener
datos y luego organizar, resumir, presentar, analizar e interpretar la
informacin para extraer conclusiones basadas en los datos. (TRIOLA)
c) Mtodos cientficos que se utilizan para recolectar, organizar, resumir,
presentar y analizar datos, as como para obtener conclusiones vlidas y
tomar decisiones razonables con base en este anlisis.
d) Del latn status, situacin. Ciencia de recolectar, describir e interpretar
datos, que se organizan y procesan para brindar informacin y tomar
decisiones o inferir.

https://www.youtube.com/watch?v=v5SrbyUdBmo

-ESTADSTICA DESCRIPTIVA

-ESTADSTICA INFERENCIAL

(A profundizar en clase, con relectura -anlisis del artculo)


1.2. Recopilacin de datos
Los datos como informacin concreta y fundamento de la
estadstica.
Son las observaciones recolectadas.

Tipos de datos:

- Cualitativos (categricos o de atributo)


- Cuantitativos (numricos)
o Discretos
o Continuos
- Nominales, ordinales, de intervalo y de razn.

* Poblacin

* Muestra

*Recopilacin de datos (muestrales) o muestreo

Si los datos muestrales no se renen de manera adecuada, stos podran resultar


intiles por completo, de tal forma que ninguna cantidad de tortura estadstica los
salvara.

La aleatoriedad por lo general juega un papel crucial para determinar cules son
los datos a reunir.

Los mtodos estadsticos se rigen por los datos. Por lo regular obtenemos datos
de dos fuentes distintas:

Estudios observacionales.- observamos y medimos caractersticas


especficas, sin manipular o modificar a los sujetos que estamos estudiando.

Experimentos.- aplicamos algn tratamiento y luego procedemos a


observar sus efectos sobre los sujetos.

Tanto para los estudios observacionales como para los experimentos es


importante elegir la muestra de tal manera que representa a la poblacin total.

- Muestra de respuesta voluntaria

- Muestra aleatoria simple.- Se selecciona una muestra de tamao de n sujetos de


manera que cada posible muestra del mismo tamao n tenga la misma posibilidad
de ser elegida.
- Muestra aleatoria.- Cada miembro de la poblacin tiene la misma probabilidad de
ser seleccionado.

- Muestra probabilstica

- Muestreo sistemtico.- Se selecciona un punto de partida, despus se selecciona


cada k-simo.

- Muestreo de conveniencia.- Se utilizan resultados que son fciles de obtener.

- Muestreo estratificado.- Se subdivide a la poblacin en al menos dos diferentes


subgrupos (o estratos) que comparten las mismas caractersticas (por ejemplo, el
gnero o categora de edad), y despus se extrae una muestra de cada subgrupo.

- Muestreo por conglomerados (racimos).- Se divide el rea de la poblacin en


secciones (o racimos), se eligen al azar unas cuantas de estas secciones y luego
se escogen todos los miembros de los racimos seleccionados.

- Muestreo de etapas mltiples.- recoleccin de datos usando cierta combinacin


de mtodos.

(Ejercicio de ejemplos y prctica de muestreo, recoleccin de datos)

Adems de controlar los efectos de las variables, otro elemento clave del diseo
experimental es el tamao de las muestras. stas deben ser suficientemente
grandes para que el comportamiento errtico, que es caracterstico de muestras
muy pequeas, no disfrace los efectos verdaderos de los diferentes tratamientos.
La repeticin de un experimento se llama rplica, la cual se utiliza con efectividad
cuando tenemos los sujetos suficientes como para reconocer las diferencias que
resultan de los diferentes tratamientos.
Base de datos agrcolas INEGI

http://www3.inegi.org.mx/sistemas/tabuladosbasicos/default.aspx?c=17177&s=est

1.3. Distribucin de frecuencias.


Histogramas, polgonos de frecuencia, ojivas.

Las distribuciones de frecuencia se construyen por las siguientes razones:

a) Es posible resumir conjuntos grandes de datos.


b) Se logra cierta comprensin sobre la naturaleza de los datos.
c) Se tiene una base para construir grficas.

Cuando se describen, exploran y comparan conjuntos de datos, las siguientes


caractersticas suelen ser de enorme importancia.

1. Centro: Valor representativo o promedio que indica la localizacin de la mitad


del conjunto de los datos.
2. Variacin: Medida de la cantidad en que los valores de los datos varan entre
s.

3. Distribucin: Naturaleza o forma de la distribucin de los datos (tales como


normales, uniformes o sesgadas).

4. Datos distantes: Valores muestrales que estn muy alejados de la vasta


mayora de los dems valores de la muestra.

5. Tiempo: Caractersticas cambiantes de los datos a travs del tiempo.

Para conjuntos grandes de datos, es til organizarlos y resumirlos por medio de la


construccin de una tabla que liste los distintos valores posibles de los datos (ya
sea de forma individual o por grupos), junto con las frecuencias correspondientes,
es decir, el nmero de veces que ocurren dichos valores.

Una distribucin de frecuencias (o tabla de frecuencias) indica cmo un


conjunto de datos se divide en varias categoras (o clases) al listar todas las
categoras junto con el nmero de valores de los datos que hay en cada una.

- Lista valores de datos (ya sea de manera individual o por grupos de


intervalos), junto con sus frecuencias (o conteos) correspondientes.

Lmites inferiores de clase son las cifras ms pequeas que pueden pertenecer
a las diferentes clases.

Lmites superiores de clase son las cifras ms grandes que pueden pertenecer a
las diferentes clases.

Fronteras de clase son las cifras utilizadas para separar las clases, aunque sin
los espacios creados por los lmites de clase.
Se obtienen de la siguiente manera: se determina el tamao del espacio entre el lmite de clase
superior de una clase y el lmite de clase inferior de la siguiente. Se suma la mitad de esa cantidad
a cada lmite de clase superior, para obtener las fronteras de clase superiores; se resta la mitad de
esa cantidad de cada lmite de clase inferior, para obtener las fronteras de clase inferiores.

Marcas de clase son los puntos medios de las clases.

Anchura/Amplitud de clase es la diferencia entre dos lmites de clase inferiores


consecutivos o dos fronteras de clase inferiores consecutivas.

Procedimiento de construccin de una distribucin de frecuencias


(Pp. 40 (72) -Triola 9 Ed.-, 48 -TRIOLA 11 Ed.-, 48 SALAZAR.)

http://www.statdisk.org/, http://www.aw-bc.com/info/Triola/supps.html

http://www.aw-bc.com/info/Triola/statdisk.pdf

https://www.youtube.com/playlist?list=PLiuxxNbKiuJ4f0QpS6csnpOkquaWxHz9P

1. Decidir el nmero de clases que se desea tener. Debe ser de entre 5 y 20, y
deben utilizarse nmeros enteros o redondeados. NC=1+3.3 log(n) (Regla de
Storges)

2. Calcular anchura/amplitud de clase

Anchura de clase (valor ms alto) - (valor ms bajo)


nmero de clases

Redondear el resultado para obtener un nmero ms adecuado (generalmente se


redondea hacia arriba). Es probable que necesite cambiar el nmero de clases,
pero la prioridad debe ser utilizar valores que sean fciles de comprender.

3. Lmite inferior de la primera clase. Elegir el valor del dato ms bajo o un valor
conveniente que sea un poco ms pequeo.

4. Listar los dems lmites de clase inferior en forma vertical con el uso del
lmite ms bajo de la primera clase + la anchura de clase.

(Sume la anchura de clase al punto de partida para obtener el segundo lmite de clase inferior.
Despus, sume la anchura de clase al segundo lmite de clase inferior para obtener el tercero y as
sucesivamente).

5. Anotar los lmites superiores de clase, que pueden identificarse con facilidad.
6. Ponga una marca de frecuencia en la clase apropiada para cada dato. Utilice
las marcas para obtener la frecuencia total de cada clase.

Cuando construya una distribucin de frecuencias, asegrese de que las clases no se traslapen,
de modo que cada uno de los valores originales pertenezca exactamente a una de las clases.
Incluya todos los casos, aun aquellos que tienen una frecuencia de cero. Trate de utilizar la misma
anchura para todas las clases, aunque en ocasiones es imposible evitar los intervalos con finales
abiertos, como 65 aos o mayores.

Distribucin de frecuencias relativas - porcentuales

Frecuencia relativa frecuencia de clase .


Suma de todas las frecuencias

Frecuencia porcentual frecuencia de clase . x 100


Suma de todas las frecuencias

La suma de las frecuencias relativas en una distribucin debe


acercarse a 1 o a 100%.

Distribucin de frecuencias acumuladas

Es la suma de las frecuencias para esa clase y todas las clases anteriores.

(Profundizacin del tema en Excel)

Pensamiento crtico: interpretacin de las distribuciones de frecuencias.


- Complementar y ligar la interpretacin con la representacin grfica.
Visualizacin de los datos

Histogramas
Grfica de barras en donde la escala horizontal representa clases de
valores de datos y la escala vertical representa frecuencias. Las alturas de
las barras corresponden a los valores de frecuencia, en tanto que las barras
se dibujan de manera adyacente (sin espacios entre ellas).

Polgonos de frecuencia
Ojivas

- Complementacin con otros tipos de representacin grfica (investigacin


de tarea).
- Entrega de los 3 tipos principales con sus respectivas distribuciones de
frecuencias impresas y para entregar.
- Visualizacin en clase de los otros tipos propuestos por el texto y anlisis
crtico de los datos y sus grficas con can.

UNIDAD II.- Medidas de tendencia central

- Investigacin previa.
2.2. Medida de tendencia central.- Valor que se encuentra en el centro o a la
mitad de un conjunto de datos.

Hay formas distintas de determinar el centro; por lo tanto, tenemos diferentes


definiciones de las medidas de tendencia central:

2.2.1. Media.- (aritmtica) generalmente es la ms importante de todas las


medidas numricas utilizadas para describir datos; constituye lo que la
mayora de la gente denomina promedio.

media = x
n
Se obtiene sumando los puntajes y dividendo el total entre el nmero de puntajes.

2.2.2. Mediana.- implica el valor que est en medio, cuando los valores
originales de los datos se presentan ordenados en orden de magnitud
creciente (o decreciente).

La mediana suele denotarse con ~x (se pronuncia x con tilde).

*La media se ve afectada de manera drstica por valores extremos, mientras que la mediana no.
Puesto que la mediana no es tan sensible a los valores extremos, con frecuencia se utiliza para
conjuntos de datos que tienen un nmero relativamente pequeo de datos distantes.

2.2.3. Moda.

Valor que ocurre con mayor frecuencia (M). Un conjunto de datos puede tener una
moda, ms de una moda o ninguna moda.

- Unimodal
- Bimodal
- Multimodal
- Sin moda

*En realidad, la moda no se utiliza mucho con datos numricos. Sin embargo, entre las distintas
medidas de tendencia central que consideramos, la moda es la nica que puede usarse con datos
de nivel nominal de medicin.
Mitad de rango

Valor que est a medio camino, entre el puntaje ms alto y el ms bajo, en el


conjunto original de datos. Se calcula sumando el valor mximo con el mnimo y
luego dividiendo dicha suma entre 2.

mitad de rango = (valor mximo + valor mnimo)/2

Media de una distribucin de frecuencias

Cuando los datos se resumen en una distribucin de frecuencias es probable que no conozcamos
los valores exactos de una clase en particular. Para hacer que los clculos sean posibles,
pretendemos que todos los valores muestrales sean iguales a la marca de clase. Ya que cada
marca de clase se repite un nmero de veces igual a la frecuencia de clase, la sumatoria de todos
los valores muestrales es (f x), donde f denota la frecuencia y x representa la marca de clase. El
nmero total de valores muestrales es la sumatoria de frecuencias f.

Clculo en clase
Media ponderada

Media que se obtiene asignando distintos pesos a los valores.

En algunos casos los valores varan su grado de importancia, de modo que es posible que
queramos acomodarlos de acuerdo con ello.

Media ponderada = (w . x)
w

2.2.4. Relacin entre media, mediana y moda.

Ejercicio de resumen y comparacin en clase.


2.2.4.1. Sesgo

Una distribucin de datos est sesgada si no es simtrica y se extiende ms hacia


un lado que hacia el otro. (Una distribucin de datos es simtrica si la mitad
izquierda de su histograma es aproximadamente una imagen en espejo de su
mitad derecha).

*Comparacin grfica entre la media, mediana y moda,

- Sesgo negativo (a la izquierda)

- Sesgo positivo (a la derecha)

Elaboracin de los histogramas comparativos para obtener sesgo.


UNIDAD III.- Medidas de dispersin / variacin

Variacin.- Medida de la cantidad en que los valores de los datos varan entre s.

3.1. Medidas de dispersin para un conjunto de datos y datos agrupados.

3.1.1. Rango
El rango de un conjunto de datos es la diferencia entre el valor mximo y el valor
mnimo.
Rango = (valor mximo) - (valor mnimo)

Es conveniente ordenar los datos para facilitar el trabajo.

3.1.2. Desviacin media.

Es una medida que compara cada valor xi con la media, y determina que tan
separado se encuentra el dato de la media.

DM = | xi - |
n

xi = Dato i = media n = nmero de datos

Para ello, se obtiene la diferencia de cada elemento menos la media y se toma el valor absoluto,
despus se suman todas y se divide entre el nmero de datos.

3.1.2.1. Desviacin media para datos agrupados.


3.1.3. Varianza. 2
La varianza muestral s2 es un estimador sin sesgo de la varianza poblacional 2, lo
que significa que los valores de s2 tienden a igualar el valor de 2, en lugar de
hacerlo de manera sistemtica, a sobreestimar o subestimar 2.

Es un promedio de las desviaciones elevadas al cuadrado.

2 = | xi - x |2 Para una poblacin


n

Medida de variacin igual al cuadrado de la desviacin estndar.


Varianza muestral: cuadrado de la desviacin estndar s.
Varianza poblacional: cuadrado de la desviacin estndar poblacional .

3.1.4. Desviacin estndar


Medida de variacin de todos los valores con respecto a la media. Es un tipo de
desviacin promedio de los valores, con respecto a la media.

El valor de la desviacin estndar s suele ser positivo. Slo es igual a cero cuando todos los valores de los
datos son el mismo nmero. Adems, valores grandes de s indican mayores cantidades de variacin.
El valor de la desviacin estndar s se puede incrementar de manera drstica con la inclusin de uno o ms
datos distantes (valores de datos que se encuentran muy lejos de los dems).
Las unidades de la desviacin estndar s (como minutos, pies, libras, etctera) son las mismas de los datos
originales.
3.2. Coeficiente de variacin (CV).
Expresado como porcentaje, describe la desviacin estndar relativa a la media, y
est dada de la siguiente forma:

3.3. Coeficiente de asimetra de Pearson.

- Distribucin hipergeomtrica

Distribucin hipergeomtrica
Ms informacin sobre Minitab 17

En este tema

Qu es la distribucin hipergeomtrica?
Ejemplo del clculo de probabilidades hipergeomtricas
La diferencia entre las distribuciones hipergeomtrica y binomial

Qu es la distribucin hipergeomtrica?
La distribucin hipergeomtrica es una distribucin discreta que modela el nmero de
eventos en una muestra de tamao fijo cuando usted conoce el nmero total de
elementos en la poblacin de la cual proviene la muestra. Cada elemento de la
muestra tiene dos resultados posibles (o es un evento o un no evento). Las muestras
no tienen reemplazo, por lo que cada elemento de la muestra es diferente. Cuando se
elige un elemento de la poblacin, no se puede volver a elegir. Por lo tanto, la
probabilidad de que un elemento en particular sea seleccionado aumenta con cada
ensayo, suponiendo que an no ha sido seleccionado.

Utilice la distribucin hipergeomtrica para muestras obtenidas de poblaciones


relativamente pequeas, sin reemplazo. Por ejemplo, esta distribucin se utiliza en la
prueba exacta de Fisher para probar la diferencia entre dos proporciones y en
muestreos de aceptacin por atributos cuando se toman muestras de un lote aislado
de tamao finito.
La distribucin hipergeomtrica es descrita por 3 parmetros: tamao de la poblacin,
conteo de eventos en la poblacin y tamao de la muestra

Por ejemplo, usted recibe un envo de pedido especial de 500 etiquetas. Supongamos
que el 2% de las etiquetas tiene defectos. El conteo de eventos en la poblacin es de
10 (.02 * 500). Usted toma una muestra de 40 etiquetas y desea determinar la
probabilidad de que haya 3 o ms etiquetas defectuosas en esa muestra.

La probabilidad de que haya 3 o ms etiquetas defectuosas en la muestra es de 0.0384.

Ejemplo del clculo de probabilidades


hipergeomtricas
Supongamos que hay diez automviles que le gustara someter a una prueba de
conduccin (N = 10), y cinco de ellos tienen motores turbo (x = 5). Si prueba tres de
los vehculos (n = 3), cul es la probabilidad de que dos de los tres que probar
tengan motores turbo?

1. Elija Calc > Distribuciones de probabilidad > Hipergeomtrica.


2. Elija Probabilidad.
3. En Tamao de la poblacin (N), ingrese 10. En Conteo de eventos en la poblacin
(M), ingrese5. En Tamao de la muestra (n), ingrese 3.
4. Elija Constante de entrada e ingrese 2.
5. Haga clic en Aceptar.
La probabilidad de que seleccione dos automviles con motores turbo cuando pruebe
tres de los diez vehculos que le interesan es 41.67%.

La diferencia entre las distribuciones hipergeomtrica y


binomial
Tanto la distribucin hipergeomtrica como la distribucin binomial describen el
nmero de veces que un evento ocurre en un nmero fijo de ensayos. En una
distribucin binomial, los ensayos son independientes. Para la distribucin
hipergeomtrica, cada ensayo cambia la probabilidad de cada ensayo subsiguiente,
porque no hay reemplazo.

http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-
graphs/probability-distributions-and-random-data/distributions/hypergeometric-distribution/

You might also like