Professional Documents
Culture Documents
La Estadstica
Estadstica: Conceptos Bsicos.
Aplicada a la
Educacin.
Objeto de la Estadstica.
Clasificacin de la Estadstica.
UNIDAD
Datos Cuantitativos y Cualitativos. I:
Conceptos de Poblacin y Muestra. Tipos.
Concepto de Estadstica:
Desde este punto de vista, se puede concluir que la estadstica se define como un
conjunto de mtodos para manejar la obtencin, presentacin y anlisis de
observaciones numricas, cuyos fines son describir al conjunto de datos obtenidos y
tomar decisiones o realizar generalizaciones acerca de las caractersticas de todas las
observaciones bajo consideracin.
Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades
de datos numricos, debido al uso de
Muestra:
Es un conjunto de mediciones u observaciones tomadas a partir de una poblacin.
Es un subconjunto de la poblacin. Este grupo representa una parte de los sujetos que
forman la poblacin, los cuales se pueden escoger de manera aleatoria o intencional,
solo el primero de ellos ser estudiado en este curso. Ejemplos: Nmero de alumnos
en el saln de clases que estudian Licenciatura en Educacin, profesores del Ncleo de
Sucre de la Universidad de Oriente, etc.
Tipos de variables:
Variables Cualitativa:
Las variables categricas resultan de registrar la presencia de un atributo.
Las categoras de una variable cualitativa deben ser definidas claramente durante la
etapa de diseo de la investigacin y deben ser mutuamente excluyentes y
exhaustivas. Esto significa que cada unidad de observacin debe ser clasificada sin
ambigedad en una y solo una de las categoras posibles y que existe una categora
para clasificar a todo individuo.
Las variables categricas solo toman valores asociados a las cualidades o atributos,
clasificndolos en una de varias categoras, es decir, no son valores numricos. Las
categoras pueden tener un orden natural (ordinales) o no (nominales). Las variables
cualitativas tambin se llaman variables categricas. Con estas variables se pueden
contar nmero de casos, comparar entre categoras, pero no se pueden realizar
operaciones numricas.
Ejemplos:
Sexo: f/m.
Hbito de fumar: Fumador/No fumador
Color de ojos: negro, azul, marrn,
Religin: catlica, evanglica,
Estado civil: soltero, casado, divorciado,
Variables Cuantitativas: Tienen valores numricos que representan medidas (largo,
peso, etc.) o frecuencias (nmero de). Tiene sentido realizar operaciones numricas
con estas variables. Adems distinguimos dentro de las variables cuantitativas las
discretas y las continuas. Una variable discreta es aquella en la cul se puede contar el
nmero posible de valores. Una variable continua puede tomar cualquier valor en un
intervalo dado.
Ejemplos:
Peso.
Edad.
Estatura.
Presin.
Humedad.
Intensidad de un sismo.
Cantidad de hermanos.
Las variables Cuantitativas puden clasificarse en:
Variables Discreta: Es aquella cuyos valores pueden ponerse en correspondencia con los nmeros naturales
(N:1,2,3,4,...) o con parte de ellos. Es decir, los valores de la variable pueden contarse. tambin se puede decir
que en la variable discreta se llega a algunos valores por ejemplo A y B de manera tal que entre esos dos valores no
existe otro valor de la variable. Llega un momento en la que se producen saltos entre los valores de la variable.
Este tipo de variable slo puede tomar un cierto conjunto de valores posibles. En general,
aparecen por conteo.
Ejemplo:
cantidad de hermanos.
nmero de miembros del hogar
nmero de intervenciones quirrgicas
nmero de casos notificados de una cierta patologa
Una variable "x" es continua si cumple con la siguiente condicin: Valores que puede toar
la variable (A y B). Siempre es posible encontrar un tercer valor C, comprendido entre
A y B, el cual, tericamente, tambin puede ser asumido por la variable. Como este
procedimiento puede repetirse reiterada y consecutivamente de manera indefinida,
entonces la condicin anterior equivale a la siguiente premisa. Dado dos valores A y B
de la variable, siempre es posible que la variable "x" tome cualquier valor comprendido
entre A y B. Es decir, podemos ir desde A hasta B y tener la seguridad que a cada
punto le corresponde un valor de la misma variable.
Ejemplo:
Del mismo modo, la variable nmero de pulsaciones/min. es una variable discreta, pero se
la trata como continua debido al gran nmero de valores posibles.
Nota:
N1)
Una variable que tericamente puede tomar cualquier valor entre dos valores dados se
le llama variable continua. si no es as se le llama discreta.
N2)
Los datos que vienen definidos por una variable discreta o continua se llaman datos
discretos o continuos respectivamente. El nmero de hijos en cada una de 1.000
familias es un ejemplo de datos discretos, mientras que las alturas de 100
universitarios es un ejemplo de datos continuos.
SENSIBILIDAD (ESTADSTICA):
La sensibilidad en estadstica (S), es definida por la menor unidad de medida en la cual
son representados o reportados los valores de una variable.
La forma en que se muestran los datos dan luces del valor de la sensibilidad.
Revisemos el siguiente ejemplo:
Sean los siguientes valores reportados:
Xi: 12 14 19 21 23 9 17 32 18 22 19 11 18
S=1
ntese que todos los datos son nmeros enteros y por tanto contables, los cuales se
pueden poner en correspondencia con el conjunto de los nmeros naturales (N), cuya
menor unidad de medida es 1. Esto significa que podemos construir todos los nmeros
de la serie Xi sumando de uno en uno hasta obtener cada uno de los valores
reportados. Miremos ahora la siguiente serie de datos:
Yi: 12,4 14,1 19,0 21,7 23,6 9,8 17,2 32,9 18,3
En la serie Yi los valores reportados son medidos de tal manera que los valores no se
obtienen sumando de uno en uno, como en el caso de la serie anterior (Xi), sino que
ha utilizado una unidad de medida mas pequea, tan pequea como el nmero de
decimales que pueda poseer alguno de los valores reportados. En este caso todos los
valores reportados tienen un decimal, por lo que se puede afirmar que la sensibilidad
de la serie de datos Yi es igual a 1 (S=0,1)
NOTA:
La sensibilidad en la escala de medicin de una variable continua NO se puede precisar
si el valor medido (valor reportado) de la variable, coincide con el valor real (valor
verdadero) de la variable.
Esto significa que dado el valor reportado siempre queda la duda de la ubicacin del
valor verdadero. Por consiguiente, es necesario colocar algunos lmites para el valor
verdadero de la variable y esto ltimo tiene que ver con la sensibilidad de la medicin
de la variable continua.
Lmite Inferior:
Se obtiene restndole la mitad de la sensibilidad (s) al valor reportado (Vr) de la
variable:
Lmite Superior:
Se obtiene sumndole la mitad de la sensibilidad (s) al valor reportado (Vr) de la
variable:
Lim. Sup.= Vr + S/2
Ejemplo:
/ / /
33,5 35 36,5
Lim. inf. Vr Lim. sup.
ESCALAS DE MEDICIN
Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". Usando
una escala nominal podemos decidir si un sujeto es igual o diferente a otro, pero no
podemos establecer relaciones de orden respecto a esa caracterstica, ni relaciones de
cantidad ni de diferencia. Por ejemplo: si medimos el color de los ojos podemos
establecer la siguiente escala: A azul, V verde, M marrn y N negro. No
podemos ordenar los sujetos de mayor a menor o viceversa, simplemente podemos
asegurar si dos sujetos tienen el mismo o distinto color de ojos. Otros ejemplos:
nacionalidad, sexo, profesin. A este tipo de variables medidas con escala nominal se
les puede asignar a cada categora cualquier tipo de smbolos. En el ejemplo hemos
asignado letras pero podamos haber optado por nmeros: 1 azul, 2 verde,
3 marrn y 4 negro.
DISTRIBUCIN DE FRECUENCIAS
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en
categoras mutuamente excluyentes que indican el nmero de observaciones en
cada categora.1 Esto proporciona un valor aadido a la agrupacin de datos. La
distribucin de frecuencias presenta las observaciones clasificadas de modo que
se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos
suelen estar agrupadas en forma de tablas.
Una distribucin de frecuencias es un formato tabular en la que se organizan los
datos en clases, es decir, en grupos de valores que describen una caracterstica
de los [datos] y muestra el nmero de observaciones del conjunto de datos que
caen en cada una de las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En
principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes
en el conjunto de datos junto con el nmero de veces que aparece, es decir, su
Frecuencia. Se puede complementar la frecuencia absoluta con la denominada
frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos.
En variables cuantitativas se distinguen por otra parte la frecuencia simple y la
frecuencia acumulada.
La tabla de frecuencias puede representar grficamente en un histograma
(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y
en el horizontal los intervalos de valores.
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma
de tabla de los datos estadsticos, asignando a cada dato su frecuencia
correspondiente.
Frecuencia Simple (fi)
La frecuencia simple es el nmero de veces que aparece un determinado valor
reportado en un estudio estadstico. Se representa por fi. La suma de las
frecuencias simple es igual al nmero total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma
mayscula) que se lee suma o sumatoria.
fi = N (nmero total de datos de la distribucin)
Frecuencia Relativa Porcentual (fr%)
La frecuencia relativa porcentua es el cociente entre la frecuencia absoluta de un
determinado valor y el nmero total de datos. Se puede expresar en tantos por
ciento y se representa por fi. La suma de las frecuencias relativas es igual a 100.
Frecuencia Acumulada (fac)
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado. Se representa por fac.
Frecuencia Relativa Acumulada Porcentual (frac%)
La frecuencia relativa acumulada porcentual es el cociente entre la frecuencia
acumulada de un determinado valor y el nmero total de datos expresada en
tantos por ciento.
Solucin:
1 Calculando el Recorrido Verdadero, se obtiene:
Rv = Vmax Vmin + S = 65 -30 + 1 = 36
Poblacin:
Es la coleccin de datos que corresponde a las
caractersticas de la totalidad de individuos, objetos,
cosas o valores en un proceso de investigacin.
Para su estudio, en general se clasifican en Poblaciones
Finitas y Poblaciones Infinitas.