You are on page 1of 52

Msc.

BLANCA FALLA ALDANA


Docente de Salud Publica
ESTADISTICA
• Ciencia, su sustento es teoría de las probabilidades
• Herramienta para procesar información y tomar decisiones
• Herramienta para investigación
Conjunto de métodos y procedimientos para captar, elaborar e
interpretar daros sujetos a variaciones.
• Predice fenómenos aleatorios que pueden expresarse
cuantitativamente.
• Utiliza para ser inferencias validas para una población mas
amplia de características similares.
• La finalidad del análisis es establecer las conclusiones a una
población donde la muestra sea representativa.
ESTADISTICA
SCHWARTS (1981)
MEtodos de razonamiento, interpreta datos de la
ciencias de la vida.
Su carácter es la variabilidad.

LAST (1988)
Resumen y analiza datos sujetos a variaciones
aleatorias.
ESTADISTICA DESCRIPTIVA
• Comprende la organización, presentación de datos de
manera científica.
• Incluye diversos métodos de organizar y representar
gráficamente los datos.
• Revisa y clasifica datos.
• Calcula medidas de tendencia central y de dispersión.
• Representa gráficamente los datos
ESTADISTICA INFERENCIAL

• Describe lo que esta pasando y realiza inferencias.


• Toma decisiones probabilísticas.
• Toda generalización tiene un margen de error.
• Comprende las bases lógicas mediante las cuales se
establecen conclusiones.
ESTADISTICA INFERENCIAL

Proporciona
métodos para
estimar las
características de un
grupo (población) Muestra
Población
basándose en los
datos de un conjunto
pequeño (muestra).
ESTADISTICA EN MEDICINA

El resultado de un análisis estadístico no es un


objetivo en sí mismo, sino una herramienta
para:
comprobar o rechazar una hipótesis de trabajo,
representar de una forma eficiente y resumida
un colectivo de observaciones,
para validar un modelo de un proceso
fisiológico
DATOS CUANTITATIVOS

En el grupo de datos cuantitativos tenemos


aquellos cuyo resultado puede variar de
forma continua, como puede ser el peso, la
presión arterial, el nivel de colesterol, etc. y
los que sólo pueden tomar valores enteros
como por ejemplo el número de hijos, el
número de ingresados en el Servicio de
Ortopedia, un día concreto, etc.
DATOS CUALITATIVOS
Pueden ser:
nominales, que constituyen una simple
etiqueta como puede ser el sexo, el grupo
sanguíneo, etc.
ordinales, en las que se da una relación
de orden entre las respuestas, por ej.
resultado de una patología/tratamiento
(fallece, empeora, sin cambios, mejora,
curación).
PRESENTACION DE DATOS
CUALITATIVOS

Indicar un valor central y uno de variabilidad o


dispersión.
Cuando es razonable suponer que los datos
pueden seguir una distribución normal, se
estimará la media y la desviación estándar.
Ejemplo: La media de la PAS fue de 139.2 ±
14.9 mmHg
MEDIDAS DE TENDENCIA
CENTRAL
• Son valores promedios que representan a
toda la muestra de valores
• Indican el punto medio de la distribución.
• En una distribución de frecuencias las
medidas de tendencia central son: Media,
mediana y moda.
MEDIA
• Es un valor representativo o promedio.
∀ x se calcula a partir de la distribucion de frecuencias.
• Suma l os valores de todas las observaciones y se divide por el numero
total.
• Ventaja. Su fácil manejo matemático y estadístico.
• Se usa en datos intervalicos y proporcionales.
• Limitación sensibilidad a los valores extremos
X1, x2, x3, ………xn
x = x1, x2, x3, ……xn
n
x = Ʃ xi
n
1.- DATOS NO AGRUPADOS: Calcular la T.A. sistólica
media de 5 pacientes en los que se han obtenido las siguientes
cifras. 110, 118, 125, 136, 145
_ = 110 + 118 + 125 + 136 + 145 = 634 = 126,8
X
5 5

2.- DATOS
AGRUPADOS:
xi fi xi . fi
1 3 3 _
2 4 8 X = Σxi . fi = 59 = 2,95
3 6 18 N 20
4 5 20
5 2 10
___ ___
En un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31
días después de la exposición. Calcule el promedio del período de
incubación en éste brote; los períodos de incubación para las i
personas afectadas (X) fueron: 29,31,24,29,30 y 25
1.- Para calcular el numerador sume las observaciones individuales

x = 29+31+24+29+30+25= 168
2.- Para calcular el denominador cuente el número de las
observaciones : n=6
3.- Para calcular la media divida el numerador sumatoría de las
observaciones) entre el denominador (numero de las
observaciones). media x = 29 31 24 29 30 25 = 168 = 28 días
6 6
Entonces: el promedio del período de incubación del brote es 28
días.
En una lista de 5 variables para 11 personas. Vamos a demostrar
como se calcula la media de cada variable (A-E) en el listado.

Persona # Variable A Variable B Variable C Variable D Variable E


1 0 0 0 0 0
2 0 4 1 1 6
3 1 4 2 1 7
4 1 4 3 2 7
5 1 5 4 2 7
6 5 5 5 2 8
7 9 5 6 3 8
8 9 6 7 3 8
9 9 6 8 3 9
10 10 6 9 4 9
11 10 10 10 10 10
1. Para calcular el numerador, sume todas las observaciones
individuales:
A. ∑i x = 0+0+1+1+1+5+9+9+9+10+10 = 55
B. ∑i x = 0+4+4+4+5+5+5+6+6+6+10 = 55
C. ∑i x = 0+1+2+3+4+5+6+7+8+9+10 = 55
D. ∑i x = 0+1+1+2+2+2+3+3+3+4+10 = 31
E. ∑i x = 0+6+7+7+7+8+8+8+9+9+10 = 79
2.- Para calcular el denominador cuente el número de
observaciones (n=11) para cada variable.
3.- Para calcular la media, divida el numerador (suma de las
observaciones) entre el denominador (número de las
observaciones).
Media de la variable A= 55/11= 5
Media de la variable B= 55/11= 5
Media de la variable C= 55/11= 5
Media de la variable D= 31/11= 2.82
Media de la variable E= 79/11= 7.18
MEDIANA
• Se define a la observación equidistante de los extremos.
• Es un valor que va a dividir una representación ordenada en dos partes
iguales.
• La mitad de las observaciones tienen valor inferior o igual a la mediana y la
otra mitad igual o mayor a la mediana.
• Los cálculos se ordenan según su valor en la escala de medición.
• Si N es impar la mediana será el valor correspondiente a la observación
situada en el centro
1,2, 3,4, 5,7, 9
Si N es par la mediana será la media de las variaciones centrales
3, 7, 5, 4, 2, 8, 11, 1 Ventaja : Se usa en variables ordinales
1, 2, 3, 4, 5, 7, 8, 11 Desventaja: Limitaciones de su manejo matemático.
Me= 4+5 = 4.5
2
MEDIDAS DE TENDENCIA CENTRAL. MEDIANA

- DATOS AGRUPADOS:

La mediana es el valor de la variable que tiene la propiedad de


que los valores menores que él son tan frecuentes como los
mayores que él.
Rango mediano = (n+1)
X = Li + N/2 – fd 2
.i
fc

donde: Li = Límite inferior del intervalo crítico


N = Nº total de datos
fd = Frecuencia acumulada por debajo del intervalo crítico
fc = Frecuencia del intervalo crítico
i = Amplitud del intervalo
INTERVALOS fi Fac. Rango mediano = (n+1)
2
151,5 – 172,5 5 5

172,5 – 193,5 7 12

193,5 – 214,5 9 21

214,5 – 235,5 6 27

235,5 – 256,5 3 30
___
30

X = Li + N/2 – fd . i = 193,5 + 30 /2 - 12 . 21 = 200,5


fc 9
• Es menos sensible que la media a la variación de las
puntuaciones. Ejemplo: A 24,25,29,30,31 Media 28.0 mediana 29
B 24,25,29,30,131 Media 44.7 mediana 29

• Se puede calcular aunque existan algún intervalo abierto,


siempre que no sea ese el intervalo crítico.

• Es más representativa cuando la distribución tiene


puntuaciones muy extremas.
MODA

• Es el valor de mayor frecuencia en el conjunto


de observaciones
• Ventaja: se usa para datos nominales.
• Limitacion: Puede no existir ninguna moda o
existir mas de uno.
• 5, 4, 6, 5, 3, 11, 5
CURVA NORMAL ESTADISTICA

• Curva de Gauss o en campana.


• Se caracteriza porque dado el promedio y la Ds es posible reconstruirlo y
precisar el área que existe bajo cualquier segmento.
• Se extiende entre – 0 a +0 su comportamiento bajo la curva es igual a la
unidad.
• En ella coincide la media, mediana y moda.
• Es la distribución teórica de probabilidad mas importante y se usa en la
mayoría de variables continuas biológicas.
• Entre el valor central y una Ds se encuentra el 68.3 del área
• Dos Ds equivale al 95%; 2.5 Ds equivale al 98.8 y 3 Ds equivale al 99.7%
IMPORTANCIA

• Describe fenómenos biológicos ya que tiene una


distribución de este tipo para un valor promedio que
establece la tendencia central del fenómeno en medición.
• Estima probabilidad de ocurrencia de diversos eventos.
• La mayoría de los Test estadísticos dan por supuesto que
provienen de una distribución normal.
PROPIEDADES

• Es simétrica, una de las partes es fiel reflejo de la otra.


• La validez de la media aritmética son iguales en una
distribución normal.
• El intervalo de valores o recorrido son las medidas de
variabilidad.
• Es la distancia entre los valores máximos y mininos.
• La media, mediana y moda tienen el mismo valor.
• Las colas de la curva están cada vez mas próximos al eje
x.
• Es unimodal
INTERPRETACION
• Se aplica al raciocinio de las pruebas de significación estadística
• La determinación de la significación estadística es un fenómeno
probabilístico: Mide la probabilidad de que un evento sea debido al azar.
• El resultado de la significación esta estrechamente ligado al numero de
observaciones realizadas.
• Una diferencias estadísticamente significativa solo indica que existe una baja
probabilidad de que el azar explique la diferencia.
• El limite de significación para que el hallazgo se considere significativo tiene
que ser igual o menor a 0.05 %.
• La dos probalidades de error
- Error tipo 1 o @ existe diferencia significativa cuando de hecho no existe
diferencia real.
- Error tipo 2 o ɞ no existe la diferencia cuando en verdad
existe
Distribución normal: curva
simétrica
30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Asimetría a la
izquierda
30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
Asimetría a la derecha

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13
MEDIDAS DE ORDEN

Permiten conocer otros puntos característicos de la


distribución que no son los valores centrales

Cuartiles, deciles y percentiles


INDICES DE POSICION
• PERCENTILES (P): Es el valor de la variable por debajo del cual
se encuentra un porcentaje determinado de observaciones.

• CUARTILES (Q): Son los valores de la variable que dejan por


debajo el

25% de los datos ............... Primer cuartil Q1 (25%)

50% de los datos................ Segundo cuartil Q2 (50%)

75% de los datos................ Tercer cuartil Q3 (75%)


CUARTILES

75% 25%
25% 75%

25% 25% 25% 25%


Cuartil 1 MedianaC Cuartil 3 Máximo
Mínimo
uartil 2
Q1 Q3
Q2
PERCENTILES

Los percentiles dividen en dos


partes las observaciones. Por
ejemplo, el percentil 20, P20 , es
el valor que deja por debajo un
20% y por encima un 80% de
las observaciones
PERCENTILES

20% 80%
Mínimo Percentil 20 Máximo

P20
MEDIDAS DE DISPERSION
Estudia lo concentrada o dispersa que está la
distribución de los datos con respecto a la media
aritmética.

Rango o recorrido, desviación media, varianza y


desviación típica o estándar, y coeficiente de variación.
• VARIANZA: Es la media de los cuadrados de las diferencias
entre cada valor de la variable y la media aritmética.
_
S² = Σ (xi - X )² o bien S² = 1 Σxi ² - (Σxi )²
N N N
_
S² =Σxi ² - X ²
También:
N
Para datos agrupados:
_
S² = Σfi (xi - X )² o bien S² = 1 Σfi . xi ² - (Σfi . xi )²
N _ N N

También: S² = Σfixi ² - X ²
N
• DESVIACIÓN TÍPICA: Es la raíz cuadrada de la varianza
Si se resta la media aritmética de cada observación, la
suma de las diferencias es cero.
Este concepto de restar la media de cada observación es la
base para dos medidas de dispersión: la varianza y la
desviación típica o estándar.
Para estas medidas, hay que elevar al cuadrado las
diferencias para eliminar los números negativos.
Después, se suma el cuadrado de las diferencias y se divide
por n-1 para encontrar la "media" de las diferencias al
cuadrado.
Esta "media" es la VARIANZA
Para convertir la varianza a las unidades originales, hay
que obtener la raíz cuadrada. Se denomina DESVIACIÓN
TIPICA Ó ESTANDAR .
• COEFICIENTE DE VARIACIÓN DE PEARSON:
Es la «desviación típica medida en unidades de media» y se
mide en %; o lo que es lo mismo, indica el tanto por ciento de
la media que representa la desviación típica. Así:
_
CV = S / X . 100
• RANGO, RECORRIDO O AMPLITUD:
Es la diferencia entre los valores más grande y más pequeño de
la distribución.

• RANGO INTERCUARTÍLICO:
Es la diferencia entre el tercer cuartil y el primero (Q3 – Q1).
Ejemplo:
En éste ejemplo se demuestra cómo se encuentran los valores
mínimo y máximo y el rango de los siguientes datos:
29,31,24,29,30,25.
1.- Organice los datos de menor a mayor: 24,25,29,29,29,30,31;
2.- Identifique los valores mínimo y máximo: mínimo=24 y
máximo=31
3.- Calcule el rango: rango = máximo - mínimo =31-24=7;
entonces el rango es igual a 7.
1. Organice las observaciones en orden ascendente.
Dados estos datos: 13, 7, 9, 15, 11, 5, 8, 4,
hay que organizarlos así: 4, 5, 7, 8, 9, 11, 13, 15.
2. Encuentre la posición del primer y el tercer cuartil. Dado
que hay 8 observaciones, n = 8.
posición del primer cuartil (Q1) = (n + 1) / 4
= (8 + 1) / 4 = 2.25
posición del tercer cuartil (Q3) = 3(n + 1) / 4 = 3 x Q1
3(8 + 1) / 4 = 6.75
Así, se encuentra Q1 (1/4) de las observaciones entre 2 y 3 y
Q3
(3/4) entre las observaciones entre 6 y 7.
3. Identifique el valor del primer y el tercer cuartil.
Valor de Q1: La posición de Q1 es 2 1/4; así, el valor de Q1
es el valor de la observación 2 más 1/4 de la diferencia entre
los valores de las observaciones 2 y 3.
Valor de la observación 3 (ver paso 1) : 7
Valor de la observación 2: 5
Q1 = 5 + 1/4( 7-5 ) = 5 + 1/4(2) = 5 + 0,5 = 5.5
Valor de Q3: La posición de Q1 es 6 3/4; así, el valor de Q3
es el valor de la observación 6 más 3/4 de la diferencia
entre los valores de las observaciones 6 y 7.
Valor de la observación 7 (ver paso 1) : 13
Valor de la observación 6: 11
Q3 = 11 + 3/4( 13-11 ) = 11 + 3/4 (2) = 11 + 1.5 = 12.5
4. Calcule el rango intercuartílico como Q3 menos Q1.
Q3 = 12,5 (ver paso 3) Q1 = 5,5
Rango intercuartílico = 12,5 - 5,5 = 7

En general, se usan los cuartiles y el rango intercuartílico


para describir la variabilidad cuando se está usando la
mediana como la medida de tendencia central.
Cuando se está usando la media aritmética, hay que usar la
desviación típica.
Valor menos la media Diferencia Diferencias al cuadrado
24-28 -4 16
25-28 -3 9
29-28 +1.0 1
29-28 +1.0 1
30-28 +2.0 4
31-28 +3.0 9
168-168.0=0 -7+7=0 40
Varianza = ∑ diferencias cuadráticas = 40 = 8
n-1 5

Desvío estándar= √8 = 2.83


La varianza y la desviación estándar son medidas de la
desviación o dispersión de las observaciones alrededor de la
media de la distribución.
La varianza es la media de las diferencias cuadradas de las
observaciones alrededor de la media. Se representa como "S2 "
en las fórmulas.
La desviación estándar es la raíz cuadrada de la varianza; se
representa con "s"
COEFICIENTE DE VARIACION
El CV es igual al cociente entre la desviación
típica y la media

Si encontramos que el coeficiente de


variación es próximo o mayor que 0.5 y no
puede haber datos negativos, la distribución
no es normal
Por tanto el coeficiente de variación es 0.49.

You might also like