You are on page 1of 39

ESTADSTICA DESCRIPTIVA

APLICADA A LA GESTIN DE
RIESGOS
SANDRA MATEUS

ESTADISTICA BSICA
SANDRA MATEUS

Estadstica Descriptiva
Medidas de tendencia central
Medidas de dispersin,
Conceptos de frecuencia,
Correlaciones
Histogramas
Distribucin de probabilidad

FRECUENCIA MENSUAL
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%

41,69%
35,28%

12,54%

3,79%

1,75%

0,58%

0,87%

3,50%

FRECUENCIA MENSUAL

Explorar los datos, debe ser la primera etapa de todo


anlisis de datos.

Por qu no analizarlos directamente?


Las tcnicas computacionales no permiten a simple
vista detectar incoherencias y errores en los datos que
usamos, datos errneos o inesperados sern procesados
de modo inapropiado.

POBLACIN
en el

Total de sujetos o unidades de anlisis de inters


estudio,

MUESTRA

Cualquier subconjunto de los sujetos o


unidades de anlisis de la poblacin.

Se usa una muestra para conocer o estimar caractersticas de la


poblacin.

PARMETRO una medida resumen calculada sobre la poblacin


ESTADSTICO una medida resumen calculada sobre la muestra

INFERENCIA ESTADSTICA:
Conjunto de mtodos que permiten hacer predicciones acerca de
caractersticas de un fenmeno sobre la base de informacin parcial acerca
del mismo.
Los mtodos de la inferencia permiten proponer el valor de una cantidad
desconocida, es decir, hacer estimacin o decidir entre dos teoras
contrapuestas cul de ellas explica mejor los datos observados (prueba de
hiptesis).
El fin de cualquier estudio es aprender sobre las poblaciones, para ello se
estudia solo una muestra de cada una de las poblaciones (rara vez se
conoce la poblacin total).

TIPOS DE DATOS
DATOS CATEGRICOS O CUALITATIVOS
Las variables categricas resultan de registrar la presencia de uno o ms
atributos, los cuales son mutuamente excluyentes y exhaustivas.
Cada unidad de observacin debe ser clasificada sin ambigedad en una
y solo una de las categoras posibles y que existe una categora para
clasificar a todo individuo.
En RO se deben contemplar todas las posibilidades, incluyendo una
categora tal como No sabe / No contesta.

Los datos categricos se clasifican en dicotmicos, nominales y ordinales.

DATOS CATEGRICOS O CUALITATIVOS


DICOTMICOS
El individuo o la unidad de observacin puede ser asignada a solo una de dos
categoras. En general, se trata de presencia - ausencia del atributo.

VARIAS CATEGORAS
CATEGORAS NOMINALES No existe orden obvio entre las categoras.
Ejemplos: Oficina, Sucursal, estado civil.
CATEGORAS ORDINALES Existe un orden natural entre las categoras.
Ejemplos: Estrato socioeconmico, Frecuencia (alta, media, baja).

DATOS NUMRICOS
Una variable es numrica cuando el resultado de la observacin o medicin
es un nmero, pueden ser:

a) Discretos. La variable slo puede tomar un cierto conjunto de valores


posibles. En general, aparecen por conteo, Ej. Nro. de veces que se cae el
sistema, Nro. de veces que se comete cierto error en un intervalo de
tiempo
b) Continuos: Las mediciones pueden tomar tericamente un conjunto
infinito de valores posibles dentro de un rango. Ej. Probabilidades, impacto
econmico.

PRESENTACIN DE DATOS CATEGRICOS


TABLA DE FRECUENCIA
El modo ms simple de presentar datos categricos es por medio de una
tabla de frecuencias. Esta tabla indica el nmero de unidades de anlisis
que caen en cada una de las clases de la variable cualitativa.
EVENTOS DE RIESGOS POR MES TOTAL SEDES
FALLAS ASESORA A CLIENTES
FALLAS REGISTRO RODUCTOS
FALLAS PROGRAMACIN CITAS
FALLAS EN EL SISTEMA
ERRORES ACTUALIZ. ADMINISTRADORES Y REVISORES F.
ERRORES LIQUIDACIN PERSONAS JURDICAS
ERRORES EN LA INSCRIPCIN DE LIBROS DE ASAMB., J.SOCIOS Y JD
ERRORES CERTIFICADOS DE EXISTENCIA Y RL

FRECUENCIA MENSUAL PORCENTAJE


121
13
43
143
6
2
3
12

35%
4%
13%
42%
2%
1%
1%
3%

REPRESENTACIN GRFICA DE UN NICO CONJUNTO DE


DATOS NUMRICOS
Se trata de responder a preguntas tales como:
Son los valores medidos casi todos iguales o son muy diferentes unos de otros?
En qu sentido difieren?
Cmo podemos describir cualquier patrn o tendencia?
Difieren algunos pocos nmeros notablemente del resto?
FRECUENCIA MENSUAL
41,69%

1,75%

0,58%

0,87%
3,50%

35,28%

FALLAS ASESORA A CLIENTES


FALLAS REGISTRO RODUCTOS
3,79%
FALLAS PROGRAMACIN CITAS

FALLAS EN EL SISTEMA
ERRORES ACTUALIZ.
ADMINISTRADORES Y REVISORES F.

12,54%

GRFICO DE TALLOS Y HOJAS (STEM AND LEAF)


Esta tcnica grfica desarrollada por Tukey es muy sencilla y permite
mostrar la forma de la distribucin de una variable numrica.
Es apropiada para conjuntos de observaciones no muy extensos, se
construye con poco esfuerzo por lo que es muy simple de realizar con lpiz
y papel.

MEDIDAS DE TENDENCIA CENTRAL

MODA
MEDIANA
PROMEDIO

MODA
La moda es el valor que tiene mayor frecuencia absoluta. Se puede hallar
la moda para variables cualitativas y cuantitativas. Se representa por Mo.
Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5

Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia
es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de
las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8

Mo = 4

MODA

MEDIANA
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de
menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo
para variables cuantitativas.
Clculo de la mediana
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la
misma.
2, 3, 4, 4, 5, 5, 5, 6, 6

Me= 5

3 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las


dos puntuaciones centrales.
7, 8, 9, 10, 11, 12

Me= 9.5

MEDIA ARITMETICA
Es el valor obtenido al sumar todos los datos y dividir el resultado entre
el nmero total de datos. es el smbolo de la media aritmtica.
Ejemplo
Los tiempos de respuesta en minutos para restablecer los sistemas de atencin
al pblico luego de una falla durante una semana fueron:
12,5 ; 39,6 ; 12,8 ; 19,3 ; 29,3 ; 31,7 ; 12,5 ; 32,5 ; 16,8 ; 12,1 ; 12,5.
Hallar el tiempo medio:

= 12,5 + 39,6 + 12,8 + 19,3 + 29,3 + 31,7 + 12,5 + 32,5 + 16,8 + 12,1 + 12,5 / 11 =
21,054

CARACTERSTICAS DE LA MEDIA ARITMETICA


1. La media se puede hallar slo para variables cuantitativas.
2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas.
La suma de las desviaciones de todas las puntuaciones de una distribucin
respecto a la media de la misma igual a cero.
La media aritmtica de los cuadrados de las desviaciones de los valores de la
variable con respecto a un nmero cualquiera se hace mnima cuando
dicho nmero coincide con la media aritmtica.
Si a todos los valores de la variable se les suma un mismo nmero, la media
aritmtica queda aumentada en dicho nmero.

Si todos los valores de la variable se multiplican por un


mismo nmero la media aritmtica queda multiplicada por dicho nmero.

MEDIDAS DE DISPERSION

RANGO
DESVIACIN MEDIA
VARIANZA
DESVIACIN TPICA
COEFICIENTE DE VARIACIN

RANGO O RECORRIDO
El rango es la diferencia entre el mayor y el menor de
los datos de una distribucin estadstica.

DESVIACIN MEDIA
La desviacin respecto a la media es la diferencia entre cada valor de la variable
estadstica y la media aritmtica.
Di = x -
La desviacin media es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media.

VARIANZA

La varianza es la media aritmtica del cuadrado


de las desviaciones respecto a la media de una
distribucin estadstica.
La varianza se representa por

DESVIACIN TPICA

La desviacin tpica es la raz cuadrada de la varianza

DESVIACIN TPICA
Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones tpicas se puede calcular
la desviacin tpica total.
Si todas las muestras tienen el mismo tamao:

Si todas las muestras tienen NO tienen el mismo tamao:

COEFICIENTE DE VARIACIN
El coeficiente de variacin es la relacin entre la desviacin
tpica de una muestra y su media.
Permite comparar
las dispersiones de dos distribuciones distintas, siempre que
sus medias sean positivas.
El coeficiente de variacin expresa en porcentajes:

Se calcula para cada una de las distribuciones y los valores que se


obtienen se comparan entre s.
La mayor dispersin corresponder al valor del coeficiente de
variacin mayor.

COVARIANZA
Es la media aritmtica de los productos de las desviaciones de
cada una de las variables respecto a sus medias respectivas, se
representa por sxy o xy.
La covarianza indica el sentido de la correlacin entre las
variables.
Si xy > 0 la correlacin es directa.
Si xy < 0 la correlacin es inversa.
Presenta como inconveniente, el hecho de que su valor
depende de la escala elegida para los ejes.

FRECUENCIA

FRECUENCIA ABSOLUTA
FRECUENCIA RELATIVA

DISTRIBUCIN DE FRECUENCIAS
La distribucin de frecuencias o tabla de frecuencias es
una ordenacin en forma de tabla de los datos estadsticos,
asignando a cada dato su frecuencia correspondiente.
FRECUENCIA ABSOLUTA
La frecuencia absoluta es el nmero de veces que aparece un
determinado valor en un estudio estadstico, se representa por fi.

La suma de las frecuencias absolutas es igual al nmero total de


datos, que se representa por N.

DISTRIBUCIN DE FRECUENCIAS
FRECUENCIA RELATIVA
La frecuencia relativa es el cociente entre la frecuencia
absoluta de un determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por ni. La
suma de las frecuencias relativas es igual a 1.

DISTRIBUCIN DE FRECUENCIAS
FRECUENCIA ACUMULADA
La frecuencia acumulada es la suma de las frecuencias
absolutas de todos los valores inferiores o iguales al valor
considerado, se representa por Fi.
FRECUENCIA RELATIVA ACUMULADA

La frecuencia relativa acumulada es el cociente entre


la frecuencia acumulada de un determinado valor y el nmero
total de datos. Se puede expresar en tantos por ciento.

DISTRIBUCIN DE FRECUENCIAS

EVENTOS DE RIESGOS POR MES TOTAL SEDES


FALLAS ASESORA A CLIENTES
FALLAS REGISTRO RODUCTOS
FALLAS PROGRAMACIN CITAS
FALLAS EN EL SISTEMA
ERRORES ACTUALIZ. ADMINISTRADORES Y REVISORES F.
ERRORES LIQUIDACIN PERSONAS JURDICAS
ERRORES EN LA INSCRIPCIN DE LIBROS DE ASAMB., J.SOCIOS Y JD
ERRORES CERTIFICADOS DE EXISTENCIA Y RL

FRECUENCIA
MENSUAL
121
13
43
143
6
2
3
12

FRECEUNCIA FRECUENCIA FRECUENCIA REL.


ACUMULADA RELATIVA
ACUMULADA
121
134
177
320
326
328
331
343

35%
4%
13%
42%
2%
1%
1%
3%

35%
39%
52%
93%
95%
96%
97%
100%

HISTOGRAMA DE FRECUENCIAS
Representacin grfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados.
En el eje vertical se representan las frecuencias, y en el eje
horizontal los valores de las variables
Se utiliza cuando se estudia una variable continua
En los casos en los que los datos son cualitativos (nonumricos), es preferible un diagrama de sectores.

HISTOGRAMA

CORRELACIN
Trata de establecer la relacin o dependencia que existe entre
las dos variables que intervienen en una distribucin
bidimensional.
Determinar si los cambios en una de las variables influyen en los
cambios de la otra. En caso de que suceda, diremos que las
variables estn correlacionadas.
El coeficiente de correlacin lineal es el cociente entre
la covarianza y el producto de las desviaciones tpicas de ambas
variables.

PROPIEDADES COEFICIENTE DE CORELACIN


1. No vara al hacerlo la escala de medicin.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza:
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.

3. Es un nmero real comprendido entre 1 y 1.


4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la
correlacin es fuerte e inversa.

5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la


correlacin es fuerte y directa.
6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la
correlacin es dbil.

CORRELACIN
DIRECTA

INVERSA

NULA

GRADO DE CORRELACIN
Indica la proximidad que hay entre los puntos de la
nube de puntos.
DEBIL

FUERTE

NULA

You might also like