Professional Documents
Culture Documents
Tema 1
Concepto de Estadística
ESTADÍSTICA
ESTADÍSTICA INFERENCIA
PROBABILIDAD
DESCRIPTIVA ESTADÍSTICA
En resumen:
z Si se quiere resumir la distribución de los caracteres observados,
usaremos la Estadística Descriptiva.
z Si, por el contrario, se espera generalizar las características
obtenidas a la población, estaremos ante la Estadística
Inferencial.
Tema 2
Series Estadísticas.
Tabulación y Representación
EE I 9
Conceptos Previos
Toda investigación estadística empieza esencialmente por observar y anotar
las características del fenómeno que se quiere estudiar. Por ello, partiremos de
una serie de conceptos:
EE I 12
Conceptos:
0 45 0,3 45 0,3
1 60 0,4 105 0,7
2 21 0,14 126 0,84
3 15 0,1 141 0,94
4 6 0,04 147 0,98
5 3 0,02 150 1
150
Ventajas:
- Permiten realizar una labor de síntesis buscando las regularidades y periodos.
- Constituyen un método de control ya que descubren las variaciones anormales debidas a alguna razón o
a un error.
- Se pueden descubrir errores de imprenta o de cálculo.
- En un único gráfico se pueden representar varias tablas estadísticas, lo que permitirá el estudio y
comparación de fenómenos relacionados entre sí o contrapuestos.
Inconvenientes:
- No sustituyen a la tabla estadística, sino que la completan.
- Deben rotularse con un título adecuado, en el que estén perfectamente delimitados los hechos
observados en el espacio y en el tiempo.
- La lectura de un gráfico es menos precisa que la de una tabla estadística, ya que se basa en
impresiones visuales de longitud, áreas o diversas tonalidades cromáticas.
- Las unidades de las escalas de los gráficos pueden ampliarse o reducirse, exagerando hechos
insignificantes o atenuando los importantes.
EE I 17
Ejemplo: Las exportaciones en miles de millones de ptas en España entre
el año 1981 y 1992 fueron las que se presentan a continuación.
7000
6000
8000
Exportaciones
5000
Exportaciones
6000
4000
4000
3000
2000
2000
0
1000
1980 1982 1984 1986 1988 1990 1992 1994
0 Años
1980 1982 1984 1986 1988 1990 1992 1994
Años
EE I 18
Distribuciones de frecuencias unidimensionales: variables no
agrupadas en intervalos:
Diagrama de barras Polígono de frecuencias
70 70
Número de familias
Número de familias
60 60
50 50
40 40
30 30
20 20
10 10
0 0
0 1 2 3 4 5 -1 0 1 2 3 4 5 6
Número de hijos Número de hijos
EE I 19
Distribuciones de frecuencias unidimensionales: variable agrupada
en intervalos.
Polígono de frecuencias
Histograma
10
10
8
8
Densidades
Densidades
6
6
4 4
2 2
0 0
[140,160) [160,170) [170,175) [175,180) [180,200) [140,160) [160,170) [170,175) [175,180) [180,200)
Estaturas
Estaturas
160
140
120 POLÍGONO ACUMULATIVO: Se
100
construye trazando, sobre cada intervalo,
Ni
80
60 líneas hasta la altura Ni o Fi de cada uno.
40
20
0
140 150 160 170 180 190 200
Estaturas
EE I 20
Distribuciones de frecuencias bidimensionales:
Nube de puntos
1600
1400
Renta nacional
1200
1000
800
600
400
200
0
25 30 35 40 45 50
Producción eléctrica
7000
6000
Exportaciones
5000
4000
3000
2000
1000
0
1980 1982 1984 1986 1988 1990 1992 1994
COORDENADAS POLARES: Se utilizan para
Años fenómenos que presentan movimientos
periódicos de 1 año.
COORDENADAS CARTESIANAS: Se
representan los periodos de tiempo frente a DIAGRAMAS DE
los valores de la variable a estudiar. Oeste
Norte
SECTORES: Se
trata de un círculo
Otras representaciones: Este
dividido en tantos
sectores como
PIRÁMIDES DE EDADES: Son histogramas modalidades del
Sur
de frecuencias, pero con los ejes cambiados. Se atributo.
usan mucho para estudiar la distribución de los ni
N º de grados = .360º
habitantes según su edad y sexo. N EE I 22
Estadística Empresarial I
Tema 3
Distribuciones de frecuencias
unidimensionales
2 3 6 ∑ ( x − x ).n
i =1
i i =0
Ventajas Inconvenientes
- Es fácil de calcular. - Es bastante sensible a valores
- Intervienen todos los valores de la extremos, lo cual puede distorsionar
variable su valor y su representatividad.
Ventajas Inconvenientes
- Intervienen todos los valores de la -Influencia de los valores pequeños de la
variable. variable, destacando su no determinación
- En algunos casos, es más representativa cuando alguno de los valores de la variable
que la media aritmética. es igual a 0.
Mo = x j / n j = max ni
i
xi ni xi ni
1 3 0 2
2 4 2 9
8 8 3 9
15 10 8 8
21 1 9 6
26 34
EE I 30
DISTRIBUCIÓN AGRUPADA EN INTERVALOS: En este caso, primero
se determinará el intervalo modal, que será aquel que tenga asociado
una mayor frecuencia absoluta (si la amplitud es constante) o densidad
de frecuencia (si la amplitud es variable).
INTERVALO MODAL
[ Lj,Lj+1)
EE I 32
di
di+1
di-1
h
Li Li+1
h h hi −1 hi −1
= i −1 ⇒ h = ai Mo = Li + ai
ai − h hi +1 hi −1 + hi +1 hi −1 + hi +1
con hi −1 = d i − d i −1 y hi +1 = d i − d i +1
NOTAS:
- El valor de la moda no coincide por ambos métodos, ya que son ambos métodos aproximados.
- Si la amplitud de los intervalos es constante, las densidades de frecuencia se sustituyen por las
frecuencias absolutas.
3
Mo = 1 + 2 = 1,857
4+3
5−4 1
Mo = 1 + 2 = 1+ 2 = 1,666
(5 − 4) + (5 − 3) 1+ 2
EE I 34
Mediana: Es aquel valor tal que, una vez ordenados los valores de la
variable en orden creciente, deja a su izquierda y a su derecha igual
número de frecuencias.
[Li ,Li+1) ni Ni
[2,4) 2 2
[4,7) 3 5
[7,9) 2 7
[9,12) 1 8
Ni=
[12,20) 4 12
12
Ni-1=
Teorema de Tales
h sobre ABC
a c h N / 2 − N i −1
= ⇒ =
b d ai ni
N / 2 − N i −1
⇒h= ai
Li= =Li+1
ni EE I 36
Por tanto, para obtener la mediana, usaremos la expresión:
N
− N i −1
Me = Li + 2 ai
ni
Ventajas Inconvenientes
- Facilidad de cálculo. - En su determinación no intervienen todos
- No es sensible a valores extremos, ya que los valores de la variable, por lo que no
no los tiene en cuenta. utiliza toda la información disponible.
EE I 37
RELACIONES ENTRE LAS MEDIDAS DE TENDENCIA CENTRAL:
k
( xi − P).ni
( xi − P).ni ∑
i =1 N
(Media de las desviaciones respecto a P)
Ventajas Inconvenientes
-Es una buena medida de dispersión - Viene expresada en una unidad distinta a
cuando se ha utilizado la media como la de la variable, concretamente, en las
medida de posición. unidades de la variable al cuadrado.
EE I 44
PROPIEDADES DE LA VARIANZA:
S X = 0.89 = 0.943
EE I 46
Medidas de dispersión relativas:
⇒ m2 = a2 − a12
EE I 50
Medidas de forma
Las medidas de forma establecen una tipología de las distribuciones
según la forma de su representación gráfica. Se van a clasificar en:
medidas de asimetría y medidas de curtosis o apuntamiento.
CAMPANIFORME
P = x = Me
EN FORMA DE U
P = x = Me
EE I 52
Distribución asimétrica : Puede serlo a la derecha o a la izquierda.
Una distribución es
asimétrica a la derecha o
positiva si la distribución
se orienta más hacia la
derecha que a la izquierda
de la media aritmética (los
datos están más dispersos
a la derecha de la media).
Una distribución es
asimétrica a la izquierda
o negativa si la
distribución se orienta más
hacia la izquierda que a la
derecha de la media
aritmética (los datos están
más dispersos a la
izquierda de la media).
EE I 53
Si la distribución es asimétrica a la derecha, de las dos ramas de la curva que
separa la media, la de la derecha es más larga que la de la izquierda. Si es
asimétrica a la izquierda, ocurrirá lo contrario.
COEFICIENTE DE APUNTAMIENTO
DE FISHER
m4 a4 − 4a1a3 + 6a12 a2 − 3a14
g2 = 4 =
S S4
g 2 < 3 ⇒ Platicúrtica
g 2 = 3 ⇒ Mesocúrtica
g 2 > 3 ⇒ Leptocúrtica
CURVA DE LORENZ:
0 ≤ pi , qi ≤ 100
EE I 59
xi ni xi.ni Ni ui pi=(Ni/N).100 qi=(ui/uk).100
x1 n1 x1.n1 N1 u1 p1 q1
x2 n2 x2.n2 N2 u2 p2 q2
: : : : : : :
: : : : : : :
xk nk xk.nk Nk uk pk=100 qk=100
N uk
• Si los valores de la
variable están ordenados
de menor a mayor, se
verifica que pi ≥ qi.
• La curva de Lorenz se
situará entre los dos
casos extremos que se
consideran.
EE I 62
ÍNDICE DE GINI:
k −1
∑(p − q ) i i
CASOS EXTREMOS
IG = i =1
k −1
, 0 ≤ IG ≤ 1 Concentración mínima: Concentración máxima:
∑p
i =1
i pi = qi , i = 1, ..., k. qi = 0 , i = 1, ..., k-1.
k −1 k −1 k −1
∑(p − q ) i i
0 ∑(p − q ) ∑ p i i i
k-1 Æ 98’33 94’50 3’83 Por tanto, podemos concluir que la distribución está poco
242’32 59’42 concentrada, estando los salarios bastante bien repartidos.
Si bien el índice de Gini tiene la ventaja de resumir en una sola cifra las
complejas informaciones expresadas en la curva de Lorenz, puede
darse el caso de que dos distribuciones de frecuencias diferentes
presenten el mismo valor del índice de Gini, aún siendo la estructura del
reparto de los valores de cada variable diferentes.
Ejemplo: Las distribuciones de
frecuencias A y B generan las curvas
de Lorenz siguientes, que muestran
una estructura de reparto distinta. Sin
embargo, puede comprobarse que: .
I GA = I GB
EE I 64
Estadística Empresarial I
Tema 4
Distribuciones de frecuencias
q-dimensionales
Ejemplo: Sobre un grupo de empresas podemos observar sus ingresos (X) y sus gastos (Y),
o bien, su número de trabajadores (X), los salarios que perciben (Y) y las horas de trabajo
que realizan (Z). Sobre un grupo de personas estudiamos su altura (X) y su peso (Y).
∑∑ n
i =1 j=1
ij =N ∑∑ f
i =1 j=1
ij =1 ∑n
i =1
i. =N ∑n j=1
.j =N
EE I 67
Ejemplo: En una determinada oposición se quiere estudiar la relación
entre la edad de los 15 aspirantes (X) y la calificación que han obtenido
(Y). A partir de las observaciones obtener la tabla de correlación.
X 23 25 26 26 25 21 28 23 28 22 26 26 22 26 26
Y 3 3 4 3 8 4 5 5 5 4 3 3 6 3 4
X Y X Y
n ij
xi ni. yj n.j xi / Y=yj ni/j yj / X=xi nj/i n ij f
fi / j = = N = ij
x1 n1. y1 n.1 x1 n1j y1 ni1 n . j n . j f. j
N
x2 n2. y2 n.2 x2 n2j y2 ni2 n ij
: : : : : : : : f j/ i
n
= ij = N = ij
f
n i. n i. f i.
xh nh. yk n.k xh nhj yk nik N
N N n.j ni.
EE I 69
Ejemplo: Para el ejemplo anterior de la oposición, obtener:
X (edad) 23 25 26 26 25 21 28 23 28 22 26 26 22 26 26
Y (nota) 3 3 4 3 8 4 5 5 5 4 3 3 6 3 4
n i. n . jn ij
X e Y son independientes ⇔ f ij = = = f i.f. j , ∀i, j
N N N
Si X e Y son independientes estadísticamente, entonces fi/j = fi. y fj/i = f.j
nij ni. n. j nij ni. n. j
n n n n
fi / j = ij = N = N N = i. = f i. f j /i = ij = N = N N = . j = f. j
n. j n. j indep n. j N ni. ni. indep ni. N
N N N N EE I 70
Distribuciones Q-dimensionales
Habitualmente, en los problemas reales intervienen más de dos
características, por lo que se hace necesario el estudio de las distribuciones Q-
dimensionales.
Dada una variable Q-dimensional (X1, X2, ..., XQ), el conjunto de observaciones
de esta variable acompañadas de sus correspondientes frecuencias absolutas
conjuntas, constituye la distribución conjunta Q-dimensional, que se tabula de
la siguiente forma:
X1 X2 ... XQ n ( X1 ,X 2 ,...,X Q ) X Y Z n ( X ,Y , Z)
x11 x21 ... xQ1 n1 x1 y1 z1 n1
x12 x22 ... xQ2 n2 x2 y2 z2 n2
... ... ... ... ... ... ... ... ...
Q=3
x1i x2i ... xQi ni xi yi zi ni
... ... ... ... ... ... ... ... ...
x1h x2h ... xQh nh xh yh zh nh
N N EE I 71
DISTRIBUCIONES MARGINALES Y CONDICIONADAS DE (X,Y,Z)
EE I 73
COVARIANZA Se trata de una medida que hace referencia a
la dependencia lineal existente entre ambas
h k ( x i − x ) ( y j − y) n ij variables. Si la covarianza es positiva, las
m11 = ∑∑ = SX Y dos variables varían en el mismo sentido, y si
i =1 j=1 N
es negativa, lo harán en sentido opuesto.
INDEPENDENCIA Y COVARIACIÓN:
Momentos de órdenes r1, r2, ..., rQ Momentos de órdenes r1, r2, ..., rQ
respecto al origen respecto a la media
(x1i − x1) 1 (x2i − x2 ) 2 ...(xQi − xQ ) Q ni
r r r k r r r
x 11i x 22i ...x QiQ n i
mr1 r2...rQ = ∑
k
a r1 r 2 ...r Q = ∑
i =1 N i=1 N
MATRIZ DE COVARIANZAS
Casos particulares:
a100...0 = x1 a 010...0 = x 2 L a 00...01 = x Q ⎛ S11 S12 L S1Q ⎞
⎜ ⎟
⎜ S21 S22 L S2 Q ⎟
m 200...0 = S11 m 020...0 = S22 L m 00...02 = SQQ S=⎜ ⎟
⎜ M M M M ⎟
m1100...0 = S12 m10100...0 = S13 L m 00...011 = SQ −1Q ⎜S ⎟ EE I 75
⎝ Q1 SQ 2 L SQQ ⎠
Estadística Empresarial I
Tema 5
Regresión y correlación
bidimensional y múltiple
∂H ∂H ∂H
=0 =0 L =0
∂ a1 ∂ a2 ∂ aR
AJUSTE LINEAL: ⎧∂ H N N
⎪ ∂ a = 0 ⇒ ∑ yi = N a + b ∑ x i
⎪ i =1 i =1
yti = f (xi, a, b) = a + b xi ⎨
⎪∂ H = 0 ⇒ x y = a x + b x2
N N N
⎪⎩ ∂ b ∑
i =1
i i ∑
i =1
i ∑
i =1
i
AJUSTE PARABÓLICO: ⎧∂ H N N N
⎪∂a = 0 ⇒ ∑ y i = N a + b ∑ x i + c ∑ x 2
i
⎪ i =1 i =1 i =1
⎪∂ H N N N N
⎪∂ b i =1 i =1 i =1 i =1
⎪∂ H N N N N
⎪ = 0 ⇒ ∑ x i y i = a ∑ x i + b ∑ x i + c ∑ x i4
2 2 3
⎩∂c i =1 i =1 i =1 i =1
EE I 80
AJUSTE EXPONENCIAL:
⎧N N
⎪∑ ln y i = N ln a + ln b ∑ x i
xi ⎪ i =1 i =1
yti = f (xi, a, b) = a b ⎨N N N
⎪ x ln y = ln a x + ln b x 2
ln yti = ln a + xi ln b ⎪⎩∑
i =1
i i ∑
i =1
i ∑
i =1
i
AJUSTE POTENCIAL:
⎧N N
⎪∑ ln y i = N ln a + b ∑ ln x i
b ⎪ i =1 i =1
yti = f (xi, a, b) = a x i ⎨N N N
⎪ ln x ln y = ln a ln x + b (ln x ) 2
ln yti = ln a + b ln xi ⎪⎩∑
i =1
i i ∑i =1
i ∑
i =1
i
AJUSTE HIPERBÓLICO: ⎧N N
1
⎪∑ i y = N a + b ∑
1 ⎪ i =1 i =1 x i
yti = f (xi, a, b) = a + b ⎨N
xi ⎪ 1 y =a
N
1 N
1
⎪⎩∑ ∑ ∑
i + b 2
i =1 x i i =1 x i i =1 x i
EE I 81
TIPOS DE AJUSTES
EE I 82
Ejemplo 1: Ajustar a las siguientes Ejemplo 2: Ajustar a las siguientes
observaciones la función que mejor observaciones la función que
explique Y a partir de X. Los datos mejor explique Y a partir de X. Los
son: (1,2), (2,2), (3,5), (4,6), (5,8). datos son: (1,2), (2,18), (3,36),
(4,12), (5,1).
Y = - 0’2 + 1’6 X
N N N ⎬ ⇒ ⎨
X
2⎪ ⎪ SXY
∑
i =1
x i yi = a ∑ x i + b ∑ x i
i =1 i =1
⎪
⎭ ⎩ ⎪
a = y− 2 x
SX
∂2 H ∂2 H
∂ a2 ∂a∂b = 2.N > 0
>0 y H= 2 >0 ∂a 2
∂a 2
∂ H ∂ H
2
EE I 85
Coeficiente de determinación y de correlación lineal
Una vez que se ha realizado un ajuste para tratar de explicar una
variable Y en función de otra variable X, necesitaremos obtener un
indicador de la bondad del ajuste planteado.
VT = S = ∑
2 ∑d 2
i ∑ (y i −yt i )2
VT = VE + VR
Y
i =1 N VR = S2ry = i =1
= i =1
EE I 86
N N
Para medir la bondad del ajuste planteado podría considerarse la
proporción de la varianza total que queda explicada por la regresión.
−
2
VE VT VR VR S
Coeficiente de determinación R2 = = = 1− = 1 − r2y
VT VT VT SY
Así, cuanto mayor sea el valor de R2, mejor será el ajuste realizado, ya
que la varianza residual sería pequeña.
R2 = 0 ⇔ S2ry = S2Y (Ajuste pésimo)
0 ≤ R2 ≤ 1
R2 = 1 ⇔ S2ry = 0 (Ajuste perfecto)
Para el caso de la regresión lineal, la varianza residual tomará el valor
2
siguiente: S2 = S2 − SXY
ry Y
S2X
⎛ 2 S2XY ⎞
SY − ⎜⎜ SY − 2 ⎟⎟
2
Coeficiente de S 2
S 2
− S 2
⎝ S X ⎠ S 2
r2 = 1− 2 =
r y Y r y
= = XY
determinación lineal SY S2Y S2Y S2X S2Y
EE I 88
CASOS POSIBLES:
En resumen:
EE I 91
Ejemplo: Supongamos que hemos obtenido una recta de regresión que
nos explica el gasto mensual por individuo en bebidas alcohólicas (Y) en
función del sueldo mensual (X). Predecir el gasto en bebidas alcohólicas
para un individuo que gana mensualmente 300000 ptas, y para otro que
gana 700000 ptas.
Y = - 20000 + 0’22 . X
EE I 93
Estadística Empresarial I
Tema 7
Números Índices
I 0 (X)
Índice de producto de magnitudes: I 0 (X .Y) = I 0 (X ) I 0 (Y)
t t t
(a) Indicar cúanto ha variado el precio de dicho artículo para cada año
con respecto al año 1998.
(b) Calcular los índices de precios para cada año considerando como
periodo base el año 1999.
∑w ∑w
N
I1w1 + ... + I N wN ∑I w N N N i i
∏I
i i ∑ wi ∑ wi I =
* i =1
= i =1
I =
*
= i =1
I =
* i =1 w1
I ...I wN
= i=1 wi H
1 1 N
1
N
∑w i ∑w
N
i
G 1 N
i =1
i
I1
w1 + ... +
IN
wN ∑I
i =1
wi
i
i =1 i =1
EE I 100
Índice media agregativa
ponderado
N
x w + ... + x Nt wN ∑x w it i
I A* = 1t 1 = i =1
x10 w1 + ... + x N 0 wN N
∑x
i =1
i0 wi
NOTAS:
• Los sistemas (1) y (2) corresponden a situaciones reales, mientras que (3) y (4) no.
• Los sistemas (2) y (3) tienen el gran inconveniente de que necesitan conocer las
cantidades consumidas en el periodo actual, lo cual no es simple posible.
• Los sistemas más utilizados son el (1) y (3).
Si la magnitud X es la cantidad, se utilizan los mismos sistemas de ponderación,
cambiando precios (p) por cantidades (q).
EE I 101
Índice de precios de Laspeyres: Se trata de un índice media aritmética
ponderado obtenido usando el sistema de ponderación (1): wi = pi0 qi0
N N N
p it
∑I w i i ∑
i =1 p
pi0q i0 ∑p q it i0
Determina el incremento de valor que experimenta un
conjunto de artículos o bienes entre los periodos 0 y t,
L p = I ( P) = i =1
N
= i0
N
= i =1
N suponiendo que las cantidades consumidas son las
∑w
i =1
i ∑p i =1
i0 qi0 ∑p i =1
i0 qi0 mismas para ambos periodos e iguales a qi0.
DEFLACTACIÓN:
Pp 0
t
corregir el efecto de la pérdida del valor del dinero y hacer
i =1 comparaciones en una unidad común.
Tema 8
Series Temporales
EE I 111
Naturaleza de las Series Temporales
Una serie temporal está formada por varias componentes, que son
las encargadas de explicar los cambios observados en la variable a lo
largo del tiempo. La descomposición más común es la que distingue las
componentes tendencial, estacional, cíclica y aleatoria, propuesta por
el enfoque clásico de las series temporales.
EE I 112
2. Variaciones estacionales: Son las oscilaciones a corto plazo que se
reproducen de forma periódica más o menos regular con periodo
constante igual o inferior al año, debidas principalmente a las influencias
de las estaciones del año, causas climatológicas, costumbres, etc.
Ejemplos: Las temperaturas medias mensuales
tienen cada año un máximo en verano y un mínimo
en invierno, por lo que presentan periodicidad anual;
el volumen de compras diarias que se realiza en un
supermercado presenta máximos y mínimos a
principios y a finales de mes, respectivamente, luego
presenta periodicidad mensual,...
En la gráfica siguiente se representa la serie del
IPI (Índice de Producción Industrial) y se observa la
caída del mes de agosto, comportamiento que se
repite de forma regular y periódica.
3. Movimientos cíclicos: Son movimientos a medio plazo que se
reproducen de manera periódica, pero no tan regular como los de la
componente estacional. Con un periodo no constante y más amplio que
los periodos estacionales, los ciclos observados en series económicas
están asociados principalmente a la alternancia de etapas de prosperidad
y depresión de la actividad económica. EE I 113
4. Variaciones irregulares o aleatorias: Son comportamientos que no
muestran carácter periódico ni regular y que se deben a fenómenos
catastróficos o fortuitos que afectan de manera casual a la variable, como
pueden ser inundaciones, terremotos, incendios, accidentes, huelgas,...
EE I 115
Análisis de la Tendencia Secular
Los procedimientos estadísticos que se utilizan para estimar la
componente tendencial (responsable del comportamiento a largo plazo
de la serie) se dividen en analíticos y no analíticos.
MÉTODOS NO ANALÍTICOS:
EE I 116
2. Ajuste por medias móviles: Consiste en hallar las medias de cada
grupo de R observaciones consecutivas, siendo R generalmente el
número de observaciones anuales de las que se dispone.
MEDIAS MÓVILES DE ORDEN R
R IMPAR R PAR
y R +1 + y R +3
y1 + y 2 + ... + y p
y R +1 = y R +2 = 2 2
2
R 2 2
y 2 + y 3 + ... + y p +1 y R +3 + y R +5
y R +3 = y R +4 = 2 2
R
2 2 2
y 3 + y 4 + ... + y p + 2 y R +5 + y R +7
y R +5 =
2
R y R +6 = 2 2
2 2
M
M
∑ Y = N .a + b ∑ t
i =1
i
i =1
i
N N N
Y = 319’92 + 9’85 t
∑t Y =a ∑t
i =1
i i
i =1
i + b ∑ t i2
i =1
EE I 123
Ejemplo: Se cuenta con una serie temporal de los precios medios por
trimestre de un determinado producto, entre los años 1995 y 1998.
EE I 124
• Los IGVE miden el nivel porcentual
del componente estacional con
respecto al nivel medio o tendencia.
• La media de los IGVE debe ser
igual a 100 (o a 1), indicando que en
un periodo anual las fluctuaciones
estacionales se deben compensar; al
no poder existir fluctuaciones
estacionales superiores al año.
• La magnitud en estudio sufre un
incremento de un 5’12 % respecto al
valor de la tendencia, debido a la
estacionalidad observada en el 1er
trimestre. Se produce, también, una
disminución del 16’25 % respecto al
valor tendencial, debido a la
estacionalidad del 2º. Se obtiene una
disminución del 2’55 % respecto al
valor tendencial, causada por la
estacionalidad del 3º; y, por último,
se produjo un incremento del 12’75
% respecto a la tendencia, debido a
la estacionalidad del 4º trimestre.
EE I 125
Desestacionalización:
Yi Y
Yd i = = i
I.G.V.E. E i
30 30
25 25
Ydi
Yi
20 20
15 15
10 10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Tiem po (t) Tiem po (t)
Yi Yd i
Yi = Ti . E i . Ci . Ii ⇒ Ci . Ii = =
Ti . E i Ti
EE I 130
Movimientos Irregulares
Son comportamientos que no muestran carácter periódico ni regular y
que se deben a fenómenos catastróficos o fortuitos que afectan de
manera casual a la variable.
Ci . Ii
Ii =
Ci
Cuanto más cerca esté cada valor Ii a 100 (o a 1, en tantos por uno),
menor será el residuo asociado a esa observación.
EE I 131
Los valores obtenidos para la componente irregular son los siguientes:
EE I 132
COMPONENTES OBTENIDAS PARA LA SERIE TEMPORAL DEL EJEMPLO
EE I 133
Estadística Empresarial I
Tema 9
Teoría de la probabilidad
ESTADÍSTICA
ESTADÍSTICA INFERENCIA
PROBABILIDAD
DESCRIPTIVA ESTADÍSTICA
(a) Asociativa: A U (B U C) = (A U B) U C A I (B I C) = (A I B) I C
(b) Conmutativa: A U B = B U A AIB = BIA
(c) Elemento neutro: A U ∅ = A AIE = A
(d) Distributiva: A U (B I C) = (A U B) I (A U C) A I (B U C) = (A I B) U (A I C)
(e) Leyes de Morgan: A U B = A I B AIB= AUB
(1) A U (B I A )
(2) (A U (A U B)) I B
EE I 140
La probabilidad y sus enfoques
Ya se ha indicado que en cualquier experimento aleatorio es
imposible predecir el resultado de antemano. Sin embargo, la
Probabilidad intenta explicar la aparición de los distintos resultados.
N º de casos favorables
Pr obabilidad =
N º de casos posibles
Ejemplo: Para el experimento que consiste en extraer una carta de la
baraja española, determinar la probabilidad de los siguientes sucesos:
(a) Salir una copa (b) Salir un rey (c) Salir una figura EE I 141
Interpretación frecuentalista: Se basa en la posibilidad de repetir un
experimento bajo las mismas condiciones. Al aumentar el número de
pruebas realizadas n, la frecuencia relativa f de un suceso A tiende a
estabilizarse en torno a un valor fijo. Se entiende por frecuencia relativa
asociada a un suceso el cociente entre el número de veces que ocurre,
m, y el número de pruebas realizadas, n.
m n (A)
f (A) = = = P (A)
n n
Ejemplo: Sea el experimento que consiste en lanzar un clavo al aire,
pudiendo caer de punta o de lado (no equiprobables). Suponiendo que se
repite el experimento 1000 veces y que en 12 de ellas cayó el clavo de
punta, determinar la probabilidad de que el clavo caiga de punta.
EE I 143
Definición axiomática de probabilidad
Esta definición se basa en un conjunto de axiomas que permitirán
construir un modelo matemático de la probabilidad que sea capaz de
explicar las regularidades observadas en los sucesos asociados a un
experimento aleatorio.
como la frecuentalista de la U Ai ∈ Å
i =1
probabilidad.
Nota 2: A la terna (E, Å, P) se le
denomina espacio probabilístico. EE I 144
AXIOMAS DE KOLMOGOROV
Axioma 1 : ∀ A ∈ Å : 0 ≤ P (A) ≤ 1
Axioma 2 : P (E ) = 1
Axioma 3 : Sea A1 , A 2 ,..., A k ∈ Å una sucesión de sucesos
incompatibles dos a dos (A i ∩ A j = ∅, ∀ i ≠ j)
⎛ k ⎞ k
Entonces : P ⎜⎜ U A i ⎟⎟ = ∑ P (A i )
⎝ i =1 ⎠ i =1
Nota: Estos tres axiomas son equivalentes a las propiedades de las frecuencias
relativas.
CONSECUENCIAS DE LOS AXIOMAS:
()
(a ) ∀A ∈ Å : P A = 1 − P (A) (b) P (∅) = 0
(c.1) ∀ A, B ∈ Å : P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
(c.2) ∀ A, B, C ∈ Å : P (A ∪ B ∪ C) = P (A ) + P (B) + P (C) − P (A ∩ B) −
− P ( A ∩ C ) − P ( B ∩ C) + P ( A ∩ B ∩ C) EE I 145
A ∪ B = (A − B) ∪ (A ∩ B) ∪ (B − A)
R = P (A) + P (B) + P (C)
A = (A − B) ∪ (A ∩ B)
S = P (A ∩ B) + P (A ∩ C) + P (B ∩ C)
B = (B − A) ∪ (A ∩ B)
T = P ( A ∩ B ∩ C)
P (A ∩ B)
P (A / B) =
P (B)
Esta definición se aceptará si verifica los tres axiomas de
Kolmogorov, es decir, si verifica que:
Axioma 1 : ∀ A ∈ Å : 0 ≤ P (A/B) ≤ 1
Axioma 2 : P (E / B) = 1
Axioma 3 : Sea A1 , A 2 ,..., A k ∈ Å una sucesión de sucesos
incompatibles dos a dos (A i ∩ A j = ∅, ∀ i ≠ j)
⎛ k ⎞ k
Entonces : P ⎜⎜ U A i / B ⎟⎟ = ∑ P (A i / B)
⎝ i =1 ⎠ i =1
EE I 148
Sea un espacio probabilístico (E, Å, P), y dos sucesos cualesquiera A y
B de Å. Se dice que A y B son estocásticamente independientes
cuando la ocurrencia de B no influye en la de A, y viceversa. En este
caso, se verificará que:
P (A / B) = P (A) P (B / A) = P (B)
P (A ∩ B) = P (A) . P (B)
EE I 149
En general, n sucesos A1, A2, ..., An son globalmente independientes
si se verifica que:
P (A i ∩ A j ) = P (A i ) . P (A j ) , ∀ i ≠ j
P (A i ∩ A j ∩ A k ) = P (A i ) . P (A j ) . P (A k ) , ∀ i ≠ j ≠ k
LLLLLLLLLLLLLLLLLLLLL
P ( A1 ∩ A 2 ∩ L ∩ A n ) = P ( A1 ) . P ( A 2 ) L P ( A n )
Diremos que los sucesos A1, A2, ..., An son independientes dos a dos
si cualquier par de dichos sucesos son estocásticamente independientes.
Nota: Si A1, A2, ..., An son globalmente independientes Æ son
independientes dos a dos.
P (A j ) . P (B / A j )
P (A j / B) = n
∑ P (A ) . P (B / A )
i =1
i i
EE I 153
Estadística Empresarial I
Tema 6
Estadística de Atributos
: : : : : : : : a1 n1. b1 n.1
: : : : : : : : : : : :
h k h k
∑n = ∑n
i =1
i.
j=1
.j = ∑∑ n ij = N
i =1 j=1
EE I 156
Independencia
De análoga forma al caso de las variables, podemos decir que, dados
dos atributos A y B:
n ij
n i. n . j n i. n . j
A y B son independientes ⇔ = ∀ i, j ⇔ n ij = ∀ i, j
N N N N
EE I 157
Tablas de contingencia 2x2
A continuación, vamos a tratar de obtener un coeficiente que
cuantifique el grado de asociación entre dos atributos, en el caso en que
los dos atributos presenten dos modalidades.
a2 N . H ij
n21 n22 n2.
Q ij = i = 1, 2 ; j = 1, 2
n11 n 22 + n12 n 21
n.j n.1 n.2 N
siendo H = F.O. – F.T.
χ2
T =
2
N (h − 1) (k − 1)
Propiedades:
(1) 0 ≤ T2 ≤ 1, sea cual sea el número de modalidades de cada atributo (h y k).
(2) T2 = 0 Æ Independencia entre los atributos.
(3) T2 = 1 Æ Perfecta asociación entre los atributos.
Ejemplo: La siguiente tabla recoge la distribución de las calificaciones del primer
parcial de EEI del curso 91/92 para los 398 alumnos matriculados, teniendo en
cuenta el grupo al que pertenecen.
Curso / Nota Susp. Aprob. Notab. Sobre. Total
Discutir la asociación
1º A 86 21 8 3 118
entre el grupo de
1º B 73 27 7 0 107
cada alumno y la
1º C 44 19 2 0 65 calificación obtenida.
1º D 61 34 9 4 108
Total 264 101 26 7 398 EE I 161
Correlación ordinal
Existe un tipo de atributos que, aunque no se puedan medir
numéricamente, son susceptibles de algún tipo de ordenación.
Estaremos, pues, ante un atributo jerarquizado, que se caracteriza
porque entre sus modalidades se puede establecer una ordenación o
clasificación, según dos criterios diferentes de ordenación.
X 1 2 3 4 5
Y 3 1 4 2 5
EE I 162
Correlación por rangos de Spearman
Sea A el atributo jerarquizado según los criterios X e Y.
N
Así pues: - 1 ≤ ρ ≤ 1
ρ=0 Independencia
EE I 163
Correlación por rangos de Kendall
Sea A el atributo jerarquizado según los criterios X e Y.
S Se basa en el concepto de
Coeficiente de correlación por τ = N .( N − 1) inversión de los rangos
rangos de Kendall 2 respecto al orden natural.
150,00
(5) Menaje 64,10 67,08
100,00
(6) Medicina 27,53 34,76
50,00
(7) Transporte 153,23 163,89 0,00
1 2 3 4 5 6 7 8 9 10 11 12
(8) Comunicaciones 27,35 27,41
IPC Nacional IPC Canarias
(9) Ocio y cultura 68,34 77,62
101,3 101,4 102,2 103,6 103,9 104 103,2 103,5 103,9 104,9 105,1 105,5
01/03 02/03 03/03 04/03 05/03 06/03 07/03 08/03 09/03 10/03
105 105,2 106 106,8 106,7 106,8 106,1 106,6 106,9 107,7
109
Índice con base 2001
108
107
106
105
104
103
102
101
100
nov-01 feb-02 may-02 sep-02 dic-02 mar-03 jun-03 oct-03 ene-04
Meses