You are on page 1of 61

A Previso com a Metodologia de Box-Jenkins

1. Introduo

Suponha que exista um sistema que atue como um filtro (Figura 1), que
estimulado por uma srie de rudos brancos, resultantes de um processo de gerao de
nmeros aleatrios, e que com esse estmulo seja gerada pelo sistema uma seqncia de
valores observados seguindo um padro, que corresponde srie temporal Yt.

rudo srie
Filtro Yt
branco temporal

Figura 1 Gerao de srie temporal Yt

Figura 2 Associao de modelo srie de observaes Yt

Em situaes da realidade, tem-se o caminho inverso ou seja, conhece-se o


conjunto de observaes seqenciais Yt geradas pelo sistema em questo, ao qual busca-
se associar um modelo que corresponda aos processos internos ao sistema que as gerou
(Figura 2). Uma vez que se estabelea um modelo operacional para essa representao,
a srie aleatria et de valores em torno de zero corresponde seqncia de valores
(resduos) que resulta ao extrair de Yt os valores obtidos com o modelo ajustado essa
mesma srie de valores observados Yt.

A metodologia de Box-Jenkins para a previso se baseia no ajuste de modelos


tentativos denominados ARIMA a sries temporais de valores observados de forma que
a diferena entre os valores gerados pelos modelos e os valores observados resulte em
sries de resduos de comportamento aleatrio em torno de zero.

Os modelos ARIMA (autoregressivos integrados e de mdias mveis) so


capazes de descrever os processos de gerao de uma variedade de sries temporais para
os previsores (que correspondem aos filtros) sem precisar levar em conta as relaes
econmicas, por exemplo, que geraram as sries.

1
Segundo a sistemtica da metodologia de Box-Jenkins os modelos ARIMA
descrevem tanto o comportamento estacionrio como o no-estacionrio. Dessa forma,
pode-se afirmar que essa uma metodologia de modelagem flexvel em que as
previses com base nesses modelos so feitas a partir dos valores correntes e passados
dessas sries.

Pode-se associar o conceito inicial de um filtro estimulado por uma srie


aleatria do tipo rudo branco metodologia de Box-Jenkins (Figura 3).

Figura 3 Os filtros de mdias mveis, autoregressivo e de integrao no-estacionria

Na Figura 3 representado um conjunto de sucessivos filtros aos quais


associam-se os parmetros dos modelos ARIMA (p,d,q) que representam os sistemas
estimulados pela srie et que geraram a srie temporal Yt: o filtro de mdias mveis
(parmetro q), o filtro autoregressivo estacionrio (parmetro p) e o filtro de integrao
no-estacionrio (parmetro d).

2. A Estacionariedade da Srie Temporal

Os modelos ARIMA ou Box-Jenkins so excelentes modelos de previso de


curto prazo (Granger & Newbold, 1977). Resultados de anlises com esses modelos
mostram que os melhores resultados (previses) so obtidos com de 5 a 10 anos de
informao (mensal), particularmente na presena de sazonalidade. Como j visto, a
importncia do processo observado ser estacionrio a possibilidade de fixar
parmetros do modelo vlidos para previso do futuro a partir do passado. Assim, como
primeiro passo para essa modelagem so realizados procedimentos para a remoo da
no-estacionariedade.

2
A anlise das estatsticas bsicas das sries estacionrias permite separar a
estacionariedade em dois grupos:

(1) estacionariedade no amplo senso: mdias, varincias e covarincias


constantes no tempo.

(2) estacionariedade no estrito senso: probabilidade de uma dada flutuao


no processo em torno da mdia a mesma em qualquer momento do
processo.

Na prtica, aceita-se que as sries observadas sejam sries fracamente


estacionrias, situaes nas quais garante-se apenas mdias e varincias invariantes no
tempo. Existe uma equivalncia entre os modelos ARIMA e os modelos ARMA
(autoregressivos e de mdias mveis). Esses ltimos so ajustados a sries j
estacionrias transformadas pelo mtodo das diferenas de ordem d ou seja, cujas sries
originais so sries no-estacionrias homogneas (assim denominadas por ter sido
possvel obter a estacionariedade com um nmero finito de diferenciaes), como a
srie do exemplo a seguir (Figuras 4, 5, 6 e 7).

Figura 4 Srie de oferta monetria ajustada sazonalmente

3
t = 2, ..., n.
Varincia no-constante no tempo.
Figura 5 Srie das 1as diferenas

t = 3, ... , n.
Zt = (Yt Yt-1) (Yt-1 Yt-2) = Yt 2Yt-1 + Yt-2.
Varincia no-constante no tempo.
Figura 6 Srie das 2as diferenas.

Yt = logYt
*

Varincia constante.
Srie pode ser dita estacionria.
A srie original dita homognea de ordem d = 1.
Figura 7 Srie das primeiras diferenas dos dados transformados.

4
Nas figuras 4, 5 e 6 so mostrados os grficos de uma srie original de oferta
monetria ajustada sazonalmente, onde existe clara tendncia, e das respectivas sries
transformadas de primeiras e segundas diferenas. Observa-se que a varincia no-
constante no tempo em todas elas. Nesse caso feita a transformao logartmica nos
dados originais e em seguida obtida a srie das primeiras diferenas da srie Yt* = log Yt

ou seja: Yt* , para a qual pode-se aceitar que a varincia constante e, assim, a srie

original dita homognea de primeira ordem (d = 1) (Figura 7).

luz da anlise de autocorrelao, seguem exemplos do uso do correlograma


para identificar sries temporais estacionrias para dados no sazonais:

1. Srie pode se considerada estacionria quando h truncamento abrupto


ou padro de decaimento rpido (Figuras 8 e 9).

Figura 8 Valores das autocorrelaes significativos nos


perodos iniciais de defasagem e truncamento aps

Figura 9 Valores das autocorrelaes significativos decaindo bem


rpido para valores prximos de zero

5
2. Srie pode ser considerada no-estacionria quando h padro de
decaimento lento para zero (Figura 10).

Figura 10 Valores das autocorrelaes significativos decaindo


extremamente devagar segundo padres de decaimento

Como exemplos de padro de decaimento podem ser observados os padres


representados na Figura 11:

a) decaimento exponencial sem oscilaes

b) decaimento exponencial com oscilaes

c) decaimento em onda senoidal

Figura 11 Exemplos de padro de decaimento

6
2.1 Um Teste para Verificar a Estacionariedade: O Teste da Raiz Unitria de
Dickey-Fuller

Seja o processo estocstico de raiz unitria:

Yt = Yt-1 + t , -1 1,

onde t um termo de erro de rudo branco.

Quando = 1 (raiz unitria), o processo gerador da srie Yt o passeio


aleatrio e a srie no-estacionria.

Subtraindo-se Yt-1 dos dois lados da igualdade, escreve-se:

Yt Yt-1 = Yt-1 Yt-1 + t

Yt-1 = Yt-1 + t , (1)

onde = - 1.

Um procedimento de teste da raiz unitria pode ser aplicado equao (1).


Dessa forma, estima-se os parmetros da equao (1) e testa-se se = 0.

Se = 0, = 1 raiz unitria e a srie original no-estacionria.

Entretanto, a estatstica t de Students no se aplica nesse caso (Gujarati, 2006).


Usa-se o teste de Dickey-Fuller, que avalia se o valor da estatstica t estimado para o
parmetro de Yt-1 segue a distribuio da estatstica (tau). Dessa forma, o teste de
Dickey-Fuller verifica a hiptese nula ( = 0) rejeitada ou no em determinados nveis
de significncia estatstica, conforme valores tabulados (Gujarati, 2006, pg. 791). Se o
valor em mdulo de t < |estatstica |, no possvel rejeitar a hiptese nula ou seja, a
hiptese de no-estacionariedade.

O procedimento do teste deve ser mais sofisticado, entretanto. estimao da


equao (1) (e conseqente teste de hiptese sobre = 0), devem se juntar a estimao
das variantes possveis do processo de passeio aleatrio e os respectivos testes de
hipteses sobre = 0:

Yt = 1 + Yt-1 + t (2)

Yt = 1 + 2 t + Yt-1 + t (3)

onde t o tempo ou a varivel de tendncia.

7
Nessas duas variantes [(2) e (3)], = 0 significa que h raiz unitria ou seja, a
srie Yt no-estacionria. A hiptese alternativa que < 0, significando - 1 < 0 ou
seja < 1 (observe que > 1 no aceita por implicar em exploso de valores da srie).

Se a hiptese nula for rejeitada, isso significa que (Gujarati, 2006):

Yt uma srie temporal estacionria com mdia zero: equao (1)

Yt uma srie temporal estacionria com mdia diferente de zero: equao (2)

Yt uma srie estacionria em torno de tendncia determinstica: equao (3)

2.2 O Teste F de Dickey-Fuller

Suponha-se que a varivel Yt possa ser descrita por:

Yt = + t + Yt-1 + t (4)

Dickey e Fuller derivaram a distribuio para o estimador e geraram um teste


para a hiptese de Yt se comportar como o passeio aleatrio isto , sob a hiptese que
= 0 e = 1.

O teste pode ser aplicado para uma verso geral da equao (4) ou seja, sob a
suposio de que Yt possa ser descrita por:

Yt = + t + Yt-1 + 1 Yt-1 + t,

onde Yt-1 = Yt-1 Yt-2.

Outras defasagens Yt-i podem ser includas na equao, mas o teste seria o
mesmo.

Com base nos Mnimos Quadrados Ordinrios, so estimados os parmetros


das regresses irrestritas (5) e restrita (6) seguintes:

Yt Yt-1 = + t + ( - 1) Yt-1 + 1 Yt-1 (5)

Yt Yt-1 = + 1 Yt-1 (6)

8
O procedimento do teste calcula a estatstica F como a razo:

(N K) (ESS R ESS IR )
F=
q (ESS IR )

onde:

ESSR e ESSIR so a soma do quadrado dos resduos nas regresses restrita e


irrestrita, respectivamente,

N o nmero de observaes,

K o nmero de parmetros estimados na regresso irrestrita, e

q o nmero de restries de parmetros (no caso: = 0; = 1)

O valor calculado de F comparado com os valores crticos da estatstica


tabulada em uma tabela apropriada desenvolvida por Dickey e Fuller (Pindyck e
Rubinfeld, 1991, pg. 461). Assim, se Fcalculado > Fcrtico de Dickey-Fuller, a hiptese do
passeio aleatrio pode ser rejeitada.

3. A Formulao dos Modelos ARMA (ou ARIMA)

A diferena bsica entre a regresso clssica e os modelos de sries temporais


que nos modelos de sries temporais ARMA (ou ARIMA) no se pode assumir
independncia entre observaes. Ao contrrio, os modelos autoregressivos e de
mdias mveis vo modelar o grau de autocorrelao entre desvios e observaes
defasadas.

Em suma, de forma geral, quando faz-se referncia a modelos ARIMA esses


modelos esto sendo ajustados srie original. J ao fazer-se referncia a modelos
ARMA, considera-se que a srie uma srie diferenciada. Supondo Yt a srie j
diferenciada, os modelos ARMA em sua forma geral se escrevem:

Yt = + 1 Yt 1 + 2 Yt 2 + ... + p Yt p + t 1 t 1 ... q t q

O melhor modelo deve ser parcimonioso ou seja, deve-se min {p,q}(o que quer
dizer que se deve tentar utilizar o menor conjunto de parmetros possvel para seu

9
ajustamento srie de dados observados). Os parmetros p e q representam o nmero
de parmetros relativos aos comprimentos de defasagem em que observa-se valores
significativos das autocorrelaes e que correspondem a particularidades do sistema de
gerao das sries que devem ser explicadas pelo modelo (pois correspondem a um
padro de gerao). O processo gerador dos dados da srie dito aleatrio linear se o
modelo ajustado Yt pode ser descrito como uma combinao linear de valores defasados
de Yt e t.

Esses modelos podem, para facilitar a compreenso, ser separados em dois


modelos complementares (conforme Figura 3): os modelos de mdias mveis e os
modelos autoregressivos. Os primeiros correspondem aos processos de mdias mveis
de ordem q em que cada observao Yt gerada por uma mdia ponderada dos erros
aleatrios q perodos no passado. Denota-se esse processo por MA(q), cuja equao :
Yt = + t 1 t 1 ... q t q , onde os parmetros 1 , ..., q podem ser positivos ou

negativos. O sinal negativo no terceiro termo em diante corresponde a uma conveno.


Assume-se que os erros aleatrios so gerados por um processo de gerao de rudos
brancos ou seja: t~N(0,2) e covarincia k = 0 para defasagens k 0. Observa-se que
Yt so dependentes, ou melhor, uma funo linear da ponderao dos erros.

Seja exemplo, inicialmente, o modelo de processos aleatrios simples:

Yt = t, t = 0, 1, 2, ..., vlido para srie puramente aleatria, nos quais, se t


so normalmente distribudos, as observaes so ditas corresponderem ao rudo
branco.

Por outro lado, exemplo de modelo de um processo aleatrio linear simples o


modelo de mdias mveis. Por exemplo, o modelo de mdias mveis de primeira ordem
escreve-se: Yt = + t - 1 t-1, cujos parmetros so , 1, 2. Como exemplo de
processo aleatrio linear simples (MA(1)), tome-se exemplo de MA(1) com 1 = 0,25
(Figura 12).

10
Figura 12 Exemplo de processo de mdias mveis MA(1) com 1 = 0,25
(Levenbach e Cleary, 1984).

Outro exemplo de processo aleatrio linear simples o processo AR(p) (auto-


regressivo) em que p = 1. O modelo AR(1) correspondente ao processo autoregressivo
de 1 ordem tambm conhecido por processo de Markov, onde:

Yt = + 1 Yt 1 + t , cujos parmetros so , 1, 2 .

Na Figura 13 representado exemplo de AR(1) com 1 = + 0,9 (Yt = 0,9Yt-1 +


t).

Figura 13 Exemplo de processo autoregressivo AR(1) com 1 = 0,9

Outro exemplo, o modelo AR(1) com 1 = -0,9 (Yt = -0,9Yt-1 + t) (Figura


14).

11
Figura 14 Exemplo de processo autoregressivo AR(1) com 1 = -0,9

O modelo autoregressivo genrico AR(p) escreve-se:

Yt = + 1 Yt 1 + 2 Yt 2 + ... + p Yt p + t .

Na verdade, como o nome indica, AR(p) modela uma autoregresso da varivel


Yt com essa mesma varivel, defasada (Yt-1, Yt-2, ... , Yt-p), para os p perodos de
defasagem em que a autocorrelao parcial entre as variveis significativa.

Na Figura 15 representado o grfico de exemplo de AR(2) com 1 = +1,0 e


2 = -0,5 (Yt = 1,0Yt-1 0,5Yt-2 + t).

Figura 15 Exemplo de processo autoregressivo AR(2) com 1 = +1,0 e 2 = -0,5

12
Existe um princpio de dualidade entre os modelos do tipo MA e AR de forma
que existe a seguinte correspondncia entre eles:

MA de ordem finita AR de ordem infinita

AR de ordem finita MA de ordem infinita

Quando o processo gerador de srie temporal corresponde a modelos


compostos por parte autoregressiva e parte mdias mveis, os modelos utilizados so o
ARMA(p,q). Como exemplo de ARMA(1,1), tem-se: Yt = + 1 Yt 1 + t 1 t 1 .

4. Estgios da Metodologia de Box-Jenkies

A metodologia de Box-Jenkins corresponde a trs estgios principais: (1)


identificao de modelos tentativos (e de seus parmetros), (2) estimao, e (3) teste de
adequao, aos quais se segue a aplicao do modelo para a previso ou controle do
sistema de gerao dos valores observados Yt (Figura 16).

Figura 16 Estgios da metodologia de Box-Jenkins

13
Assim, como tarefa inicial preciso determinar p e q para a identificao de
modelos tentativos. Para isso, procede-se ao exame dos coeficientes de autocorrelao e
dos coeficientes de autocorrelao parcial, que permitem medir a fora relativa de
interao entre as variveis Yt defasadas.

A combinao dos termos ponderados por esses dois coeficientes, na ausncia


de aleatoriedade, poderiam revelar o modelo exato ARMA(p,q). Mas fato que a
aleatoriedade est presente na amostra, o que leva a desvios dos verdadeiros valores
observados. Logo, podem haver enganos na identificao dos coeficientes de
autocorrelao com base na anlise de dados amostrais. Esses enganos so revelados no
teste de adequao do modelo ou anlise dos resduos.

5. A Autocorrelao Parcial

A autocorrelao parcial pode ser definida com o ltimo termo autoregressivo


de um modelo AR(m). Assim, 1 , 2 , 3 , ... , m -1 , m so as m autocorrelaes
parciais de qualquer processo AR(m), como pode ser visto nas equaes seguintes:

Xt = 1 Xt-1 + t (7)
Xt = 1Xt-1 + 2 Xt-2 + t (8)
Equaes Xt = 1Xt-1 + 2Xt-2 + 3 Xt-3 + t (9)
...
Xt = 1Xt-1 + 2Xt-2 + ... + m-1 Xt-m+1 + t (10)
Xt = 1Xt-1 + 2Xt-2 + ... + m Xt-m + t (11)

i so usadas para medir o grau de associao entre Xt e Xt-i, os demais efeitos


constantes, em sistemas de equaes do tipo das equaes (7)-(11) acima, que
correspondem um sistema de soluo trabalhosa.

As estimativas de 1 , 2 , ... , m podem ser obtidas com base na transformao


do sistema de equaes. Seja exemplo:

X t = 1 X t 1 + t modelo autoregressivo de 1 ordem

14
Multiplicando o primeiro e segundo termos da equao por Xt-1, obtm-se:

Xt-1 . Xt = 1 Xt-1 . Xt-1 + Xt-1 t ,

onde:

E (Xt-1 . Xt) = 1 E (X2t-1) + E (Xt-1 t)

1 0 0
1
1 = 1 0, = 1 1 = 1 , ou melhor, que: 1 = 1 = r1, sendo 1 a
0

autocorrelao terica (populao) e r1 o valor amostral estimado. Sucessivamente,


k
pode-se derivar k= .
0

Pode-se trabalhar as equaes do sistema de equaes (7)-(11) e obter as


equaes de Yule-Walker para obteno das autocorrelaes defasadas e das
autocorrelaes parciais. Mas no caso de modelos complexos como o modelo ARMA
(p,q), opta-se por simplificao nas estimativas dos valores dessas autocorrelaes.
Assim, obtm-se o correlograma da funo da autocorrelao parcial (ou correlograma
parcial, que equivale ao grfico das autocorrelaes parciais para diferentes defasagens),
com base no clculo de rkk coeficiente de autocorrelao parcial amostral e na
realizao de testes de hiptese para avaliao dos intervalos de defasagem entre as
variveis observadas em que essa autocorrelao significativa. Para isso, deve-se
observar:

r1 , se k =1
k 1
(rk rk 1, j rk j )
1) j=1 se k = 2, 3, ...
rkk = k 1
(1 rk 1, j r j )
j=1

onde rkj = rk-1, j rkk rk-1,k-j para j = 1, 2, ..., k-1

2) O desvio padro de rkk

1
Srkk =
(n b + 1)1/2

rkk
3) t rkk =
Srkk

15
4) Na prtica, se t rkk > 2, significa que autocorrelaes parciais so

significativas.

6. Expresso dos Modelos ARIMA na Forma Compactada

Define-se o operador B como BYt = Yt-1.

Assim: B2 Yt = B(BYt) = B(Yt-1) = Yt-2

BkYt = Yt-k

Yt Yt-1 = Yt BYt = (1-B)Yt

Dessa forma, o modelo AR(1) se escreve, na forma compactada:

AR(1) (1 - 1B)Yt = + t

Por simplificao, Yt incluir , sendo (Yt - ), o que corresponde a modelar a


srie ajustada mdia amostral ou seja: (Yt - Y), Y sendo a mdia amostral da srie.

Assim, reescreve-se AR(1) como (1 - 1B) Yt = t.

Para defasagens de ordem sazonal pode-se utilizar o operador BL, sendo L o


comprimento de sazonalidade, de forma que: Yt Yt-12 = Yt B12Yt = (1-B12)Yt.

Escrevendo os modelos na forma compactada possvel explorar a dualidade


entre os modelos do tipo MA e AR. Para isso, seja o modelo AR(1): (1 - 1B) Yt = t,
t
que pode ser reescrito Yt = .
1 1 B

Expandindo Yt como srie de potncia da forma:

p(p 1) 2
(1 + x)p = 1 + px + x +... ,
2!

1
o termo = (1 - 1B)-1 = 1 + 1B + 12 B2 + ... , onde -1 < 1 < 1.
1 1 B
coef. 1 coef. 2 ...coef. n
Dessa forma, escreve-se o modelo AR(1): Yt = t + 1 t-1 + 12 t-2 + ... , ou
seja, ele expresso como um processo MA de ordem infinita (valores dos coeficientes
1n decrescentes exponencialmente).

16
De forma similar, MA(1) Yt = (1 - 1B) t pode ser visto como AR de ordem
infinita, pela mesma propriedade da dualidade ou melhor, se as condies de
invertibilidade e estacionariedade forem obedecidas (sero apresentados mais frente).

Os processos de maior ordem MA, AR e ARMA podem ser representados por:

(1 - 1B - 2B2 - ... - pBp) Yt = (1 - 1B - 2B2 - ... - qBq) t,

onde Yt a srie observada ajustada mdia amostral.

(1 1 B 2 B 2 ... q B q )
Assim, Yt = t
(1 1 B 2 B 2 ... p B p )

sendo:

q(B) = 1 - 1B - 2B2 - ... - qBq ;

p(B) = 1 - 1B - 2B2 - ... - pBp , e

q (B)
H(B) = pode ser denominada funo de transferncia.
p (B)

Para representar o modelo de ARIMA (p,d,q), Yt nos modelos acima


substitudo por wt, sendo wt a srie estacionria:

wt = (1 B) Yt 1 diferena

ou, de forma geral, wt = (1 B)d Yt ou seja, a srie estacionria de ordem d.

Assim, o modelo ARIMA (p,d,q) escreve-se:

p(B)(1-B)dYt = q(B) t

Por exemplo, o modelo ARIMA (1,1,1) assume a forma compactada:

(1 - 1B)(1 B) Yt = (1 - 1B) t

O modelo operacional do sistema gerador da srie original Yt deve obedecer s


exigncias 1 e 2:

1) Unicidade de representao

2) Equilbrio estatstico em torno da mdia

O que garante:

1) Unicidade da representao, so as condies de invertibilidade de wt.

17
2) Equilbrio em torno do valor de uma mdia fixa, so as condies de
estacionariedade de wt.

7. As Condies de Estacionariedade e de Invertibilidade

Seja o modelo autoregressivo puro AR(p). O modelo autoregressivo vlido


para todas as observaes da srie. Assim, pode ser escrito para a mdia das
observaes da srie estacionria Zt:

Z t = + 1 Z t 1 + 2 Z t 2 +...+ p Z t p

Supondo-se conhecido o valor terico ou a mdia populacional, sendo que


essa verdadeira mdia constante em qualquer defasagem em que seja calculada, pode-
se escrever:

= + 1 + 2 + ... + p,


ou seja: = .
(1 1 2 ... p )

A anlise da funo de autocorrelao de processos estacionrios leva ao


estabelecimento de conjuntos de condies necessrias e suficientes para os valores k
que garantem a estacionariedade, isto , mdia finita de varincia invariante do tempo
que se somam condio necessria (1 + 2 + ... + p) < 1.

Para o conjunto de modelos abaixo, as condies de estacionariedade so as


seguintes:

Modelo: Condies de estacionariedade

Zt = + t - 1t-1 Nenhuma

Zt = + t - 1t-1 - 2t-2 Nenhuma

Zt = + 1Zt-1 + t |1| < 1

Zt = + 1Zt-1 + 2Zt-2 + t 1 + 2 < 1, |2| < 1

2 - 1 < 1

Zt = + 1Zt-1 + t + 1t-1 |1| < 1

18
No processo ARIMA (ou ARMA) a condio de invertibilidade significa que
sua parte MA pode ser invertida em AR (puro). Os pesos aplicados aos valores
passados de Zt so decrescentes, na medida em que a defasagem aumenta. Para o
conjunto de modelos abaixo, so condies de invertibilidade:

Modelo Condies de invertibilidade

Zt = + t - 1t-1 |1| < 1

Zt = + t - 1t-1 - 2t-2 1 + 2 < 1, |2| < 1

2 - 1 < 1

Zt = + 1Zt-1 + t Nenhuma

Zt = + 1Zt-1 + 2Zt-2 + t Nenhuma

Zt = + 1Zt-1 + t + 1t-1 |1| < 1

As condies de invertibilidade e estacionariedade estabelecem restries aos


valores das estimativas dos parmetros dos modelos. Como ser visto, para a estimao
desses parmetros so obtidas inicialmente suas estimativas preliminares. As
estimativas preliminares dos parmetros dos modelos de sries temporais tambm
devem satisfazer s condies de estacionariedade e invertibilidade. Por conseqncia,
a estimativa preliminar do termo constante deve ser feita com base nas estimativas
dos s e s que satisfazem as condies de estacionariedade e invertibilidade.

8. O Termo Constante

Considere-se a introduo do termo constante no modelo genrico:

ARMA (p, q) ARMA (,s, s), ou seja:

Zt = + 1Zt-1 + 2Zt-2 + ... + pZt-p + t - 1t-1 - 2t-2 - ... - qt-q

1, 2, ... so assumidos estatisticamente independentes

E(i) = 0; E(i2) = 2; i ~ N(0, 2)

Com o operador B, pode-se escrever o modelo na forma multiplicativa (


exceo da incluso aditiva do termo constante ):

19
(1 - 1B - 2B2 - ... - pBp) Zt =

= + (1 - 1B - 2B2 - ... - qBq) t

A anlise do processo autoregressivo puro permite concluir que = p(B)

onde

p(B) = (1 - 1B - 2B2 - 3B3 - ... - pBp)

= mdia populacional de todas as realizaes do processo estacionrio


sob estudo

O termo constante pode ser obtido nas trs situaes a seguir:

1) p(B) no includo no modelo (p(B) = 1) e q(B) pode ser includo, logo:


q(B) = 1 - 1B - 2B2 - ... - qBq

Assim,

p(B) Zt = + q(B) t

sendo Zt = + q(B) t ou seja, o modelo de mdias mveis,

onde = p(B)=

2) p(B) pode ser includo e q(B) no pode ser includo (q(B) = 1)

Assim,

p(B)Zt = + q(B) t

p(B)Zt = + t ou seja, o modelo autogressivo,

onde

= p(B)

= (1 - 1B - 2B2 - ... - qBq)

= - 1B - 2B2 - ... - qBq

= - 1 - 2 - ... - p

= (1 - 1 - 2 - ... - p)

20
3) Ambos p(B) e q(B) podem ser includos

Assim, p(B)Zt = + q(B) t

= p(B) = (1 - 1B - 2B2 - ... - pB2) = (1 - 1 - 2 - ... - p)

Para obter-se a estimativa amostral de , calcula-se a mdia amostral da srie


de observaes Zb, Zb+1, ... , Zn, tal que:
n
Zt
Z= t =b
estimativa de
n b +1

Assim, se Z for estatisticamente diferente de zero,

0 hiptese razovel.

Como regra prtica, obtm-se a estatstica t (Students):


1/2
n
(Z Z) 2
Z t =b t
t= , onde S z = , como a qual realiza-se o
S z /(n b + 1)1/2 (n b + 1) 1


teste de hipteses.

Quando Zt a srie de diferenas em relao srie original Yt, o termo


constante , ao ser includo no modelo, incorpora-se como medida da tendncia
determinstica existente, sendo que a tendncia estocstica medida pelo modelo
ARMA em seus parmetros p e q.

Quando a srie modelada a srie original Yt, no caso da mdia amostral no


ser estatisticamente diferente de zero, considera-se que o termo constante no deve
ser includo na formao do modelo e que Yt est flutuando em torno de uma mdia
zero.

9. Guia para Escolha do Modelo (AR(1), AR(2), MA(1), MA(2), ARMA(1,1))

No estgio de identificao, as especificaes funcionais dos modelos so


escolhidas com base na avaliao dos padres dos correlogramas, de forma que:

A) Modelos: MA(1) e MA(2)

21
O correlograma tem picos nas defasagens 1, 2, ..., q e truncamento aps, e o
correlograma parcial apresenta padro de decaimento.

Nesse caso, se:

(1) Se o correlograma tem pico na defasagem 1 e truncamento aps e o


correlograma parcial decai com uma forma exponencial o modelo tentativo pode ser
Yt = - 1 t-1 + t.

(2) Se o correlograma tem pico nas defasagens 1 e 2 e truncamento aps e o


correlograma parcial decai num misto de padro exponencial / onda senoidal, o modelo
tentativo parece ser Yt = - 1 t-1 - 2 t-2 + t.

B) Modelos: AR(1) e AR(2)

O correlograma apresenta padro de decaimento e o correlograma parcial tem


picos nas defasagens 1, 2, ..., p e truncamento aps.

Nesse caso, se:

(1) Se o correlograma parcial tem picos na defasagem 1 e o correlograma


apresenta decaimento num padro exponencial, o modelo tentativo pode ser:

Yt = + 1Yt-1 + t.

(2) Se o correlograma parcial tem picos nas defasagens 1 e 2 e o


correlograma apresenta decaimento num padro misto exponencial / onda senoidal o
modelo tentativo pode ser Yt = + 1Yt-1 + 2Yt-2 + t.

C) Modelos: MA(q) e AR(p)

Se o correlograma tem picos nas defasagens 1, 2, ..., q e truncamento aps e o


correlograma parcial tem picos nas defasagens 1, 2, ..., p e truncamento aps, devem ser
avaliadas as situaes:

1. Se o correlograma trunca-se mais abruptamente, o modelo MA(q).

2. Se o correlograma parcial trunca-se mais abruptamente, o modelo


AR(p).

22
3. Se ambos os correlogramas parecem truncar-se igualmente abruptamente,
os modelos tentativos podem ser:

1) MA(q) e no AR(p)

2) AR(p) e no MA(q)

Como regra prtica, em geral MA(q) leva ao melhor modelo e deve ser tentado
em primeiro lugar.

D) ARMA (p,q)

O correlograma apresenta padro de decaimento e o correlograma parcial,


tambm. Nesse caso, o modelo tentativo deve ter uma parte AR(p) e uma parte MA(q).

Deve-se observar o princpio da parcimnia ou seja, por exemplo: se o


correlograma apresenta padro de decaimento exponencial e o correlograma parcial,
tambm, o modelo tentativo deve ser, inicialmente, o mais simples:

Yt = + 1Yt-1 - 1t-1 + t.

E) Nem MA(q), nem AR(p).

O correlograma tem pequenos valores (sem picos) e o correlograma parcial,


idem. O modelo tentativo deve ser Yt = + t.

10. A Estimao dos Parmetros do Modelo

Considere que o modelo escolhido tentativo seja ARMA(1,1), que em forma de


desvios em relao mdia tem a forma matemtica Xt = 1Xt-1 + t + 1 t-1.

A estimao dos parmetros desse modelo deve se feita atravs de mtodos de


estimao no-linear. Assim, os passos seguintes so observados:

1) valores iniciais das estimativas dos parmetros 1 e 1 (e , se for o caso)


so definidos.

2) modificaes nesses valores so obtidas, de forma a minimizar a soma


dos quadrados dos erros.

23
Para avaliar a significncia estatstica dos valores finais dos parmetros, devem
ser construdos intervalos de confiana, realizados testes de hipteses e verificadas as
condies de estacionariedade e invertibilidade (para a unicidade de representao).

Este tpico ser retomado em detalhes mais adiante.

11. Verificao da Adequao do Modelo

Supondo-se que 1 = 0,35 e 1 = 0,20 sejam os valores finais estimados para os


parmetros do modelo ARMA(1,1), escreve-se:

X t = 0,35 Xt-1 + t 0,20 t-1.

Com os valores de X t gerados pelo modelo, obtm-se os resduos et = Xt - X t .


Se ajuste feito do modelo srie temporal de observaes for bom, a srie de et
conforma-se como o processo gerador do rudo branco.

Nesse momento, deve ser feita a anlise de autocorrelao dos resduos,


obtendo-se estimativa da estatstica 2 para o teste de Box-Pierce (ou Ljung-Box).

Caso a srie de et no se comporte como o rudo branco, deve-se escolher novo


modelo. A anlise do correlograma e do correlograma parcial pode sugerir qual o
padro do processo gerador da srie original que deixou de ser modelado e est presente
na srie de resduos.

11.1 Testes da Preciso do Modelo

Estes testes correspondem ao exame das propriedades estatsticas dos resduos,


pois qualquer dependncia entre seus valores ou existncia de no-aleatoriedade poder
estar indicando a presena de informao que deveria ser explorada para melhorar a
preciso do modelo ao representar o padro gerador da srie temporal.

So eles:

1) Teste do sobre ajustamento ou teste da significncia do parmetro


adicional ou da estimativa da varincia dos resduos 2 .

24
Obtm-se a estimativa amostral da varincia dos resduos 2 ajustada para os

graus de liberdade. Se 2 decrescer, significa que a adio do parmetro adicional


melhorou o ajuste.

S(, , )
Para isso, obtm-se a estimativa de 2 por 2 = ,
npq

onde S( , , ) soma do quadrado dos resduos.

Observa-se que, para amostras de tamanho grande, usa-se indistintamente (n-p-


q) ou (n) no denominador.

2) Teste da adequao do modelo ou teste da estatstica Qui-Quadrado de


Box-Pierce modificado por Ljung e Box.

Um grande valor da estatstica Q aponta para a inadequao do modelo,

sendo:

m
Q = n(n + 2) (n k) 1 rk2 ,
k =1

2 crtico tabela Qui-Quadrado.

rk = autocorrelaes residuais, k = 1, ... , m.

n = nmero de observaes utilizadas para ajustar o modelo (aps mtodo das


diferenas)

m = 6, 12, 18, 24 e 30 ou m tal que (m-p-q) = 20

m-p-q graus de liberdade

Para verificar a adequao do modelo, alm do teste da estatstica Qui-


Quadrado, deve-se proceder ao exame da significncia estatstica dos valores
individuais das autocorrelaes e autocorrelaes parciais nos correlogramas dos
resduos.

Caso o teste tenha indicado bom modelo, essencial apenas o exame


complementar do correlograma das autocorrelaes dos resduos.

25
3) Anlise do periodograma

Essa anlise permite observar os efeitos no-aleatrios peridicos. Como trata-


se de anlise no domnio da freqncia, o teste correspondente, ou teste de
Kolmogorov-Smirnov (Box e Jenkins (1976), Time-Series Analysis: Forecasting and
Control, Holden-Day, cap. 8.) visto em captulo frente.

4) Comparao dos correlogramas da srie de dados originais ou


transformados, se for o caso, com os correlogramas da srie obtida com o modelo. As
respectivas funes de autocorrelao devem ter grficos similares.

12. Uso do Modelo para a Previso

O uso do modelo ARMA (ou ARIMA) para a previso ser apresentado por
meio de um exemplo (Bowerman & OConnel, 1987).

Seja: Uma empresa fabrica e vende toalhas de papel absorvente. Na Figura 17


apresentado o grfico da srie de vendas (Yt) de 120 semanas de dados de vendas
semanais em unidades de 10.000 rolos. objetivo da gerncia da empresa prever as
vendas semanais para planejar e programar a produo, o oramento e estimar as
necessidades de recursos e a capacidade das instalaes para a produo e a estocagem
do produto.

Figura 17 Grfico da srie original de vendas de toalhas de papel


absorvente (unidades de 10.000 rolos)

26
Figura 18 Grfico da srie de primeiras diferenas

A anlise da Figura 17 mostra claramente que a srie Yt no estacionria.


Dessa forma na Figura 18 apresentado o grfico das primeiras diferenas Zt = Yt. As
Figuras 19 e 20, respectivamente, mostram os correlogramas de Yt e Zt.

Figura 19 Correlograma da srie original

27
Figura 20 Correlograma da srie de primeiras diferenas

Enquanto na Figura 19 confirma-se a no-estacionariedade nos dados originais,


na Figura 20 apenas o primeiro valor de autocorrelao significativo ou seja: t r1 >

1,6 com truncamento aps essa defasagem (pode ser observado que os valores
sucessivos das autocorrelaes so no significativos e prximos de zero com t rk < 1,6

para k = 2 ou 3 e t rk < 2, para k > 3).

28
Figura 21 Correlograma parcial da srie de primeiras diferenas

Na Figura 21 apresentado o correlograma parcial da srie de primeiras


diferenas. Observa-se que apenas o primeiro valor das autocorrelaes parciais
significativo, com t r11 = 3,345 > 2. H um truncamento de valores, pois t rkk < 2 para

k > 1, aps essa defasagem. Entretanto os valores em mdulo da estatstica t rkk para

k 2 so 1,912; 1,455; 1,523; ... indicando que o truncamento no correlograma parcial


no to abrupto quanto no correlograma (nesse, os valores em mdulo da estatstica
t rk so 0,648; 0,715; 1,039; 0,828; ...).

Dessa forma, o modelo tentativo para representar a srie o modelo de mdias


mveis Zt = 1(B) t. Nesse exemplo, deve-se avaliar a incluso ou no do termo
constante . Ou seja: Zt = + 1(B) t, se for includo. Observa-se que, no modelo
de mdias mveis, = .

Assim, obtm-se a estimativa amostral Z para , de forma que:

29
120
Zt
Z= t =2
= 0,005423
120 2 + 1
1
120 (Z t Z) 2
2

t
S Z = =2 = 1,104
(120 2 + 1) 1

0,005423
t= , logo: |t| = 0,0536 < 2
1,104 / (120 2 + 1) 2
1

O valor da estatstica t permite concluir que o termo constante no deve ser


includo no modelo, o que significa Zt est flutuando em torno de uma mdia zero.
Como a srie original Yt (Zt a srie de diferenas) no h tendncia determinstica
nos valores observados. Qualquer tendncia ser estocstica.

Assim, o modelo tentativo para representar a srie do tipo MA(1) e no


contm termo constante, sendo escrito: Zt = t - 1 t-1.

Como Zt = Yt Yt-1, o modelo escrito: Yt = Yt-1 + t - 1 t-1.

Considerando que se conhece a estimativa final do parmetro 1 que obedece

s condies de estacionariedade e invertibilidade, 1 = 0,3545 , o modelo assume a


forma: Yt = Yt-1 + t + 0,3545 t-1.

Com esse modelo tentativo pode-se obter as estimativas dos valores das vendas
para, ento, prever-se vendas futuras. Assim, obtm-se a estimativa Y1 ou seja:

Y1 = Y0 + 1 + 0,3545 0 .

Entretanto, Y0 no conhecido (corresponde a perodo anterior ao que se tem


dados), o que mostra necessrio, como orientao, que seja observado que:

1. A previso pontual dos futuros desvios aleatrios zero. Assim: 1 = 0 .

2. A previso pontual dos desvios aleatrios passados obtida com


informao do passado ou seja, equivale a ( Yt k Yt k ) se Yt k for

conhecido, e 0, se Yt k no for conhecido (ou se Yt k no tiver podido ser


calculado).

30
Nesse caso, Y0 Y0 no pode ser obtida pois Y0 no pode ser calculado,

assim como Y1 , pois Y0 no conhecido.

Os valores seguintes so obtidos da mesma forma: Y2 = Y1 + 2 + 0,3545 1 ,

2 = 0 e 1 = Y1 Y1 = 0 pois Y1 no foi obtido, logo Y2 = 15 + 0 + 0 = 15.

Por outro lado,

Y3 = Y2 + 3 + 0,3545 2 , sendo 3 = 0 e 2 = Y2 Y2 = 14,4064 15 =

-0,5936, logo Y3 = 14,4064 + 0 + 0,3545(0,5936) = 14,1960 .

Sucessivamente, obtm-se as estimativas at Y120 = 14,9553, de forma que

Y120 - Y120 = 15,6453 14,9553 = 0,6900 . A partir desse ponto, pode-se utilizar o
modelo para previso de valores futuros.

Sendo Yt = Yt 1 + t 1 t 1 , pode-se escrever:

Yt + (t) = Yt + -1 + t + 1 t + -1 , sendo Yt - (t) a previso feita no perodo t para

perodos frente de t.

A previso das vendas de toalhas de papel absorvente para o perodo 121 :


Y121 (120) = Y120 + 121 (0,3545)(Y120 Y120 ) = 15,6453 + 0,3545 (0,6900) = 15,8899.

Utilizando-se um pacote estatstico pode-se obter o desvio padro do erro de


previso para cada perodo a partir do limite t do tamanho de amostra. Assim, o
intervalo de confiana com 95% de probabilidade de conter o verdadeiro valor Y121
[15,8899 2,0362; 17,9261] obtido por pacote estatstico computacional (Bowerman e
OConnel, 1987).

Pode-se afirmar que, uma vez conhecida, se a observao das vendas Y121
pertencer ao intervalo, a previso foi bem sucedida. De estudos anteriores, sabe-se que
a metodologia de Box-Jenkins precisa para o curto-prazo.

O uso do modelo a partir desse ponto permite obter: Y122 = Y121 + 122 1 121 ,
sendo usado no lugar do valor observado Y121 (supondo-se no conhecido) a sua
estimativa conhecida ou seja: Y121 (120) .

31
Da mesma forma, o valor Y122 corresponde na verdade a Y122 (120) =

Y121 (120) + 122 1 121 = 15,8899 + 0 + 0, sendo 121 = 0 pois Y121 no foi observado.

Assim, Y122 (120) = 15,8899.

Observa-se que os sucessivos valores pontuais previstos so iguais ao valor


previsto para o perodo 121, equivalente a = 1. Isso permite dizer que a memria do
modelo MA(1) de um perodo.

Da mesma forma anterior, obtendo-se o desvio padro do erro de previso


por pacote estatstico, o intervalo de confiana [15,8899 3,4278, 19,3177]. Observa-
se que, quanto maior , maior o desvio padro do erro de previso e o intervalo da
previso, o que significa mais imprecisa ela .

De forma geral, Y120+ (120) = Y120 + 1 + 120+ 1 120+ 1 , o que significa que,

para 2, 120+ = 120+ 1 =0 e Y120+ (120) = Y120+ -1 (120) + 120+ 1 120+ 1 =15,8899 .

Na medida em que novos valores forem conhecidos, por exemplo, Y121 =


16,1099, pode-se calcular 121 = Y121 - Y121 (120) = 0,2200 .

Assim, Y122 (121) = Y121 + 122 1 121 = 16,1879 e os valores sucessivos so

recalculados, como exemplo Y123 (121) = 16,1879 .

13. Estimao do Modelo

Seja:

(B)(1 B) d y t = (B) t , onde w t = (1 B) d y t .

A equao pode ser reescrita como:

t = 1 (B) (B) (1 - B)d y t , ou seja:

t = 1 (B) (B) w t

O objetivo da estimao encontrar um conjunto de parmetros ( e ) que


minimizam a soma do quadrado dos erros, de forma que:

S(1 ,... p , 1 ,..., q ) = 2t


t

32
A estimativa amostral dos parmetros d origem minimizao do somatrio
do quadrado dos resduos do modelo:

S( 1 ,... p , 1 ,..., q ) = 2t
t

Na presena dos termos de mdias mveis, h no-linearidade. Logo, usa-se


um procedimento iterativo de estimao no-linear para obter os valores das estimativas
dos parmetros do modelo ( 1 ,... p , 1 ,..., q ) que minimizam 2t .
t

Uma vez que os parmetros tenham sido estimados, preciso testar se os


resduos tm distribuio aleatria de mdia zero (pelo teste da estatstica Q de Box-
Pierce, por exemplo).

O procedimento iterativo de estimao no-linear dos parmetros permite que


se teste a significncia desses estimadores por meio da estatstica t. Alm disso,
preciso verificar se esses parmetros obedecem s condies de estacionariedade e
invertibilidade.

Aps o exame da aleatoriedade dos resduos da estimao e da significncia


dos estimadores, pode ser preciso redefinir o modelo, repetir a estimao e realizar
novos exames para teste da adequao do modelo. Uma vez obtida satisfao com o
modelo, ele pode ser usado para previso.

Algumas vezes, mais de um modelo tentativo considerado adequado aps o


exame da aleatoriedade dos resduos e das propriedades estatsticas dos estimadores.
Nesse caso, pode-se proceder ao teste da simulao ou seja, comparao entre os
valores gerados pelos modelos e os valores amostrais da observao yt, obtendo-se a
soma do quadrado dos desvios caso a caso. Aquele modelo que corresponder ao menor
somatrio deve ser considerado o mais adequado.

Entretanto, sugere-se tambm reter as especificaes alternativas e utiliz-las


para a previso e, com base na avaliao do desempenho das previses, escolher a
especificao que parea ser mais pertinente com a situao analisada.

33
13.1 A Estimao No-Linear dos Parmetros do Modelo

Assume-se que existem T + d observaes disponveis da srie homognea


no-estacionria yt de ordem d ou seja: y-d+1, ..., y0, y1,..., yT. Aps diferenciar a srie d
vezes, obtm-se a srie estacionria wt (w1, ....wT).

Para estimar os parmetros do modelo ARMA (p,d) associado srie wt


baseia-se no pressuposto da distribuio normal e na independncia dos termos do erro
1,..., T ou seja t~N(0, 2).

Dessa forma, pode-se definir a funo de verossimilhana logartmica


condicional associada aos (p+q+1) parmetros (1,..., p, 1,..., q, 2):

S(1 ,..., p , 1 ,..., q )


L = -T log
2 2

A funo dita condicional pois depende dos valores do passado e de valores


no observados w0, w-1,..., w-p+1 e 0, -1,..., -q+1.

Max L corresponde minimizao de S(1,..., p, 1,..., q).

Para a estimao dos parmetros preciso escolher os valores no-observados


passados de wt (w0, w-1,..., etc.). Como soluo ao problema, Pindyck & Rubinfeld
(1991) propem que esses valores sejam os valores esperados incondicionais. Assim,
0 = ... = -q+1 = 0 e, se o nvel mdio da srie = 0, w0 = ... = w-p+1 = 0.

Dessa forma, o problema determinar 1 ,... p , 1 ,..., q que minimizam:

T
S = [ t | 1 ,... p , 1 ,..., q ] 2
t =1

A estimao no-linear pode ser obtida pelo mtodo iterativo que se baseia na
aproximao linear dos dois primeiros termos da expanso da funo
[ t | 1 ,... p , 1 ,..., q ] em srie de Taylor em torno de um ponto correspondente ao

conjunto de valores iniciais dos parmetros e , cujo vetor pode ser representado por
0. Representa-se w o vetor dos valores da varivel wt, t = 1, ..., T. Assim, a
aproximao linear corresponde aos dois primeiros termos de:

p+q [ t ]
[ t ] = [ t | w, 0 ] + ( i - i,0 ) = 0 +
i =1 i

34
2 [ t ]
2
1 p+q
+ i i,0
( - ) = 0 + ...
2 i =1 i2

onde i,0 o valor da estimativa preliminar do parmetro i.

[ t ]
Fazendo-se x i, t = = 0 e considerando que xi,t e [t|w, 0] correspondem
i

a valores resultantes da aplicao das respectivas funes em um determinado ponto


(relativos s estimativas iniciais dos parmetros + os valores de wt), pode-se escrever:
p+q p+q
[ t | w, 0 ] + i,0 x i, t = i x i, t + [ t ] , onde ser feito t,0 = [ t | w, 0 ] , para
i =1 i =1

simplificao.

O primeiro lado de igualdade corresponde aos diferentes valores da varivel


dependente para t = 1, ..., T obtidos com um conjunto de estimativas iniciais de
parmetros e valores observados da srie estacionria wt. O segundo lado da igualdade
corresponde funo linear dos parmetros a estimar multiplicados pelos valores
correspondentes das variveis independentes obtidas em torno das estimativas iniciais
dos parmetros aos quais se soma o termo do erro aleatrio.

Novas estimativas dos i podem, ento, ser obtidas por regresso linear.

medida que novos valores das estimativas so obtidos, esses so tratados


como valores iniciais e o procedimento se repete, com o reclculo dos valores das
variveis independentes e dependentes, em torno de um novo ponto (correspondente a
essas novas estimativas).

A regresso linear realizada at que os valores estimados por ela se


aproximem dos valores anteriormente obtidos para os parmetros (critrio de
convergncia). Nesse ponto, se aplicam os procedimentos para avaliao da
significncia dos estimadores e da qualidade do ajustamento.

Se for impossvel obter a convergncia, diferentes estimativas preliminares


devem ser definidas e, caso a impossibilidade continue, novas especificaes funcionais
devem ser tentadas.

Observa-se que, mesmo quando a convergncia ocorrer na primeira tentativa


de valores iniciais, aconselhado testar a existncia de mltiplas solues por meio da

35
variao desse conjunto inicial de estimadores. A estimativa final ser aquela que
corresponder menor soma do quadrado dos erros (mnimo global).

13.2 Exemplo do Mtodo de Estimao No-Linear

Como exemplo do primeiro passo do mtodo iterativo de estimao no-linear


(Pindyck & Rubinfeld, 1991), seja o modelo ARMA(1,1) escrito como:

1 1 B
t = w t , onde wt a srie estacionria.
1 1 B

Esse modelo tem dois parmetros (1 e 1). Assim:

t B
x1, t = 1 , 0 , 1 , 0 = wt
1 1 1,0 B

B - 1,0 B 2
x 2, t = t 1, 0 ,1, 0 = wt
1 (1 1,0 B) 2

x1,t e x2,t correspondem a valores numricos calculados para t = 1, ..., T. Pela


expanso dessas expresses:

x1, t = 1,0 x1, t 1 + w t 1

x 2, t = 21,0 x 2, t 1 1,0
2
x 2, t - 2 - w t 1 + 1,0 w t 2 .

Esses valores so funo dos valores defasados: x1,t-1, wt-1, x2,t-1, x2,t-2 e wt-2,
assim preciso estimar valores defasados preliminares. Logo, considerando que o nvel
mdio da srie original = 0,

x2,1 = x2,0 = w0 = w-1 = x1,0 = 0.

Dessa forma, gera-se a srie de valores x2,t, onde

x 2,0 = x 2,1 = 0 e x 2,2 = 2 1,0 x 2,1 1,0


2
x 2,0 w1 + 1,0 w 0

x2,2 = - w1

x 2,3 = 2 1,0 x 2,2 1,0


2
x 2,1 w 2 + 1,0 w1

x 2,3 = - 2 1,0 w1 w 2 + 1,0 w1 , e assim por diante.

36
O mesmo procedimento se aplica srie de valores x1,t.

1 - 1,0 B
Uma srie de valores deve ser gerada para t,0 = w t , t = 1,..., T,
1 - 1,0 B

sendo:

t,0 = w t - 1,0 w t -1 + 1,0 t -1,0 , onde 0,0 = 0 .

Com essas trs series de valores (x1,t, x2,t e t,0) pode-se estimar novos
parmetros do seguinte modelo de regresso linear:

t,0 + 1,0 x1, t + 1,0 x 2, t = 1x1, t + 1 x 2, t + t

14. Guia para a Identificao de Modelos Sazonais

Quando as sries tm comportamento em que remarcada a presena de


sazonalidade, preciso a identificao de uma forma particular do modelo de Box-
Jenkins de ordem (p, P, q, Q) que descreve a srie temporal estacionria Zb, Zb+1, .. , Zn.
Nesse modelo, P e Q dizem respeito s caractersticas de mdias mveis e
autoregressivas do processo de gerao das sries associadas ao fator sazonal. Seja o
modelo ARMA multiplicativo (na forma compactada) geral (ou seja, sazonal):

p(B) P(BL) Zt = q(B) Q(BL) t.

De forma anloga aos modelos de sries no-sazonais (ou desazonalizadas),


deve-se verificar se:

1. O termo constante deve ser includo no modelo;

2. Quais dos operadores p(B), P(BL), q(B) e Q(BL) devem ser includos no
modelo, e

3. A ordem de cada operador que ser includo no modelo.

Considerando que
1/ 2
n
Zt ( n
(Z t Z t ) 2 )
t =b
Z= t =b
e SZ =
n b +1 (n b + 1) - 1

37
so a mdia e o desvio padro da srie temporal Zb, Zb+1, ... , Zn, o procedimento
aproximado para decidir se Z estatisticamente diferente de zero, e decidir pela
incluso do termo constante: = p (B) P (B L ) no modelo geral de Box-Jenkins,

Z
verificar se o valor absoluto do termo: maior que 2, sendo Z a
S z /(n b + 1)1/2

mdia amostral e Sz o desvio padro amostral.

Da mesma forma que para sries no-sazonais, se a srie de valores Zb, ..., Zn
a srie original, a mdia ser zero significa que os valores da srie original flutuam em
torno de uma mdia zero. Se, por outro lado, Zb, ... , Zn representam a srie
diferenciada, afirmar que a mdia da populao zero equivale a dizer que a srie
original no tem tendncia determinstica. Ao contrrio, diz-se que existe essa
tendncia nos valores da srie. Se a srie no exibe tendncia determinstica, qualquer
outra tendncia ser estocstica.

Alm disso, para determinar quais dos operadores p(B), P(BL), q(B) e
Q(BL) devem ser includos no modelo de Box-Jenkins geral:

(a) analisado o comportamento do correlograma e do correlograma parcial


para determinar se algum operador no sazonal de ordem q, q(B) = (1 - 1 B - 2B2 - ...
- qBq), e se algum operador no sazonal autoregressivo de ordem p, p(B) = (1 - 1 B -
2 B2 - ... - pBp), devem ser utilizados, conforme a Tabela 1.

38
TABELA 1

Em geral, preciso determinar se uma transformao particular do tipo:

Zt = (1 BL)D (1 B)d Yt

transformou a srie temporal original Y1, Y2, ..., Yn, que apresentou variao sazonal,
numa srie estacionria Zb, Zb+1, ..., Zn.

Para isso, devem ser examinados os valores do correlograma de Zt no nvel no


sazonal e no nvel sazonal.

Define-se (muitas vezes arbitrariamente) o comportamento do correlograma


(ou do correlograma parcial) no nvel no sazonal como sendo o comportamento da
funo de autocorrelao nas defasagens 1 at (L - 3). Para informao mensal (L =
12), esse o comportamento nas defasagens 1 at 9. Para informao trimestral (L = 4),
esse o comportamento na defasagem 1. Entretanto, nesse caso, freqentemente
considera-se tambm a defasagem 2 e possivelmente a defasagem 3 como tendo valores
representativos do nvel no sazonal.

Os comportamentos apresentados no correlograma e no correlograma parcial


no nvel no sazonal so similares queles analisados anteriormente. Mais
especificamente, define-se as defasagens 1, 2, e possivelmente 3 como sendo as
defasagens baixas no sazonais no correlograma e diz-se que um pico existe numa
defasagem baixa no sazonal k no correlograma se: t rk > 1,6.

Alm disso, define-se as defasagens 4, 5, ... , L - 3 como as defasagens no


sazonais altas no correlograma, e diz-se que existe um pico numa defasagem alta no
sazonal k no correlograma se: t rk >2.

Anlise similar feita no correlograma parcial. Diz-se que existe um pico


numa defasagem no sazonal k (k = 1, 2, ... , L - 3) no correlograma parcial se: t rkk > 2.

(b) Define-se o comportamento do correlograma (ou do correlograma parcial)


no nvel sazonal como o comportamento da funo de autocorrelao nas defasagens
iguais (ou prximas) a L, 2L, 3L e 4L. Alm disso:

39
b1. Define-se as defasagens L, 2L, 3L e 4L como defasagens sazonais exatas.
Um pico existe numa defasagem sazonal exata k do correlogama se: t rk > 1,25 e um

pico existe numa defasagem exata k do correlograma parcial se: t rkk > 2.

b2. Define-se as defasagens L-2, L-1, L+1, L+2, 2L-2, 2L-1, 2L+1, 2L+2, 3L-
2, 3L-1, 3L+1, 3L+2, 4L-2, 4L-1, 4L+1 e 4L+2 como defasagens sazonais aproximadas.
Um pico existe numa defasagem sazonal aproximada k do correlograma se: t rk > 1,6.

Existe um pico numa defasagem sazonal aproximada k do correlograma parcial se:


t rkk > 2.

O valor da funo de autocorrelao no correlograma (ou correlograma parcial)


trunca aps a defasagem k no nvel sazonal se no houver picos em defasagem sazonais
exatas ou aproximadas maiores que essa defasagem k.

Alm disso, o correlograma (ou correlograma parcial) apresenta padro de


decaimento no nvel sazonal se a funo de autocorrelao no truncada, mas, ao invs
disso, decresce numa forma de padro de decaimento definida nas defasagens do nvel
sazonal.

Em geral, pode ser mostrado que, se os valores do correlograma da srie Zb,


Zb+1, ... , Zn:

(1) truncam razoavelmente rpido ou decaem razoavelmente rpido no nvel


no sazonal, e

(2) truncam razoavelmente rpido ou decaem razoavelmente rpido no nvel


sazonal,

ento essa srie tem valores que podem ser considerados estacionrios.

Caso o oposto ocorra, a srie considerada no estacionria e novas


transformaes devem ser feitas na srie de observaes.

Quando o correlograma (ou correlograma parcial) trunca razoavelmente rpido


no nvel no sazonal, isso ocorre frequentemente aps a defasagem k 2. No nvel
sazonal, isso ocorre frequentemente aps a defasagem k L + 2.

40
15. Estimativas Preliminares dos Parmetros do Modelo Geral

Os pacotes de software computacional de sries temporais comeam com


estimativas pontuais preliminares dos parmetros a serem estimados e ento aplicam
uma tcnica de busca interativa para obter as estimativas pontuais de mnimos
quadrados dos parmetros. Alguns pacotes iniciam o procedimento com estimativas
geradas internamente mas outros requerem que o usurio as fornea. Essas estimativas
devem obedecer s condies de invertibilidade e estacionariedade.

As estimativas pontuais preliminares podem ser obtidas:

1) Estabelecendo-se as estimativas preliminares dos operadores p(B),


P(BL), q(B), Q(BL) iguais a 0,1.

2) Obtendo-se a estimativa preliminar de = p (B) P (B L ) =

= (1 - 1 B - 2 B 2 ... p B p ) (1 - 1,L B L 2,L B 2L ... P,L B PL ) =

= (1 - 1 - ... p ) (1 - 1,L 2,L ... P,L ) =

Z(1 - 0,1 - 0,1 ... 0,1) (1 - 0,1 0,1 ... 0,1)

onde Z a mdia amostral da srie temporal estacionria Zb, Zb+1, ... , Zn.

Quando se obtm as estimativas finais de mnimos quadrados dos parmetros


do modelo, deve-se verificar se essas estimativas satisfazem s condies de
estacionariedade e invertibilidade (Tabela 2). Se no as satisfizerem, isto sugere que o
modelo pode no ser adequado.

41
Tabela 2 - Condies de estacionariedade e de invertibilidade sobre os parmetros de
primeira e segunda ordem dos operadores p(B), P(BL), q(B) e Q(BL).
Operador Condies de Condies de
estacionariedade invertibilidade
1(B) = (1 - 1B) Nenhuma |1| < 1
2(B) = (1 - 1B - 2B2) Nenhuma 1 + 2 < 1
2 - 1 < 1
|2| < 1
1(BL) = (1 - 1,LBL) Nenhuma |1,L| < 1
2(BL) = (1 - 1,LBL - 2,LB2L) Nenhuma 1,L + 2,L < 1
2,L - 1,L < 1
|2,L| < 1
1(B) = (1 - 1B) |1| < 1 Nenhuma
2(B) = (1 - 1B - 2B2) 1 + 2 < 1 Nenhuma
2 - 1 < 1
|2| < 1
1(BL) = (1 - 1,LBL) |1,L| < 1 Nenhuma
2(BL) = (1 - 1,LBL - 2,LB2L) 1,L + 2,L < 1 Nenhuma
2,L - 1,L < 1
|2,L| < 1

16. Melhorias no Modelo Sazonal Tentativo

Em geral, se as estatsticas Q (ou Q) indicam que a adequao de um modelo


Box-Jenkins deve ser rejeitada, deve-se investigar o correlograma e o correlograma
parcial da srie de resduos para identificar (tentativamente) um modelo descrevendo os
resduos. Esse deve ser combinado ao modelo da srie de forma a gerar um novo
modelo tentativo.

A Tabela 3 apresenta de forma sucinta os valores crticos da estatstica t para


identificar picos no correlograma e no correlograma da srie de resduos.

42
Tabela 3 Valores absolutos crticos da estatstica t para identificar picos no
correlograma da srie e no correlograma da srie de resduos
Valores Crticos Valores Crticos no
Defasagens no Correlograma Correlograma dos
Resduos
No-sazonais
Baixas (1,2 e talvez 3) 1,6 1,25
Outras defasagens no-sazonais 2,0* 1,6
Sazonais
Exatas (L, 2L, 3L, 4L) 1,25 1,25
Aproximadas (L-2, L-1, L+2, L+1, ...) 1,6 1,25
Semi-peridicas sazonais (0,5L, 1,5L, 2,5L, 3,5L) 1,6 1,25
Outras 2,0* 1,6
(Bowerman & OConnel, 1993, pg. 582)

A Tabela 3 apresentou um sumrio dos valores crticos da estatstica t para


identificar picos no correlograma dos resduos, onde os valores so aqueles das escolhas
de Pankratz (1983), excetuando os marcados com (*). No caso do correlograma parcial
dos resduos, os valores absolutos da estatstica t devem ser comparados com o valor
crtico 2.

Por outro lado, se Q (ou Q) indicam que no se deve rejeitar a adequao do


modelo, todos os valores individuais da estatstica t em mdulo devem ser comparados
com o valor crtico 2, como uma avaliao complementar ao da estatstica Q (ou Q).

17. Lista de Verificaes sobre os Modelos ARIMA (Levenbach e Cleary,


1984, pg. 457-458)

Conforme discutido por Levenbach e Cleary (1984, pgs. 457-458), devem ser
feitas as seguintes verificaes nas etapas de ajustamento de modelos ARIMA uma
srie temporal:

1. Verificar se a srie estacionria.

2. Exame da matriz de correlaes. No pode haver um alto grau de


correlao entre as estimativas dos parmetros dos modelos (por exemplo,
acima de 0,9).

3. Verificar se todos os termos do modelo foram devidamente includos.

43
4. As estimativas dos parmetros e seus desvios padro devem ser
examinados. Testes de hiptese devem ser feitos para avaliar a incluso
do parmetro no modelo.

5. Se um termo autoregressivo regular ou sazonal includo, as estimativas


dos parmetros no devem estar prximas de 1,0 (por exemplo, acima de
0,90 ou 0,95). Se uma delas prxima de 1,0, uma diferenciao regular
ou de ordem sazonal deve ser tentada e um teste de previso feito para
determinar qual modelo melhor: o diferenciado ou o autoregressivo.

6. Verificar se a soma do quadrado dos erros e o desvio padro dos resduos


diminuem enquanto o ajuste do modelo melhora.

7. A estatstica 2calculada menor 2crtico para os graus correspondentes de


liberdade?

8. Observar se h padro significante no correlograma dos resduos. Rever


o correlograma e o correlograma parcial para verificar padro restante nos
resduos. Ateno maior deve ser dado ao correlograma (padres de
decaimento dos picos das autocorrelaes defasadas com incio em um
pico de valor prximo de 1,0 indicam processo autoregressivo regular.
Padro de decaimento dos picos originando-se num valor mais baixo
indica padro misto ARMA).

9. Uma constante de tendncia determinstica foi estimada? Sugere-se que a


constante seja includa no final do procedimento. Se a mdia dos resduos
do modelo final for maior que um desvio padro em relao a zero, deve
ser colocada uma constante no modelo e avaliada a sua significncia
estatstica (H momentos em que no se deseja colocar uma tendncia
determinstica no modelo de previso).

10. Tenha ateno para a super-diferenciao. Uma verificao do


correlograma pode ajudar nessa questo. Essa aparente quando a
estimativa do parmetro regular ou sazonal de mdias mveis assume
valor prximo de 1,0.

11. Algumas combinaes dos parmetros so improvveis. Se elas


estiverem presentes, reavaliar a anlise feita. So elas:

44
Diferenas sazonais e parmetros autoregressivos sazonais.

Parmetros de mdias mveis sazonais e autoregressivos sazonais.

Parmetros de mdias mveis sazonais em defasagens outras que 4 e


12 (e seus mltiplos) para sries trimestrais e mensais.

18. Um Tpico Avanado: Estimao No Linear

Seja a equao:

Y = f(X1, X2, ... , Xk, 1, 2, ... , p) +

onde:

f funo no linear de k variveis independentes e p parmetros.

Como critrio de estimao dos parmetros, busca-se a minimizao da soma


dos desvios ao quadrado. Para isso, sejam as T observaes de Y, X1, X2, ... , Xk, de
forma que:
T
S = [Yt f(X1t ,...,X kt , 1 ,..., p )]2 a soma dos desvios ao quadrado e
t =1

1 ,..., p so os estimadores no-lineares de 1 ,..., p .

Se ~ N(0,2) 1 ,..., p so os estimadores de mxima verossimilhana ou

os estimadores dos s que tem a maior probabilidade de ter gerado as observaes


amostrais dos Ys.
2
A funo de verossimilhana L = (2 2 ) T/2 e S/2 , para a qual se quer obter a
mxima verossimilhana ou seja, maximizar L. Deve ser observado que a minimizao
de S em relao aos s equivale maximizao de L em relao aos s.

Para obter as estimativas dos `s que minimizam S, pode-se utilizar, por


exemplo, trs mtodos computacionais de estimao no linear. Nos dois primeiros, a
especificao da funo S somada eficincia computacional define o melhor mtodo:

45
1) Busca Direta

Obtm-se os valores de S associados a diferentes conjuntos de parmetros, de


forma a definir aquele conjunto associado ao S mnimo, que o conjunto timo de
parmetros.

Esse mtodo vlido apenas em casos de um ou dois parmetros, pelo grande


nmero de combinaes de parmetros para se realizar a busca direta.

2) Otimizao Direta

S
Define-se o sistema de equaes normais: = 0, i = 1, ... , p ou seja:
i

T f
2[Yt f(X1t ...X kt , 1 ,..., p )] = 0, i = 1, ..., p,
t =1 i

ao qual aplica-se mtodos computacionais eficientes.

3) Mtodo de Linearizao Iterativa

O mtodo desenvolve-se segundo trs passos:

(a) A equao linearizada atravs de expanso de sries de Taylor em


torno de um conjunto inicial de parmetros (1,0 ... p,0). Deve haver
uma variao de conjuntos iniciais para observar se o timo local ou
global foi obtido.

(b) Aplicao de Mnimos Quadrados Ordinrios (MQO) para a gerao de


parmetros da equao linearizada que minimizem a soma do quadrado
dos desvios.

(c) Equao re-linearizada em torno do novo conjunto de parmetros


(obtidos em (b)). Volta-se ao passo (b).

Na medida que se tem convergncia, h condio de parada na aplicao do


mtodo. Esse mtodo possibilita a aplicao de testes estatsticos (R2, estatstica t, ...),
por exemplo, avaliando o ajustamento a cada iterao e ao final, quando se verificou
convergncia.

Para definir as variveis independentes e dependentes para a aplicao de


MQO, seja a equao para Y na forma de srie expandida em torno de um conjunto
inicial de parmetros:

46

f 6
p 47i4 8 1 p p 2f
Y = f (X1, ... , Xk, 1,0, ... , p,0) + ( i i,0 ) + ( i . j ) + ... +
i =1 i 2 i =1 j=1 i j
0 0

Nessa srie, considera-se a aproximao linear como composta apenas pelos


dois primeiros termos aps o sinal de igualdade mais o termo do erro aleatrio. A
equao pode ser reescrita de forma a definir as variveis independentes e a varivel
dependente ou seja:

Nova varivel independente

p f
Y - f (X1, ... , Xk, 1,0, ... , p,0) + i,0 =
i =1 i 0

p f
= i +
i =1 i 0

p variveis independentes

Aplicando os Mnimos Quadrados Ordinrios (MQO) com base nesse conjunto


de variveis, obtm-se o conjunto de parmetros 1,1, 2,1, ... , p,1 e, em decorrncia, so
obtidas as novas variveis dependente e independentes, respectivamente:

p f f
Y - f (X1, ... , Xk, 1,1, ... , p,1) + i,1 e , i = 1, ..., p.
i =1 i 1 i 1

De acordo com o mtodo, aplica-se os MQO na equao linearizada


equivalente a esse novo conjunto de variveis e assim sucessivamente at observar-se o
i, j+1 i, j
critrio de parada, por exemplo, quando < , i = 1, ... , p, sendo
i, j

estabelecido pequeno arbitrariamente.

47
19. Exemplo de Aplicao da Metodologia a Srie Temporal Sazonal

A gerncia de um grupo de hotis necessita da previso de curto-prazo do


nmero de quartos ocupados em seus estabelecimentos, de forma a se programar e
contratar pessoal-extra para atender a demanda dos meses de vero, estabelecer
contratos de fornecimento de itens que tem um grande tempo de ressuprimento,
programar gastos com propaganda etc..

Para isto, foi analisada a srie histrica do nmero de quartos ocupados por dia
durante 15 anos, entre 1973 e 1987. Como o planejamento necessrio mensal, o
conjunto de dados da srie histrica foi reduzido a mdias mensais pela diviso do total
mensal pelo nmero de dias do ms. A Figura 22 apresenta o grfico dessa srie
temporal.

Foi decidido realizar a anlise da srie temporal com os dados entre 1973 e
1986, de forma que o ano de 1987 fosse usado para verificar a adequao do modelo.

A Figura 22 revela forte tendncia e padro sazonal. A amplitude do padro


sazonal parece aumentar com o aumento do nvel da srie.

Figura 22 - Grfico da srie de ocupao de quartos do hotel (yt)

Dessa forma, feita uma transformao na base de dados obtendo-se o log


(natural) de yt, de forma que y *t = ln y t , cujo grfico mostrado na Figura 23. Observa-
se que a amplitude da variao sazonal foi equalizada, mas a srie contnua no-
estacionria em relao tendncia (assim como tem padro sazonal). A anlise dos

48
correlogramas Figura 24 (a) e (b) confirma a no-estacionariedade da srie
transformada.

Figura 23 Grfico da srie transformada y *t = ln y t

Figura 24 (a) Correlograma da srie transformada y *t = ln y t

49
Figura 24 (b) Correlograma parcial da srie transformada y *t = ln y t

feita a transformao z t = y *t y *t -1 , e os correlogramas simples e parcial


relativos srie resultante so mostrados na Figura 25 (a) e (b). No correlograma
simples, observa-se que no nvel no-sazonal as autocorrelaes decaem vagarosamente
e que no nvel sazonal elas decaem extremamente devagar. Logo zt pode ser
considerada no-estacionria.

50
Figura 25 (a) Correlograma da srie transformada z t = y *t y *t -1

Figura 25 (b) Correlograma parcial da srie transformada z t = y *t y *t -1

51
feita a transformao z t = y *t y *t -12 . A Figura 26 (a) e (b) apresenta os
correlogramas relativos essa transformao. No nvel no-sazonal, no correlograma
simples, observa-se picos nos perodos 1, 3 e 5, mas que parecem fazer parte de um
padro de decaimento rpido. No correlograma parcial observa-se picos nos perodos 1,
3 e 5 e h indicao de trucamento aps o perodo 5.

Figura 26 (a) Correlograma da srie transformada z t = y *t y *t -12

52
Figura 26 (b) Correlograma parcial da srie transformada z t = y *t y *t -12

No nvel sazonal, observa-se que o correlograma tem pico e trunca aps a


defasagem de perodo 12 ( t r12 = 3,511 ). Por outro lado, no correlograma parcial a

funo decai razoavelmente rpido, com picos decrescentes nas defasagens sazonais

exatas e aproximadas ( t r12,12 = 4,057 ; t r25,25 = 2,192 ; t r37,37 = 2,027 ).

A anlise do correlograma tanto no nvel no-sazonal quanto no sazonal


permite concluir que a transformao z t = y *t y *t -12 gerou uma srie temporal
estacionria.

Entretanto, feita a transformao de primeiras diferenas na srie de


diferenas de ordem 12, gerando a srie relativa a z t = y*t y*t -1 y*t 12 + y*t 13 .

53
Figura 27 (a) Correlograma da srie z t = y*t y*t -1 y*t 12 + y*t 13

Figura 27 (b) Correlograma parcial da srie z t = y*t y*t -1 y*t 12 + y*t 13

54
A anlise do correlograma (Figura 27(a)) dessa srie feita. Observa-se
truncamento no nvel sazonal (aps defasagem de perodo 18) e decaimento
razoavelmente rpido no nvel no-sazonal. Entretanto, comparando com os padres
observados no correlograma da Figura 26(a), conclui-se que obter as diferenas de
primeira ordem no acelerou o truncamento ou o decaimento, implicando em dizer que
a transformao z t = y *t y *t -12 parece o bastante para garantir a estacionariedade e a

transformao y *t y *t -1 y *t 12 + y *t 13 estaria gerando srie menos estacionria que

y *t y *t 12 . Dessa forma, desnecessrio avaliar o correlograma parcial da Figura


27(b).

Assim, preciso avaliar o comportamento das autocorrelaes nos


correlogramas da Figura 26 (a) e (b) para identificar os operadores de mdias mveis e
autoregressivos que devem compor o(s) modelo(s) tentativo(s). Como resultado dessa
avaliao, no nvel no-sazonal, o correlograma tem padro de decaimento
razoavelmente rpido e o correlograma parcial tem picos nas defasagens 1, 3 e 5, com
truncamento aps. Dessa forma, o operador p(B) deve ser includo no modelo,
podendo assumir trs formas:

(a) (1 - 1B - 3B3 - 5B5), que corresponde a um modelo pouco usual.

(b) (1 - 1B - 3B3)

(c) (1 - 1B - 2B2 - 3B3)

No nvel sazonal, o correlograma tem pico na defasagem 12 e truncamento


aps, enquanto o correlograma parcial apresenta padro de decaimento rpido. Isto
indica o uso do operador Q(BL). Uma vez que o nico pico na defasagem 12, L = 12
e o operador sazonal :

1(B12) = (1 - 1,12B12)

Os modelos tentativos so:

(a) (1 - 1B - 3B3 - 5B5) zt = + (1 - 1,12B12) t

(b) (1 - 1B - 3B3) zt = + (1 - 1,12B12) t

(c) (1 - 1B - 2B2 - 3B3) zt = + (1 - 1,12B12) t

55
Para concluir se a constante deve ser includa no modelo (significando que a
srie varia em torno de mdia 0), deve-se obter o valor amostral da mdia e avaliar
sua significncia estatstica.

Assim, lembrando que z t = y *t y *t -12 ,

Obtm-se:
168
zt
z= t =13
= 0,0333
168 13 + 1
1/2
168 (z t z) 2
t
S z = =13 = 0,02319
(168 13 + 1) 1

z 0,033
t= = = 17,7951
Sz 0,02319
n b +1 168 - 13 + 1

Logo |t| > 2, levando concluso de que:

z estatisticamente 0 e

= p (B) P(BL).

A anlise da adequao dos trs modelos tentativos indica que a forma


(1 - 1B - 2B2 - 3B3) zt = + (1 - 1,12B12) t a mais apropriada (Bowerman e
OConnell, 1976). Logo:

(1 - 1B - 2B2 - 3B3) (y *t y *t -12 ) = + (1 - 1,12B12) t

y *t 1B y *t 2B2 y *t 3B3 y *t y *t -12 + 1B y *t -12 +

+ 2B2 y *t -12 + 3B3 y *t -12 = = + t - 1,12B12 t

A equao pode ser escrita:

y *t = + y *t -12 + 1 ( y *t -1 - y *t -13 ) + 2 ( y *t -2 - y *t -14 ) +

+ 3 ( y *t -3 - y *t -15 ) - 1,12 t-12 + t

56
As estimativas preliminares dos parmetros do modelo obedecem s condies
de invertibilidade e estacionariedade:

1 + 2 + 3 < 1 (necessria, mas no suficiente)

|1,12| < 1

So elas: 1 = 0,1 ; 2 = 0,1 ; 3 = 0,1 e 1,12 = 0,1 , e

= 0,33 (1-0,1 - 0,1 0,1) = 0,0231.

As estimativas finais de mnimos quadrados so:

1 = 0,2922 ; 2 = 0,1674 ; 3 = 0,2408 e 1,12 = 0,5917,

que satisfazem s condies de invertibilidade e estacionariedade, permitindo que se


obtenha = 0,0258.

A estatstica t para cada um dos parmetros estimados maior do que 2, em


mdulo, permitindo consider-los significantes estatisticamente.

A avaliao do coeficiente de correlao entre os parmetros estimados mostra


que o valor absoluto das correlaes inferior a 0,9, o que permite concluir que as
estimativas finais dos parmetros no so altamente correlacionadas. Correlaes muito
altas sugerem que as estimativas so de m qualidade. Nesse caso, se dever investigar
os correlogramas para encontrar um modelo alternativo que possa ter melhores
resultados nas verificaes finais da estimao.

Aplicando o teste da estatstica Q de Box-Pierce aos resduos obtidos quando o


modelo anterior ajustado srie temporal e fazendo m np = 20, onde np nmero
de parmetros igual a 4, n = n (d + LD) = 156, sendo d e D o nmero de
diferenciaes de no-sazonal e sazonal, respectivamente, obtm-se:
m
Q = n' rl2 () = 26,712
l =1

2
Observa-se que o valor tabulado de crtico :

2
(0,05) [(m np) = 20 graus de liberdade] = 31,4104

Dessa forma, conclui-se que:

57
2
Q = 26,712 < 31,4104 = (0,05) (20 graus de liberdade) e, assim, a adequao do

modelo no pode ser rejeitada para um nvel de significncia de 0,05.

Os valores individuais das estatsticas t das autocorrelaes e autocorrelaes


parciais da srie de resduos so menores do que dois (em mdulo) (excetuando-se o
caso de uma autocorrelao dos resduos, na defasagem 10), logo pode-se concluir que
o modelo adequado.

Antes de prosseguir com a previso com o modelo estimado, alguns


comentrios devem ser feitos:

1) Recomenda-se identificar picos nos correlogramas da srie de resduos de


acordo com o guia para identificao de modelos sazonais (seo ? e
Figura ?) apenas quando o teste Q (ou Q) indicar que a adequao do
modelo deve ser rejeitada.

2) Se Q (ou Q) indicarem que a adequao do modelo no deve ser


rejeitada, deve-se concentrar em examinar os valores individuais das
autocorrelaes amostrais dos resduos cujas estatsticas t forem maiores
que 2 (em mdulo).

3) Se h indicao de que a adequao do modelo deve ser rejeitada,


recomenda-se que somente sejam considerados picos significativos no
correlograma parcial dos resduos aqueles cujos valores da estatstica t
em mdulo sejam maiores que 2.

4) No caso da avaliao de modelos alternativos, aquele com menor desvio-


n
(y t y t )
2

t =1
padro S = indica o melhor ajuste e deve conduzir a
n np
previses mais precisas dos intervalos de predio.

19.1 O Uso do Modelo Tentativo para a Previso

58
Anexo 1

A Abordagem da Mxima Verossimilhana

Supe-se que um modelo :

Y = f(X1,..., Xk, 1,..., p) + , onde normalmente distribudo e satisfaz os


pressupostos do modelo clssico de regresso linear.

A distribuio de probabilidade de Y pode ser obtida por:


1/2
1 1 2
p(Yi ) = f(Yi , X i , ) = 2
exp 2 (Yi f(...) ) ,
2 2

onde:

f(...) = f(X1i ,..., X ki , 1 , ..., p )

Os estimadores de mxima verossimilhana de um parmetro so os

estimadores que maximizam:

p(Y1) p(Y2) ... p(YN)

onde:
N
L = p(Yi ) referida como a funo de verossimilhana,
i=1

ou seja: so os estimadores que mais provavelmente geram as observaes


Yi.

Aplicando logaritmo na funo de verossimilhana obtm-se (Gujarati, 2006,


pg. 93):

= log[f(Yi , X i , )] =
N
log L
i =1

N N
= log 2 - log 2
2 2

1 N (Yi f(X1i ,..., X ki , 1 ,..., p ))


2


2 i =1 2

59
Dessa forma, maximizar log L corresponde minimizao de:
N
S = (Yi f(X1i ,..., X ki , 1 ,..., p )) 2
i =1

Considerando o modelo a duas variveis Yi = + Xi + i, diferencia-se a


funo log L parcialmente em relao a , e 2.

Como resultado, obtm-se:

(log L) 1
= 2 (Yi - - Xi) = 0

(log L) 1
= 2 [Xi (Yi - - Xi) = 0

(log L) -N 1
= + 4 (Yi - - Xi)2 = 0
2
2 2
2

Prosseguindo com a soluo desse sistema de equaes, so obtidos os


estimadores de mxima verossimilhana:

' = Y ' X

(X i X) (Yi Y)
' =
(X i X) 2

' (Yi ' - ' X i ) 2


2 =
N

Os estimadores de mxima verossimilhana de e so identicamente iguais


aos estimadores de mnimos quadrados. Entretanto, 2 um estimador viesado de 2
(embora consistente).

60
Referncias

Bowerman e OConnell (1987), Times Series Forecasting: Unified Concepts and


Computer Implementation, Duxburg Press.

Dickey, P.A. e Fuller, W.A. (1979), Distribution of Estimators for Autoregressive


Time Series With a Unit Root, Journal of the American Statistical Association,
Vol. 74, pp. 427-431.

Granger e Newbold (1977), Forecasting Economic Time Series, Academic Press, NY.

Gujarati, D. (2006), Econometria Bsica, Elsevier.

Levenbach e Cleary (1984), The Modern Forecaster: The Forecasting Process Through
Data Analysis, Lifetime Learning Publications, Califrnia.

Pankratz, A. (1983), Forecasting With Univariate Box-Jenkins Models: Concepts and


Cases, Wiley, N.Y.

Pindyck, R.S. e Rubinfeld, P.L. (1991), Econometric Models & Economic Forecasts,
McGraw-Hill International Editions.

VERSO EM REVISAO

61

You might also like