Professional Documents
Culture Documents
Introduo Suponha que exista um sistema que atue como um filtro (Figura 1), que estimulado por uma srie de rudos brancos, resultantes de um processo de gerao de nmeros aleatrios, e que com esse estmulo seja gerada pelo sistema uma seqncia de valores observados seguindo um padro, que corresponde srie temporal Yt. rudo branco Filtro temporal srie Yt
Em situaes da realidade, tem-se o caminho inverso ou seja, conhece-se o conjunto de observaes seqenciais Yt geradas pelo sistema em questo, ao qual buscase associar um modelo que corresponda aos processos internos ao sistema que as gerou (Figura 2). Uma vez que se estabelea um modelo operacional para essa representao, a srie aleatria et de valores em torno de zero corresponde seqncia de valores (resduos) que resulta ao extrair de Yt os valores obtidos com o modelo ajustado essa mesma srie de valores observados Yt. A metodologia de Box-Jenkins para a previso se baseia no ajuste de modelos tentativos denominados ARIMA a sries temporais de valores observados de forma que a diferena entre os valores gerados pelos modelos e os valores observados resulte em sries de resduos de comportamento aleatrio em torno de zero. Os modelos ARIMA (autoregressivos integrados e de mdias mveis) so capazes de descrever os processos de gerao de uma variedade de sries temporais para os previsores (que correspondem aos filtros) sem precisar levar em conta as relaes econmicas, por exemplo, que geraram as sries.
Segundo a sistemtica da metodologia de Box-Jenkins os modelos ARIMA descrevem tanto o comportamento estacionrio como o no-estacionrio. Dessa forma, pode-se afirmar que essa uma metodologia de modelagem flexvel em que as previses com base nesses modelos so feitas a partir dos valores correntes e passados dessas sries. Pode-se associar o conceito inicial de um filtro estimulado por uma srie aleatria do tipo rudo branco metodologia de Box-Jenkins (Figura 3).
Na Figura 3 representado um conjunto de sucessivos filtros aos quais associam-se os parmetros dos modelos ARIMA (p,d,q) que representam os sistemas estimulados pela srie et que geraram a srie temporal Yt: o filtro de mdias mveis (parmetro q), o filtro autoregressivo estacionrio (parmetro p) e o filtro de integrao no-estacionrio (parmetro d).
2.
curto prazo (Granger & Newbold, 1977). Resultados de anlises com esses modelos mostram que os melhores resultados (previses) so obtidos com de 5 a 10 anos de informao (mensal), particularmente na presena de sazonalidade. Como j visto, a importncia do processo observado ser estacionrio a possibilidade de fixar parmetros do modelo vlidos para previso do futuro a partir do passado. Assim, como primeiro passo para essa modelagem so realizados procedimentos para a remoo da no-estacionariedade.
A anlise das estatsticas bsicas das sries estacionrias permite separar a estacionariedade em dois grupos: (1) estacionariedade no amplo senso: mdias, varincias e covarincias constantes no tempo. (2) estacionariedade no estrito senso: probabilidade de uma dada flutuao no processo em torno da mdia a mesma em qualquer momento do processo.
Na prtica, aceita-se que as sries observadas sejam sries fracamente estacionrias, situaes nas quais garante-se apenas mdias e varincias invariantes no tempo. Existe uma equivalncia entre os modelos ARIMA e os modelos ARMA Esses ltimos so ajustados a sries j (autoregressivos e de mdias mveis).
estacionrias transformadas pelo mtodo das diferenas de ordem d ou seja, cujas sries originais so sries no-estacionrias homogneas (assim denominadas por ter sido possvel obter a estacionariedade com um nmero finito de diferenciaes), como a srie do exemplo a seguir (Figuras 4, 5, 6 e 7).
t = 3, ... , n. Zt = (Yt Yt-1) (Yt-1 Yt-2) = Yt 2Yt-1 + Yt-2. Varincia no-constante no tempo.
Yt = logYt
*
Varincia constante. Srie pode ser dita estacionria. A srie original dita homognea de ordem d = 1.
Nas figuras 4, 5 e 6 so mostrados os grficos de uma srie original de oferta monetria ajustada sazonalmente, onde existe clara tendncia, e das respectivas sries transformadas de primeiras e segundas diferenas. Observa-se que a varincia noconstante no tempo em todas elas. Nesse caso feita a transformao logartmica nos dados originais e em seguida obtida a srie das primeiras diferenas da srie Yt* = log Yt
ou seja: Yt* , para a qual pode-se aceitar que a varincia constante e, assim, a srie original dita homognea de primeira ordem (d = 1) (Figura 7). luz da anlise de autocorrelao, seguem exemplos do uso do correlograma para identificar sries temporais estacionrias para dados no sazonais: 1. Srie pode se considerada estacionria quando h truncamento abrupto ou padro de decaimento rpido (Figuras 8 e 9).
Figura 8 Valores das autocorrelaes significativos nos perodos iniciais de defasagem e truncamento aps
Figura 9 Valores das autocorrelaes significativos decaindo bem rpido para valores prximos de zero
2.
Srie pode ser considerada no-estacionria quando h padro de decaimento lento para zero (Figura 10).
Figura 10 Valores das autocorrelaes significativos decaindo extremamente devagar segundo padres de decaimento
Como exemplos de padro de decaimento podem ser observados os padres representados na Figura 11: a) b) c) decaimento exponencial sem oscilaes decaimento exponencial com oscilaes decaimento em onda senoidal
2.1
Seja o processo estocstico de raiz unitria: Yt = Yt-1 + t , -1 1, onde t um termo de erro de rudo branco. Quando = 1 (raiz unitria), o processo gerador da srie Yt o passeio aleatrio e a srie no-estacionria. Subtraindo-se Yt-1 dos dois lados da igualdade, escreve-se: Yt Yt-1 = Yt-1 Yt-1 + t
Yt-1 = Yt-1 + t ,
(1)
onde = - 1. Um procedimento de teste da raiz unitria pode ser aplicado equao (1). Dessa forma, estima-se os parmetros da equao (1) e testa-se se = 0. Se = 0, = 1 raiz unitria e a srie original no-estacionria. Entretanto, a estatstica t de Students no se aplica nesse caso (Gujarati, 2006). Usa-se o teste de Dickey-Fuller, que avalia se o valor da estatstica t estimado para o parmetro de Yt-1 segue a distribuio da estatstica (tau). Dessa forma, o teste de Dickey-Fuller verifica a hiptese nula ( = 0) rejeitada ou no em determinados nveis de significncia estatstica, conforme valores tabulados (Gujarati, 2006, pg. 791). Se o valor em mdulo de t < |estatstica |, no possvel rejeitar a hiptese nula ou seja, a hiptese de no-estacionariedade. O procedimento do teste deve ser mais sofisticado, entretanto. estimao da equao (1) (e conseqente teste de hiptese sobre = 0), devem se juntar a estimao das variantes possveis do processo de passeio aleatrio e os respectivos testes de hipteses sobre = 0:
Yt = 1 + Yt-1 + t Yt = 1 + 2 t + Yt-1 + t
(2) (3)
Nessas duas variantes [(2) e (3)], = 0 significa que h raiz unitria ou seja, a srie Yt no-estacionria. A hiptese alternativa que < 0, significando - 1 < 0 ou seja < 1 (observe que > 1 no aceita por implicar em exploso de valores da srie). Se a hiptese nula for rejeitada, isso significa que (Gujarati, 2006):
Yt uma srie temporal estacionria com mdia zero: equao (1) Yt uma srie temporal estacionria com mdia diferente de zero: equao (2) Yt uma srie estacionria em torno de tendncia determinstica: equao (3)
2.2
O Teste F de Dickey-Fuller
para a hiptese de Yt se comportar como o passeio aleatrio isto , sob a hiptese que
= 0 e = 1.
O teste pode ser aplicado para uma verso geral da equao (4) ou seja, sob a suposio de que Yt possa ser descrita por: Yt = + t + Yt-1 + 1 Yt-1 + t, onde Yt-1 = Yt-1 Yt-2. Outras defasagens Yt-i podem ser includas na equao, mas o teste seria o mesmo. Com base nos Mnimos Quadrados Ordinrios, so estimados os parmetros das regresses irrestritas (5) e restrita (6) seguintes: Yt Yt-1 = + t + ( - 1) Yt-1 + 1 Yt-1 Yt Yt-1 = + 1 Yt-1 (5) (6)
onde: ESSR e ESSIR so a soma do quadrado dos resduos nas regresses restrita e irrestrita, respectivamente, N K q o nmero de observaes, o nmero de parmetros estimados na regresso irrestrita, e o nmero de restries de parmetros (no caso: = 0; = 1)
O valor calculado de F comparado com os valores crticos da estatstica tabulada em uma tabela apropriada desenvolvida por Dickey e Fuller (Pindyck e Rubinfeld, 1991, pg. 461). Assim, se Fcalculado > Fcrtico de Dickey-Fuller, a hiptese do passeio aleatrio pode ser rejeitada.
3.
A diferena bsica entre a regresso clssica e os modelos de sries temporais que nos modelos de sries temporais ARMA (ou ARIMA) no se pode assumir independncia entre observaes. defasadas. Em suma, de forma geral, quando faz-se referncia a modelos ARIMA esses modelos esto sendo ajustados srie original. J ao fazer-se referncia a modelos ARMA, considera-se que a srie uma srie diferenciada. Supondo Yt a srie j diferenciada, os modelos ARMA em sua forma geral se escrevem: Yt = + 1 Yt 1 + 2 Yt 2 + ... + p Yt p + t 1 t 1 ... q t q Ao contrrio, os modelos autoregressivos e de mdias mveis vo modelar o grau de autocorrelao entre desvios e observaes
O melhor modelo deve ser parcimonioso ou seja, deve-se min {p,q}(o que quer dizer que se deve tentar utilizar o menor conjunto de parmetros possvel para seu
ajustamento srie de dados observados). Os parmetros p e q representam o nmero de parmetros relativos aos comprimentos de defasagem em que observa-se valores significativos das autocorrelaes e que correspondem a particularidades do sistema de gerao das sries que devem ser explicadas pelo modelo (pois correspondem a um padro de gerao). O processo gerador dos dados da srie dito aleatrio linear se o modelo ajustado Yt pode ser descrito como uma combinao linear de valores defasados de Yt e t. Esses modelos podem, para facilitar a compreenso, ser separados em dois modelos complementares (conforme Figura 3): os modelos de mdias mveis e os modelos autoregressivos. Os primeiros correspondem aos processos de mdias mveis de ordem q em que cada observao Yt gerada por uma mdia ponderada dos erros aleatrios q perodos no passado. Denota-se esse processo por MA(q), cuja equao :
Yt = + t 1 t 1 ... q t q , onde os parmetros 1 , ..., q podem ser positivos ou negativos. O sinal negativo no terceiro termo em diante corresponde a uma conveno. Assume-se que os erros aleatrios so gerados por um processo de gerao de rudos brancos ou seja: t~N(0,2) e covarincia k = 0 para defasagens k 0. Observa-se que Yt so dependentes, ou melhor, uma funo linear da ponderao dos erros. Seja exemplo, inicialmente, o modelo de processos aleatrios simples: Yt = t, t = 0, 1, 2, ..., vlido para srie puramente aleatria, nos quais, se t so normalmente distribudos, as observaes so ditas corresponderem ao rudo branco. Por outro lado, exemplo de modelo de um processo aleatrio linear simples o modelo de mdias mveis. Por exemplo, o modelo de mdias mveis de primeira ordem escreve-se: Yt = + t - 1 t-1, cujos parmetros so , 1, 2. Como exemplo de processo aleatrio linear simples (MA(1)), tome-se exemplo de MA(1) com 1 = 0,25 (Figura 12).
10
Figura 12 Exemplo de processo de mdias mveis MA(1) com 1 = 0,25 (Levenbach e Cleary, 1984).
Outro exemplo de processo aleatrio linear simples o processo AR(p) (autoregressivo) em que p = 1. O modelo AR(1) correspondente ao processo autoregressivo de 1 ordem tambm conhecido por processo de Markov, onde:
2 . Yt = + 1 Yt 1 + t , cujos parmetros so , 1,
t).
Outro exemplo, o modelo AR(1) com 1 = -0,9 (Yt = -0,9Yt-1 + t) (Figura 14).
11
O modelo autoregressivo genrico AR(p) escreve-se: Yt = + 1 Yt 1 + 2 Yt 2 + ... + p Yt p + t . Na verdade, como o nome indica, AR(p) modela uma autoregresso da varivel Yt com essa mesma varivel, defasada (Yt-1, Yt-2, ... , Yt-p), para os p perodos de defasagem em que a autocorrelao parcial entre as variveis significativa. Na Figura 15 representado o grfico de exemplo de AR(2) com 1 = +1,0 e
12
Existe um princpio de dualidade entre os modelos do tipo MA e AR de forma que existe a seguinte correspondncia entre eles: MA de ordem finita AR de ordem infinita AR de ordem finita MA de ordem infinita
Quando o processo gerador de srie temporal corresponde a modelos compostos por parte autoregressiva e parte mdias mveis, os modelos utilizados so o ARMA(p,q). Como exemplo de ARMA(1,1), tem-se: Yt = + 1 Yt 1 + t 1 t 1 .
4.
A metodologia de Box-Jenkins corresponde a trs estgios principais: (1) identificao de modelos tentativos (e de seus parmetros), (2) estimao, e (3) teste de adequao, aos quais se segue a aplicao do modelo para a previso ou controle do sistema de gerao dos valores observados Yt (Figura 16).
13
Assim, como tarefa inicial preciso determinar p e q para a identificao de modelos tentativos. Para isso, procede-se ao exame dos coeficientes de autocorrelao e dos coeficientes de autocorrelao parcial, que permitem medir a fora relativa de interao entre as variveis Yt defasadas. A combinao dos termos ponderados por esses dois coeficientes, na ausncia de aleatoriedade, poderiam revelar o modelo exato ARMA(p,q). Mas fato que a aleatoriedade est presente na amostra, o que leva a desvios dos verdadeiros valores observados. Logo, podem haver enganos na identificao dos coeficientes de autocorrelao com base na anlise de dados amostrais. Esses enganos so revelados no teste de adequao do modelo ou anlise dos resduos.
5.
A Autocorrelao Parcial
A autocorrelao parcial pode ser definida com o ltimo termo autoregressivo , , , ... , , so as m autocorrelaes de um modelo AR(m). Assim, 1 2 3 m -1 m parciais de qualquer processo AR(m), como pode ser visto nas equaes seguintes: Xt-1 + t Xt = 1 Xt-2 + t Xt = 1Xt-1 +
2
Equaes
Xt-3 + t Xt = 1Xt-1 + 2Xt-2 + 3 ... Xt-m+1 + t Xt = 1Xt-1 + 2Xt-2 + ... + m -1 Xt = 1Xt-1 + 2Xt-2 + ... + Xt-m + t
m
so usadas para medir o grau de associao entre Xt e Xt-i, os demais efeitos i constantes, em sistemas de equaes do tipo das equaes (7)-(11) acima, que correspondem um sistema de soluo trabalhosa. , , ... , podem ser obtidas com base na transformao As estimativas de 1 2 m do sistema de equaes. Seja exemplo:
X + Xt = 1 t 1 t
14
Multiplicando o primeiro e segundo termos da equao por Xt-1, obtm-se: Xt-1 . Xt-1 + Xt-1 t , Xt-1 . Xt = 1 onde: E (X2t-1) + E (Xt-1 t) E (Xt-1 . Xt) = 1
0, 1 = 1 = , ou melhor, que: = 1 = r1, sendo 1 a 1 = 1 1 1 1 0 autocorrelao terica (populao) e r1 o valor amostral estimado. Sucessivamente, pode-se derivar k=
k . 0
Pode-se trabalhar as equaes do sistema de equaes (7)-(11) e obter as equaes de Yule-Walker para obteno das autocorrelaes defasadas e das autocorrelaes parciais. Mas no caso de modelos complexos como o modelo ARMA (p,q), opta-se por simplificao nas estimativas dos valores dessas autocorrelaes. Assim, obtm-se o correlograma da funo da autocorrelao parcial (ou correlograma parcial, que equivale ao grfico das autocorrelaes parciais para diferentes defasagens), com base no clculo de rkk coeficiente de autocorrelao parcial amostral e na realizao de testes de hiptese para avaliao dos intervalos de defasagem entre as variveis observadas em que essa autocorrelao significativa. Para isso, deve-se observar: r1 , se k =1 1) rkk = (rk rk 1, j rk j )
j=1 k 1
se k = 2, 3, ...
(1 rk 1, j r j )
j=1
k 1
1 (n b + 1)1/2
rkk Srkk
15
4)
significativas.
6.
Define-se o operador B como BYt = Yt-1. Assim: B2 Yt = B(BYt) = B(Yt-1) = Yt-2 BkYt = Yt-k Yt Yt-1 = Yt BYt = (1-B)Yt Dessa forma, o modelo AR(1) se escreve, na forma compactada: AR(1) (1 - 1B)Yt = + t Por simplificao, Yt incluir , sendo (Yt - ), o que corresponde a modelar a srie ajustada mdia amostral ou seja: (Yt - Y), Y sendo a mdia amostral da srie. Assim, reescreve-se AR(1) como (1 - 1B) Yt = t. Para defasagens de ordem sazonal pode-se utilizar o operador BL, sendo L o comprimento de sazonalidade, de forma que: Yt Yt-12 = Yt B12Yt = (1-B12)Yt. Escrevendo os modelos na forma compactada possvel explorar a dualidade entre os modelos do tipo MA e AR. Para isso, seja o modelo AR(1): (1 - 1B) Yt = t, que pode ser reescrito Yt =
t . 1 1 B
o termo
coef. 1
coef. 2
...coef. n
seja, ele expresso como um processo MA de ordem infinita (valores dos coeficientes
n 1 decrescentes exponencialmente).
16
De forma similar, MA(1) Yt = (1 - 1B) t pode ser visto como AR de ordem infinita, pela mesma propriedade da dualidade ou melhor, se as condies de invertibilidade e estacionariedade forem obedecidas (sero apresentados mais frente). Os processos de maior ordem MA, AR e ARMA podem ser representados por: (1 - 1B - 2B2 - ... - pBp) Yt = (1 - 1B - 2B2 - ... - qBq) t, onde Yt a srie observada ajustada mdia amostral. Assim, Yt =
(1 1 B 2 B 2 ... q B q ) (1 1 B 2 B 2 ... p B p )
sendo: q(B) = 1 - 1B - 2B2 - ... - qBq ; p(B) = 1 - 1B - 2B2 - ... - pBp , e H(B) =
q (B) p (B)
Para representar o modelo de ARIMA (p,d,q), Yt nos modelos acima substitudo por wt, sendo wt a srie estacionria: wt = (1 B) Yt 1 diferena
ou, de forma geral, wt = (1 B)d Yt ou seja, a srie estacionria de ordem d. Assim, o modelo ARIMA (p,d,q) escreve-se: p(B)(1-B)dYt = q(B) t Por exemplo, o modelo ARIMA (1,1,1) assume a forma compactada: (1 - 1B)(1 B) Yt = (1 - 1B) t O modelo operacional do sistema gerador da srie original Yt deve obedecer s exigncias 1 e 2: 1) 2) Unicidade de representao Equilbrio estatstico em torno da mdia
17
2)
7.
Seja o modelo autoregressivo puro AR(p). O modelo autoregressivo vlido para todas as observaes da srie. observaes da srie estacionria Zt: Z t = + 1 Z t 1 + 2 Z t 2 +...+ p Z t p Supondo-se conhecido o valor terico ou a mdia populacional, sendo que essa verdadeira mdia constante em qualquer defasagem em que seja calculada, podese escrever: = + 1 + 2 + ... + p, ou seja: =
. (1 1 2 ... p )
A anlise da funo de autocorrelao de processos estacionrios leva ao estabelecimento de conjuntos de condies necessrias e suficientes para os valores k que garantem a estacionariedade, isto , mdia finita de varincia invariante do tempo que se somam condio necessria (1 + 2 + ... + p) < 1. Para o conjunto de modelos abaixo, as condies de estacionariedade so as seguintes: Modelo: Zt = + t - 1t-1 Zt = + t - 1t-1 - 2t-2 Zt = + 1Zt-1 + t Zt = + 1Zt-1 + 2Zt-2 + t Condies de estacionariedade Nenhuma Nenhuma |1| < 1 1 + 2 < 1, 2 - 1 < 1 Zt = + 1Zt-1 + t + 1t-1 |1| < 1 |2| < 1
18
No processo ARIMA (ou ARMA) a condio de invertibilidade significa que sua parte MA pode ser invertida em AR (puro). Os pesos aplicados aos valores passados de Zt so decrescentes, na medida em que a defasagem aumenta. Para o conjunto de modelos abaixo, so condies de invertibilidade: Modelo Zt = + t - 1t-1 Zt = + t - 1t-1 - 2t-2 Condies de invertibilidade |1| < 1 1 + 2 < 1, |2| < 1 2 - 1 < 1 Zt = + 1Zt-1 + t Nenhuma
As condies de invertibilidade e estacionariedade estabelecem restries aos valores das estimativas dos parmetros dos modelos. Como ser visto, para a estimao desses parmetros so obtidas inicialmente suas estimativas preliminares. As estimativas preliminares dos parmetros dos modelos de sries temporais tambm devem satisfazer s condies de estacionariedade e invertibilidade. Por conseqncia, a estimativa preliminar do termo constante deve ser feita com base nas estimativas dos s e s que satisfazem as condies de estacionariedade e invertibilidade.
8.
O Termo Constante
Considere-se a introduo do termo constante no modelo genrico: ARMA (p, q) ARMA (,s, s), ou seja: Zt = + 1Zt-1 + 2Zt-2 + ... + pZt-p + t - 1t-1 - 2t-2 - ... - qt-q 1, 2, ... so assumidos estatisticamente independentes E(i) = 0; E(i2) = 2; i ~ N(0, 2) Com o operador B, pode-se escrever o modelo na forma multiplicativa ( exceo da incluso aditiva do termo constante ): 19
A anlise do processo autoregressivo puro permite concluir que = p(B) onde p(B) = (1 - 1B - 2B2 - 3B3 - ... - pBp) = mdia populacional de todas as realizaes do processo estacionrio sob estudo O termo constante pode ser obtido nas trs situaes a seguir: 1) p(B) no includo no modelo (p(B) = 1) e q(B) pode ser includo, logo: q(B) = 1 - 1B - 2B2 - ... - qBq Assim, p(B) Zt = + q(B) t sendo Zt = + q(B) t ou seja, o modelo de mdias mveis, onde = p(B)=
2)
p(B) pode ser includo e q(B) no pode ser includo (q(B) = 1) Assim, p(B)Zt = + q(B) t p(B)Zt = + t ou seja, o modelo autogressivo, onde = p(B) = (1 - 1B - 2B2 - ... - qBq) = - 1B - 2B2 - ... - qBq = - 1 - 2 - ... - p = (1 - 1 - 2 - ... - p) 20
3)
Ambos p(B) e q(B) podem ser includos Assim, p(B)Zt = + q(B) t = p(B) = (1 - 1B - 2B2 - ... - pB2) = (1 - 1 - 2 - ... - p)
Para obter-se a estimativa amostral de , calcula-se a mdia amostral da srie de observaes Zb, Zb+1, ... , Zn, tal que:
Zt
n
Z=
t =b
n b +1
estimativa de
Assim, se Z for estatisticamente diferente de zero, 0 hiptese razovel. Como regra prtica, obtm-se a estatstica t (Students): Z S z /(n b + 1)1/2
n (Z Z) 2 t =b t , como a qual realiza-se o , onde S z = (n b + 1) 1 1/2
t=
teste de hipteses. Quando Zt a srie de diferenas em relao srie original Yt, o termo constante , ao ser includo no modelo, incorpora-se como medida da tendncia determinstica existente, sendo que a tendncia estocstica medida pelo modelo ARMA em seus parmetros p e q. Quando a srie modelada a srie original Yt, no caso da mdia amostral no ser estatisticamente diferente de zero, considera-se que o termo constante no deve ser includo na formao do modelo e que Yt est flutuando em torno de uma mdia zero.
9.
No estgio de identificao, as especificaes funcionais dos modelos so escolhidas com base na avaliao dos padres dos correlogramas, de forma que: A) Modelos: MA(1) e MA(2)
21
O correlograma tem picos nas defasagens 1, 2, ..., q e truncamento aps, e o correlograma parcial apresenta padro de decaimento. Nesse caso, se: (1) Se o correlograma tem pico na defasagem 1 e truncamento aps e o correlograma parcial decai com uma forma exponencial o modelo tentativo pode ser Yt = - 1 t-1 + t. (2) Se o correlograma tem pico nas defasagens 1 e 2 e truncamento aps e o correlograma parcial decai num misto de padro exponencial / onda senoidal, o modelo tentativo parece ser Yt = - 1 t-1 - 2 t-2 + t.
B)
O correlograma apresenta padro de decaimento e o correlograma parcial tem picos nas defasagens 1, 2, ..., p e truncamento aps. Nesse caso, se: (1) Se o correlograma parcial tem picos na defasagem 1 e o correlograma apresenta decaimento num padro exponencial, o modelo tentativo pode ser: Yt = + 1Yt-1 + t. (2) Se o correlograma parcial tem picos nas defasagens 1 e 2 e o correlograma apresenta decaimento num padro misto exponencial / onda senoidal o modelo tentativo pode ser Yt = + 1Yt-1 + 2Yt-2 + t.
C)
Se o correlograma tem picos nas defasagens 1, 2, ..., q e truncamento aps e o correlograma parcial tem picos nas defasagens 1, 2, ..., p e truncamento aps, devem ser avaliadas as situaes: 1. 2. Se o correlograma trunca-se mais abruptamente, o modelo MA(q). Se o correlograma parcial trunca-se mais abruptamente, o modelo AR(p).
22
3.
Se ambos os correlogramas parecem truncar-se igualmente abruptamente, os modelos tentativos podem ser: 1) MA(q) e no AR(p) 2) AR(p) e no MA(q)
Como regra prtica, em geral MA(q) leva ao melhor modelo e deve ser tentado em primeiro lugar.
D)
ARMA (p,q)
O correlograma apresenta padro de decaimento e o correlograma parcial, tambm. Nesse caso, o modelo tentativo deve ter uma parte AR(p) e uma parte MA(q). Deve-se observar o princpio da parcimnia ou seja, por exemplo: tambm, o modelo tentativo deve ser, inicialmente, o mais simples: Yt = + 1Yt-1 - 1t-1 + t. se o
E)
O correlograma tem pequenos valores (sem picos) e o correlograma parcial, idem. O modelo tentativo deve ser Yt = + t.
10.
Considere que o modelo escolhido tentativo seja ARMA(1,1), que em forma de desvios em relao mdia tem a forma matemtica Xt = 1Xt-1 + t + 1 t-1. A estimao dos parmetros desse modelo deve se feita atravs de mtodos de estimao no-linear. Assim, os passos seguintes so observados: 1) valores iniciais das estimativas dos parmetros 1 e 1 (e , se for o caso) so definidos. 2) modificaes nesses valores so obtidas, de forma a minimizar a soma dos quadrados dos erros.
23
Para avaliar a significncia estatstica dos valores finais dos parmetros, devem ser construdos intervalos de confiana, realizados testes de hipteses e verificadas as condies de estacionariedade e invertibilidade (para a unicidade de representao). Este tpico ser retomado em detalhes mais adiante.
11.
Supondo-se que 1 = 0,35 e 1 = 0,20 sejam os valores finais estimados para os parmetros do modelo ARMA(1,1), escreve-se:
= 0,35 Xt-1 + t 0,20 t-1. X t gerados pelo modelo, obtm-se os resduos et = Xt - X . Com os valores de X t t
Se ajuste feito do modelo srie temporal de observaes for bom, a srie de et conforma-se como o processo gerador do rudo branco. Nesse momento, deve ser feita a anlise de autocorrelao dos resduos, obtendo-se estimativa da estatstica 2 para o teste de Box-Pierce (ou Ljung-Box). Caso a srie de et no se comporte como o rudo branco, deve-se escolher novo modelo. A anlise do correlograma e do correlograma parcial pode sugerir qual o padro do processo gerador da srie original que deixou de ser modelado e est presente na srie de resduos.
11.1
Estes testes correspondem ao exame das propriedades estatsticas dos resduos, pois qualquer dependncia entre seus valores ou existncia de no-aleatoriedade poder estar indicando a presena de informao que deveria ser explorada para melhorar a preciso do modelo ao representar o padro gerador da srie temporal. So eles: 1) Teste do sobre ajustamento ou teste da significncia do parmetro
24
melhorou o ajuste.
2 2 por = Para isso, obtm-se a estimativa de
, ) , S( , npq
, ) soma do quadrado dos resduos. onde S( , Observa-se que, para amostras de tamanho grande, usa-se indistintamente (n-pq) ou (n) no denominador.
2)
Box-Pierce modificado por Ljung e Box. Um grande valor da estatstica Q aponta para a inadequao do modelo, sendo:
2 Q = n(n + 2) (n k) 1 rk , k =1 m
2 crtico tabela Qui-Quadrado. rk = autocorrelaes residuais, k = 1, ... , m. n = nmero de observaes utilizadas para ajustar o modelo (aps mtodo das diferenas) m = 6, 12, 18, 24 e 30 ou m tal que (m-p-q) = 20 m-p-q graus de liberdade Para verificar a adequao do modelo, alm do teste da estatstica QuiQuadrado, deve-se proceder ao exame da significncia estatstica dos valores individuais das autocorrelaes e autocorrelaes parciais nos correlogramas dos resduos. Caso o teste tenha indicado bom modelo, essencial apenas o exame complementar do correlograma das autocorrelaes dos resduos.
25
3)
Anlise do periodograma
Essa anlise permite observar os efeitos no-aleatrios peridicos. Como tratase de anlise no domnio da freqncia, o teste correspondente, ou teste de Kolmogorov-Smirnov (Box e Jenkins (1976), Time-Series Analysis: Forecasting and Control, Holden-Day, cap. 8.) visto em captulo frente.
4)
transformados, se for o caso, com os correlogramas da srie obtida com o modelo. As respectivas funes de autocorrelao devem ter grficos similares.
12.
O uso do modelo ARMA (ou ARIMA) para a previso ser apresentado por meio de um exemplo (Bowerman & OConnel, 1987). Seja: Uma empresa fabrica e vende toalhas de papel absorvente. Na Figura 17 apresentado o grfico da srie de vendas (Yt) de 120 semanas de dados de vendas semanais em unidades de 10.000 rolos. objetivo da gerncia da empresa prever as vendas semanais para planejar e programar a produo, o oramento e estimar as necessidades de recursos e a capacidade das instalaes para a produo e a estocagem do produto.
Figura 17 Grfico da srie original de vendas de toalhas de papel absorvente (unidades de 10.000 rolos)
26
A anlise da Figura 17 mostra claramente que a srie Yt no estacionria. Dessa forma na Figura 18 apresentado o grfico das primeiras diferenas Zt = Yt. As Figuras 19 e 20, respectivamente, mostram os correlogramas de Yt e Zt.
27
Enquanto na Figura 19 confirma-se a no-estacionariedade nos dados originais, na Figura 20 apenas o primeiro valor de autocorrelao significativo ou seja: t r1 >
1,6 com truncamento aps essa defasagem (pode ser observado que os valores sucessivos das autocorrelaes so no significativos e prximos de zero com t rk < 1,6 para k = 2 ou 3 e t rk < 2, para k > 3).
28
Na Figura 21 apresentado o correlograma parcial da srie de primeiras diferenas. Observa-se que apenas o primeiro valor das autocorrelaes parciais significativo, com t r11 = 3,345 > 2. H um truncamento de valores, pois t rkk < 2 para k > 1, aps essa defasagem. Entretanto os valores em mdulo da estatstica t rkk para k 2 so 1,912; 1,455; 1,523; ... indicando que o truncamento no correlograma parcial no to abrupto quanto no correlograma (nesse, os valores em mdulo da estatstica t rk so 0,648; 0,715; 1,039; 0,828; ...). Dessa forma, o modelo tentativo para representar a srie o modelo de mdias mveis Zt = 1(B) t. Nesse exemplo, deve-se avaliar a incluso ou no do termo constante . Ou seja: Zt = + 1(B) t, se for includo. Observa-se que, no modelo de mdias mveis, = . Assim, obtm-se a estimativa amostral Z para , de forma que:
29
120
Z=
t =2
Zt
120 2 + 1
= 0,005423
1 2
t=
O valor da estatstica t permite concluir que o termo constante no deve ser includo no modelo, o que significa Zt est flutuando em torno de uma mdia zero. Como a srie original Yt (Zt a srie de diferenas) no h tendncia determinstica nos valores observados. Qualquer tendncia ser estocstica. Assim, o modelo tentativo para representar a srie do tipo MA(1) e no contm termo constante, sendo escrito: Zt = t - 1 t-1. Como Zt = Yt Yt-1, o modelo escrito: Yt = Yt-1 + t - 1 t-1. Considerando que se conhece a estimativa final do parmetro 1 que obedece = 0,3545 , o modelo assume a s condies de estacionariedade e invertibilidade, 1 forma: Yt = Yt-1 + t + 0,3545 t-1. Com esse modelo tentativo pode-se obter as estimativas dos valores das vendas ou seja: para, ento, prever-se vendas futuras. Assim, obtm-se a estimativa Y 1
=Y + 1 + 0,3545 0 . Y 1 0
Entretanto, Y0 no conhecido (corresponde a perodo anterior ao que se tem dados), o que mostra necessrio, como orientao, que seja observado que:
1 = 0 . 1. A previso pontual dos futuros desvios aleatrios zero. Assim:
calculado).
30
, pois Y no conhecido. assim como Y 1 0 =Y + 2 + 0,3545 1 , Os valores seguintes so obtidos da mesma forma: Y 2 1 = 0 pois Y no foi obtido, logo Y = 15 + 0 + 0 = 15. 2 = 0 e 1 = Y1 Y 1 1 2 Por outro lado,
=Y + = 14,4064 15 = 3 = 0 e 2 = Y2 Y 3 + 0,3545 2 , sendo Y 3 2 2 = 14,4064 + 0 + 0,3545(0,5936) = 14,1960 . -0,5936, logo Y 3 Sucessivamente, obtm-se as estimativas at Y 120 = 14,9553, de forma que = 15,6453 14,9553 = 0,6900 . Y120 - Y 120
perodos frente de t. A previso das vendas de toalhas de papel absorvente para o perodo 121 :
(120) = Y + ) = 15,6453 + 0,3545 (0,6900) = 15,8899. 121 (0,3545)(Y120 Y Y 121 120 120
Utilizando-se um pacote estatstico pode-se obter o desvio padro do erro de previso para cada perodo a partir do limite t do tamanho de amostra. Assim, o intervalo de confiana com 95% de probabilidade de conter o verdadeiro valor Y121 [15,8899 2,0362; 17,9261] obtido por pacote estatstico computacional (Bowerman e OConnel, 1987). Pode-se afirmar que, uma vez conhecida, se a observao das vendas Y121 pertencer ao intervalo, a previso foi bem sucedida. De estudos anteriores, sabe-se que a metodologia de Box-Jenkins precisa para o curto-prazo. = Y + 122 O uso do modelo a partir desse ponto permite obter: Y 122 121 1 121 , sendo usado no lugar do valor observado Y121 (supondo-se no conhecido) a sua (120) . estimativa conhecida ou seja: Y 121
31
(120) = corresponde na verdade a Y Da mesma forma, o valor Y 122 122 (120) + 122 Y 121 1 121 = 15,8899 + 0 + 0, sendo 121 = 0 pois Y121 no foi observado. (120) = 15,8899. Assim, Y 122 Observa-se que os sucessivos valores pontuais previstos so iguais ao valor previsto para o perodo 121, equivalente a = 1. Isso permite dizer que a memria do modelo MA(1) de um perodo. Da mesma forma anterior, obtendo-se o desvio padro do erro de previso por pacote estatstico, o intervalo de confiana [15,8899 3,4278, 19,3177]. Observase que, quanto maior , maior o desvio padro do erro de previso e o intervalo da previso, o que significa mais imprecisa ela .
De forma geral, Y 120 + (120) = Y120 + 1 + 120 + 1 120 + 1 , o que significa que, 120+ = 120+ 1 =0 e Y para 2, 120 + (120) = Y120 + -1 (120) + 120 + 1 120 + 1 =15,8899 .
Na medida em que novos valores forem conhecidos, por exemplo, Y121 = (120) = 0,2200 . 121 = Y121 - Y 16,1099, pode-se calcular 121 (121) = Y + 122 Assim, Y 122 121 1 121 = 16,1879 e os valores sucessivos so
(121) = 16,1879 . recalculados, como exemplo Y 123
13.
Estimao do Modelo
Seja: (B)(1 B) d y t = (B) t , onde w t = (1 B) d y t . A equao pode ser reescrita como: t = 1 (B) (B) (1 - B)d y t , ou seja: t = 1 (B) (B) w t O objetivo da estimao encontrar um conjunto de parmetros ( e ) que minimizam a soma do quadrado dos erros, de forma que: S(1 ,... p , 1 ,..., q ) = 2 t
t
32
A estimativa amostral dos parmetros d origem minimizao do somatrio do quadrado dos resduos do modelo:
,... , ,..., ) = 2 S( 1 p 1 q t
t
Na presena dos termos de mdias mveis, h no-linearidade. Logo, usa-se um procedimento iterativo de estimao no-linear para obter os valores das estimativas ,... , ,..., ) que minimizam 2 dos parmetros do modelo ( 1 p 1 q t .
t
Uma vez que os parmetros tenham sido estimados, preciso testar se os resduos tm distribuio aleatria de mdia zero (pelo teste da estatstica Q de BoxPierce, por exemplo). O procedimento iterativo de estimao no-linear dos parmetros permite que se teste a significncia desses estimadores por meio da estatstica t. Alm disso, preciso verificar se esses parmetros obedecem s condies de estacionariedade e invertibilidade. Aps o exame da aleatoriedade dos resduos da estimao e da significncia dos estimadores, pode ser preciso redefinir o modelo, repetir a estimao e realizar novos exames para teste da adequao do modelo. Uma vez obtida satisfao com o modelo, ele pode ser usado para previso. Algumas vezes, mais de um modelo tentativo considerado adequado aps o exame da aleatoriedade dos resduos e das propriedades estatsticas dos estimadores. Nesse caso, pode-se proceder ao teste da simulao ou seja, comparao entre os valores gerados pelos modelos e os valores amostrais da observao yt, obtendo-se a soma do quadrado dos desvios caso a caso. Aquele modelo que corresponder ao menor somatrio deve ser considerado o mais adequado. Entretanto, sugere-se tambm reter as especificaes alternativas e utiliz-las para a previso e, com base na avaliao do desempenho das previses, escolher a especificao que parea ser mais pertinente com a situao analisada.
33
13.1
Assume-se que existem T + d observaes disponveis da srie homognea no-estacionria yt de ordem d ou seja: y-d+1, ..., y0, y1,..., yT. Aps diferenciar a srie d vezes, obtm-se a srie estacionria wt (w1, ....wT). Para estimar os parmetros do modelo ARMA (p,d) associado srie wt baseia-se no pressuposto da distribuio normal e na independncia dos termos do erro 1,..., T ou seja t~N(0, 2). Dessa forma, pode-se definir a funo de verossimilhana logartmica condicional associada aos (p+q+1) parmetros (1,..., p, 1,..., q, 2): L = -T log S(1 ,..., p , 1 ,..., q )
2 2
A funo dita condicional pois depende dos valores do passado e de valores no observados w0, w-1,..., w-p+1 e 0, -1,..., -q+1. Max L corresponde minimizao de S(1,..., p, 1,..., q). Para a estimao dos parmetros preciso escolher os valores no-observados passados de wt (w0, w-1,..., etc.). Como soluo ao problema, Pindyck & Rubinfeld (1991) propem que esses valores sejam os valores esperados incondicionais. Assim, 0 = ... = -q+1 = 0 e, se o nvel mdio da srie = 0, w0 = ... = w-p+1 = 0. ,... , ,..., que minimizam: Dessa forma, o problema determinar 1 p 1 q ,... , ,..., ]2 S = [ t | 1 p 1 q
t =1 T
A estimao no-linear pode ser obtida pelo mtodo iterativo que se baseia na aproximao linear dos dois primeiros termos da expanso da funo ,... , ,..., ] em srie de Taylor em torno de um ponto correspondente ao [ t | 1 p 1 q conjunto de valores iniciais dos parmetros e , cujo vetor pode ser representado por 0. Representa-se w o vetor dos valores da varivel wt, t = 1, ..., T. Assim, a aproximao linear corresponde aos dois primeiros termos de:
[ t ] = [ t | w, 0 ] + ( i - i,0 )
i =1 p+q
[ t ] i
= 0
34
2 1 p+q 2 [ t ] ( ) i i,0 2 i =1 i2
= 0
+ ...
a valores resultantes da aplicao das respectivas funes em um determinado ponto (relativos s estimativas iniciais dos parmetros + os valores de wt), pode-se escrever:
[ t | w, 0 ] + i,0 x i, t = i x i, t + [ t ] , onde ser feito t,0 = [ t | w, 0 ] , para
i =1 i =1 p+q p+q
simplificao. O primeiro lado de igualdade corresponde aos diferentes valores da varivel dependente para t = 1, ..., T obtidos com um conjunto de estimativas iniciais de parmetros e valores observados da srie estacionria wt. O segundo lado da igualdade corresponde funo linear dos parmetros a estimar multiplicados pelos valores correspondentes das variveis independentes obtidas em torno das estimativas iniciais dos parmetros aos quais se soma o termo do erro aleatrio. Novas estimativas dos i podem, ento, ser obtidas por regresso linear. medida que novos valores das estimativas so obtidos, esses so tratados como valores iniciais e o procedimento se repete, com o reclculo dos valores das variveis independentes e dependentes, em torno de um novo ponto (correspondente a essas novas estimativas). A regresso linear realizada at que os valores estimados por ela se aproximem dos valores anteriormente obtidos para os parmetros (critrio de convergncia). Nesse ponto, se aplicam os procedimentos para avaliao da significncia dos estimadores e da qualidade do ajustamento. Se for impossvel obter a convergncia, diferentes estimativas preliminares devem ser definidas e, caso a impossibilidade continue, novas especificaes funcionais devem ser tentadas. Observa-se que, mesmo quando a convergncia ocorrer na primeira tentativa de valores iniciais, aconselhado testar a existncia de mltiplas solues por meio da
35
variao desse conjunto inicial de estimadores. A estimativa final ser aquela que corresponder menor soma do quadrado dos erros (mnimo global).
13.2
Como exemplo do primeiro passo do mtodo iterativo de estimao no-linear (Pindyck & Rubinfeld, 1991), seja o modelo ARMA(1,1) escrito como:
t = 1 1 B w t , onde wt a srie estacionria. 1 1 B
B wt 1 1,0 B
x 2, t
= t 1
1, 0 ,1, 0
B - 1,0 B 2 (1 1,0 B) 2
wt
x1,t e x2,t correspondem a valores numricos calculados para t = 1, ..., T. Pela expanso dessas expresses: x1, t = 1,0 x1, t 1 + w t 1
2 x 2, t = 21,0 x 2, t 1 1,0 x 2, t - 2 - w t 1 + 1,0 w t 2 .
Esses valores so funo dos valores defasados: x1,t-1, wt-1, x2,t-1, x2,t-2 e wt-2, assim preciso estimar valores defasados preliminares. Logo, considerando que o nvel mdio da srie original = 0, x2,1 = x2,0 = w0 = w-1 = x1,0 = 0. Dessa forma, gera-se a srie de valores x2,t, onde
2 x 2,0 = x 2,1 = 0 e x 2,2 = 2 1,0 x 2,1 1,0 x 2,0 w1 + 1,0 w 0
x2,2 = - w1
2 x 2,3 = 2 1,0 x 2,2 1,0 x 2,1 w 2 + 1,0 w1
O mesmo procedimento se aplica srie de valores x1,t. Uma srie de valores deve ser gerada para t,0 = sendo:
t,0 = w t - 1,0 w t -1 + 1,0 t -1,0 , onde 0,0 = 0 .
Com essas trs series de valores (x1,t, x2,t e t,0) pode-se estimar novos parmetros do seguinte modelo de regresso linear:
t,0 + 1,0 x1, t + 1,0 x 2, t = 1x1, t + 1 x 2, t + t
14.
Quando as sries tm comportamento em que remarcada a presena de sazonalidade, preciso a identificao de uma forma particular do modelo de BoxJenkins de ordem (p, P, q, Q) que descreve a srie temporal estacionria Zb, Zb+1, .. , Zn. Nesse modelo, P e Q dizem respeito s caractersticas de mdias mveis e autoregressivas do processo de gerao das sries associadas ao fator sazonal. Seja o modelo ARMA multiplicativo (na forma compactada) geral (ou seja, sazonal): p(B) P(BL) Zt = q(B) Q(BL) t. De forma anloga aos modelos de sries no-sazonais (ou desazonalizadas), deve-se verificar se: 1. O termo constante deve ser includo no modelo; 2. Quais dos operadores p(B), P(BL), q(B) e Q(BL) devem ser includos no modelo, e 3. A ordem de cada operador que ser includo no modelo. Considerando que
Zt
n
Z=
t =b
n b +1
n ( (Z t Z t ) 2 ) t =b SZ = (n b + 1) - 1
1/ 2
37
so a mdia e o desvio padro da srie temporal Zb, Zb+1, ... , Zn, o procedimento aproximado para decidir se Z estatisticamente diferente de zero, e decidir pela incluso do termo constante: = p (B) P (B L ) no modelo geral de Box-Jenkins, verificar se o valor absoluto do termo:
Z maior que 2, sendo Z a S z /(n b + 1)1/2
mdia amostral e Sz o desvio padro amostral. Da mesma forma que para sries no-sazonais, se a srie de valores Zb, ..., Zn a srie original, a mdia ser zero significa que os valores da srie original flutuam em torno de uma mdia zero. Se, por outro lado, Zb, ... , Zn representam a srie Ao contrrio, diz-se que existe essa diferenciada, afirmar que a mdia da populao zero equivale a dizer que a srie original no tem tendncia determinstica. outra tendncia ser estocstica. Alm disso, para determinar quais dos operadores p(B), P(BL), q(B) e Q(BL) devem ser includos no modelo de Box-Jenkins geral: (a) analisado o comportamento do correlograma e do correlograma parcial para determinar se algum operador no sazonal de ordem q, q(B) = (1 - 1 B - 2B2 - ... - qBq), e se algum operador no sazonal autoregressivo de ordem p, p(B) = (1 - 1 B 2 B2 - ... - pBp), devem ser utilizados, conforme a Tabela 1. tendncia nos valores da srie. Se a srie no exibe tendncia determinstica, qualquer
38
TABELA 1
Em geral, preciso determinar se uma transformao particular do tipo: Zt = (1 BL)D (1 B)d Yt transformou a srie temporal original Y1, Y2, ..., Yn, que apresentou variao sazonal, numa srie estacionria Zb, Zb+1, ..., Zn. Para isso, devem ser examinados os valores do correlograma de Zt no nvel no sazonal e no nvel sazonal. Define-se (muitas vezes arbitrariamente) o comportamento do correlograma (ou do correlograma parcial) no nvel no sazonal como sendo o comportamento da funo de autocorrelao nas defasagens 1 at (L - 3). Para informao mensal (L = 12), esse o comportamento nas defasagens 1 at 9. Para informao trimestral (L = 4), esse o comportamento na defasagem 1. representativos do nvel no sazonal. Os comportamentos apresentados no correlograma e no correlograma parcial no nvel no sazonal so similares queles analisados anteriormente. Mais especificamente, define-se as defasagens 1, 2, e possivelmente 3 como sendo as defasagens baixas no sazonais no correlograma e diz-se que um pico existe numa defasagem baixa no sazonal k no correlograma se: t rk > 1,6. Alm disso, define-se as defasagens 4, 5, ... , L - 3 como as defasagens no sazonais altas no correlograma, e diz-se que existe um pico numa defasagem alta no sazonal k no correlograma se: t rk >2. Anlise similar feita no correlograma parcial. Diz-se que existe um pico numa defasagem no sazonal k (k = 1, 2, ... , L - 3) no correlograma parcial se: t rkk > 2. (b) Define-se o comportamento do correlograma (ou do correlograma parcial) no nvel sazonal como o comportamento da funo de autocorrelao nas defasagens iguais (ou prximas) a L, 2L, 3L e 4L. Alm disso: Entretanto, nesse caso, freqentemente considera-se tambm a defasagem 2 e possivelmente a defasagem 3 como tendo valores
39
b1. Define-se as defasagens L, 2L, 3L e 4L como defasagens sazonais exatas. Um pico existe numa defasagem sazonal exata k do correlogama se: t rk > 1,25 e um pico existe numa defasagem exata k do correlograma parcial se: t rkk > 2. b2. Define-se as defasagens L-2, L-1, L+1, L+2, 2L-2, 2L-1, 2L+1, 2L+2, 3L2, 3L-1, 3L+1, 3L+2, 4L-2, 4L-1, 4L+1 e 4L+2 como defasagens sazonais aproximadas. Um pico existe numa defasagem sazonal aproximada k do correlograma se: t rk > 1,6. Existe um pico numa defasagem sazonal aproximada k do correlograma parcial se: t rkk > 2. O valor da funo de autocorrelao no correlograma (ou correlograma parcial) trunca aps a defasagem k no nvel sazonal se no houver picos em defasagem sazonais exatas ou aproximadas maiores que essa defasagem k. Alm disso, o correlograma (ou correlograma parcial) apresenta padro de decaimento no nvel sazonal se a funo de autocorrelao no truncada, mas, ao invs disso, decresce numa forma de padro de decaimento definida nas defasagens do nvel sazonal. Em geral, pode ser mostrado que, se os valores do correlograma da srie Zb, Zb+1, ... , Zn: (1) truncam razoavelmente rpido ou decaem razoavelmente rpido no nvel no sazonal, e (2) truncam razoavelmente rpido ou decaem razoavelmente rpido no nvel sazonal, ento essa srie tem valores que podem ser considerados estacionrios. Caso o oposto ocorra, a srie considerada no estacionria e novas transformaes devem ser feitas na srie de observaes. Quando o correlograma (ou correlograma parcial) trunca razoavelmente rpido no nvel no sazonal, isso ocorre frequentemente aps a defasagem k 2. No nvel sazonal, isso ocorre frequentemente aps a defasagem k L + 2.
40
15.
estimativas pontuais preliminares dos parmetros a serem estimados e ento aplicam uma tcnica de busca interativa para obter as estimativas pontuais de mnimos quadrados dos parmetros. Alguns pacotes iniciam o procedimento com estimativas geradas internamente mas outros requerem que o usurio as fornea. Essas estimativas devem obedecer s condies de invertibilidade e estacionariedade. As estimativas pontuais preliminares podem ser obtidas: 1) Estabelecendo-se as estimativas preliminares dos operadores p(B),
= (1 - 1 - ... p ) (1 - 1,L 2,L ... P,L ) = Z(1 - 0,1 - 0,1 ... 0,1) (1 - 0,1 0,1 ... 0,1) onde Z a mdia amostral da srie temporal estacionria Zb, Zb+1, ... , Zn. Quando se obtm as estimativas finais de mnimos quadrados dos parmetros do modelo, deve-se verificar se essas estimativas satisfazem s condies de estacionariedade e invertibilidade (Tabela 2). Se no as satisfizerem, isto sugere que o modelo pode no ser adequado.
41
Tabela 2 - Condies de estacionariedade e de invertibilidade sobre os parmetros de primeira e segunda ordem dos operadores p(B), P(BL), q(B) e Q(BL).
Operador
1(B) = (1 - 1B) 2(B) = (1 - 1B - 2B2)
Condies de estacionariedade
Nenhuma Nenhuma
Condies de invertibilidade
|1| < 1 1 + 2 < 1 2 - 1 < 1 |2| < 1 |1,L| < 1 1,L + 2,L < 1 2,L - 1,L < 1 |2,L| < 1 Nenhuma Nenhuma
Nenhuma Nenhuma
|1| < 1 1 + 2 < 1 2 - 1 < 1 |2| < 1 |1,L| < 1 1,L + 2,L < 1 2,L - 1,L < 1 |2,L| < 1
Nenhuma Nenhuma
16.
Box-Jenkins deve ser rejeitada, deve-se investigar o correlograma e o correlograma parcial da srie de resduos para identificar (tentativamente) um modelo descrevendo os resduos. Esse deve ser combinado ao modelo da srie de forma a gerar um novo modelo tentativo. A Tabela 3 apresenta de forma sucinta os valores crticos da estatstica t para identificar picos no correlograma e no correlograma da srie de resduos.
42
Tabela 3 Valores absolutos crticos da estatstica t para identificar picos no correlograma da srie e no correlograma da srie de resduos
Defasagens No-sazonais Baixas (1,2 e talvez 3) Outras defasagens no-sazonais Sazonais Exatas (L, 2L, 3L, 4L) Aproximadas (L-2, L-1, L+2, L+1, ...) Semi-peridicas sazonais (0,5L, 1,5L, 2,5L, 3,5L) Outras Valores Crticos no Correlograma Valores Crticos no Correlograma dos Resduos 1,25 1,6 1,25 1,25 1,25 1,6
A Tabela 3 apresentou um sumrio dos valores crticos da estatstica t para identificar picos no correlograma dos resduos, onde os valores so aqueles das escolhas de Pankratz (1983), excetuando os marcados com (*). No caso do correlograma parcial dos resduos, os valores absolutos da estatstica t devem ser comparados com o valor crtico 2. Por outro lado, se Q (ou Q) indicam que no se deve rejeitar a adequao do modelo, todos os valores individuais da estatstica t em mdulo devem ser comparados com o valor crtico 2, como uma avaliao complementar ao da estatstica Q (ou Q).
17.
Lista de Verificaes sobre os Modelos ARIMA (Levenbach e Cleary, 1984, pg. 457-458)
Conforme discutido por Levenbach e Cleary (1984, pgs. 457-458), devem ser
feitas as seguintes verificaes nas etapas de ajustamento de modelos ARIMA uma srie temporal: 1. 2. Verificar se a srie estacionria. Exame da matriz de correlaes. No pode haver um alto grau de correlao entre as estimativas dos parmetros dos modelos (por exemplo, acima de 0,9). 3. Verificar se todos os termos do modelo foram devidamente includos.
43
4.
As estimativas dos parmetros e seus desvios padro devem ser examinados. Testes de hiptese devem ser feitos para avaliar a incluso do parmetro no modelo.
5.
Se um termo autoregressivo regular ou sazonal includo, as estimativas dos parmetros no devem estar prximas de 1,0 (por exemplo, acima de 0,90 ou 0,95). Se uma delas prxima de 1,0, uma diferenciao regular ou de ordem sazonal deve ser tentada e um teste de previso feito para determinar qual modelo melhor: o diferenciado ou o autoregressivo.
6.
Verificar se a soma do quadrado dos erros e o desvio padro dos resduos diminuem enquanto o ajuste do modelo melhora.
7.
8.
Observar se h padro significante no correlograma dos resduos. Rever o correlograma e o correlograma parcial para verificar padro restante nos resduos. Ateno maior deve ser dado ao correlograma (padres de decaimento dos picos das autocorrelaes defasadas com incio em um pico de valor prximo de 1,0 indicam processo autoregressivo regular. Padro de decaimento dos picos originando-se num valor mais baixo indica padro misto ARMA).
9.
Uma constante de tendncia determinstica foi estimada? Sugere-se que a constante seja includa no final do procedimento. Se a mdia dos resduos do modelo final for maior que um desvio padro em relao a zero, deve ser colocada uma constante no modelo e avaliada a sua significncia estatstica (H momentos em que no se deseja colocar uma tendncia determinstica no modelo de previso).
10. Tenha ateno para a super-diferenciao. correlograma pode ajudar nessa questo. valor prximo de 1,0.
Uma verificao do
11. Algumas combinaes dos parmetros so improvveis. estiverem presentes, reavaliar a anlise feita. So elas:
Se elas
44
Diferenas sazonais e parmetros autoregressivos sazonais. Parmetros de mdias mveis sazonais e autoregressivos sazonais. Parmetros de mdias mveis sazonais em defasagens outras que 4 e 12 (e seus mltiplos) para sries trimestrais e mensais.
18.
onde: f funo no linear de k variveis independentes e p parmetros. Como critrio de estimao dos parmetros, busca-se a minimizao da soma dos desvios ao quadrado. Para isso, sejam as T observaes de Y, X1, X2, ... , Xk, de forma que: S = [Yt f(X1t ,...,X kt , 1 ,..., p )]2 a soma dos desvios ao quadrado e
t =1 T
,..., so os estimadores no-lineares de ,..., . 1 p 1 p ,..., so os estimadores de mxima verossimilhana ou Se ~ N(0,2) 1 p os estimadores dos s que tem a maior probabilidade de ter gerado as observaes amostrais dos Ys.
2 T/2 S/2 A funo de verossimilhana L = (2 ) e , para a qual se quer obter a
2
mxima verossimilhana ou seja, maximizar L. Deve ser observado que a minimizao de S em relao aos s equivale maximizao de L em relao aos s. Para obter as estimativas dos `s que minimizam S, pode-se utilizar, por exemplo, trs mtodos computacionais de estimao no linear. Nos dois primeiros, a especificao da funo S somada eficincia computacional define o melhor mtodo:
45
1)
Busca Direta
Obtm-se os valores de S associados a diferentes conjuntos de parmetros, de forma a definir aquele conjunto associado ao S mnimo, que o conjunto timo de parmetros. Esse mtodo vlido apenas em casos de um ou dois parmetros, pelo grande nmero de combinaes de parmetros para se realizar a busca direta. 2) Otimizao Direta S = 0, i = 1, ... , p ou seja: i
O mtodo desenvolve-se segundo trs passos: (a) A equao linearizada atravs de expanso de sries de Taylor em torno de um conjunto inicial de parmetros (1,0 ... p,0). Deve haver uma variao de conjuntos iniciais para observar se o timo local ou global foi obtido. (b) Aplicao de Mnimos Quadrados Ordinrios (MQO) para a gerao de parmetros da equao linearizada que minimizem a soma do quadrado dos desvios. (c) Equao re-linearizada em torno do novo conjunto de parmetros (obtidos em (b)). Volta-se ao passo (b). Na medida que se tem convergncia, h condio de parada na aplicao do mtodo. Esse mtodo possibilita a aplicao de testes estatsticos (R2, estatstica t, ...), por exemplo, avaliando o ajustamento a cada iterao e ao final, quando se verificou convergncia. Para definir as variveis independentes e dependentes para a aplicao de MQO, seja a equao para Y na forma de srie expandida em torno de um conjunto inicial de parmetros: 46
Nessa srie, considera-se a aproximao linear como composta apenas pelos dois primeiros termos aps o sinal de igualdade mais o termo do erro aleatrio. A equao pode ser reescrita de forma a definir as variveis independentes e a varivel dependente ou seja:
Nova varivel independente
p f Y - f (X1, ... , Xk, 1,0, ... , p,0) + i,0 = i =1 i 0 p f = i + i =1 i 0
p variveis independentes
Aplicando os Mnimos Quadrados Ordinrios (MQO) com base nesse conjunto de variveis, obtm-se o conjunto de parmetros 1,1, 2,1, ... , p,1 e, em decorrncia, so obtidas as novas variveis dependente e independentes, respectivamente:
p f f Y - f (X1, ... , Xk, 1,1, ... , p,1) + i,1 e , i = 1, ..., p. i =1 i 1 i 1
De acordo com o mtodo, aplica-se os MQO na equao linearizada equivalente a esse novo conjunto de variveis e assim sucessivamente at observar-se o critrio de parada, por exemplo, quando
i, j+1 i, j i, j
47
19.
nmero de quartos ocupados em seus estabelecimentos, de forma a se programar e contratar pessoal-extra para atender a demanda dos meses de vero, estabelecer contratos de fornecimento de itens que tem um grande tempo de ressuprimento, programar gastos com propaganda etc.. Para isto, foi analisada a srie histrica do nmero de quartos ocupados por dia durante 15 anos, entre 1973 e 1987. Como o planejamento necessrio mensal, o conjunto de dados da srie histrica foi reduzido a mdias mensais pela diviso do total mensal pelo nmero de dias do ms. A Figura 22 apresenta o grfico dessa srie temporal. Foi decidido realizar a anlise da srie temporal com os dados entre 1973 e 1986, de forma que o ano de 1987 fosse usado para verificar a adequao do modelo. A Figura 22 revela forte tendncia e padro sazonal. A amplitude do padro sazonal parece aumentar com o aumento do nvel da srie.
Dessa forma, feita uma transformao na base de dados obtendo-se o log (natural) de yt, de forma que y * t = ln y t , cujo grfico mostrado na Figura 23. Observase que a amplitude da variao sazonal foi equalizada, mas a srie contnua noestacionria em relao tendncia (assim como tem padro sazonal). A anlise dos
48
49
relativos srie resultante so mostrados na Figura 25 (a) e (b). No correlograma simples, observa-se que no nvel no-sazonal as autocorrelaes decaem vagarosamente e que no nvel sazonal elas decaem extremamente devagar. considerada no-estacionria. Logo zt pode ser
50
51
correlogramas relativos essa transformao. No nvel no-sazonal, no correlograma simples, observa-se picos nos perodos 1, 3 e 5, mas que parecem fazer parte de um padro de decaimento rpido. No correlograma parcial observa-se picos nos perodos 1, 3 e 5 e h indicao de trucamento aps o perodo 5.
52
No nvel sazonal, observa-se que o correlograma tem pico e trunca aps a defasagem de perodo 12 ( t r12 = 3,511 ). Por outro lado, no correlograma parcial a funo decai razoavelmente rpido, com picos decrescentes nas defasagens sazonais exatas e aproximadas ( t r12,12 = 4,057 ; t r25,25 = 2,192 ; t r37,37 = 2,027 ). A anlise do correlograma tanto no nvel no-sazonal quanto no sazonal
* permite concluir que a transformao z t = y * t y t -12 gerou uma srie temporal
53
54
Observa-se
truncamento no nvel sazonal (aps defasagem de perodo 18) e decaimento razoavelmente rpido no nvel no-sazonal. Entretanto, comparando com os padres observados no correlograma da Figura 26(a), conclui-se que obter as diferenas de primeira ordem no acelerou o truncamento ou o decaimento, implicando em dizer que
* a transformao z t = y * t y t -12 parece o bastante para garantir a estacionariedade e a * * * transformao y * t y t -1 y t 12 + y t 13 estaria gerando srie menos estacionria que
* y* Dessa forma, desnecessrio avaliar o correlograma parcial da Figura t y t 12 .
27(b). Assim, preciso avaliar o comportamento das autocorrelaes nos correlogramas da Figura 26 (a) e (b) para identificar os operadores de mdias mveis e autoregressivos que devem compor o(s) modelo(s) tentativo(s). Como resultado dessa avaliao, no nvel no-sazonal, o correlograma tem padro de decaimento razoavelmente rpido e o correlograma parcial tem picos nas defasagens 1, 3 e 5, com truncamento aps. Dessa forma, o operador p(B) deve ser includo no modelo, podendo assumir trs formas: (a) (b) (c) (1 - 1B - 3B3 - 5B5), que corresponde a um modelo pouco usual. (1 - 1B - 3B3) (1 - 1B - 2B2 - 3B3)
No nvel sazonal, o correlograma tem pico na defasagem 12 e truncamento aps, enquanto o correlograma parcial apresenta padro de decaimento rpido. Isto indica o uso do operador Q(BL). Uma vez que o nico pico na defasagem 12, L = 12 e o operador sazonal :
1(B12) = (1 - 1,12B12)
Os modelos tentativos so: (a) (b) (c) (1 - 1B - 3B3 - 5B5) zt = + (1 - 1,12B12) t (1 - 1B - 3B3) zt = + (1 - 1,12B12) t (1 - 1B - 2B2 - 3B3) zt = + (1 - 1,12B12) t
55
Para concluir se a constante deve ser includa no modelo (significando que a srie varia em torno de mdia 0), deve-se obter o valor amostral da mdia e avaliar sua significncia estatstica.
* Assim, lembrando que z t = y * t y t -12 ,
Obtm-se:
168
z=
t =13
zt
168 13 + 1
= 0,0333
1/2
= 0,02319
t=
z Sz n b +1
= 17,7951
Logo |t| > 2, levando concluso de que: z estatisticamente 0 e = p (B) P(BL). A anlise da adequao dos trs modelos tentativos indica que a forma (1 - 1B - 2B2 - 3B3) zt = + (1 - 1,12B12) t a mais apropriada (Bowerman e OConnell, 1976). Logo:
12 * (1 - 1B - 2B2 - 3B3) (y * t y t -12 ) = + (1 - 1,12B ) t 2 * 3 * * * * y* t 1B y t 2B y t 3B y t y t -12 + 1B y t -12 + 3 * 12 + 2B2 y * t t -12 + 3B y t -12 = = + t - 1,12B
56
As estimativas preliminares dos parmetros do modelo obedecem s condies de invertibilidade e estacionariedade: 1 + 2 + 3 < 1 (necessria, mas no suficiente) |1,12| < 1 = 0,1 ; = 0,1 ; = 0,1 , e = 0,1 e So elas: 1 2 3 1,12 = 0,33 (1-0,1 - 0,1 0,1) = 0,0231. As estimativas finais de mnimos quadrados so: = 0,1674 ; = 0,2922 ; = 0,5917, = 0,2408 e 1 2 3 1,12 que satisfazem s condies de invertibilidade e estacionariedade, permitindo que se obtenha = 0,0258. A estatstica t para cada um dos parmetros estimados maior do que 2, em mdulo, permitindo consider-los significantes estatisticamente. A avaliao do coeficiente de correlao entre os parmetros estimados mostra que o valor absoluto das correlaes inferior a 0,9, o que permite concluir que as estimativas finais dos parmetros no so altamente correlacionadas. Correlaes muito altas sugerem que as estimativas so de m qualidade. Nesse caso, se dever investigar os correlogramas para encontrar um modelo alternativo que possa ter melhores resultados nas verificaes finais da estimao. Aplicando o teste da estatstica Q de Box-Pierce aos resduos obtidos quando o modelo anterior ajustado srie temporal e fazendo m np = 20, onde np nmero de parmetros igual a 4, n = n (d + LD) = 156, sendo d e D o nmero de diferenciaes de no-sazonal e sazonal, respectivamente, obtm-se:
) = 26,712 Q = n' rl2 (
l =1 m
57
modelo no pode ser rejeitada para um nvel de significncia de 0,05. Os valores individuais das estatsticas t das autocorrelaes e autocorrelaes parciais da srie de resduos so menores do que dois (em mdulo) (excetuando-se o caso de uma autocorrelao dos resduos, na defasagem 10), logo pode-se concluir que o modelo adequado. Antes de prosseguir com a previso com o modelo estimado, alguns comentrios devem ser feitos: 1) Recomenda-se identificar picos nos correlogramas da srie de resduos de acordo com o guia para identificao de modelos sazonais (seo ? e Figura ?) apenas quando o teste Q (ou Q) indicar que a adequao do modelo deve ser rejeitada. 2) Se Q (ou Q) indicarem que a adequao do modelo no deve ser rejeitada, deve-se concentrar em examinar os valores individuais das autocorrelaes amostrais dos resduos cujas estatsticas t forem maiores que 2 (em mdulo). 3) Se h indicao de que a adequao do modelo deve ser rejeitada, recomenda-se que somente sejam considerados picos significativos no correlograma parcial dos resduos aqueles cujos valores da estatstica t em mdulo sejam maiores que 2. 4) No caso da avaliao de modelos alternativos, aquele com menor desviot =1
padro S =
t )2 (y t y n np
19.1
58
so os estimadores que mais provavelmente geram as observaes ou seja: Yi. Aplicando logaritmo na funo de verossimilhana obtm-se (Gujarati, 2006, pg. 93): log L
= log[f(Yi , X i , )] =
N i =1
N N = log 2 - log 2 2 2
2 1 N (Yi f(X1i ,..., X ki , 1 ,..., p )) 2 2 i =1
59
Dessa forma, maximizar log L corresponde minimizao de: S = (Yi f(X1i ,..., X ki , 1 ,..., p )) 2
i =1 N
Considerando o modelo a duas variveis Yi = + Xi + i, diferencia-se a funo log L parcialmente em relao a , e 2. Como resultado, obtm-se: (log L) 1 = 2 (Yi - - Xi) = 0 (log L) 1 = 2 [Xi (Yi - - Xi) = 0 (log L) -N 1 = + 4 (Yi - - Xi)2 = 0 2 2 2 2
Prosseguindo com a soluo desse sistema de equaes, so obtidos os estimadores de mxima verossimilhana: ' = Y ' X
' = (X i X) (Yi Y) (X i X) 2
2 =
'
Os estimadores de mxima verossimilhana de e so identicamente iguais aos estimadores de mnimos quadrados. Entretanto, 2 um estimador viesado de 2 (embora consistente).
60
Referncias
Bowerman e OConnell (1987), Times Series Forecasting: Unified Concepts and Computer Implementation, Duxburg Press. Dickey, P.A. e Fuller, W.A. (1979), Distribution of Estimators for Autoregressive Time Series With a Unit Root, Journal of the American Statistical Association, Vol. 74, pp. 427-431. Granger e Newbold (1977), Forecasting Economic Time Series, Academic Press, NY. Gujarati, D. (2006), Econometria Bsica, Elsevier. Levenbach e Cleary (1984), The Modern Forecaster: The Forecasting Process Through Data Analysis, Lifetime Learning Publications, Califrnia. Pankratz, A. (1983), Forecasting With Univariate Box-Jenkins Models: Concepts and Cases, Wiley, N.Y. Pindyck, R.S. e Rubinfeld, P.L. (1991), Econometric Models & Economic Forecasts, McGraw-Hill International Editions.
VERSO EM REVISAO
61