Baixe Livro de Respostas - Econometria e outras Exercícios em PDF para Introdução à Econometria, somente na Docsity! Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 1 A NATUREZA DA ANÁLISE DE REGRESSÃO 1.1 (a) A seguir temos a tabela com as taxas de inflação (%) calculadas ano sobre ano com início em 1974, pois não há dados anteriores a 1973. CANADÁ FRANÇA ALEMANHA ITÁLIA JAPÃO REINO UNIDO Estados Unidos 10,78431 13,58382 6,847134 19,41748 23,17328 0,157706 0,110360 10,84071 11,70483 5,961252 17,07317 11,69492 0,244582 0,091278 7,584830 9,567198 4,360056 16,66667 9,559939 0,164179 0,057621 7,792208 9,563410 3,638814 19,34524 8,171745 0,158120 0,065026 8,950086 9,108159 2,730819 12,46883 4,225352 0,083026 0,075908 9,320695 10,60870 4,050633 15,52106 3,685504 0,134583 0,113497 9,971098 13,67925 5,474453 21,30518 7,701422 0,178679 0,134986 12,48357 13,27801 6,343714 19,30380 4,840484 0,119745 0,103155 10,86449 11,96581 5,314534 16,31300 2,938090 0,085324 0,061606 5,795574 9,487459 3,295572 14,93729 1,732926 0,046122 0,032124 4,282869 7,669323 2,392822 10,61508 2,304609 0,050100 0,043173 4,106972 5,827937 2,044791 8,609865 1,958864 0,060115 0,035611 4,128440 2,534965 –0,095420 6,110652 0,672430 0,034203 0,018587 4,317181 3,239557 0,191022 4,591440 0,000000 0,041775 0,036496 4,054054 2,725021 1,334604 4,985119 0,763359 0,049290 0,041373 4,951299 3,456592 2,728128 6,591070 2,367424 0,077229 0,048183 4,795050 3,341103 2,747253 6,117021 3,052729 0,095344 0,054032 5,608856 3,157895 3,654189 6,390977 3,231589 0,058704 0,042081 1,537386 2,405248 4,987102 5,300353 1,652174 0,036966 0,030103 1,789401 2,135231 4,504505 4,250559 1,283148 0,015980 0,029936 0,202840 1,602787 2,742947 3,916309 0,760135 0,024803 0,025606 2,159244 1,783265 1,830664 5,369128 –0,167645 0,033648 0,028340 1,585205 2,021563 1,498127 3,870652 0,167926 0,024557 0,029528 1,625488 1,188904 1,697417 1,745283 1,676446 0,031215 0,022945 (b) Manual de Soluções • Econometria Básica • Gujarati Legenda: PC = Canadá PF = França PG = Alemanha PI = Itália PJ = Japão PUK = Reino Unido PUS = Estados Unidos (c) Pelo gráfico, pode–se ver que, com o passar dos anos, houve, em geral, diminuição da taxa de inflação de todos os países. (d) Pode–se usar o desvio-padrão como medida de flutuação das taxas. Para Canadá, França, Alemanha, Itália, Japão, Reino Unido e Estados Unidos os valores do desvio- padrão são respectivamente 0,036, 0,044, 0,018, 0,062, 0,051 e 0,032. Encontramos, assim, a maior flutuação nas taxas da Itália, e a menor, nas da Alemanha. 1.2 (a) A seguir está o gráfico com a representação das taxas de inflação dos seis países em relação à dos Estados Unidos. (b) O gráfico mostra que há correlação positiva entre as taxas de inflação dos seis países e a dos Estados Unidos. (c) Lembre–se de que correlação não implica causalidade. Talvez seja necessário consultar um livro de macroeconomia internacional para saber se há uma relação causal entre a taxa de inflação dos Estados Unidos e as dos outros países. Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 2 ANÁLISE DE REGRESSÃO COM DUAS VARIÁVEIS: ALGUMAS IDÉIAS BÁSICAS 2.1 A função informa como varia a resposta média das subpopulações de Y com os valores dados da(s) variável(is) explanatória(s). 2.2 A distinção entre as funções de regressão amostral e populacional é importante, pois aquela é um estimador desta. Na maioria dos casos, o que temos é uma amostra de observações da qual tentamos extrair informações sobre a população a que ela se refere. 2.3 Um modelo de regressão não é, de forma alguma, uma descrição absolutamente fiel da realidade. Assim, é certo que haverá diferenças entre o valor real do regressando e seus valores estimados pelo modelo escolhido. Tal diferença é simplesmente o termo de erro estocástico, cujas diversas formas são discutidas no texto. O resíduo é a contrapartida amostral do termo de erro estocástico. 2.4 Embora seja certo que podemos usar o valor médio, o desvio-padrão e outras medidas sumárias para descrever o comportamento do regressando, estamos em geral interessados em saber se há alguma força causal que o afeta. Se houver, poderemos fazer um melhor prognóstico do seu valor médio com a análise de regressão. Também não podemos esquecer que os modelos econométricos são quase sempre desenvolvidos para testar uma ou mais teorias econômicas. 2.5 É um modelo linear nos parâmetros, mas que pode ou não ser linear nas variáveis. 2.6 Os modelos (a), (b), (c) e (e) são modelos de regressão lineares (nos parâmetros). O modelo (d) também será linear se fizermos α = lnβ1. 2.7 (a) Aplicando o logaritmo natural, obtemos lnYi = β1+ β2 Xi + ui, que assim é um modelo de regressão linear. (b) A seguinte transformação, conhecida como logit, faz deste um modelo de regressão linear: ln[(1-Yi)/Yi] = β1+ β2 Xi + ui. (c) Modelo de regressão linear. (d) Modelo de regressão não-linear. (e) Modelo de regressão não-linear, pois β2 está elevado ao cubo. Manual de Soluções • Econometria Básica • Gujarati 2.8 Um modelo de regressão intrinsecamente linear é aquele que se pode fazer linear nos parâmetros, como o modelo em 2.7 (a). Se β2 na Questão 2.7 (d) fosse 0,8, esse seria um modelo de regressão linear, já que 0,8( 2)iXe− − pode ser facilmente calculado. 2.9 Todos são modelos de regressão intrinsecamente lineares, como demonstramos a seguir: (a) A transformação (1/Yi) = β1+ β2 Xi converte o modelo em linear. (b) Escrever o modelo como (Xi/Yi) = β1+ β2 Xi converte-o em linear. (c) A transformação ln[(1-Yi)/Yi] = –β1–β2 Xi converte o modelo em linear. 2.10 O gráfico de dispersão indica que, em média, os salários nos países que exportam mais exibem maior crescimento real do que naqueles que exportam menos. É por isso que muitos países em desenvolvimento seguem uma política de crescimento voltada para a exportação. A linha de regressão traçada no gráfico é amostral, pois se baseia numa amostra de 50 países em desenvolvimento. 2.11 De acordo com o conhecidíssimo modelo de comércio de Heckscher-Ohlin, os países têm tendência a exportar mercadorias que, para serem produzidas, utilizem intensivamente seus fatores de produção mais abundantes. Em outras palavras, este modelo enfatiza a relação entre dotação de fatores e vantagem comparativa. 2.12 O gráfico de dispersão mostra que quanto mais alto o salário mínimo, mais baixo é o PNB per capita, indicando, portanto, que a legislação relativa à remuneração mínima pode não ser boa para os países em desenvolvimento, mas há controvérsia quanto a esse assunto. O resultado desse tipo de legislação pode depender do efeito que causa nos empregos, da natureza da indústria do local onde é imposta e da intensidade com que o governo a impõe. 2.13 É uma FRA porque se baseia numa amostra de 15 anos de observações. Os pontos dispersos em torno da linha de regressão são de dados reais. A diferença entre as despesas em consumo reais e as estimadas pela linha representa o resíduo (amostral). Além do PIB, fatores como riqueza, taxa de juros etc. podem afetar as despesas em consumo. Manual de Soluções • Econometria Básica • Gujarati 2.14 (a) O gráfico de dispersão é o seguinte: Vertical = TPFTCH Horizontal = TDCH A relação positiva entre as duas variáveis parece surpreendente porque se esperaria, a priori, que fossem negativamente relacionadas. Mas a hipótese do efeito do trabalhador adicional da Economia do Trabalho sugere que quando o desemprego aumenta, a força de trabalho secundária pode ingressar no mercado de trabalho para garantir alguma renda familiar. (b) Segue o gráfico de dispersão: Manual de Soluções • Econometria Básica • Gujarati 2.16 (a) A representação gráfica da pontuação de homens e mulheres em aptidão verbal é a seguinte: MALEVERB =VERBH FEMVERB = VERBM E a representação correspondente da pontuação de homens e mulheres em matemática é a seguinte: MALEMATH = MATH FEMMATH = MATM (b) Ao longo dos anos, a pontuação de homens e mulheres em aptidão verbal mostra uma tendência descendente, enquanto depois de atingir o nível mais baixo em 1980, os cálculos mostram uma tendência ascendente, com variações ano a ano, é claro. (c) Pode-se elaborar um modelo de regressão simples, fazendo a regressão da pontuação em matemática contra a de aptidão verbal para ambos os sexos. Manual de Soluções • Econometria Básica • Gujarati (d) O gráfico é o seguinte: VERTICAL = VERBM HORIZONTAL = VERBH O gráfico mostra que as duas pontuações evoluíram na mesma direção ao longo do tempo. Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 3 MODELO DE REGRESSÃO DE DUAS VARIÁVEIS: O PROBLEMA DA ESTIMAÇÃO 3.1 (1) Yi = β1+ β2Xi + ui, logo, E(Yi|Xi) = E[(β1+ β2Xi + ui)|Xi] E(Yi|Xi) = β1+ β2Xi + E(ui|Xi), visto que β1e β2 são constantes e X é não-estocástico. E(Yi|Xi) = β1+ β2Xi, já que E(ui|Xi) = 0, por premissa. (2) Dado que cov(uiuj)=0 para todo i,j (i≠j), então cov(YiYj) = E{[Yi - E(Yi)] [Yj - E(Yj)]} cov(YiYj) = E(uiuj), dos resultados em (1) cov(YiYj) = E(ui)E(uj), porque é premissa que os termos de erro não estão correlacionados, cov(YiYj) = 0, já que o valor médio de ui é zero, por premissa. (3) Dado que var(ui|Xi) = σ2, var(Yi|Xi) = E[Yi - E(Yi)]2 = E(ui2) = var(ui|Xi) = σ2, por premissa. 3.2 Yi Xi yi xi xi yi xi2 4 1 –3 –3 9 9 5 4 –2 0 0 0 7 5 0 1 0 1 12 6 5 2 10 4 soma 28 16 0 0 19 14 Nota: Y = 7 e X = 4. Logo, 2 2 19ˆ 14 i i i x y x β = =∑ ∑ = 1,357; 1̂ ˆY 2 Xβ β= − = 1,572. Manual de Soluções • Econometria Básica • Gujarati 3.9 (a) 1 2 ˆ ˆ iY Xβ β= − e 1 ˆˆ Y 2 xα β= − [Observação: ( )i ix X X= − ]. 1ˆ Yα = , já que . 0ix =∑ var 2 2 1 2 ˆ( ) i i X n x β σ= ∑ ∑ e var 2 2 2 1 2 ˆ( ) i i x n x n σα σ= =∑ ∑ . Logo, nem as estimativas nem as variâncias dos estimadores são iguais. (b) 2 2 ˆ i i i x y x β = ∑ ∑ e 1 2ˆ i i i x y x α = ∑ ∑ , já que ( )i ix X X= − É fácil verificar que var var2 ˆ( )β = 2 2 2 ˆ( ) ix σα = ∑ . Ou seja, as estimativas e as variâncias dos dois estimadores são idênticas. (c) Pode ser mais fácil usar o modelo II com números X grandes, embora com os rápidos computadores atuais isso não seja mais um problema. 3.10 Como , ou seja, a soma dos desvios em relação ao valor médio é sempre zero, 0i ix y= =∑ ∑ x e y também são iguais a zero ( 0x y= = ). Assim, 1 2 0y xβ β= − =ˆ ˆ . O fato relevante aqui é que se tanto Y quanto X forem expressas como desvios em relação às respectivas médias, a linha de regressão passará pela origem. 2 2 ( )( )ˆ ( ) i i i i i 2 ix x y y x y x x x β − − = − ∑ ∑ ∑ = , já que as médias das duas variáveis são iguais a zero. Esta é a Equação (3.1.6) do livro-texto. 3.11 Sejam i iZ aX b= + e i iW cY d= + , que, em formato de desvios, tornam–se e . Por definição, i iz ax= iw cy= i 2 12 2 2 2 i i i i i i i z w ac x yi r r z w ac x y = = =∑ ∑ ∑ ∑ ∑ ∑ na Equação (3.5.13) do texto. 3.12 (a) Verdadeira. Na Questão 3.11, façamos a e c iguais a -1 e b e d iguais a 0. (b) Falsa. Consultando novamente a Questão 3.11, veremos que será negativo. Manual de Soluções • Econometria Básica • Gujarati (c) Verdadeira. Como , 0xy yxr r= > xS e (os desvios-padrão de X e Y respectivamente) são ambos positivos, e yS x yx yx y Sr S β= e yxy xy x S r S β= , então xyβ e yxβ têm de ser positivos. 3.13 Sejam Z=X1+X2 e W=X2+X3. Em formato de desvios, podemos escrevê–las como z=x1+x2 e w=x2+x3. Por definição, a correlação entre Z e W é: 2 1 2 2 3 2 2 2 2 2 2 2 2 2 1 2 2 3 1 2 2 3 ( )( ) ( ) ( ) ( )( i i zw i i z w x x x x x r z w x x x x x x x x + + = = = + + + + ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ , porque X1, X2 e X3 não são correlacionadas. (Nota: por conveniência, omitimos o subscrito de observação). 2 2 2 1 2(2 2 zwr σ σ σ = = + , em que 2σ é a variância comum. O coeficiente não é zero porque os pares combinados são correlacionados, ainda que as variáveis X1, X2 e X3 não sejam individualmente correlacionadas. Como acabamos de demonstrar, 2zw σ=∑ , denotando que a covariância entre z e w é uma constante diferente de zero. 3.14 Os resíduos e os valores ajustados de Y não mudarão. Sejam 1 2i iY X iuβ β= + + e 1 2iY Zi iuα α= + + , em que Z=2X. Empregando o formato de desvios, sabemos que 2 2 ˆ xy x β = ∑ , omitido o subscrito de observação. 2 22 2 2 1 ˆˆ 4 2 i i i i i i z y x y z x α β= = =∑ ∑ ∑ ∑ 1 2 ˆ ˆY Xβ β= − ; 1 2 ˆˆ ˆY Z 1α α β= − = (Nota: 2Z X= ) Ou seja, o intercepto não é afetado. Em conseqüência, os valores ajustados de Y e os resíduos mantêm–se os mesmos ainda que Xi seja multiplicado por 2. A análise é análoga para o caso de uma constante ser somada a Xi. Manual de Soluções • Econometria Básica • Gujarati 3.15 Por definição, 2 2 2 2 ˆ 2 2 2 2 2 ˆ ˆ ˆ ˆ ˆ( ) [ ( )( )] ˆ ˆ( )( ) ( )( ) i i i i i i yy i i i i i y y y u y y r y y y y y + = = =∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ˆ ˆ 0i iy u, já que =∑ . 2 2 2 2 22 ˆ 2 2 ˆ ˆ( )i i yy i i x x r y y β β = =∑ ∑ ∑ ∑ 2r= i , aplicando a Equação (3.5.6) do texto. 3.16 (a) Falsa. A covariância pode assumir qualquer valor, e este depende das unidades de medida. O coeficiente de correlação, por outro lado, não tem unidades, é uma grandeza adimensional. (b) Falsa. Veja a Figura 3.11(h) no texto. Lembre–se de que o coeficiente de correlação é uma medida de relação linear entre duas variáveis. Daí, como mostra a Figura 3.11(h), há uma relação perfeita entre Y e X, mas ela não é linear. (c) Verdadeira. Em formato de desvios, temos ˆ ˆi iy y u= + . Então é óbvio que se fizermos uma regressão de i ˆiy contra y , o coeficiente angular será 1, e o intercepto será 0. Mas uma prova formal pode ser feita como segue: se fizermos uma regressão de iy contra ˆˆiy , obteremos o coeficiente angular, digamos, α , sob a forma 2 2 2 2 2 ˆ ˆˆ ˆ 1ˆ ˆˆ i i i i i y y x y y x β βα β β = = =∑ ∑ ∑ ∑ = , porque ˆˆi iy xβ= e 2ˆ i i ix y β= x∑ ∑ para o modelo de duas variáveis. O intercepto nesta regressão é zero. 3.17 Escreva a regressão amostral assim: 1̂ ˆiY β iu= + . Pelo princípio dos mínimos quadrados, temos de minimizar: 2 2ˆ )1ˆ (i iu Y β= −∑ ∑ . Derive essa equação em relação ao único parâmetro conhecido e iguale o resultado a zero para obter: 2 =1 1 ˆ( ) ˆ2 ( )( 1) 0i i d u Y d β β = − −∑ , que simplificada dá 1̂ Yβ = , ou seja, a média amostral. E sabemos que a variância da média amostral é 2 y n σ , em que n é o tamanho da amostra e 2σ a variância de Y. A SQR é 2 2( )i iY Y y− =∑ ∑ e 2 ) 2ˆ ( 1) ( 1 iySQR n n σ = = − − ∑ . Vale a pena acrescentar a variável X ao modelo se ela reduzir 2σ̂ significativamente, o que acontecerá se ela tiver qualquer influência sobre Y. Resumindo, o que pretendemos nos modelos de regressão é que as variáveis explanatórias possam dar um prognóstico Manual de Soluções • Econometria Básica • Gujarati (b) Os dois gráficos mostram que há uma relação positiva entre remuneração e produção, o que não é surpresa, considerando a teoria da produtividade marginal da Economia do Trabalho. (c) Os gráficos anteriores demonstram que a relação entre remuneração e produção, embora seja positiva, não é linear. É possível, portanto, que não se consiga um bom ajuste entre os dados e um modelo de regressão linear. Mas se, como de praxe, fizermos esse ajuste, teremos os seguintes resultados, nos quais SEMP é setor empresarial; SENA, setor empresarial não-agrícola; PROD, produção por hora; e REM, remuneração real por hora. REMSEMP = –109,3833 + 2,0039 PRODSEMP ep = (9,7119) (0,1176) r2 = 0,8868 REMSENA = –123,6000 + 2,1386 PRODSENA ep = (11,0198) (0,1312) r2 = 0,8777 Como esperado, a relação entre as duas é positiva. Surpreendentemente, o valor de r2 é bem alto. 3.21 ∑ Yi ∑ Xi ∑ Xi Yi ∑ Xi2 ∑ Yi2 Dados originais: 1110 1700 205500 322000 132100 Dados revisados: 1110 1680 204200 315400 133300 Portanto, o coeficiente de correlação corrigido é 0,9688. 3.22 (a) Se representarmos estas variáveis em relação ao tempo, veremos que, em geral, subiram. Há, no caso do ouro, considerável volatilidade de preço. (b) Se a hipótese fosse verdadeira, seria de se esperar que 2 1β ≥ . (c) Preço do ourot = –186,183 + 1,842 IPCt ep = (125,403) (1,125) r2 = 0,150 NYSEt = –102,060 + 2,129 IPCt ep = (23,767) (0,230) r2 = 0,868 Parece que o mercado de ações é melhor garantia contra a inflação do que o ouro. Como veremos no Capítulo 5, o coeficiente angular da equação do preço do ouro não é estatisticamente significativo. Manual de Soluções • Econometria Básica • Gujarati 3.23 (a) Segue o gráfico, em que PIBN e PIBR são, respectivamente, PIB nominal e PIB real. NGDP = PIBN RGDP = PIBR (b) PIBNt = –986,3317 + 201,9772 tempo ep = (1907,715) + 128,7820 r2 = 0,9277 PIBRt = 1907,715 + 128,7820 tempo ep = (45,1329) (1,9666) r2 = 0,9914 (c) Nesse caso, o coeficiente angular informa a taxa de variação do PIB por intervalo de tempo. (d) A diferença entre os dois representa a inflação ao longo do tempo. (e) Como indicam o gráfico e os resultados da regressão, o PIB nominal tem crescido mais rápido que o PIB real, sugerindo que a inflação tem subido com o passar do tempo. 3.24 Este é simples e direto. 3.25 (a) Veja o gráfico do Exercício 2.16(d). (b) Seguem os resultados da regressão, em que Y é a pontuação das mulheres em aptidão verbal e X, a dos homens: t̂Y = -198,126 + 1,436 tX ep = (25,211) (0,057) r2 = 0,966. Manual de Soluções • Econometria Básica • Gujarati (c) Como ressaltamos no texto, uma relação estatística, por mais forte que seja, não determina causalidade, a qual tem de ser estabelecida a priori. Neste caso, não há razão para suspeitar de relação causal entre as duas variáveis. 3.26 Os resultados da regressão são: t̂Y = -189,057 + 1,285 tX ep = (40,927) (0,082) r2 = 0,918. 3.27 Este é para ser feito em sala de aula. Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 5 A REGRESSÃO DE DUAS VARIÁVEIS: ESTIMAÇÃO DE INTERVALO E TESTE DE HIPÓTESES Perguntas 5.1 (a) Verdadeira. O teste t baseia–se em variáveis com uma distribuição normal. Os estimadores β1 e β2 seguem tal distribuição, pois são combinações lineares do erro ui, o qual presumimos ser normalmente distribuído no MRLC. (b) Verdadeira. Uma vez que E(ui)=0, os estimadores de MQO não são tendenciosos. Não é preciso nenhuma premissa probabilística para determinar a não- tendenciosidade. (c) Verdadeira. Nesse caso, a Equação (1) da Seção 3.A.1 do Apêndice 3A não será usada. Esse tópico será tratado com mais detalhes no Capítulo 6, Seção 6.1. (d) Verdadeira. O valor p é o menor nível de significância em que se pode rejeitar a hipótese nula. Os termos nível de significância e tamanho do teste são sinônimos. (e) Verdadeira. Isso resulta da Equação (1) do Apêndice 3A, Seção 3A.1. (f) Falsa. Tudo o que podemos dizer é que os dados disponíveis não nos permitem rejeitar a hipótese nula. (g) Falsa. Um valor mais alto de σ2 deve ser contrabalançado por um valor mais alto de 2ix∑ . Somente se este for mantido constante, a afirmação pode ser verdadeira. (h) Falsa. A média condicional de uma variável aleatória depende dos valores tomados por outra variável (condicionante). As médias condicional e não-condicional só podem ser iguais se as duas variáveis forem independentes. (i) Verdadeira. Isso fica óbvio pela Equação (3.17). (j) Verdadeira. Consulte a Equação (3.5.2). Se X não tem influência sobre Y, 2β̂ será zero, e nesse caso 2 2ˆi iy u=∑ ∑ . 5.2 Tabela ANOVA para despesas com alimentos na Índia: Fonte da variação SQ gl MSQ Devido à regressão (SQE) 139023 1 139023 Devido aos resíduos (SQR) 236894 53 4470 STQ 375916 Manual de Soluções • Econometria Básica • Gujarati 139023 4470 F = =31,1013 com gl igual a 1 e 53, respectivamente. Na hipótese de não haver relação entre despesas com alimentos e despesas totais, o valor p (valor da probabilidade) de se obter tal valor F é quase zero, sugerindo enfaticamente que se pode rejeitar a hipótese nula. 5.3 (a) O ep do coeficiente angular é 0,6417 0,0664 9,6536 = . O valor t sob H0 : β1 = 0, é 0,7347 0,8797 0,8351 = . (b) O salário médio por hora aumenta em aproximadamente 64 centavos para um ano adicional de escolaridade, em média. (c) Aqui temos n = 13, então gl =11. Se a hipótese nula for verdadeira, o valor t estimado é 9,6536. A probabilidade de se obter tal t é extremamente pequena, o valor p é praticamente zero. Pode–se, portanto, rejeitar a hipótese nula de que o nível de escolaridade não afeta os ganhos por hora. (d) SQE = 74,9389; SQR = 8,8454; gl numerador = 1; gl denominador = 11; F = 93,1929. O valor p de tal F sob a hipótese nula de que não há relação entre as duas variáveis é 0,000001, que é extremamente baixo. Pode–se, assim, rejeitar com grande segurança a hipótese nula. Observe que o valor F é aproximadamente o quadrado do valor t sob a mesma hipótese nula. (e) No caso bivariado, dado que H0 : β2 = 0, existe a seguinte relação entre o valor t e r2: 2 2 2[ ( 2) tr t n = + − ] . Como o t dado é 9,6536, obtemos: 2 2 2 9,6536 0,8944 [9,6536 11] r = ≈ − . 5.4 Literalmente, a hipótese afirma que não há correlação entre as duas variáveis. Por conseguinte, se pudermos provar que a covariância entre elas é zero, então a correlação terá de ser zero. 5.5 (a) Para testar a hipótese de que o coeficiente angular verdadeiro é um, use o teste t. 2 2 ˆ 1 1,0598 1 0,821ˆ 0,0728( ) t ep β β − − = = = Para gl = 238, esse valor t não é significativo nem para α = 10%. Conclui–se, portanto, que durante o período estudado as ações da IBM não foram voláteis. Manual de Soluções • Econometria Básica • Gujarati (b) Uma vez que 0,7264 2,4205 0,3001 t = = , é significativo no nível dos 2%, mas, economicamente, isso tem pouco significado prático. Interpretado literalmente, o valor de 0,73 para o intercepto implica que mesmo que o retorno do portfólio de mercado seja zero, o do título é de 0,73%. 5.6 Sob a premissa da normalidade, 2β̂ é normalmente distribuída. Mas como uma variável normalmente distribuída é contínua, e como pela teoria das probabilidades sabemos que a probabilidade de uma variável aleatória contínua assumir um valor específico é zero, não faz, portanto, nenhuma diferença o fato de a desigualdade ser forte ou fraca. 5.7 Sob a hipótese de que β2 = 0, obtemos: 2 2 2 22 2 2 2 ˆ ˆˆ ˆ ˆ( ) (1 ) ( 2) i i i x x t ep y r n β ββ σβ = = = − − ∑ ∑ ∑ . Porque 2 2 2 ˆ (1 )ˆ ( 2) ( 2) i iu y n n σ − = = − − ∑ ∑ 2r , da Equação (3.5.10), 2 2 2 2 2 ˆ ( 2) ˆ (1 ) i i x n y r β σ − = − ∑ ∑ , mas como 2 2 2 2 2 ˆ i i x r y β= ∑ ∑ , então 2 2 2 ˆ i i x r y β= ∑ ∑ , da Equação (3.5.6). Assim, 2 2 2 ˆ( 2) ˆ(1 ) ixr nt r β σ − = = − , e 22 2 22 ( 2) ˆ ˆ1 i 2 xr nt F r β σ − = = = − ∑ , da Equação (5.9.1). Problemas 5.8 (a) Existe associação positiva na TPFT em 1972 e 1968, o que não é de surpreender, tendo em vista que desde a Segunda Guerra Mundial a TPFT das mulheres tem crescido regularmente. (b) Use o teste t unicaudal ou unilateral: 0.6560 1 1,7542 0,1961 t −= = − . Para gl = 17, o valor t unicaudal com α = 5% é 1,740. Como o t estimado é significativo, podemos, nesse nível de significância, rejeitar a hipótese de que o coeficiente angular verdadeiro é igual ou maior que 1. (c) A TPFT média é: 0,2033+0,6560(0,58)≈0,5838. Para estabelecer um intervalo de confiança de 95% para essa previsão, use a fórmula: 0,5838 ± 2,11 (ep do valor médio da previsão), em que 2,11 é valor t crítico a 5% para gl = 17. Para obter o erro- padrão do valor da previsão, empregue a Equação (5.10.2). Mas repare que, como os Manual de Soluções • Econometria Básica • Gujarati Sob a hipótese nula de que não existe relação entre salários reais e produtividade no setor de empresas, este valor F segue distribuição F com gl 1 e 37 no numerador e denominador, respectivamente. A probabilidade de obter tal F é 0,0000, ou seja, praticamente zero. Podemos, portanto, rejeitar a hipótese nula, o que não deve ser nenhuma surpresa. (b) A tabela ANOVA para o setor de empresas não-agrícolas é a seguinte: Fonte da variação SQ gl MSQ Devido à regressão (SQE) 37887,455 1 37887,455 Devido aos resíduos (SQR) 5221,585 37 141,129 STQ 43109,04 STQ = 43109,04; SQR = 5221,585; SQE = 37887,455. Sob a hipótese nula de que o coeficiente angular verdadeiro é zero, o valor F calculado é: 37887,455 268,459 141,129 F = ≈ . A probabilidade de obter tal F seria praticamente zero, caso a hipótese nula fosse verdadeira, o que leva à sua rejeição. 5.11 (a) O gráfico a seguir indica que a relação entre as duas variáveis não é linear. Inicialmente, à medida que aumentam as despesas com publicidade, o número de impressões também aumenta, mas depois decresce gradualmente. VERTICAL = IMPRESSÕES HORIZONTAL = GASTOS COM PUBLICIDADE (b) Em conseqüência de (a), não seria adequado ajustar um modelo de regressão bivariada a esses dados. Não temos, no momento, as ferramentas necessárias para Manual de Soluções • Econometria Básica • Gujarati i iufazê-lo. Mais adiante mostraremos que um modelo do tipo 2 1 2 2 3 2i iY X Xβ β β= + + + , em que Y são as impressões retidas e X2 as despesas com publicidade, pode ser apropriado. Este é um exemplo de modelo de regressão quadrático. Mas repare que ainda é um modelo linear nos parâmetros. (c) Os resultados obtidos usando um modelo linear às cegas são os seguintes: Yi = 22,163 + 0,3631 Xi ep = (7,089) (0,0971) r2=0,424. 5.12 (a) O gráfico a seguir mostra que as taxas de inflação dos dois países evoluem juntas. VERTICAL = IPCEUA HORIZONTAL = IPCCAN (b) & (c) Segue tabela conforme entregue pelo pacote de software estatístico Eviews 3: Amostra: 1973 1997 Observações incluídas: 25 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 6,251664 1,956380 3,195526 0,0040 ICAN 0,940932 0,017570 53,55261 0,0000 R-quadrado 0,992044 Variável dependente média 104,7560 Manual de Soluções • Econometria Básica • Gujarati R-quadrado ajustado 0,991698 Desvio-padrão da variável dependente 36,56767 E.P. da regressão 3,331867 Critério info Akaike 5,321561 Soma quad resíduos 255,3308 Critério Schwarz 5,419071 Verossimilhança Log –64,51951 Estatística-F 2867,882 Estat Durbin- Watson 0,264558 Probabilidade (Estatística-F) 0,000000 Esses resultados mostram que a relação entre as duas variáveis é positiva. Pode–se facilmente rejeitar a hipótese nula de que não há relação entre as duas variáveis, uma vez que o valor t obtido sob essa hipótese é 53,55, e é praticamente zero o valor p (probabilidade) de se obter tal t. Embora as duas taxas de inflação sejam positivamente relacionadas, não se pode disso deduzir causalidade, pois esta tem de ser inferida de alguma teoria econômica que a sustente. Lembre–se de que regressão não implica causalidade. 5.13 (a) As duas regressões são as seguintes: Preço do ourot = 186,183 + 1,842 IPCt ep = (125,403) (1,215) r2 = 0,150 t = (1,484) (1,515) NYSEt = 102,060 + 2,129 IPCt ep = (23,767) (0,230) r2 = 0,868 t = (–4,294) (9,247) (b) A estatística Jarque-Bera para a equação do preço do ouro é 4,751, com valor p de 0,093. A estatística JB para o índice NYSE é 1,218 com valor p de 0,544. No nível de significância de 5%, não se pode rejeitar a premissa de normalidade em nenhum dos dois casos. (c) Como o coeficiente angular na regressão do preço do ouro não é estatisticamente diferente de zero, não faz nenhum sentido tentar saber se é diferente de um. (d) & (e) Com o procedimento habitual do teste t, obtemos: 2,129 1 4,91 0,230 t −= = . Como esse valor excede o t crítico de 2,160, rejeitamos a hipótese nula. O coeficiente estimado é realmente maior que um. Para o período estudado, o investimento no mercado de ações foi provavelmente uma garantia contra a inflação. Foi, certamente, um hedge muito melhor que o investimento em ouro. 5.14 (a) Não parece haver uma melhor que as outras, todos os resultados estatísticos são muito parecidos. Todos os coeficientes angulares são estatisticamente significativos no nível de confiança de 99%. (b) Não podemos usar os r2 consistentemente elevados para decidir qual é a melhor definição de moeda. Isso, entretanto, não quer dizer que o tipo de equação usada não faça diferença. Manual de Soluções • Econometria Básica • Gujarati VERTICAL = IPC HORIZONTAL = IPP (b) Use o IPC, que representa os preços pagos pelos consumidores, como regressando, e o IPP, que representa os preços pagos pelos produtores, como regressor, porque o primeiro é o segundo com acréscimos. (c) & (d) A tabela a seguir, apresentada conforme entregue pelo pacote de software estatístico Eviews 3, fornece os dados necessários: Variável dependente: IPC Método: mínimos quadrados Data: 23/06/00 Hora: 16:50 Amostra: 1960 1999 Observações incluídas: 40 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C –13,77536 3,710747 –3,712286 0,0007 IPP 1,269994 0,042763 29,69864 0,0000 R-quadrado 0,958696 Variável dependente média 86,17000 R-quadrado ajustado 0,957609 Desvio–padrão da variável dependente 48,02523 E.P. da regressão 9,887937 Critério info Akaike 7,469215 Soma quad resíduos 3715,309 Critério Schwarz 7,553659 Verossimilhança Log –147,3843 Estatística-F 882,0093 Estat Durbin-Watson 0,093326 Probabilidade (Estatística-F) 0,000000 O valor t estimado do coeficiente angular é 29,6986 sob a hipótese nula de que não há relação entre os dois índices. O valor p (probabilidade) de se obter tal valor t é quase zero, o que indica a rejeição da hipótese nula. A seguir estão o histograma e o teste Jarque-Bera baseados nos resíduos da regressão anterior. Manual de Soluções • Econometria Básica • Gujarati Série: Resíduos Amostra 1960 1999 Observações 40 Média 7,11E-15 Mediana 3,781548 Máximo 21,84709 Mínimo – 19,05008 Desvio- padrão 9,760345 Assimetria – 0,119726 Curtose 2,620663 Jarque-Bera 0,335390 Probabilidade 0,845612 A estatística Jarque-Bera é 0,3335 com um valor p de 0,8456. Não podemos, portanto, rejeitar a premissa de normalidade. O histograma também mostra que os resíduos têm distribuição razoavelmente simétrica. Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 6 EXTENSÕES DO MODELO DE REGRESSÃO LINEAR DE DUAS VARIÁVEIS 6.1 (a) Verdadeiro. Repare que a fórmula MQO padrão para estimar o intercepto é: 1̂β = (média do regressando – 2β̂ média do regressor). Mas quando X e Y estão em formato de desvio, seus valores são sempre zero. Daí o intercepto estimado também ser zero nesse caso. 6.2 (a) & (b) Está incluído na primeira equação um termo de intercepto que, por não ser estatisticamente significativo no nível de, digamos, 5%, pode ser retirado do modelo. (c) Para os dois modelos, o aumento de um ponto percentual na taxa de retorno mensal do mercado leva a um aumento médio de cerca de 0,76 ponto percentual na taxa de retorno mensal das ações ordinárias da Texaco ao longo do período estudado. (d) Conforme tratamos no Capítulo 6 do livro-texto, esse modelo representa a linha característica da teoria do portfólio. O modelo relaciona, no caso em tela, o retorno mensal de ações da Texaco ao retorno mensal do mercado, como representado por um amplo índice de mercado. (e) Não, os r2 não são comparáveis. O do modelo sem intercepto é o r2 bruto. (f) Como a amostra é relativamente grande, podemos usar o teste de normalidade de Jarque-Bera. A estatística JB é quase a mesma para os dois modelos, isto é, 1,12, e o valor p de se obter tal valor JB é de aproximadamente 0,57. Portanto, não se pode rejeitar a hipótese de que os termos de erro seguem uma distribuição normal. (g) De acordo com o comentário de Theil visto no capítulo, se o termo do intercepto estiver ausente do modelo, então passar a regressão pela origem pode resultar em estimativa muito melhor do coeficiente angular, como ocorre nesse caso. 6.3 (a) É um modelo de regressão linear, pois é linear nos parâmetros. (b) Defina Y* = (1/Y) e X* = (1/X) e faça uma regressão MQO de Y* contra X*. (c) Quando X tende ao infinito, Y tende a (1/ β1). (d) Pode ser que este modelo seja adequado para explicar o baixo consumo de um produto, como um bem inferior, quando a renda aumenta. Manual de Soluções • Econometria Básica • Gujarati 6.12 (a) (b) Problemas 6.13 100 12,0675 16,2662 100 i iY X ⎛ ⎞ = + ⎜ ⎟− ⎝ ⎠ ep = (0,1596) (1,3232) r2 = 0,9497 Manual de Soluções • Econometria Básica • Gujarati À medida que X cresce indefinidamente, 100 100 Y ⎛ ⎞ ⎜ −⎝ ⎠ ⎟ se aproxima do valor limite de 2,0675, o que significa que Y tende ao valor limite aproximado de 51,6. 6.14 Os resultados da regressão são: log V L ⎛ ⎞ =⎜ ⎟ ⎝ ⎠ –0,4526 + 1,3338logW ep = (1,3515) (0,4470) r2 = 0,4070. Para melhor testar a hipótese nula, aplique o teste t como segue: 1,3338 1 0,7468 0, 4470 t −= = . Para gl 13, o valor t crítico a 5% (bicaudal) é 2,16. Não se pode, portanto, rejeitar a hipótese nula de que a elasticidade de substituição verdadeira entre capital e trabalho seja 1. 6.15 (a) Se estivermos convictos, a priori, de que havia uma relação um para um rigorosa entre os dois deflatores, o modelo adequado seria aquele sem o intercepto. (b) Modelo I: = 516,0898 + 0,5340 Xi îY ep = (40,5631) (0,0217) r2 = 0,9789. Modelo II: = 0,7950 îY ep = (0,0255 r2 = 0,7161* * Nota: Este r2 não é diretamente comparável ao anterior. Como o intercepto é estatisticamente significativo no primeiro modelo, ajustar o segundo resultará em viés de especificação. (c) Pode–se usar o modelo duplo-log. 6.16 Seguem os resultados da regressão: * îY = 0,9892 * iX ep = (0,0388) r2 = 0,9789 A cada incremento de 1 no deflator do PIB para as importações, há, em média, um incremento de 0,9892 no deflator do PIB para bens produzidos internamente. Repare que esse resultado é comparável àquele do exercício anterior quando se nota a relação entre os coeficientes angulares das regressões padronizadas e não-padronizadas. Conforme a Manual de Soluções • Econometria Básica • Gujarati Equação (6.3.8) do livro–texto, *2 2 x y S S β β ⎛ ⎞ = ⎜⎜ ⎝ ⎠ ⎟⎟ , em que * indica o coeficiente angular da regressão padronizada. No problema anterior, encontramos 2β̂ = 0,5340. Sy e Sx são dados como 346 e 641 respectivamente. Assim, *2 2 6410,5340 0,9892 346 x y S S β β ⎛ ⎞ ⎛ ⎞= = =⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠ . 6.17 Para obter a taxa de crescimento das despesas com bens duráveis, podemos ajustar o modelo log-lin, cujos resultados são os seguintes: ln DESPDURt = 6,2217 + 0,0154 t ep = (0,0076) (0,000554) r2 = 0,9737. Essa regressão mostra que, ao longo do período estudado, a taxa trimestral de crescimento das despesas com bens duráveis foi de aproximadamente 1,5%. Ambos os coeficientes estimados são individualmente significativos em termos estatísticos, uma vez que os valores p são extremamente baixos. Não seria muito lógico fazer neste caso uma regressão duplo-log, tal como: ln DESPDURt = β1 + β2 ln tempo + ut.. Uma vez que o coeficiente angular deste modelo é o coeficiente de elasticidade, qual é o significado da afirmação de que um aumento de 1% no tempo leva a um aumento de β2% nas despesas com bens duráveis? 6.18 Os resultados correspondentes para o setor de bens não-duráveis são: ln DESPNAODURt = 7,1929 + 0,0062 t ep = (0,0021) (0,00015) r2 = 0,9877. Pode–se ver por esses resultados que, ao longo do período estudado, a taxa trimestral de crescimento das despesas com bens não-duráveis foi de aproximadamente 0,62%. Comparando os resultados das regressões dos Problemas 6.17 e 6.18, parece que as despesas com bens duráveis aumentaram a uma taxa bem maior do que aquelas com bens não-duráveis ao longo do período 1993:01 a 1998:03, fato que, tendo em vista um dos mais longos períodos de expansão econômica na história dos Estados Unidos, não é nenhuma surpresa. 6.19 O diagrama de dispersão das impressões retidas em relação às despesas com publicidade é o seguinte: Manual de Soluções • Econometria Básica • Gujarati torno de σ2 = 4. Às vezes, podem ser necessárias mais de 100 amostras para se conseguir uma boa aproximação. 7.5 A partir da Equação (7.11.7) do texto, temos 2 2 2 213 13 12.3(1 )R r r= + − r . Logo, 2 2 2 13 12.3 2 131 R rr r − = − . Este é o coeficiente de determinação parcial, e pode-se interpretá-lo como o coeficiente que descreve a proporção da variação da variável dependente não explicada pela variável X3, mas explicada pela inclusão de X2 ao modelo. 7.6 Pode-se escrever a equação dada como: X1 = (–α2 / α1)X2 + (–α3 / α1)X3, ou X2 = (–α1 / α2)X1 + (–α3 / α2)X3, ou X3 = (–α1 / α3)X1 + (–α2 / α3)X2 . Assim, os coeficientes de regressão parcial seriam os seguintes: β12.3 = –(α2 / α1); β 13.2 = –(α3 / α1) β21.3 = –(α1 / α2); β 23.1 = –(α2 / α3) β31.2 = –(α1 / α3); β 32.1 = –(α2 / α3). Relembrando a Questão 3.6, temos 2 112.3 12.3 21.3 1 2 ( )( )( )( ) 1 ( )( ) r α αβ β α α − − 1= = = = ± . 7.7 (a) Não. O valor absoluto de r não pode ser maior que um. Aplicando à Equação (7.11.2) os dados fornecidos, obteremos r12.3 = 2,295, o que, logicamente, é impossível. (b) Sim. Seguindo o mesmo procedimento de (a), encontraremos r12.3 = 0,397, um resultado possível. (c) Sim. Da mesma forma pode-se demonstrar que r12.3 = 0,880, outro resultado possível. 7.8 Se excluirmos do modelo a variável anos de experiência (X3), o coeficiente de escolaridade (X2) será tendencioso, e a natureza do viés dependerá da correlação entre X2 e X3. O erro-padrão, a soma residual dos quadrados e R2 serão afetados em conseqüência dessa exclusão. Este é um caso de viés de variável excluída. 7.9 Os coeficientes angulares nos modelos duplo log fornecem estimativas diretas da elasticidade (constante) da variável do lado esquerdo em relação à variável do lado direito. Neste caso: Manual de Soluções • Econometria Básica • Gujarati 2 2 2 2 ln / ln / Y Y Y X X X β∂ ∂= = ∂ ∂ e 3 3 3 3 ln / ln / Y Y Y X X X β∂ ∂= = ∂ ∂ . 7.10 (a) & (b) Se multiplicarmos X2 por 2, verificaremos pelas Equações (7.4.7) e (7.4.8) do texto que os coeficientes angulares não serão afetados. Se, por outro lado, multiplicarmos Y por 2, os coeficientes angulares, assim como os interceptos e seus erros-padrão, serão multiplicados por 2. Sempre tenha em mente as unidades em que o regressando e os regressores são medidos. 7.11 A partir da Equação (7.11.5), sabemos que: 2 2 2 12 13 12 13 3 2 23 2 1 r r r r rR r + − = − . Portanto, quando r23 = 0, isto é, não há correlação entre X2 e X3, 2 2 12 13 2R r r= + , ou seja, o coeficiente de determinação múltiplo é a soma dos coeficientes de determinação na regressão de Y contra X2 e na de Y contra X3. 7.12 (a) Reescreva o modelo B como: * 1 2 2 3 3 1 2 2 3 3(1 )i t t t tY X X u Xβ β β β β β= + + + + = + + +t tX u 2, em que * 2 (1 )β β= + . Os dois modelos são, portanto, similares. Sim, os interceptos nos modelos são iguais. (b) As estimativas de MQO do coeficiente angular de X3 serão iguais nos dois modelos. (c) *2 2(1 ) 2β β α= + = . (d) Não, porque os regressandos são diferentes nos dois modelos. 7.13 (a) Aplicando MQO, obtemos: 2 2 22 2 2 2 ( )( ) ( ) ˆˆ 1i i i i i i i i i i i i y x x z x x z x x x x x α β − = = = − = −∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ . Ou seja, o coeficiente angular da regressão de poupança contra renda (quer dizer, a propensão marginal a poupar) é igual a um menos o coeficiente angular da regressão de consumo contra renda (quer dizer, a propensão marginal a consumir). Dito de outra forma, a soma das duas propensões marginais é igual a 1, como, aliás, não poderia deixar de ser, pois a receita total é igual ao total das despesas de consumo mais o total das poupanças. A propósito, repare que 1 1̂α̂ β= − . (b) Sim. A SQR para a função consumo é: 21 2ˆ ˆ( iY α α− − )iX∑ . Agora, substitua ( )i iX Y− por iZ , 1 1̂α̂ β= − , e 2 ˆˆ (1 )2α β= − e verifique que as duas SQR são iguais. (c) Não, porque os dois regressandos não são iguais. Manual de Soluções • Econometria Básica • Gujarati 7.14 (a) Conforme visto na Seção 6.9, para aplicar o modelo normal de regressão linear clássico (MNRLC), é necessário presumir que ln ui N(0,σ2). Depois de estimar o modelo Cobb-Douglas, obtenha os resíduos e submeta-os ao um teste de normalidade, tal como o Jarque-Bera. (b) Não. Como vimos na Seção 6.9, iu log – normal 2 2 2/ 2[ , ( 1e e eσ σ σ )]− . 7.15 (a) As equações normais seriam: 2 2 2 2 3 2i i i i iY X X X Xβ β= +∑ ∑ ∑ 3 3 2 3 2 2 3 3i i i i iY X X X Xβ β= +∑ ∑ ∑ . (b) Não, pela mesma razão do caso de duas variáveis. (c) Sim, essas condições são válidas. (d) Dependerá da teoria subjacente. (e) Isso é uma generalização simples das equações normais dadas anteriormente. Problemas 7.16 (a) Modelo linear: t̂Y = 10816,04 – 2227,704X2i + 1251,141X3i + 6,283X4i – 197,399X5i ep = (5988,348) (920,538) (1157021) (29,919) (101,156) R2 = 0,835 Neste modelo, os coeficientes angulares medem a taxa de variação de Y em relação à variável pertinente. (b) Modelo log–linear: ln = 0,627 – 1,274 lnX2i + 0,937 lnX3i + 1,713 lnX4i – 0,182 lnX5i t̂Y ep = (6,148) (0,527) (0,659) (1,201) (0,128) R2 = 0,778 Neste modelo, todos os coeficientes angulares parciais são elasticidades parciais de Y em relação à variável pertinente. (c) Espera-se que a elasticidade preço própria seja negativa, a preço cruzada seja positiva para bens substitutos e negativa para bens complementares, e a elasticidade renda seja positiva, já que rosas são um bem normal. Manual de Soluções • Econometria Básica • Gujarati (c) À medida que aumenta a contratação de pessoas com menos de 25 anos, a expectativa é que a taxa de desistência aumente por causa da rotatividade entre os trabalhadores mais jovens. (d) A taxa de queda é 0,54%. Motivos prováveis para essa queda seriam as melhorias nas condições de trabalho e nos benefícios de pensões ao longo do tempo. (e) Não. O significado de “baixo” é relativo. (f) Como os valores t são dados, podemos facilmente calcular os erros-padrão. Sob a hipótese nula de que β1 verdadeiro é zero, temos a relação: ˆ ˆˆ( )ˆ( ) i i i i t ep tep β ββ β = ⇒ = . 7.21 (a) Os resultados da regressão são os seguintes: 2ln M = 1,2394 + 0,5243 ln PIBR – 0,0255 ln TJCP ep = (0,6244) (0,1445) (0,0513) R2 = 0,7292. Os resultados da regressão com a TJLP são os seguintes: 2ln tM = 1,4145 + 0,4946 ln PIBRt – 0,0516 ln TJLPt ep = (1,3174) (0,2686) (0,1501) R2 = 0,7270. As elasticidades renda (0,5243 ou 0,4946) e taxa de juros (–0,0255 ou –0,0516) não são muito diferentes, mas, como veremos no Capítulo 8, a regressão usando a TJCP apresenta melhores resultados estatísticos. (b) A razão M/PIB é conhecida na literatura como o k da equação de Cambridge (Cambridge k), que representa a proporção da renda que as pessoas querem ter em dinheiro. É uma relação sensível à taxa de juros, uma vez que esta representa o custo de se guardar o dinheiro, o qual em geral não produz grandes ganhos com juros. Seguem os resultados da regressão: 2ln t M PIB ⎛ ⎞ ⎜ ⎝ ⎠ ⎟ = 3,4785 – 0,1719 ln TJCPt ep = (0,0780) (0,0409) r2 = 0,5095. 2ln t M PIB ⎛ ⎞ ⎜ ⎝ ⎠ ⎟ = 3,8318 – 0,3123 ln TJLPt ep = (0,1157) (0,0532) r2 = 0,6692. Sendo ambas as regressões bivariadas, podemos verificar que, em termos estatísticos, o Cambridge k está inversamente relacionado à taxa de juros, conforme as expectativas. Em termos numéricos, é mais sensível às taxas de longo prazo do que às de curto prazo. Como a variável dependente é a mesma nos dois modelos, pode-se ver que o r2 obtido com a TJLP apresenta um ajuste muito melhor. (c) A resposta está no Exercício 8.29. Manual de Soluções • Econometria Básica • Gujarati 7.22 (a) Seguem os resultados do ajuste da função de produção Cobb-Douglas fornecidos pelo software Eviews 3: Variável dependente: LOG(PRODUÇÃO) Amostra: 1961 1987 Observações incluídas: 27 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C -11,93660 3,211064 -3,717335 0,0011 LOG(MÃO-DE-OBRA) 2,328402 0,599490 3,883972 0,0007 LOG(CAPITAL) 0,139810 0,165391 0,845330 0,4063 R-quadrado 0,971395 Variável dependente média 4,493912 R-quadrado ajustado 0,969011 Desvio–padrão da variável dependente 0,461432 E.P. da regressão 0,081229 Critério info Akaike -2,078645 Soma quad resíduos 0,158356 Critério Schwarz -1,934663 Verossimilhança Log 31,06171 Estatística-F 407,5017 Estat Durbin-Watson 0,373792 Probabilidade (Estatística-F) 0,000000 As elasticidades estimadas produção/mão-de-obra e produção/capital são positivas, como era de se esperar. Mas veremos no próximo capítulo que os resultados, economicamente falando, não fazem sentido porque o capital não tem relação com a produção, fato que, se verdadeiro, seria surpreendente. Como veremos, o problema com os dados talvez seja a colinearidade. (b) Os resultados da regressão são os seguintes: Variável dependente: LOG(PRODUTIVIDADE) Data: 29/07/2000 Hora: 18:11 Amostra: 1961 1987 Observações incluídas: 27 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C -1,155956 0,074217 -15,57533 0,0000 LOG(RELAÇÃO CAP/MDO) 0,680756 0,044535 15,28571 0,0000 R-quadrado 0,903345 Variável dependente média -2,254332 R-quadrado ajustado 0,899479 Desvio-padrão da variável dependente 0,304336 E.P. da regressão 0,096490 Critério info Akaike -1,767569 Soma quad resíduos 0,232758 Critério Schwarz -1,671581 Verossimilhança Log 25,86218 Estatística-F 233,6528 Estat Durbin-Watson 0,263803 Probabilidade (Estatística-F) 0,000000 A elasticidade de produção/mão-de-obra (isto é, produtividade da mão-de-obra) em relação à razão capital/mão-de-obra é de aproximadamente 0,68, indicando que se Manual de Soluções • Econometria Básica • Gujarati esta aumenta em 1%, a produtividade sobe cerca 0,68%, em média. Um das principais características das economias desenvolvidas é uma relação capital/mão-de-obra relativamente elevada. 7.23 Repare que usamos todas as 528 observações para estimar a regressão cujos resultados são mostrados a seguir: Variável dependente: LOG(SALÁRIOM) Amostra: 1 528 Observações incluídas: 528 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 4,661661 1,954190 2,385470 0,0174 LOG(ESTUDO) -3,165721 1,566685 -2,020650 0,0438 [LOG(ESTUDO)]2 0,836412 0,313436 2,668524 0,0079 R-quadrado 0,157696 Variável dependente média 2,063647 R-quadrado ajustado 0,154488 Desvio-padrão da variável dependente 0,521224 E.P. da regressão 0,479275 Critério info Akaike 1,372579 Soma quad resíduos 120,5946 Critério Schwarz 1,396835 Verossimilhança Log -3593609 Estatística-F 49,14535 Estat Durbin-Watson 1,909008 Probabilidade (Estatística-F) 0,000000 Este é um modelo duplo-log, e, portanto, os coeficientes angulares medem elasticidade. Os resultados sugerem que o percentual de mudança dos salários por hora diminui à medida que aumentam os anos de estudo, mas a uma taxa maior, ou seja, torna-se menos negativa. (b) Não é possível estimar esse modelo devido à perfeita colinearidade. É fácil ver isso com as propriedades dos logaritmos: log(estudo)² = 2log(estudo). 7.24 Este exercício é para ser feito em aula. Observe que sua resposta dependerá do número de repetições que fizer. Quanto maior esse número, melhor será a aproximação. Manual de Soluções • Econometria Básica • Gujarati zero, obtemos: 3 3 ˆ ˆ( ) t ep β β = , daí 33 ˆ 23,195ˆ( ) 4,461 5,1993 ep t ββ = = = , que, devido aos erros de arredondamento, é aproximadamente igual a 4,2750. 8.8 Uma forma alternativa de escrever o primeiro modelo é 2 1 2 2 3 3ln ln ln lni i i iY X X X iuα α α− = + + = , que podemos reescrever: 1 2 2 3 3ln (1 ) ln lni iY X i iX uα α α= + + + = . O modelo anterior e o segundo, com os coeficientes β, são agora, no que tange às observações, os mesmos, com as seguintes relações entre os coeficientes α e β: 2 2 ˆ (1 )β α= + ; 3 3ˆ ˆβ α= e 1 1ˆ ˆβ α= . Os erros-padrão dos coeficientes β estimados podem, portanto, ser facilmente obtidos por meio daqueles dos coeficientes α estimados, já conhecidos. 8.9 A melhor maneira de entender esse termo é encontrar as taxas de variação de Y (despesas pessoais de consumo) em relação a X2 a X3, que são: 2 4 2 Y 3XX δ β β δ = + e 3 4 3 Y 2XX δ β β δ = + . Como vemos, a variação média das despesas pessoais de consumo em relação à renda pessoal depende não só desta, mas também do nível de riqueza pessoal. Analogamente, a variação média das despesas pessoais de consumo em relação ao nível de riqueza pessoal depende não só deste, mas também da renda pessoal. Ou seja, as variáveis renda pessoal e riqueza interagem. Podemos contornar isso introduzindo essas variáveis na regressão em formato interativo, ou multiplicativo, além do formato aditivo. A variável DPC só será independente da variável riqueza quando β4 for igual a zero. 8.10 Relembrando as relações entre as distribuições t e F, sabemos pela primeira equação que: F1,(n – k) = t2 n- k. Portanto, F = (-4,728)² = 22,3540. Pela Equação (8.5.11) do texto, temos 2 2 ( ) ( 2)(0,6149) 22,3540 ( 1)(1 ) (1)(0,3851) n k R nF k R − − = = = − − . Resolvendo essa equação para n, obtemos n ≈ 16. Nota: Na primeira equação, k = 2 e R² = 0,6149. 8.11 1. Improvável, a não ser para o caso de colinearidade muito alta. 2. Provável. Casos como esse ocorrem freqüentemente no trabalho prático. 3. Provável. Essa seria, em verdade, uma situação ideal. 4. Provável. O modelo de regressão é inútil nessa situação. 5. Poderia ocorrer no caso de a significância de um coeficiente ser insuficiente para compensar a insignificância do outro1. 6. Improvável. 1 Para uma discussão mais extensa deste assunto, consulte A Dictionary of Econometrics, de Adrian C. Darnell, Editora Edward Elgar, Reino Unido, 1994, pp. 394-395. Manual de Soluções • Econometria Básica • Gujarati 8.12 Consulte os resultados da regressão do Exercício 7.21. (a) Usando a TJCP como taxa de juros, as elasticidades renda real e taxa de juros são, respectivamente, 0,5243 e -0,0255. Usando a TJLP, as elasticidades correspondentes são 0,4946 e -0,0516. (b) Individualmente, a elasticidade renda é significativa em ambos os casos, mas as elasticidades taxa de juros, não. (c) Usando a versão R² do teste F dado na Equação (8.5.11), os valores F são 21,5429 (aplicando a TJCP) e 21,3078 (aplicando a TJLP). Os valores p desses F são quase zero em ambos os casos, levando à rejeição da hipótese de que a renda real e a taxa de juros não têm, coletivamente, impacto na demanda por moeda. (d) Nesse caso, a hipótese nula é que o coeficiente de elasticidade de renda é um. Para testá-la, usaremos o teste t como segue: - com a TJCP como variável taxa de juros, (0,5243 1) 3,2920 0,1445 t −= = − ; - com a TJLP como variável taxa de juros, (0, 4946 1) 1,8816 0,2686 t −= = − . Com 19 observações e dois regressores, temos gl 16. Como a expectativa é de que o coeficiente de elasticidade renda seja positivo, podemos aplicar um teste unicaudal. O valor t crítico unicaudal para gl 16 a 5% é 1,746. Podemos, nesse nível de significância, rejeitar a hipótese nula de que a elasticidade renda é igual a um. Ela é, na verdade, menor que um. 8.13 (a) A elasticidade é -1,34, significativamente diferente de zero, pois o valor t sob a hipótese nula de que o coeficiente de elasticidade verdadeiro é igual a zero é 1,43 4,4687 0,32 t −= = . O valor p de se obter tal t é extremamente baixo. O coeficiente não é, entretanto, diferente de um porque, sob a hipótese nula de que a elasticidade verdadeira é igual a 1, temos 1,34 1 1,0625 0,32 t − −= = − , que não é estatisticamente significativo. (b) A elasticidade renda, embora positiva, não é estatisticamente diferente de zero, pois o valor t sob a hipótese nula é menor que 1. (c) Aplicando a fórmula (7.8.4), obtemos 2 2 11 (1 ) nR R n k − = − − − Já que neste caso temos 2R =0,27, n = 46 e k = 3, basta substituir esses dados na equação e verificar que R² = 0,3026, aproximadamente. Manual de Soluções • Econometria Básica • Gujarati 8.14 (a) A expectativa, a priori, é de que o salário e as outras variáveis explanatórias sejam positivamente relacionados, e são mesmo. O coeficiente parcial de 0,280 significa que, ceteris paribus, a elasticidade do salário do CEO é de 0,28%. O coeficiente 0,0174 significa que, ceteris paribus, se a taxa de retorno sobre o patrimônio subir um ponto percentual (atenção, não é o mesmo que 1%), o salário do CEO sobe cerca de 1,07%. Analogamente, também ceteris paribus, se a taxa de retorno sobre as ações da empresa subir um ponto percentual, o salário do CEO sobe cerca de 0,024%. (b) Sob a hipótese nula individual, ou separada, de que cada um dos coeficientes populacionais verdadeiros é igual a zero, podemos obter os valores t simplesmente dividindo cada coeficiente estimado pelo seu erro-padrão. Esses t para os quatro coeficientes dados no modelo são, respectivamente, 13,5, 8, 4,25 e 0,44. Como a amostra é bastante grande, podemos ver, aplicando a regra prática 2-t, que os três primeiros coeficientes são, em termos estatísticos, muito significativos individualmente, e o último é insignificante. (c) Para testar a significância geral, isto é, todos os coeficientes angulares são iguais a zero, aplique o teste F dado em (8.5.11): 2 2 /( 1) 0,283/ 3 27,02 (1 ) /( ) 0,717 / 205 R kF R n k − = = − − = Esse valor, sob a hipótese nula, tem a distribuição F com respectivamente, 3 e 205 gl no numerador e denominador. O valor p de se obter tal F é extremamente pequeno, levando à rejeição da hipótese nula. (d) Como a variável dependente está em forma logarítmica, e roe e ros em forma linear, os coeficientes dessas variáveis fornecem semi-elasticidades, isto é, a taxa de crescimento da variável dependente em relação à variação de uma unidade (em valor absoluto) do regressor. 8.15 Aplicando a Equação (3.5.8), podemos verificar que: r12 = 0,9989; r13 = 0,9885 e r12 = 0,9839, e com as fórmulas dadas na Seção 7.11, que: r12.3 = 0,9705; r13.2 = 0,678 e r23.1 = -0,4930. Utilizando o teste Fischer dado no exercício, averiguamos que: 12.3 12.3 2 12.3 15 1 2 13,590 1 rt r − − = = − . Procedendo exatamente da mesma forma, encontramos 13.2 3, 20t = e . 23.1 1,963t = Todos esses valores t são estatisticamente significativos no nível de 5%. 8.16 (a) Os logaritmos dos índices dos preços reais e das taxas de juros no ano anterior explicam cerca de 79% da variação no logaritmo do estoque de tratores, um tipo de capital. Como este é um modelo duplo-log, os dois coeficientes angulares são elasticidades (parciais) preço, cujos sinais são os esperados a priori. (b) Cada coeficiente angular parcial é individualmente significativo no nível de 5% e significativamente diferente de um. Manual de Soluções • Econometria Básica • Gujarati (d) Embora nenhuma das duas variáveis seja estatisticamente significativa, espera-se que ambas tenham sinal positivo. (e) Talvez a amostra seja pequena demais para detectarmos a significância estatística dos preços dos cravos ou da renda na demanda por rosas. Além disso, os gastos com rosas devem ser uma parte tão pequena da renda total que não se nota nela seu impacto. 8.22 (a) Os coeficientes de X2 e X3 são estatisticamente significativos, mas os de X4 e X5 não o são. (b) Sim. Aplicando o teste F, obtemos 0,656 / 4 12,392 (1 0,656) / 26 F = = − , valor que a 5% para 4 e 26 gl é 2,74. Rejeitamos, pois, H0. (c) Usando o modelo semilogarítimico, obtemos: log(prospecções) = 2,53203 – 0,0127 tempo valor t = (38,3766) (-3,3514) r² = 0,2792. Portanto, a taxa de crescimento instantânea é -1,27%, assim como a taxa de crescimento composta correspondente. (Tome o antilogaritmo de -0,0127, que vale 0,9873, subtraia dele 1 e multiplique por 100). [N] Nota: Para valores pequenos de r, ln(1+r) ≈ r. 8.23 (a) Consulte os resultados da regressão dada no Exercício 7.18. Espera-se, a priori, que todos os coeficientes angulares sejam positivos, o que é verdade, exceto para a variável vendas militares dos Estados Unidos. O valor R² é bem alto, mas o modelo parece, em geral, satisfatório. (b) Podemos usar a versão R² da tabela ANOVA (8.5) do texto. Fonte da variação SQ gl MSQ Devido à regressão 0,978 2( )iy∑ 4 20,978 4 iy∑ Devido aos resíduos 87,782 2( iy )∑ 22 20,022 15 iy∑ STQ 1071,975 23 Sob a hipótese nula habitual, a razão F é 0,978 / 4 166,33 0,022 /15 F = = , valor obviamente muito significativo, levando à rejeição da hipótese nula de que todos os coeficientes angulares são simultaneamente iguais a zero. Em outras palavras, as quatro variáveis têm, em conjunto, impacto significativo nos gastos com defesa. Manual de Soluções • Econometria Básica • Gujarati 8.24 (a) Essa função permite que os produtos marginais de mão-de-obra e capital subam antes de acabarem caindo e leva em conta a elasticidade variável de substituição, ao contrário da função de produção Cobb-Douglas normal, que não leva isso em conta e em que os produtos marginais caem desde o início. (b) Se β4 = β5 = 0, então e0 = 1. Este é o modelo-padrão. (c) Pode-se usar o teste F dos mínimos quadrados restritos. (d) Os resultados são os seguintes: Variável dependente: LOG(PIB) Amostra: 1955 1974 Observações incluídas: 20 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C -11,70601 2,876300 -4,069814 0,0010 LOG(MÃO-DE-OBRA) 1,410377 0,590731 2,387512 0,0306 LOG(CAPITAL) 0,942699 0,194542 4,845735 0,0002 MÃO-DE-OBRA -9,06E-05 4,35E-05 -2,082179 0,0549 CAPITAL -3,54E-07 4,15E-07 -0,853032 0,4071 R-quadrado 0,999042 Variável dependente média 12,22605 R-quadrado ajustado 0,998787 Desvio-padrão da variável dependente 0,381497 E.P. da regressão 0,013289 Critério info Akaike -5,591475 Soma quad resíduos 0,002649 Critério Schwarz -5,342542 Verossimilhança Log 60,91475 Estatística-F 3911,007 Estat Durbin-Watson 1,065992 Probabilidade (Estatística-F) 0,000000 Esses cálculos mostram que os resultados são mistos, pois enquanto o coeficiente de mão-de-obra é estatisticamente significativo, o de capital não o é. Compare esses resultados com os do Exemplo 8.3 do livro-texto, obtidos com a função de produção Cobb-Douglas normal. 8.25 (a) Sim. O índice do preço do combustível é negativo e estatisticamente significativo no nível de 1%. (b) A perda de produtividade foi de 6,48% [(-0,1081)(60%)]. (c) A taxa de crescimento tendencial da produtividade foi de 0,45%. (d) Em média, para a amostra, um aumento de 1% na relação mão-de-obra/capital leva a um aumento de 0,71% na produtividade. (e) Veja a Questão 8.11. Se cada coeficiente individual for estatisticamente significativo, então é improvável que R² = 0. No caso em tela, 0,98 / 3 1928,37 (1 0,98) /118 F = = − , valor muito significativo, de forma que se pode rejeitar a hipótese de que R² é zero. Manual de Soluções • Econometria Básica • Gujarati 8.26 (a) Segundo o software Eviews 3 os resultados são os seguintes: Variável dependente: Y Amostra: 1968 1983 Observações incluídas: 16 Variável Coeficiente Erro–padrão Estatística-t Probabilidade C 5962,656 2507,724 2,377716 0,0388 X2 4,883663 2,512542 1,943714 0,0806 X3 2,363956 0,843559 2,802361 0,0187 X4 -819,1287 187,7072 -4,363863 0,0014 X5 12,01048 147,0496 0,081676 0,9365 X6 -851,3927 292,1447 -2,914284 0,0155 R-quadrado 0,822750 Variável dependente média 7543,125 R-quadrado ajustado 0,734125 Desvio-padrão da variável dependente 1217,152 E.P. da regressão 627,6005 Critério info Akaike 16,00168 Soma quad resíduos 3938824 Critério Schwarz 16,29140 Verossimilhança Log -122,0134 Estatística-F 9,283507 Estat Durbin-Watson 2,484497 Probabilidade (Estatística-F) 0,001615 (b) Seria esperado que β2, β3 e β6 fossem positivos e β4 e β5, negativos. (c) β2, β3 e β4 estão de acordo com as expectativas, mas os outros, não. (d) De acordo com os resultados da regressão, X3, X4 e X6 são significativos no nível de 5%, e X2 no nível de 10%, mas X5 é estatisticamente insignificante. (e) Aplicamos a metodologia dos mínimos quadrados restritos discutida no capítulo. Regressando Y contra X2, X3 e X4 somente, obtemos 2 RR = 0,6012. Incluindo todos os regressores, como se vê em (a), temos 2SRR = 0,8227. Portanto, aplicando a Equação (8.7.10), obtemos (0,8227 0,6012) / 2 6,25 (1 0,8227) /10 F −= = − . Para gl 2 e 10 no numerador e denominador, respectivamente, o valor F crítico a 5% é 4,10. Rejeitamos, portanto, a hipótese de que as variáveis X5 e X6 não se encaixam no modelo. 8.27 (a) Como ambos são modelos log-lineares, os coeficientes angulares estimados representam a elasticidade (parcial) da variável dependente em relação ao regressor sob observação. Por exemplo, o coeficiente 0,94 na Equação (3) significa que se a produção em kWh aumenta 1%, em média, o custo total de produção sobe em 0,94%. Analogamente, na Equação (4), se o preço da mão-de-obra em relação ao preço do combustível sobe 1%, em média, o custo relativo de produção sobe 0,51%. Manual de Soluções • Econometria Básica • Gujarati retidas aumentam a uma taxa decrescente conforme aumentam os gastos com publicidade. (b) & (c) Podemos encarar o modelo I como a versão condensada, ou restrita, do modelo II e, por isso, aplicar a técnica dos mínimos quadrados restritos para escolher entre os dois. Como a variável dependente é a mesma em ambos, podemos usar a versão R² do teste F dado em (8.7.10). Seguem os resultados: (0,53 0,424) /1 0,106 4,0613 (1 0,53) /18 0,0261 F −= = = − , valor que, sob as premissas normais do teste F, segue a distribuição F com 1 e 18 gl no numerador e denominador, respectivamente, com valor F crítico de 4,41 no nível de 5% e 3,01 no nível de 10%. O valor p é 0,0591 a cerca de 6%, próximo dos 5%. Parece que devemos manter no modelo a variável X². (d) Há retornos decrescentes nos gastos com publicidade, conforme observado em (b). Se o coeficiente do termo X² fosse positivo, os retornos com tais gastos teriam sido crescentes. Igualando a derivada em (b) a zero, temos 1,0847 = 0,008X, logo X = 135,58, valor em que a taxa de crescimento de Y em relação a X é zero. Como X é medido em milhões de dólares, pode-se dizer que no nível de gastos da ordem de 136 milhões de dólares não há mais nenhum ganho nas impressões retidas, medidas em milhões. 8.33 (a) Aplicando os dados da regressão (7.9.4) no teste t (8.7.4), obtemos: 2 2 (1, 4988 0, 4899 1) 0,9887 2,0849 0, 4742(0,5398) (0,1020) 2(0,03843) t + −= = + − = . Como 15 é o tamanho da amostra, temos gl 12. O valor t anterior é significativo no nível de 5%, indicando que talvez tenha havido retornos de escala crescentes no setor agrícola taiwanês. (b) Impondo a restrição de constantes retornos de escala, os resultados da regressão são os seguintes: 3 2 2 ln 1,7086 0,6129ln XY X X ⎛ ⎞ ⎛ ⎞ = +⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ ep = (0,4159) (0,0933) R² = 0,7685 SQR = 0,0915. A SQR sem restrições, SQRSR, pela regressão (7.9.4) é 0,0672 e a SQR com restrições, SQRR, pela regressão em (b), é 0,0915. Com o teste F dado em (8.7.9), obtemos (0,0915 0,0672) /1 4,3393 (0,0672) /12 F −= = . Sob as premissas habituais do teste F, esse valor tem distribuição F com 1gl no numerador e 12 gl no denominador. O valor p de se obter um F de 4,34 ou maior é de 0,0593 ou cerca de 6%, próximo do nível de significância de 5%. Parece, novamente, que houve retornos de escala crescentes no setor agrícola taiwanês. Manual de Soluções • Econometria Básica • Gujarati Observe que a pequena diferença nos níveis de significância de t e F deve-se a erros de arredondamento. Repare também que, como as variáveis dependentes são diferentes nos modelos com e sem restrições, não podemos usar versão R² do teste F. 8.34 Seguindo exatamente os mesmos procedimentos mostrados na Seção 8.8 do texto, aqui vão as várias somas dos quadrados dos resíduos: SQR1 = 1953,639 (1970–1982) SQR2 = 9616,213 (1983–1995) SQRR = 23248,30 (1970–1995), que é a SQR com restrições. A SQRSR = (1953,639+9616,213) = 11569,852. Com o teste F, obtemos 1 2 ( ) / (11678, 448) / 2 11,1032 ( ) /( 2 ) (11569,852) / 22 R SR SR SQR SQR kF SQR n n k − = = + − = . O valor p de se obter um valor F de 11 ou mais é cerca de 0,0005, uma probabilidade mesmo muito pequena. Embora a conclusão geral deste exercício e do exemplo visto na Seção 8.8 do texto seja a mesma, isto é, que houve uma variação estatisticamente significativa na regressão poupança-renda, a resposta depende do ponto de quebra escolhido para dividir a amostra, como vemos pelos valores F. Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 9 MODELOS DE REGRESSÃO COM VARIÁVEIS BINÁRIAS 9.1 (a) Se o intercepto estiver presente no modelo, inclua 11 variáveis binárias. Caso contrário, inclua 12. (b) Se o intercepto não estiver no modelo (isto é, regressão pela origem), introduza seis variáveis binárias. Caso contrário, introduza apenas cinco. 9.2 (a) De acordo com a teoria econômica, espera-se que os coeficientes de X2 e X5 sejam positivos, e os de X3, X8 e X9, negativos. O de X4 pode ser positivo ou negativo, dependendo da idade da esposa e do número de filhos. Uma variável binária interativa para idade e filhos com menos de 6 anos ou entre 6 e 13 anos talvez esclareça melhor a relação entre idade e horas de trabalho desejadas. (b) Mantendo-se todos os outros fatores constantes, espera-se que a variável horas de trabalho desejadas seja maior que o valor do intercepto (comum) de 1286 horas, mas esse coeficiente tem sinal negativo, e como não é estatisticamente significativo, pouco se pode dizer sobre o impacto de X6 em Y (média). Quanto a X7, espera-se que seu coeficiente seja positivo, e é mesmo. Além disso, é estatisticamente significativo, pois o valor t é bem alto. (c) Isso talvez se deva às colinearidades entre a idade e a escolaridade e entre estas e o número de filhos. Repare também que o modelo não inclui os anos de estudo completados pelo marido. 9.3 (a) Espera-se que a relação entre as duas variáveis seja negativa porque se a taxa de desemprego for alta, indicando excesso de oferta de mão-de-obra no mercado de trabalho, é menos provável que os empregadores anunciem vagas em aberto. (b) Ela é 3,8998 (=2,7491+1,1507). Como o coeficiente da variável binária é estatisticamente significativo, a taxa de desemprego é estatisticamente maior no período após o quarto trimestre de 1966 do que era antes dele. (c) Como o coeficiente diferencial da variável binária é quase significativo no nível de 5%, podemos dizer que os coeficientes angulares da função de regressão são diferentes nos dois períodos. (d) É muito provável que sim. O governo, ao tornar os benefícios-desemprego mais generosos, reduz o custo de oportunidade de se permanecer desempregado. 9.4 Os resultados mostram que o preço médio por barril em 1974 estava US$5,22 mais alto do que nos outros anos da amostra, mas o coeficiente angular, US$0,30, é o mesmo em todo o período. O gráfico se assemelha ao da Figura 9.3 b do texto com a linha de regressão para 1974 iniciando no ponto 5,22 do eixo vertical e para os outros anos passando pela origem, mas ambas com o mesmo coeficiente angular de 0,30. Manual de Soluções • Econometria Básica • Gujarati iu 9.10 Escreva assim o modelo: 1 2 1 2 ( *)i i iY D X X X Dα α β β= + + + − + , em que D=1, quando Xi>X* e D=0, se Xi<X*. Assumindo que E(ui)=0, obtemos: * 1 1( | 0, )i i iE Y D X X Xα β= < = + * * 1 2 1 2( | 1, ) ( ) ( )( )i i iE Y D X X X Xα α β β= > = + + + − Então, quando Xi excede X*, o intercepto varia por α2 e o coeficiente angular por β2. 9.11 (a) Essa designação das variáveis binárias presume uma diferença constante (proporcional): a escala da loja de rede é 10 vezes a daquela de descontos, e a da loja de conveniência é 10 vezes a de rede (ou 100 vezes a da loja de descontos). Isto é, obviamente, arbitrário. (b) Como esperado, os refrigerantes de marca são mais caros do que aqueles sem marca. Os resultados também indicam que recipientes menores são mais caros que os maiores, também como esperado. O modelo explica cerca de 60% da variação do preço dos refrigerantes. (c) A variável binária tem os valores mais elevados atribuídos aos menores recipientes. 9.12 (a) O coeficiente da variável renda em formato logarítmico é uma semi- elasticidade, ou seja, representa a variação absoluta da expectativa de vida para uma variação percentual na renda. (b) Esse coeficiente mostra que é provável que a expectativa média de vida aumente 0,0939 anos se a renda per capita aumentar 1%, ceteris paribus. (Veja o Capítulo 6 sobre o modelo lin-log). (c) Esse regressor foi incluído para contornar o efeito sobre a expectativa de vida dos aumentos crescentes da renda per capita acima do valor limite de US$1097. O regressor também informa o número de anos adicionais que se pode esperar viver quando a renda passa de US$1097. O valor do coeficiente estimado não é, entretanto, estatisticamente significativo, pois seu valor p é de 0,1618. (d) A equação da regressão para os países cuja renda per capita está abaixo do nível de 1097 dólares americanos é –2,40+9,39 lnXi , e para os países cuja renda está acima desse nível é –2,40+(9,39–3,36) lnXi + (3,36)(7) = 21,12 + 6,03 lnXi. Embora numericamente as duas regressões pareçam diferentes, não o são estatisticamente, pois o coeficiente do último termo da equação é zero em termos estatísticos. Se considerarmos países mais ricos aqueles com renda per capita maior que US$1097, parece não haver entre estes e os outros mais pobres nenhuma diferença estatística perceptível na expectativa de vida. 9.13 (a) & (b) β1 dá o valor esperado de Y para as 20 primeiras observações e β2 dá a variação do valor esperado de Y para as 30 observações seguintes, sendo (β1 + β2 ) o valor esperado real de Y para as últimas 30 observações. Manual de Soluções • Econometria Básica • Gujarati (c) Pela conhecida fórmula para achar a soma ou a diferença de duas ou mais variáveis aleatórias (veja Apêndice A do texto) pode-se demonstrar que 1 2 1 2 1 2 ˆ ˆ ˆ ˆ ˆ ˆvar( ) var( ) var( ) 2cov( , )β β β β β+ = + + β . Para obter os valores numéricos, aplicamos as fórmulas dados no Capítulo 3 para o modelo de duas variáveis. Temos, então: 2 2 1 2 1 30ˆvar( ) 300 15 ( ) 50 12 i i D n D D β σ ⎛ ⎞= = =⎜ ⎟− ⎝ ⎠ ∑ ∑ e 2 2 2 300ˆvar( ) 25 ( ) 12iD D σβ = = = − . ∑ Isso nos informa que a covariância entre os dois estimadores é 15. Juntando esses números todos, temos . 1 2 ˆ ˆvar( ) 10β β+ = Nota: Verifique que 2( )iD D− =∑ 12 . 9.14 (a) A relação esperada entre as duas variáveis é negativa. (b). Sim, confirmam. (c) & (d) Nos estados em que não havia leis de direito ao trabalho, a média de empregados que pertenciam a sindicatos era de 19,8%. Por outro lado, nos estados com essas leis, essa média era 9,39 pontos percentuais menor, aproximadamente, com um total real de sindicalizados de 10,42%. 9.15 Pelas fórmulas dos MQO dadas no Capítulo 3, temos 2 2 ( )ˆ ( ) i i iD D Y D D β − = − ∑ ∑ (1) É fácil verificar que 2i D nD n n = =∑ . 1( )i nD D n− = , se D = 1 e 2n n − , se D = 0. O denominador da Equação (1) pode ser escrito como segue: 1 2 2 2 2 2 2 2 1 1 2 1 1 ( ) ( ) ( ) n n i i i i i n nD D D D D D n n n n= = −⎛ ⎞ ⎛ ⎞− = − + − = + =⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ ∑ ∑ ∑ 1 2n nn . E o seu numerador como: 1 2 1 2 2 2 1 1 1 1 11 2 1( ) ( ) ( ) n n n n i i i i i i i i cs i i i i nD D Y D D Y D D Y Y Y Y Y Y Y n n= = = = − = − + − = − + = − = −∑ ∑ ∑ ∑ ∑ sg , e o intercepto é dado por 1̂ ˆY 2Dβ β+ − que, depois das substituições fica 1̂ sgYβ = . 9.16 (a) 2,4%. Manual de Soluções • Econometria Básica • Gujarati (b) Como tanto o intercepto diferencial quanto os coeficientes angulares são muito significativos, os níveis e as taxas de crescimento da população são diferentes nos dois períodos. Essa taxa para o período anterior a 1978 é de 1,5% e para o posterior, 2,6%(= 1,5%+1,1%). Problemas 9.17 Fazendo a regressão separadamente para os dois períodos, encontramos 21σ̂ = 0,00768 (gl = 30) para o primeiro e 22σ̂ = 0,03638 (gl = 17) para o segundo. Então, sob a premissa de que as variâncias das populações respectivas são as mesmas, e de acordo com a Equação (8.8.8), a relação a seguir está de acordo com a distribuição F: 1 2 2 2 ( ),(2 2 ˆ ˆ n k n k F Fσ σ − − = ) . No nosso exemplo, k = 2, n1 = 32 e n2 = 19. Levando esses valores à expressão anterior, obtemos F = 4,7369. O valor p de se obter um F de 4,7369 ou maior é de 0,00001, muito pequeno. A conclusão é que as variâncias nos dois subperíodos não são iguais. 9.18 A variável dependente nos modelos (9.7.3) e (9.7.4) é a mesma, então podemos usar a versão R² do teste F dado na Equação (8.7.10). No caso em tela, obtemos o R² restrito ( 2RR ) de (9.7.3), que vale 0,5318, e o irrestrito ( 2 SRR ) vale 0,7298 e é dado por (9.7.4). No exemplo, n = 2, k = 5 e m = 1. Lançando esses valores na Equação (8.7.10), obtemos (0,7298 0,5318) /1 19,8 (1 0,7298) /(32 5) F −= − − = , que tem a distribuição F com 1 e 27 gl respectivamente no numerador e denominador. Com essa distribuição, o valor p de se obter um F de 19,8 ou maior é praticamente zero. Concluímos daí que não é valida a restrição imposta pelo modelo (9.7.3) de excluir a variável X. Ou melhor, a variável X, despesas com bens duráveis, deve – definitivamente – ser incluída no modelo. 9.19 Neste caso, a variável binária Z toma o valor 2 quando D = 0 e o valor 5 quando D = 1. Com esses valores, obtemos os seguintes resultados para a regressão: Variável dependente: POUPANÇA Método: Mínimos quadrados Amostra: 1970 1995 Observações incluídas: 26 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C -100,6363 37,88404 -2,656429 0,0144 RENDA 0,123978 0,024574 5,045035 0,0000 Z 50,82618 11,02746 4,609058 0,0001 Z*RENDA -0,021823 0,005327 -4,096340 0,0005 R-quadrado 0,881944 Variável dependente média 162,0885 R-quadrado ajustado 0,865846 Desvio-padrão da variável 63,20446 Manual de Soluções • Econometria Básica • Gujarati Variável dependente: PRAT Método: Mínimos quadrados Amostra: 1978:1 1985:4 Observações incluídas: 32 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 106,8419 168,8010 0,632946 0,5321 D1 5,840220 62,14176 0,093982 0,9258 D2 24,14839 62,32067 0,387486 0,7014 D3 29,81285 62,34750 0,478172 0,6364 DUR 2,322680 0,590194 3,935452 0,0005 R-quadrado 0,378492 Variável dependente média 773,5000 R-quadrado ajustado 0,286416 Desvio-padrão da variável dependente 147,1194 E.P. da regressão 124,2775 Critério info Akaike 12,62551 Soma quad resíduos 417012,1 Critério Schwarz 12,85453 Verossimilhança Log -197,0082 Estatística-F 4,110677 Estat Durbin-Watson 0,183078 Probabilidade (Estatística-F) 0,009944 Variável dependente: TRIT Método: Mínimos quadrados Amostra: 1978:1 1985:4 Observações incluídas: 32 Variável Coeficiente Erro-padrão Estatística–t Probabilidade C 56,40125 81,47305 0,692269 0,4947 D1 -80,62057 29,99319 -2,687963 0,0122 D2 -79,75024 30,07954 -2,651312 0,0133 D3 -14,85471 30,09249 -0,493635 0,6256 DUR 3,007781 0,284862 10,55875 0,0000 R-quadrado 0,820847 Variável dependente média 856,5312 R-quadrado ajustado 0,794306 Desvio-padrão da variável dependente 132,2576 E.P. da regressão 59,98346 Critério info Akaike 11,16862 Soma quad resíduos 97146,41 Critério Schwarz 11,39764 Verossimilhança Log -173,6979 Estatística-F 30,92730 Estat Durbin-Watson 0,733166 Probabilidade (Estatística-F) 0,000000 Variável dependente: ROUP Método: Mínimos quadrados Amostra: 1978:1 1985:4 Observações incluídas: 32 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 741,0680 107,2523 6,909578 0,0000 D1 -4707049 39,48345 -1,192157 0,2436 D2 -13,14717 39,59713 -0,332023 0,7424 Manual de Soluções • Econometria Básica • Gujarati D3 -122,0311 39,61418 -3,080491 0,0047 DUR 1,754688 0,374996 4,679221 0,0001 R-quadrado 0,541230 Variável dependente média 1187,844 R-quadrado ajustado 0,473264 Desvio-padrão da variável dependente 108,7996 E.P. da regressão 78,96307 Critério info Akaike 11,71844 Soma quad resíduos 168349,5 Critério Schwarz 11,94746 Verossimilhança Log -182,4950 Estatística-F 7,963248 Estat Durbin-Watson 0,926092 Probabilidade (Estatística-F) 0,000224 (b) A inclusão de gastos com bens duráveis na equação para as máquinas de lavar pratos não muda o resultado no que tange à sazonalidade, que não existe nos dados (comparados aos do primeiro trimestre). Os resultados para os trituradores de lixo são consideravelmente diferentes, pois que há sazonalidade pronunciada nos segundo e terceiro trimestres. Para as máquinas de lavar roupas, os resultados são qualitativamente os mesmos. Observe, entretanto, que o coeficiente de gastos com bens duráveis é estatisticamente significativo em todas as regressões. (c) A inclusão das variáveis binárias no modelo de regressão remove a sazonalidade, se houver, não só da venda dos vários eletrodomésticos, mas também dos gastos com bens duráveis, a la teorema de Frisch-Waugh mencionado no capítulo do livro-texto. 9.24 (a) & (b) Este é um trabalho para ser feito individualmente pelos alunos. Nos Estados Unidos, as eleições presidenciais de 2000 ocorreram em sete de novembro. Se você tivesse usado seu modelo, sua previsão do resultado teria sido correta? (c) Os resultados desse modelo são os seguintes: Variável dependente: V Método: Mínimos quadrados Amostra: 1 21 Observações incluídas: 21 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 0,505678 0,026324 19,21007 0,0000 I -0,019753 0,016347 -1,208325 0,2456 VB 0,055755 0,019637 2,839255 0,0124 G*I 0,009625 0,001706 5,642862 0,0000 P 0,000155 0,002804 0,055370 0,9566 N -0,004637 0,003293 -1,407866 0,1796 R-quadrado 0,788321 Variável dependente média 0,490690 R-quadrado ajustado 0,717762 Desvio-padrão da variável dependente 0,075065 E.P. da regressão 0,039879 Critério info Akaike -3,370963 Soma quad resíduos 0,023855 Critério Schwarz -3,072528 Verossimilhança Log 41,39511 Estatística-F 11,17242 Estat Durbin-Watson 2,229997 Probabilidade (Estatística-F) 0,000125 Talvez G possa ser incluído no modelo como regressor, embora os autores não o tenham feito. Manual de Soluções • Econometria Básica • Gujarati 9.25 Os resultados do Eviews 3 para a regressão são os seguintes: Variável dependente: SALH Método: Mínimos quadrados Amostra: 1 528 Observações incluídas: 528 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C -0,261014 1,106956 -0,235794 0,8137 GÊNERO -2,360657 0,430203 -5,487303 0,0000 RAÇA -1,732729 0,794716 -2,180314 0,0297 GÊNERO*RAÇA 2,128986 1,222109 1,742059 0,0821 ESCOLARIDADE 0,802807 0,081014 9,909478 0,0000 R-quadrado 0,203263 Variável dependente média 9,047538 R-quadrado ajustado 0,197169 Desvio-padrão da variável dependente 5,144082 E.P. da regressão 4,609140 Critério info Akaike 5,903384 Soma quad resíduos 11110,70 Critério Schwarz 5,943811 Verossimilhança Log -1553,493 Estatística-F 33,35678 Estat Durbin-Watson 1,873724 Probabilidade (Estatística-F) 0,000000 Como mostram os resultados, a variável binária interativa gênero-raça é estatisticamente significativa no nível de 8%. Se considerarmos que esse valor p é suficientemente baixo, essa variável é significativa, e os resultados dados em (9.6.4) têm de ser reinterpretados. Em relação só ao gênero – repare que a variável binária do gênero é 1 para as mulheres –, o seu salário médio por hora é cerca de US$2,36 mais baixo em comparação ao dos homens. Da mesma forma, o salário médio por hora dos não-brancos e não-hispânicos é US$1,73 mais baixo. Mas esses resultados precisam ser modificados para levar em consideração a variável binária gênero-raça. Por exemplo, se mantivermos raça constante, o salário médio por hora das mulheres passa a ser só US$0,2317 (= -2,3606 + 2,1289) mais baixo. Analogamente, se mantivermos gênero constante, o salário médio por hora dos trabalhadores não- brancos e não-hispânicos passa a ser US$0,3962 (= -1,7327 + 2,1289) mais alto. Podemos ver, desse modo, como a variável binária interativa (ou multiplicativa) atenua ou exagera o efeito das aditivas. 9.26 Os resultados do Eviews 3 para a regressão são os seguintes: Variável dependente: SALH Método: Mínimos quadrados Amostra: 1 528 Observações incluídas: 528 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 9,067519 0,446115 20,32552 0,0000 ECIVIL 0,713991 0,551188 1,295367 0,1958 REGIÃO -2,540727 0,826694 -3,073359 0,0022 ECIVIL*REGIÃO 1,323573 1,020982 1,296373 0,1954 Manual de Soluções • Econometria Básica • Gujarati i CAPÍTULO 10 MULTICOLINEARIDADE: O QUE ACONTECE SE OS REGRESSORES SÃO CORRELACIONADOS? 10.1 Se Xk é uma combinação linear perfeita das variáveis explanatórias restantes, então existem (k-1) equações com k incógnitas. Com mais incógnitas do que equações, soluções únicas (ou singulares) não são possíveis. 10.2 (a) Não. A variável X3i é uma combinação linear exata de X2i, pois X3i = 2X2i – 1. (b) Reescrevendo a equação, obtemos: 1 2 2 3 2 1 3 2 3 2 1 2 2(2 1) ( ) ( 2 )i i i i i i iY X X u X u X uβ β β β β β β α α= + + − + = − + + + = + + , em que 1 1 3( )α β β= − e 2 2( 2 2 )α β β= + . Podemos, portanto, estimar α1 e α2 singularmente, mas não os β originais, pois só temos duas equações para resolver três incógnitas. 10.3 (a) Embora os valores numéricos do intercepto e dos coeficientes angulares de PNBpc e TAF tenham mudado, os seus sinais são os mesmos. Além disso, essas variáveis continuam sendo estatisticamente significativas. As mudanças devem ser devidas à inclusão da variável TFT, indicando que pode haver alguma colinearidade entre os regressores. (b) Como o valor t do coeficiente de TFT é muito significativo (o valor p é só 0,0032), essa variável, aparentemente, se encaixa no modelo. O sinal positivo desse coeficiente também faz sentido porque quanto mais filhos tiver uma mulher, maiores são as chances de aumentar a mortalidade infantil. (c) Esta é uma daquelas ocorrências “felizes” em que, apesar da possível colinearidade, os coeficientes individuais são, assim mesmo, estatisticamente significativos. 10.4 A relação pode ser reescrita assim: 32 1 2 3 12.3 2 13.2 3 1 1 i i i i iX X X X X λλ β β λ λ = − − = + 31 2 1 3 21.3 1 23. 2 2 i i i i 1 3iX X X X X λλ β β λ λ = − − = + 1 2 3 1 2 31.2 1 32.1 2 3 3 i i i i iX X X X X λ λ β β λ λ = − − = + Portanto, Manual de Soluções • Econometria Básica • Gujarati 2 1 12.3 12.3 21.3 1 2 ˆ ˆ( )( ) ( )( )r λ λβ β λ λ = = − − 1= ± 3 1 13.2 13.2 31.2 1 3 ˆ ˆ( )( ) ( )( )r λ λβ β λ λ = = − − 1= ± 3 2 23.1 23.1 32.1 2 3 ˆ ˆ( )( ) ( )( )r λ λβ β λ λ = = − − 1= ± Daí, 2 2 2 2 1.23 12 12 13.2(1 ) 1R r r r= + − = . Analogamente, 2 2 2.13 3.12 1R R= = . O grau de multicolinearidade é perfeito. 10.5 (a) Sim. Dados de séries temporais econômicas tendem a evoluir na mesma direção, como acontece com as variáveis defasadas de renda neste caso. (b) Como vimos sucintamente no Capítulo 10 e mais a fundo no Capítulo 17, a transformação de primeira diferença pode minorar o problema. 10.6 Quando a variável riqueza é excluída do modelo, ocorre erro de especificação, e o coeficiente da variável renda fica tendencioso. O que se observa, então, na equação (10.6.4) é uma estimativa tendenciosa do coeficiente de renda. A natureza do viés é a seguinte: Dado que 1 2 2 3 3i iY X X i iuβ β β= + + + , vem que , em que b12 é o coeficiente angular na regressão de Y contra X2, e b32 na de X3 contra X2. De acordo com os dados informados, temos que 12 2 3 32 ˆ ˆb β β= + b 2β̂ = 0,9415; 3β̂ = -0,0424; b32 = 10,191 e b12 = 0,5091. Portanto, o viés em b12 é = (–0,0424) (10,191) = –0,4321. 3 32 ˆ( )( )bβ 10.7 Como dissemos na Questão 10.5, as variáveis em Economia são muitas vezes influenciadas por fatores tais como ciclos econômicos e tendências. Espera-se, portanto, colinearidade na análise de regressão com variáveis como PIB e oferta de moeda. 10.8 (a) Sim, porque o coeficiente de correlação entre X2 e X3 é zero. Conseqüentemente, os termos do produto cartesiano anulam-se nas fórmulas para os coeficientes β (Equações 7.4.7 e 7.4.8), que ficam assim iguais àquelas para os coeficientes α e γ (Equação 3.1.8). (b) Será uma combinação, como demonstramos a seguir: Manual de Soluções • Econometria Básica • Gujarati 1 2 2 3 1 2 2 2 1 3 3 3 ˆ ˆ ˆ ˆˆ ˆ ˆˆ ˆ Y X X Y X Y X Y X Y X β β β α α β γ γ β = − − = − = − = − = − 2 3 Logo, 1 1 1 ˆ ˆ ˆ Yβ α γ= + − . (c) Não, pelas seguintes razões: 2 2 2 2 2 2 23 ˆ ˆˆvar( ) (1 )i i 2 2x r x σ σβ = = −∑ ∑ (Nota: 223 0r = ) 2 1 2 2 2 ˆˆvar( ) ix σα = ∑ (veja a Equação 3.3.1) Repare que 2 2 2 2 1 ˆ ˆ ˆ ˆ 3 2 i iu u n n σ σ= ≠ = − − ∑ ∑ . 10.9 (a) O coeficiente de correlação entre trabalho e capital é relativamente alto e aproximadamente igual a 0,698. (b) Não. Apesar da correlação entre as duas variáveis, os coeficientes da regressão são estatisticamente significativos no nível de 5%. Excluir uma variável nessas condições acarretaria viés de especificação. (c) Se for excluída a variável trabalho, o coeficiente do capital será tendencioso. O viés pode ser calculado como no Exercício 10.6 e vale = (1,4988)(0,1319) = 0,1975. 2 23 ˆ( )( )bβ 10.10 (a) Não, porque a multicolinearidade diz respeito à associação linear entre variáveis, e nesse caso ela é não-linear. (b) Não há razão para excluí-las. São teórica e estatisticamente significativas neste exemplo. (c) Se uma das variáveis for excluída, haverá viés de especificação que aparecerá nos coeficientes das variáveis remanescentes. 10.11 Não. Variáveis devem ser incluídas com fundamento teórico, e não apenas para aumentar a SQE ou o R². Além disso, se as variáveis estiverem correlacionadas, sua inclusão ou exclusão alterará os valores dos outros coeficientes. 10.12 (a) Falsa. Se existir relação linear exata entre variáveis, não poderemos sequer estimar os coeficientes ou seus erros-padrão. (b) Falsa. Deve-se conseguir obter um ou mais valores t significativos. Manual de Soluções • Econometria Básica • Gujarati 2 2 2 2 2 3 23 2 3( )( )i i i iLogo, ( )x x r x x=∑ ∑ ∑ . Substitua essa expressão nos denominadores das Equações (7.4.7) e (7.4.8) e simplifique. 10.21 Quando existe colinearidade perfeita, r23 = 1. Portanto, os denominadores em (7.4.12) e (7.4.15) serão zero, e, conseqüentemente, indefinidas as variâncias. 10.22 Como 2 3 2 3 2 3 ˆ ˆ ˆ ˆ ˆ ˆ( ) [var( ) var( ) 2cov( , )ep β β β β β+ = + + β , e tendo em vista que os valores de covariância são dados, verificar o que se pede é mera questão de substituí- los na equação. 10.23 (a) Ceteris paribus, a variância do coeficiente estimado de kβ diminui à medida que 2kσ cresce, o que permitirá uma estimação mais precisa de ˆkβ . (b) A variância é indefinida quando a colinearidade é perfeita. (c) Verdadeiro. Conforme aumenta R², diminui (1-R²), o que reduzirá a variância do coeficiente estimado. 10.24 (a) Dados o relativamente alto R² de 0,97, o valor F significativo e o (economicamente falando) insignificante e impropriamente sinalizado coeficiente de log K, pode ser que haja colinearidade no modelo. (b) A priori, espera-se que o impacto do capital sobre a produção seja positivo, o que não ocorre nesse caso devido provavelmente à colinearidade nos regressores. (c) É uma função de produção tipo Cobb-Douglas, pois podemos escrever o modelo dado como 3 421 tY K L eβ βββ= . (d) Em média, ao longo do período estudado, um incremento de 1% no índice de uso real de mão-de-obra leva a um aumento de 0,91% do índice de produto real. No modelo, a variável t representa o tempo, que com freqüência é tomado como variável instrumental para mudança tecnológica. O coeficiente de 0,47 indica que ao longo do período estudado, a taxa de crescimento do produto real (como medida pelo índice de produto) foi de 4,7%, em média. (e) Implicitamente, a equação assume que há retornos de escala constantes, ou seja, 2 3( ) 1β β+ = . Uma eventual vantagem da transformação pode ser a redução do problema da colinearidade. (f) Dado que o coeficiente da relação capital/mão-de-obra é estatisticamente insignificante, o problema da colinearidade, ao que tudo indica, não foi resolvido. Manual de Soluções • Econometria Básica • Gujarati (g) Como mencionado em (e), o autor está tentando saber se há retornos de escala constantes. O teste F visto no Capítulo 8 poderia ser utilizado para descobrirmos se a restrição é válida. Mas como as variáveis dependentes são diferentes nos dois modelos, precisamos das somas dos quadrados dos resíduos restritas e irrestritas para usar a versão R² desse teste. (h) De acordo com (g), os valores de R² não são comparáveis. Para torná-los comparáveis, poderíamos adotar os procedimentos vistos no Capítulo 7. 10.25 (a), (b), (c) & (d) Em essência, todas essas opiniões nos dizem que a multicolinearidade é, muito freqüentemente, um problema de deficiência de dados. Problemas 10.26 (a) Os resultados da regressão do modelo modificado são: îY = 20,995 + 0,710Zi ep = (6,341) (0,066) t = (3,311) (10,771) r² = 0,906 3β̂ = (0,75)(0,710) = 0,532. Portanto, 4β̂ = (0,625)(0,710) = 0,444. (b) A variável Z pode ser interpretada como uma média ponderada dos diferentes tipos de renda. 10.27 (a) Os resultados do Eviews 3 para a regressão são os seguintes: Variável dependente: LIMPORTA Método: Mínimos quadrados Data: 11/11/2000 Hora: 10:16 Amostra: 1970 1998 Observações incluídas: 29 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 1,975260 0,782070 2,525683 0,0180 LPIB 1,043167 0,405783 2,570749 0,0162 LIPC 0,446142 0,569840 0,782925 0,4407 R-quadrado 0,982318 Variável dependente média 12,49048 R-quadrado ajustado 0,980958 Desvio-padrão da variável dependente 0,904848 E.P. da regressão 0,124862 Critério info Akaike -1,225512 Soma quad resíduos 0,405356 Critério Schwarz -1,084068 Verossimilhança Log 20,76993 Estatística-F 722,2174 Estat Durbin-Watson 0,461405 Probabilidade (Estatística-F) 0,000000 (b) A julgar pelo alto R² e pelo valor t insignificante do coeficiente de ln IPC, é provável que haja multicolinearidade nos dados. Manual de Soluções • Econometria Básica • Gujarati (c) Seguem os resultados das regressões: Variável dependente: LIMPORTA Método: Mínimos quadrados Data: 11/11/2000 Hora: 10:21 Amostra: 1970 1998 Observações incluídas: 29 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 1,407426 0,290493 4,844960 0,0000 LPIB 1,359628 0,035525 38,27295 0,0000 R-quadrado 0,981901 Variável dependente: LIMPORTA Método: Mínimos quadrados Amostra: 1970 1998 Observações incluídas: 29 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 3,898610 0,250312 15,57499 0,0000 LIPC 1,905351 0,055221 34,50388 0,0000 R-quadrado 0,977824 Variável dependente: LPIB Método: Mínimos quadrados Amostra: 1970 1998 Observações incluídas: 29 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 1,8437 0,1080 17,0680 0,0000 LIPC 1,3988 0,0238 58,6972 0,0000 R-quadrado 0,9922 A regressão auxiliar de LPIB contra LIPC mostra que há alta correlação entre as duas variáveis, indicando a possibilidade de haver problemas de colinearidade com os dados. (d) No caso, a melhor solução seria expressar as importações e o PIB em termos reais dividindo-os pelo IPC, conforme observado no capítulo do livro-texto. Os resultados do Eviews 3 são os seguintes: Variável dependente: LOG(IMPORTA / IPC) Método: Mínimos quadrados Data: 11/11/2000 Hora: 10:26 Manual de Soluções • Econometria Básica • Gujarati 0,298555 0,331067 Nota: Nesta tabela, considere a última linha como a última coluna. Como mostra a tabela, as correlações aos pares, ou simples, variam desde valores muito baixos (-0,0409 entre GM e GMO, por exemplo) a valores comparativamente altos (0,8812 entre Escolaridade e Taxa, por exemplo). (a) Regressando a variável Horas contra todos os regressores, obtemos os seguintes resultados: Variável dependente: HORAS Método: Mínimos quadrados Amostra: 1 35 Observações incluídas: 35 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 1904,578 251,9333 7,559849 0,0000 TAXA -93,75255 47,14500 -1,988600 0,0574 GE 0,000225 0,038255 0,005894 0,9953 GMO -0,214966 0,097939 -2,194896 0,0373 NEIN 0,157208 0,516406 0,304427 0,7632 ATIVOS 0,015572 0,025405 0,612970 0,5452 IDADE -0,348636 3,722331 -0,093661 0,9261 Dependentes 20,72803 16,88047 1,227930 0,2305 Escolaridade 37,32563 22,66520 1,646826 0,1116 R-quadrado 0,825555 Variável dependente média 2137,086 R-quadrado ajustado 0,771879 Desvio-padrão da variável dependente 64,11542 E.P. da regressão 30,62279 Critério info Akaike 9,898400 Soma quad resíduos 24381,63 Critério Schwarz 10,29835 Verossimilhança Log -164,2220 Estatística-F 15,38050 Estat Durbin-Watson 1,779824 Probabilidade (Estatística-F) 0,000000 A interpretação é simples e direta. Então, ceteris paribus, se os salários médios por hora (TAXA) subirem um dólar, em média, o número médio de horas trabalhadas durante o ano (HORAS) cai cerca de 93 horas. (c) Por economia de espaço, calcularemos FIV e TOL somente da taxa do regressor. Regressando TAXA contra todos os outros regressores, obtemos um valor R² de 0,9416. Pela Equação (7.5.6) podemos verificar que o FIV para esse regressor é cerca de 2224, e o inverso desse número é a TOL, que vale 0,00045. (d) Nem todas as variáveis do modelo são necessárias. Uma ou mais podem ser excluídas aplicando os testes de diagnóstico apresentados no livro, ou podemos usar uma combinação linear delas. (e) Embora os resultados sejam variados, talvez haja alguma evidência de que valha a pena experimentar o imposto de renda negativo. Manual de Soluções • Econometria Básica • Gujarati 10.31 Este é para ser feito em aula. 10.32 Os resultados do Eviews para a regressão são os seguintes: Variável dependente: Y Método: Mínimos quadrados Amostra: 1947 1961 Observações incluídas: 15 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C -3017441 939728,1 -3,210973 0,0124 X1 -20,51082 87,09740 -0,235493 0,8197 X2 -0,027334 0,033175 -0,823945 0,4338 X3 -1,952293 0,476701 -4,095429 0,0035 X4 -0,958239 0,216227 -4,431634 0,0022 X5 0,051340 0,233968 0,219430 0,8318 X6 1585,156 482,6832 3,284049 0,0111 R-quadrado 0,9955 R-quadrado ajustado 0,9921 E.P. da regressão 295,6219 Soma quad resíduos 699138,2 Estatística-F 295,7710 Estat Durbin-Watson 2,492491 Comparando esses resultados com os da Seção 10.10, vemos que a exclusão de uma única observação pode alterar as magnitudes e/ou os sinais de alguns dos coeficientes, o que fundamenta o argumento apresentado no texto de que, em casos de alta colinearidade, pequenas mudanças nos dados podem levar a diferenças consideráveis nos resultados. Manual de Soluções • Econometria Básica • Gujarati CAPÍTULO 11 HETEROCEDASTICIDADE: O QUE ACONTECE SE A VARIÂNCIA DO ERRO NÃO É CONSTANTE? 11.1 (a) Falsa. Os estimadores não são tendenciosos, mas ineficientes. (b) Verdadeira. Veja a Seção 11.4. (c) Falsa. Tipicamente, mas nem sempre, a variância será superestimada. Veja a Seção 11.4 e o Exercício 11.9. (d) Falsa. Além da heterocedasticidade, tal padrão pode ser resultado de autocorrelação, erros de especificação de modelo etc. (e) Verdadeira. Como os 2iσ verdadeiros não são diretamente observados, algum pressuposto a respeito da natureza da heterocedasticidade é inevitável. (f) Verdadeira. Veja a resposta (d). (g) Falsa. Heterocedasticidade tem a ver com a variância do termo de erro ui, não com a variância do regressor. 11.2 (a) A Equação (1) mostra que à medida que N aumenta 1 unidade, em média, W aumenta 0,009 dólares. Se multiplicarmos toda a segunda equação por N, veremos que os resultados serão bem parecidos com os da primeira. (b) Aparentemente, o autor estava preocupado com a heterocedasticidade, pois dividiu a equação original por N, o que equivale a pressupor que a variância do erro é proporcional ao quadrado de N. Ele está, portanto, aplicando mínimos quadrados ponderados para estimar a Equação (2). (c) O coeficiente do intercepto da Equação (1) é o coeficiente angular na Equação (2) e vice-versa. (d) Não. As variáveis dependentes não são iguais nos dois modelos. 11.3 (a) Não. Estes modelos não são lineares nos parâmetros e não podem ser estimados por MQO. (b) Para estimar modelos não-lineares há procedimentos específicos que veremos no capítulo sobre modelos de regressão não-lineares. Podemos, informalmente, estimar os parâmetros por tentativa e erro. 11.4 (a) Veja o Exercício 7.14 e a Seção 6.9. Manual de Soluções • Econometria Básica • Gujarati 11.12 (a) e (b) VERTICAL = VMÉDIO HORIZONTAL = DESVIO PADRÃO VMÉDIO (c) Seguem os resultados da regressão: îEP = 0,9910 – 0,0650VMÉDIOi t = (0,3756) (-0,1795) r² = 0,0064. Não há relação sistemática entre as duas variáveis porque o coeficiente angular não é estatisticamente diferente de zero, o que pode ser visto pelo gráfico em (a). (d) Não há necessidade de transformação nenhuma, pois não existe relação sistemática entre a média da razão vendas/dinheiro em caixa e seu desvio-padrão nos vários níveis de ativos. 11.13 Aplicando o teste de Bartlett, 2χ é 6,6473, cujo valor p é 0,5748. Não rejeitamos, portanto, a hipótese nula de que as variâncias são iguais. 11.14 Aplicando a Fórmula (11.3.8) para mínimos quadrados ponderados, podemos demonstrar que * 1 2 1ˆ (2 ) 3 Y Yβ = − e * 2ˆvar( ) 3 2β σ= . Se usarmos MQO, obtemos então da Equação (6.1.6) o seguinte: 1 2 1 22 1ˆ ( 2 2 i i i X Y Y Y Y Y X β −= = = − )∑ ∑ . E aplicando (6.1.7), temos que 2 2 2 1ˆvar( ) 2iX σβ σ= = ∑ . Manual de Soluções • Econometria Básica • Gujarati Comparando as duas estimativas, vemos que a de mínimos quadrados ponderados atribui peso de 2/3 a Y1 e 1/3 a Y2, ao passo que a de MQO atribui igual peso às duas observações Y. A variância do estimador do coeficiente angular é maior em MQP do que em MQO. 11.15 (a) Os resultados da regressão são os seguintes: ˆ iMPG = 189,9597 – 1,2716VMi + 0,3904HPi – 1,9032PVi ep = (22,5287) (0,2331) (0,0762) (0,1855) t = (8,4318) (-5,4551) (5,1207) (-10,2593) R² = 0,8828. Conforme as expectativas, MPG é positivamente relacionada a HP e negativamente a VM e PV. (b) A priori, é de se esperar heterocedasticidade porque são dados em corte transversal abrangendo veículos diversos. (c) Regressando os quadrados dos resíduos do modelo em (a) contra os três regressores, seus quadrados e seus produtos cruzados, obtemos um R² de 0,3094, que multiplicado pelo número de observações (81), dará 25,0646, valor com distribuição qui-quadrado com 9 gl (3 regressores, 3 quadrados de regressores e 3 produtos cruzados) sob a hipótese nula de que não há heterocedasticidade. O valor p de se obter um valor qui-quadrado de 25,0646 ou maior é, sob essa hipótese, 0,0029, que é muito pequeno. Temos, portanto, de rejeitar a hipótese nula, ou seja, há heterocedasticidade. (d) Os resultados baseados nos procedimentos de White são os seguintes: Variável dependente: MPG Método: Mínimos quadrados Amostra: 1 81 Observações incluídas: 81 Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 189,9597 33,90605 5,602531 0,0000 VM -1,271697 0,336039 -3,784375 0,0003 HP 0,390433 0,108781 3,589180 0,0006 PV -1,903273 0,285077 -6,676352 0,0000 R-quadrado 0,882864 Durbin-Watson 1,0237 Comparando esses resultados com os obtidos com MQO, descobriremos que os valores dos coeficientes estimados são iguais, mas suas variâncias e erros-padrão são diferentes. Estes, como vemos, são mais altos nos procedimentos de White porque os |t| são menores, indicando que os erros-padrão estão subestimados nos resultados obtidos com MQO. Tudo isso pode ser atribuível à heterocedasticidade. (e) Não existe uma fórmula simples para determinar a natureza exata da heterocedasticidade neste caso. Podemos, talvez, partir de alguns pressupostos Manual de Soluções • Econometria Básica • Gujarati simples e tentar diferentes transformações. Se, por exemplo, acharmos que a variável “culpada” é HP e que a variância do erro é proporcional a HP², podemos dividir a equação por HP e ver o que acontece. Naturalmente, qualquer outro regressor é um candidato tão bom quanto esse para a transformação. 11.16 Seguem os resultados da regressão: Variável dependente: DESPALIM Variável Coeficiente Erro-padrão Estatística-t Probabilidade C 94,20878 50,85635 1,852449 0,0695 DESPTOT 0,436809 0,078323 5,577047 0,0000 R-quadrado 0,369824 O gráfico dos resíduos dessa regressão é: (b) A representação gráfica dos resíduos (R1) contra a despesa total é: