Baixe Econometria na pratica e outras Notas de estudo em PDF para Economia, somente na Docsity!
Organizadoras • Cláudia Malbouisson • Gisele F. Tiryaki
EconomEtria
na prática
Rio de Janeiro, 2017
iii
Sumário
Sumário
Econometria na Prática
- Capítulo 1: Fundamentos da Análise Empírica ���������������������������������������������������� Prefácio ���������������������������������������������������������������������������������������������������������������������������������������������������vii
- Tipos de Variáveis e Estrutura dos Dados ���������������������������������������������������������������������
- Estatísticas Descritivas �������������������������������������������������������������������������������������������������������������
- Relações entre as Variáveis ����������������������������������������������������������������������������������������������������
- Transformação de Variáveis ��������������������������������������������������������������������������������������������������
- Referências �����������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 2: Modelo de Regressão Linear Clássico ������������������������������������������
- Estimadores de Mínimos Quadrados Ordinários ��������������������������������������������������
- Aplicando o MQO ���������������������������������������������������������������������������������������������������������������������������
- Por que os Estimadores de MQO São Tão Conhecidos? �������������������������������������
- Hipóteses do Modelo de Regressão Linear ������������������������������������������������������������������
- O que Pode Causar a Violação das Hipóteses? ����������������������������������������������������������
- de Especificação e Endogeneidade ��������������������������������������������������������������������������������� Problemas com os Regressores: Testes
- Teste F ������������������������������������������������������������������������������������������������������������������������������������������������
- Teste RESET ����������������������������������������������������������������������������������������������������������������������������������
- Testes para Problemas com os Regressores: Multicolinearidade �������������� - Diagnóstico de Multicolinearidade: Matriz de Correlação����������������������������������� - Teste Fator de Inflação da Variância���������������������������������������������������������������������������������
- Problemas com o Erro: Heterocedasticidade ������������������������������������������������������������ - Teste Breusch-Pagan ������������������������������������������������������������������������������������������������������������������ - Teste de White �������������������������������������������������������������������������������������������������������������������������������
- Estatísticas de Influência ��������������������������������������������������������������������������������������������������������
- Referências �����������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 3: Multicolinearidade e Construção de Índices ������������������������� iv
- Análise de Componentes Principais ���������������������������������������������������������������������������������
- Análise de Fatores ����������������������������������������������������������������������������������������������������������������������
- com Variáveis Categóricas �������������������������������������������������������������������������������������������������� Apêndice 3.A. Análise de Componentes Principais
- Referências ���������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 4: Análise de Séries Temporais ����������������������������������������������������������������
- Análise Univariada ���������������������������������������������������������������������������������������������������������������������� - Integração e Raiz Unitária �������������������������������������������������������������������������������������������������� Processo Autorregressivo, Passeio Aleatório, Estacionariedade, - Diferença Estacionária versus Tendência Estacionária����������������������������������������� - Testes de Raiz Unitária: Testes de Dickey-Fuller (DF) ���������������������������������������� - Mais de uma Defasagem�������������������������������������������������������������������������������������������������������� - Critérios de Informação �������������������������������������������������������������������������������������������������������� - Outros Testes de Raiz Unitária ����������������������������������������������������������������������������������������� - Um Arcabouço para os Testes �������������������������������������������������������������������������������������������� - Um Exemplo ����������������������������������������������������������������������������������������������������������������������������������
- Análise multivariada — VAR ����������������������������������������������������������������������������������������������� - Identificação ��������������������������������������������������������������������������������������������������������������������������������� - Estabilidade ����������������������������������������������������������������������������������������������������������������������������������� - Função de Resposta a Impulso ������������������������������������������������������������������������������������������ - Decomposição da Variância do Erro de Previsão���������������������������������������������������� - Mais Variáveis ����������������������������������������������������������������������������������������������������������������������������� - Mais Defasagens ������������������������������������������������������������������������������������������������������������������������ - Causalidade de Granger ��������������������������������������������������������������������������������������������������������
- Análise multivariada — VECM ������������������������������������������������������������������������������������������ - Mais de um Vetor Cointegrante ����������������������������������������������������������������������������������������� - Defasagens ������������������������������������������������������������������������������������������������������������������������������������ - Testes de Cointegração de Johansen ������������������������������������������������������������������������������ - Termos Determinísticos �������������������������������������������������������������������������������������������������������� - Regressão Espúria ��������������������������������������������������������������������������������������������������������������������� - Outro Teste de Cointegração ��������������������������������������������������������������������������������������������� - Mais Restrições ��������������������������������������������������������������������������������������������������������������������������
- Outras decomposições ������������������������������������������������������������������������������������������������������������
- Um Arcabouço para a Análise Multivariada ������������������������������������������������������������
- Um Exemplo �������������������������������������������������������������������������������������������������������������������������������������
- Um Balanço �������������������������������������������������������������������������������������������������������������������������������������
- Referências ��������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 5: Variáveis Dependentes Discretas e Limitadas ������������������ v
- Modelo de Probabilidade Linear ��������������������������������������������������������������������������������������
- Modelos de Resposta Binária ��������������������������������������������������������������������������������������������� - Modelo Logit �������������������������������������������������������������������������������������������������������������������������������� - Modelo Probit ������������������������������������������������������������������������������������������������������������������������������
- Modelo de Regressão de Poisson ��������������������������������������������������������������������������������������
- O Processo de Poisson ��������������������������������������������������������������������������������������������������������������
- Modelo de Variável Latente �������������������������������������������������������������������������������������������������
- Modelo Tobit ����������������������������������������������������������������������������������������������������������������������������������
- Modelos de Escolha Discreta Ordenadas �������������������������������������������������������������������
- modelos logit condicional e multinomial ������������������������������������������������������������������
- Verossimilhança (Mv) ������������������������������������������������������������������������������������������������������������ Apêndice 5.A. Método de Estimação por Máxima
- Referências ��������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 6: Causalidade e Estratégias de Identificação �������������������������
- Aleatorização ��������������������������������������������������������������������������������������������������������������������������������� - O Problema da Avaliação ������������������������������������������������������������������������������������������������������ - Experimento Aleatorizado ��������������������������������������������������������������������������������������������������� - Métodos de Aleatorização ����������������������������������������������������������������������������������������������� - Possíveis Problemas com o Experimento Aleatorizado ����������������������������������
- Pareamento por Escore de Propensão ������������������������������������������������������������������������� - Uma Aplicação do Método PSM����������������������������������������������������������������������������������������
- Método de Diferença em Diferenças ����������������������������������������������������������������������������� - Uma Aplicação do Método DD �������������������������������������������������������������������������������������������
- Estimador de Variáveis Instrumentais ������������������������������������������������������������������������ - Método dos Mínimos Quadrados em Dois Estágios ��������������������������������������������� - Método Generalizado dos Momentos ���������������������������������������������������������������������������
- Referências ��������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 7: Análise de Dados em Painel ������������������������������������������������������������������
- Modelos de Efeitos Fixos e de Efeitos Aleatórios ������������������������������������������������� - Modelo de Efeitos Fixos ��������������������������������������������������������������������������������������������������������� - Modelo de Efeitos Aleatórios ���������������������������������������������������������������������������������������������� - Erros de Especificação ����������������������������������������������������������������������������������������������������������� - Poolability ��������������������������������������������������������������������������������������������������������������������������������� - Autocorrelação dos Resíduos ����������������������������������������������������������������������������������������� - Dependência em Cross-section ��������������������������������������������������������������������������������������� - Endogeneidade �����������������������������������������������������������������������������������������������������������������������
- Modelos Dinâmicos de Dados em Painel �������������������������������������������������������������������� vi - Estimador de Anderson e Hsiao (1982) ������������������������������������������������������������������������� - Estimador de Arellano e Bond (1991) ����������������������������������������������������������������������������� - Estimadores de Arellano e Bover (1995) e Blundell e Bond (1998) ����������������
- Apêndice 7.A. Dados em Painel Desbalanceados ��������������������������������������������������
- Apêndice 7.B. Séries Temporais em Cross-Section (Tscs) �������������������������������
- Referências ��������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 8: Análise de Fronteira Estocástica de Produção �����������������
- Aspectos Teóricos �����������������������������������������������������������������������������������������������������������������������
- Modelo Empírico para Análise da Produção ����������������������������������������������������������� - Fonte dos Dados ������������������������������������������������������������������������������������������������������������������������� - Estimativa da Função Fronteira de Produção ���������������������������������������������������������� - Procedimentos de Estimativa por Meio do Programa Stata®^13 ����������������� - Procedimentos de Estimativa por Meio do Programa Frontier 4.1 ���������
- Apêndice 8.A. Dados Atualizados da Tese da Conceição (2004) ���������������
- Apêndice 8.B. Índice de Eficiência Técnica dos Produtores Rurais �������� - de produção pelo programa Frontier 4.1. ���������������������������������������������������������������� Apêndice 8.C. Saída dos resultados da análise de fronteira
- Referências ���������������������������������������������������������������������������������������������������������������������������������������
- Capítulo 9: Análise Envoltória dos Dados ��������������������������������������������������������������
- Aspectos Teóricos e Exemplificação �����������������������������������������������������������������������������
- Análise Empírica Utilizando o Programa EMS �����������������������������������������������������
- Análise Empírica Utilizando o Programa Stata ®^13 �������������������������������������������
- Apêndice 9.A. Dados Atualizados da Tese de Conceição (2004) ���������������
- de Dados pelo Programa Stata ®^13 ������������������������������������������������������������������������������� Apêndice 9.B. Saída dos Resultados da Análise Envoltória
- Referências ��������������������������������������������������������������������������������������������������������������������������������������
- Apêndice A — Tabelas Estatísticas �������������������������������������������������������������������������
- Biografia dos Autores �����������������������������������������������������������������������������������������������������������
- Índice ������������������������������������������������������������������������������������������������������������������������������������������������������
Econometria na Prática
viii
Os demais capítulos do livro dedicam-se a expor os métodos econo- métricos mais comumente utilizados na pesquisa empírica. O Capítulo 2 apresenta o modelo de mínimos quadrados ordinários, que é a meto- dologia básica e utilizada de referência para a apresentação dos modelos seguintes. A popularidade deste método deve-se, em grande parte, à sua fácil aplicação, compreensão e ao baixo custo computacional. Contudo, em virtude da natureza e da disponibilidade dos dados, muitas vezes os estimadores de mínimos quadrados ordinários podem não ter as proprie- dades desejadas. Neste capítulo, são apresentados testes e possíveis cor- reções para problemas que levam a estimadores enviesados e ineficientes. O Capítulo 3 dedica-se à análise da multicolinearidade e da construção de índices. Um dos problemas associados ao modelo simples de mínimos quadrados ordinários refere-se a situações em que o pesquisador dispõe de um número elevado de variáveis independentes que são correlacio- nadas. Nesses casos, pode ser interessante que o pesquisador construa índices que representem conjuntamente essas variáveis. Neste capítulo, duas dessas metodologias serão apresentadas: a análise de componentes principais e a análise de fatores. No Capítulo 4, o pesquisador conhecerá as estratégias utilizadas para minimizar uma outra dificuldade com o modelo de mínimos quadrados ordinários: a presença de autocorrelação de resíduos. Este problema é comum em séries temporais, ou seja, quando se utiliza de dados de va- riáveis de uma mesma unidade individual ( e.g. indivíduo, empresa, mu- nicípio, estado ou país) ao longo do tempo. A análise de séries temporais tem por principal objetivo identificar e descrever formalmente padrões observados nos dados, integrando variáveis para investigar fenômenos e fazer previsões. Os modelos discutidos no Capítulo 4 são comumente utilizados em finanças, marketing, economia, demografia, dentre outras áreas de pesquisa. Dada a complexidade do tema, este capítulo apresenta uma discussão mais densa em relação aos demais capítulos do livro, em- bora o uso de exemplos discutidos detalhadamente facilite a compreen- são do leitor. O Capítulo 5 apresenta algumas metodologias a serem adotadas em um caso especial de análise econométrica: quando a variável dependen- te é representada por números discretos e restritos a um determinado conjunto de valores. Este problema geralmente surge na análise de esco- lhas individuais, tais como as preferências de consumidores entre marcas
Prefácio
ix
alternativas de produtos, decisões eleitorais, escolhas comportamentais em sociedade e preferências sobre políticas governamentais alternativas. Os modelos de escolha discreta permitem modelar probabilidades e ela- borar diagnósticos sobre a ocorrência de eventos a partir da utilização de determinadas distribuições de probabilidade.
O Capítulo 6 apresenta um dos temas mais relevantes em econome- tria: causalidade e estratégias de identificação. A preocupação das me- todologias apresentadas neste capítulo é com a definição de modelos e variáveis que permitam a correta especificação da relação de causalidade que o pesquisador deseja estabelecer ou confirmar. A dificuldade decorre da existência de efeitos não observáveis, que implicam na necessidade de controle da seleção amostral (grupo de tratamento), para garantir que os resultados obtidos possam ser generalizados para a população. Os méto- dos discutidos neste capítulo se propõem, na ausência de aleatoriedade dos dados amostrais, a identificar fontes de variação observáveis, utili- zando estratégias que se aproximam de “experimentos naturais”.
No Capítulo 7, o foco é o estudo de modelos com dados em painel, ou seja, quando se observam os valores de diferentes unidades individuais ao longo do tempo. Neste capítulo, é apresentada uma série de modelos al- ternativos para se lidar com tal estrutura de dados, trabalhando questões associadas à relação de causalidade e à dimensão temporal dos dados.
Já os dois últimos capítulos dedicam-se ao estudo de metodologias utilizadas para análise de eficiência e de fronteira. Recentemente, vários agentes econômicos têm se preocupado com a forma como os recursos são alocados e esta obra não poderia se omitir em apresentar conteúdos introdutórios para análise da eficiência. Essas ferramentas têm aplica- bilidade em vários campos da economia e de outras ciências sociais, e são utilizadas quando existe uma diferença entre o produto potencial e o real. O Capítulo 8 utiliza a análise econométrica na estimativa da eficiência produtiva, popularmente conhecida como análise de fronteira estocástica, enquanto, no Capítulo 9, a técnica utilizada para a análise da eficiência é a da programação matemática, cuja abordagem é feita pela análise envoltória dos dados.
Ao longo do texto, serão apresentados casos práticos de aplicação das metodologias. Não foi utilizado um único software econométrico, até porque os softwares mais completos nem sempre são os mais simples de utilizar. Procurou-se adotar o software que é mais apropriado ou de mais
1
Fundamentos da
Análise Empírica
Gisele Ferreira Tiryaki
Projetos empíricos em ciências sociais e em outros ramos da ciência têm por objetivo, em última instância, identificar como mudanças em uma variável impactam outra variável. Por exemplo, o pesquisador pode estar interessado em avaliar o efeito causal do gênero do indivíduo sobre o nível salarial, das inovações tecnológicas sobre o crescimento econô- mico, do background familiar dos indivíduos e seu desempenho escolar, do salário sobre a produtividade do trabalhador. É muito comum, ainda, pesquisadores dedicarem-se a analisar os impactos gerados por iniciati- vas em políticas públicas e por mudanças na legislação.
Busca-se, portanto, estudar uma relação causal de interesse. Para An- grist e Pischke (2008), a identificação da relação causal possibilita fazer previsões sobre as consequências de modificações no status quo ou em políticas públicas, permitindo verificar qual seria o cenário caso tal mu- dança não tivesse acontecido (cenário contrafactual). Os métodos econo- métricos, por sua vez, permitem a avaliação da relação causal entre duas variáveis, levando em consideração outras informações que são impor- tantes para o estudo em questão.
Existem situações, contudo, em que os dados disponíveis não permi- tem estabelecer o cenário contrafactual. Nesses casos, resta ao pesquisa- dor estar atento para identificar essas situações e ser criativo em propor soluções. Uma ilustração apresentada por Angrist e Pischke (2008) mos- tra, de maneira interessante, essa dificuldade. O que aconteceria se um pesquisador procurasse inferir os benefícios para o aprendizado infantil de iniciar a vida escolar mais tardiamente, aos sete anos? Em outras pala-
2 Gisele Ferreira Tiryaki
Econometria na Prática
vras, o que aconteceria se o pesquisador quisesse testar a hipótese de que a maturidade ajuda no processo de aprendizado? Poderia, por exemplo, comparar o desempenho em termos de notas dos alunos na segunda série do ensino fundamental, criando uma variável que permitisse identificar os alunos que foram matriculados na escola aos sete anos (na primeira série), isolando-os dos alunos que entraram na escola mais novos. O problema surge porque aqueles alunos que começaram mais cedo na escola têm mais experiência, e seria difícil para o pesquisador, se não impossível, isolar o efeito da idade sobre o aprendizado do efeito expe- riência proporcionado pela entrada antecipada na escola. Qual seria a so- lução? Como o efeito experiência tende a ser minimizado à medida que as pessoas tornam-se adultas, é possível verificar se adultos que começaram na escola mais cedo apresentam diferencial de desempenho, em termos de média de nota ao longo da vida escolar ou do nível salarial. Outra dificuldade enfrentada pelos pesquisadores diz respeito ao viés de seleção. Esse viés ocorre quando a população não é corretamente repre- sentada pela amostra que está sendo utilizada na análise. Os dois principais métodos de seleção amostral são: (i) não probabilístico, quando cada membro da população não tem chances iguais de ser selecionado e, portanto, o pesquisador não está interessado nos parâmetros da população ( e.g ., estudos de caso, pesquisas qualitativas, desenvolvimento de hipó- teses); ou (ii) probabilístico, quando cada indivíduo da população tem chances iguais de ser selecionado^1. A amostragem probabilística garante que o processo de seleção seja aleatório, sem viés. Em circunstâncias ideais, portanto, o pesquisador procura trabalhar com amostras aleatórias ou randômicas. No entanto, viés de seleção é comum acontecer, e o pesquisador=domizados) para aproximar os dados reais (randomizados). Assuma, por exemplo, que o pesquisador gostaria de verificar se cur- sar pós-graduação é um fator determinante para o salário do indivíduo. Normalmente, as pessoas que participam de cursos de pós-graduação são aquelas com diferencial de desempenho, já que foram aprovadas em pro-
(^1) Ver Kothari (2004) para detalhes quanto às estratégias de amostragem.
Amostragem populacional é o processo de selecionar um conjunto de sujeitos que é representativo da população� A amostragem é necessária sempre que for impossível trabalhar com todos os parti- cipantes de uma população�
4 Gisele Ferreira Tiryaki
Econometria na Prática
1.3. ]^ [
E w (^) i / Di = 1 − E wi / Di = 0
onde o primeiro termo representa o salário médio dos indivíduos que cursaram pós-graduação e o segundo termo representa o salário médio daqueles que não fizeram essa opção. A diferença entre a medida observada e a medida ideal é o viés de se- leção:
1.4. E^ w^ i^ /^ Di^ =^1 ]^ −^ E w [^ i^ /^ Di^ =^0 ]^ − E w^ [^ 1,^^ i^ −^ w 0,^^ i^ /^ Di^ =^1 ]^ =^ E w [^ 1,^^ i^ /^ Di^ =^1 ]^ − E w^ [ 1,^ i^ /^ Di =^0
O viés de seleção captura o fato de que pessoas que buscam pós-gra- duação têm, em média, desempenho acadêmico diferenciado e potencial para salários maiores, mesmo se não optassem pela pós-graduação. É fundamental que os trabalhos empíricos busquem eliminar o viés de seleção, pois experimentos com vieses geram resultados e conclusões equivocadas. Angrist e Pischke (2008), no entan- to, mostram que a escolha aleatória dos indivíduos para compor a amostra elimina este viés. A con- dição de amostragem aleatória requer a defini- ção da população de interesse, do modelo para a população e a seleção de uma amostra composta por observações independentes e identicamente distribuídas. A identificação da relação causal e a definição da estratégia de identi- ficação constituem, portanto, elementos fundamentais na condução de trabalhos empíricos. Dessa forma, o processo de desenvolvimento de uma pesquisa empírica é estruturado com o propósito de definir claramente tais elementos, identificar o método apropriado de inferência estatística e analisar os resultados obtidos. Esse processo requer a condução de uma série de procedimentos relacionados, que muitas vezes se sobrepõem e que não precisam ser sequenciados. A Figura 1.1 sistematiza as etapas envolvidas no desenvolvimento de uma pesquisa empírica.
Variáveis aleatórias X 1 , X 2 , ��� e XK são independentes e iden- ticamente distribuídas (i�i�d�) quando todas as variáveis Xi possuem a mesma distribui- ção de probabilidade e são mutuamente independentes�