Variável Instrumental: aplicações

IBM0288 - 2026.1

Prof. Raphael Gouvea

Escolas charter e o debate sobre educação

Ref: Seção 3.1 de Angrist, D. J., Pischke, J. Mastering metrics: the path from cause to effect.

KIPP: escolas charter e o debate sobre educação

  • KIPP (Knowledge Is Power Program): rede de escolas públicas charter nos EUA

    • 95% dos alunos são negros ou hispânicos; 80% vivem em situação de pobreza
  • Escolas charter são públicas, com maior autonomia curricular e de gestão; muitas seguem o modelo No Excuses (mais tempo de aula, disciplina, foco em leitura/matemática).

  • Questão empírica: frequentar uma escola charter melhora o desempenho?

    • Defensores: charter eleva significativamente o desempenho de minorias
    • Céticos: charter atrai famílias mais motivadas, i.e., o sucesso seria viés de seleção
  • Desafio de identificação: auto-seleção de famílias/alunos → comparação simples entre charter e escolas tradicionais é viesada.

Loterias de admissão: desenho quase-experimental

  • Em Massachusetts, quando há excesso de demanda, por lei as vagas charter são sorteadas.

    • cerca de 200 candidatos para 90 vagas anuais
  • A loteria cria variação aleatória no acesso à charter: exatamente o que precisamos!

    • nem todos os ganhadores se matriculam e alguns perdedores entram por outras vias (irmãos)
    • ganhadores tem maior probabilidade de matrícula do que perdedores.
  • O sorteio é um instrumento para matrícula em charter!

  • Objetivo: estimar o efeito causal de estudar em uma charter sobre aprendizado.

Estudo aplicado: KIPP Lynn

  • Angrist e coautores coletaram dados entre 2005 e 2008 para a escola KIIP em Lynn/MA.

Balanceamento de covariáveis: ganhadores ≈ perdedores

Colunas (1), (2) e (4) reportam as médias. A coluna (3) apresenta as diferenças entre os sorteados e os não sorteados. Esses são coeficientes de regressões que controlam para grupos de risco, ou seja, variáveis dummy para ano e série de inscrição e a presença de um irmão candidato. A coluna (5) apresenta as diferenças entre os alunos da KIPP e os candidatos que não frequentaram a KIPP. Os erros-padrão são reportados entre parênteses.

Validade do instrumento

Condições para validade instrumento:

  • Primeiro estágio: \(Z_i\) tem efeito causal sobre \(D_i\)

  • Independência: \(Z_i\) é como se aleatório — não correlacionado com variáveis omitidas

  • Restrição de exclusão: \(Z_i\) afeta \(Y_i\) somente através de \(D_i\)

Observação: Os dois últimos pontos são equivalentes à condição de exogeneidade da aula anterior.

Condição No estudo KIPP Verificável?
Primeiro estágio Oferta aumenta frequência em 74 p.p. ✓ Sim
Independência Loteria aleatória → balanceamento ✓ Sim
Restrição de exclusão Oferta só melhora notas via frequência ✗ Não

Resultados: diferença de médias

Colunas (1), (2) e (4) reportam as médias. A coluna (3) apresenta as diferenças entre os sorteados e os não sorteados. Esses são coeficientes de regressões que controlam para grupos de risco, ou seja, variáveis dummy para ano e série de inscrição e a presença de um irmão candidato. A coluna (5) apresenta as diferenças entre os alunos da KIPP e os candidatos que não frequentaram a KIPP. Os erros-padrão são reportados entre parênteses.

Resultados: VI

O efeito local médio do tratamento (LATE) é definido como:

\[\lambda = \frac{\rho}{\phi} = \frac{E[Y_i \mid Z_i=1] - E[Y_i \mid Z_i=0]}{E[D_i \mid Z_i=1] - E[D_i \mid Z_i=0]}\]

  • Numerador (\(\rho\)): efeito da oferta sobre os resultados (forma reduzida)

  • Denominador (\(\phi\)): efeito da oferta sobre o tratamento (primeiro estágio)

Usando dados da tabela anterior:

\[\lambda = \frac{\rho}{\phi} = \frac{0{,}355}{0{,}741} \approx \mathbf{0{,}48\sigma}\]

Um ganho de quase meio desvio-padrão em matemática em um ano letivo!

A quem se aplica o LATE?

  • Never-takers: escolha da escola não é influenciada pela loteria, pois eles não vão para charter de forma alguma
  • Always-takers: mesmo que percam a loteria, encontram uma forma de matricular na charter
  • Compliers: seguem o resultado da loteria - se matriculam se são sorteados e não se matriculam se não são sorteados
  • Defiers: se matriculam se não são sorteados, não se matriculam se são sorteados

LATE = efeito para os compliers

O instrumento não tem poder de mudar o tratamento de never-takers nem always-takers. O LATE captura o efeito causal apenas para os compliers — aqueles cuja decisão de frequentar a KIPP é determinada pela loteria.

LATE vs TOT

LATE = \(E[Y_{1i} - Y_{0i} \mid C_i = 1]\): efeito para os compliers

TOT (Treatment Effect on Treated) = \(E[Y_{1i} - Y_{0i} \mid D_i = 1]\): efeito para todos os tratados (compliers + always-takers)

LATE \(\neq\) TOT

O efeito tratamento médio local e o efeito tratamento sobre os tratados são diferentes, em geral, pois os tratados incluem always-takers, que podem ter efeitos diferentes dos compliers sem hipóteses adicionais.

Validade externa

O LATE estimado para a KIPP Lynn pode não se generalizar para:

  • Outras escolas charter com perfil diferente
  • Regiões com menor concentração de pobreza
  • Expansão da rede para um público diferente

Dica

A relevância de um LATE depende de quem são os compliers e se eles representam bem a população de interesse para políticas públicas.

Fertilidade e investimento em educação

Ref: Seção 3.3 de Angrist, D. J., Pischke, J. Mastering metrics: the path from cause to effect.

Tamanho da família e educação dos filhos

  • Questão: ter mais irmãos prejudica a educação dos filhos? (tradeoff quantidade-qualidade)

  • Teoria de Becker: pais com menos filhos investem mais em cada um (saúde, educação)

  • Correlação MQO: cada filho adicional reduz ~0,25 anos de escolaridade do primogênito

Problema de identificação

  • Famílias maiores diferem das menores em muitas características não observáveis

  • Mães com mais filhos tendem a ter menos escolaridade

  • Filhos de mães menos escolarizadas tendem a ter menos escolaridade

  • Viés de seleção: a correlação negativa pode não refletir causalidade

Experimento ideal: sortear aleatoriamente bebês extras para famílias com um filho já existente.

Experimento natural e VI: gêmeos

Gêmeos no 2º nascimento: \(Z_i = 1\) se segunda gestação for de gêmeos

  • Gêmeos representam um choque exógeno no tamanho da família

    • Ninguém planeja ter gêmeos
    • Correlacionado com algumas características da mãe (idade e etnia)
  • Aumenta o número médio de filhos em ~0,32

    • Não 1, pois ~70% das famílias planejavam ter 3+ filhos de qualquer forma
  • Primeiro estágio sem controles: 0,320; com controles: 0,437

Experimento natural e VI: composição de sexo

Composição de sexo dos dois primeiros filhos: \(W_i = 1\) se os dois primeiros filhos são do mesmo sexo

  • Pais preferem ter pelo menos um casal

    • famílias cujos dois primeiros filhos são do mesmo sexo têm maior probabilidade de ter 3º filho
  • O sexo do recém-nascido é essencialmente aleatório!

  • Primeiro estágio sem controles: 0,079; com controles: 0,073

Atenção: No livro do Stock e Watson (aulas passadas) \(W\) é usado para representar as variáveis de controle. Neste exemplo do livro de Angrist e Pischke \(W\) é usado para diferenciar os dois instrumentos.

Resultados forma reduzida

Instrumento gêmeos:

  • Primogênitos criados em famílias com gêmeos não têm menor escolaridade do que aqueles em famílias com apenas um irmão.

  • Forma reduzida ≈ 0

Instrumento filhos mesmo sexo:

  • Escolaridade média dos primogênitos é praticamente igual entre famílias com filhos de mesmo sexo e de sexos diferentes (ambas ≈ 12,6 anos).

  • Forma reduzida ≈ 0

LATE = 0

Se a forma reduzida é zero, o LATE também é zero: \(\lambda = \rho/\phi \approx 0/\phi = 0\).

Conclusão: Nenhuma evidência de tradeoff quantidade-qualidade!

MQ2E: um instrumento

O Mínimos Quadrado em Dois Estágios (MQ2E) generaliza o método de VI em duas dimensões:

  1. Combina múltiplos instrumentos eficientemente

  2. Incorpora covariáveis de controle

Com um instrumento (\(Z_i\)) e controle (\(A_i\) = idade da mãe):

Forma reduzida: \(Y_i = \alpha_0 + \rho Z_i + \gamma_0 A_i + e_{0i}\)

Primeiro estágio: \(D_i = \alpha_1 + \phi Z_i + \gamma_1 A_i + e_{1i}\)

Valores preditos: \(\hat{D}_i = \alpha_1 + \hat{\phi} Z_i + \hat{\gamma}_1 A_i\)

Segundo estágio: \(Y_i = \alpha_2 + \lambda_{MQ2E} \hat{D}_i + \gamma_2 A_i + e_{2i}\)

Resultado: \(\lambda_{MQ2E} = \hat{\rho}/\hat{\phi}\): o mesmo LATE, agora com controles!

MQ2E: dois instrumentos

Com dois instrumentos (\(Z_i\) gêmeos, \(W_i\) filhos do mesmo sexo) e controles (\(A_i\) idade da mãe, \(B_i\) primogênito masculino):

Primeiro estágio:

\[D_i = \alpha_1 + \phi_t Z_i + \phi_s W_i + \gamma_1 A_i + \delta_1 B_i + e_{1i}\]

Segundo estágio:

\[Y_i = \alpha_2 + \lambda_{MQ2E} \hat{D}_i + \gamma_2 A_i + \delta_2 B_i + e_{2i}\]

  • O MQ2E com dois instrumentos produz uma média ponderada dos LATEs gerados por cada instrumento individualmente.

  • Combinar instrumentos aumenta a precisão (reduz o erro-padrão)

    • Se ambos instrumentos forem fortes!

Resultados do primeiro estágio

O primeiro estágio dos gêmeos aumenta com controles: gêmeos são mais comuns em mães mais velhas, que teriam menos filhos

  • não inclusão poderia gerar viés de variável omitida e gerar correlação do instrumento com o erro

O primeiro estágio do filhos do mesmo sexo é estável com ou sem controles: sexo do bebê é verdadeiramente aleatório

Resultados MQ2E

MQO: forte correlação negativa (−0,145) — viés de seleção

2SLS: estimativas próximas de zero, não significativas — nenhuma evidência de tradeoff quantidade-qualidade

O −0,145 do MQO está fora do intervalo de confiança do 2SLS → seleção explica a correlação

China Shock e Instrumento Bartik

Refs:

  • Autor, D., Dorn, D. e Hanson, G. (2013). “The China Syndrome: Local Labor Market Effects of Import Competition in the United States.” American Economic Review, 103(6): 2121–2168.

  • Goldsmith-Pinkham, P., Sorkin, I. e Swift, H. (2020). “Bartik Instruments: What, When, Why, and How.” American Economic Review, 110(8): 2586–2624.

Ascenção comercail chinesa

A pergunta de pesquisa

O que aconteceu?

  • Entre 1991 e 2007, as importações dos EUA da China cresceram 12,5 vezes — de US$ 26 bi para US$ 330 bi

  • No mesmo período, o emprego manufatureiro caiu de 12,6% para 8,4% da população adulta

A pergunta causal: As importações chinesas causaram a queda no emprego manufatureiro americano?

Não é óbvio! Outras explicações para o declínio do emprego manufatureiro:

  • Automação e progresso tecnológico

  • Mudança na composição da demanda americana

  • Outros parceiros comerciais (México, Índia)

Estratégia de identificação

Ideia central: em vez de olhar para os EUA como um todo, analisar como cada região foi afetada de forma diferente.

Unidade de análise: Commuting Zones (equivalente à microrregião no BR).

  • 722 áreas que cobrem todo o território americano

  • Agrupam municípios com forte integração no mercado de trabalho local

  • Variam muito em sua estrutura industrial

A intuição: Regiões especializadas em indústrias que competem com a China devem ser mais afetadas pelo choque chinês.

  • Isso gera variação entre regiões que podemos explorar para identificar o efeito causal.

Exposição às importações

Para cada commuting zone \(i\) e período \(t\), podemos definir:

\[\Delta IPW_{uit} = \sum_j \frac{L_{ijt}}{L_{ujt}} \cdot \frac{\Delta M_{ucjt}}{L_{it}}\]

onde:

  • \(\frac{L_{ijt}}{L_{ujt}}\): participação da ZC \(i\) no emprego nacional do setor \(j\)

  • \(\Delta M_{ucjt}\): crescimento das importações americanas da China no setor \(j\)

  • \(L_{it}\): emprego total na ZC \(i\)

  • \(M_{uc}\): signifca importações dos US vindas da China

  • \(\Delta IPW_{uit}\): variação na exposição às importações é uma média ponderada dos choques de importações setoriais, onde os pesos são dados pela composição setorial do emprego.

Especificação Principal

\[\Delta L^m_{it} = \gamma_t + \beta_1 \,\Delta IPW_{uit} + \mathbf{X}'_{it}\beta_2 + e_{it}\]

  • \(\Delta L^m_{it}\): mudança decenal no emprego manufatureiro como proporção da pop. adulta

  • \(\beta_1\): efeito causal de interesse: como a exposição às importações afeta o emprego

O problema de simultaneidade: importações americanas da China (\(\Delta M_{ucjt}\)) refletem:

  1. Choque de oferta da China (competição chinesa) ou;

  2. Choque de demanda dos EUA (americanos querem mais produtos chineses)

Solução MQ2E, mas necessário um instrumento \(Z_{it}\) que atenda:

  1. Relevância: \(Z_{it}\) prediz \(\Delta IPW_{uit}\) (primeiro estágio forte)

  2. Exclusão: \(Z_{it}\) afeta \(\Delta L^m_{it}\) somente através de \(\Delta IPW_{uit}\)

Instrumento Bartik (ou shift-share)

O instrumento de Bartik combina dois ingredientes:

Pesos (shares): Composição industrial local no período inicial

  • Quanto cada região depende de cada setor

  • Predeterminado: reflete história local, não decisões recentes

  • Varia entre regiões

Choques (shifts):

Variação nacional (ou global) por setor

  • Dinâmica independe da decisão de cada região específica

  • Chega a cada região com intensidade diferente, dependendo da especialização local

\[\text{Instrumento}_i = \sum_j \underbrace{\text{peso}_{ij}}_{\text{local, predeterminada}} \times \underbrace{\text{choque}_j}_{\text{global/nacional, exógeno}}\]

Construção do instrumento Bartik

O exemplo usa pesos baseados na estrutura setorial do emprego, pois é o caso mais comum na litaratura e como o instrumento foi desenvolvido. Porém, qualquer estrutura de média ponderada poderia pode ser utilizada para construir um instrumento Bartik.

O instrumento do choque chinês

\[\Delta IPW_{oit} = \sum_j \frac{L_{ij,t-1}}{L_{uj,t-1}} \cdot \frac{\Delta M_{ocjt}}{L_{i,t-1}}\]

Dois ajustes em relação à medida de exposição:

  1. Pesos defasados: evita que o emprego contemporâneo, afetado pelo nível de M atual, influencie o instrumento

  2. Importações de outros países (\(M_{ocjt}\)): isola o componente de oferta chinesa

    • outros países = 8 países ricos (Austrália, Dinamarca, Finlândia, Alemanha, Japão, Nova Zelândia, Espanha e Suíça)

Intuição:

Se a China está expandindo sua capacidade produtiva (choque de oferta), ela exporta mais para todos os países ricos e não apenas para os EUA!

Resultados: primeiro estágio

Resultados: forma reduzida

Resultados: MQ2E

Resultados: MQ2E

Interpretando o coeficiente

O coeficiente preferido dos autores é \(\hat{\beta}_1 \approx -0{,}60\).

  • O que significa: um aumento de US$ 1.000 por trabalhador na exposição às importações chinesas por década reduz o emprego manufatureiro em 0,60 pontos percentuais

  • Exposição cresceu: ~US$ 1.140/trabalhador nos anos 1990 e ~US$ 1.839/trabalhador nos anos 2000

  • Impacto estimado:

    • −0,68 p.p. no emprego manufatureiro / pop. adulta na década de 1990
    • −1,10 p.p. no emprego manufatureiro / pop. adulta na década de 2000
  • Para contexto: o emprego manufatureiro/pop. caiu 2,07 p.p. nos anos 1990 e 2,00 p.p. nos anos 2000

  • A competição chinesa explica ~33% da queda nos anos 1990, ~55% nos anos 2000, e ~44% da queda total.

Outros efeitos documentados

Além do emprego manufatureiro, as regiões mais expostas às importações chinesas também experimentaram:

  • ↑ Desemprego e ↓ participação na força de trabalho
  • ↓ Salários semanais nas ZCs afetadas
  • ↑ Transferências governamentais: auxílio-desemprego, previdência por invalidez (SSDI), Medicare, welfare
  • Ajuste geográfico lento: trabalhadores não migram rapidamente para regiões menos afetadas

Importância do instrumento

O instrumento de Bartik foi essencial para separar o efeito causal da competição chinesa de outros fatores — como automação e mudança de demanda — que poderiam explicar a desindustrialização.

Visualização dos resultados

Visualize os resultados em um gráfico dinâmico no link: chinashock.info

Ameaças à validade do instrumento

Ameaça 1: Choques de demanda correlacionados

  • Se países ricos têm booms de demanda comuns (ex.: boom imobiliário dos anos 2000), as importações de todos sobem juntas e não apenas por oferta chinesa.

  • Resposta dos autores: resultados robustos ao excluir setores suspeitos (aço, vidro, cimento) e ao usar estratégia alternativa baseada no modelo de gravidade do comércio.

Ameaça 2: Pré-tendências nas “partes”

  • Se os pesos (composição industrial regional) refletem declínio já em curso, a hipótese de exogeneidade é violada.

  • Resposta dos autores (teste de falsificação): regridem mudanças passadas no emprego (anos 1970–1990) sobre a exposição futura às importações chinesas. Resultado: correlação fraca e não há pré-tendência.

Validade dos “pesos” (shares)

Goldsmith-Pinkham, Sorkin e Swift (2020) mostram que o instrumento de Bartik é equivalente a uma combinação ponderada de instrumentos, um por setor.

  • A validade depende crucialmente da exogeneidade dos pesos: a composição industrial inicial não pode refletir tendências que afetariam independentemente os resultados futuros

  • No artigo os pesos são as participações de emprego de 10 anos atrás: plausível porque a especialização industrial regional muda lentamente

  • Interpretação do LATE: o instrumento identifica o efeito médio ponderado pelos pesos setoriais de cada região.

    • Maior influência sobre os resultados de setores com maior variação na exposição chinesa