IBM0288 - 2026.1
Ref: Seção 3.1 de Angrist, D. J., Pischke, J. Mastering metrics: the path from cause to effect.
KIPP (Knowledge Is Power Program): rede de escolas públicas charter nos EUA
Escolas charter são públicas, com maior autonomia curricular e de gestão; muitas seguem o modelo No Excuses (mais tempo de aula, disciplina, foco em leitura/matemática).
Questão empírica: frequentar uma escola charter melhora o desempenho?
Desafio de identificação: auto-seleção de famílias/alunos → comparação simples entre charter e escolas tradicionais é viesada.
Em Massachusetts, quando há excesso de demanda, por lei as vagas charter são sorteadas.
A loteria cria variação aleatória no acesso à charter: exatamente o que precisamos!
O sorteio é um instrumento para matrícula em charter!
Objetivo: estimar o efeito causal de estudar em uma charter sobre aprendizado.
Colunas (1), (2) e (4) reportam as médias. A coluna (3) apresenta as diferenças entre os sorteados e os não sorteados. Esses são coeficientes de regressões que controlam para grupos de risco, ou seja, variáveis dummy para ano e série de inscrição e a presença de um irmão candidato. A coluna (5) apresenta as diferenças entre os alunos da KIPP e os candidatos que não frequentaram a KIPP. Os erros-padrão são reportados entre parênteses.
Condições para validade instrumento:
Primeiro estágio: \(Z_i\) tem efeito causal sobre \(D_i\)
Independência: \(Z_i\) é como se aleatório — não correlacionado com variáveis omitidas
Restrição de exclusão: \(Z_i\) afeta \(Y_i\) somente através de \(D_i\)
Observação: Os dois últimos pontos são equivalentes à condição de exogeneidade da aula anterior.
| Condição | No estudo KIPP | Verificável? |
|---|---|---|
| Primeiro estágio | Oferta aumenta frequência em 74 p.p. | ✓ Sim |
| Independência | Loteria aleatória → balanceamento | ✓ Sim |
| Restrição de exclusão | Oferta só melhora notas via frequência | ✗ Não |
Colunas (1), (2) e (4) reportam as médias. A coluna (3) apresenta as diferenças entre os sorteados e os não sorteados. Esses são coeficientes de regressões que controlam para grupos de risco, ou seja, variáveis dummy para ano e série de inscrição e a presença de um irmão candidato. A coluna (5) apresenta as diferenças entre os alunos da KIPP e os candidatos que não frequentaram a KIPP. Os erros-padrão são reportados entre parênteses.
O efeito local médio do tratamento (LATE) é definido como:
\[\lambda = \frac{\rho}{\phi} = \frac{E[Y_i \mid Z_i=1] - E[Y_i \mid Z_i=0]}{E[D_i \mid Z_i=1] - E[D_i \mid Z_i=0]}\]
Numerador (\(\rho\)): efeito da oferta sobre os resultados (forma reduzida)
Denominador (\(\phi\)): efeito da oferta sobre o tratamento (primeiro estágio)
Usando dados da tabela anterior:
\[\lambda = \frac{\rho}{\phi} = \frac{0{,}355}{0{,}741} \approx \mathbf{0{,}48\sigma}\]
Um ganho de quase meio desvio-padrão em matemática em um ano letivo!

LATE = efeito para os compliers
O instrumento não tem poder de mudar o tratamento de never-takers nem always-takers. O LATE captura o efeito causal apenas para os compliers — aqueles cuja decisão de frequentar a KIPP é determinada pela loteria.
LATE = \(E[Y_{1i} - Y_{0i} \mid C_i = 1]\): efeito para os compliers
TOT (Treatment Effect on Treated) = \(E[Y_{1i} - Y_{0i} \mid D_i = 1]\): efeito para todos os tratados (compliers + always-takers)
LATE \(\neq\) TOT
O efeito tratamento médio local e o efeito tratamento sobre os tratados são diferentes, em geral, pois os tratados incluem always-takers, que podem ter efeitos diferentes dos compliers sem hipóteses adicionais.
O LATE estimado para a KIPP Lynn pode não se generalizar para:
Dica
A relevância de um LATE depende de quem são os compliers e se eles representam bem a população de interesse para políticas públicas.
Ref: Seção 3.3 de Angrist, D. J., Pischke, J. Mastering metrics: the path from cause to effect.
Questão: ter mais irmãos prejudica a educação dos filhos? (tradeoff quantidade-qualidade)
Teoria de Becker: pais com menos filhos investem mais em cada um (saúde, educação)
Correlação MQO: cada filho adicional reduz ~0,25 anos de escolaridade do primogênito
Famílias maiores diferem das menores em muitas características não observáveis
Mães com mais filhos tendem a ter menos escolaridade
Filhos de mães menos escolarizadas tendem a ter menos escolaridade
Viés de seleção: a correlação negativa pode não refletir causalidade
Experimento ideal: sortear aleatoriamente bebês extras para famílias com um filho já existente.
Gêmeos no 2º nascimento: \(Z_i = 1\) se segunda gestação for de gêmeos
Gêmeos representam um choque exógeno no tamanho da família
Aumenta o número médio de filhos em ~0,32
Primeiro estágio sem controles: 0,320; com controles: 0,437
Composição de sexo dos dois primeiros filhos: \(W_i = 1\) se os dois primeiros filhos são do mesmo sexo
Pais preferem ter pelo menos um casal
O sexo do recém-nascido é essencialmente aleatório!
Primeiro estágio sem controles: 0,079; com controles: 0,073
Atenção: No livro do Stock e Watson (aulas passadas) \(W\) é usado para representar as variáveis de controle. Neste exemplo do livro de Angrist e Pischke \(W\) é usado para diferenciar os dois instrumentos.
Instrumento gêmeos:
Primogênitos criados em famílias com gêmeos não têm menor escolaridade do que aqueles em famílias com apenas um irmão.
Forma reduzida ≈ 0
Instrumento filhos mesmo sexo:
Escolaridade média dos primogênitos é praticamente igual entre famílias com filhos de mesmo sexo e de sexos diferentes (ambas ≈ 12,6 anos).
Forma reduzida ≈ 0
LATE = 0
Se a forma reduzida é zero, o LATE também é zero: \(\lambda = \rho/\phi \approx 0/\phi = 0\).
Conclusão: Nenhuma evidência de tradeoff quantidade-qualidade!
O Mínimos Quadrado em Dois Estágios (MQ2E) generaliza o método de VI em duas dimensões:
Combina múltiplos instrumentos eficientemente
Incorpora covariáveis de controle
Com um instrumento (\(Z_i\)) e controle (\(A_i\) = idade da mãe):
Forma reduzida: \(Y_i = \alpha_0 + \rho Z_i + \gamma_0 A_i + e_{0i}\)
Primeiro estágio: \(D_i = \alpha_1 + \phi Z_i + \gamma_1 A_i + e_{1i}\)
Valores preditos: \(\hat{D}_i = \alpha_1 + \hat{\phi} Z_i + \hat{\gamma}_1 A_i\)
Segundo estágio: \(Y_i = \alpha_2 + \lambda_{MQ2E} \hat{D}_i + \gamma_2 A_i + e_{2i}\)
Resultado: \(\lambda_{MQ2E} = \hat{\rho}/\hat{\phi}\): o mesmo LATE, agora com controles!
Com dois instrumentos (\(Z_i\) gêmeos, \(W_i\) filhos do mesmo sexo) e controles (\(A_i\) idade da mãe, \(B_i\) primogênito masculino):
Primeiro estágio:
\[D_i = \alpha_1 + \phi_t Z_i + \phi_s W_i + \gamma_1 A_i + \delta_1 B_i + e_{1i}\]
Segundo estágio:
\[Y_i = \alpha_2 + \lambda_{MQ2E} \hat{D}_i + \gamma_2 A_i + \delta_2 B_i + e_{2i}\]
O MQ2E com dois instrumentos produz uma média ponderada dos LATEs gerados por cada instrumento individualmente.
Combinar instrumentos aumenta a precisão (reduz o erro-padrão)
O primeiro estágio dos gêmeos aumenta com controles: gêmeos são mais comuns em mães mais velhas, que teriam menos filhos
O primeiro estágio do filhos do mesmo sexo é estável com ou sem controles: sexo do bebê é verdadeiramente aleatório
MQO: forte correlação negativa (−0,145) — viés de seleção
2SLS: estimativas próximas de zero, não significativas — nenhuma evidência de tradeoff quantidade-qualidade
O −0,145 do MQO está fora do intervalo de confiança do 2SLS → seleção explica a correlação
Refs:
Autor, D., Dorn, D. e Hanson, G. (2013). “The China Syndrome: Local Labor Market Effects of Import Competition in the United States.” American Economic Review, 103(6): 2121–2168.
Goldsmith-Pinkham, P., Sorkin, I. e Swift, H. (2020). “Bartik Instruments: What, When, Why, and How.” American Economic Review, 110(8): 2586–2624.
O que aconteceu?
Entre 1991 e 2007, as importações dos EUA da China cresceram 12,5 vezes — de US$ 26 bi para US$ 330 bi
No mesmo período, o emprego manufatureiro caiu de 12,6% para 8,4% da população adulta
A pergunta causal: As importações chinesas causaram a queda no emprego manufatureiro americano?
Não é óbvio! Outras explicações para o declínio do emprego manufatureiro:
Automação e progresso tecnológico
Mudança na composição da demanda americana
Outros parceiros comerciais (México, Índia)
Ideia central: em vez de olhar para os EUA como um todo, analisar como cada região foi afetada de forma diferente.
Unidade de análise: Commuting Zones (equivalente à microrregião no BR).
722 áreas que cobrem todo o território americano
Agrupam municípios com forte integração no mercado de trabalho local
Variam muito em sua estrutura industrial
A intuição: Regiões especializadas em indústrias que competem com a China devem ser mais afetadas pelo choque chinês.
Para cada commuting zone \(i\) e período \(t\), podemos definir:
\[\Delta IPW_{uit} = \sum_j \frac{L_{ijt}}{L_{ujt}} \cdot \frac{\Delta M_{ucjt}}{L_{it}}\]
onde:
\(\frac{L_{ijt}}{L_{ujt}}\): participação da ZC \(i\) no emprego nacional do setor \(j\)
\(\Delta M_{ucjt}\): crescimento das importações americanas da China no setor \(j\)
\(L_{it}\): emprego total na ZC \(i\)
\(M_{uc}\): signifca importações dos US vindas da China
\(\Delta IPW_{uit}\): variação na exposição às importações é uma média ponderada dos choques de importações setoriais, onde os pesos são dados pela composição setorial do emprego.
\[\Delta L^m_{it} = \gamma_t + \beta_1 \,\Delta IPW_{uit} + \mathbf{X}'_{it}\beta_2 + e_{it}\]
\(\Delta L^m_{it}\): mudança decenal no emprego manufatureiro como proporção da pop. adulta
\(\beta_1\): efeito causal de interesse: como a exposição às importações afeta o emprego
O problema de simultaneidade: importações americanas da China (\(\Delta M_{ucjt}\)) refletem:
Choque de oferta da China (competição chinesa) ou;
Choque de demanda dos EUA (americanos querem mais produtos chineses)
Solução MQ2E, mas necessário um instrumento \(Z_{it}\) que atenda:
Relevância: \(Z_{it}\) prediz \(\Delta IPW_{uit}\) (primeiro estágio forte)
Exclusão: \(Z_{it}\) afeta \(\Delta L^m_{it}\) somente através de \(\Delta IPW_{uit}\)
O instrumento de Bartik combina dois ingredientes:
Pesos (shares): Composição industrial local no período inicial
Quanto cada região depende de cada setor
Predeterminado: reflete história local, não decisões recentes
Varia entre regiões
Choques (shifts):
Variação nacional (ou global) por setor
Dinâmica independe da decisão de cada região específica
Chega a cada região com intensidade diferente, dependendo da especialização local
\[\text{Instrumento}_i = \sum_j \underbrace{\text{peso}_{ij}}_{\text{local, predeterminada}} \times \underbrace{\text{choque}_j}_{\text{global/nacional, exógeno}}\]
Construção do instrumento Bartik
O exemplo usa pesos baseados na estrutura setorial do emprego, pois é o caso mais comum na litaratura e como o instrumento foi desenvolvido. Porém, qualquer estrutura de média ponderada poderia pode ser utilizada para construir um instrumento Bartik.
\[\Delta IPW_{oit} = \sum_j \frac{L_{ij,t-1}}{L_{uj,t-1}} \cdot \frac{\Delta M_{ocjt}}{L_{i,t-1}}\]
Dois ajustes em relação à medida de exposição:
Pesos defasados: evita que o emprego contemporâneo, afetado pelo nível de M atual, influencie o instrumento
Importações de outros países (\(M_{ocjt}\)): isola o componente de oferta chinesa
Intuição:
Se a China está expandindo sua capacidade produtiva (choque de oferta), ela exporta mais para todos os países ricos e não apenas para os EUA!
O coeficiente preferido dos autores é \(\hat{\beta}_1 \approx -0{,}60\).
O que significa: um aumento de US$ 1.000 por trabalhador na exposição às importações chinesas por década reduz o emprego manufatureiro em 0,60 pontos percentuais
Exposição cresceu: ~US$ 1.140/trabalhador nos anos 1990 e ~US$ 1.839/trabalhador nos anos 2000
Impacto estimado:
Para contexto: o emprego manufatureiro/pop. caiu 2,07 p.p. nos anos 1990 e 2,00 p.p. nos anos 2000
A competição chinesa explica ~33% da queda nos anos 1990, ~55% nos anos 2000, e ~44% da queda total.
Além do emprego manufatureiro, as regiões mais expostas às importações chinesas também experimentaram:
Importância do instrumento
O instrumento de Bartik foi essencial para separar o efeito causal da competição chinesa de outros fatores — como automação e mudança de demanda — que poderiam explicar a desindustrialização.
Visualize os resultados em um gráfico dinâmico no link: chinashock.info
Ameaça 1: Choques de demanda correlacionados
Se países ricos têm booms de demanda comuns (ex.: boom imobiliário dos anos 2000), as importações de todos sobem juntas e não apenas por oferta chinesa.
Resposta dos autores: resultados robustos ao excluir setores suspeitos (aço, vidro, cimento) e ao usar estratégia alternativa baseada no modelo de gravidade do comércio.
Ameaça 2: Pré-tendências nas “partes”
Se os pesos (composição industrial regional) refletem declínio já em curso, a hipótese de exogeneidade é violada.
Resposta dos autores (teste de falsificação): regridem mudanças passadas no emprego (anos 1970–1990) sobre a exposição futura às importações chinesas. Resultado: correlação fraca e não há pré-tendência.
Goldsmith-Pinkham, Sorkin e Swift (2020) mostram que o instrumento de Bartik é equivalente a uma combinação ponderada de instrumentos, um por setor.
A validade depende crucialmente da exogeneidade dos pesos: a composição industrial inicial não pode refletir tendências que afetariam independentemente os resultados futuros
No artigo os pesos são as participações de emprego de 10 anos atrás: plausível porque a especialização industrial regional muda lentamente
Interpretação do LATE: o instrumento identifica o efeito médio ponderado pelos pesos setoriais de cada região.

O uso de celulares e computadores durante as aulas expositivas não é permitido!