IBM0288 - 2026.1
Duas pessoas idênticas, exceto pela raça, entram em um banco para solicitar uma hipoteca a fim de comprar casas idênticas.
Por lei, ambas devem receber tratamento igual no processo de solicitação.
A questão central é: o banco realmente as trata da mesma forma? As chances de aprovação são iguais para ambas?
Essa é uma grande preocupação para os reguladores bancários: se a igualdade de tratamento ocorre na prática, e não apenas no papel.
Empréstimos são concedidos ou negados por diversas razões legítimas: por exemplo, grau de comprometimento da renda mensal do solicitante.
Erros honestos também ocorrem: a negação de um único solicitante minoritário não comprova discriminação!
Por isso, muitos estudos buscam evidências estatísticas de discriminação.
Uma abordagem inicial é comparar a taxa de negação entre solicitantes brancos e minoritários.
Exemplo: pedidos individuais de hipotecas para imóveis unifamiliares realizados em 1990 em Boston:
No entanto, essa comparação não responde à pergunta central, pois os solicitantes negros e brancos não eram necessariamente idênticos exceto pela raça.
É necessário, portanto, um método que compare as taxas de negação mantendo constantes as demais características dos solicitantes.
Mas não usamos variáveis dummies anteriormente?
Sim, mas elas eram variáveis explicativas e não de interesse. Até agora, a variável dependente (\(Y\)) era contínua: nota média do distrito escolar; taxa de mortalidade no trânsito
E se \(Y\) for binária?
\(Y\) = entrar na faculdade ou não; \(X\) = notas no ensino médio, pontuação no SAT, variáveis demográficas
\(Y\) = a pessoa fuma ou não; \(X\) = imposto sobre cigarro, renda, variáveis demográficas
\(Y\) = pedido de hipoteca aprovado ou não; \(X\) = raça, renda, características do imóvel, estado civil
Seja \(Y\) uma variável aleatória discreta que assume os valores 0 e 1.
\[ Y = \begin{cases} 1, & \text{com probabilidade } p,\\[2pt] 0, & \text{com probabilidade } 1-p, \end{cases} \]
Valor Esperado e Variância da Bernoulli
O valor esperado e a variância da distribuição Bernoulli são: \[E(Y) = p \qquad \text{e} \qquad \text{Var}(Y) = p(1-p)\] A variância depende de \(p\): é máxima em \(p = 0{,}5\) e zero nos extremos.
Nos modelos de MQO que estudamos anteriormente, a função de regressão populacional é dada por:\[E(Y \mid X_1,X_2,\ldots,X_k)\]
Quando \(Y_i \in \{0,1\}\), o valor esperado de \(Y\) é \(p\), ou seja, a probabilidade de \(Y=1\):\[E(Y) = \color{red}{0 \times Pr(Y=0)} + 1 \times Pr(Y=1) = Pr(Y=1)\]
Portanto, para variável binária \(Y\) temos:\[E(Y \mid X_1,X_2,\ldots,X_k)=Pr(Y=1 \mid X_1,X_2,\ldots,X_k)\]
Um ponto de partida natural é o modelo de regressão linear (Linear Probability Model - LPM) com um único regressor:
\[Y_i = \beta_0 + \beta_1 X_i + u_i\]
Modelo de Probabilidade Linear: \(Y_i = \beta_0 + \beta_1 X_i + u_i\)
Quando \(Y\) é binária: \[E(Y | X) = 1 \cdot \Pr(Y=1|X) + 0 \cdot \Pr(Y=0|X) = \Pr(Y=1|X)\]
Sob a hipótese \(E(u_i|X_i) = 0\):
\[E(Y_i|X_i) = \beta_0 + \beta_1 X_i\]
e assim:
\[\Pr(Y=1|X) = \beta_0 + \beta_1 X_i\]
No LPM, o valor predito de \(Y\) é interpretado como a probabilidade prevista de que \(Y = 1\):
\[\Pr(\hat{Y}=1|X) = \hat{\beta}_0 + \hat{\beta}_1 X_i\]
\(\beta_1\) é a mudança nessa probabilidade para uma variação em \(X\):
\[\beta_1 = \frac{\Pr(Y=1|X=x+\Delta x)-\Pr(Y=1|X=x)}{\Delta x}\]
Interpretação
Como \(\beta_1\) é a mudança de uma probabilidade, os resultados devem ser interpretados como variação em pontos percentuais (p. p.). Ou seja, a \(\Pr(Y=1|X)\) dado um aumento de \(\Delta x=1\) varia \(\beta_1\) pontos percentuais.
deny = 1 se a solicitação foi negada, 0 se aprovada.
Obs: Gráfico com apenas 127 observações para facilitar visualização
Valor predito para razão P/I = 0,3:
\[\hat{Y} = -0{,}080 + 0{,}604 \times 0{,}3 = 0{,}101\]
Calculando efeitos: aumento da razão P/I de 0,3 para 0,4:
\[\Delta\hat{Y} = 0{,}604 \times (0{,}4 - 0{,}3) = 0{,}061\]
O efeito de aumentar a razão P/I de 0,3 para 0,4 é elevar a probabilidade de negação em 0,061 (ou seja, 6,1 pontos percentuais).
Probabilidade predita de negação para candidato negro com P/I = 0,3:\[Pr(deny =1)=-0,91+0,559\times 3 + 0,177 \times 1 = 0,254\]
Probabilidade predita de negação para candidato branco com P/I = 0,3: \[Pr(deny =1)=-0,91+0,559\times 3 = 0,077\]
Diferença = 0,177 = 17,7 pontos percentuais
O coeficiente em negro é significativo ao nível de 5%
Qual sua conclusão? Existe evidência de discriminação racial nesse mercado?
Vantagens:
Desvantagens:
O LPM afirma que a mudança na probabilidade prevista é a mesma para todos os valores de \(X\) (linearidade!)
Probabilidades preditas pelo LPM podem ser \(< 0\) ou \(> 1\)!
Essas desvantagens podem ser superadas por um modelo de probabilidade não linear: Probit e Logit (próxima aula).

O uso de celulares e computadores durante as aulas expositivas não é permitido!