Risco de Crédito da Contraparte no Contexto de

Transcrição

Risco de Crédito da Contraparte
no Contexto de Bancos Comerciais
segundo Basileia III
Lourenço Miranda
Al Qureshi
Nº 87
Maio 2014
Comparação entre Algoritmos
para o Cálculo do Indicador
AUROC
Lineke Clementino Sleegers Rocha
Luis Gustavo Santos Barros
14
Modelo de Behavior Scoring
em uma Empresa de
Telecomunicações Brasileira
Aline Gonçalves Lins
Wesley Vieira da Silva
Luciano Luiz Dalazen
Luiz Carlos Duclós
22
Previsão de Inadimplência
na Baixa Renda
Patricia Rosangela Carneiro
41
Proteja
A Serasa Experian oferece soluções sob medida para o seu
negócio. São produtos e serviços exclusivos, que vão desde
consultas de crédito até ferramentas e softwares para gerir melhor
sua empresa. Tudo muito prático, rápido e rentável. E o melhor:
cabe no seu orçamento. Entre em contato e prepare-se para se
destacar da concorrência.
Para saber mais, acesse
serasaexperian.com.br
ou ligue para 0800 773 7728
SoluçõeS eSPeCífiCaS Para
Cada etaPa do Seu negóCio


Busque novos clientes


Venda com segurança
Monitore empresas,
clientes e sócios
Cobre devedores
Compre só os dados de que precisa
3
06
Risco de Crédito da Contraparte no Contexto
de Bancos Comerciais segundo Basileia III
Lourenço Miranda
Al Qureshi
O artigo destaca as preocupações ligadas ao hedge
do Risco de Crédito da Contraparte (Counterparty
Value Adjustment – CVA), principalmente para os
bancos comerciais, cujas carteiras se compõem
fundamentalmente de empresas do middle market
ou PJs locais, cujos CCRs não possam ser objeto de
hedging direto.
14
Comparação entre Algoritmos para
o Cálculo do Indicador AUROC
Lineke Clementino Sleegers Rocha
A conclusão deste estudo, que comparou três
algoritmos, é de que a melhor metodologia para o
cálculo do indicador AUROC, um dos principais
indicadores da acurácia dos modelos de risco de
crédito, é a derivação da estatística do Teste de MannWhitney-Wilcoxon (MWW).
22
Modelo de Behavior Scoring em uma
Empresa de Telecomunicações Brasileira
Luiz Carlos Duclós
Técnicas econométricas e de análise multivariada
de Logit Binomial possibilitaram a construção de um
modelo de Behavior Scoring e a segmentação dos
clientes em classes de risco. A partir dessas classes,
empregando-se a métrica do Value at Risk (VaR),
originaram-se quatro segmentos diferenciados.
41
Previsão de Inadimplência na Baixa Renda
O potencial de consumo nas classes populares
vinha sendo ignorado pela maioria das empresas
seja no Brasil, como em outros países, porém, mais
recentemente, a atuação junto aos mercados da base
da pirâmide vem crescendo e ganhando importância.
Medir o risco de inadimplência foi o foco da pesquisa.
4
Palavra do Editor
Esta edição apresenta quatro artigos de grande relevância para a gestão de
risco de crédito, cada um deles contendo
estudos voltados para situações particulares, que poderão servir de referência a especialistas e analistas de empresas e instituições financeiras, professores e estudantes.
O primeiro artigo – “Risco de Crédito da Contraparte no Contexto de Bancos Comerciais segundo Basileia III” - focaliza especialmente instituições financeiras cujas carteiras são constituídas por empresas do middle Market ou PJs locais. Seus
autores, Lourenço Miranda e Al Qureshi
pertencem à mesma instituição - US Bancorp - o 5º maior Banco Comercial dos Estados Unidos. Miranda é Head do Quantitative Analytics Group e Al Qureshi é Head do
Market Solutions Group. Ambos têm longa experiência na atividade que exercem Gestão, Mensuração e Precificação de Risco, e Trader. No estudo, Lourenço Miranda e
Al Qureshi enumeram as preocupações ligadas ao hedge de Risco de Crédito da Contraparte, um dos assuntos do momento no
setor bancário, especialmente depois da
emissão das regras do Basileia III, segundo
as quais a mensuração de capital para fins
de CCR tornou-se obrigatória por meio do
cálculo de um VaR do CVA. Eles afirmam
que o Risco de Crédito da Contraparte e o
CVA serão, em um futuro próximo, temas
de extrema importância na agenda de gestão do risco de crédito dos principais bancos, voltados especialmente para a solidez
e estabilidade do Sistema Financeiro.
Líneke Clementino Sleegers Rocha, Gerente Executivo da área de Monito-
ração dos Modelos de Risco da Caixa Econômica Federal, estatística, pós graduada
em Métodos Quantitativos, mestre em Economia, é responsável pelo artigo “Comparação entre Algoritmos para Cálculo do Indicador AUROC” em coautoria com o estudante de Estatística Luis Gustavo Santos
Barros, estagiário na CEF. O estudo enfatiza que os softwares estatísticos retornam
este indicador na construção dos modelos,
mas que existem diversos algoritmos para
cálculo desse indicador utilizado no acompanhamento dos modelos de risco de crédito. Na análise foram comparados três algoritmos para o cálculo do AUROC obtidos pelo software SAS, cotejando os resultados para dados agrupados (em classes
de escore) e não agrupados (dados brutos).
A comparação das três propostas resultou
que a melhor metodologia para o cálculo
do indicador AUROC é pela derivação da
estatística do Teste de Mann-Whitney-Wilcoxon (MWW). Este método de cálculo não
apresenta valores fora do intervalo esperado para o indicador e não é impactado na
utilização de dados agrupados.
Os professores Aline Gonçalves
Lins, Wesley Vieira da Silva, Luciano Luiz
Dalazen e o mestrando Luiz Carlos Duclós
são autores do artigo “Modelo de Behavior
Scoring em uma Empresa de Telecomunicações Brasileira”. Trata-se de uma pesquisa
que teve por objetivo construir um modelo
para determinar a probabilidade de inadimplência de um cliente, a partir de seu comportamento de pagamentos. Utilizaram-se
técnicas econométricas e de análise multivariada para construir um modelo de Behavior Scoring e a segmentação dos clientes
5
em classes de risco, associadas a uma probabilidade de inadimplência e a perda financeira esperada. O modelo possibilitou a
compreensão do fenômeno estudado, isto
é, a inadimplência na empresa “TELE” e, a
partir da probabilidade, efetuou-se a separação dos clientes em classes de risco, possibilitando calcular o VaR desses grupos.
Na pesquisa, o VaR está definido como a
perda máxima esperada em 8 meses, com
uma confiança de 95%. Dessa maneira, foram obtidos quatro agrupamentos de clientes com perdas homogêneas dentro dos
grupos, mas heterogêneas quando comparadas entre si. Isso permitiu dar um tratamento diferenciado aos clientes, com uma
acuracidade maior no que tange a previsão
de retorno sobre o investimento.
Bastante oportuno é o artigo de
Patricia Rosangela Carneiro - “Previsão de
Inadimplência na Baixa Renda” - uma vez
que atualmente grande número de organizações passou a reconhecer e explorar as
classes populares. A autora é graduada em
Estatística e tem 10 anos de experiência em
desenvolvimento de soluções customizadas para clientes da Serasa Experian. Seu
trabalho buscou identificar variáveis capazes de explicar o comportamento de crédito
dessa classe e sugeriu um modelo de crédito para a população brasileira de baixa renda. A população de baixa renda tem pouco ou nenhum colateral, não tem histórico
de crédito, tem diminuta ou nenhuma experiência em lidar com dinheiro ou em gerenciar um negócio e pode habitar locais distantes. O inadimplemento representa um
dos maiores problemas na concessão de
crédito, pois influencia diretamente as condições para o acesso. Neste trabalho, a
inadimplência encontrada na amostra selecionada para aplicar a técnica Credit Scoring
foi de 28% de clientes inadimplentes. A alta
taxa de inadimplência é explicada pelo descontrole por parte de uma parcela da população que tem agora, acesso a bens que
nunca teve, e na qual se deposita alto nível
de confiança para o futuro. Para alcançar o
objetivo proposto, foram realizadas análises
estatísticas, as quais surpreenderam as expectativas do pesquisador.
Tecnologia de crédito
ANO XIII
Publicação trimestral da Serasa Experian
Nº 87
ISSN 2177-6032
Presidente - Brasil
Editoração Eletrônica
José Luiz Rossi
Gerson Lezak
Presidentes/Superintendentes de Unidades de Negócios
Ilustração
Juliana Azuma, Marcelo Kekligian, Maria Zanforlin,
Gerson Lezak
Mariana Pinheiro e Steven Wagner
Tradução
Diretores
Allan Hastings
Amador Rodriguez, Guilherme Cavalieri, Laércio Oliveira Pinto,
Correspondência
Lisias Lauretti, Paulo Melo, Silvânio Covas e Valdemir Bertolo
Serasa Experian - Comunicação & Branding
Editora Responsável
Alameda dos Quinimuras, 187 - CEP 04068-900 - São Paulo - SP
Rosina I. M. D’Angina (MTb 8251)
www.serasaexperian.com.br
Assistente de Edição
[email protected]
Nancy Galvão
Os conceitos emitidos em artigos assinados são de responsabi
Projeto Gráfico
lidade de seus autores, não expressando, necessariamente, o
Luis Barbuda
ponto de vista da Serasa Experian, nem do Conselho Editorial.
Capa
É proibida a reprodução total ou parcial dos artigos
Gerson Lezak
desta publicação.
6
Risco de Crédito da Contraparte no
Contexto de Bancos Comerciais
segundo Basileia III
Lourenço Miranda
Al Qureshi
7
Sumário
O artigo descreve os processos gerais de modelagem de
crédito, proxy (aproximação da carteira equivalente), hedging e práticas setoriais aplicáveis no que se refere à gestão e mensuração
do risco de crédito da contraparte (Counterparty Value Adjustment,
ou CVA). Analisa em termos de processo potencial de proxy e paradigma de hedging um modelo de carteira simplificado altamente equiparado à exposição comum ao risco de contraparte da carteira de derivativos existente em um Banco comercial. A simulação
histórica foi realizada ao longo dos últimos quatro anos. Os resultados são bastante alentadores e indicam que pode ser desenvolvido um protocolo de hedging altamente simplificado. Nesse exemplo, demonstrou-se que até mesmo com uma escala de risco muito simplificada, foi possível harmonizar mais de 98% do risco ao
longo do tempo. Análises estatísticas subsequentes sugerem que
a maior parte do “erro de hedge” observado se deve ao risco de
curva não-modelado e é resultado direto de nosso agrupamento
(bucketing) altamente simplificado de taxas e volatilidades.
Palavras-chave: Risco de Crédito da Contraparte, Basileia III,
Credit Default Swaps, Hedging e Mapeamento de Crédito.
Introdução
Muitas instituições financeiras sofreram significativas perdas ligadas ao Risco de
Crédito da Contraparte (Counterparty Credit
Risk – CCR) em suas transações com derivativos de balcão (OTC) durante a violenta perturbação de mercado de 2008-2009. Essas
perdas deveram-se principalmente a contrapartes em default direto ou de ajustes de valoração de crédito (Credit Valuation Adjustments
– CVA) relacionados a perdas de marcação
ao mercado associadas a contrapartes não
inadimplentes. Mais especificamente, o default de Lehman e seus efeitos ampliaram o
foco dos agentes do mercado sobre a questão do CCR em seus trading books. Tendo isso
em mente, o Comitê de Supervisão Bancária da Basileia (Basel Committee on Banking
Supervision – BCBS) publicou em dezembro
de 2009 um documento de consulta (consultative paper – CP), com o objetivo de atender
a certas preocupações que surgiram durante a crise dos mercados financeiros e que a
estrutura de adequação de capital do Basileia II não era capaz de cobrir inteiramente.
Uma dessas questões envolve as elevadas
perdas de CCR em potencial em instituições
8
financeiras específicas e no setor financeiro
de modo geral. Depois do período de consultas, em junho de 2011 o Comitê emitiu – em
sua forma revista e mais recente – uma série
de medidas reformadoras popularmente conhecida como Basileia III, para reforçar a regulação, a supervisão e a gestão de risco do
setor bancário. Essas medidas pretendiam:
aumentar a capacidade do setor para absorver choques decorrentes de estresse financeiro e econômico de quaisquer fontes, aprimorar a gestão de risco e a governança, e
reforçar a transparência e a divulgação por
parte dos bancos.
Mensuração do Risco de
Crédito da Contraparte
Ajuste de Valoração de Crédit
(Credit Valuation Adjustment – CVA)
Resumidamente, CVA é a modificação da marcação ao mercado de uma carteira por causa da possibilidade de default da
contraparte.
Para ilustrar a preocupação ligada ao
CCR, consideremos o caso de um fornecedor
de crédito de primeira linha que firme um derivativo de balcão nos termos do qual compre
um fluxo de caixa potencialmente positivo
de uma contraparte sub-prime e venda, pelo
mesmo preço, um fluxo de caixa idêntico a
outra instituição creditícia de primeira linha.
Na ausência de qualquer risco da contraparte, o fornecedor de crédito não teria lucro/prejuízo. Na realidade, contudo, o intermediário
apresenta prejuízo por causa da diferença de
risco de contraparte que reteve e não repassou à outra instituição de primeira linha. Para
avaliar esse ajuste, uma analogia genérica
para essa divergência de valor é admitir que
as duas contrapartes vendam implicitamente
uma à outra uma opção de default em relação
à transação. Neste exemplo, como a instituição intermediária comprou um fluxo de caixa
positivo, tem um recebível positivo da contraparte sub-prime. Como corre o risco de default
da contraparte, vendeu implicitamente a ela
uma opção de default pela qual não recebeu
qualquer prêmio. Esse prêmio é equivalente
ao preço de risco CCR do hedge, de acordo
com a teoria da precificação neutra em risco.
Assim, a instituição deveria “cobrar” do seu
trader o valor da opção de default.
Teoricamente, dada uma medida de
valoração neutra em risco, o CVA deve ser
igual ao custo do hedge da exposição ao risco.
Dito isso, dada uma transação específica em
derivativos de balcão entre duas contrapartes, o problema agora reside em identificar
um hedge para o CCR inerente à transação.
De modo geral, três fatores contribuem para o risco da contraparte. Primeiro,
o risco de crédito da contraparte medido por
sua Probabilidade de Descumprimento (PD).
Segundo, a exposição no momento do descumprimento (Exposure at Default – EAD), que
depende do mercado (por exemplo, no caso
de um swap de taxa de juros a exposição depende dos preços de mercado das taxas de
juros, o que faz da EAD uma variável de natureza aleatória. Esta é a principal diferença entre a EAD de um empréstimo e a de um derivativo). Terceiro, a recuperação após o descumprimento (medida pelo valor que pode
ser recuperado após o descumprimento, ou
Loss Given Default).
A exposição ao risco de crédito
pode, então, ser objeto de hedge por meio
de um instrumento que proteja a contraparte do descumprimento pela outra. Tal instrumento é o bem conhecido Credit Default Swap
(CDS). Quando se trata de uma só contraparte, o instrumento de hedge contra o risco de
crédito da contraparte é o CDS unitário (sin-
9
gle name CDS). Mas nem sempre se pode encontrar no mercado CDS unitários para uma
contraparte específica, principalmente quando se trata do middle market ou de instituições
cujos CDSs não sejam líquidos o bastante ou
apresente custos proibitivos. Assim, o hedging deve basear-se em aproximações (proxies) da exposição à contraparte. O hedge torna-se imperfeito, na medida em que essas
proxies apenas simulam o risco da contraparte. O problema, agora, passa a ser o de encontrar tais proxies por meio de mapeamento de risco de crédito (usando ratings ou informações setoriais).
Hedge do Risco da
Contraparte
Proxies e Mapeamento de Crédito
A modelagem e o proxying de crédito
são determinantes cruciais dos processos de
CVA a jusante, seja na precificação do componente CVA para uma nova transação, seja
no cálculo das sensibilidades de uma carteira à taxa de juros e ao hedge de crédito. Em
suma, no que se refere aos insumos de um
modelo de crédito (por proxying nos referimos
à maneira pela qual descrevemos o risco de
uma dada contraparte), é preciso destacar
que “proxies incorretas” podem dar origem a
significativa volatilidade dos ganhos.
Assim, ao discutir mapeamento de
crédito e/ou proxying, os autores sugerem que
o leitor cauteloso pense em maneiras pelas
quais as diferentes opções de projeto podem
afetar: a) mapeamentos de crédito excessivamente conservadores ou agressivos (ao que
nos referiremos por erro de modelagem) e/ou
b) mapeamentos de crédito e/ou proxies que
não se atualizem à medida que o crédito subjacente da contraparte se desloque (ao que
nos referiremos por anomalias de atualiza-
ção). Em última análise, ao sugerir as ideias
relacionadas a proxy de crédito que seguem,
nosso objetivo é o de obter um processo que
respeite os limites necessários associados
à produção de um preço de CVA competitivo, que se preste a uma estrutura razoável
de hedge e que, na medida do possível, reflita uma medida precisa do risco de crédito da
contraparte embutido nos nossos diferentes
books de derivativos.
Recomendações quanto
ao Mapeamento de Crédito
Uma Descrição Genérica para:
Contrapartes com CDSs
Negociáveis
Independentemente do ponto da estrutura de capital ao qual se vincule um dado
CDS específico, se uma determinada contraparte contar com CDSs negociáveis, então
quem fizer hedges com CVAs provavelmente usará o preço de mercado do CDS como
dado de entrada para cálculo do CVA e das
sensibilidades de hedge correspondentes. As
informações de LGD também serão inferidas
a partir do mercado. Se o procedimento for
corretamente realizado, o risco da contraparte assim mapeado deve levar a um preço de
CVA e, portanto, a um hedge de CVA que (em
tese) acompanhará com quase exatidão o risco da contraparte, de maneira a reduzir o risco líquido. Ao acompanhar o spread do Credit
Default Swap da contraparte, nosso objetivo é
minimizar o erro de modelagem e impossibilitar anomalias de atualização.
Contrapartes sem CDSs
Negociáveis
Chamamos o processo geral de atribuição de comportamento de crédito a con-
10
trapartes sem CDSs negociáveis de ciência
(ou arte?) de proxy. Esperamos utilizar os ratings de crédito internos das contrapartes. Esses ratings internos podem ser mapeados em
relação a taxas históricas de probabilidade
de descumprimento, ou “PDRs”. Usamos as
PDRs e o rating setorial para determinar precificação por faixa de Índice CDX observável e calcular um preço CVA neutro em risco
como dado de entrada para o cálculo do encargo de CVA e das sensibilidades de hedge
correspondentes. Para garantir a precisão do
proxying (mínimo erro de modelagem) e sua
atualização (ausência de anomalias de atualização), é provável que um recurso quantitativo baseado em hedging de CVA possa funcionar com o crédito para monitorar PDRs de
entrada, precisão de proxy e retrotestes dos
cálculos de proxy e LGD. A realização de retrotestes, na ausência de CDSs negociáveis,
provavelmente exigirá o uso de curvas de títulos limpas e suavizadas e de preços sintéticos de CDS derivados dos modelos de equivalência ações-CDS de fornecedores como o
KMV da Moody's.
O processo de mapeamento de crédito implica restrições operacionais rígidas
a jusante, além de alguns benefícios diretos
para o negócio. Os benefícios do uso de proxies simplificadas, porém precisas, resultam
do fato de a precificação ser direta, a precificação por CVA ser competitiva e o encargo de CVA ser derivado dos preços de mercado. Este último ponto é crítico, já que será
fundamental contar com ativos negociáveis
para fazer o hedge da volatilidade dos resultados do CVA.
Os custos associados à análise por
meio de proxy, em termos gerais, resultam do
fato de que será necessário um grande volume de análise quantitativa para garantir a
precisão das proxies (mínimo erro de mode-
lagem) e que as relações de proxy se desloquem à medida que o crédito subjacente da
contraparte se mova para cima e para baixo
(mínimas anomalias de atualização). Por outro lado, haverá a consequência inevitável
de que, com o proxying e os hedges por proxy, o crédito subjacente da contraparte não
se mova de maneira semelhante e até mesmo em direção oposta (risco-base). Na prática, qualquer movimento do crédito subjacente da contraparte que não seja capturado
pela proxy (ou seu hedge) será, afinal, um descumprimento.
A Proxy é Sempre uma
Proxy… o Risco-base é
Inevitável
Como o processo de hedging apenas
protege contra sensibilidades derivadas das
sensibilidades proxy, os hedges não podem
oferecer proteção contra o risco-base entre
a ‘proxy’ e o crédito efetivo da contraparte.
Este, enfim, é o papel dos retrotestes da proxy. Dada sua importância para o sucesso tanto da precificação quanto dos hedges, acreditamos que proxying e retrotestes devam ser
funções da mesa de operações
O hedging por CVA são será uma garantia universal – principalmente em Bancos
Comerciais e, mais especificamente, ao considerarmos a atual composição do book de
derivativos de balcão dos Bancos Comerciais
(em geral para atender às necessidades de
clientes PJ do Middle Market). O arranjo de
hedging por CVA provavelmente será incapaz de proporcionar hedge contra migração
de ratings e/ou um salto para a condição de
descumprimento em relação aos títulos com
hedge via proxy. Esse risco-base não pode ser
evitado. Principalmente nos casos em que o
book do negócio se componha predominantemente de clientes do middle market para os
11
quais não haja CDSs negociáveis, serão necessárias técnicas de hedge via proxy. Haverá
algumas situações em que existam CDSs negociáveis para a contraparte e, nesses casos,
a migração de ratings e o salto para a condição de descumprimento talvez possam ser
objeto de hedge próximo à perfeição, em um
ambiente dinâmico.
O Hedging por CVA não
irá Substituir os Limites
de Crédito
O hedging por CVA não pode ser um
substituto para os limites de crédito. Um fato
a considerar é o de que o CVA, num Banco
Comercial, provavelmente não será substituto para o monitoramento ativo do limite de
crédito. Encorajamos veementemente o monitoramento ativo de limites de crédito, dadas
as restrições associadas à metodologia de
proxy e hedge.
Metas Gerais do Hedge
Meta # 1 – O “Número Certo” é Zero
Ao fazer hedge, procuramos atingir
volatilidade mínima de resultados, com meta
idealizada de 0.
Meta #2 – Faça Hedge o Máximo
que Puder…
Se utilizamos precificação neutra
em risco, quer dizer que calculamos uma expectativa “justa” do custo do hedging da contraparte durante a vigência do contrato. Se a
instituição então construir um hedge usando
o perfil de mercado do dia, o resultado associado ao “justo preço” será 0. Isso seria verdade, é claro, se admitirmos custo de transação
0, liquidez perfeita (podemos transacionar livremente no ponto de preço) e ausência de
movimentação do mercado no tempo neces-
sário para que o custo preço/risco da contraparte (custo do CVA) seja transacionado no
mercado. Por isso, os profissionais do mercado costumam recomendar fazer hedge de
100% do risco CVA.
Revisão do Encargo
de CVA
Implicações das Metas de Hedge
para a Precificação
Se o hedge não estiver sendo realizado com objetivo de lucro (ver Meta 1) e
o agente pretender fazer hedge do máximo
possível de risco (ver Meta 2), uma consideração fundamental será garantir que quaisquer
sensibilidades calculadas a partir do encargo
de CVA da carteira possam efetivamente ser
objeto de hedge.
É preciso lembrar que o encargo
de CVA calculado e enfim precificado ao
cliente é, na verdade, precificado usando
taxas do dia do crédito e os dados de entrada do mercado. É por isso que, ao calcular
o encargo de CVA e as sensibilidades a ele
associadas, é importante usar “dados de
entrada de precificação do mercado” que
sejam negociáveis. Se usarmos esse fato –
ou seja, o de que o encargo de CVA precificado aos clientes representa a expectativa de evolução do risco e da exposição da
contraparte ao longo de um determinado
período de tempo, então o hedge das sensibilidades que decorrem do encargo de
CVA dia a dia será o custo do hedge, hoje.
Contar com dados de entrada negociáveis
significa que quaisquer sensibilidades decorrentes de nosso cálculo de CVA e nossa análise de sensibilidade serão, portanto, passíveis de hedge e negociáveis, e que
o banco poderá, com isso, mitigar a volatilidade diária de resultados (P&L). Além dis-
12
so, gerenciar o cauteloso equilíbrio entre a
proxy de um título e a competitividade em
precificação ao cliente significará assegurar que o encargo de CVA precificado aos
clientes tenha, de fato, preço de transferência “ao custo”.
Autores
Implicações para o Hedging
A predominância de contrapartes
em nosso book de derivativos irá exigir o uso
de proxies. Se a meta da mesa de CVA for minimizar a volatilidade de P&L da instituição, é
provável que o processo de proxy compartilhe
efetivamente dessa meta. Afirmamos, anteriormente, que precificar em uma estrutura
neutra em risco é o melhor que se pode fazer para atingir uma meta de resultado zero
ao fazer hedge de 100% do risco (e vice-versa). Vemos que, com as duas primeiras metas, estamos procurando atingir zero volatilidade marcada ao mercado do P&L, ao mesmo tempo que precificamos o mais próximo
possível do mercado (garantindo que o banco mantenha sua competitividade).
Conclusões e
Considerações Finais
A crise financeira de 2008-2009
fez do Risco de Crédito da Contraparte um
dos assuntos do momento no setor bancário, especialmente depois da emissão das
regras do Basileia III, segundo as quais a
mensuração de capital para fins de CCR
tornou-se obrigatória por meio do cálculo de um VaR do CVA. Neste estudo, enumeramos algumas das preocupações ligadas ao hedge do Risco de Crédito da Contraparte, principalmente para os Bancos
Comerciais, cujas carteiras se compõem
fundamentalmente de empresas do middle
market ou PJs locais cujos CCRs não possam ser objeto de hedging direto por meio
de um CDS específico e justifiquem o uso
de proxy. O Risco de Crédito da Contraparte
e o CVA serão temas de extrema importância na agenda de gestão do risco de crédito dos principais Bancos no futuro próximo,
assim como no suporte à solidez e estabilidade do Sistema Financeiro.
Lourenço Miranda
Lourenço Miranda é Head do Quantitative Analytics Group do US Bancorp, o 5º maior Banco Comercial dos Estados Unidos. Ele tem mais de 16 anos de experiência profissional em Gestão, Mensuração e Precificação de Risco, tendo trabalhado em Bancos com atividades internacionais e como assessor de risco da International Finance Corporation, o braço do Banco Mundial para o setor privado. Lourenço Miranda também está ligado à Escola
de Matemática (Matemática Financeira) da Universidade do Minnesota, onde conduz linhas de pesquisa em matemática aplicada às finanças.
Autores
13
Al Qureshi
Al Qureshi é Head do Market Solutions Group, parte do Quantitative Analytics Group do US Bancorp. Al Qureshi
tem mais de 15 anos de experiência como trader em muitas instituições financeiras, abrangendo todas as categorias de ativos dos lados comprador e vendedor. Na qualidade de Head of Market Solutions do US Bancorp, Al
Qureshi presta serviços de assessoria a todas as linhas de negócios do Mercado de Capitais, inclusive em relação a modelos de precificação e sensibilidades de hedging. Ele é também é responsável pelo desenvolvimento da
Referências
estrutura de CVA do Banco.
GIOVANNI Cesari; AQUILINA, J.; CHARPILLON, N.; FILIPOVIC, Z.; LEE, G.; and MANDA, I. - Modelling, Pricing, and
Hedging Counterparty Credit Exposure: A Technical Guide, Springer Finance, New York: 2010.
YI Tang, and BIN Li, Quantitative Analysis, Derivative Modeling, and Trading Strategies in the Presence of Counterparty Credit Risk for the Fixed Income Market, World Scientific, New Jersey: 2008.
GREGORY Jon, Counterparty Credit Risk and Credit Value Adjustment: A Continuing Challenge for Global Financial
Markets (The Wiley Finance Series), Wiley; 2 edition, New York: 2012;
http://www.bis.org/bcbs/basel3.htm?ql=1 (Basileia 3, Geral)
http://www.bis.org/publ/bcbs189.htm (Basileia 3, Documento Final)
http://www.bis.org/publ/bcbs209.htm (Basileia 3, Perguntas Frequentes sobre CCR)
14
Comparação entre
Algoritmos para o Cálculo
do Indicador AUROC
Líneke Clementino Sleegers Rocha
15
Introdução
O AUROC (Área Sob a Curva ROC) é um dos principais
indicadores de acurácia dos modelos de risco de crédito.
Os softwares estatísticos retornam este indicador na
construção dos modelos. Porém, existem diversos algoritmos
para o cálculo deste indicador utilizado no acompanhamento
dos modelos de risco de crédito.
Este estudo compara três algoritmos para o cálculo do
AUROC obtidos pelo software SAS, cotejando os resultados para
dados agrupados (em classes de escore) e não agrupados (dados
brutos).
Palavras-chave: AUROC, Curva Roc, Mann-Whitney-Wilcoxon, PROC EXPAND.
Curva ROC e Indicador
AUROC
Para a construção da Curva ROC é
necessário o cálculo da sensitividade e especificidade em diferentes pontos de corte.
A Sensitividade pode ser definida
como a capacidade de identificar os clientes maus reconhecidos realmente como
maus. Ou seja, qual é o percentual dos
clientes observados na prática como maus
pagadores, que foram classificados como
maus pelo modelo, especificado um determinado ponto de corte.
A Especificidade pode ser definida
como a capacidade de identificar os clientes
bons dado que eles realmente são bons. Ou
seja, qual é o percentual dos clientes observados na prática como bons pagadores, que
foram classificados como bons pelo modelo,
dado um determinado ponto de corte.
A curva é obtida plotando em um
gráfico Sensibilidade x (1 - Especificidade)
para os diferentes pontos de corte.
A área abaixo da curva ROC varia de
0 a 1 e mede a habilidade do modelo em discriminar os clientes que estão sendo classificados corretamente.
AUROC por Aproximação
da Área sob a Curva ROC
No SAS, a área pode ser obtida pela
PROC EXPAND.
A PROC EXPAND faz uma interpolação do tipo spline cúbica para obter a curva
ROC. “Uma spline cúbica é uma função segmentada que consiste em polinômios de terceiro grau agrupados de forma que a curva
toda tenha primeira e segunda derivada contínuas” (SAS Institute Inc., 2003, p. 846, tradução nossa).
Utiliza-se o comando “observed”, que
lê os argumentos que descrevem como os valores da série de dados são lidos e como eles
ficarão depois de interpolados. Foram utilizados os argumentos “beginning” para definir como os valores serão lidos e o argumento
16
“total” para como queremos que eles sejam
após a interpolação. O argumento “beginning”
indica que os dados estão começando no início de cada intervalo da série (SAS Institute
Inc., 2003), assim o SAS lê cada ponto dos dados individualmente. O comando “total” “indica que o valor dos dados é o valor total do intervalo correspondente à observação” (SAS
Institute Inc., 2003, p. 844, tradução nossa).
Após ajustar a curva spline aos dados, a PROC EXPAND, por meio do comando
“transformout”, aplica a função a todos os pontos da curva. No caso deste trabalho e para o
cálculo do AUROC o argumento utilizado foi
“sum”. Com isso, a procedure do SAS aplica a
soma a todos os pontos da curva transformada, resultando em uma aproximação da área
total abaixo da curva. Se houver poucas observações ou se os dados estiverem agrupados, este algoritmo pode perder precisão.
AUROC Derivado do Teste de
Mann-Whitney-Wilcoxon
(MWW)
O teste de Mann-Whitney-Wilcoxon é
não paramétrico que testa a hipótese de que
duas populações são iguais contra a hipótese
alternativa, em geral, de que uma população
apresenta valores maiores que a outra.
Dadas amostras aleatórias X1, X 2,
..., Xn e Y1, Y2, ..., Ym independentes das
duas populações. A estatística teste, segundo Conover (1999), é a soma dos ranks
atribuídos a cada uma das amostras:
n
W=
Ʃ
i=1
R(Xi)
(1)
No caso de haver muitos valores da
característica observada (e.g. scores de clientes) iguais na amostra, ou seja, empates,
“atribuem-se a cada um a média dos ranks
que seriam atribuídos a cada um se não hou-
vesse empates” (Conover, 1999, p. 272, tradução nossa). A estatística-teste para o caso de
haver vários empates de acordo com Conover (1999) é a soma de ranks menos sua média dividida pelo seu desvio-padrão:
W1 =
n(N–1)
2
W–
nm
N
N
Ʃ
i=1
2
Ri –
(2)
nm(N+1)2
4(N–1)
Onde, N=m+n.
Para a testar as hipóteses, no caso
de não haver empates, os quantis aproximados de W em (1), para m>20 e n>20 são obtidos pela aproximação normal (Conover, 1999):
n(N+1)
nm(N+1)
Wp=
+ zp
2
12
(3)
Onde Zp é o quantil da distribuição
normal padrão. No caso de haver vários empates o quantil Wp da distribuição de W1 em
(2) é obtido diretamente da tabela da distribuição normal padrão, visto que, a estatística
já é normalizada.
Para o cálculo da área sob a curva
ROC utilizando a aproximação do teste MWW
utiliza-se a seguinte relação:
w – E0(w) 1
AUC =
+
mn
2
(4)
Onde, W é a soma dos ranks, E0(W)
é o valor esperado da soma de ranks sob H0;
m e n são as freqüências das amostras das
duas populações. Segundo Randles e Wolfe
(1979), E0(W) pode ser obtida pela fórmula:
n(m+n+1)
E0 (W) =
2
(5)
17
Outra maneira de se calcular a área
sob a curva ROC é utilizando a aproximação
da estatística U. De acordo com Mozer (2003),
a estatística U, outra forma do teste MWW,
aproxima a área sob a curva ROC:
U=
1
mn
[Ʃ
n
Ri –
2
i=1
(6)
]
n(n+1)
Finalmente chegamos a uma relação de equivalência com a equação (4), como
queríamos demonstrar.
No SAS a estatística do teste MWW
e as somas de ranks são obtidas pela PROC
NPAR1WAY.
AUROC Derivado por
Aproximação pela Regra
do Trapézio
Pode-se mostrar que a estatística U
(6) está relacionada com a relação apresentada na equação (4) e que elas são equivalentes:
(7)
n
1
U=
[Ʃ
n
mn
Ri –
n(n+1)
2
i=1
]
2
=
O método do trapézio é uma outra
abordagem para o cálculo do AUROC, que
consiste em aproximar a área sob a curva,
aproximada por um polinômio, no caso deste
artigo, polinômios lineares de Lagrange.
Seja a função f(x), a curva que descreve uma função qualquer, definida entre
x0=a e x1=b. Para aproximar a área dessa
curva utilizamos o polinômio interpolador de
Lagrange (Burden e Faires, 2008):
ƩR
–n(n+1)
i
i=1
2mn
Somando e subtraindo mn de (7),
não se altera a igualdade, com isso temos,
(8)
n
2
U=
Ʃ
i=1
P1(x) =
Ri – n2 – n – nm + mn
2mn
b
n
Ʃ
i=1
=
2
=
2mn
ƩR –n(n+m+1)
2mn
a
+
1
=
2
n
ƩR
i
=
i=1
mn
–
n(n+m+1) 1 1
+ =
2mn
2 mn
=
[Ʃ
n
i=1
Ri–
]
n(n+m+1) 1
+ =
2
2
1
1
[ W – E0 (W) ] + 2
mn
(x1–x0)
x1
(x–x1)
ƒ(x1)
(x–x0))
0)
i
i=1
(x–x0))
(9)
A área sob a curva f(x), é obtida integrando-se esta função. Como o polinômio
intepolador em (9) é utilizado para aproximar
f(x) temos que:
(10)
n
Ri –n(n+m+1)+mn
(x0 –x1)
ƒ(x0)) +
ʃ ƒ(x)dx= ʃ [ (x –x ) ƒ(x ) + (x –x ) ƒ(x ) ] dx+Ɛ
Evidenciando-se n na equação anterior obtemos,
2
(x–x1)
x0
0
1
1
1
0
18
O termo de erro foi simplificado, pois
não nos interessa para os fins deste trabalho.
Resolvendo a integral da equação
(10) temos o seguinte resultado:
b
(11)
2
ʃ ƒ(x)dx = [ 2(x –x ) ƒ(x ) + 2(x –x ) ƒ(x ) ]
(x–x1)
(x–x0)
0
0
a
b
ʃ ƒ(x)dx =
a
(x1–x0)
2
1
1
1
0
x1
x0
(12)
[ ƒ(x0)+ ƒ(x1)]
O resultado descrito pela equação
(12) é denominado Regra do Trapézio (Burden e Faires, 2008), e é utilizado para aproximar áreas de curvas as quais as primitivas
não existem ou são muito difíceis de ser calculadas.
Para o cálculo da área sob a curva
ROC, abordado neste trabalho, foi aplicada
esta técnica, da seguinte forma:
Cada segmento de reta que une um
ponto da curva a outro (1-Especificidade,
Sensitividade) é como um polinômio interporlador linear de Lagrange. Dessa forma, a técnica foi aplicada entre cada dois pontos da
curva e depois foram somadas as áreas dos
trapézios resultantes de cada vez que a regra
foi aplicada entre cada dois pontos da curva,
obtendo-se assim uma aproximação da área
total abaixo da curva.
Metodologia Aplicada
Foram geradas 35.000 bases aleatórias de clientes com distribuição normal de
escores. Para obter resultados com diversos
poderes de discriminação, foram variadas as
médias de escore dos clientes adimplentes e
inadimplentes, mantendo a mesma variância.
Também foram simulados diversos níveis de
inadimplência para cada amostra.
Para cada amostra foi calculado o indicador AUROC de acordo com as três metodologias descritas acima, considerando dados agrupados e não agrupados.
Resultados Obtidos
Para verificar se o indicador é influenciado pelo índice de inadimplência, foi
utilizado o Coeficiente de Correlação de Pearson. O resultado é apresentado na tabela 1.
De acordo com o coeficiente correlação de Pearson, o indicador AUROC não é
impactado pelo índice de inadimplência em
nenhum algoritmo de cálculo.
Tabela 1
Técnica para cálculo
do AUROC
Dados
Coeficiente de Pearson
P-valor
Aproximação da área
(PROC EXPAND)
Agrupados
Não-Agrupados
-0.00233
0.00016
0.6623
0.9758
Derivado do Teste de MannWhitney-Wilcoxon (MWW)
Agrupados
Não-Agrupados
-0.00057
-0.00053
0.9158
0.9212
Aproximação pela
Regra do Trapézio
Agrupados
Não-Agrupados
-0.00002
-0.00007
0.9969
0.9892
19
A seguir, apresentamos a comparação do resultado de cálculo do AUROC
de acordo com as três propostas de cálculo considerando os dados agrupados e não
agrupados.
O AUROC derivado do Teste de
Mann-Whitney-Wilcoxon (MWW) não tem
impacto quando consideramos os dados
não agrupados.
A utilização da metodologia por
aproximação de área utilizando a PROC
EXPAND do SAS apresentou divergência para a utilização de dados agrupados,
principalmente para valores maiores de
AUROC, ou seja, para valores que indicam
alta acurácia. Também foram observados
valores fora do intervalo esperado para o
indicador, abaixo de 0,5 e acima de 1.
Apesar da metodologia por aproximação pela regra do trapézio não apresentar muito impacto na utilização de dados agrupados, foram observados valores abaixo de 0,5 para o indicador AUROC,
considerados inviáveis.
20
A seguir, apresentamos a comparação do resultado de cálculo do AUROC
cotejando as três propostas de cálculo para
os dados agrupados e não agrupados.
Os gráficos ao lado mostram que a
utilização de dados agrupados possui influência no cálculo do indicador pelo método de
aproximação de área.
O cálculo do AUROC pela regra do
trapézio e pela derivação do Teste de Mann-Whitney-Wilcoxon (MWW) são aproximados.
Porém, a regra do trapézio apresenta valores fora do intervalo tanto para os dados não
agrupados como para os dados agrupados.
Conclusão
Os resultados apresentados neste
estudo indicam que a melhor metodologia
para o cálculo do indicador AUROC é pela
derivação da estatística do Teste de Mann-Whitney-Wilcoxon (MWW). Este método de
cálculo não apresenta valores fora do intervalo esperado para o indicador e não é impactado na utilização de dados agrupados.
Autores
21
Líneke Clementino Sleegers Rocha
Formada em Estatística pela Universidade de Brasília e Tecnologia em Processamento de Dados pela Universidade Católica de Brasília com pós graduação em Métodos Quantitativos pela Universidade Paulista, MBA
em Controladoria pela Universidade Católica de Brasília e Mestrado em Economia pela Universidade Católica de Brasília. Gerente Executivo da área de Monitoração dos Modelos de Risco da Caixa Econômica Federal.
[email protected] ou [email protected]
Estudante de Estatística da Universidade de Brasília - UnB, estagiário na área de Monitoração dos Modelos de
Referências
Risco da Caixa Econômica Federal. [email protected]
BURDEN, R.L. FAIRES, J.D. Derivação e Integração Numérica. In:____. Análise Numérica. Traduzido por All
Tasks. São Paulo: Cengage Learning, 2008. p. 161-237.
CONOVER, W.J. Some methods based on ranks. In:____. Practical Nonparametric Statistics. New York:
John Wiley & Sons Inc., 1999. p. 269-427.
MOZER, Michael C. Optimizing classifier performance via an approximation to the Wilcoxon-Mann-Whitney
statistic. 2003.
RANDLES, R.H. WOLFE, D.A. Distribution-free statistics. In:____. Introduction to the Theory of Nonparametric Statistics. New York: John Wiley & Sons, Inc., 1979. p. 30-60.
SAS Institute Inc. SAS/ETS® 13.1 User’s Guide. Cary, NC: SAS Institute Inc., 2013.
22
Modelo de Behavior Scoring
em uma Empresa de
Telecomunicações Brasileira
Luiz Carlos Duclós
23
Resumo
Este estudo tem como objetivo construir um Behavior
Scoring de modo a determinar a probabilidade de inadimplência de um cliente, a partir de seu comportamento de pagamentos e uso. Os dados foram coletados junto a uma empresa do
setor de telecomunicações brasileira, com os quais, desenvolveu-se um modelo de Behavior Scoring, por meio da técnica multivariada de Logit binomial. As probabilidades de inadimplência
obtidas propiciaram a divisão dos clientes em vinte classes de
risco e, a partir dessas, foi empregada a métrica do Value at
Risk (VaR), que permitiu originar quatro segmentos diferenciados. Com isto foram alcançadas melhores oportunidades de
mercado para a organização, possibilitando gestão de seus recursos de forma adequada e voltada a resultados financeiros
positivos.
Palavras-chave: Behavior Scoring, Credit Scoring, Inadimplência.
1. Introdução
Mudanças no mercado financeiro
global e o grande volume de perdas em empréstimos geraram uma crescente preocupação com o risco de crédito. Caouette, Altaman, Narayanan, (2009) ressaltam que o gerenciamento desse risco é o próximo grande
desafio financeiro para as organizações.
Segundo Castro Junior (2003), as
questões relativas às dificuldades financeiras de empresas têm grande importância para
um público diversificado como instituições financeiras, especialistas em investimentos, investidores em geral, auditores contábeis, consultores, gestores de empresas, acadêmicos,
pesquisadores e estudantes de escolas de negócio, dado que os modelos estatísticos de
previsão tornaram-se ferramentas poderosas,
que podem ajudar esses segmentos a terem
informações que levem à tomada de decisões
estratégicas nas organizações.
Segundo Abdou e Pointon (2011),
os modelos de Credit Scoring estão cada vez
mais sendo utilizados pelas instituições financeiras especialmente bancos com a finalidade de reduzir os custos do processo para
a concessão do crédito; diminuir o risco de
inadimplência e o tempo no processo de decisão do crédito bem como amenizar o esforço dos funcionários aos quais são atribuídas
essas atividades.
Para Bemmann (2005), a habilidade para prover predições valiosas de inadimplência é de grande importância tanto sob o
ponto de vista individual como coletivo. Sob
uma perspectiva individual, proprietários,
empregados, clientes, e outras contrapar-
24
tes, em particular de instituições financeiras,
têm-se interessado em predições da inadimplência precisas, pois trata-se de uma condição prévia e fundamental para tornar os custos de crédito mensuráveis. Melhora-se, assim a relação custo-benefício do processo
de concessão de crédito, além de aumentar a liquidez dos ativos, incrementar o gerenciamento dos riscos e, determinar e controlar demandas de capital econômico. Sob
uma perspectiva coletiva da economia nacional, o emprego da predição da inadimplência é uma ferramenta poderosa para garantir
a inteira estabilidade do sistema financeiro e
para a implantação de condições de empréstimo de risco que são um incentivo à atividade creditícia.
Os modelos de crédito podem ser
utilizados para a decisão das melhores estratégias de cobrança. Se, por exemplo, o modelo indicar que o tomador está com problemas
de liquidez de curto prazo, pode-se elaborar
uma solução adequada a esse perfil, como
um parcelamento do montante da dívida (CAOUETTE, ALTMAN, NARAYANAN, 2009).
Conforme ressaltam Alvarez, Gatschet, Morrison ( 2007), o uso de agrupamentos em risco de crédito aumenta a precisão
dos processos de crédito e, com isso, se obtém uma melhoria no desempenho organizacional. Sendo assim, a modelagem do risco de inadimplência proposta neste trabalho traz benefícios teóricos e práticos, a saber: ampliação do referencial empírico sobre
o gerenciamento quantitativo do risco de crédito e/ou inadimplência em um setor que está
passando por bruscas transformações e busca diferenciais competitivos.
Este artigo está organizado em cinco
capítulos: 1- Introdução; 2 -Fundamentação
Teórica; 3- Metodologia; 4- Apresentação e
Análise de Dados e 5- Considerações Finais.
2. Fundamentação Teórica
2.1 Credit Scoring
Os autores Emel, Oral, Reisman
(2003) destacam que o risco potencial de um
cliente pode ser medido por modelos internos de scoring. Eles determinam se um tomador tem a capacidade de honrar o pagamento da dívida, avaliando o seu risco de crédito.
Esses modelos baseiam-se em dados históricos e técnicas estatísticas. Modelos conceitualmente saudáveis, empiricamente validados, apoiados em bons dados históricos, entendidos e implementados, aumentam o sucesso empresarial da qualidade de crédito.
Os modelos de scoring compreendem uma das principais ferramentas formais
de suporte à concessão de crédito. Seu desenvolvimento baseia-se, de maneira geral,
na construção de um procedimento rigoroso
para descrever quais das características dos
clientes estão relacionadas significativamente com o seu risco de crédito e qual a intensidade e direção desse relacionamento. A idéia
central desses modelos consiste na geração
de um score (ou um grupo de scores) por meio
dos quais os clientes potenciais possam ser
ordenados segundo a sua chance de inadimplência (LOUZADA NETO, 2006).
Os sistemas de decisão de crédito
baseados em dados objetivos e quantitativos
vieram substituir as metodologias de análise
julgamental. Os modelos seminais de Credit
Scoring são baseados em informações de dados contábeis das empresas. No entanto, as
análises são realizadas a partir de dados univariados, ou seja, a partir de uma única variável preditora, o que conduz a índices insatisfatórios de qualificação creditícia (CAOUETTE, ALTMAN, NARAYANAN, 2009).
Os sistemas de Scoring são conjuntos de regras racionais, objetivas e quantitativas, obtidas por meio de técnicas de otimiza-
25
ção e de estatísticas multivariadas.
Os modelos de Credit Scoring são
divididos em duas categorias: modelos de
aprovação de crédito e modelos de escoragem comportamental, conhecidos por
Behavioural Scoring (SAUNDERS,
2000).
Os modelos de aprovação de crédito, que podem ser do tipo Credit Scoring, utilizado para o crédito puro e simples e Pré Screening, que serve para efetuar pré-aprovações
em listas adquiridas no mercado (CAOUETTE, ALTMAN, NARAYANAN, 2009).
Modelos de Credit Scoring têm a vantagem de ser relativamente baratos para implementar e não sofrer com a subjetividade e
inconsistência de sistemas especialistas (ALLEN, DELONG, SAUNDERS, 2004).
Os modelos de “escoragem” comportamental, também denominados Behavior
Scoring, Fraud Score, Collection Score, Churn,
entre outros, são utilizados com a finalidade de aumentar a lucratividade das contas,
sujeitando-as aos diferentes tratamentos de
atendimento e métodos de cobrança diferenciados. Esses modelos se baseiam em análises estatísticas do perfil de consumo e hábitos de pagamento do cliente (CAOUETTE,
ALTMAN, NARAYANAN, 2009).
Thomas (2000) esclarece as diferenças entre modelos de aprovação de crédito e
modelos de escoragem comportamental. Segundo ele, os modelos de Credit Scoring são
ferramentas que dão suporte à tomada de
decisão sobre a concessão de crédito para
novas aplicações ou novos clientes. Já os modelos Behavior Scoring auxiliam na administração dos créditos já existentes, ou seja, aqueles clientes que já possuem uma relação creditícia com a instituição.
Desta forma, enquanto o principal
objetivo dos modelos de aprovação de crédito
é estimar a probabilidade de um novo solicitante de crédito se tornar inadimplente com a
instituição, em determinado período, os modelos de escoragem comportamental objetivam estimar a probabilidade de inadimplência de um cliente que já possui um produto
ou crédito com a instituição.
A próxima seção detalha o modelo
Behavior Scoring - tema central deste artigo.
2.2 Behavior Scoring
Os sistemas de Behavior Scoring permitem aos financiadores tomar melhores decisões na administração de sua carteira de
clientes, possibilitando prever o seu desempenho futuro. As decisões que podem ser tomadas para cada cliente específico incluem
a adequação do limite de crédito, quais novos produtos podem e/ou devem ser comercializados e como administrar uma eventual
inadimplência e consequente recuperação
da dívida (THOMAS, 2000).
O modelo de Behavior Scoring é um
sistema de pontuação com base na análise
comportamental do cliente; sua elaboração é
complexa, pois costuma envolver grandes volumes de informação, gerando uma gama extensa de variáveis a serem analisadas (SECURATO, 2002).
Estes modelos são empregados
para descrever o comportamento de clientes existentes e também predizer a sua futura inadimplência, baseados nas variáveis do
comportamento do indivíduo como cliente da
própria empresa (HSIEH, 2004).
Hsieh (2004) explica que uma das
vantagens do modelo de Behavior Scoring é
que a empresa, ao invés de conceder tratamento igualitário ou mesmo prover de incentivos todos os seus clientes, pode selecionar
apenas aqueles que se encaixam em critérios
de rentabilidade baseados no seu comporta-
26
mento de compras e pagamentos.
Os modelos de Behavior trazem, de
acordo com Thomas (2000), uma informação
adicional, se comparados aos modelos de
Credit Scoring que é o comportamento de pagamento do cliente ordenado no tempo.
Hsieh (2004), em seu estudo sobre
Behavior Scoring, utilizou dados de clientes de
cartões de crédito de um emissor de Taiwan.
O autor desenvolveu o modelo utilizando informações comportamentais dos clientes divididas em dois períodos: um período de 12
meses de observação, onde foram coletadas
as informações sobre as faturas dos clientes e um período subsequente também de 12
meses, onde foi examinado o pagamento das
referidas faturas.
As variáveis preditoras, derivaram
de transformações do banco de dados, como
máximo, mínimo e média de um conjunto de
informações (por exemplo: valor pago, dias
de atraso, número os cartão de crédito por
cliente, valor da fatura, parcelamentos, e assim por diante) para cada atividade mensal
registrada.
Lim e Sohn (2007) combinaram, em
seu estudo sobre risco na utilização de cartões de crédito na Coréia, variáveis demográficas e variáveis de comportamento para desenvolver um sistema de previsão à inadimplência. Hair, Babin, et al. (2005) explica que
no modelo de avaliação de crédito da consultoria Fair Isaac Company, conhecido como
FICO, em torno de 30% a 35% das variáveis
correspondem ao histórico de pagamentos e
valor da dívida do consumidor.
Brice e Maury, (2006) afirmam que a
natureza das atitudes de pessoas e seus hábitos de utilização de dinheiro, adicionados
de suas informações demográficas, podem
ser variáveis discriminatórias do seu comportamento de risco de crédito.
O artigo sobre ratings de seguradoras, Gestel (2007), enfatiza a importância de
construtos que traduzem o comportamento
creditício das empresas estudadas. Os autores realizaram a seleção prévia das variáveis
explicativas selecionadas: conhecimento empírico dos analistas financeiros e baseado em
literatura disponível, resultando em dados de
dívida, liquidez, desempenho, fluxo de caixa e
tamanho da companhia.
Thomas (2000) explica que os modelos de Behavior Scoring podem ser divididos em duas categorias: os modelos que
são variações dos modelos de Credit Scoring,
apenas adicionados de variáveis comportamentais e os modelos que procuram prever
o comportamento futuro com base no comportamento passado. O segundo grupo pode
ser subdividido pela forma que a informação
para calcular os parâmetros é obtida: os modelos que utilizam o comportamento de uma
amostra prévia de clientes ou os desenvolvidos por métodos Bayesianos, que atualizam
a condição do cliente com base em seu próprio comportamento.
Brice, Maury (2006) desenvolveram
um modelo de Behavior com o propósito de
prever a inadimplência de membros da força
aérea americana, baseado em informações
demográficas, econômicas e variáveis psicológicas dos indivíduos. As variáveis econômicas diziam respeito a indicadores como: renda, número de apontamentos negativos (restritivos ou débitos no mercado) e valor total
da dívida. As variáveis psicológicas eram, por
exemplo, satisfação com a própria vida, gosto por compras, opinião sobre o dinheiro, entre outras.
O modelo de Brice, Maury (2006) foi
gerado estatisticamente por meio de uma
análise Logit e obteve uma acuracidade máxima de 80,59%.
27
No entanto, os próprios autores admitem a dificuldade de se obter informações
de características psicológicas, pois necessitam de entrevistas e normalmente são dados
que não estão listados em bancos de dados
das organizações.
A escolha de horizonte de tempo é
provavelmente mais crítica para os modelos
de Behavior do que para os modelos de Credit Scoring. Vale destacar que o Behavior está
tentando desenvolver um sistema de previsão longitudinal usando dados cross-seccionais, ou seja, a condição de um cliente ao término do período de observação e ao término
do período de desempenho. Assim, o tempo
entre esses períodos é um fator crucial para o
desenvolvimento de sistemas mais robustos
(THOMAS, 2000).
A experimentação (e a limitação de
dados) normalmente sugere o uso de um período de 12 ou 18 meses. Alguns pesquisadores utilizam um período mais curto, como por
exemplo, 6 meses.
Hsieh (2004) assim como Lim e Sohn
(2007) alertam que a análise dos dados das
organizações para a administração do comportamento dos clientes é uma tarefa bastante complicada. Os bancos de dados são de
características multidimensionais, e têm registros das movimentações diária e mensais
dos clientes.
a. Delineamento da Pesquisa
A partir do objetivo proposto para
o trabalho, a pesquisa se caracteriza como
Pesquisa Descritiva, uma vez que procura
determinar qual a influência que as variáveis
independentes ou explicativas exercem sobre a variável dependente (GIL, 1994). Com relação ao método de investigação, a pesquisa
proposta refere-se a uma Pesquisa de Levantamento, em função de destinar-se ao estudo
dos fatos que influenciam as interações entre
pessoas ou fatos em sua vida diária Selltiz et
al., (1987), com o objetivo de avaliar a incidência relativa, distribuição e inter-relações de
fenômenos que ocorrem naturalmente (KERLINGER, 1980).
Em termos de perspectiva de análise, apresenta delineamento Longitudinal,
pois os pesquisadores medem ao longo de
certo tempo, a tendência dos dados aplicados num determinado participante, antes
do tratamento experimental, no momento da intervenção e após o tratamento ser
aplicado (SELLTIZ, WRITSMANN e COOK,
1987). Não havendo interesse em manipular os fenômenos em análise, e com o interesse de conhecer a natureza do fenômeno, sua composição e processos que o
constituem, o estudo proposto também é
definido como pesquisa ex-post-facto (KERLINGER, 1980; RICHARDSON, 1999).
3. Metodologia da Pesquisa
b. População e Amostra
A população em estudo é constituída por clientes residenciais CPF da empresa “TELE”, possuidora de pelo menos uma linha telefônica de voz ativa há no mínimo quatro meses.
A seleção da população segue o esquema proposto por Andrade (2004), em que
as informações são subdivididas em:
(a) período de observação que cor-
A referida pesquisa limita-se ao estudo em somente uma organização do setor de
telecomunicações, situada na região sul do
Brasil. Procurou-se unicamente avaliar o relacionamento entre os comportamentos de pagamentos passados e a inadimplência futura dos consumidores residenciais CPF que se
utilizam dos serviços de telefonia fixa a partir
de terminais de voz e dados.
28
responde ao período histórico no qual são observadas as características preditivas do consumidor, neste caso, o comportamento de faturamentos (valores gastos, valores pagos,
débitos e ajustes) e características do produto adquirido, correspondendo aos quatro meses anteriores ao mês de referência e;
(b) período de desempenho que é a
performance de crédito do cliente avaliado,
ou seja, o tempo entre a data de vencimento
da fatura e seu pagamento, que permite classificá-lo entre bom, mau ou indeterminado.
Nesta pesquisa, o período de desempenho
avaliado é o horizonte de seis meses após o
mês de referência.
Foram selecionados quatro meses
de referência: abril, julho e outubro de 2006
e janeiro de 2007, sendo estes escolhidos por
serem os primeiros meses dos trimestres
contábeis dos respectivos anos.
Fazem parte do estudo apenas
clientes residenciais que já completaram
pelo menos quatro meses de faturamento
no mês de referência, que estavam com a
linha ativa e que não possuíam atraso su-
perior a 30 dias no mês de referência.
c. Variáveis
A performance do cliente (ou inadimplência), que é a variável resposta, é medida
em número de dias de atraso durante o período de desempenho. Esta é a variável que
classifica o cliente entre Bom e Mau e se
constitui na variável explicativa da modelagem dos dados.
Os índices que se pretende trabalhar para explicar a inadimplência são informações sobre as faturas e o produto adquirido pelos clientes em estudo e estão especificados no Quadro 1.
Os dados das faturas foram trabalhados com indicadores de: média, soma, taxa
de crescimento nos meses de observação,
variação mensal e valor bruto.
d. Métodos de Análise
A análise exploratória dos dados foi
conduzida em uma análise fatorial que é uma
ferramenta estatística utilizada para avaliar
dados (um só conjunto por vez), permitindo
Quadro 1: Variáveis Explicativas do Estudo
Variável
Descrição
Tipo de plano
É o tipo de produto de voz que o cliente possui. Pode ser do tipo Básico, Especial, Economix ou Unique. Cada tipo de plano possui tarifação e composição
diferenciada. Todo cliente deve possuir pelo menos um tipo de produto de voz.
Tipo de internet
Descreve o tipo de acesso do cliente à internet. Pode ser acesso tipo ADSL,
internet discada exclusiva, ou nenhum acesso específico.
Valor da fatura
Valor total da fatura emitida para o cliente.
Valor pago
Valor total pago pela fatura do cliente. Não é necessariamente igual ao valor
total da fatura.
Valor do ajuste
O ajuste de faturas é concedido se o cliente discorda dos valores cobrados e
a empresa comprova o erro interno. Esta variável demonstra o valor do ajuste,
caso tenha havido algum.
Saldo devedor
Saldo em aberto que o cliente possui devido ao não pagamento da fatura.
Dias de atraso máximo
É o número máximo de dias que as faturas nos meses permaneceram sem
pagamento. É apresentada em dias corridos.
Fonte: Os Autores, 2013.c
29
sintetizar as informações de um grande número de variáveis em um número menor de
fatores (HAIR, BABIN, et al., 2005).
Para a construção do modelo de
Behavior Scoring foi utilizada a técnica estatística multivariadas de análise de regressão logística binomial. Essa técnica tem por objetivo
buscar e comprovar estatisticamente relações
entre variáveis de qualquer natureza, e estimar
essa relação por meio de dados empíricos.
Em seguida, os clientes foram segmentados pela métrica do Value at Risk (VaR),
com abordagem delta normal (ou analítico) proposta por (CROUHY, GALAI, MARK,
2004). Essa abordagem permite o emprego
direto das classes encontradas e considera
que o mercado opera sob condições históricas. Ela pressupõe, quando aplicada a dados
históricos de ações, a normalidade das taxas
de retornos.
As análises foram executadas nos
softwares SPSS 16.0 e Clementine 11.1.
4. Apresentação e Análise
dos Dados
O presente capítulo apresenta os resultados obtidos a partir do dados coletados.
Abordou-se a análise descritiva dos dados, a
análise fatorial, o modelo Logit binomial, e a
análise VaR.
a. Análise Fatorial Exploratória
O passo inicial na análise dos dados
é a verificação dos coeficientes de correlação
entre as variáveis disponíveis, com a finalidade de encontrar as colinearidades significativas e, se possível, excluí-las, evitando, assim,
problemas futuros de multicolinearidade.
Por meio da análise do nível de significância dos coeficientes de correlação de
Pearson da matriz originada pelo cruzamento
das 57 variáveis explicativas estudadas, identificou-se uma correlação estatisticamente
significante em grande parte das variáveis.
Este fenômeno explica-se pelo fato de que as
variáveis foram construídas a partir de um corte longitudinal, ou seja, foram considerados os
dados das faturas dos clientes mês a mês.
Desta maneira, não é possível excluir
as variáveis somente com o estudo da correlação. Para solucionar o problema do alto relacionamento entre as variáveis, foi executado um procedimento de análise fatorial dos
dados, objetivando encontrar componentes
derivadas das informações estudadas não
correlacionadas entre si.
Foram originados 18 componentes
principais, a partir das 48 variáveis originais
com correlação mais significante. A Tabela 1
mostra os componentes encontrados e o poder explicativo de cada um deles.
b. Formulação do Modelo de
Behavior Scoring e Avaliação
Com o objetivo de construir o Behavior Scoring de modo a determinar a probabilidade de inadimplência de um dado cliente,
a partir de seu comportamento de pagamentos, foi estimado um modelo de regressão logística binomial.
Para isso, a variável dependente foi
especificada como BOM e MAU (RESP) que
determina a inadimplência do cliente, como
uma função do número de dias de atraso,
conforme evidenciado na Tabela 2.
Dessa forma, os clientes com atraso
superior a 60 dias, foram classificados como
MAUS, isto é, considerou-se como inadimplente aquele indivíduo com dívidas em aberto há mais de dois meses. Sendo assim, o
modelo especificado visa prever a probabilidade de o cliente passar de 60 dias do vencimento da fatura sem que ele tenha feito o
30
Tabela 1: Componentes Principais
Componente
% Variância
% Acumulado
VLFAT_N; VLFAT_N1;
VLFAT_N2; VLFAT_N3;
VLFAT_N4; CRES_FAT e
DIF_VLRFAT
Variáveis originais
CP_VLRFAT_1
67,093%
67,09%
CP_VLRFAT_2
16,002%
83,10%
D_VLRFAT_43; D_VLRFAT_32; D_VLRFAT_21 e
D_VLRFAT_10
CP_VLRFAT_3
27,992%
27,99%
CP_VLRFAT_4
25,460%
53,45%
VLPGO_N; VLPGO_N1;
VLPGO_N2; VLPGO_N3;
VLPGO_N4; CRES_PGO e
DIF_VLRPGO
CP_VLRPGO_1
69,228%
69,23%
CP_VLRPGO_2
14,954%
84,18%
D_VLRPGO_43; D_VLRPGO_32; D_VLRPGO_21 e
D_VLRPGO_10
CP_VLRPGO_3
25,229%
25,23%
CP_VLRPGO_4
25,117%
50,35%
CP_VLRDEV_1
58,807%
58,81%
CP_VLRDEV_2
19,002%
77,81%
CP_VLRDEV_3
26,160%
26,16%
CP_VLRDEV_4
25,350%
51,51%
VLADJ_N; VLADJ_N1;
VLADJ_N2; VLADJ_N3;
VLADJ_N4; CRES_ADJ e
DIF_VLRADJ
CP_VLRADJ_1
37,271%
37,27%
CP_VLRADJ_2
20,593%
57,86%
CP_VLRADJ_3
16,108%
73,97%
D_VLRADJ_43; D_VLRADJ_32; D_VLRADJ_21 e
D_VLRADJ_10
CP_VLRADJ_4
26,160%
26,16%
CP_VLRADJ_5
25,350%
51,51%
CP_DIASATRASO_1
67,521%
67,52%
VLDEV_N; VLDEV_N1;
VLDEV_N2; VLDEV_N3;
VLDEV_N4; CRES_DEV e
DIF_VLRDEV
D_VLRDEV_43; D_VLRDEV_32; D_VLRDEV_21
e D_VLRDEV_10
DIASATRASO_N1;
DIASATRASO_N2;
DIASATRASO_N3 e
DIASATRASO_N4
Fonte: Os Autores, 2013.c
Tabela 2: Definição de BOM e MAU (RESP)
BOM e MAU (dias de atraso)
Menor ou igual a 30 dias
Tipo
RESP
% BM (população)
BOM
0
63,0%
31 a 60 dias
INDETERMINADO
2
14,6%
61 a 90 dias
MAU
1
2,6%
Superior a 90 dias
MAU
1
5,8%
Fonte: Os Autores, 2013.
31
pagamento, gerando assim o evento de bloqueio total na linha telefônica.
Vale salientar que a classe denominada como INDETERMINADO foi excluída
da amostra usada no desenvolvimento do
modelo, sendo utilizada na análise de rentabilidade realizada posteriormente.
Para efetuar a modelagem dos dados, utilizou-se a técnica de amostragem
aleatória estratificada não uniforme, pois o
percentual de clientes classificados como
BONS na população situava-se em patamares muito superiores ao número de MAUS.
Esta desproporção pode resultar em um
viés do modelo para explicar melhor as características dos clientes BONS; como o objetivo deste estudo é prever a inadimplência, foram igualadas as proporções dos dois
tipos de resposta, para que o modelo resultante possa também identificar os atributos
de comportamento tanto dos MAUS quanto dos BONS clientes. A Tabela 3 especifica as quantidades da amostra de desenvolvimento por tipo de cliente, comparando-as
com a população total.
Realizou-se a modelagem utilizando o procedimento de seleção de variáveis
Forward Stepwise, que constrói o modelo avançando passo a passo. Para o desenvolvimento do modelo foram utilizados 21 passos onde
foram incluídas as variáveis que agregassem
maior significância estatística aos índices do
modelo. O critério de parada para a inclusão
foi o acréscimo significativo de melhoria na
estatística -2LL. Este procedimento foi realizado no software Clementine 11.1.
O modelo final encontrado, em sua
forma funcional está especificado nas equações (1) e (2). Para facilitar o entendimento do
resultado da análise, transformando assim a
probabilidade em um scoring de crédito, o valor resultante da equação foi multiplicado por
1.000, conforme demonstrado na equação (3):
Foram incluídas 19 variáveis no modelo final, todas elas com significância estatística menor que 5% para a estatística de Wald.
A análise dos erros do modelo está
evidenciada na Tabela 4, que representa a
matriz de confusão dos valores preditos versus os valores observados, e indica que o poder de predição demonstra um nível de acerto de quase 80%. O erro Tipo I (verdadeiro/
falso), ou seja, o percentual de clientes classificados como BONS, mas, que são conhecidamente MAUS situou-se em torno de
14,6%. Já o erro Tipo II (falso/verdadeiro), que
representa os clientes reconhecidamente
BONS que foram classificados como MAUS
situa-se em torno de 26,5%.
Calculou-se o percentual de acerto do modelo na população total do estudo.
A Tabela 5 evidencia que o modelo consegue prever corretamente o comportamento de adimplência/inadimplência de 84% dos
Tabela 3: Amostragem Aleatória Estratificada Não Uniforme porTipo de Cliente
RESP
Amostra de Desenvolvimento
#
População Total
%
#
%
BOM ( 0 )
38.913
49,9%
586.594
88,2%
MAU ( 1 )
39.123
50,1%
78.172
11,8%
TOTAL
78.036
664.766
32
1
1+ ez
(1)
P (inadimplência) =
(2)
zi=0,2850 – 0,4120xiTURB0 – 0,2270xiD_VLRFAT_M0 – 0,0680xiD_VLRDEV_M0
i
– 0,0230xiM_ADJ_4M + 0,120xi D_VLRADJ_M0 – 0,0810xiCP_VLRFAT_1
– 0,0330xiCP_VLRFAT_2 + 0,390xiCP_VLRFAT_3 + 0,0270xiCP_VLRFAT_4
– 0,1700xiCP_VLRPGO_2 + 0,0390xiCP_VLRPGO_4 + 0,7110xiCCP_VLRDEV_1
– 0,4780xiCP_VLRDEV_2 + 0,4180xiCP_VLRDEV_3 + 0,4880xiCP_VLRDEV_4
+ 0 6900xiCP_VLARADJ_1 + 0,2540xi CP_VLARADJ_3 + 0,1170xi CP_VLARADJ_4
+ 0,15880xiCP_DIASATRASO_1
escore(ei )=1 – (P (inadimplência)i *1.000)
(3)
Tabela 4: Percentual de Acerto do Modelo Logit Binomial - Amostra de Desenvolvimento
a posteriori
MAU
a priori
BOM
TOTAL
BOM
33.213
85,4%
5.700
14,6%
38.913
49,9%
MAU
10.356
26,5%
28.767
73,5%
39.123
50,1%
TOTAL
43.569
55,8%
34.467
44,2%
78.036
% acerto total: 79,4%
% erro total: 20,6%
clientes da empresa. O acerto maior situa-se
nos clientes que tiveram atrasos inferiores a
30 dias, ou seja, os BONS clientes: 85,4%. Na
classificação dos MAUS, ou seja, os clientes que tiveram atraso superior a 60 dias nos
seis meses posteriores ao mês de referên-
cia, o acerto situou-se em torno de 74,1% para
aqueles que chegaram a atraso entre 61 dias
e 90 dias e 73,2% e os que apresentaram atrasos superiores a 90 dias.
Na tabela 5 também está demonstrado a classificação dada pelo modelo aos
33
Tabela 5: Percentual de Acerto do Modelo Logit Binomial – PopulaçãoTotal
Classificação pelo Modelo
BOM
MAU
Dias de Atraso
Tipo
RESP
População
#
%
#
%
Menor ou igual a 30 dias
BOM
0
586.594
500.720
85,4%
85.874
14,6%
31 a 60 dias
INDET
2
135.568
45.802
33,8%
89.766
66,2%
61 a 90 diaS
MAU
1
23.822
6.179
25,9%
17.643
74,1%
Superior a 90 dias
MAU
1
54.350
14.571
26,8%
39.779
73,2%
800.334
567.272
70,9%
233.062
29,1%
% acerto total: 84,0%
% erro total:16,0%
Tabela 6 – Distribuição dos Clientes por Classe de Risco na PopulaçãoTotal
Classes
de Risco
Até 30 dias
de atraso
31 a 60 dias
de atraso
61 a 90 dias
de atraso
#
#
#
%
%
%
Mais de 90 dias
de atraso
#
%
TOTAL
#
%
CL1
1.019
0,2%
1.003
0,7%
643
2,7%
7.037
12,9%
9.702
1,2%
CL2
2.197
0,4%
3.357
2,5%
2.256
9,5%
5.266
9,7%
13.076
1,6%
CL3
2.532
0,4%
6.213
4,6%
2.745
11,5%
4.717
8,7%
16.207
2,0%
CL4
3.514
0,6%
9.441
7,0%
2.677
11,2%
4.626
8,5%
20.258
2,5%
CJ5
6.171
1,1%
15.201
11,2%
2.535
10,6%
4.432
8,2%
28.339
3,5%
CJ6
11.144
1,9%
18.224
13,4%
2.147
9,0%
4.209
7,7%
35.724
4,5%
CL7
16.730
2,9%
14.728
10,9%
1.892
7,9%
3.685
6,8%
37.035
4,6%
CL8
21.494
3,7%
12.570
9,3%
1.578
6,6%
3.351
6,2%
38.993
4,9%
CL9
25.873
4,4%
10.755
7,9%
1.390
5,8%
2.954
5,4%
40.972
5,1%
CL10
30.861
5,3%
8.962
6,6%
1.116
4,7%
2.541
4,7%
43.480
5,4%
CL11
35.894
6,1%
7.202
5,3%
963
4,0%
2.232
4,1%
46.291
5,8%
CL12
40.257
6,9%
5.272
3,9%
784
3,3%
1.659
3,1%
47.972
6,0%
CL13
44.202
7,5%
3.714
2,7%
569
2,4%
1.338
2,5%
49.823
6,2%
CL14
47.316
8,1%
3.186
2,4%
493
2,1%
1.131
2,1%
52.126
6,5%
CL15
48.554
8,3%
2.992
2,2%
390
1,6%
1.081
2,0%
53.017
6,6%
CL16
48.908
8,3%
2.769
2,0%
366
1,5%
908
1,7%
52.951
6,6%
CL17
48.543
8,3%
2.768
2,0%
396
1,7%
879
1,6%
52.586
6,6%
CL18
49.256
8,4%
2.581
1,9%
321
1,3%
888
1,6%
53.046
6,6%
CL19
51.147
8,7%
2.409
1,8%
290
1,2%
732
1,3%
54.578
6,8%
CL20
50.982
8,7%
2.221
1,6%
271
1,1%
684
1,3%
54.158
6,8%
586.594
135.568
23.822
54.350
800.334
34
clientes classificados na categoria INDETERMINADO. Esta categoria não entra no
cálculo do acerto geral do modelo, mas será
utilizada posteriormente na análise de rentabilidade.
Este resultado demonstra que a seleção dos clientes pelo modelo Logit Binomial encontrado, produz uma melhoria na
identificação dos possíveis riscos de crédito em 84%. Neste sentido, se forem medidos
apenas os clientes que efetivamente chegaram a inadimplência, a separação criteriosa
proporcionada pelo modelo, reduz o risco de
inadimplência em 73,6% em média, supondo-se que a empresa promova medidas preventivas para os clientes que foram classificados
como potenciais MAUS pagadores.
c. Análise de Rentabilidade
Definido o modelo de Logit binomial
como o modelo de classificação de scores
– Behavior Scoring - para a empresa “TELE”,
partiu-se para o desenvolvimento da análise
de rentabilidade com base no modelo formulado objetivando entender o ganho real financeiro representado pelo modelo descrito.
Esta análise refere-se ao cálculo da
estimativa de perdas financeiras e do percentual de inadimplência (total de clientes inadimplentes/total de clientes) contra a probabilidade estimada pelo modelo formulado. Assim foi
realizado um agrupamento dos clientes com
base nas probabilidades de inadimplência obtidas pelo modelo de Behavior.
As probabilidades foram agrupadas
em categorias, denominadas nesta pesquisa de classes de risco. O critério empregado
para gerar as classes, foi a divisão das probabilidades de modo que cada uma delas contivesse 5% dos dados (da amostra de desenvolvimento), originando 20 classes de risco.
Partindo das classes de risco, foram
geradas as distribuições por tempo de atraso (tipo de cliente) para a população total original do estudo, que estão evidenciadas na
Tabela 6. Verifica-se que a distribuição dos
clientes com maior atraso, está com concentração maior nas classe inferiores (probabilidades menores de adimplência), enquanto
que os com atrasos menores aparecem em
maior número nas classes altas (probabilidades maiores de adimplência).
A Tabela 7 apresenta a distribuição
dos valores faturados e saldo em aberto (devedor) na totalidade dos clientes estudados.
Logo, é possível verificar que a perda total da
empresa nos seis meses subsequentes ao
mês de referência situa-se em torno de 1,3%.
No entanto, nas classes inferiores esta perda alcança níveis muito superiores. Na classe CL1, por exemplo, a perda da classe (que é
o valor faturado sobre o valor não pago dentro da classe de risco) é de aproximadamente 30%, o que representa 25% de total a perda
capitalizada pela empresa no período.
Dessa maneira, se a empresa decidir
agir preventivamente em relação aos clientes
inadimplentes, as três primeiras classes de
risco (CL1, CL2 e CL3), estará empenhando-se em menos de 5% dos clientes (4,9) que representam 43,6% de toda a perda da carteira.
d. Análise VaR
Para embasar a decisão sobre quais
classes de risco devem ser trabalhadas a fim
de adotar ações preventivas de inadimplência e quais devem ser submetidas a iniciativas de marketing, foi realizada a análise da
perda potencial das classes utilizando-se a
métrica Value at Risk (VaR).
Para essa análise foram utilizadas as
20 classes de risco aplicadas na população
total em estudo, incluindo os clientes categorizados como “indeterminados”.
35
Tabela 7 – Distribuição do Valor Faturado e do Saldo Devedor em Seis Meses,
por Classe de Risco, na PopulaçãoTotal em Estudo.
Classes
de Risco
$ Faturado
(A)
$ Devedor
(B)
%Perda
(C = A/B)
% da Perda
Total
% Acum
% Clientes
% Acum
Clientes
CL1
6.559.477
1.919.164
29,3%
25,0%
25,0%
1,2%
1,2%
CL2
9.619.937
797.150
8,3%
10,4%
35,4%
1,6%
2,8%
CL3
1 1.470.829
627.291
5,5%
8,2%
43,6%
2,0%
4,9%
CL4
15.484.413
639.1 19
4,1%
8,3%
52,0%
2,5%
7,4%
CJ5
22.305.614
574.498
2,6%
7,5%
59,5%
3,5%
10,9%
CJ6
27.617.333
555.141
2,0%
7,2%
66,7%
4,5%
15,4%
CL7
28.563.264
469.765
1,6%
6,1%
72,8%
4,6%
20,0%
CL8
29.882.153
408.270
1,4%
5,3%
78,2%
4,9%
24,9%
CL9
30.805.819
328.760
1,1%
4,3%
82,5%
5,1%
30,0%
CL10
32.763.440
270.931
0,8%
3,5%
86,0%
5,4%
35,5%
CL11
35.115.957
229.147
0,7%
3,0%
89,0%
5,8%
41,2%
CL12
35.513.180
161.890
0,5%
2,1%
91,1%
6,0%
47,2%
CL13
34.228.927
130.440
0,4%
1,7%
92,8%
6,2%
53,5%
CL14
33.872.015
106.849
0,3%
1,4%
94,2%
6,5%
60,0%
CL15
33.434.785
91.108
0,3%
1,2%
95,4%
6,6%
66,6%
CL16
32.349.857
85.416
0,3%
1,1%
96,5%
6,6%
73,2%
CL17
34.524.078
67.309
0,2%
0,9%
97,4%
6,6%
79,8%
CL18
36.095.430
75.703
0,2%
1,0%
98,4%
6,6%
86,4%
CL19
39.049.171
60.265
0,2%
0,8%
99,2%
6,8%
93,2%
CL20
41.975.493
64.284
0,2%
0,8%
100,0%
6,8%
100,0%
571.231.171
7.662.500
1,3%
100,0%
100,0%
As variáveis utilizadas para o desenvolvimento da análise VaR foram o Valor Faturado (R$) e o Saldo Devedor (R$) nos seis
meses subsequentes ao mês de referência
N. Dessa maneira, estabeleceu-se que o Retorno de cada cliente é o Valor Faturado menos o Saldo Devedor.
Utilizando-se a técnica proposta por
Crouhy, Galai e Mark (2004), foram calculados
o Retorno crítico (R*), o VaR absoluto (VaR’) e
a partir deles, o VaR de cada classe, para um
nível de confiança de 95%.
A Tabela 8 demonstra o cálculo do
VaR por classe de risco. O VaR para cada
uma das classe de risco, refere-se a perda
máxima esperada de pior hipótese, em um
horizonte de tempo de 6 meses, com 95% de
confiança.
A Tabela 8 evidencia o que o modelo de Behavior Scoring já havia demonstrado:
conforme diminui o score, aumenta a probabilidade de perda e o valor em risco também
aumenta.
As quatro primeiras classes apresentam VaR negativo, o que mostra que o
segmento formado por essas classes, têm
grande potencial de causar problemas financeiras à empresa TELE.
Se a empresa desejar, ao invés de
trabalhar com as 20 classes de risco, ela pode
agrupá-las pelo VaR, caracterizando-as em
quatro grupo distintos:
36
Tabela 8 – Cálculo do VaR por Classe de Risco.
Classe de
Risco
Retorno Crítico (R*)
VaR'
Var
VR*
R + VaR'
1
R$ (2.215,21)
R$ (21.492.003)
R$ (16.851.691)
2
R$ (935,26)
R$ (12.229.402)
R$ (3.406.615)
3
R$ (815,06)
R$ (13.209.678)
R$ (2.366.140)
4
R$ (883,56)
R$ (17.899.255)
R$ (3.053.960)
5
R$ (543,01)
R$ (15.388.409)
R$ 6.342.707
R$ 11.205.921
6
R$ (443,35)
R$ (15.856.271)
7
R$ (516,69)
R$ (19.135.621)
R$ 8.957.878
8
R$ (491,15)
R$ (19.151.287)
R$ 10.322.596
9
R$ (475,01)
R$ (19.462.053)
R$ 11.015.005
10
R$ (393,91)
R$ (17.127.217)
R$ 15.365.292
11
R$ (392,65)
R$ (18.176.152)
R$ 16.710.658
12
R$ (309,55)
R$ (14.849.816)
R$ 20.501.474
13
R$ (255,92)
R$ (12.750.575)
R$ 21.347.912
14
R$ (207,72)
R$ (10.827.503)
R$ 22.937.662
15
R$ (236,27)
R$ (12.526.168)
R$ 20.817.509
16
R$ (218,43)
R$ (11.566.032)
R$ 20.698.410
17
R$ (248,80)
R$ (13.083.251)
R$ 21.373.518
18
R$ (277,47)
R$ (14.718.506)
R$ 21.301.221
19
R$ (225,94)
R$ (12.331.512)
R$ 26.657.393
20
R$ (461,75)
R$ (25.007.720)
R$ 16.903.488
• GRUPO 1 – Classe de Risco 1: caracterizado pela alta perda máxima esperada;
• GRUPO 2 – Classes de Risco de 2 a 4: caracterizado por existir perda máxima esperada,
mas com níveis inferiores ao da classe 1;
• GRUPO 3 – Classes de Risco 5 a 11: caracterizado por existir um valor de retorno positivo, mas com valores individuais de retorno intermediários;
• GRUPO 4 – Classes de Risco 12 a 20: caracterizado pelo valor de retorno mais elevado
para cada cliente individual.
A Tabela 9 apresenta os agrupamentos sugeridos e o VaR total e médio de cada
um deles.
A tabela mostra também o VaR para
cada cliente individual. A perda média por
cliente do grupo 1 é de R$1.736,93 e a do grupo 2, R$178,17. O retorno esperado médio do
grupo 3 é de R$295,09 e do grupo 4, R$409,43.
Neste sentido, fica claro que com esta caracterização a empresa “TELE” pode focar os
seus esforços de maneira segmentada e com
maior adequabilidade das estratégias. Os dois
primeiros grupos, por exemplo, podem ser alvos de campanhas de cobrança e os dois últimos de campanhas de marketing.
5. CONSIDERAÇÕES
FINAIS
Esta pesquisa foi formatada com
o objetivo de construir um Behavior Scoring
de modo a determinar a probabilidade de
37
Tabela 9 – Agrupamento das Classes de Risco por VaR.
Classe
de Risco
Caracterização do
Agrupamento
Qtde de
Clientes
VaR Total
VaR Médio
VaR por
cliente
1
PERDA ESPERADA ALTA
9.702
R$ (16.851.690,58)
R$ (16.851.690,58)
R$ (1.736,93)
2a4
PERDA ESPERADA MÉDIA
49.541
R$ (8.826.714,89)
R$ (2.942.238,30)
R$ (178,17)
5 a 11
RETORNO ESPERADO MÉDIO
270.834
R$ 79.920.057,72
R$ 11.417.151,10
R$ 295,09
12 a 20
RETORNO ESPERADO ALTO
470.257
R$ 192.538.587,92
R$ 21.393.176,44
R$ 409,43
inadimplência de um cliente, a partir de seu
comportamento de pagamentos e uso.
Para isso, foram utilizadas técnicas econométricas e de análise multivariada, que
possibilitaram a construção de um modelo de Behavior Scoring e a segmentação dos
clientes em classes de risco, associadas a
uma probabilidade de inadimplência e a
perda financeira esperada.
O modelo de Behavior Scoring desenvolvido possibilita a compreensão do
fenômeno estudado – a inadimplência na
empresa “TELE” – por meio de informações que separadamente e a olho nu não
apresentavam poder explicativo, colaborando de forma apenas marginal para o entendimento do risco de crédito a que estão
submetidas.
A partir da probabilidade de
inadimplência, foi realizada a separação
dos clientes em classes de risco, possibilitando calcular o VaR desses grupos. Nesta pesquisa, o VaR está definido como
a perda máxima esperada em 8 meses,
com uma confiança de 95%. Dessa maneira, foram obtidos quatro agrupamentos
de clientes com perdas homogêneas dentro dos grupos, mas heterogêneas quando
comparadas entre si.
Esta segmentação possibilita a
empresa “TELE” um tratamento diferenciado dos clientes, com uma acuracidade
maior no que tange a previsão de retorno
sobre o investimento. A organização pode
focar equipes diferenciadas para o tratamento de cada tipo de cliente, baseado na
sua perda esperada. Por exemplo, clientes com retornos esperados elevados, podem ser operados pela equipe de marketing, para ações de up sell ou cross sell; já
grupos com perda esperada devem ser encaminhados para a área de cobrança com
propostas de negociações ou ações rigorosas de arrecadação.
Algumas questões em aberto dizem respeito às métricas empregadas,
pois os pesquisadores assumiram em alguns pontos da dissertação a suposição
de normalidade dos dados. Abre-se um
precedente para testar outras técnicas,
como modelos multivariados de Poisson,
Logit Multinomial ou Redes Neurais, entre
outras e técnicas de cálculo do VaR diferenciadas, como a por simulação de Monte Carlo.
Uma questão interessante que
pode ser abordada de forma mais aprofundada em um estudo posterior é a dos clientes que foram classificados por este estudo como do tipo “indeterminado”, ou seja,
clientes que no período de desempenho
chegaram a ter atraso de 31 a 60 dias. Estes indivíduos podem vir a apresentar características interessantes, capazes de le-
38
Autores
var a conclusões mais assertivas sobre a
inadimplência da organização.
Outro ponto que pode ser trabalhado são as variáveis selecionadas para o
estudo. Um pesquisador é capaz de selecionar uma gama de características e atributos diferenciados que possam traduzir o
comportamento de um cliente.
Especialista em Modelagem em Gestão de Riscos. Mestrado em Administração pela Pontifícia Universidade Católica do Paraná. E-Mail: [email protected]
Professor, Coordenador do Programa de Pós-Graduação em Administração da PUCPR e Bolsista em Produtividade de Pesquisa pelo CNPq. E-Mail: [email protected]
Mestrando em Administração pela Pontifícia Universidade Católica do Paraná. Discente Bolsista pela Capes.
E-Mail: [email protected]
Luiz Carlos Duclós
Ph.D. em Aplicações de Computadores em Engenharia Industrial e Sistemas, 1983, pela University Of Southern
California, Los Angeles, EUA. Professor do Ppad - Programa de Mestrado e Doutorado em Administração da
Referências
Pontifícia Universidade Católica do Paraná. E-Mail: [email protected]
ABDOU, H.; POINTON, J. 'Credit Scoring, statistical techniques and evaluation criteria: a review of the literature. Intelligent Systems in Accounting, Finance & Management, 18, n. 2-3, 2011. 59-88.
ALLEN, L.; DELONG, G.; SAUNDERS, A. Issues in the credit risk modeling of retail markets. Journal of Banking &
Finance, Amsterdam, 28, 2004. 727-752.
ALVAREZ, S.; GATSCHET, J.; MORRISON, J. Identificação de comunidades de dados: uma introdução ao agrupamento de risco de crédito e marketing. Revista Tecnologia de Crédito Serasa, São Paulo, n. 58, Fevereiro 2007.
Referências
39
ANDRADE, Fabio W. M. de. Desenvolvimento de modelo de risco e portfólio para carteiras de crédito a pessoas físicas. São Paulo, 2004. 196 f. Tese (Doutorado em Administração de Empresas) – Escola de Administração de Empresas de São Paulo, Fundação Getúlio Vargas.
BEMMANN, M. Improving the comparability of insolvency predictions. Dresden Discussion Paperin Economics,
8, 2005. Technische Universitat Dresden.
BRICE, S.; MAURY, R. V. Indicators of personal financial debt using a multi-disciplinary behavioral model. Journal
of Economic Psychology, Amsterdam, 27, n. 4, 2006. 543-556.
CAOUETTE, J. B.; ALTMAN, E. I.; NARAYANAN, P. Gestão do risco de crédito. 2ª. ed. Rio de Janeiro: Quality
Mark, 2009.
CASTRO JUNIOR, F. H. F. Previsão de insolvência de empresas brasileiras usando análise discriminante, regressão
linear e redes neurais. Dissertação de Mestrado em Administração - Faculdade de Economia, Administração
e Contabilidade, Universidade de São Paulo, 2003.
CROUHY, M.; GALAI, D.; MARK, R. Gerenciamento de risco: abordagem conceitual e prática: uma visão integrada dos riscos de crédito, operacional e de mercado. Rio de Janeiro: Quality Mark, 2004.
EMEL, A. B.; ORAL, M.; REISMAN, A. A Credit Scoring approach for the commercial banking sector. Socio-Economic Planning Sciences, 37, 2003. 103-123.
GESTEL, T. V. Forecasting and analyzing insurance companies’ ratings. International Journal of Forecasting, 23,
2007. 513-529.
GIL, A. C. Métodos e técnicas de pesquisa social. 5ª. ed. São Paulo: Atlas, 1994.
HAIR, J. F. J. et al. Fundamentos de métodos de pesquisa em administração. Porto Alegre: Bookman, 2005.
HSIEH, N.-C. An integrated data mining and behavioral scoring model for analyzing bank customers. Expert Systems with Applications, 27, 2004. 623-633.
KERLINGER, F. N. Metodologia de pesquisa em ciências sociais: um tratamento conceitual. São Paulo: EPU, 1980.
LIM, M. K.; SOHN, S. Y. Cluster-based dynamic scoring model. Expert Systems with Applications, 32, 2007. 427-431.
LOUZADA NETO, F. Modelagem temporal para Credit Scoring: uma nova alternativa à modelagem tradicional via
análise de sobrevivência. Revista Tecnologia de Crédito Serasa, São Paulo, n. 56, Dezembro 2006.
Referências
40
RICHARDSON, R. J. Pesquisa social: métodos e técnicas. São paulo: Atlas, 1999.
SAUNDERS, A. Medindo o risco de crédito: novas abordagens para o Value at Risk e outros paradigmas. Rio de
Janeiro: Quality Mark, 2000.
SECURATO, J. R. Crédito: análise e avaliação do risco. São Paulo: Saint Paul, 2002.
SELLTIZ, C.; WRITSMANN; COOK. Métodos de pesquisa nas relações sociais. 2ª. ed. SELLTIZ,
WRITSMAN,COOK.: Editora Pedagógica e Universitária Ltda, 1987.
THOMAS, L. C. A survey of credit and Behavioural scoring: forecasting financial risk of lending to consumers. International Journal of Forecasting, 16, 2000. 149-172.
41
Previsão de Inadimplência
na Baixa Renda
42
Introdução
O Governo Federal vem adotando diversas medidas para
erradicar a pobreza no Brasil e a boa notícia é que os sinais do
aumento do poder de consumo na base da pirâmide estão visíveis na proliferação de negócios voltados para a classe D. Nesse
contexto, o aumento do endividamento é explicado pelo descontrole por parte dessa parcela da população que tem agora acesso a bens que nunca teve e que está com alto nível de confiança para o futuro.
Como medir o risco de inadimplência dessa população
que dificilmente possui histórico de crédito, pois a maioria transaciona pequenos valores, mora em regiões de difícil acesso,
será o tema de nossa investigação. O trabalho buscará identificar variáveis que expliquem o comportamento de crédito dessa
classe e, por fim, sugerir um modelo de crédito para a população de Baixa Renda.
Palavras-Chave: Comportamento da População de Baixa
Renda, Modelo Logístico.
Introdução
O Brasil mudou. Na última década
institutos de pesquisas têm acompanhado
de perto a transformação da classe C1. No
início, desacreditada, quase invisível, hoje,
com mais de 104 milhões de pessoas e movimentando aproximadamente R$1,03 trilhão, a classe C representa o verdadeiro
mercado consumidor brasileiro. O investimento em inovação passa a ser fundamental para transformar conhecimento em dinheiro. Dinheiro para quem souber desenvolver produtos, serviços e canais de distribuição que sejam relevantes para um
brasileiro que passou a ser dono de si mesmo e para quem entender que gerar renda
na base da pirâmide é o melhor caminho
para o desenvolvimento sustentável de um
país que será em breve a quinta economia
do mundo (MEIRELLES, 2012).
Não há definição oficial das classes sociais brasileiras e ainda há divergências sobre quem faz parte dela. Para
Prahalad (2005, p. 119), considera-se que o
Brasil estratifica o indivíduo em cinco classes sociais, descrevendo como a base da
pirâmide as classes C, D e E, sendo que a
classe C representa a parcela da população brasileira com renda familiar entre 4 e
10 salários mínimos.
43
Com os dados do Censo Demográfico 2010, os rendimentos foram realocados
em 5 grupos, de acordo com a classificação proposta por Prahalad. A Classe E possui renda de até 2 salários mínimos, representando 73,7% da população, classe D de
2 a 5 salários mínimos com representatividade de 18%, a classe C com 5,7%, a classe
B com 1,9% e a classe A com apenas 0,7%
de representatividade. O gráfico 1 apresenta essa distribuição.
Gráfico 1: Classe Social Brasileira, por Prahalad
73,7%
18,0%
5,7%
até 2 sm
2 a 5 sm
5 a 10 sm
1,9%
0,7%
10 a 20 sm
20 ou + sm
igualmente acaba encarecendo os custos
de acesso;
• População, normalmente, não tem histórico de crédito.
Nesse contexto, como podemos medir o risco de inadimplência dessa população
que dificilmente possui histórico de crédito?
O crescimento exponencial na demanda por crédito solicitada pela população de baixa renda foi possibilitado pelo
bom desempenho da economia, pelas condições positivas de renda e de emprego. Os
sinais de aumento do poder de consumo na
base da pirâmide estão visíveis na proliferação de negócios voltados para esse perfil
de consumidor.
A base da pirâmide movimenta cerca de R$ 881,2 bilhões por ano, com salários, benefícios e crédito. Não é qualquer
produto ou empresa que consegue esse resultado (OSCAR, 2011).
Classe Social
Fonte: IBGE - Censo Demográfico 2010.
Apontado como um público lucrativo, a população de baixa renda espera
que as empresas mobilizem sua capacidade produtiva para atendê-los. Especificamente para o setor bancário, Diniz e Yokomizo (2009) argumentam que levar serviços
financeiros para a população de baixa renda esbarra em três obstáculos principais:
• População transaciona, individualmente,
pequenos valores;
• População localizada geograficamente, de
forma dispersa. Não apenas a dispersão
é um problema, mas também a dificuldade de acesso, já que, mesmo em áreas urbanas, essa população está localizada em bairros de maior risco operacional
- mais afastados do centro e, recorrentemente, com maior criminalidade -, o que,
Gráfico 2: Consumo da Classe D (em R$ bilhões)
Higiene e beleza
Eletrônicos
Transporte
Medicamentos
9,6
10,9
14,8
16
Alimentação
63,8
Fonte: Cetelem, Data Popular, IBGE, Nielsen e Empresas.
Outro indicativo de que houve
crescimento na demanda por crédito, conseguimos visualizar no indicador Serasa
Experian de Demanda do Consumidor por
Crédito, que mensura a procura de crédito por parte dos consumidores. Esse indi-
44
Conceito de Baixa Renda
cativo é construído a partir de uma amostra significativa de cerca de 11,5 milhões de
CPFs, consultados mensalmente na base
de dados da Serasa Experian. Essa quantidade de CPFs consultados refere-se a cadastros especificamente relacionados a
transações que configuram alguma relação creditícia entre os consumidores e instituições do sistema financeiro ou empresas não financeiras.
Os consumidores se animam com
o bom momento da economia e compram
cada vez mais, dessa forma, sua renda fica
comprometida e a inadimplência cresce.
O interesse desse estudo é analisar
variáveis socioeconômicas e comportamentais que consigam explicar a inadimplência
da classe D, um perfil que vive de trabalho
informal e não possui conta bancária, pois
muitos não conseguem comprovar renda e
endereço. Fazer negócios com a população
de baixa renda que não tem fluxo regular de
salários parece ser mais arriscado, comenta Prahalad (2005, p. 162).
O potencial de consumo nas classes populares vinha sendo ignorado pela
maioria das empresas. Não apenas no Brasil, mas em âmbito internacional, o foco das
organizações estava sobre a riqueza dos
mercados de alta renda. Porém, mais recentemente, a atuação junto aos mercados
da base da pirâmide vem crescendo e ganhando importância, e um número cada vez
maior de organizações passou a reconhecer e explorar a enorme oportunidade gerada no mercado de baixa renda. Apesar do
maior foco dado ao mercado popular, tanto
pelas empresas como pela academia, ainda
há uma dificuldade para se definir quem é
o consumidor de baixa renda no Brasil e no
exterior, citam Wright e Spers (2011, p. 17).
Zanella (2008) comenta que, segundo estudo do The Boston Consulting Group
(2007), os representantes do segmento de
baixa renda são aqueles que sequer compõem a classe média, mas também não aparecem como os mais miseráveis do mundo.
Gráfico 3: Indicador Serasa Experian de Demanda do Consumidor por Crédito - período janeiro/2008 a julho/2013
160,0
140,0
120,0
100,0
80,0
60,0
40,0
20,0
Indicador demanda do Consumidor por Crédito
Fonte: Serasa Experian
mai-13
jan-13
set-12
mai-12
jan-13
set-11
mai-11
jan-11
set-10
mai-10
jan-10
set-09
mai-09
jan-09
set-08
mai-08
jan-08
0,0
45
Juntos, estes representariam o maior segmento de mercado não atendido no mundo.
A análise do The Boston Consulting Group
identificou algumas particularidades do
segmento de baixa renda.
1.Os consumidores de baixa renda lidam
com rendas flutuantes, desta forma, a volatilidade da renda impõe limites à compra, o que os direciona à aquisição de
itens de maior necessidade e à dispensa
de produtos considerados não essenciais;
2.Eles vivem em casa com espaço reduzido,
visando otimizar o posicionamento dos
móveis e utensílios, de maneira a maximizar a área útil.
3.Os consumidores não são familiarizados
com uma série de produtos, de maneira que, apesar de se interessarem por diferenciais, ainda se intimidam diante de
produtos que não sabem como funciona
ou cuja utilidade ainda não esteja claramente definida.
Consumo
As estimativas da Organização das
Nações Unidas (ONU) são de que mais de
90% do crescimento populacional do mundo, nos próximos 30 anos, dar-se-á nos países em desenvolvimento e de que nesses lugares encontra-se a nova classe média consumidora e os principais mercados
emergentes do mundo, comentam Wright e
Spers (2011, p. 13).
No entanto, a concepção de bens
e serviços para esse público requer novas
posturas e exige o abandono de preconceitos tradicionais sobre o consumidor de baixa renda. Segundo Prahalad (2005), os consumidores da base da pirâmide são altamente conectados e, portanto, informados.
Dispõem de telefones celulares, acesso a
e-mail e internet, utilizam cartões eletrônicos, além de se informarem por rádio e televisão. Têm surpreendente facilidade para
adotar novas tecnologias e são cuidadosos nas decisões de compra, pois estas frequentemente têm grande importância com
relação ao status e ao patrimônio familiar.
Inúmeros são os exemplos de mudanças necessárias realizadas pelas empresas para atender esse público. A Pepsico, por exemplo, começou a pensar no poder de consumo da base da pirâmide e, em
2007, comprou a fabricante Lucky. Dona de
um portfólio de salgadinhos, a Lucky é voltada para a classe D: pacotes são maiores
e mais cheios (porque seus integrantes não
comem sozinhos, mas compartilham) e o
produto oferece maior sensação de saciedade (o público-alvo acha desperdício comprar algo que não o faça sentir-se cheio).
Ter no portfólio uma marca de salgadinhos
mais baratos foi fundamental para a Pepsico chegar até a classe D, afirma Patricia
Kastrup, vice-presidente de marketing da
Pepsico Brasil. Outro exemplo é a empresa Danone, que aumentou a participação
de seus produtos na região nordeste. Hoje
30% do portfólio na região são de produtos
de menos de R$1. Por exemplo, o produto
Danoninho ganhou sete versões, incluindo
uma de R$0,99 (TODESCHINI, 2012).
Para facilitar a interface banco-cliente, o Banco Postal estabeleceu meios
descomplicados no relacionamento com a
população mais carente. É notável a dificuldade desse público em lidar com microcomputadores, sendo fundamental a presença de um atendente para intermediar as
operações, citam Rocha e Calado (2006).
A preocupação primordial é oferecer a esse cliente a proximidade e a facilidade de acesso. Prahalad e Hamel (2005) com-
46
pactuam esse ponto de vista e notam os ganhos do “Capitalismo Inclusivo”, no sentido
de inserir a parcela mais carente da população nos benefícios do capitalismo. Os benefícios advindos de uma estratégia voltada a esse nicho podem ser observados no
caso do Banco Postal, uma aliança entre a
Empresa Brasileira de Correios e Telégrafos
(Correios) e o Banco Bradesco.
Os Correios possuem 5.306 agências em operação em 4.686 municípios, dos
quais 1.675 não possuíam nenhuma agência
bancaria antes da instalação do Banco Postal. O fator social da iniciativa pode ser observado na medida em que seus principais
clientes gastavam cerca de 20% dos rendimentos pagando a condução até a cidade
mais próxima onde iam receber seus proventos. Para estes, a instituição financeira
significou um aumento de renda, facilidade de acesso aos serviços bancários e ainda, uma movimentação na economia de pequenas cidades, comentam Rocha e Calado (2006).
Para fazer uma análise de crédito à
Pessoa Física, por exemplo, Securato (2002,
p. 33) comenta que no Brasil, cada credor
utiliza um modelo próprio de ficha cadastral para obtenção das informações básicas
do cliente, recorrendo também a empresas
especializadas, tais como Serasa e/ou SPC,
para validar, confirmar e complementar as
informações obtidas diretamente do cliente e das fontes por ele indicadas. Podemos
resumir como principais informações contidas nas fichas:
• Nome, CPF, RG do solicitante de crédito e do conjugue, quando casado. Esses
dados são utilizados para verificação de
eventual existência de homônimo e para
apuração de restrições cadastrais, como
atrasos por falta de pagamento, aponta-
mentos, protestos, cheques devolvidos,
ações judiciais, etc;
• Endereço atualizado;
• Nome da empresa em que o solicitante
trabalha, tempo de serviço, função, salário, entre outros;
• Discriminação de rendimentos com as
respectivas origens, bem como das despesas mensais de caráter fixo, tais como
aluguel da moradia e/ou do escritório;
• Fontes de referência comerciais e bancárias, que podem ser utilizadas para investigação pela própria credora.
Todas essas informações fazem
parte de um dossiê de crédito que será usado na avalição de risco de crédito, cita Securato (2002, p. 34). Um dos modelos de
avaliação usualmente empregado é o Credit Scoring – que consiste em pontuar parâmetros de crédito e ponderá-los por pesos
estabelecidos de acordo com a importância
de cada parâmetro no processo decisório.
O Credit Scoring é um modelo de
avaliação do crédito aplicável a pessoas físicas e jurídicas. Na aplicação que damos
para pessoas físicas propomos a compilação e a comparação dos dados constantes
na ficha cadastral com parâmetros quantitativos e qualitativos previamente estabelecidos, escreve Securato (2002, p. 35).
Os parâmetros básicos para a concessão do crédito à pessoas física, adaptados dos parâmetros utilizados para orientar a concessão de crédito à pessoa jurídica, também se norteiam nos chamados C’s
do crédito:
Caráter: (ou conceito);
Capacidade: na pessoa física, a capacidade de pagamento está diretamente relacionada a renda;
Capital: na pessoa física, o capital é o patrimônio pessoal;
47
Colateral: diz respeito às garantias que o
solicitante coloca à disposição do credor
para o caso de não vir a cumprir com as
obrigações previstas contratualmente.
Condições: diz respeito ao ambiente – fatores macro ou microeconômicos que influenciam na concessão do crédito.
Os parâmetros básicos para a concessão de crédito serão avaliados através da
análise criteriosa da ficha cadastral combinada com o sistema de pontuação que visa
quantificar os parâmetros definidos e atribuir pesos de acordo com a relevância de
cada informação. De acordo com a pontuação ponderada obtida, a concessão do crédito poderá ser automática ou encaminhada para a análise pelo Comitê de Crédito, de
acordo coma política da empresa.
Os primeiros modelos de Credit Scoring foram desenvolvidos entre os anos 40 e
50 e a metodologia básica, aplicada a esse
tipo de problema, era orientada por métodos de discriminação. O primeiro trabalho conhecido utilizou análise discriminante
para um problema de crédito, empregando
as técnicas desenvolvidas por Fisher para
discriminar bons e maus clientes. A técnica Credit Scoring é utilizada, principalmente
na determinação de risco de crédito. Levando-se em consideração um modelo de regressão logística já ajustada, a probabilidade de perda, isto é, a probabilidade do cliente não pagar o empréstimo tomado, é calculada considerando-se fatores de riscos, tais
como idade do solicitante, tempo no emprego, salário, se possui casa própria, localização de moradia, histórico de inadimplência,
setor de atividade etc. e/ou fatores de riscos
característicos da operação, tais como, valor total do empréstimo, prazo de pagamento, tipos de garantias, comentam Diniz e
Louzada (2012).
Alguns exemplos de informações
utilizadas para desenvolver modelos de escoragem são:
Tabela 1: PossíveisVariáveis Utilizadas nos
Modelos de Risco Pessoa Física
Variáveis atualmente
utilizadas
Idade
Renda mensal
Tempo no emprego
Baixa
pontuação
Alta
pontuação
< 30 anos
> 50 anos
baixa renda
alta renda
< 3 meses
> 10 anos
Possui restrições ativas
sim
não
Indicadores de atividade de crédito
alta
baixa
A dificuldade de coletar variáveis
para essa população que não tem conta
em Bancos” motivou o Banco Gerador2 a
investir no desenvolvimento de um sistema de cálculo de riscos. O modelo leva em
conta variáveis como contas de luz em dia
(é bom pagador) ou contas que tenham tido
aumento (está consumindo mais e consegue pagar). Graças a esse modelo, o banco já concedeu empréstimo a mais de 20 mil
pessoas (TODESCHINI, 2012).
Para identificar o perfil de um tomador de crédito, toda variável de pagamento é potencialmente importante. Esse
assunto ganhou força no I Fórum Paulista
de Microfinanças onde ocorreu uma apresentação sobre o uso do valor da conta de
energia elétrica para estimar a renda de
um domicílio, comentam Diniz e Yokomizo
(2009). A abrangência da conta de energia
é grande.
A população de baixa renda tem
pouco ou nenhum colateral, não tem histórico de crédito, tem pouca ou nenhuma experiência em lidar com dinheiro ou em gerenciar um negócio e pode habitar locais
distantes. Na ausência de histórico de informações bancárias, vão ser inseridas na mo-
48
delagem de crédito variáveis encontradas
no banco de dados da Serasa Experian, coletadas no IBGE.
População e Amostra
A população pesquisada nesse estudo são pessoas classificadas como sendo
de baixa renda de acordo com a segmentação da Serasa Experian.
A base possui 15.519.544 CPF’s cadastrados. Faz-se uma amostragem aleatória, de sorte que todo indivíduo na população tem a mesma probabilidade de ser selecionado.
Foram selecionados 300 mil indivíduos e desse total foram escolhidos 90 mil
CPF’s que foram consultados na base da
Serasa Experian no período de junho a novembro de 2012 e escolhidos outros 90 mil
CPF’s que não foram consultados nenhuma
vez nesse mesmo período.
Figura 1: Amostra do Estudo
180 mil cpf’s
90 mil CPF’s
consultados
no período
jun-nov 2012
90 mil CPF’s que não
tiveram nenhuma
consulta no período
jun-nov 2012
A escolha por dividir em dois grupos se faz pela necessidade de saber que o
primeiro grupo buscou por crédito no mer-
cado no período compreendido entre junho/2012 a novembro/2012 e todo o estudo
será feito nesse primeiro grupo e aplicado
no segundo grupo - CPF’s que não foram
consultados no banco de dados no mesmo
período.
Metodologia
Credit Scoring
Um modelo de regressão logística,
com variável resposta, Y, dicotômica, pode
ser utilizado para descrever a relação entre a ocorrência ou não de um evento, por
exemplo, neste trabalho, prever a inadimplência do público de baixa renda (DINIZ;
LOUZADA, 2012, p. 12).
Para prever a inadimplência o modelo utilizara bases históricas de performance de crédito dos CPF’s do grupo 1 –
CPF’s que buscaram por crédito no período
janeiro a outubro de 2012, e observar o comportamento desses consumidores. O período de performance foi baseado no horizonte de predição de 365 dias. Se o consumidor possui alguma negativação ativa (pendências bancárias, pendências financeiras,
protesto, ação e cheques sem fundos) com
mais de 90 dias de atraso, com valor superior a R$10,00, ele é classificado como mau
pagador; caso contrário ele é considerado
bom pagador.
O Fator tempo tem uma importância fundamental na construção de modelos preditivos. O passado é composto pelas operações para as quais já foram observados os desempenhos de crédito durante
um horizonte de previsão adotado. As informações cadastrais dos clientes no momento da concessão de crédito, levantadas no
passado mais distante, são utilizadas como
variáveis de entrada para o desenvolvimen-
49
to do modelo e os dados do passado mais
recente, as observações dos desempenhos
de crédito dos clientes, inadimplentes ou
adimplentes, são utilizadas para a determinação da variável resposta, comentam Diniz e Louzada (2012, p. 4-5).
Figura 2: EstruturaTemporal das Informações para
a Construção de Modelos Preditivos
Passado
Presente Futuro
Variáveis de
entrada para o
desenvolvimento
do Modelo
Definição
de variável
resposta - evento
de interesse
Período de
Observação
Período de
Desempenho
Fonte: Diniz e Louzada (2012, p. 5).
O período de observação compreende o período de tempo que são observadas
as informações relevantes para o evento de
interesse - período em que se constrói e obtém as variáveis explanatórias. Em um modelo de Credit Scoring3 esse período compreende na realidade um único instante, sendo o
momento em que um cliente busca o crédito
(ponto de observação). O período de desempenho é o intervalo de tempo em que é observada a ocorrência ou não da inadimplência. O presente corresponde ao período de
desenvolvimento do modelo em que, normalmente, as informações referentes a esse período ainda não estão disponível. O futuro é
período de tempo para a qual serão feitas as
predições, utilizando-se de informações do
presente, do passado e das relações entre
estas (DINIZ; LOUZADA, 2012, p. 5).
Dividiremos os 90 mil registros pertencentes ao grupo 1 (público que buscou
crédito no período junho/2012 a novem-
bro/2012) em dois grupos:

70% da amostra para desenvolvimento do
modelo;

30% da amostra para validação.
Os modelos de regressão são utilizados para estudar e estabelecer uma relação entre uma variável de interesse (variável resposta) e um conjunto de fatores referentes a cada cliente (denominados covariáveis). Para modelos de crédito, que a
variável de interesse é binária, a regressão
logística é um dos métodos estatísticos utilizados com bastante frequência.
O modelo de regressão logística é
determinado pela relação:
log
pi
( 1–pi
) = β0 + β1x1 + … + βpxp
Em que pi denota a probabilidade
de um cliente com perfil definido pelas p
covariadas, x1, x2, ..., xp ser um mau pagador. Estas covariáveis são obtidas através de
transformações, dummies. Os valores utilizados como escores finais dos clientes são obtidos multiplicando por 1000 os valores estimados das probabilidades de sucesso, pi.
A avaliação do ajuste do modelo
será feita pela estatística de Kolmogorov-Smirnov (KS). Esse método mede a boa
performance dos escores na separação dos
dois grupos – bons e maus pagadores.
Sendo FB(e) = ∑ x≤e e FB(x) e FM(e)
= ∑ x≤e FM(x) a função de distribuição empírica dos bons e maus pagadores, respectivamente, a estatística de Kolmogorov-Smirnov é dada por:
KS = max | FB (e) - FM (e) |
Em que FB(e) e FM(e) correspondem às proporções de clientes bons e
50
RESULTADOS
maus com escores menor ou igual a e. A
estatística KS é obtida através da distância
máxima entre essas duas proporções acumuladas.
Quanto maior for a estatística de
KS, maior será a separação entre os clientes adimplentes e inadimplentes. Oliveira e
Andrade (2002) sugerem uma tabela com
classificação de modelos de acordo com o
valor de KS obtido (figura 3).
No gráfico 4 temos a distribuição
geográfica da amostra selecionada de pessoas classificadas como baixa renda pela
Serasa Experian.
Os destaques das regiões com
maior representatividade: nordeste e sudeste são as duas regiões com maior participação nos dois públicos do estudo. Para o
público que buscou crédito, a participação
Figura 3: Funções Distribuições Empíricas para os Bons e Maus Clientes e a Estatísticas KS
6
5
FM(e)
4
3
KS
2
FB(e)
1
0
1
2
3
4
5
6
Scores(e)4
Fonte: Diniz e Louzada (2012, p. 17).
Gráfico 4: Distribuição por Região da Amostra de Baixa Renda
36%
33%
31%
29%
16%
12%
8%
5%
sem inform
CE
8%
6%
NE
Publico sem consulta a crédito
Fonte: Serasa Experian
9%
7%
NO
SE
Publico com consulta a crédito
SU
51
chega a 36% na região sudeste.
O processo de desenvolvimento
do modelo para baixa renda engloba as seguintes etapas:
• Definição conceitual do modelo: definição do objetivo e horizonte de tempo da
previsão.
• Avaliação das informações disponíveis
para o desenvolvimento do modelo: análise dos bancos de dados disponíveis, relevância e confiabilidade das informações.
• Amostragem: Definição dos procedimentos de amostragem.
• Definição de maus clientes.
• Elaboração das variáveis preditivas:
transformação, categorização e análise
bivariada.
• Análise críticas dos pesos finais do
Modelo.
• Desenvolvimento estatístico: obtenção
das fórmulas estatísticas.
• Validação: teste sobre uma amostra de
dados para avaliar a consistência do modelo desenvolvido.
As amostras serão avaliadas da seguinte forma: o público que foi consultado
no período de junho a novembro de 2012
terá sua performance avaliada nos próximos 12 meses. Por exemplo, um CPF com
consulta no mês de novembro de 2012 terá
sua performance avaliada até outubro de
2013. Para o público que não foi consultado,
foram geradas aleatoriamente datas dentro
desse mesmo período, ou seja, datas aleatórias entre junho a novembro de 2012 e avalição de performance nos 12 meses seguintes e assim por diante.
A figura 4 ilustra o processo.
Tabela 2: Percentual de Pessoas Inadimplentes
na Data da Consulta
Qtd
% Defaut na data
consultada
Público que foi
consultado
90,000
36,5%
Público sem
consulta
90,000
30,5%
Público do estudo
A seguir, apresentam-se as análises de performance dos dois públicos:
Nessa primeira etapa, verifica-se se
o consumidor possui alguma negativação
(pendências bancárias, pendências financeiras, protesto, ação e cheques sem fun-
Figura 4: Ilustração do Período de Performance Utilizado nesse Modelo de Baixa Renda.
Bom Pagador
Para
x1
x2
x3
x4
x5
x6
Período Histórico
...
x9
ya
Período de Performance
12 meses
Variáveis Preditivas
• Sócio-Demográficas
• Anotações Negativas
• Comportamentais
Mau Pagador
52
dos) com mais de 90 dias de atraso, com valor superior a R$10,00, na data da consulta (também chamada data de referência).
Se ele possuir, é considerado um mau pagador; caso contrário, ele é considerado um
bom pagador. Se considerado mau pagador, não fará parte da modelagem. No primeiro grupo, do público que foi consultado no período, foram eliminados 36,5% da
amostra de 90 mil, ou seja, quase 33 mil
pessoas já possuíam naquele momento dívida ativa no mercado. Por esse motivo, despreza-se esse público e verifica-se a performance do público restante.
Tabela 3: Percentual de Pessoas Inadimplentes
no Período de Performance.
Qtd
% Defaut na data
consultada
Público que foi
consultado
57,191
28%
Público sem
consulta
62,585
12%
Público do estudo
Para desenvolvimento do modelo,
optou-se por trabalhar com o público que
foi consultado e aplicar o modelo no público
sem consulta. A taxa de inadimplência para
o público que foi consultado no período é
de 28% contra 12% do público sem consulta. Essa diferença é explicada pela falta de
informação desse último público.
Amostragem de
Desenvolvimento e
Validação
Para confecção do modelo foi utilizado o público que buscou crédito no período de junho a novembro de 2012 (público consultado). A amostra é separada em
amostra de desenvolvimento e amostra de
validação. A amostra de desenvolvimento
foi utilizada para realizar o ajuste do modelo e a amostra de validação foi empregada na validação da fórmula, verificando
a manutenção das características (separação e estabilidade) e garantindo que não
houvesse overfitting (superestimação) dos
dados.
O banco de dados da Serasa Experian possui mais 2 mil variáveis para serem
testadas nos modelos de crédito. Seguem
algumas variáveis:
• Informações cadastrais: Idade e CEP residencial;
• Informações negativas, incluindo protestos, ações, cheques sem fundo, dívidas
não pagas em instituições financeiras
(REFIN) e dívidas não pagas em instituições não financeiras (PEFIN). Utilizamos
essas informações correntes bem como
seu histórico;
• Informações do IBGE;
• Score househould (é um produto da Serasa
Experian, cujo objetivo determinação do
risco de crédito da Família. Calcula-se o
risco de crédito do indivíduo, considerando informações do risco de crédito da família. O modelo devolve pontuação entre
2 a 1000);
• Score nacional de crédito 2 Bureaux (esse
modelo é o 1º release baseado nos dados
do Credit Bureau Serasa Experian e dados do SPC Brasil. O modelo possui dados cadastrais, anotações negativas e
comportamentais de consumidores brasileiros e foi desenvolvido em 2013).
Após aplicação do método Stepwise,
das mais de 2 mil variáveis analisadas foram
selecionadas nove que submetidas ao nível
de significância de 0,05% (p-value <= 0,05),
são as variáveis estatisticamente significativas para explicar a inadimplência do público
de baixa renda.
53
Na tabela 4 o modelo estatístico e a
importância de cada variável, medida pelo
Scaled Vector de Altman (1968), são apresentados.
Observa-se através da Scaled Vector, a relativa contribuição de cada variável no modelo. O Score nacional de crédito 2 Bureaux é a variável que mais contribui para explicar a inadimplência na baixa
renda, logo em seguida a variável indicando
se o indivíduo mudou de endereço recentemente também possui uma contribuição
significativa.
Distribuição do Score
Através do modelo estatístico, é possível fornecer uma representação da probabilidade de um proponente de crédito tornar-se inadimplente ao longo de 12 meses.
Pode-se concluir observando o público utilizado para desenvolvimento do modelo (público que foi consultado). Pessoas
com pontuação entre 2 e 200 representam
1% da amostra e apresentam 85% de probabilidade de tornar-se inadimplente. Pessoas com pontuação entre 201 a 300 representam 3,6% da amostra e apresentam 73,8%
de probabilidade de tornar-se inadimplente,
e assim sucessivamente.
Para avaliar a capacidade de discriminação do modelo, futilizaram-se testes
de estatística não paramétrica, isto é, o teste de Kolmogorov-Smirnov, e os coeficientes de Gini e Roc. Foram obtidos o valor de
KS de 40%, coeficiente de Roc de 76,7% e
coeficiente de Gini de 53,4%, demonstrando que o modelo tem uma capacidade de
discriminar clientes Bons de clientes Maus.
Aplicando o modelo na base de
Tabela 4: Modelo Estatístico para Previsão da Inadimplência na Baixa Renda
Descrição
Flag se a pessoa mudou-se em até
1 ano
Agrupamento do CEP
Idade
Faixa
Scaled Vector Altma
Flag ME = 1
0.0733
0 < GRUPO_PERCENTUAL < 2
2 <= GRUPO_PERCENTUAL < 3
3 <= GRUPO_PERCENTUAL < 7
16 <= GRUPO PERCENTUAL
0.0138
0.0087
0.0196
0.0187
18 <= IDADE < 31
0.0390
SCORE_2BUREAUX
Segmento Pessoas com uma ou
mais negativações ativas
0.5706
SEGMENTO = (1.2)
0.0459
1 <= Histórico_neg < 2
2 <= Histórico_neg <3
3 <= Histórico_neg <5
Histórico_neg >= 5
0.0317
0.0209
0.0269
0.0349
Tempo máximo em que uma
restrição ficou ativa
28 <= STpMa×RestrFicouAti < 253
1298 <= STpMa×RestrFicouAti
0.0114
0.0058
0.0122
0.0305
Indicador de estabilidade
profissional Serasa Experian
Flag IEP = 1
0.0121
1 <= media score hh < 240
240 <= media score hh < 277
0.0182
0.0054
Histórico de negativações
Média Household Score
54
pessoas sem consultas a crédito no período de junho a novembro de 2012, foram
obtidos o valor de KS de 44,5%, coeficiente de Roc de 77% e coeficiente de Gini de
54,1%, demonstrando que o modelo tem
uma capacidade de discriminar clientes
Bons de clientes Maus.
anos, 35 milhões os brasileiros foram incluídos nesse segmento.
A questão-problema era “Como
medir o risco de inadimplência da população de baixa renda que dificilmente possui
histórico de crédito?” O objetivo proposto
foi desenvolver um modelo estatístico matemático para prever a inadimplência do público de baixa renda, de forma a maximizar
a separação entre bons e maus pagadores.
O inadimplemento representa um
dos maiores problemas na concessão de
crédito, pois influencia diretamente as condições de acesso ao crédito.
Neste trabalho, a inadimplência
encontrada na amostra selecionada para
aplicar a técnica Credit Scoring foi de 28%
de clientes inadimplentes. A alta taxa de
inadimplência é explicada pelo descontrole
por parte de uma parcela da população que
Considerações Finais
Ao longo deste trabalho foram estudadas características da população de
baixa renda.
A motivação para o estudo originou-se na leitura de uma reportagem na revista Época – junho 2012 – “Chegou a vez da
classe D”. Atualmente, 104 milhões de brasileiros estão na classe média, ou seja, vivem em famílias com renda per capita mensal entre R$ 291 e R$ 1.019. Nos últimos dez
Tabela 5: Distribuição do Risco nas Duas Amostras
Público que foi consultado
(base desenvolvimento)
Score
Aplicação do modelo
no público sem consulta
Taxa de
Inadimplência
% Participação
Taxa de
Inadimplência
% Participação
2
a
200
85.0%
1.0%
73.4%
0.3%
201
a
300
73.8%
3.6%
65.1%
1.0%
301
a
350
66.1%
3.5%
63.2%
1.2%
351
a
400
56.5%
5.3%
37.1%
2.7%
401
a
450
48.2%
7.3%
32.1%
4.0%
451
a
500
39.3%
9.0%
31.4%
4.6%
501
a
550
33.3%
9.3%
24.6%
5.0%
551
a
600
26.7%
9.1%
18.2%
6.9%
601
a
650
20.4%
9.5%
9.3%
11.7%
651
a
700
18.1%
8.5%
8.2%
11.1%
701
a
750
13.5%
7.6%
7.2%
9.5%
751
a
800
10.3%
8.3%
4.7%
13.1%
801
a
850
7.9%
9.7%
4.0%
15.5%
a
1,000
851
Total
5.9%
8.2%
3.6%
13.4%
28.1%
100.0%
12.3%
100.0%
55
Autores
tem agora, acesso a bens que nunca teve, e
na qual se deposita alto nível de confiança
para o futuro.
Para alcançar o objetivo proposto, foram realizadas análises estatísticas,
as quais surpreenderam as expectativas do
pesquisador. O modelo logístico apresentou
uma estatística KS acima de 40% o que representa excelente discriminação entre os
clientes adimplentes e inadimplentes.
O modelo logístico conseguiu apontar outras informações relevantes capazes
de explicar a inadimplência da população
de baixa renda. Segundo Securato (2002),
um modelo de Credit Scoring pontua parâmetros de crédito e pondera por pesos estabelecidos de acordo com a importância de
cada parâmetro. No modelo proposto para
prever a inadimplência do público de baixa
renda, as variáveis score nacional de crédito
2 Bureaux e flag de mudança de endereço
recente foram as variáveis com maior contribuição relativa, segundo o Scaled Vector
de Altman (1968).
Na aplicabilidade do modelo logístico na população que não possui histórico
de busca por crédito no período compreendido entre junho a novembro de 2012 os resultados obtidos foram significativos e comprovados através do KS de 44%, quatro pontos acima do resultado no modelo desenvol-
vido, mas vale ressaltar que a inadimplência
encontrada nesse público (12%) foi bem inferior comparado com a amostra que buscou
por crédito (28%). Essa queda na inadimplência para esse público traduz escassez de informação para essa população que não utiliza serviços bancários (“desbancarizada”).
Notas
1. FGV – Fundação Getúlio Vargas faz a seguinte consideração: uma família é considerada de classe média (classe C) quando
tem renda mensal entre R$ 1.064 e R$ 4.591.
A elite econômica (classes A e B) tem renda superior a R$ 4.591, enquanto a classe D
(classificada como remediados) ganha entre R$ 768 e R$ 1.064. A classe E (pobres),
por sua vez, reúne famílias com rendimentos abaixo de R$ 768.
2. Banco Gerador - especializado no Norte/
Nordeste, com um portfólio de produtos e
serviços para atender a empresas e pessoas físicas dessas regiões. Os empreendedores do Banco Gerador possuem ampla
experiência em investimento no Nordeste,
com participação relevante em empresas
líderes nos seus setores, como Grupo Nordeste.
3. Credit Scoring consiste em avaliar quais fatores estão associados ao risco de crédito
dos clientes.
Patricia Rosangela Carneiro é Analista de Analytics. É responsável pelo desenvolvimento de modelos de crédito e cobrança, com foco tanto em Pessoa Física e Jurídica. Possui mais de 10 anos de experiência em desenvolvimento de soluções customizadas para clientes da Serasa Experian. Graduada em Estatística pela Universidade Federal de São Carlos (UFSCar), MBA em Gestão Estratégica pela FEA- RP e Especialização em Inteligência
Analítica pela FIA-SP. Entre em contato com Patricia pelo e-mail patrí[email protected]
Referências
56
ALTMAN, Edward I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy.
The Journal of Finance 23.4 (1968): 589-609.
DINIZ, C.; LOUZADA, F. Modelagem Estatística para Risco de Crédito. 20º SINAPE – Simpósio Nacional de
Probabilidade e Estatística. Universidade de São Paulo. São Paulo, 2012.
DINIZ, E. H.; YOKOMIZO, E. C. A. Projeto “(Micro?) Crédito para a População de Baixa Renda: como gerar
cadastro positivo por meio da tecnologia de correspondentes bancários”. Programa de incentivo à pesquisa
aplicada Serasa Experian. São Paulo: IES-EAESP- FGV, 2009.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA - IBGE. Disponível em: < www.ibge.gov.br>. Acesso
em: 15 de jun. 2013.
MEIRELLES, R. A Classe C Mudou. Data Popular, Brasília, 3 mai. 2012. Disponível em: <http://www.sae.gov.br/
site/?p=11401#ixzz2dZsEJfIP>. Acesso em: 21 de set. 2013.
OLIVEIRA, J. G. C. de; ANDRADE, F. W. M. de. Comparação entre Medidas de Performance de Modelos de
Credit Scoring. Tecnologia de Crédito, pp 35-47, Nov. 2002.
OSCAR, Naiana. Expansão da Renda Altera a Pirâmide Social e tende a Extinguir a Classe. O Estado de São Paulo, São Paulo, 2 de jan. 2011, Economia. Disponível em: <http://www.estadao.com.br/noticias/
impresso,expansao-da-renda-altera-a-piramide-social-e-tende-a-extinguir-a-classe-e,661000,0.htm>.
Acesso
em: 16 set. 2013.
PRAHALAD,C.;K. A Riqueza na Base da Pirâmide. Porto Alegre: Bookman, 2005.
PRAHALAD, C.; HAMEL, G. Competindo pelo Futuro, 1ª. ed. São Paulo: Campus, 2005.
ROCHA, Ricardo; CALADO, Luiz. Alianças Estratégicas Voltadas à Distribuição de Produtos Financeiros
para Baixa Renda no Brasil. Revista Tecnologia de Crédito (Serasa-Experian), N. 52, Fevereiro, 2006, p. 32-34.
SECURATO, J. R. Crédito - Análise e Avaliação do Risco, Pessoas Físicas e Jurídicas. 1ª. ed. São Paulo: Ed.
Saint Paul, 2002.
SERASA EXPERIAN –. Disponível em: < http://www.serasaexperian.com.br/>. Acesso em: 08 de set. 2013.
TODESCHINI, M. Chegou a Vez da Classe D. Época Negócios, Ed. Globo S/A, 2012, p. 49-61.
WRIGHT, J. T. C.; SPERS, R. G. Mercado Popular no Brasil. Abordagens para Geração de Negócios e Casos
de Sucesso. São Paulo: Editora Blucher, 2011.
Referências
57
ZANELLA, H. Desenvolvimento de Produtos na Indústria Alimentícia: Aplicação de um Modelo para o Mercado de Baixa Renda. Trabalho de Conclusão de Graduação em Administração da Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo – Departamento de Administração. FEA - USP: São
Paulo, 2008. Orientador: Prof. Dr. James.
Positive
Prepare sua empresa para extrair o máximo de benefícios

Saiba como explorar todo o
potencial dessa nova realidade

Conceda mais crédito com
menos riscos


Aperfeiçoe sua gestão de clientes

Minimize prejuízos causados
por fraudes e inadimplência
dos dados positivos com a ajuda da Serasa Experian.
Positive-se! Contrate agora mesmo a Consultoria Serasa
Experian em Cadastro Positivo e rentabilize suas decisões
de negócios.
Para saber mais, acesse
serasaexperian.com.br/cadastropositivo
ou ligue para 0800 773 7728
Aumente o retorno das suas
ações de cobrança
+
++
Revista Tecnologia
de Crédito online
Acesse informação de
ponta, onde você estiver.
Sua revista Tecnologia de Crédito é publicada
exclusivamente na web.
É mais um passo da Serasa Experian para a redução do
impacto de suas atividades sobre o meio ambiente, além
de um alinhamento à tendência global da universalização
de conteúdos.
Acesse:
serasaexperian.com.br/tecnologia-de-credito, e
mantenha-se bem informado sobre o mercado de crédito.

Risco de Crédito da Contraparte no Contexto de

Transcrição

Documentos relacionados

Cadastro Positivo

é o seu filho tem direito a uma refeição escolar gratuito?

Faça o aqui

Soluções Socioambientais

A Classificação Fundamental do Risco

A história não contada da Educação Financeira no Brasil

revista Credit Performance

Instrumentos para um Novo Cenário na Gestão do Risco