unalmed.edu.co

Transcrição

unalmed.edu.co
Introdução ao planejamento e análise de
pesquisas para avaliação de impacto de
políticas públicas
Pedro Silva
Julho de 2010
Conteúdo
• Avaliação de políticas
• Desenhos usados em estudos de avaliação
• Métodos de estimação
• Pesquisas amostrais como fontes de dados para avaliação
de políticas
• Planejando pesquisas para avaliação de políticas
• Um exemplo do Brasil
2
O que é avaliação de políticas?
• Utilização de vários métodos de investigação
para:
– Investigar a efetividade de implementação, processos e
intervenções;
– Determinar seu impacto em termos da melhoria de
condições econômicas e sociais de diferentes envolvidos.
• Pesquisas amostrais se tornaram importantes
instrumentos de pesquisa para avaliação de
políticas
3
Métodos de investigação podem ser
• Quantitativos e qualitativos;
• Desenhos experimentais ou não-experimentais;
• Métodos descritivos e de inferência.
• Outras abordagens incluem:
– Métodos baseados em teoria ou processo lógico;
– Métodos de síntese de estudos (meta-análise); e
– Avaliações de custo-benefício.
4
Tipos de avaliação (1)
• Dois tipos de avaliação comumente usados incluem avaliação
Somativa (‘summative’) e avaliação Formativa (‘formative’).
• Avaliação Somativa busca responder perguntas sobre o impacto de
uma política ou intervenção sobre grupos específicos de pessoas ou
unidades, tendo foco em resultados específicos.
• Busca estimar os efeitos da política em termos do que era esperado
no princípio, seja comparando com alguma outra intervenção ou com
‘fazer nada’ (situação contra-factual).
5
Tipos de avaliação(2)
• Avaliação formativa busca responder perguntas tipo como,
porque e para quem uma intervenção funciona (ou falha).
• Também procura informar sobre fatores contextuais e
mecanismos que levam ao sucesso (falha) de uma política.
• Busca também informações que permitam aprimorar a implementação
de programas, detectar e resolver problemas não previstos à medida
que vão sendo encontrados, ou documentar o progresso obtido na
busca de alcançar certos resultados desejados.
• Geralmente se faz durante o desenvolvimento ou estágios iniciais de
implantação de uma política, inclusive em testes piloto.
6
Requisitos para sucesso de uma avaliação
• A intervenção (política) e a população alvo estão bem
definidas e são identificáveis.
• Os resultados desejados da intervenção são claros,
específicos e mensuráveis.
• Um plano de avaliação adequado pode ser pactuado e
implementado, com suficientes recursos alocados.
7
Exemplo de especificação de avaliação
1. Qual é o efeito de introduzir um programa de incentivo à
manutenção das crianças e adolescentes na escola
(intervenção) em termos da sua freqüência e
desempenho escolar (resultados) para famílias em
situação de pobreza (população alvo)?
2. Qual é o efeito de oferecer um programa de capacitação
profissional (intervenção) a adultos que recebem seguro
desemprego por mais de 6 meses (população alvo) em
termos de seus prospectos de reinserção no mercado de
trabalho (resultados)?
8
Desenhos para avaliação
• Pergunta chave: “O que teria acontecido se a intervenção não fosse
feita?”
• Impossível de observar na prática.
• Desenhos para avaliação tentam aproximar esta situação mediante
criação de um ‘grupo de controle’ (situação contra-factual) formado
por ‘não participantes’ ou ‘não beneficiários’ do programa ou política.
• Os métodos usados para identificar o grupo de controle podem ser
classificados em três categorias:
– Experimentais;
– Quase-experimentais;
– Não-experimentais.
9
Desenhos experimentais (aleatorizados)
• Envolvem amostragem de um conjunto de indivíduos elegíveis
e dispostos a participar, e sua alocação em dois grupos:
– dos que vão receber a intervenção (grupo de tratamento); e
– dos que não vão receber a intervenção (grupo de controle).
• Considerado o mais robusto dos métodos de avaliação.
• Geralmente permite evitar problemas de ‘viés de seleção’.
• Principal vantagem é simplicidade da análise: o impacto
sobre o resultado que se quer avaliar é medido pela diferença de
estimativas de médias para os grupos tratamento e controle.
10
Viés de seleção (1)
• Participantes do programa podem diferir dos não participantes em
características não observadas (na pesquisa), tais como habilidade
ou motivação, que afetam:
– A decisão de participar do programa, e
– Os resultados da participação.
• Participantes do programa podem ser indivíduos que têm mais a
ganhar de um programa particular, e estão portanto mais motivados
para comprometer-se com as atividades do programa.
• Assim variações nos resultados observadas entre estes grupos ‘não
aleatórios’ de indivíduos podem indicar impacto sobre participantes
motivados, mas não refletir como o programa afetaria ‘na média’ aos
membros da população alvo.
11
Viés de seleção (2)
•
O problema surge porque não há dados sobre os fatores que afetam tanto a
participação como os resultados.
•
Em desenhos quase-experimentais ou não-experimentais, métodos
econométricos são geralmente usados para modelar os processos de
participação e de resultados, e para chegar a estimativas não viesadas do
impacto do programa.
•
Pareamento baseado em escores de propensão e regressão múltipla controlam
para seleção em variáveis observadas, enquanto métodos de variáveis
instrumentais controlam para seleção em variáveis não observadas.
•
A idéia geral é comparar participantes e não participantes do programa,
mantendo o processo de seleção ‘constante’.
•
A validade de resultados de avaliações baseadas em métodos quaseexperimentais ou não-experimentais depende da qualidade do ajuste do
modelo especificado e de hipóteses não testáveis.
12
Dificuldades com desenhos experimentais
• Aleatorização pode ser inaceitável por razões éticas ou políticas,
devido à negação de benefícios ou serviços a indivíduos elegíveis.
• O escopo da intervenção pode impedir a seleção de um grupo de
controle (por exemplo, mudança numa política nacional).
• Indivíduos nos grupos tratamento e controle podem trocar de
grupo durante o experimento, contaminando os resultados.
• Pode ser difícil assegurar que a alocação nos grupos é
genuinamente aleatória.
• Pode ser caro e demorado em certas situações.
13
Desenhos quase-experimentais
• Consistem da construção de grupos de comparação ‘a posteriori’,
mediante métodos de pareamento ou de comparação reflexiva.
• Pareamento envolve a identificação de não participantes
comparáveis em características essenciais aos participantes.
• Indivíduos devem ser pareados usando características observáveis
que se sabe ou se acredita que podem influenciar os resultados da
política.
• Pareamento baseado em escores de propensão liga o grupo de
tratamento ao grupo de controle usando probabilidades condicionais de
participação dadas as características observadas.
+ Mais rápidos e baratos de implementar.
− Confiabilidade dos resultados é reduzida – podem não
evitar o viés de seleção.
14
Desenhos quase-experimentais
• Na comparação reflexiva, participantes do programa são
observados antes e depois da intervenção, e funcionam
simultaneamente como tratamento (após) e controle (antes).
+ Mais útil em avaliações de intervenções de cobertura completa,
tais como políticas universais em que toda a população participa e não é
possível definir grupos de controle.
− Principal desvantagem: a situação dos participantes antes e depois
da intervenção pode variar por razões independentes da política que se
quer avaliar.
– Ex: Participantes num programa de treinamento podem ter sua chance de
emprego aumentada.
– Se isto pode ser atribuído ao treinamento, também pode ser atribuído a
uma recuperação da economia após uma crise.
15
Desenhos não-experimentais
• Participantes são comparados com não-participantes
usando métodos estatísticos para controlar diferenças
entre os grupos.
• Variáveis instrumentais podem ser usadas para corrigir
viés de seleção em análises de regressão.
• Consiste em usar uma ou mais covariáveis (instrumentos)
que explicam a participação no programa, mas não os
resultados do programa dada a participação.
+ Relativamente baratos e fáceis de implementar.
− Confiabilidade dos resultados é reduzida – podem
não evitar o viés de seleção.
16
Métodos de estimação e análise
• Devem derivar do desenho de avaliação adotado.
• Podem ser classificados em quatro categorias:
– Comparação de médias desenho experimental
requerido;
– Pareamento com escores de propensão;
– Regressão múltipla;
– Regressão múltipla com variáveis instrumentais; e
– Dupla diferença (diferença da diferença).
17
Método da dupla diferença
• Pode ser aplicado tanto com desenhos experimentais como quaseexperimentais
• Uma pesquisa de linha de base (baseline) é realizada para observar
os indicadores de resultados para um grupo de controle e um grupo de
tratamento antes da intervenção.
• Uma pesquisa de seguimento (follow-up) das mesmas unidades
amostradas na pesquisa de linha de base é realizada após a
intervenção.
• Estima-se a diferença média entre os valores após e antes dos
indicadores de resultados para os grupos de tratamento e de controle.
• A diferença entre estas duas diferenças médias (isto é, a diferença das
diferenças) fornece a estimativa do impacto da política.
18
Estimativa de dupla diferença
19
Pesquisas como fontes de informação
para avaliações
• Pesquisas amostrais são ferramentas eficientes para coletar
dados.
• Pesquisas bem planejadas, mesmo com pequenas amostras,
podem fornecer estimativas acuradas para parâmetros de
modelos ou populações.
• Dois tipos de pesquisas são usadas para avaliação de políticas:
– Pesquisas existentes ou de múltiplos propósitos;
– Pesquisas específicas para o estudo da política em questão.
20
Usando dados de pesquisas existentes
• Geralmente requer ajuste de modelos de regressão aos dados da
pesquisa, e a realização de inferências para parâmetros de modelos.
• Análise secundária de dados de pesquisas existentes – geralmente tem
baixo custo comparado com o desenvolvimento de estudos específicos.
• Pesquisas de múltiplos propósitos são estudos observacionais.
• Portanto têm capacidade limitada de permitir inferência sobre
relações causais.
• Capacidade limitada de identificação de grupos de tratamento e
controle em pesquisas deste tipo.
21
Exemplo
• Considere utilizar dados da situação ocupacional da
pesquisa de força de trabalho como indicador de resultado
individual (pessoa está ocupada / trabalhando).
• A pesquisa pode incluir indivíduos de dois conjuntos de
municípios:
– Onde foi realizado um programa de treinamento para desocupados;
– Onde nenhum programa deste tipo foi implementado ainda.
• Oferece capacidade limitada de observar indivíduos antes e
depois que o programa de treinamento seja realizado.
22
Pesquisas amostrais
• Fornecem oportunidades para desenhos quase- e não-experimentais.
• Selecionam-se indivíduos ao acaso, e depois separa-se os indivíduos
em grupos de acordo com o status de participante ou não do programa
ou política de interesse.
• Pesquisas longitudinais geralmente são necessárias para medir
indicadores de resultados antes e depois da intervenção.
• Pesquisas de linha de base e de seguimento são estratégia
freqüente.
• Planejamento adequado pode permitir empregar método da dupla
diferença.
23
Planejando pesquisas para avaliação de políticas
• Literatura ainda escassa.
• Crucial entender a política e seus resultados esperados.
• Obtenha acordo dos principais ‘stakeholders’ para um plano de
pesquisa e para as estratégias de análise e disseminação.
• Obtenha compromisso de financiamento do estudo, e de que não
haverá tentativas de interferir com os participantes da pesquisa.
• Organização de pesquisa deve adotar medidas de proteção, tais como:
– Garantias de não revelação da identidade de participantes;
– Programa de disseminação independente de resultados obtidos.
24
Pesquisa de Painel Simples
Seguimento
Linha de base
Controle
Controle
Intervenção
Tratamento
Amostra no
seguimento =
amostra da
linha de base
Tratamento
25
‘Screening’ (varredura)
• Freqüentemente não é possível identificar grupos de controle e
tratamento antes de selecionar a amostra para a pesquisa.
• Desenhos tipo ‘screening’ ou ‘varredura’ (amostragem em duas fases)
podem ser necessários.
• Idéia básica: amostra ‘grande’ selecionada na primeira fase, e usada
para localizar:
– Indivíduos não-elegíveis não-participantes;
– Indivíduos participantes.
• Informação da operação de varredura usada para estratificar a amostra
segundo os grupos de controle e tratamento, e então como cadastro
para selecionar a amostra da segunda fase.
26
Alguns exemplos de pesquisas do Brasil
• Pesquisa AIBF
– Cedeplar-MG
• Pesquisa Nacional de Saúde do Escolar 2009 (PENSE)
– IBGE
• ITC project (http://www.itcproject.org/)
27
Programa Bolsa Família
• Transferência de renda a famílias com renda per capita abaixo de:
– R$ 70,00 por mês (linha de extrema pobreza ≈ 1.3 USD por dia)
– Linha de pobreza (= R$ 140,00 por mês) e que tenham crianças ou
adolescentes no domicílio
• Valores das transferências
– R$ 68,00 por mês para famílias em pobreza extrema;
– R$ 22,00 por criança até R$ 66,00 por mês para famílias em pobreza;
– R$ 33,00 por adolescente (16-17 anos de idade) até R$ 66,00 por mês para
famílias em pobreza.
• ≈ 12 milhões de famílias beneficiadas (Julho de 2010)
28
Pesquisa AIBF
• Linha de base realizada em 2005 para avaliar impacto do
Programa Bolsa Família de transferência de renda.
• Pesquisa nacional por amostragem de domicílios.
• Plano amostral estratificado, conglomerado e em duas fases
(com operação de varredura).
• ≈ 15,000 domicílios & 68,000 indivíduos pesquisados.
• Pesquisa longitudinal de painel simples, com linha
de base e seguimento planejados.
29
Desafios do projeto
• Programa Bolsa Família começou em Novembro de 2003.
• Pesquisa ‘encomendada’ em Outubro de 2004, quando o programa já
atendia cerca de 4 milhões de famílias.
• Pesquisa de campo era desejada para março de 2005.
• Cadastros de famílias ou indivíduos elegíveis ou beneficiários era de
qualidade duvidosa na ocasião.
• Recursos alocados para a pesquisa eram bastante limitados (menos de
0,2% do orçamento anual do programa na ocasião).
• Projeto politicamente sensível, devido à vizinhança das eleições
presidenciais previstas para Outubro de 2006.
30
Estratégia geral
• Realizar pesquisa domiciliar por amostragem, porque não
dependeria da qualidade dos cadastros de pessoas e
famílias elegíveis e/ou beneficiárias.
• Cobertura de todas as famílias, inclusive não-elegíveis.
• Levar em conta experiência de pesquisas similares em
outros países: PROGRESA do México.
• Desenvolver instrumentos de avaliação adequados ao
contexto do programa brasileiro.
31
Cadastro
• Cadastro de setores censitários definidos para o Censo
Populacional de 2000
• Incluía total de moradores e domicílios por setor conforme
o Censo 2000
• Mapas e descrições de limites dos setores obtidos do Censo
• Algumas estatísticas agregadas em nível de município do
cadastro de beneficiários do programa usadas para efetuar
estratificação de áreas
32
Plano amostral
• Amostragem em duas fases
• Primeira fase: Amostragem estratificada de conglomerados – 3 estágios
– Municípios estratificados por tamanho e localização;
– Amostragem PPS dos municípios, com alguns municípios incluídos com
probabilidade igual a 1;
– Amostragem PPS dos setores censitários dentro dos municípios;
– Listagem / ‘screening’ de todos os domicílios nos setores selecionados.
• Segunda fase: amostragem estratificada simples de domicílios.
– Domicílios estratificados conforme eligibilidade e participação no
programa Bolsa Família;
– Todos os membros pesquisados nos domicílios selecionados.
33
Tamanho da amostra
• Tamanho total da amostra = 15,000 domicílios
• Número total de ‘localidades’ não deveria exceder cerca de 100
• Parâmetros de tamanho definidos para ajustar-se ao orçamento
disponível.
• Resultados desejados para três grandes regiões do país:
– Norte + Centro-Oeste (NO+CO)
– Nordeste (NE)
– Sudeste + Sul (SE+SU)
• Tamanhos de amostra alocados às três regiões iguais, para obter
precisão similar das estimativas.
34
Alocação da amostra entre grupos de
controle e tratamento
• Tratamento – 30% dos casos
– Domicílios já recebendo Bolsa Família.
• Controles Tipo 1 – 60% dos casos
– Domicílios elegíveis e cadastrados que ainda não estavam
recebendo o benefício.
• Controles Tipo 2 – 10% dos casos
– Todos os outros domicílios, incluindo os não elegíveis.
35
Razões para esta alocação
• Pesquisa seguimento planejada para ter lugar cerca de 1 ano após a de
linha de base.
• Trabalho de campo realizado durante 1 mês (novembro 2007 para LB).
• Esperava-se que grande parte dos controles de tipo 1 se tornariam
participantes (grupo de tratamento) entre as duas pesquisas.
• Comparações desejadas entre:
– Tratamento e controles tipo 1 (já na pesquisa de linha de base);
– Tratamento, entre as pesquisas de linha de base e a de seguimento;
– Controles tipo 1 que viraram tratamento na pesquisa de seguimento
(comparação reflexiva);
– Controles tipo 2, entre as pesquisas de linha de base e a de seguimento.
36
Plano amostral
• Municípios grandes (41)
• Outros Municípios
•
•
Fase 1 – Amostragem de
conglomerados em 2 estágios
•
Estratos = Regiões + Classes de taxas
de cobertura do programa
•
PSU = municípios ou grupos de
municípios (pop. > 50.000)
•
SSU = setores censitários
•
Seleção de PSUs: Amostragem
Seqüencial de Poisson
•
Screening + amostragem estratificada
de domicílios na fase 2
Fase 1 – Amostragem de
conglomerados em 1 estágio
•
Estratos = municípios
•
PSU = setores censitários
•
Seleção de PSUs: PPS sistemático
•
Screening + amostragem estratificada
de domicílios na fase 2
37
Amostra nos municípios grandes
• Cada município é um estrato para seleção de setores
censitários, e na segunda fase, de domicílios.
Região
Número de
municípios
(estratos)
Setores
selecionados por
município
Setores na
amostra
NO+CO
7
18
126
NE
11
15
165
SE+SU
23
15
345
Total
41
-
636
38
Amostra nos outros municípios
Região
PSUs na
população
Municípios na
população
PSUs na
amostra
SSUs
(setores)
na
amostra
Domicílios
na amostra
NO+CO
157
888
23
276
3.312
NE
480
1.775
25
300
3.600
SE+SU
783
2.802
17
204
2.040
1.420
5.465
65
780
8.952
Total
12 setores na amostra em cada PSU.
39
Tamanho total da amostra
Municípios grandes
Região
Outros municípios
Total
Setores
Setores Domicílios
Setores na Domicílios
Domicílios
na
na
na
amostra na amostra
na amostra
amostra amostra
amostra
NO+CO
126
1.512
276
3.312
402
4.824
NE
165
1.980
300
3.600
465
5.580
SE+SU
345
3.450
204
2.040
549
5.490
Total
636
6.942
780
8.952
1.416
15.894
12 domicílios por setor nas regiões NO+CO & NE, e
10 domicílios por setor nas regiões SE+SU
40
Tamanhos de amostra efetivos por região
Região
NO+CO
Domicílios
Pessoas Pessoas
com
na
por
entrevista
amostra domicílio
completa
4.433
21.314
4,8
NE
5.106
23.008
4,5
SE+SU
5.887
25.360
4,3
Total
15.426
69.682
4,5
41
Tamanhos de amostra por tipo de unidade
Estrato
Tratamento
Domicílios
Pessoas Pessoas
com
na
por
entrevista
amostra domicílio
completa
4.588
22.686
4,9
Controle tipo 1
9.036
41.068
4,5
Controle tipo 2
1.802
5.928
3,3
Total
15.426
69.682
4,5
42
Comentários finais
• Projeto bastante desafiador.
• Protocolo de pesquisa incluiu:
– Identidade e localização das unidades amostradas guardadas do
Ministério contratante da pesquisa.
– Disseminação dos resultados da pesquisa planejada para ter lugar
após as eleições.
– Microdados anonimizados para proteção de confidencialidade
depositados em arquivo público.
– Combinação de dados com outras fontes:
• ‘Pesquisa comunitária’ feita nas localidades com domicílios na amostra
(cerca de 100);
• Registros escolares das crianças recuperados para todas as crianças
entrevistadas na pesquisa.
43
Obrigado pela atenção!
44
Referências
• The World Bank Impact Evaluation website
• CEDEPLAR
(http://www.cedeplar.ufmg.br/pesquisas/projetos-concluidos/projeto-bolsafamilia.php)
• IBGE
(http://www.ibge.gov.br/home/presidencia/noticias/pense.shtm)
• The Magenta Book: Guidance notes for Policy Evaluation and Analysis
(http://www.gsr.gov.uk/professional_guidance/magenta_book/index.asp)
• Consórcio de Informações Sociais
(http://www.nadd.prp.usp.br/cis/index.aspx)
45
Amostragem de populações raras
(Kalton, 2001)
Amostrando populações raras
• Muitas pesquisas de avaliação de políticas focam em
subgrupos ‘raros’ da população
• Exemplos:
– Pessoas em situação de pobreza ou extrema pobreza;
– Pessoas em idade de aposentadoria (> 60 anos);
– Famílias com crianças em idade pré-escolar;
– Pessoas portadoras de deficiências;
– Etc.
47
Objetivos com amostragem de populações raras
• Há dois usos principais para amostras de populações raras:
• Estimar o tamanho (M) da população rara ou sua
prevalência (P=M/N);
• Medir características dos membros da população rara e
estimar medidas resumo (médias, razões, etc.) destas;
– Exemplo: estimar o gasto médio com atenção à saúde de
portadores de deficiências.
48
Pesquisas para estimar tamanho ou prevalência
• Há duas abordagens principais.
• Para estimar prevalência, a amostra deve cobrir toda a
população e métodos usuais de estimação de proporções
podem ser usados.
• Para estimar somente o tamanho, métodos baseados em
técnicas de ‘captura – recaptura’ podem ser usados.
– Exemplo: pesquisas de avaliação de cobertura de censos.
• Daqui para frente, foco em métodos para estimar resumos
de características das populações raras (segundo objetivo).
49
Amostrando populações raras
• Quando há um cadastro disponível listando os membros da
população ‘rara’ de interesse:
– Métodos usuais de amostragem podem ser empregados;
– Custos de pesquisa são menores;
– Preocupação maior deve ser com a qualidade e cobertura do
cadastro.
• Situação é mais difícil quando não há cadastro disponível
que permita identificar os membros da população rara.
• Neste caso, há que usar métodos especiais de amostragem.
50
Métodos especiais para amostrar populações raras
• Amostragem estratificada desproporcional;
• Screening ou varredura;
• Amostragem de locais x períodos (time-location sampling);
• Amostragem de múltiplos cadastros;
• Amostragem de multiplicidade (multiplicity sampling);
• Amostragem seqüencial ou inversa;
• Amostragem adaptativa;
• Acumulação de amostras.
51
Amostragem estratificada desproporcional
• Algumas populações raras são mais fortemente
concentradas em certas partes da população.
• Quando isto ocorre, pode ser vantajoso amostrar com maior
intensidade nas partes onde existe maior concentração.
• As partes da população são usadas como estratos, com
maiores frações de amostragem usadas nos estratos
com maior prevalência de membros da população rara.
• Estratégia pode ser eficiente por reduzir os custos de
varredura para identificar os membros da população rara.
52
Amostragem estratificada desproporcional
• Hipóteses de trabalho
– Média da característica y é a mesma em todos os estratos;
– Variância da característica y é a mesma em todos os estratos;
– Custo de varredura para não-membros da população rara (cs) é o
mesmo em todos os estratos;
– Custo de entrevista para membros da população rara (cr) é o
mesmo em todos os estratos.
• Amostra selecionada mediante amostragem aleatória
simples em cada estrato.
53
Alocação ótima da amostra
• Sob hipóteses de trabalho adotadas, fração ótima de
amostragem num estrato h é dada por:
fh ∝
Ph
Ph (r − 1) + 1
• Onde Ph = M h N h é a prevalência da população rara no
estrato h; e
•
r = cr cs é razão do custo de entrevista para o custo de
varredura.
54
Implicações da alocação ótima
• Na maioria dos casos, r > 1 (custos de entrevista
maiores que custos de varredura).
• Se r = 1, então f h ∝ Ph e alocação ótima seria
proporcional à prevalência em cada estrato.
• Exemplo: dois estratos, com prevalências de 64% e 4%.
– Com r = 1 a fração amostral no primeiro estrato deveria ser 4
vezes maior que no segundo.
– Com r = 4 a fração amostral no primeiro estrato deveria ser
2,48 vezes maior que no segundo.
55
Ganhos de eficiência
• Ganhos de eficiência em relação à alocação
proporcional:
(
(
)
)

M h Nh 
R=
=  ∑h

M N 
V y prop

V yopt
2
• Logo distribuições da população rara e total ao longo
dos estratos têm que diferir para obter ganhos de
eficiência com alocação desproporcional.
56
Varredura (screening) com amostras de áreas
• Grande parte das pesquisas domiciliares são feitas por
amostragem de áreas.
• Isto ocorre por não haver cadastros tipo lista disponíveis
para amostrar domicílios (ou pessoas) diretamente.
• Além disto, pesquisas conglomeradas são mais baratas
por unidade entrevistada.
• O mesmo vale para pesquisas que visam localizar membros
de populações raras.
• Mas nesse caso é necessária uma operação de varredura
(screening) antes da seleção de unidades para entrevistar.
57
Três tipos de situações distintas
• População rara está igualmente espalhada no território.
• População rara está desigualmente espalhada, com maiores
concentrações em certas áreas.
• População rara está desigualmente espalhada, com muitas
áreas sem qualquer membro da população rara.
• Os métodos adequados para amostragem variam conforme
a situação.
58
População rara igualmente espalhada no território
• Suponha plano amostral conglomerado em 2 estágios,
com:
– Amostragem aleatória simples de conglomerados;
– Amostragem aleatória simples de unidades;
– a conglomerados selecionados no 1º estágio;
– b unidades selecionadas no 2º estágio;
– Conglomerados têm igual tamanho;
– Custo total de pesquisa é dado por:
C = aC1 + abC2
59
População rara igualmente espalhada no território
• Sob estas condições, o número de unidades que se
deve amostrar por conglomerado é:
C1 1 − ρ
b=
C2 ρ
• Onde ρ é a correlação intraconglomerado da
principal variável de interesse y.
• Este é o resultado quando se quer estimar a média de
y para toda a população.
60
População rara igualmente espalhada no território
• Para populações raras igualmente espalhadas no
território, o número de unidades da população rara
que se deve amostrar por conglomerado é:
br =
C1
1− ρ
cr + cs (1 − P ) P ρ
• Isto ocorre porque o custo de amostrar cada unidade
da pop. rara é o custo de entrevista (cr) mais o custo
de varredura de unidades não pertencentes a esta
população (cs vezes o número de unidades visitadas
não membro para cada unidade entrevistada) .
61
Situações limite
• Se o custo de varredura for nulo (cs=0) e o custo de
entrevistar um membro da população rara for o mesmo que
para um não membro (isto é, C2=cr) então br= b.
• Se o custo de entrevista for igual ao custo de varredura
(cr=cs) então br=P1/2 b.
• Segue-se então que P1/2 b < br < b.
• Note que apesar de br < b o número total de unidades
visitadas (nT) por conglomerado é nT =br/P >> b.
• Ex.: Se P=0,10 e b=20 então 6 < br < 20 e 63 < nT < 200.
62
Amostragem Inversa
• Devida a Haldane (1945).
• Na amostragem usual, varredura de nT unidades (nT fixado)
é necessária para encontrar em média br unidades da
população rara (por conglomerado).
• Na amostragem inversa, varredura prossegue até encontrar
exatamente br unidades da população rara, sendo
necessário visitar nT unidades (nT é aleatório).
• Método usado na versão brasileira de Pesquisa Mundial de
Saúde (Vasconcellos, Silva e Szwarcwald, 2005).
63
População rara desigualmente espalhada no território
• Neste caso, pode-se usar amostragem estratificada
desproporcional.
• Alternativamente, usar amostragem de conglomerados com
probabilidade proporcional ao tamanho.
• Medida de tamanho deve ser aproximadamente
proporcional à prevalência da população rara por
conglomerado.
• Ex.: Amostra de população de japoneses e descendentes no
Brasil em 1988. Centro de Estudos Nipo-Brasileiros (1988).
64
Muitos conglomerados sem membros da pop. rara
• Se conglomerados puderem ser identificados com precisão
antes de amostrar, simplesmente remova-os do cadastro.
• Caso contrário, usar esquema ‘seqüencial’.
– Amostrar a conglomerados;
– Em cada conglomerado, amostrar b0 unidades;
– Se nenhuma unidade da pop. rara é encontrada num
conglomerado, interromper varredura no conglomerado.
– Se ao menos uma unidade da pop. rara é encontrada,
prosseguir até obter br unidades da pop. rara ou nT unidades.
• Pesos amostrais devem refletir mecanismo seqüencial.
65
Amostragem de locais x períodos
• Métodos usados para amostrar indivíduos que visitam
certos locais específicos, tais como bibliotecas, museus,
bares, centros comerciais, hotéis, etc.
• Amostragem é feita geralmente quando indivíduos entram
ou deixam locais selecionados.
• Duas unidades de análise distintas:
– Visitas;
– Visitantes.
– Ex. UK International Passenger Survey.
66
Amostragem de locais x períodos
• Amostras aleatórias de visitas facilmente produzidas com
este método.
– Ex. de pesquisa onde visita é unidade de análise adequada:
pesquisa de satisfação de visitantes de um museu.
• Em muitos casos, visitante é unidade de análise adequada.
• Problema: mesmo visitante pode fazer várias visitas aos
locais de interesse no período da pesquisa.
– Ex. Adultos que visitam bares, em pesquisa para saber se
pretendem dirigir depois de ingerir álcool.
67
Amostragem de locais x períodos
• Visitantes com múltiplas visitas têm maiores chances de ser
selecionados para amostra.
• Dificuldade: como obter informação acurada sobre número
de visitas feitas ou que serão feitas aos locais amostrados
durante período de referência da pesquisa.
• Duas alternativas principais para lidar com problema:
– Perguntar freqüência usual de visitas;
– Perguntar se a visita em questão é a primeira que faz durante o
período de referência da pesquisa, e entrevistar apenas os que
responderem ‘sim’.
68
Amostragem de locais x períodos
• Desenho usual: amostra conglomerada em dois estágios.
• UPAs construídas como combinações de locais e
segmentos de tempo em que os locais são visitados.
• UPAs são selecionadas com probabilidades proporcionais
ao tamanho, após cuidadosa estratificação.
• No segundo estágio, indivíduos selecionados por algum
mecanismo sistemático à medida que vão passando para
entrar ou sair do local amostrado.
• Ex. Pesquisa de condutores de veículos que freqüentam
bares em Porto Alegre, Brasil. De Boni et al (2010).
69
Referências
• Centro de Estudos Nipo-Brasileiros (ed.), Pesquisa da população de
descendentes de japoneses residentes no Brasil, 1987-1988 (1988, em
português e em japonês).
• De Boni, R. et al (2010). Beber e dirigir em uma amostra de condutores
que frequentam bares de Porto Alegre. SENAD.
http://www.obid.senad.gov.br/portais/OBID/biblioteca/documentos/Publicacoes/328040.pdf
• Haldane, JBS (1945). On a method of estimating frequencies.
Biometrika, 33, 222-225.
• Kalton, G. (2001). Practical methods for sampling rare and mobile
populations. Proc. ASA JSM.
• Vasconcellos, M.T.L.; Silva, P.L.N.; Szwarcwald, C.L. (2005). Sampling
design for the World Health Survey in Brazil. Cad. Saúde Pública, vol.
21, suppl.1, pp. S89-S99.
70
Ajustando modelos a dados
amostrais complexos
Inferência com Dados Amostrais Complexos
Podemos ignorar o plano amostral e modelar dados como
IID? NÃO
Se não, podemos ajustar procedimentos de inferência? SIM
COMO fazer inferência analítica usando dados amostrais
“complexos”? ⇓
Método da Máxima Pseudo-Verossimilhança (MPV)
72
Dados Amostrais “Comuns”
• Dados observados: y1 ,..., yn
• Modelo: y1 ,..., yn IID ∼ f(y;θ)
• Objetivo: inferência sobre parâmetro θ
• Verossimilhança da amostra
(θ; y) = ∏i∈s f ( yi ;θ )
73
Inferência para θ por máxima verossimilhança
• Log-verossimilhança
L(θ ; y ) = ∑ i∈s log[ f ( yi ;θ ) ]
Escores das
observações
• Equações de verossimilhança
∑i∈s ∂ log [ f ( yi ;θ )] / ∂θ = ∑i∈s ui (θ ) = 0
• Solução: θˆ estimador MV de θ
74
Estimando variâncias com MV
(grandes amostras)
V(θˆ) ≅ [ J (θ )]−1
J (θ ) = −∑i∈s ∂ 2 log[ f ( yi ;θ )] / ∂θ 2 = −∑i∈s ∂ ui (θ ) / ∂θ
V̂(θˆ ) ≅ [ J (θˆ )]−1
J (θˆ) = J (θ ) θ =θˆ
75
Dados de Pesquisas Amostrais
• Dados observados:
( y1; w1 ) ,…, ( yn ; wn )
• Objetivos
– Inferência analítica
– Seleção e ajuste de modelos paramétricos
• Problema: como incorporar modelo na abordagem de
Amostragem?
• Solução: modelos de superpopulação
76
Modelo de Superpopulação
Modelo paramétrico
f ( y ;θ )
Dados amostrais
y1,… , yn e w1,… , wn
População Finita U
y1,… , y N
Plano amostral
p( s)
77
Análise de Dados Amostrais “Complexos”
• Combina duas tradições
• Procura incorporar aspectos do plano amostral que gerou
os dados
• Requer nova abordagem para modelar: Modelo de
Superpopulação
78
Modelagem de Dados Amostrais Complexos
• Objetivos
– Inferir sobre θ
– Incorporando plano amostral e pesos
• Como:
– Método da Máxima Pseudo-Verossimilhança (MPV)
79
Modelo de Superpopulação
• Dados da população: y1 ,..., yN
• Modelo: y1 ,..., yN IID ∼ f(y;θ)
Inferência para θ com censo
• Log-verossimilhança do censo
LU (θ ; y ) = ∑i∈U log [ f ( yi ;θ ) ]
80
Inferência para θ com censo
• Equações de verossimilhança do censo
∑i∈U ∂ log[ f ( yi ;θ )]/ ∂θ = ∑i∈U ui (θ ) = 0
• Solução: θU estimador MV de θ com censo
– “Pseudo-parâmetro”
– Quantidade populacional descritiva correspondente (QDPC)
81
Método de Máxima Pseudo-Verossimilhança
• Dados amostrais
( y1, w1 ),..., ( yn , wn )
• Equação de verossimilhança do censo
∑i∈U ui (θ ) = T (θ ) = 0
• T(θ) é um total populacional
82
Método de Máxima Pseudo- Verossimilhança
• Estimando totais com amostra
Tˆ (θ ) = ∑ w u (θ )
i∈s i i
• Equação de verossimilhança da amostra
Tˆ (θ ) = ∑i∈s wi ui (θ ) = 0
• Solução: θˆMPV estimador MPV de θ usando amostra
• Incorpora pesos na estimação
83
Estimando Variâncias com MPV
 ˆ ˆ −1
−1 ˆ 
−1
ˆ
ˆ
ˆ
ˆ
ˆ
V (θπ ) = [ J (θπ )] V p  ∑ π i ui (θπ )  [ J (θπ )]
i∈s

Jˆ (θˆπ ) = − ∑ π i−1 ∂ ui (θ ) / ∂ θ θ =θˆ 

π 
i∈s


−1
ˆ
ˆ
V p  ∑ π i ui (θπ )  = ∑ ∑ (π i−1π −j 1 − π ij−1 )[ui (θˆπ )][ui (θˆπ )]′
i∈s
 i∈s j∈s
84
Exemplos de alguns modelos
• Regressão linear
f (β; yi , xi ) =
1
2πσ 2
exp[−( yi − x′i β) 2 / (2σ 2 )]
ui (β) = σ −2 ( yi − x′i β)xi
• Regressão logística
exp( x′i β) / [1 + exp( x′i β)] se yi = 1
f (β; yi , xi ) = 
se yi = 0
1/ [1 + exp(x′i β)]
ui (β) = [ yi − f (β; yi , xi )]xi
85
Procedimento MPV: Características
• “Corrige” teoria clássica.
• Inferência assintótica correta, considerando pesos e plano
amostral.
• Flexibilidade: aplicável a muitos modelos paramétricos e
planos amostrais “regulares”.
• Estimador não é único: pesos aplicados podem levar a
estimadores diferentes.
86
Pareamento com escores de propensão
• Defina resposta como indicador de participação no
programa de interesse
– Di = 1 se unidade participa do programa
– Di = 0 se unidade não participa do programa
• Use covariáveis xi observadas na pesquisa para ajustar
modelo de regressão logística para explicar Di .
• Calcule valores preditos para escores de propensão a
participar para participantes e não participantes
pˆ ( Di = 1) = exp(x′i βˆ ) / [1 + exp(x′i βˆ )]
87
Pareamento com escores de propensão
• Para cada caso (unidade participante do programa) localize
um controle (unidade não participate do programa) tal que:
– Seu escore de propensão seja o mais próximo do escore do caso –
‘Nearest Neighbour Matching’.
– Alternativa: defina um valor máximo d para a distância entre os
escores de propensão de um caso e de possíveis controles.
– Então localize todos os não participantes com escores de propensão
dentro deste ‘raio’ e selecione um ao acaso para parear com o caso
– ‘Maximum Radius Matching’.
• Após completar o pareamento, faça as comparações entre
os grupos de tratamento e controle mediante diferenças de
médias ou modelos de regressão.
88
Hipóteses requeridas por PSM
• Seja Y a variável de resultado que se deseja avaliar.
• Seja Y1i o valor dessa variável para indivíduo i quando este
foi tratado, e Y0i o valor quando não foi tratado.
• Somente um dos dois valores é observável para cada
indivíduo.
• O efeito (não observável) do tratamento é definido como:
Ri = Y1i − Y0i
89
Hipóteses requeridas por PSM
• Impacto médio do tratamento sobre toda a população:
E ( R) = E (Y1 − Y0 )
• Impacto médio do tratamento sobre população ‘tratada’:
E ( R D = 1) = E (Y1 − Y0 D = 1) = E (Y1 D = 1) − E (Y0 D = 1)
Termo estimável
com amostra de
casos.
Termo não
observável, que
pareamento vai
permitir estimar.
90
Estimando efeitos sob PSM
• X covariáveis que afetam participação e resultado.
• Quando se usa o método de pareamento com escores de
propensão, a estimativa do impacto médio do programa
sobre participantes é obtida por:
E ( R D = 1, X ) = E (Y1 D = 1, X ) − E (Y0 D = 0, X )
Termo estimado com
controles pareados aos
casos.
• Hipótese crucial para obter estimativas não viciadas:
E (Y0 D = 1, X ) = E (Y0 D = 0, X )
91
Dificuldades com PSM
• Grandes amostras necessárias para conseguir controles
pareados para todos os casos.
• Requer coletar informação sobre preditores do indicador de
participação que permitam predizer com confiança os
escores de propensão.
• Vícios de seleção podem persistir porque o pareamento
controla apenas através de covariáveis observáveis.
• Hipóteses que sustentam método não são testáveis com
dados obtidos numa pesquisa de avaliação.
92
Referências
•
Binder, D.A. (1983). On the variances of asymptotically normal estimators from
complex surveys. Int. Stat. Review, 51, 279-292.
•
Borland, J.; Tseng, Y. e Wilkins, R. (2005). Experimental and quasiexperimental methods of microeconomic program and policy evaluation.
Melbourne Institute Working Paper.
•
Caliendo, M. e S. Kopeinig (2008). Some practical guidance for the
implementation of propensity score matching. Journal of Economic Surveys,
22(1): 31-72.
•
Rosenbaum, P. R. e Rubin, D. B. (1983). The central role of the propensity score
in observational studies for causal effects. Biometrika 70(1): 41-55.
•
Skinner, C.J.; Holt, D. e Smith, T.M.F. (1989). Analysis of complex surveys.
Chichester, John Wiley & Sons.
93

Documentos relacionados