Teste de hipótese de médias e proporções

Transcrição

Teste de hipóteses para médias e
proporções amostrais
Prof. Marcos Pó
Métodos Quantitativos para Ciências Sociais
Intervalo de confiança: outro entendimento
É o intervalo que contém o parâmetro que
queremos estimar, com um grau de confiança
indicado pelo coeficiente γ (gama).
Ele permite estabelecer um julgamento do
erro que podemos estar cometendo e a
probabilidade de que nossa amostra tenha,
por acidente, ficado além desse erro.
ICx;  x  Z 
IC pˆ ;  pˆ  Z 

n
p(1 p)
n
Erro que
podemos
estar
cometendo
γ
α/2
α/2
γ (gama) é a
confiança que temos
de estar, no máximo,
cometendo esse erro
com nossa amostra.
2
Hipótese estatística
• Hipótese é uma explicação provisória proposta para um
fenômeno, que visa a ser posteriormente demonstrada ou
testada cientificamente.
• Hipótese estatística é uma afirmação sobre um parâmetro
populacional com base em estatísticas amostrais.
►
►
H0 - Hipótese nula: normalmente é uma afirmação de igualdade de que
os valores encontrados são explicados por erros amostrais.
HA - Hipótese alternativa: é o complemento da hipótese nula e significa
normalmente que os valores encontrados devem-se ao fato de
tratarmos de duas populações diferentes.
3
Exemplos de tipos de teste de hipótese
Tipo de teste
Ex.: investigando um assassinato
Passar pelo aro (hoop test): pode eliminar
hipóteses, mas não dá suporte às hipóteses
restantes. Condição necessária, mas não suficiente.
Indício (straw in the wind tests): fornece
informação útil que pode favorecer uma hipótese.
Não traz nem condição necessária ou suficiente para
aceitar ou rejeitar uma hipótese.
Arma fumegante (smoking gun test): apoia
fortemente uma hipótese, mas falhar no teste não
elimina a mesma. Critério suficiente, mas não
necessário para confirmação.
Duplamente decisivo (doubly decisive tests):
confirma uma hipótese e elimina outras.
O suspeito está na cidade no dia do
crime.
O suspeito disse a colegas que tinha
vontade de dar um tiro na vítima
quando ela era grosseira com ele.
O suspeito aparece com uma arma
fumegante na mão logo após o
assassinato.
Imagens mostram o suspeito entrando
sozinho no apartamento da vítima e
saindo com uma arma na mão.
Baseado em BENNETT, Andrew. Process tracing and causal inference, 2004
4
Teste estatístico de hipótese
• Processo que usa estatísticas amostrais para testar uma
afirmação sobre um parâmetro de uma população.
• O teste estatístico de hipótese oferece uma metodologia que
permite julgar se os dados amostrais trazem evidências que
apoiem ou não uma hipótese quantitativa, assim como
permite estimar a probabilidade de cometer determinados
tipos de erro nesse julgamento.
• Ou seja, nos permite responder com algum grau de confiança:
essa evidência nos convence que nossa hipótese está errada?
5
Tipos de teste estatístico de hipótese
• Médias
• Proporções
• Dados categóricos (aderência, homogeneidade e
independência)
• Variância
• Várias populações (ANOVA)
• Regressão
6
Tipos de erro
Julgamento
Realidade
Inocente
Inocente
Culpado
ok
Erro Tipo II
• Hipótese: afirmação que
queremos testar usando
técnicas estatísticas.
• Pode haver dois tipos de
erro:
►
Culpado
Erro Tipo I
ok
►
Erro Tipo I: rejeitar uma
hipótese que é verdadeira;
Erro Tipo II: aceitar uma
hipótese que é falsa.
7
Erro Tipo I: rejeitar uma hipótese verdadeira
• A probabilidade de incorrermos nesse erro é denominada α e
é chamada de nível de significância do teste, ou seja, o resultado
da amostra é tanto mais significante para rejeitar H0 quanto
menor for o valor de α
10%
• Normalmente α é fixado em:
5%
*
Evento raro
1%
**
Evento raríssimo
0,1%
***
Evento raríssimo
• A probabilidade α é um valor definido arbitrariamente pelo
pesquisador.
8
Erro Tipo II: aceitar uma hipótese falsa
• A probabilidade de se incorrer no Erro Tipo II é denominada
β (beta).
• Nem sempre conseguimos determinar ou definir β em um
teste de hipótese, pois normalmente a Hipótese Alternativa de
um problema não contém muitos elementos.
9
Exemplo
Empresa
Resistência à tração
Desvio-padrão
Preço lote
A
1450 kg
120 kg
R$ 1.000
B
1550 kg
200 kg
R$ 1.500
(a). Se a regra de decisão fosse: “caso o resultado do teste seja inferior à
1500kg, considero que os vergalhões são de A, caso contrário, são de
B”, calcule a probabilidade de cometer os seguintes erros:
►
►
Tipo I: dizer que os vergalhões são de A quando na realidade são de B;
Tipo II: dizer que os vergalhões são de B quando na realidade são de A
(b). Qual deveria ser a regra de decisão se o comprador quiser que o risco
de comprar A ao invés de B (Erro Tipo I), seja menor que 5%?
Baseado em Bussab; Moretin, 2002: 323
Uma cooperativa pode usar dois tipos de vergalhão para a construção de
casas, produzidos pelas empresas A ou B de acordo com as especificações
e com preços abaixo. Alguns lotes estão sendo vendido por R$1.100 e,
antes de se decidir, a cooperativa terá acesso ao teste de uma amostra de
25 peças.
10
Como escolher o erro que aceitamos cometer?
• Ao se diminuir a probabilidade de Erro I, aumenta-se a
chance de Erro II.
• Para escolher que risco queremos correr é necessário analisar
qual seria mais prejudicial para a pesquisa e para os seus
possíveis impactos.
• Ex.: Por causa de um erro amostral excessivo seria mais grave
considerar que...
►
►
... há ou não diferenças no desempenho acadêmico de estudantes de
acordo com o gênero?
... há ou não diferenças no desempenho de motoristas que tomam
bebidas alcoólicas?
11
Roteiro para o teste de hipótese
1. Definir as hipóteses.
►
►
Nula (H0)
Alternativa (HA)
2. Especificar as evidências estatísticas que serão usadas.
►
►
Estimadores
Obter propriedades da estatística (distribuição, média, desviopadrão...)
3. Fixar a probabilidade de cometer o Erro Tipo I (α) e
especificar a regra de decisão.
►
Valor de referência para aceitar ou rejeitar a hipótese (região crítica)
4. Apreciar a evidência.
5. Decidir e interpretar o resultado.
12
Usar t ou z para teste de hipótese?
• Se conhecermos o desvio-padrão da população (σ), pode-se
usar a distribuição z.
• Caso não se conheça σ, temos que usar o s da amostra para
determinar o intervalo de confiança.
• Assim, segue-se a mesma regra que para intervalos de
confiança:
►
►
Amostras grandes: nesse caso pode-se considerar que a amostra
aproxima-se da normal
Amostras pequenas: usar a distribuição t de Student
13
Teste de hipóteses para duas populações
• Objetivo: testar hipóteses que comparam médias de duas amostras,
possivelmente de populações distintas.
• Tipos de amostras:
►
►
Independentes: não há relação entre as amostras selecionadas em cada
população
Dependentes: cada membro de uma amostra corresponde a um membro da
outra amostra. Também chamadas de emparelhadas ou relacionadas.
População 1
(μ1; σ1)
População 2
(μ2; σ2)
Amostra
(n, X, s)
Amostra
(m, Y, s)
14
Testes possíveis
• Diferença entre médias
• Diferença entre desvios-padrão (será tratado juntamente com ANOVA)
15
Considerações: teste de médias
• Populações:
►
►
Normais (= distribuição amostral da média)
Homocedásticas (σX = σY = σ)
• Lembrar que:
E( X  Y )  E( X )  E(Y )
E( X  Y )  E( X )  E(Y )
Var ( X  Y )  Var ( X )  Var (Y )
Var (k  X )  k 2  Var ( X )
16
Amostras independentes
• Podemos definir um intervalo de confiança da diferença da média
das amostras X e Y, com n e m elementos respectivamente.
  2X  Y2 
E ( X  Y ) ~ N  0;
 
m
 n
Z
X Y
 2X   Y2
n
m
• Como as populações são homocedásticas podemos simplificar:
z
X Y
1 1
s. 
n m
• Caso seja usada a distribuição t, os graus de liberdade serão ν =
n+m-2
17
IC do teste da diferença de duas médias
14
N (0,1)
12
,1
08

2
06
04

2
1
02
0
0
-
5
-z
010
z
E( X  Y )  0
Var ( X  Y )  Var ( X )  Var (Y )
15
+
20
X Y
z
1 1
s. 
n m
Amostras dependentes
• Nesse caso, a quantidade de elementos de X e Y são iguais
(n).
• As amostras podem ser entendidas como pares (X1-Y1,..., XnYn) e, assim, podemos definir a variável D = X–Y, resultando
na amostra D1,...,Dn.
• Dessa forma, reduzimos o problema a uma única população e
amostra, com as seguintes características:
1 n
D  i 1  X i  Y i   X  Y
n

1 n
Di  D
S D  n 1 
i 1
2

2
19
Teste de hipótese para proporção
• Idêntico ao teste de médias, considerando que a estatística p
tem distribuição aproximadamente normal.
 p(1  p) 
pˆ ~ N  p,

n 

20
Probabilidade de significância (p-valor)
• Invés de se definir arbitrariamente um valor para α, um
procedimento alternativo consiste em determinar a
probabilidade de significância, ou p-valor do teste.
• Nesse caso, em vez de se calcular a região crítica para aceitar
ou rejeitar a hipótese, calcula-se qual a probabilidade de
ocorrerem valores para X ou p mais desfavoráveis à H0. A
seguir julga-se se tal valor consiste em um evento raro.
• Em muitos casos, em vez de se determinar simplesmente se
H0 é rejeitada, diz-se que H0 é rejeitada a um determinado
nível de p-valor.
21
Exercício
1. As estruturas de 20 recém-nascidos, medidas em cm, foram
tomadas no Departamento de Pediatria de um hospital.
41
50
50
52
52
50
49
47
49
49
54
51
50
46
47
50
52
49
49
50
Média: 49,35
Desvpad: 2,720
(a) Suponha que a distribuição populacional das estruturas seja
normal, com variância de 2 cm2. Teste a hipótese de que a
média seja 50 cm admitindo o risco de 5% de cometer o erro
tipo I.
(b) Faça o mesmo supondo variância populacional
desconhecida.
22
Roteiro para o teste de hipótese
1. Definir as hipóteses.
►
►
Nula (H0)
Alternativa (HA)
2. Especificar as evidências estatísticas que serão usadas.
►
►
Estimadores
Obter propriedades da estatística (distribuição, média, desviopadrão...)
3. Fixar a probabilidade de cometer o Erro Tipo I (α) e
especificar a regra de decisão.
►
Valor de referência para aceitar ou rejeitar a hipótese (região crítica)
4. Apreciar a evidência.
5. Decidir e interpretar o resultado.
23
Exercício
2. Desconfiada com os resultados do sorteio de grupos
realizado por seu professor de Métodos Quantitativos, a aluna
R. resolveu testar o dado utilizado fazendo 600 lançamentos,
onde o lado três foi sorteado 123 vezes.
(a) Podemos afirmar, ao nível de 5%, que o dado é viciado em
relação ao lado 3?
(b) Qual o p-valor do teste?
(c) Com base nesse p-valor podemos afirmar que o dado é
viciado ao nível de 1%?
24
Exercício
n
Média
Desvio-padrão
Empresários
90
7,0
2,9
Sindicato
60
7,1
2,4
(tirado de Bussab; Morettin, 2002:386)
3. Numa discussão sobre reajuste salarial os empresários
afirmam que o salário médio da categoria é de 7,6 salários
mínimos, enquanto os sindicatos dizem que é de 6,5. Para tirar
suas dúvidas, cada parte fez uma amostra de trabalhadores e
obteve os seguintes resultados:
a. As amostras servem para justificar as afirmações dos dois
grupos?
b. De posse dos resultados, qual o seu parecer?
25
Exercício
4. Uma rede de supermercados testou duas estratégias
diferentes de venda em supermercados de mesmo porte e perfil
do público. Para compará-las utilizaram-se amostras de 50
clientes, obtendo-se as médias de gasto respectivamente em
R$62 e R$71. Sabendo-se que o desvio-padrão em ambos os
casos é de R$20, é possível afirmar que o gasto médio das duas
filiais é o mesmo? Caso contrário, dê um intervalo de confiança
para a diferença.
26
Exercício
5. Uma universidade deseja estudar o efeito de uma pausa entre
as aulas sobre a produtividade dos estudantes. Para isso
sorteou 6 alunos e contou o número de artigos produzidos em
uma semana sem o intervalo e em uma semana com o
intervalo.
a. Os resultados sugerem que há melhora na produtividade?
b. Calcule o p-valor do teste
1
2
3
4
5
6
média
desvpad
Sem intervalo
23
35
29
33
43
32
32,5
6,626
Com intervalo
28
38
29
37
42
30
34
5,712
27

Teste de hipótese de médias e proporções

Transcrição

Documentos relacionados

Aula 16

Distribuição Normal de Probabilidade

Atividade 1

Terceiro período – 17/07/2014 Professor Carlos Renato dos Santos

Aula 15

UN-BBJ - SERRA DO FÉLIX

UN-BME - PACATUBA

Elaboração e revisão de "Procedimento Operacional Padrão"

prospecção de micro-organismos psicrotróficos resistentes à

VALORES DO CUB (MÉDIO)

Os Pontos Críticos das Fases Pré-analítica e Pós

indice:Layout 1

Educação não formal em Geociências

Nota Técnica nº001/2015 - Laboratório Central do Estado do

Inferência Estatística

Teste t

Prevalência do blastocystis hominis na

Abordagem factual para tomada de decisão Cartas de Atributo u

USAG RANC

padrão residenciais cub/m²

Introdução ao cálculo estocástico e o lema de Ito

Manual de Procedimentos de Coleta e Envio de Amostras