Teste de hipótese de médias e proporções
Transcrição
Teste de hipótese de médias e proporções
Teste de hipóteses para médias e proporções amostrais Prof. Marcos Pó Métodos Quantitativos para Ciências Sociais Intervalo de confiança: outro entendimento É o intervalo que contém o parâmetro que queremos estimar, com um grau de confiança indicado pelo coeficiente γ (gama). Ele permite estabelecer um julgamento do erro que podemos estar cometendo e a probabilidade de que nossa amostra tenha, por acidente, ficado além desse erro. ICx; x Z IC pˆ ; pˆ Z n p(1 p) n Erro que podemos estar cometendo γ α/2 α/2 γ (gama) é a confiança que temos de estar, no máximo, cometendo esse erro com nossa amostra. 2 Hipótese estatística • Hipótese é uma explicação provisória proposta para um fenômeno, que visa a ser posteriormente demonstrada ou testada cientificamente. • Hipótese estatística é uma afirmação sobre um parâmetro populacional com base em estatísticas amostrais. ► ► H0 - Hipótese nula: normalmente é uma afirmação de igualdade de que os valores encontrados são explicados por erros amostrais. HA - Hipótese alternativa: é o complemento da hipótese nula e significa normalmente que os valores encontrados devem-se ao fato de tratarmos de duas populações diferentes. 3 Exemplos de tipos de teste de hipótese Tipo de teste Ex.: investigando um assassinato Passar pelo aro (hoop test): pode eliminar hipóteses, mas não dá suporte às hipóteses restantes. Condição necessária, mas não suficiente. Indício (straw in the wind tests): fornece informação útil que pode favorecer uma hipótese. Não traz nem condição necessária ou suficiente para aceitar ou rejeitar uma hipótese. Arma fumegante (smoking gun test): apoia fortemente uma hipótese, mas falhar no teste não elimina a mesma. Critério suficiente, mas não necessário para confirmação. Duplamente decisivo (doubly decisive tests): confirma uma hipótese e elimina outras. O suspeito está na cidade no dia do crime. O suspeito disse a colegas que tinha vontade de dar um tiro na vítima quando ela era grosseira com ele. O suspeito aparece com uma arma fumegante na mão logo após o assassinato. Imagens mostram o suspeito entrando sozinho no apartamento da vítima e saindo com uma arma na mão. Baseado em BENNETT, Andrew. Process tracing and causal inference, 2004 4 Teste estatístico de hipótese • Processo que usa estatísticas amostrais para testar uma afirmação sobre um parâmetro de uma população. • O teste estatístico de hipótese oferece uma metodologia que permite julgar se os dados amostrais trazem evidências que apoiem ou não uma hipótese quantitativa, assim como permite estimar a probabilidade de cometer determinados tipos de erro nesse julgamento. • Ou seja, nos permite responder com algum grau de confiança: essa evidência nos convence que nossa hipótese está errada? 5 Tipos de teste estatístico de hipótese • Médias • Proporções • Dados categóricos (aderência, homogeneidade e independência) • Variância • Várias populações (ANOVA) • Regressão 6 Tipos de erro Julgamento Realidade Inocente Inocente Culpado ok Erro Tipo II • Hipótese: afirmação que queremos testar usando técnicas estatísticas. • Pode haver dois tipos de erro: ► Culpado Erro Tipo I ok ► Erro Tipo I: rejeitar uma hipótese que é verdadeira; Erro Tipo II: aceitar uma hipótese que é falsa. 7 Erro Tipo I: rejeitar uma hipótese verdadeira • A probabilidade de incorrermos nesse erro é denominada α e é chamada de nível de significância do teste, ou seja, o resultado da amostra é tanto mais significante para rejeitar H0 quanto menor for o valor de α 10% • Normalmente α é fixado em: 5% * Evento raro 1% ** Evento raríssimo 0,1% *** Evento raríssimo • A probabilidade α é um valor definido arbitrariamente pelo pesquisador. 8 Erro Tipo II: aceitar uma hipótese falsa • A probabilidade de se incorrer no Erro Tipo II é denominada β (beta). • Nem sempre conseguimos determinar ou definir β em um teste de hipótese, pois normalmente a Hipótese Alternativa de um problema não contém muitos elementos. 9 Exemplo Empresa Resistência à tração Desvio-padrão Preço lote A 1450 kg 120 kg R$ 1.000 B 1550 kg 200 kg R$ 1.500 (a). Se a regra de decisão fosse: “caso o resultado do teste seja inferior à 1500kg, considero que os vergalhões são de A, caso contrário, são de B”, calcule a probabilidade de cometer os seguintes erros: ► ► Tipo I: dizer que os vergalhões são de A quando na realidade são de B; Tipo II: dizer que os vergalhões são de B quando na realidade são de A (b). Qual deveria ser a regra de decisão se o comprador quiser que o risco de comprar A ao invés de B (Erro Tipo I), seja menor que 5%? Baseado em Bussab; Moretin, 2002: 323 Uma cooperativa pode usar dois tipos de vergalhão para a construção de casas, produzidos pelas empresas A ou B de acordo com as especificações e com preços abaixo. Alguns lotes estão sendo vendido por R$1.100 e, antes de se decidir, a cooperativa terá acesso ao teste de uma amostra de 25 peças. 10 Como escolher o erro que aceitamos cometer? • Ao se diminuir a probabilidade de Erro I, aumenta-se a chance de Erro II. • Para escolher que risco queremos correr é necessário analisar qual seria mais prejudicial para a pesquisa e para os seus possíveis impactos. • Ex.: Por causa de um erro amostral excessivo seria mais grave considerar que... ► ► ... há ou não diferenças no desempenho acadêmico de estudantes de acordo com o gênero? ... há ou não diferenças no desempenho de motoristas que tomam bebidas alcoólicas? 11 Roteiro para o teste de hipótese 1. Definir as hipóteses. ► ► Nula (H0) Alternativa (HA) 2. Especificar as evidências estatísticas que serão usadas. ► ► Estimadores Obter propriedades da estatística (distribuição, média, desviopadrão...) 3. Fixar a probabilidade de cometer o Erro Tipo I (α) e especificar a regra de decisão. ► Valor de referência para aceitar ou rejeitar a hipótese (região crítica) 4. Apreciar a evidência. 5. Decidir e interpretar o resultado. 12 Usar t ou z para teste de hipótese? • Se conhecermos o desvio-padrão da população (σ), pode-se usar a distribuição z. • Caso não se conheça σ, temos que usar o s da amostra para determinar o intervalo de confiança. • Assim, segue-se a mesma regra que para intervalos de confiança: ► ► Amostras grandes: nesse caso pode-se considerar que a amostra aproxima-se da normal Amostras pequenas: usar a distribuição t de Student 13 Teste de hipóteses para duas populações • Objetivo: testar hipóteses que comparam médias de duas amostras, possivelmente de populações distintas. • Tipos de amostras: ► ► Independentes: não há relação entre as amostras selecionadas em cada população Dependentes: cada membro de uma amostra corresponde a um membro da outra amostra. Também chamadas de emparelhadas ou relacionadas. População 1 (μ1; σ1) População 2 (μ2; σ2) Amostra (n, X, s) Amostra (m, Y, s) 14 Testes possíveis • Diferença entre médias • Diferença entre desvios-padrão (será tratado juntamente com ANOVA) 15 Considerações: teste de médias • Populações: ► ► Normais (= distribuição amostral da média) Homocedásticas (σX = σY = σ) • Lembrar que: E( X Y ) E( X ) E(Y ) E( X Y ) E( X ) E(Y ) Var ( X Y ) Var ( X ) Var (Y ) Var (k X ) k 2 Var ( X ) 16 Amostras independentes • Podemos definir um intervalo de confiança da diferença da média das amostras X e Y, com n e m elementos respectivamente. 2X Y2 E ( X Y ) ~ N 0; m n Z X Y 2X Y2 n m • Como as populações são homocedásticas podemos simplificar: z X Y 1 1 s. n m • Caso seja usada a distribuição t, os graus de liberdade serão ν = n+m-2 17 IC do teste da diferença de duas médias 14 N (0,1) 12 ,1 08 2 06 04 2 1 02 0 0 - 5 -z 010 z E( X Y ) 0 Var ( X Y ) Var ( X ) Var (Y ) 15 + 20 X Y z 1 1 s. n m Amostras dependentes • Nesse caso, a quantidade de elementos de X e Y são iguais (n). • As amostras podem ser entendidas como pares (X1-Y1,..., XnYn) e, assim, podemos definir a variável D = X–Y, resultando na amostra D1,...,Dn. • Dessa forma, reduzimos o problema a uma única população e amostra, com as seguintes características: 1 n D i 1 X i Y i X Y n 1 n Di D S D n 1 i 1 2 2 19 Teste de hipótese para proporção • Idêntico ao teste de médias, considerando que a estatística p tem distribuição aproximadamente normal. p(1 p) pˆ ~ N p, n 20 Probabilidade de significância (p-valor) • Invés de se definir arbitrariamente um valor para α, um procedimento alternativo consiste em determinar a probabilidade de significância, ou p-valor do teste. • Nesse caso, em vez de se calcular a região crítica para aceitar ou rejeitar a hipótese, calcula-se qual a probabilidade de ocorrerem valores para X ou p mais desfavoráveis à H0. A seguir julga-se se tal valor consiste em um evento raro. • Em muitos casos, em vez de se determinar simplesmente se H0 é rejeitada, diz-se que H0 é rejeitada a um determinado nível de p-valor. 21 Exercício 1. As estruturas de 20 recém-nascidos, medidas em cm, foram tomadas no Departamento de Pediatria de um hospital. 41 50 50 52 52 50 49 47 49 49 54 51 50 46 47 50 52 49 49 50 Média: 49,35 Desvpad: 2,720 (a) Suponha que a distribuição populacional das estruturas seja normal, com variância de 2 cm2. Teste a hipótese de que a média seja 50 cm admitindo o risco de 5% de cometer o erro tipo I. (b) Faça o mesmo supondo variância populacional desconhecida. 22 Roteiro para o teste de hipótese 1. Definir as hipóteses. ► ► Nula (H0) Alternativa (HA) 2. Especificar as evidências estatísticas que serão usadas. ► ► Estimadores Obter propriedades da estatística (distribuição, média, desviopadrão...) 3. Fixar a probabilidade de cometer o Erro Tipo I (α) e especificar a regra de decisão. ► Valor de referência para aceitar ou rejeitar a hipótese (região crítica) 4. Apreciar a evidência. 5. Decidir e interpretar o resultado. 23 Exercício 2. Desconfiada com os resultados do sorteio de grupos realizado por seu professor de Métodos Quantitativos, a aluna R. resolveu testar o dado utilizado fazendo 600 lançamentos, onde o lado três foi sorteado 123 vezes. (a) Podemos afirmar, ao nível de 5%, que o dado é viciado em relação ao lado 3? (b) Qual o p-valor do teste? (c) Com base nesse p-valor podemos afirmar que o dado é viciado ao nível de 1%? 24 Exercício n Média Desvio-padrão Empresários 90 7,0 2,9 Sindicato 60 7,1 2,4 (tirado de Bussab; Morettin, 2002:386) 3. Numa discussão sobre reajuste salarial os empresários afirmam que o salário médio da categoria é de 7,6 salários mínimos, enquanto os sindicatos dizem que é de 6,5. Para tirar suas dúvidas, cada parte fez uma amostra de trabalhadores e obteve os seguintes resultados: a. As amostras servem para justificar as afirmações dos dois grupos? b. De posse dos resultados, qual o seu parecer? 25 Exercício 4. Uma rede de supermercados testou duas estratégias diferentes de venda em supermercados de mesmo porte e perfil do público. Para compará-las utilizaram-se amostras de 50 clientes, obtendo-se as médias de gasto respectivamente em R$62 e R$71. Sabendo-se que o desvio-padrão em ambos os casos é de R$20, é possível afirmar que o gasto médio das duas filiais é o mesmo? Caso contrário, dê um intervalo de confiança para a diferença. 26 Exercício 5. Uma universidade deseja estudar o efeito de uma pausa entre as aulas sobre a produtividade dos estudantes. Para isso sorteou 6 alunos e contou o número de artigos produzidos em uma semana sem o intervalo e em uma semana com o intervalo. a. Os resultados sugerem que há melhora na produtividade? b. Calcule o p-valor do teste 1 2 3 4 5 6 média desvpad Sem intervalo 23 35 29 33 43 32 32,5 6,626 Com intervalo 28 38 29 37 42 30 34 5,712 27
Documentos relacionados
Distribuição Normal de Probabilidade
Distribuição Normal Padrão: µ = 0 e σ = 1 99,7% dos dados estão dentro de 3 desvios-padrão a contar da média
Leia maisInferência Estatística
desconhecido, porém n≥30, podemos usar a distribuição Normal, mas você deve substituir o desvio padrão populacional pelo desvio padrão amostral.
Leia mais