Aula 15 - Inter ça - média e proporção
Transcrição
Aula 15 - Inter ça - média e proporção
Inferência Estatística Estimação Intervalar Média e Proporção Estimação Pontual x Estimação Intervalar Exemplo Inicial: Um estudo pretende estimar o valor de familiar dos alunos da UFMG. µ, a renda média Em uma amostra de 40 alunos da universidade, encontrou-se uma renda familiar média x = 1600 reais (estimativa pontual), com desvio-padrão s=323 reais. Já sabemos que os valores de x variam de amostra para amostra e se distribuem em torno do valor de µ. Estimação Pontual x Estimação Intervalar Assim, divulgar somente um único valor como estimativa de µ (estimação pontual) deixa de lado toda a incerteza envolvida no processo de estimação de um parâmetro. Para nos lembrar da incerteza envolvida no resultado amostral, vamos associar um erro de estimação à estimativa pontual: Estimativa = Estimativa pontual ± Erro de estimação Intervalar Estimação Pontual x Estimação Intervalar Exemplo Inicial: A estimativa pontual para a renda familiar média do aluno da UFMG é 1600 reais. O erro de estimação foi calculado em 100 reais. Assim, a estimativa intervalar para a renda familiar média do aluno da UFMG é de [1600 ± 100] = [1500 ; 1700] reais. Nível de Confiança de uma Estimativa Intervalar Toda estimativa intervalar tem associada a ela um nível de confiança, geralmente expresso em porcentagem. Ex: nível de confiança de 95% Então, falamos em Intervalo de Confiança. Ex: o intervalo de 95% de confiança para a renda familiar média do aluno da UFMG vai de R$1500,00 a R$1700,00. Nível de Confiança de uma Estimativa Intervalar Como interpretar o nível de confiança associado a um intervalo? Ex: o intervalo de 95% de confiança para a renda familiar média do aluno da UFMG vai de R$1500,00 a R$1700,00. Interpretação: temos uma confiança de 95% de que o intervalo de R$1500,00 a R$1700,00 engloba o valor desconhecido da renda familiar média do aluno da UFMG. Como calcular um Intervalo de Confiança ? Intervalo de = Estimativa pontual ± Erro de estimação Confiança O erro de estimação ocorre porque X é uma variável aleatória. Assim, para calcular o erro de estimação, vamos precisar da distribuição de probabilidades de X . Relembrando: Teorema Central do Limite Seja uma amostra aleatória variável aleatória X x1 , x2 ,..., xn , de uma com média µ e desvio padrão σ. X −µ Z= σ/ n n→∞ ~ N (0,1) Sabemos que a distribuição de X está centrada em µ. Também sabemos que um “pequeno” percentual dos valores que X pode assumir está distante de µ. 95% 2.5% α/2 L1 µ 2.5% α/2 L2 X Assim, vamos encontrar um intervalo de valores [L1 ; L2], simétrico em relação a µ, que englobe uma “grande” porcentagem dos valores que X pode assumir. O intervalo de valores [L1 ; L2] é o que chamamos Intervalo de Confiança para µ. 95% 2.5% α/2 L1 µ 2.5% α/2 L2 X No exemplo acima, [L1 ; L2] é um Intervalo de 95% de Confiança para µ. De modo geral, o intervalo de valores [L1 ; L2] é o que chamamos de Intervalo de Confiança de 100(1-α)% para µ. α (1- α) α 2 L1 µ L2 2 X L1 é o percentil α/2% e L2 é o percentil (1- α/2)% da distribuição de X . L1 e L2 são simétricos em relação a µ. Relembrando o cálculo de percentis na distribuição Normal L1 = P100α / 2 = µ X + z(1−α / 2) ⋅ σ X = µ X − zα / 2 ⋅ σ n L2 = P100(1−α / 2) = µ X + z(α / 2) ⋅ σ X = µ X + zα / 2 ⋅ σ α (1- α) 2 L1 µ X − zα / 2 ⋅ σ α n µ L2 n 2 X µ X + zα / 2 ⋅ σ n Como µ X = µ e não conhecemos o valor de µ, substituímos µ por sua estimativa pontual, ou seja, L1 = x − zα / 2 ⋅ σ n e L2 = x + zα / 2 ⋅ σ O intervalo de 100(1-α)% de confiança para µ é dado por 100(1−α )% ICµ σ = x ± zα / 2 . n x . n Intervalo de 100(1-α)% de Confiança para µ Nível de confiança 100(1−α )% ICµ Erro de estimação σ = x ± zα / 2 . n estimativa pontual de µ variabilidade de X Fator para redução da confiança E se o desvio-padrão populacional (σ) for desconhecido ? 100(1−α )% ICµ σ = x ± zα / 2 . n é preciso conhecer seu valor Podemos substituir σ por sua estimativa pontual, s, o desvio-padrão amostral. No entanto, ao fazermos isto, a variável segue a distribuição Normal. X −µ s/ n não Qual é a distribuição de probabilidades de X −µ ? s/ n Resultado Importante: Se x1, x2, . . . xn é uma amostra aleatória de uma população Normal com média µ e desvio padrão σ, a X −µ variável T = tem distribuição t de Student s/ n com (n-1) graus de liberdade. Distribuição t-Student Normal (0;1) t-Student com 3 graus de liberdade Distribuição t-Student A distribuição t-Student foi proposta por W. Gosset, que usava o pseudônimo de Student, para trabalhar com pequenas amostras. A distribuição t-Student tem o formato parecido com a da distribuição Normal Padrão e também é centrada no valor zero. William Gosset (Student) A distribuição t-Student depende de um único parâmetro, chamado grau de liberdade (g.l.) Aproximação entre a t-Student e a Normal Padrão à medida que g.l. cresce g.l.=1 g.l.=10 g.l.=30 g.l.=4 g.l.=3 g.l.=8 g.l.=2 g.l.=5 g.l.=20 g.l.=6 g.l.=25 g.l.=15 g.l.=7 g.l.=9 Como calcular probabilidades com a distribuição t-Student ? Ao contrário da tabela Normal, a tabela t-Student fornece percentis. A distribuição t-Student é simétrica em torno do valor 0. Assim, somente os percentis positivos são tabelados. t g .l .;(1−α ) = −t g .l .;α t g .l .;α Tabela t Para compreender melhor …. Encontre os seguintes percentis da distribuição t-Student t19;0.05 = 0.05 t10;0.025 = 0 t19 1.729 t7;0.005 = t19;0.95 = 0.95 -1.729 0 t19 Intervalo de 100(1-α)% de Confiança para µ Erro de estimação 100(1−α )% ICµ s = x ± t( n −1);α / 2 . n estimativa pontual de µ tα / 2;( n −1) estimativa da variabilidade de x Fator para redução da confiança é o percentil da distribuição t-Student com (n-1) graus de liberdade que deixa uma área de α/2 acima dele t( n −1) α/2 tα / 2;( n −1) Exemplo: estimação da idade média ao falar Em um experimento com uma amostra de n=20 crianças, a idade média ao falar foi de x = 10 meses com desvio-padrão de s =1.5 meses. 100(1−α )% ICµ 100(1−α )% s 1.5 = x ± t( n −1;α / 2) . = 10 ± t (19;α / 2) . n 20 = [10 ± .0.335] 100(1−α )% ICµ = [10 ± t(19;α / 2) × 0.335] Exemplo: estimação da idade média ao falar Em um experimento com uma amostra de n=20 crianças, a idade média ao falar foi de x = 10 meses com desvio-padrão de s =1,5 meses. 100(1−α )% ICµ = [10 ± t(19;α / 2) × 0.335] Intervalo de 90% de confiança: 100(1-α)%=90% 1-α = 0.90 → α = 0.10 → α/2 = 0.05 → t(19;0,05) = 1.729 ICµ90% = [10 ± 1.729 ⋅ 0.335] = [10 ± 0, 6 ] = [10 − 0.6;10 + 0.6] [ IC 90% = [9.4;10.6] ICµ = [9.4 ; 10.6 ] Exemplo: estimação da idade média ao falar Em um experimento com uma amostra de n=20 crianças, a idade média ao falar foi de x = 10 meses com desvio-padrão de s =1,5 meses. 100(1−α )% ICµ = [10 ± t(19;α / 2) .0.335] Intervalo de 95% de confiança: 100(1-α)%=95% 1-α = 0.95 → α = 0.05 → α/2 = 0.025 → t(19;0,025) = 2.093 ICµ95% = [10 ± 2.093 ⋅ 0.335] = [10 ± 0.7 ] = [10 − 0.7;10 + 0.7 ] ] ] ICµ95% ==[[ 9.3 ; 10.7 Interpretando os intervalos de confiança “A idade média ao falar para esta população de crianças está entre 9.4 e 10.6 meses, com 90% de confiança.” “A idade média ao falar para esta população de crianças está entre 9.3 e 10.7 meses, com 95% de confiança.” Quando a amostra pode ser considerada grande (n > 30) …. … os percentis da distribuição t-Student podem ser substituídos pelos percentis calculados na Tabela Normal-Padrão (tabela Z). Percentis da Distribuição Normal Padrão Intervalo de 100(1-α)% de Confiança para µ quando n > 30 Erro de estimação 100(1−α )% ICµ s = x ± zα / 2 . n estimativa pontual de µ estimativa da variabilidade de x Fator para redução da confiança zα / 2 é o percentil da distribuição Normalpadrão que deixa uma área de α/2 acima dele α/2 zα / 2 Intervalo de Confiança para a Proporção 100(1−α )% IC p pˆ (1 − pˆ ) = pˆ ± zα / 2 . n Proporção amostral Válido somente quando n > 30 (amostras grandes) Exemplo: estimação da proporção de pessoas curadas com um novo tratamento Deseja-se saber a eficácia de um novo tratamento contra micose em adultos. Ou seja, deseja-se estimar: P = proporção de pessoas que seriam curadas com o novo tratamento Uma amostra de 50 pessoas doentes foi tratada segundo o novo tratamento e 45 deles foram curadas. Estimativa Pontual: a proporção amostral • pˆ = 45 / 50 = 0.90 Exemplo: estimação da proporção de pessoas curadas com um novo tratamento Estimativa Intervalar • IC 100(1−α )% p pˆ (1 − pˆ ) = pˆ ± zα /2 . n 0.9(0.1) = 0.9 ± zα /2 . 50 = [ 0.9 ± zα /2 0.04] Exemplo: estimação da proporção de pessoas curadas com um novo tratamento Intervalo de 90% de confiança: 100(1-α)%=90% 1-α = 0.90 → α = 0.10 → α/2 = 0.05 → zα/2 = z0,05 =1.64 = [ 0.9 ± 1.64 ⋅ 0.04] = [ 0.9 ± 0.07 ] = [ 0.9 − 0.07;0.9 + 0.07 ] IC 90% p IC 90% = [ 0.83 ; 0.97] p Assim, com base nesta amostra, estimamos que a proporção de cura com o novo tratamento está entre 83% e 97%, com 90% de confiança. Para compreender melhor …. Exercícios de 9.1 a 9.5 da Seção 9 Caderno de Exercícios