Aula 15 - Inter ça - média e proporção

Сomentários

Transcrição

Aula 15 - Inter ça - média e proporção
Inferência
Estatística
Estimação Intervalar
Média e Proporção
Estimação Pontual
x Estimação Intervalar
Exemplo Inicial:
Um estudo pretende estimar o valor de
familiar dos alunos da UFMG.
µ,
a renda média
Em uma amostra de 40 alunos da universidade,
encontrou-se uma renda familiar média x = 1600 reais
(estimativa pontual), com desvio-padrão s=323 reais.
Já sabemos que os valores de
x
variam de amostra para
amostra e se distribuem em torno do valor de µ.
Estimação Pontual
x Estimação Intervalar
Assim, divulgar somente um único valor como estimativa
de µ (estimação pontual)
deixa de lado toda a
incerteza envolvida no processo de estimação de um
parâmetro.
Para nos lembrar da incerteza envolvida no resultado
amostral, vamos associar um erro de estimação à
estimativa pontual:
Estimativa
= Estimativa pontual ± Erro de estimação
Intervalar
Estimação Pontual
x Estimação Intervalar
Exemplo Inicial:
A estimativa pontual para a renda familiar média do aluno
da UFMG é 1600 reais.
O erro de estimação foi calculado em 100 reais.
Assim, a estimativa intervalar para a renda familiar média
do aluno da UFMG é de
[1600 ± 100] = [1500 ; 1700] reais.
Nível de Confiança de uma
Estimativa Intervalar
Toda estimativa intervalar tem associada a ela um nível
de confiança, geralmente expresso em porcentagem.
Ex: nível de confiança de 95%
Então, falamos em Intervalo de Confiança.
Ex: o intervalo de 95% de confiança para a renda familiar
média do aluno da UFMG vai de R$1500,00 a R$1700,00.
Nível de Confiança de uma
Estimativa Intervalar
Como interpretar o nível de confiança associado a
um intervalo?
Ex: o intervalo de 95% de confiança para a renda familiar
média do aluno da UFMG vai de R$1500,00 a R$1700,00.
Interpretação: temos uma confiança de 95% de que
o intervalo de R$1500,00 a R$1700,00 engloba o
valor desconhecido da renda familiar média do aluno
da UFMG.
Como calcular um Intervalo de Confiança ?
Intervalo de
= Estimativa pontual ± Erro de estimação
Confiança
O erro de estimação ocorre porque X é uma variável
aleatória.
Assim, para calcular o erro de estimação, vamos
precisar da distribuição de probabilidades de X .
Relembrando: Teorema Central do Limite
Seja uma amostra aleatória
variável aleatória
X
x1 , x2 ,..., xn
, de uma
com média µ e desvio padrão σ.
X −µ
Z=
σ/ n
n→∞
~
N (0,1)
Sabemos que a distribuição de X está centrada em µ.
Também sabemos que um “pequeno” percentual dos
valores que X pode assumir está distante de µ.
95%
2.5%
α/2
L1
µ
2.5%
α/2
L2
X
Assim, vamos encontrar um intervalo de valores [L1 ; L2],
simétrico em relação a µ, que englobe uma “grande”
porcentagem dos valores que X pode assumir.
O intervalo de valores [L1 ; L2] é o que chamamos
Intervalo de Confiança para µ.
95%
2.5%
α/2
L1
µ
2.5%
α/2
L2
X
No exemplo acima, [L1 ; L2] é um
Intervalo de 95% de Confiança para µ.
De modo geral, o intervalo de valores [L1 ; L2] é o
que chamamos de
Intervalo de Confiança de 100(1-α)% para µ.
α
(1- α)
α
2
L1
µ
L2
2
X
L1 é o percentil α/2% e L2 é o percentil (1- α/2)%
da distribuição de X .
L1 e L2 são simétricos em relação a µ.
Relembrando o cálculo de percentis na distribuição Normal
L1 = P100α / 2 = µ X + z(1−α / 2) ⋅ σ X = µ X − zα / 2 ⋅ σ
n
L2 = P100(1−α / 2) = µ X + z(α / 2) ⋅ σ X = µ X + zα / 2 ⋅ σ
α
(1- α)
2
L1
µ X − zα / 2 ⋅ σ
α
n
µ
L2
n
2
X
µ X + zα / 2 ⋅ σ
n
Como
µ X = µ e não conhecemos o valor de µ,
substituímos µ por sua estimativa pontual, ou seja,
L1 = x − zα / 2 ⋅ σ
n
e
L2 = x + zα / 2 ⋅ σ
O intervalo de 100(1-α)% de confiança
para µ é dado por
100(1−α )%
ICµ

σ 
=  x ± zα / 2 .

n

x
.
n
Intervalo de 100(1-α)% de Confiança para µ
Nível de confiança
100(1−α )%
ICµ
Erro de estimação

σ 
=  x ± zα / 2 .

n

estimativa
pontual de µ
variabilidade
de X
Fator para redução
da confiança
E se o desvio-padrão populacional
(σ) for desconhecido ?
100(1−α )%
ICµ

σ 
=  x ± zα / 2 .

n

é preciso conhecer
seu valor
Podemos substituir σ por sua estimativa pontual, s, o
desvio-padrão amostral.
No entanto, ao fazermos isto, a variável
segue a distribuição Normal.
X −µ
s/ n
não
Qual é a distribuição de probabilidades
de
X −µ ?
s/ n
Resultado Importante:
Se x1, x2, . . . xn é uma amostra aleatória de uma
população Normal com média µ e desvio padrão σ, a
X −µ
variável T =
tem distribuição t de Student
s/ n
com (n-1) graus de liberdade.
Distribuição t-Student
Normal (0;1)
t-Student com 3
graus de liberdade
Distribuição t-Student
A distribuição t-Student foi proposta
por W. Gosset, que usava o
pseudônimo
de
Student,
para
trabalhar com pequenas amostras.
A distribuição t-Student tem o
formato
parecido
com
a
da
distribuição Normal Padrão e também
é centrada no valor zero.
William Gosset
(Student)
A distribuição t-Student depende de um único parâmetro,
chamado grau de liberdade (g.l.)
Aproximação entre a t-Student e a Normal Padrão
à medida que g.l. cresce
g.l.=1
g.l.=10
g.l.=30
g.l.=4
g.l.=3
g.l.=8
g.l.=2
g.l.=5
g.l.=20
g.l.=6
g.l.=25
g.l.=15
g.l.=7
g.l.=9
Como calcular probabilidades com a
distribuição t-Student ?
Ao contrário da tabela Normal, a tabela t-Student fornece
percentis.
A distribuição t-Student é simétrica em torno do valor 0.
Assim, somente os percentis positivos são tabelados.
t g .l .;(1−α )
= −t g .l .;α
t g .l .;α
Tabela t
Para compreender melhor ….
Encontre os seguintes percentis da distribuição t-Student
t19;0.05 =
0.05
t10;0.025 =
0
t19
1.729
t7;0.005 =
t19;0.95 =
0.95
-1.729
0
t19
Intervalo de 100(1-α)% de Confiança para µ
Erro de estimação
100(1−α )%
ICµ
s 

=  x ± t( n −1);α / 2 .

n

estimativa
pontual de µ
tα / 2;( n −1)
estimativa da
variabilidade
de x
Fator para redução
da confiança
é o percentil da distribuição
t-Student com (n-1) graus de liberdade que
deixa uma área de α/2 acima dele
t( n −1)
α/2
tα / 2;( n −1)
Exemplo: estimação da idade média ao falar
Em um experimento com uma amostra de n=20
crianças, a idade média ao falar foi de x = 10 meses
com desvio-padrão de s =1.5 meses.
100(1−α )%
ICµ
100(1−α )%
s  
1.5 

=  x ± t( n −1;α / 2) .
=
10
±
t
(19;α / 2) .
 

n 
20 

= [10 ±
.0.335]
100(1−α )%
ICµ
= [10 ± t(19;α / 2) × 0.335]
Exemplo: estimação da idade média ao falar
Em um experimento com uma amostra de n=20
crianças, a idade média ao falar foi de x = 10 meses
com desvio-padrão de s =1,5 meses.
100(1−α )%
ICµ
= [10 ± t(19;α / 2) × 0.335]
Intervalo de 90% de confiança: 100(1-α)%=90%
1-α = 0.90 → α = 0.10 → α/2 = 0.05 → t(19;0,05) = 1.729
ICµ90% = [10 ± 1.729 ⋅ 0.335] = [10 ± 0, 6 ] = [10 − 0.6;10 + 0.6]
[
IC 90% = [9.4;10.6]
ICµ = [9.4 ; 10.6 ]
Exemplo: estimação da idade média ao falar
Em um experimento com uma amostra de n=20
crianças, a idade média ao falar foi de x = 10 meses
com desvio-padrão de s =1,5 meses.
100(1−α )%
ICµ

 
= [10 ± t(19;α / 2) .0.335]
Intervalo de 95% de confiança: 100(1-α)%=95%
1-α = 0.95 → α = 0.05 → α/2 = 0.025 → t(19;0,025) = 2.093
ICµ95% = [10 ± 2.093 ⋅ 0.335] = [10 ± 0.7 ] = [10 − 0.7;10 + 0.7 ]
] ]
ICµ95% ==[[ 9.3 ; 10.7
Interpretando os intervalos de confiança
“A idade média ao falar para esta população de crianças
está entre 9.4 e 10.6 meses, com 90% de confiança.”
“A idade média ao falar para esta população de crianças
está entre 9.3 e 10.7 meses, com 95% de confiança.”
Quando a amostra pode ser considerada
grande (n > 30) ….
… os percentis da distribuição t-Student podem
ser substituídos pelos percentis calculados na
Tabela Normal-Padrão (tabela Z).
Percentis da Distribuição Normal Padrão
Intervalo de 100(1-α)% de Confiança para µ
quando n > 30
Erro de estimação
100(1−α )%
ICµ
s 

=  x ± zα / 2 .

n

estimativa
pontual de µ
estimativa da
variabilidade
de x
Fator para redução
da confiança
zα / 2 é o percentil da distribuição Normalpadrão que deixa uma área de α/2 acima dele
α/2
zα / 2
Intervalo de Confiança para a Proporção
100(1−α )%
IC p

pˆ (1 − pˆ ) 
=  pˆ ± zα / 2 .

n


Proporção
amostral
Válido somente quando n > 30 (amostras grandes)
Exemplo: estimação da proporção de pessoas
curadas com um novo tratamento
Deseja-se saber a eficácia de um novo tratamento
contra micose em adultos. Ou seja, deseja-se estimar:
P = proporção de pessoas que seriam curadas
com o novo tratamento
Uma amostra de 50 pessoas doentes foi tratada
segundo o novo tratamento e 45 deles foram curadas.
Estimativa Pontual: a proporção amostral
•
pˆ = 45 / 50 = 0.90
Exemplo: estimação da proporção de pessoas
curadas com um novo tratamento
Estimativa Intervalar
•
IC

100(1−α )%
p

pˆ (1 − pˆ ) 
=  pˆ ± zα /2 .

n


 

0.9(0.1) 
= 0.9 ± zα /2 .

50 

= [ 0.9 ± zα /2 0.04]

Exemplo: estimação da proporção de pessoas
curadas com um novo tratamento
Intervalo de 90% de confiança: 100(1-α)%=90%
1-α = 0.90 → α = 0.10 → α/2 = 0.05 → zα/2 =
z0,05 =1.64
= [ 0.9 ± 1.64 ⋅ 0.04] = [ 0.9 ± 0.07 ] = [ 0.9 − 0.07;0.9 + 0.07 ]
IC 90%
p
IC 90%
= [ 0.83 ; 0.97]
p
Assim, com base nesta amostra, estimamos que a
proporção de cura com o novo tratamento está entre
83% e 97%, com 90% de confiança.
Para compreender melhor ….
Exercícios de 9.1 a 9.5 da Seção 9
Caderno de Exercícios

Documentos relacionados