Bioestatística Aula 6 - Prof. Dr. Anderson Castro Soares de Oliveira

Transcrição

Bioestatística Aula 6 - Prof. Dr. Anderson Castro Soares de Oliveira
Notes
Bioestatística
Aula 6
Anderson Castro Soares de Oliveira
Anderson
Bioestatística
Notes
Teste de hipótese
Teste de hipótese é uma metodologia estatística que
permite tomar decisões sobre uma ou mais populações
baseando-se no conhecimento de informações da amostra.
A formulação de suposições ou de conjeturas acerca das
populações são denominadas de Hipóteses Estatísticas,
que podem ser:
HIPÓTESE NULA - É aquela Hipótese Estatística, prefixada, formulada sobre o parâmetro populacional estudado,
e é sempre uma afirmativa. É representada por H0 .
HIPÓTESE ALTERNATIVA - São quaisquer hipóteses que
difiram da Hipótese Nula. Pode ser representada por H1 ou
Ha
Anderson
Bioestatística
Notes
Teste de hipótese
Imagine que estamos interessados em responder a questao:
Níveis elevados de bilirrubina em recém-nascidos afetam a
capacidade auditiva?
Dado uma amostra de n recem-nascidos, construimos dois
grupos:
A = taxa de bilirrubina normal
B = taxa de bilirrubina elevada
Gera-se a hipótese de nula H0 :
H0 : µA = µB
µA média da capacidade auditiva do grupo A
µB média da capacidade auditiva do grupo B
Anderson
Bioestatística
Notes
Teste de hipótese
Com a formulação dessa hipótese H0 estamos testando se
as médias auditivas dos dois grupos são iguais
Aceitar H0 significa afirmar que os níveis de bilirrubinas não
afetam a audição!
Rejeitar H0 significa comprovar que os níveis de bilirrubina
afetam a capacidade auditiva
Poderíamos formular as seguintes hipóteses alternativas:
H1 : µA 6= µB as médias dos dois grupos são diferentes
H1 : µA > µB A média do grupo A é maior que a média do
grupo B
H1 : µA < µB A média do grupo A é menor que a média do
grupo B
Anderson
Bioestatística
Notes
Teste de hipótese
Consideremos θ o parâmetro estudado e θ0 valor inicialmente suposto para. Podemos formular as seguintes hipóteses:
H0 : θ = θ0
Teste Bilateral
H1 : θ 6= θ0
H0 : θ = θ0
Teste Unilateral
H1 : θ > θ0
H0 : θ = θ0
Teste Unilateral
H1 : θ < θ0
Anderson
Bioestatística
Notes
Teste de hipótese
Aceitando-se H0 rejeita-se automaticamente H1 , e viceversa
Para se decidir se aceitamos ou se rejeitamos uma hipótese deve-se utilizar uma regra de decisão.
As regras de decisão são baseadas nas distribuições
amostrais.
Anderson
Bioestatística
Notes
Teste de hipótese
Tabela 1: Erros possíveis de se cometer no processo de tomada de
decisão
Decisões possíveis
Aceitação de Ho
Rejeição de Ho
Estados possíveis
Ho verdadeira
Ho falsa
Decisão correta
Erro do tipo II
Erro do tipo I
Decisão correta
Anderson
Bioestatística
Notes
Teste de hipótese
Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro do
tipo I é denominada de Nível de Significância do Teste e é
representada por α.
O nível de significância α. é geralmente determinado pelo
pesquisador antes da coleta dos dados. Em muitas aplicações da estatística, o nível de significância é tradicionalmente fixado em 0,05
Existem duas opções para expressar a conclusão final de
um teste de hipóteses.
Comparar o valor da estatística do teste com o valor obtido
a partir da distribuição teórica, específica para o teste, para
um valor pré-fixado do nível de significância;
Quantificar a probabilidade do que foi observado considerando H0 verdadeira. Esta probabilidade é chamada de
valor-p e frequentemente é indicado apenas por p.
Anderson
Bioestatística
Notes
Teste de hipótese
Alguns enganos em relação ao valor-p
O valor-p não é a probabilidade da hipótese nula de um
teste ser verdadeira.
O valor-p não é a probabilidade de um dado resultado ter
sido obtido de um "acaso".
O valor-p não é a probabilidade da hipótese nula ter sido
enganosamente rejeitada.
Valor-p e nível de significância não são sinônimos. O valorp é sempre obtido de uma amostra, enquanto o nível de
significância é geralmente fixado antes da coleta dos dados.
Anderson
Bioestatística
Notes
Teste de hipótese
Assim a regra de decisão do teste de hipóteses poderá ser
feita pela comparação do valor-p com o nível de significância
Se o valor-p for maior que α então a hipótese nula será
aceita.
Se o valor-p for menor ou igual a α então a hipótese nula
será rejeitada.
Anderson
Bioestatística
Notes
Teste de hipótese
Anderson
Bioestatística
Notes
Teste de hipótese
Teste de hipóteses para variáveis categóricas
Usualmente, usam-se testes que comparam proporções,
tais como o Teste Qui-Quadrado e o Exato de Fisher.
Teste de hipóteses para variáveis quantitativas:
Para variáveis com distribuição normal -testes que comparam médias: teste-t e ANOVA (Análise de Variância);
Para variáveis com distribuição não normal- testes que comparam medianas, tais como Testes de Mann-Witney, Wilcoxon e Kruskal-Wallis (testes não-paramétricos)
Anderson
Bioestatística
Notes
Escolha do teste de hipótese
Quantas variáveis serão analisadas ?
Qual seu objetivo?
Comparação de médias
Comparação de variância
Relação entre variáveis
Quais o tipo de variável ?
Quantitativa
Qualitativa
Qual a natureza da distribuição de probabilidade da variável?
Distribuição Binomial
Distribuição Poisson
Distribuição Normal
Anderson
Bioestatística
Notes
Etapas aplicadas a qualquer teste de hipóteses
Determinar as hipóteses nula e alternativa.
Selecionar a estatística de teste que será usada para decidir rejeitar ou não a hipótese nula.
Especificar o nível de significância α para o teste.
Usar o nível de significância α para desenvolver regra de
decisão que indica os valores críticos da estatística de teste
que levará a rejeição de H0 .
Coletar os dados amostrais e calcular a estatística de teste.
Comparar o valor da estatística do teste com o(s) valor(es)
crítico(s) especificado(s) na regra de decisão para determinar se H0 deve ser rejeitado.
Anderson
Bioestatística
Notes
Teste de Normalidade
O teste de Shapiro-Wilk W tem sido o mais utilizado para
testar a normalidade e tem uma melhor performance em
amostras reduzidas n < 30
As hipóteses geradas são:
H0 : A amostra provém de uma população com distribuição Normal
H1 : A amostra não provém de uma população com distribuição Normal
Anderson
Bioestatística
Teste de Normalidade
Para testar a normalidade se calcula a estatística
n
2
P
ai x(i)
i=1
W = n
P
(xi − x̄)2
i=1
em que os x(i)0 s são os valores amostrais ordenado e os
ai0 s são constantes geradas das médias, variâncias e covariâncias das estatísticas de ordem de uma amostra aleatória de tamanho n de uma distribuição normal.
Se o valor calculado de W é estatisticamente significativo
(para α = 0, 05) rejeita-se a hipótese que a distribuição
estudada é normal
Ou seja Para a Distribuição ser considerada Normal o valorp deve ser maior que 0,05
Anderson
Bioestatística
Notes
Notes
Teste de Normalidade
O teste de Kolmogorov-Smirnov é utilizado para verificar
a normalidade e baseia-se na máxima diferença entre a
distribuição acumulada da amostra e distribuição acumulada esperada e deve ser utilizado em amostras grandes
(n ≥ 30)
As hipóteses geradas são:
H0 : A amostra provém de uma população com distribuição Normal
H1 : A amostra não provém de uma população com distribuição Normal
Se o valor calculado de D é estatisticamente significativo
(para α = 0, 05) rejeita-se a hipótese que a distribuição
estudada é normal
Ou seja: para a Distribuição ser considerada Normal o
valor-p deve ser maior que 0,05
Anderson
Bioestatística
Notes
Teste de homogeneidade de variâncias
O teste de Bartlett é utilizado para verificar se a variância
de diferentes grupos são homogêneas
H0 : σ12 = σ22 = ... = σi2 vsHa : ∃i, jσi2 6= σj2
O teste de Bartlett é fortemente sensível à Normalidade das
observações subjacentes
Uma regra comum é considerar que o teste apenas deve
ser usado quando cada grupo tiver 5 mais repetições ni > 5
Anderson
Bioestatística
Notes
Teste de homogeneidade de variâncias
O teste de Levene é utilizado para verificar se a variância
de diferentes grupos são homogêneas
Uma vantagem do teste de Levene é que ele não exige
normalidade dos dados.
Anderson
Bioestatística
Notes
Teste de normalidade
Para fazer o teste de Shapiro-Wilk utiliza-se
Estatisticas⇒
Resumos
Teste de normalidade de shapiro-wilk
⇒
No pacote RcmdrPlugin.EZR para fazer o teste
Kolmogorov-Smirnov utiliza-se
Statistical Analysis⇒ Continuos variables ⇒
Kolmogorov-Smirnov test for normal distribuition
Anderson
Bioestatística
Notes
Teste de homogeneidade de variância
Para fazer o teste de Bartlett utiliza-se
Estatisticas⇒ Variâncias ⇒ Teste de Bartlett
Para fazer o teste de Levene utiliza-se
Estatisticas⇒ Variâncias ⇒ Teste de Bartlett
Anderson
Bioestatística
Notes
Teste para comparação de duas médias
Um problema comum é o pesquisador observa dois grupos
distintos com o objetivo de saber se os grupos diferem ou
não em relação à resposta de interesse.
Quando a varíavel de interesse é quantitativa, a estratégia
pra verificar se os grupo diferem ou não é comparar suas
médias.
Assim, utiliza-se os teste de hipótese para comparação de
duas médias.
Os teste de comparação de duas médias podem ser:
Teste para amostras independentes - quando é medido a
mesma variável sobre individuos diferentes após um tempo
ou um tratamento.
Teste para amostras dependentes ou pareadas - quando é
medido a mesma variável sobre o mesmo individuo após um
tempo ou um tratamento.
Anderson
Bioestatística
Notes
Teste para comparação de duas médias
Antes de aplicar um teste de comparação de duas médias
é necessário verificar se os dados seguem distribuição normal ou não.
Se os dados tem distribuição normal utiliza-se teste paramétricos (teste t)
Se os dados não tem distribuição normal utiliza-se teste não
paramétricos
Para verificar se os dados seguem uma distribuição normal
aplica-se um teste de normalidade.
Anderson
Bioestatística
Notes
Teste t para duas médias
Se a variável de interesse tem distribuição normal ou aproximadamente normal, aplica-se o teste t para comparar
duas médias.
O teste t para duas médias tem duas abordagens distintas
Amostras independentes
Amostras dependentes ou pareadas
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Para aplicar o teste t para duas médias independentes é
necessário verificar se as variâncias dos grupos são homogêneas, pode-se utilizar os teste de Bartlett ou Levene.
O teste de hipótese pode ser formulado como segue:
H0 : µ1 = µ2
H0 : µ1 = µ2
H0 : µ1 = µ2
H1 : µ1 6= µ2
H1 : µ1 < µ2
H1 : µ1 > µ2
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Quando as variâncias são consideradas homogêneas, pra
testar a hipótese de igualdade entre duas médias, se calcula a estatística
x1 − x2
tc = r Sd2 n11 +
1
n2
em que Sd2 é uma variância combinada dada por
Sd2
(n1 − 1)S12 + (n2 − 1)S22
=
n1 + n2 − 2
Rejeita-se H0 se valor − p ≤ α ou |tc | > tα , em que tα é
obtido da distribuição t com n1 + n2 − 2 graus de liberdade
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Quando as variâncias são consideradas heterogêneas, pra
testar a hipótese de igualdade entre duas médias, se calcula a estatística
x1 − x2
tc = r
S1
S2
n1 + n2
Rejeita-se H0 se valor − p ≤ α ou |tc | > tα , em que tα é
2
S1
S22 2
+
n1
n2
obtido da distribuição t com ν = 2 2 2 2 graus de
S
1
n1
n1 −1
liberdade
Anderson
Bioestatística
+
S
2
n2
n2 −1
Notes
Teste t para duas médias independentes
Um estudo foi realizado para verificar a influencia da adição
de cálcio na alimentação de frangos sobre o peso e parâmetros densitometria óssea. Foram utilizados 60 pintos de
um dia distribuídos em dois grupos, alimentado durante 45
dias com ração com e sem adição de cálcio. Aos 45 dias
os frangos foram abatidos pesados e foram medidos os diâmetros das epífises proximais e distais e diáfises dos tibiotarsos de cada grupo foram avaliados e posteriormente
destinados à análise densitométrica. Os dados obtidos estão contidos no arquivo "calcio.xlsx".
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Para a variável diáfise
teste de Kolmogorov-Smirnov: aceita-se a hipótese de normalidade (valor-p=0,4912)
teste de Bartlett: aceita-se a hipótese de homogeneidade
de variância (valor-p=0,1093)
Utiliza-se o Teste t com variâncias homogêneas
Temos:
X com = 2, 26 X sem = 1, 76
2
2
Scom
= 0, 56 Ssem
= 0, 31
(29)0, 56 + (29)0, 31
Sd2 =
= 0.435
58
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Vamos testar
Assim,
H0 : µcom = µsem
H1 : µcom 6= µsem
2, 26 − 1, 76
tc = q
= 2, 93
1
1
0, 435 30 + 30
Considerando grau de liberdade ν = 58, temos t0,025 =
2, 00.
Conclusão: Observando tc = 2, 93, temos que como
2, 93 > 2, 00 rejeita-se H0 ao nível de 5% de significância.
Portanto, temos evidências o cálcio afeta a diáfise, pois as
médias de com e sem calcio são diferentes.
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Para a variável peso:
teste de Kolmogorov-Smirnov: aceita-se a hipótese de normalidade (valor-p=0,0987)
teste de Bartlett: rejeita a hipótese de homogeneidade de
variância (valor-p=0,0077)
Utiliza-se o Teste t com variâncias heterógeneas
Temos:
X com = 1961, 64 X sem = 1910, 59
2
2
Scom
= 81, 77 Ssem
= 226, 33
2
81,77
226,33
30 + 30
ν = 81,77 2
= 47, 66
2
( 226,33
( 30 )
30 )
+ 29
29
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Vamos testar
Assim,
H0 : µcom = µsem
H1 : µcom 6= µsem
1961, 64 − 1910, 59
tc = q
= 15, 92
1
1
308, 10 30 + 30
Considerando grau de liberdade ν = 47, 66, temos t0,025 =
2, 01.
Conclusão: Observando tc = 15, 92, e como 15, 92 > 2, 01
rejeita-se H0 ao nível de 5% de significância. Portanto, temos evidências o cálcio afeta o peso, pois as médias de
com e sem calcio são diferentes.
Anderson
Bioestatística
Notes
Teste t para duas médias independentes
Para fazer o Teste t para duas médias independentes
Estatisticas⇒
Médias
⇒
Teste t para amostras independentes
Em seguida escolher a variável a ser analisada e os grupos.
Também deve-se informar:
Se o teste é unilateral ou bilateral
Nível de confiança do teste
Se o teste é com variância homogênea ou heterogênea
Anderson
Bioestatística
Notes
Teste t para duas médias pareadas
Num estudo pareado, temos duas amostras mas cada observação da primeira amostra é pareada com uma observação da segunda amostra.
Para calcular a a estatística é necessário obtermos uma
amostra de diferenças di
di = x2i − x1i
Para testar a hipótese de igualdade entre duas médias, se
calcula a estatística
d
tc = 2
Sd
n
em d e Sd2 são respectivamente a média e a variância das
diferenças
Rejeita-se H0 se valor − p ≤ α ou |tc | > tα , em que tα é
obtido da distribuição t com ν = n − 1 graus de liberdade
Anderson
Bioestatística
Notes
Teste t para duas médias pareadas
Um estudo observou o efeito de uma determinada dieta sobre o colesterol em 40 cães. Os cães foram submetidos a
dieta durente o período de 60 dias e mediu-se o colesterol
antes e depois da aplicação da dieta.
animal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
CA
CB
54,72
42,06
54,90
49,64
58,59
47,66
53,79
49,76
65,90
39,69
54,98
50,68
52,89
54,23
63,42
47,23
60,93
47,15
60,56
44,15
62,66
44,27
47,05
43,48
56,05
47,21
62,60
36,86
48,77
51,38
65,22
40,25
74,72
48,25
64,64
46,64
58,91
45,39
Anderson
57,13
36,74
animal
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Bioestatística
40
CA
63,23
54,32
47,27
62,84
51,51
56,31
54,46
58,57
59,63
60,98
55,94
51,96
53,89
62,55
53,16
55,15
62,39
45,08
49,76
54,61
CB
42,53
39,18
51,65
42,71
43,16
43,79
37,63
31,38
47,78
46,40
39,48
45,53
28,98
43,97
28,86
45,80
42,30
48,67
37,43
45,28
Notes
Teste t para duas médias pareadas
Para testar o efeito da dieta, primeiro vamos obter as diferenças.
animal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
CA
54,72
54,90
58,59
53,79
65,90
54,98
52,89
63,42
60,93
60,56
62,66
47,05
56,05
62,60
48,77
65,22
74,72
64,64
58,91
57,13
CB
42,06
49,64
47,66
49,76
39,69
50,68
54,23
47,23
47,15
44,15
44,27
43,48
47,21
36,86
51,38
40,25
48,25
46,64
45,39
36,74
d
12,66
5,26
10,93
4,03
26,21
4,30
-1,34
16,19
13,78
16,41
18,39
3,57
8,84
25,74
-2,61
24,97
26,47
18,00
13,52
20,39
Anderson
animal
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Bioestatística
CA
63,23
54,32
47,27
62,84
51,51
56,31
54,46
58,57
59,63
60,98
55,94
51,96
53,89
62,55
53,16
55,15
62,39
45,08
49,76
54,61
CB
42,53
39,18
51,65
42,71
43,16
43,79
37,63
31,38
47,78
46,40
39,48
45,53
28,98
43,97
28,86
45,80
42,30
48,67
37,43
45,28
d
20,70
15,14
-4,38
20,13
8,35
12,52
16,83
27,19
11,85
14,58
16,46
6,43
24,91
18,58
24,30
9,35
20,09
-3,59
12,33
9,33
Notes
Teste t para duas médias pareadas
A partir das diferenças obtém-se:
d = 13, 67
Vamos testar
S 2 = 74, 82 CA = 57, 30 CB = 43, 63
H0 : µA = µB
H1 : µA 6= µB
Assim,
tc =
13, 67
74,82
40
= 9, 99
Considerando grau de liberdade ν = 39, temos t0,025 =
2, 02.
Conclusão: Observando tc = 2, 02, temos que como
9, 99 > 2, 02 rejeita-se H0 ao nível de 5% de significância. Portanto, temos evidências que o colesterol que a dieta
afeta o colesterol médio dos cães.
Anderson
Bioestatística
Notes
Teste t para duas médias dependentes (pareadas)
Para fazer o Teste t para duas médias pareadas
Estatisticas⇒
Médias
⇒
Teste t (dados pareados)
Em seguida escolher a variável na primeira amostra e segunda amostra
Também deve-se informar:
Se o teste é unilateral ou bilateral
Nível de confiança do teste
Anderson
Bioestatística
Notes
Teste não paramétrico para comparar dois grupos
Quando queremos comparar dois grupos e a hipótese de
normalidade dos dados não é atendida podemos utilizar
teste não paramétricos.
Alguns testes não paramétricos são baseados no posto
(score ou rank) de um valor de um conjunto de n valores, que corresponde a sua posição no conjunto ordenado
(posto, score ou rank). Exemplo
X = {3, 5, 7, 12, 15, 20} ⇒ Posto= {1, 2, 3, 4, 5, 6}
Para comparar dois grupos pode-se utilizar dois teste distintos:
Amostras independentes - teste de Mann-Whitney
Amostras dependentes ou pareadas - teste de Wilcoxon
Anderson
Bioestatística
Notes
Teste de Mann-Whitney - Amostras independentes
O teste de Mann-Whitney é usado para a comparação de
dois grupos independentes.
O teste de hipótese pode ser formulado como segue:
H0 : As duas amostras têm distribuições idênticas
H1 : As duas amostras têm distribuições diferentes
H0 : µ1 = µ2
H1 : µ1 6= µ2
Anderson
Bioestatística
Notes
Teste de Mann-Whitney - Amostras independentes
Para testar a hipótese de igualdade entre duas médias, se
calcula a estatística
U = min{U1 , U2 }
sendo
U1 = n1 n2 +
n2 (n2 + 1)
−w2
2
U2 = n1 n2 +
n1 (n1 + 1)
−w1
2
n1 é o tamanho de amostra grupo 1 e n2 é o tamanho de
amostra do grupo 2;
w1 é a soma dos postos do grupo 1 e nw2 é a soma dos
postos do grupo 2;
Anderson
Bioestatística
Notes
Teste de Mann-Whitney - Amostras independentes
Se ambas as amostras tiverem tamanhos superiores a 10
observações, pode fazer-se a aproximação à distribuição
normal, com parâmetros
Média µU =
n1 n2
2
r
Desvio Padrão sem empate σU =
Desvio
Padrão
com
v
X
u
u n1 n2 (n3 − n −
(ui3 − ui ))
t
12(n2 − n)
de elementos dentro do empate
U − µU
Calcula-se zc =
σU
n1 n2 (n1 + n2 + 1)
12
empate
σU
em que ui é o numero
Rejeita-se H0 se valor − p ≤ α ou |zc | > zα
Anderson
=
Bioestatística
Teste de Mann-Whitney - Amostras independentes
Um estudo foi realizado com o objetivo de estimar os efeitos da inalação prolongada de óxido de cádmio. Os animais
foram divididos em dois grupos, o primeiro grupo composto
por 15 animais sujeitas em laboratório a um ambiente contaminado com este óxido, e o segundo grupo com 10 animais estiveram num ambiente normal sem essa contaminação (grupo de controle). A variável de interesse é a concentração de hemoglobina após a exposição.
exposto
14,4 15,7
14,2 16,7
13,8 13,7
16,5 15,3
14,1 14,0
16,6
15,9
15,6
14,1
15,3
Anderson
controle
17,4
16,2
17,1
17,5
15,0
16,0
16,9
15,0
16,3
16,8
Bioestatística
Notes
Notes
Teste de Mann-Whitney - Amostras independentes
Primeiro ordenar como se fosse um só grupo
grupo
exposto
exposto
exposto
exposto
exposto
exposto
exposto
controle
controle
exposto
exposto
exposto
exposto
exposto
13,7
13,8
14,0
14, 1
14, 1
14,2
14,4
15, 0
15, 0
15, 3
15, 3
15,6
15,7
posto
1
2
3
4,5
4,5
6
7
8,5
8,5
10,5
10,5
12
13
grupo
exposto
controle
controle
controle
exposto
exposto
exposto
controle
controle
controle
controle
controle
exposto
15,9
16,0
16,2
16,3
16,5
16,6
16,7
16,8
16,9
17,1
17,4
17,5
posto
14
15
16
17
18
19
20
21
22
23
24
25
Nos valores sublinhados ocorrem empates, por exemplo o
valor 14,1, ocorre no 4o e 5o elemento, assim o posto é
obtido da média dos dois valores ficando 4,5.
Anderson
Bioestatística
Teste de Mann-Whitney - Amostras independentes
A partir dos dados e dos postos temos:
n1 = 15 n2 = 10 w1 = 145 w2 = 180
10 × 11
− 180 = 25
U1 = 15 × 10 +
2
15 × 16
U2 = 15 × 10 +
− 145 = 125
2
Assim, a estatística de teste é U = min{25, 125} = 25
Usando a aproximação à distribuição normal, temos:
15 × 10
Média: µU =
= 75
2
Desvio Padrão, temos 3 empates 14,1 com 2 elementos,
15,0 com 2 elementos e 15,3 15,0 com 2 elementos
σ
sU =
15 × 10(253 − 25 − (23 − 2) + (23 − 2) + (23 − 2) )
=
12(252 − 25)
18, 02
Anderson
Bioestatística
Notes
Notes
Teste de Mann-Whitney - Amostras independentes
Assim
zc =
25 − 72
= −2, 77
18, 02
Considerando z0,025 = 1, 96.
Conclusão: Observando |zc | = 2, 77, como 2, 77 > 1, 96
rejeita-se H0 ao nível de 5% de significância. Portanto,
existe diferença entre os dois grupos, assim a exposição
a óxido de cádmio afeta a hemoglobina.
Anderson
Bioestatística
Notes
Teste de Mann-Whitney - Amostras independentes
Para fazer o Teste de Mann-Whitney para duas médias independentes
Estatísticas⇒
Teste Não Paramétricos
⇒
Teste de Wilcoxon (2 amostras)
Em seguida escolher a variável a ser analisada e os grupos.
Também deve-se informar:
Se o teste é unilateral ou bilateral
Nível de confiança do teste
Anderson
Bioestatística
Notes
Teste de Wilcoxon - Amostras dependentes
O teste de Wilcoxon é usado para a comparação de dois
grupos quando os dados são obtidos através do esquema
de pareamento.
O teste de hipótese pode ser formulado como segue:
H0 : As duas amostras têm distribuições idênticas
H1 : As duas amostras têm distribuições diferentes
H0 : µ1 = µ2
H1 : µ1 6= µ2
Anderson
Bioestatística
Notes
Teste de Wilcoxon - Amostras dependentes
Para testar a hipótese de igualdade entre duas médias, é
necessário primeiro obter uma amostra de diferenças di
di = x2i − x1i
As diferença iguais a zero devem ser excluídas.
Em seguida ignorar os sinais das diferenças e atribuir postos a elas.
Para testar a hipótese de igualdade entre duas médias, se
calcula a estatística
T = min{T+ , T− }
T+ é a soma dos postos das diferenças positivas
T− é a soma dos postos das diferenças positivas
Anderson
Bioestatística
Notes
Teste de Wilcoxon - Amostras dependentes
Se a amostra tiver tamanho superiores a 10 observações,
pode fazer-se a aproximação à distribuição normal, com parâmetros
Média µT =
n(n + 1)
4
r
n(n + 1)(2n + 1)
24
Desvio
rPadrão com empate P
P
ui3 − ui
n(n + 1)(2n + 1)
σT =
−
em que ui é o
24
48
numero de elementos dentro do empate
U − µU
Calcula-se zc =
σU
Desvio Padrão sem empate σT =
Rejeita-se H0 se valor − p ≤ α ou |zc | > zα
Anderson
Bioestatística
Notes
Teste de Wilcoxon - Amostras dependentes
Um estudo foi realizado com o objetivo de verificar o efeito
de uma ração sobre o peso dos animais. Dez animais adultos foram submetidas ao tratamento com a ração durante
uma semana. Os animais foram perfeitamente identificados, tendo sido mantidos, para tanto, em gaiolas individuais. Os pesos, em gramas,no princípio e no fim da semana,
são designados respectivamente por peso 1 e peso 2. Ao
nível de 5% de significância pode-se concluir que o uso da
ração contribuiu para o aumento do peso médio dos animais?
Animal
peso1
peso2
1
635
640
2
704
712
3
662
681
Anderson
4
560
558
5
603
610
Bioestatística
6
745
740
7
698
707
8
575
585
9
633
635
10
669
682
Notes
Teste de Wilcoxon - Amostras dependentes
Obter os postos
Animal
9
4
1
6
5
2
7
8
10
3
peso1
633
560
635
745
603
704
698
575
669
662
peso2
635
558
640
740
610
712
707
585
682
681
d
2
-2
5
-5
7
8
9
10
13
19
|d|
2
2
5
5
7
8
9
10
13
19
Total
posto
1,5
1,5
3,5
3,5
5
6
7
8
9
10
Nos valores sublinhados ocorrem empates
Anderson
Bioestatística
-
+
1,5
1,5
3,5
3,5
5
5
6
7
8
9
10
50
Notes
Teste de Wilcoxon - Amostras dependentes
Assim, a estatística de teste é U = min{5, 50} = 5
Usando a aproximação à distribuição normal, temos:
Média µT =
10(10 + 1)
= 27, 5
4
r
Desvio Padrão sem empate σT =
n(n + 1)(2n + 1)
24
15 × 10
Média: µU =
= 75
2
Desvio Padrão, temos 2 empates 2 com 2 elementos e 5
com 2relementos
10(10 + 1)(2 × 10 + 1) 23 + 23 − (2 + 2)
σT =
−
= 9, 8
24
48
Anderson
Bioestatística
Notes
Teste de Wilcoxon - Amostras dependentes
Assim
zc =
5 − 27, 5
= −2, 229
9, 8
Considerando z0,025 = 1, 96.
Conclusão: Observando |zc | = 2, 22, como 2, 22 > 1, 96
rejeita-se H0 ao nível de 5% de significância. Portanto,
existe diferença entre os dois grupos, assim o uso da ração contribui para o aumento do peso médio dos animais.
Anderson
Bioestatística
Notes
Teste de Wilcoxon - Amostras dependentes
Para fazer o Teste t para duas médias pareadas
Estatísticas⇒
Teste Não Paramétricos
⇒
Teste de Wilcoxon (amostras pareadas)
Em seguida escolher a variável na primeira amostra e segunda amostra
Também deve-se informar:
Se o teste é unilateral ou bilateral
Nível de confiança do teste
Anderson
Bioestatística

Documentos relacionados

Teste de hipótese de médias e proporções

Teste de hipótese de médias e proporções Teste de hipóteses para duas populações • Objetivo: testar hipóteses que comparam médias de duas amostras, possivelmente de populações distintas. • Tipos de amostras:

Leia mais