Bioestatística Aula 6 - Prof. Dr. Anderson Castro Soares de Oliveira
Transcrição
Bioestatística Aula 6 - Prof. Dr. Anderson Castro Soares de Oliveira
Notes Bioestatística Aula 6 Anderson Castro Soares de Oliveira Anderson Bioestatística Notes Teste de hipótese Teste de hipótese é uma metodologia estatística que permite tomar decisões sobre uma ou mais populações baseando-se no conhecimento de informações da amostra. A formulação de suposições ou de conjeturas acerca das populações são denominadas de Hipóteses Estatísticas, que podem ser: HIPÓTESE NULA - É aquela Hipótese Estatística, prefixada, formulada sobre o parâmetro populacional estudado, e é sempre uma afirmativa. É representada por H0 . HIPÓTESE ALTERNATIVA - São quaisquer hipóteses que difiram da Hipótese Nula. Pode ser representada por H1 ou Ha Anderson Bioestatística Notes Teste de hipótese Imagine que estamos interessados em responder a questao: Níveis elevados de bilirrubina em recém-nascidos afetam a capacidade auditiva? Dado uma amostra de n recem-nascidos, construimos dois grupos: A = taxa de bilirrubina normal B = taxa de bilirrubina elevada Gera-se a hipótese de nula H0 : H0 : µA = µB µA média da capacidade auditiva do grupo A µB média da capacidade auditiva do grupo B Anderson Bioestatística Notes Teste de hipótese Com a formulação dessa hipótese H0 estamos testando se as médias auditivas dos dois grupos são iguais Aceitar H0 significa afirmar que os níveis de bilirrubinas não afetam a audição! Rejeitar H0 significa comprovar que os níveis de bilirrubina afetam a capacidade auditiva Poderíamos formular as seguintes hipóteses alternativas: H1 : µA 6= µB as médias dos dois grupos são diferentes H1 : µA > µB A média do grupo A é maior que a média do grupo B H1 : µA < µB A média do grupo A é menor que a média do grupo B Anderson Bioestatística Notes Teste de hipótese Consideremos θ o parâmetro estudado e θ0 valor inicialmente suposto para. Podemos formular as seguintes hipóteses: H0 : θ = θ0 Teste Bilateral H1 : θ 6= θ0 H0 : θ = θ0 Teste Unilateral H1 : θ > θ0 H0 : θ = θ0 Teste Unilateral H1 : θ < θ0 Anderson Bioestatística Notes Teste de hipótese Aceitando-se H0 rejeita-se automaticamente H1 , e viceversa Para se decidir se aceitamos ou se rejeitamos uma hipótese deve-se utilizar uma regra de decisão. As regras de decisão são baseadas nas distribuições amostrais. Anderson Bioestatística Notes Teste de hipótese Tabela 1: Erros possíveis de se cometer no processo de tomada de decisão Decisões possíveis Aceitação de Ho Rejeição de Ho Estados possíveis Ho verdadeira Ho falsa Decisão correta Erro do tipo II Erro do tipo I Decisão correta Anderson Bioestatística Notes Teste de hipótese Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro do tipo I é denominada de Nível de Significância do Teste e é representada por α. O nível de significância α. é geralmente determinado pelo pesquisador antes da coleta dos dados. Em muitas aplicações da estatística, o nível de significância é tradicionalmente fixado em 0,05 Existem duas opções para expressar a conclusão final de um teste de hipóteses. Comparar o valor da estatística do teste com o valor obtido a partir da distribuição teórica, específica para o teste, para um valor pré-fixado do nível de significância; Quantificar a probabilidade do que foi observado considerando H0 verdadeira. Esta probabilidade é chamada de valor-p e frequentemente é indicado apenas por p. Anderson Bioestatística Notes Teste de hipótese Alguns enganos em relação ao valor-p O valor-p não é a probabilidade da hipótese nula de um teste ser verdadeira. O valor-p não é a probabilidade de um dado resultado ter sido obtido de um "acaso". O valor-p não é a probabilidade da hipótese nula ter sido enganosamente rejeitada. Valor-p e nível de significância não são sinônimos. O valorp é sempre obtido de uma amostra, enquanto o nível de significância é geralmente fixado antes da coleta dos dados. Anderson Bioestatística Notes Teste de hipótese Assim a regra de decisão do teste de hipóteses poderá ser feita pela comparação do valor-p com o nível de significância Se o valor-p for maior que α então a hipótese nula será aceita. Se o valor-p for menor ou igual a α então a hipótese nula será rejeitada. Anderson Bioestatística Notes Teste de hipótese Anderson Bioestatística Notes Teste de hipótese Teste de hipóteses para variáveis categóricas Usualmente, usam-se testes que comparam proporções, tais como o Teste Qui-Quadrado e o Exato de Fisher. Teste de hipóteses para variáveis quantitativas: Para variáveis com distribuição normal -testes que comparam médias: teste-t e ANOVA (Análise de Variância); Para variáveis com distribuição não normal- testes que comparam medianas, tais como Testes de Mann-Witney, Wilcoxon e Kruskal-Wallis (testes não-paramétricos) Anderson Bioestatística Notes Escolha do teste de hipótese Quantas variáveis serão analisadas ? Qual seu objetivo? Comparação de médias Comparação de variância Relação entre variáveis Quais o tipo de variável ? Quantitativa Qualitativa Qual a natureza da distribuição de probabilidade da variável? Distribuição Binomial Distribuição Poisson Distribuição Normal Anderson Bioestatística Notes Etapas aplicadas a qualquer teste de hipóteses Determinar as hipóteses nula e alternativa. Selecionar a estatística de teste que será usada para decidir rejeitar ou não a hipótese nula. Especificar o nível de significância α para o teste. Usar o nível de significância α para desenvolver regra de decisão que indica os valores críticos da estatística de teste que levará a rejeição de H0 . Coletar os dados amostrais e calcular a estatística de teste. Comparar o valor da estatística do teste com o(s) valor(es) crítico(s) especificado(s) na regra de decisão para determinar se H0 deve ser rejeitado. Anderson Bioestatística Notes Teste de Normalidade O teste de Shapiro-Wilk W tem sido o mais utilizado para testar a normalidade e tem uma melhor performance em amostras reduzidas n < 30 As hipóteses geradas são: H0 : A amostra provém de uma população com distribuição Normal H1 : A amostra não provém de uma população com distribuição Normal Anderson Bioestatística Teste de Normalidade Para testar a normalidade se calcula a estatística n 2 P ai x(i) i=1 W = n P (xi − x̄)2 i=1 em que os x(i)0 s são os valores amostrais ordenado e os ai0 s são constantes geradas das médias, variâncias e covariâncias das estatísticas de ordem de uma amostra aleatória de tamanho n de uma distribuição normal. Se o valor calculado de W é estatisticamente significativo (para α = 0, 05) rejeita-se a hipótese que a distribuição estudada é normal Ou seja Para a Distribuição ser considerada Normal o valorp deve ser maior que 0,05 Anderson Bioestatística Notes Notes Teste de Normalidade O teste de Kolmogorov-Smirnov é utilizado para verificar a normalidade e baseia-se na máxima diferença entre a distribuição acumulada da amostra e distribuição acumulada esperada e deve ser utilizado em amostras grandes (n ≥ 30) As hipóteses geradas são: H0 : A amostra provém de uma população com distribuição Normal H1 : A amostra não provém de uma população com distribuição Normal Se o valor calculado de D é estatisticamente significativo (para α = 0, 05) rejeita-se a hipótese que a distribuição estudada é normal Ou seja: para a Distribuição ser considerada Normal o valor-p deve ser maior que 0,05 Anderson Bioestatística Notes Teste de homogeneidade de variâncias O teste de Bartlett é utilizado para verificar se a variância de diferentes grupos são homogêneas H0 : σ12 = σ22 = ... = σi2 vsHa : ∃i, jσi2 6= σj2 O teste de Bartlett é fortemente sensível à Normalidade das observações subjacentes Uma regra comum é considerar que o teste apenas deve ser usado quando cada grupo tiver 5 mais repetições ni > 5 Anderson Bioestatística Notes Teste de homogeneidade de variâncias O teste de Levene é utilizado para verificar se a variância de diferentes grupos são homogêneas Uma vantagem do teste de Levene é que ele não exige normalidade dos dados. Anderson Bioestatística Notes Teste de normalidade Para fazer o teste de Shapiro-Wilk utiliza-se Estatisticas⇒ Resumos Teste de normalidade de shapiro-wilk ⇒ No pacote RcmdrPlugin.EZR para fazer o teste Kolmogorov-Smirnov utiliza-se Statistical Analysis⇒ Continuos variables ⇒ Kolmogorov-Smirnov test for normal distribuition Anderson Bioestatística Notes Teste de homogeneidade de variância Para fazer o teste de Bartlett utiliza-se Estatisticas⇒ Variâncias ⇒ Teste de Bartlett Para fazer o teste de Levene utiliza-se Estatisticas⇒ Variâncias ⇒ Teste de Bartlett Anderson Bioestatística Notes Teste para comparação de duas médias Um problema comum é o pesquisador observa dois grupos distintos com o objetivo de saber se os grupos diferem ou não em relação à resposta de interesse. Quando a varíavel de interesse é quantitativa, a estratégia pra verificar se os grupo diferem ou não é comparar suas médias. Assim, utiliza-se os teste de hipótese para comparação de duas médias. Os teste de comparação de duas médias podem ser: Teste para amostras independentes - quando é medido a mesma variável sobre individuos diferentes após um tempo ou um tratamento. Teste para amostras dependentes ou pareadas - quando é medido a mesma variável sobre o mesmo individuo após um tempo ou um tratamento. Anderson Bioestatística Notes Teste para comparação de duas médias Antes de aplicar um teste de comparação de duas médias é necessário verificar se os dados seguem distribuição normal ou não. Se os dados tem distribuição normal utiliza-se teste paramétricos (teste t) Se os dados não tem distribuição normal utiliza-se teste não paramétricos Para verificar se os dados seguem uma distribuição normal aplica-se um teste de normalidade. Anderson Bioestatística Notes Teste t para duas médias Se a variável de interesse tem distribuição normal ou aproximadamente normal, aplica-se o teste t para comparar duas médias. O teste t para duas médias tem duas abordagens distintas Amostras independentes Amostras dependentes ou pareadas Anderson Bioestatística Notes Teste t para duas médias independentes Para aplicar o teste t para duas médias independentes é necessário verificar se as variâncias dos grupos são homogêneas, pode-se utilizar os teste de Bartlett ou Levene. O teste de hipótese pode ser formulado como segue: H0 : µ1 = µ2 H0 : µ1 = µ2 H0 : µ1 = µ2 H1 : µ1 6= µ2 H1 : µ1 < µ2 H1 : µ1 > µ2 Anderson Bioestatística Notes Teste t para duas médias independentes Quando as variâncias são consideradas homogêneas, pra testar a hipótese de igualdade entre duas médias, se calcula a estatística x1 − x2 tc = r Sd2 n11 + 1 n2 em que Sd2 é uma variância combinada dada por Sd2 (n1 − 1)S12 + (n2 − 1)S22 = n1 + n2 − 2 Rejeita-se H0 se valor − p ≤ α ou |tc | > tα , em que tα é obtido da distribuição t com n1 + n2 − 2 graus de liberdade Anderson Bioestatística Notes Teste t para duas médias independentes Quando as variâncias são consideradas heterogêneas, pra testar a hipótese de igualdade entre duas médias, se calcula a estatística x1 − x2 tc = r S1 S2 n1 + n2 Rejeita-se H0 se valor − p ≤ α ou |tc | > tα , em que tα é 2 S1 S22 2 + n1 n2 obtido da distribuição t com ν = 2 2 2 2 graus de S 1 n1 n1 −1 liberdade Anderson Bioestatística + S 2 n2 n2 −1 Notes Teste t para duas médias independentes Um estudo foi realizado para verificar a influencia da adição de cálcio na alimentação de frangos sobre o peso e parâmetros densitometria óssea. Foram utilizados 60 pintos de um dia distribuídos em dois grupos, alimentado durante 45 dias com ração com e sem adição de cálcio. Aos 45 dias os frangos foram abatidos pesados e foram medidos os diâmetros das epífises proximais e distais e diáfises dos tibiotarsos de cada grupo foram avaliados e posteriormente destinados à análise densitométrica. Os dados obtidos estão contidos no arquivo "calcio.xlsx". Anderson Bioestatística Notes Teste t para duas médias independentes Para a variável diáfise teste de Kolmogorov-Smirnov: aceita-se a hipótese de normalidade (valor-p=0,4912) teste de Bartlett: aceita-se a hipótese de homogeneidade de variância (valor-p=0,1093) Utiliza-se o Teste t com variâncias homogêneas Temos: X com = 2, 26 X sem = 1, 76 2 2 Scom = 0, 56 Ssem = 0, 31 (29)0, 56 + (29)0, 31 Sd2 = = 0.435 58 Anderson Bioestatística Notes Teste t para duas médias independentes Vamos testar Assim, H0 : µcom = µsem H1 : µcom 6= µsem 2, 26 − 1, 76 tc = q = 2, 93 1 1 0, 435 30 + 30 Considerando grau de liberdade ν = 58, temos t0,025 = 2, 00. Conclusão: Observando tc = 2, 93, temos que como 2, 93 > 2, 00 rejeita-se H0 ao nível de 5% de significância. Portanto, temos evidências o cálcio afeta a diáfise, pois as médias de com e sem calcio são diferentes. Anderson Bioestatística Notes Teste t para duas médias independentes Para a variável peso: teste de Kolmogorov-Smirnov: aceita-se a hipótese de normalidade (valor-p=0,0987) teste de Bartlett: rejeita a hipótese de homogeneidade de variância (valor-p=0,0077) Utiliza-se o Teste t com variâncias heterógeneas Temos: X com = 1961, 64 X sem = 1910, 59 2 2 Scom = 81, 77 Ssem = 226, 33 2 81,77 226,33 30 + 30 ν = 81,77 2 = 47, 66 2 ( 226,33 ( 30 ) 30 ) + 29 29 Anderson Bioestatística Notes Teste t para duas médias independentes Vamos testar Assim, H0 : µcom = µsem H1 : µcom 6= µsem 1961, 64 − 1910, 59 tc = q = 15, 92 1 1 308, 10 30 + 30 Considerando grau de liberdade ν = 47, 66, temos t0,025 = 2, 01. Conclusão: Observando tc = 15, 92, e como 15, 92 > 2, 01 rejeita-se H0 ao nível de 5% de significância. Portanto, temos evidências o cálcio afeta o peso, pois as médias de com e sem calcio são diferentes. Anderson Bioestatística Notes Teste t para duas médias independentes Para fazer o Teste t para duas médias independentes Estatisticas⇒ Médias ⇒ Teste t para amostras independentes Em seguida escolher a variável a ser analisada e os grupos. Também deve-se informar: Se o teste é unilateral ou bilateral Nível de confiança do teste Se o teste é com variância homogênea ou heterogênea Anderson Bioestatística Notes Teste t para duas médias pareadas Num estudo pareado, temos duas amostras mas cada observação da primeira amostra é pareada com uma observação da segunda amostra. Para calcular a a estatística é necessário obtermos uma amostra de diferenças di di = x2i − x1i Para testar a hipótese de igualdade entre duas médias, se calcula a estatística d tc = 2 Sd n em d e Sd2 são respectivamente a média e a variância das diferenças Rejeita-se H0 se valor − p ≤ α ou |tc | > tα , em que tα é obtido da distribuição t com ν = n − 1 graus de liberdade Anderson Bioestatística Notes Teste t para duas médias pareadas Um estudo observou o efeito de uma determinada dieta sobre o colesterol em 40 cães. Os cães foram submetidos a dieta durente o período de 60 dias e mediu-se o colesterol antes e depois da aplicação da dieta. animal 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 CA CB 54,72 42,06 54,90 49,64 58,59 47,66 53,79 49,76 65,90 39,69 54,98 50,68 52,89 54,23 63,42 47,23 60,93 47,15 60,56 44,15 62,66 44,27 47,05 43,48 56,05 47,21 62,60 36,86 48,77 51,38 65,22 40,25 74,72 48,25 64,64 46,64 58,91 45,39 Anderson 57,13 36,74 animal 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 Bioestatística 40 CA 63,23 54,32 47,27 62,84 51,51 56,31 54,46 58,57 59,63 60,98 55,94 51,96 53,89 62,55 53,16 55,15 62,39 45,08 49,76 54,61 CB 42,53 39,18 51,65 42,71 43,16 43,79 37,63 31,38 47,78 46,40 39,48 45,53 28,98 43,97 28,86 45,80 42,30 48,67 37,43 45,28 Notes Teste t para duas médias pareadas Para testar o efeito da dieta, primeiro vamos obter as diferenças. animal 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 CA 54,72 54,90 58,59 53,79 65,90 54,98 52,89 63,42 60,93 60,56 62,66 47,05 56,05 62,60 48,77 65,22 74,72 64,64 58,91 57,13 CB 42,06 49,64 47,66 49,76 39,69 50,68 54,23 47,23 47,15 44,15 44,27 43,48 47,21 36,86 51,38 40,25 48,25 46,64 45,39 36,74 d 12,66 5,26 10,93 4,03 26,21 4,30 -1,34 16,19 13,78 16,41 18,39 3,57 8,84 25,74 -2,61 24,97 26,47 18,00 13,52 20,39 Anderson animal 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Bioestatística CA 63,23 54,32 47,27 62,84 51,51 56,31 54,46 58,57 59,63 60,98 55,94 51,96 53,89 62,55 53,16 55,15 62,39 45,08 49,76 54,61 CB 42,53 39,18 51,65 42,71 43,16 43,79 37,63 31,38 47,78 46,40 39,48 45,53 28,98 43,97 28,86 45,80 42,30 48,67 37,43 45,28 d 20,70 15,14 -4,38 20,13 8,35 12,52 16,83 27,19 11,85 14,58 16,46 6,43 24,91 18,58 24,30 9,35 20,09 -3,59 12,33 9,33 Notes Teste t para duas médias pareadas A partir das diferenças obtém-se: d = 13, 67 Vamos testar S 2 = 74, 82 CA = 57, 30 CB = 43, 63 H0 : µA = µB H1 : µA 6= µB Assim, tc = 13, 67 74,82 40 = 9, 99 Considerando grau de liberdade ν = 39, temos t0,025 = 2, 02. Conclusão: Observando tc = 2, 02, temos que como 9, 99 > 2, 02 rejeita-se H0 ao nível de 5% de significância. Portanto, temos evidências que o colesterol que a dieta afeta o colesterol médio dos cães. Anderson Bioestatística Notes Teste t para duas médias dependentes (pareadas) Para fazer o Teste t para duas médias pareadas Estatisticas⇒ Médias ⇒ Teste t (dados pareados) Em seguida escolher a variável na primeira amostra e segunda amostra Também deve-se informar: Se o teste é unilateral ou bilateral Nível de confiança do teste Anderson Bioestatística Notes Teste não paramétrico para comparar dois grupos Quando queremos comparar dois grupos e a hipótese de normalidade dos dados não é atendida podemos utilizar teste não paramétricos. Alguns testes não paramétricos são baseados no posto (score ou rank) de um valor de um conjunto de n valores, que corresponde a sua posição no conjunto ordenado (posto, score ou rank). Exemplo X = {3, 5, 7, 12, 15, 20} ⇒ Posto= {1, 2, 3, 4, 5, 6} Para comparar dois grupos pode-se utilizar dois teste distintos: Amostras independentes - teste de Mann-Whitney Amostras dependentes ou pareadas - teste de Wilcoxon Anderson Bioestatística Notes Teste de Mann-Whitney - Amostras independentes O teste de Mann-Whitney é usado para a comparação de dois grupos independentes. O teste de hipótese pode ser formulado como segue: H0 : As duas amostras têm distribuições idênticas H1 : As duas amostras têm distribuições diferentes H0 : µ1 = µ2 H1 : µ1 6= µ2 Anderson Bioestatística Notes Teste de Mann-Whitney - Amostras independentes Para testar a hipótese de igualdade entre duas médias, se calcula a estatística U = min{U1 , U2 } sendo U1 = n1 n2 + n2 (n2 + 1) −w2 2 U2 = n1 n2 + n1 (n1 + 1) −w1 2 n1 é o tamanho de amostra grupo 1 e n2 é o tamanho de amostra do grupo 2; w1 é a soma dos postos do grupo 1 e nw2 é a soma dos postos do grupo 2; Anderson Bioestatística Notes Teste de Mann-Whitney - Amostras independentes Se ambas as amostras tiverem tamanhos superiores a 10 observações, pode fazer-se a aproximação à distribuição normal, com parâmetros Média µU = n1 n2 2 r Desvio Padrão sem empate σU = Desvio Padrão com v X u u n1 n2 (n3 − n − (ui3 − ui )) t 12(n2 − n) de elementos dentro do empate U − µU Calcula-se zc = σU n1 n2 (n1 + n2 + 1) 12 empate σU em que ui é o numero Rejeita-se H0 se valor − p ≤ α ou |zc | > zα Anderson = Bioestatística Teste de Mann-Whitney - Amostras independentes Um estudo foi realizado com o objetivo de estimar os efeitos da inalação prolongada de óxido de cádmio. Os animais foram divididos em dois grupos, o primeiro grupo composto por 15 animais sujeitas em laboratório a um ambiente contaminado com este óxido, e o segundo grupo com 10 animais estiveram num ambiente normal sem essa contaminação (grupo de controle). A variável de interesse é a concentração de hemoglobina após a exposição. exposto 14,4 15,7 14,2 16,7 13,8 13,7 16,5 15,3 14,1 14,0 16,6 15,9 15,6 14,1 15,3 Anderson controle 17,4 16,2 17,1 17,5 15,0 16,0 16,9 15,0 16,3 16,8 Bioestatística Notes Notes Teste de Mann-Whitney - Amostras independentes Primeiro ordenar como se fosse um só grupo grupo exposto exposto exposto exposto exposto exposto exposto controle controle exposto exposto exposto exposto exposto 13,7 13,8 14,0 14, 1 14, 1 14,2 14,4 15, 0 15, 0 15, 3 15, 3 15,6 15,7 posto 1 2 3 4,5 4,5 6 7 8,5 8,5 10,5 10,5 12 13 grupo exposto controle controle controle exposto exposto exposto controle controle controle controle controle exposto 15,9 16,0 16,2 16,3 16,5 16,6 16,7 16,8 16,9 17,1 17,4 17,5 posto 14 15 16 17 18 19 20 21 22 23 24 25 Nos valores sublinhados ocorrem empates, por exemplo o valor 14,1, ocorre no 4o e 5o elemento, assim o posto é obtido da média dos dois valores ficando 4,5. Anderson Bioestatística Teste de Mann-Whitney - Amostras independentes A partir dos dados e dos postos temos: n1 = 15 n2 = 10 w1 = 145 w2 = 180 10 × 11 − 180 = 25 U1 = 15 × 10 + 2 15 × 16 U2 = 15 × 10 + − 145 = 125 2 Assim, a estatística de teste é U = min{25, 125} = 25 Usando a aproximação à distribuição normal, temos: 15 × 10 Média: µU = = 75 2 Desvio Padrão, temos 3 empates 14,1 com 2 elementos, 15,0 com 2 elementos e 15,3 15,0 com 2 elementos σ sU = 15 × 10(253 − 25 − (23 − 2) + (23 − 2) + (23 − 2) ) = 12(252 − 25) 18, 02 Anderson Bioestatística Notes Notes Teste de Mann-Whitney - Amostras independentes Assim zc = 25 − 72 = −2, 77 18, 02 Considerando z0,025 = 1, 96. Conclusão: Observando |zc | = 2, 77, como 2, 77 > 1, 96 rejeita-se H0 ao nível de 5% de significância. Portanto, existe diferença entre os dois grupos, assim a exposição a óxido de cádmio afeta a hemoglobina. Anderson Bioestatística Notes Teste de Mann-Whitney - Amostras independentes Para fazer o Teste de Mann-Whitney para duas médias independentes Estatísticas⇒ Teste Não Paramétricos ⇒ Teste de Wilcoxon (2 amostras) Em seguida escolher a variável a ser analisada e os grupos. Também deve-se informar: Se o teste é unilateral ou bilateral Nível de confiança do teste Anderson Bioestatística Notes Teste de Wilcoxon - Amostras dependentes O teste de Wilcoxon é usado para a comparação de dois grupos quando os dados são obtidos através do esquema de pareamento. O teste de hipótese pode ser formulado como segue: H0 : As duas amostras têm distribuições idênticas H1 : As duas amostras têm distribuições diferentes H0 : µ1 = µ2 H1 : µ1 6= µ2 Anderson Bioestatística Notes Teste de Wilcoxon - Amostras dependentes Para testar a hipótese de igualdade entre duas médias, é necessário primeiro obter uma amostra de diferenças di di = x2i − x1i As diferença iguais a zero devem ser excluídas. Em seguida ignorar os sinais das diferenças e atribuir postos a elas. Para testar a hipótese de igualdade entre duas médias, se calcula a estatística T = min{T+ , T− } T+ é a soma dos postos das diferenças positivas T− é a soma dos postos das diferenças positivas Anderson Bioestatística Notes Teste de Wilcoxon - Amostras dependentes Se a amostra tiver tamanho superiores a 10 observações, pode fazer-se a aproximação à distribuição normal, com parâmetros Média µT = n(n + 1) 4 r n(n + 1)(2n + 1) 24 Desvio rPadrão com empate P P ui3 − ui n(n + 1)(2n + 1) σT = − em que ui é o 24 48 numero de elementos dentro do empate U − µU Calcula-se zc = σU Desvio Padrão sem empate σT = Rejeita-se H0 se valor − p ≤ α ou |zc | > zα Anderson Bioestatística Notes Teste de Wilcoxon - Amostras dependentes Um estudo foi realizado com o objetivo de verificar o efeito de uma ração sobre o peso dos animais. Dez animais adultos foram submetidas ao tratamento com a ração durante uma semana. Os animais foram perfeitamente identificados, tendo sido mantidos, para tanto, em gaiolas individuais. Os pesos, em gramas,no princípio e no fim da semana, são designados respectivamente por peso 1 e peso 2. Ao nível de 5% de significância pode-se concluir que o uso da ração contribuiu para o aumento do peso médio dos animais? Animal peso1 peso2 1 635 640 2 704 712 3 662 681 Anderson 4 560 558 5 603 610 Bioestatística 6 745 740 7 698 707 8 575 585 9 633 635 10 669 682 Notes Teste de Wilcoxon - Amostras dependentes Obter os postos Animal 9 4 1 6 5 2 7 8 10 3 peso1 633 560 635 745 603 704 698 575 669 662 peso2 635 558 640 740 610 712 707 585 682 681 d 2 -2 5 -5 7 8 9 10 13 19 |d| 2 2 5 5 7 8 9 10 13 19 Total posto 1,5 1,5 3,5 3,5 5 6 7 8 9 10 Nos valores sublinhados ocorrem empates Anderson Bioestatística - + 1,5 1,5 3,5 3,5 5 5 6 7 8 9 10 50 Notes Teste de Wilcoxon - Amostras dependentes Assim, a estatística de teste é U = min{5, 50} = 5 Usando a aproximação à distribuição normal, temos: Média µT = 10(10 + 1) = 27, 5 4 r Desvio Padrão sem empate σT = n(n + 1)(2n + 1) 24 15 × 10 Média: µU = = 75 2 Desvio Padrão, temos 2 empates 2 com 2 elementos e 5 com 2relementos 10(10 + 1)(2 × 10 + 1) 23 + 23 − (2 + 2) σT = − = 9, 8 24 48 Anderson Bioestatística Notes Teste de Wilcoxon - Amostras dependentes Assim zc = 5 − 27, 5 = −2, 229 9, 8 Considerando z0,025 = 1, 96. Conclusão: Observando |zc | = 2, 22, como 2, 22 > 1, 96 rejeita-se H0 ao nível de 5% de significância. Portanto, existe diferença entre os dois grupos, assim o uso da ração contribui para o aumento do peso médio dos animais. Anderson Bioestatística Notes Teste de Wilcoxon - Amostras dependentes Para fazer o Teste t para duas médias pareadas Estatísticas⇒ Teste Não Paramétricos ⇒ Teste de Wilcoxon (amostras pareadas) Em seguida escolher a variável na primeira amostra e segunda amostra Também deve-se informar: Se o teste é unilateral ou bilateral Nível de confiança do teste Anderson Bioestatística
Documentos relacionados
Teste de hipótese de médias e proporções
Teste de hipóteses para duas populações • Objetivo: testar hipóteses que comparam médias de duas amostras, possivelmente de populações distintas. • Tipos de amostras:
Leia mais