Leg
Transcrição
Leg
9 a 14 de Setembro Pós-Graduação em Produção Vegetal UFPR Éder David Borges da Silva Renato Gonçalves de Oliveira Conteúdo abordado: Revisão de Estatística básica Princípios básicos de experimentação Delineamento inteiramente casualizado (DIC) Delineamento blocos ao acaso (DBA) Delineamento Quadrado latino (DQL) Esquema Fatorial Delineamento em parcela subdividida Delineamento em faixas Introdução ao Software R Análise de variância DIC DBA Fatorial 3x2 Parcelas subdivididas Analise de regressão linear Analise de regressão não linear Planejamento e análise de Experimentos 2 Circularidade do Método científico PLANEJAMENTO HIPÓTESE CONCLUSÃO/DESENV. TEORIA EXPERIMENTO TESTE DA HIPÓTESE ANÁLISE ESTATÍSTICA Planejamento e análise de Experimentos 5 Funções de distribuição de probabilidade normal f x, , 1 exp 2 Planejamento e análise de Experimentos x 2 2 2 7 Intervalos de confiança e teste de hipótese 14 N (0,1) 12 0,1 08 06 04 2 1 2 02 0 0 - 5 -zcrít 0 10 zcrít 15 + 20 2 rejeição de H0 z <<< 0 Se H0 falsa rejeição de H0 z >>> 0 Se H0 falsa 0,14 aceitação de H0 z=0 Se H0 verdadeira N ( 0, 0,12 0,1 n 2 ) N ( 1, n ) 0,08 0,06 1 0,04 0,02 0 0 - 5 Planejamento e análise de Experimentos 10 0 X crít 15 20 1 + 8 Tipos de erro no teste de hipóteses Realidade Decisão H0 é verdadeira H0 é falsa Rejeitar H0 Erro tipo I Decisão correta Não Rejeitar H0 Decisão correta Erro tipo II Planejamento e análise de Experimentos 9 Propriedades da distribuição F f ( x) [( g1 g 2 ) 2] g1 ( g1 2) ( g 2 2) g 2 E( X ) g1 / 2 x g1 / 2 1 g1 1 x g2 ( g1 g 2 ) 2 x 0 + 0 g2 g2 2 2 g22 ( g1 g 2 2) Var ( X ) g1 ( g2 2)2 ( g 2 4) X ~ Fg1 ,g2 (lê-se: X tem distribuição F com g1 e g2 graus de liberdade) Propriedades: a) se U ~ 2 g1 eV~ 2 g2 b) se X ~ Fg1 ,g2 então então Fg1 ,g2 U / g1 ~ Fg1 ,g2 V / g2 1 ~ Fg2 , g1 X P( Fg1 ,g2 F 0 F) Planejamento e análise de Experimentos P( Fg2 ,g1 1 ) F + Fg2 ,g1 0 1 F + 10 Teste F Fr Fcalc 1, nT r QMT QME 0 1 H0 verd. Fcrít ac. H0 Planejamento e análise de Experimentos + H0 falso rej. H0 11 P-valor Planejamento e análise de Experimentos 12 Princípios básicos da experimentação Casualização Repetição Controle local A aleatorização torna os testes estatísticos válidos A repetição torna os testes estatísticos possíveis O controle local torna o experimento mais eficiente Planejamento e análise de Experimentos 14 Pressupostos de modelos lineares (ANOVA) Y X Planejamento e análise de Experimentos 16 Pressupostos de modelos lineares (ANOVA) Normalidade da distribuição dos erros; Homogeneidade das variâncias; Aditividade dos efeitos dos fatores de variação; Independência dos erros; Planejamento e análise de Experimentos 17 0.2 0.0 0.1 f(x) 0.3 0.4 Normalidade da distribuição dos erros -4 -2 0 2 4 x Analise gráfica e pelo teste Shapiro-Wilk 2 n ai x i W i 1 n _ xi 2 x i 1 Planejamento e análise de Experimentos 18 0 -50 Resíduos 50 Homogeneidade das variâncias, t1 t2 t3 t4 t5 t6 t7 t8 t9 Linhagens Analise gráfica e pelo teste Bartlett k 1 C 1 3k 1 i 1 1 1 ni 1 n k K ni 1 log Si2 n k log QMRE K i 1 C Planejamento e análise de Experimentos ~ X k2 1 19 Aditividade dos efeitos dos fatores de variação yij i ij Cada componente do modelo deve ter efeito aditivo; Planejamento e análise de Experimentos 20 0 -50 Resíduos 50 Independência dos erros: 2 4 6 8 Linhagens Os erros devem possuir independência dos demais cov( ij , ' ij ) Planejamento e análise de Experimentos 0 21 Definição Efeitos fixos: Os níveis em estudo forem escolhidos pelo pesquisador, de modo que o interesse concentre-se nesses níveis; Inferência restrita aos níveis em estudo. Efeitos aleatórios (variáveis aletórias): Os níveis em estudo correspondem a uma amostra aleatória de uma população de referência; Os níveis provem de uma distribuição de probabilidade; A inferência é extrapolada para uma população de referência; Planejamento e análise de Experimentos 23 Observações do experimento Os valores observados quando da avaliação dos materiais representa a média fenotípica: Observação Efeitos Efeitos Efeitos fenotípica = genéticos + ambientais + residuais Planejamento e análise de Experimentos 24 Modelo estatístico inteiramente casualizado yij yij IDD i ij onde ij ~ N (0, 2 ) é o valor do i-ésimo tratamento na j-ésima parcela é a constante geral do modelo (normalmente a média) i ij é o efeito do i-ésimo tratamento é o erro experimental associado ao i-ésimo tratamento na j-ésima parcela Planejamento e análise de Experimentos 26 Quadro de anova DIC Fonte GL SQ Tratamento t 1 SQtrat Erro (t 1)(r 1) SQerro Total tr 1 SQtotal QM SQtrat t 1 SQerro (t 1)(r 1) Planejamento e análise de Experimentos EMEF EMEA 2 2 i r t 1 2 2 r 2 27 2 Delineamentos blocos ao acaso Considerações importantes: O bloco é uma restrição à casualização; Isto implicará em perda de precisão experimental e ganho na facilidade de condução do experimento; Isso se deve a perda de graus de liberdade do resíduo; O bloco não é necessariamente espacial, áreas desuniformes, ele pode ser virtual, no caso de épocas de plantio por exemplo. Planejamento e análise de Experimentos 29 Modelo estatístico Blocos ao acaso yij yij IDD i j ij onde ij ~ N (0, 2 ) é o valor do i-ésimo tratamento na j-ésima parcela é a constante geral do modelo (normalmente a média) é o efeito do i-ésimo tratamento i j ij é o efeito do j-ésimo bloco é o erro experimental associado ao i-ésimo tratamento na j-ésima parcela Planejamento e análise de Experimentos 30 Quadro de anova DBA Fonte GL SQ QM Bloco j 1 SQbloco QMbloco Tratamento t 1 SQtrat QMtrat Erro ( j 1)(t 1) SQerro QMerro Total jt 1 SQtotal QMtotal Planejamento e análise de Experimentos EMEF t 2 2 EMEA 2 j 2 2 j 1 j t 2j t 2 j 2 t t 1 2 2 31 DBA Outra Estufa Canteiro E N T R A D A C E R C A Corredor _RS _Tke _Pe _P _RSe _RS _RS _P _RSe _RSe _Pe _Tke _P _RSe _TK _TK _Tke _Pe _Pe _TK _TKe _P _TK _RS Planejamento e análise de Experimentos 32 Modelo estatístico Quadrado latino yijk yij i l j ck IDD ijk onde ijk ~ N (0, 2 ) é o valor do i-ésimo tratamento na j-ésima parcela é a constante geral do modelo (normalmente a média) i é o efeito do i-ésimo tratamento lj é o efeito da j-ésima linha ck é o efeito da k-ésima linha ij é o erro experimental associado ao i-ésimo tratamento na j-ésima parcela Planejamento e análise de Experimentos 34 Delineamento Quadrado latino Casualização: Somente uma repetição de cada tratamento aparece em cada bloco; Limitação: O número de tratamentos deve ser igual ao número de repetições. Isso implica na necessidade de grandes áreas e grande volumes de material experimental; Desvantagem: O número de repetições aumentará a medida que o número de tratamentos também aumente; Planejamento e análise de Experimentos 35 Delineamento Quadrado latino Colunas Linhas I II III IV V I D A B C E II C E A B D III E B C D A IV B D E A C V A C D E B Planejamento e análise de Experimentos 36 Esquema fatorial Esquema fatorial não é um delineamento, é apenas um arranjo entre os tratamentos; O arranjo fatorial pode ser conduzido em Delineamento inteiramente casualisado; Blocos ao acaso; Quadrado latino; Outros; Planejamento e análise de Experimentos 38 Esquema fatorial Definições Fator: uma causa de variação conhecida e de interesse do pesquisador (um tipo de tratamento); Nível: subdivisão do fator; Efeito principal: pode-se estudar isoladamente o efeito de cada fator no experimento; Efeito da interação: quando existir, estudar o comportamento de cada fator, na presença ou ausência de níveis dos demais fatores Planejamento e análise de Experimentos 39 Modelo estatístico Esquema Fatorial yijk yijk i j ( )ij IDD ijk onde ij ~ N (0, 2 ) é o valor do i-ésimo tratamento na j-ésima parcela e na k-ésima repetição é a constante geral do modelo (normalmente a média) é o efeito do i-ésimo nível do fator A i é o efeito da j-ésimo nível do fator B j ( )ij ijk é o efeito da interação entre i-ésimo nível do fator A e j-ésimo nível do fator B é o erro experimental entre i-ésimo nível do fator A e j-ésimo nível do fator B na k-ésima repetição. Planejamento e análise de Experimentos 40 Quadro de anova fatorial Fonte TratamentoA GL SQ a 1 SQA QM EMEF QMA 2 2 TratamentoB b 1 SQB QMB AB (a 1)(b 1) SQAB QMAB Erro ab(r 1) SQErro QMErro Planejamento e análise de Experimentos 2 2 i br 2 r 2 br 2 2 r 2 ar 2 a 1 2 j ar r EMEA t 1 ( )ij2 (a 1)(b 1) 2 2 r 2 2 41 Modelo estatístico Delineamento em parcela subdividida IDD yijk i yijk j ij k ik ijk onde ijk 2 ~ N (0, é o valor do i-ésimo tratamento na j-ésima parcela e na k-ésima repetição é a constante geral do modelo (normalmente a média) i j é o efeito do i-ésimo nível do fator A é o efeito da j-ésimo bloco ij é o erro experimental entre i-ésimo nível do fator A e j-ésimo bloco k é o efeito da k-ésimo nível do fator B ik é o efeito da interação entre o i-ésimo nível do fator A e da k-ésimo nível do fator B ijk é o erro experimental entre i-ésimo nível do fator A e j-ésimo bloco e k-ésimo nível do fator B Planejamento e análise de Experimentos 43 ) Anova de split-plot Fonte GL Bloco r 1 A ErroA a 1 (r 1)(a 1) SQ QM 2 SQBloco QMBloco SQA QMA 2 b 1 SQB QMB AB (a 1)(b 1) SQAB QMAB 2 b 2 2 2 SQerrob QMerroB SQtotal Planejamento e análise de Experimentos 2 b SQerroa QMerroa B ErroB a(b 1)(r 1) Total abr 1 EMEF 2 p ab rb b 2 i a 1 2 b 1 ( )ij2 (a 1)(b 1) 2 2 b 2 ab 2 p 2 b 2 rb 2 2 2 j ra r EMEA b 2 ra 2 r 2 2 2 2 44 Experimento Split-plot Quando instalar: Em experimentos fatoriais com dois ou mais fatores; Quando há alguma limitação para instalar o experimento; Facilidade para instalação; Em alguns casos é a única forma de aplicação dos tratamentos às unidades experimentais; Planejamento e análise de Experimentos 45 Experimento em Split-plot Definição: Esse tipo de experimento aloca o fator A em parcelas principais, ou primária, e o fator B nas sub-parcelas, ou secundárias; Cada parcela funciona como um “bloco” para as subparcelas; Se existem mais de dois fatores o experimento é chamado de parcelas sub-divididas e assim por diante; Planejamento e análise de Experimentos 46 Experimento Split-plot Croqui de uma parcela principal de um experimento em Parcelas subdivididas Parcela principal (Fator A) Sub-parcela (Fator B) Planejamento e análise de Experimentos 47 Experimento Split-plot Por exemplo: Experimento com 2 fatores (A e B), cada um com 4 níveis, dispostos em 3 blocos: A = A1; A2; A3; A4 B = B1; B2; B3; B4 BLOCO = I; II; IV Bloco I A1 B4 B1 B3 B2 A3 B1 B3 B4 B2 A4 B1 B3 B2 B4 A2 B2 B1 B3 B4 Planejamento e análise de Experimentos 48 Experimento Split-plot O fator de maior interesse deve ser colocado nas subparcelas quando possível (maior número de graus de liberdade); Caso não seja possível a aplicação dos tratamentos às parcelas principais ou sub-parcelas dependerá da facilidade de instalação do experimento; Planejamento e análise de Experimentos 49 Experimentos em faixas ou Split Block É uma variação dos experimentos em parcelas subdivididas; Os fatores A e B são dispostos em faixas como se fossem parcelas principais; Planejamento e análise de Experimentos 51 Modelo estatístico Delineamento em faixas yijk j yijk i ij k jk ( )ij IDD ijk onde ijk 2 ~ N (0, é o valor do i-ésimo tratamento A e k-ésimo tratamento B no j-ésima bloco é a constante geral do modelo (normalmente a média) é o efeito do j-ésimo bloco j é o efeito da i-ésimo tratamento A i é o erro experimental entre i-ésimo nível do fator A e j-ésimo bloco ij é o efeito da k-ésimo nível do fator B k é o erro experimental entre k-ésimo nível do fator B e j-ésimo bloco jk ( ) ij ijk é o efeito da interação entre o i-ésimo nível do fator A e da k-ésimo nível do fator B é o erro experimental entre i-ésimo nível do fator A e k-ésimo nivel de B no j-ésimo bloco Planejamento e análise de Experimentos 52 ) Experimento Em Faixas CROQUI B4 B2 B3 B1 A2 A1 A3 Planejamento e análise de Experimentos 53 Transformações mais utilizadas Logarítimica: log(x); Raiz quadrada; Raiz cúbica; Angular: arcsen(x), sem(x),...; Hiperbólica de primeiro grau: x=1/x; Hiperbólica de segundo grau; Planejamento e análise de Experimentos 55 Tipos de transformações mais utilizadas A transformação Box-Cox identifica a exata transformação por meio de uma família de transformações de potência de Y. 2 Y' Y2 0,5 0 Y' Y' 0,5 Y' Y 1 Y loge Y (por definição) Planejamento e análise de Experimentos -1,0 Y' 1 Y 56 Tipos de transformações mais utilizadas O procedimento Box-Cox usa o método de máxima verossimilhança para estimar , 0, 1e 2. A função de verossimilhança é dada por: n L( 0, 1, 2 , ) 1 (2 2 n / 2 exp ) 1 2 (Yi 2 0 2 X ) 1 i i 1 Planejamento e análise de Experimentos 57 95% -240 -260 -280 log-Likelihood -220 -200 Função verossimilhança -2 -1 0 Planejamento e análise de Experimentos 1 2 58 Procedimentos para comparações múltiplas Teste de Tukey ou DHS (HSD): q p ,v , QME r Teste de Duncan: q p ,v , p QME r Planejamento e análise de Experimentos 60 Procedimentos para comparações múltiplas Teste Scott-Knott: SQgrupos G1 k1 2 G2 k2 SQmédias v 2 0 2 G3 k3 2 QME r k v 2 2 * 2 0 2 0 Planejamento e análise de Experimentos 61 Procedimentos para comparações múltiplas Um teste pode ter dois parâmetros; Poder do teste: Capacidade do teste em detectar diferenças reais entre os tratamentos. Rigorosidade: Confiança no resultado obtido. Planejamento e análise de Experimentos 62 Procedimentos para comparações múltiplas Erro tipo I por comparação: Probabilidade de se rejeitar uma hipótese verdadeira nas comparações dos tratamentos tomados dois a dois; Erro tipo I por experimento: Probabilidade de se realizar pelo menos uma inferência errada por experimento; Erro tipo III: Probabilidade de se classificar um tratamento superior ao outro quando o segundo supera o primeiro; Planejamento e análise de Experimentos 63 Procedimentos para comparações múltiplas Linhagens Médias 1 14,65 a 2 12,34 ab 3 10,42 b Ambigüidade dos resultados Planejamento e análise de Experimentos 64 Procedimentos para comparações múltiplas Valores médios Procedimentos de comparações múltiplas Trat. Par. Est. Tukey SNK LSD LSDB SK 3 85 80,461 D C E D B 1 85 83,498 D C DE CD B 4 85 86,488 CD C DE CD B 2 85 90,742 CD BC DE CD B 6 95 95,986 CD BC CD BCD B 5 95 96,511 BCD BC CD BCD B 7 105 107,689 ABC AB BC ABC A 8 115 120,436 AB A AB AB A 9 125 123,492 A A A A A 10 125 123,942 A A A A A Planejamento e análise de Experimentos 65 Procedimentos para comparações múltiplas Comparação do teste de Scott-Knott com os demais: Comparações realizadas através de experiemntos com dados simulados; Taxas de erro tipo I sempre abaixo do nível de significância (menores que α); O poder do teste foi duas vezes maiores que os do teste de Duncan, t e SNK, oito vezes mais poderoso que o teste Tukey e semelhante ao t-Bayesiano; Planejamento e análise de Experimentos 66 Novas ferramentas para análise GLM: Modelos Lineares Generalizados; AMMI: Additive main effects and Multiplicative Interaction model; Selegen: Sistemas REML/BLUP de análise via modelos mistos; Planejamento e análise de Experimentos 68 GLM Modelos lineares generalizados; Distribuição Poisson Planejamento e análise de Experimentos 69 AMMI Additive main effects and Multiplicative Interaction model; Interação GxE; Interação em modelos estatísticos com efeitos fixos Planejamento e análise de Experimentos 70 AMMI Interação GxE; Planejamento e análise de Experimentos 71 AMMI Interação em modelos estatísticos com efeitos fixos; Planejamento e análise de Experimentos 72 Sistemas REML/BLUP REML: Máxima verossimilhança restrita; BLUP: Melhor predição linear não viesada; Planejamento e análise de Experimentos 73 Sistemas REML/BLUP Planejamento e análise de Experimentos 74 Sistemas REML/BLUP Safra 1 Safra 2 Planejamento e análise de Experimentos 75 Sistemas REML/BLUP Planejamento e análise de Experimentos 76 Experimento hipotético Para se estudar padrões nutricionais e expressão gênica em híbridos Bt comerciais de milho decidiu-se trabalhar com dois híbridos Bt e suas respectivas isolinhas submetendo-os a três diferentes regimes de controle de lagarta. Para esse experimento definiu-se que seriam usadas 5 repetições. Planejamento e análise de Experimentos 78 DIC Fontes de variação Graus de liberdade Tratamentos 11 Híbridos 3 Tratamentos 2 Hib. x Trat. 6 Erro experimental 48 Total 59 Planejamento e análise de Experimentos 79 DBA Fontes de variação Graus de liberdade Blocos 4 Tratamentos 11 Híbridos 3 Tratamentos 2 Hib. x Trat. 6 Erro experimental 44 Total 59 Planejamento e análise de Experimentos 80 Parcela subdividida Fontes de variação Graus de liberdade Blocos 4 Híbridos 3 Erro a 12 Tratamento 2 Híb. x Trat. 6 Erro b 32 Total 59 Planejamento e análise de Experimentos 81 Parcela subdividida Fontes de variação Graus de liberdade Blocos 4 Tratamento 2 Erro a 8 Híbrido 3 Trat. x Híb. 6 Erro b 36 Total 59 Planejamento e análise de Experimentos 82 Delineamento em faixas Fontes de variação Graus de liberdade Blocos 4 Híbrido 3 Erro a 12 Tratamento 2 Erro b 8 Híb. x Trat. 6 Erro c 24 Total 59 Planejamento e análise de Experimentos 83 Delineamento em faixas Fontes de variação Graus de liberdade Blocos 4 Tratamento 2 Erro a 8 Híbrido 3 Erro b 12 Trat. x Híb. 6 Erro c 24 Total 59 Planejamento e análise de Experimentos 84