Material Regressão Simples

Transcrição

Material Regressão Simples
29/03/2011
Mario de Andrade Lira Junior
lira.pro.br\wordpress
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
TÉCNICAS EXPERIMENTAIS
APLICADAS EM CIÊNCIA DO
SOLO
REGRESSÃO X CORRELAÇÃO
Diferença

Usos
Regressão – estimar valores intermediários aos
realmente estudados durante o experimento
 Correlação – indicar variáveis com comportamento
semelhante

lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Regressão - equação ligando duas ou mais variáveis
 Correlação – medida do grau de ligação entre duas
variáveis

29/03/2011

COEFICIENTE DE CORRELAÇÃO
Análise de variância da regressão
completa
 No computador, cada componente é
testado pelo teste de t

lira.pro.br\wordpress - Reservados todos os
direitos autorais.
o grau de relação linear
entre variáveis
Interpretação
Testes de significância
29/03/2011
Mede
ANÁLISE DE REGRESSÃO
É importante diferenciar entre testes de
“significância” e “importância”


Em modelos de regressão avaliar a importância
científica costuma ser mais importante do que a
significância
Em modelos lineares a importância é
principalmente definida por:
Proporção da variância atribuída ao modelo
◦ O tamanho de um ou mais coeficientes de correlação
◦ Intervalos de confiança de interesse
◦
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Significância – chance de acontecer devido ao acaso
 Importância – quanto a regressão realmente explica

29/03/2011

TIPOS DE REGRESSÃO
Linear

Polinomial
Yij    1 X i   2 X i2 

  n X in   i
Múltiplo
Yij    1 X i   2 Zi   i

Modelos não-lineares
◦ Exponencial
◦ Logarítimico
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Yij     X i   i
29/03/2011

LIMITAÇÕES DOS TIPOS MAIS COMUNS
A linear raramente representa bem toda uma
série de dados

Pode representar bem faixas de valores
Regressões polinomiais não têm interpretação
biológica para os parâmetros
Úteis como simplificação de situação real
 Podem ser usadas para estimar valores com
significado biológico/prático
 Polinomiais cúbicas ou mais complexas raramente
são boas descritoras de fatos biológicos

lira.pro.br\wordpress - Reservados todos os
direitos autorais.

29/03/2011

REQUISITOS DA REGRESSÃO LINEAR

lira.pro.br\wordpress - Reservados todos os
direitos autorais.

Variável independente medida sem erro
O valor esperado de Y é descrito pela função
linear de X
Para cada Xi os Y´s têm resíduos
◦ Independentes
◦ Normalmente distribuídos com média zero
◦ Homocedástico – variância aproximadamente
constante
29/03/2011

FONTES DE VARIAÇÃO
29/03/2011
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Médias - variável independente
 Acaso
Valores ajustados e resíduos
 Valor ajustado - obtido pela equação estimativa
da população
 Resíduo- diferença entre ajustado e real
 Comparação entre resíduo e variável
independente é útil para visualizar ajuste do
modelo

INTERPRETAÇÃO REGRESSÃO LINEAR
Varia de -1 a 1
 Quanto da variação de y é explicada por x


r2 – coeficiente de determinação
Quanto de y é explicado pela regressão
 Varia de 0 a 1

lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Y – variável dependente
 a – y para x =0
 b – quanto y varia para cada x
 r – coeficiente de correlação

29/03/2011
Y  a  bX
INTERPRETAÇÃO
29/03/2011
Triângulos
80
y = 7,8818x + 1,1364
R² = 0,9451
70
60
Quadrados
50
Losangos
y = 5,6909x + 8,4545
R² = 0,9938
40
y = 1,9909x + 2,3182
R² = 0,986
30
20
10
0
0
1
2
3
4
5
6
7
8
9
10
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
90
INTERPRETAÇÃO DE ANÁLISE DO OUTPUT
DO SAS EM UMA REGRESSÃO LINEAR
Analysis of Variance
Mean
DF
Squares
Square
F Value
Pr > F
Model
1
58120
58120
53,45
<,0001
Error
18
19572
1087,32861
19
77692
ANAVA
ANOVA
Corrected
Total
Root MSE
Dependent Mean
Coeff Var
32,97467
R-Square
0,7481
159,31150
Adj R-Sq
0,7341
Síntese
20,69823
Parameter Estimates
Parameter
Standard
Error
Standardized
Variable
DF
Estimate
Intercept
1
83,07500
12,77103
t Value
6,50
<,0001
Pr>|t| Estimate
0
N
1
0,76237
0,10428
7,31
<,0001
0,86492
Parameter Estimates
Variable
DF
95% Confidence Limits
Intercept
1
56,24405
109,90595
N
1
0,54329
0,98144
Estimativa e
significância
Intervalos
confiança
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Sum of
Source
29/03/2011
Model: MODEL1 - Dependent Variable: _800125888
MODELOS NÃO LINEARES
29/03/2011

Processos interativos

Não tem como separar os coeficientes



Os cálculos variam de equação para equação
Sugiro programas especializados (SigmaPlot)
Bons programas gerais como SAS também dão opção
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Bons descritores de fenômenos biológicos
 Uso bem mais complexo
 Freqüentemente derivadas de modelagem mecanicista
 Parâmetros têm significado biológico
 Cálculo

GOMPERTZ

Corrigem para redução do crescimento no tempo
e é a constante neperiana
y(t )  ae
bect
lira.pro.br\wordpress - Reservados todos os
direitos autorais.

29/03/2011
Curva de crescimento com fases inicial e final
lentas
 a é a assíntota do crescimento
 c é a taxa de crescimento
 b e c são constantes negativas

EXEMPLO DE GOMPERTZ
29/03/2011
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
http://en.wikipedia.org/wiki/Gompertz_curve

REGRESSÃO LOGÍSTICA
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Verhultz – crescimento populacional
 Sigmoidal

29/03/2011
Também modelo de crescimento
 Crescimento inicial aproximadamente
exponencial seguido por redução do crescimento
pela competição até estabilização
 Também pode ajudar no estudo de reações
autocatalíticas
 Alguns modelos específicos são

QUEDA EXPONENCIAL

a – pool de elementos
◦ b – taxa de decomposição
◦ e – constante neperiana
◦
y  ae bx  ce  dx

c – pool de elementos de decomposição lenta
◦ d – taxa de decomposição deste segundo pool
◦
lira.pro.br\wordpress - Reservados todos os
direitos autorais.

Modelo básico para decomposição de matéria
orgânica e liberação de nutrientes
Casos típicos queda exponencial simples ou
dupla
y  ae bx
29/03/2011

Dados originais
Queda Exp. Simples
Queda Exp. Dupla
30
Simples
R 2  0,90
20
Dupla
y  5,4971e 0, 0989t  24,5988e 0,0025t
15
10
1
6
11
16
21
26
31
36
41
46
51
56
61
66
71
76
81
86
91
96
101
106
111
116
121
126
131
136
141
146
151
156
161
166
171
176
181
186
191
196
201
206
211
216
221
226
231
R 2  0,98
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
y  27,7139e 0, 0035t
29/03/2011
25
HIPERBÓLICA
Crescimento
y  y0 

ax
b x
Queda
y  y0 
ab
b x
lira.pro.br\wordpress - Reservados todos os
direitos autorais.

29/03/2011
Adequada para casos em que tende a uma
constante
 As constantes também apresentam interpretação
biológica pré-definida
 Dividem-se em dois tipos básicos

CURVAS HIPERBÓLICAS
Hiperbole Retangular Simples, 3 componentes
45
35
y  15,1203 
24,9563x
0,4444  x
30
25
20
y  15,1203 
24,9563  0,4444
0,4444  x
15
0
6
12
18
24
30
36
42
48
54
60
66
72
78
84
90
96
102
108
114
120
126
132
138
144
150
156
162
168
174
180
186
192
198
204
210
216
222
228
10
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
40
29/03/2011
Queda Hiperbólica, 3 partes
LITERATURA RECOMENDADA
Muller e Fetterman Regression and ANOVA. An
integrated approach using SAS software

Mills, J.L. How to torture your data- Artigo no
site
lira.pro.br\wordpress - Reservados todos os
direitos autorais.
Capítulo 2
 Capítulo 4
 Capítulo 5
 Capítulo 11

29/03/2011


Documentos relacionados