Texto Completo em pdf

Transcrição

Texto Completo em pdf
UNIVERSIDADE FEDERAL DA PARAÍBA
CENTRO DE CIÊNCIAS E TECNOLOGIA
CURSO DE PÓS – GRADUAÇÃO EM ENGENHARIA CIVIL
DESAGREGAÇÃO ESPACIAL DA PRECIPITAÇÃO SIMULADA
POR MODELOS ATMOSFÉRICOS NO NORDESTE DO BRASIL
ALESSANDRA MARIA RAMOS
CAMPINA GRANDE – PB
DEZEMBRO – 2000
ALESSANDRA MARIA RAMOS
DESAGREGAÇÃO ESPACIAL DA PRECIPITAÇÃO SIMULADA POR
MODELOS ATMOSFÉRICOS NO NORDESTE DO BRASIL
Dissertação apresentada ao Curso de Pós –
Graduação em Engenharia Civil, na área de
Engenharia de Recursos Hídricos, em
cumprimento às exigências para obtenção
do Grau de Mestre
ÁREA DE CONCENTRAÇÃO: RECURSOS HÍDRICOS
ORIENTADOR: CARLOS OLIVEIRA GALVÃO
Campina Grande – PB
Dezembro – 2000
ALESSANDRA MARIA RAMOS
DESAGREGAÇÃO ESPACIAL DA PRECIPITAÇÃO SIMULADA
POR MODELOS ATMOSFÉRICOS NO NORDESTE DO BRASIL
Aprovada em 12 de Dezembro de 2000
COMISSÃO EXAMINADORA
__________________________________________
Prof. Dr. Carlos de Oliveira Galvão
Orientador
__________________________________________
Dr. José Roberto Gonçalves de Azevedo
Examinador
__________________________________________
Dr Manoel Francisco Gomes Filho
Examinador
i
A meus pais,
Sandra e Hermílio
ii
AGRADECIMENTOS
Aos professores Tarciso Cabral e Alain Passerat, com os quais conheci a área de
Recursos Hídricos e muito aprendi.
Ao professor Heber Pimentel que, com seu convite e entusiasmo, trouxe-me ao
mestrado em Campina Grande.
Ao professor Sérgio Góis, que me acolheu em seu ambiente de trabalho, enquanto
aluna especial.
Aos meus colegas Paula Freire e Dimitri Pinto, com os quais compartilhei dúvidas e
soluções.
A Carlos Galvão, que além de grande orientador, soube ser um amigo essencial
para a minha formação.
Ao professor Manoel Gomes Filho que, sempre prestativo e atencioso, contribuiu
para a minha pesquisa desde o início.
A todos os funcionários, professores e alunos da área de Recursos Hídricos da
UFPB em Campina Grande, que ajudaram direta ou indiretamente no meu trajeto, e pelos
quais adquiri grande carinho.
À minha família e a André Pineli pela compreensão e apoio constantes.
iii
RESUMO
A importância de previsões de longo prazo de precipitação para o gerenciamento
dos recursos hídricos de uma região, e a comprovação da boa previsibilidade de um
modelo de circulação global (MCG) para uma região do Nordeste do Brasil, motivaram o
desenvolvimento desta dissertação. Para o aproveitamento dessas previsões em recursos
hídricos, o problema da diferença de escalas do modelo atmosférico e das bacias
hidrográficas, espacial e temporal, vem sendo solucionado através da utilização de técnicas
de desagregação espacial. Esta dissertação se propôs a, numa bacia hidrográfica do semiárido nordestino, melhorar a desagregação espacial de precipitação sazonal e mensal,
utilizando-se para isto, o método das Redes Neurais Artificiais (RNAs). Constatou-se que a
desagregação da precipitação sazonal na bacia do Rio Piancó apresentou melhoria, em
comparação a um estudo anterior, e que, tanto no nível sazonal quanto no mensal, obtevese altas correlações entre os dados observados e os valores obtidos na modelagem,
indicando que o método utilizado é uma técnica adequada de desagregação.
iv
ABSTRACT
This dissertation was motivated by the importance of long-range precipitation
forecasting for regional water resources management, and by recent research that showed
good precipitation predictability by an Atmospheric General Circulation Model for a
region in north-eastern Brazil. For applying these forecasts in water resources, the problem
of difference of scales, spatial and temporal, between the atmospheric model and the
drainage basins has been dealt with the so-called downscaling techniques. This work aimed
to improve downscaling of seasonal and monthly precipitation, for a drainage basin in the
semiarid north-eastern Brazil, using an Artificial Neural Network (ANN) technique. The
seasonal downscaling was improved in comparison with a previous study for the same
basin and, both in seasonal and monthly time scales, high correlations between modelled
and observed data were obtained, thus indicating that the ANN technique is adequate for
downscaling.
v
SUMÁRIO
DEDICATÓRIA ........................................................................................................................................... i
AGRADECIMENTOS ................................................................................................................................ ii
RESUMO .................................................................................................................................................... iii
ABSTRACT ................................................................................................................................................ iv
SUMÁRIO.................................................................................................................................................... v
LISTA DE TABELAS............................................................................................................................... vii
LISTA DE FIGURAS............................................................................................................................... viii
1. INTRODUÇÃO ............................................................................................................................ 1
2. REVISÃO DE LITERATURA ................................................................................................... 4
2.1. CARACTERIZAÇÃO DO CLIMA DO NORDESTE DO BRASIL ........................................................ 4
2.2. PREVISÃO DE LONGO PRAZO DE PRECIPITAÇÃO ....................................................................... 8
2.3. DESAGREGAÇÃO ESPACIAL DE PRECIPITAÇÃO ...................................................................... 12
2.4. REDES NEURAIS ARTIFICIAIS ................................................................................................. 14
3. METODOLOGIA ...................................................................................................................... 18
3.1. DELIMITAÇÃO DA REGIÃO DE ESTUDO................................................................................... 18
3.2. COLETA DE DADOS PLUVIOMÉTRICOS ................................................................................... 22
3.3. DIAGNÓSTICO DAS RELAÇÕES DA PRECIPITAÇÃO ENTRE AS DUAS ESCALAS ........................ 24
3.4. SELEÇÃO DO MÉTODO DE DESAGREGAÇÃO ........................................................................... 24
3.5. CALIBRAÇÃO E VALIDAÇÃO DOS MODELOS ........................................................................... 25
3.5.1 Regressão Linear Simples................................................................................................ 25
3.5.2 Redes Neurais Artificiais ................................................................................................. 26
4. RESULTADOS........................................................................................................................... 35
4.1. DIAGNÓSTICO DAS RELAÇÕES DA PRECIPITAÇÃO ENTRE AS DUAS ESCALAS ........................ 35
4.1.1. Nível Sazonal .................................................................................................................. 35
4.1.2. Nível Mensal ................................................................................................................... 38
4.2. DESAGREGAÇÃO VIA REGRESSÃO LINEAR ............................................................................ 45
4.2.1. Nível Sazonal .................................................................................................................. 45
4.2.2. Nível Mensal ................................................................................................................... 47
vi
4.3. DESAGREGAÇÃO VIA REDES NEURAIS ARTIFICIAIS .............................................................. 52
4.3.1. Redes Neurais Artificiais como Regressão Linear.......................................................... 52
4.3.2. Pré-processamento dos dados de entrada de uma Rede Neural..................................... 54
4.3.3. Modelagem das Redes Neurais ....................................................................................... 58
4.3.4. Nível Sazonal .................................................................................................................. 58
4.3.5. Nível Mensal ................................................................................................................... 63
4.3.6. Importância da análise gráfica....................................................................................... 79
4.3.7. Ocorrência de Superajustamento.................................................................................... 80
4.3.8. Comentários finais sobre o método de redes neurais ..................................................... 84
4.4. COMPARAÇÃO ENTRE OS MÉTODOS ADOTADOS PARA A DESAGREGAÇÃO ............................ 84
5. CONCLUSÃO E RECOMENDAÇÕES .................................................................................. 86
REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................................... 88
vii
LISTA DE TABELAS
Tabela 3.1 – Postos pluviométricos da bacia do Rio Piancó............................................................ 22
Tabela 3.2 – Postos pluviométricos da célula do MCG sobre a bacia do Rio Piancó...................... 23
Tabela 4.1 - Coeficientes de correlação obtidos entre as séries mensais para os períodos de
1911-88 e 1939-88....................................................................................................... 43
Tabela 4.2 – Coeficientes de correlação obtidos entre séries observadas e calculadas pela
regressão linear ............................................................................................................ 49
Tabela 4.3 – Coeficientes de correlação obtidos nas simulações das estruturas de rede
selecionadas para a verificação da estabilidade do algoritmo de treinamento, para o
nível sazonal ................................................................................................................ 59
Tabela 4.4 – Valores pelos quais as séries mensais foram normalizadas......................................... 63
Tabela 4.5 – Coeficientes de correlação obtidos nas simulações das estruturas de rede
selecionadas, para os meses de fevereiro a maio ......................................................... 63
Tabela 4.6 – Coeficientes de correlação obtidos das redes julgadas mais adequadas para a
desagregação, nos meses de fevereiro a maio.............................................................. 65
Tabela 4.7 – Coeficientes de correlação obtidos entre a precipitação observada da bacia do
Piancó e os resultados da Regressão linear e das Redes Neurais, nos períodos de
treinamento e validação ............................................................................................... 85
viii
LISTA DE FIGURAS
Figura 2.1 – Precipitação anual média ............................................................................................... 5
Figura 2.2 – Distribuição espacial do percentual da precipitação para o quadrimestre chuvoso
(FMAM), em relação ao total anual, sobre a região do semi-árido nordestino........... 6
Figura 2.3 - Sub-regiões climáticas do Nordeste do Brasil ............................................................... 8
Figura 2.4 – Exemplo da estrutura de uma RNA multicamada com três camadas .......................... 15
Figura 2.5 – Rede de Elman ............................................................................................................. 16
Figura 3.1 - Malha do modelo do ECMWF ..................................................................................... 19
Figura 3.2 - Mapas esquemáticos (fora de escala) mostrando a célula do MCG sobre a Bacia do
Rio Piancó, e os respectivos postos pluviométricos .................................................... 19
Figura 3.3 – Comparação entre o total precipitado de março-junho observado e previsto pelo
MCG do ECMWF para a célula sobre a bacia do Piancó............................................ 20
Figura 3.4 – Possibilidades de redução de escala para a região de estudo ....................................... 21
Figura 3.5 – Reta de ajuste da Regressão Linear obtida entre duas variáveis.................................. 25
Figura 3.6 – Fluxograma do processo de treinamento e validação de uma RNA com aprendizado
supervisionado ............................................................................................................. 27
Figura 3.7 – Configuração da rede ................................................................................................... 31
Figura 3.8 – Fluxograma do processo de seleção da rede neural para a desagregação espacial ...... 32
Figura 3.9 – Algoritmo, gráfico e símbolo utilizados pela função TANSIG .................................. 34
Figura 3.10 – Algoritmo, gráfico e símbolo utilizados pela função PURELIN ............................. 34
Figura 4.1 – Séries temporais de precipitação sazonal (fevereiro-maio) da célula e da bacia do
Rio Piancó (1911-88)................................................................................................... 35
Figura 4.2 – Relação entre dados sazonais (fevereiro-maio) de precipitação da célula e da bacia,
para o período de 1911 a 1988..................................................................................... 36
Figura 4.3 – Coeficientes de correlação entre as séries de precipitação sazonal da bacia e da
célula, para uma janela móvel de 30 anos ................................................................... 37
Figura 4.4 – Coeficientes de correlação entre as séries sazonais de precipitação da bacia e da
célula, para uma janela móvel de 30 anos, iniciando entre 1936 e 1941 ..................... 37
Figura 4.5 – Relação entre dados sazonais (fevereiro-maio) de precipitação da célula e da bacia,
para o período de 1939 a 1988..................................................................................... 38
Figura 4.6 – Séries temporais de precipitação da célula e da bacia do Rio Piancó, para os meses
de: a) fevereiro; b) março; c) abril; e d) maio.............................................................. 39
ix
Figura 4.7 – Relação entre dados mensais de precipitação da célula e da bacia, para o período de
1911 a 1988, nos meses de: a) fevereiro; b) março; c) abril; e d) maio....................... 41
Figura 4.8 – Coeficientes de correlação entre as séries mensais de precipitação da bacia e da
célula, para uma janela móvel de 30 anos ................................................................... 42
Figura 4.9 – Coeficientes de correlação entre as séries mensais de precipitação da bacia e da
célula, para uma janela móvel de 30 anos, iniciando entre 1936 e 1941 ..................... 43
Figura 4.10 – Relação entre dados mensais de precipitação da célula e da bacia, para o período
de 1939 a 1988, nos meses de: a) fevereiro; b) março; c) abril; d) maio .................. 44
Figura 4.11 – Calibração do modelo de Regressão Linear entre dados de precipitação sazonal,
para o período de 1939 a 1968 .................................................................................. 45
Figura 4.12 – Validação modelo de Regressão Linear entre dados de precipitação sazonal, para
o período de 1969 a 1988 .......................................................................................... 46
Figura 4.13 – Comparação entre o total precipitado sazonal observado e calculado pelo modelo
de Regressão Linear para a bacia do Piancó ............................................................. 46
Figura 4.14 – Calibração do modelo de Regressão Linear entre dados de precipitação mensal,
para o período de 1939 a 1968, nos meses de: a) fevereiro; b) março; c) abril;
d) maio ...................................................................................................................... 48
Figura 4.15 – Validação do modelo de Regressão Linear entre dados de precipitação mensal,
para o período de 1969 a 1988, nos meses de: a) fevereiro; b) março; c) abril;
d) maio ...................................................................................................................... 49
Figura 4.16 – Comparação entre o total precipitado observado e calculado pelo modelo de
Regressão Linear, para a bacia do Piancó, nos meses de: a) fevereiro; b) março;
c) abril; d) maio........................................................................................................ 50
Figura 4.17 – Configuração da rede composta por neurônios lineares ............................................ 52
Figura 4.18 – Resultados obtidos em 10 simulações de uma rede neural com 5 neurônios
sigmóides na camada escondida e 1 neurônio linear na camada de saída, em totais
precipitados. .............................................................................................................. 56
Figura 4.19 – Relações entre as séries normalizadas sazonais da célula e da bacia, para o
conjunto de dez redes com 4 neurônios na camada escondida, no período de
a) treinamento; e de b) validação .............................................................................. 60
Figura 4.20 – Relações resultantes da Rede 11 entre as séries normalizadas sazonais da célula e
da bacia, no período de a) treinamento; e de b) validação ........................................ 61
Figura 4.21 – Comparação entre as séries normalizadas observada e calculada pela Rede Neural,
para a bacia do Piancó, nos períodos de: a) treinamento e b) validação ................... 62
x
Figura 4.22 – Relações entre as séries normalizadas da célula e da bacia para o conjunto de dez
redes, no período de treinamento (1939-68), referentes aos meses de a) fevereiro;
b) março; c) abril; d) maio ........................................................................................ 67
Figura 4.23 – Relações entre as séries normalizadas da célula e da bacia para o conjunto de dez
redes, no período de validação (1969-88), referentes aos meses de a) fevereiro;
b) março; c) abril; d) maio ....................................................................................... 69
Figura 4.24 – Relações resultantes da Rede 13 entre as séries normalizadas da célula e da bacia,
referentes ao mês de Fevereiro, no período de a) treinamento; e de b) validação .... 71
Figura 4.25 – Relações resultantes da Rede 26 entre as séries normalizadas da célula e da bacia,
referentes ao mês de Março, no período de a) treinamento; e de b) validação ......... 72
Figura 4.26 – Relações resultantes da Rede 14 entre as séries normalizadas da célula e da bacia,
referentes ao mês de Abril, no período de a) treinamento; e de b) validação ........... 73
Figura 4.27 – Relações resultantes da Rede 38 entre as séries normalizadas da célula e da bacia,
referentes ao mês de Maio, no período de a) treinamento; e de b) validação ........... 74
Figura 4.28 – Comparação entre as séries normalizadas observada e calculada pela Rede Neural,
para a bacia do Piancó, no mês de Fevereiro, nos períodos de: a)treinamento e
b)validação ................................................................................................................ 75
Figura 4.29 – Comparação entre as séries normalizadas observada e calculada pela Rede Neural,
para a bacia do Piancó, no mês de Março, nos períodos de: a) treinamento e
b) validação ............................................................................................................... 76
Figura 4.30 – Comparação entre as séries normalizadas observada e calculada pela Rede Neural,
para a bacia do Piancó, no mês de Abril, nos períodos de: a) treinamento e
b) validação ............................................................................................................... 77
Figura 4.31 – Comparação entre as séries normalizadas observada e calculada pela Rede Neural,
para a bacia do Piancó, no mês de Maio, nos períodos de: a) treinamento e
b) validação ............................................................................................................... 78
Figura 4.32 – Relações resultantes da Rede 37 entre as séries normalizadas da célula e da bacia,
referentes ao mês de Maio, no período de a) treinamento; e de b) validação ........... 79
Figura 4.33 – Validação de redes neurais com 9 neurônios na camada escondida
correspondentes a treinamentos que obtiveram coeficientes de correlação de:
a) 0,9846; b) 0,9849; e c) 0,9850 ............................................................................. 80
Figura 4.34 – Fluxograma do processo de treinamento e validação de uma RNA com
aprendizado supervisionado ...................................................................................... 83
CAPÍTULO 1 – INTRODUÇÃO
1
1. INTRODUÇÃO
Nos últimos anos, o aumento da população, a necessidade de alimentos e energia, e
o crescimento da atividade industrial têm aumentado significativamente a demanda de
água, e o atendimento a esta demanda constitui, atualmente, um dos problemas mais
importantes em muitas partes do mundo.
Segundo levantamentos realizados pela Organização Meteorológica Mundial das
Nações Unidas (WMO, 1997 apud Freitas e Santos, 1999), um terço da população mundial
vive em regiões de moderado a alto estresse hídrico, apresentando um nível de consumo
superior a 20% de sua disponibilidade d’água. Neste cenário, o Brasil possui a maior
disponibilidade hídrica do planeta, correspondendo a aproximadamente 14% do deflúvio
médio mundial (Freitas e Santos, 1999). No entanto, de acordo com informações coletadas
pelo PROÁGUA, programa do Governo Federal sob a coordenação da Secretaria de
Recursos Hídricos do Ministério de Meio Ambiente, do percentual de disponibilidade
hídrica detido pelo Brasil, o Nordeste do país possui apenas 3% do total (MMA, 2000).
Acrescendo-se a isto o fato de que se trata da segunda região mais populosa do país,
constata-se então um quadro preocupante, principalmente na região semi-árida nordestina,
que apresenta índices pluviométricos inferiores a 800 mm/ano e elevadas taxas de
evapotranspiração, além de possuir solos rasos sobre embasamento cristalino, que não
favorecem a um aproveitamento de recursos hídricos subterrâneos nesta região, visto que,
em tal caso, a existência de água subterrânea se verifica ou em pequenas manchas
sedimentares ou nas fraturas das rochas, que em sua grande maioria, abrigam águas com
alto teor de salinidade (Costa e Costa, 1997).
Agravando a situação, os mecanismos climáticos que produzem as precipitações do
Nordeste são complexos e, aliados a fatores como a orografia da região e a proximidade do
mar, resultam numa forte variabilidade espaço-temporal das precipitações, que pode gerar
eventos extremos como grandes cheias ou secas devastadoras. Felizmente, hoje já existe a
possibilidade de se prever, com alguma antecedência, as probabilidades de ocorrência dos
CAPÍTULO 1 – INTRODUÇÃO
2
eventos extremos e os períodos em que provavelmente ocorrerão, informações que podem
ser usadas para minimizar os efeitos negativos desses eventos.
Vários estudos têm sido feitos e, apesar de toda a complexidade, os mecanismos
oceânicos e atmosféricos que determinam a maior parte da variabilidade climática nas
regiões tropicais, já estão bem caracterizados, possibilitando a realização nessas regiões,
entre as quais o Nordeste do Brasil (NEB), de previsões de precipitação de longo prazo
(uma semana a alguns meses de antecedência). Esses estudos têm sido motivados pela
observação de que a precipitação no NEB é influenciada pelos eventos El Niño-Oscilação
Sul (ENOS), pelo gradiente de temperatura da superfície do mar (TSM) entre Oceano
Atlântico sul e norte, e pela migração latitudinal da Zona de Convergência Intertropical
(ZCIT) (Uvo, 1998).
A importância de previsões de longo prazo de precipitação para o gerenciamento
dos recursos hídricos da região, e a comprovação da viabilidade de se empregar previsões
fornecidas por modelos de circulação global atmosférica (MCGs) em escalas menores,
como a de uma bacia hidrográfica no Nordeste do Brasil (Galvão, 1999), motivaram o
desenvolvimento desta dissertação. Entre os principais problemas para a efetiva aplicação
da previsão meteorológica em recursos hídricos está a diferença entre a escala para a qual
são realizadas as previsões, e a escala da região onde se deseja empregá-las. Esta questão
tem sido contornada utilizando-se técnicas de transferência da informação meteorológica
para as escalas menores, as chamadas técnicas de downscaling ou desagregação espacial.
Para reduzir o erro associado às previsões, que torna-se maior quando a escala
temporal de interpretação é reduzida, os resultados dos modelos climáticos, normalmente
fornecidos em nível diário, têm sido agrupados em escalas temporais maiores, geralmente
para prever o comportamento da precipitação para a estação chuvosa do ano, denominada
de precipitação sazonal. Por conseguinte, a desagregação também tem sido efetuada em
escalas maiores, como a sazonal. Contudo, é provável que os MCGs também simulem
razoavelmente bem a precipitação mensal. Galvão (1999) mostrou que, no nível sazonal,
para uma região no Nordeste do Brasil, as simulações de precipitação por MCGs e a sua
desagregação para escalas menores têm boa precisão. No entanto, ainda assim o autor
sugere que a desagregação espacial deve ser aprimorada, considerando modelos mais
apropriados que possam levar a uma melhoria das previsões.
Diante dos problemas aqui citados, para uma região do Nordeste brasileiro, os
objetivos desta dissertação são: (i) melhorar a desagregação espacial de precipitação
CAPÍTULO 1 – INTRODUÇÃO
3
sazonal, (ii) realizar a desagregação espacial de precipitação mensal, referente aos meses
da estação chuvosa e (iii) avaliar o comportamento do método de Redes Neurais Artificiais
como técnica de desagregação espacial.
CAPÍTULO 2 – REVISÃO DE LITERATURA
4
2. REVISÃO DE LITERATURA
2.1. CARACTERIZAÇÃO DO CLIMA DO NORDESTE DO BRASIL
A enorme extensão territorial da Região Nordeste (1.540.827 km2), o relevo –
constituído por amplas planícies (baixadas litorâneas), por vales baixos, geralmente
inferiores a 500 m, entre superfícies que se alçam, muitas vezes, a cotas de 800 m na
Borborema, Araripe, Ibiapaba e de 1.200 m na Diamantina – somado à conjugação de
diferentes sistemas de circulação atmosférica, tornam a climatologia desta região uma das
mais complexas do mundo (Nimer, 1989). Esta complexidade se traduz numa grande
variabilidade espacial pluviométrica, com médias anuais que decrescem da costa para o
interior da região (Figura 2.1). No litoral oriental nordestino, áreas possuem precipitação
média anual em torno de 1.500 mm/ano (de Pernambuco a Sergipe, e do Recôncavo
Baiano ao extremo sul da Bahia). No sertão, por sua vez, os índices são inferiores a 1.000
mm/ano, havendo locais (raso da Catarina, Cariri e depressão de Patos, na Paraíba) onde o
índice pluviométrico cai para menos de 500 mm/ano.
A variabilidade espacial da precipitação no NEB delimita três áreas distintas na
região: a zona da mata, o agreste, e o semi-árido. A zona da mata corresponde a uma
estreita faixa costeira que se estende do Rio Grande do Norte ao sul da Bahia, e onde o
clima é tropical quente e úmido e a pluviometria varia de 1.200 a 2.500 mm por ano. O
agreste abrange a região imediatamente a oeste da zona da mata, e é considerado uma área
de transição por apresentar características intermediárias às que estão presentes nas outras
duas regiões delimitadas. O setor que constitui o semi-árido é o mais complexo do NEB,
apresentando
características
que
limitam
seu
potencial
produtivo,
como
a
evapotranspiração elevada, chuvas escassas, e solos rasos com embasamento rochoso
aflorante e alta salinidade.
CAPÍTULO 2 – REVISÃO DE LITERATURA
5
Figura 2.1 – Precipitação anual média (Cadier, 1994)
A maior parte do total pluviométrico anual observado sobre o semi-árido nordestino
concentra-se em quatro meses do ano, fevereiro a maio (FMAM), compreendendo a
estação chuvosa dessa região. Souza et al. (1998) mostraram que, com relação ao total
CAPÍTULO 2 – REVISÃO DE LITERATURA
6
anual, o percentual de precipitação observado no período de FMAM é em torno de 40% a
60% na parte sul do semi-árido nordestino, e de 60% a 85% no setor centro-norte da região
(Figura 2.2). Entre os meses de fevereiro e abril, a Zona de Convergência Intertropical
(ZCIT), que constitui o principal sistema meteorológico indutor de chuvas no semi-árido
nordestino, atinge sua posição mais ao sul, próxima da região, aumentando a instabilidade
atmosférica e ocasionando as chuvas da estação. Esse sistema tem sua origem no encontro
dos ventos alísios provenientes dos hemisférios norte e sul, e sua migração latitudinal e
intensidade são consideradas os principais fatores que ditam o comportamento da estação
chuvosa na região (Roucou et al., 1996). Segundo Uvo (1998), a posição da ZCIT - que é
um dos sistemas que mais interferem na precipitação sobre o Nordeste - é altamente
variável, e é esta variabilidade a causa direta da distribuição espacial e temporal da
precipitação sobre a região. Conforme o referido autor, a posição da ZCIT nos meses de
fevereiro a abril, é determinada por um grupo de fatores que incluem os gradientes de TSM
e de pressão ao nível do mar entre o Atlântico norte e sul, as TSMs sobre o Pacífico
tropical e a Oscilação do Sul. Mostrou-se, ainda, que existem significantes relações
intrasazonais entre as TSMs do Pacífico e do Atlântico e a precipitação do Nordeste.
Figura 2.2 – Distribuição espacial do percentual da
precipitação para o quadrimestre chuvoso (FMAM),
em relação ao total anual, sobre a região do semiárido nordestino (Souza et al., 1998)
CAPÍTULO 2 – REVISÃO DE LITERATURA
7
Além da variabilidade espacial da precipitação, o NEB apresenta uma grande
variabilidade interanual desta, com flutuações atingindo até 40% da média (Uvo et al.,
1998). Em regiões semi-áridas do NEB, estas flutuações acontecem com maior freqüência
e maior intensidade. Cadier (1994) cita a bacia experimental de Sumé, localizada no semiárido paraibano, como exemplo dessa variabilidade: enquanto no ano de 1983 precipitou
apenas um total de 248 mm, em 1985 a precipitação anual foi de 1.438 mm.
A característica mais negativa da precipitação no NEB, no entanto, não reside nos
seus totais, mas na sua irregular distribuição anual, onde se constata, inclusive, uma nítida
variabilidade intrasazonal. De acordo com Kousky (1985), Ramos (1975) observou que um
número pequeno de eventos de precipitação pode ocorrer em poucos dias numa estação
chuvosa, ficando o restante do período sem nenhuma ocorrência de precipitação. Isto se
deve à atuação de diferentes sistemas de precipitação (como a ZCIT, por exemplo) sobre a
região nos meses da estação chuvosa.
Diferentes regimes de precipitação podem ser identificados no NEB. Para fins de
análise climática, a região tem sido dividida em quatro sub-regiões (Galvão, 1999): o norte,
o leste, o sul do NEB e a pré-Amazônia (Figura 2.3). O norte do Nordeste (norte-NEB) é
composto pela região semi-árida dos Estados do Piauí, Ceará, Rio Grande do Norte,
Paraíba, Pernambuco, Alagoas e norte da Bahia. Possui como quadra chuvosa os meses de
fevereiro a maio. É a região que apresenta, no NEB, a maior variabilidade interanual de
precipitação, a maior escassez hídrica, e tem sido a mais estudada climática e
hidrologicamente (Brito et al., 1991; Alves e Repelli, 1992; Alves et al., 1994). A parte
leste do NEB compreende a faixa litorânea dos Estados do Rio Grande do Norte, Paraíba,
Pernambuco, Alagoas, Sergipe e Bahia, equivalendo, aproximadamente, à região da zona
da mata. Possui um regime de chuvas satisfatório, em termos de volume e regularidade,
porém ainda presencia a ocorrência de secas e enchentes em alguns anos. Tem sua estação
chuvosa entre maio e agosto, e apesar de menos estudada do que o norte-NEB, dispõe de
alguns trabalhos realizados sobre a mesma (Rao et al., 1993; Lima e Rao, 1994; Herdies et
al., 1994). O sul do Nordeste (sul-NEB) tem sua precipitação máxima entre novembro e
dezembro e, semelhante à sub-região pré-Amazônia, carece de estudos para uma melhor
compreensão sobre os mecanismos que provocam a variabilidade interanual da
precipitação na sub-região.
CAPÍTULO 2 – REVISÃO DE LITERATURA
8
leste-NEB
norte-NEB
sul-NEB
pré-Amazônia
Figura 2.3 - Sub-regiões climáticas do Nordeste do Brasil (adaptada de Nobre e Molion, 1988)
2.2. PREVISÃO DE LONGO PRAZO DE PRECIPITAÇÃO
A previsão climática de longo prazo é uma estimativa do comportamento médio da
atmosfera com antecedência de um a seis meses, que pode ser produzida em escalas
temporais diferentes, como a diária, mensal ou sazonal. A disponibilização desse tipo de
informação é de grande importância nos dias de hoje, pois pode levar à preparação de
medidas preventivas contra eventos extremos, como cheias e secas. O Nordeste do Brasil
tem recebido considerável atenção de pesquisadores da área de previsão meteorológica
devido a sua grande variabilidade interanual de precipitação (Kousky, 1985), aliada a uma
alta variabilidade espaço-temporal da mesma em cada estação chuvosa (Uvo et al., 1998).
Segundo Brankovic et al. (1994), as regiões tropicais apresentam maior índice de
acerto a nível mundial, quando se trata de previsões sazonais, pois os fatores que
determinam os fenômenos meteorológicos são diretamente influenciados pelas condições à
superfície, tais como a temperatura da superfície do mar (TSM) e a umidade do solo nos
continentes, que variam lentamente no tempo, e hoje já estão razoavelmente
CAPÍTULO 2 – REVISÃO DE LITERATURA
9
caracterizados. De acordo com experimentos do programa de pesquisa sobre
previsibilidade sazonal PROVOST – Prediction of climate variations on seasonal and
interannual timescales, conduzidos por quatro centros de pesquisa europeus, a área sobre o
globo terrestre que possui maior previsibilidade se estende por grande parte do leste do
Brasil – com destaque para o nordeste do país – e atinge a Bacia Amazônica, a Guiana
Francesa, o Suriname, a Guiana e parte do sudeste do Caribe (Evans e Graham, 1999).
Outras regiões, como o leste da África (Brankovic e Palmer, 1998), a Índia (Sperber e
Palmer, 1996) e o Sahel africano (Folland et al., 1991), estreita faixa de terra situada ao sul
do deserto do Saara, também se mostraram áreas de boa capacidade preditiva para
precipitação sazonal.
Uma vasta literatura existente sobre o assunto (Harzallah et al., 1996; Sperber e
Palmer, 1996; Uvo et al., 1998; entre outros) comprova que muito da variabilidade
atmosférica verificada em escala sazonal é originada por anomalias da TSM. A mais
importante fonte de variabilidade relevante da TSM é o El Niño, que consiste no
aquecimento anômalo das águas superficiais do Oceano Pacífico Equatorial. Fenômeno de
escala global, é cíclico porém não possui período regular. Quando ocorre, afeta a
circulação atmosférica e, associado ao fenômeno Oscilação Sul (OS) – mais importante
fenômeno atmosférico de grande escala relacionado à variabilidade interanual nos trópicos,
conforme Kayano e Kousky (1994) – que recebe a denominação de ENOS (El
Niño/Oscilação Sul), determina perturbações no padrão de variabilidade da temperatura do
ar e, principalmente, da precipitação, em diversas regiões do Globo, ocasionando
enchentes em algumas regiões, e chuvas abaixo da média, e até mesmo grandes secas, em
outras. Segundo Alves e Repelli (1992), tal resposta deve-se às características específicas
de cada região, principalmente a sua posição geográfica, seu quadrimestre mais chuvoso e
os principais sistemas atmosféricos responsáveis pelas chuvas sobre as mesmas. No Brasil,
o fenômeno apresenta conseqüências opostas, dada a extensão do território, determinando
excesso de precipitação no sul do país, e a ocorrência de precipitação abaixo da média no
Nordeste brasileiro (Fontana e Berlato, 1997). Kane (1997) mostrou que, para o Nordeste
do país, o El Niño é associado a cerca de 50% dos eventos de seca analisados ocorridos na
região, apesar da precipitação no NEB estar mais fortemente relacionada a anomalias da
TSM do Oceano Atlântico, cujo sistema acoplado oceano-atmosfera tem se mostrado o
principal indutor de chuvas neste local. De acordo com Ward e Folland (1991), os mais
CAPÍTULO 2 – REVISÃO DE LITERATURA
10
importantes preditores para uma previsão sazonal no NEB são obtidos no Oceano
Atlântico.
Recentemente, a capacidade de se prever anomalias da TSM e o entendimento
sobre as conseqüências destas a nível global tiveram uma grande evolução, e isto tem
aumentado o interesse de centros meteorológicos em previsões sazonais. Duas outras
razões também reforçam esse interesse (ECMWF, 2000): o desenvolvimento de um
sistema de observação oceânico relativamente vasto no Pacífico Equatorial, de onde se
obtém temperaturas medidas da superfície a cerca de 500 m de profundidade no Oceano,
além de outros dados fornecidos por satélites europeus, americanos e japoneses, que
podem possibilitar as previsões, como dados de vento, temperatura e umidade do ar. O
segundo fato que estimula a produção de previsões sazonais é o aperfeiçoamento de
modelos numéricos atmosféricos e oceânicos, que são modelos computacionais complexos
que descrevem as condições climáticas da Terra, baseando-se em códigos numéricos de
formas aproximadas das leis físicas que regem os movimentos na atmosfera ou nos
oceanos, e as interações entre a atmosfera e a superfície.
Além da utilização dos modelos numéricos (também chamados “dinâmicos”) para
previsões sazonais, outros métodos já bastante empregados para esse tipo de previsão são
os estatísticos. Eles são baseados em fórmulas estatísticas que relacionam variáveis a
serem previstas com variáveis do estado da atmosfera e dos oceanos. Folland et al. (1991)
e Colman et al. (1998) fizeram uso de dois métodos estatísticos, regressão linear múltipla e
análise discriminante linear, para prever a precipitação no Sahel africano e no Nordeste do
Brasil (respectivamente), usando TSMs como preditores.
Os modelos dinâmicos mais largamente usados para as previsões de longo prazo
são os modelos de circulação global atmosférica (MCGs). Esses MCGs apresentam uma
malha horizontal com resolução de 2 a 4 graus de latitude-longitude, e são divididos
verticalmente em 10 a 30 camadas. Como variáveis de saída, eles fornecem, entre outras,
temperatura do ar, velocidade do vento em várias direções, cobertura de nuvens,
precipitação, umidade do solo, cobertura de neve, radiação solar, pressão e temperatura na
superfície do mar (Becker, 1997). No caso das regiões tropicais, as estações são melhor
definidas como estações secas e úmidas, uma vez que a variação anual da temperatura do
ar é bastante pequena nesta área do globo, o que resulta numa especial atenção para a
precipitação como variável de principal interesse nas previsões, visto que ela define, em
grande parte, o clima, a hidrologia e a biologia de uma região (Uvo, 1998).
CAPÍTULO 2 – REVISÃO DE LITERATURA
11
Devido à baixa resolução horizontal da malha desses MCGs (equivalente a 2 a 5
centenas de quilômetros em regiões tropicais), variáveis relevantes às escalas local (até
alguns milhares de m2) ou da bacia hidrográfica (até cerca de 10 mil km2) são mal
representadas, ou mesmo ignoradas. Este é um dos principais problemas para se realizar a
aplicação da previsão meteorológica em Recursos Hídricos: a diferença entre a escala para
a qual são realizadas as previsões, e a escala da região onde se deseja empregá-las. A baixa
resolução desses modelos deve-se ao poder computacional exigido para a execução dos
mesmos, pois quanto maior a resolução espacial requerida, maior será o tempo de
computação necessário.
Esses MCGs fornecem seus resultados em nível diário, apesar de geralmente não
simularem bem a precipitação nessa escala temporal. Bons resultados da simulação desses
modelos são normalmente associados apenas a previsões sazonais, visto que não se tem
conhecimento de estudos que avaliem o desempenho de MCGs na escala mensal, o que os
tornaria adequados para uso com modelos hidrológicos. O NEB é uma região cuja
precipitação sazonal já está sendo prevista de modo experimental usando esses MCGs
(Cavalcanti et al., 1999; Evans e Graham, 1999).
Os resultados produzidos por um MCG podem ser considerados de natureza
pontual ou espacial. Na hipótese pontual, supõe-se que o MCG simula dados referentes à
localização de cada nó, encontrando respaldo no esquema numérico do modelo, que
baseia-se em métodos que só produzem valores correspondentes a cada ponto da malha. Na
abordagem espacial, os dados gerados nos nós da malha do modelo são tomados como
médias de áreas cujos centros geométricos correspondem aos respectivos nós, encontrando
suporte na concepção e parametrização do modelo, que usa como valores de entrada dados
calculados como médias espaciais. Apesar de não chegarem a um consenso sobre qual é a
natureza dos dados fornecidos pelos MCGs, Skelly e Henderson-Sellers (1996) sugerem
que a abordagem espacial pode ser mais útil e intuitiva em aplicações hidrológicas.
Aliados aos métodos de previsão sazonal descritos anteriormente, prognósticos de
consenso elaborados por meteorologistas das agências de previsão do Nordeste são de
extrema valia e devem ser considerados. Esses prognósticos são baseados na análise
conceitual subjetiva dos técnicos sobre padrões das principais variáveis atmosféricas e
oceânicas em grande escala (Repelli e Alves, 1994), normalmente realizados no mês que
antecede o início da estação chuvosa.
CAPÍTULO 2 – REVISÃO DE LITERATURA
12
Um dos modelos que fornecem atualmente previsões meteorológicas sazonais para
o NEB é o modelo de circulação global atmosférico do European Centre for MediumRange Weather Forecasts – ECMWF, um centro de estudos climáticos da União Européia,
localizado no Reino Unido (Becker, 1997). Os resultados da previsão são fornecidos em
nós de uma malha de resolução de 2,5° × 2,5° de latitude-longitude. Outros modelos, como
o do Centro de Previsão de Tempo e Estudos Climáticos do Instituto Nacional de Pesquisas
Espaciais – CPTEC/INPE (Cavalcanti et al., 1999), e do Hadley Centre for Climate
Prediction and Research do serviço meteorológico britânico (Evans e Graham, 1999),
também já fazem este tipo de previsão para o Nordeste do Brasil.
2.3. DESAGREGAÇÃO ESPACIAL DE PRECIPITAÇÃO
Como ferramentas para produção de previsões sazonais, os MCGs conseguem
representar bem os padrões climáticos de grande escala. Todavia, devido à baixa resolução
do modelo, características locais (acidentes topográficos, linhas de costa, uso do solo,...)
que influenciam o clima numa determinada região podem ser ignoradas, conduzindo a
resultados irreais se aplicadas diretamente em pequena escala. Para solucionar o problema
da diferença entre a escala para a qual são realizadas as previsões, e a escala da região onde
se deseja empregá-las, faz-se uso de técnicas de transferência da informação meteorológica
para as escalas menores, as chamadas técnicas de downscaling ou desagregação espacial
(Wilby et al., 1998). Além da importância destas para as previsões meteorológicas de
longo prazo, essas técnicas são também úteis nas previsões de tempo fornecidas por
modelos dinâmicos semelhantes aos MCGs, que embora possuam uma maior resolução,
ainda precisam ter suas informações desagregadas para as escalas menores, e ainda na
desagregação de cenários decorrentes de possíveis alterações climáticas (como o aumento
do efeito estufa com a emissão de gases e aerossóis), também simulados por MCGs. A
maioria dos modelos que avaliam impactos produzidos por mudanças climáticas operam
numa escala espacial de 1 a 100 km de resolução (mesoescala). Portanto, as informações
sobre possíveis alterações climáticas têm de ser transferidas para a mesma escala de
resolução, a fim de que possam ser usadas como dados de entrada por esses modelos
(Semenov e Barrow, 1997; Schubert, 1998).
CAPÍTULO 2 – REVISÃO DE LITERATURA
13
Duas formas de desagregação espacial podem ser usadas para solucionar o
problema da diferença entre escalas (Hewitson e Crane, 1996): (i) a utilização de métodos
empíricos, que desagregam estatisticamente a previsão meteorológica fornecida pelo MCG
para a escala da bacia; (ii) e através do aninhamento de modelos numéricos semelhantes
aos MCGs, porém com resolução mais fina, utilizando condições iniciais e de contorno
advindos de um MCG.
A desagregação de variáveis meteorológicas através de métodos estatísticos parte
da suposição de que relações empíricas estáveis podem ser estabelecidas entre processos
atmosféricos que ocorrem em escalas espaciais e/ou temporais diferentes (Wilby et al.,
1998). Trata-se de uma abordagem que oferece soluções em curto espaço de tempo, e que
não necessita de grande poder computacional, constituindo uma solução viável para os
pesquisadores da área. A principal limitação desta abordagem é que o modelo de
desagregação fica restrito a uma região e às séries de dados utilizadas.
O segundo método de desagregação de saídas de um MCG para uma resolução
espacial maior, consiste da utilização de aninhamento de modelos numéricos. São modelos
climáticos de mesoescala ou regionais que, inicializados com os resultados de um MCG,
descrevem melhor as condições climáticas de uma região. Esses modelos podem apresentar
ainda a peculiaridade de possuir várias grades de espaçamentos diferentes, que podem ser
aninhadas, proporcionando resultados de alta resolução (Pielke et al., 1992). Essa
metodologia, no entanto, necessita de tempo e grande capacidade computacional para a
execução dos modelos, e ainda possui o agravante de que as simulações dos modelos de
maior resolução podem ser contaminadas por erros nas condições limites simuladas pela
baixa resolução do MCG (Frederick et al., 1997).
Entre os métodos empíricos utilizados como ferramentas de desagregação, os mais
largamente empregados até hoje são os de regressão múltipla (Palutikof et al., 1997;
Schubert, 1998). Nos últimos anos, no entanto, o método das redes neurais artificiais
(RNAs) tem conquistado espaço entre pesquisadores da área, obtendo bons resultados
como um instrumento de desagregação espacial (Cavazos, 1997; Trigo e Palutikof, 1999;
Galvão e Trigo, 1999). Conforme Gardner e Dorling (1998), uma grande vantagem desse
método sobre as demais técnicas estatísticas é o fato dele não precisar de suposições
iniciais sobre a distribuição estatística dos dados. A sua aplicação tem provado ser
particularmente efetiva na desagregação de precipitação, onde há relações não-lineares que
CAPÍTULO 2 – REVISÃO DE LITERATURA
14
técnicas mais tradicionais, como regressão múltipla, não capturam muito bem (Hewitson e
Crane, 1996).
Uma consideração também importante a ser feita na desagregação espacial de
dados de precipitação é a escala temporal da mesma, visto que os MCGs fornecem seus
resultados em nível diário, mas, no entanto, não simulam bem a precipitação nesta escala
temporal. Desejando reduzir o erro associado a essas previsões, antes de serem utilizados,
os resultados são normalmente agrupados em escalas temporais maiores, geralmente em
formato sazonal, e, por conseguinte, a desagregação também tem sido efetuada neste
formato.
2.4. REDES NEURAIS ARTIFICIAIS
Segundo Valença e Ludermir (1999a), as Redes Neurais são sistemas constituídos
por elementos de processamento interconectados, chamados de neurônios, os quais estão
dispostos em camadas (uma camada de entrada, uma ou várias intermediárias e uma de
saída) e são responsáveis pela não-linearidade da rede, através do processamento interno
de certas funções matemáticas.
A rede mais simples existente é conhecida por Perceptron, e foi proposta por
Rosenblatt (1958) apud Hines (1997). Ela é composta de duas camadas, onde os neurônios
da primeira estão conectados ao único neurônio da camada de saída.
O tipo de rede neural que tem estado em maior evidência na comunidade científica
é a rede perceptron multicamadas. Poderosa técnica de regressão (Sarle, 1994), ela é capaz
de modelar funções altamente não-lineares, e após ser treinada, generalizar com grande
precisão. Trata-se de uma rede com uma ou mais camadas intermediárias, em que todos os
neurônios de uma camada se ligam a todos da camada seguinte (Figura 2.4). Entende-se
por generalização a capacidade que uma RNA tem de fornecer respostas adequadas para
dados de entrada que não foram usados na calibração.
Numa rede multicamadas, o valor de saída de cada neurônio é multiplicado por um
peso (w), cujo produto será a entrada para o neurônio da camada seguinte. Em cada
neurônio são somados todos os produtos recebidos, sendo então adicionado ao somatório
uma parcela conhecida por ruído (b). O resultado disto é, em seguida, transformado por
CAPÍTULO 2 – REVISÃO DE LITERATURA
15
uma função de ativação que transmitirá o resultado da transformação aos neurônios da
camada seguinte.
Camada de
entrada
Camada
escondida
Camada de
saída
(w1 × S1) + b2
ƒ
S1
S0
ƒ
ƒ
S2
(w5 ×S2+ w6 ×S3+ w7 ×S4+ w8 ×S5) + b6
S3
S6
ƒ
S4
ƒ
Erro
Saída
Objetivo
S5
ƒ
w pesos
Ajuste dos
pesos
b ruídos
ƒ
função de ativação
“retropropagação” do erro
Figura 2.4 – Exemplo da estrutura de uma RNA multicamada com três camadas
O elemento responsável pela não-linearidade de uma rede neural é a função de
ativação. Ela transforma as informações que chegam num dado neurônio, para serem
utilizadas pelos neurônios da camada seguinte. Há vários tipos de função que podem ser
empregadas numa rede. As mais comuns são a linear, a sigmóide, a gaussiana e a tangente
hiperbólica. Segundo Azoff (1994), pode-se utilizar uma função de ativação diferente para
cada neurônio existente numa rede.
O aprendizado de uma rede, processo que habilita a mesma à realização de novas
tarefas, pode ser realizado de três formas diferentes (Valença e Ludermir, 1999a): através
do estabelecimento de novas conexões na rede, da eliminação de conexões existentes, e da
alteração dos pesos das conexões. Existem duas categorias básicas de aprendizado: o
supervisionado e o não supervisionado. O primeiro consiste da necessidade de um conjunto
de dados de entrada e suas respectivas respostas para que, de posse da diferença entre a
CAPÍTULO 2 – REVISÃO DE LITERATURA
16
resposta desejada e a fornecida pela rede, se possa corrigir os pesos das conexões entre os
neurônios. No aprendizado não supervisionado, a rede requer o conjunto de dados de
entrada sem exigir o conjunto resposta. Ela aprende a detectar regularidades e correlações
em suas entradas, moldando suas futuras respostas àquelas entradas. São as chamadas
redes auto-organizáveis.
A rede multicamada necessita de aprendizado supervisionado, realizado através de
um algoritmo de treinamento que busca o mínimo global através de incrementos nos
valores dos pesos por uma quantidade proporcional à primeira derivada da diferença entre
o valor de saída desejado e o fornecido pela rede, modificando os pesos da rede até reduzir
tal diferença.
Atualmente, existem vários tipos de redes neurais. O que diferencia uma da outra
são as funções de ativação utilizadas, se a rede possui camadas intermediárias ou não,
como são efetuadas as conexões entre os neurônios, e o tipo de aprendizado empregado na
rede.
As redes recorrentes são extensões das redes Perceptron multicamadas, com a
particularidade de apresentar conexões de retorno entre camadas intermediárias ou de saída
e a camada de entrada. As redes de Jordan, Elman (Figura 2.5) e Hopfield são exemplos de
redes recorrentes (Beale e Jackson, 1990; Valença e Ludermir, 1999a).
Camada de
entrada
Camada
escondida
Camada de
saída
Figura 2.5 – Rede de Elman
As redes com função de base (RBF), conforme Valença e Ludermir (1999a),
também podem ser consideradas como redes multicamadas que contém apenas uma
camada intermediária, onde os neurônios dessa usam funções de base ortogonal, e os da
camada de saída empregam a função linear. Essas redes apresentam rápida aprendizagem e
CAPÍTULO 2 – REVISÃO DE LITERATURA
17
facilidade de projeto, porém, em alguns casos, podem necessitar de um número muito
grande de neurônios na camada intermediária, tornando-se preferível a utilização de outras
redes.
As redes auto-organizáveis são aquelas que estão submetidas ao aprendizado não
supervisionado. Dentre estas, merecem destaque a de Kohonen (Caudill, 1997) e as redes
compostas por blocos de sigmóides auto-organizáveis (SSBN) (Valença e Ludermir,
1999a).
Nos últimos anos tem havido um aumento na adoção das RNAs pela comunidade
meteorológica. Elas têm sido utilizadas como técnicas de desagregação espacial,
estabelecendo funções de transferência entre a circulação de grande escala e a precipitação
num dado local (Hewitson e Crane, 1996; Cavazos, 1997). Isto se deve, principalmente, à
capacidade que uma RNA tem de generalizar relações, após ser “treinada” (calibrada)
usando casos observados.
Embora sejam análogas à regressão múltipla, o maior atrativo das RNAs é sua
capacidade de representar qualquer função não-linear. Robinson (1991) promoveu em seu
estudo uma comparação entre regressão múltipla e redes neurais, e apesar desta última ter
se mostrado significativamente melhor do que a primeira, ele chama atenção para alguns
pontos importantes para se obter bons resultados: o primeiro diz respeito à necessidade de
uma quantidade satisfatória de dados (quantidade essa que depende de cada caso
específico), para que a rede seja capaz de identificar a relação existente no problema. O
segundo, refere-se ao tamanho mais adequado para a rede, que deverá conter mais ou
menos neurônios e camadas de acordo com a complexidade do problema. A terceira e
última observação feita é relacionada à utilização de valores padronizados para os
parâmetros de aprendizagem da rede, que podem não ser os mais apropriados para algumas
situações, tornando-se a escolha destes uma questão de experiência e/ou tentativas.
CAPÍTULO 3 - METODOLOGIA
18
3. METODOLOGIA
3.1. DELIMITAÇÃO DA REGIÃO DE ESTUDO
A região escolhida para a aplicação do método de desagregação foi o norte do
Nordeste do Brasil (norte-NEB), que compreende parte dos Estados do Piauí, Ceará, Rio
Grande do Norte, Paraíba, Pernambuco, Alagoas e norte da Bahia. Essa escolha foi
baseada nas seguintes considerações (Galvão, 1999):
− a região apresenta, no NEB, a maior variabilidade interanual de precipitação e
maior escassez hídrica;
− tem sua economia com base no grande número de reservatórios construídos e na
pequena agricultura familiar dependente de chuva;
− tem sido mais estudada climática e hidrologicamente;
− sua precipitação sazonal tem apresentado maior previsibilidade que a das outras
sub-regiões do Nordeste.
Para representar a região escolhida neste estudo, selecionou-se a bacia hidrográfica
do Rio Piancó, limitada pelo posto fluviométrico de mesmo nome. Ela possui uma área de
4.550 km2 e está localizada na porção sudoeste do Estado da Paraíba, entre as latitudes
7°10’S e 7°53’S e longitudes 37°50’W e 38°44’W. Três fatos justificam essa escolha: a
bacia do Rio Piancó apresenta características hidrometerorológicas típicas do norte-NEB;
ela possui uma boa densidade espacial de postos pluviométricos, que fornecem séries
históricas de longa duração e boa qualidade; e ela pode ser considerada de porte médio,
representando bem as bacias contribuintes de reservatórios do Nordeste do Brasil, que
possuem áreas de 200 km2 a 15.000 km2.
Neste trabalho, considerou-se a malha de resolução do modelo do ECMWF como
referência (Figura 3.1), que gera células em regiões tropicais – segundo a abordagem
espacial sugerida por Skelly e Henderson-Sellers (1996), e aqui acatada – de 275 km × 275
km. Entre estas, apenas uma célula contém toda a Bacia do Rio Piancó, se estendendo de
CAPÍTULO 3 - METODOLOGIA
19
6,25°S a 8,75°S e de 36,25°W a 38,75°W, e onde estão incluídas regiões dos Estados do
Ceará, Rio Grande do Norte, Paraíba e Pernambuco (Figura 3.2).
2,5°
2,5°
Figura 3.1 - Malha do modelo do ECMWF
localização da célula do MCG
-39,0
-38,5
-38,0
-37,5
-37,0
-36,5
-6,0
-36,0
-6,5
limite da célula do MCG
-7,0
bacia do Piancó
-7,5
postos da série da célula
postos da série da bacia
-8,0
-8,5
-9,0
Figura 3.2 - Mapas esquemáticos (fora de escala) mostrando a célula do MCG
sobre a Bacia do Rio Piancó, e os respectivos postos pluviométricos
CAPÍTULO 3 - METODOLOGIA
20
A opção pelo modelo do ECMWF como referência se deve ao fato de que Galvão
(1999), buscando verificar a previsibilidade do MCG, comparou valores previstos pelo
modelo – executado nove vezes para produzir o conjunto de previsões para cada estação do
ano, originando nove membros que diferem entre si apenas pelo dia em que o modelo foi
inicializado – com dados observados de precipitação obtidos em postos pluviométricos da
região da célula. Nesta comparação (Figura 3.3), ele observou que as previsões seguiram
bem a tendência de anos secos e chuvosos e, apesar do modelo quase sempre subestimar a
precipitação, obteve altos coeficientes de correlação entre a precipitação observada e a
prevista por cada um dos membros ou a sua média (0,90), o que comprovou a boa
previsibilidade do MCG do ECMWF no nível sazonal nesta região.
precipitação sazonal (mm)
1200
membro 1
membro 2
1000
membro 3
membro 4
800
membro 5
600
membro 6
membro 7
400
membro 8
200
0
1979
membro 9
obs
1980
1981
1982
1983
1984
1985
1986
1987
1988
média
Figura 3.3 – Comparação entre o total precipitado de março-junho observado e previsto
pelo MCG do ECMWF para a célula sobre a bacia do Piancó. A linha ‘média’
corresponde à média dos nove membros e a linha ‘obs’ corresponde à média de
precipitação de 17 postos localizados na célula (Galvão, 1999)
Como já mencionado no Capítulo 2, os MCGs apresentam malhas horizontais com
baixa resolução e, por isso, para se utilizar suas previsões em escalas menores, faz-se
necessário o uso de técnicas que proporcionem a desagregação espacial. A Figura 3.4
ilustra dois níveis de redução de escala possíveis para a região escolhida neste estudo. Os
valores obtidos no nó da malha do MCG poderiam ser desagregados para a escala de bacia,
construindo relações de desagregação com valor oriundo da média de dados de postos
pluviométricos localizados na mesma, ou ao nível de posto pluviométrico, estabelecendo
relações diretamente com cada posto. Neste estudo, abordou-se apenas a desagregação para
a escala de bacia, visto que o tempo imposto para o desenvolvimento da pesquisa não
possibilitaria o estudo para a outra escala e a adequada análise de suas implicações.
CAPÍTULO 3 - METODOLOGIA
21
275 km
Malha do
modelo do
ECMWF
275 km
-6,0
-39,0
-38,5
-38,0
-37,5
-37,0
-36,5
-36,0
-6,5
Célula que está
situada sobre a Bacia
do Rio Piancó
(A ≅ 75000 km2)
-7,0
-7,5
-8,0
Desagregação para
o nível de posto
(A ≅ 10 m2)
-8,5
-9,0
×médio
×
Desagregação para
o nível de bacia
(A ≅ 5000 km2)
Figura 3.4 – Possibilidades de redução de escala para a região de estudo
CAPÍTULO 3 - METODOLOGIA
22
É de suma importância a compreensão de que, neste estudo, não se utilizou o MCG
ou qualquer resultado dele. Fez-se uso apenas de dados observados, com o propósito de
estabelecer relações que possam desagregar, posteriormente, as previsões do MCG para a
escala da bacia hidrográfica. Considerou-se aqui, apenas como referência para a
desagregação, a malha do modelo do ECMWF.
3.2. COLETA DE DADOS PLUVIOMÉTRICOS
Os dados de precipitação que foram utilizados para a calibração e validação do
método de desagregação foram obtidos de Galvão (1999), e originalmente extraídos dos
bancos de dados da Superintendência do Desenvolvimento do Nordeste (SUDENE), do
Departamento Nacional de Águas e Energia Elétrica (DNAEE), da Universidade Federal
da Paraíba (UFPB), e de núcleos estaduais de meteorologia e recursos hídricos da região.
Os postos utilizados para representar a precipitação na bacia (Tabela 3.1 e Figura
3.2) foram selecionados com base na sua distribuição espacial, na extensão da série e na
qualidade dos dados, conforme avaliação realizada por Molinier et al. (1994). Dos nove
postos selecionados, quatro foram implantados em 1911 e cinco em 1933. Como poucos
destes apresentavam dados disponíveis em anos posteriores a 1988, provavelmente devido
a uma crise institucional vivida pela SUDENE, principal responsável na época pela coleta
dos dados, optou-se por se considerar apenas o período de 1911 a 1988 nesta dissertação.
Tabela 3.1 – Postos pluviométricos da bacia do Rio Piancó
CÓDIGO
DNAEE
00738013
00737006
00738017
00738020
00738023
00738022
00738015
00738010
00738014
POSTO
Princesa Isabel
Piancó
Itaporanga
Conceição
Bom Jesus
Bonito de Santa Fé
Manaíra
Serra Grande
Nova Olinda
COORDENADAS / ALTITUDE
INÍCIO DA SÉRIE
7o44’S - 38o01’W / 660 m
7o11’S - 37o57’W / 250 m
7o18’S - 38o10’W / 230 m
7o33’S - 38o31’W / 370 m
7o21’S - 38o22’W / 470 m
7o19’S - 38o31’W / 575 m
7o42’S - 38o10’W / 605 m
7o15’S - 38o19’W / 585 m
7o28’S - 38o03’W / 315 m
1911
1911
1911
1911
1933
1933
1933
1933
1933
CAPÍTULO 3 - METODOLOGIA
23
Galvão (1999) utilizou o método de Thiessen para calcular as precipitações médias
diárias sobre a bacia do Rio Piancó. As falhas não foram preenchidas diretamente, mas
levadas em conta à medida que não foram consideradas na determinação dos polígonos os
postos que as apresentavam.
Os dados de precipitação obtidos para representar o valor gerado pelo MCG na
célula que contém a bacia do Rio Piancó foram retirados da base de dados de Brito et al.
(1991). Considerou-se dezessete postos com séries de longa duração, agrupadas
mensalmente, dois dos quais coincidentes com os da bacia (Tabela 3.2 e Figura 3.2).
Tabela 3.2 – Postos pluviométricos da célula do MCG sobre a bacia do Rio Piancó
CÓDIGO
DNAEE
00636005
00636025
00637004
00637032
00638011
00638033
00736008
00737002
00737006
00737014
00738008
00738017
00738032
00836032
00837003
00837025
00838020
POSTO
Florânia (Flores)
Currais Novos
Caicó
Pombal
Pereiro
Antenor Navarro
Soledade(Ibiapinópolis)
Teixeira
Piancó
Monteiro
Milagres
Itaporanga(Misericórdia)
Triunfo
Pesqueira
Arcoverde (Rio Branco)
Ibimirim (Jeritacó)
Floresta
COORDENADAS /
PERÍODO DA
LOCALIZAÇÃO
ALTITUDE
SÉRIE
1911-1989
6o08’S - 36o49’W / 210 m
RN
1911-1988
6o16’S - 36o31’W / 350 m
RN
1913-1989
6o27’S - 37o06’W / 143 m
RN
1911-1988
6o46’S - 37o49’W / 178 m
PB
1911-1989
6o03’S - 38o28’W / 220 m
CE
1911-1990
6o44’S - 38o27’W / 240 m
PB
1913-1988
7o04’S - 36o22’W / 560 m
PB
1911-1989
7o13’S - 37o16’W / 770 m
PB
1911-1985
7o11’S - 37o57’W / 250 m
PB
1912-1986
7o53’S - 37o07’W / 590 m
PB
1912-1989
7o19’S - 38o57’W / 371 m
CE
1911-1989
7o18’S - 38o10’W / 230 m
PB
1912-1989
7o50’S - 38o07’W / 1010 m
PE
1920-1989
8o22’S - 36o42’W / 650 m
PE
1914-1989
8o26’S - 37o04’W / 663 m
PE
1934-1989
8o23’S - 37o38’W / 445 m
PE
1911-1988
8o36’S - 38o35’W / 317 m
PE
Como Galvão (1999) mostrou que no nível sazonal, para a região da bacia do
Piancó, a desagregação é viável, definiu-se esta escala temporal para o desenvolvimento do
presente estudo. Acreditando-se que os MCGs também simulem razoavelmente bem a
precipitação mensal, e que isto será em breve confirmado em outros estudos, optou-se por
produzir relações de desagregação também na escala mensal. Portanto, objetivando-se
construir essas relações, as médias diárias referentes à bacia foram acumuladas
mensalmente, e depois agrupadas a nível sazonal (fevereiro a maio), procedimento também
adotado para as médias mensais que representam a precipitação da célula.
CAPÍTULO 3 - METODOLOGIA
3.3. DIAGNÓSTICO
24
DAS RELAÇÕES DA PRECIPITAÇÃO ENTRE AS DUAS
ESCALAS
Buscando-se a visualização das relações existentes entre a precipitação da célula e
da bacia nas escalas sazonal e mensal, comparou-se as séries de dados das duas escalas
espaciais, resultantes das médias entre dados dos postos pluviométricos selecionados,
construindo-se gráficos que mostram o comportamento da precipitação em cada escala
temporal.
Para a verificação da estabilidade de relações resultantes entre as séries sazonais da
célula e da bacia, calculou-se coeficientes de correlação entre as duas séries para uma
“janela” de 30 anos, móvel ano a ano sobre todo o período. O mesmo procedimento foi
adotado com relação às séries mensais, calculando-se “janelas” móveis de 30 anos
aplicadas para os meses de fevereiro a maio.
Galvão (1999) mostrou, através do traçado de isoietas na célula sobre a bacia do
Piancó, que o padrão de distribuição espacial da precipitação sazonal, seja para anos secos,
normais ou chuvosos, sempre segue aproximadamente a topografia da região,
caracterizando uma distribuição espacial relativamente bem definida, o que favorece a
desagregação espacial da precipitação na região da bacia do Piancó.
3.4. SELEÇÃO DO MÉTODO DE DESAGREGAÇÃO
Como já mencionado na seção 2.3, nos últimos anos, o método das Redes Neurais
Artificiais (RNAs) tem obtido bons resultados como um instrumento de desagregação
espacial, e tem provado ser particularmente efetivo na desagregação de precipitação, onde
há uma relação não-linear que técnicas convencionais não capturam muito bem. Em
comparação aos modelos dinâmicos com grades aninhadas, apresenta ainda a grande
vantagem de não exigir alto custo computacional para a sua execução. Por tais motivos, o
método das redes neurais artificiais foi julgado apropriado para o desenvolvimento desta
dissertação. Um fato que possibilita a utilização deste método empírico é a existência de
séries de dados de longa duração disponíveis para a modelagem.
CAPÍTULO 3 - METODOLOGIA
25
Com base no estudo de Galvão (1999), no qual verificou que as séries sazonais da
célula e da bacia do Piancó apresentam uma relação aproximadamente linear, recorreu-se
ao método da Regressão Linear Simples para também se realizar a desagregação espacial
da precipitação. O objetivo disto é de comparar e avaliar, posteriormente, a eficiência do
método das Redes Neurais Artificiais.
3.5. CALIBRAÇÃO E VALIDAÇÃO DOS MODELOS
3.5.1 REGRESSÃO LINEAR SIMPLES
A regressão linear simples é um método estatístico que busca estabelecer uma
equação matemática linear que descreva o relacionamento entre duas variáveis. Essa
equação é então utilizada para estimar, ou predizer valores futuros de uma variável quando
se conhece os valores da outra.
Denominada de equação de regressão, ela possui a forma
a variável independente,
aeb
y = ax + b , onde x
são os parâmetros a serem estimados, e
y
é
é a variável
dependente. Essa equação é estimada através do método dos mínimos quadrados, técnica
que define que a reta a ser estabelecida entre pontos que representam a relação entre as
duas variáveis (Figura 3.5) deverá ser aquela que torna mínima a soma dos quadrados das
distâncias da reta aos pontos, medidas na direção da variável dependente ( y ).
y
x
Figura 3.5 – Reta de ajuste da Regressão Linear obtida entre duas variáveis
CAPÍTULO 3 - METODOLOGIA
26
Neste estudo, buscou-se encontrar equações de regressão que possibilitassem a
desagregação espacial da precipitação, onde
MCG na escala da célula, e
y
x
representaria a precipitação prevista pelo
a precipitação correspondente na bacia do Piancó. Para a
modelagem dessa desagregação, adotou-se o procedimento de se dividir cada série de
dados em duas outras: uma para calibrar o modelo e a outra para validá-lo. Na fase de
calibração estimou-se os parâmetros
a
e
b
através do já citado método dos mínimos
quadrados, originando as equações de regressão. Na fase de validação, essas equações
foram verificadas com a utilização do segundo grupo de dados, onde se compara os valores
calculados pela equação de regressão com os dados observados da bacia do Piancó.
Para se verificar o grau de relacionamento entre as duas variáveis de uma equação
de regressão, são feitas análises dos coeficientes de correlação calculados em cada fase da
modelagem. Esse foi o procedimento adotado neste estudo.
Para a modelagem do método de regressão linear foram utilizadas planilhas
eletrônicas do EXCEL (Microsoft, 1997).
3.5.2 REDES NEURAIS ARTIFICIAIS
Para a implementação de uma rede neural artificial (RNA), algumas decisões
devem ser tomadas, tais como a seleção dos dados – se de “treinamento” (expressão
comumente utilizada para designar a calibração de uma rede neural) ou de validação, a
arquitetura da rede, o algoritmo de treinamento e o número de iterações necessárias (Hines,
1997).
O fluxograma apresentado na Figura 3.6 indica os passos que devem ser tomados
para se implementar uma rede neural com aprendizado supervisionado. O primeiro é a
coleta dos dados. Uma vez coletados, eles são divididos em dois grupos: um para treinar e
o outro para validar a rede. Essa seleção deve ser realizada de modo que o primeiro grupo
contenha exemplos dos possíveis casos que possam ocorrer, para que a rede seja capaz de
capturar a relação entrada-saída, fornecendo respostas adequadas para qualquer situação.
Após selecionado o conjunto de dados para o treinamento, deve-se definir a
arquitetura da rede. Esta definição consiste na descrição de quantas camadas essa rede deve
CAPÍTULO 3 - METODOLOGIA
27
ter, o número de neurônios existente em cada uma, a função de ativação escolhida para
cada camada, e como elas são conectadas umas as outras e com as entradas da rede. A
melhor arquitetura para a rede depende do tipo de problema a ser representado. Em geral,
ela deve possuir a estrutura mais simples possível que consiga estabelecer a relação
entrada-saída desejada.
Dados Coletados
Seleção dos Grupos de
Treinamento e Validação
Seleção da Arquitetura da Rede
Neural
Treinamento
Reinicializar Pesos e
Ruídos
ou
Aumento do Tamanho
da RN e/ou Mudança
nas Funções de
Ativação
ou
Alocação de mais dados
para o Treinamento
N
Ajuste
satisfatório?
Nova seleção do Grupo
de Treinamento
ou
Coleta de mais Dados
S
Validação
Ajuste
satisfatório?
N
S
FIM
Figura 3.6 – Fluxograma do processo de treinamento e validação de uma RNA com
aprendizado supervisionado (Hines, 1997)
CAPÍTULO 3 - METODOLOGIA
28
Definida a arquitetura da rede (também chamada de “estrutura”), dá-se início à fase
de treinamento da mesma, buscando-se um ajuste satisfatório entre dados observados e
calculados pela rede.
Segundo Hines (1997), a rede pode não alcançar o resultado desejado devido às
seguintes razões:
− o algoritmo de treinamento converge para um mínimo local;
− a rede não tem o número de graus de liberdade necessário para achar a relação
entrada-saída;
− não há dados suficientes para executar o traçado desejado.
No primeiro caso, a solução seria reinicializar pesos e ruídos, e recomeçar o
treinamento. No segundo, seria adicionar neurônios e/ou camadas, recomeçando o
treinamento em seguida. O último caso necessitaria da alocação de mais dados para o
conjunto de treinamento. Uma das situações que devem ser evitadas durante o treinamento
de uma rede é a ocorrência de um superajustamento (overfitting). Isto acontece quando ela
contém um número elevado de neurônios que faz com que a rede apenas “memorize” os
dados, perdendo sua boa capacidade de generalização.
Após se alcançar um ajuste satisfatório no treinamento, o próximo passo seria a
validação da rede, onde se emprega o conjunto de dados até então não utilizado. Esse
conjunto deve ser uma amostra representativa do problema e, de acordo com Hines (1997),
se um resultado satisfatório não for alcançado será devido ou a uma fraca generalização do
conjunto de treinamento, que deverá ser resolvida com uma nova seleção do grupo, ou a
uma má representatividade do conjunto de validação, indicando que este necessita de
outros dados.
Atingindo-se resultados satisfatórios também na validação, a RNA estará pronta
para ser utilizada, fornecendo respostas adequadas a dados de entrada que ainda não
tenham sido usados, demonstrando a sua capacidade de generalização.
O tipo de rede neural adotado para a desagregação dos dados de precipitação sobre
a bacia do Rio Piancó foi a rede perceptron multicamadas. Essa escolha teve por base a
capacidade que este tipo de rede tem, já mencionada na seção 2.4, de poder generalizar
com precisão.
O aprendizado é do tipo supervisionado, onde foi fornecido como entrada à rede,
um conjunto de dados observados de precipitação em grande escala (representando a célula
CAPÍTULO 3 - METODOLOGIA
29
do MCG), e como a respectiva resposta esperada, um conjunto de dados de precipitação
observados na bacia hidrográfica do Rio Piancó. A diferença entre a resposta desejada e a
fornecida pela rede é reduzida através da utilização de um algoritmo de treinamento,
técnica de otimização projetada para minimizar uma função objetivo, modificando os pesos
da rede até atingir tal fim. Com esse algoritmo, cada exemplo treinado gera um erro de
saída que é usado para ajustar os pesos e ruídos, os quais são iniciados com valores
aleatórios.
O algoritmo de treinamento utilizado na modelagem das redes neurais foi o
algoritmo de Levenberg–Marquardt, um algoritmo de retropropagação (backpropagation),
que ajusta pesos e ruídos modificando-os da camada de saída à camada de entrada.
Segundo Hagan e Menhaj (1994), ele é muito mais eficiente que outras técnicas quando
treina redes que têm até umas poucas centenas de parâmetros (pesos e ruídos), provocando
uma convergência mais rápida e resultados com maior precisão. Em Demuth e Beale
(1998), a comparação do desempenho de vários algoritmos de treinamento em um
determinado problema mostrou que o algoritmo de Levenberg–Marquardt é amplamente
superior aos demais, pois atinge a convergência em menor tempo, com um menor número
de iterações, e com menor número de operações com ponto flutuante. O responsável pela
velocidade e pela precisão com que uma rede converge, atingindo rapidamente um valor
próximo ao mínimo global da função objetivo erro, é um parâmetro que o algoritmo de
Levenberg–Marquardt apresenta. Esse parâmetro é variável no tempo, diminuindo após
cada passo do algoritmo que reduza a função objetivo, e sofrendo acréscimos quando o
algoritmo se afasta do mínimo da função, resultando na redução do erro a cada iteração do
algoritmo de treinamento. A grande desvantagem atribuída a esse algoritmo é a capacidade
computacional exigida por ele, que é bem superior à capacidade necessária à utilização dos
demais algoritmos existentes. Todavia, como o nível de exigência computacional para a
sua utilização não é demasiadamente alto, e previa-se, neste estudo, redes pequenas com
apenas algumas dezenas de neurônios na camada escondida, adotou-se o mesmo como o
algoritmo de treinamento responsável pela redução da diferença entre a resposta desejada e
a fornecida por cada rede projetada, em vista de sua eficiência já comprovada.
Os coeficientes de correlação resultantes entre os dados observados e os fornecidos
pela rede foram adotados como índice indicativo do desempenho do treinamento de cada
rede. O treinamento seria encerrado quando o ganho nesses coeficientes fosse
insignificante. Constatou-se que, em vista da rápida velocidade com que o algoritmo
CAPÍTULO 3 - METODOLOGIA
30
escolhido provoca a convergência de uma rede, todas as redes projetadas convergiram em
algumas dezenas de iterações.
Apesar da possibilidade de se utilizar uma função de ativação diferente para cada
neurônio da rede, geralmente atribui-se uma única função para os neurônios de uma mesma
camada escondida (Hines, 1997). Uma rede multicamada com uma única camada
escondida de neurônios sigmoidais, que recebem entradas diretamente, e então transmitem
suas saídas para uma camada de neurônios lineares, tem provado ser capaz de aproximar
qualquer função contínua com satisfatória exatidão, sendo considerada como aproximador
universal de funções (Hines, 1997; Demuth e Beale, 1998; Valença e Ludermir, 1999a).
Com base nesta indicação, foram projetadas redes com apenas três camadas neste estudo.
A camada de entrada de cada rede não faz processamento, ou seja, não se atribui a ela
funções de ativação. Ela simplesmente envia os dados de entrada, modificados por um
peso, para cada um dos neurônios da próxima camada. A segunda camada, única escondida
em cada rede neural, é composta de neurônios com função de ativação sigmóide; e a
camada de saída é formada por neurônios com função linear.
Para determinar o número de neurônios de uma camada, alguns projetistas
escolhem iniciar com uma rede razoavelmente grande, encontrando com facilidade o ajuste
desejado; então eles extraem neurônios até obter a menor rede que ainda atinja um
resultado satisfatório. Outros projetistas preferem começar com uma rede pequena,
fazendo-a “crescer” até alcançar o ajuste desejado, o que é recomendável uma vez que o
tempo de treinamento aumenta bastante com o tamanho da rede (Valença e Ludermir,
1999b). Este foi o procedimento adotado para a determinação do número de neurônios da
camada escondida de cada rede neural projetada para a desagregação. Os números de
neurônios na camada de entrada e de saída foram determinados pela dimensão dos campos
de entrada e de saída, respectivamente, ou seja, como se deseja relacionar um dado de
precipitação média da célula a um único valor médio da bacia, as camadas de entrada e de
saída foram formadas por apenas um neurônio cada uma. A configuração de rede da Figura
3.7 ilustra o processo de desagregação.
Um dos procedimentos clássicos de validação, conforme Valença e Ludermir
(1999b), é escolher algumas arquiteturas para a rede, realizar o treinamento e fazer a
validação de tal forma que, através de um índice indicativo (erro médio quadrático,
coeficiente de correlação,...), se possa escolher a de melhor ajuste. Este foi o procedimento
adotado neste trabalho, apesar de existirem divergências sobre tal procedimento, uma vez
CAPÍTULO 3 - METODOLOGIA
31
que o grupo de dados destinado para a validação acaba por participar do processo de
seleção da rede, o que vai de encontro à idéia original de validação, que exige dados
independentes e nunca utilizados. Para contornar isso, o que se pode fazer é dividir a série
disponível em três conjuntos de dados. O primeiro seria empregado no treinamento da
rede, o segundo, utilizado para a verificação de acordo com o procedimento aqui descrito,
e o terceiro grupo seria utilizado na validação propriamente dita.
Precipitação média
observada na célula
Camada de
entrada
Precipitação média
observada na bacia
Camada de
saída
X1
Figura 3.7 – Configuração da rede
O fluxograma da Figura 3.8 indica os passos que foram tomados para a escolha da
melhor rede. Dividiu-se a série histórica em dois grupos, realizando-se o treinamento de
várias redes de arquiteturas semelhantes – que diferem apenas pelo número de neurônios
na camada escondida – com o primeiro grupo. Em seguida, efetuou-se a validação de todas
elas com o segundo grupo de dados e, com base nos coeficientes de correlação gerados nas
fases de treinamento e validação, extraiu-se destas um conjunto formado por aquelas que
obtiveram, aparentemente, os melhores desempenhos. Por existir uma sensibilidade dos
algoritmos de treinamento em relação aos pesos e ruídos iniciais, fez-se 10 calibrações para
cada estrutura de rede selecionada, com o objetivo de se verificar a “estabilidade” de cada
estrutura de rede. Entende-se por uma estrutura estável quando, nas redes resultantes das
10 calibrações, o algoritmo de treinamento consegue convergir para uma solução aceitável,
fornecendo coeficientes de correlação semelhantes para todas elas. Aquela rede que
fornecesse o melhor coeficiente de correlação na validação, e que ainda possuísse uma
estrutura estável, seria a mais indicada para a desagregação espacial. No entanto, além
destes
critérios
de
seleção,
considerou-se
ainda
o
princípio
da
parcimônia
CAPÍTULO 3 - METODOLOGIA
32
Seleção dos Grupos de
Treinamento e Validação
Redes com quantidade de
neurônios diferente na
camada escondida
Treinamento
Validação
Seleção das estruturas de redes
que obtiveram os melhores
coeficientes de correlação
10 calibrações para cada
estrutura de rede selecionada
Qual a melhor
estrutura?
Critérios de Seleção
Maior coeficiente de
correlação na Validação
Maior estabilidade nas
10 calibrações
Princípio da parcimônia
Análise gráfica
Rede Neural mais indicada
para a Desagregação Espacial
Figura 3.8 – Fluxograma do processo de seleção da rede neural para a desagregação espacial
CAPÍTULO 3 - METODOLOGIA
33
para a efetiva escolha da melhor rede. Este princípio consiste na representação adequada
do comportamento de um processo ou um sistema por um modelo com o menor número
possível de parâmetros (Tucci, 1998). Isto é, a melhor rede será aquela que contenha o
menor número de neurônios na camada escondida e apresente um desempenho semelhante
às redes com mais neurônios.
A ferramenta utilizada para a implementação da rede neural foi o MATLAB, versão
5.3. Sistema interativo e linguagem de programação para computação técnica e científica
em geral, o MATLAB permite a construção de “bibliotecas” de funções, denominadas de
toolboxes, que o tornam apto a resolver classes particulares de problemas (Hanselman e
Littlefield, 1999). Como essas toolboxes foram escritas usando a linguagem do MATLAB,
isto permite não só o exame de comandos internos de algoritmos que a compõem, como
também a criação de algoritmos novos.
Utilizou-se a toolbox de Redes Neurais do MATLAB neste estudo. Ela possibilita o
uso dos mais variados tipos de redes neurais, permite a modificação de redes já existentes e
a criação de outras desejáveis, e apresenta a enorme vantagem de possibilitar rapidez e
eficácia na implementação e na simulação de uma rede neural.
As funções de ativação TANSIG e PURELIN, implementadas na toolbox de Redes
Neurais, foram utilizadas nas camadas escondida e de saída, respectivamente, neste
trabalho. A função de ativação sigmoidal tangente hiperbólica, denominada TANSIG, é
frequentemente empregada em redes multicamadas. Ela gera saídas no intervalo de –1 a +1
(Figura 3.9), calculando-as de acordo com a equação abaixo, onde n é o somatório dos
produtos das saídas da camada anterior pelos pesos de ligação, e comumente também
acrescido de um ruído.
a = TANSIG (n ) =
2
−1
1 + e −2 n
(
)
Figura 3.9 – Algoritmo, gráfico e símbolo utilizados pela função
TANSIG (Demuth e Beale, 1998)
CAPÍTULO 3 - METODOLOGIA
34
A função PURELIN é uma função de ativação linear também utilizada em redes
multicamadas. É freqüentemente empregada em camadas de saída, pois não restringe os
resultados da rede a intervalos, permitindo que os mesmos assumam qualquer valor (Figura
3.10).
a = PURELIN (n ) = n
Figura 3.10 – Algoritmo, gráfico e símbolo utilizados pela função
PURELIN (Demuth e Beale, 1998)
Uma rede do tipo perceptron multicamadas formada apenas por neurônios lineares
comporta-se como uma equação de regressão. Para demonstrar isso, projetou-se uma rede
com três camadas, sendo as duas últimas compostas de neurônios com a função de ativação
PURELIN.
CAPÍTULO 4 – RESULTADOS
35
4. RESULTADOS
4.1. DIAGNÓSTICO
DAS RELAÇÕES DA PRECIPITAÇÃO ENTRE AS DUAS
ESCALAS
4.1.1. NÍVEL SAZONAL
As séries temporais da célula e da bacia da média dos dados dos postos
pluviométricos selecionados estão mostradas na Figura 4.1. Verificou-se que entre estas
existe uma relação aproximadamente linear (Figura 4.2), com um coeficiente de correlação
de 0,85 para o período de 1911 a 1988.
Bacia
Célula
Média_bacia
Média_célula
1400,0
Precipitação sazonal (mm)
1200,0
1000,0
800,0
600,0
400,0
200,0
1910
1912
1914
1916
1918
1920
1922
1924
1926
1928
1930
1932
1934
1936
1938
1940
1942
1944
1946
1948
1950
1952
1954
1956
1958
1960
1962
1964
1966
1968
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
0,0
Figura 4.1 – Séries temporais de precipitação sazonal (fevereiro-maio) da célula e da bacia
do Rio Piancó (1911-88)
CAPÍTULO 4 – RESULTADOS
36
Precipitação da bacia (mm)
1400
1200
1000
800
600
400
200
R=0,85
0
0
200
400
600
800
1000
1200
1400
P r e c ip ita ç ã o d a c é lu la (m m )
Figura 4.2 – Relação entre dados sazonais (fevereiro-maio) de
precipitação da célula e da bacia, para o período de 1911 a 1988
Apesar da constatação, através da Figura 4.2, de que a relação entre as séries da
célula e da bacia é aproximadamente linear, é nítida a existência de dados bastante
dispersos. Ao se analisar a Figura 4.1, constatou-se que essa dispersão está relacionada,
principalmente, às três primeiras décadas do período analisado. Atribui-se a isto o fato de
cinco dos nove postos selecionados para representar a bacia terem sido instalados em 1933,
atingindo efetiva operação em 1938. Outras possíveis causas seriam os meios e
instrumentos de medição utilizados na época, ou ainda, a ocorrência de mudanças
climáticas. Notou-se também que, além das três primeiras décadas, alguns anos também
mostraram o comportamento da precipitação bem diferente dos demais. Estes anos foram:
1971, 1977, 1978 e 1979. Duas possibilidades são consideradas: ou se trata de anos
realmente anômalos, relacionados a alguma anomalia nos sistemas atmosféricos; ou é o
resultado de falhas em coleta e transcrição de dados. É importante salientar que a anomalia
aqui considerada diz respeito não ao fato de que os totais precipitados desses anos fugiram
ao intervalo esperado, mas refere-se a anos em que a relação entre a precipitação na célula
e na bacia, observada nos outros anos, não foi verificada.
Desejando-se averiguar se a relação entre a precipitação na célula e na bacia é
estável, calculou-se coeficientes de correlação entre as duas séries para uma “janela” de 30
anos, móvel ano a ano sobre todo o período (Figura 4.3). Os problemas detectados também
CAPÍTULO 4 – RESULTADOS
37
foram verificados, visto que os coeficientes passaram a ser menores ou maiores à medida
que alguns dos anos mencionados eram incluídos ou excluídos da janela. Isto é
comprovado ao se observar os coeficientes das janelas que tiveram início nos anos 1936 a
1941 (Figura 4.4), períodos em que as três primeiras décadas e os anos citados não estão
inclusos, constatando-se que, para estes períodos, a relação bacia × célula é bastante
estável.
R 1,00
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
1910
1920
1930
1940
1950
1960
Início do Período
Figura 4.3 – Coeficientes de correlação entre as séries de precipitação
sazonal da bacia e da célula, para uma janela móvel de 30 anos
Coef. de Correlação
1,00
0,95
0,90
0,85
0,80
1935
1936
1937
1938
1939
1940
1941
1942
Início do Período
Figura 4.4 – Coeficientes de correlação entre as séries sazonais de precipitação da
bacia e da célula, para uma janela móvel de 30 anos, iniciando entre 1936 e 1941
CAPÍTULO 4 – RESULTADOS
38
Visando aumentar a estabilidade da relação das precipitações entre as duas escalas,
as três primeiras décadas das séries foram descartadas, utilizando-se apenas o período de
1939 a 1988 (Figura 4.5) para a obtenção da relação de desagregação. Após investigar-se
os anos anômalos detectados, conferindo-se os dados originais e as operações realizadas
entre estes, não se descobriu nada que os invalidasse e, portanto, optou-se por considerálos corretos nesta pesquisa. O coeficiente de correlação linear encontrado para o período de
Precipitação da bacia (mm)
1939 a 1988 foi de 0,90.
1200,0
1000,0
800,0
600,0
400,0
200,0
R=0,90
0,0
0,0
200,0
400,0
600,0
800,0
1000,0
1200,0
Precipitação da célula (mm)
Figura 4.5 – Relação entre dados sazonais (fevereiro-maio) de
precipitação da célula e da bacia, para o período de 1939 a 1988
4.1.2. NÍVEL MENSAL
O mesmo procedimento foi adotado para a análise das séries de precipitação que se
referem aos meses da quadra chuvosa da bacia do Piancó (Figura 4.6), séries essas também
oriundas de médias entre os postos pluviométricos selecionados. Elas também
apresentaram uma relação aproximadamente linear entre dados da célula e da bacia (Figura
CAPÍTULO 4 – RESULTADOS
39
4.7). Os coeficientes de correlação obtidos entre essas séries mensais, para o período de
1911 a 1988, estão expostos na Figura 4.7 e na Tabela 4.1.
700,0
Bacia
Célula
Média_bacia
Média_célula
Precipitação mensal (mm)
600,0
500,0
400,0
300,0
200,0
100,0
1910
1912
1914
1916
1918
1920
1922
1924
1926
1928
1930
1932
1934
1936
1938
1940
1942
1944
1946
1948
1950
1952
1954
1956
1958
1960
1962
1964
1966
1968
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
0,0
a) fevereiro
700,0
Bacia
Célula
Média_bacia
Média_célula
Precipitação mensal (mm)
600,0
500,0
400,0
300,0
200,0
100,0
1910
1912
1914
1916
1918
1920
1922
1924
1926
1928
1930
1932
1934
1936
1938
1940
1942
1944
1946
1948
1950
1952
1954
1956
1958
1960
1962
1964
1966
1968
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
0,0
b) março
Figura 4.6 – Séries temporais de precipitação da célula e da bacia do Rio Piancó,
para os meses de: a) fevereiro; b) março; c) abril; e d) maio
1910
1912
1914
1916
1918
1920
1922
1924
1926
1928
1930
1932
1934
1936
1938
1940
1942
1944
1946
1948
1950
1952
1954
1956
1958
1960
1962
1964
1966
1968
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
Precipitação mensal (mm)
1910
1912
1914
1916
1918
1920
1922
1924
1926
1928
1930
1932
1934
1936
1938
1940
1942
1944
1946
1948
1950
1952
1954
1956
1958
1960
1962
1964
1966
1968
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
Precipitação mensal (mm)
CAPÍTULO 4 – RESULTADOS
40
500,0
450,0
Bacia
Bacia
Célula
Célula
Média_bacia
Média_bacia
Média_célula
400,0
350,0
300,0
250,0
200,0
150,0
100,0
50,0
0,0
c) abril
300,0
250,0
Média_célula
200,0
150,0
100,0
50,0
0,0
d) maio
Figura 4.6 – Séries temporais de precipitação da célula e da bacia do Rio Piancó,
para os meses de: a) fevereiro; b) março; c) abril; e d) maio (continuação)
41
500
450
400
350
300
250
200
150
100
R=0,80
Precipitação da bacia (mm)
Precipitação da bacia (mm)
CAPÍTULO 4 – RESULTADOS
550
500
450
400
350
300
250
200
150
100
R=0,86
50
50
0
0
0
50
0
100 150 200 250 300 350 400 450 500
50 100 150 200 250 300 350 400 450 500 550
Precipitação da célula (mm)
Precipitação da célula (m m )
b) março
Precipitação da bacia (mm)
Precipitação da bacia (mm)
a) fevereiro
500
450
400
350
300
250
200
150
100
250
200
150
100
50
R=0,85
R=0,81
50
0
0
0
50
100 150 200 250 300 350 400 450 500
Precipitação da célula (m m )
c) abril
0
50
100
150
200
250
Precipitação da célula (m m )
d) maio
Figura 4.7 – Relação entre dados mensais de precipitação da célula e da bacia, para o
período de 1911 a 1988, nos meses de: a) fevereiro; b) março; c) abril; e d) maio
Objetivando verificar se a relação existente entre os dados da célula e da bacia é
estável para cada mês, calculou-se coeficientes de correlação para janelas móveis de 30
anos (Figura 4.8). Da mesma forma que para a escala sazonal, detectou-se problemas nas
três primeiras décadas e nos anos de 1971, 1977, 1978 e 1979. Isto pode ser verificado
também ao se observar o comportamento dos coeficientes das janelas que tiveram início
CAPÍTULO 4 – RESULTADOS
42
nos anos 1936 a 1941 (Figura 4.9), períodos em que as três primeiras décadas, e os meses
que integram os anos citados, não estão inclusos.
1,00
0,95
Coef. de Correlação
0,90
0,85
Fevereiro
Março
Abril
Maio
0,80
0,75
0,70
0,65
0,60
1910
1915
1920
1925
1930
1935
1940
1945
1950
1955
1960
Início do Período
Figura 4.8 – Coeficientes de correlação entre as séries mensais de precipitação da bacia e
da célula, para uma janela móvel de 30 anos
Para o mês de fevereiro, verificou-se que grandes distorções entre os dados da bacia
e os da célula ocorreram nos anos de 1971 e 1977. O mês de março apresentou a maior
distorção no ano de 1979, e o mês de abril se destacou em 1971 e 1979. Considerou-se
como “grandes distorções” quando a diferença entre dados mensais da célula e da bacia
atingiu 60% da média dos dados da célula. Nesse contexto, o mês de maio não apresentou
diferenças significativas entre os seus dados.
CAPÍTULO 4 – RESULTADOS
43
Coef. de Correlação
1,00
0,95
Fevereiro
Março
Abril
Maio
0,90
0,85
0,80
1935 1936 1937 1938 1939 1940 1941 1942
Início do Período
Figura 4.9 – Coeficientes de correlação entre as séries mensais de precipitação da bacia e
da célula, para uma janela móvel de 30 anos, iniciando entre 1936 e 1941
Semelhante às conclusões resultantes da análise feita para o nível sazonal, optou-se
também por descartar as três primeiras décadas das séries mensais, visando aumentar a
estabilidade das relações entre as escalas. Os meses “anômalos” também foram
considerados corretos, uma vez que foram investigados e não se achou nada que os
invalidasse.
Os coeficientes de correlação encontrados entre as séries mensais do período de
1939 a 1988 (Figura 4.10) estão expostos na Tabela 4.1.
Tabela 4.1 - Coeficientes de correlação obtidos entre as séries mensais para os
períodos de 1911-88 e 1939-88
Período
da Série
Coeficiente de Correlação
Fevereiro
Março
Abril
Maio
1911-88
0,80
0,86
0,81
0,85
1939-88
0,85
0,90
0,92
0,90
44
400,0
Precipitação da bacia (mm)
Precipitação da bacia (mm)
CAPÍTULO 4 – RESULTADOS
350,0
300,0
250,0
200,0
150,0
100,0
R=0,85
50,0
0,0
0,0
100,0
200,0
300,0
550,0
500,0
450,0
400,0
350,0
300,0
250,0
200,0
150,0
100,0
50,0
0,0
400,0
R=0,90
0,0
Precipitação da célula (m m )
Pre cipitação da célula (m m )
b) março
400,0
Precipitação da bacia (mm)
Precipitação da bacia (mm)
a) fevereiro
350,0
300,0
250,0
200,0
150,0
100,0
R=0,92
50,0
0,0
0,0
100,0
200,0
100,0 200,0 300,0 400,0 500,0
300,0
400,0
Precipitação da célula (m m )
250,0
200,0
150,0
100,0
50,0
R=0,90
0,0
0,0
50,0 100,0 150,0 200,0 250,0
Precipitação da cé lula (m m )
c) abril
d) maio
Figura 4.10 – Relação entre dados mensais de precipitação da célula e da bacia, para o
período de 1939 a 1988, nos meses de: a) fevereiro; b) março; c) abril; d) maio
Ao fim da etapa de diagnóstico, observou-se que os dados de precipitação sazonal e
mensal nas escalas espaciais do modelo de circulação global e da bacia do Piancó
apresentam uma relação aproximadamente linear, com altas correlações, o que torna
possível a realização da transferência da previsão entre as duas escalas, sem perdas
significativas de previsibilidade, pelo menos na região estudada.
CAPÍTULO 4 – RESULTADOS
45
4.2. DESAGREGAÇÃO VIA REGRESSÃO LINEAR
Definiu-se o período de 1939 a 1968 para a calibração dos dois métodos, e o
período de 1969 a 1988 para a validação dos mesmos. Esta definição foi arbitrária,
considerando-se apenas um grupo maior de dados para a calibração.
4.2.1. NÍVEL SAZONAL
Na calibração do modelo para a escala temporal sazonal (Figura 4.11), obteve-se a
seguinte equação de regressão
Pb = 1,134 Pc − 38,686
(4.1)
onde Pc é o total sazonal precipitado na célula e Pb a precipitação correspondente na bacia,
em mm.
O coeficiente de correlação obtido no período de calibração foi de 0,95.
Precipitação da bacia (mm)
1200,0
1000,0
800,0
600,0
400,0
200,0
0,95
0,0
0,0
200,0
400,0
600,0
800,0
1000,0
1200,0
Precipitação da célula (mm)
Figura 4.11 – Calibração do modelo de Regressão Linear entre dados
de precipitação sazonal, para o período de 1939 a 1968
CAPÍTULO 4 – RESULTADOS
46
Para a validação do ajuste (Figura 4.12), o coeficiente de correlação encontrado
entre os dados observados da bacia e os valores obtidos da equação de regressão foi de
0,86. Esta queda no coeficiente de correlação se deve, especialmente, aos anos
identificados como anômalos (1971, 1977, 1978 e 1979). Isso pode ser também observado
na Figura 4.13, que apresenta a relação entre os dados observados e os calculados pela
equação para todo o período (1939-88).
1200,0
Precipitação da bacia (mm)
1971
1000,0
1977
800,0
1979
600,0
1978
400,0
200,0
0,86
0,0
0,0
200,0
400,0
600,0
800,0
1000,0
1200,0
Precipitação da célula (mm)
Figura 4.12 – Validação modelo de Regressão Linear entre dados
de precipitação sazonal, para o período de 1969 a 1988
1600,0
Precipitação da bacia (mm)
calibração
validação
1400,0
observada
1200,0
calculada
1000,0
800,0
600,0
400,0
200,0
1987
1985
1983
1981
1979
1977
1975
1973
1971
1969
1967
1965
1963
1961
1959
1957
1955
1953
1951
1949
1947
1945
1943
1941
1939
0,0
Figura 4.13 – Comparação entre o total precipitado sazonal observado e calculado pelo
modelo de Regressão Linear para a bacia do Piancó
CAPÍTULO 4 – RESULTADOS
47
4.2.2. NÍVEL MENSAL
Na calibração dos modelos de regressão para os meses de Fevereiro a Maio (Figura
4.14), as equações obtidas para cada mês foram as seguintes:
Fevereiro:
Pb = 1,111Pc + 9,443
(4.2)
Março:
Pb = 1,214 Pc − 16,243
(4.3)
Abril:
Pb = 1,065Pc − 9,554
(4.4)
Maio:
Pb = 0,957 Pc − 12,807
(4.5)
onde Pc é o total mensal precipitado na célula e Pb a precipitação correspondente na bacia,
em mm.
Efetuou-se a validação das equações de ajuste, e novamente verificou-se a queda
dos coeficientes de correlação devido aos dados dos denominados anos anômalos, como se
pode ver na Figura 4.15. Excluiu-se das séries os anos que apresentaram anomalia
(indicados na Figura 4.15), para a verificação da influência desses no comportamento dos
coeficientes de correlação. Constatou-se que, para os meses de fevereiro, março e abril, os
coeficientes apresentariam um aumento significativo. O mês de fevereiro, que apresentou
um coeficiente de 0,83, passaria a ter um de 0,96, março que é de 0,73, subiria para 0,85, e
o mês de abril passaria de 0,93 a 0,96.
48
300,0
Precipitação da bacia (mm)
Precipitação da bacia (mm)
CAPÍTULO 4 – RESULTADOS
250,0
200,0
150,0
100,0
50,0
R=0,87
0,0
0,0
550,0
500,0
450,0
400,0
350,0
300,0
250,0
200,0
150,0
100,0
50,0
0,0
R=0,95
0,0 100,0 200,0 300,0 400,0 500,0
100,0
200,0
300,0
Precipitação da célula (mm)
Precipitação da célula (m m )
b) março
400,0
Precipitação da bacia (mm)
Precipitação da bacia (mm)
a) fevereiro
350,0
300,0
250,0
200,0
150,0
100,0
R=0,92
50,0
0,0
300,0
250,0
200,0
150,0
100,0
50,0
R=0,92
0,0
0,0
100,0
200,0
300,0
400,0
Precipitação da célula (m m )
c) abril
0,0
100,0
200,0
300,0
Precipitação da célula (mm)
d) maio
Figura 4.14 – Calibração do modelo de Regressão Linear entre dados de precipitação mensal, para
o período de 1939 a 1968, nos meses de: a) fevereiro; b) março; c) abril; d) maio
Os coeficientes encontrados entre as séries nos períodos de calibração e de
validação estão expostos na Tabela 4.2. A Figura 4.16 apresenta a relação resultante entre
os dados observados e calculados pelas equações de regressão, para cada mês, em todo o
período (1939-88).
CAPÍTULO 4 – RESULTADOS
49
Precipitação da bacia (mm)
Precipitação da bacia (mm)
400,0
1971
300,0
1977
200,0
1978
100,0
400,0
300,0
1979
1977
200,0
1978
100,0
R=0,73
R=0,83
0,0
0,0
0,0
0,0
100,0
200,0
300,0
400,0
Precipitação da célula (mm)
300,0
400,0
b) março
Precipitação da bacia (mm)
Precipitação da bacia (mm)
200,0
Precipitação da célula (mm)
a) fevereiro
400,0
100,0
1971
300,0
1979
200,0
100,0
200,0
1977
150,0
100,0
50,0
R=0,93
R=0,86
0,0
0,0
0,0
100,0
200,0
300,0
400,0
0,0
Precipitação da célula (mm)
50,0
100,0
150,0
200,0
Precipitação da célula (mm)
d) maio
c) abril
Figura 4.15 – Validação do modelo de Regressão Linear entre dados de precipitação mensal, para
o período de 1969 a 1988, nos meses de: a) fevereiro; b) março; c) abril; d) maio
Tabela 4.2 – Coeficientes de correlação obtidos entre séries
observadas e calculadas pela regressão linear
Escala temporal
Calibração
Validação
Sazonal
Fevereiro
Março
Mensal
Abril
Maio
0,95
0,87
0,95
0,92
0,92
0,86
0,83
0,73
0,93
0,86
CAPÍTULO 4 – RESULTADOS
50
450,0
Precipitação da bacia (mm)
calibração
validação
400,0
observada
350,0
calculada
300,0
250,0
200,0
150,0
100,0
50,0
1985
1987
1987
1983
1985
1981
1979
1977
1975
1973
1971
1969
1967
1965
1963
1961
1959
1957
1955
1953
1951
1949
1947
1945
1943
1941
1939
0,0
a) Fevereiro
800,0
Precipitação da bacia (mm)
calibração
validação
700,0
observada
600,0
calculada
500,0
400,0
300,0
200,0
100,0
1983
1981
1979
1977
1975
1973
1971
1969
1967
1965
1963
1961
1959
1957
1955
1953
1951
1949
1947
1945
1943
1941
1939
0,0
b) Março
Figura 4.16 – Comparação entre o total precipitado observado e calculado pelo modelo de
Regressão Linear, para a bacia do Piancó, nos meses de: a) fevereiro; b) março; c) abril;
d) maio
CAPÍTULO 4 – RESULTADOS
51
450,0
calibração
validação
Precipitação da bacia (mm)
400,0
observada
350,0
calculada
300,0
250,0
200,0
150,0
100,0
50,0
1987
1985
1983
1981
1979
1977
1975
1973
1971
1969
1967
1965
1963
1961
1959
1957
1955
1953
1951
1949
1947
1945
1943
1941
1939
0,0
c) Abril
400,0
calibração
validação
Precipitação da bacia (mm)
350,0
300,0
observada
250,0
calculada
200,0
150,0
100,0
50,0
0,0
1987
1985
1983
1981
1979
1977
1975
1973
1971
1969
1967
1965
1963
1961
1959
1957
1955
1953
1951
1949
1947
1945
1943
1941
1939
-50,0
d) Maio
Figura 4.16 – Comparação entre o total precipitado observado e calculado pelo modelo de
Regressão Linear, para a bacia do Piancó, nos meses de: a) fevereiro; b) março; c) abril;
d) maio (continuação)
CAPÍTULO 4 – RESULTADOS
52
4.3. DESAGREGAÇÃO VIA REDES NEURAIS ARTIFICIAIS
4.3.1. REDES NEURAIS ARTIFICIAIS COMO REGRESSÃO LINEAR
Objetivando-se confirmar que uma rede neural formada apenas por neurônios
lineares se comporta como uma equação de regressão, projetou-se uma rede com três
camadas (Figura 4.17), onde a camada escondida é composta de dois neurônios PURELIN.
Forneceu-se como dados de entrada e de saída, as séries sazonais de precipitação da célula
e da bacia, respectivamente.
Precipitação média
observada na célula
Precipitação média
observada na bacia
b1
w1 × P
/
P’
w3 × P’
P
b3
/
w2 × P
b2
/
Pb
w4 × P”
P”
Figura 4.17 – Configuração da rede composta por neurônios lineares
As operações que devem ser efetuadas para se obter a equação que representa a
rede neural são:
P′ = w1 × P + b1
(4.6)
P ′′ = w2 × P + b2
(4.7)
Pb = w3 × P ′ + w4 × P ′′ + b3
(4.8)
CAPÍTULO 4 – RESULTADOS
53
onde:
P é a precipitação média observada na célula;
w1 , w2 , w3 e w4 são os pesos da rede;
b1 , b2 , e b3 são os ruídos inseridos nos três neurônios lineares;
P ′ corresponde à saída do primeiro neurônio linear da camada escondida;
P ′′ corresponde à saída do segundo neurônio linear da camada escondida;
Pb é a precipitação média a ser calculada para a bacia.
Substituindo as equações (4.6) e (4.7) na equação (4.8), obtém-se:
Pb = w3 × (w1 × P + b1 ) + w4 × (w2 × P + b2 ) + b3
⇒
Pb = w3 w1 P + w3b1 + w4 w2 P + w4b2 + b3
⇒
Pb = (w3 w1 + w4 w2 )P + (w3b1 + w4b2 + b3 )
(4.9)
Como todos os elementos que estão inseridos entre os parênteses da equação (4.9)
possuem valores constantes numa rede neural, pode-se igualar cada membro contido em
parêntese a uma única constante.
w3 w1 + w4 w2 = a
(4.10)
w3b1 + w4b2 + b3 = c
(4.11)
Substituindo as equações (4.10) e (4.11) na equação (4.9), obtém-se como a
equação que representa a rede neural:
Pb = a × P + c
(4.12)
mostrando que uma rede do tipo perceptron multicamadas formada por neurônios
lineares comporta-se como uma equação de regressão.
CAPÍTULO 4 – RESULTADOS
54
Utilizando-se as séries de precipitação coletadas para esta pesquisa, a matriz dos
pesos e ruídos resultante do treinamento (calibração) da rede é:
Pesos_e_ruídos =
-0,8404
0,7345
-3,0606
-5,1750
3,1113
5,1032
-2,7586
w1
w2
b1
b2
w3
w4
b3
Aplicando estes valores na equação (4.9), obteve-se a seguinte equação:
Pb = 1,1336P − 38,6901
(4.13)
Comparando a equação (4.13) com a equação de ajuste (4.1) resultante da regressão
linear (seção 4.1), observa-se que elas são realmente semelhantes, mostrando que o
algoritmo de treinamento da rede obteve valores dos parâmetros compatíveis com os
obtidos pelo método dos mínimos quadrados na regressão linear.
4.3.2. PRÉ-PROCESSAMENTO
NEURAL
DOS DADOS DE ENTRADA DE UMA
REDE
Antes de se iniciar a modelagem de um sistema qualquer através do método de
redes neurais, vários estudos sugerem que se efetue o pré-processamento ou normalização
dos dados de entrada da rede (Lawrence, 1991; Azoff, 1994; Gately, 1996; entre outros).
Segundo Eklund (1994), trata-se de um processo em que se converte um conjunto de dados
a um intervalo menor do que o original, tornando mais fácil o treinamento da rede,
facilitando sua convergência. O autor afirma ainda que a normalização não só melhora o
desempenho de uma rede neural, como reduz o seu tamanho, mostrando, inclusive, que
CAPÍTULO 4 – RESULTADOS
55
redes com um única camada que tiveram seus dados de entrada normalizados, podem
“competir” com redes multicamadas cujos dados não tenham sido normalizados.
As simulações realizadas em redes projetadas com totais precipitados apresentaram
alertas no MATLAB que diziam que os resultados obtidos poderiam não ser corretos.
Verificou-se que essas redes geravam resultados bastante diferentes a cada simulação
(Figura 4.18), apresentando-se muito instáveis, e expondo a necessidade de se fazer uma
normalização dos dados antes da modelagem. Diante disto e com base na literatura, que
recomenda que todos os dados de entrada de uma rede sejam normalizados – com exceção
para dados que já estejam num “formato normalizado”, como os dados binários, ou para
dados que se apresentem na mesma ordem de grandeza (Azoff, 1994) – efetuou-se a
normalização dividindo-se cada valor utilizado da série pelo máximo valor (ou próximo
dele) registrado na mesma, proporcionando o uso de dados que variam apenas entre 0 e +1,
facilitando o treinamento e resultando em redes mais estáveis.
CAPÍTULO 4 – RESULTADOS
56
R=0,00
R=0,42
R=0,73
Figura 4.18 – Resultados obtidos em 10 simulações de uma rede neural com 5 neurônios sigmóides
na camada escondida e 1 neurônio linear na camada de saída, em totais precipitados. A linha
contínua é o resultado da simulação e a tracejada apresenta os dados observados
CAPÍTULO 4 – RESULTADOS
57
R=0,78
R=0,95
R=0,96
Figura 4.18 – Resultados obtidos em 10 simulações de uma rede neural com 5 neurônios sigmóides
na camada escondida e 1 neurônio linear na camada de saída, em totais precipitados. A linha
contínua é o resultado da simulação e a tracejada apresenta os dados observados (continuação)
CAPÍTULO 4 – RESULTADOS
58
4.3.3. MODELAGEM DAS REDES NEURAIS
Pelos motivos já descritos no capítulo anterior, todas as redes projetadas neste
estudo são do tipo multicamadas, com apenas uma camada escondida, composta de
neurônios sigmoidais, e com a camada de saída formada por apenas um neurônio linear.
Conforme o procedimento adotado para a determinação do número de neurônios
adequado para compor a camada escondida (Figura 3.8), projetou-se redes semelhantes
onde este número variou de 1 a 10 neurônios. A princípio, para a rede projetada para a
desagregação da precipitação sazonal, esse número chegou a 15 neurônios, onde se
constatou que tal magnitude não se fazia necessária, uma vez que redes com mais de 10
neurônios não apresentavam bons resultados na validação, caracterizando sempre a
ocorrência de superajustamento.
As dez simulações realizadas com o objetivo de verificar a estabilidade de cada
estrutura de rede selecionada pelo desempenho resultaram num conjunto de 10 redes,
proporcionando o processo de seleção da melhor estrutura através dos critérios adotados,
de estabilidade, de melhor coeficiente de correlação, análise gráfica e do princípio da
parcimônia.
4.3.4. NÍVEL SAZONAL
As estruturas de rede que numa primeira seleção apresentaram os melhores
resultados para a desagregação em escala sazonal, foram simuladas dez vezes, resultando
em redes que estão apresentadas na Tabela 4.3.
A estrutura de rede neural escolhida para realizar a desagregação espacial da
precipitação para a bacia do Rio Piancó, em escala sazonal, foi a de 4 neurônios na camada
escondida.
CAPÍTULO 4 – RESULTADOS
59
Tabela 4.3 – Coeficientes de correlação obtidos nas simulações das estruturas de rede
selecionadas para a verificação da estabilidade do algoritmo de treinamento, no nível
sazonal
3 neurônios
Rede
1
2
3
4
5
6
7
8
9
10
Número de neurônios na camada escondida
4 neurônios
5 neurônios
6 neurônios
TreinaTreinaTreinaTreinaValidação Rede
Validação Rede
Validação Rede
Validação
mento
mento
mento
mento
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,86
0,84
0,86
0,86
0,86
0,86
0,84
0,86
0,86
0,86
11
12
13
14
15
16
17
18
19
20
0,97
0,96
0,97
0,97
0,97
0,96
0,96
0,97
0,97
0,97
0,87
0,83
0,87
0,87
0,87
0,83
0,83
0,87
0,87
0,87
21
22
23
24
25
26
27
28
29
30
0,98
0,97
0,97
0,97
0,97
0,98
0,97
0,97
0,97
0,97
0,86
0,85
0,86
0,87
-0,42
0,86
0,85
0,86
0,87
-0,42
31
32
33
34
35
36
37
38
39
40
0,97
0,98
0,98
0,96
0,97
0,97
0,98
0,97
0,98
0,97
-0,34
0,86
0,84
-0,34
-0,42
-0,39
0,87
-0,34
0,86
-0,32
Os valores fornecidos por essas redes, e a média calculada entre esses valores, estão
mostrados na Figura 4.19, juntamente com os dados observados da bacia. Como algumas
redes mostraram o mesmo comportamento, mas diferiram de outras, manteve-se o mesmo
símbolo no gráfico para as primeiras, e atribuiu-se símbolos diferentes às últimas.
A normalização dos dados foi realizada dividindo-se cada valor utilizado por 1200,
que é aproximadamente o máximo valor registrado na série.
Como se pode verificar na Tabela 4.3, sete redes forneceram resultados
semelhantes, obtendo os mesmos coeficientes no treinamento e na validação, e por isso,
apresentando dados sobrepostos (Figura 4.19). Portanto, qualquer uma dessas sete redes
poderia ser julgada adequada para realizar a desagregação a nível sazonal. A Figura 4.20
mostra o comportamento, no treinamento e na validação, da Rede 11 – escolhida ao acaso
entre as sete redes – em comparação aos dados observados. Nesta figura, pode se observar
que a rede selecionada consegue capturar bem o comportamento não linear da precipitação
durante o treinamento, conseguindo uma alta correlação. No entanto, devido aos já citados
anos anômalos (1971, 1977-79), essa correlação cai na fase de validação.
Além da opção de se eleger uma única rede para a desagregação espacial da
precipitação, uma outra alternativa seria a utilização de todas as dez redes para se obter
uma faixa de valores previstos, estabelecendo um intervalo onde seria maior a
possibilidade de acerto nas previsões.
A Figura 4.21 possibilita a comparação entre os dados sazonais observados e os
calculados pela Rede 11 ao longo de toda a série (1939-88).
CAPÍTULO 4 – RESULTADOS
+
•
×
ο
60
observada
calculada: melhor
calculada: pior
média
a) Treinamento
+
•
×
ο
observada
calculada: melhor
calculada: pior
média
b) Validação
Figura 4.19 – Relações entre as séries normalizadas sazonais da célula e da bacia,
para o conjunto de dez redes com 4 neurônios na camada escondida, no período de
a) treinamento; e de b) validação
CAPÍTULO 4 – RESULTADOS
61
R = 0,97
a) treinamento
1971
1977
1979
1978
R = 0,87
b) validação
Figura 4.20 – Relações resultantes da Rede 11 entre as séries normalizadas
sazonais da célula e da bacia, no período de: a) treinamento; e de b) validação
CAPÍTULO 4 – RESULTADOS
62
a) treinamento
b) validação
Figura 4.21 – Comparação entre as séries normalizadas observada e calculada
pela Rede Neural, para a bacia do Piancó, nos períodos de: a) treinamento e
b) validação
CAPÍTULO 4 – RESULTADOS
63
4.3.5. Nível Mensal
Entre as séries mensais, observou-se que o mês mais chuvoso na região da bacia do
Piancó é o mês de Março, e o que apresenta os menores valores de precipitação é o mês de
Maio. No procedimento adotado para a normalização, conforme descrito na seção 4.3.2,
cada dado da série foi dividido pelo máximo valor (ou próximo dele) registrado na mesma.
Diante disto, as séries foram normalizadas com a utilização de valores diferentes, que estão
indicados na Tabela 4.4.
Tabela 4.4 – Valores pelos quais as séries mensais foram normalizadas
Fevereiro
400
Março
550
Abril
400
Maio
240
As estruturas de rede que numa primeira seleção apresentaram os melhores
resultados para a desagregação espacial em escala mensal foram simuladas dez vezes,
resultando em redes que estão apresentadas na Tabela 4.5. Destas, aquelas que tiveram
suas estruturas consideradas como adequadas para realizar a desagregação espacial da
precipitação nos meses de fevereiro a maio, para a bacia do Rio Piancó, estão expostas na
Tabela 4.6, com os coeficientes de correlação obtidos das redes resultantes das dez
simulações, nas fases de treinamento e de validação.
Tabela 4.5 – Coeficientes de correlação obtidos nas simulações das estruturas de
rede selecionadas, para os meses de fevereiro a maio
FEVEREIRO
1 neurônio
2 neurônios
3 neurônios
Rede Treinamento Validação Rede Treinamento Validação Rede Treinamento Validação
1
2
3
4
5
6
7
8
9
10
0,88
0,88
0,88
0,88
0,88
0,88
0,88
0,88
0,88
0,88
0,83
0,83
0,83
0,83
0,83
0,83
0,83
0,83
0,83
0,83
11
12
13
14
15
16
17
18
19
20
0,92
0,90
0,90
0,90
0,90
0,90
0,90
0,90
0,90
0,90
0,81
0,85
0,85
0,85
0,85
0,85
0,85
0,85
0,85
0,85
21
22
23
24
25
26
27
28
29
30
0,90
0,91
0,91
0,93
0,91
0,91
0,91
0,91
0,91
0,91
-0,53
0,86
0,82
0,81
0,82
0,83
0,82
0,82
0,83
0,83
CAPÍTULO 4 – RESULTADOS
64
Tabela 4.5 – Coeficientes de correlação obtidos nas simulações das estruturas de rede
selecionadas, para os meses de fevereiro a maio (continuação)
MARÇO
1 neurônio
Rede
1
2
3
4
5
6
7
8
9
10
2 neurônios
1
2
3
4
5
6
7
8
9
10
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,71
0,71
0,71
0,71
0,71
0,71
0,71
0,71
0,71
0,71
11
12
13
14
15
16
17
18
19
20
1
2
3
4
5
6
7
8
9
10
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,96
0,71
21
0,71
22
0,71
23
0,71
24
0,71
25
0,71
26
0,71
27
0,71
28
0,71
29
0,71
30
ABRIL
4 neurônios
0,97
0,96
0,96
0,97
0,96
0,97
0,97
0,97
0,96
0,96
0,78
0,71
0,71
0,78
0,71
0,78
0,78
0,78
0,71
0,71
31
32
33
34
35
36
37
38
39
40
5 neurônios
0,96
0,97
0,97
0,97
0,97
0,97
0,97
0,97
0,97
0,97
0,72
0,72
0,72
0,72
0,72
0,72
0,72
0,72
0,72
0,72
6 neurônios
TreinaTreinaTreinaTreinaValidação Rede
Validação Rede
Validação Rede
Validação
mento
mento
mento
mento
0,93
0,93
0,93
0,92
0,93
0,92
0,93
0,93
0,92
0,93
0,92
0,92
0,92
0,79
0,92
0,79
0,92
0,92
0,79
0,92
11
12
13
14
15
16
17
18
19
20
1 neurônio
Rede
4 neurônios
TreinaTreinaTreinaTreinaValidação Rede
Validação Rede
Validação Rede
Validação
mento
mento
mento
mento
3 neurônios
Rede
3 neurônios
0,94
0,94
0,94
0,94
0,94
0,94
0,94
0,94
0,94
0,94
0,92
21
0,92
22
0,92
23
0,92
24
0,92
25
0,92
26
0,92
27
0,92
28
0,92
29
0,92
30
MAIO
2 neurônios
0,94
0,94
0,94
0,94
0,94
0,94
0,94
0,94
0,94
0,95
0,92
0,92
0,92
0,91
0,92
0,90
0,91
0,92
0,91
0,89
31
32
33
34
35
36
37
38
39
40
3 neurônios
0,95
0,94
0,94
0,94
0,94
0,95
0,95
0,95
0,95
0,95
0,87
0,90
0,88
0,85
0,19
0,86
0,86
0,86
0,89
0,89
4 neurônios
TreinaTreinaTreinaTreinaValidação Rede
Validação Rede
Validação Rede
Validação
mento
mento
mento
mento
0,93
0,93
0,93
0,93
0,93
0,93
0,93
0,93
0,93
0,93
0,85
0,85
0,85
0,85
0,85
0,85
0,85
0,85
0,85
0,85
11
12
13
14
15
16
17
18
19
20
0,93
0,93
0,93
0,93
0,92
0,93
0,93
0,93
0,93
0,93
0,86
0,86
0,85
0,86
0,86
0,86
0,86
0,85
0,85
0,85
21
22
23
24
25
26
27
28
29
30
0,95
0,93
0,93
0,95
0,93
0,95
0,93
0,93
0,93
0,93
0,84
-0,53
0,84
0,84
-0,51
0,79
-0,53
-0,54
-0,53
-0,55
31
32
33
34
35
36
37
38
39
40
0,95
0,95
0,95
0,94
0,95
0,96
0,93
0,95
0,95
0,95
0,87
0,87
0,87
0,86
0,87
0,71
0,81
0,88
0,86
0,87
CAPÍTULO 4 – RESULTADOS
65
Tabela 4.6 – Coeficientes de correlação obtidos das redes julgadas mais adequadas para a
desagregação, nos meses de fevereiro a maio
FEVEREIRO
MARÇO
ABRIL
MAIO
2 neurônios
3 neurônios
4 neurônios
4 neurônios
TreinaTreinaTreinaTreinaRede
Validação Rede
Validação Rede
Validação Rede
Validação
mento
mento
mento
mento
11
0,92
0,81
21
11
31
0,97
0,78
0,94
0,92
0,95
0,87
12
22
0,96
0,71
12
32
0,90
0,85
0,94
0,92
0,95
0,87
13
23
0,96
0,71
13
33
0,90
0,85
0,94
0,92
0,95
0,87
14
24
14
34
0,90
0,85
0,97
0,78
0,94
0,92
0,94
0,86
15
25
0,96
0,71
15
35
0,90
0,85
0,94
0,92
0,95
0,87
16
26
16
36
0,96
0,71
0,90
0,85
0,97
0,78
0,94
0,92
17
27
17
37
0,93
0,81
0,90
0,85
0,97
0,78
0,94
0,92
18
28
18
38
0,90
0,85
0,97
0,78
0,94
0,92
0,95
0,88
19
29
0,96
0,71
19
39
0,90
0,85
0,94
0,92
0,95
0,86
20
30
0,96
0,71
20
40
0,90
0,85
0,94
0,92
0,95
0,87
Os valores fornecidos durante a fase de treinamento pelas redes referentes ao mês
de fevereiro, março, abril e maio, e as médias calculadas entre esses valores, estão
mostrados na Figura 4.22, juntamente com os dados observados da bacia. Os resultados da
fase de validação estão expostos na Figura 4.23.
Para o mês de Fevereiro, apenas a Rede 11 apresentou um comportamento diferente
das demais, atribuindo-se a ela, portanto, um símbolo diferente das outras nas Figuras 4.22
e 4.23. Nestas figuras e na Tabela 4.6, percebe-se que nove redes forneceram resultados
semelhantes, obtendo os mesmos coeficientes no treinamento e na validação. Portanto,
qualquer uma das nove poderia ser escolhida como a rede de melhor desempenho para a
desagregação no mês de Fevereiro. A Figura 4.24 mostra o comportamento, no
treinamento e na validação, da Rede 13 – escolhida ao acaso entre as nove redes – em
comparação aos dados observados. Nesta figura (como em todas as outras redes projetadas
a nível mensal e sazonal), pode se observar que a rede selecionada consegue capturar bem
o comportamento não linear da precipitação durante o treinamento, conseguindo uma alta
correlação. No entanto, devido aos já citados anos anômalos (1971, 1977, 1978 e 1979),
essa correlação cai na fase de validação.
Para o mês de Março, atribuiu-se às redes destacadas na Tabela 4.6 um símbolo
diferente das demais. Como elas têm o comportamento semelhante e forneceram os
mesmos resultados, selecionou-se arbitrariamente a Rede 26 como a mais indicada para a
CAPÍTULO 4 – RESULTADOS
66
desagregação espacial da precipitação no mês de Março. A Figura 4.25 mostra o
comportamento, no treinamento e na validação, desta rede em comparação aos dados
observados. Mais uma vez registrou-se queda no coeficiente de correlação da validação em
relação ao coeficiente obtido no treinamento devido aos anos anômalos.
Com relação ao mês de Abril, através da Tabela 4.6 e das Figuras 4.22 e 4.23,
observou-se que todas as redes se comportaram de maneira semelhante, indicando se tratar
de uma estrutura de rede altamente estável. Apontou-se, então, a Rede 14 para representar
o conjunto resultante, recebendo a denominação de a rede neural mais adequada para a
desagregação espacial da precipitação no mês de Abril. A Figura 4.26 mostra o
comportamento, no treinamento e na validação, desta rede em comparação aos dados
observados.
Como das redes que compõem o conjunto referente ao mês de Maio – com exceção
da Rede 37, que não foi considerada por motivos que serão expostos adiante – apenas a
sexta apresentou um comportamento diferente das demais (Tabela 4.6, Figura 4.22 e
Figura 4.23), atribuiu-se a ela, no gráfico, um símbolo diferente das outras. Apesar de
apresentarem comportamentos semelhantes, a Rede 38 mostrou um desempenho um pouco
melhor que as demais, e por isso foi selecionada para a desagregação espacial da
precipitação no mês de Maio. A Figura 4.27 mostra o comportamento, no treinamento e na
validação, desta rede em comparação aos dados observados.
As Figuras 4.28, 4.29, 4.30 e 4.31 possibilitam a comparação entre os dados
observados e os calculados pelas redes escolhidas para a desagregação espacial da
precipitação nos meses de fevereiro, março, abril e maio (respectivamente).
CAPÍTULO 4 – RESULTADOS
+
•
×
ο
67
observada
calculada: melhor
calculada: pior
média
a) fevereiro
+
•
×
ο
observada
calculada: melhor
calculada: pior
média
b) março
Figura 4.22 – Relações entre as séries normalizadas da célula e da bacia para o
conjunto de dez redes, no período de treinamento (1939-68), referentes aos
meses de a) fevereiro; b) março; c) abril; d) maio
CAPÍTULO 4 – RESULTADOS
68
+ observada
• calculada
ο média
c) abril
+
•
×
ο
observada
calculada: melhor
calculada: pior
média
d) maio
Figura 4.22 – Relações entre as séries normalizadas da célula e da bacia para o
conjunto de dez redes, no período de treinamento (1939-68), referentes aos
meses de a) fevereiro; b) março; c) abril; d) maio (continuação)
CAPÍTULO 4 – RESULTADOS
+
•
×
ο
69
observada
calculada: melhor
calculada: pior
média
a) fevereiro
+
•
×
ο
observada
calculada: melhor
calculada: pior
média
b) março
Figura 4.23 – Relações entre as séries normalizadas da célula e da bacia para o
conjunto de dez redes, no período de validação (1969-88), referentes aos meses
de a) fevereiro; b) março; c) abril; d) maio
CAPÍTULO 4 – RESULTADOS
70
+ observada
• calculada
ο média
c) abril
+
•
×
ο
observada
calculada: melhor
calculada: pior
média
d) maio
Figura 4.23 – Relações entre as séries normalizadas da célula e da bacia para o
conjunto de dez redes, no período de validação (1969-88), referentes aos meses
de a) fevereiro; b) março; c) abril; d) maio (continuação)
CAPÍTULO 4 – RESULTADOS
71
R = 0,90
a) treinamento
1971
1977
1978
R = 0,85
b) validação
Figura 4.24 – Relações resultantes da Rede 13 entre as séries normalizadas da célula e da
bacia, referentes ao mês de Fevereiro, no período de a) treinamento; e de b) validação
CAPÍTULO 5 – RESULTADOS
72
R = 0,97
a) treinamento
1979
1977
1978
R = 0,78
b) validação
Figura 4.25 – Relações resultantes da Rede 26 entre as séries normalizadas da célula e
da bacia, referentes ao mês de Março, no período de a) treinamento; e de b) validação
CAPÍTULO 4 – RESULTADOS
73
R = 0,94
a) treinamento
1971
1979
R = 0,92
b) validação
Figura 4.26 – Relações resultantes da Rede 14 entre as séries normalizadas da célula
e da bacia, referentes ao mês de Abril, no período de: a) treinamento; e b) validação
CAPÍTULO 4 – RESULTADOS
74
R = 0,95
a) treinamento
1977
R = 0,88
b) validação
Figura 4.27 – Relações resultantes da Rede 38 entre as séries normalizadas da célula
e da bacia, referentes ao mês de Maio, no período de: a) treinamento; e b) validação
CAPÍTULO 4 – RESULTADOS
75
a) treinamento
b) validação
Figura 4.28 – Comparação entre as séries normalizadas observada e calculada pela
Rede Neural, para a bacia do Piancó, no mês de Fevereiro, nos períodos de:
a) treinamento e b) validação
CAPÍTULO 4 – RESULTADOS
76
a) treinamento
b) validação
Figura 4.29 – Comparação entre as séries normalizadas observada e calculada pela
Rede Neural, para a bacia do Piancó, no mês de Março, nos períodos de:
a) treinamento e b) validação
CAPÍTULO 4 – RESULTADOS
77
a) treinamento
b) validação
Figura 4.30 – Comparação entre as séries normalizadas observada e calculada pela
Rede Neural, para a bacia do Piancó, no mês de Abril, nos períodos de:
a) treinamento e b) validação
CAPÍTULO 4 – RESULTADOS
78
a) treinamento
b) validação
Figura 4.31 – Comparação entre as séries normalizadas observada e calculada pela
Rede Neural, para a bacia do Piancó, no mês de Maio, nos períodos de:
a) treinamento e b) validação
CAPÍTULO 4 – RESULTADOS
79
4.3.6. IMPORTÂNCIA DA ANÁLISE GRÁFICA
O principal motivo de se ter extraído a Rede 37 das Figuras 4.22 e 4.23, que
apresentam o conjunto de redes com 4 neurônios na camada escondida, foi para se mostrar
isoladamente o seu caso. Os coeficientes de correlação obtidos nas fases de treinamento e
de validação dessa rede foram bons e são da mesma ordem de grandeza dos coeficientes
das demais (Tabela 4.6). No entanto, apesar disso, observou-se nos gráficos obtidos nessas
fases (Figura 4.32), que a rede gerou um mesmo valor para a precipitação na bacia,
relacionando-o a vários dados diferentes da célula. Como a rede atribuiu à precipitação um
comportamento irreal, não conseguindo um ajuste satisfatório com os dados observados da
bacia, não se fez adequada a sua adesão ao conjunto de redes bens treinadas. Este exemplo
confirma a importância de se utilizar também a análise gráfica como critério de seleção da
rede, e não apenas a verificação dos coeficientes de correlação calculados.
a) treinamento
b) validação
Figura 4.32 – Relações resultantes da Rede 37 entre as séries normalizadas da célula e da
bacia, referentes ao mês de Maio, no período de: a) treinamento; e b) validação
O elemento responsável por se obter redes que forneçam resultados tão diferentes
de uma estrutura de rede, é o algoritmo de treinamento, e é por isso que, apesar de se ter
obtido grandes avanços na formulação desses algoritmos, várias pesquisas continuam a ser
realizadas com o objetivo de promover correções e proporcionar melhorias a esses
elementos.
CAPÍTULO 4 – RESULTADOS
80
4.3.7. OCORRÊNCIA DE SUPERAJUSTAMENTO
Ao se fazer várias simulações com a rede que possui 9 neurônios na camada
escondida, projetada para a escala sazonal, constatou-se que a cada aumento de 0,0001 na
correlação entre as séries observada e prevista no treinamento, que não provoca mudanças
visíveis no ajuste, os gráficos gerados na validação ficaram bastante diferentes uns dos
outros (Figura 4.33), com correlações variando de 0,84 a –0,12. Isso é o resultado de uma
rede instável devido à ocorrência de um superajustamento nos dados do período de
treinamento, ou seja, apesar de fornecer resultados com altas correlações na fase de
treinamento, a rede apenas memorizou os dados, perdendo sua boa capacidade de
generalização.
R = 0,84
a) coeficiente de correlação do treinamento = 0.9846
Figura 4.33 – Validação de redes neurais com 9 neurônios na camada escondida
correspondentes a treinamentos que obtiveram coeficientes de correlação de: a) 0,9846;
b) 0,9849; e c) 0,9850
CAPÍTULO 4 – RESULTADOS
81
R = 0,75
b) coeficiente de correlação do treinamento = 0.9849
R = - 0,12
c) coeficiente de correlação do treinamento = 0.9850
Figura 4.33 – Validação de redes neurais com 9 neurônios na camada escondida
correspondentes a treinamentos que obtiveram coeficientes de correlação de: a) 0,9846;
b) 0,9849; e c) 0,9850 (continuação)
CAPÍTULO 4 – RESULTADOS
82
A Figura 4.33 mostra um típico exemplo de superajustamento numa rede. Isto
acontece quando ela contém um número elevado de neurônios, resultando em bons ajustes
no treinamento, e péssimos resultados na validação. Diante de tal situação, o fluxograma
proposto por Hines (1997) é questionado (seção 3.5.2 e Figura 3.6), pois para o caso de não
se obter ajuste satisfatório na validação, ele aponta como causas ou uma fraca
generalização do conjunto de treinamento, que deverá ser resolvida com uma nova seleção
do grupo, ou a uma má representatividade do conjunto de validação, indicando que este
necessita de outros dados. Hines (1997) esquece de mencionar, no entanto, algo que
Valença e Ludermir (1999b) consideram como um dos aspectos fundamentais a ser
analisado quando do treinamento de uma rede neural: a ocorrência de superajustamento
(overfitting). Esquece que uma “fraca generalização do conjunto de treinamento” pode ser
o resultado de um número excessivo de neurônios, o que seria resolvido com a redução
deste número. Por isso, propõe-se aqui, uma pequena modificação neste fluxograma
(Figura 4.34), onde se passa então a considerar uma das maiores causas de ajuste não
satisfatório na validação: o superajustamento de uma rede.
CAPÍTULO 4 – RESULTADOS
83
Dados Coletados
Seleção dos Grupos de
Treinamento e Validação
Seleção da Arquitetura
da Rede Neural
Treinamento
Reinicializar Pesos e
Ruídos
ou
Aumento do Tamanho
da RN e/ou Mudança
nas Funções de
Ativação
ou
Alocação de mais dados
para o Treinamento
N
Nova seleção do Grupo
de Treinamento
ou
Coleta de mais Dados
ou
Ocorrência de
Superajustamento:
Redução do Tamanho
da Rede Neural
Ajuste
satisfatório?
S
Validação
Ajuste
satisfatório?
N
S
FIM
Figura 4.34 – Fluxograma do processo de treinamento e validação de uma RNA com
aprendizado supervisionado (modificado de Hines, 1997)
CAPÍTULO 4 – RESULTADOS
84
4.3.8. COMENTÁRIOS FINAIS SOBRE O MÉTODO DE REDES NEURAIS
O método das redes neurais correspondeu às expectativas criadas com base na
literatura (Sarle, 1994; Hewitson e Crane, 1996; Cavazos, 1997; entre outros), conseguindo
capturar bem a não linearidade da relação entre a precipitação nas duas escalas, mostrando
poder ser usado como uma técnica de desagregação da precipitação para a bacia do Piancó,
tanto no nível sazonal quanto mensal. Devido à existência de relações aproximadamente
lineares entre dados de precipitação da célula e da bacia, obteve-se redes com estruturas
pequenas, possuindo, no máximo, 4 neurônios na camada escondida.
Para a implementação desse método, deve-se, no entanto, considerar especial
atenção para um dos aspectos mais importantes: o excesso de neurônios numa rede, e o
conseqüente superajustamento dos dados. Num primeiro ensaio deste estudo, apontou-se
como as melhores redes para a desagregação, estruturas com até 8 neurônios na camada
escondida. Só depois de se efetuar as dez calibrações de cada estrutura para a verificação
da estabilidade da rede, e de se levar em consideração o princípio da parcimônia, verificouse que se tratava de redes muito grandes (para o caso específico da bacia do Piancó), e por
isso muito instáveis.
4.4. COMPARAÇÃO ENTRE OS MÉTODOS ADOTADOS PARA A DESAGREGAÇÃO
Apesar da existência de relações aproximadamente lineares entre dados de
precipitação da célula e da bacia, para as escalas sazonal e mensal (Figuras 4.5 e 4.10), o
método das redes neurais artificiais obteve melhores resultados nas fases de treinamento e
de validação, em comparação aos resultados obtidos com a regressão linear simples
(Tabela 4.7). Isto se deve, principalmente, à capacidade que um RNA tem de capturar a
não linearidade da relação da precipitação nas duas escalas.
Através dos coeficientes de correlação apresentados na Tabela 4.7, observou-se que
a diferença no desempenho dos dois métodos, apesar de considerável, é pequena, devido às
“relações aproximadamente lineares”. Com isto, questionamentos sobre os reais benefícios
que uma RNA poderia trazer para a desagregação da precipitação sobre a região em
estudo, podem ser levantados. No entanto, deve-se lembrar que, se no caso específico da
CAPÍTULO 4 – RESULTADOS
85
bacia do Piancó, que apresenta relações entre dados relativamente fáceis de ser modeladas
por outros métodos, a RNA ainda assim se mostrou superior; em outras regiões, com
qualquer outro tipo de relação entre os dados, sua superioridade poderia ser ainda maior.
Tabela 4.7 – Coeficientes de correlação obtidos entre a precipitação observada da
bacia do Piancó e os resultados da Regressão linear e das Redes Neurais, nos
períodos de treinamento e validação
Escala temporal
Sazonal
Fevereiro
Março
Mensal
Abril
Maio
Regressão linear
Treinamento Validação
0,95
0,86
0,87
0,83
0,95
0,73
0,92
0,93
0,92
0,86
Redes Neurais
Treinamento Validação
0,97
0,87
0,90
0,85
0,97
0,78
0,94
0,92
0,95
0,88
CAPÍTULO 5 – CONCLUSÃO E RECOMENDAÇÕES
86
5. CONCLUSÃO E RECOMENDAÇÕES
Diante da carência de água existente no Nordeste do Brasil, previsões de longo
prazo de precipitação são de grande valia para o manejo dos recursos hídricos da região.
No entanto, existe o problema da diferença entre a escala para a qual são realizadas as
previsões (malha dos modelos de circulação global atmosférica – MCGs), e a escala da
região onde se deseja empregá-las (bacia hidrográfica, neste estudo). Por isso, os objetivos
desta dissertação, já citados no Capítulo de Introdução, para uma região do Nordeste do
Brasil, foram: (i) melhorar a desagregação espacial de precipitação sazonal em relação a
trabalhos anteriores, (ii) realizar a desagregação espacial de precipitação mensal, referente
aos meses da estação chuvosa e (iii) avaliar o comportamento do método de Redes Neurais
Artificiais (RNAs) como técnica de desagregação espacial.
Como os dados observados nas duas escalas espaciais consideradas neste estudo
(malha de um MCG e bacia do Rio Piancó) apresentaram relações sazonais e mensais
aproximadamente lineares, utilizou-se o método de Regressão Linear para também se
realizar a desagregação da precipitação, com o objetivo de se comparar e avaliar a
eficiência do método das RNAs. Apesar da Regressão Linear ter fornecido bons resultados
na desagregação, as RNAs forneceram resultados ainda melhores, obtendo altas
correlações com os dados observados. Atribui-se a isto a capacidade que uma rede tem de
conseguir capturar a não linearidade da relação entre a precipitação nas duas escalas,
mesmo se tratando de relações aproximadamente lineares. Entretanto, verificou-se também
que, em todos os meses considerados (fevereiro a maio) e no nível sazonal, o desempenho
das redes neurais foi menor nas fases de validação, sendo esta queda atribuída à existência
de grandes diferenças entre a precipitação observada nas duas escalas em alguns anos
(1971, 1977, 1978 e 1979) do grupo de dados selecionados para esta fase da modelagem.
Uma seleção mais adequada desses dados, obtida talvez através de validação cruzada
(Valença e Ludermir, 1999b), poderia resultar no aumento do desempenho das redes, com
uma melhoria das correlações também na fase de validação.
CAPÍTULO 5 – CONCLUSÃO E RECOMENDAÇÕES
87
Constatou-se a importância de se efetuar a normalização dos dados de entrada da
rede neural antes de utilizá-los no seu treinamento (calibração), e também a necessidade de
se atribuir critérios de seleção para a escolha da melhor rede, de modo a se evitar um
número excessivo de parâmetros, que pode causar problemas na utilização da mesma.
Verificou-se, também, a importância de se utilizar a análise gráfica como critério de
seleção da rede, e não apenas a verificação dos coeficientes de correlação, diante da alta
sensibilidade das redes aos pesos e ruídos iniciais.
Portanto, sintetizando os resultados expostos acima, tem-se como conclusões deste
estudo:
•
Houve melhoria da desagregação espacial da precipitação sobre a bacia do
Piancó, no nível sazonal, em comparação ao estudo de Galvão (1999);
•
A precipitação pode ser desagregada também no nível mensal, com mesmo
desempenho que no nível sazonal;
•
Apesar da verificação de que as relações sazonais e mensais para a região são
aproximadamente lineares, o método das RNAs forneceu resultados ainda
melhores que o método da Regressão Linear;
•
É importante que se efetue a normalização dos dados de entrada da rede antes
de utilizá-los na sua calibração;
•
É necessário o uso de vários critérios para a seleção da melhor rede;
•
É importante que se utilize a análise gráfica como critério de seleção.
Conclui-se, portanto, que o método das Redes Neurais Artificiais pode e deve ser
utilizado como técnica de desagregação espacial de precipitação, tanto no nível sazonal
quanto mensal, devendo-se, no entanto, buscar o aperfeiçoamento deste através de
alterações nos elementos que nele interferem (algoritmo de treinamento, por exemplo),
para que se possa ter resultados ainda melhores numa desagregação de precipitação.
Com base nos conhecimentos adquiridos nesta pesquisa, além de sugestões
lançadas até aqui, faz-se ainda algumas recomendações a trabalhos posteriores:
•
Verificar se a utilização de outros nós da malha do MCG próximos ao nó
utilizado acarretaria em melhorias na desagregação da precipitação;
•
Desagregar a precipitação para a escala de posto pluviométrico;
•
Verificar a previsibilidade do MCG para o nível mensal.
REFERÊNCIAS
88
REFERÊNCIAS BIBLIOGRÁFICAS
ALVES, J. M. B. e REPELLI, C. A. (1992). A variabilidade pluviométrica no setor norte
do Nordeste e os eventos El Niño – Oscilação Sul (ENOS). Revista Brasileira de
Meteorologia. Rio de Janeiro, v.7, n.2, p.583-592.
ALVES, J. M. B. e REPELLI, C. A. MELLO, N. S. e FERREIRA, A. G. (1994). Um
estudo da variabilidade pluviométrica no setor norte do nordeste ao longo deste século.
In: CONGRESSO BRASILEIRO DE METEOROLOGIA, 8., 1994, Belo Horizonte.
Anais: ... Belo Horizonte: SBMET. v.2, p.111-114.
AZOFF, E. M. (1994). Neural network time series forecasting of financial markets.
Chichester: Jonh Wiley & Sons.
BEALE, R. e JACKSON, T. (1990). Neural computing: an introdution. New York: Adam
Hilger.
BECKER, B. D. (1997). The ECMWF ensemble simulation CD-ROMs. Reading: European
Centre for Medium-Range Weather Forecasts. Em CD-ROM.
BRANKOVIC, C. e PALMER, T. N. (1998). Seasonal skill and predictability of ECMWF
PROVOST ensembles. Reading: ECMWF. (ECMWF Technical Memorandum No.
263).
BRANKOVIC, C., PALMER, T. N. e FERRANTI, L. (1994). Predictability of seasonal
atmospheric variations. Journal of Climate. Boston, v.7, n.2, p.217-237.
BRITO, J. I. B., NOBRE, C. A. e ZARANZA, A. R. (1991). A precipitação da pré-estação
chuvosa e a previsibilidade da estação chuvosa do norte do Nordeste. Climanálise. São
José dos Campos, v.6, n.6, p.39-55.
CADIER, E. (1994). Hidrologia das pequenas bacias do Nordeste semi-árido:
transposição hidrológica. Recife: SUDENE.
CAUDILL, M. (1997). Neural Networks Primer. 3 Ed. San Francisco: Miller Freeman Inc.
REFERÊNCIAS
89
CAVALCANTI, I. F.A., PEZZI, L. P., NOBRE, P., SAMPAIO, G. e CAMARGO JR., H.
(1999). Climate prediction of precipitation in Brazil for the Nordeste rainy season
(MAM). Experimental Long-Lead Forecast Bulletin, v.8, n.1. Disponível on-line em
http://grads.iges.org/ellfb/Mar99/cptec.htm . 18 Nov 1999.
CAVAZOS, T. (1997). Downscaling large-scale circulation to local winter rainfall in
north-eastern Mexico. International Journal of Climatology. Chichester, v.17, p.10691082.
COLMAN, A., DAVEY, M., HARRISON, M. e EVANS, A. (1998). Prediction of marchapril-may 1998 rainfall in Northeast Brazil using input from multiple regression,
discriminant analysis and an atmospheric global circulation model. Experimental
Long-lead Forecast Bulletim. v.7, n.1. http://grads.iges.org/ellfb/Mar98/co2.html.
COSTA, W. D. e COSTA, W. D. (1997). Disponibilidades hídricas subterrâneas na região
Nordeste do Brasil. A Água em Revista. anoV, n.9, p.47-59.
DEMUTH, H. e BEALE, M. (1998). Neural Network Toolbox for use with MATLAB –
User’s guide, version 3. The MathWorks, Inc.
EKLUND, P. (1994). Network size versus preprocessing. In: Yager, R. R., Zadeh, L. A.
(Ed.). Fuzzy sets, neural networks, and soft computing. New York: Van Nostrand
Reinhold. p.250-264.
ECMWF – EUROPEAN CENTRE FOR MEDIUM-RANGE WEATHER FORECASTS
(2000). ECMWF’s seasonal forecast project: introduction. Disponível on-line em
http://www.ecmwf.int/services/seasonal/info/info.html . 02 Mai 2000.
EVANS, T. e GRAHAM, R. (1999). A dynamical one-month lead seasonal rainfall
prediction for march to may 1998 for the North-Eastern area of South America.
Experimental Long-Lead Forecast Bulletin, v.8, n.1. Disponível on-line em
http://grads.iges.org/ellfb/Mar99/evens.htm . 18 Nov 1999.
FOLLAND, C. K., OWEN, J., WARD, N. e COLMAN, A. (1991). Prediction of seasonal
rainfall in the Sahel region using empirical and dynamical methods. Journal of
Forecasting. Chichester, v.10, p.21-56.
FONTANA, D. C. e BERLATO, M. A. (1997). A influência do El Niño Oscilação Sul
sobre a precipitação pluvial no Estado do Rio Grande do Sul. Revista Brasileira de
Agrometeorologia. Santa Maria, v.5, n.1, p.127-132.
REFERÊNCIAS
90
FREDERICK, K. D., MAJOR, D. C. e STAKHIV, E. Z. (1997). Water resources planning
principles and evaluation criteria for climate change: summary e conclusions. Climatic
Change, Dordrecht, v.37, p.291-313.
FREITAS, M. A. V. e SANTOS, A. H. M. (1999). Importância da água e da informação
hidrológica. In: Freitas, M. A. V. (Org.). O estado das águas no Brasil. Brasília:
ANEEL, MMA/SRH, MME. p.13-16.
GALVÃO, C. O. (1999). Aplicabilidade em Recursos Hídricos da previsão de
precipitação de longo prazo no nordeste do Brasil. Porto Alegre. Tese (Doutor em
Engenharia) – Programa de Pós-Graduação em Engenharia de Recursos Hídricos e
Saneamento Ambiental, Universidade Federal do Rio Grande do Sul, Porto Alegre.
GALVÃO, C. O. e TRIGO, R. M. (1999). Downscaling da precipitação e temperatura de
modelos de circulação global para a escala de bacia hidrográfica. In: IV SIMPÓSIO
DE HIDRÁULICA E RECURSOS HÍDRICOS DOS PAÍSES DE LÍNGUA OFICIAL
PORTUGUESA. Coimbra: Portugal. Em CD-ROM.
GARDNER, M. W. e DORLING, S. R. (1998). Artificial neural networks (the multilayer
perceptron) – a review of applications in the atmospheric sciences. Atmospheric
Environment. v.32, p.2627-2636.
GATELY, E. (1996). Neural networks for financial forecasting. New York: Jonh Wiley &
Sons.
HAGAN, M. T. e MENHAJ, M. (1994). Training feedforward networks with the
Marquardt algorithm. IEEE Transactions on Neural Networks. v. 5, n.6, p.989-993.
HANSELMAN, D. e LITTLEFIELD, B. (1999). MATLAB 5 Versão do Estudante – Guia
do Usuário. São Paulo: MAKRON Books.
HARZALLAH, A., ARAGÃO, J. O. R. e SADOURNY, R. (1996). Interannual rainfall
variability in North-East Brazil: observation and model simulation. International
Journal of Climatology. Chichester, v.16, p.861-878.
HERDIES, D. L., PEZZI, L. P. e ARAVÉQUIA, J. A. (1994). Análise da estação chuvosa
do leste do Nordeste. In: CONGRESSO BRASILEIRO DE METEOROLOGIA, 8.,
1994, Belo Horizonte. Anais: ... Belo Horizonte: SBMET. v.2, p.155-157.
HEWITSON, B. C. e CRANE, R. G. (1996). Climate downscaling: techniques and
application. Climate Research, v.7. p.85-95.
HINES, J. W. (1997). MATLAB Supplement to fuzzy and neural approaches in
engineering. Chichester: Jonh Wiley & Sons.
REFERÊNCIAS
91
KANE, R. P. (1997). Prediction of droughts in North-East Brazil: role of ENSO and use of
periodicities. International Journal of Climatology. Chichester, v.17, p.655-665.
KAYANO, M. T. e KOUSKY, V. E. (1994). Análises regionais da variabilidade
interanual. In: CONGRESSO BRASILEIRO DE METEOROLOGIA, 8., 1994, Belo
Horizonte. Anais: ... Belo Horizonte: SBMET. v.2, p.7-9.
KOUSKY, V. E. (1985). Atmospheric circulation changes associated with rainfall
anomalies over tropical Brazil. Monthly Weather Review. Boston, v.113, p.1951-1957.
LAWRENCE, J. (1991). Data preparation for a neural network. AI Expert. November,
p.34-41.
LIMA, M. C. de e RAO, V. B. (1994). Estudo de casos extremos (secas/enchentes) no leste
da
região
Nordeste
do
Brasil.
In:
CONGRESSO
BRASILEIRO
DE
METEOROLOGIA, 8., 1994, Belo Horizonte. Anais: ... Belo Horizonte: SBMET. v.2,
p.46-48.
MICROSOFT CORPORATION (1997). Excel 97. Microsoft Co.
MMA – MINISTÉRIO DO MEIO AMBIENTE (2000). PROÁGUA semi-árido.
Disponível on-line em http://www.proagua.gov.br/_htm/default.htm. 14 Out 2000.
MOLINIER, M., ALBUQUERQUE, C. H. C. e CADIER, E. (1994). Análise da
pluviometria e isoietas homogeneizadas do Nordeste brasileiro. Recife: SUDENE.
NIMER, E. (1989). Climatologia do Brasil. Rio de Janeiro: IBGE.
NOBRE, C. A. e MOLION, L. C. B. (1988). The climatology of droughts and drought
prediction. In: PARRY, M. L., CARTER, T. R. e KONIJN, N. T. (Ed.) the Impact of
Climate Variations on Agriculture. Dordrecht: Kluwer: IIASA:UNEP. v.2, p.305-323.
PALUTIKOF, J. P., WINKLER, J. A., GOODESS, C. M. e ANDRESEN, J. A. (1997).
The simulation of daily temperture time series from GCM output. Part I: comparison
of model data with observations. Journal of Climate. Boston, v.10, p.2497-2513.
PIELKE, R. A., COTTON, W. R., WALKO, R. L., TREMBACK, C. J., LYONS, W. A.,
GRASSO, L. D., NOCHOLLS, M. E., MORAN, M. D., WESLEY, D. A., LEE, T. J. e
COPELAND, J. H. (1992). A comprehensive meteorological modeling system –
RAMS. Meteorology Atmospheric Physics, v.49, p.69-91.
RAMOS, R. P. L. (1975). Precipitation characteristics in the Northeast Brazil dry region. J.
Geophys. Res., v.80, p.1665-1678.
REFERÊNCIAS
92
RAO, V. B., LIMA, M. C. e FRANCHITO, S. H. (1993). Seasonal and interannual
variations of rainfall over eastern Northeast Brazil. Journal of Climate. Boston, v.6,
p.1754-1763.
REPELLI, C. A. e ALVES, J. M. B. (1994). O estado da arte da previsibilidade
operacional da quadra chuvosa do setor norte do nordeste do Brasil. In: CONGRESSO
BRASILEIRO DE METEOROLOGIA, 8., 1994, Belo Horizonte. Anais: ... Belo
Horizonte: SBMET. v.3, p.438-442.
ROBINSON, R. (1991). Neural networks offer an alternative to traditional regression.
Geobyte. February, p.14-19.
ROSENBLAT, F. (1958). The Perceptron: a probabilistic model for information
storage and organization in the human brain. Psychological Review, v. 65,
p.386-408.
ROUCOU, P., ARAGÃO, J. O. R., HARZALLAH, A., FONTAINE, B. e JANICOT, S.
(1996). Vertical motion changes related to North-East Brazil rainfall variability: a
GCM simulation. International Journal of Climatology. Chichester, v.16, p.879-891.
SARLE, W. S. (1994). Neural networks and statistical models. Proceedings of the
Nineteenth Annual SAS Users Group International Conference. Cary, NC: SAS
Institute.
SCHUBERT, S. (1998). Downscaling local extreme temperature changes in south-eastern
Australia from the CSIRO Mark2 GCM. International Journal of Climatology.
Chichester, v.18, p.1419-1438.
SEMENOV, M. A. e BARROW, E. M. (1997). Use of a stochastic weather generator in
the development of climate change scenarios. Climatic Change, Dordrecht, v.35,
p.397-414.
SKELLY, W. C. e HENDERSON-SELLERS, A. (1996). Grid box ou grid point: what type
of data do GCMs deliver to climate impacts researchers? International Journal of
Climatology. Chichester, v.16, p.1079-1086.
SOUZA, E. B., ALVES, J. M. B. e XAVIER, T. B. S. (1998). A estação chuvosa no SemiÁrido Nordestino nos anos de predominância de aquecimento ou de resfriamento em
toda bacia do atlântico tropical. Revista Brasileira de Recursos Hídricos. v.3, n.2,
p.47-55.
REFERÊNCIAS
93
SPERBER, K. R. e PALMER, T. N. (1996). Interannual tropical rainfall variability in
general circulation model simulations associated with the atmospheric model
intercomparison project. Jounal of Climate. Boston, v.9, p.2727-2750.
TRIGO, R. M. e PALUTIKOF, J. P. (1999). Simulation of daily maximum and minimum
temperature over Portugal: a neural network model approach. Climate Research. V.13,
p.45-59
TUCCI, C. E. M. (1998). Modelos hidrológicos. Porto Alegre: Associação Brasileira de
Recursos Hídricos.
UVO, C. B. (1998). Influence of sea surface temperature on rainfall and runoff in
northeastern South America: analysis and modeling. Department of Water Resources
Engineering, Lund Institute of Technology, Lund University, Sweden. Tese
(Doutorado)
UVO, C. B., REPELLI, C. A., ZEBIAK, S. e KUSHNIR, Y. (1998). The relationships
between tropical pacific and atlantic SST and the Northeast Brazil monthly
precipitation. Journal of Climate. Boston, v.11, p.551-562.
VALENÇA, M. J. S. e LUDERMIR, T. B. (1999a). Introdução às redes neurais. In:
Galvão, C. O., Valença, M. J. S. (Org.). Sistemas Inteligentes; aplicações a Recursos
Hídricos e ciências ambientais. Porto Alegre: Associação Brasileira de Recursos
Hídricos. p.19-59.
VALENÇA, M. J. S. e LUDERMIR, T. B. (1999b). Aplicações de redes neurais. In:
Galvão, C. O., Valença, M. J. S. (Org.). Sistemas Inteligentes; aplicações a Recursos
Hídricos e ciências ambientais. Porto Alegre: Associação Brasileira de Recursos
Hídricos. p.61-96.
WARD, M. N. e FOLLAND, C. K. (1991). Prediction of seasonal rainfall in the North
Nordeste of Brazil using eigenvectors of sea surface temperatures. International
Journal of Climatology. Chichester, v.11, p.711-743.
WILBY, R. L., WIGLEY, T. M. L., CONWAY, D., JONES, P. D., HEWITSON, B. C.,
MAIN, J. e WILKS, D. S. (1998). Statistical downscaling of general circulation model
output: a comparison of methods. Water Resources Research, Washington, v.34, n.11,
p.2995-3008.
WMO – WORLD METEOROLOGICAL ORGANIZATION (1997). Comprehensive
assessment of the freshwater resources of the World. Genebra: WMO.

Documentos relacionados