uma estimação do valor da commodity de açúcar utilizando redes

Transcrição

uma estimação do valor da commodity de açúcar utilizando redes
Disponível eletronicamente em
www.revista-ped.unifei.edu.br
Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Recebido em 15/03/2007. Aceito em 31/05/2008
ISSN 1679-5830
UMA ESTIMAÇÃO DO VALOR DA COMMODITY DE AÇÚCAR
UTILIZANDO REDES NEURAIS ARTIFICIAIS
Vinicius Amorim Sobreiro
Universidade de São Paulo
Departamento de Engenharia de Produção
[email protected]
Pedro Henrique de Sousa Leão Araújo
Universidade de São Paulo
Departamento de Engenharia de Produção
[email protected]
Michelle Magalhães Mendonça
Universidade de São Paulo
Departamento de Engenharia Elétrica
[email protected]
Marcelo Seido Nagano
Universidade de São Paulo
Departamento de Engenharia de Produção
[email protected]
RESUMO
O objetivo deste artigo é avaliar a aplicação de Redes Neurais Artificiais - RNAs, usando a
arquitetura Perceptron Multicamadas, na previsão do valor da commodity de açúcar. Tal
possibilidade permite fazer previsões dos preços futuros desse produto que é
comercializado e consumido no mundo inteiro. O método para realização da aplicação foi
proposta por Zhang et al. (1998). Como resultado foi demonstrado que a aplicação obteve
uma aproximação significante comparada às cotações reais, o que em conclusão evidência
a importância da RNAs como um método alternativo na estimação de valores para as
commodities a todos os atores envolvidos no setor sucroalcooleiro
Palavras-chave: Previsão de Preços, Commodity de Açucar, Redes Neurais Artificiais.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
AN EVALUATION OF APLLICATION OF ARTIFICIAL NEURAL
NETWORK FOR COMMODITY SUGAR PRICE FORECASTING
ABSTRACT
The aim of this paper is to evaluate the application of Artificial Neural Network using the
Perceptron Multilayer for commodity sugar price forecasting. This possibility highlights
the importance of ANN for the future price of commodity sugar. The methods were
proposed by Zhang et al. (1998). The obtained results demonstrate that ANN can be used
as an alternative method for commodity sugar price forecasting in sugar-alcohol field in
Brazil.
Keywords: Price Forecasting, Commodity Sugar; Artificial Neural Networks.
1. INTRODUÇÃO
Atualmente, o setor sucroalcooleiro brasileiro se destaca por sua importância no
contexto mundial da produção de álcool e de açúcar, já que esse setor é o maior produtor e
exportado do mundo desses mesmos produtos conforme observaram Lamounier et al. (2006)
em seu trabalho sobre a análise do trade-off na produção de açúcar e de álcool nas usinas da
região Centro-Sul do Brasil. De certa forma, como explicam com propriedade esses mesmos
pesquisadores, essa posição entre os principais produtores do mundo quando observada no
contexto nacional expõe a razão do cultivo da cana-de-açúcar ocupar um lugar de destaque
entre as principais fontes de renda da agricultura brasileira. Porém, esse setor apresenta uma
flexibilidade quanto à geração de açúcar ou de álcool, ou seja, em geral, as usinas são
construídas para geração de ambos.
Dentro desse enfoque, os gestores responsáveis pelo setor sucroalcooleiro formam
suas opiniões quanto à produção do açúcar ou do álcool considerando, principalmente, as
quantidades demandadas e ofertadas e o preço desses produtos no mercado interno e externo,
pois o principal objetivo dos gestores é proporcionar o maior lucro aos investidores. Assim,
posto que o preço tornou-se um dos imperativos para a gestão da produção dentro do setor
sucroalcooleiro, a previsão de preços futuros do açúcar ou do álcool auxilia os gestores nas
diversas tomadas de decisões necessárias para a gestão do setor sucroalcooleiro.
Dentre as diversas técnicas de previsão existentes na literatura especializada as Redes
Neurais Artificiais - RNAs vêm ganhando muita notoriedade por não requerer préespecificações ou estabelecimento de hipóteses e suposições sobre a distribuição estatística ou
propriedades dos dados e por apresentarem a capacidade de aprender sobre o relacionamento
das variáveis (DECO et al., 1997; THAWORNWONG e ENKE, 2004; HASSAN et al., 2007;
HUARNG e YU, 2006; MALIK e NASEREDDIN, 2006; ORMONEIT, 1999; STEINER e
WITTKEMPER, 1996; TERÄSVIRTAA et al., 2005).
As RNAs consistem uma área de pesquisa relativamente recente, mas de importância
crescente no grupo do conhecimento que envolve o campo da Inteligência Artificial. Segundo
Zhang et al. (1998), a aplicação de RNAs para previsão surgiu em 1968 com o trabalho de
Hu, que fazia previsões sobre o clima. Apenas, por volta de 1990 começam a surgir às
primeiras aplicações de RNAs no ambiente financeiro no EUA com o propósito de realizar
previsões. Atualmente, no Brasil existem várias pesquisas que contemplam RNAs para
estimação de preços, e dentre essas se destacam a pesquisa da utilização das RNAs para
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
previsão de séries temporais (DINIZ et al., 1998) e as pesquisas sobre a previsão do valor das
commodities no agro negócio (FREIMAN e PAMPLONA, 2005).
Com base nesse contexto, o objetivo deste artigo é avaliar a aplicação das RNAs na
previsão do preço da commodity açúcar. O preço desse produto foi escolhido como principal
foco de análise entre os produtos do setor sucroalcooleiro porque os autores obtiveram uma
série de dados completa do açúcar por um período de nove anos. Além disso, este trabalho
contribui com o quadro geral do conhecimento na área de preços agrícolas mediante a
exposição e análise de uma aplicação detalhada e bem sucedida sobre a utilização das RNAs
para a previsão da commodity de açúcar.
Para realizar essa avaliação, de acordo com Zhang et al. (1998), os critérios
metodológicos seguidos foram: (1) a definição da arquitetura que foi utilizada; (2) escolha da
função de ativação; (3) seleção do algoritmo; (4) normalização os dados; (5) treinamento e
teste da amostra; e (6) mensuração a performance da aplicação. Por conseguinte, os resultados
alcançados pela RNAs quando comparados com os dados reais das cotações demonstram a
utilidade da aplicação das mesmas para estimação do preço de commodities especialmente
para o açúcar.
O artigo está estruturado como se segue: a segunda seção apresenta uma revisão de
literatura sobre a commodity de açúcar e os conceitos básicos sobre as RNAs, já a terceira
seção demonstra os métodos utilizados, na quarta são expostos os resultados e finalmente na
quinta seção apresentam-se as discussões e conclusões.
2. REVISÃO DE LITERATURA
Com o propósito de fornecer as informações necessárias para a compreensão do tópico
abordado neste trabalho visando o seu objetivo, são apresentados os principais conceitos ou
apontamentos sobre a commodity de açúcar e sobre as RNAs.
2.1. Commodity de Açúcar
O açúcar é geralmente utilizado para alterar o sabor dos alimentos, de uma maneira
mais especifica, o mesmo serve para adoçar os alimentos e as bebidas. A forma mais comum
de açúcar é a sacarose em estado cristalino. Atualmente, o açúcar é produzido a partir da
beterraba ou da cana-de-açúcar.
Segundo Guarani (2008), antes da existência do açúcar conhecido atualmente, o mel
era utilizado para adoçar os alimentos. Além disso, o mesmo sugere que o açúcar surgiu na
Nova Guiné, contudo o açúcar ganhou destaque quando os portugueses descobriram que o
Brasil apresentava um solo fértil e um clima proprício para a cultural da cana-de-açúcar. Cabe
ressaltar, ainda, que em 1584 o Brasil, segundo Guarani (2008), já tinha 115 engenhos
funcionando e que os mesmos utilizavam aproximadamente 10.000 escravos como mão-deobra e que, já nessa época, a produção do açúcar era de cerca de 3000 tonelada ao ano.
Atualmente, de acordo com a União da Indústria de Cana de Açúcar – UNICA (2008),
a produção brasileira de cana-de-açúcar supera a marca de 426 milhões de toneladas na safra
2006/2007. Ainda com base nesse dados, o estado de São Paulo é entre os principais
produtores o responsável por aproximadamente 62% dessa produção. A Tabela 1 apresenta as
quantidades produzidas por estado brasileiro com base na safra de 2006/2007.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Tabela 1 - Produção de cana-de-açúcar, açúcar e álcool na safra de 2006/2007.
ESTADO
Ceará
R. G. Sul
Tocantins
Amazonas
Amazonas
Pará
Piauí
Sergipe
Maranhão
Bahia
R. G. Norte
Espirito Santo
Rio de Janeiro
Paraiba
Mato Grosso do Sul
Mato Grosso
Pernambuco
Goiás
Alagoas
Minas Gerais
Paraná
São Paulo
BRASIL
CANA-DE-AÇÚCAR (TON)
27.400
91.919
179.300
224.700
224.700
697.400
706.000
1.136.100
1.660.300
2.185.600
2.397.400
2.894.421
3.445.154
5.107.700
11.635.096
13.179.510
15.293.700
16.140.043
23.635.100
29.034.195
31.994.581
264.336.825
426.002.444
AÇÚCAR (TON)
1.500
0
0
15.700
15.700
5.100
0
50.400
2.700
115.700
259.000
48.949
262.104
154.000
440.997
540.200
1.357.300
765.717
2.136.900
1.911.700
2.105.974
19.507.637
29.681.578
ÁLCOOL (TON)
1.002
5.686
11.567
5.650
5.650
51.818
50.501
53.833
128.469
93.962
77.833
173.192
87.455
315.114
640.843
757.251
318.938
821.556
604.177
1.291.445
1.318.904
10.953.937
17.763.133
Fonte: Elaboração própria a partir dos dados do site da União da Agroindústria de São Paulo UNICA.
Segundo Lamounier et al. (2006), as usinas comercializam geralmente dois tipos de
açúcar, isto é, o açúcar cristal e o açúcar very high polarization - VHP. Geralmente, o açúcar
cristal é destinado ao mercado interno e o VHP é destinado ao mercado externo. Além desses
dois tipos de açúcar o setor também apresenta o açúcar orgânico e o açúcar líquido visando
atender e buscar novos clientes.
O açúcar destinado ao mercado exterior é produzido seguindo algumas características
físicas definidas por esse mercado a fim de estabelecer um padrão ou homogeneidade entre os
produtos. De certo modo, esse padrão permite que os produtos sejam transacionados em
bolsas de valores, assim todos os produtos que se encontram nesse contexto são conhecidos
como commodity. Nesse sentido, o objeto de estudo deste artigo é os preços da commodity de
açúcar, pois os mesmos influenciam diversas decisões dos gestores responsáveis pelo setor
sucroalcooleiro. O Gráfico 1 apresenta o comportamento do preço da commodity de açúcar do
período de janeiro de 2006 a junho de 2007 em dólar.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Gráfico 1 – Preço da commodity açúcar de Jan/2006 a Jun/2007.
Fonte: Elaboração própria a partir dos dados do site da União da Agroindústria de São Paulo UNICA.
Entretanto, a quantidade de açúcar exportada nesse mesmo período não apresentou o
mesmo comportamento observado quanto ao preço médio conforme mostra o Gráfico 2.
Gráfico 2 – Exportação do Açúcar no período de Jan/2006 a Jun/2007.
Fonte: Elaboração própria a partir dos dados do site da União da Agroindústria de São Paulo UNICA.
Uma das variáveis que influenciam esse comportamento como apontou Lamounier et
al. (2006) em seus estudos é o preço do álcool anidro, pois geralmente a usina escolhe entre a
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
produção de açúcar ou de álcool. Assim, o Gráfico 3 apresenta o comportamento do preço
médio do álcool para o período de Jan/2006 a Jun/2007 em dólar.
Gráfico 3 – Preço médio do álcool para o período de Jan/2006 a Jun/2007.
Fonte: Elaboração própria a partir dos dados do site da União da Agroindústria de São Paulo UNICA.
Dentro desse contexto é válido apresentar o comportamento da exportação do álcool.
Assim, o Gráfico 4 é representativo desse comportamento.
Gráfico 4
– Exportação do álcool para o período de Jan/2006 a Jun/2007.
Fonte: Elaboração própria a partir dos dados do site da União da Agroindústria de São Paulo
– ÚNICA
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Essas considerações sobre as oscilações do preço médio e as quantidades exportadas
do álcool e principalmente do açúcar no contexto dos produtos do setor sucroalcoleiro
ressaltam a importância dos trabalhos que abordam a questão de previsão dos preços da
commodities, pois tal questão é importante na formulação de estratégias que garantam não só
a sobrevivência das organizações do setor sucroalcoleiro em um ambiente volátil e
competitivo, mas a sobrevivência com vantagem sobre os concorrentes. Assim, no que tange
o seu objetivo, este artigo reveste-se de suma importância, pois consiste na avaliação da
aplicação das RNAs na previsão do preço da commodity de açúcar.
Dentro dessa tônica e com base no objetivo deste artigo a próxima seção abordará o
conceito de RNAs de maneira breve, porém acentuando todos as suas principais
características.
2.2. RNAs
As RNAs são compreendidas como métodos que aprendem com um exemplo
mediante funções de aproximação universal (HORNIK et al., 1989), ou seja, uma classe de
modelos não-lineares que permitem identificar padrões em dados (PAO, 2007). Ainda nessa
linha, as RNAs buscam imitar um sistema biológico, ou melhor, o cérebro humano, visto que
ambos compreendem um grande número de interconexões das unidades de processamentos
não-lineares chamadas de neurônios, que apresentam como principal função o armazenamento
e disponibilidade de informação (FREIMAN e PAMPLONA, 2005; RAZI e ATHAPPILLY,
2005; WIDROW et al., 1994). Nessa perspectiva, as RNAs demonstram características
semelhantes ao comportamento humano tais como:
•
Aprendem por experiência (RED’KO et al., 2005);
•
Associam diferentes padrões (ZHANG et al., 1998); e
•
Realizam generalizações às novas entradas ou inputs com bases em padrões anteriores
(CHAKRABORTY et al., 1992).
A sistematização das RNAs é realizada conforme o padrão de conexão entre várias
camadas das redes, os números de neurônios, a capacidade da aprendizagem e as funções de
ativação. De certa forma, a RNAs são conjuntos de entrelaçamentos no quais cada conexão
apresenta um peso a fim de ajustar os inputs de entradas aos outputs referentes à saída. Pao
(2007) tipifica as RNAs em regressão, probabilística e multicamadas, a Figura 1 apresenta
representações generalizadas dessas três tipologias.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Camada de Entrada
Camadas Escondidas 1
Camadas Escondidas 2
Camadas de Saída
h1 w1
X1
h2
X2
∑
w2
s
s/t
∑ t
wn
Camadas Escondidas
Camada de Entrada
y
h3
X3
Arquitetura Generalizada das RNAs para regressão.
Camada de Entrada
Camadas de Saída
Camadas Escondidas 1Camadas Escondidas 2
Z1
Z1
Camadas de Saída
X1
Arquitetura Generalizada das RNAs
Multicamadas.
ƒa(x)
X2
X3
Zn
ƒb(x)
Arquitetura Generalizada das RNAs probabilísticas.
Figura 1 - Arquiteturas generalizadas das RNAs
Fonte: Adaptado de Thawornwog e Enke (2005)
Ainda quanto a essas arquiteturas é válido destacar que para a tipologia caracterizada
como regressão a função de ativação, ou melhor, a função que transforma a soma dos inputs
ou entradas em um sinal de saída é representada pela Equação 1.
E[ y | x ] =
∫
∞
∞
yf ( x, y ) dy /
−∞
∫ f ( x, y)dy
(1)
−∞
Onde:
y
é o estimador;
x
é o peso do y ;
Ε y x é o valor esperado de y determinado por x ; e
f ( x, y ) é a função
para densidade de probabilidade continua em comum de x e y .
No caso da arquitetura probabilística a função de ativação é representada pela Equação
2.
f A ( x) =
1
(2π ) P / 2 σ P N
N
∑Z
i =1
i
(2)
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Onde:
f a (x) é a probabilidade da função estimadora para classe A;
P é dimensionado pelo treinamento do vetor;
Z i = exp[− Di /(2σ 2 )] é o resultados dos neurônios da camada escondida;
Di = ( x − u i ) T ( x − Qi ) é a distância entre os vetores x de entrada e o treinamento do vetor u da
categoria A; e
σ é o desvio padrão que atenua a estimação dos parâmetros.
Para as RNAs classificadas em multicamadas a função de ativação é representada pela
Equação 3.
y p + m = f ( y p , y p −1 ,..., y1 )
y p + m+1 = f ( y p +1 , y p ,..., y 2)
y n = f ( y n− m , y n − m−1 ,..., y n − m− p +1 )
(3)
Nessa tipologia, considera-se N observações de Y para o treinamento do conjunto M.
O principal objetivo é encontrar os pesos que fazem à ligação da camada escondida com os
dados de entrada, a fim de diminuir ao máximo a soma dos quadrados minimizando, assim, os
erros.
De forma geral essas três tipologias de RNAs são capazes de resolver a maioria dos
problemas de previsão de valor. Entretanto, existem outras tipologias desenvolvidas e
utilizadas para resolução de problemas mais complexos. Além disso, alguns pesquisadores
como Hassan et al. (2006) propõem a utilização de modelos híbridos, ou seja, a combinação
das RNAs com o modelo de Hidden Markov ou com algoritmos genéticos (HASSAN e
NATH, 2005), a fim de obter melhores resultados em seus ensaios. Para Menezes e Nikolaev
(2006) os modelos híbridos podem ser formados mediante RNAs e polinômios geneticamente
programados.
Além dessa caracterização, quando essas tipologias de RNAs apresentam uma camada
de entrada, uma ou mais camadas intermediárias, e uma camada de saída à mesma é
denominada como Perceptron Multicamadas, ou seja, uma arquitetura em camadas. Segundo,
(LNCC, 2008), as principais características do Perceptron Multicamadas são:
• Geralmente, essa arquitetura utiliza uma função de ativação não – linear como, por exemplo,
a função sigmóide, linear e hiperbólica
• Apresentar uma ou mais camadas ocultas, que lhe permite solucionar problemas complexos,
extraindo as características mais significativas dos padrões de entrada; e
• Possuir um alto grau de conectividade, o que permite uma maior interação entre os seus
componentes.
Complementando esse entendimento quanto ao Perceptron Multicamadas a Figura 2 a
seguir é representativa do mesmo.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Camada de Entrada
Camadas Ocultas
X1
Camada de Saída
X2
Xn
Figura 2 – Perceptron Multicamadas
Fonte: Adaptado de LNCC (2008).
Além disso, na aplicação das RNAs são utilizadas algumas técnicas de aprendizagem
visando à obtenção dos menores erros possíveis. Entre o conjunto de técnicas atualmente
existe o Backpropagation que é a mais utilizada e difundida, pois a mesma é de fácil aplicação
já que não apresenta conexões em loop. Nesse sentido, o Backpropragation foi utilizado neste
artigo como algoritmo de treinamento. Com base nesses conceitos, a próxima seção apresenta
os métodos utilizados para a realização da avaliação da aplicação das RNAs na previsão do
preço da commodity de açúcar.
3. MÉTODO
A partir da compreensão dos fundamentos que estruturam raciocínios relevantes as
RNAs, justificam-se a condução desta pesquisa, cujos procedimentos metodológicos são
classificados como pesquisa experimental, visto que, é determinado o objeto de estudo, ou
seja, o valor da commodity de açúcar e as variáveis possíveis de influenciá-lo, e a forma de
controle e observação sobre as mesmas.
O padrão do produto em estudo corresponde ao açúcar granulado, negociado no
mercado de São Paulo; o estado brasileiro com a maior representatividade na produção. O
açúcar é acumulado em bolsas de cinqüenta quilos, com mínimo de polarização de 99,7 graus,
máximo de 0,10% de umidade, cor freqüente como ICUMSA 130 - 180 cinzas no máximo,
ensacadas em bolsas novas de polipropileno, com o destino final o mercado interno.
As outras variáveis escolhidas com o objetivo de modelar o comportamento do valor
da commodity açúcar foram o Índice Geral de Preço de Mercado - IGP-M, e a taxa SELIC.
Respectivamente, o índice representa o ritmo adotado pela evolução dos preços como uma
medida que consolida de modo sintético a inflação nacional e a taxa demonstra o resultado
das negociações dos títulos públicos de governo, isto é, uma taxa de imposto básica da
economia brasileira.
Os dados, ou seja, os valores mensais utilizados para o experimento referente à
commodity açúcar no período de 1997 a 2006 foram coletados junto ao Centro de Estudos
Avançados em Economia Aplicada (CEPEA), um segmento do Departamento de Economia,
Administração e Sociologia (DEAS) da Escola Superior de Agricultura Luiz de Queiroz Esalq/USP. Os valores mensais referentes ao índice IGP-M e a taxa Selic, respectivos ao
mesmo período dos dados para a commodity foram obtidos do Instituto de Pesquisa
Econômica Aplicada – IPEA. No tocante aos critérios ou condições empregadas para
realização do processo de implementação da RNAs foram seguidos os propostos por Zhang et
al. (1998), conforme demonstrado na Figura 2.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Obtenção dos dados sobre a cotação da commodity açúcar, Índice Geral
de Preço - IGP-M e Taxa de Juros - Selic.
Definir
a
arquitetura
para a rede.
Escolher a
função
de
ativação.
Selecionar o
algoritmo de
treinamento.
Normalizar
todos
os
dados.
Fase 1
Fase 2
Fase 3
Fase 4
Treinar
testar
amostra.
Fase 5
e
a
Mensurar a
performance
da aplicação.
Fase 6
Dados
Métodos
Software
Resultados
Figura 3 – Métodos Utilizados
Fonte: Elaboração própria
O detalhamento sobre os procedimentos, ou seja, os critérios e condições utilizados e
o fornecimento de justificativa sobre os mesmos são apresentados na Tabela 2 com o
propósito de alcançar o objetivo deste artigo.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Tabela 2 - Detalhamento dos critérios e condições
CRITÉRIOS E CONDIÇÕES
1
FASES
Definir a
Arquitetura para
a rede.
UTILIZADAS
JUSTIFICATIVA
O tipo de rede utilizado neste artigo é de regressão, nesse caso, a
arquitetura mais fácil de se aplicar ou utilizar é Perceptron
Multicamada.
Perceptron
Multicamada
A função de ativação escolhida foi a Sigmóide, f ( x) = (1 + EXP(− x )) −1 ,
2
Escolher a
função de
ativação.
Sigmóide (Logística)
3
Selecionar o
algoritmo de
treinamento.
Backpropagation
elástico
4
Normalizar os
dados.
Mediante valores de
máximo e mínimo.
onde
f (x) é o valor esperado, EXP é o número neperiano elevado
a variável de entrada, e x é a variável de entrada.
O algoritmo e a função de treinamento Resilient Back-Propagation TRAINRP foram escolhidos devido à performance junto aos resultados
quando comparados a outros algoritmos e funções.
Para os aspectos de Hardware foi utilizado um processador AMD
Duron 1,10 GHz, 376 MB de Ram. O software utilizado como sistema
operacional foi Microsoft Windows XP Profissional versão 2002 com
Service Pack 2, já para treinar e aplicar a RNAs foi utilizado o
MATLAB da Mathworks. Contudo, o mesmo opera com valores
dentro do intervalo de 0 a 1, nesse sentido, os dados foram
 x 0 − x MIN

 x MAX
é o maior valor e x MIN
escalonados, por meio da função
valor observado,
5
Treinar e testar a
amostra.
6
Mensurar a
performance da
aplicação.
86% das observações
para o grupo de
treinamento e 14%
ao grupo de teste.
x MAX
éo
é o menor valor no
conjunto de valores.
Os dados mensais do período analisado correspondem a 111 valores
dos quais 95 foram destinados ao treinamento e 16 ao teste. Tal
escolha é fundamenta no princípio exposto por Zhang et al. (1998) no
qual o grupo de observações é destinado ao treinamento deve ser o
maior possível a fim de fornecer os melhores resultados quando as
RNAs forem aplicada ao grupo de teste.
A performance preditiva da RNAs é abordada sob a convicção do erro
^
Erro quadrático
médio.

 , na qual x0

2
quadrático médio, SSE = ∑ (Y1 −Y 1 ) onde
SSE
é o erro
^
quadrático médio, Y1 é a variável ou valor observado, e
variável estimada pelo modelo.
Y1é a
Fonte: Elaboração própria.
Os resultados obtidos a partir da adoção de tais critérios e condições foram ajustados e
examinados também considerando algumas propriedades da RNAs, visando o melhor
resultado, tomando como base o erro quadrático médio. Nesse sentido, a Tabela 3 apresenta
os parâmetros adotados quanto ao número de neurônios, camada escondida, taxa de
aprendizagem e de época.
Tabela 3 - Propriedades da RNAs
PROPRIEDADES DA RNAs
Função de Treinamento
Número de camadas escondidas
Taxa de aprendizagem
Número de épocas
Erro padrão
1º TESTE
TRAINGDA
11
0,001
100
1,4763
2º TESTE
TRAINRP
11
0,001
100
0,5527
3º TESTE
TRAINRP
15
0,001
100
1,2448
Fonte: Elaboração própria.
Dessa perspectiva de comparação das propriedades consideradas na rede as mais
adequadas foram as do segundo teste por apresentarem o menor erro quadrático médio.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
4. RESULTADOS OBTIDOS
Com o objetivo de aplicar RNAs nos valores da commodity de açúcar considerando os
métodos expostos na seção anterior os resultados obtidos são apresentados na Tabela 4. Na
mesma é possível observar os valores reais da cotação da commodity e os valores estimados
pela RNAs.
Tabela 4 - Resultados obtidos pela RNA
Valores Observados
Valores Reais da Cotação
Valores Estimados Pela
RNA
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
26,24
26,13
29,19
30,51
31,80
33,69
34,28
39,15
47,80
51,55
51,72
50,61
48,56
49,72
50,25
45,02
44,73
19,00
13,73
17,24
40,80
20,46
45,30
42,22
36,96
51,25
45,68
42,12
41,91
46,28
51,20
45,77
Diferenças Entre Valores
Reais da Cotação e
Estimados Pela RNAs
-18,49
7,14
15,46
13,27
-9,00
13,23
-11,02
-3,07
10,85
0,30
6,04
8,49
6,65
3,43
-0,95
-0,75
Fonte: Elaboração própria.
Notavelmente, conforme constado por Freiman e Pamplona (2005) no caso da
previsão para a commodity do agro negócio os valores tendem aproximação próximos aos
últimos valores analisados. O Gráfico 5 apresenta a comparação dos resultados obtidos pelas
RNAs com os valores reais da cotação.
Valor da Commodity
60,00
50,00
40,00
30,00
20,00
10,00
0,00
96
97
98
99
100 101 102 103 104 105 106 107 108 109 110 111
Observação
Valores Reais da Cotação
Valores Estimados Pela Rede
Gráfico 5 - Comparação entre valores reais e obtidos
Fonte: Elaboração própria.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Porém, cabe destacar que nesse período de análise ocorreram variações significativas
no IGP-M, principalmente nos valores observados 101 a 104. Essas variações certamente
influenciaram na diferença entre o valor real e o previsto, que já estavam convergindo à zero.
O comportamento para o mesmo período de análise do Gráfico 5 do IGP-M e da Taxa Selic
são apresentados no Gráfico 6.
2
1,5
Valores
1
0,5
0
96
97
98
99
100 101 102 103 104 105 106 107 108 109 110 111
-0,5
-1
Observação
IGP-M
Selic
Gráfico 6 – Comportamento do IGP-M e da Taxa Selic
Fonte: Elaboração própria.
Essa diferença entre os dados reais e estimados provavelmente ocorre porque a RNAs
podem se usadas de forma eficiente para fazer previsão dos valores durante períodos que são
semelhantes ao passado, assim, a RNAs é capaz reconhecer facilmente situações históricas,
entretanto, quando há uma grande variação durante o tempo essa capacidade é limitada.
5. DISCUSSÕES E CONCLUSÕES
O produto açúcar sempre foi uma mercadoria de destaque no Brasil a partir de sua
colonização até os dias atuais. Sua importância é de tamanha proporção que atualmente o
Brasil ocupa a posição de maior produtor e exportador desse produto. Entretanto, conforme
muito bem apontado por Lamounier et al. (2006) existe um trade-off entre a produção do
açúcar e a produção do álcool, pois as usinas geralmente são projetadas para a produção de
ambos. Nessa perspectiva, um dos principais indicadores utilizados pelos gestores e usineiros
são os preços que ambos podem alcançar no mercado interno e principalmente no mercado
externo, já que esses produtos são commodities comercializadas no mundo inteiro.
Com base nesse contexto existem diversas técnicas, ou seja, vários conjuntos de
procedimentos metódicos empregados para obter um determinado resultado considerando um
modo ordenado de se proceder que primam pela previsão de valores futuros para um
determinado objeto de estudo. Todavia, as técnicas geralmente utilizadas apresentam algumas
limitações, ou melhor, para que seja realizada a sua aplicação alguns apontamentos devem ser
observados e seguidos como, por exemplo, os dados devem apresentar uma distribuição
normal e uma variância constante (homocedasticidade). Assim, uma técnica que vem sendo
utilizada para a realização da previsão de valores futuros é a RNAs, pois a mesma possibilita a
realização da previsão sem que esses pré-requisitos sejam observados.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
Consequentemente, com base nessas indicações, o objetivo desse trabalho foi avaliar a
aplicação das RNAs na previsão do preço da commodity de açúcar. Os métodos utilizados
para a realização dessa avaliação conforme apresentados na terceira seção deste artigo foram
os indicados e sugeridos por Zhang et al. (1998) em um artigo clássico sobre o estado da arte
de RNAs. Entre esses procedimentos se sobressai à utilização do erro quadrático médio como
medida de erro agregado, pois o mesmo possibilita a comparação com outras técnicas
proveniente dos modelos econometricos clássicos.
Os resultados obtidos são satisfatórios, pois quanto ao objeto de estudo demonstram a
eficiência alcançada pela RNAs no que tange a previsão de valores futuros. Além disso, em
um contexto maior tais resultados validam a utilização das técnicas de RNAs no contexto da
previsão de preços agrícolas se tornando uma ferramenta capaz de oferecer aos gestores das
usinas e até aos atores do governo informações que permitam a melhor tomada de decisão.
Entretanto, todos esses resultados são delimitados ao foco deste estudo e outras características
particulares como, por exemplo, pela quantidade de dados disponíveis sobre o setor
açucareiro no Brasil, visto que os dados utilizados foram coletados de forma mensal, ou seja,
cento e onze observações representam apenas nove anos de acompanhamento.
Ainda nesse escopo algumas sugestões de pesquisas futuras são propostas: (a) a
realização da comparação do desempenho da RNAs com os modelos clássicos de previsão
como o modelo ARIMA da metodologia Box-Jenkins; (b) uma análise sobre o desempenho
da RNAs com o acréscimo de outras variáveis como, por exemplo, quantidades produzidas de
açúcar e álcool, o preço do álcool e o preço de outros produtos agrícolas, e (c) a aplicação
conjunta de RNAs com algoritmos genéticos. Ademais, a evolução do conhecimento, e
conseqüentemente da tecnologia, possibilita de forma eficiente a transformação de dados em
informações. Cabe aos pesquisadores ou dirigentes das organizações identificarem a melhor
maneira de beneficiar-se da associação dos avanços tecnológicos com os métodos e
ferramentas matemáticas desenvolvidas.
REFERÊNCIAS BIBLIOGRÁFICAS
CHAKRABORTY, Kanad; MEHROTRA, Kishan; MOHAN, Chilukuri K.; RANKA, Sanjay.
Forecasting the behavior of multivariate time series using neural networks, Neural
Networks, Volume 5, Issue 6, November-December 1992, Pages 961-970.
DECO, Gustavo; NEUNEIER, Ralph; SCHÜRMANN, Bernd. Non-parametric Data
Selection for Neural Learning in Non-stationary Time Series, Neural Networks, Volume
10, Issue 3, April 1997, Pages 401-407.
DINIZ, H.; ANDRADE, L. C. M.; CARVALHO, A. C. P. L. F.; ANDRADE, M. G.
“Previsão de Séries Temporais Utilizando Redes Neurais Artificiais e Modelos de Box &
Jenkins”. V Simpósio Brasileiro de Redes Neurais, 1998, Belo Horizonte.
ENKE, David; THAWORNWONG, Suraphan. The adaptive selection of financial and
economic variables for use with artificial neural networks, Neurocomputing, Volume 56,
January 2004, Pages 205-232.
ENKE, David; THAWORNWONG, Suraphan. The use of data mining and neural
networks for forecasting stock market returns, Expert Systems with Applications,
Volume 29, Issue 4, November 2005, Pages 927-940.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
FREIMAN, José Paulo; PAMPLONA, E. O. Redes Neurais Artificiais na Previsão do
Valor de Commodity do Agronegócio. In: V Encuentro Internacional de Finanzas, 2005,
Santiago. Anais do V Encuentro Internacional de Finanzas, 2005.
GUARANI. História do Açúcar.
Acesso em: 12 mar. 2008.
Disponível em: <http://www.acucarguarani.com.br>.
HASSAN, M. R.; NATH, B. Stock market forecasting using hidden markov model: a new
approach. In Proceedings of 5th international conference on intelligent system design and
application (pp. 192–196). 2005 Poland.
HASSAN, Md. Rafiul; NATH; B.; KIRLEY, M. A fusion model of HMM, ANN and GA
for stock market forecasting, Expert Systems with Applications Volume 33, Issue 1, , July
2007, Pages 171-180.
HORNIK, K.; STINCHCOMBE, M.; WHITE, H. Multi-layered feedforward networks are
universal approximators. Neural Networks, Volume 2, Issue 3, November 1989, Pages 359–
366.
HUARNG, Kunhuang; YU, Tiffany Hui-Kuang. The application of neural networks to
forecast fuzzy time series, Physica A: Statistical Mechanics and its Applications, Volume
363, Issue 2, 1 May 2006, Pages 481-491.
LAMOUNIER, W. M; CAMPOS FILHO, M. F; BRESSAN, A. A. Análise do trade-off na
produção de açúcar e álcool nas usinas da região Centro-Sul do Brasil. In: 44 Congresso
Brasileiro de Economia e Sociologia, Rural, 2006, Fortaleza - CE. Anais do 44 Congresso
Brasileiro de Economia e Sociologia Rural, 2006.
LNCC. Tutorial de Redes Neurais.
Acesso em: 20 mar. 2008.
Disponível em: <http://www.lncc.br/frame.html>.
MALIK, Farooq; NASEREDDIN, Mahdi. Forecasting output using oil prices: A cascaded
artificial neural network approach, Journal of Economics and Business, Volume 58, Issue
2, March-April 2006, Pages 168-180.
MENEZES, Lilian M.; NIKOLAEV, Nikolay Y. Forecasting with genetically programmed
polynomial neural networks, International Journal of Forecasting, Volume 22, Issue 2,
April-June 2006, Pages 249-265.
ORMONEIT, D. A regularization approach to continuous learning with an application to
financial derivatives pricing, Neural Networks, Volume 12, Issue 10, December 1999, Pages
1405-1412.
PAO, Hsiao-Tien. Forecasting electricity market pricing using artificial neural networks,
Energy Conversion and Management Volume 48, Issue 3, March 2007, Pages 907-912.
RAZI, Muhammad A.; ATHAPPILLY, Kuriakose. A comparative predictive analysis of
neural networks (NNs), nonlinear regression and classification and regression tree
(CART) models, Expert Systems with Applications, Volume 29, Issue 1, July 2005, Pages
65-74.
RED'KO, Vladimir G.; MOSALOV, Oleg P.; PROKHOROV, Danil V. A model of evolution
and learning, Neural Networks, Volume 18, Issues 5-6, IJCNN 2005, July-August 2005,
Pages 738-745.
STEINER, M; WITTKEMPER, H-G. Using neural networks to forecast the systematic
risk of stocks. European Journal of Operational Research 1996, Pages 577-588.
Sobreiro et al. / Revista P&D em Engenharia de Produção Nº. 7 (2008) p. 36-52
TERÄSVIRTA, Timo; DIJK, Dick van; MEDEIROS, Marcelo C. Linear models, smooth
transition autoregressions, and neural networks for forecasting macroeconomic time
series: A re-examination, International Journal of Forecasting, Volume 21, Issue 4,
Nonlinearities, Business Cycles and Forecasting, October-December 2005, Pages 755-774.
UNICA. Memória. Disponível em: <www.portalunica.com.br>. Acesso em: 13 mar. 2008.
WIDROW, B.; RUMELHART, D. E.; LEHR, M.A.. Neural networks: Applications in
industry, business and science. Communications of the ACM, Volume 37, Issue 3, 1994,
Pages 93-105.
ZHANG, Guoqiang; PATUWO, B. Eddy; HU, Michael Y, Forecasting with artificial
neural networks: The state of the art, International Journal of Forecasting, Volume 14,
Issue 1, March 1998, Pages 35-62.

Documentos relacionados