UM ESTUDO COMPARATIVO ENTRE ARQUITETURAS NEURAIS

Transcrição

Anais do XIX Congresso Brasileiro de Automática, CBA 2012.
UM ESTUDO COMPARATIVO ENTRE ARQUITETURAS NEURAIS APLICADAS A
UM ROBÔ AUTÔNOMO EM TRAJETÓRIA ORIENTADA
Hugo V. D. Silva, Wylliam S. Gongora, Alessandro Goedtel, Marcos B. R. Vallim
Universidade Tecnológica Federal do Paraná - UTFPR
Programa de Pós-Graduação em Engenharia Elétrica
Av. Alberto Carazzai, 1640, Cornélio Procópio, Paraná, Brasil
E-mails: [email protected], [email protected], [email protected],
[email protected]
Abstract— This article has the objective to contribute to the study of artificial neural networks by comparing
the different architectures applied to control navigation of a line follower robot. This autonomous navigation
R
kit, and its goal is to shift on a specific track the trajectory to be
device is built with Lego Mindstorms NXT
followed. Two different paths are constructed where the networks are trained and validated. This paper presents
comparison between the data and the evolution of the robot for each neural network topology.
Keywords—
Robot line follower, navegation control, artificial neural network, recurrent networks.
Resumo— Este artigo tem o objetivo de contribuir para os estudos da redes neurais artificias comparando
as diferentes arquiteturas aplicadas ao controle de navegação de um robô seguidor de linha. Este dispositivo de
R
, e seu objetivo é o deslocamento sobre
navegação autônoma é construı́do com o kit Lego Mindstorms NXT
uma faixa que especı́fica a trajetória à ser seguida. São construı́dos dois percursos diferentes onde as redes são
treinadas e validadas. O artigo apresenta a comparação entre os dados e a evolução do robô para cada topologia
de rede neural.
Palavras-chave—
1
Robô seguidor de linha, controle de navegação, redes neurais artificiais, redes recorrentes.
Introdução
No inı́cio dos anos 60 os primeiros robôs foram desenvolvidos com o principal objetivo de substituir
os humanos nas realizações de tarefas consideradas perigosas ou em casos de extremo esforço fı́sico, podendo destacar a manipulação e armazenamento de peças utilizadas no ambiente industrial
(Pazos, 2002).
Atualmente os robôs estão presentes nas mais
diversas áreas, sendo que em algumas aplicações,
é necessário que o robô seja capaz de definir uma
trajetória de deslocamento.
O problema de controle de robôs móveis exibe
dois subproblemas principais; sendo a navegação,
a qual designa a determinação de posição e orientação do veı́culo em um dado instante de tempo, e
a guiagem referente ao controle da trajetória (Lora
et al., 1998; Chen et al., 2011).
Nos últimos anos, com a capacidade computacional aumentada e a minimização dos hardwares,
tornou-se possı́vel a entrada dos sistema inteligentes aplicados a navegação de robôs móveis, criando
o conceito de navegação autônoma e automática
(Steels, 1995; Oliveira, 2010).
Segundo Steels (1995), um agente autônomo é
definido por um elemento que além de agir por si
só, consegue se auto-regular gerando suas próprias
regras de controle. Assim, pode-se diferenciar um
agente autônomo de um automático. Este, por sua
vez, visando realizar as tarefas já estabelicidas,
interage com o ambiente a que está inserido.
Os sistemas inteligentes têm sido utilizados na
resolução dos problemas relativos a trajetória de
robôs. Tais sistemas são baseados na Lógica Nebulosa (LN), Algoritmos Genéticos (AG) e Redes
ISBN: 978-85-8001-069-5
Neurais Artificias (RNAs).
Neste contexto, a LN é empregada para determinar a trajetória a ser seguida, onde suas regras
de implicação definem a maneira em que será executado o percurso (Gartner e Astolfi, 1996; Lee
et al., 2003; Dongshu et al., 2011).
O AG é empregado para determinar as possı́veis trajetórias que o robô pode percorrer. Uma
vez determinado o conjunto de soluções, este método tem por objetivo encontrar a resposta ótima
ao problema de trajetória (Siciliano, 2006).
As RNAs, também se mostram eficazes na
sı́ntese de arquiteturas de controle em navegação de robôs. Estas se caracterizam por modelos de aprendizagem que apresentam um grande
poder de representação de conhecimento, possuindo ainda as caracterı́sticas de generalização
(Cazangi, 2004).
A proposta deste trabalho é apresentar um estudo comparativo entre as estruturas neurais aplicadas no controle de trajetória do robô seguidor
de linha, construı́do com o kit Lego Mindstorm
R
NXT
. Os sinais dos sensores de luminosidade
do robô são as entradas da rede, e as saı́das da
RNA são diretamente repassadas aos motores, garantindo a permanência do robô em sua trajetória
sobre uma linha. As caracterı́sticas de cada topologia, os parâmetros de treinamento e a organização dos dados são relatadas neste trabalho.
O artigo está estruturado da seguinte forma:
a Seção 2 descreve os modelos das RNAs utilizadas. Na Seção 3, as caracterı́sticas construtivas
do robô e os percursos utilizados são detalhados.
A Seção 4 apresenta um estudo comparativo entre as aplicações das arquiteturas. Finalizando, na
Seção 5 as conclusões são apresentadas.
3445
2
Modelos das Redes Neurais Artificiais
As RNAs são sistemas computacionais para processamento de informações paralelas tendo uma
composição simples de unidades de processamento
interligadas entre si (Haykin, 2001). As RNAs
são modelos computacionais inspirados no sistema
nervoso de seres vivos as quais são interligadas por
um grande número de conexões conhecidas como
sinapses artificiais.
Utilizando como base a Figura 1, onde é proposto o modelo do neurônio artificial, tem-se que o
processamento das informações ocorre por cálculos matriciais matemáticos onde cada unidade de
processamento (ω) imputa um peso ao dado de entrada (x) e este, por sua vez, após um somatório
das entradas ponderadas e o bias (θ), é processado por uma função de ativação (f (u)). Assim
obtém-se uma resposta (y) a qual a rede foi treinada (Rosenblatt, 1958).
Assim pode-se dizer que as RNAs são empregadas para classificar padrões, analisar séries
temporais, minerar dados, agrupar resultados e
como aproximador universal de funções baseadas no conhecimento previamente adquirido e sua
capacidade de generalização das situações (Silva
et al., 2010).
Quando aplicadas ao controle de trajetória,
estas redes utilizam-se da capacidade de generalização para processar os dados não apresentados
em seu treinamento na finalidade de manter a orientação ao objetivo definido.
2.1
Redes Perceptron Múltiplas Camadas
As redes Perceptrons Múltiplas Camadas (PMC)
tem por base a estrutura apresentada por Rosenblatt (1958). A diferença consiste na arquitetura a
qual apresenta uma ou mais camadas intermediárias, onde podem estar contidos desde um simples
neurônio a inúmeros, como visto na Figura 2.
Figura 1. Neurônio Artificial
Os modelos matemáticos destas unidades tendem a imitar o processamento de informações de
um neurônio cerebral humano (Hebb, 1949), e
desta forma adquirem a capacidade de aprendizagem e generalização do conhecimento.
As equações 1 e 2 expressam a relação da saı́da
(y) com as entradas (xi ) dos neurônios. Sendo
o processamento, um somatório do produto das
entradas por seus respectivos pesos e considerando
n o número total de neurônios, tem-se:
u=
n
X
Figura 2. Modelo de uma PMC
Considerando que as entradas de cada camada
são os valores da multiplicação matricial de todos
os elementos da camada anterior pelo seus respectivos pesos, pode-se descreve esta operação pelas
equações 3 e 4 (Haykin, 2001; Silva et al., 2010).
I1j =
ω1ji xi ; j = 1...N1
(3)
ω2ji y1i ; j = 1...N2
(4)
i=0
(ωi xi ) − θ
(1)
i=1
y = f (u)
(2)
Haykin (2001), descreve que uma rede neural
extrai seu poder computacional máximo através
de sua estrutura e sua habilidade de aprender e
generalizar. As saı́das da RNA representam o sistema em questão mesmo recebendo entradas que
não estavam no processo de treinamento sem alterar resultados.
De acordo com Wasserman e Schwartz (1988),
o conhecimento se trata de uma informação ou
mesmo um modelo que é utilizado por pessoas ou
máquinas a fim de interpretar, prever e responder
apropriadamente aos estı́mulos do mundo exterior.
ISBN: 978-85-8001-069-5
n
X
I2j =
n
X
i=0
Sendo que j é o número de entradas da camada, e N1 e N2 são os números de neurônios
presentes nas respectivas camadas.
A função de ativação de cada neurônio deve
ser derivável em todo o seu intervalo. Como exemplo pode-se utilizar a função logı́stica apresentada
na equação 5, onde o termo a determina a evolução da reta. Em alguns casos, utiliza-se a variação
da saı́da da função de ativação entre −1 e 1, caracterı́stica da função tangente hiperbólica, mostrada
na equação 6.
3446
f (u) =
f (u) = tgh
1
1 + e−ax
(5)
x
1 − e−x
=
2
1 + e−x
(6)
Logo, aplicando o conjunto de saı́da de cada
camada (n) a equação 2, obtém-se os vetores mostrados nas equações 7 e 8.
Figura 3. Modelo de uma TDNN
y1j = f (I1j ); j = 1..N1
(7)
y2j = f (I2j ); j = 1..N2
(8)
Também se define que seu treinamento é realizado de forma supervisionada, fazendo com que
a rede ajuste adequadamente seus pesos para melhor atender os objetivos determinados. As variações dos pesos são obtidas pelo somatório das diferenças entre os valores calculados e os desejados,
multiplicados por um coeficiente de aprendizado
(η). Onde p, é o número de amostras utilizadas
no treinamento, definido pela equação 9.
∆ω = η.
p
X
(dj (k) − yj (k))x(k)
(9)
k=1
Assumindo que a diferença entre o valor desejado (dj ) e a saı́da (yj ) da RNA diminui a cada
época de treinamento, utiliza-se a função do erro
quadrático médio para mensurar o desvio das respostas produzidas pelos neurônios, conforme mostrada na equação 10.
p
EM =
2.3
PMC com saı́das recorrentes às entradas
Esta estrutura PMC, conhecida como Nonlinear
Auto-Regressive with Exogenous Inputs (NARX),
possui uma lembrança das saı́das anteriores. Suas
respostas são atrasadas de uma unidade de tempo
e posteriormente reapresentadas as entradas, produzindo uma melhor resposta de generalização da
rede (Leontaritis e Billings, 1985).
Seus dados são organizados considerando um
atraso de (p) amostras para as entradas, que são
deslocadas dentro do vetor de entrada. Da mesma
forma, as saı́da recorrentes são atrasadas de (q)
amostras, e realocadas no sentido decrescente. A
topologia desta RNA é mostrada na Figura 4.
N
2
1 XX
2
(dj (k) − yj (k))
2p
j=1
(10)
k=1
Desta forma é possı́vel acompanhar o desempenho do treinamento da rede e determinar um
valor mı́nimo de EM para convergência dos resultados na busca dos melhores pesos.
2.2
PMC com entradas atrasadas no tempo
Uma rede neural normalmente utilizada para realizar processamento temporal é a Time Delay
Neural Network (TDNN), que utiliza a arquiterura PMC e possui a caracterı́stica de predizer os
valores posteriores utilizando as entradas anteriores apresentadas a rede (Lang e Hinton, 1988).
As redes TDNN possuem um atraso em suas
entradas de p amostras, como apresentado na Figura 3.
O processo de aprendizado de uma PMC com
entradas atrasadas é semelhante a PMC convencional (Silva et al., 2010). Sendo assim, sua principal diferença está nos conjuntos de dados, onde as
amostras são organizadas considerando o atraso
entre elas.
ISBN: 978-85-8001-069-5
Figura 4. Modelo da rede NARX
Assim, pode-se dizer que esta topologia apresenta uma memória, pois utiliza-se dos valores
passados que são atualizados a cada passo de cálculo, sendo capaz de produzir respostas atuais e
também futuras.
Estas estruturas, quando aplicadas ao controle de trajetória do robô, demonstram a capacidade de generalização e melhoram a dinâmica do
agente em sua trajetória.
3447
3
O robô e os percursos utilizados
O robô seguidor de linha possui como caracterı́stica a movimentação por uma superfı́cie buscando
manter-se sobre uma trajetória referencial. Esta
trajetória especı́fica ao robô o caminho que deve
ser seguido, sendo determinada por uma linha fixa
na superfı́cie.
3.1
Sensores e Atuadores
R
O kit Lego Mindstorms NXT
possui vários tipos de sensores, tais como sensor de toque, som,
luminosidade, distância, entre outros.
Neste trabalho são utilizados dois sensores de
luminosidade para determinar a trajetória a seguir, como pode ser observado na Figura 6.
Levin e Mioduser (1996), propuseram a montagem de um robô utilizando um sensor de luminosidade e dois motores. Nesta estrutura, a rotina
de controle busca encontrar o limite da linha de
referência, alternando o acionamento dos motores
responsáveis pelo deslocamento. Assim, pode-se
dizer que é realizado um controle por histerese,
mantendo o sinal do sensor de luminosidade dentro de uma faixa de operação determinada.
Neste trabalho, opta-se pela substituição da
técnica de controle por histerese por uma proposta
de controle inteligente, onde uma RNA é responsável pelo processamento dos sinais do robô. Tendo
assim um deslocamento contı́nuo sem realizar paradas alternadas dos motores.
O robô seguidor de linha utilizado nesta proposta possui dois sensores de luminosidade, com
a função de perceber o ambiente, e dois motores de corrente contı́nua para o seu deslocamento.
Com base na plataforma do kit Lego Mindstorm
R
NXT
, o robô tem sua estrutura mostrada na Figura 5.
Figura 6. Esquemático do robô seguidor de linha
Os sensores de luminosidade operam com um
par de emissor e receptor, medindo o grau de reflexão da luz vermelha emitida sobre a superfı́cie.
O sinal adquirido pelos sensores (S1 e S2), variam
entre 0 a 100%, e estes valores são ponderados e
repassados como entradas da rede (x1 e x2 ). Os
sinais de controle (y1 e y2 ) são gerados pela RNA e
repassados diretamente aos atuadores (Motor A e
Motor B), que são responsáveis pelo deslocamento
no percurso e correção da trajetória.
3.2
Figura 5. Robô Lego
R
O kit Lego Mindstorm NXT
possui um
bloco programável NXT (brick ) que dispõe de
quatro entradas para sensores e três saı́das para
motores. Um processador ARM 7TM é responsável pela execução do algoritmo, gerenciamento dos
drivers de acionamento dos motores e comunicação com os sensores externos. O dispositivo é alimentado por uma bateria interna, o que dispensa
a utilização de fontes de energia conectadas ao experimento.
ISBN: 978-85-8001-069-5
Processamento e comunicação
O processo de aprendizagem para todas as topologias propostas é realizado de modo off-line. Assim
o treinamento da rede é realizado fora do ambiente
de operação.
Os dados coletados são repassados ao computador utilizando uma conexão Bluetooth. O sinal
do controlador é processado e então devolvido ao
agente, garantindo assim a total liberdade de movimento ao robô desenvolvido.
Um dado considerado na velocidade de comunicação é o tempo de envio e retorno dos pacotes, sendo para estes equipamentos de aproximadamente 150 ms.
3.3
Percursos utilizados
Para demonstrar a aplicabilidade e desempenho
das RNAs em problemas de navegação autônoma
com trajetória orientada, foram utilizados dois
percursos para testes. O primeiro percurso é um
circuito elı́ptico, composto de curvas de 12 cm de
raio, com um perı́metro reduzido. Com este percurso busca-se visualizar as tendências dos movimentos do robô.
3448
Já no percurso avançado, procura-se explorar
o desempenho na execução de caminhos sinuosos.
Este percurso possui curvas para ambos os lados e,
além das curvas abertas, algumas acentuadas que
formam ângulos de 90o . Na Figura 7 são apresentados os dois circuitos utilizados para os testes.
Figura 7. Circuito elı́ptico e circuito avançado
4
Comparativo entre arquiteturas neurais
As redes neurais têm sido aplicadas em problemas associados à navegação autônoma (Cazangi,
2004), tendo em vista sua capacidade de aprendizado, adaptação e generalização (Haykin, 2001).
Assim, a proposta deste artigo é apresentar um estudo comparativo entre três arquiteturas neurais
aplicadas a um robô seguidor de linha. A Figura
8 apresenta a metodologia proposta neste artigo.
Figura 8. Esquemático controle de trajetória
As entradas das RNAs são os sinais ponderados dos sensores de luminosidades do robô (x1 e
x2 ) e as suas saı́das (y1 e y2 ) são os sinais aplicados aos motores. Para a coleta dos dados de
treinamento, o robô é deslocado manualmente pelos circuitos e os valores obtidos dos sensores de
entradas juntamente com a leitura dos sinais de
saı́das dos atuadores são transmitidos e armazenados em uma matriz de dados no computador
pessoal. Utilizando a matriz coletada, esta é reorganizada considerando a topologia da construção
da RNA.
4.1
Caracterização das estruturas neurais
Três arquiteturas de RNAs foram abordadas neste
estudo; a PMC, a TDNN e a NARX. A Tabela 1
apresenta um resumo dos parâmetros das RNAs
utilizadas neste artigo.
ISBN: 978-85-8001-069-5
Tabela 1. Caracterı́sticas das RNAs
Tipo
Arquitetura
Treinamento
No Camada
intermediaria
Neurônios
1 camada
Neurônios
saı́da
Algoritmo de
Treinamento
Função de
ativação
1 camada
Função de
ativação
saı́da
Entradas
atrasadas
Saı́das
recorrentes
Rede 1
PMC
PS
1
Rede 2
TDNN
PS
1
Rede 3
NARX
PS
1
10
3
3
2
2
2
BP
BP
BP
Função
Logı́stica
Tangente
Hiperbólica
Tangente
Hiperbólica
Função
Logı́stica
Função
Linear
Função
Linear
-
10
10
-
-
10
(BP) Backpropagation
(PS) Supervisionada
Tais parâmetros foram obtidos através do treinamento supervisionado das redes, aplicando o
método de validação cruzada. A organização dos
dados e sua apresentação as redes são descritas na
Tabela 2.
Tabela 2. Organização
Entradas Rede1
1
x1 (t)
2
x2 (t)
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
-
das entradas das RNAs
Rede 2
Rede 3
x1 (t)
x1 (t)
x2 (t)
x2 (t)
x1 (t − 1) x1 (t − 1)
x2 (t − 1) x2 (t − 1)
x1 (t − 2) x1 (t − 2)
x2 (t − 2) x2 (t − 2)
x1 (t − 3) x1 (t − 3)
x2 (t − 3) x2 (t − 3)
x1 (t − 4) x1 (t − 4)
x2 (t − 4) x2 (t − 4)
x1 (t − 5) x1 (t − 5)
x2 (t − 5) x2 (t − 5)
y1 (t − 5)
y2 (t − 5)
y1 (t − 4)
y2 (t − 4)
y1 (t − 3)
y2 (t − 3)
y1 (t − 2)
y2 (t − 2)
y1 (t − 1)
y2 (t − 1)
Os parâmetros referentes ao treinamento das
redes, tais como o Erro Quadrático Médio (EQM),
coeficiente de aprendizado e número de épocas de
treinamento são especı́ficos para cada topologia,
conforme pode ser visto na Tabela 3.
3449
Tabela 3. Parâmetros de treinamento das RNA
Tipo
Rede 1 Rede 2 Rede 3
EQM
10−6
10−9
10−7
Coef. Aprendizado
0,1
0,01
0,001
Épocas
500
300
1000
nado, já para o sentido contrário apresenta erros
na execução das curvas.
A Rede 1 foi treinada com um EQM objetivo
de ε = 10−6 e um coeficiente de aprendizado de
η = 0, 1, sendo necessárias 135 épocas de treinamento para convergência.
Na Rede 2, a RNA foi treinada com um EQM
objetivo de ε = 10−9 e um coeficiente de aprendizado de η = 0, 01, onde a convergência é alcançada
com 60 épocas.
A Rede 3 foi treinada com um EQM objetivo
de ε = 10−7 e um coeficiente de aprendizado de
η = 0, 001. A convergência desta estrutura foi
alcançada com 350 épocas.
4.2
Teste e validação das estruturas neurais
Concluı́do o treinamento da Rede 1 inicia-se a
etapa de teste que consiste na implementação da
RNA no robô seguidor de linha. O robô mostrouse eficiente realizando corretamente os dois percursos em que foi treinado, nos sentidos horário e
anti-horário, mas em baixa velocidade.
Após o mesmo treinamento, mas aplicado
a Rede 2, o robô apresentou uma melhora significativa principalmente nas saı́das das curvas.
Quando comparada com a Rede 1, o robô corrige
mais rapidamente sua posição realizando movimentos mais suaves, mas ainda apresentando uma
evolução lenta, como pode ser observado na Figura 9. O robô também realizou os dois percursos
nos dois sentidos sem apresentar erros.
Figura 10. Sinal atuador circuı́to elı́ptico Rede 2
e Rede 3
Tendo em vista as limitações observadas na
validação da rede no circuito avançado, um novo
treinamento da Rede 3 foi realizado, onde são
apresentados somente os dados do percurso elı́ptico. Em um novo teste, o robô completou o
percurso somente no sentido treinando diferentemente das Rede 1 e Rede 2.
5
Conclusões
Este trabalho apresenta um estudo comparativo
entre as topologias de RNAs aplicadas ao controle
de trajetória de um robô autônomo. Nesta proposta, as redes com atraso ou recorrência mostraram um melhor desempenho.
Figura 9. Sinal atuador Rede 1 e Rede 2
Após a fase de treinamento do percurso avançado, a Rede 3 foi submetida ao teste.
O
robô apresentou as mesma caracterı́sticas da Rede
2, porém com uma velocidade aproximadamente
30% maior, como pode ser observado na Figura
10. No entanto, a evolução teve os movimentos
menos suaves. Um fato a ser considerado nesta
topologia, é que o robô realiza corretamente o percurso avançando apenas no sentido que foi o trei-
ISBN: 978-85-8001-069-5
A Rede 2 mostrou uma maior aplicabilidade
do que a Rede 1 principalmente quando se compara o reinı́cio dos trechos de reta. Devido a sua
caracterı́stica de gravar a tendência do percurso,
esta retoma a direção do robô aplicando sinais menos oscilatórios.
Já para a Rede 3, é possı́vel a execução do
percurso com uma velocidade 30% maior do que
a Rede 2, mas com sinais de controle mais oscilatórios. Vale ressaltar que a Rede 3 executou com
perfeição apenas os percursos no sentido em que
foi treinada, não generalizando de forma correta
as informações no sentido contrário.
3450
Agradecimentos
Este trabalho é financiado pela FINEP - Financiadora de Estudos e Projetos (Processo No
4971/2006). O mesmo conta com o apoio da Fundação de Apoio à Educação, Pesquisa e Desenvolvimento Cientı́fico e Tecnológico da UTFPR
(FUNTEF), da Fundação Araucária de Apoio ao
Desenvolvimento Cientı́fico e Tecnológico do Paraná, do Conselho Nacional de Desenvolvimento
Cientı́fico e Tecnológico - CNPq Brasil (Processo
No 474290/2008-5, 552269/2011-5, 473576/20112) e bolsas Capes-DS.
Referências
Cazangi, R. R. (2004). Uma Proposta Evolutiva para Controle Inteligente em Navegação Autônoma de Robôs, Tese de Doutorado,
Universidade Estadual de Campinas, Campinas.
Chen, F., Ma, C., Ma, W., Zhu, H., Zhu, J. e Yi,
L. (2011). Study on mobile robot navigation
based on strategy of blind man finding way,
Mechatronics and Automation (ICMA), 2011
International Conference on, pp. 1045–1049.
Dongshu, W., Yusheng, Z. e Wenjie, S. (2011).
Behavior-based hierarchical fuzzy control for
mobile robot navigation in dynamic environment, Control and Decision Conference
(CCDC), 2011 Chinese, pp. 2419 –2424.
Levin, I. e Mioduser, D. (1996). A multipleconstructs framework for teaching control
concepts, Education, IEEE Transactions on
39(4): 488–496.
Lora, F. A. S., Hemerly, E. M. e Lages, W. F.
(1998). Sistema para navegação e guiagem
de robôs móveis autônomos, SBA Controle
& Automação 9: 107–118.
Oliveira, J. R. (2010). Um sistema integrado para
navegação autônoma de robôs móveis, Dissertação de Mestrado, Instituto de Ciências Matemáticas e de Computação, Universidade de
São Paulo, São Carlos.
Pazos, F. (2002). Automação de sistemas e robótica, Editora Axcel Books do Brasil, Rio de
Janeiro.
Rosenblatt, F. (1958). The perceptron: A probabilistic model for information storage and
organization in the brain, Phisicological Review 65(3): 386–408.
Siciliano, A. V. (2006). Determinação de trajetória ótima em navegação robótica móvel, utilizando algoritmo genético, Tese de Doutorado, Universidade Federal do Rio de Janeiro,
COPPE, Rio de Janeiro.
Silva, I. N., Spatti, D. H. e Flauzino, R. A. (2010).
Redes Neurais Artificiais para engenharia e
ciências aplicadas, 1 edição, São Paulo : Artliber.
Gartner, H. e Astolfi, A. (1996). Stability study
of a fuzzy controlled mobile robot, Decision
and Control, 1996., Proceedings of the 35th
IEEE, Vol. 2, pp. 1121–1126.
Steels, L. (1995). When are robots intelligent autonomous agents?, Robotics and Autonomous
Systems 15: 3–9.
Haykin, S. (2001). Redes Neurais: Princı́pios e
Práticas, 2 edição, Porto Alegre : Bookman.
Wasserman, P. e Schwartz, T. (1988). Neural
networks Part.II. what are they and why is
everybody so interested in them now?, IEEE
Expert 3(1): 10–15.
Hebb, D. (1949). The organization of behavior:
a neuropsychological theory, Wiley book in
clinical psychology, Wiley.
Lang, K. J. e Hinton, G. E. (1988). The development of the time-delay neural network architecture for speech recognition, Tech. report CMU-CS-88-152, Carnegie-Mellon University, Pittsburgh, PA .
Lee, T., Lam, H., Leung, F. e Tam, P. (2003). A
practical fuzzy logic controller for the path
tracking of wheeledmobile robots, Control
Systems, IEEE 23(2): 60–65.
Leontaritis, I. J. e Billings, S. A. (1985). Inputoutput parametric models for non-linear systems part i: deterministic non-linear systems,
International Journal of Control 41(2): 303–
328.
ISBN: 978-85-8001-069-5
3451

UM ESTUDO COMPARATIVO ENTRE ARQUITETURAS NEURAIS

Transcrição

Documentos relacionados

Projeto de Extensão: Difusão de anime na UTFPR

Realidade Aumentada aplicada ao Futebol de Robôs

Artigo completo

Um robô por aluno: uma realidade possıvel

"Implementação de estratégias para futebol de robôs utilizando

ROBO TX Training Lab - Folheto

Sobre o controle de robos heterogêneos em formação

Nas Ãºltimas dÃ©cadas a importÃ¢ncia dos ecossistemas naturais

rafael rosado cruz uso de aprendizado de m´aquina para classifica

A Viagem de Chihiro

P - Fischertechnik

ROBO TX Training Lab - Folheto

Brochura

- Prefeitura Municipal de Itapororoca

ll air s NÌght Out

Controle de Tr´afego para um Enxame de Robˆos

Controle de formação de vants utilizando esquema

PFC 167

Desenvolvimento de um Sistema de Visão Artificial para um Robô

"Robôs móveis inteligentes: principios e técnicas".

do arquivo - Programa de Pós