Sobre o controle de robos heterogêneos em formação
Transcrição
Sobre o controle de robos heterogêneos em formação
XII Simpósio Brasileiro de Automação Inteligente (SBAI) Natal – RN, 25 a 28 de outubro de 2015 SOBRE O CONTROLE DE ROBÔS HETEROGÊNEOS EM FORMAÇÃO UTILIZANDO O SISTEMA DE POSICIONAMENTO VICON Mauricio E. Nakai∗, Roberto S. Inoue†, Valdir Grassi Junior∗, Marco H. Terra∗ ∗ Departamento de Engenharia Elétrica Universidade de São Paulo São Carlos, São Paulo, Brasil † Departamento de Engenharia Elétrica Universidade Federal de São Carlos São Carlos, São Paulo, Brasil Emails: [email protected], [email protected], [email protected], [email protected] Abstract— This paper deals with a heterogeneous robot formation control, consisting of a quadrotor and four wheeled mobile robots. In the formation strategy developed, the formation of wheeled mobile robots tracks and follows a quadrotor. This paper presents experimetal results using a wheeled mobile robot, e-Puck and the a quadrotor, mQX. For the position measure of the respective robots in formation, it was used a high precision camera Vicon system. Keywords— Formation Control, Heterogeneous Robots, Mobile Robots, Vicon Resumo— Este artigo trata do controle de formação de robôs heterogêneos composto por um quadricóptero e quatro robôs móveis com rodas. Na estratégia desenvolvida a formação de robôs móveis acompanha a trajetória gerada pelo quadricóptero. São apresentados resultados experimentais utilizando o robô móvel com rodas e-Puck e o quadricóptero mQX. Para a realimentação da posição dos agentes é utilizado o sistema de câmeras de alta precisão Vicon. Palavras-chave— 1 Controle de Formação, Robôs Heterogêneos, Robôs Móveis, Vicon cuja dinâmica de estado são acopladas através de uma lei de controle comum. O controle de formação pode ser utilizado para as mais diversas tarefas com por exemplo: pequenos robôs de reconhecimento; veı́culos de grande porte não tripulados; missões de resgate. Introdução Com o crescimento da pesquisa voltada para veı́culos autônomos de todos os tipos, aumentou-se também a pesquisa em controle de formação e cooperação em diversas áreas. Este trabalho trata do controle de coordenação de um grupo de robôs heterogêneos, isto é, tem pelo menos um individuo do grupo diferente dos demais, a diferença pode ser morfológica e/ou funcional. A necessidade de integração fı́sica e funcional de diferentes plataformas de hardware resulta em considerável complexidade para o projeto e a aplicação. Devido à diferença de funcionalidade em um grupo de robôs heterogêneos, os membros da equipe devem decidir qual robô deve executar uma determinada tarefa, com base em suas capacidades individuais. Os agentes não dependem unicamente de seus sensores para obter informação sobre o ambiente, as informações dos sensores podem ser compartilhadas entre os robôs da formação. Por exemplo em Dorigo et al. (2013) foi apresentado um grupo heterogêneo com três robôs diferentes sendo que um deles é um robô aéreo autônomo. Este se fixa em um ponto mais elevado e obtém imagens para melhor navegação dos robôs terrestres. O controle de formação vem sendo pesquisado durante muitos anos e tem ganhado cada vez mais espaço com o surgimento dos veı́culos não tripulados. Uma formação de robôs autônomos refere-se a um grupo de robôs espacialmente distribuı́dos Existem três principais abordagens para o controle de formação, são estas: o controle baseado no comportamento; configuração lı́der/seguidor; estrutura virtual (Lawton et al., 2003). Para o presente trabalho utilizou-se o controle baseado em Lı́der/Seguidor descrito em Williams et al. (2005) e Lafferriere et al. (2004). A principal contribuição deste artigo diz respeito a um projeto de hardware baseado em câmeras de alta precisão para o controle em ambientes internos de robôs heterogêneos em formação. 2 Robô móvel com rodas (RMR) O e-Puck é um robô móvel com rodas desenvolvido na École Polytechnique Fédérale de Lausanne para utilização nas atividades de ensino (Mondada et al., 2009). Dentre as caracterı́sticas que contribuem para a versatilidade do robô estão: tamanho reduzido; Várias possibilidades de aplicação; Interface amigável; Baixo custo; Projeto Aberto; Opensource software. 1316 XII Simpósio Brasileiro de Automação Inteligente (SBAI) 3 Modelo de Formação O modelo de formação é caracterizado por ẋi = Aveh xi + Bveh ui , i = 1, · · · , N, xi ∈ R2n , (1) sendo N quantidade de veı́culos, n é a quantidade de eixos acessı́veis aos agentes, xi representa os estados para cada i veı́culos e ui representa a entrada do controle. No presente estudo iremos utilizar duas dimensões, portanto as matrizes Aveh e Bveh são dadas por 0 1 0 0 0 a22 0 a24 , Aveh = (2) 0 0 0 1 0 a42 0 a44 Bveh 0 1 = 0 0 0 0 . 0 1 Figura 1: Formação com três veı́culos. inversa. A matriz de adjunta Q que define a topologia de comunicação entre os robôs da formação, ou seja, a hierarquia lı́der/seguidor dos robôs que compôe a formação (Veerman et al., 2005). (3) L = LG ⊗ I2n . 4 5 Controle de Formação Para a convergência da formação h, é necessário uma lei de controle u. O aspecto da distribuição desse controle é baseado na dependência de u em informações locais. O erro de saı́da zi é calculado como a média do posicionamento relativo da vizinhança dos agentes como apresentado na Equação (9) onde Ji representa a quantidade de vizinhos do veı́culo i, (5) Definição de Formação A matriz de formação é dada por, 1 h = hp ⊗ ∈ R2nN . 0 (8) O robô lı́der não receberá informação dos demais robôs integrantes da formação. Nesse caso a linha da matriz de adjacência Q referente ao lı́der deve ser zero. Isto significa que os outros robôs da formação são forçados a se coordenarem em função do lı́der. A Figura 1 mostra a representação vetorial da matriz h e a formação após um deslocamento q. Os valores das colunas pares controlam a aceleração, enquanto que os zeros nas colunas ı́mpares garantem a convergência na formação (Lafferriere et al., 2005). O vetor xi é a composição dos vetores, xp que representa as posições e xv com as velocidades, T xp = (xp )1 ... (xp )N , (4) T xv = (xv )1 ... (xv )N . O vetor x é representado pela equação 1 0 x = xp ⊗ + xv ⊗ . 0 1 LG = D+ (D − Q). (6) zi = (xi − hi ) − Um dı́grafo Γ representa a topologia de comunicação entre os robôs, consiste em um conjunto finito de vértices V e arestas E. Cada vértice representa um robô, e a aresta que liga dois vértices representa a comunicação entre dois robôs. O par (i, j) pertence ao conjunto de arestas E se i é vizinho de j , Ji indica o número de vizinhos do i-ésimo robô. A matriz de adjacência Γ é uma matriz quadrada Q sendo ( 1 se(j, i) ∈ E qij = , (i, j ∈ V). (7) 0 caso contrário 1 X (xj − hj ) i = 1...N. (9) |Ji | j∈Ji Como resultado o vetor z de saı́da pode ser escrito como z = L(x − h), (10) sendo L a matriz Laplaciana do dı́grafo de comunicação, obtida em (8). A lei de controle, dada a existência de uma matriz de realimentação F , pode ser escrita como u = F z = F L(x − h). (11) Consequentemente o problema de controle de formação é dado pela equação A matriz Laplaciana L é dada pela Equação (8) sendo ⊗ representa o produto de Kronecker, D é a matriz diagonal, D+ é a sua matriz pseudo ẋ = Ax + BF L(x − h), 1317 (12) XII Simpósio Brasileiro de Automação Inteligente (SBAI) sendo A(q̇2 ) = −M2−1 C2 (q̇2 ) e B = M2−1 . As matrizes M2 e C2 são dadas por, sendo A = IN ⊗ Aveh e B = IN ⊗ Bveh , sendo IN a matriz identidade de ordem N . Levando em consideração as estruturas dos blocos A, B e L, a matriz F = IN ⊗ Fveh , sendo f1 f2 0 0 Fveh = . (13) 0 0 f1 f2 M2 = Sc (q1 )T M (q1 )Sc (q1 ) . C2 = Sc (q1 )T C(q, q̇)Sc (q1 ) + Sc (q1 )T M (q1 )Sc (q1 ) (20) A matriz Sc permite transformar as velocidades angulares das rodas nas velocidades atuantes no centro de massa do robô móvel, C é a matriz de forças de coriolis e centrı́peta, M é a matriz de inércia e q1 = [xc yc α θd θe ]T . Matrizes foram obtidas através dos modelos cinemáticos e dinâmicos baseados em (Coelho and Nunes, 2003). Em (Williams et al., 2005) mostra-se que as condições necessárias e suficientes para o sistema convergir para a formação são obtidas com f1 < 0 e f2 < 0. 6 Controlador Baseado na Cinemática 8 Lei de controle utilizada baseada na cinemática proposta por (Kanayama et al., 1990) v d = vor cos(αe ) + kx xe , ω d = ωr + vor (ky ye + kα sin(αe )), Sistema Vicon O sistema Vicon consiste em um conjunto de câmeras de alta resolução. As câmeras são posicionadas de forma a se obter vários ângulos de um mesmo ponto. Essa variação de posicionamento possibilita a localização do ponto em um sistema de coordenadas cartesiano (x, y, z) e os ângulos de rotação (θx , θy , θz ). A localização e o rastreio dos agentes são obtidos a partir de marcadores reflexivos, e sua identificação é feita a partir do padrão em que esses marcadores estão posicionados (distância entre os marcadores). As câmeras se utilizam do espectro de luz infravermelho cuja fonte é localizada em volta da lente da câmera como é possı́vel observar na Figura 2. Dessa forma o sistema independe da iluminação presente no ambiente desde que este esteja em espectro diferente do infravermelho. (14) sendo v d a velocidade linear desejada, ω d a velocidade angular desejada, kx , ky e kα os ganhos para os respectivos erros, xe e ye os erros nas coordenadas x e y respectivamente e αe o erro do ângulo de orientação do robô, dados pelas equações xe = (xr − xo )cos(α) + (yr − yo )sin(α), ye = −(xr − xo )sin(α) + (yr − yo )cos(α), αe = αr − α, (15) sendo xr , yr e αr as posições e ângulo de orientação futuras e xo , yo e αo as posições a ângulo de orientação atuais. O cálculo de vor é dado por q (16) vor = ẋ2r + y˙r2 . O controlador baseado na dinâmica considera as velocidades angulares de cada roda, portanto, as relações de velocidade são definidas em d d θ̇di 1/r b/r vi d q̇2i = d = (17) d , 1/r −b/r w θ̇ei i sendo θ̇ddi e θ̇edi as velocidades desejadas nas rodas direita e esquerda respectivamente, r é o raio da roda e b é a distância entre o centro de eixo e as rodas. 7 Figura 2: Iluminação infravermelho em volta da lente da câmera, vista frontal e lateral. Controlador Baseado na Dinâmica As câmeras Vicon são conectadas através de um cabo coaxial a uma plataforma que realiza o tratamento das imagem. A comunicação entre a plataforma e o servidor se dá por um cabo ethernet ligado a uma placa de rede (1Gbps), o que permite as altas taxas de aquisição e transmissão de dados para o servidor. O servidor utiliza um software Vicon para disponibilizar valores de posição e orientação, esses dados são distribuı́dos através da rede local para o computador com os algoritmos de controle dos robôs. As câmeras utilizam lentes da marca PENTAX modelo C21211KP, as carac- O controle proporcional derivativo (PD) utilizado é independente para cada uma das rodas do robô móvel dado por ud = −[θd − θdd ]kp1 − [θ̇d − θ̇dd ]kd1 . ue = −[θe − θed ]kp2 − [θ̇e − θ̇ed ]kd2 (18) A equação de torque controlado obtida através do modelo dinâmico, τ = B −1 (q̈2d − A(q̇2 )q̇2d + u), (19) 1318 XII Simpósio Brasileiro de Automação Inteligente (SBAI) terı́sticas técnicas das câmeras são apresentadas na Tabela 1. Tabela 1: Caracterı́sticas da câmera Vicon. Câmera Resolução Máx. taxa em máx. resolução Sensor 9 T40S 4Mp (2336 × 1728) 515 fps Vicon Vegas S-4 Métodos Utilizados e Resultados As câmeras Vicon estão posicionadas nos cantos superiores do ambiente de ensaio, as imagens são transmitidas para um módulo Vicon que realiza o processamento das imagens. Os dados processados são então enviados para um servidor com o software de interface Tracker Vicon. O servidor então envia os dados para o computador com os algoritmos de controle de formação, que por sua vez, envia os valores de torque para os robôs via bluetooth. A Figura 3 apresenta o esquemático do ambiente de ensaio utilizado para o controle de formação. Figura 4: Desenho utilizado para o cálculo dos momentos do robô e-Puck. Na Tabela 2 temos as dimensões medidas e os momentos de inércia calculados para o robô ePuck. Tabela 2: Caracterı́sticas fı́sicas do robô móvel com rodas. Raio da roda 20mm Centro do eixo até a 29mm roda Massa do robô 150g Dist. entre centro de 0.5mm massa e centro do eixo M.I. de inércia da pla- 78, 399Kg mm2 taforma M.I. da rodas em rela- 1, 314Kg mm2 ção ao eixo da roda M.I. da roda em rela- 0, 676Kg mm2 ção ao eixo no plano da roda Figura 3: Esquemático de configuração do ambiente de ensaio. 9.2 9.1 O algoritmo utilizado é composto de quatro partes: tratamento dos dados enviados pelo sistema Vicon; controle de formação; controle baseado no modelo cinemático; controle baseado no modelo dinâmico. A Figura 5 ilustra o diagrama de blocos do algoritmo. Caracterı́sticas e Dimensões do RMR Utilizado As caracterı́sticas fı́sicas do robô são necessárias para o correto funcionamento do modelo dinâmico. A utilização de um software CAD viabilizou o cálculo dos valores dos momentos de inércia da plataforma do robô e de suas rodas para a utilização no controle baseado na dinâmica. O robô foi desmontado, cada peça foi desenhada no software e pesadas individualmente. Na Figura 4 tem-se o desenho do robô e-puck utilizado na ferramenta CAD para os cálculos de suas propriedades fı́sicas. Algoritmos de Intefarce e Validação • Algoritmo Vicon: realiza a aquisição das imagens e o processamento de visão computacional para se obter as posições de todos os elementos previamente identificados dentro do volume de trabalho a uma taxa de 100 fps. • Controle de Formação: calcula as posições futuras de cada robô utilizando-se das coordenadas atuais e a trajetória desejada. 1319 XII Simpósio Brasileiro de Automação Inteligente (SBAI) • Controle Baseado na Cinemática: realiza o cálculo da velocidade linear e angular de cada robô levando-se em conta restrições dos agentes. O algoritmo também faz o controle de saturação das velocidade. foi h1 = [450 0], h2 = [225 150], h3 = [225 − 150] e h4 = [0 300]. O ganhos utilizados no controlador cinemático foram kα = 0, 0001 e kx = ky = 1, 5x10−5 e a matriz de realimentação da formação utilizada foi −2 −2 0 0 Fveh = . (21) 0 0 −2 −2 • Controle Baseado na Dinâmica: realiza o cálculo do torque de cada robô levando em consideração as caracterı́sticas do modelo dinâmico e cinemático. Em seguida o torque calculado é transformado em pulsos por segundos devido à caracterı́stica de acionamento do robô e-puck. A Figura 7 apresenta o ensaio realizado onde pode-se ver quatro momentos diferentes no trajeto realizado, que ocorrem na ordem crescente dos numerais. Nota-se que no primeiro instante a formação está uniforme, no segundo momento, percebe-se um pequeno adiantamento na formação do Robô 1, no instante 3 o Robô 1 se mantém abaixo do quadricóptero enquanto os demais robôs se aproximam da formação e no momento seguinte nota-se um adiantamento no posicionamento do Robô 1, seguido dos demais robôs da formação. Figura 5: Diagrama de blocos do algoritmo elaborado para o controle de formação 9.3 Figura 7: Formação com quatro robôs RMR e um robô aéreo em quatro momentos distintos da trajetória percorrida. Resutados Práticos No ensaio realizado a formação de RMR se mantém sob o quadricóptero, responsável por estabelecer um trajeto para a formação. Utilizou-se o robô móvel com rodas e-Puck e o quadricóptero mQX da marca Hobby Horizon, controlado manualmente. A Figura 6 apresenta a configuração de vizinhança definida para o ensaio. Na Figura 8 pode-se ver o mesmo percurso apresentado na Figura 7, com a trajetórias dos RMRs utilizados na formação, percebem-se pequenas instabilidades, principalmente na trajetória dos Robôs 3 e 4, isso ocorre devido ao acúmulo do erro no controle de formação, visto que são os dois últimos robôs na configuração de vizinhança. Percebe-se também uma pequena irregularidade na trajetória do Robô 1 em destaque na Figura 9, isso se deu devido ao erro real de posição, no instante que o Robô 1 chega próximo à posição desejada, o algoritmo de controle continua calculando o erro de posição por menor que ele seja, como consequência da correção deste pequeno erro, o robô realiza uma trajetória circular em torno da posição desejada. Figura 6: Configuração de vizinhança utilizada no ensaio. 10 Os valores adotados dos ganhos para o controlador PD são kp1 = kp2 = 0, 17 e kd1 = kd2 = 0, 05. A matriz de formação utilizada nos ensaios Conclusões O sistema Vicon tem proporcionado aquisições de dados com alta confiabilidade, sem falhas nem 1320 XII Simpósio Brasileiro de Automação Inteligente (SBAI) Dorigo, M., Floreano, D., Gambardella, L., Mondada, F., Nolfi, S., Baaboura, T., Birattari, M., Bonani, M., Brambilla, M., Brutschy, A., Burnier, D., Campo, A., Christensen, A., Decugniere, A., Di Caro, G., Ducatelle, F., Ferrante, E., Forster, A., Martinez Gonzales, J., Guzzi, J., Longchamp, V., Magnenat, S., Mathews, N., Montes de Oca, M., O’Grady, R., Pinciroli, C., Pini, G., Retornaz, P., Roberts, J., Sperati, V., Stirling, T., Stranieri, A., Stutzle, T., Trianni, V., Tuci, E., Turgut, A. and Vaussard, F. (2013). Swarmanoid: A novel concept for the study of heterogeneous robotic swarms, Robotics Automation Magazine, IEEE 20(4): 60–71. Figura 8: Trajetória percorrida por quatro RMR em formação durante o ensaio realizado. Kanayama, Y., Kimura, Y., Miyazaki, F. and Noguchi, T. (1990). A stable tracking control method for an autonomous mobile robot, Robotics and Automation, 1990. Proceedings., 1990 IEEE International Conference on, pp. 384–389 vol.1. Lafferriere, G., Caughman, J. and Williams, A. (2004). Graph theoretic methods in the stability of vehicle formations, American Control Conference, 2004. Proceedings of the 2004, Vol. 4, pp. 3729–3734 vol.4. Figura 9: Trajetória do Robô 1, região em destaque na Figura 8. Lafferriere, G., Williams, A., Caughman, J. and Veerman, J. (2005). Decentralized control of vehicle formations, Systems & Control Letters 54(9): 899 – 910. atrasos significativos. A comunicação bluetooth entre o computador e o robôs e-Puck tem se mostrado uma alternativa também viável para esse tipo de problema. As caracterı́sticas dinâmica, cinemática e os pesos utilizadas nos modelos e no controlador utilizado se mostraram corretas. Estabeleceu-se um sistema de alta precisão para localização dos robôs e um método de controle de formação de robôs heterogêneos eficaz, pretendese em trabalhos futuros obter resultados experimentais utilizando controladores baseados em sistemas lineares sujeitos a saltos Markovianos aplicados para essa classe de robôs. Incluindo controle Markoviano para sistemas descentralizados, para tratar de alternância de lı́deres e falhas na formação. Lawton, J., Beard, R. and Young, B. (2003). A decentralized approach to formation maneuvers, Robotics and Automation, IEEE Transactions on 19(6): 933–941. Mondada, F., Bonani, M., Raemy, X., Pugh, J., Cianci, C., Klaptocz, A., Magnenat, S., christophe Zufferey, J., Floreano, D. and Martinoli, A. (2009). The e-puck, a robot designed for education in engineering, In Proceedings of the 9th Conference on Autonomous Robot Systems and Competitions, pp. 59–65. Veerman, J., Lafferriere, G., Caughman, J. and Williams, A. (2005). Flocks and formations, Journal of Statistical Physics 121(5-6): 901– 936. Agradecimentos Williams, A., Lafferriere, G. and Veerman, J. (2005). Stable motions of vehicle formations, Decision and Control, 2005 and 2005 European Control Conference. CDC-ECC ’05. 44th IEEE Conference on, Seville, pp. 72–77. Este trabalho contou com o apoio financeiro da FAPESP através dos processos 2007/03484-8 e 2012/08106-0, CAPES e CNPQ. Referências Coelho, P. and Nunes, U. (2003). Lie algebra application to mobile robot control: a tutorial, Robotica 21: 483–493. 1321
Documentos relacionados
Controle de formação de vants utilizando esquema
dinâmicas e também suas estratégias de navegação individuais. Por fim, a Camada de Ambiente é incluı́da para representar a interação entre o ambiente e os robôs a partir da informação se...
Leia maisAvaliar os sistemas operacionais embarcado MQX Lite
Devido a complexidade de algumas tarefas que os robôs devem cumprir o uso de sistemas operacionais embarcados é fundamental, pois é comum robôs realizarem várias tarefas e com isso possuı́rem ...
Leia maisNilton Alejandro Cuellar Loyola Interface Háptica de Cinco Graus de
Nacional de Ingenierı́a - UNI (Lima, Perú) em 2008. Trabalhou na área de desenvolvimento de projetos em robótica e automação industrial antes de começar mestrado em IGIUNI. Suas áreas de int...
Leia mais