Artigo completo - Grupo de Controle Automação e Robótica
Transcrição
Artigo completo - Grupo de Controle Automação e Robótica
UMA PROPOSTA PARA SUPERAR RESTRIÇÕES DE REDES IP EM APLICAÇÕES DE CONTROLE EM MALHA FECHADA SÉRGIO R. SUESS, CARLOS E. PEREIRA, WALTER F. LAGES Departamento de Engenharia Elétrica, UFRGS Av.Oswaldo Aranha 103, 90035-190, Porto Alegre, RS, BRASIL E-mails: [email protected], [email protected], [email protected] ALESSANDRO GOEDTEL Departamento de Eletrotécnica, UTFPR-CP Av. Alberto Carazzai 1640, 86.300-000, Cornélio Procópio, PR, BRASIL E-mail: [email protected] Abstract This work proposes the use of a Smith predictor with jitter transport delay adaptation to feedback control systems on which control loops are closed through an IP network. The well know Smith predictor is efficient to compensate constant transport delay but IP networks presents jitters which disturb the performance of the predictor. Therefore, along with predictor a new compensation scheme is implemented. This compensation has a data structure in order to store values from the output of the predictor. The compensation is chosen based in the last delay in the control loop. The proposed approach was validated via simulation and experimental results are presented. Keywords Feedback control systems, transport delay, Smith predictor, IP network. Resumo Este trabalho propõe o uso do preditor de Smith com adaptação à variação do atraso de transporte para o controle em malha fechada sobre redes IP. O bem conhecido preditor de Smith é eficiente na compensação de atrasos de transporte constantes, mas redes IP apresentam variações que afetam o desempenho do preditor. Assim, juntamente com o preditor é desenvolvida uma nova forma de compensação para essa variação típica de atraso destas redes. Esta compensação utiliza uma estrutura de dados para armazenar os valores de saída do preditor, para que desta estrutura seja lido o valor adequado para comparação com o valor da realimentação do sistema. O valor é escolhido com base no último atraso ocorrido na malha de controle. Resultados de simulação são apresentados para validar a metodologia proposta. Palavras-chave Redes IP, preditor de Smith, atraso de transporte, controle realimentado. 1 Introdução Existe hoje uma grande tendência do uso de recursos físicos de comunicação comum, independente do tipo de informação a ser transmitida. Alguns objetivos claros a serem seguidos nesta direção são a otimização do uso da infraestrutura na qual se faz o investimento, a simplificação no ambiente da instalação (menos cabos) e a integração entre todos os dados em um mesmo sistema. As redes IP foram idealizadas para serem compartilhadas para a transmissão de dados de diversas aplicações executadas ao mesmo tempo, o que otimiza o uso da instalação. Estas redes tem se tornado o meio padrão de comunicação em diversas áreas, mas não foram idealizadas para o uso em aplicações de tempo real (RT), não sendo determinísticas quanto ao tempo de entrega das informações enviadas. Por isso, para o uso em aplicações de controle e automação, pesquisas têm sido realizadas para compensar as características de indeterminismo do protocolo de internet (IP) ou mesmo para alterálo. No campo da robótica, segundo MontufarChaveznava e Mendez-Polanco (2005), a rede IP foi usada pela primeira vez como meio para teleoperar um robô em 1994 na Califórnia, em Berkeley, e na universidade do oeste da Austrália. Os robôs poderiam ser acessados via web browser. Trata-se de uma tecnologia interessante quando há riscos quanto à segurança humana, restrições de tempo ou restrições devido ao custo. Outra aplicação foi desenvolvida no trabalho de Bate e Cook (2001), que analisa a viabilidade de uma realimentação de força para um operador remoto, para que este tenha uma noção do esforço que determinado equipamento está exercendo, devido ao seu comando. Os estudos feitos para o uso de tecnologias de controle, com o uso de redes IP, têm seu foco principal sobre as características do atraso inserido na malha de controle entre o controlador e a planta. O tempo de propagação de sinais transmitidos no meio físico entre dois dispositivos na rede pode ser estimado por tabelas da recomendação G.114 (ITU-T, 2003), mas a contribuição deste atraso é menos importante que o tempo que os pacotes ficam em filas de roteadores do caminho percorrido. O atraso tem efeitos bem conhecidos a medida que este é aumentado, como a redução da margem de ganho e de fase do sistema. No caso de redes IP, a complexidade para o controle é intensificada devido à variação do atraso, havendo necessidade de adaptação do controle a cada novo valor de atraso. Se esta variação não for compensada, o sistema pode perder estabilidade ou não cumprir mais com seus requisitos de desempenho. Neste artigo utiliza-se um método bastante conhecido para a compensação de atrasos, com bons resultados na manutenção da margem de ganho e de fase, o preditor de Smith. Entretanto este preditor depende de uma boa modelagem da planta a ser controlada e do atraso de transporte, como demonstrado em Bahil (1983). Portanto, é preciso que o preditor se adapte a cada novo valor de atraso. A proposta deste trabalho consiste em apresentar uma nova forma de compensação de atraso de redes IP, que avalia o atraso de transporte a cada novo pacote de informações proveniente da planta para o controlador. Baseando-se em dados de tempo presentes nas informações envidas do controlador para a planta e desta para o controlador, é calculado o roundtrip. Com esta informação o atraso imposto ao modelo da planta junto ao preditor de Smith mantémse ajustado. Para validar o método, será utilizado o modelo de um Motor de Corrente Contínua (MCC). Este modelo será simulado e trocará informações com o controlador via uma rede IP. Para verificação do comportamento desta malha de controle, será aplicada uma referência de entrada do tipo degrau unitário. Este artigo encontra-se assim organizado: na Seção 2 apresenta-se uma breve explanação do funcionamento do preditor de Smith e também é apresentada uma análise do estado da arte de trabalhos relacionados e que visam lidar com o atraso variante de redes de comunicação em sistemas de controle em rede. Na Seção 3 descreve-se a proposta baseada no preditor de Smith e a estrutura de dados para adaptação do atraso variante. Por fim, na Seção 4, as conclusões deste trabalho são descritas e linhas de trabalho futuro são sinalizadas. 2 Preditor de Smith Figura 1. Diagrama onde a variável fictícia B – saída da planta sem atraso – poderia realimentar o sistema. reconstruí-lo. Por isto, paralelamente deve-se aplicar o mesmo sinal de entrada a um modelo que a represente da melhor forma possível (Gm e Tm) e deste retira-se então o valor de Bm. O novo sistema é representado pela Fig. 2. Na Fig. 2, o bloco C representa o controle, Gp o comportamento dinâmico da planta, Tp o atraso de transporte da planta, Gm, um modelo da planta cuja dinamica é dada por Gp e Tm o atraso inserido no modelo para compensar Tp. Figura 2. Preditor de Smith (Bahil, 1983). Fazendo as transformações (1), (2) e (3), o sistema da Fig. 2 pode ser também representado pela Fig. 3. F = R − E − Bm (1) F = R − (Yp − Ym) − Bm (2) F = R − Yp − (Ym + Bm) (3) O bloco Gsp na Fig. 3 é chamado de Controlador Preditor de Smith (CPS). Segundo Bahil (1983), o preditor de Smith se baseia no conceito de que o atraso entre a entrada do sinal em uma planta e a sua saída, pode ser representado por um bloco separado. Para aplicação de um preditor de Smith, uma planta sendo controlada é representada por dois blocos em série; um bloco representando a dinâmica da planta (Gp) e outro representando o atraso (Tp) – vide Fig. 1, que ilustra uma malha de controle realimentada, onde estão inseridos estes blocos da planta. O controle apresentado na Fig. 1 é realimentado com a saída do bloco da planta sem atraso, melhorando o desempenho e a estabilidade, mantendo a margem de ganho do controle. No entanto, o sinal B não está disponível de forma que se possa obtê-lo por meio de algum sensor na planta. Assim, deve-se utilizar um estimador para Figura 3. Controlador Preditor de Smith (Bahil, 1983). 2.1 Modelo de um laço de controle fechado sobre uma rede IP A Fig. 4 ilustra um sistema sendo controlado via uma rede IP. O controlador processa os dados provenientes dos sensores, aplica a lei de controle correspondente e envia os valores calculados para serem aplicados nos atuadores também via rede. Figura 4. Controle de uma planta via rede IP. Os pacotes provenientes dos sensores sofrem os mesmos tipos de problemas de atraso que os pacotes que são enviados aos atuadores. No momento do cálculo da lei de controle, pode-se usar o valor do timestamp de envio do pacote com os dados dos sensores para se determinar o valor do atraso ocorrido do sinal do sensor para o controle. Todavia, o atraso no sentido do controlador para a planta ainda não ocorreu e devido à característica de variação de atraso de redes IP, este pode apenas ser estimado baseando-se nas últimas informações de timestamp. O máximo atraso para não haver degradação do sistema, segundo Park, Kim Y. e Kim D. (2002), depende somente de parâmetros e configurações da planta e do controlador. Então, o Limite Máximo de Atraso Permitido (Maximum Allowable Delay Bound - MADB) é obtido da planta, independente da rede, enquanto os atrasos de rede induzidos dependem apenas da configuração da rede. estimativa muito próxima do estado da planta no momento do cálculo dos novos valores de controle. Enquanto o atraso da planta para o controlador pode ser calculado, o atraso no sentido inverso pode apenas ser estimado tomando-se como base os atrasos anteriores. Então, a estimativa do estado da planta no momento em que o sinal de controle chegará nesta, baseia-se em outra estimativa, a do atraso que ainda irá ocorrer. Sendo uma estimativa baseada em outra, o grau de incerteza aumenta. Em Alt et al (2003), para se lidar com esta variação de atraso, foi estimado um intervalo de tempo provável para o atraso no caminho do controlador para os atuadores da planta e foram calculados diversos valores de controle para este intervalo, para que quando o pacote chegasse com estes valores, o mais adequado deles pudesse ser escolhido pelo nodo do atuador. Esta análise é feita pelo atuador, considerando o valor do timestamp. Esta solução apresenta a necessidade de um sincronismo entre os relógios de cada nodo do sistema. Em Bauer (2001) foi proposta a aplicação de algumas variações do preditor de Smith adaptado a um laço com rede IP, para controlar o sistema representado em (4). Gp ( z ) = 1 z −1 (4) Na Fig. 5, τ1 é o atraso do sinal de controle no caminho de ida até a planta. O τ2 é o atraso na rede, no laço de realimentação. A transmissão no caminho para a planta é representada por um bloco de taxa de bits variável, em inglês Variable Bit Rate (VBR) e no laço de realimentação, por um segurador da amostra mais recente, em inglês Hold Freshest Sample (HFS). O controlador, formado pelos blocos dentro do campo tracejado chamado de controle, é uma adaptação do preditor de Smith para tempo variante. Os símbolos com asterisco são estimativas dos seus correspondentes sem asterisco. Em Costa et al (2004) foi demonstrado que é possível calcular o atraso máximo dentro de uma determinada topologia com switches. Desta forma, sendo conhecido o MADB e o atraso máximo da rede, pode ser verificada a viabilidade de controle. A seguir serão apresentados alguns métodos de controle para este tipo de malha fechada sobre rede IP. 2.2 Algumas soluções para compensar o atraso e suas variações Figura 5. Solução de Bauer (2001) para controle em redes IP. A partir do modelo que represente de forma adequada à dinâmica da planta, a leitura dos sensores e o atraso com que estes dados chegam ao controlador, calculado com base no timestamp, pode-se ter uma Em Wang (2005), foi equacionado o atraso de uma rede e foi considerado que existe uma probabilidade de comportamento no atraso, baseando-se em sua característica self-similar, i.e., o intervalo seguin- te ao atual apresenta uma grande probabilidade de manter a mesma taxa de fluxo. Para ajustar o preditor de Smith foi criado um módulo de auto-ajuste de atraso, como pode ser visto na Fig. 6, obtida de Wang (2005). A variação ∆Tr se dá em função da saída X1(s) e da diferença ε(s) entre a saída da planta e do modelo. ε (s ) = X 1 ( s ) − X 2 ( s ) (5) Foram comparadas as respostas do sistema com e sem o regulador de atraso, enquanto que sem o regulador a resposta apresentou-se bastante distorcida, com o regulador a resposta ficou muito próxima da que se obteria com o atraso fixo. Neste, modelo alguns parâmetros do regulador de atraso são obtidos por estatísticas e experiência dos pesquisadores com relação ao comportamento do atraso. Embora tenham sido obtidos bons resultados, a solução estima o atraso por meio de uma equação que depende do conhecimento do comportamento estatístico do atraso da rede que será utilizada, o que pode ser complexo bastante para inviabilizar a aplicação. Ainda, se o atraso variar mais do que o esperado, a equação de ajuste pode não convergir suficientemente rápido para o valor correto do atraso. O sinal u(t) do controlador C é aplicado no dispositivo G sendo controlado e então é enviado um pacote com a leitura dos sensores y(t), com o tempo de atraso do controlador para planta, Tcp, e a hora em que este pacote está sendo enviado, t. Ao chegarem estas últimas informações ao controlador, no instante t1, é calculado o atraso da planta para o controlador por Tpc = t 1 − t (6) que é somado ao tempo de atraso do controlador para a planta, contido nas informações do pacote, para ser obtido o tempo de roundtrip, ou seja Trt = Tpc + Tcp (7) A Fig. 7 mostra parte do sistema, com os instantes de tempo e os atrasos envolvidos. Figura 7. Malha de controle com seus respectivos atrasos. Ao mesmo tempo em que o sinal de controle foi enviado para a rede IP, com o endereço da planta, também foi aplicado o mesmo sinal na entrada do modelo da planta e o seu valor Bm foi guardado em uma estrutura de dados. Cada valor nesta estrutura tem um índice i, sendo 0 (zero) o do último valor guardado. O valor Bm cujo índice associado é i, será representado por bm [i ] . A cada novo valor, o que já Figura 6. Preditor de Smith com regulador de atraso em Wang (2005). 3 Preditor de Smith com Buffer de ajuste para Atraso Variante de Redes IP Para se compensar as características de redes IP, propõe-se neste trabalho uma combinação entre um préditor de Smith e um sistema de determinação do atraso a ser ajustado a cada novo cálculo da lei de controle. A forma com que é feito este ajuste do atraso pode ser considerada uma contribuição nesta área de conhecimento, a qual se mostra eficiente para ordens de atraso e variações típicas de redes IP. Trata-se de um algoritmo mais simples que o desenvolvido por Wang (2005), aproveitando a possibilidade de ter a informação do atraso real a cada pacote e convergindo ao atual atraso rapidamente. estavam na estrutura tem o seu índice incrementado de 1. Quando um valor de Bm for receber um índice maior que o definido para o tamanho da estrutura, este é descartado. Esta estrutura de dados recebe o nome de Buffer na Fig. 8 e é vista em detalhe na Fig. 9. A Fig. 8 e a Fig. 9 descrevem este laço de controle, onde R representa o sinal de referência de entrada, C o módulo do controle, L uma possível perturbação, Gp a equação de transferência da planta, Gm o modelo de Gp, τcp o atraso do controlador para a planta e τpc da planta para o controlador. O atraso τcp precede o bloco Gp, mas para evidenciar o sinal B, representado por Bm no modelo, foi feita a inversão da ordem na figura, sem alterar o resultado matemático do laço de controle. Os pacotes armazenados em seqüência no Buffer diferem-se nos seus tempos de aquisição por um período de amostragem P do controlador. Para se saber o instante de tempo no qual um valor de Bm foi gerado, basta usar o índice correspondente de Bm e multiplicar pelo período de amostragem usado. O índice é um número inteiro do intervalo [0, N), onde N deve ser igual ou maior que o maior atraso possível da rede utilizada, dividido por P. Então, para se saber qual o valor de Bm que será atribuído a Ym, no momento de sua leitura, basta se atribuir ao índice de Bm o tempo de roundtrip dividido por P. Figura 8. Preditor de Smith com regulador de atraso baseado no roundtrip. ta da planta. Em um instante próximo a 3,650 s, foi provocada uma perturbação na planta e observa-se que a compensação na planta ocorre em um período de um roundtrip após, como demarcam as linhas tracejadas verticais da Fig. 10. Figura 10. Curvas de resposta da planta com e sem o preditor de Smith. O gráfico da Fig. 11 demonstra o comportamento do sinal de controle e do tempo de roundtrip durante o ensaio. Figura 9. Escolha de Ym baseada no último roundtrip. T Ym = bm rt P (8) A escolha do período de amostragem P é baseada nas características da planta, desconsiderando-se o tempo de atraso. Isso é possível devido ao modelo local sem atraso, do preditor de Smith. Vários sinais de controle podem ser enviados dentro de um mesmo intervalo de roundtrip. Para análise do comportamento da solução proposta, foi utilizado como objeto de controle um modelo de segunda ordem representado pelas expressões (9) e (10). &y&(t ) + a1 y& (t ) + a2 y (t ) = b0u (t ) a1 = 141,41043 a2 = 5327,9519 Figura 11. Ensaio com o preditor de Smith com compensação de variação de atrasos, o sinal de controle e a curva de roundtrip. Na Fig. 12 podem ser vistas em detalhe as curvas a partir do momento da perturbação. Entre o instante de tempo aproximado de 3,65 s e 5 s. O roundtrip variou dentro da faixa aproximada de 0,5 s a 0,6 s. (9) (10) b0 = 1131,016 A resposta ao degrau unitário da Fig. 10 foi obtida com a simulação sobre rede da malha de controle representada na Fig. 8. A reta “a” representa a referência, “b” é a resposta sem a os blocos Bm e o Buffer, i.e., sem o preditor de Smith. As curvas “c” e “d” são respectivamente a resposta do modelo e a respos- Figura 12. Curvas de resposta à perturbação na planta. Para ser feito o experimento, o controlador e o simulador da planta foram executados em um computador, mas a troca de pacotes entre estes processos foi feita via um segundo computador. Neste último foi executado um software de encaminhamento de pacotes com inserção de atrasos programados. Para os experimentos cujos resultados são demonstrados pelas Fig. 10, Fig. 11 e Fig. 12, foi programado um incremento constante ao atraso, somado de valores randômicos. Comparando estas figuras é visto que à medida que o atraso aumenta, o resultado do sistema sem o preditor de Smith com buffer de ajuste de variação de atraso se desestabiliza, enquanto que o outro se mantém estável dentro dos valores de atraso testados. Na Fig. 10, a saída da planta sem compensação de atraso apresenta um sobrepasso de aproximadamente 50% acima do valor de referência no primeiro instante, mas tende a convergir. No entanto, o atraso da rede começa a ser aumentado e o sobrepasso começa a aumentar. Na mesma figura, a curva de saída resultante do uso do preditor de Smith e compensação de variação de atraso, a curva de resposta da planta convergiu para a referência da mesma forma que a resposta do modelo local, i.e., o controle conseguiu um desempenho similar ao que se teria com uma planta local. Houve apenas um deslocamento da curva, equivalente ao tempo de roundtrip. A diferença de tempo percebida entre a saída da planta e a do modelo, destacada pelas linhas tracejadas verticais, na Fig. 10, é o tempo de roundtrip, sendo que o gráfico de ambas as curvas foi traçado com informações presentes no controlador 4 Conclusão Este trabalho apresentou uma proposta para desenvolvimento de sistemas de controle em redes IP, a qual combina um preditor de Smith com um sistema de compensação de variação de atraso. A proposta é capaz de lidar com atrasos variáveis que são característicos de redes IP e os estudos de caso desenvolvidos indicam que a solução proposta é adequada, pois apresentou uma melhora significativa no desempenho da resposta simulada, reduzindo o sobrepasso e o tempo de acomodação. Também demonstrou estabilidade mesmo com o acréscimo de atraso e jitter conforme a Fig. 11 e a inserção de uma perturbação. O preditor de Smith é um recurso já bastante conhecido para a compensação de atraso, mas também é sabido que quando submetido a variações na planta em relação ao modelo utilizado no preditor, ou variações de atraso, o controle pode ser desestabilizado, conforme demonstrado em Bahil (1983). Com a aplicação da proposta, a variação do atraso passou a influenciar menos o preditor, pois o atraso imposto ao modelo passou a ser sintonizado com o da rede a cada novo dado de realimentação recebido. Referências Bibliográficas Alt, Gustavo H., Lages, Walter F. e Lubaszewski, Marcelo S. (2003). Controle em Tempo Real de Robôs através de Redes IP., Universidade Federal do Rio Grande do Sul. Programa de PósGraduação em Computação. Porto Alegre. Bahil, A. Terry (1983). A Simple Adaptive SmithPredictor for Controlling Time-Delay Systems. Biomedical Engineering Program, Department of Electrical Engineering, Carnegie-Mellon University, Pittsburgh, PA 15213. Control Systems Magazine, p. 16-22. Bate, L. and Cook, C. (2001). The Feasibility of Force Control Over the Internet. Proceedings of Australian Conference on Robotics and Automation, Sydney, p. 14-15. Bauer, Peter et al. (2001). A New Class of Smith Predictors for Network Congestion Control. Electronics, Circuits and Systems, 2001. ICECS 2001. The 8th IEEE International Conference . v. 2, 2-5 Sept. 2001. p. 685-688. Costa, Rafael Pinto, Netto, João César e Pereira, Carlos Eduardo (2004). Analysis of Traffic Differentiation on Switched Ethernet. 16th Euromicro Conference on Real-Time Systems. Montufar-Chaveznava, e Mendez-Polanco, J. A. (2005). Multiagent Architecture for Telerobotics. IEEE - Proceedings of the 15th International Conference on Electronics, Communications and Computers (CONIELECOMP), [S. l.]. Neto, Angelo Zerbetto (2006). Análise do Impacto da Comunicação em Redes Foundation Fieldbus no Desempenho de Sistemas de Controle. 94 p. Dissertação de Mestrado – Programa de PósGraduação em Engenharia Elétrica, Universidade Federal do Rio Grande do Sul, Porto Alegre. Park, H. S., Kim, Y. H., Kim, D. S. and Kwon W. H. (2002). A Scheduling Method for NetworkBased Control Systems. IEEE Transactions on Control Systems Technology, [S. l.], v. 10, n. 3, p. 319-330. Wang, S.; XU, B; Wang, Q.. Delays Analysis for Teleoperation ove Internet and Smith Predictor with Adaptative Time-delay Control. IEEE Iternational Conference on Robotics and Biomimetics, [S. l.], p. 664-669, 2005.