link para o texto completo - Mestrado em Engenharia Elétrica
Transcrição
link para o texto completo - Mestrado em Engenharia Elétrica
b c Este trabalho, eu dedico a meus pais Isaac e Clara, bem como a minha futura esposa Miriam. AGRADECIMENTOS Ao Instituto Militar de Engenharia, especialmente ao Departamento de Engenharia Elétrica, pela oportunidade de realizar este curso de pós-graduação. Ao amigo, orientador e professor Geraldo Magela Pinheiro Gomes pela orientação sincera e idéias, sem as quais esta tese não teria se concretizado. Ao amigo e co-orientador Paulo Cesar Pellanda pelo interesse e paciência dispensada durante a realização desta tese. Aos amigos e professores Ernesto Leite Pinto, Alcyone Fernandes de Almeida Junior e Francisco José da Cunha Pires Soeiro pelas excelentes aulas ministradas durante as cadeiras de Sistemas Estocásticos, Sistemas Multivariáveis e Otimização, respectivamente. A minhas amigas e colegas de turma Cristiane de Oliveira Iorio e Letícia ... pela amizade sem interesse e excelente ambiente de trabalho durante as aulas do curso de pós-graduação. Aos amigos e colegas de turma Decílio Medeiros Sales e Marconi pela amizade e companheirismo demonstrado durante o curso. Aos meus pais que me deram força e incentivo para conclusão desta etapa de minha vida. A minha futura esposa Miriam pelo apoio durante a realização do curso e compreensão pelas horas de lazer perdidas. A CAPES pelo incentivo à pesquisa, concretizado através da bolsa de estudos fornecida durante o ano de tese. A todos aqueles que não tenham sido aqui citados, mas que de algum modo colaboraram para realização desta tese. ii RESUMO Esta tese realiza um estudo na área de controle robusto paramétrico, baseado na síntese PRCBI (Parameter Robust Control by Bayesian Identification). A finalidade principal deste trabalho consiste no cálculo, por métodos de otimização numérica, de controladores de robustez híbrida, isto é, aqueles obtidos levando-se em conta a robustez paramétrica e o desempenho do sistema analisado. Como aplicação para demonstrar os resultados alcançados, utilizou-se exemplos acadêmicos baseados no sistema massa-mola e um modelo real de um helicóptero, cedido pelo CERT (Centre d'Etudes et Recherches de Toulouse). iii ABSTRACT This Thesis carry out a study in the subject of parametrical robust feedback control, based on the synthesis PRCBI (Parameter Robust Control by Bayesian Identification). The main purpose of this work consist in the calculus, by numerical otimization methods, obtaining hibrid robustness controller, that is, those take into account the parametrical robustness and performance of the analysed system. As application to show obtained results, many academic examples based on mass-coil system were used and a real model of helicopter, provided by CERT (Centre d'Etudes et Recherches de Tolouse). iv SUMÁRIO RESUMO iii ABSTRACT iv LISTA DE ILUSTRAÇÕES viii LISTA DE TABELAS xv LISTA DE ABREVIATURAS E SÍMBOLOS 1 - INTRODUÇÃO GERAL xvii 1 1.1 - Motivação e posicionamento da tese 1 1.2 - Objetivos e Escopo 2 2 - OTIMIZAÇÃO 4 2.1 - Introdução 4 2.1.1 - Variáveis de projeto 5 2.1.2 - Restrições de projeto 5 2.1.3 - Função objetivo 6 2.2 - Métodos de otimização 7 2.2.1 - Grid e métodos aleatórios 9 2.2.2 - Método de Powell: Direções conjugadas 10 2.2.3 - Método do Steepest Descent 13 2.2.4 - Método dos Gradientes Conjugados 14 2.2.5 - Método da Aproximação Polinomial 15 2.3 - O sistema computacional 19 3 - TÓPICOS DE CONTROLE ÓTIMO E A SÍNTESE DE CONTROLE ROBUSTO PARAMÉTRICO PRCBI 21 3.1 - Introdução 21 3.2 - Tópicos de controle ótimo 22 3.2.1 - Regulador Linear Quadrático (LQR) v 22 3.2.2 - Regulador Linear Quadrático Gaussiano (LQG) 25 3.3 - Síntese de um controle robusto com base na qualidade de identificação bayesiana dos parâmetros sensíveis 29 3.3.1 - Introdução 29 3.3.2 - Qualidade de identificação bayesiana em malha fechada 30 3.3.3 - Síntese PRCBI 34 3.4 - O problema do seguidor ( Tracking ) 4 - O SISTEMA MASSA-MOLA 36 40 4.1 - Introdução 40 4.1.1 - Diagrama de Sensibilidade por Pontos 41 4.1.2 - Hiperesfera Percentual de Estabilidade 43 4.1.3 - A técnica das liberações 44 4.2 - Sistema massa-mola com 4 estados 45 4.2.1 - Resultados obtidos 48 4.3 - Sistema massa-mola com 8 estados 4.3.1 - Robustecimento a variação de 2 massas 55 55 4.3.1.1 - Equações de estado da planta 56 4.3.1.2 - Constantes e considerações adotadas 56 4.3.1.3 - Vetor de parâmetros sensíveis 57 4.3.1.4 - Resultados obtidos 57 4.3.2 - Robustecimento a variação de 4 massas 74 4.3.2.1 - Constantes e considerações adotadas 75 4.3.2.2 - Vetor de parâmetros sensíveis 75 4.3.2.3 - Resultados obtidos 76 5 - O PROBLEMA DO HELICÓPTERO 5.1 - Introdução 85 85 5.1.1 - Os movimentos do helicóptero 85 5.1.2 - O vôo do helicóptero 87 5.1.3 - O vôo estacionário (teórico) 88 vi 5.1.4 - O vôo vertical (ascendente e descendente) 89 5.1.5 - O vôo de translação (longitudinal e lateral) 89 5.1.6 - A finalidade do rotor traseiro 90 5.1.7 - O movimento de lacet 91 5.1.8 - Exemplos de movimentos acoplados 92 5.2 - O modelo matemático disponível 93 5.3 - O problema original e o proposto 94 5.4 - Critério adotado como desempenho ótimo 99 5.5 - A técnica das liberações realimentadas 103 5.6 - A aplicação da síntese PRCBI 106 5.7 - Resultados obtidos 108 6 - CONCLUSÕES E PERSPECTIVAS 123 6.1 - Conclusões 123 6.2 - Perspectivas 125 APÊNDICE A - SOLUÇÃO PARA AS EQUAÇÕES DE L, N e ∆ P' 126 REFERÊNCIAS BIBLIOGRÁFICAS 127 vii LISTA DE ILUSTRAÇÕES FIGURA 2.1: Minimização através do método de Powell 11 FIGURA 2.2: Fluxograma do método de otimização de Powell 12 FIGURA 2.3: Fluxograma do método de otimização Steepest Descent 14 FIGURA 2.4: Fluxograma do método dos gradientes conjugados 15 FIGURA 2.5: Uma possível forma de F( α) 16 FIGURA 2.6: Fluxograma do método de aproximação polinomial 19 FIGURA 2.7: Sistema computacional utilizado na tese 20 FIGURA 3.1: Estrutura LQR com observador preditor 23 FIGURA 3.2: Algoritmo para o cálculo de K C 24 FIGURA 3.3: Estrutura LQG com filtro de Kalman preditor 26 FIGURA 3.4: Estrutura LQG com filtro de Kalman corrente 27 FIGURA 3.5: Algoritmo para o cálculo de K F 28 FIGURA 3.6: Visualização da qualidade de identificação paramétrica para um caso escalar 30 FIGURA 3.7: Estrutura do problema abordado 32 FIGURA 3.8: Síntese PRCBI em malha fechada 35 FIGURA 3.9: Diagrama do problema do seguidor 39 FIGURA 4.1: Fluxograma da técnica das liberações para duas funções objetivo 46 FIGURA 4.2: Diagrama físico do sistema massa-mola de 4 estados 46 FIGURA 4.3: Evolução temporal dos estados da planta em malha aberta 51 FIGURA 4.4: Diagrama de sensibilidade para o controlador 4.1 52 FIGURA 4.5: Diagrama de sensibilidade para o controlador 4.2 52 FIGURA 4.6: Diagrama de sensibilidade para o controlador 4.3 53 FIGURA 4.7: Diagrama de sensibilidade para o controlador 4.5 53 FIGURA 4.8: Diagrama de sensibilidade para o controlador 4.8 54 FIGURA 4.9: Diagrama de sensibilidade para o controlador 4.10 54 viii FIGURA 4.10: Diagrama físico do sistema massa-mola de 8 estados 55 FIGURA 4.11: Diagrama de sensibilidade com o controlador 4.11 61 FIGURA 4.12: Região de estabilidade e hiperesfera percentual com o controlador 4.11 61 FIGURA 4.13: Diagrama de sensibilidade com o controlador 4.12 62 FIGURA 4.14: Região de estabilidade e hiperesfera percentual com o controlador 4.12 62 FIGURA 4.15: Diagrama de sensibilidade com o controlador 4.13 63 FIGURA 4.16: Região de estabilidade e hiperesfera percentual com o controlador 4.13 63 FIGURA 4.17: Diagrama de sensibilidade com o controlador 4.14 64 FIGURA 4.18: Região de estabilidade e hiperesfera percentual com o controlador 4.14 64 FIGURA 4.19: Diagrama de sensibilidade com o controlador 4.15 65 FIGURA 4.20: Região de estabilidade e hiperesfera percentual com o controlador 4.15 65 FIGURA 4.21: Diagrama de sensibilidade com o controlador 4.16 66 FIGURA 4.22: Região de estabilidade e hiperesfera percentual com o controlador 4.16 66 FIGURA 4.23: Diagrama de sensibilidade com o controlador 4.17 67 FIGURA 4.24: Região de estabilidade e hiperesfera percentual com o controlador 4.17 67 FIGURA 4.25: Diagrama de sensibilidade com o controlador 4.18 68 FIGURA 4.26: Região de estabilidade e hiperesfera percentual com o controlador 4.18 68 FIGURA 4.27: Diagrama de sensibilidade com o controlador 4.19 69 FIGURA 4.28: Região de estabilidade e hiperesfera percentual com o controlador 4.19 69 FIGURA 4.29: Diagrama de sensibilidade com o controlador 4.20 ix 70 FIGURA 4.30: Região de estabilidade e hiperesfera percentual com o controlador 4.20 70 FIGURA 4.31: Diagrama de sensibilidade com o controlador 4.23 71 FIGURA 4.32: Região de estabilidade e hiperesfera percentual com o controlador 4.23 71 FIGURA 4.33: Diagrama de sensibilidade com o controlador 4.21 72 FIGURA 4.34: Região de estabilidade e hiperesfera percentual com o controlador 4.21 72 FIGURA 4.35: Diagrama de sensibilidade com o controlador 4.22 73 FIGURA 4.36: Região de estabilidade e hiperesfera percentual com o controlador 4.22 73 FIGURA 4.37: Diagrama físico do sistema analisado 75 FIGURA 4.38: Diagrama de sensibilidade com o controlador 4.24 79 FIGURA 4.39: Evolução temporal do módulo da saída nominal e envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.24 79 FIGURA 4.40: Diagrama de sensibilidade com o controlador 4.25 80 FIGURA 4.41: Evolução temporal do módulo da saída nominal e envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.25 80 FIGURA 4.42: Diagrama de sensibilidade com o controlador 4.26 81 FIGURA 4.43: Evolução temporal do módulo da saída nominal e envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.26 81 FIGURA 4.44: Diagrama de sensibilidade com o controlador 4.29 82 FIGURA 4.45: Evolução temporal do módulo da saída nominal e envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.29 82 FIGURA 4.46: Diagrama de sensibilidade com o controlador 4.27 83 x FIGURA 4.47: Evolução temporal do módulo da saída nominal e envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.27 83 FIGURA 4.48: Diagrama de sensibilidade com o controlador 4.28 84 FIGURA 4.49: Evolução temporal do módulo da saída nominal e envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.28 84 FIGURA 5.1: Referência utilizada pelo helicóptero 86 FIGURA 5.2: As forças aplicadas sobre o helicóptero em vôo 88 FIGURA 5.3: O vôo estacionário 88 FIGURA 5.4: O vôo ascendente e descendente 90 FIGURA 5.5: Vôo de translação longitudinal e lateral 90 FIGURA 5.6: O rotor traseiro 91 FIGURA 5.7: Representação dos modelos disponíveis linearizados nas velocidades apresentadas 93 FIGURA 5.8: Diagrama do problema original H ∞ 96 FIGURA 5.9: Diagrama do problema proposto 98 FIGURA 5.10: Cálculo do custo da fase 1 de desempenho - Manobra 1 101 FIGURA 5.11: Cálculo do custo da fase 2 de desempenho - Manobra 1 101 FIGURA 5.12: Cálculo do custo da fase 3 de desempenho - Manobra 1 102 FIGURA 5.13: Cálculo do custo final de desempenho - Manobra 1 102 FIGURA 5.14: Fluxograma da etapa 2 da técnica das liberações realimentadas 105 FIGURA 5.15: Adaptação da síntese PRCBI para o problema do helicóptero 107 FIGURA 5.16: Diagrama de sensibilidade com o controlador 5.1, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul) 111 xi FIGURA 5.17: Diagrama de sensibilidade com o controlador 5.2, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul) 112 FIGURA 5.18: Diagrama de sensibilidade com o controlador 5.3, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul) 112 FIGURA 5.19: Diagrama de sensibilidade com o controlador 5.4, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul) 113 FIGURA 5.20: Diagrama de sensibilidade com o controlador 5.5, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul) 113 FIGURA 5.21: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.1 na velocidade longitudinal de 200 Km/h 114 FIGURA 5.22: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.2 na velocidade longitudinal de 200 Km/h 114 FIGURA 5.23: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.1 na velocidade longitudinal de 200 Km/h 115 FIGURA 5.24: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.2 na velocidade longitudinal de 200 Km/h 115 FIGURA 5.25: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.1 na velocidade longitudinal de 200 Km/h 116 FIGURA 5.26: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.2 na velocidade longitudinal de 200 Km/h 116 xii FIGURA 5.27: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.1 na velocidade longitudinal de 100 Km/h 117 FIGURA 5.28: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.2 na velocidade longitudinal de 100 Km/h 117 FIGURA 5.29: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.1 na velocidade longitudinal de 100 Km/h 118 FIGURA 5.30: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.2 na velocidade longitudinal de 100 Km/h 118 FIGURA 5.31: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.1 na velocidade longitudinal de 100 Km/h 119 FIGURA 5.32: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.2 na velocidade longitudinal de 100 Km/h 119 FIGURA 5.33: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.1 na velocidade longitudinal de 300 Km/h 120 FIGURA 5.34: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.2 na velocidade longitudinal de 300 Km/h 120 FIGURA 5.35: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.1 na velocidade longitudinal de 300 Km/h 121 FIGURA 5.36: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.2 na velocidade longitudinal de 300 Km/h 121 xiii FIGURA 5.37: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.1 na velocidade longitudinal de 300 Km/h 122 FIGURA 5.38: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.2 na velocidade longitudinal de 300 Km/h 122 xiv LISTA DE TABELAS TABELA 3.1: Exemplo da notação adotada TABELA 4.1: Significado físico dos estados do sistema massa-mola de 4 31 estados 47 TABELA 4.2: Valores adotados para os parâmetros utilizados 47 TABELA 4.3: Vetores obtidos na fase 1 do processo de otimização 48 TABELA 4.4: Controladores obtidos na fase 2 do processo de otimização 49 TABELA 4.5: Características obtidas nos controladores otimizados 49 TABELA 4.6: Significado físico dos estados do sistema massa-mola de 8 estados TABELA 4.7: 57 Controladores obtidos através da síntese PRCBI, por métodos de otimização utilizando critérios híbridos e por meio analítico TABELA 4.8: 58 Características dos controladores obtidos a partir da síntese PRCBI e pela liberação do custo de robustez ótimo TABELA 4.9: 60 Características dos controladores obtidos a partir da liberação do custo de desempenho nominal ótimo, otimizando-se o traço de G θ−1 0 60 TABELA 4.10: Controladores obtidos através da síntese PRCBI, por métodos de otimização utilizando critérios híbridos e por meio analítico 76 TABELA 4.11: Características dos controladores obtidos a partir da síntese PRCBI e pela liberação do custo de robustez ótimo 76 TABELA 4.12: Características dos controladores obtidos por métodos de otimização e por meio analítico (LQR) 77 TABELA 5.1: Correspondência entre termos 85 TABELA 5.2: Os movimentos do helicóptero 86 TABELA 5.3: Dados referentes aos estados do modelo 94 xv TABELA 5.4: Dados referentes às entradas do modelo 94 TABELA 5.5: Entradas de referência 96 TABELA 5.6: Efeitos das manobras do helicóptero 97 TABELA 5.7: Controladores calculados no problema do helicóptero 108 TABELA 5.8: Características dos controladores calculados 108 xvi LISTA DE ABREVIATURAS E SÍMBOLOS FK : Filtro de Kalman LQG : "Linear Quadratic Gaussian" LQG/LTR : "Linear Quadratic Gaussian - Loop Transfer Recovery" LTI : "Linear Time Invariant" LQR : "Linear Quadratic Regulator" MF : Malha fechada MIMO : "Multiple-Input-Multiple-Output" PRCBI : "Parameter Robust Control by Bayesian Identification" PRLQG : "Parameter Robust Linear - Quadratic Gaussian" E{ ⋅ } : Esperança matemática z −1 : Retardo unitário x : Vetor x Cn : Conjunto dos vetores complexos de dimensão n Cn × m : Conjunto de matrizes complexas de dimensão n x m In : Matriz identidade de ordem n In × m : Matriz identidade de dimensão n x m G θ−1 : Matriz da qualidade de identificação bayesiana. ℜn : Conjunto dos vetores reais de ordem n ℜn × m : Conjunto das matrizes reais de ordem n x m AT : Matriz transposta da matriz A. 0 A : Determinante da matriz A b : Valor absoluto do escalar b c : Módulo do vetor c θ : Vetor paramétrico a ∈B : a pertence a B ⊗ : Produto de Kronecker xvii ( ⋅ )0 : Argumento considerando o sistema operando com os parâmetros ( ⋅ )p nominais : Argumento considerando o sistema operando com os parâmetros perturbados 0 A( : , n) : Vetor com todos os elementos nulos : Vetor contendo todos os elementos da coluna n da matriz A A( m, : ) : Vetor contendo todos os elementos da linha m da matriz A Tr A : Traço da matriz A A −1 : Matriz inversa de A s : Variável de Laplace z : Variável complexa representativa do domínio discreto x$ : Vetor x estimado x$ k / k−1 : Vetor x predito: vetor estimado no tempo k com base nos valores conhecidos em k-1 x$ k / k : Vetor x corrente: vetor estimado no tempo k com base nos valores conhecidos em k λ max ( A ) : Autovalor máximo da matriz A Ctrl : Controlador F( ⋅ ) : F é uma função objetivo do argumento f( ⋅ ) : f é uma função qualquer do argumento ∆ : Variação incremental xviii CAPÍTULO 1 INTRODUÇÃO GERAL 1.1 - MOTIVAÇÃO E POSICIONAMENTO DA TESE Nesta tese propõe-se realizar um estudo na área de Controle Robusto Paramétrico, baseado na síntese PRCBI (Parameter Robust Control by Bayesian Identification) (GOMES, 1991), desenvolvida a partir de um estudo sobre o comportamento assintótico dos estimadores bayesianos (GAUVRIT, 1982). Durante os grandes desenvolvimentos teóricos dos anos 60-80, pouco foi considerado sobre variação de modelos. As teorias de controle ótimo envolvendo sistemas multivariáveis (métodos LQ, LQG, Filtros de Kalman, etc.) levam em conta apenas o desempenho nominal do sistema e supõem as plantas perfeitamente representadas pelos respectivos modelos utilizados. O conceito de robustez constitui parte fundamental na teoria de controle, tendo como principal razão a não existência de um modelo que represente perfeitamente a realidade. Os modelos são, em sua maioria, aproximações de processos reais que encontram-se vulneráveis a diversos tipos de perturbações. Em consequência, os modelos acabam não representando os sistemas reais, tornando impraticável o controle de determinadas plantas. Além disso, algumas plantas apresentam em suas estruturas, parâmetros sujeitos a perturbações de natureza aleatória que devem ser tratadas com técnicas especiais de controle robusto. O controle robusto é uma técnica moderna que visa adaptar os métodos de controle ótimo de modo a tornar os sistemas imunes a diversos tipos de perturbações. Portanto, um regulador robusto deve ser capaz de manter a estabilidade e assegurar uma maior insensibilidade do desempenho do sistema que se encontra submetido a alguma perturbação. Dentro da literatura, os erros de modelagem são considerados perturbações e classificam-se segundo duas grandes classes: ESTRUTURADOS (variações paramétricas) e NÃO ESTRUTURADOS (dinâmicas 1 não modeladas, retardos, modos de alta freqüência ignorados, etc.). Considera-se como variações paramétricas, as alterações dos valores nominais assumidos por determinadas constantes, chamadas de parâmetros, internas à planta utilizada. Por vetor paramétrico ou vetor de parâmetros sensíveis deve-se entender um vetor formado por todos os parâmetros em relação aos quais o sistema deverá ser robustecido. As técnicas robustas de natureza freqüêncial (método LQG/LTR, síntese H ∞ , etc.) são mais adaptadas às incertezas não estruturadas, apresentando-se freqüentemente menos eficientes em relação às incertezas paramétricas. A síntese PRCBI, por estar baseada na formulação de espaço de estado, de natureza temporal, adapta-se melhor às incertezas estruturadas. 1.2 - OBJETIVOS E ESCOPO Os objetivos desta tese são: a) Realizar um estudo sobre métodos de otimização a fim de melhor aplicá-los à síntese PRCBI, permitindo obter, através de meios numéricos, controladores mais robustos à variações paramétricas para os modelos analisados. b) Desenvolver um controlador com "robustez híbrida", isto é, aquele resultante da otimização de um critério a ser estabelecido que levará em conta a robustez paramétrica, bem como as características de desempenho exigidas pelo sistema, em complemento aos estudos que originaram a síntese PRCBI (GAUVRIT, 1982 ; GOMES, 1991). c) Aplicar o critério e a técnica de otimização numérica em um modelo real multivariável, investigando os resultados alcançados. O modelo escolhido foi o de um helicóptero, desenvolvido e em fase de estudos pela Aeroespaciale Francesa, tendo sido cedido pelo CERT ( Centre d'Etudes et Recherches de Tolouse ). 2 O Capítulo 2 desta tese descreve alguns conceitos básicos sobre otimização. Além disso são apresentados os métodos utilizados neste trabalho, bem como seus respectivos fluxogramas. O Capítulo 3 apresenta um resumo das técnicas de controle ótimo quadrático, com base na realimentação de estados estimados, além dos desenvolvimentos teóricos relacionados com a síntese PRCBI. Encontra-se também comentado o problema do seguidor (tracking), cuja teoria será empregada no Capítulo 5. O Capítulo 4 mostra os resultados da aplicação da síntese PRCBI em três exemplos acadêmicos monovariáveis relacionados com um sistema massa-mola. Neste capítulo são apresentados diversos controladores com robustez híbrida, bem como a técnica de otimização desenvolvida para obtê-los. O Capítulo 5 apresenta os resultados da aplicação da síntese PRCBI em um modelo multivariável de um helicóptero, obtidos a partir de um aperfeiçoamento da técnica de otimização utilizada no Capítulo 4. No Capítulo 6 , referente às conclusões, são comentadas as contribuições desta tese e algumas sugestões para desenvolvimentos futuros. 3 CAPÍTULO 2 OTIMIZAÇÃO 2.1 - INTRODUÇÃO As técnicas apresentadas a seguir estão baseadas no "projeto ótimo quantificado". Por exemplo, na estrutura de uma ponte pode ser adotado concreto, aço ou ainda algum outro material a ser definido, proporcionando em relação aos demais parâmetros do projeto soluções distintas. Do ponto de vista do projeto ótimo, as soluções encontradas deverão ser quantificadas em função dos valores dos parâmetros adotados, baseadas em determinado critério específico. Esta quantificação levará também em conta as limitações e restrições impostas ao projeto, que deverão ser atendidas da melhor maneira possível na ótica do critério escolhido. Os métodos apresentados a seguir são numéricos e somente podem ser utilizados por intermédio de programas de computador. Os métodos e algoritmos expostos não permitirão soluções inovadoras para os problemas de engenharia, mas sim a satisfação de objetivos pré-selecionados, levandose em conta as limitações impostas. A metodologia portanto não adiciona diretamente um meio de desenvolvimento criativo de novas soluções, mas permite a obtenção de uma melhor solução dentro do conceito de projeto ótimo. Estas idéias formam a base da ferramenta de projeto denominada por "Otimização", onde os conflitos entre os diversos objetivos serão decididos através da quantificação adotada. Para a utilização desta ferramenta considera-se que o problema já possui uma formulação apropriada para análise, bem como um modelo matemático. Cabe alertar que este capítulo não tem por objetivo esgotar o assunto, mas sim comentar os métodos utilizados neste trabalho, além de apresentar noções sobre otimização (FOX, 1971 ; VANDERPLAATS, 1984). 4 2.1.1 - Variáveis de Projeto As variáveis que tiverem seus valores determinados durante o processo de otimização, produzindo uma solução para o problema, serão daqui por diante designadas por variáveis de projeto. Alguns autores preferem chamá-las de parâmetros de construção ou variáveis de construção. O vetor de variáveis de projeto X é simplesmente um vetor coluna contendo todas as variáveis a serem definidas em um problema particular. Quando os valores das variáveis estão definidos, diz-se ter obtido um projeto. Ao formular um problema deve-se simplificar ao máximo o número de variáveis de projeto, isto é, se x3 = f ( x1 , x2 ) então x 3 não deverá ser uma variável de projeto. Tais simplificações poderão render consideráveis vantagens em termos computacionais na obtenção da solução desejada. Em certos problemas, determinados valores são pré-fixados, sendo denominados por parâmetros. O conjunto destes valores constantes durante o processo de otimização acrescido ao das variáveis de projeto descreverá completamente a solução obtida. 2.1.2 - Restrições de Projeto Deve-se enfatizar que um projeto é simplesmente um conjunto particular de valores para as variáveis de projeto. O vetor X particular será um projeto ainda que possua um significado absurdo, o que ocorre por exemplo, quando a variável x i que representa a área de uma determinada peça assume um valor negativo. Claramente, alguns projetos representam soluções mais úteis que outros. Se um projeto alcança todos os requisitos estabelecidos, será chamado de projeto aceitável ou factível. Caso contrário será dito um projeto não aceitável. As limitações que o projeto deve atender são genericamente denominadas por restrições. Normalmente, identifica-se duas categorias de restrições em problemas de engenharia, ou seja, laterais e de comportamento. No primeiro tipo, consideram-se aquelas que limitam a faixa de 5 projeto de uma determinada variável, sendo também chamadas de restrições de construtibilidade. No segundo incluem-se as impostas por necessidade de desempenho, onde obriga-se às variáveis de projeto a atenderem determinadas funções. Neste caso poderia-se citar como exemplo a otimização de um controlador segundo um critério específico, em que uma das imposições seria a necessidade de tornar ou manter o sistema em questão estável. Embora na grande maioria dos casos não seja possível ou prático escrever funções explícitas para as restrições, ainda assim estas poderão ser escritas de modo computável e portanto passíveis de utilização. Neste caso, por exemplo, enquadra-se a verificação dos modos de uma determinada planta discreta controlada onde deverá ser observado se os pólos de malha fechada não estarão fora do círculo unitário (plano z). Outros tipos de restrição ocorrem quando as variáveis de projeto admitem somente valores discretos. Tais restrições podem ser problemáticas, embora existam técnicas para manipulá-las ou evitá-las. 2.1.3 - Função Objetivo Considerando todos os projetos factíveis, certamente alguns serão melhores que outros. Se isto é verdade, então existirá alguma qualidade que o melhor projeto alcançará em relação aos demais. Esta qualidade, denominada função objetivo, será uma função computável das variáveis de projeto, otimizada a fim de obter o melhor projeto. Daqui por diante será designada por F ou ainda por F(X) para enfatizar sua dependência com as variáveis de projeto. Considera-se que a função objetivo deva sempre ser minimizada, o que ocorrerá sem perda de generalidade, já que o máximo de F(X) será o mínimo de −F( X) . A seleção da função objetivo é uma das mais importantes decisões em um problema de otimização. Por exemplo: "Componentes leves fazem bons aviões". Claramente bons aviões não são apenas aqueles que possuem peças leves, já que outros objetivos também devem ser atingidos, isto é, devem ser econômicos para operar, baratos para serem adquiridos, devem possuir estabilidade no vôo, etc. O 6 critério de utilização de componentes leves poderá ser admitido para atingir mais rapidamente os objetivos propostos, mas certamente não proporcionará os resultados desejados caso seja considerado isoladamente. Em alguns problemas, poderá ocorrer que duas ou mais quantidades devam ser funções objetivo. Por exemplo, considere um produto a ser projetado de modo que duas propriedades indesejáveis A e B devam ser minimizadas. Para este caso não existirá um meio de satisfazer tais requisitos em casos gerais, a menos que as propriedades sejam dependentes completamente de conjuntos de variáveis de projeto distintos e as restrições sejam independentes. ( ) ( ) ∀X aceitável. Portanto A( X ) << A( X ) e B( X ) << B( X ) . Deste modo, nenhum dos Considere dois projetos X1 e X 2 tais que A X1 << A( X) e B X2 << B( X) , 1 2 2 1 dois projetos será o mais desejável. Assim adotam-se as seguintes condutas: (a) Formula-se uma função objetivo composta, isto é, F( X) = λ1. A( X) + (1 − λ1 ). B( X) onde λ 1 é uma constante; (b) O limite imposto para uma das funções é utilizado como restrição para outra. Esta última será bastante explorada nos problemas estudados (Capítulos 4 e 5). Na construção de tais funções deve-se ter certeza que a unidade dimensional não trará prejuízos. Por exemplo, se A está em metros e B em dólares, então A + B poderia ser perfeitamente aceitável como uma função objetivo. No entanto, certamente não seria a mesma, caso A estivesse em milímetros. Muito tem sido escrito sobre as funções objetivo, e em alguns casos tais funções constituem-se partes essenciais do processo de modelagem do sistema (FOX, 1971). 2.2 - MÉTODOS DE OTIMIZAÇÃO A seguir serão apresentados alguns métodos de otimização utilizados nesta tese, bem como outros de menor importância, por razões didáticas. Pode-se classificar os métodos de otimização em métodos baseados no gradiente e métodos de ordem zero, que são aqueles que independem do cálculo do gradiente da função. Do primeiro 7 caso, serão comentados adiante os métodos do Steepest Descent e dos Gradientes Conjugados, que utilizam a primeira derivada. Entre os métodos de ordem zero podese citar o de Powell que foi intensivamente utilizado nos cálculos apresentados nesta tese. O método da variável métrica, bastante conhecido em otimização, também dependente do cálculo da primeira derivada da função, não será abordado nesta tese, já que nos problemas estudados não possuía-se a derivada citada de forma analítica. A utilização da análise de sensibilidade para suprir a falta de tal derivada normalmente gera resultados bastante imprecisos, desestimulando a aplicação da variável métrica. Na maioria dos problemas, não é possível garantir que a solução do processo de minimização seja realmente o mínimo do problema proposto, isto é, o mínimo global. Nestes casos, as soluções são denominadas de mínimos locais ou relativos pois garantem o valor mínimo da função somente em suas respectivas vizinhanças, mas não necessariamente para todos os X. O problema do mínimo local é um dos mais discutidos em otimização, já que a maioria dos métodos viáveis podem procurar somente mínimos relativos e não garantem que algum destes seja realmente o mínimo global. A solução escolhida para o projeto ótimo poderá ser a melhor entre os diversos mínimos relativos. No entanto a solução global poderá permanecer desconhecida, pois para obtê-la necessita-se de grandes alterações nos valores do projeto do mínimo relativo. Um dos modos mais comuns de lidar com este problema consiste em utilizar diversos pontos iniciais de otimização, denominados por sementes. Como os mínimos obtidos estarão próximos dos pontos iniciais, o uso de várias sementes aumentará a probabilidade de atingir o mínimo global. Os métodos aqui abordados são considerados de otimização sem restrição, onde o problema a ser resolvido consiste em descobrir X tal que F(X ) seja mínimo, qualquer que seja X. Nos problemas estudados, a implementação de restrições será realizada através de artifícios matemáticos e computacionais. 8 2.2.1 - Grid e Métodos Aleatórios O estudo das variáveis de projeto consiste no exame sistemático da faixa de projeto fornecida a fim de escolher o "melhor" entre os analisados. O grid e os métodos aleatórios são utilizados quando existe um pequeno número de variáveis de projeto e a avaliação do custo de um determinado projeto pode ser realizada rapidamente. Além disso, utiliza-se este método quando deseja-se obter uma noção qualitativa da superfície estudada. O método do grid consiste em avaliar a função objetivo para todas as combinações possíveis de valores assumidos pelas variáveis de projeto, escolhendo-se ao final do processo a combinação de menor custo. Como normalmente tais variáveis são contínuas, estabelece-se um espaçamento constante para cada variável dentro de suas respectivas faixas de projeto a fim de permitir a avaliação do custo. Obviamente quanto menor o espaçamento, mais precisa será a solução, mas em compensação também maior será o tempo de processamento computacional. Considere entretanto um problema com dez variáveis de projeto e um grid consistindo da determinação de dez valores para cada variável. Se uma avaliação de custo consome 0,001 segundos computacionalmente, então para o grid inteiro levará 0, 001 × 1010 = 107 segundos, ou aproximadamente 3000 horas. Certamente, só problemas extremamente importantes justificariam tais gastos. Neste caso poderia-se considerar o aumento do espaçamento do grid, mas isto possivelmente reduziria a probabilidade de obter o melhor projeto possível. Os métodos aleatórios são sempre conceitualmente triviais (FOX, 1971), consistindo na avaliação do custo de projetos gerados aleatoriamente. Cabe observar que a maioria das linguagens de programação dispõem de geradores de números aleatórios, facilitando o uso de tais métodos. A principal utilidade está em pequenos problemas onde o esforço de programação e aplicação de métodos mais eficientes supera o custo de tempo computacional dos aleatórios. Sugere-se que tais métodos sejam utilizados para gerar boas sementes. A partir destas sementes emprega-se então métodos de otimização mais eficientes. 9 2.2.2 - Método de Powell: Direções Conjugadas Neste método define-se a priori uma base vetorial para o espaço de otimização trabalhado. Normalmente a base adotada é a canônica, isto é, os vetores coluna que compõem a matriz identidade da ordem do vetor de variáveis de projeto. Definida a base, explora-se sequencialmente a minimização unidimensional de cada uma destas direções. Ao encerrar este primeiro ciclo, calcula-se a direção formada pelo ponto final deste processo e o ponto inicial ("semente"). Esta direção, dita conjugada, formada pela minimização da função em cada uma das direções da base adotada, substituirá a primeira da base. Explora-se novamente cada uma das direções da nova base, formando-se então outra direção conjugada neste ciclo, que substituirá então a segunda direção da base inicial. Este processo será repetido indefinidamente até que a função tenha convergido para um mínimo. Cabe neste ponto tecer um comentário sobre a minimização unidimensional, que consiste em encontrar α = α* de tal modo que: ( ) ( ) ) F X1 = F X0 + αS = F(α) (2.1) seja mínimo na direção S, a partir do ponto X 0 , qualquer que seja α . O processo de cálculo de α * será apresentado no Item 2.2.5 (Método da Aproximação Polinomial). A Figura 2.1 ilustra uma superfície tridimensional, quantificada através de curvas de níveis, onde as curvas mais internas possuem valores menores, sendo minimizada através do método de Powell. Neste caso: x z = F( X) e X = ∈ ℜ2 y (2.2) Na Figura 2.1, as direções 1 e 2 são as da base inicial. A direção a é a conjugada deste primeiro ciclo e substituirá a direção 1 da base inicial. Minimiza-se 10 então as direções da nova base, formando-se então a direção conjugada b, que substituirá a direção 2 da base inicial. O processo será repetido conforme citado. 6 5 b a 4 3 2 1 FIGURA 2.1: Minimização através do método de Powell. Demonstra-se que (FOX, 1971), se F(X) pode ser escrita sob a forma quadrática, conforme a Equação (2.3), então o método de Powell levará ao mínimo global de F(X) após executar o algoritmo ilustrado na Figura 2.2 até que a base vetorial inteiramente formada por direções conjugadas já tenha sido minimizada. F( X) = XTAX + XT B + c (2.3) onde A e B são matrizes constantes de dimensões compatíveis com o problema e "c" é um escalar. Deve-se observar que o sinal de " =" utilizado nos algoritmos ilustrados nesta tese estão empregados no sentido de atribuição. Por exemplo, q = q + 1 deve ser entendido como q recebe o valor de q+1. 11 Início Dado de Entrada: X 0 => Ponto inicial. A = I N ×N J=1 q=0 L=1 Dado de Saída: X tal que F( X ) é mínimo. J≤N q = q+1 J = J+1 A (:, L ) = Xq − X 0 N L = L+1 J=1 X0 = Xq S S = (A :, J) X q +1 = Xq + α* S L>N Calcula α = α* que minimiza F (Xq + αS) N N S L=1 Converg. Ok? S X = Xq Fim FIGURA 2.2: Fluxograma do método de otimização de Powell. Cabe observar que o teste da convergência apresentado na Figura 2.2 poderá ser realizado do seguinte modo: ( ) ( ) F Xq − F Xq −1 ≤ ε onde ε é uma constante pré-definida. 12 (2.4) 2.2.3 - Método do Steepest Descent O vetor gradiente de uma função F( X) é simbolizado por ∇F, representando a direção de maior taxa de variação da função. O gradiente é definido como: ∂F ∂F ∂F , , ... , ∇F ≡ G ≡ ∂x n ∂x1 ∂x2 T (2.5) ) T ) Qualquer direção e tal que G . e < 0 é chamada uma direção de descenso, já ) que F( X) será localmente decrescente na direção positiva de e . Esta propriedade foi ) reconhecida em 1847 por Cauchy, que considerou e como uma boa direção de minimização. Outro conjunto de direções interessantes ocorre quando: T ) G .e = 0 (2.6) que representa a ortogonalidade entre a direção considerada e o gradiente. A Equação (2.6) define portanto uma direção contida no hiperplano tangente à superfície F( X) = constante, em algum ponto X do espaço. A essência deste método consiste em utilizar a direção do gradiente, no seu sentido inverso, como a direção escolhida para a minimização da função a partir de um determinado ponto. Portanto: S = −∇F (2.7) A Figura 2.3 apresenta o fluxograma do método em questão. Entre as deficiências do método pode-se citar que quando a função minimizada possui alta excentricidade ou, quando existe um grande número de variáveis de projeto e o gradiente da função não existe analiticamente, a convergência torna-se bastante lenta. 13 Início Dado de Entrada: X 0 => Ponto inicial. Dado de Saída: X tal que F(X) é mínimo. q=0 S = −∇F(X) X = Xq Calcula α = α* que minimiza F(X q + α S) q = q+1 N Xq +1 = X q + α* S convergiu ? S X = Xq +1 Fim FIGURA 2.3: Fluxograma do método de otimização Steepest Descent. 2.2.4 - Método dos Gradientes Conjugados As dificuldades de convergência do método do Steepest Descent podem ser reduzidas através de uma simples modificação no método apresentado no item anterior, transformando-o no método dos Gradientes Conjugados ou de Fletcher e Reeves. Neste método, a nova direção a ser minimizada é formada pela composição da direção do gradiente da função com um resíduo da direção anteriormente minimizada. Logo: S q +1 = − G q +1 + β S q (2.8) onde β é um escalar que determina a influência da direção anterior na nova direção de minimização, sendo calculado conforme ilustra o algoritmo da Figura 2.4. 14 Uma situação especial ocorre quando a nova direção de minimização, calculada através da Equação (2.8), não é uma direção de descenso, ou seja: S q +1 . G q +1 > 0 T (2.9) Neste caso o processo deve ser reinicializado fazendo-se Sq +1 = − G q +1 . Início Dado de Entrada: X 0 => Ponto inicial. Dado de Saída: X tal que F(X) é mínimo q=0 G q = ∇F (X) X =X S = −G q q S Calcula α = α* que minimiza F(Xq +αS) N Slp = ST . G q +1 q = q +1 X q +1 = X q + α* S convergiu ? Slp ≥ 0 G q +1 = ∇F X N β =( S X = X q +1 Fim G q +1 Gq ) X = Xq +1 2 S = −G q +1 + βS FIGURA 2.4: Fluxograma do método dos Gradientes Conjugados. 2.2.5 - Método da Aproximação Polinomial Na realidade, este método compõe o sistema de otimização, atuando conjuntamente com um dos algoritmos apresentados nos Itens 2.2.2, 2.2.3 e 2.2.4, sendo também denominado de "Interpolação Quadrática". Consiste num método de 15 grande simplicidade que permite determinar o valor de α = α * , que leve a uma boa aproximação do mínimo de F(X ) na direção considerada. A rapidez da obtenção de α * está relacionada com a precisão do mesmo. Deste modo, deve-se estabelecer um compromisso entre a velocidade de obtenção e a precisão do valor, a fim de obter mais rapidamente a solução geral para o problema. Como a otimização consiste na minimização sequêncial de diversas direções, através de um processo de aproximações sucessivas ao mínimo relativo, seria um desperdício de tempo tentar determinar precisamente o mínimo da função em cada uma das direções pesquisadas. Considere uma direção Sq de modo que: X q +1 = X q + α.Sq (2.10) onde, se α é considerado uma variável, o lugar geométrico de X q+1 para uma faixa de valores de α é uma linha reta. Calculando F( X q +1 ) obtém-se: ) F( Xq +1 ) = F( X q + α.Sq ) = F(α ) (2.11) Como F pode ser considerada uma função de α , já que X q e Sq estão fixos, ) procura-se o valor de α que minimiza F(α ) . A Figura 2.5 apresenta uma possível ) ) forma de F(α ) . Observe que α * , não produzirá o mínimo global de F , a menos que X q +1 = X q + α.Sq contenha o ponto mínimo global. F( X q + α.Sq ) α ) FIGURA 2.5: Uma possível forma de F(α ) . 16 Através deste conceito, o problema de minimizar F(X ) poderá ser reduzido a um conjunto de minimizações unidimensionais, sem que a dimensão de X seja considerada. Resta ainda o cálculo de α * , que só será possível através de algum ) processo numérico. Considere então que a função F(α ) possa ser aproximada pela função H(α ) , de modo que: H (α ) = a + bα + cα 2 (2.12) Se c > 0 então o mínimo desta parábola será: dH = b + 2cα = 0 dα (2.13) Ou ainda, α* = − b 2c (2.14) ) As constantes a, b e c podem ser determinadas atribuindo-se valores a F(α ) em três pontos distintos α1 , α 2 e α 3 e igualando-se a H(α ) . Escolhendo α1 = 0 , α 2 = t e α 3 = 2 t tem-se: ) F( 0) = f1 = H( 0) ) F( t ) = f2 = H( t ) ) F(2 t ) = f3 = H( 2 t ) (2.15) Portanto por (2.12) e (2.15): f1 = a f2 = a + bt + ct 2 f3 = a + 2 bt + 4ct 2 17 (2.16) Resolvendo as equações chega-se a: a = f1 4 f − 3f1 − f3 b= 2 2t f3 + f1 − 2 f2 c= 2t2 (2.17) Logo por (2.14): α* = 4 f2 − 3f1 − f3 .t 4 f2 − 2 f3 − 2 f1 (2.18) No entanto, para permitir que α * seja uma boa aproximação do mínimo em ) cima da curva F(α ) , deve-se estabelecer as seguintes condições: f1 > f2 e f3 > f2 (2.19) que garantem a existência de um mínimo entre os pontos extremos, ou seja, 0 < α * < 2.t independentemente do fato de H(α ) ser uma boa aproximação para ) F(α ) . Como não existem garantias que a aproximação será boa, caberá verificar se ) F(α * ) ≤ f2 , conforme está ilustrado no fluxograma da Figura 2.6. Tendo em vista a necessidade das condições apresentadas em (2.19), o valor do parâmetro t será dobrado durante a execução do algoritmo até que as condições supracitadas sejam atendidas. 18 Dados de Entrada: M => No. máximo de tentativas. S => Direção de pesquisa. α => Passo inicial. X => Ponto inicial. Início Dado de Saída: α* => Passo que leva ao mínimo de na direção S f1 = F( X) f2 = F(X + α S) f3 = F(X + 2 α S) J =1 f3 ≤ f2 ou f1 ≤ f2 N S (f 3 ≤ f2 ou f1 ≤ f2 ) e J ≤ M α* = 4 f2 − 3f1 − f3 4 f2 − 2 f3 − 2 f1 α f4 = F(X + α* S) N f1 ≤ f3 S α = 2α f2 = f3 f3 = F(X + 2 αS) J = J +1 N S α* = 2α α =0 N f4 > f2 * Fim S α* = α FIGURA 2.6: Fluxograma do método de Aproximação Polinomial. 2.3 - O SISTEMA COMPUTACIONAL A Figura 2.7 apresenta o sistema computacional utilizado para resolver os problemas propostos. Todas as rotinas foram escritas em linguagem Matlab 3.5, sendo executadas neste ambiente. No programa principal define-se o problema a ser estudado, o período de amostragem, as sementes a serem utilizadas, bem como outros dados de inicialização. A rotina para cálculo de modelos fornece as matrizes nominais e perturbadas do problema estudado. Na rotina de otimização escolhe-se o método a ser empregado, isto é, Powell, Steepest Descent ou Gradientes Conjugados. A rotina de avaliação de Custos é a função objetivo do problema, sendo auxiliada por outra que fornece dados relativos à síntese PRCBI. 19 FIGURA 2.7: Sistema computacional utilizado na tese. As conexões entre as diversas rotinas ilustradas pela Figura 2.7 foram feitas de modo didático levando-se em conta o fluxo computacional. No entanto, cabe esclarecer que outras conexões puderam ser suprimidas da figura devido ao uso da instrução "global" do Matlab no programa principal. 20 CAPÍTULO 3 TÓPICOS DE CONTROLE ÓTIMO E A SÍNTESE DE CONTROLE ROBUSTO PARAMÉTRICO PRCBI 3.1 - INTRODUÇÃO Neste capítulo será realizada uma abordagem teórica sobre alguns tópicos de controle ótimo e controle robusto. Estes assuntos serão enfocados de modo a atender as necessidades da tese. Uma abordagem mais completa sobre PRCBI (Parameter Robust Control by Bayesian Identification) poderá ser vista nas referências básicas deste capítulo (GOMES, 1991; PELLANDA, 1993). As técnicas freqüênciais dos anos 50 e 60, de natureza gráfica (Bode, Nyquist, etc. ), conduziram aos reguladores PID e, as noções de margem de Ganho e de Fase introduziram as primeiras exigências de robustez. Entretanto, as linhas teóricas entre insensibilidade e a estrutura de malha não foram formuladas naquela época. Entre os anos 60 e 70, com a introdução da modelagem através da formulação por equações de estado, surgiram as técnicas de Controle Ótimo, utilizando os critérios quadráticos LQR (Linear Quadratic Regulator) e LQG (Linear Quadratic Gaussian), de natureza temporal, além da realimentação de estados, ainda que por estimação. A técnica que utiliza a estrutura do regulador linear quadrático (LQR), quando os estados estão disponíveis para realimentação, possui excelentes margens de ganho e de fase, mas nada pode ser dito a respeito de sua robustez paramétrica. A estrutura LQG, não dispondo do vetor de estados completo para a realimentação, estima-o com base num observador ótimo denominado por Filtro de Kalman (FK), sendo por esta razão muito sensível a variações paramétricas. A utilização do conceito de robustez na área de controle é bastante recente e constitui a base da teoria moderna de controle, já que os modelos dificilmente conseguem representar as plantas reais. As técnicas de controle ótimo se baseiam em um modelo, que quando coincidente com a planta, permitem que o sistema adquira características ótimas de desempenho. No entanto, cabe ressaltar que ao diferir da 21 planta real, acaba levando o sistema controlado à instabilidade ou, à deterioração de seu desempenho. As sínteses de controle robusto surgem exatamente para preencher esta lacuna dentro da teoria de controle ótimo. Um regulador robusto deve ser capaz de manter a estabilidade e assegurar uma maior insensibilidade ao desempenho de um sistema, quando submetido a algum tipo de perturbação (GOMES, 1991). A síntese PRCBI, discutida neste capítulo, baseia-se na estrutura LQG, visando robustecê-la em relação às variações paramétricas. Deste modo, torna-se necessário tecer alguns comentários, mesmo que de forma sucinta e direcionada para as aplicações desta tese, sobre alguns tópicos de controle ótimo quadrático para sistemas discretos. 3.2 - TÓPICOS DE CONTROLE ÓTIMO 3.2.1 - Regulador Linear Quadrático (LQR) Considere um sistema multivariável discreto LTI (Linear Time Invariant) descrito pelas equações de estado a seguir: x k +1 = Φx k + Γ u k y k = Cx k (3.1) onde: x u : Vetor de estados ( x ∈ ℜn ) . : Vetor de entradas ( u ∈ℜ p ). y : Vetor de saídas y ∈ ℜq . ( ) Φ : Matriz de transição de estado discreta (Φ ∈ ℜn× n ) . Γ : Matriz de entrada (ou de controle) ( Γ ∈ ℜn× p ) . C : Matriz de saída (ou de observação) ( C ∈ ℜq × n ) . A síntese LQR determina a localização dos pólos de malha fechada (MF) através da seguinte lei de controle: u k = − K C x$ k 22 (3.2) sendo x$ k os estados estimados no tempo k e K C o ganho de realimentação, determinado através da minimização de um custo quadrático escrito sob a seguinte forma geral: J LQR ( discreto ) = ∑( xTk Q1 x k + uTk Q2 u k ) (3.3) k onde Q1 (simétrica e positiva semi-definida) e Q 2 (simétrica e positiva definida) são matrizes de ponderação do critério (3.3), escolhidas de modo a obter um desempenho desejado. Os estados reais da planta poderão ser realimentados caso estejam disponíveis na saída, o que geralmente não ocorre. A Figura 3.1 ilustra uma estrutura LQR com observador preditor. Para que o critério convirja, o par (Φ, Γ) deve ser controlável. Este problema possui solução analítica através da resolução de uma equação algébrica de Ricatti. Foi proposta uma solução recursiva para o problema (FRANKLIN & POWELL, 1980), cujo algoritmo encontra-se reproduzido na Figura 3.2. rk + uk Γ + x k +1 z−1 - PLANTA xk C yk Φ OBSERVADOR PREDITOR Γ0 + + K0 x$ k +1/ k z −1 Φ0 x$ k / k −1 - C0 y$ k / k −1 KC FIGURA 3.1: Estrutura LQR com observador preditor. 23 A dinâmica global da estrutura LQR com observador preditor é dada por: x k +1 Φ −ΓKC x k Γ = + r k x$ K0 C Φ − Γ K − K0C x$ 0 0 C 0 k +1/ k k / k −1 Γ0 (3.4) O ganho K 0 do observador é determinado pelo projetista de forma que os modos de (Φ0 − K0C0 ) sejam estáveis e a constante de tempo do pólo dominante de observação seja inferior à constante de tempo dos pólos do controlador. Para este cálculo pode-se utilizar a fórmula de Ackermann, no caso de rk escalar. Início S = Q1 K= 0 % 1 K= ε<<1 − M = S− SΓ0 (Q2 +ΓT0 SΓ0 ) 1ΓT0 S − K'= (Q2 +ΓT0 SΓ0 ) 1ΓT0 S Φ0 S = Φ0T M Φ0 + Q1 % = K' − K K K=K' NÃO % <ε K SIM KC = K Fim FIGURA 3.2: Algoritmo para o cálculo de K C . 24 3.2.2 - Regulador Linear Quadrático Gaussiano (LQG) No regulador apresentado no Item 3.2.1, a matriz K 0 (Ganho do Observador) era determinada por escolha do projetista. No regulador LQG utiliza-se o Filtro de Kalman que estima os estados de maneira ótima, sendo o ganho determinado através do critério de erro médio quadrático. Além disso, considera-se que a planta e as medidas de saída estejam sujeitas a ruídos de distribuição Gaussiana. Quanto ao controlador, a síntese LQG segue os mesmos princípios da LQR. Na prática, pode-se considerar que o ruído da planta seja introduzido através dos atuadores, implicando que D = Γ . Quanto ao ruído nas medidas de saída diz-se que este foi introduzido através dos sensores de medida. Seja o sistema estocástico discreto LTI: x k +1 = Φx k + Γ u k + Dξk y k = Cx k + ηk (3.5) onde: D : Matriz de entrada de ruídos na planta ( D ∈ ℜ n × p ). ξ k : Ruído da planta ( ξ k ∈ ℜ p ). ηk : Ruído nas medidas de saída ( ηk ∈ ℜ q ) Além disso, ξ k e ηk possuem as seguintes características: - São ruídos brancos, gaussianos e não correlacionados entre si; E{ξ ξ } = W ; E{η η } = R ; { } { } - Q = E( Dξ )( Dξ ) = E{Dξ ξ D } = D E{ξ ξ } D = DWD ; - E ξk = E ηk = 0 ; k T T k k T k k k T k k T k T k T T - Q é simétrica e positiva semi-definida e R é simétrica e positiva definida. Na Figura 3.3 ilustra-se a estrutura LQG com Filtro de Kalman preditor. A dinâmica global do sistema é dada por: 25 x k +1 Φ − ΓK C x k x$ = K FC Φ − Γ K − K FC x$ + 0 0 C 0 k +1/ k k / k −1 D 0 ξk Γ + r k + 0 K F ηk Γ0 (3.6) Caso seja utilizado um estimador corrente então a estrutura LQG seria a mostrada na Figura 3.4. Neste caso, a dinâmica global do sistema é dada por: x k +1 Φ x$ = K CΦ F k +1/ k +1 −ΓKC x k ( I − K FC0 )(Φ0 − Γ0KC ) − KFCΓKC x$ k / k + 0 ξk D Γ + r k + K FCD K F ηk +1 Γ0 ξk rk + D uk Γ + x k +1 z−1 - (3.7) PLANTA xk C Φ FILTRO PREDITOR Γ0 + z −1 Φ0 ηk + + KF x$ k +1/ k yk x$ k / k −1 - C0 y$ k / k −1 KC FIGURA 3.3: Estrutura LQG com filtro de Kalman preditor. 26 ξk rk + uk D Γ x k +1 + - z−1 PLANTA xk C Φ yk + ηk FILTRO ESTIMADOR K + F CORRENTE x$ k / k −1 x$ k −1/ k −1 y$ k / k −1 + −1 z z C0 Φ0 x$ k / k −1 Γ0 + KC FIGURA 3.4: Estrutura LQG com filtro de Kalman corrente. Quando emprega-se o Filtro de Kalman preditor, o controle obedece a lei u k = − K C x$ k / k −1 , onde x$ k / k−1 é o vetor de estado estimado no tempo k conhecida a saída no instante k-1. A matriz de ganho de realimentação de estado K C é calculada pela minimização do seguinte critério quadrático: J LQG ( discreto ) = E ∑ xTk Q1 x k + u Tk Q2 u k k ( ) (3.8) O ganho K F é calculado de modo a minimizar o traço de: {( )( P' = Pk / k −1 = E x$ k / k −1 − x k x$ k / k −1 − x k )} T (3.9) onde Pk / k −1 é a matriz covariância do erro de predição. O ganho ótimo em regime permanente é dado por: K F = Φ0 P' CT0 ( C0 P' C0T + R ) 27 −1 (3.10) onde P' é a solução da equação algébrica de Ricatti discreta: P'−Φ0 P' Φ0T + Φ0 P' C0T ( C0 P' C0T + R) C0 P' Φ0T − Q = 0 −1 (3.11) Cabe observar que o ganho do Filtro de Kalmam corrente se relaciona com o preditor da seguinte maneira: K F = Φ 0−1 K F (3.12) Na Figura 3.5 encontra-se um algoritmo (FRANKLIN & POWELL, 1980) que utiliza a formulação recursiva de Kalmam. A matriz P é simétrica e positiva definida, devendo ser inicializada com os valores da diagonal principal muito maiores que os demais para que a convergência do algoritmo seja mais rápida. Início K= 0 % 1 K= ε<<1 P' = Φ0 P ΦT0 + Q −1 K'= P' CT0 (C 0 P' CT0 + R) P=(I −K'C0)P' % = K' − K K K=K' NÃO % <ε K SIM KF = K Fim FIGURA 3.5: Algoritmo para o cálculo de K F 28 3.3 - SÍNTESE DE UM CONTROLE ROBUSTO COM BASE NA QUALIDADE DE IDENTIFICAÇÃO BAYESIANA DOS PARÂMETROS SENSÍVEIS 3.3.1 - Introdução Antes de prosseguir, cabe comentar que o verbo robustecer, amplamente utilizado a partir deste item, significa adotar critérios e minimizar custos dentro de uma estratégia de controle definida, tornando o sistema em MF mais robusto em relação à variações de alguns parâmetros selecionados na planta. Várias técnicas de Controle Robusto, com base na estrutura LQG, baseiam-se na pré-modelagem das incertezas para o sistema analisado. Entre elas, uma das primeiras e mais importantes utiliza uma representação externa das incertezas sob a forma de matriz de erro (DOYLE & STEIN, 1981), sendo denominada de LQG-LTR (Linear Quadratic Gaussian - Loop Transfer Recovery). Uma das dificuldades desta técnica é a inadequação com as incertezas paramétricas. Posteriormente desenvolveu-se outra técnica de Controle Robusto voltada para as variações paramétricas (TAHK & SPEYER, 1987), conhecida por PRLQG (Parameter Robust Linear Quadratic Gaussian), baseando-se na representação interna das incertezas e cuja metodologia de síntese consiste em analisar as propriedades assintóticas do método LQG. Mostrou-se que a síntese LQG-LTR é um caso particular da PRLQG, possuindo esta última, qualidades de desempenho e robustez paramétrica bem superiores. No entanto, a representação interna das incertezas envolve a decomposição da matriz ∆A (perturbação da matriz de transição de estados A devido a perturbações paramétricas) em três matrizes, exigindo que os parâmetros sensíveis estejam explícitos em A. Em 1991, foi proposta uma síntese denominada por PRCBI (GOMES), baseada nos estudos sobre o comportamento assintótico dos estimadores bayesianos (GAUVRIT, 1982). Os resultados obtidos comprovaram a eficácia do método para 29 alguns exemplos utilizados pelas técnicas anteriores no que diz respeito a variações paramétricas. Ao contrário das técnicas auto-adaptativas, onde os parâmetros sensíveis são efetivamente identificados em tempo real, a técnica PRCBI utiliza uma formulação matemática baseada na qualidade de identificação em regime permanente. Os ganhos do controlador são estabelecidos através de um processo "off-line", minimizando-se um critério apresentado adiante, que produzirá a pior qualidade de identificação possível. 3.3.2 - Qualidade de Identificação Bayesiana em Malha Fechada A formulação a seguir apresentada tem por objetivo fornecer uma visão qualitativa sobre o assunto, bem como permitir a fácil aplicação da síntese PRCBI nos problemas propostos nesta tese. A identificação bayesiana consiste em determinar a densidade de probabilidade condicional p(θ Y k ) do vetor de parâmetros sensíveis θ , a partir do conhecimento do { conjunto de medidas de saída da planta até o instante k, isto é, Y k = y , y , ... , y 0 1 k }e da densidade de probabilidade p0 ( θ) . A Figura 3.6 ilustra duas situações para um caso escalar. Boa qualidade de identificação de θ p( θ 0 / Y k ) Má qualidade de identificação de θ p( θ / Y k ) p( θ / Y k ) p(θ 0 + ∆θ / Y k ) p(θ0 / Y k ) θ0 θ 0 + ∆θ p(θ0 + ∆θ / Y k ) θ 0 θ0 + ∆θ θ θ FIGURA 3.6: Visualização da qualidade de identificação paramétrica para um caso escalar. 30 Através de desenvolvimento matemático chega-se a: ( ) ( ) p(θ Y k ) = p θ0 + ∆θ Y k = f G θ−01 (3.13) onde a matriz G θ−1 permite quantificar a qualidade de identificação do vetor 0 paramétrico nominal θ 0 . Resta-nos obviamente apresentar como poderá ser calculada a matriz G θ−1 , bem como determinar uma função adequada f ( ⋅) que permita expressar a 0 qualidade de identificação paramétrica. Antes disso, deve-se alertar sobre a notação utilizada na formulação apresentada adiante. De maneira geral, tem-se que: ∆( ⋅) = ( ⋅) p − ( ⋅) 0 (3.14) onde (⋅) representa um argumento qualquer, o índice "p" de perturbado indica que o argumento foi perturbado devido a uma variação dos valores nominais dos parâmetros sensíveis e finalmente, o índice "0" representa que o argumento é função do vetor paramétrico nominal. No entanto, alguns argumentos dependem da estrutura LQG como um todo (Figuras 3.3 e 3.4), isto é, serão ditos nominais se a planta e o FK estiverem em função dos valores nominais dos parâmetros sensíveis, caso contrário estes argumentos serão considerados perturbados. A Tabela 3.1 mostra um exemplo da notação adotada para este caso. A Figura 3.7 ilustra a estrutura do problema abordado. TABELA 3.1: Exemplo da notação adotada. PLANTA F.K. θ0 θ0 + ∆θ θ0 θ0 Covariância do erro de predição do vetor de saída M0 Mp 31 ξk D ηk rk yk SISTEMA S(θ) + + F.K. ( θ0) KC Regulador Ótimo FIGURA 3.7: Estrutura do problema abordado. Considere então as seguintes equações: Φ p = Φ0 + ∆Φ M p = M0 + ∆M Kp = K0 + ∆K Pp ' = P0 ' + ∆P ' (3.15) onde M é a covariância do erro de predição do vetor de saída, K é o ganho do filtro estimador e P' a covariância do erro de predição do vetor de estado. Retornando ao cálculo da matriz G θ−1 , considere as seguintes definições: 0 ∆θ = (ε1 ε2 ... εi ... ε r ) T (3.16) ∆θii = ∆θi = ( 0 ... 0 εi 0 ... 0) , i = 1... r T ( ) T ∆θij = 0 ... 0 εi 0 ... 0 ε j 0 ... 0 , i ≠ j 32 (3.17) (3.18) Além disso, define-se também Tr M0−1 ∆M como sendo o valor calculado em ∆θ ij função da perturbação ∆θij , então: g ii = G g ij = G θ−01 ( i, j) = −1 θ0 ( i, i ) = Tr[ M −0 1 ∆M] ∆ θi (3.19) ε i2 ( Tr[ M 0−1 ∆M] ∆ θij − ε 2i g ii + ε 2j g jj ) (3.20) 2 εi ε j i≠ j Para o cálculo de M0 e ∆M utiliza-se as seguintes equações: M 0 = C0 P0 ' CT0 + R (3.21) onde P0 ' pode ser calculado a partir da Equação (3.11). Parte-se então para o cálculo das matrizes auxiliares L, N e ∆P' , conforme as equações a seguir: L = (Φ0 − Γ0 K C ) L(Φ0 − Γ0 KC ) + (Φ0 − Γ0 K C ) K 0 M 0 K 0T (Φ0 − Γ0 KC ) T T ~ N = (Φ0 − Γ0 K C ) N( I − K0C0 ) ΦT0 − (Φ0 − Γ0 K C ) L ∆ΦT T ~ − (Φ0 − Γ0 K C ) K 0 M 0 ( ∆Φ K 0 + Φ0 ∆K) T (3.22) (3.23) % = ∆Φ − ∆Γ K , e onde ∆Φ C T T ~ ∆P' = Φ0 ( I − K 0C0 ) ∆P' ( I − K 0C0 ) ΦT0 − ∆ΦN( I − K 0C0 ) Φ0T T ~ ~ ~ ~ + (Φ0 ∆K + ∆Φ K 0 ) M 0 (Φ0 ∆K + ∆Φ K0 ) + ∆Φ L ∆ΦT ~ − Φ0 ( I − K0C0 ) N T ∆ΦT Finalmente, ∆M = C0 ∆P ' C0T 33 (3.24) (3.25) As Equações (3.23) a (3.25) são equações matriciais de Lyapunov do tipo: X = F.X.G + H (3.26) encontrando-se a solução destas equações no Apêndice A. Entretanto, uma matriz não é um bom "parâmetro" para comparação de robustez e também não define precisamente uma medida de robustez. Foram investigados (GOMES, 1991) diversos índices relacionados com a matriz G θ−01 (traço, determinante, autovalor de maior módulo, etc.) tendo sido escolhido como critério de robustez: ( ) J rob = Tr G θ−01 (3.27) 3.3.3 - A Síntese PRCBI A síntese PRCBI em MF consiste em utilizar a formulação apresentada no Item 3.3.2, considerando a medida de robustez representada por (3.27), conforme ilustrado na Figura 3.8. A medida de robustez com base na qualidade de identificação bayesiana dos parâmetros sensíveis necessita do conhecimento das matrizes D, Q e R e das demais características estocásticas destes ruídos. Deste modo, três situações podem ocorrer: a) No caso estocástico, estas matrizes são impostas pelo modelo sendo consideradas como dados do problema. O ganho de Kalman é determinado em função destas matrizes e dos valores nominais do sistema, restando atuar sobre o ganho de realimentação de estado K C , a fim de minimizar o seguinte critério: [ ( )] J 1 = min Tr G θ−01 KC 34 (3.28) b) No caso determinístico ou quando os ruídos não afetam fortemente a precisão do modelo, pode-se utilizar as matrizes D, Q e R como grandezas variáveis no processo de minimização da medida de robustez em malha fechada. Assim, os ruídos são considerados fictícios e o filtro de Kalman passa a atender as características de robustez desejadas. [ ( )] J 2 = min Tr G θ−01 D, K C (3.29) c) Numa terceira abordagem , o controlador K C pode ser calculado para atender as condições de desempenho, ficando a minimização dependente unicamente do filtro para o robustecimento do sistema. ξk ηk D Cálculo do Tr G−θ1 Sistema A( θ) B( θ) C( θ) KC 0 F.K. A(θ0) C(θ0) −1 min Tr (Gθ ) D, K 0 C Programação não linear FIGURA 3.8: Síntese PRCBI em malha fechada. A Figura 3.8 ilustra o segundo caso citado. A síntese de controle robusto utilizará um dos métodos de minimização apresentados no Capítulo 2. O processo ilustrado será repetido até que o traço mínimo de G θ−1 seja obtido. Após a otimização, 0 35 as matrizes D rob e K Crob são intoduzidas no regulador, que passará a ser robusto em relação às variações do vetor de parâmetros sensíveis θ . 3.4 - O PROBLEMA DO SEGUIDOR ( TRACKING ) Um dos problemas mais importantes na área de controle consiste em obter um controlador de modo que a planta considerada possa ser regulada, ou seja, que os estados possam ser deslocados para a origem do espaço de estados. Neste item, entretanto, o interesse será controlar o sistema de maneira que o mesmo seja levado a uma determinada posição do espaço de estados (set point). Considera-se que este ponto de acomodação seja constante sobre longos períodos de tempo, mas esporadicamente poderá ser alterado. Como exemplo pode-se citar o caso em que deseja-se redirecionar uma antena parabólica para que possa receber o sinal de outro satélite geo-estacionário, através da alteração da posição angular de um potenciômetro. A abordagem a seguir apresentada estará limitada a um sistema linear, invariante no tempo e discreto. Considere então um sistema representado pela seguinte equação de estado: x( k + 1) = Φx( k ) + Γ u( k ) (3.30) onde a variável controlada é dada por: z( k ) = C' x( k ) (3.31) Supondo que a variável controlada deverá se acomodar na posição z 0 , então para manter o sistema neste ponto, uma entrada constante u 0 deverá ser descoberta para que os estados sejam estabilizados em x 0 . Assim: z 0 = C' x 0 36 (3.32) x0 = Φ x0 + Γ u0 e por (3.30): (3.33) Deve-se observar que o sistema somente poderá ser mantido em um determinado ponto de acomodação, caso (3.32) e (3.33) possam ser resolvidas para u 0 , dado o valor de z 0 . Realizando a seguinte mudança de variáveis: u'( k ) = u( k ) − u0 x'( k ) = x( k ) − x0 (3.34) z'( k ) = z( k ) − z0 chega-se através de (3.30) a (3.33) que: x'( k + 1) = Φx'( k ) + Γ u'( k ) z'( k ) = C' x'( k ) (3.35) Logo, por meio de uma simples mudança de variáveis foi possível transformar o sistema em outro com ponto de acomodação na origem, podendo-se então tratar este novo problema como um regulador. A fim de atingir os objetivos propostos pelo seguidor, sugere-se como critério de minimização: J= k2 ∑ [ z'T ( k ) R 3 z'( k ) + u'T ( k) R 2 u'( k )] + x'T ( k 2 ) R1 x'( k 2 ) k = k1 (3.36) onde R 1 , R 2 e R 3 são matrizes de ponderação entre os estados, as entradas e as variáveis controladas respectivamente. Os dois primeiros termos de (3.36) penalizam a evolução das variáveis controladas e das entradas, enquanto o terceiro penaliza os valores finais (supostos estacionários) dos estados da planta. O resultado do processo de otimização, caso exista solução, será o controlador K C que ao realimentar os estados da planta minimizará o custo dado por (3.36). A aplicação da lei de controle dada por (3.37) garantirá que o sistema original será transferido para seu ponto de 37 acomodação tão rápido quanto possível, sem que haja transientes excessivos na entrada da planta. u'( k ) = − KC x'( k ) (3.37) Aplicando (3.34) em (3.37) a fim de observar o sistema com as variáveis originais chega-se a: u( k ) = − KC x( k ) + u0 + KC x0 u( k ) = − KC x( k ) + u0 ' (3.38) onde u 0 ' é um vetor constante a ser determinado de modo que em estado estacionário a variável controlada z( k ) assuma o valor z 0 . Resta apenas determinar as condições para que u 0 ' possa ser calculado. De (3.38) em (3.30): x( k + 1) = (Φ − ΓKC ) x( k ) + Γ u0 ' (3.39) Como o sistema é assintoticamente estável, quando k → ∞: x0 = (Φ − ΓKC ) x0 + Γ u0 ' ( I − Φ + ΓKC ) x0 = Γu0 ' x0 = ( I − Φ + ΓKC ) Γ u0 ' (3.40) z 0 = C' ( I − Φ + ΓK C ) Γ u 0 ' (3.41) −1 De (3.40) em (3.32): −1 O caso de interesse na resolução de (3.41) ocorre quando u' e z possuem a mesma dimensão. Deve-se observar que a matriz que relaciona u 0 ' e z 0 em (3.41) é na 38 verdade a matriz de transferência discreta em malha fechada do sistema para z=1. Assim, caso esta matriz seja não singular: H f ( z) = C' ( zI − Φ + ΓKC )Γ [ ] u0 ' = C' ( I − Φ + ΓKC ) Γ −1 −1 (3.42) z0 = H −f 1(1) z0 (3.43) A Figura 3.9 mostra o diagrama final do problema do seguidor. z0 H−1 f (1) u'0 + PLANTA C' z(k) - KC FIGURA 3.9: Diagrama do problema do seguidor. 39 CAPÍTULO 4 O SISTEMA MASSA-MOLA 4.1 - INTRODUÇÃO A notação e a teoria utilizadas a seguir são as que foram definidas nos Capítulos 2 e 3. Neste capítulo aplica-se a síntese PRCBI em três exemplos acadêmicos monovariáveis a fim de obter controladores que tornem os sistemas robustos a variações paramétricas. Os três modelos utilizados, configurações diversas do sistema massa-mola, constituem-se em blocos com determinadas massas interligados através de amortecedores e molas. A análise desta estrutura flexível é de grande interesse para teóricos e práticos em controle, pois simula, entre outros, a aplicação de comandos a bordo de veículos espaciais (GOMES, 1991). Este tipo de estrutura geralmente é bastante oscilante, com pólos de malha aberta muito próximos da instabilidade. No Item 4.2, utiliza-se como modelo o sistema massa-mola de 4 estados, robustecendo-o a alterações dos valores de suas massas. No Item 4.3, adiciona-se ao modelo anterior dois blocos de massas, elevando-se o número de estados para oito. No Subitem 4.3.1, robustece-se o sistema a alterações dos valores nominais das massas que se encontram nas extremidades, enquanto que no Sub-item 4.3.2 considera-se que o sistema deverá ser robustecido em relação à variação de todas as massas. Em todos os problemas estudados, a síntese PRCBI em MF será utilizada de acordo com o Capítulo 3. Um dos efeitos observados da aplicação da síntese é a dessensibilização, ou ainda, insensibilização dos pólos de MF do sistema controlado a variações dos parâmetros considerados. Para mostrar esta propriedade far-se-á uso de um gráfico de grande importância denominado de "Diagrama de Sensibilidade", discutido a seguir no Item 4.1.1. 40 Como consequência da referida dessensibilização, espera-se que alterações nos valores dos parâmetros sensíveis acarretem pouca degradação em termos de desempenho nominal do sistema, já que os pólos de MF pouco se deslocarão. Além disso, a aplicação da síntese nos casos estudados levou a um aumento do domínio de estabilidade do sistema. Isto será posteriormente constatado através de uma medida denominada de "Raio da Hiperesfera Percentual de Estabilidade". 4.1.1 - Diagrama de Sensibilidade por Pontos Através deste tipo de gráfico foi possível apresentar os resultados da dessensibilização dos pólos de MF dos sistemas estudados. Consiste em verificar a posição dos pólos de MF para os sistemas perturbados, que foram gerados a partir de perturbações em direções aleatórias com raio percentual constante. Considere como exemplo, um caso em que o vetor de parâmetros sensíveis seja de segunda ordem, isto é: θ1 θ = e portanto, θ ∈ℜ 2 θ2 (4.1) Seja θ 0 o vetor com os valores nominais dos parâmetros considerados, então: θ1N θ0 = θ2 N (4.2) Considere ainda ℵ o conjunto de pares ( r1 , r2 ) que satisfaçam a seguinte equação: R = r12 + r22 (4.3) onde R é uma constante. Cabe observar que o conjunto ℵ é formado pelos pares ordenados que formam uma circunferência de raio R, centrada na origem do plano 41 r1 × r2 . Através do conjunto ℵ é possível obter vetores paramétricos perturbados com raio percentual R do seguinte modo: (1 + r1 )θ1N θ= (1 + r2 )θ2 N (4.4) A partir da Expressão (4.4), a determinação dos modelos perturbados com raio percentual constante torna-se elementar, já que as matrizes do sistema (transição de estados e de entrada) são funções de θ . As referidas matrizes podem ser de sistemas contínuos ou discretos. Nos sistemas massa-mola, estas matrizes representam o sistema contínuo e após perturbadas serão discretizadas. Portanto: A = A( θ) e B = B(θ) (4.5) Com as matrizes perturbadas discretas pode-se obter a matriz de transição de estado da estrutura LQG (com Filtro de Kalman) utilizando-se (3.7) e então calcular os pólos de MF do sistema perturbado para plotá-los no referido diagrama. O diagrama de sensibilidade por pontos foi de grande valia nesta tese, já que ao testar a robustez do sistema com o controlador obtido (robusto ou híbrido) em direções específicas, sempre persistia a dúvida se esta propriedade ainda ocorreria em outras direções. Através deste diagrama estabelece-se uma varredura aleatória por várias direções do espaço paramétrico considerado, permitindo a fácil visualização ou comparação entre a sensibilidade dos pólos de MF dos diversos controladores considerados. 42 4.1.2 - Hiperesfera Percentual de Estabilidade A hiperesfera de estabilidade pode ser definida resumidamente, como aquela de maior raio percentual de perturbação que poderá ser inscrita na região de estabilidade dentro do domínio paramétrico, centrada no ponto do espaço em que os parâmetros assumem seus valores nominais. Quando o vetor de parâmetros sensíveis é de segunda ordem, a hiperesfera transforma-se em uma circunferência, sendo portanto possível visualizá-la, bem como a região de estabilidade do domínio paramétrico. Este tipo de gráfico será empregado quando do estudo do problema apresentado no Item 4.3.1. Uma figura de mérito dos controladores trabalhados será o raio da hiperesfera percentual de estabilidade, que é definido como a maior porcentagem de perturbação admissível pelo sistema, considerando qualquer direção do espaço paramétrico. Para calcular este raio, inicia-se do ponto em que os parâmetros assumem seus valores nominais com raio bem pequeno. Testa-se aleatoriamente um grande número de direções com este raio. Caso o sistema seja estável para todas as direções testadas, isto é, os pólos de MF de todos os modelos perturbados estejam inseridos no círculo unitário (plano z), então aumenta-se o raio e repete-se o processo. Quando for alcançada a instabilidade, reinicializa-se o processo com um raio percentual intermediário entre o atual e o anterior, até que seja obtida a precisão desejada para o referido raio. É de bom alvitre que, ao aumentar o raio, também seja aumentado o número de direções testadas. O raio percentual da hiperesfera é definido como: R = r12 + r22 +... + rn2 (4.6) onde R é uma constante. Os modelos perturbados são gerados a partir dos seguintes vetores de parâmetros sensíveis: 43 (1 + r1 )θ1N ( ) r + θ 1 2 2 N θ= ..... (1 + rn )θnN (4.7) Em termos computacionais, como a maioria dos ambientes de programação possuem geradores de números aleatórios de densidade de probabilidade uniforme entre 0 (zero) e 1 (um), utiliza-se este recurso gerando um vetor aleatório de dimensão igual ao vetor paramétrico. Em seguida, subtrai-se cada uma das componentes de 0.5, com intuito de obter números positivos e negativos em torno de zero. Normaliza-se este vetor, dividindo-o por uma constante igual a seu módulo e finalmente, multiplicase o mesmo por R para obter o raio desejado. As componentes deste vetor substituirão os ri para 1 ≤ i ≤ n em (4.7). 4.1.3 - A Técnica das Liberações O título acima foi escolhido pelo autor, tendo em vista que a bibliografia disponível sobre otimização não permitiu rotular a técnica com mais precisão. Esta técnica tem por objetivo permitir, em termos de otimização, que as variáveis de projeto atendam simultaneamente a diversas funções objetivo. Graças a este método foi possível obter os resultados apresentados nesta tese. Para facilitar o entendimento, será apresentado neste Item como a técnica atua conciliando apenas duas funções objetivo. A Figura 4.1 ilustra o fluxograma da técnica em questão. O método pode ser facilmente extrapolado, fazendo uso de tantas etapas de otimização quantas forem as funções objetivo consideradas. O algoritmo é bastante simples, ou seja, na etapa 1 otimiza-se a primeira função objetivo, obtendo ao final do processo de minimização o projeto ótimo (X 0 ) das variáveis de projeto. Portanto: ( ) F X0 ≤ F( X), ∀ X ≠ X0 44 (4.8) Como já foi mencionado, o mínimo obtido nem sempre é o absoluto, ou seja, o mínimo de todos os mínimos da superfície considerada. No entanto, este fato não inviabiliza o método. Aliás, X 0 não precisa nem mesmo ser o mínimo da função F(⋅) , mas quanto mais próximo dele, melhores serão os resultados obtidos. ( ) Na etapa 2, baseado no custo J 1 min = F X0 obtido na primeira etapa, define-se uma folga aceitável (J 1 LIB ) sobre este valor mínimo e então otimiza-se a segunda função objetivo ( G( ⋅) ). Portanto a solução para o problema será um vetor X1 tal que: ( ) J 1 = F X1 ≤ J 1 LIB e ( ) J 2 = G X1 = mínimo (4.9) onde J 1 LIB = k. J 1 min com k > 1. Finalmente, deve-se comentar que este algoritmo estará embutido dentro da "Rotina para Avaliação do Custo" mostrada na Figura 2.7. 4.2 - SISTEMA MASSA-MOLA COM 4 ESTADOS O problema a ser estudado, de acordo com a Figura 4.2, é um sistema composto por duas massas interligadas através de um amortecedor e de uma mola. Diz-se não colocado, pois a entrada e a saída do sistema não estão sobre a mesma massa. O primeiro objetivo deste problema será calcular, através da síntese PRCBI, um controlador que torne o sistema robusto a variação das massas. O segundo objetivo, finalidade desta tese, será obter um controlador híbrido que mantenha as qualidades de robustez, mas que também possua características de desempenho aceitáveis. 45 ETAPA 1 ETAPA 2 INÍCIO INÍCIO Verificação das RESTRIÇÕES IMPOSTAS J1 LIB = k . J1 min Verificação das RESTRIÇÕES IMPOSTAS Restrições Satisfeitas NÃO Restrições Satisfeitas SIM Cálculo da Função Objetivo J1 = F(X) J1 =1000000 NÃO SIM Cálculo de J1 =F(X) FIM J1 ≤ J 1 LIB NÃO J2 =1000000 Resultado J1min =F(X0) SIM Cálculo da Função Objetivo J2 =G(X) FIM FIGURA 4.1: Fluxograma da técnica das liberações para duas funções objetivo. FIGURA 4.2: Diagrama físico do sistema massa-mola de 4 estados. Equacionando o problema e colocando-o sob a forma de equações de estado chega-se a: 46 1 0 0 0 0 k b − k − b 1 m1 m1 m1 m1 . x + m1 . u x& = 0 0 1 0 0 k b k b − m2 − m2 0 m2 m2 (4.8) y = ( 0 0 1 0). x (4.9) onde x = ( x1 , x 2 , x 3 , x 4 ) T é o vetor de estados, cujo significado físico encontra-se apresentado na Tabela 4.1; "u" representa a força aplicada na entrada do sistema e "y" é a saída, que representa a posição da massa 2. Na Tabela 4.2 encontram-se os valores adotados para os diversos parâmetros utilizados no processo de otimização. TABELA 4.1: Significado físico dos estados do sistema massa-mola de 4 estados. ESTADO x1 x2 x3 x4 Significado Físico Posição da massa 1 (m) Velocidade da massa 1 (m/s) Posição da massa 2 (m) Velocidade da massa 2 (m/s) TABELA 4.2: Valores adotados para os parâmetros utilizados. CONSTANTES Massa nominal do primeiro bloco: m1N Massa nominal do segundo bloco: m2 N Constante de elasticidade da mola: k Constante de amortecimento: b Período de amostragem: T Covariância do ruído na planta: Q Covariância do ruído no sensor de saída: R VALOR 1.0 Kg 0.25 Kg 0.145 N/m 0.04875 N.s/m 0.1 s 0.01 0.0001 Conforme citado acima, as massas do sistema serão as variáveis sensíveis no problema. Deste modo, o vetor de parâmetros sensíveis nominal será dado por: 47 . m1N 10 = θ0 = m2 N 0.25 (4.10) 4.2.1 - Resultados Obtidos Os resultados abaixo foram obtidos em duas fases de otimização. A primeira fase consistiu da otimização de um vetor de oito componentes formado por D e K C através da síntese PRCBI, minimizando-se o traço de G θ−1 . Na segunda fase, otimizou0 se o vetor de ganhos K C considerando-se o desempenho do sistema em MF em detrimento de liberações gradativas do traço de G θ−1 (técnica das liberações). Na 0 Tabela 4.3 encontram-se os resultados obtidos na fase 1 do processo de otimização utilizando-se dois métodos de minimização. Na Tabela 4.4 estão listados nove controladores, sendo o primeiro o de traço mínimo da Tabela 4.3. Os controladores 4.2 a 4.9 são híbridos levando-se em conta a robustez exigida e o desempenho nominal. O 4.10 foi obtido pelo processo analítico de cálculo do LQR, conforme explicado no Capítulo 3. TABELA 4.3: Vetores obtidos na fase 1 do processo de otimização. Método de Otimização Traço G θ−1 Vetor Obtido 0 T D=[0.7296 0.1421 0.2041 0.6371 ] K C =[0.8971 2.4888 -0.8971 0.3399] D=[0.6825 -0.0134 -0.0187 0.7305 ]T K C =[0.9398 2.4315 -0.9397 1.3475] Powell Gradientes Conjugados 0.5248 0.8839 Na Tabela 4.5 encontram-se as características dos controladores citados, isto é, seus valores de traço de G θ−1 e respectivos custos de desempenho, calculados conforme 0 as Expressões (4.11) e (4.12). Nesta Tabela mostra-se também o quanto foi degradada a robustez, a fim de obter um melhor desempenho do controlador. Os valores apresentados fornecem uma noção relativa das características de um controlador 48 quando comparado com os demais do mesmo problema. O valor absoluto isoladamente não possui significado algum. Nas demais tabelas similares deste capítulo continuam valendo estas mesmas observações. TABELA 4.4: Controladores obtidos na fase 2 do processo de otimização. Número do Controlador 4.1 (1) 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 (2) C O N T R O L A D O R ( KC ) [0.897119673 [1.152416971 [1.180608876 [1.181616899 [1.213875492 [1.229378689 [1.293642866 [1.362271712 [1.514233895 [1.455608702 2.488786502 1.304220219 2.164228460 1.910178412 1.946445260 1.975696065 2.041960491 2.187990372 2.412747905 1.969629306 -0.897119623 -0.694296964 -0.660627925 -0.596083132 -0.563761910 -0.533018863 -0.516952819 -0.383951436 -0.289715794 -0.182252604 0.339874639] -0.046376922] -0.185770629] -0.153506053] -0.145316147] -0.117608642] -0.115569133] 0.017546165] 0.353968223] 0.928758998] - Controlador com custo de robustez ótimo (Síntese PRCBI), obtido através do método de Powell (Tabela 4.3). (2) - Controlador com custo de desempenho ótimo, obtido por processo analítico (LQR). (1) TABELA 4.5: Características obtidas nos controladores otimizados. Número do Controlador Limite do custo de robustez ótimo (%) Valor do traço de 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 0 5 10 20 30 40 50 100 150 - 0.5247759 0.5510111 0.5771632 0.6297310 0.6822085 0.7346862 0.7871638 1.0495518 1.3119397 1.6931585 G θ−1 0 - Custo de robustez ótimo. (4) - Custo de desempenho ótimo. (3) 49 (3) Custo de Desempenho J DESEMP 116.6998 16.3315 15.4024 14.3891 13.8423 13.4689 13.1349 12.2923 11.5373 11.1035 (4) Para o cálculo do custo de desempenho considerou-se a energia total dos estados e da entrada ponderados pelas seguintes matrizes Q1= I 4 e Q 2 =1 após fechar a malha em k=51 (t=5.1s), através da realimentação direta de estados. A Fórmula (4.11) mostra como foi avaliado o custo de desempenho. O sistema foi excitado por meio de um impulso unitário, permanecendo em malha aberta até k=50. Para fins de avaliação da energia considerou-se a evolução do sistema em malha fechada por mais 250 períodos, sem a utilização de estimador de estados. J Desemp = onde: 300 ∑ (x Q x k = 51 T k 1 k + u Tk Q 2 u k ) x k +1 = ( Φ − Γ . K C ) x k para 51 ≤ k ≤ 300 (4.11) (4.12) A Figura 4.3 ilustra a evolução temporal dos estados do sistema massa-mola de 4 estados, após excitá-lo com um impulso unitário discreto em k=0. De maneira geral, pode-se dizer que os blocos com massa menor, relativamente aos demais, tendem a oscilar mais em posição (x 3 em relação a x1 ) e velocidade (x 4 em relação a x 2 ). Para os outros problemas deste Capítulo, as curvas de evolução temporal em malha aberta dos estados das plantas possuem forma e comportamento análogos ao da Figura 4.3. Nas Figuras 4.4 a 4.9 encontram-se ilustrados os diagramas de sensibilidade do sistema massa-mola de 4 estados com alguns dos controladores da Tabela 4.4. As curvas vermelhas representam as várias posições assumidas pelos pólos de MF no plano z (discreto) da estrutura apresentada na Figura 3.4, considerando a planta perturbada com raio percentual de 10%. As curvas de cores azul e verde representam raios de perturbação de 30% e 50%, respectivamente. As várias cruzes assinaladas mostram as posições dos pólos de MF do sistema considerando os parâmetros sensíveis em seus valores nominais. 50 FIGURA 4.3: Evolução temporal dos estados da planta em malha aberta. De maneira geral, pode-se observar pelas Figuras 4.4 a 4.9 que a medida que o valor do traço de G θ−1 eleva-se, também aumenta a sensibilidade dos pólos de MF para 0 o sistema perturbado. As pequenas ilhas da Figura 4.4 (controlador com robustez ótima) fundem-se numa única curva, como ilustra a Figura 4.9 (controlador de desempenho ótimo). Deve-se observar que para todos os controladores ilustrados, o sistema massamola perturbado com até 50% de raio percentual permaneceu estável (pólos de MF dentro do círculo unitário). 51 FIGURA 4.4: Diagrama de Sensibilidade para o controlador 4.1. FIGURA 4.5: Diagrama de Sensibilidade para o controlador 4.2. 52 FIGURA 4.6: Diagrama de Sensibilidade para o controlador 4.3. FIGURA 4.7: Diagrama de Sensibilidade para o controlador 4.5. 53 FIGURA 4.8: Diagrama de Sensibilidade para o controlador 4.8. FIGURA 4.9: Diagrama de Sensibilidade para o controlador 4.10. 54 4.3 - SISTEMA MASSA-MOLA COM 8 ESTADOS Durante os primeiros estudos da tese, procurou-se utilizar os vários métodos de otimização apresentados no Capítulo 2, a fim de observar aquele que levaria aos melhores resultados. Entretanto, como as restrições impostas nos problemas abordados foram implementadas por meio de artifícios computacionais e adicionalmente, como não era possível calcular o gradiente analítico para as funções objetivo adotadas, verificou-se por estes motivos que na totalidade das vezes testadas, o método de Powell levou aos melhores resultados e portanto, passou a ser utilizado com exclusividade a partir deste item. 4.3.1 - Robustecimento a Variação de 2 Massas Este problema embora semelhante ao anterior, possui um grau de complexidade a mais, já que a ordem da planta foi aumentada para oito estados. Neste caso tem-se quatro massas interligadas através de amortecedores e molas, conforme ilustrado na Figura 4.10. O objetivo será, numa primeira fase, calcular um controlador por intermédio da síntese PRCBI, que torne o sistema robusto a variações das massas 1 e 4. Na segunda fase, tentar-se-á produzir controladores híbridos em robustez e desempenho, utilizando-se novamente a técnica das liberações. Todas as simulações serão realizadas por intermédio de estimador corrente de estados, mais precisamente Filtro de Kalman. FIGURA 4.10: Diagrama físico do sistema massa-mola de 8 estados. 55 4.3.1.1 - Equações de Estado da Planta Após os devidos cálculos chega-se às seguintes equações de estado: x& = A. x + B. u (4.13) y = C. x (4.14) onde x T = ( x 1 x 2 ... x 8 ) é o vetor de estados, cujo significado físico encontra-se na Tabela 4.6. Além disso tem-se que "y" é a saída (posição da massa 4) e "u" a entrada da planta (força aplicada na massa 1). As matrizes A, B e C são as que se seguem: 1 0 0 0 0 0 0 0 k b k b − − m1 m1 0 0 0 0 m m1 1 0 0 0 1 0 0 0 0 k b k b 2k 2b − − 0 0 m2 m2 m2 m2 m2 m2 A = 0 0 0 0 0 1 0 0 2k 2b k b k b − m 3 − m3 m3 0 m3 m3 m3 0 0 0 0 0 0 0 1 0 k b k 0 − m4 − mb4 0 0 0 m4 m4 [ BT = 0 1 m1 ] 0 0 0 0 0 0 C = [0 0 0 0 0 0 1 0] (4.15) (4.16) (4.17) 4.3.1.2 - Constantes e Considerações Adotadas a) Matriz covariância de entrada de ruídos na planta: Q=0.01; b) Matriz covariância do ruído no sensor de medidas de saída da planta: R=0.0001; c) Período de amostragem considerado na discretização: T=0.1 seg; d) Método de otimização utilizado: Powell; e) Valores nominais das massas (Kg): m1 = 1. 0 , m2 = 0. 25, m3 = 0.1 e m4 = 0.1; 56 f) Constante elástica das molas: k = 0.145 N/m; g) Constante de amortecimento: b = 0.04875 N.s/m; h) Considerou-se que D= Γ , isto é, o ruído entra na planta através dos atuadores; i) O desempenho do sistema malha fechada é avaliado por estimador corrente de estados; j) Para efeito de custo de desempenho serão consideradas as seguintes matrizes de ponderação de estados Q1 = I 8 e da entrada Q2 =1. TABELA 4.6: Significado físico dos estados do sistema massa-mola 8 estados. ESTADO x1 x2 x3 x4 x5 x6 x7 x8 Significado Físico Posição da massa 1 (m) Velocidade da massa 1 (m/s) Posição da massa 2 (m) Velocidade da massa 2 (m/s) Posição da massa 3 (m) Velocidade da massa 3 (m/s) Posição da massa 4 (m) Velocidade da massa 4 (m/s) 4.3.1.3 - Vetor de Parâmetros Sensíveis Os parâmetros sensíveis são as massas 1 e 4. Portanto: . m1N 10 m1 = e θ= θ0 = . m4 N 01 m4 (4.18) 4.3.1.4 - Resultados Obtidos A Tabela 4.7 enumera os vários controladores que serão analisados. O controlador 4.11 foi obtido através da minimização do traço de G θ−1 . Os controladores 0 4.12 a 4.20 são híbridos, calculados a partir do controlador 4.11 através da técnica das liberações. O controlador 4.23 é o LQR para a matriz de ponderação dos estados 57 Q1 = I 8 e da entrada Q 2 = 1, tendo sido calculado analiticamente. Quanto aos controladores 4.21 e 4.22, foram obtidos numericamente a partir do controlador 4.23, utilizando-se novamente a técnica das liberações, mas agora otimizando-se o traço de G θ−1 a partir da degradação do custo de desempenho nominal ótimo. As Tabelas 4.8 e 0 4.9 mostram as características dos controladores supra-citados. TABELA 4.7: Controladores obtidos através da síntese PRCBI, por métodos de otimização utilizando critérios híbridos e por meio analítico. No. 4.11 (5) 4.12 4.13 4.14 4.15 4.16 4.17 4.18 4.19 4.20 4.21 4.22 4.23 (6) C O N T R O L A D O R ( KC ) [4.705820385 7.361800067 -2.104900311 [4.705976684 8.002000067 -2.102399530 [4.710979809 8.182100067 -2.102399530 [4.871779809 8.502900067 -2.096749530 [5.031879833 8.823039114 -2.056724524 [5.030979809 8.822100067 -1.781149530 [5.453379809 9.564500067 -1.348749530 [5.554004809 11.174500067 0.261250470 [5.012690309 8.498820067 0.406495470 [4.962285954 7.528828067 1.290487470 [1.554220533 2.659255445 0.375904911 [1.534195533 2.980905445 0.055504911 [ 1.846076533 2.205799446 0.769685911 -4.270015626 -0.876346472 -4.189990626 -0.836333972 -4.029890626 -0.826327722 -3.984865626 -0.665527722 -3.979237348 -0.645515219 -3.689890626 -0.506015222 -3.715771139 -0.358188095 -3.608896139 -0.167944420 -3.450550971 -0.167944420 -3.305311403 -0.119967558 -0.372793527 0.181784530 -0.392818527 0.161759530 0.020262473 -0.048710792 -6.408789105 0.440542769 1.152333760] -6.368776605 0.460549019 1.153584150] -6.348451605 0.465552144 1.154834931] -6.177651605 0.471202144 1.159859931] -6.017551581 0.511227150 1.169866183] -6.018451605 0.478052144 1.474834931] -5.586051605 0.643760899 1.897859931] -3.969801605 1.229021141 2.010984931] -1.394121605 1.493829509 2.150984931] -0.605274356 1.667067663 3.029576931] 1.256454417 -0.276966758 0.441236803] 0.934804417 -0.357066758 0.401186803] 1.664610417 -0.040385758 0.816805303] (5) - Controlador com o traço de G θ−10 ótimo, obtido através da síntese PRCBI. (6) - Controlador com custo de desempenho ótimo. 58 O controlador 4.21 foi propositalmente liberado de 12.36%, a fim de igualar seu custo de desempenho com o do controlador 4.20, a fim de observar se os resultados alcançados a partir da liberação do desempenho seriam melhores que aqueles a partir da liberação do traço de G θ−1 . Neste caso, o controlador 4.20 obteve 0 características superiores, pois seu custo de robustez foi menor. Procedeu-se analogamente com o controlador 4.22, liberando-o 23.77% do custo de desempenho nominal ótimo, a fim de compará-lo com o controlador 4.19. Este último alcançou resultados superiores, pois seu custo de robustez foi menor e adicionalmente, o raio da hiperesfera de estabilidade foi maior. Para este problema, as comparações comentadas evidenciam que os controladores obtidos a partir da degradação do traço de G θ−1 possuem características 0 superiores segundo os critérios analisados. As Figuras 4.11 a 4.36 mostram os diagramas de sensibilidade, as regiões de estabilidade e as hiperesferas percentuais para o sistema em estudo com os controladores da Tabela 4.7. Nos diagramas de sensibilidade encontram-se ilustrados os pólos de MF do sistema perturbado com raios percentuais de 10% (vermelho) e 40% (azul). Vale observar que os controladores que possuem raio da hiperesfera percentual, de acordo com as Tabelas 4.8 e 4.9, inferiores a 40%, obviamente deverão ter a curva de perturbação azul cruzando a fronteira do círculo unitário (plano z). Nas figuras que ilustram as regiões de estabilidade, os pontos de cor azul claro no domínio paramétrico indicam que o sistema é estável nestas posições, a cruz mostra a posição do vetor paramétrico nominal e a circunferência ilustra graficamente a hiperesfera no ℜ2 , cujo raio foi divulgado nas Tabelas 4.8 e 4.9. Além disso, como as variações percentuais das massas 1 e 4 são iguais (-80% a 200% do valor nominal) e correspondem a mesma dimensão física, a hiperesfera sempre será uma circunferência. 59 TABELA 4.8: Características dos controladores obtidos a partir da síntese PRCBI e pela liberação do custo de robustez ótimo. Número do Ctrl. 4.11 4.12 4.13 4.14 4.15 4.16 4.17 4.18 4.19 4.20 (7) Limite do Custo de Robustez ótimo (%) 0 5 10 20 30 50 100 200 300 500 Valor do Traço de G θ−10 2.60409005 (7) 2.73427910 2.86448520 3.12488989 3.38531696 3.90602889 5.20789785 7.80841917 10.41631737 15.62425935 Custo de Desempenho J DESEMP 991.790962 538.287546 327.698673 151.882485 118.411605 95.913688 70.375903 46.597650 39.643464 35.988292 Raio da Hiperesfera Percentual (%) 59.9609 59.5703 40.0586 26.3867 29.8633 30.5078 41.7188 38.1445 34.7656 24.6484 - Custo de robustez ótimo, obtido através da técnica PRCBI. TABELA 4.9: Características dos controladores obtidos a partir da liberação do custo de Desempenho ótimo, otimizando-se o traço de G θ−1 . 0 Número do Ctrl. 4.23 4.21 4.22 Limite (%) do Desempenho Nominal ótimo 0 12.36 23.77 Custo de Desempenho J DESEMP 32.02968266 (8) 35.98851006 39.64290839 Valor do Traço de G θ−10 45.5105208 18.0900845 13.2905033 Raio da Hiperesfera Percentual (%) 14.0234 24.5117 29.3164 (8) - Custo de Desempenho ótimo obtido através de um sistema com estimador corrente de estados, utilizando Filtro de Kalman e ponderando os estados e a entrada através das seguintes matrizes Q1 =I 8 e Q2 =1. 60 FIGURA 4.11: Diagrama de Sensibilidade com o controlador 4.11. FIGURA 4.12: Região de estabilidade e Hiperesfera percentual com o controlador 4.11. 61 FIGURA 4.13: Diagrama de Sensibilidade com o controlador 4.12. FIGURA 4.14: Região de estabilidade e Hiperesfera percentual com o controlador 4.12. 62 FIGURA 4.15: Diagrama de Sensibilidade com o controlador 4.13. FIGURA 4.16: Região de estabilidade e Hiperesfera percentual com o controlador 4.13. 63 FIGURA 4.17: Diagrama de Sensibilidade com o controlador 4.14. FIGURA 4.18: Região de estabilidade e Hiperesfera percentual com o controlador 4.14. 64 FIGURA 4.19: Diagrama de Sensibilidade com o controlador 4.15. FIGURA 4.20: Região de estabilidade e Hiperesfera percentual com o controlador 4.15. 65 FIGURA 4.21: Diagrama de Sensibilidade com o controlador 4.16. FIGURA 4.22: Região de estabilidade e Hiperesfera percentual com o controlador 4.16. 66 FIGURA 4.23: Diagrama de Sensibilidade com o controlador 4.17. FIGURA 4.24: Região de estabilidade e Hiperesfera percentual com o controlador 4.17. 67 FIGURA 4.25: Diagrama de Sensibilidade com o controlador 4.18. FIGURA 4.26: Região de estabilidade e Hiperesfera percentual com o controlador 4.18. 68 FIGURA 4.27: Diagrama de Sensibilidade com o controlador 4.19. FIGURA 4.28: Região de estabilidade e Hiperesfera percentual com o controlador 4.19. 69 FIGURA 4.29: Diagrama de Sensibilidade com o controlador 4.20. FIGURA 4.30: Região de estabilidade e Hiperesfera percentual com o controlador 4.20. 70 FIGURA 4.31: Diagrama de Sensibilidade com o controlador 4.23. FIGURA 4.32: Região de estabilidade e Hiperesfera percentual com o controlador 4.23. 71 FIGURA 4.33: Diagrama de Sensibilidade com o controlador 4.21. FIGURA 4.34: Região de estabilidade e Hiperesfera percentual com o controlador 4.21. 72 FIGURA 4.35: Diagrama de Sensibilidade com o controlador 4.22. FIGURA 4.36: Região de estabilidade e Hiperesfera percentual com o controlador 4.22. 73 Analogamente aos diagramas de sensibilidade do problema anterior, a medida que o traço de G θ−1 aumenta, as pequenas ilhas fundem-se formando uma curva que 0 engloba uma grande região, representando um grande aumento da sensibilidade dos pólos de MF ao perturbar o sistema parametricamente. Analisando os resultados obtidos pelas tabelas e figuras citadas, pode-se concluir em linhas gerais, que a minimização do traço de G θ−1 leva a uma 0 dessensibilização dos pólos de MF do sistema, além de aumentar a região de estabilidade e o raio da hiperesfera percentual. Entretanto, observa-se que a minimização de tal critério leva, no caso do sistema massa-mola, a deterioração do desempenho devido a alocação de pólos de MF totalmente insensíveis, mas muito próximos ao ponto (1,0) do plano z. Os controladores híbridos calculados parecem atender as necessidades de desempenho e robustez desejáveis no sistema estudado. O desempenho dos controladores é avaliado por 150 períodos através da energia de seus estados e entrada após o fechamento da malha em k=51 (t=5.1s), tendo o sistema recebido como excitação um impulso unitário em sua entrada em k=0. Para 1 ≤ k ≤ 50 o sistema evolui livremente (malha aberta). A Expressão (4.19) mostra como é avaliado o custo de desempenho. J Desemp = 200 ∑ (x Q x k = 51 T k 1 k + u Tk Q 2 u k ) (4.19) onde para 51 ≤ k ≤ 200 , x k deve ser calculado pela Equação (3.7) e u k = − K C x$ k / k . 4.3.2 - Robustecimento a Variação de 4 Massas A principal diferença deste problema para o anterior está na dimensão do vetor de parâmetros sensíveis. Neste caso, este vetor possui ordem 4, o que acarreta a impossibilidade de representar graficamente a hiperesfera de estabilidade, a exemplo do item anterior. O diagrama físico da planta é semelhante ao da Figura 4.10, a menos 74 dos valores nominais das massas e encontra-se ilustrado na Figura 4.37. As equações de estado são as apresentadas em (4.13) a (4.17). FIGURA 4.37: Diagrama físico do sistema analisado. 4.3.2.1 - Constantes e Considerações Adotadas a) Matriz covariância de entrada de ruídos na planta: Q=0.01; b) Matriz covariância do ruído do sensor de medidas de saída da planta: R=0.0001; c) Período de amostragem considerado na discretização: T=0.25 seg; d) Método de otimização utilizado: Powell; e) Valores nominais adotados nas massas: m1N = m2 N = m3N = m4 N = 1. 0 Kg; f) Constante elástica das molas: k = 0.145 N/m; g) Constante de amortecimento: b = 0.04875 N.s/m; h) Considerou-se que D= Γ , isto é, o ruído entra na planta através dos atuadores; i) O desempenho do sistema malha fechada é avaliado por estimador corrente de estados; j) O sistema será robustecido em relação a variação das massas. 4.3.2.2 - Vetor de Parâmetros Sensíveis Como citado acima, as massas da planta serão os parâmetros sensíveis, e conseqüentemente o controlador robusto deverá tornar, entre outros critérios, o sistema insensível a variações das massas. Assim: 75 . m1 m1N 10 m m 10 . θ0 = 2 N = e θ = 2 10 . m3 m3N m4 m4 N 10 . (4.20) 4.3.2.3 - Resultados Obtidos As Tabelas 4.11 e 4.12 mostram as características dos controladores numerados na Tabela 4.10. TABELA 4.10: Controladores obtidos através da síntese PRCBI, por métodos de otimização utilizando critérios híbridos e por meio analítico. NO C O N T R O L A D O R (K C ) 4.24 [2.909953 7.973019 -1.684919 -0.160940 [4.080548 6.816629 -2.159006 1.400809 [3.825548 3.436629 -2.188643 1.549968 [1.570331 3.526856 -0.628789 0.235109 [1.620331 4.336903 -0.503629 0.385749 [1.114621 1.704016 0.204799 0.106795 4.25 4.26 4.27 4.28 4.29 0.871488 0.579147] 3.903083 3.660742] 6.183083 4.483867] 0.139279 0.778424] 1.362646 1.280986] 2.550429 2.621865] -1.063487 -5.501394 -0.792975 -2.419798 -0.713825 0.866452 -1.043883 0.253709 -0.731969 0.584728 0.135705 2.665679 TABELA 4.11: Características dos controladores obtidos pela síntese PRCBI e pela liberação do custo de robustez ótimo. No. Ctrl 4.24 4.25 4.26 (9) Limite do Custo de Robustez ótimo (%) 0 30 100 Valor do Traço de G θ−10 0.21564588 (9) 0.28028729 0.43128482 Custo de Desempenho J DESEMP 1854.675536 181.719570 138.081073 - Custo de robustez ótimo, obtido através da síntese PRCBI. 76 Raio da Hiperesfera Percentual (%) 62.0313 44.8438 38.7500 TABELA 4.12: Características dos controladores obtidos por métodos de otimização e por meio analítico (LQR). No. Ctrl 4.29 4.27 4.28 Limite (%) do Módulo Máximo pólos 0 1 1 (+7% Traço) Custo de Desempenho J DESEMP 124.247549 (10) 690.276633 192.654214 Valor do Traço de G θ−10 2.01729169 0.26647546 0.28509928 Raio da Hiperesfera Percentual (%) 12.03125 52.50000 49.53125 (10) - Custo de desempenho ótimo obtido através de um sistema com estimador de estados, utilizando FK e ponderando os estados e a entrada através das seguintes matrizes Q1 =I 8 e Q2 =1. O controlador 4.27 foi obtido a partir da otimização do traço de G θ−1 , liberando0 se 1% do módulo máximo dos pólos de MF obtidos com o controlador 4.29, cujo desempenho é ótimo (LQR) considerando-se as matrizes de ponderação dos estados Q1 = I 8 e da entrada Q2 =1. O controlador 4.28 foi obtido a partir da otimização do critério de desempenho, liberando-se 1% do módulo máximo dos pólos de MF obtidos com o controlador 4.29 e 7% do traço obtido pelo controlador 4.27. As Figuras 4.38 a 4.49 apresentam os diagramas de sensibilidade e as curvas envoltórias temporais do sistema massa-mola 8 estados com os controladores numerados na Tabela 4.10. Neste problema, como o vetor de parâmetros sensíveis é de quarta ordem, torna-se impossível a representação gráfica da região de estabilidade e da hiperesfera percentual, tal como foi realizada no problema anterior. Deve-se observar que as curvas formando ilhas nos diagramas de sensibilidade do problema anterior transformam-se em áreas por onde transitaram os pólos de MF do sistema perturbado. As regiões vermelhas representam perturbações de raio percentual de 10%, enquanto que as de cor azul representam de 40%. Nas figuras com envoltórias temporais, a curva preta representa o módulo da saída nominal. As curvas vermelhas representam a envoltória de todas as saídas possíveis, considerando o sistema perturbado com raio percentual de 10%. As curvas 77 de cor azul são análogas às vermelhas, mas com raio percentual de perturbação de 40%. Nos controladores 4.26 e 4.29 não foram apresentadas as curvas de cor azul, pois o raio da hiperesfera percentual é menor que 40%. Assim ao perturbar o sistema em várias direções paramétricas com raio de 40%, o sistema acabaria se tornando instável e conseqëntemente inviabilizaria a intenção de representar a envoltória. De maneira geral, os comentários realizados a respeito do traço de G θ−1 , raio de 0 hiperesfera percentual e do desempenho no problema anterior continuam válidos para este problema. 78 FIGURA 4.38: Diagrama de Sensibilidade com o controlador 4.24. FIGURA 4.39: Evolução temporal do módulo da saída nominal e envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.24. 79 FIGURA 4.40: Diagrama de Sensibilidade com o controlador 4.25. FIGURA 4.41: Evolução temporal do módulo da saída nominal e da envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.25. 80 FIGURA 4.42: Diagrama de Sensibilidade com o controlador 4.26. FIGURA 4.43: Evolução temporal do módulo da saída nominal e da envoltória da saída perturbada em 10% (curva vermelha) com o controlador 4.26. 81 FIGURA 4.44: Diagrama de Sensibilidade com o controlador 4.29. FIGURA 4.45: Evolução temporal do módulo da saída nominal e da envoltória da saída perturbada em 10% (curva vermelha) com o controlador 4.29. 82 FIGURA 4.46: Diagrama de Sensibilidade com o controlador 4.27. FIGURA 4.47: Evolução temporal do módulo da saída nominal e da envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.27. 83 FIGURA 4.48: Diagrama de Sensibilidade com o controlador 4.28. FIGURA 4.49: Evolução temporal do módulo da saída nominal e da envoltória da saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.28. 84 CAPÍTULO 5 O PROBLEMA DO HELICÓPTERO 5.1 - INTRODUÇÃO Neste capítulo propõe-se um problema envolvendo o robustecimento paramétrico de um sistema MIMO. O modelo utilizado é o de um helicóptero, empregado em recente trabalho da área de controle robusto (SAMBLANCAT, 1991). Como a fonte de consulta original encontrava-se em francês, preferiu-se manter alguns termos no idioma de origem. Ainda assim, tais termos foram relacionados com os equivalentes em outras idiomas através da Tabela 5.1. As explicações a seguir apresentadas sobre os comandos e funcionamento do helicóptero têm por finalidade apenas ilustrar o modelo matemático a ser estudado, justificando-se deste modo as simplificações por ventura existentes. TABELA 5.1: Correspondência entre termos. Correspondência entre os termos referentes aos movimentos do helicóptero Francês Inglês Português Tangage Pitch Caturro Roulis Roll Balanço Lacet Heading Rumo 5.1.1 - Os Movimentos do Helicóptero A Tabela 5.2 apresenta os movimentos de translação e rotação do helicóptero. Na Figura 5.1 encontram-se ilustrados os eixos de referência ligados ao helicóptero. Consideram-se positivos os movimentos no sentido do referencial apresentado. O movimento longitudinal é aquele que ocorre quando o aparelho se desloca para frente mantendo a altitude constante (eixo OX). O movimento lateral é o que ocorre sobre o 85 eixo OY, isto é, o aparelho se desloca para a direita ou esquerda do piloto. O movimento normal ou vertical é o do eixo OZ. Quanto aos movimentos de rotação pode-se dizer que o de tangage é aquele em que a frente do helicóptero inclina-se para cima ou para baixo, sendo positivo quando gira-se o eixo OZ para OX de acordo com a Figura 5.1. O movimento de roulis é o visto por um observador externo de frente para o aparelho, quando este gira no sentido horário ou anti-horário, sendo positivo no sentido de OY para OZ. Finalmente o lacet ocorre quando o helicóptero gira no plano horizontal, sendo positivo no sentido de OX para OY. TABELA 5.2: Os movimentos do helicóptero. Movimentos do Helicóptero de Translação: de Rotação: Longitudinal Tangage Normal (vertical) Roulis Lateral Lacet (Vista lateral) (Vista de frente) (Vista de cima) FIGURA 5.1: Referência utilizada pelo helicóptero. 86 5.1.2 - O Vôo do Helicóptero A fim de simplificar a análise do vôo do helicóptero, considera-se que o eixo do rotor principal passa pelo centro de gravidade (G) do aparelho. Em vôo, o helicóptero está sujeito a três forças principais, isto é: r - Seu peso P , aplicado sobre o ponto G. r - A força FN , gerada pelo rotor principal. r - Fx provocada no vôo de translação pela resistência do ar sobre a estrutura do aparelho. Supõe-se por motivos de simplificação que esta força também estará aplicada sobre o centro de gravidade G. A Figura 5.2 ilustra as forças aplicadas sobre o helicóptero em vôo. Para que o r r r helicóptero esteja em equilíbrio, torna-se necessário que a resultante R entre P e Fx r seja igual e oposta a FN . Sendo nula a resultante total das forças, o vôo do helicóptero estabiliza-se. Neste caso, o aparelho estará imóvel ou em translação (movimento r retilíneo uniforme). Alterações em direção ou em intensidade de FN resultará na quebra do equilíbrio supra-citado, alterando o movimento por ventura existente. A r intensidade de FN varia em função da potência do rotor principal. Para pilotar o helicóptero, o piloto dispõe do manche de pás coletivas e do manche de pás cíclicas e ainda dos pedais de lacet, cujo funcionamento será descrito adiante. 87 FIGURA 5.2: As forças aplicadas sobre o helicóptero em vôo. 5.1.3 - O Vôo Estacionário (teórico) Em vôo estacionário, caso o vento seja nulo, as únicas forças aplicadas ao r aparelho seriam o peso e a força de sustentação gerada pelo rotor principal FN . Como o helicóptero encontra-se em vôo estacionário, a resultante destas forças será nula. A Figura 5.3 ilustra o helicóptero em vôo estacionário. Manche de pás cíclicas na posição neutro FIGURA 5.3: O vôo estacionário. 88 5.1.4 - O Vôo Vertical (ascendente ou descendente) O vôo vertical é obtido, a partir do vôo estacionário, com o acionamento do manche de pás coletivas. De maneira simplificada pode-se dizer que um aumento do passo das pás estará associado a um aumento da potência do rotor no sentido de manter constante a velocidade de rotação do mesmo. Assim um deslocamento do manche de pás coletivas tendente a aproximá-lo do piloto provoca um aumento gradual do passo das pás do rotor principal e também um aumento da potência do r mesmo rotor. Deste modo, a força de sustentação gerada pelo rotor FN torna-se r r superior a P , impondo conseqüentemente uma velocidade normal (vertical) v z ascendente ao helicóptero. O contrário ocorrerá, caso o manche de pás coletivas seja empurrado pelo piloto no sentido de afastá-lo , isto é, o passo das pás do rotor r principal diminuirá, provocando uma diminuição em intensidade de FN , rompendo o equilíbrio e gerando uma resultante na mesma direção e sentido do peso. Assim o aparelho adquirirá uma velocidade normal descendente. A Figura 5.4 mostra o vôo ascendente e descendente do helicóptero. 5.1.5 - O Vôo de Translação (longitudinal e lateral) O vôo de translação é obtido, a partir do vôo estacionário, com o acionamento do manche de pás cíclicas. O deslocamento deste manche provoca uma inclinação r proporcional e na mesma direção do eixo do rotor principal. A força FN se decompõe r r então em duas, ou seja, Fh que assegura um movimento longitudinal ou lateral e Fs que mantém a sustentação do aparelho. A Figura 5.5 apresenta o vôo de translação longitudinal e lateral. 89 FIGURA 5.4: O vôo ascendente e descendente. FIGURA 5.5: Vôo de translação longitudinal e lateral. 5.1.6 - A Finalidade do Rotor Traseiro Com o helicóptero em vôo estacionário, pode-se dizer que o rotor principal está gerando um torque sobre seu eixo fazendo girá-lo. Este torque, representado por um conjugado, provocaria pela terceira lei de Newton uma reação igual em módulo, mas em sentido oposto sobre a cabine do helicóptero. Deste modo, enquanto as pás 90 girariam num determinado sentido, a cabine teria o mesmo movimento em sentido oposto. Assim, surge a necessidade do rotor traseiro gerar uma força, provocando um torque contrário sobre a cabine de modo a estabilizá-la. Em termos de torques a cabine estaria estabilizada, mas agora o rotor traseiro estaria gerando uma força no plano horizontal, o que certamente provocaria uma deriva lateral do aparelho. A fim de sanar tal problema, inclina-se levemente o rotor principal para o lado, gerando uma força em sentido contrário àquela do rotor traseiro, de maneira que a resultante no plano horizontal seja nula. A Figura 5.6 ilustra as explicações citadas acima. FIGURA 5.6: O rotor traseiro. 5.1.7 - O Movimento de Lacet A partir do vôo estacionário, o lacet é obtido com o acionamento de um dos dois pedais. Este comando cria uma variação de potência do rotor traseiro, e por consequência um movimento de rotação no plano horizontal da cabine em torno de seu centro de gravidade. 91 5.1.8 - Exemplos de Movimentos Acoplados Neste item descreve-se algumas das características do comportamento do helicóptero, permitindo avaliar a dificuldade de pilotar o aparelho e obter movimentos precisos. Alguns exemplos de movimentos acoplados são: - Acoplamento entre o movimento de Lacet e o movimento Lateral: Quando um comando de lacet é aplicado, o equilíbrio das forças provocadas pelo rotor traseiro e pela inclinação do rotor principal é rompido. Assim o aparelho adquire uma velocidade lateral. - Acoplamento entre o movimento Normal e o movimento Roulis/Tangage: Para adquirir um movimento de translação longitudinal ou lateral, um comando de pás cíclicas deverá ser aplicado, inclinando o rotor para frente (tangage) ou para o lado (roulis). Esta inclinação provoca uma diminuição da componente de sustentação, gerando uma velocidade normal. - Acoplamento entre o movimento Normal e o movimento de Lacet: Para aumentar a velocidade normal, aumenta-se o passo das pás coletivas, isto é, a incidência das pás do rotor principal e conseqüentemente a potência do rotor. Este aumento do torque do rotor principal provocará o rompimento do equilíbrio dos torques com o rotor traseiro, conseqüentemente gerando um movimento de lacet. Após estes três exemplos torna-se claro a existência no helicóptero de fortes acoplamentos de movimentos. 92 5.2 - O MODELO MATEMÁTICO DISPONÍVEL A partir de determinados ensaios e cálculos teóricos foi possível obter um modelo não linear para o helicóptero, restrito a determinadas condições de vôo. Este modelo foi então linearizado para as velocidades longitudinais de 0 até 300 Km/h, de 50 em 50 Km/h. Na linearização destes sete modelos foi considerado que o helicóptero encontrava-se estabilizado em determinada altitude, sujeitando-se a pequenos movimentos em torno destas velocidades longitudinais. Os modelos são multivariáveis com 8 estados, 3 entradas e 5 saídas, conforme será descrito a seguir. A Figura 5.7 mostra uma representação dos modelos linearizados disponíveis, fornecidos pelo CERT (Centre d'Etudes et Recherches de Toulouse - França). MODELOS DISPONÍVEIS Velocidades Longitudinais (Km/h) 0 50 100 v1 v2 v3 150 200 250 300 v4 v5 v6 v7 FIGURA 5.7: Representação dos modelos disponíveis linearizados nas velocidades apresentadas. O modelos supra-citados encontram-se sob a forma de equações de estado da maneira seguinte: x& ( t ) = A. x( t ) + B. u( t ) (5.1) onde A e B dependem da velocidade longitudinal. Os estados do modelo são os descritos na Tabela 5.3 e as entradas u( t ) encontram-se na Tabela 5.4. 93 TABELA 5.3: Dados referentes aos estados do modelo. ESTADO x1 x2 x3 x4 x5 x6 x7 x8 SÍMBOLO u vz q θ v p r φ DESCRIÇÃO Velocidade Longitudinal Velocidade Vertical Velocidade de Tangage Ângulo de Tangage Velocidade Lateral Velocidade de Roulis Lacet Ângulo de Roulis UNIDADE m/s m/s graus/s graus m/s graus/s graus/s graus TABELA 5.4: Dados referentes às entradas do modelo. ENTRADA u1 u2 u3 SÍMBOLO DESCRIÇÃO Pás Cíclica Longitudinal Pás Cíclica Lateral Pás Rotor Traseiro θ2 θ1 θr UNIDADE graus graus graus Os modelos disponíveis possuem como saída os seguintes estados: q, θ , p, r e φ . Portanto a matriz C de saída da planta será dada por: 0 0 C = 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 (5.2) 5.3 - O PROBLEMA ORIGINAL E O PROPOSTO As noções introduzidas no início do capítulo colocam em evidência a complexidade do funcionamento do helicóptero e a grande carga de trabalho a que 94 sujeita-se o piloto. A elaboração de uma lei de controle que diminua o trabalho do piloto é um problema complexo que apresenta um interesse evidente. O desacoplamento dos diferentes movimentos do helicóptero é um dos objetivos do controle. Os movimentos que devem ser desacoplados são os seguintes: a) Movimento longitudinal, relativo às variáveis: u q θ b) Movimento lateral, relativo às variáveis: v p φ c) Movimento de lacet, relativo à variável: r O problema original, cujo diagrama encontra-se na Figura 5.8, consiste em projetar um controlador robusto K(s) e um filtro W(s) através da síntese H ∞ , atendendo a determinadas especificações impostas em (SAMBLANCAT, 1991) e adicionalmente permitindo os desacoplamentos de movimentos a seguir comentados. Nesta figura, G(s) representa o helicóptero. O sistema possui três entradas de referência possíveis, ilustradas na Tabela 5.5, correspondentes a manobras prédeterminadas do helicóptero. A primeira deverá habilitar o aparelho a realizar alterações em seu movimento longitudinal, desacoplando os movimentos laterais e de lacet. A segunda entrada promoverá um efeito análogo ao da primeira, isto é, realizará um movimento lateral desacoplando os movimentos longitudinal e de lacet. A terceira permitirá um movimento de lacet. Não deve ser esquecido que os modelos utilizados foram linearizados em torno de seus respectivos pontos de operação, conseqüentemente qualquer variação dos estados do modelo equivale a adicionar ou subtrair esta variação aos valores reais apresentados pela planta. Além disso, os modelos representam o helicóptero estabilizado em determinada altitude, deslocando-se para frente nas velocidades longitudinais especificadas. Ao acionar a primeira entrada de referência fazendo no caso θ ref = −1, esperase que o estado θ siga a referência, diminuindo seu valor atual de um grau, acarretando esta inclinação adicional da frente do helicóptero para baixo. O aumento da inclinação citada provocará um aumento da força resultante na direção longitudinal 95 e portanto a velocidade longitudinal do helicóptero aumentará. Espera-se que este aumento ocorra a uma taxa constante. Em (SAMBLANCAT, 1991), utilizou-se θ ref = 1 observando-se conseqüentemente uma diminuição da velocidade longitudinal, isto é, uma frenagem do aparelho. As demais entradas de referência deverão produzir efeitos semelhantes aos citados acima e encontram-se resumidos na Tabela 5.6. Os objetivos de desempenho atingidos em (SAMBLANCAT, 1991) serão perseguidos no problema proposto. 0 θ1 θ2 θr + K(s) q θ θ ref 0 p rref r φ φ ref + G(s) W(s) Sinal de erro FIGURA 5.8: Diagrama do problema original H ∞ . TABELA 5.5: Entradas de referência. θ −1 Z01 = r = 0 φ 0 θ 0 Z02 = r = 1 φ 0 θ 0 Z03 = r = 0 φ 1 MANOBRA 1 MANOBRA 2 MANOBRA 3 96 TABELA 5.6: Efeitos das manobras do helicóptero. MANOBRA 1 2 3 Estado seguidor da referência θ r φ Estado que evoluirá com taxa constante u v v Estados regulados (convergentes para zero) vz q v p r φ u vz q θ p φ u vz q θ p r O objetivo do problema proposto será calcular um controlador robusto, através da síntese PRCBI, mas que também possua as características de desempenho apresentadas pelo problema original, ou seja, que possa realizar as manobras resumidas pela Tabela 5.6, ao alimentar o sistema com as entradas de referência citadas. O diagrama do problema proposto encontra-se na Figura 5.9. Com a síntese PRCBI, torna-se imprescindível a inclusão da planta na estrutura LQG. Além disso, para que o sistema possa seguir as entradas de referência, um "bloco compensador" deverá ser inserido na estrutura LQG, conforme apresentado no Item 3.4. O bloco compensador poderá ser calculado através da fórmula (3.14) que encontra-se a seguir reproduzida: [ ] u0 ' = C' ( I − Φ + ΓKC ) Γ −1 −1 Z0 = H −f 1(1) Z0 [3.14] Deve-se observar que C' não necessariamente será a matriz de saída da planta, conforme (5.2). A matriz C' de (3.14) é aquela que permite gerar as saídas seguidoras das referências. Portanto: 0 0 0 1 0 0 0 0 C' = 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 97 (5.3) Z0 BLOCO COMPENSADOR ξk D ηk + + − PLANTA HELICÓPTERO C + Φ Γ Y(k) FILTRO DE KALMAN KC Φ0 Γ0 FIGURA 5.9: Diagrama do problema proposto. A robustez exigida será observada quando a planta tiver seu modelo modificado para as diversas velocidades longitudinais, esperando-se manter o desempenho do sistema com o controlador robusto calculado para a velocidade definida nominal. Para todos os efeitos será considerado como nominal o modelo de 200 Km/h, ou seja, para este modelo os diversos parâmetros sensíveis assumirão seus valores nominais. Este modelo também será inserido no Filtro de Kalman durante os diversos cálculos e simulações. Em princípio, a filosofia adotada para resolver o problema será a mesma do sistema massa-mola, mas inicialmente procurar-se-á obter através da minimização de um critério de desempenho, um controlador que consiga realizar as manobras definidas pelas Tabelas 5.5 e 5.6. Este controlador será denominado de controlador de desempenho ótimo. A bem da verdade, o critério de desempenho citado é composto por três funções objetivo, que representam as manobras exigidas, fazendo-se portanto necessário o uso da Técnica das Liberações (Item 4.1.3). Após isto, as atenções serão voltadas no sentido de obter controladores híbridos que mantenham o desempenho adquirido, mas também levem em conta a robustez do sistema a variações 98 paramétricas. A fim de evitar surpresas mais adiante, registra-se aqui que a Técnica das Liberações será aperfeiçoada no Item 5.5. 5.4 - CRITÉRIO ADOTADO COMO DESEMPENHO ÓTIMO O critério apresentado a seguir foi adotado para a manobra 1. Para as demais manobras deve-se alterar esta rotina de acordo com os efeitos divulgados na Tabela 5.6. Este critério proposto foi fruto da observação dos resultados ao longo de várias tentativas, tendo por objetivo o desempenho alcançado com o controlador H ∞ (SAMBLANCAT, 1991). O custo total de desempenho a ser minimizado consiste na soma dos custos de três fases. Na primeira fase, composta pelos dez primeiros períodos de evolução, enfatiza-se o transitório das entradas da planta. Além disso, a entrada de referência final somente é alcançada no décimo período de amostragem, sendo formada por uma sucessão de degraus com amplitudes iguais a 1/10 da amplitude final. O período de amostragem adotado para discretização dos modelos do helicóptero foi T = 0.01 segundos. A Figura 5.10 mostra a formulação para o cálculo do custo da fase 1. Deve-se observar que a evolução dos estados da planta é realizado de acordo com uma variação de (3.2), apresentada através de (5.4). x k +1 Φ x$ = K CΦ F k +1/ k +1 −ΓKC x k ( I − K FC0 )(Φ0 − Γ0KC ) − KFCΓKC x$ k / k + Γ −1 + C' ( I − Φ0 + Γ0 KC ) Γ0 Γ0 [ ] −1 Z0 (5.4) Note ainda que nesta fase de otimização do desempenho considera-se que: Φ = Φ 0 , Γ = Γ0 e C = C0 (5.5) Além disso, os ruídos ξ k e ηk mostrados na Figura 5.9, foram desconsiderados e portanto retirados de (5.4). 99 A Figura 5.11 ilustra a formulação da fase 2, onde aumenta-se a importância dos erros dos estados relativamente aos transitórios das entradas, uma vez que as entradas já começam a se estabilizar. A fase 2 possui uma duração de 0.2 s, sendo observados os períodos de 11 a 30. A Figura 5.12 apresenta a formulação da fase 3. Nesta fase despreza-se os transitórios das entradas, pois estas já estão estabilizadas e aumenta-se a ênfase sobre os estados seguidores, através da matriz de ponderação Q p . A fase 3 dura 7.7 segundos, sendo bem maior que as anteriores. Isto acarretará uma compensação no cálculo do custo final. A Figura 5.13 mostra como foi calculado o custo final de desempenho para a manobra 1 e por analogia para as outras. As fases 1 e 2 tiveram um peso dobrado em relação a fase 3 pois esta última possui um ciclo de duração bem superior às anteriores (k=31 até 800). Além dos custos das fases 1, 2 e 3, foi penalizado o erro estacionário dos estados seguidores, isto é, a diferença entre seus valores e respectivas referências. No caso da manobra 1 levou-se em conta para efeito de erro estacionário o estado v (vel. lateral), já que este possuia uma tendência de não convergir para zero. Nas manobras 2 e 3, o vetor de erro estacionário não poderá conter este estado, pois o mesmo evoluirá a uma taxa constante. Neste item foi estabelecido um critério ou, em termos de otimização, uma função objetivo a ser atingida pelo controlador calculado. Mas em termos de desempenho, não basta somente que o controlador atenda este critério, o que permitiria somente a realização da manobra 1. Deste modo, surge a necessidade de compor três critérios análogos, porém diferentes, de modo a permitir a realização das três manobras propostas. Isto será realizado através da técnica das liberações realimentadas, comentada no próximo item. Esta técnica permitirá posteriormente a incorporação de uma função objetivo relativo a robustez paramétrica do sistema, obtendo-se então um controlador híbrido, tal como foi feito no Capítulo 4. 100 MANOBRA 1 - FASE 1 Para k = 1 até 10 − 10k Z0 = 0 --------------------------------------- Entrada de Referência. 0 ∆U k = 8.( u( k ) − u( k − 1)) ------------------------ Variação das Entradas. ∆X k = x k (2:8) T − ( 0 0 −1 0 0 0 0) ----- Erro dos Estados. 10 J 11 = ∑ ( ∆ X k . I 7 . ∆ X Tk + ∆ U Tk . I 3 . ∆ U k ) ----------- Custo da FASE 1. k =1 FIGURA 5.10: Cálculo do custo da fase 1 de desempenho - Manobra 1. MANOBRA 1 - FASE 2 Para k = 11 até 30 −1 Z0 = 0 ------------------------------------------ Entrada de Referência. 0 ∆U k = 4.( u( k ) − u( k − 1)) ------------------------ Variação das Entradas. ∆X k = x k (2:8) T − ( 0 0 −1 0 0 0 0) ----- Erro dos Estados. J 12 = 30 ∑ ( ∆ X k . I 7 . ∆ XTk + ∆ UTk . I 3 . ∆ U k ) ----------- Custo da FASE 2. k =11 FIGURA 5.11: Cálculo do custo da fase 2 de desempenho - Manobra 1. 101 MANOBRA 1 - FASE 3 Para k = 31 até 800 −1 Z0 = 0 ------------------------------------------ Entrada de Referência. 0 Q P = diag(1 1 4 1 1 4 4) ---------------- Matriz de Ponderação. ∆X k = x k (2:8) T − ( 0 0 −1 0 0 0 0) ----- Erro dos Estados. J 13 = 800 ∑ ( ∆ X k . Q P . ∆ XTk ) --------------------------- Custo da FASE 3. k = 31 FIGURA 5.12: Cálculo do custo da fase 3 de desempenho - Manobra 1. CUSTO FINAL DE DESEMPENHO - MANOBRA 1 E ( k =800) x4 −1 x 0 5 = − ----------------------------- Erro Estacionário. x7 0 x8 0 J DES = 2.( J 11 + J 12 ) + J 13 + 50.( E T . I 4 . E ) ------------ Custo Final. FIGURA 5.13: Cálculo do custo final de desempenho - Manobra 1. 102 5.5 - A TÉCNICA DAS LIBERAÇÕES REALIMENTADAS Esta técnica foi desenvolvida com a finalidade de superar as dificuldades enfrentadas neste problema, já não mais atendido pela técnica comentada no Item 4.1.3. Ainda que bons resultados tenham sido obtidos para o sistema massa-mola, através da técnica anterior, observou-se que ao otimizar a segunda função objetivo, na etapa 2, o custo da primeira função objetivo minimizada era naturalmente levado pelo processo de otimização para um valor degradado muito próximo da liberação (folga) permitida. Isto realmente ocorrerá se por exemplo a direção do mínimo da primeira função objetivo for uma direção de maximização da segunda e vice-versa. Neste caso, os objetivos serão conciliados conforme as liberações autorizadas. No entanto, para o problema do helicóptero sentiu-se a necessidade de minimizar a n-ésima função objetivo, procurando manter os custos mínimos atingidos nas (n-1) etapas anteriores, ainda que estabelecidas liberações para as funções objetivos anteriores. Para tanto, desenvolveu-se um artifício simples que penaliza a degradação dos custos mínimos atingidos e estimula, caso seja possível, uma minimização adicional das funções objetivo já consideradas. Este novo método foi denominado de "Técnica das Liberações Realimentadas". A etapa 1 deste algoritmo é igual a da Figura 4.1. Na Figura 5.14, ilustra-se a segunda etapa deste método, que corresponde a inclusão da segunda função objetivo. Do mesmo modo que a técnica do Item 4.1.3, pode-se extrapolar o método para n funções objetivo. Conforme a Figura 5.14, o método consiste em estabelecer uma folga para o custo atingido quando da minimização da primeira função objetivo e em seguida, numa segunda etapa, autorizar uma degradação deste valor no sentido de permitir agora a otimização de um custo composto incluindo a segunda função objetivo. Na segunda etapa, independentemente do número de funções objetivo, este custo composto será dado por: ( ) J = M1 J 1 − J 1 min + J 2 103 (5.6) onde J 1 min é o custo mínimo atingido na etapa 1 e M1 é um escalar que será ajustado durante o processo de minimização de acordo com os valores de J 1 min e J 2 . Deve ficar claro que em (5.6) as variáveis são J 1 e J 2 , funções diretas das variáveis de projeto X, isto é: J 1 = F( X) e J 2 = G( X) (5.7) Além disso, o valor de M1 deve ser convenientemente manipulado pelo projetista. Considere como exemplo a otimização das duas funções objetivo de (5.7), supondo que ambas possuam a mesma ordem de grandeza em termos de faixa de valores possíveis, ou seja: l1 ≤ J 1 ≤ L1 e l 2 ≤ J 2 ≤ L2 , com l1 ≅ l 2 e L1 ≅ L2 (5.8) onde deseja-se obter X, que minimize ambas as funções, gerando valores de igual ordem de grandeza para as mesmas. Suponha ainda que J 1 min =10 e que ao encerrar a ( ) primeira etapa tenha sido obtido X1 tal que J 1 min = F X1 . Para este projeto tem-se que ( ) o valor de J 2 = G X1 = 35000 . Deve-se agora observar que a escolha de M1 pelo projetista terá grande influência sobre a solução final a ser atingida, isto é, se M1=1000 então ao minimizar J em (5.6), uma unidade degradada no valor de J 1 deverá acarretar uma redução superior a 1000 em J 2 . Isto ocorre pois o processo de minimização a cada passo reduz o valor do custo J, portanto por (5.6): J novo = 1000 (11 − 10) + J 2 e J atual = 1000 (10 − 10) + 35000 = 35000 (5.9) Mas necessariamente, J novo < J atual 104 (5.10) Para que (5.9) atenda a (5.10) tem-se que J 2 < 34000, reduzindo esta variável de um valor superior a 1000. O processo de otimização aceitará esta relação de compensação de 1:1000 enquanto for mais fácil reduzir J 2 . No entanto chegará um momento que será mais interessante manter J 2 e tornar a reduzir J 1 , pois esta redução será multiplicada por M1=1000. Neste momento deve-se cogitar a diminuição do valor de M1, considerando que J 2 ainda seja bem maior que J 1 . De um modo geral, se ainda J 1 << J 2 então quanto maior for M1, mais rapidamente o processo de otimização optará por estabilizar J 2 e continuará a minimizar J 1 , em muitos casos podendo obter J 1 ≤ J 1 min . Por outro lado se a relação de compensação não for grande suficiênte, então o processo de otimização poderá degradar demasiadamente J 1 em função da pequena diminuição de J 2 . ETAPA 2 INÍCIO Restrições Satisfeitas NÃO J 1 LIB = k . J1 min SIM Verificação das RESTRIÇÕES IMPOSTAS Cálculo de J1 = F(X) J 1 ≤ J 1 LIB NÃO J = 1000000 SIM Cálculo de J 2 = G (X) Cálculo da Função Objetivo J = M1 (J1 − J 1 min) + J 2 FIM FIGURA 5.14: Fluxograma da etapa 2 da técnica das liberações realimentadas. 105 Finalmente para encerrar este item, será registrada através da Fórmula (5.11) o custo composto na n-ésima etapa de otimização: ( ) ( ) ( ) J = M1 J 1 − J 1 min + M 2 J 2 − J 2 min + ... + M n −1 J n −1 − J n −1 min + J n (5.11) 5.6 - A APLICAÇÃO DO PRCBI Neste item procura-se mostrar como foi introduzida a robustez no problema do helicóptero, utilizando a síntese PRCBI. Algumas dificuldades apareceram pois não estava disponível o modelo teórico literal do helicóptero. Além de não possuir os parâmetros influentes no problema, também desconhecia-se como estes interferiam nos diversos modelos linearizados em torno das várias velocidades longitudinais. Como idéia inicial, comparou-se através do computador, considerando o modelo de 200 Km/h como o nominal, os elementos das matrizes Φ e Γ dos diversos modelos com seus equivalentes nominais, de modo a analisar os termos que mais variavam segundo critérios estipulados. Estes critérios levavam em conta a variação percentual em relação ao valor nominal, mas também o valor absoluto do elemento. Como a matriz Φ possui 64 elementos e a Γ , 24 elementos, perfazendo assim um total de 88 elementos, optou-se por determinar entre os diversos modelos, os quinze elementos de maior variação segundo o critério especificado para compor o vetor de parâmetros sensíveis. No entanto, foi observado que outros elementos também estavam variando excessivamente e considerando que o tempo de processamento computacional seria elevado para um vetor paramétrico de quinze elementos, resolveu-se descartar esta abordagem e utilizar uma nova idéia. Esta nova idéia adaptou-se bem melhor ao problema proposto. Consiste em definir um vetor paramétrico fictício, em analogia ao sistema massa-mola, de maneira que ao perturbar um dos parâmetros em 100%, o modelo perturbado seja o representado por outra velocidade longitudinal. A Figura 5.15 ilustra esta idéia. 106 Através desta abordagem, todas as variações dos elementos das matrizes Φ e Γ dos diversos modelos foram consideradas. No trabalho de (SAMBLANCAT, 1991), pode-se observar através dos gráficos, que o desempenho do sistema utilizando o controlador robusto H ∞ com os modelos de 150 e 250 Km/h, já encontrava-se bastante degradado. Deste modo, a fim de simplificar os cálculos, resolveu-se trabalhar somente com os modelos de 100 a 300 Km/h, conforme pode ser visto na Figura 5.15. Segundo a abordagem proposta, o vetor paramétrico será de quarta ordem. 2 1 θ= 1 1 100 1 2 θ= 1 1 1 1 θ= 2 1 150 250 v5 = 200 Km / h Modelo Nominal 1 1 θ= 1 2 300 1 1 θ0 = 1 1 FIGURA 5.15: Adaptação da síntese PRCBI para o problema do helicóptero. Para efeito de cálculo do traço de G θ−1 , obteve-se os modelos perturbados 0 através de interpolação linear entre o modelo nominal e os demais. 107 5.7 - RESULTADOS OBTIDOS As Tabelas 5.7 e 5.8 apresentam os resultados obtidos a partir do processo de minimização utilizando o método de Powell, com o critério de desempenho descrito no Item 5.4 e compondo as várias funções objetivo através da técnica comentada no Item 5.5. TABELA 5.7: Controladores calculados no problema do helicóptero. C O N T RO L A D O R (K C ) No 5.1 5.2 5.3 [-0.0914 -0.5265 -2.1263 -0.0260 0.1606 -0.5425 0.1307 -0.3168 0.4127 [-0.0858 -0.4998 -0.3247 -0.0260 0.1862 -0.2469 0.1307 -0.3312 0.2301 [ 0.5507 0.0936 0.0373 11.1605 9.3088 2.8524 1.7758 -1.9086 -0.1010 -3.1416 0.1109 -2.7422 1.8337 -3.2657 -0.6665 0.1195 -1.2421 0.2978 -1.6382 0.4945 0.4215 0.5353 1.0183 0.6659] -0.7122 0.0270 -0.0963 -0.3087 -0.1544 -0.1813 0.0898 -0.9938 -0.7165 -1.4550 0.1558 0.4284 0.2498 1.8325 0.2536] -0.2242 -0.0179 0.0333 -0.5475 -0.4654 1.6478 -14.6403 -0.5527 -1.7692 -7.3210 0.6463 -1.2324 -0.1013 1.7609 0.4586] 5.4 [-0.1754 0.4962 0.0674 -0.1141 1.3438 0.0333 -0.4907 -0.4421 -6.9778 14.9761 2.2221 2.6302 7.1415 -0.1605 -3.5573 -6.8504 1.4831 -2.9755 -0.1836 0.2769 -3.6009 -0.0876 1.5974 0.7424] 5.5 [ 0.9659 0.3420 0.0396 -0.1615 1.9621 0.0333 -0.4288 -0.3197 3.1568 12.4669 1.9046 2.8505 15.3842 -0.1728 -2.9499 -5.1787 -2.2453 -3.2001 -0.1623 0.7198 -5.7685 -0.0765 1.3828 0.5327] TABELA 5.8: Características dos controladores calculados. Ctrl No. Manobra 1 5.1 5.2 5.3 5.4 5.5 269 262 1517523 531863 644526 Manobra 2 Manobra 3 Traço G θ−01 246 218 15800 1418 2396 44 34 281025 45658 111488 0.13794 0.00353 0.00156 - 108 Comentários: a) O controlador 5.1 foi obtido minimizando-se o critério de desempenho estabelecido no Item 5.4 e empregando a técnica apresentada em 5.5, tendo sido denominado de controlador de desempenho ótimo. Foi utilizado como semente um controlador LQR calculado através da rotina "dlqr" do Matlab. Os custos das manobras para o controlador LQR utilizado eram da ordem de 105 . Para a minimização de cada uma das três etapas (manobras) foi necessária cerca de 60 horas de processamento computacional, utilizando-se um microcomputador PC-386DX40 e o Matlab, que é uma linguagem interpretada. b) O controlador 5.2 foi obtido a partir do 5.1, introduzindo-se um quarto objetivo relativo à robustez através da técnica descrita no Item 5.5. Atuando convenientemente sobre as constantes M i , comentadas no Item 5.5, foi possível após cerca de 70 horas de processamento computacional, otimizar o traço de G θ−01 e ainda melhorar os custos das manobras 1, 2 e 3. Para otimização do referido traço levou-se em conta somente os modelos de 150, 200 e 250 Km/h. c) O controlador 5.3 foi calculado utilizando como semente o 5.2, otimizando-se apenas o traço de G θ−01 . Pela Tabela 5.8, observa-se que o valor do traço foi reduzido, mas em compensação os custos das manobras degradaram-se completamente. Também neste caso, para o cálculo do traço somente foram considerados os modelos de 150, 200 e 250 Km/h. d) O controlador 5.4 foi calculado a partir do 5.2, tomando-se por base somente a otimização do traço de G θ−01 , mas considerando os modelos de 100, 150, 200, 250 e 300 Km/h. Neste caso, o vetor paramétrico é de quarta ordem e as matrizes perturbadas, empregadas no cálculo do traço de G θ−01 , foram geradas por interpolação linear entre o 109 modelo nominal e os demais de acordo com a Figura 5.7, considerando os parâmetros perturbados em 20%. e) O controlador 5.5 é análogo ao 5.4, mas as matrizes perturbadas foram obtidas considerando os parâmetros perturbados em 98%, isto é, praticamente utilizando como matrizes perturbadas os próprios modelos das demais velocidades. f) A fim de evitar interpretações erradas, omitiu-se os valores do traço de G θ−01 na Tabela 5.8 para os controladores 5.4 e 5.5 pois estes não poderiam ser comparados entre si, nem entre os demais. Nas Figuras 5.16 a 5.20 encontram-se ilustrados os diagramas de sensibilidade do sistema com os controladores enumerados pela Tabela 5.7. Nestas figuras, as cruzes representam os pólos de MF do sistema funcionando com o modelo de 200 Km/h, definido nominal. Os modelos perturbados são gerados interpolando-se linearmente os sete modelos disponíveis. A curva vermelha mostra a posição dos pólos de MF do sistema, perturbando-o com modelos de 100 Km/h até 300 Km/h. A curva azul é análoga a vermelha, mas considera-se somente os modelos de 150 Km/h até 250 Km/h. Pelos diagramas de sensibilidade dos controladores 5.4 e 5.5 conclui-se que o cálculo do traço de G θ−01 com matrizes perturbadas ao longo da faixa de operação gera uma maior dessensibilização dos pólos de MF que utilizando modelos na vizinhança do nominal (200 Km/h). Nas Figuras 5.21 a 5.26 ilustra-se a evolução dos estados do helicóptero ao aplicar as entradas de referência da Tabela 5.5 na situação nominal com os controladores 5.1 (desempenho ótimo) e 5.2 (híbrido). Os efeitos esperados são aqueles comentados pela Tabela 5.6. Ao comparar as figuras de desempenho temporal deve-se observar se os eixos dos gráficos estão na mesma escala. 110 Nas Figuras 5.27 a 5.32 supõe-se a planta perturbada, em operação com velocidade longitudinal de 100 Km/h e aplica-se as entradas de refêrencia a fim de realizar as manobras supra-citadas. Observa-se que as manobras utilizando o controlador 5.1 deterioram-se mais que as do controlador 5.2. Isto ocorre devido a dessensibilização dos pólos de MF do sistema com a utilização do controlador híbrido. As Figuras 5.33 a 5.38 são análogas às anteriores, mas a planta perturbada opera em 300 Km/h. FIGURA 5.16: Diagrama de sensibilidade com o controlador 5.1, variando-se os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul). 111 FIGURA 5.17: Diagrama de sensibilidade com o controlador 5.2, variando-se os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul). FIGURA 5.18: Diagrama de sensibilidade com o controlador 5.3, variando-se os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul). 112 FIGURA 5.19: Diagrama de sensibilidade com o controlador 5.4, variando-se os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul). FIGURA 5.20: Diagrama de sensibilidade com o controlador 5.5, variando-se os modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul). 113 FIGURA 5.21: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.1 na velocidade longitudinal de 200 Km/h. FIGURA 5.22: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.2 na velocidade longitudinal de 200 Km/h. 114 FIGURA 5.23: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.1 na velocidade longitudinal de 200 Km/h. FIGURA 5.24: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.2 na velocidade longitudinal de 200 Km/h. 115 FIGURA 5.25: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.1 na velocidade longitudinal de 200 Km/h. FIGURA 5.26: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.2 na velocidade longitudinal de 200 Km/h. 116 FIGURA 5.27: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.1 na velocidade longitudinal de 100 Km/h. FIGURA 5.28: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.2 na velocidade longitudinal de 100 Km/h. 117 FIGURA 5.29: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.1 na velocidade longitudinal de 100 Km/h. FIGURA 5.30: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.2 na velocidade longitudinal de 100 Km/h. 118 FIGURA 5.31: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.1 na velocidade longitudinal de 100 Km/h. FIGURA 5.32: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.2 na velocidade longitudinal de 100 Km/h. 119 FIGURA 5.33: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.1 na velocidade longitudinal de 300 Km/h. FIGURA 5.34: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o controlador 5.2 na velocidade longitudinal de 300 Km/h. 120 FIGURA 5.35: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.1 na velocidade longitudinal de 300 Km/h. FIGURA 5.36: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o controlador 5.2 na velocidade longitudinal de 300 Km/h. 121 FIGURA 5.37: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.1 na velocidade longitudinal de 300 Km/h. FIGURA 5.38: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o controlador 5.2 na velocidade longitudinal de 300 Km/h. 122 CAPÍTULO 6 CONCLUSÕES E PERSPECTIVAS 6.1 - CONCLUSÕES Após a realização deste trabalho na área de controle robusto paramétrico, baseado na síntese PRCBI, concluiu-se que: a) De acordo com os resultados do Capítulo 4, a otimização numérica de um critério combinando estabilidade e desempenho é viável computacionalmente. Para os exemplos utilizados, os controladores calculados através do critério de robustez híbrida proposto permitiram conciliar em diversos níveis o compromisso estabilidade versus desempenho. b) Da forma como foram definidas neste trabalho, a técnica das liberações e a das liberações realimentadas permitiram compor, de forma intuitiva e organizada, diversas funções objetivo. c) As técnicas de otimização foram selecionadas e utilizadas a medida que os problemas de controle exigiram. Após alcançar os resultados apresentados nos Capítulos 4 e 5, concluiu-se que os mesmos poderiam ser obtidos pela técnica das liberações realimentadas, otimizando-se em uma única etapa todas as funções objetivo envolvidas. Logicamente, as constantes M i citadas no Item 5.5 deverão ser convenientemente manuseadas. Entretanto, a noção do mínimo que poderia ser atingido para cada função objetivo isoladamente seria perdida. d) O uso de vetores paramétricos perturbados aleatoriamente com raio percentual constante nos diagramas de sensibilidade permitiu a comparação da robustez paramétrica entre os diversos controladores calculados. 123 e) O raio da hiperesfera percentual de estabilidade constitui uma figura de mérito de grande interesse para avaliar o domínio de estabilidade paramétrica do sistema. Além disso, a utilização de escalas convenientes nos gráficos da região de estabilidade do domínio paramétrico permitiu que a hiperesfera percentual fosse representada por uma circunferência, facilitando a comparação visual entre os gráficos dos diversos controladores. f) Foi possível a aplicação da síntese PRCBI em sistemas MIMO, bem como o cálculo de controladores com robustez híbrida para os mesmos. Além disso, a utilização das múltiplas saídas da planta para estimar o vetor de estado através do FK, em comparação com o uso de uma única saída, melhora consideravelmente o resultado da estimação. g) A síntese PRCBI se mostrou eficiente mesmo sendo empregada em sistemas onde a influência dos parâmetros sensíveis não esteja explícita nas matrizes da dinâmica (transição de estados e de controle), o que foi comprovado pelo problema do Capítulo 5. h) A abordagem adotada no problema do helicóptero indica uma maneira simples de robustecer sistemas não lineares através da parametrização fictícia. i) Na maioria dos casos, a minimização do traço de G θ−1 conduz a um aumento do raio 0 da hiperesfera percentual, bem como da região de estabilidade no domínio paramétrico. j) Nos problemas estudados, observou-se que pequenas degradações do custo de desempenho nominal ótimo possibilitou grandes reduções do custo de robustez e vice-versa. k) A utilização dos vetores paramétricos perturbados de forma normalizada, isto é, com raio percentual constante, permitiu definir o que equivaleria perturbar o sistema em cada uma das direções paramétricas geradas aleatoriamente. 124 6.2 - PERSPECTIVAS Com base na experiência obtida durante a elaboração deste trabalho, sugere-se os seguintes desenvolvimentos futuros: a) Aplicar a metodologia desenvolvida nesta tese para obter controladores de robustez híbrida em outros sistemas reais, como por exemplo os SEP (Sistemas Elétricos de Potência), que foram robustecidos através do traço de G θ−1 (PELLANDA, 1993) 0 sem levar em conta o desempenho do sistema. b) Pesquisar um índice que permita medir a sensibilidade dos pólos de MF, a fim de provar que a síntese PRCBI não conduz simplesmente a dessensibilização do pólos de MF do sistema. c) Procurar combinar o critério PRCBI com outros que levem em conta a robustez à incertezas não estruturadas. d) Estudar a possibilidade de obter de forma analítica um limitante do custo de desempenho quadrático, a fim de evitar as simulações (resposta ao impulso) a cada passo do processo de otimização numérica. e) Realizar um estudo empregando a síntese PRCBI em controladores dinâmicos, conforme (GAUVRIT & LAVIGNE, 1994). f) Simular distúrbios de forma a melhorar a análise dos resultados alcançados pela síntese PRCBI. g) Fazer análises através do diagrama de Nyquist e procurar obter envoltórias frequênciais. 125 APÊNDICE A SOLUÇÃO PARA AS EQUAÇÕES DE L, N e ∆P' A condição necessária e suficiente para que exista uma única solução para o sistema matricial envolvido é, neste caso, que os autovalores de (Φ0 − Γ0 KC ) sejam estáveis, isto é, que os modos de controle do sistema MF estejam no interior do círculo unitário do plano complexo z. A solução da equação X = F X G + H é dada pela seguinte relação: x = U −1 h (A.1) f11G T − I f12 G T L f1mG T f GT f GT − I L f GT 21 22 2m U = F ⊗ GT − I ⊗ I = M M M M T T fm1G T L fmmG − I f m2 G (A.2) onde: Além disso, h e x são vetores constituidos pelos elementos das matrizes X e H, da seguinte maneira: h = −[ h11 h12 L h1n h21 L h2 n L h mn ] x = [ x11 x12 L x1n x21 L x2 n L x mn ] com F ∈ C m × m , G ∈ C n × n , H ∈ C m × n , X ∈ C m 126 ×n e U ∈ C mn T (A.3) T × mn (A.4) . REFERÊNCIAS BIBLIOGRÁFICAS APKARIAN, Pierre. Robustesse de la Commande des Systemes Multivariables Application au Pilotage d'un Helicoptere. Tese de Doutorado, Ecole Nationale Superieure de l'Aeronautique et de l'Espace - ENSAE, Toulouse, 1988. BOURRET, Thierry. Commande Robuste des Systemes Multivariables Discrets soumis a des Perturbations Parametriques. Application au Pilote Automatique d'un Avion de Type Airbus. Tese de Doutorado, Ecole Nationale Superieure de l'Aeronautique et de l'Espace - ENSAE, Toulouse, 1993. CHEN, Chi-Tsong. Linear System Theory and Design, CBS College Publishing, New York, 1984. D'AZZO, J. J. & HOUPIS, C. H. Análise e Projeto de Sistemas de Controle Lineares, Segunda Edição, Editora Guanabara, Rio de Janeiro, 1988. DOYLE, John C. & STEIN, Gunter. "Multivariable Feedback Design: Concepts for a Classical / Modern Synthesis". IEEE Trans. Automatic Control, fevereiro de 1981, 26(1), 4-16. FOX, Richard L. Optimization Methods for Engineering Design, Addison-Wesley, Califórnia, 1971. FRANKLIN, Gene F. & POWELL, J. D. Digital Control of Dynamic Systems, Addison-Wesley, Califórnia, 1980. GAUVRIT, Michel. Performances des Estimateurs Bayesiens en Boucle Ouverte et Fermée. Tese de Doutorado, Université Paul Sabatier, Toulose, 1982. GAUVRIT, Michel & LAVIGNE, G. "Parameter Robust Control by Dynamic Compensator". Symposium on Robust Control Design, IFAC, Rio de Janeiro, setembro de 1994, 481-486. GOMES, G. M. Pinheiro. Synthese d'une Commande Robuste liee a la Qualite de L'identification Bayesienne. Tese de Doutorado, Ecole Nationale Superieure de l'Aeronautique et de l'Espace - ENSAE, Toulouse, 1991. 127 GOODWIN, Graham C. "Linking Identification and Robust Control". 9o CBA-UFES, . KAILATH, Thomas. Linear Systems. Prentice-Hall, New Jersey, 1980. KWAKERNAAK, Huibert & SIVAN, Raphael. Linear Optimal Control Systems. John Wiley & Sons, New York, 1972. MORARI, Manfred & ZAFIRIOV, E. Robust Process Control. Prentice Hall, 1990. MOREIRA, F. J. O. (CTA-IAE) & Hemerly, Elder M. (CTA-ITA). "Projeto de um Autopiloto Robusto para um Foguete Usando a Técnica H ∞ " - 9o CBA-UFES. PAPOULIS, Athanasios. Probability, Random Variables, and Stochastic Processes. Third Edition, McGraw-Hill, New York, 1991. PELLANDA, Paulo Cesar. Controle Robusto Aplicado na Estabilização de Sistemas Elétricos de Potência. Tese de Mestrado, Instituto Militar de Engenharia - IME, Rio de Janeiro, 1993. PERES, P. L. D. et alii. "Controle de Sistemas Dinâmicos Sujeito a Restrições Estruturais e Limitante H ∞ " - 9o CBA-UFES. PERES, P. L. D. (UNICAMP) & PIERI, Edson R. (UFSC). "Controle Robusto de Sistemas de Estrutura Flexivel por Realimentação de Saída" - 9o CBA-UFES. SAMBLANCAT, Christiane. Commande Robuste Multivariable Applications a L'helicoptere. Tese de Doutorado, Ecole Nationale Superieure de l'Aeronautique et de l'Espace - ENSAE, Toulouse, 1991. TAHK, M. & SPEYER, J. L. "A Parameter Robust LQG Design Synthesis with Applications to Control of Flexible Structures", IEEE Trans. Automatic Control, 1987. VANDERPLAATS, Garret N. Numerical Optimization Techniques for Engineering Design, McGraw-Hill, New York, 1984. 128 129
Documentos relacionados
59531 - 2009 Brazilian Symposium on Aerospace Engineering and
são modeladas como reduções nos ganhos dos atuadores. Os resultados são avaliados através de simulações no ambiente Matlab/Simulink. Para tanto, a resposta do sistema em malha fechada é analisada c...
Leia mais