texto completo - Mestrado em Engenharia Elétrica
Transcrição
texto completo - Mestrado em Engenharia Elétrica
INSTITUTO MILITAR DE ENGENHARIA CÁLCULO DE LIMITANTE INFERIOR PARA O VALOR SINGULAR ESTRUTURADO VIA OTIMIZAÇÃO NÃO-DIFERENCIÁVEL Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para obtenção do título de Mestre em Ciências em Engenharia Elétrica. Orientador: Cap Alberto Mota Simões - Dr. ISAE Rio de Janeiro 2012 c2012 INSTITUTO MILITAR DE ENGENHARIA Praça General Tibúrcio, 80-Praia Vermelha Rio de Janeiro-RJ CEP 22290-270 Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de arquivamento. É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem finalidade comercial e que seja feita a referência bibliográfica completa. Os conceitos expressos neste trabalho são de responsabilidade do autor e do orientador. L557 Lemos, Rodrigo Garrido da Silva Cálculo de limitante inferior para o valor singular estruturado via otimização não-diferenciável / Rodrigo Garrido da Silva Lemos. - Rio de Janeiro : Instituto Militar de Engenharia, 2012. 104 p.: il. Dissertação (mestrado) - Instituto Militar de Engenharia - Rio de Janeiro, 2012. 1. Engenharia elétrica (teses e dissertações). 2. Controle robusto 3. Valor Singular Estruturado 4. Otimização nãodiferenciável I. Título II. Instituto Militar de Engenharia. CDD 621.3822 2 INSTITUTO MILITAR DE ENGENHARIA RODRIGO GARRIDO DA SILVA LEMOS CÁLCULO DE LIMITANTE INFERIOR PARA O VALOR SINGULAR ESTRUTURADO VIA OTIMIZAÇÃO NÃO-DIFERENCIÁVEL Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para obtenção do título de Mestre em Ciências em Engenharia Elétrica. Orientador: Cap Alberto Mota Simões - Dr. ISAE Aprovada em 09 de Março 2012 pela seguinte Banca Examinadora: Cap Alberto Mota Simões - Dr. ISAE do IME Cel Paulo César Pellanda - Dr. ENSAE do IME Ricardo Hiroshi Caldeira Takahashi - Dr. UNICAMP da UFMG Leonardo Antônio Borges Tôrres - Dr. UFMG da UFMG Rio de Janeiro 2012 3 À minha mãe. 4 AGRADECIMENTOS Ao meu orientador, Cap Alberto Mota Simões, pela dedicação, atenção e compreensão dispensados, que somados ao compartilhamento de notório saber possibilitaram o desenvolvimento desse trabalho. Aos meus pais, Nelson da Silva Lemos e Iris Garrido da Silva Lemos, in memorian, por tudo. Ao meu primo, Andersen, pelos constantes apoio e incentivo, sem os quais esse objetivo jamais teria sido alcançado. À minha esposa, Ana Paula, por dividir comigo, a cada dia, os risos dos momentos felizes e as lágrimas dos momentos tristes. Aos meus familiares, que contribuíram de maneira significante com a minha formação, em especial ao meu irmão Rafael, às minhas tias Isis e Célia e à minha madrinha Conceição. Ao Exército Brasileiro, pelo significativo investimento e pelo voto de confiança. 5 Epígrafe “Julgue seu sucesso pelas coisas que você teve que renunciar para conseguir.” Dalai Lama 6 SUMÁRIO LISTA DE ILUSTRAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 LISTA DE SMBOLOS E ABREVIATURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.1 Motivação do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.2 Organização da dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2 ANÁLISE DE ROBUSTEZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.1 Caracterização das incertezas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.2 Quadro de trabalho para a análise de robustez . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.2.1 Representação de incertezas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.2.2 Definições de estabilidade e desempenho robustos . . . . . . . . . . . . . . . . . . . . . . . 25 2.2.3 Estabilidade robusta na estrutura M ∆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.3 Valor singular estruturado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.3.1 Estabilidade robusta para bloco de incertezas diagonal . . . . . . . . . . . . . . . . . . 30 2.4 Valor singular estruturado oblíquo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.5 Desempenho robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.5.1 Teste-µ para desempenho robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.6 Análise µ por espaço de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3 ELEMENTOS DE OTIMIZAÇÃO NÃO-DIFERENCIÁVEL . . . . . 41 3.1 Análise não-diferenciável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.1.1 Introducão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.1.2 Subdiferencial de uma função convexa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.1.3 Subdiferencial de Clarke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.1.4 Regras de cálculo do subdiferencial de Clarke . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.2 Técnica de otimização não-diferenciável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.2.1 Algoritmo de penalização exata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.2.2 Detalhes da implementação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 7 4 APLICAÇÕES NUMÉRICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.1 Exemplo com incertezas puramente reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.2 Exemplo com incertezas mistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.3 Sistema massa-mola-amortecedor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 4.4 Sistema de controle de voo longitudinal de míssil . . . . . . . . . . . . . . . . . . . . . . . 74 4.5 Avião flexível . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 5 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.1 Visão geral do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.2 Estudos de caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.3 Sugestão para trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 6 REFERÊNCIAS BIBLIOGRFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 7 APÊNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 7.1 Transformações Fracionais Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 7.1.1 Interconexão de LFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 7.2 Autovalores e autovetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 7.3 Valores singulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 7.4 Critério de Nyquist Generalizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 7.5 Fórmula de Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 8 LISTA DE ILUSTRAÇÕES FIG.2.1 Incerteza multiplicativa de entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 FIG.2.2 Estrutura M ∆ para análise de robustez em estabilidade . . . . . . . . . . . . . . 24 FIG.2.3 Estrutura N ∆ para análise de robustez em desempenho . . . . . . . . . . . . . . 24 FIG.2.4 Forma padrão para síntese de controladores . . . . . . . . . . . . . . . . . . . . . . . . . 25 FIG.2.5 Estrutura M ∆ particionada para análise ν . . . . . . . . . . . . . . . . . . . . . . . . . 31 ˆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Estrutura G∆ FIG.2.6 FIG.2.8 ∆p incluso na estrutura N ∆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 ˆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Estrutura N ∆ FIG.2.9 Teste µ - espaço de estados FIG.3.1 Interpretação geométrica do subdiferencial de uma função convexa FIG.2.7 (HIRIART-URRUTY, 1993) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 FIG.3.2 Interpretação geométrica do subdiferencial de Clarke . . . . . . . . . . . . . . . . 47 FIG.4.1 Limitantes de µ com 1 ponto inicial: 1a aplicação . . . . . . . . . . . . . . . . . . . 60 FIG.4.2 Limitantes de µ com 5 pontos iniciais: 1a aplicação . . . . . . . . . . . . . . . . . . 61 FIG.4.3 Limitantes de µ com 10 pontos iniciais: 1a aplicação . . . . . . . . . . . . . . . . . 62 FIG.4.4 Análise de singularidade via menor valor singular (GB/ND-GF): 1a aplicação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 FIG.4.5 Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): 1a aplicação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 FIG.4.6 Diagramas de blocos do sistema em malha fechada: 2a aplicação. . . . . . . 63 FIG.4.7 Limitantes de µ: 2a aplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 FIG.4.8 Análise de singularidade via menor valor singular (GB/ND-GF): 2a aplicação (estabilidade robusta). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 FIG.4.9 Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): 2a aplicação (estabilidade robusta). . . . . . . . . . . . . 66 FIG.4.10 Limitantes para o pior caso de ganho da transferência F : 2a aplicação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 FIG.4.11 Análise de singularidade via menor valor singular (ND-GF): 2a aplicação (desempenho robusto). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 9 FIG.4.12 Análise de singularidade via recíproco do número de condicionamento (ND-GF): 2a aplicação (desempenho robusto). . . . . . . . . . . . . . . . 69 FIG.4.13 Sistema massa-mola-amortecedor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 FIG.4.14 Limitantes de µ: massa-mola-amortecedor. . . . . . . . . . . . . . . . . . . . . . . . . . 71 FIG.4.15 Análise de singularidade via menor valor singular (ND-EE): massamola-amortecedor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 FIG.4.16 Análise de singularidade via recíproco do número de condicionamento (ND-EE): massa-mola-amortecedor. FIG.4.17 Diagrama de blocos do míssil. . . . . . . . . . . . . . . . . . . . . . . . . 73 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 FIG.4.18 Limitantes de µ: míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 FIG.4.19 Análise de singularidade via menor valor singular (ND-EE): míssil (análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 FIG.4.20 Análise de singularidade via recíproco do número de condicionamento (ND-EE): míssil (análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 FIG.4.21 Limitante de µ: míssil (Mα e Mβ reduzidos). . . . . . . . . . . . . . . . . . . . . . . . . 78 FIG.4.22 Análise de singularidade via menor valor singular para (GB/NDGF): míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 FIG.4.23 Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 FIG.4.24 Limitantes de ν: míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 FIG.4.25 Análise de singularidade via menor valor singular (ND-EE): míssil (análise ν). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 FIG.4.26 Análise de singularidade via recíproco do número de condicionamento (ND-EE): míssil (análise ν). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 FIG.4.27 Limitante para µ - míssil: Zα e Zβ reduzidos . . . . . . . . . . . . . . . . . . . . . . . 83 FIG.4.28 Limitantes de µ - avião flexível. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 FIG.4.29 Análise de singularidade via menor valor singular (ND-EE): avião flexível (análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 FIG.4.30 Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . 86 FIG.4.31 Limitantes de ν - avião flexível: restrição na faixa de variação dos coeficientes aerodinâmicos do modelo rígido. . . . . . . . . . . . . . . . . . . . . . . . 87 10 FIG.4.32 Análise de singularidade via menor valor singular (ND-EE): avião flexível (1a análise ν. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 FIG.4.33 Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (1a análise ν). . . . . . . . . . . . . . . . . . . . . . . 89 FIG.4.34 Limitantes de ν: avião flexível (restrição na faixa de variação das frequências naturais dos modos flexíveis). . . . . . . . . . . . . . . . . . . . . . . . . . . 90 FIG.4.35 Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (2a análise ν). . . . . . . . . . . . . . . . . . . . . . . 91 FIG.4.36 Análise de singularidade via menor valor singular (ND-EE): avião flexível (2a análise ν). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 FIG.7.1 LFT inferior em função de K FIG.7.2 LFT superior em função de ∆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 FIG.7.3 Interconexão de LFTs resulta em uma LFT FIG.7.4 Sistema com realimentação negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 11 . . . . . . . . . . . . . . . . . . . . . . . . 99 LISTA DE SMBOLOS E ABREVIATURAS ABREVIATURAS VANT - Veículo Aéreo Não-Tripulado UAV - Unmanned Aerial Vehicle LFT - Linear Fractional Transformations PI - Power Iteration GBLB - Gain Based Lower Bound EN - Estabilidade Nominal ER - Estabilidade Robusta DN - Desempenho Nominal DR - Desempenho Robusto LS - Limitante Superior LI GB - Limitante Inferior Gain Based LI ND-GF - Limitante Inferior Não-Diferenciável Grade de Frequências LI ND-EE - Limitante Inferior Não-Diferenciável Espaço de Estados LS-WC - Limitante Superior Worst Case LI-WC - Limitante Inferior Worst Case FIG(s) - Figura(s) TEO(s) - Teorema(s) EQ(s) - Equação(ções) MIMO - Multiple-Imput Multiple-Output CQP - Convex Quadratic Programming SDP - Semidefinite Programming , - igual, por definição ∀ - para todo ⇒ - se, então ⇔ - se, somente se SÍMBOLOS 12 2 - fim de demonstração a∈A - a pertence ao conjunto A R - conjunto dos números reais Rn×m - matriz real com n linhas e m colunas Rn - vetor coluna real com n elementos C - conjunto dos números complexos Cn×m - matriz complexa com n linhas e m colunas Cn - vetor coluna complexo com n elementos co - fecho convexo de um conjunto M T - transposta da matriz M M ∗ - adjunta da matriz M MH - transposta conjugada da matriz M Ip - matriz identidade de ordem p Tr - traço da matriz quadrada det - determinante da matriz Re - parte real de uma matriz Im - parte imaginária de uma matriz λ - autovalor q - autovetor ρ - raio espectral Hm - conjunto de matrizes hermitianas de ordem m X0 - matriz X é positiva definida X0 - matriz X é positiva semidefinida X ∗Y - produto estrela de Redheffer entre as matrizes X e Y µ - valor singular estruturado ν - valor singular estruturado oblíquo σ - valor singular σ - maior valor singular σ - menor valor singular B(δ, ρ) - bola de raio ρ > 0 centrada no ponto δ Jf (δ) - matriz jacobiana para o campo vetorial f(·) em δ δj - j-ésima componente do vetor δ ∈ Rn 13 ∂f (δ) - subdiferencial de Clarke em δ Epi(f ) - Epígrafo da função f f 0 (δ; h) - derivada direcional de δ na direção h ∇δ f (δ, y) - gradiente em relação à primeira variável Fu - LFT superior Fl - LFT inferior 14 RESUMO Este trabalho trata da análise de robustez de sistemas incertos via otimização nãodiferenciável. É proposta uma nova técnica baseada em otimização não-diferenciável para o cálculo de limitante inferior para o valor singular estruturado µ e para o valor singular estruturado oblíquo ν (skewed-µ), duas valiosas ferramentas para análise de robustez de sistemas incertos. µ e ν podem ser aplicados na análise de robustez de controladores utilizados em aplicações militares como mísseis e Veículos Aéreos Não-Tripulados (VANT). Exemplos numéricos mostram que em alguns casos os limitantes inferiores encontrados, tanto para µ quanto para ν, são iguais aos seus valores verdadeiros. Para o cálculo dos limitantes é utilizado um eficiente algoritmo de otimização dotado de certificado de convergência e otimalidade local. Em virtude da eficiência da técnica não-diferenciável, o algoritmo pode ser aplicado para resolver, até mesmo, problemas que envolvam um significativo número de incertezas paramétricas. Outra característica interessante da abordagem nãodiferenciável proposta é o pequeno impacto causado no tempo computacional pelo número de repetições das incertezas escalares no bloco estruturado das incertezas. Para algumas aplicações desafiadoras, como as discutidas neste trabalho, a técnica proposta pode fornecer limitantes inferiores menos conservadores quando comparada com as técnicas mais populares atualmente disponíveis. 15 ABSTRACT This work deals with robustness analysis of uncertain systems by non-smooth optimization. It is proposed a new technique based on non-smooth optimization to directly compute lower bounds on the structured singular value µ and the skew structured singular value ν, which are two valuable tools for robustness analysis of uncertain systems. µ and ν can be applied to the robustness analysis of controllers used in military applications such as missiles and Unmanned Aerial Vehicles (UAV). Numerical examples show that in some cases the lower bounds found for both µ and ν are equal to their true values. For the computation of bounds is used an optimization algorithm endowed with a certificate of convergence and local optimality. Thanks to the efficiency of the non-smooth technique, the algorithm can be applied to solve problems that involve even a significant number of parametric uncertainties. Another interesting feature of the proposed non-smooth approach is the little impact of dimension of repeated scalar uncertainties in the overall structured uncertainty matrix on the computational time. For some challenging applications, such as those discussed in this work, the proposed technique can provide tighter lower bounds when compared with the most popular techniques currently available. 16 1 INTRODUÇÃO Modelos matemáticos não possuem a capacidade de descrever com exatidão o comportamento de sistemas físicos reais. No entanto, muitas vezes, para fins de análise e projeto, é conveniente utilizá-los para se obter uma aproximação do comportamento de um determinado sistema. Para muitas aplicações as aproximações se mostram eficazes, mas em algumas circunstâncias, sobretudo em sistemas de alto desempenho, é possível que um projeto de controle forneça bons resultados na simulação de seu modelo nominal, mas não seja aplicável ao sistema físico real. Esse problema surge na medida em que o modelo não é suficientemente preciso. A Teoria de Controle Robusto (ZHOU, 1996) (SKOGESTAD, 2005) leva em conta as incertezas e imprecisões inerentes ao modelo, visando possibilitar uma análise sistemática e o desenvolvimento de técnicas de projeto para o tratamento dessas incertezas. O ponto de partida é considerar um modelo nominal e o conjunto de incertezas que o afeta. O sistema obtido é dito robusto se mantém suas propriedades mesmo sob influência dessas incertezas. Duas propriedades que são especialmente avaliadas são a estabilidade e o desempenho. Problemas de controle robusto seguem basicamente duas linhas: a análise de robustez e a síntese de controladores robustos. A primeira consiste em avaliar as propriedades de um sistema dado (em geral, planta e controlador) sob influência de um conjunto de incertezas. A segunda consiste em projetar um controlador que atenda, em malha fechada, as condições de robustez requeridas. Essa dissertação abordará o problema de análise de robustez. Existem várias hipóteses que podem ser adotadas para traduzir o conhecimento prévio que se tem acerca das incertezas e esse fato gera diferentes paradigmas para análise de robustez. Para que sejam obtidas descrições mais realistas dos sistemas físicos, é preciso permitir que modelos matemáticos mais sofisticados sejam utilizados na representação do conjunto de incertezas. Porém, essa medida pode acarretar dificuldades no tratamento do problema. Um significativo número de aplicações pode ser representado supondo-se que as incertezas sejam limitadas em norma. A medida de robustez será dada, então, em função da menor incerteza para a qual uma determinada propriedade do sistema não seja aten17 dida. No quadro de trabalho utilizado, as diferentes fontes de incertezas são organizadas em uma matriz bloco diagonal, o que induz uma estrutura para o conjunto. Esta configuração motiva a definição do valor singular estruturado µ (DOYLE, 1982), que é uma ferramenta matemática utilizada para se medir a robustez de sistemas incertos sujeitos à incertezas estruturadas. Outra grandeza utilizada para a análise de robustez é o valor singular estruturado oblíquo ν (skewed-µ) (FAN, 1992) que consiste em uma generalização para µ. 1.1 MOTIVAÇÃO DO TRABALHO µ e ν são duas valiosas ferramentas utilizadas para análise de robustez de sistemas incertos. Originalmente desenvolvido para análise de robustez em estabilidade, µ também pode ser utilizado para avaliação da robustez em desempenho via Teorema Principal de Malha (Main Loop Theorem) (PACKARD, 1993a). No entanto, alguns problemas mais complexos de análise de robustez só podem ser tratados através do caso mais geral, a análise ν. Podem ser citados como exemplos típicos, a avaliação do pior caso de desempenho H∞ , a maior incerteza permitida (FAN, 1992), e a obtenção da maior incerteza paramétrica aceitável na presença de dinâmicas negligenciadas (FERRERES, 1996), todos apresentando grande relevância do ponto de vista da engenharia. Uma abordagem possível para a obtenção de ν consiste na resolução iterativa de problemas µ (SKOGESTAD, 2005). Infelizmente, o cálculo de µ não é uma tarefa trivial e foi provado que, em geral, trata-se de um problema NP-difícil (BLONDEL, 2000). Para o caso de incertezas puramente reais até, mesmo o cálculo de um valor aproximado de µ é um problema NP-difícil (FU, 1997). Em virtude disso, na prática obtém-se uma estimativa do valor de µ a partir do cálculo de limitantes superior e inferior. Em contraste com o cálculo do limitante superior, que permite uma formulação convexa (FAN, 1991) (YOUNG, 1992), o cálculo do limitante inferior representa um problema bem mais delicado. A obtenção de limitantes inferiores justos tem grande importância, uma vez que que o limitante superior pode ser conservador (MEINSMA, 1997), especialmente quando há presença de incertezas paramétricas repetidas. No caso puramente complexo, o algoritmo baseado no método das potências (PI, de power iteration) (PACKARD, 1993a) geralmente fornece bons limites inferiores com baixo tempo computacional. O método foi estendido para o caso em que há presença de 18 incertezas mistas em (YOUNG, 1997), mas infelizmente não fornece bons resultados para algumas classes de problemas, incluindo o caso puramente real (NEWLIN, 1995). Algumas abordagens tem sido propostas na literatura com o objetivo de contornar as limitações do algoritmo PI nos casos de incertezas puramente reais ou mistas. O algoritmo GBLB (gainbased lower bound) (SEILER, 2010) fornece limitantes inferiores melhores em alguns casos. Esquemas de regularização (PACKARD, 1993b) (FERRERES, 2001) podem representar uma alternativa válida, mas geralmente é difícil inferir quão longe do problema original está o problema resolvido. O algoritmo em tempo polinomial apresentado em (DAILEY, 1990) fornece bons resultados para o caso puramente real, mas possui a limitação de funcionar bem somente em problemas que envolvem um número pequeno de parâmetros incertos. Programação não-linear foi utilizada em (HAYES, 2001) (BATES, 2004) para a obtenção de um limitante inferior para µ. No entanto, quando se utiliza técnicas de otimização diferenciável para se tratar um problema genuinamente não-diferenciável, nenhum certificado formal de convergência ou otimalidade pode ser fornecido. De fato, existe uma longa experiência no uso de métodos diferenciáveis clássicos para a solução de problemas nãodiferenciáveis. Na prática, ótimos locais são pontos de não diferenciabilidade (ZOWE, 1987). A utilização de métodos diferenciáveis invariavelmente provoca falhas em pontos que não são ótimos locais mas que possuem características de não-diferenciabilidade. Poucos trabalhos têm sido propostos tratando do cálculo direto de um limitante inferior para ν. Em (HOLLAND, 2005), o algoritmo PI foi estendido para problemas ν. Estratégia similares foram adotadas em (FERRERES, 1996) (GLAVASKI, 1998). Infelizmente, todas essas técnicas enfrentam as mesmas dificuldades de convergência do algoritmo PI original. Nessa dissertação, será apresentada uma abordagem baseada em otimização nãodiferenciável para o cálculo de limitantes inferiores para µ e ν. Para isso, um problema de otimização não-convexa, não-diferenciável e com restrição será resolvido através de um eficiente algoritmo dotado de certificado de convergência e otimalidade local. O objetivo principal do trabalho é comprovar a eficiência da técnica proposta, com a realização de extensivos testes numéricos. É mostrado que para algumas aplicações desafiadoras a técnica de otimização não-diferenciável fornece limitantes menos conservadores quando comparada com as técnicas atualmente disponíveis. Além disso, em muitos casos o limitante inferior obtido é igual ao valor verdadeiro de µ ou de ν. Graças à eficiência do algoritmo, o método pode ser aplicado em uma grande classe de problemas, até mesmo 19 nos casos com grande número de incertezas paramétricas. Outra característica fundamental da abordagem não-diferenciável é que a dimensão de incertezas escalares repetidas na matriz estruturada de incertezas parece ter pequeno impacto no tempo computacional global. 1.2 ORGANIZAÇÃO DA DISSERTAÇÃO Além dessa introdução, a dissertação está organizada em mais 4 capítulos: • Capítulo 2: São abordados os aspectos da teoria de controle robusto utilizados na análise de robustez de sistemas incertos. É proposta uma formulação geral para o tratamento das incertezas. A ideia principal é reuní-las em uma matriz blocodiagonal, dando origem a um bloco de incertezas ∆ estruturado. Em seguida é definida a grandeza µ, ferramenta que permite, no domínio da frequência, medir a robustez de sistemas incertos com ∆ estruturado. É proposta uma estratégia baseada em otimização não-diferenciável para o cálculo direto de limitantes inferiores para µ. São apresentados, ainda, testes para análise de estabilidade e desempenho robustos que consistem, sumariamente, em realizar uma pesquisa do valor de pico de µ em todo o domínio de frequência. Nesse capítulo, também é definida a grandeza ν. Uma estratégia similar à primeira é adotada para obtenção de limitantes inferiores para ν. Por fim, é apresentada uma abordagem por espaço de estados que permite eliminar a pesquisa frequencial, tratando a frequência como um parâmetro incerto. • Capítulo 3: São apresentados elementos de otimização não-diferenciável e é discutido como a obtenção de limitantes inferiores para µ e ν pode ser realizada através de eficientes programas de otimização não-convexa, não-diferenciável com restrição. Cabe ressaltar aqui que a implementação do algoritmo não foi objetivo desse trabalho, mas sim a sua aplicação em diversos problemas de controle. • Capítulo 4: São realizados extensivos testes numéricos onde o valor prático da técnica proposta é avaliado. Os resultados obtidos são comparados com os obtidos pelas técnicas mais populares disponíveis atualmente. • Capítulo 5: Finalmente, nesse capítulo, são apresentadas as conclusões do trabalho e as perspectivas de estudos futuros. 20 2 ANÁLISE DE ROBUSTEZ 2.1 CARACTERIZAÇÃO DAS INCERTEZAS A maioria dos projetos de controle é baseada no uso de modelos que aproximam um determinado sistema físico. A relação entre os modelos e a realidade que eles representam é sutil e complexa. Um modelo matemático fornece um mapa de entradas e respostas e sua qualidade depende de quão perto essas respostas estão daquelas fornecidas pela planta verdadeira. Nenhum modelo único é capaz de traduzir o comportamento da planta verdadeira, precisa-se, no mínimo, de um conjunto de mapas. Obter um conjunto de modelos que contenha a planta verdadeira é uma tarefa bastante difícil, tendo em vista que, o universo matemático é diferente do universo de sistemas físicos. Um bom modelo deve ser simples o suficiente para facilitar sua concepção e complexo o suficiente para garantir sua aplicabilidade ao sistema real. O termo incertezas refere-se às diferenças ou erros entre os modelos e a realidade e qualquer mecanismo usado para expressar esses erros é chamado de representação de incertezas. As incertezas podem ter várias origens: • Possibilidade de haver parâmetros do modelo linear que são conhecidos apenas aproximadamente ou com erro. • Variação dos parâmetros devido à não-linearidade ou mudança do ponto de operação. • Imperfeições nos sensores. • Em altas frequências, a estrutura e a ordem do modelo são desconhecidos. • Mesmo quando um modelo bastante detalhado está disponível, pode-se optar em utilizar um modelo mais simples, porém tratável computacionalmente. As dinâmicas negligenciadas então são representadas como incertezas. Os vários tipos de incertezas do modelo podem ser agrupados em duas classes principais: 21 a) Incerteza paramétrica: A estrutura do modelo, incluindo sua ordem, é conhecida, mas alguns parâmetros são incertos. b) Dinâmicas não modeladas ou negligenciadas: O modelo utilizado não é preciso devido ao desconhecimento de sua dinâmica, geralmente em altas frequências, à negligências deliberadas ou por falta de compreensão do processo físico. Qualquer modelo de um sistema real, invariavelmente, irá conter essa fonte de incerteza. Incertezas paramétricas podem ser quantificadas a partir de um valor nominal p0 e de uma ponderação α que determina a faixa de variação. Desta maneira, tem-se conjuntos de parâmetros com a seguinte forma: pp = p0 + αδp0 (2.1) onde δ é um escalar real satisfazendo |δ| ≤ 1. Dinâmicas não modeladas ou negligenciadas são menos precisas e mais difíceis de serem quantificadas. Uma abordagem válida para descrever essa classe de incertezas é o domínio da frequência, que dá origem a perturbações complexas normalizadas k∆(s)k∞ ≤ 1. Pode ser considerada, ainda, uma terceira classe, que consiste em uma ou mais fontes de incertezas paramétricas e/ou dinâmicas não modeladas/negligenciadas reunidas em uma única incerteza concentrada. Como exemplos para essa classe podem ser citadas as incertezas multiplicativas. A FIG. 2.1 ilustra uma incerteza multiplicativa de entrada. FIG. 2.1: Incerteza multiplicativa de entrada O conjunto de plantas incertas gerado tem a seguinte forma: ΠI : Gp (s) = G(s)(I + WI (s)∆I (s)), onde WI (s) representa a ponderação. 22 |∆I (jω)| ≤ 1 ∀ω (2.2) 2.2 QUADRO DE TRABALHO PARA A ANÁLISE DE ROBUSTEZ 2.2.1 REPRESENTAÇÃO DE INCERTEZAS O ponto de partida para a análise de robustez é a definição de uma forma padrão para representar os sistemas incertos, na qual todas as incertezas que os afetam são isoladas em uma matriz bloco-diagonal, chamada de bloco de incertezas ∆: ∆1 ... ∆= , ∆ i .. . (2.3) onde cada bloco ∆i pode representar uma fonte específica de incerteza, como, por exemplo, incerteza de entrada, ∆I , ou incerteza paramétrica, δi , onde δi é real. Define-se uma estrutura geral para o bloco de incertezas utilizando-se a seguinte notação padrão: c C r I ∆ = ∆ = diag(δ1r Ik1 , . . . , δm I , δm , . . . , δ1c Ikmr +mc , ∆C 1 , . . . , ∆mC ) r +1 kmr +1 r k mr kmr +mc +i ×kmr +mc +i : δir ∈ R, δic ∈ C, ∆C i ∈ C . (2.4) Tipicamente, os escalares reais δir representam incertezas paramétricas, enquanto que os escalares complexos δic e os blocos complexos cheios ∆C i representam dinâmicas não modeladas ou negligenciadas. Os inteiros mr , mc and mC denotam o número de escalares reais repetidos, escalares complexos repetidos e blocos complexos cheios, respectivamente. O bloco de incertezas ∆ é dito complexo se é composto somente por escalares complexos ou blocos complexos cheios. É dito real se é composto somente por escalares reais. Finalmente, se possui simultaneamente incertezas complexas e reais é dito misto. Se o objetivo é a análise de robustez em estabilidade, utiliza-se a estrutura M ∆ (FIG. 2.2 para representar o sistema incerto, onde M (s) representa o sistema nominal. 23 FIG. 2.2: Estrutura M ∆ para análise de robustez em estabilidade Alternativamente, se o objetivo é a análise de robustez em desempenho utiliza-se a estrutura N ∆ mostrada na FIG. 2.3. FIG. 2.3: Estrutura N ∆ para análise de robustez em desempenho A Função de Transferência de w para z do sistema em malha fechada é dada pela Transformação Fracional Linear (LFT, do inglês Linear Fractional Transformation)(Seção 7.1 do Apêndice) superior entre N e ∆, z = Fu (N, ∆)w = N22 + N21 ∆(I − N11 ∆)−1 N12 w. (2.5) N (s) normalmente é obtido a partir da LFT inferior envolvendo a planta generalizada P (SKOGESTAD, 2005) e um controlador K, " N (s) = Fl (P (s), K(s)) = N11 (s) N12 (s) # . (2.6) N21 (s) N22 (s) A FIG. 2.4 ilustra a forma padrão mais geral, envolvendo P , um controlador K e o bloco de incertezas ∆: 24 FIG. 2.4: Forma padrão para síntese de controladores com, P11 (s) P12 (s) P13 (s) . P (s) = P (s) P (s) P (s) 21 22 23 P31 (s) P32 (s) P33 (s) (2.7) Para se estabelecer as condições de robustez, cada incerteza individual será considerada normalizada, ou seja: σ (∆i (jω)) ≤ 1 ∀ω; |δi | ≤ 1. (2.8) Como o maior valor singular de uma matriz bloco-diagonal é igual ao máximo entre os maiores valores singulares dos blocos individuais (Seção 7.3), então o bloco geral de incertezas também será normalizado: σ (∆(jω)) ≤ 1 ∀ω ⇔ k∆k∞ ≤ 1. (2.9) No quadro de trabalho proposto, ∆ possui uma estrutura definida. Portanto, as condições de estabilidade e desempenho robustos serão estabelecidas para um subconjunto que possua a estrutura dada pela EQ. 2.4 que satisfaça a EQ. 2.9. A hipótese de considerar ∆ estável pode ser relaxada, mas as condições de robustez tornam-se mais difíceis de serem obtidas. Além disso, se for usada a forma correta para representar as incertezas e se for permitida a ocorrência de incertezas múltiplas, sempre será possível gerar a classe de plantas desejada utilizando-se somente incertezas estáveis. 2.2.2 DEFINIÇÕES DE ESTABILIDADE E DESEMPENHO ROBUSTOS Foi discutido na Seção 2.2.1 como representar um sistema incerto através da estrutura N ∆ (FIG. 2.3). O próximo passo da análise é verificar se o sistema possui, sob influência 25 das incertezas, estabilidade e desempenho aceitável. • Análise de estabilidade robusta: Consiste em determinar se um dado sistema incerto permanece estável para todo ∆ permitido. • Análise de desempenho robusto: Se há estabilidade robusta, determina-se o maior "tamanho"da função de transferência que relaciona as entradas exógenas w com as saídas exógenas z para todo ∆ permitido. Na FIG. 2.3, w representa as entradas exógenas (por exemplo, distúrbios e referências normalizados) e z representa as saídas exógenas (por exemplo, erros normalizados). A Função de Transferência de w para z é dada pela EQ. 2.5, z = F w, onde F , Fu (N, ∆) = N22 + N21 ∆(I − N11 ∆)−1 N12 . (2.10) Será usada a norma H∞ para medir o desempenho. A condição para que se tenha desempenho robusto é kF k∞ ≤ 1, ∀ ∆ permitido. Na estrutura N ∆, as condições de estabilidade e desempenho podem então ser resumidas como se segue: Estabilidade Nominal (EN) ⇔ N é internamente estável Desempenho Nominal (DN) ⇔ kN22 k∞ < 1; Estabilidade Robusta (ER) ⇔ F (2.11) e EN (2.12) é estável ∀∆, k∆k∞ ≤ 1; Desempenho Robusto (DR) ⇔ kF k∞ < 1, ∀∆, k∆k∞ ≤ 1; e EN e EN (2.13) (2.14) 2.2.3 ESTABILIDADE ROBUSTA NA ESTRUTURA M ∆ Considere, em princípio, a estrutura N ∆ (FIG. 2.3) para representar um determinado sistema incerto. A Função de Transferência de w para z é dada pela EQ. 2.10. Suponha que o sistema possui estabilidade nominal (com ∆ = 0), o que significa dizer que todo N é estável e não somente N22 . Suponha também que ∆ é estável. Da análise direta da EQ. 2.10 observa-se que a única fonte possível de instabilidade é o termo (I − N11 ∆)−1 . Então, a estrutura M ∆ (FIG. 2.2) pode ser utilizada para verificar a estabilidade do sistema, fazendo M = N11 . O próximo passo, portanto, é reunir as condições necessárias para se verificar a estabilidade da estrutura M ∆. O teorema que segue deriva do Teorema de Nyquist Generalizado 26 (Seção 7.4) e é aplicado para os blocos de incertezas ∆, com norma H∞ limitada, mas também pode ser aplicado para qualquer outro conjunto convexo de incertezas (isto é, conjuntos com outras estruturas ou limitados com outros tipos de norma) Teorema 2.1 (Condição de estabilidade do determinante (SKOGESTAD, 2005)). Assuma que o sistema nominal M (s) e o bloco das incertezas ∆(s) são estáveis. Considere o conjunto convexo de incertezas ∆ de tal forma que, se ∆0 é permitido, então c∆0 também é, onde c é um escalar real qualquer, tal que |c| ≤ 1. Então, o sistema M ∆ da FIG. 2.2 é estável para todo ∆ permitido (ER) se e somente se: O diagrama de Nyquist de det (I − M ∆(s)) não envolve a origem, ∀∆ (2.15) ⇔ det (I − M ∆(jω)) 6= 0, ∀ω, ∀∆ (2.16) ⇔ λi (M ∆) 6= 1, ∀i, ∀ω, ∀∆ (2.17) Demonstração. A condição dada pela EQ. 2.15 é simplesmente a aplicação do Teorema de Nyquist Generalizado a um sistema com realimentação positiva e com função de transferência igual a M ∆. (2.15) ⇒ (2.16): Esta implicação é trivial, uma vez que se o diagrama passar pela origem, obviamente esta estará sendo envolvida. (2.15) ⇐ (2.16): Basta provar que a negação de (2.15) implica na negação de (2.16). Primeiramente nota-se que para ∆ = 0, det(I − M ∆) = 1 para todas as frequências. Assuma que exista uma perturbação ∆0 tal que o diagrama de Nyquist de det(I − M ∆0 ) envolva a origem. Como o contorno de Nyquist é fechado, então existe uma outra perturbação ∆00 = c∆0 com c ∈ [0, 1] e uma frequência ω 0 tal que det(I − M ∆”(jω 0 )) = 0. Q (2.17) é equivalente a (2.16) pelas propriedades: det(I−A) = i λi (I−A) e λi (I−A) = 1 − λi (A) (Seção 7.2). 2.3 VALOR SINGULAR ESTRUTURADO O valor singular estruturado µ é uma grandeza que mede a robustez de sistemas incertos sujeitos a um bloco de incertezas ∆ com estrutura definida. A sua aplicação pode fornecer condições necessárias e suficientes tanto para estabilidade quanto para desempenho robustos. 27 Seja a estrutura M ∆ mostrada na FIG. 2.2. Da condição de estabilidade do determinante ( EQ. 2.16) tem-se que: ER ⇔ det (I − M ∆(jω)) 6= 0, ∀ω, ∀∆, σ(∆(jω)) ≤ 1, ∀ω (2.18) A motivação para a definição da grandeza µ é responder a seguinte questão: Dada uma matriz M ∈ Cp×q , qual é o menor ∆ ∈ Cq×p (medido através do maior valor singular σ(∆) (Seção 7.3)) tal que det(I − M ∆) = 0, ou seja, qual o menor ∆ que leva o sistema à instabilidade? Definição 2.1 (Valor singular estruturado µ). Seja a matriz complexa M o valor da matriz de transferência M (s) em s = jω e, de maneira semelhante, seja ∆ o valor de ∆(s) em s = jω. O valor singular estruturado µ(M ) é definido como: −1 µ(M ) = min {σ(∆) | det (I − ∆M ) = 0} , ∆∈∆ (2.19) com µ(M ) = 0 se não existe ∆ ∈ ∆ tal que det (I − ∆M ) = 0. É importante notar que o valor de µ(M ) depende da estrutura de ∆. Isso às vezes é mostrado explicitamente usando-se a notação µ∆ (M ). O valor de µ = 1 significa que existe um ∆ com σ(∆) = 1 que torna a matriz (I − ∆M ) singular. Valores elevados de µ indicam pouca robustez, pois significa dizer que existe uma pequena incerteza que torna (I − ∆M ) singular. Inversamente, valores reduzidos de µ indicam boa robustez. Nesse trabalho propõe-se o cálculo direto de um limitante inferior para µ. Assuma momentaneamente que µ(M ) 6= 0 para um dado M . Considere, então, a seguinte estratégia para se calcular µ(M ) inspirada pela própria definição dada pela EQ. 2.19. Primeiramente, o programa de otimização com restrição abaixo é resolvido: minimize σ(∆) ∆∈∆ sujeito a (2.20) det (I − ∆M ) = 0 . Se ∆0 é uma solução factível para (2.20) minimizando σ(·), então pode-se facilmente calcular µ(M ) = σ(∆0 ) −1 . Se, porém, nenhuma solução factível é encontrada, então estabelece-se µ(M ) = 0. Se por um lado a abordagem acima soa natural, por outro lado solucionar (2.20) representa uma difícil tarefa. De fato, trata-se de um programa de otimização com função objetivo não-diferenciável e com uma restrição de igualdade que destrói sua convexidade. 28 Na Seção 3.2, é apresentada uma técnica de otimização não-diferenciável que permite resolver eficientemente (2.20). O algoritmo não-diferenciável é dotado de certificado de convergência global e de otimalidade local. Otimalidade local significa que se ∆0 é uma solução factível para (2.20), então ∆0 é um minimizador local de σ(·). Consequentemente, σ(∆0 ) −1 representa um limitante inferior para µ(M ). Uma vez que a abordagem proposta baseia-se em uma técnica de otimização local, a seleção do ponto inicial pode impactar o resultado, eventualmente resultando em um limitante inferior mais conservador. Apesar dessa possível limitação, exemplos numéricos como os apresentados no Capítulo 4 confirmam o grande interesse prático da técnica. De fato, em algumas aplicações desafiadoras a técnica não-diferenciável proposta produz limitantes inferiores que são menos conservadores do que os fornecidos pelas técnicas atuais. Graças à eficiência da técnica de otimização não-diferenciável, o método proposto pode ser aplicado mesmo em problemas com um número moderado de incertezas. A experiência também tende a indicar que a inicialização do algoritmo não-diferenciável não é crítica e que ela pode ser facilmente complementada por estratégias de múltiploscomeços. A seguir, serão listadas algumas propriedades importantes de µ que são úteis no desenvolvimento desse trabalho. As duas propriedades abaixo valem para todas as classes de perturbações (reais, complexas ou mistas): • µ(αM ) = |α| µ(M ) para qualquer escalar α real. • Seja ∆ = diag {∆1 , ∆2 } um conjunto de perturbações organizadas em uma matriz bloco diagonal. Considere a partição da matriz M de acordo com as dimensões de ∆1 e ∆2 : " M= M11 M12 # (2.21) M21 M22 Então: µ∆ (M ) ≥ max {µ∆1 (M11 ), µ∆2 (M22 )} (2.22) Esse último resultado mostra que as características de robustez em estabilidade, em relação a um conjunto de incertezas, são tão ruins ou piores do que em relação à qualquer uma das incertezas isoladas. 29 As próximas propriedades listadas valem somente para incertezas complexas e permitem estabelecer limites para µ: • Para incerteza complexa escalar repetida, ∆ = δI com δ ∈ C, µ(M ) = ρ(M ). • Para incerteza complexa cheia, ∆ = Cn×n (incerteza não estruturada), µ(M ) = σ(M ). Conclui-se, então, que: ρ(M ) ≤ µ(M ) ≤ σ(M ). (2.23) Outras propriedades de µ, tais como o refinamento dos seus limites, e as provas das propriedades listadas podem ser encontradas em (SKOGESTAD, 2005). 2.3.1 ESTABILIDADE ROBUSTA PARA BLOCO DE INCERTEZAS DIAGONAL A combinação da condição dada pela EQ. 2.18 com a definição de µ fornece uma condição necessária e suficiente para que haja estabilidade robusta. O teorema a seguir dá origem ao uso mais comum de µ, como um teste de robustez no domínio da frequência. Teorema 2.2 (Estabilidade robusta para bloco de incertezas diagonal (SKOGESTAD, 2005)). Assuma que o sistema nominal M (s) e o bloco de incertezas ∆(s) são estáveis. Então, a estrutura M ∆ (FIG. 2.2) é estável para todo ∆ ∈ ∆, com σ(∆) ≤ 1, ∀ω, se e somente se, µ(M (jω)) < 1, ∀ω. (2.24) Demonstração. Se µ(M ) < 1 para todas as frequências, então σ(∆) > 1 para a menor incerteza tal que det(I − ∆M ) = 0, como os ∆’s permitidos são limitados em norma, σ(∆) ≤ 1, ∀ω, então o sistema é estável. Por outro lado, se µ(M ) ≥ 1 para alguma frequência, então existe um ∆ com σ(∆) ≤ 1 tal que det(I − ∆M ) = 0. Este teorema indica que é possível avaliar as propriedades de robustez em estabilidade de um sistema em malha fechada pesquisando o valor de µ em todo domínio de frequência. O valor de pico de µ determina o tamanho máximo admissível de incerteza para a qual garante-se que o sistema em malha fechada mantém-se estável. Entretanto, a varredura de todo o domínio de frequência pode ter um alto custo computacional. Na prática, é estabelecida uma grade de frequências dentro de uma faixa apropriada. O inconveniente 30 dessa abordagem é que corre-se o risco de perder pontos importantes se a grade não for suficientemente densa, sobretudo porque em alguns casos µ pode ser descontínuo (YOUNG, 2001). 2.4 VALOR SINGULAR ESTRUTURADO OBLÍQUO Para explicar de maneira sucinta o conceito do valor singular estruturado oblíquo ν, considere um valor de µ = 1, 1 em um problema de estabilidade robusta. Isso significa que todas as incertezas do sistema devem ser diminuídas em magnitude por um fator de 1,1 para que se garanta a estabilidade. Mas se o desejo é fixar a faixa de variação de algumas incertezas, então o quão grande podem ser as outras incertezas antes que a instabilidade ocorra? Este valor que quantifica o quão grandes essas fontes podem ser é definido como ν. A descrição matemática de ν é semelhante à de µ e é desenvolvida em relação à estrutura M ∆ (FIG. 2.2). O bloco de incertezas ∆ é dividido em dois sub-blocos, ∆f (bloco contendo as incertezas com faixa de variação fixa) e ∆v (bloco contendo as incertezas com faixa de variação livre) (FIG. 2.5). FIG. 2.5: Estrutura M ∆ particionada para análise ν Sejam ∆f e ∆v com a mesma estrutura geral de ∆ (EQ. 2.4). A matriz de transferência M é particionada de acordo com as dimensões de ∆f e ∆v . Como ∆f será limitado em norma, define-se uma nova estrutura de bloco: B∆f = {∆f ∈ ∆f : σ(∆f ) ≤ 1} 31 (2.25) A partir dessas considerações, é possível definir uma nova estrutura geral para o bloco de incertezas que será utilizado no cálculo de ν: ∆c = {∆c = diag(∆f , ∆v ) : ∆f ∈ B∆f , ∆v ∈ ∆v } (2.26) Definição 2.2 (Valor singular estruturado oblíquo ν). Seja a matriz complexa M o valor da matriz de transferência M (s) em s = jω e, de maneira semelhante, seja ∆c o valor de ∆c (s) em s = jω. O valor singular estruturado oblíquo ν(M ) é definido como: ν(M ) = −1 min {σ(∆v ) | det (I − ∆c M ) = 0} ∆c ∈∆c (2.27) com ν(M ) = 0 se não existe ∆c ∈ ∆c tal que det (I − ∆c M ) = 0. De maneira semelhante ao cálculo de µ, propõe-se o cálculo direto de um limitante inferior para ν. Agora, assuma momentaneamente que ν(M ) 6= 0 para um dado M . Considere, então, a seguinte estratégia para se calcular ν(M ) inspirada pela própria definição dada pela EQ. 2.27. Primeiramente, o programa de otimização com restrição abaixo é resolvido: minimize ∆f ∈∆f ,∆v ∈∆v sujeito a σ(∆v ) σ(∆f ) ≤ 1, (2.28) det (I − diag(∆f , ∆v )M ) = 0 . Note que a restrição de desigualdade existente em (2.28) garante que ∆f ∈ B∆f . Logo, se (∆0f , ∆0v ) é uma solução factível para (2.28) minimizando σ(∆v ), então pode-se facilmente calcular ν(M ) = σ(∆0v ) −1 . Se, porém, nenhuma solução factível é encontrada, então estabelece-se ν(M ) = 0. Na Seção 3.2, é apresentada uma técnica de otimização não-diferenciável que permite resolver eficientemente o programa (2.28). As características de não-diferenciabilidade, convergência global e otimalidade local presentes na obtenção de µ permanecem nesse caso. 2.5 DESEMPENHO ROBUSTO Muitas vezes, a estabilidade robusta não é a única propriedade que precisa ser avaliada em um sistema em malha fechada. Normalmente, existem distúrbios exógenos que atuam 32 sobre o sistema, que sob influência das incertezas podem acarretar erros de monitoramento e regulação. Na maioria dos casos, muito antes do início da instabilidade, o desempenho em malha fechada pode degradar-se ao ponto de atingir níveis inaceitáveis. Diante disso, surge a necessidade de realizar um teste de desempenho robusto que tenha como objetivo obter o pior caso de degradação de desempenho, associado a um determinado nível de incertezas. 2.5.1 TESTE-µ PARA DESEMPENHO ROBUSTO Primeiramente será apresentado o Teorema Principal de Malha (Main Loop Theorem) (PACKARD, 1993a), que é base para o teste proposto. Teorema 2.3 (Teorema Principal de Malha (PACKARD, 1993a)). Seja G a matriz complexa particionada da seguinte maneira: " G= G11 G12 # . G21 G22 Suponha que existam 2 blocos com a estrutura diagonal definida pela EQ. 2.4, ∆1 e ∆2 , que são compatíveis com as dimensões de G11 e G12 , respectivamente. Define-se, então, ˆ da seguinte maneira: a estrutura ∆ " # ∆ 0 1 ˆ = ∆ , ∆1 ∈ ∆1 , ∆2 ∈ ∆2 . (2.29) 0 ∆2 ˆ que é similar à estrutura M ∆ (FIG. 2.2) : Desta forma, obtém-se a estrutura G∆, ˆ FIG. 2.6: Estrutura G∆ O Teorema Principal de Malha diz que: µ∆1 (G11 ) < 1, e µ∆ˆ (G) < 1 ⇔ µ (F (G, ∆ )) < 1, ∆2 u 1 33 (2.30) com σ(∆1 ) ≤ 1. ˆ = (⇒) Considere ∆i ∈ ∆i tal que σ(∆i ) ≤ 1 e assuma que ∆ ˆ e σ(∆) ˆ ∈∆ ˆ ≤ 1 . Então, diag(∆1 , ∆2 ), obviamente ∆ " # I − G −G 11 ∆1 12 ∆2 ˆ = det det(I − G∆) . (2.31) −G21 ∆1 I − G22 ∆2 Demonstração. Por hipótese (I − G11 ∆1 ) é não-singular, então utilizando a fórmula de Schur (Seção 7.5) é possível reescrever a EQ. 2.31 como: ˆ = det(I − G11 ∆1 ) det(I − G22 ∆2 − G21 ∆1 (I − G11 ∆1 )−1 G12 ∆2 ) det(I − G∆) = det(I − G11 ∆1 ) det(I − (G22 + G21 ∆1 (I − G11 ∆1 )−1 G12 )∆2 ).(2.32) Agora escreve-se a EQ. 2.32 em função de Fu (G, ∆1 ): ˆ = det(I − G11 ∆1 ) det(I − Fu (G, ∆1 )∆2 ). det(I − G∆) (2.33) Também por hipótese, µ∆2 (Fu (G, ∆1 )) < 1 com σ(∆1 ) ≤ 1, o que significa dizer que ˆ é não-singular e pela (I − Fu (G, ∆1 )∆2 ) é não-singular. Conclui-se, então, que (I − G∆) definição de µ, µ∆ˆ (G) < 1. (⇐) Basicamente, o argumento acima é invertido. Novamente considere ∆i ∈ ∆i tal ˆ com σ(∆) ˆ = diag(∆1 , ∆2 ). Então, ∆ ˆ ∈ ∆ ˆ ≤ 1. Por que σ(∆i ) ≤ 1 e assuma que ∆ ˆ 6= 0. De acordo com a propriedade de µ dada pela EQ. 2.22: hipótese, det(I − G∆) µ∆ˆ (G) ≥ max {µ∆1 (G11 ), µ∆2 (G22 )} , (2.34) pode-se afirmar que µ∆1 (G11 ) < 1, o que significa dizer que (I − G11 ∆1 ) é não-singular. Voltando à EQ. 2.33 conclui-se que: ˆ 6= 0. det(I − G11 ∆1 ) det(I − Fu (G, ∆1 )∆2 ) = det(I − G∆) Obviamente, (I − Fu (G, ∆1 )∆2 ) também é não-singular para ∆i ∈ ∆i com σ(∆i ) ≤ 1, o que indica que a afirmação é verdadeira. Conforme discutido na Seção 2.2.2, para um sistema nominalmente estável, a condição de DR é dada por: DR ⇔ kF k∞ < 1, ∀∆, k∆k∞ ≤ 1, (2.35) onde F = Fu (N, ∆) representa a transferência de w para z da estrutura N ∆ (FIG. 2.3). O DR pode ser tratado como um caso especial de ER com a criação de um bloco fictício de incertezas ∆p para representar as especificações de desempenho H∞ (FIG. 2.7), onde ∆p é uma matriz complexa cheia com as mesmas dimensões de F T . 34 FIG. 2.7: ∆p incluso na estrutura N ∆ Define-se, então, o bloco de incertezas aumentado " # ∆ 0 ˆ = ∆ , 0 ∆p (2.36) ˆ dando origem a estrutura N ∆: ˆ FIG. 2.8: Estrutura N ∆ O problema de DR original equivale ao problema de ER da estrutura aumentada, como indicado pelo teorema a seguir: Teorema 2.4 (Desempenho robusto). Assuma que um dado sistema nominalmente estável seja representado pela estrutura N ∆. O sistema é internamente estável e kFu (N, ∆)k∞ < 1, ∀∆, k∆k∞ ≤ 1 (DR), se e somente se µ∆ˆ (N (jω)) < 1, 35 ∀ω (2.37) Demonstração. Será mostrado que trata-se de um caso particular do Teorema Principal de Malha. Deixe o teorema ser reescrito como: µ∆ (N11 (jω)) < 1, ∀ω (estabilidade interna) e µ∆ˆ (N (jω)) < 1, ∀ω ⇔ kF (N, ∆)k < 1, ∀∆, com k∆k ≤ 1. u ∞ (2.38) ∞ Para uma frequência dada pode-se afirmar que: µ∆ (N11 ) < 1, e µ∆ˆ (N ) < 1 ⇔ (2.39) σ(F (N, ∆)) < 1, u com σ(∆) ≤ 1. Por hipótese, ∆p foi definido como um bloco complexo cheio. Então, de acordo com a propriedade discutida na Seção 2.3, tem-se a seguinte igualdade: µ∆p (Fu (N, ∆)) = σ(Fu (N, ∆)). Logo, a EQ. 2.39 pode ser reescrita como: µ∆ (N11 ) < 1, e µ∆ˆ (N ) < 1 ⇔ µ (F (N, ∆)) < 1, ∆p u (2.40) com σ(∆) ≤ 1, o que representa um caso particular do Teorema Principal de Malha com N = G, ∆ = ∆1 e ∆p = ∆2 Observações: • A condição dada pelo TEO. 2.4 permite testar se kF k∞ < 1 para todos os ∆0 s possíveis sem ter que testar cada ∆ individualmente. Essencialmente, µ é definido tal que o pior caso seja considerado. • ∆p tem que ser um bloco complexo cheio. Com essa hipótese, no caso nominal (∆ = 0) µ∆ˆ (N ) = µ∆p (N22 ) = σ(N22 ). Se µ∆ˆ (N ) < 1, ∀ω, então σ(N22 ) < 1, ∀ω, o que representa a condição de DN (kN22 k∞ < 1). ˆ sempre possui estrutura, o uso da norma H∞ , kN k < 1, geralmente • Uma vez que ∆ ∞ é conservador para análise de DR. 36 • De acordo com as propriedades de µ discutidas na Seção 2.3, pode-se afirmar que: (2.41) µ∆ˆ (N ) ≥ max µ∆ (N11 ), µ∆p (N22 ) | {z } | {z } | {z } ER DR DN ou seja, DR implica em ER e DN, em sistemas com EN. A condição dada pelo TEO. 2.4 fornece um teste para desempenho robusto (kF k∞ < 1, ∀∆, k∆k∞ ≤ 1) mas não permite determinar o chamado pior caso de desempenho, associado à seguinte pergunta: qual será o maior valor de ganho da transferência F levando-se em conta todas as incertezas admissíveis (k∆k∞ ≤ 1)? Note que um valor de µ∆ˆ (N ) = 0, 8 corresponde a uma incerteza ∆ com σ(∆) = 1, 25(1/0, 8), o que significa que a restrição não foi saturada, e que, consequentemente, ainda há margem para degradação do valor do ganho da transferência F . O pior caso de ganho pode ser obtido resolvendo um problema ν, com restrição de variação para ∆. A solução desse problema provavelmente levará à saturação da restrição. Note também que a condição de desempenho robusto pode ser inferida a partir da informação do pior caso de desempenho. Significa então dizer que a condição de DR pode ser testada alternativamente por: DR ⇔ ν∆c (N (jω)) < 1, ∀ω (2.42) ˆ ∆f = ∆ e ∆v = ∆p . com ∆c = ∆, 2.6 ANÁLISE µ POR ESPAÇO DE ESTADOS Conforme discutido na Seção 2.3.1, a pesquisa do valor de pico de µ em todo domínio de frequência pode ter um alto custo computacional. Na prática é estabelecida uma grade de frequências dentro de uma faixa previamente escolhida. No entanto, essa medida pode ocasionar a perda de pontos importantes se a grade não for suficientemente densa. A abordagem por espaço de estados permite eliminar tal pesquisa frequencial. A idéia é representar a transferência M (s) da estrutura M ∆ (FIG. 2.2) como uma LFT de uma matriz constante em relação à variável frequência. A frequência passa então a ser enxergada como um parâmetro incerto real, variando dentro de um intervalo previamente escolhido (ω ∈ [ω, ω]), e é incluída no bloco das incertezas. Considere a representação em espaço de estados para representar a função de transferência nominal, isto é, M (s) = C(sIp − A)−1 B + D, com A ∈ Rp×p . Fazendo s = jω, 37 M (jω) pode ser representada pela seguinte expressão (SIDERIS, 1992), M (jω) = C(jωIp − A)−1 B + D = Fu (M̂ , ωIp ) (2.43) onde M̂ é constante, " M̂ = jA−1 A−1 B # −jCA−1 −CA−1 B + D . (2.44) Seja a frequência quantificada por: ω = ω 0 + α ω δω , δω ∈ [−1, 1] (2.45) com ω0 = (ω + ω)/2, (2.46) αω = (ω − ω)/2. (2.47) e A EQ. 2.43 pode ser reescrita por: M (jω) = C(jωIp − A)−1 B + D = C[j(ω0 + αω δω )Ip − A]−1 B + D = C[j(αω δω )Ip − (A − jω0 Ip )]−1 B + D, (2.48) seja a matriz A1 definida como: A1 = A − jω0 Ip , (2.49) M (jω) = C[j(αω δω )Ip − A1 ]−1 B + D = Fu (M̂ (ω0 ), (αω δω )Ip ), (2.50) então onde " M̂ (ω0 ) = jA−1 1 A−1 1 B −CA−1 −jCA−1 1 1 B +D # . (2.51) Passando αω para M̂ (ω0 ) obtém-se: M (jω) = Fu (M̂1 (ω0 , αω ), δω Ip ), (2.52) onde " M̂1 (ω0 , αω ) = jA−1 1 αω A−1 1 B −1 −jCA−1 1 αω −CA1 B + D 38 # . (2.53) Reescrevendo a transferência nominal M (jω) com a expressão (2.52) é possível incluir δω Ip no bloco das incertezas. Conforme ilustrado pela FIG. 2.9, é definida uma perturbação aumentada, ∆aum = diag(δω Ip , ∆), de tal forma que M̂1 (ω0 , αω ) passe a desempenhar o papel do sistema nominal. FIG. 2.9: Teste µ - espaço de estados A condição de estabilidade robusta é dada pelo seguinte teorema : Teorema 2.5 (Teste em intervalo de frequência). Suponha que M (s) possui todos os seus pólos no semiplano aberto da esquerda (isto é, estabilidade nominal). Seja a representação mínima por espaço de estados de M (s) dada por: M (s) = C(sIp − A)−1 B + D (2.54) Dado ∆ compatível com M (s), define-se uma nova estrutura para o bloco de incertezas ∆aum como: ∆aum = {diag(δω Ip , ∆) : δω ∈ R, ∆ ∈ ∆} (2.55) Então, ∀ ∆ ∈ ∆ com k∆k∞ ≤ 1, o sistema em malha fechada mostrado na FIG. 2.9 é estável se e somente se, µ∆aum (M̂1 (ω0 , αω )) < 1 (2.56) A formulação dada pelo TEO. 2.5 fornece um teste µ para a análise de robustez em estabilidade. Isto pode ser melhorado reformulando o problema com a técnica ν. 39 Uma vez que δω é considerado dentro do intervalo real [−1, 1], a condição dada pela EQ. 2.56 pode ser reescrita como um problema ν. A condição de estabilidade robusta é então dada por: ν∆c (M̂1 (ω0 , αω )) < 1, (2.57) com ∆c = ∆aum , ∆f = δω Ip e ∆v = ∆. A abordagem por espaço de estados pode ser facilmente estendida para um problema originalmente ν, considerando ∆c = ∆aum , ∆f = diag(δω Ip , ∆0f ) e ∆v = ∆0v , com ∆0f e ∆0v representando, respectivamente, as incertezas com faixa de variação restringida e não-restringida do problema original. É possível ainda, obter a incerteza desestabilizante e o valor do parâmetro δω que carrega a informação de frequência. Com δω é possível determinar o valor da frequência crítica para o intervalo de variação considerado: ωc = ω0 + αω δω . 40 (2.58) 3 ELEMENTOS DE OTIMIZAÇÃO NÃO-DIFERENCIÁVEL 3.1 ANÁLISE NÃO-DIFERENCIÁVEL As noções apresentadas nesta seção são discutidas em profundidade em (CLARKE, 1983) (POLAK, 1987) (HIRIART-URRUTY, 1993) (POLAK, 1997). 3.1.1 INTRODUCÃO Denote por B(x, r) a bola aberta de centro x ∈ Rn e raio r > 0, definida por B(x, r) , {y ∈ Rn : ky − xk < r} . Comecemos pela definição de funções Lipschitz contínuas. Definição 3.1. Uma função f : Rn 7→ R é dita Lipschitz contínua sobre S ⊂ Rn se existe uma constante L > 0 tal que, para todo y, z ∈ S, |f (y) − f (z)| ≤ Lky − zk. (3.1) A função f é dita localmente Lipschitz contínua em x ∈ Rn se existe um real positivo > 0 tal que f é Lipschitz contínua sobre B(x, ). Uma função Lipschitz contínua em x apresenta, assim, uma taxa de crescimento que é limitada em uma vizinhança de x. Por outro lado, uma função localmente Lipschitz contínua em x não é necessariamente diferenciável em x. Definição 3.2. A função f : Rn 7→ R admite uma derivada direcional em x ∈ Rn na direção d ∈ Rn se o limite f (x + td) − f (x) t→0 t lim (3.2) t>0 existe e é finito. Neste caso, a derivada direcional é representada por f 0 (x, d). Uma função f diferenciável em x admite derivadas direcionais em todas as direções d e, além disso, tem-se que f 0 (x, d) = ∇f (x)T d. A recíproca não é verdadeira em geral, a menos que as derivadas direcionais sejam contínuas. 41 A propriedade de sublinearidade definida abaixo é importante para a noção de subdiferencial de uma função. Definição 3.3. Uma função σ : Rn 7→ R é dita sublinear quando apresenta as seguintes propriedades: (a) aditividade: σ(x + y) ≤ σ(x) + σ(y), para todo x, y ∈ Rn (3.3) (b) homogeneidade positiva: σ(tx) = tσ(x), para todo x ∈ Rn e t > 0. (3.4) Toda função sublinear apresenta a propriedade de majorar ao menos uma função linear. Tem-se, então, o seguinte teorema: Teorema 3.1. Se σ : Rn → R é uma função sublinear, então o conjunto Sσ , {s ∈ Rn : hs, xi ≤ σ(x) para todo x ∈ Rn } (3.5) é não-vazio, compacto e convexo. Adicionalmente, tem-se a relação σ(x) = sup {hs, xi : s ∈ Sσ } . (3.6) Reciprocamente, dado um conjunto S não-vazio, compacto e convexo, a função σS : Rn → R de S, definida por σS (x) , sup {hs, xi : s ∈ S} , (3.7) é sublinear, e ela dita função suporte de S. 3.1.2 SUBDIFERENCIAL DE UMA FUNÇÃO CONVEXA Antes de apresentar a noção de subdiferencial de Clarke, é conveniente apresentar a definição do subdiferencial de uma função convexa (HIRIART-URRUTY, 1993). De fato, o subdiferencial de Clarke, definido para a classe mais geral de funções localmente Lipschitz contínuas, constitui uma generalização da ideia de subdiferencial de uma função convexa. 42 Definição 3.4. Uma função f : Rn 7→ R é dita convexa se, para todo x, y ∈ Rn e para todo real λ ∈ [0, 1], tem-se f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y). (3.8) Alternativamente, f é dita estritamente convexa se a desigualdade (3.8) é estrita para todo x, y ∈ Rn tais que x 6= y e para todo real λ ∈]0, 1[. Mostra-se que toda função convexa f : Rn 7→ R é localmente Lipschitz contínua em todo ponto de Rn . Teorema 3.2. Para todo x ∈ Rn , uma função convexa f : Rn 7→ R admite derivadas direcionais em todas as direções d ∈ Rn . Adicionalmente, para todo x fixo, a applicação d ∈ Rn 7→ f 0 (x, d) é sublinear. De acordo com os TEOs. 3.1 e 3.2, concluimos que a aplicação d ∈ Rn 7→ f 0 (x, d) é a função suporte de um conjunto não-vazio, compacto e convexo de Rn , que é denominado de subdiferencial. Definição 3.5. O subdiferencial em x de uma função convexa f , representado por ∂c f (x), é o conjunto não-vazio, compacto e convexo de Rn cuja função suporte é d ∈ Rn 7→ f 0 (x, d), ou seja, ∂c f (x) , {s ∈ Rn : hs, di ≤ f 0 (x, d) para todo d ∈ Rn } . (3.9) Os elementos de ∂c f (x) são chamados de subgradientes de f em x. Reciprocamente, as derivadas direcionais de f podem ser determinadas a partir do subdiferencial por f 0 (x, d) = max {hs, di : s ∈ ∂c f (x)} . (3.10) Para uma função f : Rn 7→ R convexa e diferenciável em x, ∂c f (x) corresponde ao conjunto unitário {∇f (x)}. O subdiferencial admite uma interpretação geométrica. Para tanto, são necessárias as definições a seguir. 43 Definição 3.6. O epigrafo de uma função f : Rn → 7 R é definida por (" # ) x n+1 Epi(f ) , ∈R : l ≥ f (x) . l Definição 3.7. A direção s ∈ Rm é dita normal, em x, a um conjunto convexo fechado C ⊂ Rm quando hs , y − xi ≤ 0, ∀y ∈ C. O conjunto de todas essas direções é chamado cone normal a C em x, e denotado por NC (x). Tem-se, então, o seguinte resultado: Proposição 3.1. Seja uma função f : Rn 7→ R convexa. Um vetor s ∈ Rn é um subgradiente de f em x se e somente se (s, −1) ∈ Rn × R é normal a Epi(f ) em (x, f (x)). Conclui-se daí que a interseção do cone normal NEpi(f ) (x) com o espaço Rn no nível −1 representa ∂c f (x) × {−1}, conforme mostrado na Figura 3.1. 3.1.3 SUBDIFERENCIAL DE CLARKE Diferentemente do caso convexo, a hipótese de que a função f : Rn 7→ R é localmente Lipschitz contínua em x ∈ Rn não é suficiente para a existência das derivadas direcionais de f . Por esta razão é preciso generalizar o conceito de derivada direcional. Definição 3.8. Uma função f : Rn 7→ R admite uma derivada direcional generalizada em x ∈ Rn na direção d ∈ Rn se o limite lim sup y→x t→0 t>0 f (y + td) − f (y) t (3.11) existe e é finito. Neste caso, ela é representada por f ◦ (x, d). Teorema 3.3. Para todo x ∈ Rn , uma função f : Rn 7→ R localmente Lipschitz contínua em x ∈ Rn admite derivadas direcionais generalizadas em todas as direções d ∈ Rn . Adicionalmente, a aplicação d 7→ f ◦ (x, d) é sublinear. 44 Epi(f ) − (x, f (x)) 0 −1 NEpi(f ) ∂c f (x) Rn × {−1} FIG. 3.1: Interpretação geométrica do subdiferencial de uma função convexa (HIRIART-URRUTY, 1993) Pode-se, assim, definir um subdiferencial para as funções localmente Lipschitz contínuas de uma forma análoga ao caso convexo: Definição 3.9. Para uma função f : Rn 7→ R localmente Lipschitz contínua em x ∈ Rn , o subdiferencial de Clarke de f em x, representado por ∂f (x), é o conjunto não-vazio, compacto e convexo Rn cuja função suporte é d ∈ Rn 7→ f ◦ (x, d), ou seja, ∂f (x) , {s ∈ Rn : hs, di ≤ f ◦ (x, d) para todo d ∈ Rn } . (3.12) Os elementos de ∂f (x) são chamados subgradientes de Clarke (ou gradientes generalizados) de f em x. As derivadas direcionais generalizadas podem ser determinadas a partir de ∂f (x) para toda direção d ∈ Rn : f ◦ (x, d) = max {hs, di : s ∈ ∂f (x)} . 45 (3.13) O subdiferencial de Clarke generaliza as noções de subdiferencial de uma função convexa e de gradiente de uma função diferenciável: a) Se uma função f é convexa, tem-se f ◦ (x, d) = f 0 (x, d) para todo d ∈ Rn , e assim ∂f (x) = ∂c f (x). b) Se uma função f localmente Lipschitz contínua em x ∈ Rn é diferenciável em x, então tem-se que f 0 (x, d) = h∇f (x), di ≤ f ◦ (x, d) para todo d ∈ Rn , e então ∇f (x) ∈ ∂f (x). c) Se uma função f é continuamente diferenciável em x, tem-se a igualdade h∇f (x), di = f ◦ (x, d) para todo d ∈ Rn , de modo que ∂f (x) = {∇f (x)}. Se por um lado uma função localmente Lipschitz contínua não é necessariamente diferenciável, por outro lado o conjunto de pontos nos quais ela é não-diferenciável é de medida nula, como indicado no teorema abaixo. Teorema 3.4 (Teorema de Rademacker). Suponha que a função f : Rn → R seja localmente Lipschitz contínua. Então ∇f (x) existe para quase todo x ∈ Rn . À luz do TEO 3.4, poder-se-ia pensar que as técnicas de otimização diferenciável podem ser igualmente utilizadas para uma função localmente Lipschitz contínua, uma vez que os pontos onde a função é não-diferenciável são "raros"em uma certa medida. Entretanto, esta ideia revela-se falsa porque a prática mostra que o mínimo da função é geralmente atingido exatamente nos pontos onde ela é não-diferenciável. O subdiferencial de Clarke admite uma interpretação geométrica em Rn+1 análoga àquela do caso convexo, com a condição de se generalizar a noção de cone normal a um subconjunto qualquer C 6= ∅ não necessariamente convexo. Assim, ∂f (x) é novamente o x s ] está no cone normal ao epigrafo de f em [ f (x) ], conjunto dos vetores s ∈ Rn tais que [ −1 conforme representado na FIG. 3.2. 3.1.4 REGRAS DE CÁLCULO DO SUBDIFERENCIAL DE CLARKE Em geral, as regras de cálculo do subdiferencial de Clarke compreendem apenas inclusões. Entretanto, é possível obter-se igualidades sob uma condição suficiente mais forte que a Lipschitz-continuidade local: 46 Epi(f ) f (x) f (x) − 1 x+s x x + ∂f (x) FIG. 3.2: Interpretação geométrica do subdiferencial de Clarke Definição 3.10. Uma função f : Rn → R localmente Lipschitz contínua é dita regular se a derivada direcional f 0 (x, d) existe para todo x, d ∈ Rn e se, adicionalmente, tem-se f 0 (x, d) = f ◦ (x, d). Em particular, toda função convexa e toda função continuamente diferenciável em x ∈ Rn são então regulares. Por outro lado, se f é regular e diferenciável em x, então ∂f (x) = {∇f (x)}. Considere, a seguir, a regra da diferenciação em cadeia, ou de composição. Lema 3.1. Seja H : Rn → Rm uma função continuamente diferenciável e g : Rm → R uma função localmente Lipschitz contínua. Tem-se, então, que ∂H(x)T ξ, ξ ∈ ∂g(H(x)) . ∂(g ◦ H)(x) ⊂ co η : η = ∂x (3.14) Tem-se a igualdade em (3.14) quando g é regular. Considere H 0 (x) , ∂H(x)/∂x. Pode-se então representar por [H 0 (x)]? ∂g (H (x)) o segundo membro de (3.14), como a ação da aplicação linear adjunta [H 0 (x)]? sobre o subdiferencial. Uma vez que os problemas do tipo minimax desempenham um papel central no presente trabalho, interessam particularmente as propriedades diferenciais das funções max. Consideremos inicialmente o subdiferencial de Clarke de um máximo finito de funções. 47 Lema 3.2. Sejam f 1 , f 2 , . . . , f m : Rn → R funções localmente Lipschitz contínuas e ψ(x) , max f j (x), j∈m com m , {1, 2, . . . , m}. Então, ∂ψ(x) ⊂ co j ∂f (x) , (3.15) j∈m̂(x) onde m̂(x) designa o conjunto de índices j ativos em x: m̂(x) , j ∈ m : f j (x) = ψ(x) . Tem-se a igualidade em (3.15) se as funções f j , j ∈ m̂(x), são regulares em x. A partir dos Lemas 3.1 e 3.2, a importância da condição de regularidade torna-se evidente, pois ela permite um cálculo facilitado de todo o subdiferencial de Clarke. Esta condição concerne, felizmente, a classe de funções que estamos interessados neste trabalho. O teorema abaixo é fundamental pois ele caracteriza o subdiferencial de uma função max calculada sobre um contínuo de índices. Denote-se por ∇x φ(·, ·) o gradiente de φ(·, ·) em relação ao primeiro argumento. Teorema 3.5 (TEO. 5.4.7, (POLAK, 1997)). Considere a função ψ(x) , max φ(x, y). y∈Y (3.16) Suponha que (a) φ : Rn × Rm → R é contínua, (b) ∇x φ(·, ·) existe e é contínuo, e (c) Y ∈ Rm é compacto. Então o subdiferencial de ψ(·) em x é ∂ψ(x) = co {∇x φ(x, y)} (3.17) y∈Ŷ (x) onde Ŷ (x) designa o conjunto de índices ativos Ŷ (x) , {y ∈ Y : ψ(x) = φ(x, y)} . 48 (3.18) 3.2 TÉCNICA DE OTIMIZAÇÃO NÃO-DIFERENCIÁVEL 3.2.1 ALGORITMO DE PENALIZAÇÃO EXATA Será tratado nessa seção o caso mais geral, dado pelo programa de otimização sob restrição (2.28) utilizado na obtenção de um limitante inferior para ν. Reescrevendo-se (2.28) de uma forma mais adequada, tem-se: minimize f (δ) , σ(∆v (δ)) m δ∈R sujeito a gI (δ) , σ(∆f (δ)) − 1 ≤ 0 gE1 (δ) = Re det (I − ∆c (δ)M ) = 0 gE2 (δ) = Im det (I − ∆c (δ)M ) = 0 . (3.19) com ∆c (δ) = diag(∆f (δ), ∆v (δ)). O vetor δ ∈ Rm de variáveis de decisão consiste nas partes reais e imaginárias dos elementos de ∆c não-identicamente nulos. A título de exemplo, suponha que ∆c compreenda um escalar real δ1r e um escalar complexo δ1c , os quais podem ser repetidos ou não (k1 ≥ 1, k2 ≥ 1). Então, δ = [δ1r Re δ1c Im δ1c ]T neste P C caso. A dimensão de δ é dada por m = mr + 2mc + 2 m i=1 kmr +mc +i × kmr +mc +i , com mr , mc e mC definindo ∆c . T Denote-se por gE (δ) , [gE1 (δ) gE2 (δ)] a função restrição de igualdade para (3.19) e seja FIE , {δ ∈ Rm | gI (δ) ≤ 0, gE (δ) = 0}. Então δ̂ ∈ FIE é denominado um minimizador local para (3.19) se existe um ρ > 0 tal que f (δ) ≥ f (δ̂) para todo δ ∈ FIE ∩ B(δ̂, ρ). Na sequência, será apresentado um algoritmo de penalização que permite determinar eficientemente um mínimo local para (3.19). Os teoremas e o algoritmo de penalização exata a serem discutidos foram originalmente propostos em (POLAK, 1997) considerando uma função restrição de desigualdade diferenciável e uma classe mais simples de funções objetivo. No presente trabalho, as condições de otimalidade foram adaptadas para uma classe mais abrangente de problemas não-diferenciáveis que inclui (3.19). As provas dos teoremas imitam aquelas em (POLAK, 1997), e por isso não foram apresentadas aqui. O leitor pode referir-se a (POLAK, 1997) para mais detalhes. Para começar, considere a condição necessária de otimalidade de primeira ordem para o programa (3.19) apresentada no próximo teorema. Teorema 3.6 (TEO. 2.2.19, (POLAK, 1997)). Suponha que δ̂ é um minimizador local para (3.19) e que JgE (δ̂) é de posto de linha cheio. Então, existem multiplicadores χ̂ ∈ Σ2 , 49 ξˆ ∈ R2 , e vetores δf ∈ ∂f (δ̂) e δgI ∈ ∂gI (δ̂) tais que χ̂1 δf + χ̂2 δgI + JgE (δ̂)T ξˆ = 0, (3.20) χ̂2 gI (δ̂) = 0. (3.21) Denota-se por Σn o seguinte conjunto, Σn , {χ ∈ Rn+ : Pn j=1 χj = 1}. A fim de se obter um teste prático de otimalidade, denote-se por Ψ(δ) = max { gI (δ)+ , kgE (δ)k∞ } (3.22) a função violação de restrição para (3.19), onde gI (δ)+ = max {0, gI (δ)} . (3.23) Então, considere a função penalização exata fπ : Rm 7→ R definida como fπ (δ) = f (δ) + πΨ(δ), (3.24) com π ∈ R+ . Note que Ψ(·) torna fπ (·) não-diferenciável mesmo quando f (·), gI (·) e gE (·) são diferenciáveis. É mostrado abaixo que sob certas circunstâncias um minimizador local δ̂ da função não-diferenciável fπ (·) também será um um minimizador local para (3.19). Assim, ao invés de se abordar o problema original (3.19) diretamente, resolve-se o seguinte problema de otimização sem restrição: minimize fπ (δ). m δ∈R (3.25) Abordagens de penalização exata como (3.25) são atraentes porque soluções do problema original podem ser obtidas com uma única execução com o valor do parâmetro de penalização fixo, evitando-se assim o mal-condicionamento inerente às técnicas de penalização clássicas para valores assintóticos do parâmetro de penalização. Os dois teoremas seguintes estabelecem a equivalência dos problemas (3.19) e (3.25). Teorema 3.7 (TEO. 2.7.12, (POLAK, 1997)). Suponha que δ̂ ∈ Rm é tal que gI (δ̂) ≤ 0, gE (δ̂) = 0, JgE (δ̂) seja de posto de linha cheio e que exista um χ̂ ∈ Σ2 , com χ̂1 > 0, e um ξˆ ∈ R2 satisfazendo a condição de otimalidade de primeira ordem (3.20)-(3.21). Seja P2 ˆl 1 2 π̂ , χ̂ + l=1 |ξ | /χ̂ . Então, para todo π ≥ π̂, δ̂ satisfaz a condição de otimalidade de primeira ordem 0 ∈ ∂fπ (δ̂) de um mínimo local de fπ (·). 50 Teorema 3.8 (TEO. 2.7.13 (POLAK, 1997)). Considere o problema (3.19), com a função penalidade exata fπ (·) associada, com π > 0, definida em (3.24). Suponha que JgE (δ) é de posto de linha cheio para todo δ ∈ Rm . Suponha que δ̂ ∈ Rm satisfaça gI (δ̂) ≤ 0, gE (δ̂) = 0. (a) Se δ̂ é um minimizador local de fπ (·), então δ̂ é um minimizador local para (3.19). (b) Se δ̂ satisfaz a condição de primeira-ordem 0 ∈ ∂fπ (δ̂) para um minimizador local de fπ (·), então existe um χ̂ ∈ Σ2 , com χ̂1 > 0, e um ξˆ ∈ R2 satisfazendo a condição de otimalidade (3.20)-(3.21). Baseado nos TEOs. 3.7 e 3.8, o problema é então reformulado como a procura por um minimizador local de fπ (·). Para tanto, considere ∆v ∈ Cp1 ×q1 , ∆f ∈ Cp2 ×q2 e seja f (·) reescrito como f (δ) = max φf (δ, Z), (3.26) φf (δ, Z) , h Z , ∆v (δ) i . (3.27) Z∈Zp1 ×q1 onde Por definição, Zp1 ×q1 , {Z ∈ Cp1 ×q1 | Z = uv H , u ∈ Cp1 , v ∈ Cq1 , kuk = kvk = 1}, (3.28) e max h Z , ∆v (δ) i = p ×q Z∈Z 1 1 H max Re Tr Z ∆ v (δ) . p ×q Z∈Z 1 (3.29) 1 Analogamente, seja gI (δ) = max W ∈Zp2 ×q2 φI (δ, W ), (3.30) onde φI (δ, W ) , h W , ∆f (δ) i − 1. (3.31) Agora, seja fπ (·) in (3.24) reescrita como fπ (δ) = max φπ (δ, y), y∈Yπ 51 (3.32) com y , (j , Z , W ), Yπ , {1, . . . , 6} × Zp1 ×q1 × Zp2 ×q2 e φf (δ, Z), se φf (δ, Z) + πφI (δ, W ), se φ (δ, Z) + πg 1 (δ), se f E φπ (δ, y) , φf (δ, Z) + πgE2 (δ), se φf (δ, Z) − πgE1 (δ), se 2 φf (δ, Z) − πgE (δ), se j = 1, j = 2, j = 3, (3.33) j = 4, j = 5, j = 6. Em seguida, uma aproximação quadrática convexa de primeira ordem para fπ (·) é introduzida: 1 T ˜ fπ (δ + h, δ) , max φπ (δ, y) + h∇δ φπ (δ, y), hi + h Qh , y∈Yπ 2 (3.34) com Q 0. Denote por h i 1 T θπ (δ) , minm f˜π (δ + h, δ) − fπ (δ) = minm max φπ (δ, y) − fπ (δ) + h∇δ φπ (δ, y), hi + h Qh h∈R h∈R y∈Yπ 2 (3.35) a chamada função de otimalidade para fπ (·), e seja i h ˜ h(δ) , arg minm fπ (δ + h, δ) − fπ (δ) . h∈R (3.36) A função de otimalidade θπ (·) apresenta propriedades interessantes que são sintetizadas no próximo teorema. Teorema 3.9 (TEO. 2.1.6 (POLAK, 1997)). Considere a função de otimalidade θπ (·) em (3.35), e a função h(·) em (3.36). Então, (a) para todo δ ∈ Rm , θπ (δ) ≤ 0; (b) para todo δ ∈ Rm , fπ0 (δ; h(δ)) ≤ θπ (δ); (c) para qualquer δ ∈ Rm , 0 ∈ ∂fπ (δ) se e somente se θπ (δ) = 0. Dois fatos fundamentais resultam do TEO. 3.9. Primeiro, θπ (δ) = 0 é uma condição de otimalidade para o programa original (3.19) que pode ser utilizada na prática como um critério de parada. Segundo, como h(δ) é uma direção de descida para fπ (·) em δ, ela pode ser usada em um algoritmo de minimização do tipo de descida. A próxima iteração será então δ + = δ + h(δ), o que representa uma estimativa de primeira ordem de um minimizador local de fπ (·). Em implementações práticas δ + é escolhido como 52 δ + = δ + ρh(δ) para uma largura de passo adequada ρ ∈ (0, 1) determinada por uma pesquisa linear de Armijo por backtracking (DENNIS, 1996), isto é, fπ (δ + ρh(δ)) − fπ (δ) ≤ ζρfπ0 (δ, h(δ)) < 0, (3.37) onde 0 < ζ < 1. A condição de Armijo acima trata-se de uma pesquisa linear exata que garante a convergência global do algoritmo para um minimizador local de (3.19). Na prática, o seguinte procedimento iterativo é utilizado para se determinar um mínimo local de fπ (·). Suponha que a iteração atual δ seja tal que θπ (δ) 6= 0, o que implica que é possível reduzir fπ (·) em uma vizinhança de δ, isto é, encontrar δ + tal que fπ (δ + ) < fπ (δ). Substituindo δ por δ + , o procedimento é repetido. A menos que θπ (δ + ) = 0, que significaria que uma ponto crítico foi encontrado, é possível novamente encontrar δ ++ tal que fπ (δ ++ ) < fπ (δ + ), etc. Espera-se que a sequência δ, δ + , δ ++ , . . . assim gerada convirja para um mínimo local δ̂ de (3.25). Considere a seguinte função de otimalidade associada a Ψ(·): h i θΨ (δ) , minm Ψ̃(δ + h, δ) − Ψ(δ) = minm max 0, max {φI (δ, W ) + h∇δ φI (δ, W ), hi} , W ∈W h∈R h∈R 1 T kgE (δ) + JgE (δ)hk∞ } + h Qh − Ψ(δ) (3.38) 2 O próximo teorema suplementa o TEO. 3.8. Teorema 3.10 (TEO. 2.7.13 (POLAK, 1997)). Considere o problema (3.19), com a função penalidade exata associada fπ (·), com π > 0, definida em (3.24). Suponha que JgE (δ) é de posto de linha cheio para todo δ ∈ Rm . Considere a função violação de restrição Ψ(·) em (3.22) e a função de otimalidade correspondente θΨ (·) em (3.38). Então, para qualquer δ ∈ Rm tal que θΨ (δ) < 0, existe um πδ < ∞ tal que θπ (δ) < 0 para todo π > πδ , onde θπ (·) é a função de otimalidade para fπ (·) em (3.35). Em resumo, nossa estratégia para resolver (3.19) consiste em solucionar o problema sem restrição auxiliar (3.25), baseado no fato de que um minimizador local de fπ (·) é também um minimizador local para o problema original (3.19) sob condições apropriadas. A única dificuldade restante reside na seleção de uma valor grande o suficiente para o parâmetro de penalidade π. Para tanto, considere a chamada função-teste para fπ (·): tπ (δ) , θπ (δ) + 53 1 Ψ(δ). π (3.39) Teorema 3.11 (TEO. 2.7.24 (POLAK, 1997)). Considere a função-teste tπ (·) em (3.39) para o problema (3.19), e suponha que JgE (δ) é de posto de linha cheio para todo δ ∈ Rmr . Além disso, suponha que, para todo δ ∈ Rmr tal que Ψ(δ) > 0, θΨ (δ) < 0, com θΨ (·) definido em (3.38). Então, (a) para todo π > 0, tπ (·) é contínua, (b) para todo π > 0, se δ̂ é tal que θπ (δ̂) = 0 e tπ (δ̂) ≤ 0, então gI (δ̂) ≤ 0, gE (δ̂) = 0, e a condição de otimalidade de primeira ordem (3.20)-(3.21) é atendida para o problema (3.19), (c) para todo δ ∗ ∈ Rmr , existe um ρ∗ > 0 e um π ∗ ∈ (0, ∞) tais que, para todo δ ∈ B(δ ∗ , ρ∗ ) e π ≥ π ∗ , tπ (δ) ≤ 0. Com o TEO. 3.11 em mente, usamos a função-teste tπ (·) para adaptativamente determinar um valor satisfatório finito para o parâmetro de penalidade π. Tendo descrito todos os seus elementos-chave, o algoritmo não-diferenciável é apresentado no Algoritmo 1. Algorithm 1 Algoritmo de penalização exata para o programa (3.19) Parâmetros: Q 0, κ > 1, 0 < β, ζ < 1. 1: Inicialização. Inicialize o vetor de incertezas δ. Selecione o parâmetro de penalidade π > 0. 2: Critério de parada. Se θπ (δ) = 0, isto é 0 ∈ ∂fπ (δ), então pare. Senão, continue. 3: Cálculo da direção de descida. Resolva o programa tangente (3.35) 1 T θπ (δ) = minm max φπ (δ, y) − fπ (δ) + h∇δ φπ (δ, y), hi + h Qh h∈R y∈Yπ 2 A solução representa a direção de busca h(δ). 4: Função-teste. Compute tπ (δ) em (3.39) tπ (δ) = θπ (δ) + 1 Ψ(δ). π Se tπ (δ) ≤ 0 então continue. Senão, faça π ← κπ e volte para o passo 3. 5: Pesquisa linear. Encontre ρ = β γ , γ ∈ N, satisfazendo a condição de Armijo fπ (δ + ρh(δ)) − fπ (δ) ≤ ζρfπ0 (δ, h(δ)) < 0. 6: Atualização. Faça δ ← δ + ρh(δ). Volte para o passo 2. 54 Estratégia semelhante é adotada para resolver o programa de otimização dado por (2.20), utilizado na obtenção de um limitante inferior para µ. 3.2.2 DETALHES DA IMPLEMENTAÇÃO O programa tangente (3.35) pode ser convertido em um SDP da seguinte maneira. Primeiro, considere as decomposições em valores singulares ∆v (δ) = U (δ)Σ(δ)V (δ)H e ∆f (δ) = UI (δ)ΣI (δ)VI (δ)H . Considere Qu (δ) a submatriz de U (δ) compreendendo os vetores singulares à esquerda associados a σ(∆v (δ)) e considere Qv (δ) a submatriz de V (δ) compreendendo os vetores singulares à direita associados a σ(∆v (δ)). Analogamente, considere QIu (δ) a submatriz de UI (δ) compreendendo os vetores singulares à esquerda associados a σ(∆f (δ)) e considere QIv (δ) a submatriz de VI (δ) compreendendo os vetores singulares à direita associados a σ(∆f (δ)). Note que o valor de θπ (δ) permanece inalterado se as matrizes Z em (3.26) e W em (3.30) são restringidas a Z = Qu (δ)Y Qv (δ)H , com Y ∈ Yr1 , e W = QIu (δ)XQIv (δ)H , com X ∈ Yr2 , respectivamente. Denota-se por Yr o seguinte conjunto, Yr , {Y ∈ Hr | Y 0 , Tr Y = 1}. Em seguida, seja θπ rescrita como 1 T j j θπ (δ) = min max max φπ (δ, Yj , Xj ) − fπ (δ) + ∇δ φπ (δ, Yj , Xj ), h + h Qh . (3.40) j Yj ,Xj h 2 A dualidade de Fenchel permite cambiar os operadores min e max em (3.40). Inicialmente, o primeiro supremo interior é substituído por um supremo sobre o envelope convexo, parametrizado por algum τ ∈ Σ6 . Esta operação não altera o valor de θπ . Então, max e min são trocados. O agora interno ínfimo sobre h ∈ Rm torna-se sem restrição e pode ser calculado explicitamente. Para τ , Yj e Xj fixos, determina-se h(δ, τ, Yj , Xj ) = −Q−1 X τj ∇δ φjπ (δ, Yj , Xj ). (3.41) j Substituindo de volta, a seguinte expressão dual é obtida: θπ (δ) = max max ( X τ ∈Σ6 Yj ,Xj τj φjπ (δ, Yj , Xj ) − fπ (δ) j − 1 2 !T X τj ∇δ φjπ (δ, Yj , Xj ) j Q−1 X j 55 τj ∇δ φjπ (δ, Yj , Xj ) ! . (3.42) Para o cálculo dos gradientes aparecendo em (3.42), observe que df (δ) = = max h Z , d∆v (δ) i Z∈Zp1 ×q1 max Re Tr Z H d∆v (δ) p ×q Z∈Z = 1 1 1 Re vecT (Z ∗ ) J∆v dδ max p ×q Z∈Z = 1 T ∗ max Re vec (Z ) vec(d∆ v (δ)) p ×q Z∈Z = 1 max Re Tr (Z ∗ )T d∆v (δ) p ×q Z∈Z = 1 1 max p ×q Z∈Z 1 1 1 T dδ. Re J∆T v vec(Z ∗ ) Conclui-se, então, que ∇δ φf (δ, Y ) = Re J∆T v vec (Z ∗ ) . O TEO. 3.5 permite caracterizar completamente o subdiferencial ∂f (·): ∂f (δ) = co Re J∆T v vec Qu (δ)∗ Y Qv (δ)T : Y ∈ Yr1 . Aplicando raciocínio análogo para gI (δ), obtém-se ∇δ φI (δ, X) = Re J∆T f vec (W ∗ ) , n o ∂gI (δ) = co Re J∆T f vec QIu (δ)∗ XQIv (δ)T : X ∈ Yr2 . (3.43) (3.44) (3.45) (3.46) Para o cálculo de JGE (·), é necessário o cálculo da derivada do determinante. Como a matriz (I − ∆c (δ)M ) estará frequentemente próxima da singularidade, torna-se necessária a aplicação da Fórmula de Jacobi, que diz que para uma matriz A qualquer, d(det(A)) = Tr (Adj(A) dA) Assim, para gE1 (·) obtém-se: dgE1 (δ) = Re d (det (I − ∆c (δ)M )) = Re Tr (Adj(I − ∆c (δ)M )d (I − ∆c (δ)M )) = −Re Tr (Adj(I − ∆c (δ)M )d∆c (δ)M ) = −Re Tr (M Adj(I − ∆c (δ)M )d∆c (δ)) T = −Re Tr AdjT (I − ∆c (δ)M )M T d∆c (δ) = −Re vecT AdjT (I − ∆c (δ)M )M T vec (d∆c (δ)) = −Re vecT AdjT (I − ∆c (δ)M )M T J∆c dδ T dδ. = −Re J∆T c vec AdjT (I − ∆c (δ)M )M T 56 (3.47) De onde se conclui que ∇δ gE1 (δ) = −Re J∆T c vec AdjT (I − ∆c (δ)M )M T . (3.48) . (3.49) Pelo mesmo raciocínio, tem-se ∇δ gE2 (δ) = −Im J∆T c vec AdjT (I − ∆c (δ)M )M T Baseado em (3.43), (3.45), (3.48) e (3.49), e definindo Tj = τ j Yj e Rj = τ j Xj em (3.42), θπ (δ) = max Tj 0, Rj 0, P j Tr(Tj ) = 1, P j Tr(Rj ) = 1 − 1 2 ( X φjπ (δ, Tj , Rj ) − fπ (δ) j !T X ∇δ φjπ (δ, Tj , Rj ) j Q−1 X j ∇δ φjπ (δ, Tj , Rj ) ! . (3.50) Finalmente, o programa (3.50) pode ser convertido em um problema LMI utilizando-se complemento Schur. Note que se Yj e Xj são mantidos fixos, então (3.50) se reduz a um programa convexo quadrático (CQP). Por um lado, isto resulta em direções de descida h(·) de pior qualidade. Por outro lado, o CQP resultante pode ser resolvido eficientemente pelos algorimos atualmente disponíveis e com um tempo de execução menor que o SDP (3.50) original. A experiência prática tende a demonstrar a superioridade da abordagem CQP, porque embora o número de iterações possa eventualmente aumentar, o tempo computacional final é menor do que se SDP fossem resolvidos. O modelo da função objetivo representado por θπ (·) é em princípio de primeira ordem, mas o termo quadrático no programa tangente (3.35) pode em tese ser usado para capturar informação de segunda ordem. A escolha mais elementar consiste em se fazer Q = ηI 0. É sabido que o determinante não representa a medida mais apropriada da singularidade de uma matriz, uma vez que uma matriz pode ter um determinante bastante pequeno mesmo estando longe da singularidade (STRANG, 2005). De fato, na presente aplicação tal fenômeno torna-se facilmente perceptível tão logo a dimensão dos blocos de escalares repetidos aumenta. O menor valor singular seria uma medida mais apropriada, mas 57 infelizmente esta função viola as hipóteses feitas até aqui com relação à função restrição de igualdade. Para contornar essa dificuldade, o determinante foi reescalonado a cada iteração, com o fator de reescalonamento permanecendo fixo durante cada iteração. Este reescalonamento é feito com salvaguardas de forma a não comprometer as propriedades de convergência e otimalidade do algoritmo. A seguinte heurística foi utilizada para a seleção do fator de reescalonamento citado acima. Sejam λi , i = 1, . . . , m os autovalores da matriz (I − ∆M ) organizados por ordem decrescente de módulo. Considere o inteiro g , min i : |λi | ≤ , onde ∈ R é em princípio bastante pequeno. Note que a finalidade de g é caracterizar a partir de qual índice os autovalores podem ser considerados numericamente nulos. Definase, também, g−1 Y ζ, λi i=1 . Então, em uma dada iteração k, a função restrição de igualdade será multiplicada por um fator de reescalonamento γk dado por γk = min γk−1 , ζk−1 . (3.51) A experiência numérica decorrente dos diversos exemplos discutidos no Capítulo 4 corrobora a validade dessa abordagem. 58 4 APLICAÇÕES NUMÉRICAS As simulações e cálculos envolvidos nas aplicações numéricas apresentadas nesta seção foram realizados com a ferramenta Matlab, versão R2010b. O processador utilizado foi um Core 2 Duo, 2,10GHz, com 4Gb de memória RAM. 4.1 EXEMPLO COM INCERTEZAS PURAMENTE REAIS A primeira aplicação trata do problema acadêmico apresentado originalmente em (ELGERSMA, 1992). A técnica para a obtenção de limitantes inferiores para µ via otimização não-diferenciável com a utilização de grade de frequências (LI ND-GF), tratada nos Capítulos 2 e 3, é utilizada para estimar um limitante inferior para µ. É considerada a matriz M ∈ C3×3 , da estrutura M ∆, que varia com r/2 M = θ/2 θ/2 o parâmetro escalar real ω (frequência): s/θ s/θ (4.1) r s/θ θ r onde, r = 2(ω + j), s = r2 − 12j, j= √ −1 (4.2) e θ é a solução da equação quadrática sθ2 + r(r2 − 3s)θ + s2 = 0. (4.3) O bloco de incertezas ∆ é composto por 3 parâmetros escalares reais não-repetidos: δ1 . ∆= (4.4) δ 2 δ3 Em (ELGERSMA, 1992) é proposto um método para o cálculo do valor exato de µ para o exemplo em questão. A comparação dos resultados fornecidos pelo algoritmo ND-GF com o valor exato de µ, que nesse caso particular é conhecido, mostra a eficácia da técnica proposta. São realizadas 3 análises que diferem no número de pontos iniciais considerados para cada frequência. Os pontos iniciais foram escolhidos aleatoriamente. 59 A FIG. 4.1 mostra o valor exato de µ além dos limitantes obtidos por diferentes técnicas: limitante superior (LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior pelo algoritmo gain-based (LI GB) (SEILER, 2010) e limitante inferior via otimização não-diferenciável com grade de frequências (LI ND-GF), obtido com 1 ponto inicial para cada frequência da grade. FIG. 4.1: Limitantes de µ com 1 ponto inicial: 1a aplicação . LS e LI GB são calculados através de rotinas disponíveis na toolbox de controle robusto do Matlab. O algoritmo GB levou 1,2 minutos no cálculo do limitante inferior, para uma grade de frequências com 100 pontos logaritmicamente espaçados. O algoritmo NDGF, para o mesma grade, gastou 2,5 minutos. Contudo, é possível observar que mesmo considerando apenas 1 ponto inicial para cada frequência, de uma maneira geral, LI NDGF é mais preciso do que LI GB. O algoritmo ND-GF é baseado em uma técnica de otimização local, e portanto, a escolha do ponto inicial pode impactar o resultado. A FIG. 4.2 retrata os mesmos limitantes da FIG. 4.1, no entanto, nessa simulação foi adotada a estratégia de múltiplos-começos, sendo considerados 5 pontos iniciais para cada frequência. O algoritmo ND-GF gastou, neste caso, cerca de 15 minutos para o cálculo do limitante inferior. 60 FIG. 4.2: Limitantes de µ com 5 pontos iniciais: 1a aplicação . Nota-se que com o aumento do número de pontos iniciais, o limitante encontrado é menos conservador, aproximando-se do valor exato de µ. Finalmente, a FIG. 4.3 mostra os limitantes de µ para 10 pontos iniciais. O algoritmo ND-GF gastou cerca de 33 minutos, com essa configuração, e o limitante inferior obtido praticamente coincidiu com o valor exato de µ. Com a finalidade de obter-se uma certificação de que as incertezas encontradas são realmente desestabilizantes, são calculados dois indicadores de singularidade para a matriz (I−∆M ): O menor valor singular σ(I−∆M ) e o recíproco do número de condicionamento, rcond(I − ∆M ) = σ(I − ∆M ) . σ(I − ∆M ) (4.5) As FIGs. 4.4 e 4.5 mostram estes indicadores nos casos GB e ND-GF na simulação com 10 pontos iniciais. Os resultados indicam que as incertezas encontradas são realmente desestabilizantes. São considerados satisfatórios valores menores do que 10−5 (zero numérico). 61 FIG. 4.3: Limitantes de µ com 10 pontos iniciais: 1a aplicação . FIG. 4.4: Análise de singularidade via menor valor singular (GB/ND-GF): 1a aplicação. 62 FIG. 4.5: Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): 1a aplicação. 4.2 EXEMPLO COM INCERTEZAS MISTAS Essa aplicação trata da análise de estabilidade e desempenho robustos de um exemplo apresentado originalmente na toolbox de controle robusto do Matlab (versão R2010b). O bloco de incertezas inclui dinâmicas não-modeladas e variações paramétricas. A FIG. 4.6 mostra o diagrama de blocos do sistema em malha fechada: FIG. 4.6: Diagramas de blocos do sistema em malha fechada: 2a aplicação. 63 O modelo da planta P é incerto, os sinais d e n são distúrbios e a saída e deve ser mantida pequena para uma rejeição adequada desses distúrbios. P é um sistema de segunda ordem que possui incerteza paramétrica nos coeficientes do denominador e significativa dependência frequencial de dinâmicas não modeladas. O modelo matemático considerado é descrito a seguir: P (s) = s2 16 (1 + Wu (s)δc (s)). + 0, 16s + k (4.6) Assume-se que o parâmetro k possua 40% de incerteza e valor nominal 16. A incerteza dependente da frequência na entrada da planta, referente às dinâmicas não-modeladas, é considerada 20% para baixas frequências e atinge 100% em 6 rad/s. A variação é dada pela ponderação Wu (s): 10s + 12, 18 . s + 60, 93 O controlador K de 3a ordem é dado a seguir: Wu (s) = K(s) = −12, 56s2 + 17, 32s + 67, 28 . s3 + 20, 37s2 + 136, 74s + 179, 46 (4.7) (4.8) Considere inicialmente a análise de robustez em estabilidade. O sistema nominal em malha fechada M (s) da estrutura M ∆ tem ordem 6. O bloco de incertezas ∆ ∈ C2×2 é composto pela incerteza complexa δc , que é representada por δc1 + δc2 j, e pela incerteza paramétrica δk , com δc1 , δc2 e δk ∈ R: " ∆= # δc1 + δc2 j . (4.9) δk A FIG. 4.7 mostra os limitantes de µ obtidos por diferentes técnicas: limitante superior (LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior pelo algoritmo gainbased (LI GB) (SEILER, 2010), limitante inferior via otimização não-diferenciável com grade de frequências (LI ND-GF). LS e LI GB são calculados através de rotinas disponíveis na toolbox de controle robusto do Matlab. O algoritmo GB gastou 2 segundos no cálculo de LI GB, para um grade de frequências com 100 pontos logaritmicamente espaçados. O algoritmo ND-GF, para a mesma grade, gastou 28 segundos no cálculo de LI ND-GF, considerando 1 ponto inicial para cada frequência. Observa-se na FIG. 4.7 que LS, LI GB e LI ND-GF são praticamente coincidentes, o que sugere que a presença de incerteza complexa tende a convexificar o problema, facilitando a determinação do mínimo global. Nesses casos, o algoritmo GB 64 FIG. 4.7: Limitantes de µ: 2a aplicação . fornece limitantes inferiores bastante satisfatórios com um tempo de execução inferior ao algoritmo ND-GF. Esse resultado parece indicar que o foco de aplicação da técnica de otimização não-diferenciável são os sistemas onde só existam incertezas paramétricas, casos em que há margem para melhoria na exatidão do cálculo de limitantes inferiores para µ e ν. As FIGs. 4.8 e 4.9 indicam que as incertezas encontradas, tanto por GB quanto por ND-GF, são realmente desestabilizantes. É possível observar que em altas frequências (acima de 100 rad/s) o algoritmo ND-GF não conseguiu encontrar incertezas desestabilizantes. Porém, nesse exemplo, isso não chega a representar uma limitação, uma vez que, nessa faixa de frequências o valor de µ é praticamente nulo. Considere agora o teste de robustez em desempenho discutido na Seção 2.5.1. A técnica para obtenção de limitantes inferiores para ν via otimização não-diferenciável com grade de frequências (LI ND-GF) é utilizada na determinação do pior caso de ganho da transferência F , com a medida do ganho sendo dada pela norma kHk∞ . A estrutura N ∆ (FIG. 2.3) é utilizada para representar o sistema em malha fechada. O sistema nominal N (s), assim como M (s), possui ordem 6, mas agora o canal de desempenho é considerado. A transferência do sistema em malha fechada da entrada [d, n]T para a saída e é dada por F = Fu (N, ∆) ∈ C1×2 . A FIG. 4.10 mostra os limitantes para o pior caso de ganho da 65 FIG. 4.8: Análise de singularidade via menor valor singular (GB/ND-GF): 2a aplicação (estabilidade robusta). FIG. 4.9: Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): 2a aplicação (estabilidade robusta). 66 transferência F obtidos por diferentes técnicas: limitante superior (LS-WC) e limitante inferior (LI-WC) obtidos pela rotina wcgain da toolbox de controle robusto do Matlab e limitante inferior via otimização não-diferenciável com grade de frequências (LI ND-GF). FIG. 4.10: Limitantes para o pior caso de ganho da transferência F : 2a aplicação. O bloco fictício ∆p ∈ C2×1 que representa as especificações de desempenho H∞ é dado por: " ∆p = δ1 + δ2 j # . (4.10) δ3 + δ4 j ˆ é dado por diag {∆, ∆p }: O bloco de incertezas aumentado ∆ δc + δc2 j 0 0 1 0 δ 0 k ˆ ∆= . 0 0 δ + δ j 1 2 0 0 δ3 + δ4 j (4.11) ˆ ∆f = ∆ e ∆v = ∆p . O algoritmo NDLI ND-GF é obtido com a técnica ν, onde ∆c = ∆, GF gastou 128 segundos no cálculo de LI ND-GF, considerando 1 ponto inicial para cada frequência de uma grade com 100 pontos logaritmicamente espaçados. O cálculo feito 67 pela rotina wcgain levou 40 segundos. Assim como no estudo da estabilidade robusta, ˆ possuir blocos de incertezas complexos, LS-WC, LI-WC e LI ND-GF são em função de ∆ praticamente coincidentes. Novamente, os resultados obtidos pelas técnicas atualmente disponíveis não oferecem margem para melhoria na exatidão. As FIGs. 4.11 e 4.12 mostram que as incertezas encontradas pelo algoritmo ND-GF na faixa crítica de frequência são realmente desestabilizantes. Novamente, em altas frequências ND-GF não conseguiu encontrar perturbações desestabilizantes. FIG. 4.11: Análise de singularidade via menor valor singular (ND-GF): 2a aplicação (desempenho robusto). 68 FIG. 4.12: Análise de singularidade via recíproco do número de condicionamento (ND-GF): 2a aplicação (desempenho robusto). 4.3 SISTEMA MASSA-MOLA-AMORTECEDOR Essa aplicação trata do sistema de controle do modelo massa-mola-amortecedor apresentado originalmente em (ACKERMANN, 1990). A técnica para obtenção de limitantes inferiores para µ via otimização não-diferenciável com abordagem por espaço de estados (LI ND-EE), tratada nos Capítulos 2 e 3, é utilizada na análise de robustez em estabilidade. O modelo é composto por 2 massas como mostrado na FIG. 4.13. FIG. 4.13: Sistema massa-mola-amortecedor. 69 As matrizes da representação em espaço de estados do modelo são mostradas a seguir. A planta compreende 4 estados: posição de m1 (x1 ), velocidade de m1 (x˙1 ), posição de m2 (x2 ) e velocidade de m2 (x˙2 ). É considerada como entrada a força aplicada à massa m2 e como saída a posição da massa m1 : 0 1 0 0 −(c1 +c12 ) −d1 c12 0 m1 m1 m1 A= , 0 0 0 1 −(c2 +c12 ) c12 −d2 0 m2 m2 m2 0 0 B = , 0 1 h i C= 1 0 0 0 , D = 0. (4.12) Os valores nominais das massas, das constantes elásticas das molas e dos coeficientes de amortecimento dos amortecedores são conhecidos: m1 = 2 Kg, m2 = 3, 5 Kg, c1 = 1, 5 N/m, c2 = 3 N/m, c12 = 1 N/m, d1 = 1, 25 Ns/m e d2 = 1, 25 Ns/m. O modelo do sistema em malha fechada envolve um controlador de terceira ordem. A função de transferência do controlador é dada por: K(s) = 471250s3 + 801125s2 + 895375s + 235625 . s3 + 62s2 + 1450s + 19000 (4.13) Considere agora o seguinte problema de análise. Suponha que não exista incerteza na constante elástica c12 da mola que liga as massas m1 e m2 . Para qual faixa de valores das contantes m1 , m2 , c1 , c2 , d1 e d2 o sistema permanece estável? Nesse caso, as técnicas que utilizam grade de frequências na análise µ se mostram ineficientes, tal como indicado a seguir. A FIG. 4.14 mostra os limitantes de µ obtidos por diferentes técnicas: limitante superior (LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior pelo algoritmo gain-based (LI GB) (SEILER, 2010) e limitante inferior via otimização não-diferenciável com abordagem por espaço de estados (LI ND-EE). LS e LI GB são calculados através de rotinas disponíveis na toolbox de controle robusto do Matlab. 70 FIG. 4.14: Limitantes de µ: massa-mola-amortecedor. A estrutura M ∆ envolve um sistema nominal M (s) de ordem 7. Nos casos LS, LI GB, o bloco de incertezas ∆ é composto por 4 escalares reais não-repetidos e 2 escalares reais repetidos 3 vezes: δc 1 δc 2 δd1 ∆= δd2 δm1 I3 . (4.14) δm2 I3 No caso LI ND-EE, ∆aum é composto por 1 escalar real repetido 7 vezes (frequência) mais um bloco com 4 escalares reais não-repetidos e 2 escalares reais repetidos 3 vezes (parâmetros): 71 ∆aum δω I7 δc1 δc 2 = δd1 δd2 δm1 I3 . (4.15) δm2 I3 A solução é obtida com a reformulação do problema com a técnica ν, conforme discutido na Seção 2.6, com ∆c = ∆aum , ∆f = δω I7 e ∆v = ∆. Os fatores de ponderação utilizados na representação das incertezas foram selecionados como 50%. O algoritmo ND-EE detecta o valor de pico de 1, 7535 para o limitante inferior de µ na frequência crítica de 16, 9124 rad/s. As FIGs. 4.15 e 4.16 indicam que as incertezas encontradas são realmente desestabilizantes. São utilizados como indicadores de singularidade o menor valor singular σ(I − ∆c M̂1 ) e o recíproco do número de condicionamento, rcond(I − ∆c M̂1 ) = σ(I − ∆c M̂1 ) σ(I − ∆c M̂1 ) . (4.16) O limitante superior e o limitante inferior obtidos pelo algoritmo gain-based são calculados para uma grade de frequências com 1000 pontos logaritmicamente espaçados. LS indica o valor de pico de 1,699 na frequência de 17,03 rad/s, enquanto que LI GB indica o valor de pico de 1,659 na frequência de 17,03 rad/s. Para esse exemplo, a limitação das técnicas que utilizam grade de frequência fica evidente. Mesmo com a utilização de uma grade bastante densa, os valores de pico estimados por LS e LI GB são menores do que o determinado por LI ND-EE. Em virtude disso, o uso do valor de pico dado por LS para determinar a margem de estabilidade, que em alguns casos pode ser até mesmo conservador, seria na verdade excessivamente otimista. Seria esperada a manutenção da estabilidade do sistema caso a faixa de variação dos parâmetros incertos não excedesse 29, 42% (50%/1, 699), no entanto, LI ND-EE mostra que existe uma incerteza com 28, 51%(50%/1, 7535) de variação que leva o sistema à instabilidade. Outra vantagem do algoritmo ND-EE, para essa aplicação, é o tempo computacional. Enquanto que o algoritmo GB gastou cerca de 16 minutos no cálculo de um limitante inferior para µ, ND-EE gastou 1,5 minutos, com 10 pontos iniciais para cada um dos 4 intervalos de frequência 72 FIG. 4.15: Análise de singularidade via menor valor singular (ND-EE): massa-mola-amortecedor. FIG. 4.16: Análise de singularidade via recíproco do número de condicionamento (ND-EE): massa-mola-amortecedor. 73 considerados. Isso se deve, principalmente, ao fato da abordagem não-diferenciável não sofrer grande impacto no tempo computacional em virtude da dimensão de incertezas paramétricas repetidas no bloco estruturado das incertezas. 4.4 SISTEMA DE CONTROLE DE VOO LONGITUDINAL DE MÍSSIL Essa aplicação trata do sistema de controle de voo longitudinal para o modelo de míssil apresentado originalmente em (WISE, 1990). A aerodinâmica do míssil foi linearizada para um ângulo de ataque de 16 graus, Mach 0,8 e uma altitude de 4000 pés. O modelo de corpo rígido da estrutura do míssil compreende 4 estados: ângulo de ataque (α), taxa de elevação (q), deflexão da barbatana (β), taxa de deflexão da barbatana (β̇). A entrada da planta é o comando de deflexão da barbatana (βc )(rad) e as saídas são a aceleração vertical (η)(ft/s2 ) e a taxa de elevação (q)(rad/s). Assume-se que os valores da velocidade do míssil (V = 886, 78 ft/s), do amortecimento (ζ = 0, 6) e da frequência natural (ωn = 113rad/s) do atuador sejam conhecidos precisamente. Os valores nominais das derivadas aerodinâmicas de estabilidade são Zα = −1, 3046 1/s, Zβ = −0, 2142 1/s, Mα = 47, 7109 1/s2 e Mβ = −104, 8346 1/s2 . O modelo nominal é instável em malha aberta, mas um controlador de segunda ordem estabiliza o sistema em malha fechada. As entradas do controlador, como mostrado na FIG. 4.17, são o erro da aceleração vertical (e = ηc − η)(ft/s2 ) e a taxa de elevação (−q)(rad/s), a saída é o comando de deflexão do fin (βc )(rad). FIG. 4.17: Diagrama de blocos do míssil. 74 As matrizes da representação em espaço de estados da planta do míssil são dadas por: Zα 1 Zβ 0 0 " # " # M 0 M 0 0 V Zα 0 V Zβ 0 0 β α A= , D= . , B = , C = 0 0 0 0 1 0 1 0 0 0 2 ωn2 0 0 −ωn −2ζωn (4.17) As matrizes da representação em espaço de estados do controlador são dadas por: " # " # h i h i 0 0 K a az 0 Ac = , Bc = , Cc = Kq 1 , Dc = Ka Kq Kq , K q aq 0 K a K q aq K q aq (4.18) onde os parâmetro são conhecidos, Ka = −0, 0015, Kq = −0, 32, az = 2, 0 e aq = 6, 0. Considere inicialmente o seguinte problema de análise. Suponha que não existam incertezas nas derivadas de estabilidade Zα e Zβ . Para que faixa de valores das derivadas de estabilidade Mα e Mβ o sistema em malha fechada mantém-se estável? Apesar de sua aparente simplicidade, enfrentar este problema através da análise-µ é difícil, tal como especificado abaixo. FIG. 4.18: Limitantes de µ: míssil. 75 A FIG. 4.18 mostra os limitantes de µ obtidos por diferentes técnicas: limitante superior (LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior pelo algoritmo gain-based (LI GB) (SEILER, 2010), limitante inferior via otimização não-diferenciável com grade de frequências (LI ND-GF) e limitante inferior via otimização não-diferenciável com abordagem por espaço de estados (LI ND-EE). LS e LI GB são calculados através de rotinas disponíveis na toolbox de controle robusto do Matlab. A estrutura M ∆ envolve um sistema nominal M (s) de ordem 6. O bloco de incertezas ∆ é composto por 2 escalares reais não-repetidos nos casos LS, LI GB e LI ND-GF: " # δMα ∆= . δMβ (4.19) No caso LI ND-EE, ∆aum é composto por por um escalar real repetido 6 vezes (frequência) mais 2 escalares reais não-repetidos (derivadas de estabilidade): δω I6 . ∆aum = δ Mα δMβ (4.20) A solução é obtida com a reformulação do problema com a técnica ν, conforme discutido na Seção 2.6, com ∆c = ∆aum , ∆f = δω I6 e ∆v = ∆. Os fatores de ponderação utilizados na representação das incertezas para Mα e Mβ são selecionados como 100%. Note na FIG. 4.18 que µ apresenta um pico estreito seguido por uma descontinuidade na frequência. Como enfatizado na Seção 2.6, abordagens baseadas em grade de frequências podem ser inapropriadas quando há ocorrência de picos. Na verdade, um ponto crítico pode ser facilmente perdido se a grade não for suficientemente densa, podendo acarretar imprecisões na estimação da margem de estabilidade. Para resultados mais precisos, a grade pode ser adensada na região previamente identificada como crítica. O algoritmo ND-EE detecta o valor de pico 1,5389 na frequência crítica de 5,5598 rad/s. As FIGs. 4.19 e 4.20 indicam que as incertezas encontradas são realmente desestabilizantes. Frequências logaritmicamente espaçadas são selecionadas para formar a grade de frequências usada pelas técnicas LS, LI GB e LI ND-GF. Para um número crescente de pontos da grade, o limitante superior e o limitante inferior obtido pelo algoritmo NDGF se aproximam do valor de pico encontrados pela técnica ND-EE na freqüência crítica referida. Para cerca de 1000 ou mais pontos na grade, os três limitantes LS, LI ND-GF 76 FIG. 4.19: Análise de singularidade via menor valor singular (ND-EE): míssil (análise µ). FIG. 4.20: Análise de singularidade via recíproco do número de condicionamento (ND-EE): míssil (análise µ). 77 e LI ND-EE praticamente coincidem para 5,5598 rad/s, sugerindo que 1,5389 representa o valor de pico verdadeiro de µ. Note que a frequência crítica (5,5598 rad/s) obtida pela técnica ND-EE foi incluída na grade de frequências usada na FIG. 4.18 a fim de ajudar a verificação da consistência dos resultados. Como conclusão, a análise-µ discutida indica que o sistema em malha fechada permanece estável se as derivadas de estabilidade Mα e Mβ não apresentarem variação maior que 64,98% (100%/1,5389) em relação aos seus valores nominais. A FIG. 4.21 mostra LS e LI ND-EE de µ para uma nova configuração com ponderação de 64, 98%. Os valores de pico encontrados pelas duas técnicas, na frequência crítica de 5,56 rad/s, praticamente coincidem em 0,999, sugerindo que este seja o verdadeiro valor de pico de µ. FIG. 4.21: Limitante de µ: míssil (Mα e Mβ reduzidos). Outro fato que cabe ressaltar é que mesmo com o pequeno número de parâmetros incertos, o limitante inferior obtido com a técnica GB é bastante insatisfatório. De fato, para uma série de frequências, especialmente no intervalo crítico, a técnica GB não consegue nem mesmo achar uma incerteza desestabilizante, como indicado pelas FIGs. 4.22 e 4.23. O desempenho do algoritmo PI (power iteration) é ainda pior e, portanto, não foi incluído na FIG. 4.18. O algoritmo GB gastou 69 segundos no calculo de um limitante inferior de µ para uma grade com 1000 pontos. O algoritmo ND-EE com 10 pontos iniciais 78 e 3 intervalos de frequência gastou 62 segundos. FIG. 4.22: Análise de singularidade via menor valor singular para (GB/ND-GF): míssil. FIG. 4.23: Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): míssil. Considere agora o seguinte problema de análise com maior grau de complexidade. 79 Suponha que há incerteza nas quatro derivadas de estabilidade. Em particular, assuma que as derivadas de estabilidade Mα e Mβ não tenham variação maior que 60% em relação aos seus valores nominais. Assim, para qual intervalo de valores de Zα e Zβ o sistema em malha fechada mantém-se estável? Este é um típico problema de análise-ν discutido na Seção 2.4. Limitantes de ν obtidos por diferentes técnicas são mostrados na FIG. 4.24: limitante superior (LS) (FERRERES, 1997) e limitante inferior (LI PI) obtidos pelo método das potências (FERRERES, 1999), implementados com as rotinas mixed_mu_ub e mixed_mu_lb da toolbox SMT (FERRERES, 2004), limitante inferior via otimização não-diferenciável com grade de frequências (LI ND-GF) e limitante inferior via otimização não-diferenciável com abordagem por espaço de estados (LI ND-EE). FIG. 4.24: Limitantes de ν: míssil. Agora, o bloco de incertezas ∆c é composto por 4 escalares reais não-repetidos nos casos LS, LI PI e LI ND-GF: δM α δMβ ∆c = δZα 80 δZβ , (4.21) com " ∆f = # δMα , (4.22) . (4.23) δM β e " ∆v = # δZα δZβ No caso LI ND-EE, ∆aum é composto por um escalar real repetido 6 vezes (frequência) e por 4 escalares reais não-repetidos (derivadas de estabilidade): δ I ω 6 δMα , ∆aum = ∆c = δM β δ Z α δZβ com (4.24) δω I6 ∆f = δM α , (4.25) δMβ e " ∆v = # δZα . (4.26) δZβ Os fatores de ponderação foram selecionados como 60% para Mα e Mβ e 100% para Zα e Zβ . O algoritmo PI gastou 11 segundos no cálculo de um limitante inferior de ν para uma grade com 100 pontos, mas não conseguiu convergir para a maioria das frequências da grade. A técnica ND-EE determinou um valor de pico de 1,5305 na frequência de 3,214 rad/s, levando 35 segundos com a utilização de 3 pontos iniciais para cada um dos 3 intervalos. As FIGs. 4.25 e 4.26 indicam que as incertezas encontradas são realmente desestabilizantes. Com uma grade de frequências com 100 pontos logaritmicamente espaçados, tanto o limitante superior quanto o limitante inferior obtidos pela técnica ND-GF subestimam, ligeiramente, o valor de pico fornecido pelo algoritmo ND-EE. Aumentando o número de pontos da grade, ambos os valores, LS e LI ND-GF, convergem para o valor de pico encontrado por ND-EE. Mais uma vez, o valor praticamente idêntico de LS, LI ND-GF 81 FIG. 4.25: Análise de singularidade via menor valor singular (ND-EE): míssil (análise ν). FIG. 4.26: Análise de singularidade via recíproco do número de condicionamento (ND-EE): míssil (análise ν). 82 e LI ND-EE na frequência crítica (3,214 rad/s) sugere que o valor de pico determinado pela abordagem ND-EE é realmente igual ao verdadeiro valor de pico de ν. Isso significa dizer que se a variação das derivadas de estabilidade Zα e Zβ não for maior que 65, 33% (100%/1, 5305) em relação aos seus valores nominais, o sistema em malha fechada mantém-se estável. A FIG. 4.27 mostra LS e LI ND-EE de µ para uma nova configuração com ponderação de 65, 33%. Os valores de pico encontrados pelas duas técnicas, na frequência crítica de 3,403 rad/s, praticamente coincidem em 0,997, sugerindo que este seja o verdadeiro valor de pico de µ. FIG. 4.27: Limitante para µ - míssil: Zα e Zβ reduzidos . 4.5 AVIÃO FLEXÍVEL Nessa aplicação, a técnica para obtenção de limitantes inferiores de µ e ν via otimização não-diferenciável com abordagem por espaço de estados é usada na análise de robustez em estabilidade do controlador de voo lateral projetado para a aeronave flexível de transporte apresentada em (FERRERES, 1999). Os dados numéricos para esse problema estão disponíveis na toolbox SMT (FERRERES, 2004). As limitações encontradas pelas técnicas que utilizam grade de frequência para detectar valores de pico de µ e ν 83 tornam-se evidentes, nesse caso, devido à presença de modos flexíveis. Inicialmente, a margem de estabilidade é estimada via análise-µ. FIG. 4.28: Limitantes de µ - avião flexível. A FIG. 4.28 mostra os diferentes limitantes obtidos para µ: limitante superior (LS)(FAN, 1991) (YOUNG, 1992), limitante inferior dado pelo algoritmo gain-based (LI GB)(SEILER, 2010) e limitante inferior via otimização não-diferenciável com abordagem por espaço de estados (LI ND-EE). Nota-se que algoritmos em tempo exponencial como o método de Dailey (DAILEY, 1990) são inoperantes para aplicações com grande número de incertezas paramétricas, como o presente. O modelo flexível apresenta 20 parâmetros incertos, compreendendo 14 coeficientes aerodinâmicos do modelo de corpo rígido e as frequências naturais de 6 modos flexíveis. O sistema nominal em malha fechada M (s) da estrutura M ∆ tem ordem 46. O bloco de incertezas ∆ é composto por 20 escalares reais não-repetidos nos casos LS e LI GB: δ1 .. ∆= . . (4.27) δ20 No caso LI ND-EE, ∆aum é composto por um escalar real repetido 46 vezes (frequência) 84 e por 20 escalares reais não-repetidos (coeficientes aerodinâmicos e frequências naturais): δω I46 δ 1 ∆aum = (4.28) . .. . δ20 A solução é obtida com a reformulação do problema com a técnica ν, conforme discutido na Seção 2.6, com ∆c = ∆aum , ∆f = δω I46 e ∆v = ∆. Os fatores de ponderação utilizados na representação das incertezas foram selecionados como 10%. O algoritmo ND-EE detecta o valor de pico de 4,475 para o limitante inferior de µ na frequência crítica de 13,3587 rad/s. As FIGs. 4.29 e 4.30 indicam que as incertezas encontradas são realmente desestabilizantes. FIG. 4.29: Análise de singularidade via menor valor singular (ND-EE): avião flexível (análise µ). 85 FIG. 4.30: Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (análise µ). O limitante superior e o limitante inferior obtidos pelo algoritmo gain-based são calculados para uma grade de frequências com 1000 pontos logaritmicamente espaçados e indicam um valor de pico de 3,798 na frequência de 13,4 rad/s. A limitação das técnicas que utilizam grade de frequências na manipulação de modos flexíveis fica evidente, tendo em vista que, mesmo com a utilização de uma grade bastante densa, os valores de pico estimados por LS e LI GB são consideravelmente menores do que o determinado pelo algoritmo ND-EE. Assim como na aplicação massa-mola-amortecedor discutida na Seção 4.3, o uso do valor de pico dado por LS para determinar a margem de estabilidade seria otimista: seria esperada a manutenção da estabilidade do sistema caso a faixa de variação dos parâmetros incertos não excedesse 2, 63% (10%/3, 798). No entanto, LI ND-EE mostra que existe uma incerteza com 2, 23% (10%/4, 475) de variação que leva o sistema à instabilidade. O algoritmo GB gastou cerca de 19 minutos no cálculo de um limitante inferior de µ para uma grade com 1000 pontos, enquanto que o algoritmo ND-EE com 10 pontos iniciais e 10 intervalos de frequência gastou cerca de 70 minutos, entretanto, com resultados mais precisos. Considere agora o seguinte problema de análise com maior grau de complexidade. 86 Assumindo que os coeficientes aerodinâmicos não sofram variação maior do que 2% em relação aos seus valores nominais, para qual faixa de valores das frequências naturais dos modos flexíveis o sistema em malha fechada é estável? Esse é um genuíno problema de análise ν. FIG. 4.31: Limitantes de ν - avião flexível: restrição na faixa de variação dos coeficientes aerodinâmicos do modelo rígido. A FIG. 4.31 mostra o limitante superior (LS) e o limitante inferior via algoritmo PI (LI PI), obtidos através de rotinas existentes na toolbox SMT (FERRERES, 2004), e o limitante inferior via otimização não-diferenciável com abordagem por espaço de estados (LI ND-EE). Para os casos LS e LI PI, ∆c = ∆ (∆c ∈ R20×20 ) com ∆f envolvendo os 14 coeficientes aerodinâmicos (∆f ∈ R14×14 ) e ∆v envolvendo as 6 frequências naturais (∆v ∈ R6×6 ). Para o caso LI ND-EE, ∆c = ∆aum (∆c ∈ R66×66 ) com ∆f envolvendo a frequência como um parâmetro incerto mais os 14 coeficientes aerodinâmicos (∆f ∈ R60×60 ) e ∆v envolvendo as 6 frequências naturais dos modos flexíveis (∆v ∈ R6×6 ). Da análise da FIG. 4.31 é possível observar que mesmo com a dimensão elevada da matriz de incertezas, a técnica via otimização não-diferenciável ainda funciona adequadamente e que mesmo estabelecendo um grade de freqüências com 1000 pontos, os valores de pico encontrados 87 em LS e LI PI são inferiores ao encontrado em LI ND-EE. Novamente, o uso de LS para determinar a margem de estabilidade seria excessivamente otimista. Além disso, o algoritmo de PI mais uma vez não apresenta bom desempenho, não convergindo para um grande número de freqüências. O algoritmo ND-EE determina o valor de pico de 4,4677 para o limitante inferior de ν na frequência crítica de 13,3580rad/s. As FIGs. 4.32 e 4.33 indicam que as incertezas encontradas são realmente desestabilizantes. FIG. 4.32: Análise de singularidade via menor valor singular (ND-EE): avião flexível (1a análise ν. 88 FIG. 4.33: Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (1a análise ν). Uma comparação cuidadosa entre as FIGs. 4.28 e 4.31 é muito instrutiva. Observe que os dois gráficos são muito semelhantes em altas frequências. Por exemplo, os valores de pico e as respectivas frequências críticas são praticamente iguais. Contudo, os conteúdos de baixa frequência são bastantes diferentes. Isso pode ser explicado pelo fato de que, neste exemplo, cada tipo de incerteza afeta de forma mais significativa regiões distintas de frequência: coeficientes aerodinâmicos em baixas frequências e frequências naturais dos modos flexíveis em frequências mais altas. De fato, enquanto o pico na frequência 0,9469 rad/s está intimamente relacionado aos coeficientes aerodinâmicos do modelo rígido, o pico na frequência 13,3587 rad/s está essencialmente relacionado com a incerteza em frequências naturais dos modos flexíveis. Por exemplo, o pico em 0,9469 rad/s na FIG. 4.28 é praticamente inexistente na FIG. 4.31, porque na análise-ν realizada a faixa de variação dos coeficientes aerodinâmicos foi restringida (2% de desvio) de forma a mantêlos longe da fronteira de estabilidade. Para corroborar com a explicação acima, considere a situação oposta: assumindo que as frequências naturais dos modos flexíveis não sofram variação maior do que 2%, para qual faixa de valores dos coeficientes aerodinâmicos o sistema em malha fechada mantém89 se estável? Limitantes de ν obtidos para esse novo cenário são mostrados na FIG. 4.34. FIG. 4.34: Limitantes de ν: avião flexível (restrição na faixa de variação das frequências naturais dos modos flexíveis). Agora, nos casos LS e LI PI, ∆c = ∆ (∆c ∈ R20×20 ), ∆v envolve os 14 coeficientes aerodinâmicos (∆v ∈ R14×14 ) e ∆f envolve as 6 frequências naturais (∆f ∈ R6×6 ). Para o caso LI ND-EE, ∆c = ∆aum (∆c ∈ R66×66 ), com ∆f envolvendo a frequência como um parâmetro incerto mais as 6 frequências naturais dos modos flexíveis (∆f ∈ R52×52 ) e ∆v envolvendo os 14 coeficientes aerodinâmicos (∆v ∈ R14×14 ). Mais uma vez, a técnica de otimização não-diferenciável com abordagem por espaço de estados tem bom desempenho, determinando um valor de pico de 2,8978 na frequência crítica de 0,9667 rad/s. As FIGs. 4.35 e 4.36 indicam que as incertezas encontradas são realmente desestabilizantes. Dessa vez, com uma grade de frequências com 1000 pontos logaritmicamente espaçados, LS parece coincidir com LI ND-EE, mas o algoritmo PI novamente se mostra ineficiente. Como previsto, as FIGs. 4.28 e 4.34 são muito semelhantes na região de baixas frequências. Por outro lado, os picos de alta frequência praticamente desaparecem na FIG. 4.34, já que dessa vez foi a faixa de variação das frequências naturais dos modos flexíveis que foi restringida. 90 FIG. 4.35: Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (2a análise ν). FIG. 4.36: Análise de singularidade via menor valor singular (ND-EE): avião flexível (2a análise ν). 91 5 CONCLUSÃO 5.1 VISÃO GERAL DO TRABALHO Nesse trabalho, foi proposta uma nova técnica baseada em otimização não-diferenciável para obtenção de limitantes inferiores para o valor singular estruturado µ e para o valor singular estruturado oblíquo ν, duas valiosas ferramentas utilizadas na análise de robustez de sistemas incertos. Foram apresentadas duas abordagens distintas, uma que utiliza grade de frequências (LI ND-GF) e outra que considera a frequência como um parâmetro incerto variando dentro de um intervalo pré-determinado (LI ND-EE). O cálculo dos limitantes foi realizado através de eficiente algoritmo dotado de certificado de convergência global e otimalidade local. No âmbito deste trabalho, foi aceito para apresentação oral na 10a Conferência Brasileira de Dinâmica, Controle e Aplicações (DINCON), realizada entre 28 de agosto e 2 de setembro de 2011 em Águas de Lindóia-SP, o artigo intitulado: Análise µ via otimização não-diferenciável. Também foi submetido para o International Journal of Robust and Nonlinear Control o artigo intitulado: A non-smooth lower bound on ν. 5.2 ESTUDOS DE CASO Na primeira aplicação discutida (Seção 4.1), foi enfatizado como a escolha do ponto inicial pode impactar os resultados obtidos pela técnica não-diferenciável e também como essa limitação pode ser aproximadamente contornada adotando-se uma estratégia de múltiplos começos. A segunda aplicação (Seção 4.2) envolveu incertezas complexas. Na análise µ realizada, observou-se que o limitante superior (LS), o limitante inferior dado pelo algoritmo gain based (LI GB) e o limitante inferior via otimização não-diferenciável com grade de frequências (LI ND-GF) foram praticamente coincidentes, sugerindo que a presença de incertezas complexas tende a convexificar o problema, facilitando a obtenção do mínimo global. Também foi apresentado um teste de desempenho robusto via análise ν e novamente os limitantes encontrados foram praticamente coincidentes. A eficácia da técnica não-diferenciável ficou ilustrada. Porém, nesses casos não há margem para melhoria na 92 exatidão dos resultados. Em virtude disso, o foco de aplicação da técnica proposta parece ser os sistemas que possuam somente incertezas paramétricas. A terceira aplicação (Seção 4.3) envolveu incertezas reais repetidas. Nesse caso, a limitação das técnicas que utilizam grade de frequências na obtenção de limitantes para µ ficou evidenciada. Mesmo com a utilização de uma grade bastante densa (1000 pontos), os valores de pico dados por LS e LI GB subestimaram o valor de pico dado por LI ND-EE. Outra vantagem apresentada pelo algoritmo ND-EE foi o tempo computacional, razoavelmente menor quando comparado com LS e LI GB. Na quarta aplicação (Seção 4.4), as técnicas LI ND-GF e LI ND-EE foram utilizadas nas análises µ e ν do sistema de controle de voo longitudinal de um míssil. Em ambas as análises, o valores de pico dados por LI ND-GF e por LI ND-EE praticamente coincidiram com os valores dados por LS, sugerindo que estes representavam os verdadeiros valores de pico de µ e de ν, o que permitiu a determinação das margens de estabilidade. Finalmente, na quinta aplicação (Seção 4.5), a técnica LI ND-EE foi utilizada na obtenção de limitantes inferiores para µ e ν. O modelo do avião flexível envolveu 20 parâmetros incertos. A limitação das técnicas que utilizam grade de frequências ficou evidente nesse caso, devido à presença de modos flexíveis. Foi observado, também, que a técnica LI ND-EE apresenta bons resultados mesmo com a elevada dimensão da matriz de incertezas. Os testes numéricos realizados mostraram que em alguns casos a utilização da técnica não-diferenciável fornece limitantes inferiores mais justos em relação às técnicas mais populares atualmente disponíveis, como por exemplo, LI PI (FERRERES, 1999) e LI GB (SEILER, 2010). 5.3 SUGESTÃO PARA TRABALHOS FUTUROS Como sugestão para trabalhos futuros fica a investigação de um método que possibilite a escolha criteriosa dos pontos iniciais. A abordagem não-diferenciável proposta baseia-se em uma técnica de otimização local. Portanto, a escolha do ponto inicial pode impactar os resultados, eventualmente resultando em um limitante inferior mais conservador. Nos exemplos discutidos neste trabalho os pontos iniciais foram escolhidos de maneira aleatória. As limitações impostas por essa medida foram aproximadamente contornadas adotando-se uma estratégia de múltiplos começos. No entanto, essa estratégia pode au- 93 mentar razoavelmente o tempo computacional, sobretudo quando se utiliza a técnica com grade de frequências. 94 6 REFERÊNCIAS BIBLIOGRFICAS ACKERMANN, J. e SIENEL, W. What is a ’large’ number of parameters in robust systems? Em Decision and Control, 1990., Proceedings of the 29th IEEE, volume 6, págs. 3496 – 3497 vol.6, dec 1990. BATES, D. G. e MANNCHEN, T. Improved computation of mixed µ bounds for flight control law robustness analysis. Proceedings of the Institution of Mechanical Engineers, Part I: Journal of Systems and Control Engineering, 218(8):609–619, 2004. BLONDEL, V. D. e TSITSIKLIS, J. N. A survey of computational complexity results in systems and control. Automatica, 36(9):1249 – 1274, 2000. ISSN 0005-1098. CLARKE, F. H. Optimization and Nonsmooth Analysis. Canadian Math. Soc. Series. John Wiley & Sons, New York, 1983. DAILEY, R. L. A new algorithm for the real structured singular value. Em American Control Conference, 1990, págs. 3036 –3040, may 1990. DENNIS, JR., J. E. e SCHNABEL, R. B. Numerical Methods for Unconstrained Optimization and Nonlinear Equations (Classics in Applied Mathematics, 16). Soc for Industrial & Applied Math, 1996. ISBN 0898713641. DOYLE, J. C. Analysis of feedback systems with structured uncertainty. IEE Proceedings, 129(6):242–250, 1982. ELGERSMA, M., F. J. e MORTON, B. Polynomial methods for the structured singular value with real parameters. Em Decision and Control, 1992., Proceedings of the 31th IEEE, volume 1, págs. 237 –242 vol.4, dec 1992. FAN, M. K. H. e TITS, A. L. A measure of worst-case H∞ performance and of largest acceptable uncertainty. Systems & Control Letters, 18(6):409 – 421, 1992. ISSN 01676911. FAN, M., TITS, A. e DOYLE, J. Robustness in the presence of mixed parametric uncertainty and unmodeled dynamics. Automatic Control, IEEE Transactions on, 36(1):25 –38, jan 1991. ISSN 0018-9286. FERRERES, G., BIANNIC, J. e MAGNI, J. A skew mu toolbox (SMT) for robustness analysis. Em Computer Aided Control Systems Design, 2004 IEEE International Symposium on, págs. 309 –314, sept. 2004. FERRERES, G. e FROMION, V. Robustness analysis using the ν tool. Em Decision and Control, 1996., Proceedings of the 35th IEEE, volume 4, págs. 4566 –4570 vol.4, dec 1996. 95 FERRERES, G. e FROMION, V. Computation of the robustness margin with the skewed µ tool. Systems & Control Letters, 32(4):193 – 202, 1997. ISSN 0167-6911. FERRERES, G. A Practical Approach to Robustness Analysis with Aeronautical Applications. Klumer Academic, 1999. FERRERES, G. e BIANNIC, J.-M. Reliable computation of the robustness margin for a flexible aircraft. Control Engineering Practice, 9(12):1267 – 1278, 2001. ISSN 0967-0661. FU, M. The real structured singular value is hardly approximable. Automatic Control, IEEE Transactions on, 42(9):1286 –1288, sep 1997. ISSN 0018-9286. GLAVASKI, S. e TIERNO, J. Advances in worst-case h∞ performance computation. Em Control Applications, 1998. Proceedings of the 1998 IEEE International Conference on, volume 1, págs. 668 –673 vol.1, sep 1998. HAYES, M. J., BATES, D. G. e POSTLETHWAITE, I. New tools for computing tight bounds on the real structured singular value. Journal of Guidance, Control, and Dynamics, 24(6):1204–1213, 2001. HIRIART-URRUTY, J.-B. e LEMARECHAL, C. Convex Analysis and Minimization Algorithms I: Fundamentals (Grundlehren Der Mathematischen Wissenschaften). Springer, October 1993. ISBN 0387568506. HOLLAND, R., YOUNG, P. e ZHU, C. Development of a skew µ lower bound. International Journal of Robust and Nonlinear Control, 15(11):495–506, 2005. ISSN 1099-1239. MEINSMA, G., SHRIVASTAVA, Y. e FU, M. A dual formulation of mixed µ and on the losslessness of (D, G) scaling. Automatic Control, IEEE Transactions on, 42(7):1032 –1036, jul 1997. NEWLIN, M. e GLAVASKI, S. Advances in the computation of the µ lower bound. Em American Control Conference, 1995. Proceedings of the, volume 1, págs. 442 –446 vol.1, jun 1995. PACKARD, A. e DOYLE, J. The complex structured singular value. Automatica, 29: 71–109, January 1993a. ISSN 0005-1098. PACKARD, A. e PANDEY, P. Continuity properties of the real/complex structured singular value. Automatic Control, IEEE Transactions on, 38(3):415 –428, mar 1993b. ISSN 0018-9286. POLAK, E. On the mathematical foundations of nondifferentiable optimization in engineering design. SIAM Rev., 29(1):21–89, 1987. ISSN 0036-1445. POLAK, E. Optimization: algorithms and consistent approximations. Springer-Verlag New York, Inc., New York, NY, USA, 1997. ISBN 0-387-94971-2. SEILER, P., PACKARD, A. e BALAS, G. J. A gain-based lower bound algorithm for real and mixed µ problems. Automatica, 46(3):493 – 500, 2010. ISSN 0005-1098. 96 SIDERIS, A. Elimination of frequency search from robustness tests. Automatic Control, IEEE Transactions on, 37(10):1635 –1640, oct 1992. ISSN 0018-9286. SKOGESTAD, S. e POSTLETHWAITE, I. Multivariable Feedback Control: Analysis and Design. John Wiley & Sons, 2005. ISBN 0470011688. STRANG, G. Linear Algebra and Its Applications. Brooks Cole, julho 2005. ISBN 0030105676. WISE, K. A. A comparison of six robustness tests evaluating missile autopilot robustness to uncertain aerodynamics. Em American Control Conference, 1990, págs. 755 –763, may 1990. YOUNG, P. M. Structured singular value approach for systems with parametric uncertainty. International Journal of Robust and Nonlinear Control, 11(7):653–680, 2001. ISSN 1099-1239. YOUNG, P. M., NEWLIN, M. P. e DOYLE, J. C. Practical computation of the mixed µ problem. Em American Control Conference, 1992, págs. 2190 –2194, june 1992. YOUNG, P. e DOYLE, J. A lower bound for the mixed µ problem. Automatic Control, IEEE Transactions on, 42(1):123 –128, jan 1997. ISSN 0018-9286. ZHOU, K., DOYLE, J. C. e GLOVER, K. Robust and optimal control. Prentice-Hall, Inc., Upper Saddle River, NJ, USA, 1996. ISBN 0-13-456567-3. ZOWE, J. Optimization with nonsmooth data. OR Spectrum, 9:195–201, 1987. 97 7 APÊNDICES 7.1 TRANSFORMAÇÕES FRACIONAIS LINEARES As Transformações Fracionais Lineares (LFT, do inglês Linear Fractional Transformations) amplamente utilizadas na literatura de controle foram introduzidas em (DOYLE, 1984). Essas funções de matrizes são ferramentas muito poderosas na análise e projeto de sistemas. Considere uma matriz P de dimensões (n1 + n2 ) × (m1 + m2 ) particionada da seguinte forma: " P = P11 P12 # . (7.1) P21 P22 Deixe as matrizes ∆ ∈ Cm1 ×n1 e K ∈ Cm2 ×n2 ter suas dimensões compatíveis, respectivamente, com as partições superior e inferior de P . Adota-se a seguinte notação para representar as LFT superior e inferior: Fu (P, ∆) = P22 + P21 ∆(I − P11 ∆)−1 P12 , (7.2) Fl (P, K) = P11 + P12 K(I − P22 K)−1 P21 , (7.3) onde o subescrito u significa superior (upper) e l inferior (lower). A LFT inferior Fu (P, K) é a função de transferência de w para z, obtida com a realimentação positiva K na partição inferior de P , conforme ilustrado na FIG. 7.1. FIG. 7.1: LFT inferior em função de K O diagrama em blocos mostrado na FIG. 7.1 pode ser reescrito como: z = P11 w + P12 u, v = P21 w + P22 u, 98 u = Kv. (7.4) Eliminando u e v em (7.5), obtém-se: z = Fl (P, K)w = P11 + P12 K(I − P22 K)−1 P21 w. (7.5) De maneira análoga, a LFT superior conforme ilustrado na FIG. 7.2, Fu (P, ∆), é obtida pela realimentação positiva ∆ na partição superior de P . FIG. 7.2: LFT superior em função de ∆ 7.1.1 INTERCONEXÃO DE LFT Uma propriedade importante das LFT é que a interconexão de LFT também é uma LFT. Considere a FIG. 7.3, onde R é escrito como a LFT inferior envolvendo Q e K 0 , K 0 por sua vez é a LFT inferior envolvendo M e K. FIG. 7.3: Interconexão de LFTs resulta em uma LFT Deseja-se expressar R diretamente como uma LFT em termos de K. Uma vez que R = Fl (Q, K 0 ), onde K 0 = Fl (M, K), 99 (7.6) o objetivo é obter P em termos de Q e M tal que: R = Fl (P, K). (7.7) Obtém-se: " # " # P11 P12 Q11 + Q12 M11 (I − Q22 M11 )−1 Q21 Q12 (I − M11 Q22 )−1 M12 P = = . P21 P22 M21 (I − Q22 M11 )−1 Q21 M22 + M21 Q22 (I − M11 Q22 )−1 M12 (7.8) Aplicam-se expressões similares quando são usadas LFT superiores. Para R = Fu (M, ∆0 ), onde ∆0 = Fu (Q, ∆), (7.9) escreve-se R = Fu (P, ∆), com P obtido, em termos de Q e M , por (7.8). 7.2 AUTOVALORES E AUTOVETORES Seja A uma matriz quadrada n × n. Os autovalores λi , i = 1, 2, . . . , n de A são as n soluções da equação característica: det(A − λI) = 0. (7.10) O autovetor à direita, ti , correspondente ao autovalor λi é a solução não-trivial (ti 6= 0) para: (A − λi I)ti = 0 ⇔ Ati = λi ti . (7.11) O autovetor à esquerda correspondente, qi , satisfaz: qiH (A − λi I) = 0 ⇔ qiH A = λi qiH . (7.12) Os autovalores também são chamados de ganhos característicos. O conjunto de autovalores de A é chamado de espectro de A e o maior valor absoluto entre os autovalores é o raio espectral, ρ(A): ρ(A) , max(|λi (A)|). i (7.13) Normalmente trabalha-se com autovetores normalizados, isto é, tH i ti = 1. Isso é possível graças à propriedade de que se t é um autovetor então αt também é, para qualquer α constante. Um resultado importante é que autovalores distintos geram autovetores linearmente independentes. 100 Os autovetores podem ser organizados de maneira a representar as colunas de uma matriz T e os autovalores λ1 , λ2 , . . . , λn os elementos da matriz diagonal Λ: T = {t1 , t2 , . . . , tn } ; Λ = diag {λ1 , λ2 , . . . , λn } . (7.14) Então, a equação (7.11) pode ser reescrita como: AT = T Λ. (7.15) T é a matriz de transformação utilizada para a diagonalização da matriz A quando esta possui autovetores linearmente independentes tal que T −1 existe (isto sempre ocorre para autovalores distintos, mas pode ocorrer também em outros casos, por exemplo A = I). Da equação (7.15) obtém-se a fórmula para a diagonalização: Λ = T −1 AT. (7.16) Serão enumeradas algumas propriedades dos autovalores: • A soma dos autovalores de A é igual ao traço de A (soma dos elementos da diagonal): P trA = λi . i • O produto dos autovalores de A é igual ao determinante de A: det(A) = Q λi . i • Os autovalores de uma matriz triangular superior são iguais aos elementos da diagonal. • Para uma matriz real os autovalores ou são reais ou pares complexos conjugados. • A e AT possuem os mesmos autovalores (mas autovetores diferentes). • A inversa A−1 existe se e somente se todos os autovalores de A forem diferentes de zero. Nesse caso, A−1 tem autovalores 1 , . . . , λ1n . λ1 • A matriz (cI + A) tem autovalores c + λi . • A matriz cAk , onde k é um inteiro tem os autovalores cλki . 101 7.3 VALORES SINGULARES Os valores singulares de uma matriz complexa An×m , representados por σi (A), i = 1, · · · , k, são as k raízes quadradas não negativas dos autovalores de AH A (ou AAH ), onde k = min(n, m), ou seja: σi (A) = p λi (AH A) i = 1, 2, . . . , k. (7.17) Um modo de representar uma matriz de forma a expor sua estrutura interna é a chamada Decomposição em Valores Singulares (DVS). Para uma matriz An×m a DVS é dada por: A = U ΣV H = k X σi (A)ui viH , (7.18) i=1 onde Un×n e Vm×m são matrizes unitárias formadas por vetores colunas dados por: U = (u1 , u2 , . . . , un ), V = (v1 , v2 , . . . , vm ), e Σn×m contém a matriz diagonal Σ1 com os valores singulares σi , reais e não negativos, arranjados em ordem decrescente: " Σ= Σ1 # ; n≥m (7.19) 0 ou h i Σ = Σ1 0 ; n≤m (7.20) e Σ1 = diag(σ1 , σ2 , . . . , σk ); k = min(m, n), (7.21) onde σ = σ1 ≥ σ2 ≥ . . . ≥ σk = σ. (7.22) Esta decomposição não é única, uma vez que as matrizes U e V não são únicas. Contudo, os σi são únicos. Como U e V são unitárias, posto(A) = posto(Σ). Então se posto(A) = k, somente os k primeiros valores singulares são positivos, os demais são iguais a zero. Pode ser mostrado que as colunas de U e V são os autovetores unitários de AAH e de AH A respectivamente, conhecidos como vetores singulares à esquerda e à direita da matriz A. 102 A partir dos valores singulares é possível definir o chamado número de condicionamento, grandeza dependente da frequência que em análise numérica mede o quão próximo da singularidade está uma matriz: cond(A) = σ(A) . σ(A) (7.23) σ também é utilizado como indicador de singularidade, quanto mais próximo de zero for o valor de σ(A), mais próxima da singularidade está a matriz A. Um resultado importante encontrado em (SKOGESTAD, 2005) é o maior valor singular de uma matriz bloco diagonal : " #! A 0 σ = max {σ(A), σ(B)} . 0 B (7.24) 7.4 CRITÉRIO DE NYQUIST GENERALIZADO Considere o sistema MIMO (Multiple-Imput Multiple-Output) em malha fechada com realimentação negativa, mostrado na FIG. 7.4 e assuma que não ocorram cancelamentos internos de pólos do semiplano da direita na matriz de transferência L(s), isto é, L(s) não possui modos instáveis escondidos. FIG. 7.4: Sistema com realimentação negativa O Teorema de Nyquist Generalizado permite avaliar a estabilidade do sistema em malha fechada a partir da resposta em frequência L(jω). Teorema 7.1 (Teorema de Nyquist Generalizado (SKOGESTAD, 2005)). Deixe Pol denotar o número de pólos instáveis de malha aberta em L(s) . O sistema em malha fechada com realimentação negativa é estável se, e somente se, o diagrama de Nyquist de det(I + L(s)) realizar Pol envolvimentos da origem no sentido anti-horário e não passar pela origem. O estudo detalhado da análise de estabilidade no domínio da frequência e a prova do Teorema 7.1 podem ser encontrados em (SKOGESTAD, 2005). 103 7.5 FÓRMULA DE SCHUR O determinante da matriz A com a seguinte partição: " # A11 A12 A= , A21 A22 é dado por det(A) = det(A11 ) det(A22 − A21 A−1 11 A12 ), (7.25) det(A) = det(A22 ) det(A11 − A12 A−1 22 A21 ), (7.26) ou assumindo que A11 e/ou A22 são não-singulares. 104