texto completo - Mestrado em Engenharia Elétrica

Transcrição

INSTITUTO MILITAR DE ENGENHARIA
CÁLCULO DE LIMITANTE INFERIOR PARA O VALOR
SINGULAR ESTRUTURADO VIA OTIMIZAÇÃO
NÃO-DIFERENCIÁVEL
Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para obtenção do título de
Mestre em Ciências em Engenharia Elétrica.
Orientador: Cap Alberto Mota Simões - Dr. ISAE
Rio de Janeiro
2012
c2012
Praça General Tibúrcio, 80-Praia Vermelha
Rio de Janeiro-RJ CEP 22290-270
Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-lo
em base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de
arquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecas
deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a
ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem finalidade
comercial e que seja feita a referência bibliográfica completa.
Os conceitos expressos neste trabalho são de responsabilidade do autor e do orientador.
L557 Lemos, Rodrigo Garrido da Silva
Cálculo de limitante inferior para o valor singular estruturado
via otimização não-diferenciável / Rodrigo Garrido da Silva Lemos.
- Rio de Janeiro : Instituto Militar de Engenharia, 2012.
104 p.: il.
Dissertação (mestrado) - Instituto Militar de Engenharia - Rio
de Janeiro, 2012.
1. Engenharia elétrica (teses e dissertações). 2. Controle
robusto 3. Valor Singular Estruturado 4. Otimização nãodiferenciável I. Título II. Instituto Militar de Engenharia.
CDD 621.3822
2
RODRIGO GARRIDO DA SILVA LEMOS
CÁLCULO DE LIMITANTE INFERIOR PARA O VALOR SINGULAR
ESTRUTURADO VIA OTIMIZAÇÃO NÃO-DIFERENCIÁVEL
Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica
do Instituto Militar de Engenharia, como requisito parcial para obtenção do título de
Mestre em Ciências em Engenharia Elétrica.
Orientador: Cap Alberto Mota Simões - Dr. ISAE
Aprovada em 09 de Março 2012 pela seguinte Banca Examinadora:
Cap Alberto Mota Simões - Dr. ISAE do IME
Cel Paulo César Pellanda - Dr. ENSAE do IME
Ricardo Hiroshi Caldeira Takahashi - Dr. UNICAMP da UFMG
Leonardo Antônio Borges Tôrres - Dr. UFMG da UFMG
Rio de Janeiro
2012
3
À minha mãe.
4
AGRADECIMENTOS
Ao meu orientador, Cap Alberto Mota Simões, pela dedicação, atenção e compreensão dispensados, que somados ao compartilhamento de notório saber possibilitaram o
desenvolvimento desse trabalho.
Aos meus pais, Nelson da Silva Lemos e Iris Garrido da Silva Lemos, in memorian,
por tudo.
Ao meu primo, Andersen, pelos constantes apoio e incentivo, sem os quais esse objetivo jamais teria sido alcançado.
À minha esposa, Ana Paula, por dividir comigo, a cada dia, os risos dos momentos
felizes e as lágrimas dos momentos tristes.
Aos meus familiares, que contribuíram de maneira significante com a minha formação, em especial ao meu irmão Rafael, às minhas tias Isis e Célia e à minha madrinha
Conceição.
Ao Exército Brasileiro, pelo significativo investimento e pelo voto de confiança.
5
Epígrafe
“Julgue seu sucesso pelas coisas que
você teve que renunciar para conseguir.”
Dalai Lama
6
SUMÁRIO
LISTA DE ILUSTRAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
LISTA DE SMBOLOS E ABREVIATURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1
INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1
Motivação do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2
Organização da dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2
ANÁLISE DE ROBUSTEZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1
Caracterização das incertezas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2
Quadro de trabalho para a análise de robustez . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1
Representação de incertezas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.2
Definições de estabilidade e desempenho robustos . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3
Estabilidade robusta na estrutura M ∆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3
Valor singular estruturado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1
Estabilidade robusta para bloco de incertezas diagonal . . . . . . . . . . . . . . . . . . 30
2.4
Valor singular estruturado oblíquo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5
Desempenho robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1
Teste-µ para desempenho robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.6
Análise µ por espaço de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3
ELEMENTOS DE OTIMIZAÇÃO NÃO-DIFERENCIÁVEL . . . . . 41
3.1
Análise não-diferenciável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.1
Introducão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.2
Subdiferencial de uma função convexa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1.3
Subdiferencial de Clarke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.1.4
Regras de cálculo do subdiferencial de Clarke . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2
Técnica de otimização não-diferenciável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.1
Algoritmo de penalização exata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.2
Detalhes da implementação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7
4
APLICAÇÕES NUMÉRICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.1
Exemplo com incertezas puramente reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2
Exemplo com incertezas mistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.3
Sistema massa-mola-amortecedor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.4
Sistema de controle de voo longitudinal de míssil . . . . . . . . . . . . . . . . . . . . . . . 74
4.5
Avião flexível . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5
CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.1
Visão geral do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.2
Estudos de caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.3
Sugestão para trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
6
REFERÊNCIAS BIBLIOGRFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7
APÊNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.1
Transformações Fracionais Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.1.1
Interconexão de LFT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7.2
Autovalores e autovetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
7.3
Valores singulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.4
Critério de Nyquist Generalizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.5
Fórmula de Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
8
LISTA DE ILUSTRAÇÕES
FIG.2.1
Incerteza multiplicativa de entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
FIG.2.2
Estrutura M ∆ para análise de robustez em estabilidade . . . . . . . . . . . . . . 24
FIG.2.3
Estrutura N ∆ para análise de robustez em desempenho . . . . . . . . . . . . . . 24
FIG.2.4
Forma padrão para síntese de controladores . . . . . . . . . . . . . . . . . . . . . . . . . 25
FIG.2.5
Estrutura M ∆ particionada para análise ν . . . . . . . . . . . . . . . . . . . . . . . . . 31
ˆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Estrutura G∆
FIG.2.6
FIG.2.8
∆p incluso na estrutura N ∆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
ˆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Estrutura N ∆
FIG.2.9
Teste µ - espaço de estados
FIG.3.1
Interpretação geométrica do subdiferencial de uma função convexa
FIG.2.7
(HIRIART-URRUTY, 1993)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
FIG.3.2
Interpretação geométrica do subdiferencial de Clarke
. . . . . . . . . . . . . . . . 47
FIG.4.1
Limitantes de µ com 1 ponto inicial: 1a aplicação . . . . . . . . . . . . . . . . . . . 60
FIG.4.2
Limitantes de µ com 5 pontos iniciais: 1a aplicação . . . . . . . . . . . . . . . . . . 61
FIG.4.3
Limitantes de µ com 10 pontos iniciais: 1a aplicação . . . . . . . . . . . . . . . . . 62
FIG.4.4
Análise de singularidade via menor valor singular (GB/ND-GF): 1a
aplicação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
FIG.4.5
Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): 1a aplicação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
FIG.4.6
Diagramas de blocos do sistema em malha fechada: 2a aplicação. . . . . . . 63
FIG.4.7
Limitantes de µ: 2a aplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
FIG.4.8
Análise de singularidade via menor valor singular (GB/ND-GF): 2a
aplicação (estabilidade robusta). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
FIG.4.9
Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): 2a aplicação (estabilidade robusta). . . . . . . . . . . . . 66
FIG.4.10 Limitantes para o pior caso de ganho da transferência F : 2a aplicação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
FIG.4.11 Análise de singularidade via menor valor singular (ND-GF): 2a aplicação (desempenho robusto). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
9
FIG.4.12 Análise de singularidade via recíproco do número de condicionamento (ND-GF): 2a aplicação (desempenho robusto). . . . . . . . . . . . . . . . 69
FIG.4.13 Sistema massa-mola-amortecedor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
FIG.4.14 Limitantes de µ: massa-mola-amortecedor. . . . . . . . . . . . . . . . . . . . . . . . . . 71
FIG.4.15 Análise de singularidade via menor valor singular (ND-EE): massamola-amortecedor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
FIG.4.16 Análise de singularidade via recíproco do número de condicionamento (ND-EE): massa-mola-amortecedor.
FIG.4.17 Diagrama de blocos do míssil.
. . . . . . . . . . . . . . . . . . . . . . . . 73
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
FIG.4.18 Limitantes de µ: míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
FIG.4.19 Análise de singularidade via menor valor singular (ND-EE): míssil
(análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
FIG.4.20 Análise de singularidade via recíproco do número de condicionamento (ND-EE): míssil (análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
FIG.4.21 Limitante de µ: míssil (Mα e Mβ reduzidos). . . . . . . . . . . . . . . . . . . . . . . . . 78
FIG.4.22 Análise de singularidade via menor valor singular para (GB/NDGF): míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
FIG.4.23 Análise de singularidade via recíproco do número de condicionamento (GB/ND-GF): míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
FIG.4.24 Limitantes de ν: míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
FIG.4.25 Análise de singularidade via menor valor singular (ND-EE): míssil
(análise ν). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
FIG.4.26 Análise de singularidade via recíproco do número de condicionamento (ND-EE): míssil (análise ν). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
FIG.4.27 Limitante para µ - míssil: Zα e Zβ reduzidos . . . . . . . . . . . . . . . . . . . . . . . 83
FIG.4.28 Limitantes de µ - avião flexível. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
FIG.4.29 Análise de singularidade via menor valor singular (ND-EE): avião
flexível (análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
FIG.4.30 Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (análise µ). . . . . . . . . . . . . . . . . . . . . . . . . . 86
FIG.4.31 Limitantes de ν - avião flexível: restrição na faixa de variação dos
coeficientes aerodinâmicos do modelo rígido. . . . . . . . . . . . . . . . . . . . . . . . 87
10
flexível (1a análise ν.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
FIG.4.33 Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (1a análise ν). . . . . . . . . . . . . . . . . . . . . . . 89
FIG.4.34 Limitantes de ν: avião flexível (restrição na faixa de variação das
frequências naturais dos modos flexíveis). . . . . . . . . . . . . . . . . . . . . . . . . . . 90
FIG.4.35 Análise de singularidade via recíproco do número de condicionamento (ND-EE): avião flexível (2a análise ν). . . . . . . . . . . . . . . . . . . . . . . 91
flexível (2a análise ν). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
FIG.7.1
LFT inferior em função de K
FIG.7.2
LFT superior em função de ∆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
FIG.7.3
Interconexão de LFTs resulta em uma LFT
FIG.7.4
Sistema com realimentação negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
11
. . . . . . . . . . . . . . . . . . . . . . . . 99
LISTA DE SMBOLOS E ABREVIATURAS
ABREVIATURAS
VANT
-
Veículo Aéreo Não-Tripulado
UAV
-
Unmanned Aerial Vehicle
LFT
-
Linear Fractional Transformations
PI
-
Power Iteration
GBLB
-
Gain Based Lower Bound
EN
-
Estabilidade Nominal
ER
-
Estabilidade Robusta
DN
-
Desempenho Nominal
DR
-
Desempenho Robusto
LS
-
Limitante Superior
LI GB
-
Limitante Inferior Gain Based
LI ND-GF
-
Limitante Inferior Não-Diferenciável Grade de Frequências
LI ND-EE
-
Limitante Inferior Não-Diferenciável Espaço de Estados
LS-WC
-
Limitante Superior Worst Case
LI-WC
-
Limitante Inferior Worst Case
FIG(s)
-
Figura(s)
TEO(s)
-
Teorema(s)
EQ(s)
-
Equação(ções)
MIMO
-
Multiple-Imput Multiple-Output
CQP
-
Convex Quadratic Programming
SDP
-
Semidefinite Programming
,
-
igual, por definição
∀
-
para todo
⇒
-
se, então
⇔
-
se, somente se
SÍMBOLOS
12
2
-
fim de demonstração
a∈A
-
a pertence ao conjunto A
R
-
conjunto dos números reais
Rn×m
-
matriz real com n linhas e m colunas
Rn
-
vetor coluna real com n elementos
C
-
conjunto dos números complexos
Cn×m
-
matriz complexa com n linhas e m colunas
Cn
-
vetor coluna complexo com n elementos
co
-
fecho convexo de um conjunto
M
T
-
transposta da matriz M
M
∗
-
adjunta da matriz M
MH
-
transposta conjugada da matriz M
Ip
-
matriz identidade de ordem p
Tr
-
traço da matriz quadrada
det
-
determinante da matriz
Re
-
parte real de uma matriz
Im
-
parte imaginária de uma matriz
λ
-
autovalor
q
-
autovetor
ρ
-
raio espectral
Hm
-
conjunto de matrizes hermitianas de ordem m
X0
-
matriz X é positiva definida
X0
-
matriz X é positiva semidefinida
X ∗Y
-
produto estrela de Redheffer entre as matrizes X e Y
µ
-
valor singular estruturado
ν
-
valor singular estruturado oblíquo
σ
-
valor singular
σ
-
maior valor singular
σ
-
menor valor singular
B(δ, ρ)
-
bola de raio ρ > 0 centrada no ponto δ
Jf (δ)
-
matriz jacobiana para o campo vetorial f(·) em δ
δj
-
j-ésima componente do vetor δ ∈ Rn
13
∂f (δ)
-
subdiferencial de Clarke em δ
Epi(f )
-
Epígrafo da função f
f 0 (δ; h)
-
derivada direcional de δ na direção h
∇δ f (δ, y)
-
gradiente em relação à primeira variável
Fu
-
LFT superior
Fl
-
LFT inferior
14
RESUMO
Este trabalho trata da análise de robustez de sistemas incertos via otimização nãodiferenciável.
É proposta uma nova técnica baseada em otimização não-diferenciável para o cálculo
de limitante inferior para o valor singular estruturado µ e para o valor singular estruturado
oblíquo ν (skewed-µ), duas valiosas ferramentas para análise de robustez de sistemas
incertos. µ e ν podem ser aplicados na análise de robustez de controladores utilizados em
aplicações militares como mísseis e Veículos Aéreos Não-Tripulados (VANT). Exemplos
numéricos mostram que em alguns casos os limitantes inferiores encontrados, tanto para
µ quanto para ν, são iguais aos seus valores verdadeiros. Para o cálculo dos limitantes
é utilizado um eficiente algoritmo de otimização dotado de certificado de convergência
e otimalidade local. Em virtude da eficiência da técnica não-diferenciável, o algoritmo
pode ser aplicado para resolver, até mesmo, problemas que envolvam um significativo
número de incertezas paramétricas. Outra característica interessante da abordagem nãodiferenciável proposta é o pequeno impacto causado no tempo computacional pelo número
de repetições das incertezas escalares no bloco estruturado das incertezas.
Para algumas aplicações desafiadoras, como as discutidas neste trabalho, a técnica
proposta pode fornecer limitantes inferiores menos conservadores quando comparada com
as técnicas mais populares atualmente disponíveis.
15
ABSTRACT
This work deals with robustness analysis of uncertain systems by non-smooth optimization.
It is proposed a new technique based on non-smooth optimization to directly compute
lower bounds on the structured singular value µ and the skew structured singular value
ν, which are two valuable tools for robustness analysis of uncertain systems. µ and ν can
be applied to the robustness analysis of controllers used in military applications such as
missiles and Unmanned Aerial Vehicles (UAV). Numerical examples show that in some
cases the lower bounds found for both µ and ν are equal to their true values. For the
computation of bounds is used an optimization algorithm endowed with a certificate of
convergence and local optimality. Thanks to the efficiency of the non-smooth technique,
the algorithm can be applied to solve problems that involve even a significant number
of parametric uncertainties. Another interesting feature of the proposed non-smooth
approach is the little impact of dimension of repeated scalar uncertainties in the overall
structured uncertainty matrix on the computational time.
For some challenging applications, such as those discussed in this work, the proposed
technique can provide tighter lower bounds when compared with the most popular techniques currently available.
16
1 INTRODUÇÃO
Modelos matemáticos não possuem a capacidade de descrever com exatidão o comportamento de sistemas físicos reais. No entanto, muitas vezes, para fins de análise e projeto,
é conveniente utilizá-los para se obter uma aproximação do comportamento de um determinado sistema. Para muitas aplicações as aproximações se mostram eficazes, mas em
algumas circunstâncias, sobretudo em sistemas de alto desempenho, é possível que um
projeto de controle forneça bons resultados na simulação de seu modelo nominal, mas não
seja aplicável ao sistema físico real. Esse problema surge na medida em que o modelo não
é suficientemente preciso. A Teoria de Controle Robusto (ZHOU, 1996) (SKOGESTAD,
2005) leva em conta as incertezas e imprecisões inerentes ao modelo, visando possibilitar
uma análise sistemática e o desenvolvimento de técnicas de projeto para o tratamento
dessas incertezas.
O ponto de partida é considerar um modelo nominal e o conjunto de incertezas que o
afeta. O sistema obtido é dito robusto se mantém suas propriedades mesmo sob influência
dessas incertezas. Duas propriedades que são especialmente avaliadas são a estabilidade e
o desempenho. Problemas de controle robusto seguem basicamente duas linhas: a análise
de robustez e a síntese de controladores robustos. A primeira consiste em avaliar as
propriedades de um sistema dado (em geral, planta e controlador) sob influência de um
conjunto de incertezas. A segunda consiste em projetar um controlador que atenda, em
malha fechada, as condições de robustez requeridas. Essa dissertação abordará o problema
de análise de robustez.
Existem várias hipóteses que podem ser adotadas para traduzir o conhecimento prévio
que se tem acerca das incertezas e esse fato gera diferentes paradigmas para análise de
robustez. Para que sejam obtidas descrições mais realistas dos sistemas físicos, é preciso
permitir que modelos matemáticos mais sofisticados sejam utilizados na representação do
conjunto de incertezas. Porém, essa medida pode acarretar dificuldades no tratamento
do problema.
Um significativo número de aplicações pode ser representado supondo-se que as incertezas sejam limitadas em norma. A medida de robustez será dada, então, em função
da menor incerteza para a qual uma determinada propriedade do sistema não seja aten17
dida. No quadro de trabalho utilizado, as diferentes fontes de incertezas são organizadas
em uma matriz bloco diagonal, o que induz uma estrutura para o conjunto. Esta configuração motiva a definição do valor singular estruturado µ (DOYLE, 1982), que é uma
ferramenta matemática utilizada para se medir a robustez de sistemas incertos sujeitos
à incertezas estruturadas. Outra grandeza utilizada para a análise de robustez é o valor
singular estruturado oblíquo ν (skewed-µ) (FAN, 1992) que consiste em uma generalização
para µ.
1.1 MOTIVAÇÃO DO TRABALHO
µ e ν são duas valiosas ferramentas utilizadas para análise de robustez de sistemas incertos. Originalmente desenvolvido para análise de robustez em estabilidade, µ também
pode ser utilizado para avaliação da robustez em desempenho via Teorema Principal de
Malha (Main Loop Theorem) (PACKARD, 1993a). No entanto, alguns problemas mais
complexos de análise de robustez só podem ser tratados através do caso mais geral, a
análise ν. Podem ser citados como exemplos típicos, a avaliação do pior caso de desempenho H∞ , a maior incerteza permitida (FAN, 1992), e a obtenção da maior incerteza
paramétrica aceitável na presença de dinâmicas negligenciadas (FERRERES, 1996), todos
apresentando grande relevância do ponto de vista da engenharia.
Uma abordagem possível para a obtenção de ν consiste na resolução iterativa de
problemas µ (SKOGESTAD, 2005). Infelizmente, o cálculo de µ não é uma tarefa trivial e
foi provado que, em geral, trata-se de um problema NP-difícil (BLONDEL, 2000). Para o
caso de incertezas puramente reais até, mesmo o cálculo de um valor aproximado de µ é um
problema NP-difícil (FU, 1997). Em virtude disso, na prática obtém-se uma estimativa do
valor de µ a partir do cálculo de limitantes superior e inferior. Em contraste com o cálculo
do limitante superior, que permite uma formulação convexa (FAN, 1991) (YOUNG, 1992),
o cálculo do limitante inferior representa um problema bem mais delicado. A obtenção de
limitantes inferiores justos tem grande importância, uma vez que que o limitante superior
pode ser conservador (MEINSMA, 1997), especialmente quando há presença de incertezas
paramétricas repetidas.
No caso puramente complexo, o algoritmo baseado no método das potências (PI,
de power iteration) (PACKARD, 1993a) geralmente fornece bons limites inferiores com
baixo tempo computacional. O método foi estendido para o caso em que há presença de
18
incertezas mistas em (YOUNG, 1997), mas infelizmente não fornece bons resultados para
algumas classes de problemas, incluindo o caso puramente real (NEWLIN, 1995). Algumas
abordagens tem sido propostas na literatura com o objetivo de contornar as limitações do
algoritmo PI nos casos de incertezas puramente reais ou mistas. O algoritmo GBLB (gainbased lower bound) (SEILER, 2010) fornece limitantes inferiores melhores em alguns casos.
Esquemas de regularização (PACKARD, 1993b) (FERRERES, 2001) podem representar
uma alternativa válida, mas geralmente é difícil inferir quão longe do problema original
está o problema resolvido. O algoritmo em tempo polinomial apresentado em (DAILEY,
1990) fornece bons resultados para o caso puramente real, mas possui a limitação de
funcionar bem somente em problemas que envolvem um número pequeno de parâmetros
incertos.
Programação não-linear foi utilizada em (HAYES, 2001) (BATES, 2004) para a obtenção de um limitante inferior para µ. No entanto, quando se utiliza técnicas de otimização
diferenciável para se tratar um problema genuinamente não-diferenciável, nenhum certificado formal de convergência ou otimalidade pode ser fornecido. De fato, existe uma longa
experiência no uso de métodos diferenciáveis clássicos para a solução de problemas nãodiferenciáveis. Na prática, ótimos locais são pontos de não diferenciabilidade (ZOWE,
1987). A utilização de métodos diferenciáveis invariavelmente provoca falhas em pontos
que não são ótimos locais mas que possuem características de não-diferenciabilidade.
Poucos trabalhos têm sido propostos tratando do cálculo direto de um limitante inferior
para ν. Em (HOLLAND, 2005), o algoritmo PI foi estendido para problemas ν. Estratégia
similares foram adotadas em (FERRERES, 1996) (GLAVASKI, 1998). Infelizmente, todas
essas técnicas enfrentam as mesmas dificuldades de convergência do algoritmo PI original.
Nessa dissertação, será apresentada uma abordagem baseada em otimização nãodiferenciável para o cálculo de limitantes inferiores para µ e ν. Para isso, um problema
de otimização não-convexa, não-diferenciável e com restrição será resolvido através de um
eficiente algoritmo dotado de certificado de convergência e otimalidade local. O objetivo principal do trabalho é comprovar a eficiência da técnica proposta, com a realização
de extensivos testes numéricos. É mostrado que para algumas aplicações desafiadoras a
técnica de otimização não-diferenciável fornece limitantes menos conservadores quando
comparada com as técnicas atualmente disponíveis. Além disso, em muitos casos o limitante inferior obtido é igual ao valor verdadeiro de µ ou de ν. Graças à eficiência do
algoritmo, o método pode ser aplicado em uma grande classe de problemas, até mesmo
19
nos casos com grande número de incertezas paramétricas. Outra característica fundamental da abordagem não-diferenciável é que a dimensão de incertezas escalares repetidas na
matriz estruturada de incertezas parece ter pequeno impacto no tempo computacional
global.
1.2 ORGANIZAÇÃO DA DISSERTAÇÃO
Além dessa introdução, a dissertação está organizada em mais 4 capítulos:
• Capítulo 2: São abordados os aspectos da teoria de controle robusto utilizados
na análise de robustez de sistemas incertos. É proposta uma formulação geral para
o tratamento das incertezas. A ideia principal é reuní-las em uma matriz blocodiagonal, dando origem a um bloco de incertezas ∆ estruturado. Em seguida é
definida a grandeza µ, ferramenta que permite, no domínio da frequência, medir
a robustez de sistemas incertos com ∆ estruturado. É proposta uma estratégia
baseada em otimização não-diferenciável para o cálculo direto de limitantes inferiores
para µ. São apresentados, ainda, testes para análise de estabilidade e desempenho
robustos que consistem, sumariamente, em realizar uma pesquisa do valor de pico de
µ em todo o domínio de frequência. Nesse capítulo, também é definida a grandeza ν.
Uma estratégia similar à primeira é adotada para obtenção de limitantes inferiores
para ν. Por fim, é apresentada uma abordagem por espaço de estados que permite
eliminar a pesquisa frequencial, tratando a frequência como um parâmetro incerto.
• Capítulo 3: São apresentados elementos de otimização não-diferenciável e é discutido como a obtenção de limitantes inferiores para µ e ν pode ser realizada através
de eficientes programas de otimização não-convexa, não-diferenciável com restrição. Cabe ressaltar aqui que a implementação do algoritmo não foi objetivo desse
trabalho, mas sim a sua aplicação em diversos problemas de controle.
• Capítulo 4: São realizados extensivos testes numéricos onde o valor prático da
técnica proposta é avaliado. Os resultados obtidos são comparados com os obtidos
pelas técnicas mais populares disponíveis atualmente.
• Capítulo 5: Finalmente, nesse capítulo, são apresentadas as conclusões do trabalho
e as perspectivas de estudos futuros.
20
2 ANÁLISE DE ROBUSTEZ
2.1 CARACTERIZAÇÃO DAS INCERTEZAS
A maioria dos projetos de controle é baseada no uso de modelos que aproximam um
determinado sistema físico. A relação entre os modelos e a realidade que eles representam
é sutil e complexa. Um modelo matemático fornece um mapa de entradas e respostas
e sua qualidade depende de quão perto essas respostas estão daquelas fornecidas pela
planta verdadeira. Nenhum modelo único é capaz de traduzir o comportamento da planta
verdadeira, precisa-se, no mínimo, de um conjunto de mapas. Obter um conjunto de
modelos que contenha a planta verdadeira é uma tarefa bastante difícil, tendo em vista
que, o universo matemático é diferente do universo de sistemas físicos. Um bom modelo
deve ser simples o suficiente para facilitar sua concepção e complexo o suficiente para
garantir sua aplicabilidade ao sistema real.
O termo incertezas refere-se às diferenças ou erros entre os modelos e a realidade
e qualquer mecanismo usado para expressar esses erros é chamado de representação de
incertezas.
As incertezas podem ter várias origens:
• Possibilidade de haver parâmetros do modelo linear que são conhecidos apenas aproximadamente ou com erro.
• Variação dos parâmetros devido à não-linearidade ou mudança do ponto de operação.
• Imperfeições nos sensores.
• Em altas frequências, a estrutura e a ordem do modelo são desconhecidos.
• Mesmo quando um modelo bastante detalhado está disponível, pode-se optar em
utilizar um modelo mais simples, porém tratável computacionalmente. As dinâmicas
negligenciadas então são representadas como incertezas.
Os vários tipos de incertezas do modelo podem ser agrupados em duas classes principais:
21
a) Incerteza paramétrica: A estrutura do modelo, incluindo sua ordem, é conhecida,
mas alguns parâmetros são incertos.
b) Dinâmicas não modeladas ou negligenciadas: O modelo utilizado não é preciso
devido ao desconhecimento de sua dinâmica, geralmente em altas frequências, à
negligências deliberadas ou por falta de compreensão do processo físico. Qualquer
modelo de um sistema real, invariavelmente, irá conter essa fonte de incerteza.
Incertezas paramétricas podem ser quantificadas a partir de um valor nominal p0 e de
uma ponderação α que determina a faixa de variação. Desta maneira, tem-se conjuntos
de parâmetros com a seguinte forma:
pp = p0 + αδp0
(2.1)
onde δ é um escalar real satisfazendo |δ| ≤ 1.
Dinâmicas não modeladas ou negligenciadas são menos precisas e mais difíceis de serem
quantificadas. Uma abordagem válida para descrever essa classe de incertezas é o domínio
da frequência, que dá origem a perturbações complexas normalizadas k∆(s)k∞ ≤ 1.
Pode ser considerada, ainda, uma terceira classe, que consiste em uma ou mais fontes
de incertezas paramétricas e/ou dinâmicas não modeladas/negligenciadas reunidas em
uma única incerteza concentrada. Como exemplos para essa classe podem ser citadas as
incertezas multiplicativas. A FIG. 2.1 ilustra uma incerteza multiplicativa de entrada.
FIG. 2.1: Incerteza multiplicativa de entrada
O conjunto de plantas incertas gerado tem a seguinte forma:
ΠI :
Gp (s) = G(s)(I + WI (s)∆I (s)),
onde WI (s) representa a ponderação.
22
|∆I (jω)| ≤ 1 ∀ω
(2.2)
2.2 QUADRO DE TRABALHO PARA A ANÁLISE DE ROBUSTEZ
2.2.1 REPRESENTAÇÃO DE INCERTEZAS
O ponto de partida para a análise de robustez é a definição de uma forma padrão para
representar os sistemas incertos, na qual todas as incertezas que os afetam são isoladas
em uma matriz bloco-diagonal, chamada de bloco de incertezas ∆:


∆1


...




∆=
,


∆
i


..
.
(2.3)
onde cada bloco ∆i pode representar uma fonte específica de incerteza, como, por exemplo,
incerteza de entrada, ∆I , ou incerteza paramétrica, δi , onde δi é real.
Define-se uma estrutura geral para o bloco de incertezas utilizando-se a seguinte notação padrão:
c
C
r
I
∆ = ∆ = diag(δ1r Ik1 , . . . , δm
I , δm
, . . . , δ1c Ikmr +mc , ∆C
1 , . . . , ∆mC )
r +1 kmr +1
r k mr
kmr +mc +i ×kmr +mc +i
: δir ∈ R, δic ∈ C, ∆C
i ∈ C
. (2.4)
Tipicamente, os escalares reais δir representam incertezas paramétricas, enquanto que os
escalares complexos δic e os blocos complexos cheios ∆C
i representam dinâmicas não modeladas ou negligenciadas. Os inteiros mr , mc and mC denotam o número de escalares
reais repetidos, escalares complexos repetidos e blocos complexos cheios, respectivamente.
O bloco de incertezas ∆ é dito complexo se é composto somente por escalares complexos ou blocos complexos cheios. É dito real se é composto somente por escalares reais.
Finalmente, se possui simultaneamente incertezas complexas e reais é dito misto.
Se o objetivo é a análise de robustez em estabilidade, utiliza-se a estrutura M ∆ (FIG.
2.2 para representar o sistema incerto, onde M (s) representa o sistema nominal.
23
FIG. 2.2: Estrutura M ∆ para análise de robustez em estabilidade
Alternativamente, se o objetivo é a análise de robustez em desempenho utiliza-se a
estrutura N ∆ mostrada na FIG. 2.3.
FIG. 2.3: Estrutura N ∆ para análise de robustez em desempenho
A Função de Transferência de w para z do sistema em malha fechada é dada pela
Transformação Fracional Linear (LFT, do inglês Linear Fractional Transformation)(Seção
7.1 do Apêndice) superior entre N e ∆,
z = Fu (N, ∆)w = N22 + N21 ∆(I − N11 ∆)−1 N12 w.
(2.5)
N (s) normalmente é obtido a partir da LFT inferior envolvendo a planta generalizada P
(SKOGESTAD, 2005) e um controlador K,
"
N (s) = Fl (P (s), K(s)) =
N11 (s) N12 (s)
#
.
(2.6)
N21 (s) N22 (s)
A FIG. 2.4 ilustra a forma padrão mais geral, envolvendo P , um controlador K e o bloco
de incertezas ∆:
24
FIG. 2.4: Forma padrão para síntese de controladores
com,


P11 (s) P12 (s) P13 (s)


.
P (s) = 
P
(s)
P
(s)
P
(s)
21
22
23


P31 (s) P32 (s) P33 (s)
(2.7)
Para se estabelecer as condições de robustez, cada incerteza individual será considerada
normalizada, ou seja:
σ (∆i (jω)) ≤ 1 ∀ω;
|δi | ≤ 1.
(2.8)
Como o maior valor singular de uma matriz bloco-diagonal é igual ao máximo entre
os maiores valores singulares dos blocos individuais (Seção 7.3), então o bloco geral de
incertezas também será normalizado:
σ (∆(jω)) ≤ 1 ∀ω ⇔ k∆k∞ ≤ 1.
(2.9)
No quadro de trabalho proposto, ∆ possui uma estrutura definida. Portanto, as condições de estabilidade e desempenho robustos serão estabelecidas para um subconjunto
que possua a estrutura dada pela EQ. 2.4 que satisfaça a EQ. 2.9.
A hipótese de considerar ∆ estável pode ser relaxada, mas as condições de robustez
tornam-se mais difíceis de serem obtidas. Além disso, se for usada a forma correta para
representar as incertezas e se for permitida a ocorrência de incertezas múltiplas, sempre
será possível gerar a classe de plantas desejada utilizando-se somente incertezas estáveis.
2.2.2 DEFINIÇÕES DE ESTABILIDADE E DESEMPENHO ROBUSTOS
Foi discutido na Seção 2.2.1 como representar um sistema incerto através da estrutura
N ∆ (FIG. 2.3). O próximo passo da análise é verificar se o sistema possui, sob influência
25
das incertezas, estabilidade e desempenho aceitável.
• Análise de estabilidade robusta: Consiste em determinar se um dado sistema incerto
permanece estável para todo ∆ permitido.
• Análise de desempenho robusto: Se há estabilidade robusta, determina-se o maior
"tamanho"da função de transferência que relaciona as entradas exógenas w com as
saídas exógenas z para todo ∆ permitido.
Na FIG. 2.3, w representa as entradas exógenas (por exemplo, distúrbios e referências
normalizados) e z representa as saídas exógenas (por exemplo, erros normalizados). A
Função de Transferência de w para z é dada pela EQ. 2.5, z = F w, onde
F , Fu (N, ∆) = N22 + N21 ∆(I − N11 ∆)−1 N12 .
(2.10)
Será usada a norma H∞ para medir o desempenho. A condição para que se tenha
desempenho robusto é kF k∞ ≤ 1, ∀ ∆ permitido.
Na estrutura N ∆, as condições de estabilidade e desempenho podem então ser resumidas como se segue:
Estabilidade Nominal (EN) ⇔ N
é internamente estável
Desempenho Nominal (DN) ⇔ kN22 k∞ < 1;
Estabilidade Robusta (ER) ⇔ F
(2.11)
e EN
(2.12)
é estável ∀∆, k∆k∞ ≤ 1;
Desempenho Robusto (DR) ⇔ kF k∞ < 1, ∀∆, k∆k∞ ≤ 1;
e EN
e EN
(2.13)
(2.14)
2.2.3 ESTABILIDADE ROBUSTA NA ESTRUTURA M ∆
Considere, em princípio, a estrutura N ∆ (FIG. 2.3) para representar um determinado
sistema incerto. A Função de Transferência de w para z é dada pela EQ. 2.10. Suponha
que o sistema possui estabilidade nominal (com ∆ = 0), o que significa dizer que todo N
é estável e não somente N22 . Suponha também que ∆ é estável. Da análise direta da EQ.
2.10 observa-se que a única fonte possível de instabilidade é o termo (I − N11 ∆)−1 . Então,
a estrutura M ∆ (FIG. 2.2) pode ser utilizada para verificar a estabilidade do sistema,
fazendo M = N11 .
O próximo passo, portanto, é reunir as condições necessárias para se verificar a estabilidade da estrutura M ∆. O teorema que segue deriva do Teorema de Nyquist Generalizado
26
(Seção 7.4) e é aplicado para os blocos de incertezas ∆, com norma H∞ limitada, mas
também pode ser aplicado para qualquer outro conjunto convexo de incertezas (isto é,
conjuntos com outras estruturas ou limitados com outros tipos de norma)
Teorema 2.1 (Condição de estabilidade do determinante (SKOGESTAD, 2005)). Assuma que o sistema nominal M (s) e o bloco das incertezas ∆(s) são estáveis. Considere
o conjunto convexo de incertezas ∆ de tal forma que, se ∆0 é permitido, então c∆0 também
é, onde c é um escalar real qualquer, tal que |c| ≤ 1. Então, o sistema M ∆ da FIG. 2.2
é estável para todo ∆ permitido (ER) se e somente se:
O diagrama de Nyquist de det (I − M ∆(s)) não envolve a origem, ∀∆
(2.15)
⇔ det (I − M ∆(jω)) 6= 0, ∀ω, ∀∆
(2.16)
⇔ λi (M ∆) 6= 1, ∀i, ∀ω, ∀∆
(2.17)
Demonstração. A condição dada pela EQ. 2.15 é simplesmente a aplicação do Teorema
de Nyquist Generalizado a um sistema com realimentação positiva e com função de transferência igual a M ∆.
(2.15) ⇒ (2.16): Esta implicação é trivial, uma vez que se o diagrama passar pela
origem, obviamente esta estará sendo envolvida.
(2.15) ⇐ (2.16): Basta provar que a negação de (2.15) implica na negação de (2.16).
Primeiramente nota-se que para ∆ = 0, det(I − M ∆) = 1 para todas as frequências.
Assuma que exista uma perturbação ∆0 tal que o diagrama de Nyquist de det(I − M ∆0 )
envolva a origem. Como o contorno de Nyquist é fechado, então existe uma outra perturbação ∆00 = c∆0 com c ∈ [0, 1] e uma frequência ω 0 tal que det(I − M ∆”(jω 0 )) = 0.
Q
(2.17) é equivalente a (2.16) pelas propriedades: det(I−A) = i λi (I−A) e λi (I−A) =
1 − λi (A) (Seção 7.2).
2.3 VALOR SINGULAR ESTRUTURADO
O valor singular estruturado µ é uma grandeza que mede a robustez de sistemas incertos sujeitos a um bloco de incertezas ∆ com estrutura definida. A sua aplicação pode
fornecer condições necessárias e suficientes tanto para estabilidade quanto para desempenho robustos.
27
Seja a estrutura M ∆ mostrada na FIG. 2.2. Da condição de estabilidade do determinante ( EQ. 2.16) tem-se que:
ER ⇔ det (I − M ∆(jω)) 6= 0, ∀ω, ∀∆,
σ(∆(jω)) ≤ 1, ∀ω
(2.18)
A motivação para a definição da grandeza µ é responder a seguinte questão: Dada
uma matriz M ∈ Cp×q , qual é o menor ∆ ∈ Cq×p (medido através do maior valor singular
σ(∆) (Seção 7.3)) tal que det(I − M ∆) = 0, ou seja, qual o menor ∆ que leva o sistema
à instabilidade?
Definição 2.1 (Valor singular estruturado µ). Seja a matriz complexa M o valor da
matriz de transferência M (s) em s = jω e, de maneira semelhante, seja ∆ o valor de
∆(s) em s = jω. O valor singular estruturado µ(M ) é definido como:
−1
µ(M ) = min {σ(∆) | det (I − ∆M ) = 0}
,
∆∈∆
(2.19)
com µ(M ) = 0 se não existe ∆ ∈ ∆ tal que det (I − ∆M ) = 0.
É importante notar que o valor de µ(M ) depende da estrutura de ∆. Isso às vezes
é mostrado explicitamente usando-se a notação µ∆ (M ). O valor de µ = 1 significa que
existe um ∆ com σ(∆) = 1 que torna a matriz (I − ∆M ) singular. Valores elevados de µ
indicam pouca robustez, pois significa dizer que existe uma pequena incerteza que torna
(I − ∆M ) singular. Inversamente, valores reduzidos de µ indicam boa robustez.
Nesse trabalho propõe-se o cálculo direto de um limitante inferior para µ. Assuma momentaneamente que µ(M ) 6= 0 para um dado M . Considere, então, a seguinte estratégia
para se calcular µ(M ) inspirada pela própria definição dada pela EQ. 2.19. Primeiramente, o programa de otimização com restrição abaixo é resolvido:
minimize σ(∆)
∆∈∆
sujeito a
(2.20)
det (I − ∆M ) = 0 .
Se ∆0 é uma solução factível para (2.20) minimizando σ(·), então pode-se facilmente
calcular µ(M ) = σ(∆0 ) −1 . Se, porém, nenhuma solução factível é encontrada, então
estabelece-se µ(M ) = 0.
Se por um lado a abordagem acima soa natural, por outro lado solucionar (2.20)
representa uma difícil tarefa. De fato, trata-se de um programa de otimização com função
objetivo não-diferenciável e com uma restrição de igualdade que destrói sua convexidade.
28
Na Seção 3.2, é apresentada uma técnica de otimização não-diferenciável que permite
resolver eficientemente (2.20). O algoritmo não-diferenciável é dotado de certificado de
convergência global e de otimalidade local. Otimalidade local significa que se ∆0 é uma
solução factível para (2.20), então ∆0 é um minimizador local de σ(·). Consequentemente,
σ(∆0 ) −1 representa um limitante inferior para µ(M ).
Uma vez que a abordagem proposta baseia-se em uma técnica de otimização local,
a seleção do ponto inicial pode impactar o resultado, eventualmente resultando em um
limitante inferior mais conservador. Apesar dessa possível limitação, exemplos numéricos
como os apresentados no Capítulo 4 confirmam o grande interesse prático da técnica.
De fato, em algumas aplicações desafiadoras a técnica não-diferenciável proposta produz
limitantes inferiores que são menos conservadores do que os fornecidos pelas técnicas
atuais. Graças à eficiência da técnica de otimização não-diferenciável, o método proposto
pode ser aplicado mesmo em problemas com um número moderado de incertezas. A
experiência também tende a indicar que a inicialização do algoritmo não-diferenciável
não é crítica e que ela pode ser facilmente complementada por estratégias de múltiploscomeços.
A seguir, serão listadas algumas propriedades importantes de µ que são úteis no desenvolvimento desse trabalho.
As duas propriedades abaixo valem para todas as classes de perturbações (reais, complexas ou mistas):
• µ(αM ) = |α| µ(M ) para qualquer escalar α real.
• Seja ∆ = diag {∆1 , ∆2 } um conjunto de perturbações organizadas em uma matriz
bloco diagonal. Considere a partição da matriz M de acordo com as dimensões de
∆1 e ∆2 :
"
M=
M11 M12
#
(2.21)
M21 M22
Então:
µ∆ (M ) ≥ max {µ∆1 (M11 ), µ∆2 (M22 )}
(2.22)
Esse último resultado mostra que as características de robustez em estabilidade, em relação a um conjunto de incertezas, são tão ruins ou piores do que em relação à qualquer
uma das incertezas isoladas.
29
As próximas propriedades listadas valem somente para incertezas complexas e permitem estabelecer limites para µ:
• Para incerteza complexa escalar repetida, ∆ = δI com δ ∈ C, µ(M ) = ρ(M ).
• Para incerteza complexa cheia, ∆ = Cn×n (incerteza não estruturada), µ(M ) =
σ(M ).
Conclui-se, então, que:
ρ(M ) ≤ µ(M ) ≤ σ(M ).
(2.23)
Outras propriedades de µ, tais como o refinamento dos seus limites, e as provas das
propriedades listadas podem ser encontradas em (SKOGESTAD, 2005).
2.3.1 ESTABILIDADE ROBUSTA PARA BLOCO DE INCERTEZAS DIAGONAL
A combinação da condição dada pela EQ. 2.18 com a definição de µ fornece uma
condição necessária e suficiente para que haja estabilidade robusta. O teorema a seguir
dá origem ao uso mais comum de µ, como um teste de robustez no domínio da frequência.
Teorema 2.2 (Estabilidade robusta para bloco de incertezas diagonal (SKOGESTAD,
2005)). Assuma que o sistema nominal M (s) e o bloco de incertezas ∆(s) são estáveis.
Então, a estrutura M ∆ (FIG. 2.2) é estável para todo ∆ ∈ ∆, com σ(∆) ≤ 1, ∀ω, se e
somente se,
µ(M (jω)) < 1,
∀ω.
(2.24)
Demonstração. Se µ(M ) < 1 para todas as frequências, então σ(∆) > 1 para a menor
incerteza tal que det(I − ∆M ) = 0, como os ∆’s permitidos são limitados em norma,
σ(∆) ≤ 1, ∀ω, então o sistema é estável. Por outro lado, se µ(M ) ≥ 1 para alguma
frequência, então existe um ∆ com σ(∆) ≤ 1 tal que det(I − ∆M ) = 0.
Este teorema indica que é possível avaliar as propriedades de robustez em estabilidade
de um sistema em malha fechada pesquisando o valor de µ em todo domínio de frequência.
O valor de pico de µ determina o tamanho máximo admissível de incerteza para a qual
garante-se que o sistema em malha fechada mantém-se estável. Entretanto, a varredura
de todo o domínio de frequência pode ter um alto custo computacional. Na prática, é
estabelecida uma grade de frequências dentro de uma faixa apropriada. O inconveniente
30
dessa abordagem é que corre-se o risco de perder pontos importantes se a grade não
for suficientemente densa, sobretudo porque em alguns casos µ pode ser descontínuo
(YOUNG, 2001).
2.4 VALOR SINGULAR ESTRUTURADO OBLÍQUO
Para explicar de maneira sucinta o conceito do valor singular estruturado oblíquo ν,
considere um valor de µ = 1, 1 em um problema de estabilidade robusta. Isso significa que
todas as incertezas do sistema devem ser diminuídas em magnitude por um fator de 1,1
para que se garanta a estabilidade. Mas se o desejo é fixar a faixa de variação de algumas
incertezas, então o quão grande podem ser as outras incertezas antes que a instabilidade
ocorra? Este valor que quantifica o quão grandes essas fontes podem ser é definido como
ν.
A descrição matemática de ν é semelhante à de µ e é desenvolvida em relação à estrutura M ∆ (FIG. 2.2). O bloco de incertezas ∆ é dividido em dois sub-blocos, ∆f (bloco
contendo as incertezas com faixa de variação fixa) e ∆v (bloco contendo as incertezas com
faixa de variação livre) (FIG. 2.5).
FIG. 2.5: Estrutura M ∆ particionada para análise ν
Sejam ∆f e ∆v com a mesma estrutura geral de ∆ (EQ. 2.4). A matriz de transferência M é particionada de acordo com as dimensões de ∆f e ∆v .
Como ∆f será limitado em norma, define-se uma nova estrutura de bloco:
B∆f = {∆f ∈ ∆f : σ(∆f ) ≤ 1}
31
(2.25)
A partir dessas considerações, é possível definir uma nova estrutura geral para o bloco
de incertezas que será utilizado no cálculo de ν:
∆c = {∆c = diag(∆f , ∆v ) : ∆f ∈ B∆f , ∆v ∈ ∆v }
(2.26)
Definição 2.2 (Valor singular estruturado oblíquo ν). Seja a matriz complexa M o valor
da matriz de transferência M (s) em s = jω e, de maneira semelhante, seja ∆c o valor de
∆c (s) em s = jω. O valor singular estruturado oblíquo ν(M ) é definido como:
ν(M ) =
−1
min {σ(∆v ) | det (I − ∆c M ) = 0}
∆c ∈∆c
(2.27)
com ν(M ) = 0 se não existe ∆c ∈ ∆c tal que det (I − ∆c M ) = 0.
De maneira semelhante ao cálculo de µ, propõe-se o cálculo direto de um limitante
inferior para ν. Agora, assuma momentaneamente que ν(M ) 6= 0 para um dado M . Considere, então, a seguinte estratégia para se calcular ν(M ) inspirada pela própria definição
dada pela EQ. 2.27. Primeiramente, o programa de otimização com restrição abaixo é
resolvido:
minimize
∆f ∈∆f ,∆v ∈∆v
sujeito a
σ(∆v )
σ(∆f ) ≤ 1,
(2.28)
det (I − diag(∆f , ∆v )M ) = 0 .
Note que a restrição de desigualdade existente em (2.28) garante que ∆f ∈ B∆f . Logo, se
(∆0f , ∆0v ) é uma solução factível para (2.28) minimizando σ(∆v ), então pode-se facilmente
calcular ν(M ) = σ(∆0v ) −1 . Se, porém, nenhuma solução factível é encontrada, então
estabelece-se ν(M ) = 0.
Na Seção 3.2, é apresentada uma técnica de otimização não-diferenciável que permite
resolver eficientemente o programa (2.28). As características de não-diferenciabilidade,
convergência global e otimalidade local presentes na obtenção de µ permanecem nesse
caso.
2.5 DESEMPENHO ROBUSTO
Muitas vezes, a estabilidade robusta não é a única propriedade que precisa ser avaliada
em um sistema em malha fechada. Normalmente, existem distúrbios exógenos que atuam
32
sobre o sistema, que sob influência das incertezas podem acarretar erros de monitoramento
e regulação. Na maioria dos casos, muito antes do início da instabilidade, o desempenho
em malha fechada pode degradar-se ao ponto de atingir níveis inaceitáveis. Diante disso,
surge a necessidade de realizar um teste de desempenho robusto que tenha como objetivo
obter o pior caso de degradação de desempenho, associado a um determinado nível de
incertezas.
2.5.1 TESTE-µ PARA DESEMPENHO ROBUSTO
Primeiramente será apresentado o Teorema Principal de Malha (Main Loop Theorem)
(PACKARD, 1993a), que é base para o teste proposto.
Teorema 2.3 (Teorema Principal de Malha (PACKARD, 1993a)). Seja G a matriz complexa particionada da seguinte maneira:
"
G=
G11 G12
#
.
G21 G22
Suponha que existam 2 blocos com a estrutura diagonal definida pela EQ. 2.4, ∆1 e ∆2 ,
que são compatíveis com as dimensões de G11 e G12 , respectivamente. Define-se, então,
ˆ da seguinte maneira:
a estrutura ∆
"
#
∆
0
1
ˆ =
∆
, ∆1 ∈ ∆1 , ∆2 ∈ ∆2 .
(2.29)
0 ∆2
ˆ que é similar à estrutura M ∆ (FIG. 2.2) :
Desta forma, obtém-se a estrutura G∆,
ˆ
FIG. 2.6: Estrutura G∆
O Teorema Principal de Malha diz que:



 µ∆1 (G11 ) < 1, e
µ∆ˆ (G) < 1 ⇔


 µ (F (G, ∆ )) < 1,
∆2
u
1
33
(2.30)
com σ(∆1 ) ≤ 1.
ˆ =
(⇒) Considere ∆i ∈ ∆i tal que σ(∆i ) ≤ 1 e assuma que ∆
ˆ e σ(∆)
ˆ ∈∆
ˆ ≤ 1 . Então,
diag(∆1 , ∆2 ), obviamente ∆
"
#
I
−
G
−G
11 ∆1
12 ∆2
ˆ = det
det(I − G∆)
.
(2.31)
−G21 ∆1 I − G22 ∆2
Demonstração.
Por hipótese (I − G11 ∆1 ) é não-singular, então utilizando a fórmula de Schur (Seção 7.5)
é possível reescrever a EQ. 2.31 como:
ˆ = det(I − G11 ∆1 ) det(I − G22 ∆2 − G21 ∆1 (I − G11 ∆1 )−1 G12 ∆2 )
det(I − G∆)
= det(I − G11 ∆1 ) det(I − (G22 + G21 ∆1 (I − G11 ∆1 )−1 G12 )∆2 ).(2.32)
Agora escreve-se a EQ. 2.32 em função de Fu (G, ∆1 ):
ˆ = det(I − G11 ∆1 ) det(I − Fu (G, ∆1 )∆2 ).
det(I − G∆)
(2.33)
Também por hipótese, µ∆2 (Fu (G, ∆1 )) < 1 com σ(∆1 ) ≤ 1, o que significa dizer que
ˆ é não-singular e pela
(I − Fu (G, ∆1 )∆2 ) é não-singular. Conclui-se, então, que (I − G∆)
definição de µ, µ∆ˆ (G) < 1.
(⇐) Basicamente, o argumento acima é invertido. Novamente considere ∆i ∈ ∆i tal
ˆ com σ(∆)
ˆ = diag(∆1 , ∆2 ). Então, ∆
ˆ ∈ ∆
ˆ ≤ 1. Por
que σ(∆i ) ≤ 1 e assuma que ∆
ˆ 6= 0. De acordo com a propriedade de µ dada pela EQ. 2.22:
hipótese, det(I − G∆)
µ∆ˆ (G) ≥ max {µ∆1 (G11 ), µ∆2 (G22 )} ,
(2.34)
pode-se afirmar que µ∆1 (G11 ) < 1, o que significa dizer que (I − G11 ∆1 ) é não-singular.
Voltando à EQ. 2.33 conclui-se que:
ˆ 6= 0.
det(I − G11 ∆1 ) det(I − Fu (G, ∆1 )∆2 ) = det(I − G∆)
Obviamente, (I − Fu (G, ∆1 )∆2 ) também é não-singular para ∆i ∈ ∆i com σ(∆i ) ≤ 1, o
que indica que a afirmação é verdadeira.
Conforme discutido na Seção 2.2.2, para um sistema nominalmente estável, a condição
de DR é dada por:
DR ⇔ kF k∞ < 1, ∀∆, k∆k∞ ≤ 1,
(2.35)
onde F = Fu (N, ∆) representa a transferência de w para z da estrutura N ∆ (FIG. 2.3).
O DR pode ser tratado como um caso especial de ER com a criação de um bloco
fictício de incertezas ∆p para representar as especificações de desempenho H∞ (FIG. 2.7),
onde ∆p é uma matriz complexa cheia com as mesmas dimensões de F T .
34
FIG. 2.7: ∆p incluso na estrutura N ∆
Define-se, então, o bloco de incertezas aumentado
"
#
∆
0
ˆ =
∆
,
0 ∆p
(2.36)
ˆ
dando origem a estrutura N ∆:
ˆ
FIG. 2.8: Estrutura N ∆
O problema de DR original equivale ao problema de ER da estrutura aumentada, como
indicado pelo teorema a seguir:
Teorema 2.4 (Desempenho robusto). Assuma que um dado sistema nominalmente
estável seja representado pela estrutura N ∆.
O sistema é internamente estável e
kFu (N, ∆)k∞ < 1, ∀∆, k∆k∞ ≤ 1 (DR), se e somente se
µ∆ˆ (N (jω)) < 1,
35
∀ω
(2.37)
Demonstração. Será mostrado que trata-se de um caso particular do Teorema Principal
de Malha. Deixe o teorema ser reescrito como:


 µ∆ (N11 (jω)) < 1, ∀ω (estabilidade interna) e

µ∆ˆ (N (jω)) < 1, ∀ω ⇔


 kF (N, ∆)k < 1, ∀∆, com k∆k ≤ 1.
u
∞
(2.38)
∞
Para uma frequência dada pode-se afirmar que:



 µ∆ (N11 ) < 1,
e
µ∆ˆ (N ) < 1 ⇔
(2.39)


 σ(F (N, ∆)) < 1,
u
com σ(∆) ≤ 1.
Por hipótese, ∆p foi definido como um bloco complexo cheio. Então, de acordo com a
propriedade discutida na Seção 2.3, tem-se a seguinte igualdade:
µ∆p (Fu (N, ∆)) = σ(Fu (N, ∆)).
Logo, a EQ. 2.39 pode ser reescrita como:



 µ∆ (N11 ) < 1,
e
µ∆ˆ (N ) < 1 ⇔


 µ (F (N, ∆)) < 1,
∆p
u
(2.40)
com σ(∆) ≤ 1,
o que representa um caso particular do Teorema Principal de Malha com N = G, ∆ = ∆1
e ∆p = ∆2
Observações:
• A condição dada pelo TEO. 2.4 permite testar se kF k∞ < 1 para todos os ∆0 s
possíveis sem ter que testar cada ∆ individualmente. Essencialmente, µ é definido
tal que o pior caso seja considerado.
• ∆p tem que ser um bloco complexo cheio. Com essa hipótese, no caso nominal
(∆ = 0) µ∆ˆ (N ) = µ∆p (N22 ) = σ(N22 ). Se µ∆ˆ (N ) < 1, ∀ω, então σ(N22 ) < 1, ∀ω, o
que representa a condição de DN (kN22 k∞ < 1).
ˆ sempre possui estrutura, o uso da norma H∞ , kN k < 1, geralmente
• Uma vez que ∆
∞
é conservador para análise de DR.
36
• De acordo com as propriedades de µ discutidas na Seção 2.3, pode-se afirmar que:




(2.41)
µ∆ˆ (N ) ≥ max µ∆ (N11 ), µ∆p (N22 )
| {z } | {z }
| {z }
ER
DR
DN
ou seja, DR implica em ER e DN, em sistemas com EN.
A condição dada pelo TEO. 2.4 fornece um teste para desempenho robusto (kF k∞ <
1, ∀∆, k∆k∞ ≤ 1) mas não permite determinar o chamado pior caso de desempenho,
associado à seguinte pergunta: qual será o maior valor de ganho da transferência F
levando-se em conta todas as incertezas admissíveis (k∆k∞ ≤ 1)? Note que um valor de
µ∆ˆ (N ) = 0, 8 corresponde a uma incerteza ∆ com σ(∆) = 1, 25(1/0, 8), o que significa que
a restrição não foi saturada, e que, consequentemente, ainda há margem para degradação
do valor do ganho da transferência F . O pior caso de ganho pode ser obtido resolvendo um
problema ν, com restrição de variação para ∆. A solução desse problema provavelmente
levará à saturação da restrição. Note também que a condição de desempenho robusto
pode ser inferida a partir da informação do pior caso de desempenho. Significa então
dizer que a condição de DR pode ser testada alternativamente por:
DR
⇔
ν∆c (N (jω)) < 1,
∀ω
(2.42)
ˆ ∆f = ∆ e ∆v = ∆p .
com ∆c = ∆,
2.6 ANÁLISE µ POR ESPAÇO DE ESTADOS
Conforme discutido na Seção 2.3.1, a pesquisa do valor de pico de µ em todo domínio
de frequência pode ter um alto custo computacional. Na prática é estabelecida uma grade
de frequências dentro de uma faixa previamente escolhida. No entanto, essa medida pode
ocasionar a perda de pontos importantes se a grade não for suficientemente densa.
A abordagem por espaço de estados permite eliminar tal pesquisa frequencial. A
idéia é representar a transferência M (s) da estrutura M ∆ (FIG. 2.2) como uma LFT de
uma matriz constante em relação à variável frequência. A frequência passa então a ser
enxergada como um parâmetro incerto real, variando dentro de um intervalo previamente
escolhido (ω ∈ [ω, ω]), e é incluída no bloco das incertezas.
Considere a representação em espaço de estados para representar a função de transferência nominal, isto é, M (s) = C(sIp − A)−1 B + D, com A ∈ Rp×p . Fazendo s = jω,
37
M (jω) pode ser representada pela seguinte expressão (SIDERIS, 1992),
M (jω) = C(jωIp − A)−1 B + D = Fu (M̂ , ωIp )
(2.43)
onde M̂ é constante,
"
M̂ =
jA−1
A−1 B
#
−jCA−1 −CA−1 B + D
.
(2.44)
Seja a frequência quantificada por:
ω = ω 0 + α ω δω ,
δω ∈ [−1, 1]
(2.45)
com
ω0 = (ω + ω)/2,
(2.46)
αω = (ω − ω)/2.
(2.47)
e
A EQ. 2.43 pode ser reescrita por:
M (jω) = C(jωIp − A)−1 B + D
= C[j(ω0 + αω δω )Ip − A]−1 B + D
= C[j(αω δω )Ip − (A − jω0 Ip )]−1 B + D,
(2.48)
seja a matriz A1 definida como:
A1 = A − jω0 Ip ,
(2.49)
M (jω) = C[j(αω δω )Ip − A1 ]−1 B + D = Fu (M̂ (ω0 ), (αω δω )Ip ),
(2.50)
então
onde
"
M̂ (ω0 ) =
jA−1
1
A−1
1 B
−CA−1
−jCA−1
1
1 B +D
#
.
(2.51)
Passando αω para M̂ (ω0 ) obtém-se:
M (jω) = Fu (M̂1 (ω0 , αω ), δω Ip ),
(2.52)
onde
"
M̂1 (ω0 , αω ) =
jA−1
1 αω
A−1
1 B
−1
−jCA−1
1 αω −CA1 B + D
38
#
.
(2.53)
Reescrevendo a transferência nominal M (jω) com a expressão (2.52) é possível incluir
δω Ip no bloco das incertezas. Conforme ilustrado pela FIG. 2.9, é definida uma perturbação aumentada, ∆aum = diag(δω Ip , ∆), de tal forma que M̂1 (ω0 , αω ) passe a desempenhar
o papel do sistema nominal.
FIG. 2.9: Teste µ - espaço de estados
A condição de estabilidade robusta é dada pelo seguinte teorema :
Teorema 2.5 (Teste em intervalo de frequência). Suponha que M (s) possui todos os seus
pólos no semiplano aberto da esquerda (isto é, estabilidade nominal). Seja a representação
mínima por espaço de estados de M (s) dada por:
M (s) = C(sIp − A)−1 B + D
(2.54)
Dado ∆ compatível com M (s), define-se uma nova estrutura para o bloco de incertezas
∆aum como:
∆aum = {diag(δω Ip , ∆) : δω ∈ R, ∆ ∈ ∆}
(2.55)
Então, ∀ ∆ ∈ ∆ com k∆k∞ ≤ 1, o sistema em malha fechada mostrado na FIG. 2.9 é
estável se e somente se,
µ∆aum (M̂1 (ω0 , αω )) < 1
(2.56)
A formulação dada pelo TEO. 2.5 fornece um teste µ para a análise de robustez em
estabilidade. Isto pode ser melhorado reformulando o problema com a técnica ν.
39
Uma vez que δω é considerado dentro do intervalo real [−1, 1], a condição dada pela
EQ. 2.56 pode ser reescrita como um problema ν. A condição de estabilidade robusta é
então dada por:
ν∆c (M̂1 (ω0 , αω )) < 1,
(2.57)
com ∆c = ∆aum , ∆f = δω Ip e ∆v = ∆.
A abordagem por espaço de estados pode ser facilmente estendida para um problema
originalmente ν, considerando ∆c = ∆aum , ∆f = diag(δω Ip , ∆0f ) e ∆v = ∆0v , com ∆0f
e ∆0v representando, respectivamente, as incertezas com faixa de variação restringida e
não-restringida do problema original.
É possível ainda, obter a incerteza desestabilizante e o valor do parâmetro δω que
carrega a informação de frequência. Com δω é possível determinar o valor da frequência
crítica para o intervalo de variação considerado:
ωc = ω0 + αω δω .
40
(2.58)
3 ELEMENTOS DE OTIMIZAÇÃO NÃO-DIFERENCIÁVEL
3.1 ANÁLISE NÃO-DIFERENCIÁVEL
As noções apresentadas nesta seção são discutidas em profundidade em (CLARKE,
1983) (POLAK, 1987) (HIRIART-URRUTY, 1993) (POLAK, 1997).
3.1.1 INTRODUCÃO
Denote por B(x, r) a bola aberta de centro x ∈ Rn e raio r > 0, definida por
B(x, r) , {y ∈ Rn : ky − xk < r} .
Comecemos pela definição de funções Lipschitz contínuas.
Definição 3.1. Uma função f : Rn 7→ R é dita Lipschitz contínua sobre S ⊂ Rn se existe
uma constante L > 0 tal que, para todo y, z ∈ S,
|f (y) − f (z)| ≤ Lky − zk.
(3.1)
A função f é dita localmente Lipschitz contínua em x ∈ Rn se existe um real positivo
> 0 tal que f é Lipschitz contínua sobre B(x, ).
Uma função Lipschitz contínua em x apresenta, assim, uma taxa de crescimento que
é limitada em uma vizinhança de x. Por outro lado, uma função localmente Lipschitz
contínua em x não é necessariamente diferenciável em x.
Definição 3.2. A função f : Rn 7→ R admite uma derivada direcional em x ∈ Rn na
direção d ∈ Rn se o limite
f (x + td) − f (x)
t→0
t
lim
(3.2)
t>0
existe e é finito. Neste caso, a derivada direcional é representada por f 0 (x, d).
Uma função f diferenciável em x admite derivadas direcionais em todas as direções d
e, além disso, tem-se que f 0 (x, d) = ∇f (x)T d. A recíproca não é verdadeira em geral, a
menos que as derivadas direcionais sejam contínuas.
41
A propriedade de sublinearidade definida abaixo é importante para a noção de subdiferencial de uma função.
Definição 3.3. Uma função σ : Rn 7→ R é dita sublinear quando apresenta as seguintes
propriedades:
(a) aditividade:
σ(x + y) ≤ σ(x) + σ(y),
para todo x, y ∈ Rn
(3.3)
(b) homogeneidade positiva:
σ(tx) = tσ(x),
para todo x ∈ Rn e t > 0.
(3.4)
Toda função sublinear apresenta a propriedade de majorar ao menos uma função linear.
Tem-se, então, o seguinte teorema:
Teorema 3.1. Se σ : Rn → R é uma função sublinear, então o conjunto
Sσ , {s ∈ Rn : hs, xi ≤ σ(x) para todo x ∈ Rn }
(3.5)
é não-vazio, compacto e convexo. Adicionalmente, tem-se a relação
σ(x) = sup {hs, xi : s ∈ Sσ } .
(3.6)
Reciprocamente, dado um conjunto S não-vazio, compacto e convexo, a função σS : Rn →
R de S, definida por
σS (x) , sup {hs, xi : s ∈ S} ,
(3.7)
é sublinear, e ela dita função suporte de S.
3.1.2 SUBDIFERENCIAL DE UMA FUNÇÃO CONVEXA
Antes de apresentar a noção de subdiferencial de Clarke, é conveniente apresentar
a definição do subdiferencial de uma função convexa (HIRIART-URRUTY, 1993). De
fato, o subdiferencial de Clarke, definido para a classe mais geral de funções localmente
Lipschitz contínuas, constitui uma generalização da ideia de subdiferencial de uma função
convexa.
42
Definição 3.4. Uma função f : Rn 7→ R é dita convexa se, para todo x, y ∈ Rn e para
todo real λ ∈ [0, 1], tem-se
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y).
(3.8)
Alternativamente, f é dita estritamente convexa se a desigualdade (3.8) é estrita para
todo x, y ∈ Rn tais que x 6= y e para todo real λ ∈]0, 1[.
Mostra-se que toda função convexa f : Rn 7→ R é localmente Lipschitz contínua em
todo ponto de Rn .
Teorema 3.2. Para todo x ∈ Rn , uma função convexa f : Rn 7→ R admite derivadas
direcionais em todas as direções d ∈ Rn . Adicionalmente, para todo x fixo, a applicação
d ∈ Rn 7→ f 0 (x, d) é sublinear.
De acordo com os TEOs. 3.1 e 3.2, concluimos que a aplicação d ∈ Rn 7→ f 0 (x, d) é a
função suporte de um conjunto não-vazio, compacto e convexo de Rn , que é denominado
de subdiferencial.
Definição 3.5. O subdiferencial em x de uma função convexa f , representado por ∂c f (x),
é o conjunto não-vazio, compacto e convexo de Rn cuja função suporte é d ∈ Rn 7→
f 0 (x, d), ou seja,
∂c f (x) , {s ∈ Rn : hs, di ≤ f 0 (x, d) para todo d ∈ Rn } .
(3.9)
Os elementos de ∂c f (x) são chamados de subgradientes de f em x.
Reciprocamente, as derivadas direcionais de f podem ser determinadas a partir do
subdiferencial por
f 0 (x, d) = max {hs, di : s ∈ ∂c f (x)} .
(3.10)
Para uma função f : Rn 7→ R convexa e diferenciável em x, ∂c f (x) corresponde ao conjunto
unitário {∇f (x)}.
O subdiferencial admite uma interpretação geométrica. Para tanto, são necessárias as
definições a seguir.
43
Definição 3.6. O epigrafo de uma função f : Rn →
7 R é definida por
(" #
)
x
n+1
Epi(f ) ,
∈R
: l ≥ f (x) .
l
Definição 3.7. A direção s ∈ Rm é dita normal, em x, a um conjunto convexo fechado
C ⊂ Rm quando
hs , y − xi ≤ 0,
∀y ∈ C.
O conjunto de todas essas direções é chamado cone normal a C em x, e denotado por
NC (x).
Tem-se, então, o seguinte resultado:
Proposição 3.1. Seja uma função f : Rn 7→ R convexa. Um vetor s ∈ Rn é um
subgradiente de f em x se e somente se (s, −1) ∈ Rn × R é normal a Epi(f ) em (x, f (x)).
Conclui-se daí que a interseção do cone normal NEpi(f ) (x) com o espaço Rn no nível
−1 representa ∂c f (x) × {−1}, conforme mostrado na Figura 3.1.
3.1.3 SUBDIFERENCIAL DE CLARKE
Diferentemente do caso convexo, a hipótese de que a função f : Rn 7→ R é localmente
Lipschitz contínua em x ∈ Rn não é suficiente para a existência das derivadas direcionais
de f . Por esta razão é preciso generalizar o conceito de derivada direcional.
Definição 3.8. Uma função f : Rn 7→ R admite uma derivada direcional generalizada
em x ∈ Rn na direção d ∈ Rn se o limite
lim sup
y→x
t→0
t>0
f (y + td) − f (y)
t
(3.11)
existe e é finito. Neste caso, ela é representada por f ◦ (x, d).
Teorema 3.3. Para todo x ∈ Rn , uma função f : Rn 7→ R localmente Lipschitz contínua
em x ∈ Rn admite derivadas direcionais generalizadas em todas as direções d ∈ Rn .
Adicionalmente, a aplicação d 7→ f ◦ (x, d) é sublinear.
44
Epi(f ) − (x, f (x))
0
−1
NEpi(f )
∂c f (x)
Rn × {−1}
FIG. 3.1: Interpretação geométrica do subdiferencial de uma função convexa
(HIRIART-URRUTY, 1993)
Pode-se, assim, definir um subdiferencial para as funções localmente Lipschitz contínuas de uma forma análoga ao caso convexo:
Definição 3.9. Para uma função f : Rn 7→ R localmente Lipschitz contínua em x ∈ Rn ,
o subdiferencial de Clarke de f em x, representado por ∂f (x), é o conjunto não-vazio,
compacto e convexo Rn cuja função suporte é d ∈ Rn 7→ f ◦ (x, d), ou seja,
∂f (x) , {s ∈ Rn : hs, di ≤ f ◦ (x, d) para todo d ∈ Rn } .
(3.12)
Os elementos de ∂f (x) são chamados subgradientes de Clarke (ou gradientes generalizados) de f em x.
As derivadas direcionais generalizadas podem ser determinadas a partir de ∂f (x) para
toda direção d ∈ Rn :
f ◦ (x, d) = max {hs, di : s ∈ ∂f (x)} .
45
(3.13)
O subdiferencial de Clarke generaliza as noções de subdiferencial de uma função convexa
e de gradiente de uma função diferenciável:
a) Se uma função f é convexa, tem-se f ◦ (x, d) = f 0 (x, d) para todo d ∈ Rn , e assim
∂f (x) = ∂c f (x).
b) Se uma função f localmente Lipschitz contínua em x ∈ Rn é diferenciável em x, então
tem-se que f 0 (x, d) = h∇f (x), di ≤ f ◦ (x, d) para todo d ∈ Rn , e então ∇f (x) ∈
∂f (x).
c) Se uma função f é continuamente diferenciável em x, tem-se a igualdade
h∇f (x), di = f ◦ (x, d) para todo d ∈ Rn , de modo que ∂f (x) = {∇f (x)}.
Se por um lado uma função localmente Lipschitz contínua não é necessariamente
diferenciável, por outro lado o conjunto de pontos nos quais ela é não-diferenciável é
de medida nula, como indicado no teorema abaixo.
Teorema 3.4 (Teorema de Rademacker). Suponha que a função f : Rn → R seja
localmente Lipschitz contínua. Então ∇f (x) existe para quase todo x ∈ Rn .
À luz do TEO 3.4, poder-se-ia pensar que as técnicas de otimização diferenciável
podem ser igualmente utilizadas para uma função localmente Lipschitz contínua, uma
vez que os pontos onde a função é não-diferenciável são "raros"em uma certa medida.
Entretanto, esta ideia revela-se falsa porque a prática mostra que o mínimo da função é
geralmente atingido exatamente nos pontos onde ela é não-diferenciável.
O subdiferencial de Clarke admite uma interpretação geométrica em Rn+1 análoga
àquela do caso convexo, com a condição de se generalizar a noção de cone normal a um
subconjunto qualquer C 6= ∅ não necessariamente convexo. Assim, ∂f (x) é novamente o
x
s
] está no cone normal ao epigrafo de f em [ f (x) ],
conjunto dos vetores s ∈ Rn tais que [ −1
conforme representado na FIG. 3.2.
3.1.4 REGRAS DE CÁLCULO DO SUBDIFERENCIAL DE CLARKE
Em geral, as regras de cálculo do subdiferencial de Clarke compreendem apenas inclusões. Entretanto, é possível obter-se igualidades sob uma condição suficiente mais forte
que a Lipschitz-continuidade local:
46
Epi(f )
f (x)
f (x) − 1
x+s x
x + ∂f (x)
FIG. 3.2: Interpretação geométrica do subdiferencial de Clarke
Definição 3.10. Uma função f : Rn → R localmente Lipschitz contínua é dita regular
se a derivada direcional f 0 (x, d) existe para todo x, d ∈ Rn e se, adicionalmente, tem-se
f 0 (x, d) = f ◦ (x, d).
Em particular, toda função convexa e toda função continuamente diferenciável em
x ∈ Rn são então regulares. Por outro lado, se f é regular e diferenciável em x, então
∂f (x) = {∇f (x)}.
Considere, a seguir, a regra da diferenciação em cadeia, ou de composição.
Lema 3.1. Seja H : Rn → Rm uma função continuamente diferenciável e g : Rm → R
uma função localmente Lipschitz contínua. Tem-se, então, que
∂H(x)T
ξ, ξ ∈ ∂g(H(x)) .
∂(g ◦ H)(x) ⊂ co η : η =
∂x
(3.14)
Tem-se a igualdade em (3.14) quando g é regular.
Considere H 0 (x) , ∂H(x)/∂x. Pode-se então representar por [H 0 (x)]? ∂g (H (x)) o
segundo membro de (3.14), como a ação da aplicação linear adjunta [H 0 (x)]? sobre o
subdiferencial.
Uma vez que os problemas do tipo minimax desempenham um papel central no presente trabalho, interessam particularmente as propriedades diferenciais das funções max.
Consideremos inicialmente o subdiferencial de Clarke de um máximo finito de funções.
47
Lema 3.2. Sejam f 1 , f 2 , . . . , f m : Rn → R funções localmente Lipschitz contínuas e
ψ(x) , max f j (x),
j∈m
com m , {1, 2, . . . , m}. Então,
∂ψ(x) ⊂
co
j ∂f (x) ,
(3.15)
j∈m̂(x)
onde m̂(x) designa o conjunto de índices j ativos em x:
m̂(x) , j ∈ m : f j (x) = ψ(x) .
Tem-se a igualidade em (3.15) se as funções f j , j ∈ m̂(x), são regulares em x.
A partir dos Lemas 3.1 e 3.2, a importância da condição de regularidade torna-se
evidente, pois ela permite um cálculo facilitado de todo o subdiferencial de Clarke. Esta
condição concerne, felizmente, a classe de funções que estamos interessados neste trabalho.
O teorema abaixo é fundamental pois ele caracteriza o subdiferencial de uma função
max calculada sobre um contínuo de índices. Denote-se por ∇x φ(·, ·) o gradiente de φ(·, ·)
em relação ao primeiro argumento.
Teorema 3.5 (TEO. 5.4.7, (POLAK, 1997)). Considere a função
ψ(x) , max φ(x, y).
y∈Y
(3.16)
Suponha que
(a) φ : Rn × Rm → R é contínua,
(b) ∇x φ(·, ·) existe e é contínuo, e
(c) Y ∈ Rm é compacto. Então o subdiferencial de ψ(·) em x é
∂ψ(x) = co {∇x φ(x, y)}
(3.17)
y∈Ŷ (x)
onde Ŷ (x) designa o conjunto de índices ativos
Ŷ (x) , {y ∈ Y : ψ(x) = φ(x, y)} .
48
(3.18)
3.2 TÉCNICA DE OTIMIZAÇÃO NÃO-DIFERENCIÁVEL
3.2.1 ALGORITMO DE PENALIZAÇÃO EXATA
Será tratado nessa seção o caso mais geral, dado pelo programa de otimização sob
restrição (2.28) utilizado na obtenção de um limitante inferior para ν. Reescrevendo-se
(2.28) de uma forma mais adequada, tem-se:
minimize
f (δ) , σ(∆v (δ))
m
δ∈R
sujeito a
gI (δ) , σ(∆f (δ)) − 1 ≤ 0
gE1 (δ)
= Re det (I − ∆c (δ)M ) = 0
gE2 (δ)
= Im det (I − ∆c (δ)M ) = 0 .
(3.19)
com ∆c (δ) = diag(∆f (δ), ∆v (δ)). O vetor δ ∈ Rm de variáveis de decisão consiste nas
partes reais e imaginárias dos elementos de ∆c não-identicamente nulos. A título de
exemplo, suponha que ∆c compreenda um escalar real δ1r e um escalar complexo δ1c , os
quais podem ser repetidos ou não (k1 ≥ 1, k2 ≥ 1). Então, δ = [δ1r Re δ1c Im δ1c ]T neste
P C
caso. A dimensão de δ é dada por m = mr + 2mc + 2 m
i=1 kmr +mc +i × kmr +mc +i , com mr ,
mc e mC definindo ∆c .
T
Denote-se por gE (δ) , [gE1 (δ) gE2 (δ)] a função restrição de igualdade para (3.19) e
seja FIE , {δ ∈ Rm | gI (δ) ≤ 0, gE (δ) = 0}. Então δ̂ ∈ FIE é denominado um minimizador
local para (3.19) se existe um ρ > 0 tal que f (δ) ≥ f (δ̂) para todo δ ∈ FIE ∩ B(δ̂, ρ).
Na sequência, será apresentado um algoritmo de penalização que permite determinar
eficientemente um mínimo local para (3.19). Os teoremas e o algoritmo de penalização
exata a serem discutidos foram originalmente propostos em (POLAK, 1997) considerando
uma função restrição de desigualdade diferenciável e uma classe mais simples de funções
objetivo. No presente trabalho, as condições de otimalidade foram adaptadas para uma
classe mais abrangente de problemas não-diferenciáveis que inclui (3.19). As provas dos
teoremas imitam aquelas em (POLAK, 1997), e por isso não foram apresentadas aqui. O
leitor pode referir-se a (POLAK, 1997) para mais detalhes.
Para começar, considere a condição necessária de otimalidade de primeira ordem para
o programa (3.19) apresentada no próximo teorema.
Teorema 3.6 (TEO. 2.2.19, (POLAK, 1997)). Suponha que δ̂ é um minimizador local
para (3.19) e que JgE (δ̂) é de posto de linha cheio. Então, existem multiplicadores χ̂ ∈ Σ2 ,
49
ξˆ ∈ R2 , e vetores δf ∈ ∂f (δ̂) e δgI ∈ ∂gI (δ̂) tais que
χ̂1 δf + χ̂2 δgI + JgE (δ̂)T ξˆ = 0,
(3.20)
χ̂2 gI (δ̂) = 0.
(3.21)
Denota-se por Σn o seguinte conjunto, Σn , {χ ∈ Rn+ :
Pn
j=1
χj = 1}.
A fim de se obter um teste prático de otimalidade, denote-se por
Ψ(δ) = max { gI (δ)+ , kgE (δ)k∞ }
(3.22)
a função violação de restrição para (3.19), onde
gI (δ)+ = max {0, gI (δ)} .
(3.23)
Então, considere a função penalização exata fπ : Rm 7→ R definida como
fπ (δ) = f (δ) + πΨ(δ),
(3.24)
com π ∈ R+ . Note que Ψ(·) torna fπ (·) não-diferenciável mesmo quando f (·), gI (·) e gE (·)
são diferenciáveis. É mostrado abaixo que sob certas circunstâncias um minimizador local
δ̂ da função não-diferenciável fπ (·) também será um um minimizador local para (3.19).
Assim, ao invés de se abordar o problema original (3.19) diretamente, resolve-se o seguinte
problema de otimização sem restrição:
minimize
fπ (δ).
m
δ∈R
(3.25)
Abordagens de penalização exata como (3.25) são atraentes porque soluções do problema
original podem ser obtidas com uma única execução com o valor do parâmetro de penalização fixo, evitando-se assim o mal-condicionamento inerente às técnicas de penalização
clássicas para valores assintóticos do parâmetro de penalização. Os dois teoremas seguintes estabelecem a equivalência dos problemas (3.19) e (3.25).
Teorema 3.7 (TEO. 2.7.12, (POLAK, 1997)). Suponha que δ̂ ∈ Rm é tal que gI (δ̂) ≤ 0,
gE (δ̂) = 0, JgE (δ̂) seja de posto de linha cheio e que exista um χ̂ ∈ Σ2 , com χ̂1 > 0, e
um ξˆ ∈ R2 satisfazendo a condição de otimalidade de primeira ordem (3.20)-(3.21). Seja
P2 ˆl 1
2
π̂ , χ̂ + l=1 |ξ | /χ̂ . Então, para todo π ≥ π̂, δ̂ satisfaz a condição de otimalidade
de primeira ordem 0 ∈ ∂fπ (δ̂) de um mínimo local de fπ (·).
50
Teorema 3.8 (TEO. 2.7.13 (POLAK, 1997)). Considere o problema (3.19), com a função
penalidade exata fπ (·) associada, com π > 0, definida em (3.24). Suponha que JgE (δ)
é de posto de linha cheio para todo δ ∈ Rm . Suponha que δ̂ ∈ Rm satisfaça gI (δ̂) ≤ 0,
gE (δ̂) = 0.
(a) Se δ̂ é um minimizador local de fπ (·), então δ̂ é um minimizador local para (3.19).
(b) Se δ̂ satisfaz a condição de primeira-ordem 0 ∈ ∂fπ (δ̂) para um minimizador local
de fπ (·), então existe um χ̂ ∈ Σ2 , com χ̂1 > 0, e um ξˆ ∈ R2 satisfazendo a condição de
otimalidade (3.20)-(3.21).
Baseado nos TEOs. 3.7 e 3.8, o problema é então reformulado como a procura por um
minimizador local de fπ (·). Para tanto, considere ∆v ∈ Cp1 ×q1 , ∆f ∈ Cp2 ×q2 e seja f (·)
reescrito como
f (δ) =
max φf (δ, Z),
(3.26)
φf (δ, Z) , h Z , ∆v (δ) i .
(3.27)
Z∈Zp1 ×q1
onde
Por definição,
Zp1 ×q1 , {Z ∈ Cp1 ×q1 | Z = uv H , u ∈ Cp1 , v ∈ Cq1 , kuk = kvk = 1},
(3.28)
e
max
h Z , ∆v (δ) i =
p ×q
Z∈Z
1
1
H
max
Re
Tr
Z
∆
v (δ) .
p ×q
Z∈Z
1
(3.29)
1
Analogamente, seja
gI (δ) =
max
W ∈Zp2 ×q2
φI (δ, W ),
(3.30)
onde
φI (δ, W ) , h W , ∆f (δ) i − 1.
(3.31)
Agora, seja fπ (·) in (3.24) reescrita como
fπ (δ) = max φπ (δ, y),
y∈Yπ
51
(3.32)
com y , (j , Z , W ), Yπ , {1, . . . , 6} × Zp1 ×q1 × Zp2 ×q2 e


φf (δ, Z),
se





φf (δ, Z) + πφI (δ, W ), se




 φ (δ, Z) + πg 1 (δ),
se
f
E
φπ (δ, y) ,

φf (δ, Z) + πgE2 (δ),
se






φf (δ, Z) − πgE1 (δ),
se




2
φf (δ, Z) − πgE (δ),
se
j = 1,
j = 2,
j = 3,
(3.33)
j = 4,
j = 5,
j = 6.
Em seguida, uma aproximação quadrática convexa de primeira ordem para fπ (·) é
introduzida:
1 T
˜
fπ (δ + h, δ) , max φπ (δ, y) + h∇δ φπ (δ, y), hi + h Qh ,
y∈Yπ
2
(3.34)
com Q 0. Denote por
h
i
1
T
θπ (δ) , minm f˜π (δ + h, δ) − fπ (δ) = minm max φπ (δ, y) − fπ (δ) + h∇δ φπ (δ, y), hi + h Qh
h∈R
h∈R y∈Yπ
2
(3.35)
a chamada função de otimalidade para fπ (·), e seja
i
h
˜
h(δ) , arg minm fπ (δ + h, δ) − fπ (δ) .
h∈R
(3.36)
A função de otimalidade θπ (·) apresenta propriedades interessantes que são sintetizadas
no próximo teorema.
Teorema 3.9 (TEO. 2.1.6 (POLAK, 1997)). Considere a função de otimalidade θπ (·) em
(3.35), e a função h(·) em (3.36). Então,
(a) para todo δ ∈ Rm , θπ (δ) ≤ 0;
(b) para todo δ ∈ Rm , fπ0 (δ; h(δ)) ≤ θπ (δ);
(c) para qualquer δ ∈ Rm , 0 ∈ ∂fπ (δ) se e somente se θπ (δ) = 0.
Dois fatos fundamentais resultam do TEO. 3.9. Primeiro, θπ (δ) = 0 é uma condição
de otimalidade para o programa original (3.19) que pode ser utilizada na prática como
um critério de parada. Segundo, como h(δ) é uma direção de descida para fπ (·) em δ,
ela pode ser usada em um algoritmo de minimização do tipo de descida. A próxima
iteração será então δ + = δ + h(δ), o que representa uma estimativa de primeira ordem
de um minimizador local de fπ (·). Em implementações práticas δ + é escolhido como
52
δ + = δ + ρh(δ) para uma largura de passo adequada ρ ∈ (0, 1) determinada por uma
pesquisa linear de Armijo por backtracking (DENNIS, 1996), isto é,
fπ (δ + ρh(δ)) − fπ (δ) ≤ ζρfπ0 (δ, h(δ)) < 0,
(3.37)
onde 0 < ζ < 1. A condição de Armijo acima trata-se de uma pesquisa linear exata que
garante a convergência global do algoritmo para um minimizador local de (3.19).
Na prática, o seguinte procedimento iterativo é utilizado para se determinar um mínimo local de fπ (·). Suponha que a iteração atual δ seja tal que θπ (δ) 6= 0, o que
implica que é possível reduzir fπ (·) em uma vizinhança de δ, isto é, encontrar δ + tal
que fπ (δ + ) < fπ (δ). Substituindo δ por δ + , o procedimento é repetido. A menos que
θπ (δ + ) = 0, que significaria que uma ponto crítico foi encontrado, é possível novamente
encontrar δ ++ tal que fπ (δ ++ ) < fπ (δ + ), etc. Espera-se que a sequência δ, δ + , δ ++ , . . .
assim gerada convirja para um mínimo local δ̂ de (3.25).
Considere a seguinte função de otimalidade associada a Ψ(·):
h
i
θΨ (δ) , minm Ψ̃(δ + h, δ) − Ψ(δ) = minm max 0, max {φI (δ, W ) + h∇δ φI (δ, W ), hi} ,
W ∈W
h∈R
h∈R
1 T
kgE (δ) + JgE (δ)hk∞ } + h Qh − Ψ(δ) (3.38)
2
O próximo teorema suplementa o TEO. 3.8.
Teorema 3.10 (TEO. 2.7.13 (POLAK, 1997)). Considere o problema (3.19), com a
função penalidade exata associada fπ (·), com π > 0, definida em (3.24). Suponha que
JgE (δ) é de posto de linha cheio para todo δ ∈ Rm . Considere a função violação de
restrição Ψ(·) em (3.22) e a função de otimalidade correspondente θΨ (·) em (3.38). Então,
para qualquer δ ∈ Rm tal que θΨ (δ) < 0, existe um πδ < ∞ tal que θπ (δ) < 0 para todo
π > πδ , onde θπ (·) é a função de otimalidade para fπ (·) em (3.35).
Em resumo, nossa estratégia para resolver (3.19) consiste em solucionar o problema
sem restrição auxiliar (3.25), baseado no fato de que um minimizador local de fπ (·) é
também um minimizador local para o problema original (3.19) sob condições apropriadas.
A única dificuldade restante reside na seleção de uma valor grande o suficiente para o
parâmetro de penalidade π. Para tanto, considere a chamada função-teste para fπ (·):
tπ (δ) , θπ (δ) +
53
1
Ψ(δ).
π
(3.39)
Teorema 3.11 (TEO. 2.7.24 (POLAK, 1997)). Considere a função-teste tπ (·) em (3.39)
para o problema (3.19), e suponha que JgE (δ) é de posto de linha cheio para todo δ ∈ Rmr .
Além disso, suponha que, para todo δ ∈ Rmr tal que Ψ(δ) > 0, θΨ (δ) < 0, com θΨ (·)
definido em (3.38). Então,
(a) para todo π > 0, tπ (·) é contínua,
(b) para todo π > 0, se δ̂ é tal que θπ (δ̂) = 0 e tπ (δ̂) ≤ 0, então gI (δ̂) ≤ 0, gE (δ̂) = 0,
e a condição de otimalidade de primeira ordem (3.20)-(3.21) é atendida para o problema
(3.19),
(c) para todo δ ∗ ∈ Rmr , existe um ρ∗ > 0 e um π ∗ ∈ (0, ∞) tais que, para todo
δ ∈ B(δ ∗ , ρ∗ ) e π ≥ π ∗ , tπ (δ) ≤ 0.
Com o TEO. 3.11 em mente, usamos a função-teste tπ (·) para adaptativamente determinar um valor satisfatório finito para o parâmetro de penalidade π. Tendo descrito
todos os seus elementos-chave, o algoritmo não-diferenciável é apresentado no Algoritmo
1.
Algorithm 1 Algoritmo de penalização exata para o programa (3.19)
Parâmetros: Q 0, κ > 1, 0 < β, ζ < 1.
1:
Inicialização. Inicialize o vetor de incertezas δ. Selecione o parâmetro de penalidade
π > 0.
2:
Critério de parada. Se θπ (δ) = 0, isto é 0 ∈ ∂fπ (δ), então pare. Senão, continue.
3:
Cálculo da direção de descida. Resolva o programa tangente (3.35)
1 T
θπ (δ) = minm max φπ (δ, y) − fπ (δ) + h∇δ φπ (δ, y), hi + h Qh
h∈R y∈Yπ
2
A solução representa a direção de busca h(δ).
4:
Função-teste. Compute tπ (δ) em (3.39)
tπ (δ) = θπ (δ) +
1
Ψ(δ).
π
Se tπ (δ) ≤ 0 então continue. Senão, faça π ← κπ e volte para o passo 3.
5:
Pesquisa linear. Encontre ρ = β γ , γ ∈ N, satisfazendo a condição de Armijo
fπ (δ + ρh(δ)) − fπ (δ) ≤ ζρfπ0 (δ, h(δ)) < 0.
6:
Atualização. Faça δ ← δ + ρh(δ). Volte para o passo 2.
54
Estratégia semelhante é adotada para resolver o programa de otimização dado por
(2.20), utilizado na obtenção de um limitante inferior para µ.
3.2.2 DETALHES DA IMPLEMENTAÇÃO
O programa tangente (3.35) pode ser convertido em um SDP da seguinte maneira.
Primeiro, considere as decomposições em valores singulares ∆v (δ) = U (δ)Σ(δ)V (δ)H e
∆f (δ) = UI (δ)ΣI (δ)VI (δ)H . Considere Qu (δ) a submatriz de U (δ) compreendendo os
vetores singulares à esquerda associados a σ(∆v (δ)) e considere Qv (δ) a submatriz de
V (δ) compreendendo os vetores singulares à direita associados a σ(∆v (δ)). Analogamente,
considere QIu (δ) a submatriz de UI (δ) compreendendo os vetores singulares à esquerda
associados a σ(∆f (δ)) e considere QIv (δ) a submatriz de VI (δ) compreendendo os vetores
singulares à direita associados a σ(∆f (δ)). Note que o valor de θπ (δ) permanece inalterado
se as matrizes Z em (3.26) e W em (3.30) são restringidas a Z = Qu (δ)Y Qv (δ)H , com
Y ∈ Yr1 , e W = QIu (δ)XQIv (δ)H , com X ∈ Yr2 , respectivamente. Denota-se por Yr o
seguinte conjunto, Yr , {Y ∈ Hr | Y 0 , Tr Y = 1}. Em seguida, seja θπ rescrita como
1 T
j
j
θπ (δ) = min max max φπ (δ, Yj , Xj ) − fπ (δ) + ∇δ φπ (δ, Yj , Xj ), h + h Qh . (3.40)
j Yj ,Xj
h
2
A dualidade de Fenchel permite cambiar os operadores min e max em (3.40). Inicialmente,
o primeiro supremo interior é substituído por um supremo sobre o envelope convexo,
parametrizado por algum τ ∈ Σ6 . Esta operação não altera o valor de θπ . Então, max e
min são trocados. O agora interno ínfimo sobre h ∈ Rm torna-se sem restrição e pode ser
calculado explicitamente. Para τ , Yj e Xj fixos, determina-se
h(δ, τ, Yj , Xj ) = −Q−1
X
τj ∇δ φjπ (δ, Yj , Xj ).
(3.41)
j
Substituindo de volta, a seguinte expressão dual é obtida:
θπ (δ) = max max
(
X
τ ∈Σ6 Yj ,Xj
τj φjπ (δ, Yj , Xj ) − fπ (δ)
j
−
1
2
!T
X
τj ∇δ φjπ (δ, Yj , Xj )
j
Q−1
X
j
55
τj ∇δ φjπ (δ, Yj , Xj )
!


. (3.42)
Para o cálculo dos gradientes aparecendo em (3.42), observe que
df (δ) =
=
max h Z , d∆v (δ) i
Z∈Zp1 ×q1
max
Re Tr Z H d∆v (δ)
p ×q
Z∈Z
=
1
1
1
Re vecT (Z ∗ ) J∆v dδ
max
p ×q
Z∈Z
=
1
T
∗
max
Re
vec
(Z
)
vec(d∆
v (δ))
p ×q
Z∈Z
=
1
max
Re Tr (Z ∗ )T d∆v (δ)
p ×q
Z∈Z
=
1
1
max
p ×q
Z∈Z
1
1
1
T
dδ.
Re J∆T v vec(Z ∗ )
Conclui-se, então, que
∇δ φf (δ, Y ) = Re J∆T v vec (Z ∗ ) .
O TEO. 3.5 permite caracterizar completamente o subdiferencial ∂f (·):
∂f (δ) = co Re J∆T v vec Qu (δ)∗ Y Qv (δ)T : Y ∈ Yr1 .
Aplicando raciocínio análogo para gI (δ), obtém-se
∇δ φI (δ, X) = Re J∆T f vec (W ∗ ) ,
n o
∂gI (δ) = co Re J∆T f vec QIu (δ)∗ XQIv (δ)T : X ∈ Yr2 .
(3.43)
(3.44)
(3.45)
(3.46)
Para o cálculo de JGE (·), é necessário o cálculo da derivada do determinante. Como a
matriz (I − ∆c (δ)M ) estará frequentemente próxima da singularidade, torna-se necessária
a aplicação da Fórmula de Jacobi, que diz que para uma matriz A qualquer,
d(det(A)) = Tr (Adj(A) dA)
Assim, para gE1 (·) obtém-se:
dgE1 (δ) = Re d (det (I − ∆c (δ)M ))
= Re Tr (Adj(I − ∆c (δ)M )d (I − ∆c (δ)M ))
= −Re Tr (Adj(I − ∆c (δ)M )d∆c (δ)M )
= −Re Tr (M Adj(I − ∆c (δ)M )d∆c (δ))
T
= −Re Tr AdjT (I − ∆c (δ)M )M T d∆c (δ)
= −Re vecT AdjT (I − ∆c (δ)M )M T vec (d∆c (δ))
= −Re vecT AdjT (I − ∆c (δ)M )M T J∆c dδ
T
dδ.
= −Re J∆T c vec AdjT (I − ∆c (δ)M )M T
56
(3.47)
De onde se conclui que
∇δ gE1 (δ) = −Re J∆T c vec AdjT (I − ∆c (δ)M )M T
.
(3.48)
.
(3.49)
Pelo mesmo raciocínio, tem-se
∇δ gE2 (δ) = −Im J∆T c vec AdjT (I − ∆c (δ)M )M T
Baseado em (3.43), (3.45), (3.48) e (3.49), e definindo Tj = τ j Yj e Rj = τ j Xj em
(3.42),
θπ (δ) =
max
Tj 0, Rj 0,
P
j Tr(Tj ) = 1,
P
j Tr(Rj ) = 1
−
1
2
(
X
φjπ (δ, Tj , Rj ) − fπ (δ)
j
!T
X
∇δ φjπ (δ, Tj , Rj )
j
Q−1
X
j
∇δ φjπ (δ, Tj , Rj )
!

. (3.50)

Finalmente, o programa (3.50) pode ser convertido em um problema LMI utilizando-se
complemento Schur.
Note que se Yj e Xj são mantidos fixos, então (3.50) se reduz a um programa convexo
quadrático (CQP). Por um lado, isto resulta em direções de descida h(·) de pior qualidade. Por outro lado, o CQP resultante pode ser resolvido eficientemente pelos algorimos
atualmente disponíveis e com um tempo de execução menor que o SDP (3.50) original.
A experiência prática tende a demonstrar a superioridade da abordagem CQP, porque
embora o número de iterações possa eventualmente aumentar, o tempo computacional
final é menor do que se SDP fossem resolvidos.
O modelo da função objetivo representado por θπ (·) é em princípio de primeira ordem,
mas o termo quadrático no programa tangente (3.35) pode em tese ser usado para capturar
informação de segunda ordem. A escolha mais elementar consiste em se fazer Q = ηI 0.
É sabido que o determinante não representa a medida mais apropriada da singularidade
de uma matriz, uma vez que uma matriz pode ter um determinante bastante pequeno
mesmo estando longe da singularidade (STRANG, 2005). De fato, na presente aplicação
tal fenômeno torna-se facilmente perceptível tão logo a dimensão dos blocos de escalares
repetidos aumenta. O menor valor singular seria uma medida mais apropriada, mas
57
infelizmente esta função viola as hipóteses feitas até aqui com relação à função restrição
de igualdade. Para contornar essa dificuldade, o determinante foi reescalonado a cada
iteração, com o fator de reescalonamento permanecendo fixo durante cada iteração. Este
reescalonamento é feito com salvaguardas de forma a não comprometer as propriedades
de convergência e otimalidade do algoritmo.
A seguinte heurística foi utilizada para a seleção do fator de reescalonamento citado
acima. Sejam λi , i = 1, . . . , m os autovalores da matriz (I − ∆M ) organizados por ordem
decrescente de módulo. Considere o inteiro
g , min i : |λi | ≤ ,
onde ∈ R é em princípio bastante pequeno. Note que a finalidade de g é caracterizar a
partir de qual índice os autovalores podem ser considerados numericamente nulos. Definase, também,
g−1
Y
ζ,
λi
i=1
.
Então, em uma dada iteração k, a função restrição de igualdade será multiplicada por um
fator de reescalonamento γk dado por
γk = min γk−1 , ζk−1 .
(3.51)
A experiência numérica decorrente dos diversos exemplos discutidos no Capítulo 4 corrobora a validade dessa abordagem.
58
4 APLICAÇÕES NUMÉRICAS
As simulações e cálculos envolvidos nas aplicações numéricas apresentadas nesta seção
foram realizados com a ferramenta Matlab, versão R2010b. O processador utilizado foi
um Core 2 Duo, 2,10GHz, com 4Gb de memória RAM.
4.1 EXEMPLO COM INCERTEZAS PURAMENTE REAIS
A primeira aplicação trata do problema acadêmico apresentado originalmente em (ELGERSMA, 1992). A técnica para a obtenção de limitantes inferiores para µ via otimização
não-diferenciável com a utilização de grade de frequências (LI ND-GF), tratada nos Capítulos 2 e 3, é utilizada para estimar um limitante inferior para µ. É considerada a matriz
M ∈ C3×3 , da estrutura M ∆, que varia com

r/2

M =
θ/2
θ/2
o parâmetro escalar real ω (frequência):

s/θ s/θ

(4.1)
r s/θ

θ
r
onde,
r = 2(ω + j),
s = r2 − 12j,
j=
√
−1
(4.2)
e θ é a solução da equação quadrática
sθ2 + r(r2 − 3s)θ + s2 = 0.
(4.3)
O bloco de incertezas ∆ é composto por 3 parâmetros escalares reais não-repetidos:


δ1


.
∆=
(4.4)
δ
2


δ3
Em (ELGERSMA, 1992) é proposto um método para o cálculo do valor exato de
µ para o exemplo em questão. A comparação dos resultados fornecidos pelo algoritmo
ND-GF com o valor exato de µ, que nesse caso particular é conhecido, mostra a eficácia
da técnica proposta. São realizadas 3 análises que diferem no número de pontos iniciais
considerados para cada frequência. Os pontos iniciais foram escolhidos aleatoriamente.
59
A FIG. 4.1 mostra o valor exato de µ além dos limitantes obtidos por diferentes técnicas: limitante superior (LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior
pelo algoritmo gain-based (LI GB) (SEILER, 2010) e limitante inferior via otimização
não-diferenciável com grade de frequências (LI ND-GF), obtido com 1 ponto inicial para
cada frequência da grade.
FIG. 4.1: Limitantes de µ com 1 ponto inicial: 1a aplicação .
LS e LI GB são calculados através de rotinas disponíveis na toolbox de controle robusto
do Matlab. O algoritmo GB levou 1,2 minutos no cálculo do limitante inferior, para
uma grade de frequências com 100 pontos logaritmicamente espaçados. O algoritmo NDGF, para o mesma grade, gastou 2,5 minutos. Contudo, é possível observar que mesmo
considerando apenas 1 ponto inicial para cada frequência, de uma maneira geral, LI NDGF é mais preciso do que LI GB.
O algoritmo ND-GF é baseado em uma técnica de otimização local, e portanto, a escolha do ponto inicial pode impactar o resultado. A FIG. 4.2 retrata os mesmos limitantes
da FIG. 4.1, no entanto, nessa simulação foi adotada a estratégia de múltiplos-começos,
sendo considerados 5 pontos iniciais para cada frequência. O algoritmo ND-GF gastou,
neste caso, cerca de 15 minutos para o cálculo do limitante inferior.
60
FIG. 4.2: Limitantes de µ com 5 pontos iniciais: 1a aplicação .
Nota-se que com o aumento do número de pontos iniciais, o limitante encontrado é
menos conservador, aproximando-se do valor exato de µ. Finalmente, a FIG. 4.3 mostra os
limitantes de µ para 10 pontos iniciais. O algoritmo ND-GF gastou cerca de 33 minutos,
com essa configuração, e o limitante inferior obtido praticamente coincidiu com o valor
exato de µ.
Com a finalidade de obter-se uma certificação de que as incertezas encontradas são
realmente desestabilizantes, são calculados dois indicadores de singularidade para a matriz
(I−∆M ): O menor valor singular σ(I−∆M ) e o recíproco do número de condicionamento,
rcond(I − ∆M ) =
σ(I − ∆M )
.
σ(I − ∆M )
(4.5)
As FIGs. 4.4 e 4.5 mostram estes indicadores nos casos GB e ND-GF na simulação com
10 pontos iniciais. Os resultados indicam que as incertezas encontradas são realmente
desestabilizantes. São considerados satisfatórios valores menores do que 10−5 (zero numérico).
61
FIG. 4.3: Limitantes de µ com 10 pontos iniciais: 1a aplicação .
FIG. 4.4: Análise de singularidade via menor valor singular (GB/ND-GF): 1a aplicação.
62
FIG. 4.5: Análise de singularidade via recíproco do número de condicionamento
(GB/ND-GF): 1a aplicação.
4.2 EXEMPLO COM INCERTEZAS MISTAS
Essa aplicação trata da análise de estabilidade e desempenho robustos de um exemplo
apresentado originalmente na toolbox de controle robusto do Matlab (versão R2010b). O
bloco de incertezas inclui dinâmicas não-modeladas e variações paramétricas. A FIG. 4.6
mostra o diagrama de blocos do sistema em malha fechada:
FIG. 4.6: Diagramas de blocos do sistema em malha fechada: 2a aplicação.
63
O modelo da planta P é incerto, os sinais d e n são distúrbios e a saída e deve
ser mantida pequena para uma rejeição adequada desses distúrbios. P é um sistema
de segunda ordem que possui incerteza paramétrica nos coeficientes do denominador e
significativa dependência frequencial de dinâmicas não modeladas. O modelo matemático
considerado é descrito a seguir:
P (s) =
s2
16
(1 + Wu (s)δc (s)).
+ 0, 16s + k
(4.6)
Assume-se que o parâmetro k possua 40% de incerteza e valor nominal 16. A incerteza
dependente da frequência na entrada da planta, referente às dinâmicas não-modeladas, é
considerada 20% para baixas frequências e atinge 100% em 6 rad/s. A variação é dada
pela ponderação Wu (s):
10s + 12, 18
.
s + 60, 93
O controlador K de 3a ordem é dado a seguir:
Wu (s) =
K(s) =
−12, 56s2 + 17, 32s + 67, 28
.
s3 + 20, 37s2 + 136, 74s + 179, 46
(4.7)
(4.8)
Considere inicialmente a análise de robustez em estabilidade. O sistema nominal em
malha fechada M (s) da estrutura M ∆ tem ordem 6. O bloco de incertezas ∆ ∈ C2×2 é
composto pela incerteza complexa δc , que é representada por δc1 + δc2 j, e pela incerteza
paramétrica δk , com δc1 , δc2 e δk ∈ R:
"
∆=
#
δc1 + δc2 j
.
(4.9)
δk
A FIG. 4.7 mostra os limitantes de µ obtidos por diferentes técnicas: limitante superior
(LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior pelo algoritmo gainbased (LI GB) (SEILER, 2010), limitante inferior via otimização não-diferenciável com
grade de frequências (LI ND-GF). LS e LI GB são calculados através de rotinas disponíveis
na toolbox de controle robusto do Matlab.
O algoritmo GB gastou 2 segundos no cálculo de LI GB, para um grade de frequências com 100 pontos logaritmicamente espaçados. O algoritmo ND-GF, para a mesma
grade, gastou 28 segundos no cálculo de LI ND-GF, considerando 1 ponto inicial para
cada frequência. Observa-se na FIG. 4.7 que LS, LI GB e LI ND-GF são praticamente
coincidentes, o que sugere que a presença de incerteza complexa tende a convexificar o
problema, facilitando a determinação do mínimo global. Nesses casos, o algoritmo GB
64
FIG. 4.7: Limitantes de µ: 2a aplicação .
fornece limitantes inferiores bastante satisfatórios com um tempo de execução inferior
ao algoritmo ND-GF. Esse resultado parece indicar que o foco de aplicação da técnica
de otimização não-diferenciável são os sistemas onde só existam incertezas paramétricas,
casos em que há margem para melhoria na exatidão do cálculo de limitantes inferiores
para µ e ν. As FIGs. 4.8 e 4.9 indicam que as incertezas encontradas, tanto por GB
quanto por ND-GF, são realmente desestabilizantes. É possível observar que em altas
frequências (acima de 100 rad/s) o algoritmo ND-GF não conseguiu encontrar incertezas
desestabilizantes. Porém, nesse exemplo, isso não chega a representar uma limitação, uma
vez que, nessa faixa de frequências o valor de µ é praticamente nulo.
Considere agora o teste de robustez em desempenho discutido na Seção 2.5.1. A
técnica para obtenção de limitantes inferiores para ν via otimização não-diferenciável com
grade de frequências (LI ND-GF) é utilizada na determinação do pior caso de ganho da
transferência F , com a medida do ganho sendo dada pela norma kHk∞ . A estrutura N ∆
(FIG. 2.3) é utilizada para representar o sistema em malha fechada. O sistema nominal
N (s), assim como M (s), possui ordem 6, mas agora o canal de desempenho é considerado.
A transferência do sistema em malha fechada da entrada [d, n]T para a saída e é dada por
F = Fu (N, ∆) ∈ C1×2 . A FIG. 4.10 mostra os limitantes para o pior caso de ganho da
65
FIG. 4.8: Análise de singularidade via menor valor singular (GB/ND-GF): 2a aplicação
(estabilidade robusta).
(GB/ND-GF): 2a aplicação (estabilidade robusta).
66
transferência F obtidos por diferentes técnicas: limitante superior (LS-WC) e limitante
inferior (LI-WC) obtidos pela rotina wcgain da toolbox de controle robusto do Matlab e
limitante inferior via otimização não-diferenciável com grade de frequências (LI ND-GF).
FIG. 4.10: Limitantes para o pior caso de ganho da transferência F : 2a aplicação.
O bloco fictício ∆p ∈ C2×1 que representa as especificações de desempenho H∞ é dado
por:
"
∆p =
δ1 + δ2 j
#
.
(4.10)
δ3 + δ4 j
ˆ é dado por diag {∆, ∆p }:
O bloco de incertezas aumentado ∆


δc + δc2 j 0
0
 1



0
δ
0
k


ˆ
∆=
.


0
0
δ
+
δ
j
1
2


0
0 δ3 + δ4 j
(4.11)
ˆ ∆f = ∆ e ∆v = ∆p . O algoritmo NDLI ND-GF é obtido com a técnica ν, onde ∆c = ∆,
GF gastou 128 segundos no cálculo de LI ND-GF, considerando 1 ponto inicial para cada
frequência de uma grade com 100 pontos logaritmicamente espaçados. O cálculo feito
67
pela rotina wcgain levou 40 segundos. Assim como no estudo da estabilidade robusta,
ˆ possuir blocos de incertezas complexos, LS-WC, LI-WC e LI ND-GF são
em função de ∆
praticamente coincidentes. Novamente, os resultados obtidos pelas técnicas atualmente
disponíveis não oferecem margem para melhoria na exatidão. As FIGs. 4.11 e 4.12 mostram que as incertezas encontradas pelo algoritmo ND-GF na faixa crítica de frequência
são realmente desestabilizantes. Novamente, em altas frequências ND-GF não conseguiu
encontrar perturbações desestabilizantes.
FIG. 4.11: Análise de singularidade via menor valor singular (ND-GF): 2a aplicação
(desempenho robusto).
68
(ND-GF): 2a aplicação (desempenho robusto).
4.3 SISTEMA MASSA-MOLA-AMORTECEDOR
Essa aplicação trata do sistema de controle do modelo massa-mola-amortecedor apresentado originalmente em (ACKERMANN, 1990). A técnica para obtenção de limitantes
inferiores para µ via otimização não-diferenciável com abordagem por espaço de estados
(LI ND-EE), tratada nos Capítulos 2 e 3, é utilizada na análise de robustez em estabilidade. O modelo é composto por 2 massas como mostrado na FIG. 4.13.
FIG. 4.13: Sistema massa-mola-amortecedor.
69
As matrizes da representação em espaço de estados do modelo são mostradas a seguir.
A planta compreende 4 estados: posição de m1 (x1 ), velocidade de m1 (x˙1 ), posição de
m2 (x2 ) e velocidade de m2 (x˙2 ). É considerada como entrada a força aplicada à massa
m2 e como saída a posição da massa m1 :


0
1
0
0



 −(c1 +c12 ) −d1
c12
0

 m1
m1
m1
A=
,

 0
0
0
1


−(c2 +c12 )
c12
−d2
0
m2
m2
m2
 
0
 
0
 
B =  ,
0
 
1
h
i
C= 1 0 0 0 ,
D = 0.
(4.12)
Os valores nominais das massas, das constantes elásticas das molas e dos coeficientes de
amortecimento dos amortecedores são conhecidos: m1 = 2 Kg, m2 = 3, 5 Kg, c1 = 1, 5
N/m, c2 = 3 N/m, c12 = 1 N/m, d1 = 1, 25 Ns/m e d2 = 1, 25 Ns/m. O modelo do sistema
em malha fechada envolve um controlador de terceira ordem. A função de transferência
do controlador é dada por:
K(s) =
471250s3 + 801125s2 + 895375s + 235625
.
s3 + 62s2 + 1450s + 19000
(4.13)
Considere agora o seguinte problema de análise. Suponha que não exista incerteza na
constante elástica c12 da mola que liga as massas m1 e m2 . Para qual faixa de valores das
contantes m1 , m2 , c1 , c2 , d1 e d2 o sistema permanece estável? Nesse caso, as técnicas
que utilizam grade de frequências na análise µ se mostram ineficientes, tal como indicado
a seguir.
A FIG. 4.14 mostra os limitantes de µ obtidos por diferentes técnicas: limitante superior (LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior pelo algoritmo
gain-based (LI GB) (SEILER, 2010) e limitante inferior via otimização não-diferenciável
com abordagem por espaço de estados (LI ND-EE). LS e LI GB são calculados através
de rotinas disponíveis na toolbox de controle robusto do Matlab.
70
FIG. 4.14: Limitantes de µ: massa-mola-amortecedor.
A estrutura M ∆ envolve um sistema nominal M (s) de ordem 7. Nos casos LS, LI GB,
o bloco de incertezas ∆ é composto por 4 escalares reais não-repetidos e 2 escalares reais
repetidos 3 vezes:

δc 1


δc 2



δd1
∆=

δd2



δm1 I3







.





(4.14)
δm2 I3
No caso LI ND-EE, ∆aum é composto por 1 escalar real repetido 7 vezes (frequência)
mais um bloco com 4 escalares reais não-repetidos e 2 escalares reais repetidos 3 vezes
(parâmetros):
71
∆aum


δω I7


δc1



δc 2


=
δd1


δd2



δm1 I3








.






(4.15)
δm2 I3
A solução é obtida com a reformulação do problema com a técnica ν, conforme discutido
na Seção 2.6, com ∆c = ∆aum , ∆f = δω I7 e ∆v = ∆. Os fatores de ponderação utilizados
na representação das incertezas foram selecionados como 50%.
O algoritmo ND-EE detecta o valor de pico de 1, 7535 para o limitante inferior de µ na
frequência crítica de 16, 9124 rad/s. As FIGs. 4.15 e 4.16 indicam que as incertezas encontradas são realmente desestabilizantes. São utilizados como indicadores de singularidade
o menor valor singular σ(I − ∆c M̂1 ) e o recíproco do número de condicionamento,
rcond(I − ∆c M̂1 ) =
σ(I − ∆c M̂1 )
σ(I − ∆c M̂1 )
.
(4.16)
O limitante superior e o limitante inferior obtidos pelo algoritmo gain-based são calculados para uma grade de frequências com 1000 pontos logaritmicamente espaçados. LS
indica o valor de pico de 1,699 na frequência de 17,03 rad/s, enquanto que LI GB indica
o valor de pico de 1,659 na frequência de 17,03 rad/s. Para esse exemplo, a limitação
das técnicas que utilizam grade de frequência fica evidente. Mesmo com a utilização de
uma grade bastante densa, os valores de pico estimados por LS e LI GB são menores do
que o determinado por LI ND-EE. Em virtude disso, o uso do valor de pico dado por
LS para determinar a margem de estabilidade, que em alguns casos pode ser até mesmo
conservador, seria na verdade excessivamente otimista. Seria esperada a manutenção
da estabilidade do sistema caso a faixa de variação dos parâmetros incertos não excedesse 29, 42% (50%/1, 699), no entanto, LI ND-EE mostra que existe uma incerteza com
28, 51%(50%/1, 7535) de variação que leva o sistema à instabilidade. Outra vantagem do
algoritmo ND-EE, para essa aplicação, é o tempo computacional. Enquanto que o algoritmo GB gastou cerca de 16 minutos no cálculo de um limitante inferior para µ, ND-EE
gastou 1,5 minutos, com 10 pontos iniciais para cada um dos 4 intervalos de frequência
72
FIG. 4.15: Análise de singularidade via menor valor singular (ND-EE):
massa-mola-amortecedor.
(ND-EE): massa-mola-amortecedor.
73
considerados. Isso se deve, principalmente, ao fato da abordagem não-diferenciável não
sofrer grande impacto no tempo computacional em virtude da dimensão de incertezas
paramétricas repetidas no bloco estruturado das incertezas.
4.4 SISTEMA DE CONTROLE DE VOO LONGITUDINAL DE MÍSSIL
Essa aplicação trata do sistema de controle de voo longitudinal para o modelo de míssil
apresentado originalmente em (WISE, 1990). A aerodinâmica do míssil foi linearizada
para um ângulo de ataque de 16 graus, Mach 0,8 e uma altitude de 4000 pés. O modelo
de corpo rígido da estrutura do míssil compreende 4 estados: ângulo de ataque (α),
taxa de elevação (q), deflexão da barbatana (β), taxa de deflexão da barbatana (β̇). A
entrada da planta é o comando de deflexão da barbatana (βc )(rad) e as saídas são a
aceleração vertical (η)(ft/s2 ) e a taxa de elevação (q)(rad/s). Assume-se que os valores
da velocidade do míssil (V = 886, 78 ft/s), do amortecimento (ζ = 0, 6) e da frequência
natural (ωn = 113rad/s) do atuador sejam conhecidos precisamente. Os valores nominais
das derivadas aerodinâmicas de estabilidade são Zα = −1, 3046 1/s, Zβ = −0, 2142 1/s,
Mα = 47, 7109 1/s2 e Mβ = −104, 8346 1/s2 . O modelo nominal é instável em malha
aberta, mas um controlador de segunda ordem estabiliza o sistema em malha fechada. As
entradas do controlador, como mostrado na FIG. 4.17, são o erro da aceleração vertical
(e = ηc − η)(ft/s2 ) e a taxa de elevação (−q)(rad/s), a saída é o comando de deflexão do
fin (βc )(rad).
FIG. 4.17: Diagrama de blocos do míssil.
74
As matrizes da representação em espaço de estados da planta do míssil são dadas por:


 
Zα 1 Zβ
0
0


 
"
#
" #
M 0 M
0
0 
V Zα 0 V Zβ 0
0
β
 α

 
A=
, D=
.
, B =  , C =
 0 0

0
0
1
0
1
0
0
0

 

2
ωn2
0 0 −ωn −2ζωn
(4.17)
As matrizes da representação em espaço de estados do controlador são dadas por:
"
#
"
#
h
i
h
i
0
0
K a az
0
Ac =
, Bc =
, Cc = Kq 1 , Dc = Ka Kq Kq ,
K q aq 0
K a K q aq K q aq
(4.18)
onde os parâmetro são conhecidos, Ka = −0, 0015, Kq = −0, 32, az = 2, 0 e aq = 6, 0.
Considere inicialmente o seguinte problema de análise. Suponha que não existam
incertezas nas derivadas de estabilidade Zα e Zβ . Para que faixa de valores das derivadas
de estabilidade Mα e Mβ o sistema em malha fechada mantém-se estável? Apesar de
sua aparente simplicidade, enfrentar este problema através da análise-µ é difícil, tal como
especificado abaixo.
FIG. 4.18: Limitantes de µ: míssil.
75
A FIG. 4.18 mostra os limitantes de µ obtidos por diferentes técnicas: limitante superior (LS) proposto em (FAN, 1991) (YOUNG, 1992), limitante inferior pelo algoritmo
gain-based (LI GB) (SEILER, 2010), limitante inferior via otimização não-diferenciável
com grade de frequências (LI ND-GF) e limitante inferior via otimização não-diferenciável
com abordagem por espaço de estados (LI ND-EE). LS e LI GB são calculados através de
rotinas disponíveis na toolbox de controle robusto do Matlab. A estrutura M ∆ envolve um
sistema nominal M (s) de ordem 6. O bloco de incertezas ∆ é composto por 2 escalares
reais não-repetidos nos casos LS, LI GB e LI ND-GF:
"
#
δMα
∆=
.
δMβ
(4.19)
No caso LI ND-EE, ∆aum é composto por por um escalar real repetido 6 vezes (frequência)
mais 2 escalares reais não-repetidos (derivadas de estabilidade):


δω I6


.
∆aum = 
δ
Mα


δMβ
(4.20)
na representação das incertezas para Mα e Mβ são selecionados como 100%.
Note na FIG. 4.18 que µ apresenta um pico estreito seguido por uma descontinuidade
na frequência. Como enfatizado na Seção 2.6, abordagens baseadas em grade de frequências podem ser inapropriadas quando há ocorrência de picos. Na verdade, um ponto crítico
pode ser facilmente perdido se a grade não for suficientemente densa, podendo acarretar
imprecisões na estimação da margem de estabilidade. Para resultados mais precisos, a
grade pode ser adensada na região previamente identificada como crítica.
O algoritmo ND-EE detecta o valor de pico 1,5389 na frequência crítica de 5,5598
rad/s. As FIGs. 4.19 e 4.20 indicam que as incertezas encontradas são realmente desestabilizantes.
Frequências logaritmicamente espaçadas são selecionadas para formar a grade de
frequências usada pelas técnicas LS, LI GB e LI ND-GF. Para um número crescente
de pontos da grade, o limitante superior e o limitante inferior obtido pelo algoritmo NDGF se aproximam do valor de pico encontrados pela técnica ND-EE na freqüência crítica
referida. Para cerca de 1000 ou mais pontos na grade, os três limitantes LS, LI ND-GF
76
FIG. 4.19: Análise de singularidade via menor valor singular (ND-EE): míssil (análise µ).
(ND-EE): míssil (análise µ).
77
e LI ND-EE praticamente coincidem para 5,5598 rad/s, sugerindo que 1,5389 representa
o valor de pico verdadeiro de µ. Note que a frequência crítica (5,5598 rad/s) obtida pela
técnica ND-EE foi incluída na grade de frequências usada na FIG. 4.18 a fim de ajudar a
verificação da consistência dos resultados.
Como conclusão, a análise-µ discutida indica que o sistema em malha fechada permanece estável se as derivadas de estabilidade Mα e Mβ não apresentarem variação maior
que 64,98% (100%/1,5389) em relação aos seus valores nominais. A FIG. 4.21 mostra LS
e LI ND-EE de µ para uma nova configuração com ponderação de 64, 98%. Os valores
de pico encontrados pelas duas técnicas, na frequência crítica de 5,56 rad/s, praticamente
coincidem em 0,999, sugerindo que este seja o verdadeiro valor de pico de µ.
FIG. 4.21: Limitante de µ: míssil (Mα e Mβ reduzidos).
Outro fato que cabe ressaltar é que mesmo com o pequeno número de parâmetros
incertos, o limitante inferior obtido com a técnica GB é bastante insatisfatório. De fato,
para uma série de frequências, especialmente no intervalo crítico, a técnica GB não consegue nem mesmo achar uma incerteza desestabilizante, como indicado pelas FIGs. 4.22
e 4.23. O desempenho do algoritmo PI (power iteration) é ainda pior e, portanto, não foi
incluído na FIG. 4.18. O algoritmo GB gastou 69 segundos no calculo de um limitante
inferior de µ para uma grade com 1000 pontos. O algoritmo ND-EE com 10 pontos iniciais
78
e 3 intervalos de frequência gastou 62 segundos.
FIG. 4.22: Análise de singularidade via menor valor singular para (GB/ND-GF): míssil.
(GB/ND-GF): míssil.
Considere agora o seguinte problema de análise com maior grau de complexidade.
79
Suponha que há incerteza nas quatro derivadas de estabilidade. Em particular, assuma
que as derivadas de estabilidade Mα e Mβ não tenham variação maior que 60% em relação
aos seus valores nominais. Assim, para qual intervalo de valores de Zα e Zβ o sistema
em malha fechada mantém-se estável? Este é um típico problema de análise-ν discutido
na Seção 2.4. Limitantes de ν obtidos por diferentes técnicas são mostrados na FIG.
4.24: limitante superior (LS) (FERRERES, 1997) e limitante inferior (LI PI) obtidos pelo
método das potências (FERRERES, 1999), implementados com as rotinas mixed_mu_ub
e mixed_mu_lb da toolbox SMT (FERRERES, 2004), limitante inferior via otimização
não-diferenciável com grade de frequências (LI ND-GF) e limitante inferior via otimização
não-diferenciável com abordagem por espaço de estados (LI ND-EE).
FIG. 4.24: Limitantes de ν: míssil.
Agora, o bloco de incertezas ∆c é composto por 4 escalares reais não-repetidos nos
casos LS, LI PI e LI ND-GF:

δM
 α

δMβ

∆c = 

δZα

80

δZβ



,


(4.21)
com
"
∆f =
#
δMα
,
(4.22)
.
(4.23)
δM β
e
"
∆v =
#
δZα
δZβ
No caso LI ND-EE, ∆aum é composto por um escalar real repetido 6 vezes (frequência) e
por 4 escalares reais não-repetidos (derivadas de estabilidade):


δ I

 ω 6


δMα




,
∆aum = ∆c = 
δM β






δ
Z
α


δZβ
com
(4.24)


δω I6

∆f = 
δM α


,

(4.25)
δMβ
e
"
∆v =
#
δZα
.
(4.26)
δZβ
Os fatores de ponderação foram selecionados como 60% para Mα e Mβ e 100% para Zα e
Zβ .
O algoritmo PI gastou 11 segundos no cálculo de um limitante inferior de ν para uma
grade com 100 pontos, mas não conseguiu convergir para a maioria das frequências da
grade. A técnica ND-EE determinou um valor de pico de 1,5305 na frequência de 3,214
rad/s, levando 35 segundos com a utilização de 3 pontos iniciais para cada um dos 3
intervalos. As FIGs. 4.25 e 4.26 indicam que as incertezas encontradas são realmente
desestabilizantes.
Com uma grade de frequências com 100 pontos logaritmicamente espaçados, tanto o
limitante superior quanto o limitante inferior obtidos pela técnica ND-GF subestimam,
ligeiramente, o valor de pico fornecido pelo algoritmo ND-EE. Aumentando o número
de pontos da grade, ambos os valores, LS e LI ND-GF, convergem para o valor de pico
encontrado por ND-EE. Mais uma vez, o valor praticamente idêntico de LS, LI ND-GF
81
FIG. 4.25: Análise de singularidade via menor valor singular (ND-EE): míssil (análise ν).
(ND-EE): míssil (análise ν).
82
e LI ND-EE na frequência crítica (3,214 rad/s) sugere que o valor de pico determinado
pela abordagem ND-EE é realmente igual ao verdadeiro valor de pico de ν. Isso significa dizer que se a variação das derivadas de estabilidade Zα e Zβ não for maior que
65, 33% (100%/1, 5305) em relação aos seus valores nominais, o sistema em malha fechada
mantém-se estável. A FIG. 4.27 mostra LS e LI ND-EE de µ para uma nova configuração com ponderação de 65, 33%. Os valores de pico encontrados pelas duas técnicas, na
frequência crítica de 3,403 rad/s, praticamente coincidem em 0,997, sugerindo que este
seja o verdadeiro valor de pico de µ.
FIG. 4.27: Limitante para µ - míssil: Zα e Zβ reduzidos .
4.5 AVIÃO FLEXÍVEL
Nessa aplicação, a técnica para obtenção de limitantes inferiores de µ e ν via otimização não-diferenciável com abordagem por espaço de estados é usada na análise de
robustez em estabilidade do controlador de voo lateral projetado para a aeronave flexível
de transporte apresentada em (FERRERES, 1999). Os dados numéricos para esse problema estão disponíveis na toolbox SMT (FERRERES, 2004). As limitações encontradas
pelas técnicas que utilizam grade de frequência para detectar valores de pico de µ e ν
83
tornam-se evidentes, nesse caso, devido à presença de modos flexíveis. Inicialmente, a
margem de estabilidade é estimada via análise-µ.
FIG. 4.28: Limitantes de µ - avião flexível.
A FIG. 4.28 mostra os diferentes limitantes obtidos para µ: limitante superior
(LS)(FAN, 1991) (YOUNG, 1992), limitante inferior dado pelo algoritmo gain-based (LI
GB)(SEILER, 2010) e limitante inferior via otimização não-diferenciável com abordagem
por espaço de estados (LI ND-EE). Nota-se que algoritmos em tempo exponencial como
o método de Dailey (DAILEY, 1990) são inoperantes para aplicações com grande número
de incertezas paramétricas, como o presente. O modelo flexível apresenta 20 parâmetros
incertos, compreendendo 14 coeficientes aerodinâmicos do modelo de corpo rígido e as
frequências naturais de 6 modos flexíveis. O sistema nominal em malha fechada M (s) da
estrutura M ∆ tem ordem 46. O bloco de incertezas ∆ é composto por 20 escalares reais
não-repetidos nos casos LS e LI GB:

δ1

..
∆=
.



.

(4.27)
δ20
No caso LI ND-EE, ∆aum é composto por um escalar real repetido 46 vezes (frequência)
84
e por 20 escalares reais não-repetidos (coeficientes aerodinâmicos e frequências naturais):


δω I46




δ
1


∆aum = 
(4.28)
.
..


.


δ20
na representação das incertezas foram selecionados como 10%.
O algoritmo ND-EE detecta o valor de pico de 4,475 para o limitante inferior de µ
na frequência crítica de 13,3587 rad/s. As FIGs. 4.29 e 4.30 indicam que as incertezas
encontradas são realmente desestabilizantes.
FIG. 4.29: Análise de singularidade via menor valor singular (ND-EE): avião flexível
(análise µ).
85
(ND-EE): avião flexível (análise µ).
O limitante superior e o limitante inferior obtidos pelo algoritmo gain-based são calculados para uma grade de frequências com 1000 pontos logaritmicamente espaçados e
indicam um valor de pico de 3,798 na frequência de 13,4 rad/s. A limitação das técnicas
que utilizam grade de frequências na manipulação de modos flexíveis fica evidente, tendo
em vista que, mesmo com a utilização de uma grade bastante densa, os valores de pico
estimados por LS e LI GB são consideravelmente menores do que o determinado pelo
algoritmo ND-EE. Assim como na aplicação massa-mola-amortecedor discutida na Seção
4.3, o uso do valor de pico dado por LS para determinar a margem de estabilidade seria
otimista: seria esperada a manutenção da estabilidade do sistema caso a faixa de variação dos parâmetros incertos não excedesse 2, 63% (10%/3, 798). No entanto, LI ND-EE
mostra que existe uma incerteza com 2, 23% (10%/4, 475) de variação que leva o sistema
à instabilidade. O algoritmo GB gastou cerca de 19 minutos no cálculo de um limitante
inferior de µ para uma grade com 1000 pontos, enquanto que o algoritmo ND-EE com 10
pontos iniciais e 10 intervalos de frequência gastou cerca de 70 minutos, entretanto, com
resultados mais precisos.
Considere agora o seguinte problema de análise com maior grau de complexidade.
86
Assumindo que os coeficientes aerodinâmicos não sofram variação maior do que 2% em
relação aos seus valores nominais, para qual faixa de valores das frequências naturais dos
modos flexíveis o sistema em malha fechada é estável? Esse é um genuíno problema de
análise ν.
FIG. 4.31: Limitantes de ν - avião flexível: restrição na faixa de variação dos coeficientes
aerodinâmicos do modelo rígido.
A FIG. 4.31 mostra o limitante superior (LS) e o limitante inferior via algoritmo PI
(LI PI), obtidos através de rotinas existentes na toolbox SMT (FERRERES, 2004), e o
limitante inferior via otimização não-diferenciável com abordagem por espaço de estados
(LI ND-EE).
Para os casos LS e LI PI, ∆c = ∆ (∆c ∈ R20×20 ) com ∆f envolvendo os 14 coeficientes
aerodinâmicos (∆f ∈ R14×14 ) e ∆v envolvendo as 6 frequências naturais (∆v ∈ R6×6 ).
Para o caso LI ND-EE, ∆c = ∆aum (∆c ∈ R66×66 ) com ∆f envolvendo a frequência
como um parâmetro incerto mais os 14 coeficientes aerodinâmicos (∆f ∈ R60×60 ) e ∆v
envolvendo as 6 frequências naturais dos modos flexíveis (∆v ∈ R6×6 ). Da análise da
FIG. 4.31 é possível observar que mesmo com a dimensão elevada da matriz de incertezas,
a técnica via otimização não-diferenciável ainda funciona adequadamente e que mesmo
estabelecendo um grade de freqüências com 1000 pontos, os valores de pico encontrados
87
em LS e LI PI são inferiores ao encontrado em LI ND-EE. Novamente, o uso de LS
para determinar a margem de estabilidade seria excessivamente otimista. Além disso, o
algoritmo de PI mais uma vez não apresenta bom desempenho, não convergindo para um
grande número de freqüências. O algoritmo ND-EE determina o valor de pico de 4,4677
para o limitante inferior de ν na frequência crítica de 13,3580rad/s. As FIGs. 4.32 e 4.33
indicam que as incertezas encontradas são realmente desestabilizantes.
FIG. 4.32: Análise de singularidade via menor valor singular (ND-EE): avião flexível (1a
análise ν.
88
(ND-EE): avião flexível (1a análise ν).
Uma comparação cuidadosa entre as FIGs. 4.28 e 4.31 é muito instrutiva. Observe que
os dois gráficos são muito semelhantes em altas frequências. Por exemplo, os valores de
pico e as respectivas frequências críticas são praticamente iguais. Contudo, os conteúdos
de baixa frequência são bastantes diferentes. Isso pode ser explicado pelo fato de que,
neste exemplo, cada tipo de incerteza afeta de forma mais significativa regiões distintas de
frequência: coeficientes aerodinâmicos em baixas frequências e frequências naturais dos
modos flexíveis em frequências mais altas. De fato, enquanto o pico na frequência 0,9469
rad/s está intimamente relacionado aos coeficientes aerodinâmicos do modelo rígido, o
pico na frequência 13,3587 rad/s está essencialmente relacionado com a incerteza em
frequências naturais dos modos flexíveis. Por exemplo, o pico em 0,9469 rad/s na FIG.
4.28 é praticamente inexistente na FIG. 4.31, porque na análise-ν realizada a faixa de
variação dos coeficientes aerodinâmicos foi restringida (2% de desvio) de forma a mantêlos longe da fronteira de estabilidade.
Para corroborar com a explicação acima, considere a situação oposta: assumindo que
as frequências naturais dos modos flexíveis não sofram variação maior do que 2%, para
qual faixa de valores dos coeficientes aerodinâmicos o sistema em malha fechada mantém89
se estável? Limitantes de ν obtidos para esse novo cenário são mostrados na FIG. 4.34.
FIG. 4.34: Limitantes de ν: avião flexível (restrição na faixa de variação das frequências
naturais dos modos flexíveis).
Agora, nos casos LS e LI PI, ∆c = ∆ (∆c ∈ R20×20 ), ∆v envolve os 14 coeficientes
aerodinâmicos (∆v ∈ R14×14 ) e ∆f envolve as 6 frequências naturais (∆f ∈ R6×6 ). Para
o caso LI ND-EE, ∆c = ∆aum (∆c ∈ R66×66 ), com ∆f envolvendo a frequência como um
parâmetro incerto mais as 6 frequências naturais dos modos flexíveis (∆f ∈ R52×52 ) e ∆v
envolvendo os 14 coeficientes aerodinâmicos (∆v ∈ R14×14 ). Mais uma vez, a técnica de
otimização não-diferenciável com abordagem por espaço de estados tem bom desempenho,
determinando um valor de pico de 2,8978 na frequência crítica de 0,9667 rad/s. As FIGs.
4.35 e 4.36 indicam que as incertezas encontradas são realmente desestabilizantes. Dessa
vez, com uma grade de frequências com 1000 pontos logaritmicamente espaçados, LS
parece coincidir com LI ND-EE, mas o algoritmo PI novamente se mostra ineficiente.
Como previsto, as FIGs. 4.28 e 4.34 são muito semelhantes na região de baixas frequências.
Por outro lado, os picos de alta frequência praticamente desaparecem na FIG. 4.34, já
que dessa vez foi a faixa de variação das frequências naturais dos modos flexíveis que foi
restringida.
90
(ND-EE): avião flexível (2a análise ν).
FIG. 4.36: Análise de singularidade via menor valor singular (ND-EE): avião flexível (2a
análise ν).
91
5 CONCLUSÃO
5.1 VISÃO GERAL DO TRABALHO
Nesse trabalho, foi proposta uma nova técnica baseada em otimização não-diferenciável
para obtenção de limitantes inferiores para o valor singular estruturado µ e para o valor
singular estruturado oblíquo ν, duas valiosas ferramentas utilizadas na análise de robustez
de sistemas incertos. Foram apresentadas duas abordagens distintas, uma que utiliza
grade de frequências (LI ND-GF) e outra que considera a frequência como um parâmetro
incerto variando dentro de um intervalo pré-determinado (LI ND-EE). O cálculo dos
limitantes foi realizado através de eficiente algoritmo dotado de certificado de convergência
global e otimalidade local.
No âmbito deste trabalho, foi aceito para apresentação oral na 10a Conferência Brasileira de Dinâmica, Controle e Aplicações (DINCON), realizada entre 28 de agosto e 2
de setembro de 2011 em Águas de Lindóia-SP, o artigo intitulado: Análise µ via otimização não-diferenciável. Também foi submetido para o International Journal of Robust and
Nonlinear Control o artigo intitulado: A non-smooth lower bound on ν.
5.2 ESTUDOS DE CASO
Na primeira aplicação discutida (Seção 4.1), foi enfatizado como a escolha do ponto
inicial pode impactar os resultados obtidos pela técnica não-diferenciável e também como
essa limitação pode ser aproximadamente contornada adotando-se uma estratégia de múltiplos começos.
A segunda aplicação (Seção 4.2) envolveu incertezas complexas. Na análise µ realizada, observou-se que o limitante superior (LS), o limitante inferior dado pelo algoritmo
gain based (LI GB) e o limitante inferior via otimização não-diferenciável com grade de
frequências (LI ND-GF) foram praticamente coincidentes, sugerindo que a presença de
incertezas complexas tende a convexificar o problema, facilitando a obtenção do mínimo
global. Também foi apresentado um teste de desempenho robusto via análise ν e novamente os limitantes encontrados foram praticamente coincidentes. A eficácia da técnica
não-diferenciável ficou ilustrada. Porém, nesses casos não há margem para melhoria na
92
exatidão dos resultados. Em virtude disso, o foco de aplicação da técnica proposta parece
ser os sistemas que possuam somente incertezas paramétricas.
A terceira aplicação (Seção 4.3) envolveu incertezas reais repetidas. Nesse caso, a
limitação das técnicas que utilizam grade de frequências na obtenção de limitantes para µ
ficou evidenciada. Mesmo com a utilização de uma grade bastante densa (1000 pontos),
os valores de pico dados por LS e LI GB subestimaram o valor de pico dado por LI
ND-EE. Outra vantagem apresentada pelo algoritmo ND-EE foi o tempo computacional,
razoavelmente menor quando comparado com LS e LI GB.
Na quarta aplicação (Seção 4.4), as técnicas LI ND-GF e LI ND-EE foram utilizadas
nas análises µ e ν do sistema de controle de voo longitudinal de um míssil. Em ambas as
análises, o valores de pico dados por LI ND-GF e por LI ND-EE praticamente coincidiram
com os valores dados por LS, sugerindo que estes representavam os verdadeiros valores de
pico de µ e de ν, o que permitiu a determinação das margens de estabilidade.
Finalmente, na quinta aplicação (Seção 4.5), a técnica LI ND-EE foi utilizada na
obtenção de limitantes inferiores para µ e ν. O modelo do avião flexível envolveu 20
parâmetros incertos. A limitação das técnicas que utilizam grade de frequências ficou
evidente nesse caso, devido à presença de modos flexíveis. Foi observado, também, que a
técnica LI ND-EE apresenta bons resultados mesmo com a elevada dimensão da matriz
de incertezas.
Os testes numéricos realizados mostraram que em alguns casos a utilização da técnica
não-diferenciável fornece limitantes inferiores mais justos em relação às técnicas mais
populares atualmente disponíveis, como por exemplo, LI PI (FERRERES, 1999) e LI GB
(SEILER, 2010).
5.3 SUGESTÃO PARA TRABALHOS FUTUROS
Como sugestão para trabalhos futuros fica a investigação de um método que possibilite
a escolha criteriosa dos pontos iniciais. A abordagem não-diferenciável proposta baseia-se
em uma técnica de otimização local. Portanto, a escolha do ponto inicial pode impactar os resultados, eventualmente resultando em um limitante inferior mais conservador.
Nos exemplos discutidos neste trabalho os pontos iniciais foram escolhidos de maneira
aleatória. As limitações impostas por essa medida foram aproximadamente contornadas
adotando-se uma estratégia de múltiplos começos. No entanto, essa estratégia pode au-
93
mentar razoavelmente o tempo computacional, sobretudo quando se utiliza a técnica com
grade de frequências.
94
6 REFERÊNCIAS BIBLIOGRFICAS
ACKERMANN, J. e SIENEL, W. What is a ’large’ number of parameters in robust
systems? Em Decision and Control, 1990., Proceedings of the 29th IEEE, volume 6,
págs. 3496 – 3497 vol.6, dec 1990.
BATES, D. G. e MANNCHEN, T. Improved computation of mixed µ bounds for flight
control law robustness analysis. Proceedings of the Institution of Mechanical Engineers,
Part I: Journal of Systems and Control Engineering, 218(8):609–619, 2004.
BLONDEL, V. D. e TSITSIKLIS, J. N. A survey of computational complexity results in
systems and control. Automatica, 36(9):1249 – 1274, 2000. ISSN 0005-1098.
CLARKE, F. H. Optimization and Nonsmooth Analysis. Canadian Math. Soc. Series.
John Wiley & Sons, New York, 1983.
DAILEY, R. L. A new algorithm for the real structured singular value. Em American
Control Conference, 1990, págs. 3036 –3040, may 1990.
DENNIS, JR., J. E. e SCHNABEL, R. B. Numerical Methods for Unconstrained Optimization and Nonlinear Equations (Classics in Applied Mathematics, 16). Soc for Industrial
& Applied Math, 1996. ISBN 0898713641.
DOYLE, J. C. Analysis of feedback systems with structured uncertainty. IEE Proceedings,
129(6):242–250, 1982.
ELGERSMA, M., F. J. e MORTON, B. Polynomial methods for the structured singular
value with real parameters. Em Decision and Control, 1992., Proceedings of the 31th
IEEE, volume 1, págs. 237 –242 vol.4, dec 1992.
FAN, M. K. H. e TITS, A. L. A measure of worst-case H∞ performance and of largest
acceptable uncertainty. Systems & Control Letters, 18(6):409 – 421, 1992. ISSN 01676911.
FAN, M., TITS, A. e DOYLE, J. Robustness in the presence of mixed parametric uncertainty and unmodeled dynamics. Automatic Control, IEEE Transactions on, 36(1):25
–38, jan 1991. ISSN 0018-9286.
FERRERES, G., BIANNIC, J. e MAGNI, J. A skew mu toolbox (SMT) for robustness
analysis. Em Computer Aided Control Systems Design, 2004 IEEE International Symposium on, págs. 309 –314, sept. 2004.
FERRERES, G. e FROMION, V. Robustness analysis using the ν tool. Em Decision and
Control, 1996., Proceedings of the 35th IEEE, volume 4, págs. 4566 –4570 vol.4, dec
1996.
95
FERRERES, G. e FROMION, V. Computation of the robustness margin with the skewed
µ tool. Systems & Control Letters, 32(4):193 – 202, 1997. ISSN 0167-6911.
FERRERES, G. A Practical Approach to Robustness Analysis with Aeronautical Applications. Klumer Academic, 1999.
FERRERES, G. e BIANNIC, J.-M. Reliable computation of the robustness margin for a
flexible aircraft. Control Engineering Practice, 9(12):1267 – 1278, 2001. ISSN 0967-0661.
FU, M. The real structured singular value is hardly approximable. Automatic Control,
IEEE Transactions on, 42(9):1286 –1288, sep 1997. ISSN 0018-9286.
GLAVASKI, S. e TIERNO, J. Advances in worst-case h∞ performance computation. Em
Control Applications, 1998. Proceedings of the 1998 IEEE International Conference on,
volume 1, págs. 668 –673 vol.1, sep 1998.
HAYES, M. J., BATES, D. G. e POSTLETHWAITE, I. New tools for computing tight
bounds on the real structured singular value. Journal of Guidance, Control, and Dynamics, 24(6):1204–1213, 2001.
HIRIART-URRUTY, J.-B. e LEMARECHAL, C. Convex Analysis and Minimization Algorithms I: Fundamentals (Grundlehren Der Mathematischen Wissenschaften). Springer, October 1993. ISBN 0387568506.
HOLLAND, R., YOUNG, P. e ZHU, C. Development of a skew µ lower bound. International Journal of Robust and Nonlinear Control, 15(11):495–506, 2005. ISSN 1099-1239.
MEINSMA, G., SHRIVASTAVA, Y. e FU, M. A dual formulation of mixed µ and on the
losslessness of (D, G) scaling. Automatic Control, IEEE Transactions on, 42(7):1032
–1036, jul 1997.
NEWLIN, M. e GLAVASKI, S. Advances in the computation of the µ lower bound. Em
American Control Conference, 1995. Proceedings of the, volume 1, págs. 442 –446 vol.1,
jun 1995.
PACKARD, A. e DOYLE, J. The complex structured singular value. Automatica, 29:
71–109, January 1993a. ISSN 0005-1098.
PACKARD, A. e PANDEY, P. Continuity properties of the real/complex structured
singular value. Automatic Control, IEEE Transactions on, 38(3):415 –428, mar 1993b.
ISSN 0018-9286.
POLAK, E. On the mathematical foundations of nondifferentiable optimization in engineering design. SIAM Rev., 29(1):21–89, 1987. ISSN 0036-1445.
POLAK, E. Optimization: algorithms and consistent approximations. Springer-Verlag
New York, Inc., New York, NY, USA, 1997. ISBN 0-387-94971-2.
SEILER, P., PACKARD, A. e BALAS, G. J. A gain-based lower bound algorithm for real
and mixed µ problems. Automatica, 46(3):493 – 500, 2010. ISSN 0005-1098.
96
SIDERIS, A. Elimination of frequency search from robustness tests. Automatic Control,
IEEE Transactions on, 37(10):1635 –1640, oct 1992. ISSN 0018-9286.
SKOGESTAD, S. e POSTLETHWAITE, I. Multivariable Feedback Control: Analysis and
Design. John Wiley & Sons, 2005. ISBN 0470011688.
STRANG, G. Linear Algebra and Its Applications. Brooks Cole, julho 2005. ISBN
0030105676.
WISE, K. A. A comparison of six robustness tests evaluating missile autopilot robustness
to uncertain aerodynamics. Em American Control Conference, 1990, págs. 755 –763,
may 1990.
YOUNG, P. M. Structured singular value approach for systems with parametric uncertainty. International Journal of Robust and Nonlinear Control, 11(7):653–680, 2001.
ISSN 1099-1239.
YOUNG, P. M., NEWLIN, M. P. e DOYLE, J. C. Practical computation of the mixed µ
problem. Em American Control Conference, 1992, págs. 2190 –2194, june 1992.
YOUNG, P. e DOYLE, J. A lower bound for the mixed µ problem. Automatic Control,
IEEE Transactions on, 42(1):123 –128, jan 1997. ISSN 0018-9286.
ZHOU, K., DOYLE, J. C. e GLOVER, K. Robust and optimal control. Prentice-Hall,
Inc., Upper Saddle River, NJ, USA, 1996. ISBN 0-13-456567-3.
ZOWE, J. Optimization with nonsmooth data. OR Spectrum, 9:195–201, 1987.
97
7 APÊNDICES
7.1 TRANSFORMAÇÕES FRACIONAIS LINEARES
As Transformações Fracionais Lineares (LFT, do inglês Linear Fractional Transformations) amplamente utilizadas na literatura de controle foram introduzidas em (DOYLE,
1984). Essas funções de matrizes são ferramentas muito poderosas na análise e projeto
de sistemas. Considere uma matriz P de dimensões (n1 + n2 ) × (m1 + m2 ) particionada
da seguinte forma:
"
P =
P11 P12
#
.
(7.1)
P21 P22
Deixe as matrizes ∆ ∈ Cm1 ×n1 e K ∈ Cm2 ×n2 ter suas dimensões compatíveis, respectivamente, com as partições superior e inferior de P . Adota-se a seguinte notação para
representar as LFT superior e inferior:
Fu (P, ∆) = P22 + P21 ∆(I − P11 ∆)−1 P12 ,
(7.2)
Fl (P, K) = P11 + P12 K(I − P22 K)−1 P21 ,
(7.3)
onde o subescrito u significa superior (upper) e l inferior (lower).
A LFT inferior Fu (P, K) é a função de transferência de w para z, obtida com a
realimentação positiva K na partição inferior de P , conforme ilustrado na FIG. 7.1.
FIG. 7.1: LFT inferior em função de K
O diagrama em blocos mostrado na FIG. 7.1 pode ser reescrito como:
z = P11 w + P12 u,
v = P21 w + P22 u,
98
u = Kv.
(7.4)
Eliminando u e v em (7.5), obtém-se:
z = Fl (P, K)w = P11 + P12 K(I − P22 K)−1 P21 w.
(7.5)
De maneira análoga, a LFT superior conforme ilustrado na FIG. 7.2, Fu (P, ∆), é obtida
pela realimentação positiva ∆ na partição superior de P .
FIG. 7.2: LFT superior em função de ∆
7.1.1 INTERCONEXÃO DE LFT
Uma propriedade importante das LFT é que a interconexão de LFT também é uma
LFT. Considere a FIG. 7.3, onde R é escrito como a LFT inferior envolvendo Q e K 0 , K 0
por sua vez é a LFT inferior envolvendo M e K.
FIG. 7.3: Interconexão de LFTs resulta em uma LFT
Deseja-se expressar R diretamente como uma LFT em termos de K. Uma vez que
R = Fl (Q, K 0 ),
onde K 0 = Fl (M, K),
99
(7.6)
o objetivo é obter P em termos de Q e M tal que:
R = Fl (P, K).
(7.7)
Obtém-se:
"
# "
#
P11 P12
Q11 + Q12 M11 (I − Q22 M11 )−1 Q21
Q12 (I − M11 Q22 )−1 M12
P =
=
.
P21 P22
M21 (I − Q22 M11 )−1 Q21
M22 + M21 Q22 (I − M11 Q22 )−1 M12
(7.8)
Aplicam-se expressões similares quando são usadas LFT superiores. Para
R = Fu (M, ∆0 ),
onde ∆0 = Fu (Q, ∆),
(7.9)
escreve-se R = Fu (P, ∆), com P obtido, em termos de Q e M , por (7.8).
7.2 AUTOVALORES E AUTOVETORES
Seja A uma matriz quadrada n × n. Os autovalores λi , i = 1, 2, . . . , n de A são as n
soluções da equação característica:
det(A − λI) = 0.
(7.10)
O autovetor à direita, ti , correspondente ao autovalor λi é a solução não-trivial (ti 6= 0)
para:
(A − λi I)ti = 0 ⇔ Ati = λi ti .
(7.11)
O autovetor à esquerda correspondente, qi , satisfaz:
qiH (A − λi I) = 0 ⇔ qiH A = λi qiH .
(7.12)
Os autovalores também são chamados de ganhos característicos. O conjunto de autovalores de A é chamado de espectro de A e o maior valor absoluto entre os autovalores é
o raio espectral, ρ(A):
ρ(A) , max(|λi (A)|).
i
(7.13)
Normalmente trabalha-se com autovetores normalizados, isto é, tH
i ti = 1. Isso é
possível graças à propriedade de que se t é um autovetor então αt também é, para qualquer
α constante. Um resultado importante é que autovalores distintos geram autovetores
linearmente independentes.
100
Os autovetores podem ser organizados de maneira a representar as colunas de uma
matriz T e os autovalores λ1 , λ2 , . . . , λn os elementos da matriz diagonal Λ:
T = {t1 , t2 , . . . , tn } ;
Λ = diag {λ1 , λ2 , . . . , λn } .
(7.14)
Então, a equação (7.11) pode ser reescrita como:
AT = T Λ.
(7.15)
T é a matriz de transformação utilizada para a diagonalização da matriz A quando esta
possui autovetores linearmente independentes tal que T −1 existe (isto sempre ocorre para
autovalores distintos, mas pode ocorrer também em outros casos, por exemplo A = I).
Da equação (7.15) obtém-se a fórmula para a diagonalização:
Λ = T −1 AT.
(7.16)
Serão enumeradas algumas propriedades dos autovalores:
• A soma dos autovalores de A é igual ao traço de A (soma dos elementos da diagonal):
P
trA = λi .
i
• O produto dos autovalores de A é igual ao determinante de A: det(A) =
Q
λi .
i
• Os autovalores de uma matriz triangular superior são iguais aos elementos da diagonal.
• Para uma matriz real os autovalores ou são reais ou pares complexos conjugados.
• A e AT possuem os mesmos autovalores (mas autovetores diferentes).
• A inversa A−1 existe se e somente se todos os autovalores de A forem diferentes de
zero. Nesse caso, A−1 tem autovalores
1
, . . . , λ1n .
λ1
• A matriz (cI + A) tem autovalores c + λi .
• A matriz cAk , onde k é um inteiro tem os autovalores cλki .
101
7.3 VALORES SINGULARES
Os valores singulares de uma matriz complexa An×m , representados por σi (A), i =
1, · · · , k, são as k raízes quadradas não negativas dos autovalores de AH A (ou AAH ),
onde k = min(n, m), ou seja:
σi (A) =
p
λi (AH A) i = 1, 2, . . . , k.
(7.17)
Um modo de representar uma matriz de forma a expor sua estrutura interna é a
chamada Decomposição em Valores Singulares (DVS). Para uma matriz An×m a DVS é
dada por:
A = U ΣV
H
=
k
X
σi (A)ui viH ,
(7.18)
i=1
onde Un×n e Vm×m são matrizes unitárias formadas por vetores colunas dados por:
U = (u1 , u2 , . . . , un ),
V = (v1 , v2 , . . . , vm ),
e Σn×m contém a matriz diagonal Σ1 com os valores singulares σi , reais e não negativos,
arranjados em ordem decrescente:
"
Σ=
Σ1
#
;
n≥m
(7.19)
0
ou
h
i
Σ = Σ1 0 ;
n≤m
(7.20)
e
Σ1 = diag(σ1 , σ2 , . . . , σk );
k = min(m, n),
(7.21)
onde
σ = σ1 ≥ σ2 ≥ . . . ≥ σk = σ.
(7.22)
Esta decomposição não é única, uma vez que as matrizes U e V não são únicas.
Contudo, os σi são únicos. Como U e V são unitárias, posto(A) = posto(Σ). Então se
posto(A) = k, somente os k primeiros valores singulares são positivos, os demais são iguais
a zero.
Pode ser mostrado que as colunas de U e V são os autovetores unitários de AAH e
de AH A respectivamente, conhecidos como vetores singulares à esquerda e à direita da
matriz A.
102
A partir dos valores singulares é possível definir o chamado número de condicionamento, grandeza dependente da frequência que em análise numérica mede o quão próximo
da singularidade está uma matriz:
cond(A) =
σ(A)
.
σ(A)
(7.23)
σ também é utilizado como indicador de singularidade, quanto mais próximo de zero for
o valor de σ(A), mais próxima da singularidade está a matriz A.
Um resultado importante encontrado em (SKOGESTAD, 2005) é o maior valor singular de uma matriz bloco diagonal :
"
#!
A 0
σ
= max {σ(A), σ(B)} .
0 B
(7.24)
7.4 CRITÉRIO DE NYQUIST GENERALIZADO
Considere o sistema MIMO (Multiple-Imput Multiple-Output) em malha fechada com
realimentação negativa, mostrado na FIG. 7.4 e assuma que não ocorram cancelamentos
internos de pólos do semiplano da direita na matriz de transferência L(s), isto é, L(s) não
possui modos instáveis escondidos.
FIG. 7.4: Sistema com realimentação negativa
O Teorema de Nyquist Generalizado permite avaliar a estabilidade do sistema em
malha fechada a partir da resposta em frequência L(jω).
Teorema 7.1 (Teorema de Nyquist Generalizado (SKOGESTAD, 2005)). Deixe Pol denotar o número de pólos instáveis de malha aberta em L(s) . O sistema em malha fechada com realimentação negativa é estável se, e somente se, o diagrama de Nyquist de
det(I + L(s)) realizar Pol envolvimentos da origem no sentido anti-horário e não passar
pela origem.
O estudo detalhado da análise de estabilidade no domínio da frequência e a prova do
Teorema 7.1 podem ser encontrados em (SKOGESTAD, 2005).
103
7.5 FÓRMULA DE SCHUR
O determinante da matriz A com a seguinte partição:
"
#
A11 A12
A=
,
A21 A22
é dado por
det(A) = det(A11 ) det(A22 − A21 A−1
11 A12 ),
(7.25)
det(A) = det(A22 ) det(A11 − A12 A−1
22 A21 ),
(7.26)
ou
assumindo que A11 e/ou A22 são não-singulares.
104

texto completo - Mestrado em Engenharia Elétrica

Transcrição

Documentos relacionados

PALAVRAS CRUZADAS DIRETAS

CORRESPONDÊNCIA ENTRE O TAMANHO DOS

Manual mesa

Tutoria Online

O Velho Continente e o Novo Mundo. Os desafios

ficha 2 - ABciências.Webnode.pt

ensino secundario - examesfisicaquimica.org

Informativo técnico 4615 Auth

Manual técnico - camp. sem fio

a importância da ortodontia preventiva e