link para o texto completo - Mestrado em Engenharia Elétrica

Transcrição

link para o texto completo - Mestrado em Engenharia Elétrica
b
c
Este trabalho, eu dedico a meus
pais Isaac e Clara, bem como
a minha futura esposa Miriam.
AGRADECIMENTOS
Ao Instituto Militar de Engenharia, especialmente ao Departamento de
Engenharia Elétrica, pela oportunidade de realizar este curso de pós-graduação.
Ao amigo, orientador e professor Geraldo Magela Pinheiro Gomes pela
orientação sincera e idéias, sem as quais esta tese não teria se concretizado.
Ao amigo e co-orientador Paulo Cesar Pellanda pelo interesse e paciência
dispensada durante a realização desta tese.
Aos amigos e professores Ernesto Leite Pinto, Alcyone Fernandes de
Almeida Junior e Francisco José da Cunha Pires Soeiro pelas excelentes aulas
ministradas durante as cadeiras de Sistemas Estocásticos, Sistemas Multivariáveis e
Otimização, respectivamente.
A minhas amigas e colegas de turma Cristiane de Oliveira Iorio e Letícia ...
pela amizade sem interesse e excelente ambiente de trabalho durante as aulas do
curso de pós-graduação.
Aos amigos e colegas de turma Decílio Medeiros Sales e Marconi pela
amizade e companheirismo demonstrado durante o curso.
Aos meus pais que me deram força e incentivo para conclusão desta etapa de
minha vida.
A minha futura esposa Miriam pelo apoio durante a realização do curso e
compreensão pelas horas de lazer perdidas.
A CAPES pelo incentivo à pesquisa, concretizado através da bolsa de
estudos fornecida durante o ano de tese.
A todos aqueles que não tenham sido aqui citados, mas que de algum modo
colaboraram para realização desta tese.
ii
RESUMO
Esta tese realiza um estudo na área de controle robusto paramétrico, baseado
na síntese PRCBI (Parameter Robust Control by Bayesian Identification).
A finalidade principal deste trabalho consiste no cálculo, por métodos de
otimização numérica, de controladores de robustez híbrida, isto é, aqueles obtidos
levando-se em conta a robustez paramétrica e o desempenho do sistema analisado.
Como aplicação para demonstrar os resultados alcançados, utilizou-se
exemplos acadêmicos baseados no sistema massa-mola e um modelo real de um
helicóptero, cedido pelo CERT (Centre d'Etudes et Recherches de Toulouse).
iii
ABSTRACT
This Thesis carry out a study in the subject of parametrical robust feedback
control, based on the synthesis PRCBI (Parameter Robust Control by Bayesian
Identification).
The main purpose of this work consist in the calculus, by numerical otimization
methods, obtaining hibrid robustness controller, that is, those take into account the
parametrical robustness and performance of the analysed system.
As application to show obtained results, many academic examples based on
mass-coil system were used and a real model of helicopter, provided by CERT
(Centre d'Etudes et Recherches de Tolouse).
iv
SUMÁRIO
RESUMO
iii
ABSTRACT
iv
LISTA DE ILUSTRAÇÕES
viii
LISTA DE TABELAS
xv
LISTA DE ABREVIATURAS E SÍMBOLOS
1 - INTRODUÇÃO GERAL
xvii
1
1.1 - Motivação e posicionamento da tese
1
1.2 - Objetivos e Escopo
2
2 - OTIMIZAÇÃO
4
2.1 - Introdução
4
2.1.1 - Variáveis de projeto
5
2.1.2 - Restrições de projeto
5
2.1.3 - Função objetivo
6
2.2 - Métodos de otimização
7
2.2.1 - Grid e métodos aleatórios
9
2.2.2 - Método de Powell: Direções conjugadas
10
2.2.3 - Método do Steepest Descent
13
2.2.4 - Método dos Gradientes Conjugados
14
2.2.5 - Método da Aproximação Polinomial
15
2.3 - O sistema computacional
19
3 - TÓPICOS DE CONTROLE ÓTIMO E A SÍNTESE DE CONTROLE ROBUSTO PARAMÉTRICO PRCBI
21
3.1 - Introdução
21
3.2 - Tópicos de controle ótimo
22
3.2.1 - Regulador Linear Quadrático (LQR)
v
22
3.2.2 - Regulador Linear Quadrático Gaussiano (LQG)
25
3.3 - Síntese de um controle robusto com base na qualidade de
identificação bayesiana dos parâmetros sensíveis
29
3.3.1 - Introdução
29
3.3.2 - Qualidade de identificação bayesiana em malha fechada
30
3.3.3 - Síntese PRCBI
34
3.4 - O problema do seguidor ( Tracking )
4 - O SISTEMA MASSA-MOLA
36
40
4.1 - Introdução
40
4.1.1 - Diagrama de Sensibilidade por Pontos
41
4.1.2 - Hiperesfera Percentual de Estabilidade
43
4.1.3 - A técnica das liberações
44
4.2 - Sistema massa-mola com 4 estados
45
4.2.1 - Resultados obtidos
48
4.3 - Sistema massa-mola com 8 estados
4.3.1 - Robustecimento a variação de 2 massas
55
55
4.3.1.1 - Equações de estado da planta
56
4.3.1.2 - Constantes e considerações adotadas
56
4.3.1.3 - Vetor de parâmetros sensíveis
57
4.3.1.4 - Resultados obtidos
57
4.3.2 - Robustecimento a variação de 4 massas
74
4.3.2.1 - Constantes e considerações adotadas
75
4.3.2.2 - Vetor de parâmetros sensíveis
75
4.3.2.3 - Resultados obtidos
76
5 - O PROBLEMA DO HELICÓPTERO
5.1 - Introdução
85
85
5.1.1 - Os movimentos do helicóptero
85
5.1.2 - O vôo do helicóptero
87
5.1.3 - O vôo estacionário (teórico)
88
vi
5.1.4 - O vôo vertical (ascendente e descendente)
89
5.1.5 - O vôo de translação (longitudinal e lateral)
89
5.1.6 - A finalidade do rotor traseiro
90
5.1.7 - O movimento de lacet
91
5.1.8 - Exemplos de movimentos acoplados
92
5.2 - O modelo matemático disponível
93
5.3 - O problema original e o proposto
94
5.4 - Critério adotado como desempenho ótimo
99
5.5 - A técnica das liberações realimentadas
103
5.6 - A aplicação da síntese PRCBI
106
5.7 - Resultados obtidos
108
6 - CONCLUSÕES E PERSPECTIVAS
123
6.1 - Conclusões
123
6.2 - Perspectivas
125
APÊNDICE A - SOLUÇÃO PARA AS EQUAÇÕES DE L, N e ∆ P'
126
REFERÊNCIAS BIBLIOGRÁFICAS
127
vii
LISTA DE ILUSTRAÇÕES
FIGURA 2.1: Minimização através do método de Powell
11
FIGURA 2.2: Fluxograma do método de otimização de Powell
12
FIGURA 2.3: Fluxograma do método de otimização Steepest Descent
14
FIGURA 2.4: Fluxograma do método dos gradientes conjugados
15
FIGURA 2.5: Uma possível forma de F( α)
16
FIGURA 2.6: Fluxograma do método de aproximação polinomial
19
FIGURA 2.7: Sistema computacional utilizado na tese
20
FIGURA 3.1: Estrutura LQR com observador preditor
23
FIGURA 3.2: Algoritmo para o cálculo de K C
24
FIGURA 3.3: Estrutura LQG com filtro de Kalman preditor
26
FIGURA 3.4: Estrutura LQG com filtro de Kalman corrente
27
FIGURA 3.5: Algoritmo para o cálculo de K F
28
FIGURA 3.6: Visualização da qualidade de identificação paramétrica para
um caso escalar
30
FIGURA 3.7: Estrutura do problema abordado
32
FIGURA 3.8: Síntese PRCBI em malha fechada
35
FIGURA 3.9: Diagrama do problema do seguidor
39
FIGURA 4.1: Fluxograma da técnica das liberações para duas funções
objetivo
46
FIGURA 4.2: Diagrama físico do sistema massa-mola de 4 estados
46
FIGURA 4.3: Evolução temporal dos estados da planta em malha aberta
51
FIGURA 4.4: Diagrama de sensibilidade para o controlador 4.1
52
FIGURA 4.5: Diagrama de sensibilidade para o controlador 4.2
52
FIGURA 4.6: Diagrama de sensibilidade para o controlador 4.3
53
FIGURA 4.7: Diagrama de sensibilidade para o controlador 4.5
53
FIGURA 4.8: Diagrama de sensibilidade para o controlador 4.8
54
FIGURA 4.9: Diagrama de sensibilidade para o controlador 4.10
54
viii
FIGURA 4.10: Diagrama físico do sistema massa-mola de 8 estados
55
FIGURA 4.11: Diagrama de sensibilidade com o controlador 4.11
61
FIGURA 4.12: Região de estabilidade e hiperesfera percentual com o
controlador 4.11
61
FIGURA 4.13: Diagrama de sensibilidade com o controlador 4.12
62
FIGURA 4.14: Região de estabilidade e hiperesfera percentual com o
controlador 4.12
62
FIGURA 4.15: Diagrama de sensibilidade com o controlador 4.13
63
FIGURA 4.16: Região de estabilidade e hiperesfera percentual com o
controlador 4.13
63
FIGURA 4.17: Diagrama de sensibilidade com o controlador 4.14
64
FIGURA 4.18: Região de estabilidade e hiperesfera percentual com o
controlador 4.14
64
FIGURA 4.19: Diagrama de sensibilidade com o controlador 4.15
65
FIGURA 4.20: Região de estabilidade e hiperesfera percentual com o
controlador 4.15
65
FIGURA 4.21: Diagrama de sensibilidade com o controlador 4.16
66
FIGURA 4.22: Região de estabilidade e hiperesfera percentual com o
controlador 4.16
66
FIGURA 4.23: Diagrama de sensibilidade com o controlador 4.17
67
FIGURA 4.24: Região de estabilidade e hiperesfera percentual com o
controlador 4.17
67
FIGURA 4.25: Diagrama de sensibilidade com o controlador 4.18
68
FIGURA 4.26: Região de estabilidade e hiperesfera percentual com o
controlador 4.18
68
FIGURA 4.27: Diagrama de sensibilidade com o controlador 4.19
69
FIGURA 4.28: Região de estabilidade e hiperesfera percentual com o
controlador 4.19
69
FIGURA 4.29: Diagrama de sensibilidade com o controlador 4.20
ix
70
FIGURA 4.30: Região de estabilidade e hiperesfera percentual com o
controlador 4.20
70
FIGURA 4.31: Diagrama de sensibilidade com o controlador 4.23
71
FIGURA 4.32: Região de estabilidade e hiperesfera percentual com o
controlador 4.23
71
FIGURA 4.33: Diagrama de sensibilidade com o controlador 4.21
72
FIGURA 4.34: Região de estabilidade e hiperesfera percentual com o
controlador 4.21
72
FIGURA 4.35: Diagrama de sensibilidade com o controlador 4.22
73
FIGURA 4.36: Região de estabilidade e hiperesfera percentual com o
controlador 4.22
73
FIGURA 4.37: Diagrama físico do sistema analisado
75
FIGURA 4.38: Diagrama de sensibilidade com o controlador 4.24
79
FIGURA 4.39: Evolução temporal do módulo da saída nominal e
envoltória da saída perturbada em 10% (curva vermelha) e
40% (curva azul) com o ctrl 4.24
79
FIGURA 4.40: Diagrama de sensibilidade com o controlador 4.25
80
FIGURA 4.41: Evolução temporal do módulo da saída nominal e
envoltória da saída perturbada em 10% (curva vermelha) e
40% (curva azul) com o ctrl 4.25
80
FIGURA 4.42: Diagrama de sensibilidade com o controlador 4.26
81
FIGURA 4.43: Evolução temporal do módulo da saída nominal e
envoltória da saída perturbada em 10% (curva vermelha) e
40% (curva azul) com o ctrl 4.26
81
FIGURA 4.44: Diagrama de sensibilidade com o controlador 4.29
82
FIGURA 4.45: Evolução temporal do módulo da saída nominal e
envoltória da saída perturbada em 10% (curva vermelha) e
40% (curva azul) com o ctrl 4.29
82
FIGURA 4.46: Diagrama de sensibilidade com o controlador 4.27
83
x
FIGURA 4.47: Evolução temporal do módulo da saída nominal e
envoltória da saída perturbada em 10% (curva vermelha) e
40% (curva azul) com o ctrl 4.27
83
FIGURA 4.48: Diagrama de sensibilidade com o controlador 4.28
84
FIGURA 4.49: Evolução temporal do módulo da saída nominal e
envoltória da saída perturbada em 10% (curva vermelha) e
40% (curva azul) com o ctrl 4.28
84
FIGURA 5.1: Referência utilizada pelo helicóptero
86
FIGURA 5.2: As forças aplicadas sobre o helicóptero em vôo
88
FIGURA 5.3: O vôo estacionário
88
FIGURA 5.4: O vôo ascendente e descendente
90
FIGURA 5.5: Vôo de translação longitudinal e lateral
90
FIGURA 5.6: O rotor traseiro
91
FIGURA 5.7: Representação dos modelos disponíveis linearizados nas
velocidades apresentadas
93
FIGURA 5.8: Diagrama do problema original H ∞
96
FIGURA 5.9: Diagrama do problema proposto
98
FIGURA 5.10: Cálculo do custo da fase 1 de desempenho - Manobra 1
101
FIGURA 5.11: Cálculo do custo da fase 2 de desempenho - Manobra 1
101
FIGURA 5.12: Cálculo do custo da fase 3 de desempenho - Manobra 1
102
FIGURA 5.13: Cálculo do custo final de desempenho - Manobra 1
102
FIGURA 5.14: Fluxograma da etapa 2 da técnica das liberações
realimentadas
105
FIGURA 5.15: Adaptação da síntese PRCBI para o problema do
helicóptero
107
FIGURA 5.16: Diagrama de sensibilidade com o controlador 5.1, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a
250 Km/h (azul)
111
xi
FIGURA 5.17: Diagrama de sensibilidade com o controlador 5.2, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a
250 Km/h (azul)
112
FIGURA 5.18: Diagrama de sensibilidade com o controlador 5.3, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a
250 Km/h (azul)
112
FIGURA 5.19: Diagrama de sensibilidade com o controlador 5.4, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a
250 Km/h (azul)
113
FIGURA 5.20: Diagrama de sensibilidade com o controlador 5.5, variandose os modelos de 100 a 300 Km/h (vermelha) e de 150 a
250 Km/h (azul)
113
FIGURA 5.21: Evolução dos estados do helicóptero, ao realizar a manobra
1 com o controlador 5.1 na velocidade longitudinal de 200
Km/h
114
FIGURA 5.22: Evolução dos estados do helicóptero, ao realizar a manobra
1 com o controlador 5.2 na velocidade longitudinal de 200
Km/h
114
FIGURA 5.23: Evolução dos estados do helicóptero, ao realizar a manobra
2 com o controlador 5.1 na velocidade longitudinal de 200
Km/h
115
FIGURA 5.24: Evolução dos estados do helicóptero, ao realizar a manobra
2 com o controlador 5.2 na velocidade longitudinal de 200
Km/h
115
FIGURA 5.25: Evolução dos estados do helicóptero, ao realizar a manobra
3 com o controlador 5.1 na velocidade longitudinal de 200
Km/h
116
FIGURA 5.26: Evolução dos estados do helicóptero, ao realizar a manobra
3 com o controlador 5.2 na velocidade longitudinal de 200
Km/h
116
xii
FIGURA 5.27: Evolução dos estados do helicóptero, ao realizar a manobra
1 com o controlador 5.1 na velocidade longitudinal de 100
Km/h
117
FIGURA 5.28: Evolução dos estados do helicóptero, ao realizar a manobra
1 com o controlador 5.2 na velocidade longitudinal de 100
Km/h
117
FIGURA 5.29: Evolução dos estados do helicóptero, ao realizar a manobra
2 com o controlador 5.1 na velocidade longitudinal de 100
Km/h
118
FIGURA 5.30: Evolução dos estados do helicóptero, ao realizar a manobra
2 com o controlador 5.2 na velocidade longitudinal de 100
Km/h
118
FIGURA 5.31: Evolução dos estados do helicóptero, ao realizar a manobra
3 com o controlador 5.1 na velocidade longitudinal de 100
Km/h
119
FIGURA 5.32: Evolução dos estados do helicóptero, ao realizar a manobra
3 com o controlador 5.2 na velocidade longitudinal de 100
Km/h
119
FIGURA 5.33: Evolução dos estados do helicóptero, ao realizar a manobra
1 com o controlador 5.1 na velocidade longitudinal de 300
Km/h
120
FIGURA 5.34: Evolução dos estados do helicóptero, ao realizar a manobra
1 com o controlador 5.2 na velocidade longitudinal de 300
Km/h
120
FIGURA 5.35: Evolução dos estados do helicóptero, ao realizar a manobra
2 com o controlador 5.1 na velocidade longitudinal de 300
Km/h
121
FIGURA 5.36: Evolução dos estados do helicóptero, ao realizar a manobra
2 com o controlador 5.2 na velocidade longitudinal de 300
Km/h
121
xiii
FIGURA 5.37: Evolução dos estados do helicóptero, ao realizar a manobra
3 com o controlador 5.1 na velocidade longitudinal de 300
Km/h
122
FIGURA 5.38: Evolução dos estados do helicóptero, ao realizar a manobra
3 com o controlador 5.2 na velocidade longitudinal de 300
Km/h
122
xiv
LISTA DE TABELAS
TABELA 3.1:
Exemplo da notação adotada
TABELA 4.1:
Significado físico dos estados do sistema massa-mola de 4
31
estados
47
TABELA 4.2:
Valores adotados para os parâmetros utilizados
47
TABELA 4.3:
Vetores obtidos na fase 1 do processo de otimização
48
TABELA 4.4:
Controladores obtidos na fase 2 do processo de otimização
49
TABELA 4.5:
Características obtidas nos controladores otimizados
49
TABELA 4.6:
Significado físico dos estados do sistema massa-mola de 8
estados
TABELA 4.7:
57
Controladores obtidos através da síntese PRCBI, por
métodos de otimização utilizando critérios híbridos e por
meio analítico
TABELA 4.8:
58
Características dos controladores obtidos a partir da
síntese PRCBI e pela liberação do custo de robustez ótimo
TABELA 4.9:
60
Características dos controladores obtidos a partir da
liberação do custo de desempenho nominal ótimo,
otimizando-se o traço de G θ−1
0
60
TABELA 4.10: Controladores obtidos através da síntese PRCBI, por
métodos de otimização utilizando critérios híbridos e por
meio analítico
76
TABELA 4.11: Características dos controladores obtidos a partir da
síntese PRCBI e pela liberação do custo de robustez ótimo
76
TABELA 4.12: Características dos controladores obtidos por métodos de
otimização e por meio analítico (LQR)
77
TABELA 5.1:
Correspondência entre termos
85
TABELA 5.2:
Os movimentos do helicóptero
86
TABELA 5.3:
Dados referentes aos estados do modelo
94
xv
TABELA 5.4:
Dados referentes às entradas do modelo
94
TABELA 5.5:
Entradas de referência
96
TABELA 5.6:
Efeitos das manobras do helicóptero
97
TABELA 5.7:
Controladores calculados no problema do helicóptero
108
TABELA 5.8:
Características dos controladores calculados
108
xvi
LISTA DE ABREVIATURAS E SÍMBOLOS
FK
: Filtro de Kalman
LQG
: "Linear Quadratic Gaussian"
LQG/LTR
: "Linear Quadratic Gaussian - Loop Transfer Recovery"
LTI
: "Linear Time Invariant"
LQR
: "Linear Quadratic Regulator"
MF
: Malha fechada
MIMO
: "Multiple-Input-Multiple-Output"
PRCBI
: "Parameter Robust Control by Bayesian Identification"
PRLQG
: "Parameter Robust Linear - Quadratic Gaussian"
E{ ⋅ }
: Esperança matemática
z −1
: Retardo unitário
x
: Vetor x
Cn
: Conjunto dos vetores complexos de dimensão n
Cn × m
: Conjunto de matrizes complexas de dimensão n x m
In
: Matriz identidade de ordem n
In × m
: Matriz identidade de dimensão n x m
G θ−1
: Matriz da qualidade de identificação bayesiana.
ℜn
: Conjunto dos vetores reais de ordem n
ℜn × m
: Conjunto das matrizes reais de ordem n x m
AT
: Matriz transposta da matriz A.
0
A
: Determinante da matriz A
b
: Valor absoluto do escalar b
c
: Módulo do vetor c
θ
: Vetor paramétrico
a ∈B
: a pertence a B
⊗
: Produto de Kronecker
xvii
( ⋅ )0
: Argumento considerando o sistema operando com os parâmetros
( ⋅ )p
nominais
: Argumento considerando o sistema operando com os parâmetros
perturbados
0
A( : , n)
: Vetor com todos os elementos nulos
: Vetor contendo todos os elementos da coluna n da matriz A
A( m, : )
: Vetor contendo todos os elementos da linha m da matriz A
Tr A
: Traço da matriz A
A −1
: Matriz inversa de A
s
: Variável de Laplace
z
: Variável complexa representativa do domínio discreto
x$
: Vetor x estimado
x$ k / k−1
: Vetor x predito: vetor estimado no tempo k com base nos valores
conhecidos em k-1
x$ k / k
: Vetor x corrente: vetor estimado no tempo k com base nos valores
conhecidos em k
λ max ( A )
: Autovalor máximo da matriz A
Ctrl
: Controlador
F( ⋅ )
: F é uma função objetivo do argumento
f( ⋅ )
: f é uma função qualquer do argumento
∆
: Variação incremental
xviii
CAPÍTULO 1
INTRODUÇÃO GERAL
1.1 - MOTIVAÇÃO E POSICIONAMENTO DA TESE
Nesta tese propõe-se realizar um estudo na área de Controle Robusto
Paramétrico, baseado na síntese PRCBI (Parameter Robust Control by Bayesian
Identification) (GOMES, 1991), desenvolvida a partir de um estudo sobre o comportamento assintótico dos estimadores bayesianos (GAUVRIT, 1982).
Durante os grandes desenvolvimentos teóricos dos anos 60-80, pouco foi
considerado sobre variação de modelos. As teorias de controle ótimo envolvendo
sistemas multivariáveis (métodos LQ, LQG, Filtros de Kalman, etc.) levam em conta
apenas o desempenho nominal do sistema e supõem as plantas perfeitamente
representadas pelos respectivos modelos utilizados.
O conceito de robustez constitui parte fundamental na teoria de controle, tendo
como principal razão a não existência de um modelo que represente perfeitamente a
realidade. Os modelos são, em sua maioria, aproximações de processos reais que
encontram-se vulneráveis a diversos tipos de perturbações. Em consequência, os
modelos acabam não representando os sistemas reais, tornando impraticável o controle
de determinadas plantas. Além disso, algumas plantas apresentam em suas estruturas,
parâmetros sujeitos a perturbações de natureza aleatória que devem ser tratadas com
técnicas especiais de controle robusto.
O controle robusto é uma técnica moderna que visa adaptar os métodos de
controle ótimo de modo a tornar os sistemas imunes a diversos tipos de perturbações.
Portanto, um regulador robusto deve ser capaz de manter a estabilidade e
assegurar uma maior insensibilidade do desempenho do sistema que se encontra
submetido a alguma perturbação. Dentro da literatura, os erros de modelagem são
considerados
perturbações
e
classificam-se
segundo
duas
grandes
classes:
ESTRUTURADOS (variações paramétricas) e NÃO ESTRUTURADOS (dinâmicas
1
não modeladas, retardos, modos de alta freqüência ignorados, etc.). Considera-se
como variações paramétricas, as alterações dos valores nominais assumidos por
determinadas constantes, chamadas de parâmetros, internas à planta utilizada. Por
vetor paramétrico ou vetor de parâmetros sensíveis deve-se entender um vetor
formado por todos os parâmetros em relação aos quais o sistema deverá ser
robustecido.
As técnicas robustas de natureza freqüêncial (método LQG/LTR, síntese H ∞ ,
etc.)
são
mais
adaptadas
às
incertezas
não
estruturadas,
apresentando-se
freqüentemente menos eficientes em relação às incertezas paramétricas. A síntese
PRCBI, por estar baseada na formulação de espaço de estado, de natureza temporal,
adapta-se melhor às incertezas estruturadas.
1.2 - OBJETIVOS E ESCOPO
Os objetivos desta tese são:
a) Realizar um estudo sobre métodos de otimização a fim de melhor aplicá-los à
síntese PRCBI, permitindo obter, através de meios numéricos, controladores mais
robustos à variações paramétricas para os modelos analisados.
b) Desenvolver um controlador com "robustez híbrida", isto é, aquele resultante da
otimização de um critério a ser estabelecido que levará em conta a robustez
paramétrica, bem como as características de desempenho exigidas pelo sistema, em
complemento aos estudos que originaram a síntese PRCBI (GAUVRIT, 1982 ;
GOMES, 1991).
c) Aplicar o critério e a técnica de otimização numérica em um modelo real
multivariável, investigando os resultados alcançados. O modelo escolhido foi o de
um helicóptero, desenvolvido e em fase de estudos pela Aeroespaciale Francesa,
tendo sido cedido pelo CERT ( Centre d'Etudes et Recherches de Tolouse ).
2
O Capítulo 2 desta tese descreve alguns conceitos básicos sobre otimização.
Além disso são apresentados os métodos utilizados neste trabalho, bem como seus
respectivos fluxogramas.
O Capítulo 3 apresenta um resumo das técnicas de controle ótimo quadrático,
com base na realimentação de estados estimados, além dos desenvolvimentos teóricos
relacionados com a síntese PRCBI. Encontra-se também comentado o problema do
seguidor (tracking), cuja teoria será empregada no Capítulo 5.
O Capítulo 4 mostra os resultados da aplicação da síntese PRCBI em três
exemplos acadêmicos monovariáveis relacionados com um sistema massa-mola.
Neste capítulo são apresentados diversos controladores com robustez híbrida, bem
como a técnica de otimização desenvolvida para obtê-los.
O Capítulo 5 apresenta os resultados da aplicação da síntese PRCBI em um
modelo multivariável de um helicóptero, obtidos a partir de um aperfeiçoamento da
técnica de otimização utilizada no Capítulo 4.
No Capítulo 6 , referente às conclusões, são comentadas as contribuições desta
tese e algumas sugestões para desenvolvimentos futuros.
3
CAPÍTULO 2
OTIMIZAÇÃO
2.1 - INTRODUÇÃO
As técnicas apresentadas a seguir estão baseadas no "projeto ótimo
quantificado". Por exemplo, na estrutura de uma ponte pode ser adotado concreto, aço
ou ainda algum outro material a ser definido, proporcionando em relação aos demais
parâmetros do projeto soluções distintas. Do ponto de vista do projeto ótimo, as
soluções encontradas deverão ser quantificadas em função dos valores dos parâmetros
adotados, baseadas em determinado critério específico. Esta quantificação levará
também em conta as limitações e restrições impostas ao projeto, que deverão ser
atendidas da melhor maneira possível na ótica do critério escolhido.
Os métodos apresentados a seguir são numéricos e somente podem ser
utilizados por intermédio de programas de computador.
Os métodos e algoritmos expostos não permitirão soluções inovadoras para os
problemas de engenharia, mas sim a satisfação de objetivos pré-selecionados, levandose em conta as limitações impostas. A metodologia portanto não adiciona diretamente
um meio de desenvolvimento criativo de novas soluções, mas permite a obtenção de
uma melhor solução dentro do conceito de projeto ótimo. Estas idéias formam a base
da ferramenta de projeto denominada por "Otimização", onde os conflitos entre os
diversos objetivos serão decididos através da quantificação adotada. Para a utilização
desta ferramenta considera-se que o problema já possui uma formulação apropriada
para análise, bem como um modelo matemático.
Cabe alertar que este capítulo não tem por objetivo esgotar o assunto, mas sim
comentar os métodos utilizados neste trabalho, além de apresentar noções sobre
otimização (FOX, 1971 ; VANDERPLAATS, 1984).
4
2.1.1 - Variáveis de Projeto
As variáveis que tiverem seus valores determinados durante o processo de
otimização, produzindo uma solução para o problema, serão daqui por diante
designadas por variáveis de projeto. Alguns autores preferem chamá-las de
parâmetros de construção ou variáveis de construção.
O vetor de variáveis de projeto X é simplesmente um vetor coluna contendo
todas as variáveis a serem definidas em um problema particular. Quando os valores
das variáveis estão definidos, diz-se ter obtido um projeto. Ao formular um problema
deve-se simplificar ao máximo o número de variáveis de projeto, isto é, se
x3 = f ( x1 , x2 ) então x 3 não deverá ser uma variável de projeto. Tais simplificações
poderão render consideráveis vantagens em termos computacionais na obtenção da
solução desejada.
Em
certos
problemas,
determinados
valores
são
pré-fixados,
sendo
denominados por parâmetros. O conjunto destes valores constantes durante o processo
de otimização acrescido ao das variáveis de projeto descreverá completamente a
solução obtida.
2.1.2 - Restrições de Projeto
Deve-se enfatizar que um projeto é simplesmente um conjunto particular de
valores para as variáveis de projeto. O vetor X particular será um projeto ainda que
possua um significado absurdo, o que ocorre por exemplo, quando a variável x i que
representa a área de uma determinada peça assume um valor negativo. Claramente,
alguns projetos representam soluções mais úteis que outros. Se um projeto alcança
todos os requisitos estabelecidos, será chamado de projeto aceitável ou factível. Caso
contrário será dito um projeto não aceitável. As limitações que o projeto deve atender
são genericamente denominadas por restrições. Normalmente, identifica-se duas
categorias de restrições em problemas de engenharia, ou seja,
laterais e de
comportamento. No primeiro tipo, consideram-se aquelas que limitam a faixa de
5
projeto de uma determinada variável, sendo também chamadas de restrições de
construtibilidade. No segundo incluem-se as impostas por necessidade de
desempenho, onde obriga-se às variáveis de projeto a atenderem determinadas
funções. Neste caso poderia-se citar como exemplo a otimização de um controlador
segundo um critério específico, em que uma das imposições seria a necessidade de
tornar ou manter o sistema em questão estável.
Embora na grande maioria dos casos não seja possível ou prático escrever
funções explícitas para as restrições, ainda assim estas poderão ser escritas de modo
computável e portanto passíveis de utilização. Neste caso, por exemplo, enquadra-se a
verificação dos modos de uma determinada planta discreta controlada onde deverá ser
observado se os pólos de malha fechada não estarão fora do círculo unitário (plano z).
Outros tipos de restrição ocorrem quando as variáveis de projeto admitem
somente valores discretos. Tais restrições podem ser problemáticas, embora existam
técnicas para manipulá-las ou evitá-las.
2.1.3 - Função Objetivo
Considerando todos os projetos factíveis, certamente alguns serão melhores que
outros. Se isto é verdade, então existirá alguma qualidade que o melhor projeto
alcançará em relação aos demais. Esta qualidade, denominada função objetivo, será
uma função computável das variáveis de projeto, otimizada a fim de obter o melhor
projeto. Daqui por diante será designada por F ou ainda por F(X) para enfatizar sua
dependência com as variáveis de projeto.
Considera-se que a função objetivo deva sempre ser minimizada, o que ocorrerá
sem perda de generalidade, já que o máximo de F(X) será o mínimo de −F( X) .
A seleção da função objetivo é uma das mais importantes decisões em um
problema de otimização. Por exemplo: "Componentes leves fazem bons aviões".
Claramente bons aviões não são apenas aqueles que possuem peças leves, já que
outros objetivos também devem ser atingidos, isto é, devem ser econômicos para
operar, baratos para serem adquiridos, devem possuir estabilidade no vôo, etc. O
6
critério de utilização de componentes leves poderá ser admitido para atingir mais
rapidamente os objetivos propostos, mas certamente não proporcionará os resultados
desejados caso seja considerado isoladamente.
Em alguns problemas, poderá ocorrer que duas ou mais quantidades devam ser
funções objetivo. Por exemplo, considere um produto a ser projetado de modo que
duas propriedades indesejáveis A e B devam ser minimizadas. Para este caso não
existirá um meio de satisfazer tais requisitos em casos gerais, a menos que as
propriedades sejam dependentes completamente de conjuntos de variáveis de projeto
distintos e as restrições sejam independentes.
( )
( )
∀X aceitável. Portanto A( X ) << A( X ) e B( X ) << B( X ) . Deste modo, nenhum dos
Considere dois projetos X1 e X 2 tais que A X1 << A( X) e B X2 << B( X) ,
1
2
2
1
dois projetos será o mais desejável. Assim adotam-se as seguintes condutas:
(a) Formula-se uma função objetivo composta, isto é, F( X) = λ1. A( X) + (1 − λ1 ). B( X)
onde λ 1 é uma constante; (b) O limite imposto para uma das funções é utilizado como
restrição para outra. Esta última será bastante explorada nos problemas estudados
(Capítulos 4 e 5).
Na construção de tais funções deve-se ter certeza que a unidade dimensional
não trará prejuízos. Por exemplo, se A está em metros e B em dólares, então A + B
poderia ser perfeitamente aceitável como uma função objetivo. No entanto, certamente
não seria a mesma, caso A estivesse em milímetros.
Muito tem sido escrito sobre as funções objetivo, e em alguns casos tais
funções constituem-se partes essenciais do processo de modelagem do sistema (FOX,
1971).
2.2 - MÉTODOS DE OTIMIZAÇÃO
A seguir serão apresentados alguns métodos de otimização utilizados nesta
tese, bem como outros de menor importância, por razões didáticas. Pode-se classificar
os métodos de otimização em métodos baseados no gradiente e métodos de ordem
zero, que são aqueles que independem do cálculo do gradiente da função. Do primeiro
7
caso, serão comentados adiante os métodos do Steepest Descent e dos Gradientes
Conjugados, que utilizam a primeira derivada. Entre os métodos de ordem zero podese citar o de Powell que foi intensivamente utilizado nos cálculos apresentados nesta
tese.
O método da variável métrica, bastante conhecido em otimização, também
dependente do cálculo da primeira derivada da função, não será abordado nesta tese, já
que nos problemas estudados não possuía-se a derivada citada de forma analítica. A
utilização da análise de sensibilidade para suprir a falta de tal derivada normalmente
gera resultados bastante imprecisos, desestimulando a aplicação da variável métrica.
Na maioria dos problemas, não é possível garantir que a solução do processo de
minimização seja realmente o mínimo do problema proposto, isto é, o mínimo global.
Nestes casos, as soluções são denominadas de mínimos locais ou relativos pois
garantem o valor mínimo da função somente em suas respectivas vizinhanças, mas não
necessariamente para todos os X. O problema do mínimo local é um dos mais
discutidos em otimização, já que a maioria dos métodos viáveis podem procurar
somente mínimos relativos e não garantem que algum destes seja realmente o mínimo
global. A solução escolhida para o projeto ótimo poderá ser a melhor entre os diversos
mínimos relativos. No entanto a solução global poderá permanecer desconhecida, pois
para obtê-la necessita-se de grandes alterações nos valores do projeto do mínimo
relativo. Um dos modos mais comuns de lidar com este problema consiste em utilizar
diversos pontos iniciais de otimização, denominados por sementes. Como os mínimos
obtidos estarão próximos dos pontos iniciais, o uso de várias sementes aumentará a
probabilidade de atingir o mínimo global.
Os métodos aqui abordados são considerados de otimização sem restrição, onde
o problema a ser resolvido consiste em descobrir X tal que F(X ) seja mínimo,
qualquer que seja X. Nos problemas estudados, a implementação de restrições será
realizada através de artifícios matemáticos e computacionais.
8
2.2.1 - Grid e Métodos Aleatórios
O estudo das variáveis de projeto consiste no exame sistemático da faixa de
projeto fornecida a fim de escolher o "melhor" entre os analisados. O grid e os
métodos aleatórios são utilizados quando existe um pequeno número de variáveis de
projeto e a avaliação do custo de um determinado projeto pode ser realizada
rapidamente. Além disso, utiliza-se este método quando deseja-se obter uma noção
qualitativa da superfície estudada. O método do grid consiste em avaliar a função
objetivo para todas as combinações possíveis de valores assumidos pelas variáveis de
projeto, escolhendo-se ao final do processo a combinação de menor custo. Como
normalmente tais variáveis são contínuas, estabelece-se um espaçamento constante
para cada variável dentro de suas respectivas faixas de projeto a fim de permitir a
avaliação do custo. Obviamente quanto menor o espaçamento, mais precisa será a
solução, mas em compensação também maior será o tempo de processamento
computacional. Considere entretanto um problema com dez variáveis de projeto e um
grid consistindo da determinação de dez valores para cada variável. Se uma avaliação
de custo consome 0,001 segundos computacionalmente, então para o grid inteiro
levará 0, 001 × 1010 = 107 segundos, ou aproximadamente 3000 horas. Certamente, só
problemas extremamente importantes justificariam tais gastos. Neste caso poderia-se
considerar o aumento do espaçamento do grid, mas isto possivelmente reduziria a
probabilidade de obter o melhor projeto possível.
Os métodos aleatórios são sempre conceitualmente triviais (FOX, 1971),
consistindo na avaliação do custo de projetos gerados aleatoriamente. Cabe observar
que a maioria das linguagens de programação dispõem de geradores de números
aleatórios, facilitando o uso de tais métodos. A principal utilidade está em pequenos
problemas onde o esforço de programação e aplicação de métodos mais eficientes
supera o custo de tempo computacional dos aleatórios. Sugere-se que tais métodos
sejam utilizados para gerar boas sementes. A partir destas sementes emprega-se então
métodos de otimização mais eficientes.
9
2.2.2 - Método de Powell: Direções Conjugadas
Neste método define-se a priori uma base vetorial para o espaço de otimização
trabalhado. Normalmente a base adotada é a canônica, isto é, os vetores coluna que
compõem a matriz identidade da ordem do vetor de variáveis de projeto. Definida a
base, explora-se sequencialmente a minimização unidimensional de cada uma destas
direções. Ao encerrar este primeiro ciclo, calcula-se a direção formada pelo ponto
final deste processo e o ponto inicial ("semente"). Esta direção, dita conjugada,
formada pela minimização da função em cada uma das direções da base adotada,
substituirá a primeira da base. Explora-se novamente cada uma das direções da nova
base, formando-se então outra direção conjugada neste ciclo, que substituirá então a
segunda direção da base inicial. Este processo será repetido indefinidamente até que a
função tenha convergido para um mínimo.
Cabe neste ponto tecer um comentário sobre a minimização unidimensional,
que consiste em encontrar α = α* de tal modo que:
( )
(
)
)
F X1 = F X0 + αS = F(α)
(2.1)
seja mínimo na direção S, a partir do ponto X 0 , qualquer que seja α . O processo de
cálculo de α * será apresentado no Item 2.2.5 (Método da Aproximação Polinomial).
A Figura 2.1 ilustra uma superfície tridimensional, quantificada através de
curvas de níveis, onde as curvas mais internas possuem valores menores, sendo
minimizada através do método de Powell. Neste caso:
 x
z = F( X) e X =   ∈ ℜ2
 y
(2.2)
Na Figura 2.1, as direções 1 e 2 são as da base inicial. A direção a é a
conjugada deste primeiro ciclo e substituirá a direção 1 da base inicial. Minimiza-se
10
então as direções da nova base, formando-se então a direção conjugada b, que
substituirá a direção 2 da base inicial. O processo será repetido conforme citado.
6
5
b
a
4
3
2
1
FIGURA 2.1: Minimização através do método de Powell.
Demonstra-se que (FOX, 1971), se F(X) pode ser escrita sob a forma
quadrática, conforme a Equação (2.3), então o método de Powell levará ao mínimo
global de F(X) após executar o algoritmo ilustrado na Figura 2.2 até que a base
vetorial inteiramente formada por direções conjugadas já tenha sido minimizada.
F( X) = XTAX + XT B + c
(2.3)
onde A e B são matrizes constantes de dimensões compatíveis com o problema e "c" é
um escalar.
Deve-se observar que o sinal de " =" utilizado nos algoritmos ilustrados nesta
tese estão empregados no sentido de atribuição. Por exemplo, q = q + 1 deve ser
entendido como q recebe o valor de q+1.
11
Início
Dado de Entrada:
X 0 => Ponto inicial.
A = I N ×N
J=1
q=0
L=1
Dado de Saída:
X tal que F( X ) é mínimo.
J≤N
q = q+1
J = J+1
A (:, L ) = Xq − X 0
N
L = L+1
J=1
X0 = Xq
S
S = (A :, J)
X q +1 = Xq + α* S
L>N
Calcula α = α*
que minimiza
F (Xq + αS)
N
N
S
L=1
Converg. Ok?
S
X = Xq
Fim
FIGURA 2.2: Fluxograma do método de otimização de Powell.
Cabe observar que o teste da convergência apresentado na Figura 2.2 poderá ser
realizado do seguinte modo:
( ) (
)
F Xq − F Xq −1 ≤ ε
onde ε é uma constante pré-definida.
12
(2.4)
2.2.3 - Método do Steepest Descent
O vetor gradiente de uma função F( X) é simbolizado por ∇F, representando a
direção de maior taxa de variação da função. O gradiente é definido como:
 ∂F ∂F
∂F 

,
, ... ,
∇F ≡ G ≡ 
∂x n 
 ∂x1 ∂x2
T
(2.5)
)
T )
Qualquer direção e tal que G . e < 0 é chamada uma direção de descenso, já
)
que F( X) será localmente decrescente na direção positiva de e . Esta propriedade foi
)
reconhecida em 1847 por Cauchy, que considerou e como uma boa direção de
minimização. Outro conjunto de direções interessantes ocorre quando:
T )
G .e = 0
(2.6)
que representa a ortogonalidade entre a direção considerada e o gradiente. A Equação
(2.6) define portanto uma direção contida no hiperplano tangente à superfície F( X) =
constante, em algum ponto X do espaço.
A essência deste método consiste em utilizar a direção do gradiente, no seu
sentido inverso, como a direção escolhida para a minimização da função a partir de um
determinado ponto. Portanto:
S = −∇F
(2.7)
A Figura 2.3 apresenta o fluxograma do método em questão.
Entre as deficiências do método pode-se citar que quando a função minimizada
possui alta excentricidade ou, quando existe um grande número de variáveis de projeto
e o gradiente da função não existe analiticamente, a convergência torna-se bastante
lenta.
13
Início
Dado de Entrada:
X 0 => Ponto inicial.
Dado de Saída:
X tal que F(X) é mínimo.
q=0
S = −∇F(X)
X = Xq
Calcula α = α*
que minimiza
F(X q + α S)
q = q+1
N
Xq +1 = X q + α* S
convergiu ?
S
X = Xq +1
Fim
FIGURA 2.3: Fluxograma do método de otimização Steepest Descent.
2.2.4 - Método dos Gradientes Conjugados
As dificuldades de convergência do método do Steepest Descent podem ser
reduzidas através de uma simples modificação no método apresentado no item
anterior, transformando-o no método dos Gradientes Conjugados ou de Fletcher e
Reeves.
Neste método, a nova direção a ser minimizada é formada pela composição da
direção do gradiente da função com um resíduo da direção anteriormente minimizada.
Logo:
S q +1 = − G q +1 + β S q
(2.8)
onde β é um escalar que determina a influência da direção anterior na nova direção de
minimização, sendo calculado conforme ilustra o algoritmo da Figura 2.4.
14
Uma situação especial ocorre quando a nova direção de minimização, calculada
através da Equação (2.8), não é uma direção de descenso, ou seja:
S q +1 . G q +1 > 0
T
(2.9)
Neste caso o processo deve ser reinicializado fazendo-se Sq +1 = − G q +1 .
Início
Dado de Entrada:
X 0 => Ponto inicial.
Dado de Saída:
X tal que F(X) é mínimo
q=0
G q = ∇F (X) X =X
S = −G q
q
S
Calcula α = α*
que minimiza
F(Xq +αS)
N
Slp = ST . G q +1
q = q +1
X q +1 = X q + α* S
convergiu ?
Slp ≥ 0
G q +1 = ∇F X
N
β =(
S
X = X q +1
Fim
G q +1
Gq
)
X = Xq +1
2
S = −G q +1 + βS
FIGURA 2.4: Fluxograma do método dos Gradientes Conjugados.
2.2.5 - Método da Aproximação Polinomial
Na realidade, este método compõe o sistema de otimização, atuando
conjuntamente com um dos algoritmos apresentados nos Itens 2.2.2, 2.2.3 e 2.2.4,
sendo também denominado de "Interpolação Quadrática". Consiste num método de
15
grande simplicidade que permite determinar o valor de α = α * , que leve a uma boa
aproximação do mínimo de F(X ) na direção considerada. A rapidez da obtenção de α *
está relacionada com a precisão do mesmo. Deste modo, deve-se estabelecer um
compromisso entre a velocidade de obtenção e a precisão do valor, a fim de obter mais
rapidamente a solução geral para o problema. Como a otimização consiste na
minimização sequêncial de diversas direções, através de um processo de aproximações
sucessivas ao mínimo relativo, seria um desperdício de tempo tentar determinar
precisamente o mínimo da função em cada uma das direções pesquisadas.
Considere uma direção Sq de modo que:
X q +1 = X q + α.Sq
(2.10)
onde, se α é considerado uma variável, o lugar geométrico de X q+1 para uma faixa de
valores de α é uma linha reta. Calculando F( X q +1 ) obtém-se:
)
F( Xq +1 ) = F( X q + α.Sq ) = F(α )
(2.11)
Como F pode ser considerada uma função de α , já que X q e Sq estão fixos,
)
procura-se o valor de α que minimiza F(α ) . A Figura 2.5 apresenta uma possível
)
)
forma de F(α ) . Observe que α * , não produzirá o mínimo global de F , a menos que
X q +1 = X q + α.Sq contenha o ponto mínimo global.
F( X q + α.Sq )
α
)
FIGURA 2.5: Uma possível forma de F(α ) .
16
Através deste conceito, o problema de minimizar F(X ) poderá ser reduzido a
um conjunto de minimizações unidimensionais, sem que a dimensão de X seja
considerada. Resta ainda o cálculo de α * , que só será possível através de algum
)
processo numérico. Considere então que a função F(α ) possa ser aproximada pela
função H(α ) , de modo que:
H (α ) = a + bα + cα 2
(2.12)
Se c > 0 então o mínimo desta parábola será:
dH
= b + 2cα = 0
dα
(2.13)
Ou ainda,
α* = −
b
2c
(2.14)
)
As constantes a, b e c podem ser determinadas atribuindo-se valores a F(α ) em
três pontos distintos α1 , α 2 e α 3 e igualando-se a H(α ) . Escolhendo α1 = 0 , α 2 = t e
α 3 = 2 t tem-se:
)
F( 0) = f1 = H( 0)
)
F( t ) = f2 = H( t )
)
F(2 t ) = f3 = H( 2 t )
(2.15)
Portanto por (2.12) e (2.15):
f1 = a
f2 = a + bt + ct 2
f3 = a + 2 bt + 4ct 2
17
(2.16)
Resolvendo as equações chega-se a:
a = f1
4 f − 3f1 − f3
b= 2
2t
f3 + f1 − 2 f2
c=
2t2
(2.17)
Logo por (2.14):
α* =
4 f2 − 3f1 − f3
.t
4 f2 − 2 f3 − 2 f1
(2.18)
No entanto, para permitir que α * seja uma boa aproximação do mínimo em
)
cima da curva F(α ) , deve-se estabelecer as seguintes condições:
f1 > f2
e f3 > f2
(2.19)
que garantem a existência de um mínimo entre os pontos extremos, ou seja,
0 < α * < 2.t independentemente do fato de H(α ) ser uma boa aproximação para
)
F(α ) . Como não existem garantias que a aproximação será boa, caberá verificar se
)
F(α * ) ≤ f2 , conforme está ilustrado no fluxograma da Figura 2.6.
Tendo em vista a necessidade das condições apresentadas em (2.19), o valor do
parâmetro t será dobrado durante a execução do algoritmo até que as condições supracitadas sejam atendidas.
18
Dados de Entrada: M => No. máximo de tentativas.
S => Direção de pesquisa.
α => Passo inicial.
X => Ponto inicial.
Início
Dado de Saída: α* => Passo que leva ao mínimo de
na direção S
f1 = F( X)
f2 = F(X + α S)
f3 = F(X + 2 α S)
J =1
f3 ≤ f2 ou f1 ≤ f2
N
S
(f 3 ≤ f2 ou f1 ≤ f2 ) e J ≤ M
α* =
4 f2 − 3f1 − f3
4 f2 − 2 f3 − 2 f1
α
f4 = F(X + α* S)
N
f1 ≤ f3
S
α = 2α
f2 = f3
f3 = F(X + 2 αS)
J = J +1
N
S
α* = 2α
α =0
N
f4 > f2
*
Fim
S
α* = α
FIGURA 2.6: Fluxograma do método de Aproximação Polinomial.
2.3 - O SISTEMA COMPUTACIONAL
A Figura 2.7 apresenta o sistema computacional utilizado para resolver os
problemas propostos. Todas as rotinas foram escritas em linguagem Matlab 3.5, sendo
executadas neste ambiente. No programa principal define-se o problema a ser
estudado, o período de amostragem, as sementes a serem utilizadas, bem como outros
dados de inicialização. A rotina para cálculo de modelos fornece as matrizes nominais
e perturbadas do problema estudado. Na rotina de otimização escolhe-se o método a
ser empregado, isto é, Powell, Steepest Descent ou Gradientes Conjugados. A rotina
de avaliação de Custos é a função objetivo do problema, sendo auxiliada por outra que
fornece dados relativos à síntese PRCBI.
19
FIGURA 2.7: Sistema computacional utilizado na tese.
As conexões entre as diversas rotinas ilustradas pela Figura 2.7 foram feitas de
modo didático levando-se em conta o fluxo computacional. No entanto, cabe
esclarecer que outras conexões puderam ser suprimidas da figura devido ao uso da
instrução "global" do Matlab no programa principal.
20
CAPÍTULO 3
TÓPICOS DE CONTROLE ÓTIMO E A SÍNTESE
DE CONTROLE ROBUSTO PARAMÉTRICO PRCBI
3.1 - INTRODUÇÃO
Neste capítulo será realizada uma abordagem teórica sobre alguns tópicos de
controle ótimo e controle robusto. Estes assuntos serão enfocados de modo a atender
as necessidades da tese. Uma abordagem mais completa sobre PRCBI (Parameter
Robust Control by Bayesian Identification) poderá ser vista nas referências básicas
deste capítulo (GOMES, 1991; PELLANDA, 1993).
As técnicas freqüênciais dos anos 50 e 60, de natureza gráfica (Bode, Nyquist,
etc. ), conduziram aos reguladores PID e, as noções de margem de Ganho e de Fase
introduziram as primeiras exigências de robustez. Entretanto, as linhas teóricas entre
insensibilidade e a estrutura de malha não foram formuladas naquela época.
Entre os anos 60 e 70, com a introdução da modelagem através da formulação
por equações de estado, surgiram as técnicas de Controle Ótimo, utilizando os critérios
quadráticos LQR (Linear Quadratic Regulator) e LQG (Linear Quadratic Gaussian),
de natureza temporal, além da realimentação de estados, ainda que por estimação. A
técnica que utiliza a estrutura do regulador linear quadrático (LQR), quando os estados
estão disponíveis para realimentação, possui excelentes margens de ganho e de fase,
mas nada pode ser dito a respeito de sua robustez paramétrica. A estrutura LQG, não
dispondo do vetor de estados completo para a realimentação, estima-o com base num
observador ótimo denominado por Filtro de Kalman (FK), sendo por esta razão muito
sensível a variações paramétricas.
A utilização do conceito de robustez na área de controle é bastante recente e
constitui a base da teoria moderna de controle, já que os modelos dificilmente
conseguem representar as plantas reais. As técnicas de controle ótimo se baseiam em
um modelo, que quando coincidente com a planta, permitem que o sistema adquira
características ótimas de desempenho. No entanto, cabe ressaltar que ao diferir da
21
planta real, acaba levando o sistema controlado à instabilidade ou, à deterioração de
seu desempenho. As sínteses de controle robusto surgem exatamente para preencher
esta lacuna dentro da teoria de controle ótimo. Um regulador robusto deve ser capaz
de manter a estabilidade e assegurar uma maior insensibilidade ao desempenho de
um sistema, quando submetido a algum tipo de perturbação (GOMES, 1991).
A síntese PRCBI, discutida neste capítulo, baseia-se na estrutura LQG, visando
robustecê-la em relação às variações paramétricas. Deste modo, torna-se necessário
tecer alguns comentários, mesmo que de forma sucinta e direcionada para as
aplicações desta tese, sobre alguns tópicos de controle ótimo quadrático para sistemas
discretos.
3.2 - TÓPICOS DE CONTROLE ÓTIMO
3.2.1 - Regulador Linear Quadrático (LQR)
Considere um sistema multivariável discreto LTI (Linear Time Invariant)
descrito pelas equações de estado a seguir:
 x k +1 = Φx k + Γ u k

 y k = Cx k
(3.1)
onde:
x
u
: Vetor de estados ( x ∈ ℜn ) .
: Vetor de entradas ( u ∈ℜ p ).
y
: Vetor de saídas y ∈ ℜq .
(
)
Φ : Matriz de transição de estado discreta (Φ ∈ ℜn× n ) .
Γ : Matriz de entrada (ou de controle) ( Γ ∈ ℜn× p ) .
C : Matriz de saída (ou de observação) ( C ∈ ℜq × n ) .
A síntese LQR determina a localização dos pólos de malha fechada (MF)
através da seguinte lei de controle:
u k = − K C x$ k
22
(3.2)
sendo x$ k os estados estimados no tempo k e K C o ganho de realimentação,
determinado através da minimização de um custo quadrático escrito sob a seguinte
forma geral:
J LQR ( discreto ) =
∑( xTk Q1 x k + uTk Q2 u k )
(3.3)
k
onde Q1 (simétrica e positiva semi-definida) e Q 2 (simétrica e positiva definida) são
matrizes de ponderação do critério (3.3), escolhidas de modo a obter um desempenho
desejado. Os estados reais da planta poderão ser realimentados caso estejam
disponíveis na saída, o que geralmente não ocorre. A Figura 3.1 ilustra uma estrutura
LQR com observador preditor. Para que o critério convirja, o par (Φ, Γ) deve ser
controlável. Este problema possui solução analítica através da resolução de uma
equação algébrica de Ricatti. Foi proposta uma solução recursiva para o problema
(FRANKLIN & POWELL, 1980), cujo algoritmo encontra-se reproduzido na Figura
3.2.
rk
+
uk
Γ
+
x k +1
z−1
-
PLANTA
xk
C
yk
Φ
OBSERVADOR
PREDITOR
Γ0
+
+
K0
x$ k +1/ k
z
−1
Φ0
x$ k / k −1
-
C0
y$ k / k −1
KC
FIGURA 3.1: Estrutura LQR com observador preditor.
23
A dinâmica global da estrutura LQR com observador preditor é dada por:
 x k +1   Φ
−ΓKC
 x k   Γ 
=
 +  r k
 x$
  K0 C Φ − Γ K − K0C  x$
0
0 C
0
k +1/ k 
k / k −1   Γ0 
(3.4)
O ganho K 0 do observador é determinado pelo projetista de forma que os
modos de (Φ0 − K0C0 ) sejam estáveis e a constante de tempo do pólo dominante de
observação seja inferior à constante de tempo dos pólos do controlador. Para este
cálculo pode-se utilizar a fórmula de Ackermann, no caso de rk escalar.
Início
S = Q1
K= 0
% 1
K=
ε<<1
−
M = S− SΓ0 (Q2 +ΓT0 SΓ0 ) 1ΓT0 S
−
K'= (Q2 +ΓT0 SΓ0 ) 1ΓT0 S Φ0
S = Φ0T M Φ0 + Q1
% = K' − K
K
K=K'
NÃO
% <ε
K
SIM
KC = K
Fim
FIGURA 3.2: Algoritmo para o cálculo de K C .
24
3.2.2 - Regulador Linear Quadrático Gaussiano (LQG)
No regulador apresentado no Item 3.2.1, a matriz K 0 (Ganho do Observador)
era determinada por escolha do projetista. No regulador LQG utiliza-se o Filtro de
Kalman que estima os estados de maneira ótima, sendo o ganho determinado através
do critério de erro médio quadrático. Além disso, considera-se que a planta e as
medidas de saída estejam sujeitas a ruídos de distribuição Gaussiana. Quanto ao
controlador, a síntese LQG segue os mesmos princípios da LQR.
Na prática, pode-se considerar que o ruído da planta seja introduzido através
dos atuadores, implicando que D = Γ . Quanto ao ruído nas medidas de saída diz-se
que este foi introduzido através dos sensores de medida.
Seja o sistema estocástico discreto LTI:
 x k +1 = Φx k + Γ u k + Dξk

 y k = Cx k + ηk
(3.5)
onde:
D : Matriz de entrada de ruídos na planta ( D ∈ ℜ n × p ).
ξ k : Ruído da planta ( ξ k ∈ ℜ p ).
ηk : Ruído nas medidas de saída ( ηk ∈ ℜ q )
Além disso, ξ k e ηk possuem as seguintes características:
- São ruídos brancos, gaussianos e não correlacionados entre si;
E{ξ ξ } = W ; E{η η } = R ;
{ } { }


- Q = E( Dξ )( Dξ )  = E{Dξ ξ D } = D E{ξ ξ } D = DWD ;


- E ξk = E ηk = 0 ;
k
T
T
k
k
T
k
k
k
T
k
k
T
k
T
k
T
T
- Q é simétrica e positiva semi-definida e R é simétrica e positiva definida.
Na Figura 3.3 ilustra-se a estrutura LQG com Filtro de Kalman preditor. A
dinâmica global do sistema é dada por:
25
 x k +1   Φ
− ΓK C
 x k 
 x$
 =  K FC Φ − Γ K − K FC  x$
+
0
0 C
0
k +1/ k
k / k −1 
 D 0  ξk 
Γ
+  r k + 
 
 0 K F ηk 
 Γ0 
(3.6)
Caso seja utilizado um estimador corrente então a estrutura LQG seria a
mostrada na Figura 3.4. Neste caso, a dinâmica global do sistema é dada por:
 x k +1   Φ
 x$
 =  K CΦ
F
k +1/ k +1 
−ΓKC
 x k 
( I − K FC0 )(Φ0 − Γ0KC ) − KFCΓKC  x$ k / k  +
0  ξk 
 D
Γ
+  r k + 


 K FCD K F ηk +1 
 Γ0 
ξk
rk
+
D
uk
Γ
+
x k +1
z−1
-
(3.7)
PLANTA
xk
C
Φ
FILTRO
PREDITOR
Γ0
+
z
−1
Φ0
ηk
+
+
KF
x$ k +1/ k
yk
x$ k / k −1
-
C0
y$ k / k −1
KC
FIGURA 3.3: Estrutura LQG com filtro de Kalman preditor.
26
ξk
rk
+
uk
D
Γ
x k +1
+
-
z−1
PLANTA
xk
C
Φ
yk
+
ηk
FILTRO ESTIMADOR K
+
F
CORRENTE
x$ k / k −1 x$ k −1/ k −1
y$ k / k −1
+
−1
z
z
C0
Φ0
x$ k / k −1
Γ0
+
KC
FIGURA 3.4: Estrutura LQG com filtro de Kalman corrente.
Quando emprega-se o Filtro de Kalman preditor, o controle obedece a lei
u k = − K C x$ k / k −1 , onde x$ k / k−1 é o vetor de estado estimado no tempo k conhecida a
saída no instante k-1. A matriz de ganho de realimentação de estado K C é calculada
pela minimização do seguinte critério quadrático:


J LQG ( discreto ) = E ∑ xTk Q1 x k + u Tk Q2 u k 
k

(
)
(3.8)
O ganho K F é calculado de modo a minimizar o traço de:
{(
)(
P' = Pk / k −1 = E x$ k / k −1 − x k x$ k / k −1 − x k
)}
T
(3.9)
onde Pk / k −1 é a matriz covariância do erro de predição.
O ganho ótimo em regime permanente é dado por:
K F = Φ0 P' CT0 ( C0 P' C0T + R )
27
−1
(3.10)
onde P' é a solução da equação algébrica de Ricatti discreta:
P'−Φ0 P' Φ0T + Φ0 P' C0T ( C0 P' C0T + R) C0 P' Φ0T − Q = 0
−1
(3.11)
Cabe observar que o ganho do Filtro de Kalmam corrente se relaciona com o
preditor da seguinte maneira:
K F = Φ 0−1 K F
(3.12)
Na Figura 3.5 encontra-se um algoritmo (FRANKLIN & POWELL, 1980) que
utiliza a formulação recursiva de Kalmam. A matriz P é simétrica e positiva definida,
devendo ser inicializada com os valores da diagonal principal muito maiores que os
demais para que a convergência do algoritmo seja mais rápida.
Início
K= 0
% 1
K=
ε<<1
P' = Φ0 P ΦT0 + Q
−1
K'= P' CT0 (C 0 P' CT0 + R)
P=(I −K'C0)P'
% = K' − K
K
K=K'
NÃO
% <ε
K
SIM
KF = K
Fim
FIGURA 3.5: Algoritmo para o cálculo de K F
28
3.3 - SÍNTESE DE UM CONTROLE ROBUSTO COM BASE
NA QUALIDADE DE IDENTIFICAÇÃO BAYESIANA DOS
PARÂMETROS SENSÍVEIS
3.3.1 - Introdução
Antes de prosseguir, cabe comentar que o verbo robustecer, amplamente
utilizado a partir deste item, significa adotar critérios e minimizar custos dentro de
uma estratégia de controle definida, tornando o sistema em MF mais robusto em
relação à variações de alguns parâmetros selecionados na planta.
Várias técnicas de Controle Robusto, com base na estrutura LQG, baseiam-se
na pré-modelagem das incertezas para o sistema analisado. Entre elas, uma das
primeiras e mais importantes utiliza uma representação externa das incertezas sob a
forma de matriz de erro (DOYLE & STEIN, 1981), sendo denominada de LQG-LTR
(Linear Quadratic Gaussian - Loop Transfer Recovery). Uma das dificuldades desta
técnica é a inadequação com as incertezas paramétricas.
Posteriormente desenvolveu-se outra técnica de Controle Robusto voltada para
as variações paramétricas (TAHK & SPEYER, 1987), conhecida por PRLQG
(Parameter Robust Linear Quadratic Gaussian), baseando-se na representação interna
das incertezas e cuja metodologia de síntese consiste em analisar as propriedades
assintóticas do método LQG. Mostrou-se que a síntese LQG-LTR é um caso particular
da PRLQG, possuindo esta última, qualidades de desempenho e robustez paramétrica
bem superiores.
No entanto, a representação interna das incertezas envolve a decomposição da
matriz ∆A (perturbação da matriz de transição de estados A devido a perturbações
paramétricas) em três matrizes, exigindo que os parâmetros sensíveis estejam
explícitos em A.
Em 1991, foi proposta uma síntese denominada por PRCBI (GOMES), baseada
nos estudos sobre o comportamento assintótico dos estimadores bayesianos
(GAUVRIT, 1982). Os resultados obtidos comprovaram a eficácia do método para
29
alguns exemplos utilizados pelas técnicas anteriores no que diz respeito a variações
paramétricas.
Ao contrário das técnicas auto-adaptativas, onde os parâmetros sensíveis são
efetivamente identificados em tempo real, a técnica PRCBI utiliza uma formulação
matemática baseada na qualidade de identificação em regime permanente. Os ganhos
do controlador são estabelecidos através de um processo "off-line", minimizando-se
um critério apresentado adiante, que produzirá a pior qualidade de identificação
possível.
3.3.2 - Qualidade de Identificação Bayesiana em Malha Fechada
A formulação a seguir apresentada tem por objetivo fornecer uma visão
qualitativa sobre o assunto, bem como permitir a fácil aplicação da síntese PRCBI nos
problemas propostos nesta tese.
A identificação bayesiana consiste em determinar a densidade de probabilidade
condicional p(θ Y k ) do vetor de parâmetros sensíveis θ , a partir do conhecimento do
{
conjunto de medidas de saída da planta até o instante k, isto é, Y k = y , y , ... , y
0
1
k
}e
da densidade de probabilidade p0 ( θ) . A Figura 3.6 ilustra duas situações para um caso
escalar.
Boa qualidade de
identificação de θ
p( θ 0 / Y k )
Má qualidade de
identificação de θ
p( θ / Y k )
p( θ / Y k )
p(θ 0 + ∆θ / Y k )
p(θ0 / Y k )
θ0
θ 0 + ∆θ
p(θ0 + ∆θ / Y k )
θ 0 θ0 + ∆θ
θ
θ
FIGURA 3.6: Visualização da qualidade de identificação paramétrica para um caso
escalar.
30
Através de desenvolvimento matemático chega-se a:
(
)
( )
p(θ Y k ) = p θ0 + ∆θ Y k = f G θ−01
(3.13)
onde a matriz G θ−1 permite quantificar a qualidade de identificação do vetor
0
paramétrico nominal θ 0 . Resta-nos obviamente apresentar como poderá ser calculada a
matriz G θ−1 , bem como determinar uma função adequada f ( ⋅) que permita expressar a
0
qualidade de identificação paramétrica. Antes disso, deve-se alertar sobre a notação
utilizada na formulação apresentada adiante. De maneira geral, tem-se que:
∆( ⋅) = ( ⋅) p − ( ⋅) 0
(3.14)
onde (⋅) representa um argumento qualquer, o índice "p" de perturbado indica que o
argumento foi perturbado devido a uma variação dos valores nominais dos parâmetros
sensíveis e finalmente, o índice "0" representa que o argumento é função do vetor
paramétrico nominal. No entanto, alguns argumentos dependem da estrutura LQG
como um todo (Figuras 3.3 e 3.4), isto é, serão ditos nominais se a planta e o FK
estiverem em função dos valores nominais dos parâmetros sensíveis, caso contrário
estes argumentos serão considerados perturbados. A Tabela 3.1 mostra um exemplo da
notação adotada para este caso. A Figura 3.7 ilustra a estrutura do problema abordado.
TABELA 3.1: Exemplo da notação adotada.
PLANTA
F.K.
θ0
θ0 + ∆θ
θ0
θ0
Covariância do erro de
predição do vetor de
saída
M0
Mp
31
ξk
D
ηk
rk
yk
SISTEMA
S(θ)
+
+
F.K.
( θ0)
KC
Regulador Ótimo
FIGURA 3.7: Estrutura do problema abordado.
Considere então as seguintes equações:
Φ p = Φ0 + ∆Φ
M p = M0 + ∆M
Kp = K0 + ∆K
Pp ' = P0 ' + ∆P '
(3.15)
onde M é a covariância do erro de predição do vetor de saída, K é o ganho do filtro
estimador e P' a covariância do erro de predição do vetor de estado.
Retornando ao cálculo da matriz G θ−1 , considere as seguintes definições:
0
∆θ = (ε1 ε2 ... εi ... ε r )
T
(3.16)
∆θii = ∆θi = ( 0 ... 0 εi 0 ... 0) , i = 1... r
T
(
)
T
∆θij = 0 ... 0 εi 0 ... 0 ε j 0 ... 0 , i ≠ j
32
(3.17)
(3.18)
Além disso, define-se também Tr M0−1 ∆M
como sendo o valor calculado em
∆θ ij
função da perturbação ∆θij , então:
g ii = G
g ij = G θ−01 ( i, j) =
−1
θ0
( i, i ) =
Tr[ M −0 1 ∆M] ∆ θi
(3.19)
ε i2
(
Tr[ M 0−1 ∆M] ∆ θij − ε 2i g ii + ε 2j g jj
)
(3.20)
2 εi ε j
i≠ j
Para o cálculo de M0 e ∆M utiliza-se as seguintes equações:
M 0 = C0 P0 ' CT0 + R
(3.21)
onde P0 ' pode ser calculado a partir da Equação (3.11). Parte-se então para o cálculo
das matrizes auxiliares L, N e ∆P' , conforme as equações a seguir:
L = (Φ0 − Γ0 K C ) L(Φ0 − Γ0 KC ) + (Φ0 − Γ0 K C ) K 0 M 0 K 0T (Φ0 − Γ0 KC )
T
T
~
N = (Φ0 − Γ0 K C ) N( I − K0C0 ) ΦT0 − (Φ0 − Γ0 K C ) L ∆ΦT
T
~
− (Φ0 − Γ0 K C ) K 0 M 0 ( ∆Φ K 0 + Φ0 ∆K)
T
(3.22)
(3.23)
% = ∆Φ − ∆Γ K , e
onde ∆Φ
C
T
T
~
∆P' = Φ0 ( I − K 0C0 ) ∆P' ( I − K 0C0 ) ΦT0 − ∆ΦN( I − K 0C0 ) Φ0T
T
~
~
~
~
+ (Φ0 ∆K + ∆Φ K 0 ) M 0 (Φ0 ∆K + ∆Φ K0 ) + ∆Φ L ∆ΦT
~
− Φ0 ( I − K0C0 ) N T ∆ΦT
Finalmente,
∆M = C0 ∆P ' C0T
33
(3.24)
(3.25)
As Equações (3.23) a (3.25) são equações matriciais de Lyapunov do tipo:
X = F.X.G + H
(3.26)
encontrando-se a solução destas equações no Apêndice A.
Entretanto, uma matriz não é um bom "parâmetro" para comparação de
robustez e também não define precisamente uma medida de robustez. Foram
investigados (GOMES, 1991) diversos índices relacionados com a matriz G θ−01 (traço,
determinante, autovalor de maior módulo, etc.) tendo sido escolhido como critério de
robustez:
( )
J rob = Tr G θ−01
(3.27)
3.3.3 - A Síntese PRCBI
A síntese PRCBI em MF consiste em utilizar a formulação apresentada no Item
3.3.2, considerando a medida de robustez representada por (3.27), conforme ilustrado
na Figura 3.8. A medida de robustez com base na qualidade de identificação bayesiana
dos parâmetros sensíveis necessita do conhecimento das matrizes D, Q e R e das
demais características estocásticas destes ruídos. Deste modo, três situações podem
ocorrer:
a) No caso estocástico, estas matrizes são impostas pelo modelo sendo consideradas
como dados do problema. O ganho de Kalman é determinado em função destas
matrizes e dos valores nominais do sistema, restando atuar sobre o ganho de
realimentação de estado K C , a fim de minimizar o seguinte critério:
[ ( )]
J 1 = min Tr G θ−01
KC
34
(3.28)
b) No caso determinístico ou quando os ruídos não afetam fortemente a precisão do
modelo, pode-se utilizar as matrizes D, Q e R como grandezas variáveis no
processo de minimização da medida de robustez em malha fechada. Assim, os
ruídos são considerados fictícios e o filtro de Kalman passa a atender as
características de robustez desejadas.
[ ( )]
J 2 = min Tr G θ−01
D, K C
(3.29)
c) Numa terceira abordagem , o controlador K C pode ser calculado para atender as
condições de desempenho, ficando a minimização dependente unicamente do filtro
para o robustecimento do sistema.
ξk
ηk
D
Cálculo do
Tr G−θ1
Sistema
A( θ) B( θ) C( θ)
KC
0
F.K.
A(θ0) C(θ0)
−1
min
Tr (Gθ )
D, K
0
C
Programação não linear
FIGURA 3.8: Síntese PRCBI em malha fechada.
A Figura 3.8 ilustra o segundo caso citado. A síntese de controle robusto
utilizará um dos métodos de minimização apresentados no Capítulo 2. O processo
ilustrado será repetido até que o traço mínimo de G θ−1 seja obtido. Após a otimização,
0
35
as matrizes D rob e K Crob são intoduzidas no regulador, que passará a ser robusto em
relação às variações do vetor de parâmetros sensíveis θ .
3.4 - O PROBLEMA DO SEGUIDOR ( TRACKING )
Um dos problemas mais importantes na área de controle consiste em obter um
controlador de modo que a planta considerada possa ser regulada, ou seja, que os
estados possam ser deslocados para a origem do espaço de estados.
Neste item, entretanto, o interesse será controlar o sistema de maneira que o
mesmo seja levado a uma determinada posição do espaço de estados (set point).
Considera-se que este ponto de acomodação seja constante sobre longos períodos de
tempo, mas esporadicamente poderá ser alterado. Como exemplo pode-se citar o caso
em que deseja-se redirecionar uma antena parabólica para que possa receber o sinal de
outro satélite geo-estacionário, através da alteração da posição angular de um
potenciômetro.
A abordagem a seguir apresentada estará limitada a um sistema linear,
invariante no tempo e discreto. Considere então um sistema representado pela
seguinte equação de estado:
x( k + 1) = Φx( k ) + Γ u( k )
(3.30)
onde a variável controlada é dada por:
z( k ) = C' x( k )
(3.31)
Supondo que a variável controlada deverá se acomodar na posição z 0 , então
para manter o sistema neste ponto, uma entrada constante u 0 deverá ser descoberta
para que os estados sejam estabilizados em x 0 . Assim:
z 0 = C' x 0
36
(3.32)
x0 = Φ x0 + Γ u0
e por (3.30):
(3.33)
Deve-se observar que o sistema somente poderá ser mantido em um
determinado ponto de acomodação, caso (3.32) e (3.33) possam ser resolvidas para u 0 ,
dado o valor de z 0 . Realizando a seguinte mudança de variáveis:
u'( k ) = u( k ) − u0
x'( k ) = x( k ) − x0
(3.34)
z'( k ) = z( k ) − z0
chega-se através de (3.30) a (3.33) que:
x'( k + 1) = Φx'( k ) + Γ u'( k )
z'( k ) = C' x'( k )
(3.35)
Logo, por meio de uma simples mudança de variáveis foi possível transformar
o sistema em outro com ponto de acomodação na origem, podendo-se então tratar este
novo problema como um regulador. A fim de atingir os objetivos propostos pelo
seguidor, sugere-se como critério de minimização:
J=
k2
∑ [ z'T ( k ) R 3 z'( k ) + u'T ( k) R 2 u'( k )] + x'T ( k 2 ) R1 x'( k 2 )
k = k1
(3.36)
onde R 1 , R 2 e R 3 são matrizes de ponderação entre os estados, as entradas e as
variáveis controladas respectivamente. Os dois primeiros termos de (3.36) penalizam a
evolução das variáveis controladas e das entradas, enquanto o terceiro penaliza os
valores finais (supostos estacionários) dos estados da planta. O resultado do processo
de otimização, caso exista solução, será o controlador K C que ao realimentar os
estados da planta minimizará o custo dado por (3.36). A aplicação da lei de controle
dada por (3.37) garantirá que o sistema original será transferido para seu ponto de
37
acomodação tão rápido quanto possível, sem que haja transientes excessivos na
entrada da planta.
u'( k ) = − KC x'( k )
(3.37)
Aplicando (3.34) em (3.37) a fim de observar o sistema com as variáveis
originais chega-se a:
u( k ) = − KC x( k ) + u0 + KC x0
u( k ) = − KC x( k ) + u0 '
(3.38)
onde u 0 ' é um vetor constante a ser determinado de modo que em estado estacionário a
variável controlada z( k ) assuma o valor z 0 . Resta apenas determinar as condições
para que u 0 ' possa ser calculado. De (3.38) em (3.30):
x( k + 1) = (Φ − ΓKC ) x( k ) + Γ u0 '
(3.39)
Como o sistema é assintoticamente estável, quando k → ∞:
x0 = (Φ − ΓKC ) x0 + Γ u0 '
( I − Φ + ΓKC ) x0 = Γu0 '
x0 = ( I − Φ + ΓKC ) Γ u0 '
(3.40)
z 0 = C' ( I − Φ + ΓK C ) Γ u 0 '
(3.41)
−1
De (3.40) em (3.32):
−1
O caso de interesse na resolução de (3.41) ocorre quando u' e z possuem a
mesma dimensão. Deve-se observar que a matriz que relaciona u 0 ' e z 0 em (3.41) é na
38
verdade a matriz de transferência discreta em malha fechada do sistema para z=1.
Assim, caso esta matriz seja não singular:
H f ( z) = C' ( zI − Φ + ΓKC )Γ
[
]
u0 ' = C' ( I − Φ + ΓKC ) Γ
−1
−1
(3.42)
z0 = H −f 1(1) z0
(3.43)
A Figura 3.9 mostra o diagrama final do problema do seguidor.
z0
H−1
f (1)
u'0
+
PLANTA
C'
z(k)
-
KC
FIGURA 3.9: Diagrama do problema do seguidor.
39
CAPÍTULO 4
O SISTEMA MASSA-MOLA
4.1 - INTRODUÇÃO
A notação e a teoria utilizadas a seguir são as que foram definidas nos
Capítulos 2 e 3. Neste capítulo aplica-se a síntese PRCBI em três exemplos
acadêmicos monovariáveis a fim de obter controladores que tornem os sistemas
robustos a variações paramétricas. Os três modelos utilizados, configurações diversas
do sistema massa-mola, constituem-se em blocos com determinadas massas
interligados através de amortecedores e molas. A análise desta estrutura flexível é de
grande interesse para teóricos e práticos em controle, pois simula, entre outros, a
aplicação de comandos a bordo de veículos espaciais (GOMES, 1991). Este tipo de
estrutura geralmente é bastante oscilante, com pólos de malha aberta muito próximos
da instabilidade.
No Item 4.2, utiliza-se como modelo o sistema massa-mola de 4 estados,
robustecendo-o a alterações dos valores de suas massas. No Item 4.3, adiciona-se ao
modelo anterior dois blocos de massas, elevando-se o número de estados para oito. No
Subitem 4.3.1, robustece-se o sistema a alterações dos valores nominais das massas
que se encontram nas extremidades, enquanto que no Sub-item 4.3.2 considera-se que
o sistema deverá ser robustecido em relação à variação de todas as massas.
Em todos os problemas estudados, a síntese PRCBI em MF será utilizada de
acordo com o Capítulo 3. Um dos efeitos observados da aplicação da síntese é a
dessensibilização, ou ainda, insensibilização dos pólos de MF do sistema controlado a
variações dos parâmetros considerados. Para mostrar esta propriedade far-se-á uso de
um gráfico de grande importância denominado de "Diagrama de Sensibilidade", discutido a seguir no Item 4.1.1.
40
Como consequência da referida dessensibilização, espera-se que alterações nos
valores dos parâmetros sensíveis acarretem pouca degradação em termos de
desempenho nominal do sistema, já que os pólos de MF pouco se deslocarão.
Além disso, a aplicação da síntese nos casos estudados levou a um aumento do
domínio de estabilidade do sistema. Isto será posteriormente constatado através de
uma medida denominada de "Raio da Hiperesfera Percentual de Estabilidade".
4.1.1 - Diagrama de Sensibilidade por Pontos
Através deste tipo de gráfico foi possível apresentar os resultados da
dessensibilização dos pólos de MF dos sistemas estudados. Consiste em verificar a
posição dos pólos de MF para os sistemas perturbados, que foram gerados a partir de
perturbações em direções aleatórias com raio percentual constante.
Considere como exemplo, um caso em que o vetor de parâmetros sensíveis seja
de segunda ordem, isto é:
 θ1 
θ =   e portanto, θ ∈ℜ 2
θ2 
(4.1)
Seja θ 0 o vetor com os valores nominais dos parâmetros considerados, então:
 θ1N 
θ0 =  
θ2 N 
(4.2)
Considere ainda ℵ o conjunto de pares ( r1 , r2 ) que satisfaçam a seguinte
equação:
R = r12 + r22
(4.3)
onde R é uma constante. Cabe observar que o conjunto ℵ é formado pelos pares
ordenados que formam uma circunferência de raio R, centrada na origem do plano
41
r1 × r2 . Através do conjunto ℵ é possível obter vetores paramétricos perturbados com
raio percentual R do seguinte modo:
 (1 + r1 )θ1N 
θ=

(1 + r2 )θ2 N 
(4.4)
A partir da Expressão (4.4), a determinação dos modelos perturbados com raio
percentual constante torna-se elementar, já que as matrizes do sistema (transição de
estados e de entrada) são funções de θ . As referidas matrizes podem ser de sistemas
contínuos ou discretos. Nos sistemas massa-mola, estas matrizes representam o
sistema contínuo e após perturbadas serão discretizadas. Portanto:
A = A( θ) e B = B(θ)
(4.5)
Com as matrizes perturbadas discretas pode-se obter a matriz de transição de
estado da estrutura LQG (com Filtro de Kalman) utilizando-se (3.7) e então calcular os
pólos de MF do sistema perturbado para plotá-los no referido diagrama.
O diagrama de sensibilidade por pontos foi de grande valia nesta tese, já que ao
testar a robustez do sistema com o controlador obtido (robusto ou híbrido) em direções
específicas, sempre persistia a dúvida se esta propriedade ainda ocorreria em outras
direções. Através deste diagrama estabelece-se uma varredura aleatória por várias
direções do espaço paramétrico considerado, permitindo a fácil visualização ou
comparação entre a sensibilidade dos pólos de MF dos diversos controladores
considerados.
42
4.1.2 - Hiperesfera Percentual de Estabilidade
A hiperesfera de estabilidade pode ser definida resumidamente, como aquela de
maior raio percentual de perturbação que poderá ser inscrita na região de estabilidade
dentro do domínio paramétrico, centrada no ponto do espaço em que os parâmetros
assumem seus valores nominais. Quando o vetor de parâmetros sensíveis é de segunda
ordem, a hiperesfera transforma-se em uma circunferência, sendo portanto possível
visualizá-la, bem como a região de estabilidade do domínio paramétrico. Este tipo de
gráfico será empregado quando do estudo do problema apresentado no Item 4.3.1.
Uma figura de mérito dos controladores trabalhados será o raio da hiperesfera
percentual de estabilidade, que é definido como a maior porcentagem de perturbação
admissível pelo sistema, considerando qualquer direção do espaço paramétrico. Para
calcular este raio, inicia-se do ponto em que os parâmetros assumem seus valores
nominais com raio bem pequeno. Testa-se aleatoriamente um grande número de
direções com este raio. Caso o sistema seja estável para todas as direções testadas, isto
é, os pólos de MF de todos os modelos perturbados estejam inseridos no círculo
unitário (plano z), então aumenta-se o raio e repete-se o processo. Quando for
alcançada a instabilidade, reinicializa-se o processo com um raio percentual intermediário entre o atual e o anterior, até que seja obtida a precisão desejada para o referido
raio. É de bom alvitre que, ao aumentar o raio, também seja aumentado o número de
direções testadas.
O raio percentual da hiperesfera é definido como:
R = r12 + r22 +... + rn2
(4.6)
onde R é uma constante. Os modelos perturbados são gerados a partir dos seguintes
vetores de parâmetros sensíveis:
43
 (1 + r1 )θ1N 


(
)
r
+
θ
1
2
2
N

θ=
 ..... 


(1 + rn )θnN 
(4.7)
Em termos computacionais, como a maioria dos ambientes de programação
possuem geradores de números aleatórios de densidade de probabilidade uniforme
entre 0 (zero) e 1 (um), utiliza-se este recurso gerando um vetor aleatório de dimensão
igual ao vetor paramétrico. Em seguida, subtrai-se cada uma das componentes de 0.5,
com intuito de obter números positivos e negativos em torno de zero. Normaliza-se
este vetor, dividindo-o por uma constante igual a seu módulo e finalmente, multiplicase o mesmo por R para obter o raio desejado. As componentes deste vetor substituirão
os ri para 1 ≤ i ≤ n em (4.7).
4.1.3 - A Técnica das Liberações
O título acima foi escolhido pelo autor, tendo em vista que a bibliografia
disponível sobre otimização não permitiu rotular a técnica com mais precisão.
Esta técnica tem por objetivo permitir, em termos de otimização, que as
variáveis de projeto atendam simultaneamente a diversas funções objetivo. Graças a
este método foi possível obter os resultados apresentados nesta tese. Para facilitar o
entendimento, será apresentado neste Item como a técnica atua conciliando apenas
duas funções objetivo. A Figura 4.1 ilustra o fluxograma da técnica em questão. O
método pode ser facilmente extrapolado, fazendo uso de tantas etapas de otimização
quantas forem as funções objetivo consideradas. O algoritmo é bastante simples, ou
seja, na etapa 1 otimiza-se a primeira função objetivo, obtendo ao final do processo de
minimização o projeto ótimo (X 0 ) das variáveis de projeto. Portanto:
( )
F X0 ≤ F( X), ∀ X ≠ X0
44
(4.8)
Como já foi mencionado, o mínimo obtido nem sempre é o absoluto, ou seja, o
mínimo de todos os mínimos da superfície considerada. No entanto, este fato não
inviabiliza o método. Aliás, X 0 não precisa nem mesmo ser o mínimo da função F(⋅) ,
mas quanto mais próximo dele, melhores serão os resultados obtidos.
( )
Na etapa 2, baseado no custo J 1 min = F X0 obtido na primeira etapa, define-se
uma folga aceitável (J 1 LIB ) sobre este valor mínimo e então otimiza-se a segunda
função objetivo ( G( ⋅) ). Portanto a solução para o problema será um vetor X1 tal que:
( )
J 1 = F X1 ≤ J 1 LIB
e
( )
J 2 = G X1 = mínimo
(4.9)
onde J 1 LIB = k. J 1 min com k > 1.
Finalmente, deve-se comentar que este algoritmo estará embutido dentro da
"Rotina para Avaliação do Custo" mostrada na Figura 2.7.
4.2 - SISTEMA MASSA-MOLA COM 4 ESTADOS
O problema a ser estudado, de acordo com a Figura 4.2, é um sistema composto
por duas massas interligadas através de um amortecedor e de uma mola. Diz-se não
colocado, pois a entrada e a saída do sistema não estão sobre a mesma massa. O
primeiro objetivo deste problema será calcular, através da síntese PRCBI, um
controlador que torne o sistema robusto a variação das massas. O segundo objetivo,
finalidade desta tese, será obter um controlador híbrido que mantenha as qualidades de
robustez, mas que também possua características de desempenho aceitáveis.
45
ETAPA 1
ETAPA 2
INÍCIO
INÍCIO
Verificação das
RESTRIÇÕES
IMPOSTAS
J1 LIB = k . J1 min
Verificação das
RESTRIÇÕES
IMPOSTAS
Restrições
Satisfeitas
NÃO
Restrições
Satisfeitas
SIM
Cálculo da
Função Objetivo
J1 = F(X)
J1 =1000000
NÃO
SIM
Cálculo de
J1 =F(X)
FIM
J1 ≤ J 1 LIB
NÃO
J2 =1000000
Resultado
J1min =F(X0)
SIM
Cálculo da
Função Objetivo
J2 =G(X)
FIM
FIGURA 4.1: Fluxograma da técnica das liberações para duas funções objetivo.
FIGURA 4.2: Diagrama físico do sistema massa-mola de 4 estados.
Equacionando o problema e colocando-o sob a forma de equações de estado
chega-se a:
46
1
0
0 
 0
0
k
b 
− k − b
1
m1
m1
m1
m1
. x +  m1 . u
x& = 
0
0
1 
 0
0
k
b
k
b 
− m2 − m2 
0
 m2
m2
(4.8)
y = ( 0 0 1 0). x
(4.9)
onde x = ( x1 , x 2 , x 3 , x 4 ) T é o vetor de estados, cujo significado físico encontra-se
apresentado na Tabela 4.1; "u" representa a força aplicada na entrada do sistema e "y"
é a saída, que representa a posição da massa 2. Na Tabela 4.2 encontram-se os valores
adotados para os diversos parâmetros utilizados no processo de otimização.
TABELA 4.1: Significado físico dos estados do sistema
massa-mola de 4 estados.
ESTADO
x1
x2
x3
x4
Significado Físico
Posição da massa 1 (m)
Velocidade da massa 1 (m/s)
Posição da massa 2 (m)
Velocidade da massa 2 (m/s)
TABELA 4.2: Valores adotados para os parâmetros utilizados.
CONSTANTES
Massa nominal do primeiro bloco: m1N
Massa nominal do segundo bloco: m2 N
Constante de elasticidade da mola: k
Constante de amortecimento: b
Período de amostragem: T
Covariância do ruído na planta: Q
Covariância do ruído no sensor de saída: R
VALOR
1.0 Kg
0.25 Kg
0.145 N/m
0.04875 N.s/m
0.1 s
0.01
0.0001
Conforme citado acima, as massas do sistema serão as variáveis sensíveis no
problema. Deste modo, o vetor de parâmetros sensíveis nominal será dado por:
47
. 
 m1N   10
=

θ0 = 
 m2 N   0.25
(4.10)
4.2.1 - Resultados Obtidos
Os resultados abaixo foram obtidos em duas fases de otimização. A primeira
fase consistiu da otimização de um vetor de oito componentes formado por D e K C
através da síntese PRCBI, minimizando-se o traço de G θ−1 . Na segunda fase, otimizou0
se o vetor de ganhos K C considerando-se o desempenho do sistema em MF em
detrimento de liberações gradativas do traço de G θ−1 (técnica das liberações). Na
0
Tabela 4.3 encontram-se os resultados obtidos na fase 1 do processo de otimização
utilizando-se dois métodos de minimização. Na Tabela 4.4 estão listados nove
controladores, sendo o primeiro o de traço mínimo da Tabela 4.3. Os controladores 4.2
a 4.9 são híbridos levando-se em conta a robustez exigida e o desempenho nominal. O
4.10 foi obtido pelo processo analítico de cálculo do LQR, conforme explicado no
Capítulo 3.
TABELA 4.3: Vetores obtidos na fase 1 do processo de otimização.
Método de Otimização
Traço G θ−1
Vetor Obtido
0
T
D=[0.7296 0.1421 0.2041 0.6371 ]
K C =[0.8971 2.4888 -0.8971 0.3399]
D=[0.6825 -0.0134 -0.0187 0.7305 ]T
K C =[0.9398 2.4315 -0.9397 1.3475]
Powell
Gradientes Conjugados
0.5248
0.8839
Na Tabela 4.5 encontram-se as características dos controladores citados, isto é,
seus valores de traço de G θ−1 e respectivos custos de desempenho, calculados conforme
0
as Expressões (4.11) e (4.12). Nesta Tabela mostra-se também o quanto foi degradada
a robustez, a fim de obter um melhor desempenho do controlador. Os valores
apresentados fornecem uma noção relativa das características de um controlador
48
quando comparado com os demais do mesmo problema. O valor absoluto
isoladamente não possui significado algum. Nas demais tabelas similares deste
capítulo continuam valendo estas mesmas observações.
TABELA 4.4: Controladores obtidos na fase 2 do processo de otimização.
Número do
Controlador
4.1 (1)
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10 (2)
C O N T R O L A D O R ( KC )
[0.897119673
[1.152416971
[1.180608876
[1.181616899
[1.213875492
[1.229378689
[1.293642866
[1.362271712
[1.514233895
[1.455608702
2.488786502
1.304220219
2.164228460
1.910178412
1.946445260
1.975696065
2.041960491
2.187990372
2.412747905
1.969629306
-0.897119623
-0.694296964
-0.660627925
-0.596083132
-0.563761910
-0.533018863
-0.516952819
-0.383951436
-0.289715794
-0.182252604
0.339874639]
-0.046376922]
-0.185770629]
-0.153506053]
-0.145316147]
-0.117608642]
-0.115569133]
0.017546165]
0.353968223]
0.928758998]
- Controlador com custo de robustez ótimo (Síntese PRCBI), obtido através
do método de Powell (Tabela 4.3).
(2) - Controlador com custo de desempenho ótimo, obtido por processo analítico
(LQR).
(1)
TABELA 4.5: Características obtidas nos controladores otimizados.
Número do
Controlador
Limite do custo de
robustez ótimo (%)
Valor do traço de
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
0
5
10
20
30
40
50
100
150
-
0.5247759
0.5510111
0.5771632
0.6297310
0.6822085
0.7346862
0.7871638
1.0495518
1.3119397
1.6931585
G θ−1
0
- Custo de robustez ótimo.
(4) - Custo de desempenho ótimo.
(3)
49
(3)
Custo de
Desempenho
J DESEMP
116.6998
16.3315
15.4024
14.3891
13.8423
13.4689
13.1349
12.2923
11.5373
11.1035 (4)
Para o cálculo do custo de desempenho considerou-se a energia total dos
estados e da entrada ponderados pelas seguintes matrizes Q1= I 4 e Q 2 =1 após fechar a
malha em k=51 (t=5.1s), através da realimentação direta de estados. A Fórmula
(4.11) mostra como foi avaliado o custo de desempenho. O sistema foi excitado por
meio de um impulso unitário, permanecendo em malha aberta até k=50.
Para fins de avaliação da energia considerou-se a evolução do sistema em
malha fechada por mais 250 períodos, sem a utilização de estimador de estados.
J Desemp =
onde:
300
∑ (x Q x
k = 51
T
k
1
k
+ u Tk Q 2 u k )
x k +1 = ( Φ − Γ . K C ) x k para 51 ≤ k ≤ 300
(4.11)
(4.12)
A Figura 4.3 ilustra a evolução temporal dos estados do sistema massa-mola de
4 estados, após excitá-lo com um impulso unitário discreto em k=0. De maneira geral,
pode-se dizer que os blocos com massa menor, relativamente aos demais, tendem a
oscilar mais em posição (x 3 em relação a x1 ) e velocidade (x 4 em relação a x 2 ). Para
os outros problemas deste Capítulo, as curvas de evolução temporal em malha aberta
dos estados das plantas possuem forma e comportamento análogos ao da Figura 4.3.
Nas Figuras 4.4 a 4.9 encontram-se ilustrados os diagramas de sensibilidade do
sistema massa-mola de 4 estados com alguns dos controladores da Tabela 4.4. As
curvas vermelhas representam as várias posições assumidas pelos pólos de MF no
plano z (discreto) da estrutura apresentada na Figura 3.4, considerando a planta
perturbada com raio percentual de 10%. As curvas de cores azul e verde representam
raios de perturbação de 30% e 50%, respectivamente. As várias cruzes assinaladas
mostram as posições dos pólos de MF do sistema considerando os parâmetros
sensíveis em seus valores nominais.
50
FIGURA 4.3: Evolução temporal dos estados da planta em malha aberta.
De maneira geral, pode-se observar pelas Figuras 4.4 a 4.9 que a medida que o
valor do traço de G θ−1 eleva-se, também aumenta a sensibilidade dos pólos de MF para
0
o sistema perturbado. As pequenas ilhas da Figura 4.4 (controlador com robustez
ótima) fundem-se numa única curva, como ilustra a Figura 4.9 (controlador de
desempenho ótimo).
Deve-se observar que para todos os controladores ilustrados, o sistema massamola perturbado com até 50% de raio percentual permaneceu estável (pólos de MF
dentro do círculo unitário).
51
FIGURA 4.4: Diagrama de Sensibilidade para o controlador 4.1.
FIGURA 4.5: Diagrama de Sensibilidade para o controlador 4.2.
52
FIGURA 4.6: Diagrama de Sensibilidade para o controlador 4.3.
FIGURA 4.7: Diagrama de Sensibilidade para o controlador 4.5.
53
FIGURA 4.8: Diagrama de Sensibilidade para o controlador 4.8.
FIGURA 4.9: Diagrama de Sensibilidade para o controlador 4.10.
54
4.3 - SISTEMA MASSA-MOLA COM 8 ESTADOS
Durante os primeiros estudos da tese, procurou-se utilizar os vários métodos de
otimização apresentados no Capítulo 2, a fim de observar aquele que levaria aos
melhores resultados. Entretanto, como as restrições impostas nos problemas abordados
foram implementadas por meio de artifícios computacionais e adicionalmente, como
não era possível calcular o gradiente analítico para as funções objetivo adotadas,
verificou-se por estes motivos que na totalidade das vezes testadas, o método de
Powell levou aos melhores resultados e portanto, passou a ser utilizado com
exclusividade a partir deste item.
4.3.1 - Robustecimento a Variação de 2 Massas
Este problema embora semelhante ao anterior, possui um grau de complexidade
a mais, já que a ordem da planta foi aumentada para oito estados. Neste caso tem-se
quatro massas interligadas através de amortecedores e molas, conforme ilustrado na
Figura 4.10. O objetivo será, numa primeira fase, calcular um controlador por
intermédio da síntese PRCBI, que torne o sistema robusto a variações das massas 1 e
4. Na segunda fase, tentar-se-á produzir controladores híbridos em robustez e
desempenho, utilizando-se novamente a técnica das liberações. Todas as simulações
serão realizadas por intermédio de estimador corrente de estados, mais precisamente
Filtro de Kalman.
FIGURA 4.10: Diagrama físico do sistema massa-mola de 8 estados.
55
4.3.1.1 - Equações de Estado da Planta
Após os devidos cálculos chega-se às seguintes equações de estado:
x& = A. x + B. u
(4.13)
y = C. x
(4.14)
onde x T = ( x 1 x 2 ... x 8 ) é o vetor de estados, cujo significado físico encontra-se
na Tabela 4.6. Além disso tem-se que "y" é a saída (posição da massa 4) e "u" a
entrada da planta (força aplicada na massa 1). As matrizes A, B e C são as que se
seguem:
1
0
0
0
0
0
0 
 0
k
b
k
b
−
− m1 m1
0
0
0
0 
m
m1
 1

0
0
0
1
0
0
0
0


k
b
k
b
2k
2b
−
−
0
0
 m2

m2
m2
m2
m2
m2
A =
0
0
0
0
0
1
0
0 

2k
2b
k
b
k
b 
− m 3 − m3 m3
0
m3
m3
m3 
 0
0
0
0
0
0
0
1 
 0
k
b
k
 0
− m4 − mb4 
0
0
0
m4
m4
[
BT = 0
1
m1
]
0 0 0 0 0 0
C = [0 0 0 0 0 0 1 0]
(4.15)
(4.16)
(4.17)
4.3.1.2 - Constantes e Considerações Adotadas
a) Matriz covariância de entrada de ruídos na planta: Q=0.01;
b) Matriz covariância do ruído no sensor de medidas de saída da planta: R=0.0001;
c) Período de amostragem considerado na discretização: T=0.1 seg;
d) Método de otimização utilizado: Powell;
e) Valores nominais das massas (Kg): m1 = 1. 0 , m2 = 0. 25, m3 = 0.1 e m4 = 0.1;
56
f) Constante elástica das molas: k = 0.145 N/m;
g) Constante de amortecimento: b = 0.04875 N.s/m;
h) Considerou-se que D= Γ , isto é, o ruído entra na planta através dos atuadores;
i) O desempenho do sistema malha fechada é avaliado por estimador corrente de
estados;
j) Para efeito de custo de desempenho serão consideradas as seguintes matrizes de
ponderação de estados Q1 = I 8 e da entrada Q2 =1.
TABELA 4.6: Significado físico dos estados do sistema massa-mola 8 estados.
ESTADO
x1
x2
x3
x4
x5
x6
x7
x8
Significado Físico
Posição da massa 1 (m)
Velocidade da massa 1 (m/s)
Posição da massa 2 (m)
Velocidade da massa 2 (m/s)
Posição da massa 3 (m)
Velocidade da massa 3 (m/s)
Posição da massa 4 (m)
Velocidade da massa 4 (m/s)
4.3.1.3 - Vetor de Parâmetros Sensíveis
Os parâmetros sensíveis são as massas 1 e 4. Portanto:
. 
 m1N  10
 m1 
=  e θ= 
θ0 = 
.
 m4 N   01
 m4 
(4.18)
4.3.1.4 - Resultados Obtidos
A Tabela 4.7 enumera os vários controladores que serão analisados. O
controlador 4.11 foi obtido através da minimização do traço de G θ−1 . Os controladores
0
4.12 a 4.20 são híbridos, calculados a partir do controlador 4.11 através da técnica das
liberações. O controlador 4.23 é o LQR para a matriz de ponderação dos estados
57
Q1 = I 8 e da entrada Q 2 = 1, tendo sido calculado analiticamente. Quanto aos
controladores 4.21 e 4.22, foram obtidos numericamente a partir do controlador 4.23,
utilizando-se novamente a técnica das liberações, mas agora otimizando-se o traço de
G θ−1 a partir da degradação do custo de desempenho nominal ótimo. As Tabelas 4.8 e
0
4.9 mostram as características dos controladores supra-citados.
TABELA 4.7: Controladores obtidos através da síntese PRCBI, por métodos de
otimização utilizando critérios híbridos e por meio analítico.
No.
4.11
(5)
4.12
4.13
4.14
4.15
4.16
4.17
4.18
4.19
4.20
4.21
4.22
4.23
(6)
C O N T R O L A D O R ( KC )
[4.705820385 7.361800067
-2.104900311
[4.705976684 8.002000067
-2.102399530
[4.710979809 8.182100067
-2.102399530
[4.871779809 8.502900067
-2.096749530
[5.031879833 8.823039114
-2.056724524
[5.030979809 8.822100067
-1.781149530
[5.453379809 9.564500067
-1.348749530
[5.554004809 11.174500067
0.261250470
[5.012690309 8.498820067
0.406495470
[4.962285954 7.528828067
1.290487470
[1.554220533 2.659255445
0.375904911
[1.534195533 2.980905445
0.055504911
[ 1.846076533 2.205799446
0.769685911
-4.270015626
-0.876346472
-4.189990626
-0.836333972
-4.029890626
-0.826327722
-3.984865626
-0.665527722
-3.979237348
-0.645515219
-3.689890626
-0.506015222
-3.715771139
-0.358188095
-3.608896139
-0.167944420
-3.450550971
-0.167944420
-3.305311403
-0.119967558
-0.372793527
0.181784530
-0.392818527
0.161759530
0.020262473
-0.048710792
-6.408789105 0.440542769
1.152333760]
-6.368776605 0.460549019
1.153584150]
-6.348451605 0.465552144
1.154834931]
-6.177651605 0.471202144
1.159859931]
-6.017551581 0.511227150
1.169866183]
-6.018451605 0.478052144
1.474834931]
-5.586051605 0.643760899
1.897859931]
-3.969801605 1.229021141
2.010984931]
-1.394121605 1.493829509
2.150984931]
-0.605274356 1.667067663
3.029576931]
1.256454417 -0.276966758
0.441236803]
0.934804417 -0.357066758
0.401186803]
1.664610417 -0.040385758
0.816805303]
(5)
- Controlador com o traço de G θ−10 ótimo, obtido através da síntese PRCBI.
(6)
- Controlador com custo de desempenho ótimo.
58
O controlador 4.21 foi propositalmente liberado de 12.36%, a fim de igualar
seu custo de desempenho com o do controlador 4.20, a fim de observar se os
resultados alcançados a partir da liberação do desempenho seriam melhores que
aqueles a partir da liberação do traço de G θ−1 . Neste caso, o controlador 4.20 obteve
0
características superiores, pois seu custo de robustez foi menor.
Procedeu-se analogamente com o controlador 4.22, liberando-o 23.77% do
custo de desempenho nominal ótimo, a fim de compará-lo com o controlador 4.19.
Este último alcançou resultados superiores, pois seu custo de robustez foi menor e
adicionalmente, o raio da hiperesfera de estabilidade foi maior.
Para este problema, as comparações comentadas evidenciam que os
controladores obtidos a partir da degradação do traço de G θ−1 possuem características
0
superiores segundo os critérios analisados.
As Figuras 4.11 a 4.36 mostram os diagramas de sensibilidade, as regiões de
estabilidade e as hiperesferas percentuais para o sistema em estudo com os
controladores da Tabela 4.7. Nos diagramas de sensibilidade encontram-se ilustrados
os pólos de MF do sistema perturbado com raios percentuais de 10% (vermelho) e
40% (azul). Vale observar que os controladores que possuem raio da hiperesfera
percentual, de acordo com as Tabelas 4.8 e 4.9, inferiores a 40%, obviamente deverão
ter a curva de perturbação azul cruzando a fronteira do círculo unitário (plano z). Nas
figuras que ilustram as regiões de estabilidade, os pontos de cor azul claro no domínio
paramétrico indicam que o sistema é estável nestas posições, a cruz mostra a posição
do vetor paramétrico nominal e a circunferência ilustra graficamente a hiperesfera no
ℜ2 , cujo raio foi divulgado nas Tabelas 4.8 e 4.9. Além disso, como as variações
percentuais das massas 1 e 4 são iguais (-80% a 200% do valor nominal)
e
correspondem a mesma dimensão física, a hiperesfera sempre será uma circunferência.
59
TABELA 4.8: Características dos controladores obtidos a partir da síntese PRCBI e
pela liberação do custo de robustez ótimo.
Número
do Ctrl.
4.11
4.12
4.13
4.14
4.15
4.16
4.17
4.18
4.19
4.20
(7)
Limite do Custo
de Robustez
ótimo (%)
0
5
10
20
30
50
100
200
300
500
Valor do
Traço de G θ−10
2.60409005 (7)
2.73427910
2.86448520
3.12488989
3.38531696
3.90602889
5.20789785
7.80841917
10.41631737
15.62425935
Custo de
Desempenho
J DESEMP
991.790962
538.287546
327.698673
151.882485
118.411605
95.913688
70.375903
46.597650
39.643464
35.988292
Raio da
Hiperesfera
Percentual (%)
59.9609
59.5703
40.0586
26.3867
29.8633
30.5078
41.7188
38.1445
34.7656
24.6484
- Custo de robustez ótimo, obtido através da técnica PRCBI.
TABELA 4.9: Características dos controladores obtidos a partir da liberação
do custo de Desempenho ótimo, otimizando-se o traço de G θ−1 .
0
Número
do Ctrl.
4.23
4.21
4.22
Limite (%) do
Desempenho
Nominal ótimo
0
12.36
23.77
Custo de
Desempenho
J DESEMP
32.02968266 (8)
35.98851006
39.64290839
Valor do
Traço de G θ−10
45.5105208
18.0900845
13.2905033
Raio da
Hiperesfera
Percentual (%)
14.0234
24.5117
29.3164
(8) - Custo de Desempenho ótimo obtido através de um sistema com estimador
corrente de estados, utilizando Filtro de Kalman e ponderando os estados e a entrada
através das seguintes matrizes Q1 =I 8 e Q2 =1.
60
FIGURA 4.11: Diagrama de Sensibilidade com o controlador 4.11.
FIGURA 4.12: Região de estabilidade e Hiperesfera percentual com
o controlador 4.11.
61
FIGURA 4.13: Diagrama de Sensibilidade com o controlador 4.12.
FIGURA 4.14: Região de estabilidade e Hiperesfera percentual com
o controlador 4.12.
62
FIGURA 4.15: Diagrama de Sensibilidade com o controlador 4.13.
FIGURA 4.16: Região de estabilidade e Hiperesfera percentual com
o controlador 4.13.
63
FIGURA 4.17: Diagrama de Sensibilidade com o controlador 4.14.
FIGURA 4.18: Região de estabilidade e Hiperesfera percentual com
o controlador 4.14.
64
FIGURA 4.19: Diagrama de Sensibilidade com o controlador 4.15.
FIGURA 4.20: Região de estabilidade e Hiperesfera percentual com
o controlador 4.15.
65
FIGURA 4.21: Diagrama de Sensibilidade com o controlador 4.16.
FIGURA 4.22: Região de estabilidade e Hiperesfera percentual com
o controlador 4.16.
66
FIGURA 4.23: Diagrama de Sensibilidade com o controlador 4.17.
FIGURA 4.24: Região de estabilidade e Hiperesfera percentual com
o controlador 4.17.
67
FIGURA 4.25: Diagrama de Sensibilidade com o controlador 4.18.
FIGURA 4.26: Região de estabilidade e Hiperesfera percentual com
o controlador 4.18.
68
FIGURA 4.27: Diagrama de Sensibilidade com o controlador 4.19.
FIGURA 4.28: Região de estabilidade e Hiperesfera percentual com
o controlador 4.19.
69
FIGURA 4.29: Diagrama de Sensibilidade com o controlador 4.20.
FIGURA 4.30: Região de estabilidade e Hiperesfera percentual com
o controlador 4.20.
70
FIGURA 4.31: Diagrama de Sensibilidade com o controlador 4.23.
FIGURA 4.32: Região de estabilidade e Hiperesfera percentual com
o controlador 4.23.
71
FIGURA 4.33: Diagrama de Sensibilidade com o controlador 4.21.
FIGURA 4.34: Região de estabilidade e Hiperesfera percentual com
o controlador 4.21.
72
FIGURA 4.35: Diagrama de Sensibilidade com o controlador 4.22.
FIGURA 4.36: Região de estabilidade e Hiperesfera percentual com
o controlador 4.22.
73
Analogamente aos diagramas de sensibilidade do problema anterior, a medida
que o traço de G θ−1 aumenta, as pequenas ilhas fundem-se formando uma curva que
0
engloba uma grande região, representando um grande aumento da sensibilidade dos
pólos de MF ao perturbar o sistema parametricamente.
Analisando os resultados obtidos pelas tabelas e figuras citadas, pode-se
concluir em linhas gerais, que a minimização do traço de G θ−1 leva a uma
0
dessensibilização dos pólos de MF do sistema, além de aumentar a região de
estabilidade e o raio da hiperesfera percentual. Entretanto, observa-se que a
minimização de tal critério leva, no caso do sistema massa-mola, a deterioração do
desempenho devido a alocação de pólos de MF totalmente insensíveis, mas muito
próximos ao ponto (1,0) do plano z.
Os controladores híbridos calculados parecem atender as necessidades de
desempenho e robustez desejáveis no sistema estudado.
O desempenho dos controladores é avaliado por 150 períodos através da
energia de seus estados e entrada após o fechamento da malha em k=51 (t=5.1s), tendo
o sistema recebido como excitação um impulso unitário em sua entrada em k=0. Para
1 ≤ k ≤ 50 o sistema evolui livremente (malha aberta). A Expressão (4.19) mostra
como é avaliado o custo de desempenho.
J Desemp =
200
∑ (x Q x
k = 51
T
k
1
k
+ u Tk Q 2 u k )
(4.19)
onde para 51 ≤ k ≤ 200 , x k deve ser calculado pela Equação (3.7) e u k = − K C x$ k / k .
4.3.2 - Robustecimento a Variação de 4 Massas
A principal diferença deste problema para o anterior está na dimensão do vetor
de parâmetros sensíveis. Neste caso, este vetor possui ordem 4, o que acarreta a
impossibilidade de representar graficamente a hiperesfera de estabilidade, a exemplo
do item anterior. O diagrama físico da planta é semelhante ao da Figura 4.10, a menos
74
dos valores nominais das massas e encontra-se ilustrado na Figura 4.37. As equações
de estado são as apresentadas em (4.13) a (4.17).
FIGURA 4.37: Diagrama físico do sistema analisado.
4.3.2.1 - Constantes e Considerações Adotadas
a) Matriz covariância de entrada de ruídos na planta: Q=0.01;
b) Matriz covariância do ruído do sensor de medidas de saída da planta: R=0.0001;
c) Período de amostragem considerado na discretização: T=0.25 seg;
d) Método de otimização utilizado: Powell;
e) Valores nominais adotados nas massas: m1N = m2 N = m3N = m4 N = 1. 0 Kg;
f) Constante elástica das molas: k = 0.145 N/m;
g) Constante de amortecimento: b = 0.04875 N.s/m;
h) Considerou-se que D= Γ , isto é, o ruído entra na planta através dos atuadores;
i) O desempenho do sistema malha fechada é avaliado por estimador corrente de
estados;
j) O sistema será robustecido em relação a variação das massas.
4.3.2.2 - Vetor de Parâmetros Sensíveis
Como citado acima, as massas da planta serão os parâmetros sensíveis, e
conseqüentemente o controlador robusto deverá tornar, entre outros critérios, o
sistema insensível a variações das massas. Assim:
75
. 
 m1 
 m1N  10


m 
 m  10
.
θ0 =  2 N  =   e θ =  2 
10
.
 m3 
 m3N   
 m4 
 m4 N  10
. 
(4.20)
4.3.2.3 - Resultados Obtidos
As Tabelas 4.11 e 4.12 mostram as características dos controladores numerados
na Tabela 4.10.
TABELA 4.10: Controladores obtidos através da síntese PRCBI, por métodos de
otimização utilizando critérios híbridos e por meio analítico.
NO
C O N T R O L A D O R (K C )
4.24
[2.909953 7.973019 -1.684919
-0.160940
[4.080548 6.816629 -2.159006
1.400809
[3.825548 3.436629 -2.188643
1.549968
[1.570331 3.526856 -0.628789
0.235109
[1.620331 4.336903 -0.503629
0.385749
[1.114621 1.704016 0.204799
0.106795
4.25
4.26
4.27
4.28
4.29
0.871488
0.579147]
3.903083
3.660742]
6.183083
4.483867]
0.139279
0.778424]
1.362646
1.280986]
2.550429
2.621865]
-1.063487 -5.501394
-0.792975 -2.419798
-0.713825 0.866452
-1.043883 0.253709
-0.731969 0.584728
0.135705
2.665679
TABELA 4.11: Características dos controladores obtidos pela síntese PRCBI
e pela liberação do custo de robustez ótimo.
No.
Ctrl
4.24
4.25
4.26
(9)
Limite do Custo
de Robustez
ótimo (%)
0
30
100
Valor do
Traço de G θ−10
0.21564588 (9)
0.28028729
0.43128482
Custo de
Desempenho
J DESEMP
1854.675536
181.719570
138.081073
- Custo de robustez ótimo, obtido através da síntese PRCBI.
76
Raio da
Hiperesfera
Percentual (%)
62.0313
44.8438
38.7500
TABELA 4.12: Características dos controladores obtidos por métodos
de otimização e por meio analítico (LQR).
No.
Ctrl
4.29
4.27
4.28
Limite (%) do
Módulo
Máximo pólos
0
1
1 (+7% Traço)
Custo de
Desempenho
J DESEMP
124.247549 (10)
690.276633
192.654214
Valor do
Traço de G θ−10
2.01729169
0.26647546
0.28509928
Raio da
Hiperesfera
Percentual (%)
12.03125
52.50000
49.53125
(10) - Custo de desempenho ótimo obtido através de um sistema com estimador de
estados, utilizando FK e ponderando os estados e a entrada através das seguintes
matrizes Q1 =I 8 e Q2 =1.
O controlador 4.27 foi obtido a partir da otimização do traço de G θ−1 , liberando0
se 1% do módulo máximo dos pólos de MF obtidos com o controlador 4.29, cujo
desempenho é ótimo (LQR) considerando-se as matrizes de ponderação dos estados
Q1 = I 8 e da entrada Q2 =1.
O controlador 4.28 foi obtido a partir da otimização do critério de desempenho,
liberando-se 1% do módulo máximo dos pólos de MF obtidos com o controlador 4.29
e 7% do traço obtido pelo controlador 4.27.
As Figuras 4.38 a 4.49 apresentam os diagramas de sensibilidade e as curvas
envoltórias temporais do sistema massa-mola 8 estados com os controladores
numerados na Tabela 4.10. Neste problema, como o vetor de parâmetros sensíveis é de
quarta ordem, torna-se impossível a representação gráfica da região de estabilidade e
da hiperesfera percentual, tal como foi realizada no problema anterior. Deve-se
observar que as curvas formando ilhas nos diagramas de sensibilidade do problema
anterior transformam-se em áreas por onde transitaram os pólos de MF do sistema
perturbado. As regiões vermelhas representam perturbações de raio percentual de
10%, enquanto que as de cor azul representam de 40%.
Nas figuras com envoltórias temporais, a curva preta representa o módulo da
saída nominal. As curvas vermelhas representam a envoltória de todas as saídas
possíveis, considerando o sistema perturbado com raio percentual de 10%. As curvas
77
de cor azul são análogas às vermelhas, mas com raio percentual de perturbação de
40%. Nos controladores 4.26 e 4.29 não foram apresentadas as curvas de cor azul, pois
o raio da hiperesfera percentual é menor que 40%. Assim ao perturbar o sistema em
várias direções paramétricas com raio de 40%, o sistema acabaria se tornando instável
e conseqëntemente inviabilizaria a intenção de representar a envoltória.
De maneira geral, os comentários realizados a respeito do traço de G θ−1 , raio de
0
hiperesfera percentual e do desempenho no problema anterior continuam válidos para
este problema.
78
FIGURA 4.38: Diagrama de Sensibilidade com o controlador 4.24.
FIGURA 4.39: Evolução temporal do módulo da saída nominal e envoltória da saída
perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.24.
79
FIGURA 4.40: Diagrama de Sensibilidade com o controlador 4.25.
FIGURA 4.41: Evolução temporal do módulo da saída nominal e da envoltória da
saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.25.
80
FIGURA 4.42: Diagrama de Sensibilidade com o controlador 4.26.
FIGURA 4.43: Evolução temporal do módulo da saída nominal e da envoltória da
saída perturbada em 10% (curva vermelha) com o controlador 4.26.
81
FIGURA 4.44: Diagrama de Sensibilidade com o controlador 4.29.
FIGURA 4.45: Evolução temporal do módulo da saída nominal e da envoltória da
saída perturbada em 10% (curva vermelha) com o controlador 4.29.
82
FIGURA 4.46: Diagrama de Sensibilidade com o controlador 4.27.
FIGURA 4.47: Evolução temporal do módulo da saída nominal e da envoltória da
saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.27.
83
FIGURA 4.48: Diagrama de Sensibilidade com o controlador 4.28.
FIGURA 4.49: Evolução temporal do módulo da saída nominal e da envoltória da
saída perturbada em 10% (curva vermelha) e 40% (curva azul) com o ctrl 4.28.
84
CAPÍTULO 5
O PROBLEMA DO HELICÓPTERO
5.1 - INTRODUÇÃO
Neste capítulo propõe-se um problema envolvendo o robustecimento
paramétrico de um sistema MIMO. O modelo utilizado é o de um helicóptero,
empregado em recente trabalho da área de controle robusto (SAMBLANCAT, 1991).
Como a fonte de consulta original encontrava-se em francês, preferiu-se manter alguns
termos no idioma de origem. Ainda assim, tais termos foram relacionados com os
equivalentes em outras idiomas através da Tabela 5.1.
As explicações a seguir apresentadas sobre os comandos e funcionamento do
helicóptero têm por finalidade apenas ilustrar o modelo matemático a ser estudado,
justificando-se deste modo as simplificações por ventura existentes.
TABELA 5.1: Correspondência entre termos.
Correspondência entre os termos referentes
aos movimentos do helicóptero
Francês
Inglês
Português
Tangage
Pitch
Caturro
Roulis
Roll
Balanço
Lacet
Heading
Rumo
5.1.1 - Os Movimentos do Helicóptero
A Tabela 5.2 apresenta os movimentos de translação e rotação do helicóptero.
Na Figura 5.1 encontram-se ilustrados os eixos de referência ligados ao helicóptero.
Consideram-se positivos os movimentos no sentido do referencial apresentado. O
movimento longitudinal é aquele que ocorre quando o aparelho se desloca para frente
mantendo a altitude constante (eixo OX). O movimento lateral é o que ocorre sobre o
85
eixo OY, isto é, o aparelho se desloca para a direita ou esquerda do piloto. O
movimento normal ou vertical é o do eixo OZ.
Quanto aos movimentos de rotação pode-se dizer que o de tangage é aquele em
que a frente do helicóptero inclina-se para cima ou para baixo, sendo positivo quando
gira-se o eixo OZ para OX de acordo com a Figura 5.1. O movimento de roulis é o
visto por um observador externo de frente para o aparelho, quando este gira no sentido
horário ou anti-horário, sendo positivo no sentido de OY para OZ. Finalmente o lacet
ocorre quando o helicóptero gira no plano horizontal, sendo positivo no sentido de OX
para OY.
TABELA 5.2: Os movimentos do helicóptero.
Movimentos do Helicóptero
de Translação:
de Rotação:
Longitudinal
Tangage
Normal (vertical)
Roulis
Lateral
Lacet
(Vista lateral)
(Vista de frente)
(Vista de cima)
FIGURA 5.1: Referência utilizada pelo helicóptero.
86
5.1.2 - O Vôo do Helicóptero
A fim de simplificar a análise do vôo do helicóptero, considera-se que o eixo do
rotor principal passa pelo centro de gravidade (G) do aparelho. Em vôo, o helicóptero
está sujeito a três forças principais, isto é:
r
- Seu peso P , aplicado sobre o ponto G.
r
- A força FN , gerada pelo rotor principal.
r
- Fx provocada no vôo de translação pela resistência do ar sobre a estrutura do
aparelho. Supõe-se por motivos de simplificação que esta força também estará
aplicada sobre o centro de gravidade G.
A Figura 5.2 ilustra as forças aplicadas sobre o helicóptero em vôo. Para que o
r
r r
helicóptero esteja em equilíbrio, torna-se necessário que a resultante R entre P e Fx
r
seja igual e oposta a FN . Sendo nula a resultante total das forças, o vôo do helicóptero
estabiliza-se. Neste caso, o aparelho estará imóvel ou em translação (movimento
r
retilíneo uniforme). Alterações em direção ou em intensidade de FN resultará na
quebra do equilíbrio supra-citado, alterando o movimento por ventura existente. A
r
intensidade de FN varia em função da potência do rotor principal.
Para pilotar o helicóptero, o piloto dispõe do manche de pás coletivas e do
manche de pás cíclicas e ainda dos pedais de lacet, cujo funcionamento será descrito
adiante.
87
FIGURA 5.2: As forças aplicadas sobre o helicóptero em vôo.
5.1.3 - O Vôo Estacionário (teórico)
Em vôo estacionário, caso o vento seja nulo, as únicas forças aplicadas ao
r
aparelho seriam o peso e a força de sustentação gerada pelo rotor principal FN . Como
o helicóptero encontra-se em vôo estacionário, a resultante destas forças será nula. A
Figura 5.3 ilustra o helicóptero em vôo estacionário.
Manche de pás
cíclicas na posição neutro
FIGURA 5.3: O vôo estacionário.
88
5.1.4 - O Vôo Vertical (ascendente ou descendente)
O vôo vertical é obtido, a partir do vôo estacionário, com o acionamento do
manche de pás coletivas. De maneira simplificada pode-se dizer que um aumento do
passo das pás estará associado a um aumento da potência do rotor no sentido de
manter constante a velocidade de rotação do mesmo. Assim um deslocamento do
manche de pás coletivas tendente a aproximá-lo do piloto provoca um aumento
gradual do passo das pás do rotor principal e também um aumento da potência do
r
mesmo rotor. Deste modo, a força de sustentação gerada pelo rotor FN torna-se
r
r
superior a P , impondo conseqüentemente uma velocidade normal (vertical) v z
ascendente ao helicóptero. O contrário ocorrerá, caso o manche de pás coletivas seja
empurrado pelo piloto no sentido de afastá-lo , isto é, o passo das pás do rotor
r
principal diminuirá, provocando uma diminuição em intensidade de FN , rompendo o
equilíbrio e gerando uma resultante na mesma direção e sentido do peso. Assim o
aparelho adquirirá uma velocidade normal descendente. A Figura 5.4 mostra o vôo
ascendente e descendente do helicóptero.
5.1.5 - O Vôo de Translação (longitudinal e lateral)
O vôo de translação é obtido, a partir do vôo estacionário, com o acionamento
do manche de pás cíclicas. O deslocamento deste manche provoca uma inclinação
r
proporcional e na mesma direção do eixo do rotor principal. A força FN se decompõe
r
r
então em duas, ou seja, Fh que assegura um movimento longitudinal ou lateral e Fs que
mantém a sustentação do aparelho. A Figura 5.5 apresenta o vôo de translação
longitudinal e lateral.
89
FIGURA 5.4: O vôo ascendente e descendente.
FIGURA 5.5: Vôo de translação longitudinal e lateral.
5.1.6 - A Finalidade do Rotor Traseiro
Com o helicóptero em vôo estacionário, pode-se dizer que o rotor principal está
gerando um torque sobre seu eixo fazendo girá-lo. Este torque, representado por um
conjugado, provocaria pela terceira lei de Newton uma reação igual em módulo, mas
em sentido oposto sobre a cabine do helicóptero. Deste modo, enquanto as pás
90
girariam num determinado sentido, a cabine teria o mesmo movimento em sentido
oposto. Assim, surge a necessidade do rotor traseiro gerar uma força, provocando um
torque contrário sobre a cabine de modo a estabilizá-la.
Em termos de torques a cabine estaria estabilizada, mas agora o rotor traseiro
estaria gerando uma força no plano horizontal, o que certamente provocaria uma
deriva lateral do aparelho. A fim de sanar tal problema, inclina-se levemente o rotor
principal para o lado, gerando uma força em sentido contrário àquela do rotor traseiro,
de maneira que a resultante no plano horizontal seja nula. A Figura 5.6 ilustra as
explicações citadas acima.
FIGURA 5.6: O rotor traseiro.
5.1.7 - O Movimento de Lacet
A partir do vôo estacionário, o lacet é obtido com o acionamento de um dos
dois pedais. Este comando cria uma variação de potência do rotor traseiro, e por
consequência um movimento de rotação no plano horizontal da cabine em torno de seu
centro de gravidade.
91
5.1.8 - Exemplos de Movimentos Acoplados
Neste item descreve-se algumas das características do comportamento do
helicóptero, permitindo avaliar a dificuldade de pilotar o aparelho e obter movimentos
precisos. Alguns exemplos de movimentos acoplados são:
- Acoplamento entre o movimento de Lacet e o movimento Lateral: Quando um
comando de lacet é aplicado, o equilíbrio das forças provocadas pelo rotor traseiro e
pela inclinação do rotor principal é rompido. Assim o aparelho adquire uma
velocidade lateral.
- Acoplamento entre o movimento Normal e o movimento Roulis/Tangage: Para
adquirir um movimento de translação longitudinal ou lateral, um comando de pás
cíclicas deverá ser aplicado, inclinando o rotor para frente (tangage) ou para o lado
(roulis). Esta inclinação provoca uma diminuição da componente de sustentação,
gerando uma velocidade normal.
- Acoplamento entre o movimento Normal e o movimento de Lacet: Para aumentar a
velocidade normal, aumenta-se o passo das pás coletivas, isto é, a incidência das pás
do rotor principal e conseqüentemente a potência do rotor. Este aumento do torque do
rotor principal provocará o rompimento do equilíbrio dos torques com o rotor traseiro,
conseqüentemente gerando um movimento de lacet.
Após estes três exemplos torna-se claro a existência no helicóptero de fortes
acoplamentos de movimentos.
92
5.2 - O MODELO MATEMÁTICO DISPONÍVEL
A partir de determinados ensaios e cálculos teóricos foi possível obter um
modelo não linear para o helicóptero, restrito a determinadas condições de vôo. Este
modelo foi então linearizado para as velocidades longitudinais de 0 até 300 Km/h, de
50 em 50 Km/h. Na linearização destes sete modelos foi considerado que o helicóptero
encontrava-se estabilizado em determinada altitude, sujeitando-se a pequenos
movimentos em torno destas velocidades longitudinais. Os modelos são multivariáveis
com 8 estados, 3 entradas e 5 saídas, conforme será descrito a seguir. A Figura 5.7
mostra uma representação dos modelos linearizados disponíveis, fornecidos pelo
CERT (Centre d'Etudes et Recherches de Toulouse - França).
MODELOS DISPONÍVEIS
Velocidades Longitudinais (Km/h)
0
50
100
v1
v2
v3
150
200
250
300
v4
v5
v6
v7
FIGURA 5.7: Representação dos modelos disponíveis linearizados nas velocidades
apresentadas.
O modelos supra-citados encontram-se sob a forma de equações de estado da
maneira seguinte:
x& ( t ) = A. x( t ) + B. u( t )
(5.1)
onde A e B dependem da velocidade longitudinal. Os estados do modelo são os
descritos na Tabela 5.3 e as entradas u( t ) encontram-se na Tabela 5.4.
93
TABELA 5.3: Dados referentes aos estados do modelo.
ESTADO
x1
x2
x3
x4
x5
x6
x7
x8
SÍMBOLO
u
vz
q
θ
v
p
r
φ
DESCRIÇÃO
Velocidade Longitudinal
Velocidade Vertical
Velocidade de Tangage
Ângulo de Tangage
Velocidade Lateral
Velocidade de Roulis
Lacet
Ângulo de Roulis
UNIDADE
m/s
m/s
graus/s
graus
m/s
graus/s
graus/s
graus
TABELA 5.4: Dados referentes às entradas do modelo.
ENTRADA
u1
u2
u3
SÍMBOLO
DESCRIÇÃO
Pás Cíclica Longitudinal
Pás Cíclica Lateral
Pás Rotor Traseiro
θ2
θ1
θr
UNIDADE
graus
graus
graus
Os modelos disponíveis possuem como saída os seguintes estados: q, θ , p, r e
φ . Portanto a matriz C de saída da planta será dada por:
0
0

C = 0
0

0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0

0
0

1
(5.2)
5.3 - O PROBLEMA ORIGINAL E O PROPOSTO
As noções introduzidas no início do capítulo colocam em evidência a
complexidade do funcionamento do helicóptero e a grande carga de trabalho a que
94
sujeita-se o piloto. A elaboração de uma lei de controle que diminua o trabalho do
piloto é um problema complexo que apresenta um interesse evidente.
O desacoplamento dos diferentes movimentos do helicóptero é um dos
objetivos do controle. Os movimentos que devem ser desacoplados são os seguintes:
a) Movimento longitudinal, relativo às variáveis: u q θ
b) Movimento lateral, relativo às variáveis: v p φ
c) Movimento de lacet, relativo à variável: r
O problema original, cujo diagrama encontra-se na Figura 5.8, consiste em
projetar um controlador robusto K(s) e um filtro W(s) através da síntese H ∞ ,
atendendo a determinadas especificações impostas em (SAMBLANCAT, 1991) e
adicionalmente permitindo os desacoplamentos de movimentos a seguir comentados.
Nesta figura, G(s) representa o helicóptero. O sistema possui três entradas de
referência possíveis, ilustradas na Tabela 5.5, correspondentes a manobras prédeterminadas do helicóptero. A primeira deverá habilitar o aparelho a realizar
alterações em seu movimento longitudinal, desacoplando os movimentos laterais e de
lacet. A segunda entrada promoverá um efeito análogo ao da primeira, isto é, realizará
um movimento lateral desacoplando os movimentos longitudinal e de lacet. A terceira
permitirá um movimento de lacet.
Não deve ser esquecido que os modelos utilizados foram linearizados em torno
de seus respectivos pontos de operação, conseqüentemente qualquer variação dos
estados do modelo equivale a adicionar ou subtrair esta variação aos valores reais
apresentados pela planta. Além disso, os modelos representam o helicóptero
estabilizado em determinada altitude, deslocando-se para frente nas velocidades
longitudinais especificadas.
Ao acionar a primeira entrada de referência fazendo no caso θ ref = −1, esperase que o estado θ siga a referência, diminuindo seu valor atual de um grau,
acarretando esta inclinação adicional da frente do helicóptero para baixo. O aumento
da inclinação citada provocará um aumento da força resultante na direção longitudinal
95
e portanto a velocidade longitudinal do helicóptero aumentará. Espera-se que este
aumento ocorra a uma taxa constante. Em (SAMBLANCAT, 1991), utilizou-se
θ ref = 1 observando-se conseqüentemente uma diminuição da velocidade longitudinal,
isto é, uma frenagem do aparelho. As demais entradas de referência deverão produzir
efeitos semelhantes aos citados acima e encontram-se resumidos na Tabela 5.6. Os
objetivos de desempenho atingidos em (SAMBLANCAT, 1991) serão perseguidos no
problema proposto.
0
θ1
θ2
θr
+
K(s)
q
θ
θ ref
0
p
rref
r
φ
φ ref
+
G(s)
W(s)
Sinal de erro
FIGURA 5.8: Diagrama do problema original H ∞ .
TABELA 5.5: Entradas de referência.
 θ  −1
Z01 =  r  =  0 
   
φ   0 
 θ   0
   
Z02 = r = 1
   
φ   0 
 θ   0
   
Z03 = r = 0
   
φ   1 
MANOBRA 1
MANOBRA 2
MANOBRA 3
96
TABELA 5.6: Efeitos das manobras do helicóptero.
MANOBRA
1
2
3
Estado
seguidor da
referência
θ
r
φ
Estado que
evoluirá com
taxa constante
u
v
v
Estados regulados
(convergentes para
zero)
vz q v p r φ
u vz q θ p φ
u vz q θ p r
O objetivo do problema proposto será calcular um controlador robusto, através
da síntese PRCBI, mas que também possua as características de desempenho
apresentadas pelo problema original, ou seja, que possa realizar as manobras
resumidas pela Tabela 5.6, ao alimentar o sistema com as entradas de referência
citadas. O diagrama do problema proposto encontra-se na Figura 5.9. Com a síntese
PRCBI, torna-se imprescindível a inclusão da planta na estrutura LQG. Além disso,
para que o sistema possa seguir as entradas de referência, um "bloco compensador"
deverá ser inserido na estrutura LQG, conforme apresentado no Item 3.4. O bloco
compensador poderá ser calculado através da fórmula (3.14) que encontra-se a seguir
reproduzida:
[
]
u0 ' = C' ( I − Φ + ΓKC ) Γ
−1
−1
Z0 = H −f 1(1) Z0
[3.14]
Deve-se observar que C' não necessariamente será a matriz de saída da planta,
conforme (5.2). A matriz C' de (3.14) é aquela que permite gerar as saídas seguidoras
das referências. Portanto:
 0 0 0 1 0 0 0 0


C' = 0 0 0 0 0 0 1 0


 0 0 0 0 0 0 0 1
97
(5.3)
Z0
BLOCO
COMPENSADOR
ξk
D
ηk
+
+
−
PLANTA
HELICÓPTERO
C
+
Φ Γ
Y(k)
FILTRO DE
KALMAN
KC
Φ0
Γ0
FIGURA 5.9: Diagrama do problema proposto.
A robustez exigida será observada quando a planta tiver seu modelo modificado
para as diversas velocidades longitudinais, esperando-se manter o desempenho do
sistema com o controlador robusto calculado para a velocidade definida nominal. Para
todos os efeitos será considerado como nominal o modelo de 200 Km/h, ou seja, para
este modelo os diversos parâmetros sensíveis assumirão seus valores nominais. Este
modelo também será inserido no Filtro de Kalman durante os diversos cálculos e
simulações.
Em princípio, a filosofia adotada para resolver o problema será a mesma do
sistema massa-mola, mas inicialmente procurar-se-á obter através da minimização de
um critério de desempenho, um controlador que consiga realizar as manobras
definidas pelas Tabelas 5.5 e 5.6. Este controlador será denominado de controlador de
desempenho ótimo. A bem da verdade, o critério de desempenho citado é composto
por três funções objetivo, que representam as manobras exigidas, fazendo-se portanto
necessário o uso da Técnica das Liberações (Item 4.1.3). Após isto, as atenções serão
voltadas no sentido de obter controladores híbridos que mantenham o desempenho
adquirido, mas também levem em conta a robustez do sistema a variações
98
paramétricas. A fim de evitar surpresas mais adiante, registra-se aqui que a Técnica
das Liberações será aperfeiçoada no Item 5.5.
5.4 - CRITÉRIO ADOTADO COMO DESEMPENHO ÓTIMO
O critério apresentado a seguir foi adotado para a manobra 1. Para as demais
manobras deve-se alterar esta rotina de acordo com os efeitos divulgados na Tabela
5.6. Este critério proposto foi fruto da observação dos resultados ao longo de várias
tentativas, tendo por objetivo o desempenho alcançado com o controlador H ∞
(SAMBLANCAT, 1991). O custo total de desempenho a ser minimizado consiste na
soma dos custos de três fases. Na primeira fase, composta pelos dez primeiros
períodos de evolução, enfatiza-se o transitório das entradas da planta. Além disso, a
entrada de referência final somente é alcançada no décimo período de amostragem,
sendo formada por uma sucessão de degraus com amplitudes iguais a 1/10 da
amplitude final. O período de amostragem adotado para discretização dos modelos do
helicóptero foi T = 0.01 segundos. A Figura 5.10 mostra a formulação para o cálculo
do custo da fase 1. Deve-se observar que a evolução dos estados da planta é realizado
de acordo com uma variação de (3.2), apresentada através de (5.4).
 x k +1   Φ
 x$
 =  K CΦ
F
k +1/ k +1 
−ΓKC
 x k 
( I − K FC0 )(Φ0 − Γ0KC ) − KFCΓKC  x$ k / k  +
Γ
−1
+   C' ( I − Φ0 + Γ0 KC ) Γ0
 Γ0 
[
]
−1
Z0
(5.4)
Note ainda que nesta fase de otimização do desempenho considera-se que:
Φ = Φ 0 , Γ = Γ0 e C = C0
(5.5)
Além disso, os ruídos ξ k e ηk mostrados na Figura 5.9, foram desconsiderados
e portanto retirados de (5.4).
99
A Figura 5.11 ilustra a formulação da fase 2, onde aumenta-se a importância
dos erros dos estados relativamente aos transitórios das entradas, uma vez que as
entradas já começam a se estabilizar. A fase 2 possui uma duração de 0.2 s, sendo
observados os períodos de 11 a 30.
A Figura 5.12 apresenta a formulação da fase 3. Nesta fase despreza-se os
transitórios das entradas, pois estas já estão estabilizadas e aumenta-se a ênfase sobre
os estados seguidores, através da matriz de ponderação Q p . A fase 3 dura 7.7
segundos, sendo bem maior que as anteriores. Isto acarretará uma compensação no
cálculo do custo final.
A Figura 5.13 mostra como foi calculado o custo final de desempenho para a
manobra 1 e por analogia para as outras. As fases 1 e 2 tiveram um peso dobrado em
relação a fase 3 pois esta última possui um ciclo de duração bem superior às anteriores
(k=31 até 800). Além dos custos das fases 1, 2 e 3, foi penalizado o erro estacionário
dos estados seguidores, isto é, a diferença entre seus valores e respectivas referências.
No caso da manobra 1 levou-se em conta para efeito de erro estacionário o estado v
(vel. lateral), já que este possuia uma tendência de não convergir para zero. Nas
manobras 2 e 3, o vetor de erro estacionário não poderá conter este estado, pois o
mesmo evoluirá a uma taxa constante.
Neste item foi estabelecido um critério ou, em termos de otimização, uma
função objetivo a ser atingida pelo controlador calculado. Mas em termos de
desempenho, não basta somente que o controlador atenda este critério, o que
permitiria somente a realização da manobra 1. Deste modo, surge a necessidade de
compor três critérios análogos, porém diferentes, de modo a permitir a realização das
três manobras propostas. Isto será realizado através da técnica das liberações
realimentadas, comentada no próximo item. Esta técnica permitirá posteriormente a
incorporação de uma função objetivo relativo a robustez paramétrica do sistema,
obtendo-se então um controlador híbrido, tal como foi feito no Capítulo 4.
100
MANOBRA 1 - FASE 1
Para k = 1 até 10
 − 10k 
Z0 =  0  --------------------------------------- Entrada de Referência.


 0 
∆U k = 8.( u( k ) − u( k − 1)) ------------------------ Variação das Entradas.
∆X k = x k (2:8) T − ( 0 0 −1 0 0 0 0) ----- Erro dos Estados.
10
J 11 = ∑ ( ∆ X k . I 7 . ∆ X Tk + ∆ U Tk . I 3 . ∆ U k ) ----------- Custo da FASE 1.
k =1
FIGURA 5.10: Cálculo do custo da fase 1 de desempenho - Manobra 1.
MANOBRA 1 - FASE 2
Para k = 11 até 30
 −1
Z0 =  0  ------------------------------------------ Entrada de Referência.
 
0
∆U k = 4.( u( k ) − u( k − 1)) ------------------------ Variação das Entradas.
∆X k = x k (2:8) T − ( 0 0 −1 0 0 0 0) ----- Erro dos Estados.
J 12 =
30
∑ ( ∆ X k . I 7 . ∆ XTk + ∆ UTk . I 3 . ∆ U k ) ----------- Custo da FASE 2.
k =11
FIGURA 5.11: Cálculo do custo da fase 2 de desempenho - Manobra 1.
101
MANOBRA 1 - FASE 3
Para k = 31 até 800
 −1
Z0 =  0  ------------------------------------------ Entrada de Referência.
 
0
Q P = diag(1 1 4 1 1 4 4) ---------------- Matriz de Ponderação.
∆X k = x k (2:8) T − ( 0 0 −1 0 0 0 0) ----- Erro dos Estados.
J 13 =
800
∑ ( ∆ X k . Q P . ∆ XTk ) --------------------------- Custo da FASE 3.
k = 31
FIGURA 5.12: Cálculo do custo da fase 3 de desempenho - Manobra 1.
CUSTO FINAL DE DESEMPENHO - MANOBRA 1
E ( k =800)
 x4   −1
x   0 
5
=   −   ----------------------------- Erro Estacionário.
 x7   0 
 x8   0 
J DES = 2.( J 11 + J 12 ) + J 13 + 50.( E T . I 4 . E ) ------------ Custo Final.
FIGURA 5.13: Cálculo do custo final de desempenho - Manobra 1.
102
5.5 - A TÉCNICA DAS LIBERAÇÕES REALIMENTADAS
Esta técnica foi desenvolvida com a finalidade de superar as dificuldades
enfrentadas neste problema, já não mais atendido pela técnica comentada no Item
4.1.3.
Ainda que bons resultados tenham sido obtidos para o sistema massa-mola,
através da técnica anterior, observou-se que ao otimizar a segunda função objetivo, na
etapa 2, o custo da primeira função objetivo minimizada era naturalmente levado pelo
processo de otimização para um valor degradado muito próximo da liberação (folga)
permitida. Isto realmente ocorrerá se por exemplo a direção do mínimo da primeira
função objetivo for uma direção de maximização da segunda e vice-versa. Neste caso,
os objetivos serão conciliados conforme as liberações autorizadas.
No entanto, para o problema do helicóptero sentiu-se a necessidade de
minimizar a n-ésima função objetivo, procurando manter os custos mínimos atingidos
nas (n-1) etapas anteriores, ainda que estabelecidas liberações para as funções
objetivos anteriores. Para tanto, desenvolveu-se um artifício simples que penaliza a
degradação dos custos mínimos atingidos e estimula, caso seja possível, uma
minimização adicional das funções objetivo já consideradas. Este novo método foi
denominado de "Técnica das Liberações Realimentadas". A etapa 1 deste algoritmo é
igual a da Figura 4.1. Na Figura 5.14, ilustra-se a segunda etapa deste método, que
corresponde a inclusão da segunda função objetivo. Do mesmo modo que a técnica do
Item 4.1.3, pode-se extrapolar o método para n funções objetivo.
Conforme a Figura 5.14, o método consiste em estabelecer uma folga para o
custo atingido quando da minimização da primeira função objetivo e em seguida,
numa segunda etapa, autorizar uma degradação deste valor no sentido de permitir
agora a otimização de um custo composto incluindo a segunda função objetivo. Na
segunda etapa, independentemente do número de funções objetivo, este custo
composto será dado por:
(
)
J = M1 J 1 − J 1 min + J 2
103
(5.6)
onde J 1 min é o custo mínimo atingido na etapa 1 e M1 é um escalar que será ajustado
durante o processo de minimização de acordo com os valores de J 1 min e J 2 . Deve ficar
claro que em (5.6) as variáveis são J 1 e J 2 , funções diretas das variáveis de projeto X,
isto é:
J 1 = F( X) e J 2 = G( X)
(5.7)
Além disso, o valor de M1 deve ser convenientemente manipulado pelo
projetista. Considere como exemplo a otimização das duas funções objetivo de (5.7),
supondo que ambas possuam a mesma ordem de grandeza em termos de faixa de
valores possíveis, ou seja:
l1 ≤ J 1 ≤ L1 e l 2 ≤ J 2 ≤ L2 , com l1 ≅ l 2 e L1 ≅ L2
(5.8)
onde deseja-se obter X, que minimize ambas as funções, gerando valores de igual
ordem de grandeza para as mesmas. Suponha ainda que J 1 min =10 e que ao encerrar a
( )
primeira etapa tenha sido obtido X1 tal que J 1 min = F X1 . Para este projeto tem-se que
( )
o valor de J 2 = G X1 = 35000 . Deve-se agora observar que a escolha de M1 pelo
projetista terá grande influência sobre a solução final a ser atingida, isto é, se
M1=1000 então ao minimizar J em (5.6), uma unidade degradada no valor de J 1
deverá acarretar uma redução superior a 1000 em J 2 . Isto ocorre pois o processo de
minimização a cada passo reduz o valor do custo J, portanto por (5.6):
J novo = 1000 (11 − 10) + J 2 e J atual = 1000 (10 − 10) + 35000 = 35000
(5.9)
Mas necessariamente,
J novo < J atual
104
(5.10)
Para que (5.9) atenda a (5.10) tem-se que J 2 < 34000, reduzindo esta variável
de um valor superior a 1000. O processo de otimização aceitará esta relação de
compensação de 1:1000 enquanto for mais fácil reduzir J 2 . No entanto chegará um
momento que será mais interessante manter J 2 e tornar a reduzir J 1 , pois esta redução
será multiplicada por M1=1000. Neste momento deve-se cogitar a diminuição do valor
de M1, considerando que J 2 ainda seja bem maior que J 1 .
De um modo geral, se ainda J 1 << J 2 então quanto maior for M1, mais
rapidamente o processo de otimização optará por estabilizar J 2 e continuará a
minimizar J 1 , em muitos casos podendo obter J 1 ≤ J 1 min . Por outro lado se a relação de
compensação não for grande suficiênte, então o processo de otimização poderá
degradar demasiadamente J 1 em função da pequena diminuição de J 2 .
ETAPA 2
INÍCIO
Restrições
Satisfeitas
NÃO
J 1 LIB = k . J1 min
SIM
Verificação das
RESTRIÇÕES
IMPOSTAS
Cálculo de
J1 = F(X)
J 1 ≤ J 1 LIB
NÃO
J = 1000000
SIM
Cálculo de
J 2 = G (X)
Cálculo da
Função Objetivo
J = M1 (J1 − J 1 min) + J 2
FIM
FIGURA 5.14: Fluxograma da etapa 2 da técnica das liberações realimentadas.
105
Finalmente para encerrar este item, será registrada através da Fórmula (5.11) o
custo composto na n-ésima etapa de otimização:
(
)
(
)
(
)
J = M1 J 1 − J 1 min + M 2 J 2 − J 2 min + ... + M n −1 J n −1 − J n −1 min + J n
(5.11)
5.6 - A APLICAÇÃO DO PRCBI
Neste item procura-se mostrar como foi introduzida a robustez no problema do
helicóptero, utilizando a síntese PRCBI. Algumas dificuldades apareceram pois não
estava disponível o modelo teórico literal do helicóptero.
Além de não possuir os parâmetros influentes no problema, também
desconhecia-se como estes interferiam nos diversos modelos linearizados em torno das
várias velocidades longitudinais.
Como idéia inicial, comparou-se através do computador, considerando o
modelo de 200 Km/h como o nominal, os elementos das matrizes Φ e Γ dos diversos
modelos com seus equivalentes nominais, de modo a analisar os termos que mais
variavam segundo critérios estipulados. Estes critérios levavam em conta a variação
percentual em relação ao valor nominal, mas também o valor absoluto do elemento.
Como a matriz Φ possui 64 elementos e a Γ , 24 elementos, perfazendo assim um
total de 88 elementos, optou-se por determinar entre os diversos modelos, os quinze
elementos de maior variação segundo o critério especificado para compor o vetor de
parâmetros sensíveis. No entanto, foi observado que outros elementos também
estavam variando excessivamente e considerando que o tempo de processamento
computacional seria elevado para um vetor paramétrico de quinze elementos,
resolveu-se descartar esta abordagem e utilizar uma nova idéia.
Esta nova idéia adaptou-se bem melhor ao problema proposto. Consiste em
definir um vetor paramétrico fictício, em analogia ao sistema massa-mola, de maneira
que ao perturbar um dos parâmetros em 100%, o modelo perturbado seja o
representado por outra velocidade longitudinal. A Figura 5.15 ilustra esta idéia.
106
Através desta abordagem, todas as variações dos elementos das matrizes Φ e Γ dos
diversos modelos foram consideradas.
No trabalho de (SAMBLANCAT, 1991), pode-se observar através dos gráficos,
que o desempenho do sistema utilizando o controlador robusto H ∞ com os modelos de
150 e 250 Km/h, já encontrava-se bastante degradado. Deste modo, a fim de
simplificar os cálculos, resolveu-se trabalhar somente com os modelos de 100 a 300
Km/h, conforme pode ser visto na Figura 5.15. Segundo a abordagem proposta, o
vetor paramétrico será de quarta ordem.
2 
 1
θ= 
 1
 1
100
 1
2 
θ= 
 1
 1
 1
 1
θ= 
2 
 1
150
250
v5 = 200 Km / h
Modelo Nominal
 1
 1
θ= 
 1
2 
300
1
1
θ0 =  
1
1
FIGURA 5.15: Adaptação da síntese PRCBI para o problema do helicóptero.
Para efeito de cálculo do traço de G θ−1 , obteve-se os modelos perturbados
0
através de interpolação linear entre o modelo nominal e os demais.
107
5.7 - RESULTADOS OBTIDOS
As Tabelas 5.7 e 5.8 apresentam os resultados obtidos a partir do processo de
minimização utilizando o método de Powell, com o critério de desempenho descrito
no Item 5.4 e compondo as várias funções objetivo através da técnica comentada no
Item 5.5.
TABELA 5.7: Controladores calculados no problema do helicóptero.
C O N T RO L A D O R (K C )
No
5.1
5.2
5.3
[-0.0914 -0.5265 -2.1263
-0.0260 0.1606 -0.5425
0.1307 -0.3168 0.4127
[-0.0858 -0.4998 -0.3247
-0.0260 0.1862 -0.2469
0.1307 -0.3312 0.2301
[ 0.5507 0.0936 0.0373
11.1605 9.3088 2.8524
1.7758 -1.9086 -0.1010
-3.1416 0.1109 -2.7422 1.8337 -3.2657
-0.6665 0.1195 -1.2421 0.2978 -1.6382
0.4945 0.4215 0.5353 1.0183 0.6659]
-0.7122 0.0270 -0.0963 -0.3087 -0.1544
-0.1813 0.0898 -0.9938 -0.7165 -1.4550
0.1558 0.4284 0.2498 1.8325 0.2536]
-0.2242 -0.0179 0.0333 -0.5475 -0.4654
1.6478 -14.6403 -0.5527 -1.7692 -7.3210
0.6463 -1.2324 -0.1013 1.7609 0.4586]
5.4
[-0.1754 0.4962 0.0674 -0.1141 1.3438 0.0333 -0.4907 -0.4421
-6.9778 14.9761 2.2221 2.6302 7.1415 -0.1605 -3.5573 -6.8504
1.4831 -2.9755 -0.1836 0.2769 -3.6009 -0.0876 1.5974 0.7424]
5.5
[ 0.9659 0.3420 0.0396 -0.1615 1.9621 0.0333 -0.4288 -0.3197
3.1568 12.4669 1.9046 2.8505 15.3842 -0.1728 -2.9499 -5.1787
-2.2453 -3.2001 -0.1623 0.7198 -5.7685 -0.0765 1.3828 0.5327]
TABELA 5.8: Características dos controladores calculados.
Ctrl No.
Manobra 1
5.1
5.2
5.3
5.4
5.5
269
262
1517523
531863
644526
Manobra 2
Manobra 3
Traço G θ−01
246
218
15800
1418
2396
44
34
281025
45658
111488
0.13794
0.00353
0.00156
-
108
Comentários:
a) O controlador 5.1 foi obtido minimizando-se o critério de desempenho estabelecido no
Item 5.4 e empregando a técnica apresentada em 5.5, tendo sido denominado de
controlador de desempenho ótimo. Foi utilizado como semente um controlador LQR
calculado através da rotina "dlqr" do Matlab. Os custos das manobras para o
controlador LQR utilizado eram da ordem de 105 . Para a minimização de cada uma
das três etapas (manobras) foi necessária cerca de 60 horas de processamento
computacional, utilizando-se um microcomputador PC-386DX40 e o Matlab, que é
uma linguagem interpretada.
b) O controlador 5.2 foi obtido a partir do 5.1, introduzindo-se um quarto objetivo
relativo à robustez através da técnica descrita no Item 5.5. Atuando convenientemente
sobre as constantes M i , comentadas no Item 5.5, foi possível após cerca de 70 horas
de processamento computacional, otimizar o traço de G θ−01 e ainda melhorar os custos
das manobras 1, 2 e 3. Para otimização do referido traço levou-se em conta somente os
modelos de 150, 200 e 250 Km/h.
c) O controlador 5.3 foi calculado utilizando como semente o 5.2, otimizando-se apenas
o traço de G θ−01 . Pela Tabela 5.8, observa-se que o valor do traço foi reduzido, mas em
compensação os custos das manobras degradaram-se completamente. Também neste
caso, para o cálculo do traço somente foram considerados os modelos de 150, 200 e
250 Km/h.
d) O controlador 5.4 foi calculado a partir do 5.2, tomando-se por base somente a
otimização do traço de G θ−01 , mas considerando os modelos de 100, 150, 200, 250 e 300
Km/h. Neste caso, o vetor paramétrico é de quarta ordem e as matrizes perturbadas,
empregadas no cálculo do traço de G θ−01 , foram geradas por interpolação linear entre o
109
modelo nominal e os demais de acordo com a Figura 5.7, considerando os parâmetros
perturbados em 20%.
e) O controlador 5.5 é análogo ao 5.4, mas as matrizes perturbadas foram obtidas
considerando os parâmetros perturbados em 98%, isto é, praticamente utilizando como
matrizes perturbadas os próprios modelos das demais velocidades.
f) A fim de evitar interpretações erradas, omitiu-se os valores do traço de G θ−01 na Tabela
5.8 para os controladores 5.4 e 5.5 pois estes não poderiam ser comparados entre si,
nem entre os demais.
Nas Figuras 5.16 a 5.20 encontram-se ilustrados os diagramas de sensibilidade
do sistema com os controladores enumerados pela Tabela 5.7. Nestas figuras, as
cruzes representam os pólos de MF do sistema funcionando com o modelo de 200
Km/h, definido nominal. Os modelos perturbados são gerados interpolando-se
linearmente os sete modelos disponíveis. A curva vermelha mostra a posição dos pólos
de MF do sistema, perturbando-o com modelos de 100 Km/h até 300 Km/h. A curva
azul é análoga a vermelha, mas considera-se somente os modelos de 150 Km/h até 250
Km/h.
Pelos diagramas de sensibilidade dos controladores 5.4 e 5.5 conclui-se que o
cálculo do traço de G θ−01 com matrizes perturbadas ao longo da faixa de operação gera
uma maior dessensibilização dos pólos de MF que utilizando modelos na vizinhança
do nominal (200 Km/h).
Nas Figuras 5.21 a 5.26 ilustra-se a evolução dos estados do helicóptero ao
aplicar as entradas de referência da Tabela 5.5 na situação nominal com os
controladores 5.1 (desempenho ótimo) e 5.2 (híbrido). Os efeitos esperados são
aqueles comentados pela Tabela 5.6. Ao comparar as figuras de desempenho temporal
deve-se observar se os eixos dos gráficos estão na mesma escala.
110
Nas Figuras 5.27 a 5.32 supõe-se a planta perturbada, em operação com
velocidade longitudinal de 100 Km/h e aplica-se as entradas de refêrencia a fim de
realizar as manobras supra-citadas. Observa-se que as manobras utilizando o
controlador 5.1 deterioram-se mais que as do controlador 5.2. Isto ocorre devido a
dessensibilização dos pólos de MF do sistema com a utilização do controlador híbrido.
As Figuras 5.33 a 5.38 são análogas às anteriores, mas a planta perturbada
opera em 300 Km/h.
FIGURA 5.16: Diagrama de sensibilidade com o controlador 5.1, variando-se os
modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul).
111
FIGURA 5.17: Diagrama de sensibilidade com o controlador 5.2, variando-se os
modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul).
FIGURA 5.18: Diagrama de sensibilidade com o controlador 5.3, variando-se os
modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul).
112
FIGURA 5.19: Diagrama de sensibilidade com o controlador 5.4, variando-se os
modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul).
FIGURA 5.20: Diagrama de sensibilidade com o controlador 5.5, variando-se os
modelos de 100 a 300 Km/h (vermelha) e de 150 a 250 Km/h (azul).
113
FIGURA 5.21: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o
controlador 5.1 na velocidade longitudinal de 200 Km/h.
FIGURA 5.22: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o
controlador 5.2 na velocidade longitudinal de 200 Km/h.
114
FIGURA 5.23: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o
controlador 5.1 na velocidade longitudinal de 200 Km/h.
FIGURA 5.24: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o
controlador 5.2 na velocidade longitudinal de 200 Km/h.
115
FIGURA 5.25: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o
controlador 5.1 na velocidade longitudinal de 200 Km/h.
FIGURA 5.26: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o
controlador 5.2 na velocidade longitudinal de 200 Km/h.
116
FIGURA 5.27: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o
controlador 5.1 na velocidade longitudinal de 100 Km/h.
FIGURA 5.28: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o
controlador 5.2 na velocidade longitudinal de 100 Km/h.
117
FIGURA 5.29: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o
controlador 5.1 na velocidade longitudinal de 100 Km/h.
FIGURA 5.30: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o
controlador 5.2 na velocidade longitudinal de 100 Km/h.
118
FIGURA 5.31: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o
controlador 5.1 na velocidade longitudinal de 100 Km/h.
FIGURA 5.32: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o
controlador 5.2 na velocidade longitudinal de 100 Km/h.
119
FIGURA 5.33: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o
controlador 5.1 na velocidade longitudinal de 300 Km/h.
FIGURA 5.34: Evolução dos estados do helicóptero, ao realizar a manobra 1 com o
controlador 5.2 na velocidade longitudinal de 300 Km/h.
120
FIGURA 5.35: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o
controlador 5.1 na velocidade longitudinal de 300 Km/h.
FIGURA 5.36: Evolução dos estados do helicóptero, ao realizar a manobra 2 com o
controlador 5.2 na velocidade longitudinal de 300 Km/h.
121
FIGURA 5.37: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o
controlador 5.1 na velocidade longitudinal de 300 Km/h.
FIGURA 5.38: Evolução dos estados do helicóptero, ao realizar a manobra 3 com o
controlador 5.2 na velocidade longitudinal de 300 Km/h.
122
CAPÍTULO 6
CONCLUSÕES E PERSPECTIVAS
6.1 - CONCLUSÕES
Após a realização deste trabalho na área de controle robusto paramétrico,
baseado na síntese PRCBI, concluiu-se que:
a) De acordo com os resultados do Capítulo 4, a otimização numérica de um critério
combinando estabilidade e desempenho é viável computacionalmente. Para os
exemplos utilizados, os controladores calculados através do critério de robustez
híbrida proposto permitiram conciliar em diversos níveis o compromisso
estabilidade versus desempenho.
b) Da forma como foram definidas neste trabalho, a técnica das liberações e a das
liberações realimentadas permitiram compor, de forma intuitiva e organizada,
diversas funções objetivo.
c) As técnicas de otimização foram selecionadas e utilizadas a medida que os
problemas de controle exigiram. Após alcançar os resultados apresentados nos
Capítulos 4 e 5, concluiu-se que os mesmos poderiam ser obtidos pela técnica das
liberações realimentadas, otimizando-se em uma única etapa todas as funções
objetivo envolvidas. Logicamente, as constantes M i citadas no Item 5.5 deverão ser
convenientemente manuseadas. Entretanto, a noção do mínimo que poderia ser
atingido para cada função objetivo isoladamente seria perdida.
d) O uso de vetores paramétricos perturbados aleatoriamente com raio percentual
constante nos diagramas de sensibilidade permitiu a comparação da robustez
paramétrica entre os diversos controladores calculados.
123
e) O raio da hiperesfera percentual de estabilidade constitui uma figura de mérito de
grande interesse para avaliar o domínio de estabilidade paramétrica do sistema.
Além disso, a utilização de escalas convenientes nos gráficos da região de
estabilidade do domínio paramétrico permitiu que a hiperesfera percentual fosse
representada por uma circunferência, facilitando a comparação visual entre os
gráficos dos diversos controladores.
f) Foi possível a aplicação da síntese PRCBI em sistemas MIMO, bem como o cálculo
de controladores com robustez híbrida para os mesmos. Além disso, a utilização das
múltiplas saídas da planta para estimar o vetor de estado através do FK, em
comparação com o uso de uma única saída, melhora consideravelmente o resultado
da estimação.
g) A síntese PRCBI se mostrou eficiente mesmo sendo empregada em sistemas onde a
influência dos parâmetros sensíveis não esteja explícita nas matrizes da dinâmica
(transição de estados e de controle), o que foi comprovado pelo problema do
Capítulo 5.
h) A abordagem adotada no problema do helicóptero indica uma maneira simples de
robustecer sistemas não lineares através da parametrização fictícia.
i) Na maioria dos casos, a minimização do traço de G θ−1 conduz a um aumento do raio
0
da hiperesfera percentual, bem como da região de estabilidade no domínio
paramétrico.
j) Nos problemas estudados, observou-se que pequenas degradações do custo de
desempenho nominal ótimo possibilitou grandes reduções do custo de robustez e
vice-versa.
k) A utilização dos vetores paramétricos perturbados de forma normalizada, isto é,
com raio percentual constante, permitiu definir o que equivaleria perturbar o
sistema em cada uma das direções paramétricas geradas aleatoriamente.
124
6.2 - PERSPECTIVAS
Com base na experiência obtida durante a elaboração deste trabalho, sugere-se
os seguintes desenvolvimentos futuros:
a) Aplicar a metodologia desenvolvida nesta tese para obter controladores de robustez
híbrida em outros sistemas reais, como por exemplo os SEP (Sistemas Elétricos de
Potência), que foram robustecidos através do traço de G θ−1 (PELLANDA, 1993)
0
sem levar em conta o desempenho do sistema.
b) Pesquisar um índice que permita medir a sensibilidade dos pólos de MF, a fim de
provar que a síntese PRCBI não conduz simplesmente a dessensibilização do pólos
de MF do sistema.
c) Procurar combinar o critério PRCBI com outros que levem em conta a robustez à
incertezas não estruturadas.
d) Estudar a possibilidade de obter de forma analítica um limitante do custo de
desempenho quadrático, a fim de evitar as simulações (resposta ao impulso) a cada
passo do processo de otimização numérica.
e) Realizar um estudo empregando a síntese PRCBI em controladores dinâmicos,
conforme (GAUVRIT & LAVIGNE, 1994).
f) Simular distúrbios de forma a melhorar a análise dos resultados alcançados pela
síntese PRCBI.
g) Fazer análises através do diagrama de Nyquist e procurar obter envoltórias
frequênciais.
125
APÊNDICE A
SOLUÇÃO PARA AS EQUAÇÕES DE L, N e ∆P'
A condição necessária e suficiente para que exista uma única solução para o
sistema matricial envolvido é, neste caso, que os autovalores de (Φ0 − Γ0 KC ) sejam
estáveis, isto é, que os modos de controle do sistema MF estejam no interior do círculo
unitário do plano complexo z.
A solução da equação X = F X G + H é dada pela seguinte relação:
x = U −1 h
(A.1)
 f11G T − I f12 G T L f1mG T 
 f GT f GT − I L f GT 
21
22
2m

U = F ⊗ GT − I ⊗ I = 
M
M
M
M


T
T
 fm1G T
L fmmG − I 
f m2 G
(A.2)
onde:
Além disso, h e x são vetores constituidos pelos elementos das matrizes X e H, da
seguinte maneira:
h = −[ h11 h12 L h1n h21 L h2 n L h mn ]
x = [ x11 x12 L x1n x21 L x2 n L x mn ]
com F ∈ C m × m , G ∈ C n × n , H ∈ C m × n , X ∈ C m
126
×n
e U ∈ C mn
T
(A.3)
T
× mn
(A.4)
.
REFERÊNCIAS BIBLIOGRÁFICAS
APKARIAN, Pierre. Robustesse de la Commande des Systemes Multivariables
Application au Pilotage d'un Helicoptere. Tese de Doutorado, Ecole Nationale
Superieure de l'Aeronautique et de l'Espace - ENSAE, Toulouse, 1988.
BOURRET, Thierry. Commande Robuste des Systemes Multivariables Discrets
soumis a des Perturbations Parametriques. Application au Pilote Automatique d'un
Avion de Type Airbus. Tese de Doutorado, Ecole Nationale Superieure de
l'Aeronautique et de l'Espace - ENSAE, Toulouse, 1993.
CHEN, Chi-Tsong. Linear System Theory and Design, CBS College Publishing, New
York, 1984.
D'AZZO, J. J. & HOUPIS, C. H. Análise e Projeto de Sistemas de Controle Lineares,
Segunda Edição, Editora Guanabara, Rio de Janeiro, 1988.
DOYLE, John C. & STEIN, Gunter. "Multivariable Feedback Design: Concepts for a
Classical / Modern Synthesis". IEEE Trans. Automatic Control, fevereiro de 1981,
26(1), 4-16.
FOX, Richard L. Optimization Methods for Engineering Design, Addison-Wesley,
Califórnia, 1971.
FRANKLIN, Gene F. & POWELL, J. D. Digital Control of Dynamic Systems,
Addison-Wesley, Califórnia, 1980.
GAUVRIT, Michel. Performances des Estimateurs Bayesiens en Boucle Ouverte et
Fermée. Tese de Doutorado, Université Paul Sabatier, Toulose, 1982.
GAUVRIT, Michel & LAVIGNE, G. "Parameter Robust Control by Dynamic
Compensator". Symposium on Robust Control Design, IFAC, Rio de Janeiro,
setembro de 1994, 481-486.
GOMES, G. M. Pinheiro. Synthese d'une Commande Robuste liee a la Qualite de
L'identification Bayesienne. Tese de Doutorado, Ecole Nationale Superieure de
l'Aeronautique et de l'Espace - ENSAE, Toulouse, 1991.
127
GOODWIN, Graham C. "Linking Identification and Robust Control". 9o CBA-UFES, .
KAILATH, Thomas. Linear Systems. Prentice-Hall, New Jersey, 1980.
KWAKERNAAK, Huibert & SIVAN, Raphael. Linear Optimal Control Systems.
John Wiley & Sons, New York, 1972.
MORARI, Manfred & ZAFIRIOV, E. Robust Process Control. Prentice Hall, 1990.
MOREIRA, F. J. O. (CTA-IAE) & Hemerly, Elder M. (CTA-ITA). "Projeto de um
Autopiloto Robusto para um Foguete Usando a Técnica H ∞ " - 9o CBA-UFES.
PAPOULIS, Athanasios. Probability, Random Variables, and Stochastic Processes.
Third Edition, McGraw-Hill, New York, 1991.
PELLANDA, Paulo Cesar. Controle Robusto Aplicado na Estabilização de Sistemas
Elétricos de Potência. Tese de Mestrado, Instituto Militar de Engenharia - IME, Rio
de Janeiro, 1993.
PERES, P. L. D. et alii. "Controle de Sistemas Dinâmicos Sujeito a Restrições
Estruturais e Limitante H ∞ " - 9o CBA-UFES.
PERES, P. L. D. (UNICAMP) & PIERI, Edson R. (UFSC). "Controle Robusto de
Sistemas de Estrutura Flexivel por Realimentação de Saída" - 9o CBA-UFES.
SAMBLANCAT, Christiane. Commande Robuste Multivariable Applications a
L'helicoptere. Tese de Doutorado, Ecole Nationale Superieure de l'Aeronautique et de
l'Espace - ENSAE, Toulouse, 1991.
TAHK, M. & SPEYER, J. L. "A Parameter Robust LQG Design Synthesis with
Applications to Control of Flexible Structures", IEEE Trans. Automatic Control, 1987.
VANDERPLAATS, Garret N. Numerical Optimization Techniques for Engineering
Design, McGraw-Hill, New York, 1984.
128
129

Documentos relacionados

59531 - 2009 Brazilian Symposium on Aerospace Engineering and

59531 - 2009 Brazilian Symposium on Aerospace Engineering and são modeladas como reduções nos ganhos dos atuadores. Os resultados são avaliados através de simulações no ambiente Matlab/Simulink. Para tanto, a resposta do sistema em malha fechada é analisada c...

Leia mais