dE EQUAÇÕES DE EULER

Transcrição

dE EQUAÇÕES DE EULER
UNIVERSIDADE FEDERAL DO CEARÁ
DEPARTAMENTO DE MATEMÁTICA
INTRODUÇÃO AO
CÁLCULO DAS VARIAÇÕES.
Juscelino Pereira Silva
FORTALEZA-CE
2005
Sumário
1 Introdução
3
2 Elementos da Teoria
5
2.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 A Variação de um Funcional . . . . . . . . . . . . . . . . . . . 11
2.3 O Teorema da Divergência . . . . . . . . . . . . . . . . . . . . 17
3 Equações de Euler-Lagrange
21
3.1 A Equação de Euler-Lagrange. . . . . . . . . . . . . . . . . . . 21
3.2 O Princı́pio de Fermat . . . . . . . . . . . . . . . . . . . . . . 27
4 Problemas Variacionais
30
4.1 Distância mı́nima no plano. . . . . . . . . . . . . . . . . . . . 30
4.2 Braquistócrona . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.3 Superfı́cie de revolução de área mı́nima . . . . . . . . . . . . . 34
5 Equação de Euler-Lagrange generalizada.
5.1 Equação de Euler-Lagrange generalizada. .
5.2 Geodésicas . . . . . . . . . . . . . . . . . .
5.3 Problemas Isoperimétricos . . . . . . . . .
5.4 A Catenária. . . . . . . . . . . . . . . . . .
5.5 O Problema Isoperimétrico Original. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
39
42
43
45
6 Equações de Hamilton
47
6.1 As Equações de Hamilton . . . . . . . . . . . . . . . . . . . . 47
6.2 Integral Primeira para as Equações de Hamilton . . . . . . . . 49
7 O Princı́pio Variacional de Hamilton
54
7.1 Dinâmica Lagrangiana . . . . . . . . . . . . . . . . . . . . . . 54
7.2 Oscilador Harmônico Simples . . . . . . . . . . . . . . . . . . 58
7.3 Forças Centrais. . . . . . . . . . . . . . . . . . . . . . . . . . . 59
1
2
8 A Equação de Euler-Lagrange em RN .
62
8.1 A Equação de Euler-Lagrange em RN . . . . . . . . . . . . . . 62
8.2 O Princı́pio de Dirichlet . . . . . . . . . . . . . . . . . . . . . 64
8.3 O Problema de Plateau . . . . . . . . . . . . . . . . . . . . . . 66
Referências Bibliográficas
69
Capı́tulo 1
Introdução
Estas notas foram escritas no intuito de dar a alunos de graduação
em matemática, fı́sica ou engenharia, que possuam um curso de cálculo de
funções reais de várias variáveis e gosto pela matemática, uma breve introdução ao Cálculo das Variação. No capı́tulo 2 fizemos a breve apresentação
de alguns conceitos fundamentais sobre Algebra Linear e Cálculo Diferencial
indispensáveis ao desenvolvimento da teoria. No capı́tulo 3 é apresentadas as
equações de Euler-Lagrange e como aplicação para a mesma é apresentado o
prı́ncı́pio de Fermat para a propagação da luz. No capı́tulo 4 são apresentados
alguns problemas variacionais clássicos como: curva que minimiza distância
no plano euclidiano, o problema da Braquistócrona ou ainda conhecida como
a curva que une dois pontos de forma a minimizar o tempo e o problema de
encontrar a curva perfil que gera uma superfı́cie de rotação com área mı́nima.
No capı́tulo 5 são introduzidas as equações de Euler-Lagrange para problemas com N graus de liberdade e como aplicação às mesmas são feitos alguns
comentários sobre geodésicas sobre superfı́cies em R3 , entretanto o fato primordial de tal capı́tulo é o teorema do Multiplicador de Lagrange, que não é
demonstrado mas é indicada uma referência. No capı́tulo 6 são apresentadas
as equações de Hamilton e alguns exemplos onde tais equações podem ser
aplicadas e ainda é dada uma condição necessária e suficiente para tal sistema de equações possuir uma integrau primeira. O capı́tulo 7 versa sobre a
dinâmica lagrangiana e tem como ponto primordial o princı́pio variacional de
Hamilton e ainda alguns exemplos. No caı́tulo 8 é apresentada a equação de
Euler-Lagrange em RN e como aplicações às mesmas são apresentados o
princı́pio de Dirichlet e problema de Plateau para superfı́cies em R3 . É de
suma importância salientar que durante o decorrer destas notas fazemos o
uso das equações de Euler-Lagrange para estudar os problemas variacionais
admitindo, em várias circunstâncias, que as soluções das Equações de EulerLagrange são, de fato, mı́nimos(máximos) para os funcionais em questão, de3
CAPÍTULO 1. INTRODUÇÃO
4
vido as equações de Euler-Lagrange serem somente uma condição necessária
para tais fato, e não suficiente. tais condições suficientes são dadas com o
estudo mais profundo da segunda variação do funcional, o que pretendemos
fazer em breve. por último resta comentar que tais notas não são, em sua totalidade, originais, boa parte dela é inspirada e tem como principal referência
o excelente livro “Calculus of Variations”, dos autores Gelfand e Fomin, cujo
mesmo está nas referências bibliográficas dessas notas. Agradeço ainda a
Antonio Caminha M. Neto e Wilson Hugo C. Freire pela leitura, correções
de vários erros e pelas valiosas sugestões.
Juscelino P. Silva
Fortaleza-Ce
Junho de 2005
Capı́tulo 2
Elementos da Teoria
2.1
Conceitos Básicos
Introduziremos aqui alguns conceitos fundamentais para o desenvolvimento
da teoria que abordaremos nos próximos capı́tulos.
Definição 2.1.1 O par (E, ||.||) será dito um R-Espaço Vetorial Normado
se, dados x, y, z ∈ E e α, β ∈ R arbitrários, os seguintes axiomas forem
satisfeitos:
1. x + y = y + x;
2. (x + y) + z = x + (y + z);
3. Existe um elemento 0(elemento zero) tal que x+0 = x para todo x ∈ E;
4. Para cada x ∈ E existe um elemento −x tal que x + (−x) = 0;
5. 1.x = x;
6. α(βx) = (αβ)x;
7. (α + β)x = αx + βx;
8. α(x + y) = αx + αy;
9. ||x|| ≥ 0 e ||x|| = 0 se e somente se x = 0;
10. ||αx|| = |α|.||x||;
11. ||x + y| ≤ ||x|| + ||y||.(Desigualdade Triangular)
5
CAPÍTULO 2. ELEMENTOS DA TEORIA
6
Obs 2.1.1 Os axiomas 9, 10 e 11 são relativos a definição de espaço normado.
Definição 2.1.2 Um subconjunto X ⊆ E é dito um subespaço vetorial de E
se dados quaisquer dois elementos x, y ∈ X e α ∈ R então x + αy ∈ X.
Definição 2.1.3 Uma base {e1 , ..., ei , ...} é um conjunto de elementos de E
tais que cada elemento x ∈ E é uma combinação linear finita de elementos
{ei } da forma:
k
X
x=
αj ej , αj ∈ R
j=1
e mais ainda tal conjunto {ei } é linearmente independente(l.i.), ou seja, dada
combinação linear
α1 x1 + ... + αk xk = 0
teremos então, obrigatoriamente, que todos os escalares αi devem ser nulos.
Obs 2.1.2 Existem espaços vetoriais que não possuem base enumerável, e
portanto, uma base para tais espaços é da forma {eλ }λ∈Λ onde Λ é um conjunto de ı́ndices não enumerável. Mas, por simplicidade, consideraremos
aqui apenas espaços vetoriais que possuam base enumerável.
Obs 2.1.3 Qualquer base de um espaço vetorial E possui a mesma quantidade de elementos.
Definição 2.1.4 A dimensão dim E de um espaço vetorial E é definida como
sendo o número de elementos de uma base de E.
Definição 2.1.5 Sejam E e F dois R-espaços vetorais. Uma tranformação
linear T : E → F é uma regra que associa a cada elemento x ∈ E um único
elemento T (x) ∈ F e que satistaz as seguintes propriedades:
1. T (x + y) = T (x) + T (y);
2. T (αx) = αT (x).
para quaisquer x, y ∈ E e α ∈ R. Quando F = R, tais tansformações recebem
o nome de funcionais lineares.
Definição 2.1.6 Uma transformação linear T : (E, ||.||1 ) → (F, ||.||2 ) é dita
contı́nua em x ∈ E se dado > 0 existe δ > 0 tal que
||T (x) − T (y)||2 < se ||x − y||1 < δ. Tal transformação é dita contı́nua se a mesma o for em
todos os pontos x ∈ E.
CAPÍTULO 2. ELEMENTOS DA TEORIA
7
Teorema 2.1.1 Seja T : (E, ||.||1 ) → (F, ||.||2 ) uma transformação linear entre espaços vetoriais normados E e F. As seguintes afirmações são
equivalentes:
1. T é contı́nua;
2. T é contı́nua em 0;
3. Existe M > 0 tal que ||T (x)||2 ≤ M ||x||1 (Limitação);
4. Existe M > 0 tal que ||T (x) − T (y)||2 ≤ M ||x − y||1 .
Demonstração: (1) ⇒ (2) É óbvia.
(2) ⇒ (3) Tomando = 1 tem-se que existe δ > 0 tal que ||x||1 < δ implica
que ||T (x)||2 < 1, pela continuidade de T em 0. Escolha agora M qualquer
tal que 0 < 1/M < δ. A relação ||T (x)||2 ≤ M ||x||1 é trivialmente satisfeita
x
para x = 0, daı́ considerando x 6= 0,
tem norma 1/M , portanto
M ||x||1
menor que δ. Logo,
x
||T (
)||2 < 1 ⇒ ||T (x)||2 ≤ M ||x||1 .
M ||x||1
(3) ⇒ (4) Decorre da linearidade de T .
(4) ⇒ (1) Dado > 0 arbitrário basta tomar δ = /M .
Definição 2.1.7 O conjunto formado pelos funcionais lineares f : E → R
é chamado de espaço dual de E e representado por E∗ (dual algébrico). E∗ é
um espaço vetorial munido das seguintes propriedades:
1. (f + g)(x) := f (x) + g(x) ∀x ∈ E;
2. (αf )(x) := αf (x) ∀x ∈ E λ ∈ R.
A base canônica de E∗ é formada pelos funcionais lineares {dx1 , ..., dxi , ...}
definidos pela seguinte sentença:
dxi (ej ) = δij (delta de Kronecker)
onde
δij =
1, se i = j
0, se i 6= j
Definição 2.1.8 E0 ⊆ E∗ (dual topológico) é o conjunto formado por todos
os funcionais lineares f : E → R contı́nuos. Tem-se que (E0 , ||.||E0 ) é um
subespaço vetorial normado de E∗ munido da seguinte norma:
||f ||E0 := sup |f (x)|
||x||=1
CAPÍTULO 2. ELEMENTOS DA TEORIA
8
Obs 2.1.4 Se dim E = ∞ então E0 6= E∗ e se dim E < ∞ então E0 = E∗ .
Exemplo 1: Um funcional linear descontı́nuo. Seja E o conjunto dos
polinômios reais com uma variável. E é um espaço vetorial normado munido pela norma ||p|| = sup |p(x)|. Considere agora f : E → R definida
0≤x≤1
por f (p) = p(2), é claro que f é um funcional linear. Mostraremos
x nque f
é descontı́nuo em 0 ∈ E(polinômio nulo). De fato seja pn (x) =
uma
2
sequência de polinômios em E. Note que
x n 1
1
=
||pn − 0|| = ||pn || = sup <
n
2
2
n
0≤x≤1
e portanto temos que pn → 0 quando n → ∞. No entanto note que
|f (pn ) − f (0)| = |f (pn )| = pn (2) = 1 >
1
2
implicando dessa forma que f (pn ) 6→ f (0) quando n → ∞, e portanto, f é
descontı́nuo em 0.
Exemplo 2: O espaço Euclidiano RN . Tem-se que o (RN , ||.||e ) é um Respaço vetorial normado munido com as seguintes operações:
1. (x1 , ..., xN ) + (y1 , ..., yN ) := (x1 + y1 , ..., xN + yN );
2. α(x1 , ..., xN ) := (αx1 , ..., αxN ), α ∈ R.
e com a seguinte norma:
v
u N
uX
p
x2i .
||(x1 , ..., xN )||e := h(x1 , ..., xN ), (x1 , ..., xN )i = t
i=1
onde h, i simboliza o produto interno canônico em RN . Seja ainda {e1 , ..., eN }
i
z}|{
a base canônica de RN , ou seja, ei = (0, ..., 0, 1 , 0, ..., 0) temos associada a
mesma, a base dual {dx1 , ..., dxN } definida em (2.1.7).
Exemplo 3: O espaço de funções C([0, 1], R). O conjunto formado pelas
funções contı́nuas f : [0, 1] → R munido com as operações definidas em
(2.1.7) e pela norma
||f ||0 := sup |f (x)|
0≤x≤1
CAPÍTULO 2. ELEMENTOS DA TEORIA
9
é um espaço vetorial normado. Em alguns contextos C([0, 1], R) é munido da
norma
s
Z 1
f (x)2 dx.
||f ||L2 :=
0
Tal norma provém do produto interno
Z 1
hf, giL2 :=
f (x)g(x)dx.
0
Note que ||f ||L2 ≤ ||f ||0 . O espaço C([0, 1], R) é chamado de espaço vetorial
das funções contı́nuas definidas em [0, 1].
Exemplo 4: O espaço de funções C 1 ([0, 1], R). O conjunto formado pelas
funções f : [0, 1] → R deriváveis cujas derivadas são contı́nuas, munido com
as operações definidas em 2.1.7 e pela norma
||f ||1 := sup |f (x)| + sup |f 0 (x)| = ||f ||0 + ||f 0 ||0
0≤x≤1
0≤x≤1
é um espaço vetorial normado. Em alguns contextos C 1 ([0, 1], R) é munido
da norma
s
s
Z 1
Z 1
||f ||H 1 :=
|f (x)|2 dx +
|f 0 (x)|2 dx.
0
0
Note que ||f ||0 ≤ ||f ||1 . O espaço C 1 ([0, 1], R) é chamado de espaço vetorial
das funções de classe C 1 definidas em [0, 1].
Obs 2.1.5 O espaço de funções C k ([0, 1], R), onde k ≥ 1 é inteiro, é definido
de forma análoga.
Definição 2.1.9 Uma forma bilinear B : E×E → R é uma regra que associa
a cada par de elementos (x, y) um único número real B(x, y) que satisfaz as
seguintes propriedades:
1. Para cada x ∈ E fixado, y 7→ B(x, y) é linear;
2. Para cada y ∈ E fixado, x 7→ B(x, y) é linear.
Definição 2.1.10 Uma forma bilinear B : E×E → R é dita contı́nua quando
existe uma constante M > 0 tal que
|B(x, y)| ≤ M ||x||.||y|| ∀x, y ∈ E
e dita coerciva quando existe uma constante N > 0 tal que
N ||x||2 ≤ B(x, x) ∀x ∈ E.
CAPÍTULO 2. ELEMENTOS DA TEORIA
10
Obs 2.1.6 Um produto interno h, i é uma forma bilinear simétrica, ou seja,
B(x, y) = B(y, x) para quaisquer x, y ∈ E.
Definição 2.1.11 Uma forma quadrática Q : E → R associada a uma forma
bilinear B (2.1.9) é uma regra que associa a cada x ∈ E um único número
real Q(x) := B(x, x).
Vejamos agora a deigualdade de Cauchy1 -Schwarz2
Lema 2.1.1 (Desigualdade de Cauchy-Schwarz) Seja (E, h, i)
R-espaço vetorial com produto interno. Sejam x, y ∈ E então
um
| hx, yi | ≤ ||x||.||y||
e a igualdade vale se, e somente se, existe α ∈ R tal que x + αy = 0.
Demonstração: Sejam x, y ∈ E fixados. Defina a seguinte função real
g : R → R por g(t) = ||x + ty||2 . Usando a bilinearidade do produto interno
segue que
g(t) = ||x||2 + 2t hx, yi + t2 ||y||2 .
Portanto g é uma função quadrática não-negativa na variável t, implicando
assim que seu discriminante deve ser não positivo. Note que o discriminante
de g é
4 hx, yi2 − 4||x||2 .||y||2
daı́, segue que
| hx, yi | ≤ ||x||.||y||.
Por último note que, a igualdade acima é válida se, e somente se, g possui
uma raı́z real. Daı́ segue o resultado.
Definição 2.1.12 Seja (E, h, i) um espaço vetorial com produto interno. Uma
base {e1 , ..., ei , ...} de E é dita ortonormal se hei , ej i = δij .
Obs 2.1.7 Existe um processo denominado de Ortogonalização de
Gram-Schmidt pelo qual dada uma base qualquer é possı́vel transformá-la
em uma base ortonormal.
Vejamos o importante teorema de Riesz3
1
Augustin Louis Cauchy(1789-1857), nascido em Paris na França.
Hermann Amandus Schwarz(1843-1921) nascido em Hermdorf na Polônia.
3
Frigyes Riesz(1880-1956) nascido em Györ na Hungria.
2
CAPÍTULO 2. ELEMENTOS DA TEORIA
11
Teorema 2.1.2 (Representação de Riesz) Seja (E, h, i) um espaço vetorial de dimensão finita e f : E → R um funcional linear, então existe um
único elemento vf ∈ E que representa f , i.e.,
f (x) = hx, vf i ∀x ∈ E.
Demonstração:
PN Seja {e1 , ..., eN } uma base ortonormal
PN de E, defina o elemento vf :=
f
(e
)e
.
Seja
x
∈
E,
então
x
=
i i
i=1
j=1 αj ej e portanto
PN
f (x) = j=1 αj f (ej ). Por outro lado, temos que
* N
+
N
N
N
X
X
X
X
hx, vf i =
αj ej ,
f (ei )ei =
αj f (ei )δij =
αi f (ei ) = f (x).
j=1
i=1
i,j=1
i=1
Daı́ está provada a existência. Suponhamos que existam dois representantes
para f em E, digamos, vf e wf , então segue, pela representação que
hx, vf i = hx, wf i ∀ x ∈ E
e por linearidade segue que hx, vf − wf i = 0 ∀x ∈ E, em particular, para
x = vf − wf e dessa forma ||vf − wf ||2 = 0, implicando que vf = wf , daı́
resultando a unicidade, e portanto o teorema está provado.
Obs 2.1.8 O teorema de Riesz é válido ainda em dimensão infinita com as
hipóteses de f ser contı́nuo e de E ser um espaço de Hilbert.45
2.2
A Variação de um Funcional
Definição 2.2.1 Um subconjunto A ⊆ E, onde E é um espaço vetorial
normado, é dito uma Variedade Afim quando a reta que une dois
pontos quaisquer de A está contida em A. Assim, A ⊆ E é uma variedade
afim se, e somente se, cumpre a seguinte condição:
x, y ∈ A, t ∈ R ⇒ (1 − t)x + ty ∈ A.
Obs 2.2.1 Todo espaço vetorial normado (E, ||.||) é um espaço é uma
variedade afim.
Obs 2.2.2 Encare A como um espaço vetorial transladado da origem, na
realidade dado um y ∈ A existe um único F ⊆ E, subespaço vetorial de E,
tal que A = y + F.6 F será chamado de Espaço Tangente a A.
4
David Hilbert(1862-1943) nascido em Königsberg na Prússia, hoje Rússia.
Ver Brezis.
6
Ver Elon L. Lima, Álgebra Linear.
5
CAPÍTULO 2. ELEMENTOS DA TEORIA
12
Definição 2.2.2 Um funcional7 J : A → R é uma regra que a cada y ∈ A
associa um único número real J[y] onde A é uma variedade afim.
Obs 2.2.3 Em geral, funcionais não precisam ser definidos em uma
variedade afim, entretando, para os propósitos desse trabalho, defini-los dessa
forma é suficiente.
Definição 2.2.3 Um funcional J é dito contı́nuo em y ∈ A se dado > 0
existe δ > 0 tal que
|J[y] − J[x]| < se ||y − x|| < δ. Tal funcional é dito contı́nuo se o mesmo o for em todos os
pontos y ∈ A.
Definição 2.2.4 Sejam y ∈ A e h ∈ F ⊆ E o funcional J é dito diferenciável8 se
J[y + h] − J[y] = Φy (h) + R(h)||h||.
onde Φy : F → R é um funcional linear e R = R(h) é um funcional tal que
lim R(h) = 0.
||h||→0
A parte linear Φy (h) de J[y + h] − J[y] é chamada de variação(ou diferencial)
de J em y que denotaremos por δJ[y] = Φy .
Obs 2.2.4 Perceba a natureza da variação δJ. Tem-se que δJ : A → E∗ é
uma regra que associa a cada y ∈ A um único funcional linear δJ[y] : F → R,
como mostra o seguinte diagrama:
δJ : A −→
F∗
y 7−→ δJ[y] : F −→
R
h 7−→ δJ[y]h
Definição 2.2.5 Sejam y ∈ A e h ∈ F, definimos a derivada(funcional) de
J em y “na direção de h” como
J[y + th] − J[y]
t→0
t
δJ[y]h := lim
quando tal limite existe.
7
O funcional J não é, em geral, um funcional linear.
Em alguns livros, R é definido de uma forma um pouco diferente, mas equivalente a
essa definição.
8
CAPÍTULO 2. ELEMENTOS DA TEORIA
13
Obs 2.2.5 Você pode achar estranho a nomenclatura “direcional”, pois h é
uma função. Lembre-se que h ∈ F que é um espaço vetorial, logo funções
como h são vetores num espaço de funções. A nomenclatura “direcional” é
apenas no sentido de fazer uma analogia com o caso Euclidiano.
Teorema 2.2.1 (Unicidade da diferencial) A diferencial de um funcional
diferenciável é única.
Demonstração: Seja y ∈ A fixado. Mostraremos inicialmente que se Φy é
um funcional linear tal que
Φy (h)
→0
||h||
quando ||h|| → 0, então Φy ≡ 0, i.e., Φy é o funcional nulo. De fato, suponha
que existe um h0 6= 0 ∈ E tal que Φy (h0 ) 6= 0. Defina a seguinte sequência
hn =
h0
,
n
λ=
Φy (h0 )
,
||h0 ||
note que ||hn || → 0 quanto n → ∞, entretanto
Φy (hn )
nΦy (h0 )
= lim
= λ 6= 0,
n→∞ ||hn ||
n→∞ n||h0 ||
lim
contrariando a nossa hipótese.
Suponhamos agora que a diferencial de J em y não seja única, digamos
Φy e Ψy , então
J[y + h] − J[y] = Φy (h) + R1 (h)||h||,
J[y + h] − J[y] = Ψy (h) + R2 (h)||h||,
onde R1 (h), R2 (h) → 0 quando k|h|| → 0. Dessa forma temos
(Φy − Ψy )(h) = R1 (h)||h|| − R2 (h)||h||
implicando assim que
(Φy − Ψy )(h)
= R1 (h) − R2 (h).
||h||
Tem-se que Φy − Ψy é um funcional linear e R1 (h) − R2 (h) → 0 quando
||h|| → 0, daı́ segue, pelo resultado provado inicialmente, que o funcional
linear Φy −Ψy é identicamente nulo, dessa forma ficando provado o teorema.
CAPÍTULO 2. ELEMENTOS DA TEORIA
14
Definição 2.2.6 O funcional J : A → R é dito de classe C 1 quando
δJ : A → F0 ⊆ F∗ é contı́nua, isto dado y ∈ A arbitrário e > 0 existe
δ > 0 tal que
||y − x|| < δ ⇒ ||δJ[y] − δJ[x]||F0 < .
Definição 2.2.7 Um funcional J : A → R é dito duas vezes diferenciável se
dado y ∈ A e h ∈ F tem-se que
J[y + h] − J[y] = δJ[y]h + Ψy (h) + R(h)||h||2
onde Ψy : F → R é uma forma quadrática representada por δ 2 J[y] é
denominada de segunda variação(ou diferencial segunda) de J no ponto y
e R(h) → 0 quando ||h|| → 0.
Obs 2.2.6 Na realidade, a diferencial segunda de J é uma regra que associa
a cada ponto y ∈ A uma forma bilinear B(y) : F × F → R, no entanto,
como o vetor h é fixado temos B(y)(h, h), i.e., a forma quadrática associada
a B(y), que no caso acima é δ 2 J[y](h, h) = δ 2 J[y]h2 .
Obs 2.2.7 A diferencial segunda de um funcional duas vezes diferenciável é
única.
Exemplo 5: Seja Ω ⊆ RN um domı́nio, i.e., um aberto conexo. E seja
F : Ω → R uma função diferenciável de classe C 2 . Temos então que dados
y, v ∈ Ω tal que y + v ∈ Ω segue que
F(y + v) − F(y) = dF(y)v + d2 F(y)v 2 9 + R(v)||v||
onde R(v) → 0 quando ||v|| → 0. Onde aqui denotamos por dF a diferencial
de F. Temos então que dF(y) : E → R é um funcional linear, daı́ pelo
teorema de Riesz (2.1.2), existe um vetor, que representaremos por ∇F(y)
que representa dF(y), i.e.,
dF(y)v = hv, ∇F(y)i .
Como F é de classe C 2 , em particular C 1 , temos que a aplicação y 7→ ∇F(y)
é contı́nua. Tal aplicação é uma função vetorial, i.e., associa a cada y ∈ Ω o
vetor ∇F(y) denominado de Gradiente de F no ponto y.
Vejamos quem são as coordenadas do Gradiente. Temos que a derivada
direcional de F em y na direção de v é
F(y + tv) − F(y)
∂F(y)
= lim
,
t→0
∂v
t
9 2
d F(y)v 2 significa d2 F(y)(v, v).
CAPÍTULO 2. ELEMENTOS DA TEORIA
15
ou seja,
∂F(y)
= dF(y)v,
∂v
no caso particular em que v = ei temos que tal derivada direcional recebe
o nome de derivada parcial com respeito a coordenada yi , considerando y =
(y1 , ..., yi , ..., yN ), e representada por
∂F(y)
= dF(y)ei .
∂yi
Escrevamos v como combinação linear do vetores canônicos ei , logo
v = α1 e1 + ... + αN eN ,
logo tem-se que v = (α1 , ..., αN ) e daı́ segue que
!
N
N
N
X
X
X
∂F(y)
dF(y)v = dF(y)
αi ei =
αi dF(y)ei =
αi
∂yi
i=1
i=1
i=1
implicando que
∂F(y)
∂F(y)
dF(y)v = v, (
, ...,
)
∂y1
∂yN
no entanto, a representação de dF(y) é única, logo
∇F(y) = (
∂F(y)
∂F(y)
, ...,
).
∂y1
∂yN
Outra forma de chegar a tal resultado seria em lembrar que dF(y) ∈ (RN )∗
e portanto o mesmo é uma combinação linear do elemento da base dual
{dx1 , ..., dxN }, logo
N
X
dF(y) =
βi dxi
i=1
lembrando-se que dxi ej = δij , segue que
∂F(y)
= dF(y)ei = βi
∂yi
e daı́ decorrendo tudo da mesma forma.
Usando que F é de classe C 2 temos, pelo teorema de Schwarz, que
∂ 2 F(y)
∂ 2 F(y)
=
(i, j = 1, ..., N)
∂yj ∂yi
∂yi ∂yj
CAPÍTULO 2. ELEMENTOS DA TEORIA
16
e portanto
d2 F(y)(u, v) =
∂ 2 F(y)
∂ 2 F(y)
=
= d2 F(y)(v, u)
∂v∂u
∂u∂v
daı́ segue que
2
d F(y) =
∂ 2 F(y)
∂yj ∂yi
1≤i,j≤N
onde d2 F(y) é denominada de matriz Hessiana10 associada a F aplicada no
ponto y.
A partir de agora, quando não for especificado, J : A → R será um
funcional diferenciável.
Definição 2.2.8 Um elemento y ∈ A é dito estacionário para J se
δJ[y] ≡ 0,
i.e., δJ[y]h = 0, ∀h ∈ F.
Definição 2.2.9 Um elemento y ∈ A é dito um ponto de mı́nimo(máximo)
local para J se existe δ > 0 tal que
J[y] ≤ J[x] (≥)
para todo x ∈ E tal que ||y − x|| < δ.
Obs 2.2.8 No decorrer desse texto, frequentemente, iremos nos referir a
mı́nimos e/ou máximos(locais) dos funcionais em questão apenas
como extremos.
Teorema 2.2.2 Uma condição necessária para que y ∈ A seja um ponto de
mı́nimo(máximo) local para J é que y seja estacionário.
Demonstração: Vamos supor, sem perda de generalidade, que y seja
um ponto mı́nimo local para J. Então deve existir um δ > 0 tal que
J[x] − J[y] ≥ 0 para ||y − x|| < δ. Seja então h ∈ E tal que ||h|| = 1, e
consideremos x = y + th, segue então que
||y − x|| < δ ∀ t ∈ (−δ, δ).
Dessa forma segue que para todo t ∈ (−δ, δ) temos que J[y + th] − J[y] ≤ 0.
Usando agora o fato de que J é diferenciável temos que:
J[y + th] − J[y] = tδJ[y]h + R(th)|t|
10
Quando F é de classe C 2 , d2 F(y) é uma forma bilinear simétrica para cada y.
CAPÍTULO 2. ELEMENTOS DA TEORIA
17
onde R(th) → 0 quando t → 0. Portanto temos
|t|
J[y + th] − J[y]
= δJ[y]h + R(th) .
t
t
O limite da quantidade que está do lado direito da igualdade acima existe, e
é igual a derivada direcional de J é y na direção de h 11 . Daı́ tem-se que
lim+
t→0
J[y + th] − J[y]
≤0
t
uma vez que J[y + th] − J[y] ≤ 0 para t ∈ (−δ, δ) e estamos considerando
t > 0. Entretanto, note que
lim−
t→0
J[y + th] − J[y]
≥0
t
uma vez que J[y+th]−J[y] ≤ 0 para t ∈ (−δ, δ) e agora estamos considerando
t < 0. Daı́ como o limite em questão existe, segue que
δJ[y]h = lim+
t→0
J[y + th] − J[y]
J[y + th] − J[y]
= lim−
=0
t→0
t
t
implicando assim que y é estacionário.
Obs 2.2.9 Note que, que pela linearidade de δJ[y], podemos considerar
acima ||h|| = 1 sem haver perda de generalidade, uma vez que
e
h
δJ[e
h] = ||e
h||δJ[y]
.
||e
h||
2.3
O Teorema da Divergência
Dedicaremos esta seção para breves comentários sobre o teorema da
divergência de Gauss12 e algumas de suas aplicações.
Definição 2.3.1 Seja X : Ω → RN , X(x) = (X1 (x), ..., XN (x)), um campo
vetorial de classe C 1 (Ω, R), i.e., as funções Xi : Ω → RN são funcões de
classe C 1 (Ω, R). Definimos o divergente do campo X por
divX(x) :=
N
X
∂Xi
i=1
11
12
∂xi
(x).
|t|
Note que limt→0 R(th) |t|
t = 0, mesmo não existindo limt→0 t .
Johann Carl Friedrich Gauss(1777-1855) nascido em Brunswick na Alemanha.
CAPÍTULO 2. ELEMENTOS DA TEORIA
18
Teorema 2.3.1 (Divergência de Gauss) Seja X : Ω → R um campo
vetorial de classe C 1 (Ω, R), Ω ⊆ RN compacto, com fronteira ∂Ω suave,
orientável, orientada e com o vetor normal unitário exterior η. Então
Z
Z
divX dx =
hX, ηi dSx
(2.1)
Ω
∂Ω
Obs 2.3.1 Acima, dx é o elemento de volume em RN , dSx é o elemento de
área em ∂Ω e as integrais são respectivas a tais elementos.
Obs 2.3.2 O teorema de divergência de Gauss é também conhecido com
integração por partes generalizada, devido a identidade entre a integral em
Ω e a integral em ∂Ω.
Obs 2.3.3 Em R2 , o teorema da divergência resulta do teorema de Green13 ,
I
Z Z
P(x, y)dx + Q(x, y)dy =
(Qx (x, y) − Py (x, y))dxdy
(2.2)
γ
Ω
onde γ : [a, b] → ∂Ω ⊆ R2 é uma curva suave, simples e regular. A expressão
do lado esquerdo da igualdade significa, considerando γ(t) = (x(t), y(t)),
I
Z b
P(x, y)dx + Q(x, y)dy :=
(P(x(t), y(t))x0 (t) + Q(x(t), y(t))y 0 (t)) dt
γ
a
donde P, Q : Ω → R são funções de classe C 1 .
Obs 2.3.4 O teorema de Green em RN é chamado de teorema de Stokes.14
Obs 2.3.5 Seja Ω ⊆ R2 como nas hipóteses do teorema da divergência,
temos pela expressão (2.2), que
I
Z Z
1
−ydx + xdy =
dxdy = Área de Ω.
2 ∂Ω
Ω
Sejam u, v : Ω ⊆ RN → R funções de classe C 2 (Ω, R), considere o campo
definido por
X(x) = u∇v,
é imediato que X é de classe C 1 . Seja η o vetor normal exterior a ∂Ω. Então
hX, ηi = hu∇v, ηi = u
13
14
∂v
∂η
George Green(1793-1841) nascido em Nottingham na Inglaterra.
George Gabriel Stokes(1819-1903) nascido em Skreen na Irlanda.
CAPÍTULO 2. ELEMENTOS DA TEORIA
donde
19
∂v
é chamada de derivada normal de v. Temos ainda
∂η
divX = h∇u, ∇vi + u∆v
onde
∆v =
N
X
∂2v
i=1
∂x2i
chama-se Laplaciano15 de v, segue, pelo teorema da divergência (2.1),
Z
Z
Z
∂v
h∇u, ∇vi dx + u∆dx =
u dSx
(2.3)
Ω
Ω
∂Ω ∂η
que é conhecida como primeira fórmula de Green. Se considerarmos o campo
X = u∇v − v∇u
segue, de forma análoga
Z
Z
∂v
∂u
(u∆v − v∆u)dx =
(u
− v )dSx
∂η
∂η
Ω
∂Ω
(2.4)
que é conhecida como segunda fórmula de Green. Vejamos uma aplicação,
ao Problema de Dirichlet16 , das fórmulas de Green.
Um famoso problema da teoria das equações diferenciais parciais é o
problema de Dirichlet:
∆u = 0, em Ω
(2.5)
u = g, em ∂Ω
onde u ∈ C 2 (Ω) ∩ C(∂Ω) é uma função, a priori, desconhecida, g ∈ C(∂Ω)
uma função conhecida e Ω é um domı́nio em RN .
Definição 2.3.2 Uma função u : Ω → R de classe C 2 (Ω) é dita harmônica
se ∆u ≡ 0.
Teorema 2.3.2 Seja u : Ω → R tal que u ∈ C 2 (Ω) ∩ C(∂Ω). Se u é
harmônica em Ω e u = 0 em ∂Ω então u é constante.
15
Em homenagem a Pierre-Simon Laplace(1749-1827) nascido em Normadia na França.
Johann Peter Gustav Lejeune Dirichlet(1805-1859) nascido em Düren na França, hoje,
Alemanha.
16
CAPÍTULO 2. ELEMENTOS DA TEORIA
20
Demonstração: Usando a primeira fórmula de Green (2.3) para o campo
X = u∇u, temos
Z
Z
Z
∂u
2
||∇u|| dx + u∆udx =
u dSx
Ω
Ω
∂Ω ∂η
e daı́ usando que ∆u = 0 em Ω e u = 0 em ∂Ω, segue
Z
||∇u||2 dx = 0,
Ω
e portanto ||∇u|| = 0, implicando que u = C(cte). Entretanto u = em ∂Ω,
seguindo assim que u ≡ 0.
Teorema 2.3.3 (Unicidade) O problema de Dirichlet (2.5) possui, no
máximo, uma solução.
Demonstração: Sejam u, v : Ω → R funções pertencentes a C 2 (Ω) ∩ C(∂Ω)
soluções do problema (2.5). Então w = u − v é solução do problema de
Dirichlet
∆u = 0, em Ω
u = 0, em ∂Ω
no entanto, pelo teorema (2.3.2), tal problema possui somente a solução
trivial, logo u − v ≡ 0.
Capı́tulo 3
Equações de Euler-Lagrange
3.1
A Equação de Euler-Lagrange.
Consideraremos, a partir de agora, funções L : [0, 1] × R × R → R as quais
serão chamadas Lagrangianas, onde L = L(x, y(x), y 0 (x)) e y 0 simbolizará
dy
y 0 = dx
, sempre que não for previamente especificado. Em vários momentos, com o intuito de não sobrecarregarmos a notação, escreveremos somente
L = L(x, y, y 0 ). Desejaremos ainda que L possua derivadas parciais de 1a e 2a
ordem contı́nuas, sendo assim, em particular, L diferenciável, como função
de três variáveis.
Definiremos agora alguns espaços(vetoriais) de funções reais que serão
utilizados adiante:
Definição 3.1.1 O conjunto das funções contı́nuas que se anulam na
fronteira
C0 ([0, 1], R) := {f : [0, 1] → R; f é contı́nua; f (0) = f (1) = 0}
Definição 3.1.2 O conjunto das função de classe C k que se anulam na
fronteira
C0k ([0, 1], R) := {f : [0, 1] → R; f ∈ C k ; f (0) = f (1) = 0}
onde k ≥ 1 é um inteiro.
Obs 3.1.1 Note que tanto C0k ([0, 1], R) quanto C0 ([0, 1], R) são subespaços
vetoriais de C([0, 1], R) munidos das operações herdadas do mesmo.
Apresentemos agora um lema de suma importância:
21
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
22
Lema 3.1.1 (Lema fundamental do Cálculo das Variações) Seja
g : [0, 1] → R uma função contı́nua tal que
Z 1
g(x)f (x)dx = 0 ∀f ∈ C0 ([0, 1], R)
0
Então g ≡ 0.
Demonstração: Suponha, por absurdo, que g 6= 0. Então, sem perda de
generalidade, podemos supor, devido a continuidade de g, que g > 0 em um
intervalo [a, b] ⊆ [0, 1]. Defina h(x) := (a − x)(x − b) em [a, b] e h(x) = 0 em
[0, 1] ∩ [a, b]c . É imediato que h ∈ C0 ([0, 1], R). Por outro lado
Z
1
Z
g(x)h(x)dx =
0
b
g(x)h(x)dx > 0
a
uma vez que g(x)h(x) > 0 em [a, b]. Portanto obtivemos uma contradição à
nossa hipótese, donde g ≡ 0.
Obs 3.1.2 Note que o lema acima poderia ser reformulado para
f ∈ C0k ([0, 1], R) ao invés de f ∈ C0 ([0, 1], R), a demonstração seria, essencialmente a mesma, sendo feita apenas a definição de h(x) := ((a − x)(x − b))k
em [a, b] e h(x) = 0 em [0, 1] ∩ [a, b]c . É fácil ver que h ∈ C0k ([0, 1], R).
Definição 3.1.3 Fixados A, B ∈ R definiremos
A(A,B) := {y : [0, 1] → R; y = y(x) ∈ C 1 ; y(0) = A e y(1) = B}.
Chamaremos os elementos de A(A,B) de curvas admissı́veis.
Obs 3.1.3 Note que A(A,B) é uma variedade afim contida em C 1 ([0, 1], R)
com espaço tangente C01 ([0, 1], R), pois note que dadas duas curvas
y1 , y2 ∈ A(A,B) ambas não pertencem a C01 ([0, 1], R), entretanto y1 − y2 ∈
C01 ([0, 1], R).
Definição 3.1.4 Definiremos o funcional J : A(A,B) → R por
Z
J[y] :=
1
L(x, y(x), y 0 (x))dx
0
onde L é a Lagrangiana definida em (3.1).
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
23
Exemplo 6: Sejam y1 (x) = x e y2 (x) = x2 pertencentes a A(0,1) e considere
a seguinte lagrangiana
1
L(x, y, y 0 ) = (y 0 )2 + y 3 .
2
Assim segue
L(x, y1 , y10 ) = L(x, x, 1) =
1
+ x3
2
implicando assim que:
Z 1
1
1 1 1 1 1 1
3
J[y1 ] =
( + x3 )dx = x0 + x4 0 = + =
2
4
2 4
4
0 2
Temos ainda que:
1
L(x, y2 , y20 ) = L(x, x2 , 2x) = (2x)2 + x6
2
implicando
Z
1
2 1 1 1 2 1
17
(2x2 + x6 )dx = x3 0 + x7 0 = + = .
3
7
3 7
21
0
p
Exemplo 7: Considere ainda A(0,1) e a lagrangiana L(x, y, y 0 ) = 1 + (y 0 )2
e portanto o funcional
Z 1p
J[y] =
1 + (y 0 )2 dx.
J[y2 ] =
0
p
1 + |y 0 |
0
2
Usando o fato de que 1 + (y ) ≥ √ , temos que
2
Z 1p
Z 1
Z 1
√
1 + y0
1 + |y 0 |
0
2
√
√ dx = 2
J[y] =
1 + (y ) dx ≥
dx ≥
2
2
0
0
0
√
Note agora que y1 (x) = x ∈ A(0,1) e J[y1 ] = 2. Logo y1 minimiza tal
funcional. Daı́ eu diria que o objetivo é desenvolver uma teoria que permite
minimizar(maximizar) funcionais y 7→ J[y] mais gerais, para os quais os
métodos tradicionais do cálculo não dão suporte. Essa teoria é o Cálculo das
Variações.
Estaremos a partir de agora interessados em encontrar curvas admissı́veis,
que sejam extremos para J, na realidade curvas y estacionárias para o funcional J , i.e, desejamos encontrar curvas admissı́veis y tais que
δJ[y]h = 0 ∀ h ∈ C01 ([0, 1], R).
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
24
Consideremos então y ∈ A(A,B) uma curva admissı́vel que seja estacionária,i.e.,
δJ[y]h = 0
para toda curva h ∈ C0 ([0, 1], R). Fixada uma tal h, definamos a função
“perturbação” para J por ξ : (−, ) → R, > 0, dada por
ξ(t) := J[y + th].
O fato de y ∈ A(A,B) ser estacionária para J é equivalente a ξ 0 (0) = 0, uma
vez que ξ 0 (0) = δJ[y]h. Por outro lado,
Z 1
ξ(t) = J[y + th] =
L(x, y + th, y 0 + th0 )dx.
0
Como o sinal da integral é relativo a x e a derivada de ξ é relativa a t, temos:
Z 1
0
ξ (t) =
[Ly (x, y + th, y 0 + th0 )h + Ly0 (x, y + th, y 0 + th0 )h0 ]dx
0
donde, integrando por partes,
Z 1
1
0
ξ (t) =
Ly (x, y + th, y 0 + th0 )hdx + Ly0 (x, y + th, y 0 + th0 )h0
0
Z 1
d
Ly0 (x, y + th, y 0 + th0 )hdx
−
dx
0
Como h(0) = h(1) = 0, o segundo termo do lado direito da igualdade acima
se anula e obtemos
Z 1
d
0
ξ (t) =
[Ly (x, y + th, y 0 + th0 ) − Ly0 (x, y + th, y 0 + th0 )]hdx
dx
0
Fazendo t = 0, e usando que ξ 0 (0) = δJ[y]h = 0, chegamos finalmente a
Z 1
d
[Ly (x, y, y 0 ) − Ly0 (x, y, y 0 )]hdx = 0.
dx
0
Como h ∈ C01 ([0, 1], R) é arbitrária, segue da observação (3.1.1) que:
Ly (x, y, y 0 ) =
d
Ly0 (x, y, y 0 ).
dx
A equação acima é chamada de Equação de Euler1 -Lagrange2 associada ao
funcional J.
1
2
Leonhard Euler(1707-1783) nascido em Basiléia na Suiça.
Joseph-Louis Lagrange(1736-1813) nascido em Turim na Itália.
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
25
d
Obs 3.1.4 : Note a diferença entre dx
L e Lx . A primeira é a derivada de L
como função da variável x. A segunda é a derivada parcial de L como função
explicita de x, em outras palavras, se L = L(y, y 0 ) então terı́amos:
d
L = Ly y 0 + Ly0 y 00 e Lx = 0
dx
O teorema abaixo nos dá uma condição necessária para uma curva
y = y(x) ∈ A(A,B) seja uma curva extrema para J.
Teorema 3.1.1 Seja y = y(x) ∈ A(A,B) uma curva extremo para o funcional
J. Então y satisfaz a equação de Euler-Lagrange
Ly (x, y, y 0 ) =
d
Ly0 (x, y, y 0 ).
dx
Sabemos que dada uma solução y = y(x) da equação de Euler-Lagrange
d
Ly0 = Ly
dx
temos que a mesma é de classe C 1 ([0, 1], R), pois lembre-se que y = y(x) é
uma curva admissı́vel. Uma pergunta bastante pertinente seria tentar saber
se y 00 existe e se é contı́nua, e que condições sobre L deverı́amos impor para
que isso aconteça. O teorema a seguir responde tal pergunta.
Teorema 3.1.2 Suponha que y = y(x) possui derivada primeira contı́nua e
satisfaz a equação
d
Ly0 = Ly .
dx
Se L = L(x, y, y 0 ) possui derivadas parciais de primeira e segunda ordem
contı́nuas com respeito a todos os argumentos, então y = y(x) possui derivada
segunda contı́nua em todos os pontos x tais que
Ly0 y0 (x, y(x), y 0 (x)) 6= 0.
Demonstração: Seja g : [0, 1] → R dada por
g(t) := Ly0 (x + t∆x, y + t∆y, y 0 + t∆y 0 )
onde ∆x, ∆y e ∆y 0 são pequenas variações nas respectivas coordenadas.
Pelas hipóteses sobre L, g é de classe C 1 , e pelo teorema do valor médio de
Lagrange, deve existir c ∈ (0, 1) tal que
g(1) − g(0) = g 0 (c).
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
26
Temos então que
g 0 (c) = (Ly0 x ∆x + Ly0 y ∆y + Ly0 y0 ∆y 0 ) |t=c .
Fazendo ∆Ly0 = g(1) − g(0) = Ly0 (x + ∆x, y + ∆y, y 0 + ∆y 0 ) − Ly0 (x, y, y 0 )
temos que
∆Ly0
∆y ∆y 0 − Ly0 x + Ly0 y
= Ly 0 y 0
∆x
∆x t=c
∆x t=c
Note que existe o limite quando ∆x → 0 da expressão do lado esquerdo da
igualdade acima e tal limite é Ly − Ly0 x − Ly0 y y 0 (∗) uma vez que as derivadas
d
parciais de L são contı́nuas e dx
Ly0 = Ly . Daı́ segue que o limite quando
∆x → 0 da expressão do lado direito existe e é igual a (∗). Temos ainda que
lim Ly0 y0 |t=c = Ly0 y0
∆x→0
daı́ segue que se Ly0 y0 6= 0, então y 00 existe e
∆y 0
Ly − Ly0 x − Ly0 y y 0
=
∆x→0 ∆x
Ly0 y0
y 00 (x) = lim
e protanto contı́nua em x.
Façamos agora algumas considerações sobre casos particulares da equação
de Euler-Lagrange:
Caso 1: (L = L(x, y 0 )) Temos nesse caso que a equação de Euler-Lagrange
se reduz a :
d
Ly0 (x, y 0 ) = 0
dx
e portanto
Ly0 (x, y 0 ) = C(cte).
Caso 2: (L = L(y, y 0 )) Assumiremos aqui Ly0 y0 6= 0 e portanto nas hipóteses
do teorema anterior. Vejamos inicialmente que
Ly −
d
Ly0 = Ly − Ly0 y y 0 − Ly0 y0 y 00
dx
Multiplicando em ambos os lados por y 0 , temos:
Ly y 0 − (
d
Ly0 )y 0 = Ly y 0 − Ly0 y (y 0 )2 − Ly0 y0 y 00 y 0 .
dx
Note agora que
d
(L − y 0 Ly0 ) = Ly y 0 + Ly0 y 00 − y 00 Ly0 − y 0 Ly0 y y 0 − y 0 Lyy0 y 00
dx
= Ly y 0 − Ly0 y (y 0 )2 − Ly0 y y 0 y 00
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
27
E daı́ seguindo que:
d
d
Ly0 )y 0 =
(L − y 0 Ly0 ) .
dx
dx
Daı́, como y satisfaz a equação de Euler-Lagrange, segue que tal equação é
equivalente a
L(y, y 0 ) − y 0 Ly0 (y, y 0 ) = C(cte).
(Ly −
Caso 3:(L = L(x, y)) A equação de Euler-Lagrange nesse caso é equivalente
a:
Ly (x, y) = 0.
3.2
O Princı́pio de Fermat
Em 1657, Pierre de Fermat3 encontrou um novo método para determinar a trajetória dos raios luminosos, baseado na sua hipótese de que “a
natureza sempre atua pelo caminho mais curto”. Tal hipótese é conhecida
como princı́pio de Fermat e seu enunciado preciso é o seguinte é:
“Dentre todos os caminhos possı́veis para ir de um ponto a
outro, a luz segue aquele que é percorrido no tempo mı́nimo.”
Tal caminho escolhido pela luz é denominado de caminho ótico mı́nimo.
Para a propagação da luz num meio homogêneo, cujo ı́ndice de refração
da luz é constante, o caminho ótico mı́nimo também corresponde à distância
mı́nima, ou seja, o princı́pio de Fermat leva à propagação retilı́nea da luz
entre dois pontos.
Exemplo 8: (Propagação da luz em um meio inomogêneo). Um meio opticamente inomogêneo é um meio onde o ı́ndice de refração da luz (n) varia
continuamente de ponto em ponto, e portanto o mesmo acontece com sua
velocidade uma vez a velocidade da luz em tal meio que é dada por
c
v=
n
onde c é a velocidade da luz no vácuo. Suponha então que a luz se propague
num meio inomogêneo bidimensional xy e sua velocidade seja dada por uma
função contı́nua η = η(y). O caminho ótico mı́nimo y = y(x) da luz ligando
os pontos (0, A) e (1, B) minimiza o funcional
Z 1p
1 + y 02
J[y] =
dx.
η(y)
0
3
Pierre de Fermat(1601-1665) nascido em Beaumont-de-Lomagne na França.
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
28
Temos então que a lagrangiana associada a tal problema fı́sico é:
p
1 + y 02
L = L(y, y 0 ) =
.
η(y)
Temos que y deve satisfazer a equação de Euler-Lagrange para tal funcional,
daı́ calculando-a temos
p
1 + y 02
y 02
p
L − y 0 Ly0 =
−
= C(cte)
η(y)
η(y) 1 + y 02
portanto
p
1 + y 02 − y 02 = Cη(y) 1 + y 02 ,
implicando assim que
p
1
η(y) 1 + y 02 = (cte).
C
(3.1)
Seja φ = φ(x) o ângulo formado entre a reta tangente a y = y(x) no ponto x
e o eixo y, temos então que:
y 0 (x) = cotgφ(x) ⇒ 1 + y 02 = 1 + cotg2 φ(x) =
1
sen2 φ(x)
.
Segue então que a equação de Euler-Lagrange(3.1) é equivalente a
senφ(x)
= κ(cte)
η(y(x))
que é conhecida como Lei de Snell da óptica geométrica.
Aos leitores amantes da fı́sica façamos mais alguns comentários:
Suponhamos que um determinado meio inomogêneo tenhamos η(y) = ρy,
onde ρ é uma constante real, vejamos quem são os caminhos óticos mı́nimos:
Temos
y 2 (1 + y 02 ) = µ2
Note que |y| ≤ |µ|, daı́ podemos fazer a seguinte mudança de varı́ável
y = µsent temos:
dy
dx
= µcost ⇒ y 0
= µcost.
dt
dt
Assim
dy
dx
( )2 = y 02 ( )2
dt
dt
e daı́
dx
dx
µ2 sen2 t[( )2 + µ2 cos2 t] = µ2 ( )2 .
dt
dt
CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE
29
segue que
µ2 (
dx
dx 2
) (1 − sen2 t) = µ4 sen2 tcos2 t ⇒
= ±µsent
dt
dt
donde
x(t) = ±µcost + x0
e os caminhos óticos mı́nimos os cı́rculos com centro sobre o eixo x dados
por
(x − x0 )2 + y 2 = µ2 .
Capı́tulo 4
Problemas Variacionais
Neste capı́tulo estaremos interessados em estudar três problemas variacionais clássicos: O problema de distância mı́nima no em R2 , o problema da
Braquistócrona e o problema da superfı́cie de revolução de área mı́nima. Não
seremos, para efeito didático, rigorosos na resolução de tais problemas, uma
vez que iremos admitir que os funcionais associados a tais problemas admitem
mı́nimos e iremos encontrá-los através das equações de Euler-Lagrange como
curvas estacionárias. Lembre-se que o fato de uma curva admissı́vel y = y(x)
ser solução para a equação de Euler-Lagrande é uma condição necessária para
que a mesma seja um extremo para o funcional em questão, entretanto não é
uma condição suficiente para tal propósito. Tais condições suficientes serão
dadas nos capı́tulos adiante, quando fizermos um estudo analı́tico sobre a
segunda variação de tais funcionais.
4.1
Distância mı́nima no plano.
Talvez o problema variacional mais simples seja o da distância mı́nima no
plano
Dados dois pontos A e B fixados no plano cartesiano xy.
Qual, dentre todas as curvas planas unindo tais pontos, possui comprimento minimo?
Considere inicialmente os tais dois pontos A e B no plano xy, imagine agora
uma curva unindo tais pontos. Sem nenhuma perda de generalidade, podemos considerar curvas α : [0, 1] → R2 onde α(0) = A e α(1) = B. Esperamos
de tais curvas um pouco de regularidade e ainda, para efeito didático, imaginemos que tais curvas sejam gráficos de funções y = y(x) ou x = x(y) de
classe C 1 , ou seja, estamos falando de curvas admissı́veis em A(A,B) . Qual
das curvas em questão minimiza a distância entre tais pontos?
30
CAPÍTULO 4. PROBLEMAS VARIACIONAIS
31
Solução: Se y = y(x) ∈ A(A,B) , então o comprimento S(y) da curva y é
dado pela seguinte integral:
Z 1p
S(y) =
1 + y 02 dx.
0
Logo, a curva desejada é tal que minimiza o seguinte funcional:
Z 1p
J[y] =
1 + y 02 dx.
0
A lagrangiana associada é
p
L(x, y, y 0 ) =
1 + y 02 ,
de forma que a curva desejada deve satisfazer a equação de Euler-Lagrange
associada a tal funcional. Como
y0
Ly0 = p
1 + y 02
e L não depende explicitamente de x, a equação de Euler-Lagrange associada
é equivalente a
L − y 0 Ly0 =
p
y 02
1
1 + y 02 − p
=p
= C(cte).
1 + y 02
1 + y 02
Portanto y 0 (x) = λ(cte), e daı́
y(t) = λt + β
onde λ e β são constante tais que y(0) = A e y(1) = B. Reobtemos assim
o resultado do exemplo 7, i.e., Temos assim que a curva que minimiza a
distância entre tais pontos é tais pontos é o segmento de reta que os une.
4.2
Braquistócrona
Um dos problemas famosos na história da matemática é o problema da
braquistócrona1
1
“Braquistócrona” deriva do grego: brachistos, menor e chronos, tempo.
CAPÍTULO 4. PROBLEMAS VARIACIONAIS
32
Qual a curva ao longo da qual uma partı́cula desliza, sem
atrito, em tempo mı́nimo, atuando sobre a mesma apenas
a aceleração gravitacional, de um ponto P dado para outro ponto Q, o segundo ponto estando mais abaixo do que o
primeiro, mas não diretamente abaixo?
Esse problema foi proposto por Johann Bernoulli2 em 1696 como um desafio
aos matemáticos de sua época. Soluções corretas foram encontradas pelo
próprio Johann Bernoulli e ainda pelo seu irmão Jakob(Jacques) Bernoulli3 ,
além de Isaac Newton4 , Gottfried Leibniz5 e o Marquês de L’Hôpital6 .
Consideremos então um sistema de coordenadas cartesianas xy onde a
orientação do eixo y é contrária a usual. E consideremos tais pontos como
sendo P = (0, 0) e Q = (1, B).
Solução: Considerando nula a velocidade inicial da partı́cula , temos, pela
equação de Torricelli, que a velocidade da partı́cula em função de y é dada
por
p
v(y) = 2gy
onde g é a aceleração gravitacional. Temos ainda que o comprimento S da
curva y ligando P ao ponto (x, y(x)) é dado por
Z xp
S=
1 + y 02 ds.
0
Dessa forma, temos
p
d
S = 1 + y 02
dx
p
dS = 1 + y 02 dx
e daı́
Lembrando que,
v=
d
1
S ⇒ dS = vdt ⇒ dt = dS,
dt
v
obtemos
p
dt =
2
1 + y 02
√
dx,
2gy
Johann Bernoulli(1667-1748) nascido em Basiléia na Suiça.
Jakob(Jacques) Bernoulli(1654-1705) nascido em Basiléia na Suiça.
4
Sir Isaac Newton(1643-1727) nascido em Woolsthorpe na Inglaterra.
5
Gottfried Wilhelm von Leibniz(1646-1716) nascido em Leipzig na Alemanha.
6
Guillaume François Antoine Marquis de L’Hôpital(1661-1704) nascido em Paris na
França.
3
CAPÍTULO 4. PROBLEMAS VARIACIONAIS
33
por sua vez, implicando que o tempo τ0,B gasto para ir de P a Q é dado por:
Z 1p
1 + y 02
√
τ0,B =
dx
2gy
0
Logo a curva procurada minimiza o funcional:
Z 1p
1 + y 02
1
J[y] = √
dx,
√
y
2g 0
com lagrangiana associada
p
0
L = L(y, y ) =
e portanto,
1 + y 02
.
√
y
y0
Ly0 = √ p
.
y 1 + y 02
A equação de Euler-Lagrange nesse caso é equivalente a
p
1 + y 02
y 02
L − y 0 Ly0 =
−√ p
= C(cte)
√
y
y 1 + y 02
segue que
√ p
1 + y 02 − y 02 = C y 1 + y 02 ⇒ y(1 + y 02 ) = κ2 (cte).
Veja que |y| ≤ κ2 , daı́ chamando y = κ2 sen2 t, segue que
dy
dx
= 2κ2 sent cost ⇒ 2κ2 sent cost = y 0 .
dt
dt
Assim:
y[(
dx 2
dy
dx
) + y 02 ( )2 ] = κ2 ( )2 ,
dt
dt
dt
o que nos dá
κ2 sen2 t[(
dx 2
dx
) + 4k 4 sen2 t cos2 t] = κ2 ( )2 ,
dt
dt
ou ainda:
4κ6 sen4 t cos2 t = κ2 (
dx 2
) (1 − sen2 t).
dt
Logo,
4κ4 sen4 t = (
dx 2
dx
) ⇒
= 2κ2 sen2 t
dt
dt
CAPÍTULO 4. PROBLEMAS VARIACIONAIS
34
A escolha de dx
> 0 é devido y 0 > 0, resultante orientação imposta, e ainda
dt
dy
dx
> 0, logo dt > 0. Usando agora o fato de que 2sen2 t = 1 − cos2t, segue
dt
que:
dx
= κ2 − κ2 cos2t
dt
implicando em
sen2t
κ2
) e y(t) = (1 − cos2t)
2
2
finalmente, substituindo θ = 2t, temos:
x(t) = κ2 (t −
κ2
κ2
(θ − senθ) e y = (1 − cosθ)
2
2
Tal curva é conhecida como ciclóide.
x=
Obs 4.2.1 A ciclóide é obtida da seguinte forma: Considere um disco de
raio r > 0, imagine que o disco está inerte com centro no ponto (0, r) e
seja P o ponto do disco que está sobre a origem. Imagine agora que o disco
começa a rolar sobre o eixo x, sem atrito. A curva descrita pelo ponto P ao
longo do movimento é a ciclóide γ(t) = r(t − sent, 1 − cost).
4.3
Superfı́cie de revolução de área mı́nima
Mais um dos problemas variaionais clássico famosos é o seguinte problema:
Considere inicialmente uma curva y = y(x) ∈ A(A,B) , que não intercepta o
eixo x, sem perda de generalidade, y(x) > 0 ∀x ∈ [a, b] e seja σ a superfı́cie
de revolução gerada pela rotação de y em torno do eixo x
Qual dentre as curvas perfis y admissı́veis, com tais
hipóteses, gera a superfı́cie σ de área mı́nima?
Solução: Podemos encarar tal curva y = y(x) em R3 como sendo
γ : [0, 1] → R3 dada por γ(x) = (x, y(x), 0). Rotacionando γ em torno do eixo
x, encontramos a seguinte superfı́cie parametrizada Φ : [0, 1] × [0, 2π] → R3 ,
dada por:

  
1
0
0
x
Φ(x, θ) =  0 cosθ −senθ  .  y  = (x, ycosθ, ysenθ)
0 senθ cosθ
0
Temos assim que a área Sσ de σ é dada por:
Z 1 Z 2π
Sσ =
||Φx ∧ Φθ ||dθdx
0
0
CAPÍTULO 4. PROBLEMAS VARIACIONAIS
35
onde o sinal “∧” simboliza o produto vetorial das derivadas parciais de Φ.
Das derivadas parciais de Φ
Φx (x, θ) = (1, y 0 cosθ, y 0 senθ), Φθ (x, θ) = (0, −ysenθ, ycosθ),
obtemos
Φx ∧ Φθ = (yy 0 , −ycosθ, −ysenθ)
e daı́ uma vez que y > 0,
||Φx ∧ Φθ || = y
p
1 + y 02 ,
logo,
Z
1
Z
Sσ =
2π
y
0
p
1+
Z
y 02 dθdx
1
= 2π
0
y
p
1 + y 02 dx
0
Assim, a curva procurada é tal que minimiza o funcional
Z 1 p
J[y] = 2π
y 1 + y 02 dx,
0
onde a lagrangiana associada é dada por
L = L(y, y 0 ) = y
e portanto
p
1 + y 02
yy 0
Ly0 = p
1 + y 02
,
Usando novamente o fato da não-dependência explı́cita de x da lagrangiana,
a curva procurada deve satisfazer a equação de Euler-Lagrange associada a
tal funcional, que nesse caso é equivalente a
L − y 0 Ly0 = y
y.(y 0 )2
1 + y 02 − p
= C(cte),
1 + y 02
p
ou ainda
y=C
p
1 + (y 0 )2 .
Agora,
y=C
p
1 + y 02 ⇒ y 2 = C2 + C2 (y 0 )2 ⇒ C2 (y 0 )2 = y 2 − C2
e daı́,
dy
=
dx
r
y 2 − C2
=
C2
p
y 2 − C2
.
C
CAPÍTULO 4. PROBLEMAS VARIACIONAIS
36
Separando variáveis, temos
Cdy
p
y 2 − C2
= dx,
donde
x + C1 = C ln
y+
p
y 2 − C2
C
!
e portanto
y+
x + C1
= ln
C
p
y 2 − C2
C
!
e −
x + C1
C
= ln
y−
p
y 2 − C2
C
!
Assim,
e
x+C1
C
=
y+
p
y 2 − C2 −( x+C1 ) y −
C
e
=
C
Lembrando que
cosh t =
p
y 2 − C2
C
et + e−t
,
2
segue finalmente que
y(x) = C cosh
x + C1
C
.
Tal curva é conhecida com catenária.
Obs 4.3.1 A catenária será apresentada adiante como solução de um
problema variacional isoperimétrico.
Capı́tulo 5
Equação de Euler-Lagrange
generalizada.
5.1
Equação de Euler-Lagrange generalizada.
Consideremos agora a lagrangiana L : [0, 1] × RN × RN → R, onde
0
1 ≤ N é um número natural, L = L(x, y1 , ..., yN , y10 , ..., yN
), onde novamente
L possui derivadas parciais contı́nuas de primeira e segunda ordem em relação
a todas as coordenadas. O funcional associado a tal lagrangiana é
Z 1
0
J[y1 , ..., yN ] =
L(x, y1 , ..., yN , y10 , ..., yN
)dx.
0
Calculemos então a equação de Euler-Lagrangre associada a tal funcional,
portanto y1 , ..., yN curvas admissı́veis e h1 , ..., hN ∈ C01 ([0, 1], R), definindo
novamente a “ perturbação” ξ : (−, ) → R por
ξ(t) := J[y1 + th1 , ..., yN + thN ],
Temos
ξ 0 (t) =
Z
0
Z
=
1
N
X
Lyi hi +
N
X
Lyi0 h0i dx
i=1
N
1X
i=1
N
X
i=1
i=1
Lyi hi dx +
0
!
1
Lyi0 hi 0 −
Z
0
N
1X
i=1
d
Ly0 hi dx,
dx i
onde realizamos integração por partes na segunda igualdade. Usando o fato
de que hi (1) = hi (0) = 0, i = 1, ..., N e fazendo t = 0, temos
N Z 1
X
d
0
ξ (0) = δJ[y1 , ..., yN ](h1 , ..., hN ) =
(Lyi − Lyi0 )hi dx.
dx
i=1 0
37
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.38
Daı́, se y1 , ..., yN forem curvas que extremizem(estacionárias) o funcional,
temos ξ 0 (0) = 0 e como hi é arbitrária, novamente segue
Lyi =
d
Ly0 (i = 1, ..., N ).1
dx i
Tais equações são chamadas de equações de Euler-Lagrange associadas ao
funcional J[y1 , ..., yN ]. Vejamos agora uma versão do teorema (3.1.2) do capı́tulo
3 sobre regularidade das soluções para as equações de Euler-Lagrange
generalizadas:
Teorema 5.1.1 Suponha que y1 = y1 (x), ..., yN = yN (x) possuem derivadas
primeira contı́nua e satisfazem as equações
d
Ly0 = Lyi (i = 1, ..., N ).
dx i
0
Se L = L(x, y1 , ..., yN , y10 , ..., yN
) possui derivadas parciais de primeira e segunda ordem contı́nuas com relação a todos os argumentos, então
yi = yi (x) (i = 1, ..., N ) possui derivada segunda contı́nua em todos os
pontos x tais que
det(Lyi0 yj0 )2 6= 0.
Demonstração: : Imitando a demonstração do teorema (3.1.2), definamos
gi : [0, 1] → R por
0
0
gi (t) = Lyi0 (x + t∆x, y1 + t∆y1 , ..., yN + t∆yN , y10 + t∆y10 , ..., yN
+ t∆yN
)
Pelo teorema do valor médio de Lagrange, deve existir ci ∈ (0, 1) tal que
gi (1) − gi (0) = gi0 (ci ).
por outro lado, pela regra da cadeia,
gi0 (ci ) =
Lyi0 x ∆x +
N
X
Lyi0 yj ∆yj +
j=1
N
X
j=1
!
Lyi0 yj0 ∆yj0 t=ci
e segue daı́ que
d
z
}|i
"
# {
N
N
X
X
∆Lyi0
∆yj0
∆yj − Lyi0 x +
Lyi0 yj (
) =
Lyi0 yj0 (
)
∆x
∆x
t=ci ∆x
j=1
j=1
t=ci
1
2
A observação (3.1.2) é utilizada para cada integral em questão.
(Lyi0 yj0 )1≤i,j≤N é uma matriz quadrada de ordem N .
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.39
Tal sistema de equações pode ser visto matricialmente da forma

 ∆y0 

1
d1 |t=c1
∆x

 . 

..

 = Ly0 y0  ..  .
.
i j
dN |t=cN
0
∆yN
∆x
Pelas hipóteses sobre L, quando ∆x → 0 todos os limites das entradas da
matriz (Lyi0 yj0 ) e das entradas da matriz coluna à esquerda existem e são
funções contı́nuas. Assim, se
det(Lyi0 yj0 ) 6= 0
então o limite quando ∆x → 0 de cada entrada da matriz coluna à direita,i.e.,
yi00 , existe,sendo contı́nuo pela identidade matricial.
5.2
Geodésicas
Como uma aplicação as equações de Euler-Lagrange generalizadas falaremos de curvas sobre superfı́cies que minimizam distância. Consideremos
então uma superfı́cie σ parametrizada por
Φ = Φ(u, v)
Dados A, B ∈ σ, uma curva suave γ : [0, 1] → σ é dita minimizante se γ
possuir comprimento mı́nimo dentre todas as curvas suaves sobre σ ligando
A e B. Se γ : [0, 1] → σ é uma curva suave tal que γ(0) = A e γ(1) = B,
dada por
γ(x) = Φ(u(x), v(x))
o seu comprimento `(γ)é dado por
Z
`(γ) =
1
||γ 0 (x)||dx.
0
Pela regra da cadeia, temos y 0 (x) = u0 Φu + v 0 Φv , donde
||y 0 (x)||2 = hΦu , Φv i u02 + 2 hΦu , φv i u0 v 0 + hΦu , Φv i v 02 .
Denotando
hΦu , Φu i = E, hΦu , Φv i = F e hΦv , Φv i = G
temos
Z
`(γ) =
0
1
√
Eu02 + 2F u0 v 0 + Gv 02 dx
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.40
Dessa forma as curvas minimizantes γ = γ(x) de σ minimizam o funcional
Z 1√
J[u, v] =
Eu02 + 2F u0 v 0 + Gv 02 dx,
(5.1)
0
com lagrangiana associada
L = L(x, u, v, u0 , v 0 ) =
√
Eu02 + 2F u0 v 0 + Gv 02 .
e as equações de Euler-Lagrange correspondentes são
Lu =
d
d
Lu0 e Lv =
Lv0 .
dx
dx
Derivando
L2 = Eu02 + 2F u0 v 0 + Gv 02
implicitamente com respeito a u, temos:
2LLu = Eu u02 + 2Fu u0 v 0 + Gu v 02
e daı́
Lu =
1 Eu u02 + 2Fu u0 v 0 + Gu v 02
√
.
2 Eu02 + 2F u0 v 0 + Gv 02
Lv =
1 Ev u02 + 2Fv u0 v 0 + Gv v 02
√
.
2 Eu02 + 2F u0 v 0 + Gv 02
De forma análoga,
Temos ainda que:
2LLu0 = 2Eu0 + 2F v 0 ⇒ Lu0 = √
Eu0 + F v 0
,
Eu02 + 2F u0 v 0 + Gv 02
F u0 + Gv 0
.
Eu02 + 2F u0 v 0 + Gv 02
Portanto as equações de Euler-Lagrange são:
Eu u02 + 2Fu u0 v 0 + Gu v 02
d
2(Eu0 + F v 0 )
√
√
=
dx
Eu02 + 2F u0 v 0 + Gv 02
Eu02 + 2F u0 v 0 + Gv 02
Ev u02 + 2Fv u0 v 0 + Gv v 02
d
2(F u0 + Gv 0 )
√
√
=
dx
Eu02 + 2F u0 v 0 + Gv 02
Eu02 + 2F u0 v 0 + Gv 02
Exemplo 9: Seja σ o cilindro parametrizado por
2LLv0 = 2F u0 + 2Gv 0 ⇒ Lv0 = √
Φ : [0, 2π] × [0, 1] → R3 ,
Φ(θ, τ ) = (ρcosθ, ρsenθ, τ )
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.41
então
Φθ (θ, τ ) = (−ρsenθ, ρcosθ, 0), Φτ (θ, τ ) = (0, 0, 1)
implicando em:
E = hΦθ , Φθ i = ρ2 , F = hΦθ , Φτ i = 0 e G = hΦτ , Φτ i = 1
Logo, as curva minimizantes γ = γ(x) = Φ(θ(x), τ (x)) são tais que:
"
"
#
#
d
ρ2 θ 0
τ0
d
p
p
=0 e
= 0,
dx
dx
ρ2 θ02 + τ 02
ρ2 θ02 + τ 02
i.e.,
ρ2 θ 0
p
ρ2 θ02 + τ 02
= C1
τ0
e p
ρ2 θ02 + τ 02
= C2 .
Considerando τ = τ (θ(x)) segue, pela regra da cadeia, que τ 0 =
dτ 0
θ.
dθ
Assim,
dτ
τ0
= 0 ⇒ τ = λθ + β(cte)
dθ
θ
e daı́
γ(θ) = φ(θ(x), τ (θ(x))) = Φ(θ, λθ + β) = (ρcosθ, ρsenθ, λθ + β)
é uma hélice(se λ 6= 0) ou um cı́rculo(se λ = 0.). Se θ = θ(τ (x)), um
raciocı́nio análogo permite concluir que
γ(x) = Φ(λτ + β, τ ) = (ρcos(λτ + β), ρsen(λτ + β), τ ),
e dessa forma uma hélice(se λ 6= 0) ou um segmento de reta(λ = 0). Ademais,
com
|γ 0 (x)|2 = ρ2 (θ0 )2 + (τ 0 )2 6= 0,
temos, para cada x ∈ [0, 1], θ0 (x) 6= 0 ou τ 0 (x) 6= 0. Portanto, numa vizinhança de cada x ∈ [0, 1], θ = θ(τ (x)) ou τ = τ (θ(x)), e é imediato concluir
que as curvas acima constituem todas as soluções das equações de EulerLagrange.
Exemplo 10: Seja σ o cilindro circular reto com base de raio r = 1 e
parametrizado por:
Φ(θ, τ ) = (cosθ, senθ, τ ) 0 ≤ θ ≤ 2π 0 ≤ τ ≤ 1.
√
√
√
√
Sejam A = ( 2/2, − 2/2, 1/2) e B = (− 2/2, − 2/2, 1/2) segue, pelas
afirmações feitas acima, que a curva γ : [0, 2π] → σ dada por
3
π
3
π 1
γ(θ) = cos( θ − ), sen( θ − ),
4
4
4
4 2
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.42
é uma solução da equação de Euler-Lagrange associada ao funcional (5.1),
entretanto tal curva não é minimizante, pois note que
3
3
π
3
π
0
γ (θ) =
−sen( θ − ), −cos( θ − ), 0
4
4
4
4
4
e dessa forma
||γ 0 (θ)|| =
3
4
implicando que
3π
>π
2
e portanto γ não pode ser minimizante, uma vez que tais pontos estão sobre
um cı́rculo e portanto a distância entre os mesmos deve, obrigatoriamente,
ser menor que π.
`(γ) =
Obs 5.2.1 O exemplo acima mostra que, apesar de as curvas minimizantes
sobre uma superfı́cie parametrizada da forma Φ(u, v) serem solução das
Equações de Euler-Lagrange para o funcional (5.1), nem toda solução de
tais equações será minimizante. Contudo, fixado A ∈ σ é possı́vel mostrar
que se B estiver suficientemente próximo de A(em R3 ), então dentre todas
as soluções das equações de Euler-Lagrange associadas a (5.1) haverá uma
que é minimizante.3
Definição 5.2.1 Uma curva γ solução das equações de Euler-Lagrange
associadas ao funcional (5.1) é denominada de geodésica de σ.
Obs 5.2.2 Note que
γ minimizante ⇒ γ geodésica 6⇒ γ minimizante.
5.3
Problemas Isoperimétricos
Alguns dos problemas variacionais podem vir acompanhados de vı́nculos, ou
seja, uma condição adicional a qual as curvas admissı́veis devem ainda satisfazer. Um problema isoperimétrico é uma problema da seguinte forma:
Encontrar a curva y = y(x) que extremiza o funcional
Z 1
J[y] =
L(x, x, y 0 )dx
0
3
Ver Manfredo P. do Carmo, Differential Geometry of Curves and Surfaces.
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.43
onde y(0) = A, y(1) = B e cujo funcional
Z 1
K[y] =
M(x, y, y 0 )dx
0
possua, sobre as curvas admissı́veis, valor fixado `.
Para tentar resolver tais problemas enunciemos o seguinte teorema:
Teorema 5.3.1 (Multiplicador de Lagrange) Considere o funcional
Z 1
J[y] =
L(x, x, y 0 )dx,
0
onde as curvas admissı́veis satisfazem as condições
Z 1
y(0) = A e y(1) = B, K[y] =
M(x, x, y 0 )dx = `,
0
K[y] sendo outro funcional, e se J[y] tem um extremo para y = y(x) e y não
é um extremo para K[y] então existe uma constante λ tal que y = y(x) é um
extremo do funcional
Z
1
(L + λM)dx,
0
i.e., y = y(x) satisfaz a equação diferencial
d
d
Ly − Ly0 + λ My − My0 = 0.
dx
dx
Para uma demonstração do seguinte teorema veja I.M. Gelfand e S.V. Fomin,
Calculus of Variations.
5.4
A Catenária.
Um problema variacional isoperimétrico clássico bastante famoso é o
problema da Catenária:
Considere a determinação da forma tomada por um cabo
flexı́vel, inextensı́vel, com densidade uniforme ρ e de comprimento `, suspenso entre dois pontos A e B, e sujeito somente ao seu próprio peso. Fisicamente falando, estamos
à procura dentre todas as curvas de comprimento ` a que
possua energia potencial mı́nima, uma vez que a única força
atuando sobre a mesma é o seu peso.
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.44
Solução: A massa de pequena porção infinitesimal ∆si do cabo é dada por
ρ∆si . Portanto a força P atuando sobre tal porção é, orientado o eixo y para
cima, sendo g o módulo da aceleração gravitacional:
P = −ρg∆si .
Como tal força atua somente na direção y temos que a energia potencial(gravitacional)
V de tal porção do cabo é dada por
V = ρgyi ∆si .
Dessa forma, energia potencial Ep do cabo é dada por
Z 1
Z 1 p
Ep = ρg
yds = ρg
y 1 + y 02 dx,
0
0
onde, sem perda de generalidade, as extremidades do cabo são dadas por
y(0) = A e y(1) = B.
Logo a curva y = y(x) que procuramos minimiza o funcional
Z 1 p
J[y] = ρg
y 1 + y 02 dx,
0
sujeita ao vı́nculo
Z
K[y] =
1
p
1 + y 02 dx = `.
0
Temos então as lagrangianas
p
p
L(y, y 0 ) = y 1 + y 02 e M(y, y 0 ) = 1 + y 02
Note que os funcionais J e K não possuem extremos em comum, uma vez
que os extremos de K são retas e os extremos de J foram encontrados no
problema da superfı́cie de rotação de área mı́nima. Daı́ usando o teorema
e = L + λM, temos, pelo fato
anterior e considerando a lagrangiana auxiliar L
0
e = L(y,
e y ), que a equação de Euler-Lagrange é equivalente a
de L
e − y0L
ey0 = C(cte)
L
ou ainda
p
y 02 (y + λ)
(y + λ) 1 + y 02 − p
= C.
1 + y 02
Segue daı́
y+λ
p
=C
1 + y 02
temos que tal EDO foi resolvida na seção AJEITAR!!!, donde
x + C1
y(x) = coshC(
) + C2
C
Concluı́mos assim que a curva procurada é a catenária.
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.45
5.5
O Problema Isoperimétrico Original.
Sem dúvida nenhuma, o problema isoperimétrico mais famoso é:
Considere como sendo as curvas admissı́veis o conjunto das
curvas fechada, que não auto-intersectam, com comprimento
total `. Qual, dentre tais curvas admissı́veis, encerra maior
área?
Solução: Sejam x = x(t), y = y(t) onde 0 ≤ t ≤ 1 e x(0) = x(1) =
0 e y(0) = y(1) = 0 a representação paramétrica das curvas adimı́ssı́veis
discutidas acima. Tais curvas devem satisfazer
Z 1p
K[x, y] =
ẋ2 + ẏ 2 dt = `
0
e a curva admissı́vel procurada deve ser um extremo para o funcional
Z 1
J[x, y] =
(xẏ − y ẋ)dt,
0
pois tal expressão determina a área encerrada pela curva γ(t) = (x(t), y(t)),
em virtude do teorema de Green. Temos que tais funcionais não possuem
pontos extremos em comum, uma vez que os pontos extremos de K são
segmentos de retas e não é difı́cil de verificar4 que os pontos extremos de J
satisfazem y = C1 e x = C2 . Introduzindo novamente a lagrangiana auxiliar
p
e y, ẋ, ẏ) = 1 (xẏ − y ẋ) + λ ẋ2 + ẏ 2 .
L(x,
2
Segue do teorema do multiplicador de Lagrange que a curva desejada satisfaz
as equações
eẋ
e
dL
ex dLẏ = L
ey ,
=L
dt
dt
seguindo que
!
!
1
1
d
1
λẋ
d 1
λẏ
ẏ =
− y+p
, − ẋ =
x+ p
2
dt
2
2
dt 2
ẋ2 + ẏ 2
ẋ2 + ẏ 2
e integrando com relação a t segue
λẋ
y + C1 = p
ẋ2 + ẏ 2
4
− x + C2 = p
λẏ
ẏ 2 + ẏ 2
Decorre direto das equações de Euler-Lagrange associadas a J.
.
CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.46
Note que ẋ 6= 0 ou ẏ 6= 0, daı́, usando que y 0 =
ẏ
, segue
ẋ
−x + C2
dy
=
,
y + C1
dx
separando variáveis
(−x + C2 )dx = (y + C1 )dy,
e integrando em ambos os lados, segue que a curva procurada é
(y + C1 )2 + (x − C2 )2 = r2
como escolhemos curvas passando sobre a origem, segue
y 2 + x2 = C21 + C22 .
Portanto a curva procurada o cı́rculo de raio
p
`
C21 + C22 =
.
2π
Capı́tulo 6
Equações de Hamilton
6.1
As Equações de Hamilton
Consideremos as equações de Euler-Lagrange
dLyi0
= Lyi (i = 1, ..., N )
dx
(6.1)
associadas ao funcional
Z
J[y1 , ..., yN ] =
1
0
L(x, y1 , ..., yN , y10 , ..., yN
)dx,
0
e suponhamos ainda que a lagrangiana L satisfaç a condição
det Lyi0 yj0 6= 0.
As equações (6.1) formam então um sistema de N equações diferenciais de
segunda ordem. No entanto, tal sistema pode ser reduzido a um sistema de
2N equações de primeira ordem(a nomenclatura “reduzida” está associada
à ordem da derivada e não ao número de equações), que, em várias circunstâncias, é bastante conveniente. Por seguinte, a partir de agora, iremos
introduzir as chamadas variáveis canônicas. Escrevendo:
pi = Lyi0 (i = 1, ..., N ),
0
em termos das variáveis
gostarı́amos de expressar as funções y10 , ..., yN
x, y1 , ..., yN , p1 , ..., pN ,
47
(6.2)
CAPÍTULO 6. EQUAÇÕES DE HAMILTON
48
ou seja, estamos interessados numa mudança de variável conveniente, dada
por (6.2), que é perfeitamente possı́vel, uma vez que o jacobiano1
det(
∂pi
) = det(Lyi0 yj0 ) 6= 0.
∂yj0
Tal mudança de variável é garantida apenas localmente, pelo teorema da
função inversa.2
0
Daı́ expressaremos a função L = L(x, y1 , ..., yN , y10 , ..., yN
) em termos uma
0
0
nova função H = H(x, y1 , ..., yN , y1 , ..., yN ) relativa a L dada por:
H = −L +
N
X
yi0 pi
i=1
onde yi0 = yi0 (x, y1 , ..., yN , p1 , ..., pN ).
A função H é denominada de
Hamiltoniana correspondente a L. E finalmente introduzimos as novas variáveis
x, y1 , ..., yN , p1 , ..., pN , H
chamadas de variáveis canônicas.
Vejamos como se transformam as equações de Euler-Lagrange associadas a
J mediante as variáveis canônicas. Temos inicialmente, pela definição de H
que
N
N
X
X
0
dH = −dL +
pi dyi +
yi0 dpi
i=1
i=1
usando a expressão
dL = Lx +
N
X
Lyi dyi +
i=1
N
X
Lyi0 dyi0
i=1
segue
dH = −Lx −
N
X
i=1
Lyi dyi −
N
X
L
yi0
dyi0
i=1
+
N
X
i=1
pi dyi0
+
N
X
yi0 dpi
i=1
Encontrarı́amos agora o seguinte problema:
Como expressar dyi0 em função de x, y1 , ..., yN , p1 , ..., pN ?
1
Em homenagem a Carl Gustav Jacob Jacobi(1804-1851) nascido em Potsdam na
Prússia, hoje Rússia.
2
Para maiores informações veja Elon Lages Lima, Análise Real Vol.II.
CAPÍTULO 6. EQUAÇÕES DE HAMILTON
49
No entanto, lembre-se que
pi = Lyi0 (i = 1, ..., N )
e portanto
dH = −Lx −
N
X
Lyi dyi +
i=1
N
X
yi0 dpi
i=1
dyi0 .
não envolvendo assim os
Por outro lado,
H = H(x, y1 , ..., yN , p1 , ..., pN ), e portanto
dH = Hx −
N
X
Hyi dyi +
i=1
N
X
lembre-se que
Hpi dpi
i=1
daı́ pela unicidade da diferencial, segue que:
Hx = −Lx , Hyi = −Lyi e Hpi =
dyi
(i = 1, ..., N )
dx
Veja que as quantidades Lyi e yi0 são conectadas as derivadas de H pelas
fórmulas acima. Supondo satisfeitas as equações de Euler-Lagrange
dLyi0
= Lyi (i = 1, ..., N )
dx
temos o seguinte sistema de equações:
dyi
= Hpi
dx
dpi
= −Hyi (i = 1, ..., N )
dx
As equações acima são chamadas de equações de Hamilton3 .
6.2
Integral Primeira para as Equações de
Hamilton
Definição 6.2.1 Uma função F = F(x, y1 , ..., yN , p1 , ..., pN ) é dita uma curva integral para um sistema de equações diferenciais se a mesma é constante
ao longo de cada curva integral do sistema, ou seja, sejam yi = yi (x) e
pi = pi (x) soluções de tal sistema, então
d
F(x, y1 (x), ..., yN (x), p1 (x), ..., pN (x)) = 0
dx
3
William Rowan Hamilton(1805-1865) nascido em Dublin na Irlanda.
CAPÍTULO 6. EQUAÇÕES DE HAMILTON
50
0
Consideremos inicialmente uma Lagrangiana L = L(y1 , ..., yN , y10 , ..., yN
) que
não dependa explicitamente de x, segue dai que a Hamiltoniana associada à
mesma
N
X
H = −L +
yi0 pi
i=1
também não depende explicitamente de x. Assim segue que
N
N
N dH X
dyi X
dpi X
dyi
dpi
=
Hy i
+
Hpi
=
H yi
+ Hpi
dx
dx
dx
dx
dx
i=1
i=1
i=1
Supondo satisfeitas as equações de Hamilton
dyi
dpi
= Hpi ,
= −Hyi (i = 1, ..., N )
dx
dx
e portanto
N
dH X
=
(Hyi Hpi − Hpi Hyi ) = 0,
dx
i=1
ao longo das curvas que extremizam J. Assim segue que se L não depende
explicitamente de x então a Hamiltoniana H é uma curva integral para as
equações de Hamilton. Caracterizemos agora quando uma função arbitrária
Φ = Φ(y1 , ..., yN , p1 , ..., pN )
vem a ser uma curva integral para as equações de Hamilton. Temos, ao longo
das curvas integrais para as equações de Hamilton
N
N
N
dΦ X
dyi X
dpi X
=
Φyi
+
Φpi
=
(Φyi Hpi − Φpi Hyi )
dx
dx
dx
i=1
i=1
i=1
denotando
[Φ, H] :=
N
X
(Φyi Hpi − Φpi Hyi )
i=1
segue
dΦ
= [Φ, H],
dx
donde a expressão do lado direito da igualdade acima é chamado de colchete
de Poisson4 . Segue daı́ que a identidade acima determina uma condição
necessária e suficiente para as equações de Hamilton possuı́rem Φ como
integral primeira, ou seja, Φ é uma integral primeira para as equações de
Hamilton se, e somente se o colchete de Poisson [Φ, H] é identicamente nulo.
Obs 6.2.1 A condição suficiente acima é dada pelo teorema5 de Cauchy4
5
Siméon Denis Poisson(1781-1840) nascido em Pithiviers na França.
Ver Jorge Sotomayor, Lições de Equações Diferenciais Ordinárias.
CAPÍTULO 6. EQUAÇÕES DE HAMILTON
51
Picard6 .
0
Obs 6.2.2 Se Φ = Φ(x, y1 , ..., yN , y10 , ..., yN
) então a condição é substituı́da
por
d
Φ = Φx + [Φ, H].
dx
Exemplo 11: Usaremos as equações de Hamilton para encontrar extremos
para o funcional
Z p
p
x2 + y 2 1 + y 02 dx
p
x2 + y 2 1 + y 02 , e daı́ segue que
p
y 0 x2 + y 2
Ly0 = p
1 + y 02
Solução: Temos que L(x, y, y 0 ) =
p
fazendo p = Ly0 , temos
p
p2 (1 + y 02 ) = y 02 (x2 + y 2 ) ⇒ p2 = y 02 (x2 + y 2 − p2 ) ⇒ y 0 = p
x2
como
d
y = Hp , segue
dx
p
Hp = p
x2
+ y 2 − p2
+ y 2 − p2
.
Lembrando da expressão do Hamiltoniano,
H = −L + y 0 p
como
p
p
x2 + y 2
x2 + y 2
02 = p
1+y = 2
⇒
1
+
y
x + y 2 − p2
x2 + y 2 − p2
02
temos
x2 + y 2
L(x, y, y 0 ) = p
x2 + y 2 − p2
e portanto
p
−(x2 + y 2 )
p2
p
p
H(x, y, p) =
+
= − x2 + y 2 − p2
x2 + y 2 − p2
x2 + y 2 − p2
6
Charles Émile Picard(1856-1941) nascido em Paris na França.
,
CAPÍTULO 6. EQUAÇÕES DE HAMILTON
52
lembrando que
dp
= −Hy
dx
implicando em
y
d
p= p
dx
x2 + y 2 − p2
p
d
y=p
dx
x2 + y 2 − p2
Considerando p = p(y(x)), segue, pela regra da cadeia que
y
dp
=
dy
p
daı́ separando variáveis temos:
pdp = ydy ⇒ p2 = y 2 + C2 (cte)
substituindo o valor de p temos
p y
p
( )2 + 1
y 2 + C2
dy
= √
= p Cx 2
dx
(C) + 1
x 2 + C2
separando variáveis novamente
dy
( Cy )2
p
+1
=p
dx
( Cx )2
+1
seguindo
r
ln
y
y
( )2 + 1 −
C
C
r
= ln
x
x
( )2 + 1 −
C
C
+ C1
vamos supor, por simplicidade, que C1 = 0. Então
r
r
y 2
x
1
( ) + 1 − ( )2 + 1 = (y − x)
C
C
C
elevando ao quadrado em ambos os lados
r
r
y 2
x 2
y 2
x 2
y
2
x
( ) +2+( ) −2
( ) +1
( ) + 1 = ( )2 − xy + ( )2
C
C
C
C
C
C
C
seguindo assim
r
C
r
y 2
x 2
( ) +1
( ) + 1 = C + xy
C
C
CAPÍTULO 6. EQUAÇÕES DE HAMILTON
e daı́
C
2
2
y2
x
+1
+ 1 = C2 + 2Cxy + x2 y 2
C2
C2
implicando
C
2
y 2 x2
y2
x2
+ 2 + 2 + 1 = C2 + 2Cxy + x2 y 2
C4
C
C
e portanto
y 2 x2
+ y 2 + x2 = 2Cxy + x2 y 2
2
C
e finalmente a solução é:
1
2
2
− 1 + y 2 + x2 − 2Cxy = 0.
y +x
2
C
53
Capı́tulo 7
O Princı́pio Variacional de
Hamilton
7.1
Dinâmica Lagrangiana
“Desde que existe como ciência, a Fı́sica tem como seu objetivo mais cobiçado a solução do problema de condensar todos
os fenômenos naturais num único princı́pio. Dentre as leis
mais ou menos gerais que marcam as conquistas da ciência
fı́sica durante o curso dos últimos séculos, o princı́pio da
mı́nima ação é talvez aquele que, no que se refere à forma e ao conteúdo, mais se aproxima desse objetivo final da
pesquisa teórica”.
Max Planck
Vı́nculos cinemáticos são limitações às possı́veis posições e velocidades
das partı́culas de um sistema mecânico, restringindo a priori o movimento. Se
y1 , ..., yN são coordenadas arbitrárias usadas para descrever a configuração1
de um sistema mecânico, um vı́nculo é chamado holônomo2 quando pode ser
expresso por uma equação da forma
f (t, y1 , ..., yN ) = 0,
(7.1)
onde f é uma função com um certo grau de regularidade. Em sistemas
holônomos é possı́vel introduzir um certo número N de variáveis independentes, denotadas genericamente por q1 , ..., qN e denominadas coordenadas
generalizadas de sorte que:
1
A posição de cada uma das partı́culas de um sistema mecânico num dado instante
define a configuração do sistema no referido instante.
2
Do grego hólos(inteiro, completo) e nómos(regra, lei).
54
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
55
• o vetor posição de cada partı́cula é determinado univocamente em cada
instante pelos “qs”;
• os vı́nculos, supostos todos da forma (7.1), são identicamente satisfeitos
se expressos em termos dos “qs”.
O espaço cartesiano N dimensional cujos pontos são as N -uplas formadas
pelas coordenadas generalizadas é chamado de espaço de configuração. A
medida que o tempo passa, o estado do sistema se modifica e o ponto
representativo do sistema descreve uma curva no espaço de configuração,
já que as equações q1 = q1 (t), ..., qN = qN (t) são a representação paramétrica
de uma curva tendo t como parâmetro. Designaremos, por simplicidade,
q = (q1 , ..., qN ).
Princı́pio de Hamilton: Dado um sistema mecânico holônomo descrito
pela lagrangiana L(t, q, q̇) seu movimento do instante t1 para o instante t2 é
tal que a ação
Z
t2
A(q) =
L(t, q, q̇)dt
t1
é mı́nima(mais geralmente, estacionária) para a trajetória real, mantidos
fixos os pontos inicial e final da trajetória no espaço de configuração.
Obs 7.1.1 O princı́pio de Hamilton é também conhecido como princı́pio da
mı́nima ação.
Considere um sistema mecânico N partı́culas, onde não são impostos nenhum tipo de vı́nculo3 , suponha que tal sistema possua uma energia potencial
V, i.e., existe uma função
V = V(t, x1 , y1 , z1 , ..., xN , yN , zN ),
tal que a força atuando na i-ésima partı́cula tem como componentes
Xi = −
∂V
∂V
∂V
, Yi = −
, Zi = −
.
∂xi
∂yi
∂zi
A quantidade definida por, onde mi simboliza a massa da i-ésima partı́cula,
N
1X
T =
mi (ẋ2i + ẏi2 + żi2 )
2 i=1
3
Para uma apresentação com alguns vı́culos incluı́dos veja Robert Weinstock, Calculus
of Variations.
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
56
é chamada de energia cinética do sistema4 . A Lagrangiana que descreve tal
sistema mecânico é defina por
L = T − V.
Tal lagrangiana é ainda conhecida com Potencial Cinético. Pelo princı́pio de
Hamilton, a evolução de tal sistena dar-se-á de um instante t1 a um intante
t2 de forma que a ação
Z
t2
A=
Ldt
t1
é estacionário. Portanto as equações de Euler-Lagrange
Lxi =
dLx˙i
dLy˙i
dLz˙i
, Lyi =
, Lzi =
dt
dt
dt
devem ser satisfeitas para i = 1, ..., N . Usando as expressões da energia
cinética e da energia potencial, segue
d
mi ẋi
dt
d
−Vyi = mi ẏi
dt
d
−Vzi = mi z˙i .
dt
−Vxi =
(7.2)
Substituindo −Vxi = Xi , −Vyi = Yi e −Vzi = Zi o sistema acima é reduzido
a
mi ẍi = Xi , mi ÿi = Yi , mi z¨i = Zi ,
que são justamente as equações de Newton do movimento do sistema de N
partı́culas. As variáveis canônicas correspondentes a ação A são
pix = Lẋi = mi ẋi ,
piy = Lẏi = mi ẏi ,
piz = Lżi = mi z˙i ,
as quantidades pix , piy e piz são chamadas de momentos generalizados e a
quantidade definida por
H=
N
X
(ẋi pix + ẏi piy + z˙i piz ) − L = 2T − (T − V) = T + V,
i=1
4
Como não são impostos vı́nculos as própria coordenadas x1 , y1 , z1 , ..., xN , yN , zN são
as coordenadas generalizadas do sistema.
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
57
é denominada de energia mecânica ou energia total do sistema. Suponha
que um dado sistema mecânico é conservativo, i.e., a energia potencial V
não depende explicitamente do tempo, daı́ decorre que a energia mecânica é
conservada, i.e., ele permanece constante das soluções do sistema (7.2). De
fato,
dT
dV
dH
=
+
,
dt
dt
dt
usando as expressões da energia cinética e da energia potencial, segue
N
d
1X
d
d
(T + V) =
mi (ẋi 2 + ẏi 2 + z˙i 2 ) + V(x1 , y1 , z1 , ..., xN , yN , zN )
dt
2 i=1
dt
dt
=
N
X
mi (ẋi ẍi + ẏi ÿi + +z˙i z¨i ) +
i=1
N
X
(Vxi ẋi + Vyi ẏi + Vzi z˙i )
i=1
e daı́
N
N
N
X
X
X
d
dH
= (T +V) =
ẋi (mi ẍi +Vxi )+
ẏi (mi ÿi +Vyi )+
z˙i (mi z¨i +Vzi ),
dt
dt
i=1
i=1
i=1
daı́ usando
d
mi ẋi = mi ẍi
dt
d
−Vyi = mi ẏi = mi ÿi
dt
d
−Vzi = mi z˙i = mi z¨i ,
dt
−Vxi =
segue que
dH
= 0 ⇒ H = C(cte).
dt
A expressão acima é conhecida como Lei da Conservação da Energia Mecânica.
Obs 7.1.2 Vejamos um exemplo simples onde a Lei da conservação da Energia Mecânica é obtida de forma mais simples. Considere um campo de
forças F : Ω ⊆ R3 → R3 conservativo, atuando sobre uma partı́cula P de
massa m e seja V o seu potencial, i.e.,
∇V(x, y, z) = −F(x, y, z).
Seja γ : [0, 1] → Ω uma curva suave descrevendo a trajetória de P sobre Ω ao
longo do tempo. Seja A = γ(0) e B = γ(1), o trabalho W(A,B) a ser realizado
para mover P de A até B é dado por
Z 1
W(A,B) =
F(γ(t)).γ 0 (t)dt
0
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
58
onde o ponto “ponto(.)” simboliza o produto interno em R3 . Pela segunda
lei de Newton, F(γ(t)) = mγ 00 t), daı́
Z 1
Z 1
1
d
0
00
W(A,B) = m
γ (t).γ (t)dt = m
(||γ 0 (t)||2 )dt
2
dt
0
0
1
1
0
2
0
2
=
m||γ (1)|| − m||γ (0)|| = TB − TA
2
2
donde as quantidades TA e TB representam a energia cinética da partı́culas
nos pontos indicados. Por outro lado,
Z 1
Z 1
0
W(A,B) =
F(γ(t)).γ (t)dt = −
∇V(γ(t))γ 0 (t)dt
0
0
Z 1
d
= −
(V(γ(t))dt = V(γ(0)) − V(γ(1)) = VA − VB
0 dt
donde as quantidades VA a VB representam a energia potencial da partı́cula
nos pontos indicados, seguindo então que
VA − VB = TB − TA ⇒ TA + VA = TB + VB ,
ou seja, a energia mecânica é a mesma nos pontos A e B, no entanto, o
mesmo procedimento pode ser feito para quaisquer dois pontos sobre a curva
γ, e portanto a energia mecânica é conservada.
7.2
Oscilador Harmônico Simples
Considere uma partı́cula de massa m fixada a uma mola e sobre a mesma atuando uma força restauradora −κx, i.e., oscilador harmônico simples.
Como a força atuando sobre a partı́cula é −κx, a energia potencial para a
mesma é
1
V(x) = κx2
2
e a energia cinética
1
T (ẋ) = mẋ2
2
e portanto o potencial cinético associado a tal sistema fı́sico é
1
1
L(x, ẋ) = mẋ2 − κx2
2
2
e daı́ o funcional ação de tal sistema é
Z
1 t1
J[x] =
(mẋ2 − κx2 )dt.
2 t0
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
59
uma vez que Lẋ = mẋ, implicando que p = mẋ, seguindo que
L(x, ẋ) =
1 2 1 2
ṗ − κx .
2m
2
Temos a Hamiltoniana associada
1
1 2 p2
1
1 2
H(x, p) = κx2 −
p +
= κx2 +
p,
2
2m
m
2
2m
daı́, as equações de Hamilton são:
ẋ = Hp , ṗ = −Hx ⇒ ẋ =
p
, ṗ = −κx
m
note daı́ que:
mẍ = ṗ = −κx
que é 2a lei de Newton. Calculemos ainda
[x, H] =
∂x
∂x
Hp −
Hx = Hp = ẋ
∂x
∂p
e mais
[p, H] =
como p = mẋ segue que
∂p
∂p
Hp − Hx
∂x
∂p
∂p
= 0, e portanto
∂x
[p, H] = −Hx = ṗ.
Vale a pena relembrar que fato de H não depender explicitamente de t implica
que H é uma integral primeira para as equações de Hamilton associadas a J.
7.3
Forças Centrais.
Usaremos aqui o princı́pio de Hamilton mı́nima para a formulação variacional do problema do movimento plano de uma partı́cula de massa m atraı́da
para a origem do sistema de coordenadas por uma força inversamente proporcional ao quadrado da distância a origem, ou seja, uma força central5 .
Usaremos coordenadas polares:
x(t) = r(t)cosθ(t) e y(t) = r(t)senθ(t)
5
Uma força é dita central quando ela depende somente da distância do corpo a um
referencial tomado.
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
60
temos que a energia cinética T atuando na partı́cula é
1
T = m[ẋ2 + ẏ 2 ]
2
como
ẋ = ṙcosθ − rsenθ θ̇ , ẏ = ṙsenθ + rcosθ θ̇,
segue que
1
T (r, ṙ, θ, θ̇) = m(ṙ2 + r2 θ̇2 ).
2
Temos que o quadrado distância da partı́cula a origem é r2 , e portanto a
força F atuando sobre a tal é
F(r) =
κ
r2
implicando que
κ
V(r) = − ,
r
onde V é a energia potencial da partı́cula. Daı́ segue que a Lagrangiana
associada a este problema fı́sico é
1
1
κ
H(r, θ, ṙ, θ̇) = mṙ2 + m2 θ̇2 + ,
2
2
r
daı́, pelo princı́pio de Hamilton, a evolução do sistema de instante t1 para o
instante t2 dar-se-á de forma que o funcional ação
Z t2
1
1
κ
J[r, θ] =
[ mṙ2 + mr2 θ̇ + ]dt
2
r
t1 2
sejá minimizado(estacionário).
Desejamos encontrar a Hamiltoniana
H(r, θ, pr , pθ ) associada a Lagrangiana L. Temos que:
pr
m
pθ
pθ = Lθ̇ ⇒ pθ = mr2 θ̇ ⇒ θ̇ =
mr2
Assim a Lagrangiana é
pr = Lṙ ⇒ pr = mṙ ⇒ ṙ =
L(r, θ, ṙ, θ̇) =
1 2
1 2 κ
pr +
p +
2m
2mr2 θ r
e portanto a Hamiltoniana associada ao sistema é
H(r, θ, pr , pθ ) = −L(r, θ, ṙ, θ̇) + ṙpr + θ̇pθ
CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON
61
seguindo que
H(r, θ, pr , pθ ) =
1 2
1 2 κ
pr +
p −
2m
2mr2 θ r
daı́ as equações de Hamilton são
ṙ = Hpr p˙r = −Hr
usando que
Hr =
θ̇ = Hpθ p˙θ = −Hθ ,
κ
pθ
Hθ = 0 Hpr = mpr Hpθ =
2
r
mr2
segue
ṙ = mpr p˙r = −
κ
pθ
θ̇ =
p˙θ = 0.
2
r
mr2
Calculemos os colchetes de Poisson
[Pr , H] = −
∂pr
κ
Hr = − 2
∂pr
r
[Pθ , H] = −
∂pθ
HHθ = 0
∂pθ
Logo pθ é uma integral primeira para as equações de Hamilton de tal problema. Calculemos as equações(explı́citas) do movimento da partı́cula. Temos
1
1
κ
L(r, θ, ṙ, θ̇) = mṙ2 + mr2 θ̇2 +
2
2
r
logo as equações de Euler-Lagrange são
L − ṙLṙ = C1 (cte)
e daı́
L − θ̇θ̇ = C2 (cte),
1
1
κ
− mṙ2 + mr2 θ̇2 + = C1
2
2
r
e
1 2 1 2 2 κ
mṙ − mr θ̇ + = C2 ,
2
2
r
2κ
implicando assim que
= C1 + C2 ⇒ r = ρ(cte). Daı́
r
mr2 θ̇2 = C1 − C2
implicando
θ̇2 = cte ⇒ θ = µt + β
onde µ e β são constantes. E finalmente as equações do movimento são
x(t) = ρcos(µt + β) e x(t) = ρsen(µt + β)
ou seja, a partı́cula está movendo-se sobre cı́rculo de raio ρ e centro na origem.
Capı́tulo 8
A Equação de Euler-Lagrange
em RN .
8.1
A Equação de Euler-Lagrange em RN .
Consideremos agora L : Ω × R × RN → R onde Ω ⊆ RN é um aberto,
conexo e limitado com fronteira ∂Ω suave e L possuindo derivadas parciais
contı́nuas de primeira e segunda ordem com respeito a todas as variáveis em
questão. Seja ainda funcional
Z
J[u] =
L(x, u, ∇u)dx
Ω
1
0
onde u ∈ C (Ω, R) ∩ C (∂Ω, R) e x = (x1 , ..., xN ), dx = dx1 ...dxN , tal integral
simboliza a integral múltipla sobre a região Ω e ∇u = (ux1 , ..., uxN ) representa
o vetor gradiente associado a função u = u(x).
Segue um lema análogo ao do capı́tulo 3.
Lema 8.1.1 (Lema fundamental do Cálculo das Variações) Seja
g : Ω → R uma função contı́nua tal que
Z
g(x)f (x)dx = 0 ∀f ∈ C0 (Ω, R)
Ω
Então g ≡ 0.
Demonstração: Suponha, por absurdo, que g 6= 0. Então, sem perda de
generalidade, podemos supor, devido a continuidade de g, que g > 0 em uma
bola aberta Br (x0 ) ⊆ Ω, para algum r > 0. Defina h(x) := r2 − ||x − x0 ||2
em Br (x0 ) e h(x) = 0 em Br (x0 )c ∩ Ω. É imediato que h ∈ C0 (Ω, R). Por
outro lado
Z
Z
g(x)h(x)dx =
g(x)h(x)dx > 0
Ω
Br (x0 )
62
CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN .
63
uma vez que g(x)h(x) > 0 em Br (x0 ). Portanto obtivemos uma contradição
à nossa hipótese, donde g ≡ 0.
Obs 8.1.1 Da mesma forma como no capı́tulo 3, o lema acima pode ser
modificado para h ∈ C0k (Ω), pois basta definir h(x) := (r2 − ||x − x0 ||2 )k .
Vamos estabelecer as equações de Euler-Lagrange para o funcional J.
Seja h ∈ C01 (Ω, R), i.e., uma função de classe C 1 em Ω que é identicamente
nula sobre a fronteira ∂Ω. Definamos a “perturbação” para o funcional J,
ξ : (−, ) → R, onde > 0, dada por
ξ(t) := J[u + th]
então ξ 0 (0) = δJ[u]h. Por definição,
Z
ξ(t) =
L(x, u + th, ∇u + t∇h)dx
Ω
e, pela regra da cadeia,
N
X
∂L
ξ (t) = (Lu h +
hxi )dx
∂u
x
Ω
i
i=1
0
Z
usaremos agora o teorema da divergência de Gauss (2.1) para o campo
X = (hLux1 , ..., hLuxi ).
Temos que X é C 1 e portanto
N
N
N
X
X
∂(hLuxi ) X
∂Lux1
∂h
div X =
=
Luxi +
h
∂xi
∂xi
∂xi
i=1
i=1
i=1
Veja que X ≡ 0 ∈ ∂Ω, uma vez que h ≡ 0 ∈ ∂Ω, daı́ temos que:
Z
hX, υi dSx = 0
∂Ω
e portanto
Z
div Xdx = 0
Ω
e portanto
Z X
Z X
N
N
∂Luxi
∂h
Luxi dx + (
)hdx = 0.
Ω i=1 ∂xi
Ω i=1 ∂xi
CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN .
64
Daı́, voltando a expressão de ξ 0 (t), segue
Z
0
(Lu −
ξ (t) =
Ω
N
X
∂Lux
i
∂xi
i=1
)hdx
e fazendo t = 0,
0
Z
(Lu −
ξ (0) =
Ω
N
X
∂Lux
i
∂xi
i=1
)hdx
Daı́ se u for um extremo para J, usando que ξ 0 (0) = δJ[u]h = 0 e a
observação do lema (8.1.1), segue que
Lu =
N
X
∂Lux
i
i=1
∂xi
.
(8.1)
A equação acima é chamada de equação de Euler-Lagrange associada ao
funcional J.
Vejamos uma aplicação da equação de Euler-Lagrange acima ao problema
de Poisson.
8.2
O Princı́pio de Dirichlet
Uma generalização do problema de Dirichlet, visto no capı́tulo 1, é o
problema de Poisson:
∆u = f, em Ω
(8.2)
u = g, em ∂Ω
onde u ∈ C 2 (Ω) ∩ C(∂Ω) é uma função, a priori, desconhecida, g ∈ C(∂Ω)
e f ∈ C(Ω) funções conhecidas e ainda Ω um domı́nio limitado em RN com
fronteira suave.
Obs 8.2.1 Note que o problema de Dirichlet é uma caso particular do
problema de Poisson quando f ≡ 0.
Teorema 8.2.1 (Unicidade) O problema de Poisson (8.2) possui, no máximo,
uma solução.
Demonstração: A demonstração é idêntica ao teorema 1.3.3.
Seja v ∈ C01 (Ω) e u satisfazendo
−∆u = f em Ω
CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN .
65
multiplicando ambos os lados da igualdade acima por v e integrando em Ω,
temos
Z
Z
− ∆u vdx =
f vdx
Ω
Ω
devido v = 0 em ∂Ω segue, pelo primeira fórmula de Green (2.3), que
Z
Z
− ∆u vdx =
∇u∇vdx,
Ω
Ω
e portanto
Z
Z
∇u∇vdx =
f vdx.
Ω
(8.3)
Ω
Note que a expressão (8.3) é linear em relação a v, motivados por tal linearidade definamos o funcional Energia J : A → R por
Z
1
(8.4)
J[w] = ( ||∇w||2 − wf )dx,
Ω 2
onde A = {w ∈ C 2 (Ω); u = g em ∂Ω}.
variacional do problema de Poisson (8.2).
Vejamos agora a versão
Teorema 8.2.2 (Princı́pio de Dirichlet) Uma função u é uma solução
para o problema de Poisson (8.2) se e somente se
J[u] = min J[w]
w∈A
(8.5)
Demonstração: Seja u uma solução para o problema de Poisson (8.2) e
w ∈ A, segue que
Z
(−∆u − f )(u − w)dx = 0
Ω
como u − w = 0 em ∂Ω, segue pela primeira fórmula de Green (2.3) que
Z
Z
− ∆u(u − w)dx =
∇u(∇u − ∇w)dx,
Ω
Ω
daı́ segue que
Z
2
Z
(||∇u|| − f u)dx =
Ω
(h∇u, ∇wi − f w)dx.
Ω
Por Cauchy-Schwarz,
Z
Z
Z
Z
1
1
2
h∇u, ∇wi dx ≤
||∇u||.||∇w||dx ≤
||∇u|| dx +
||∇w||2 dx,
2
2
Ω
Ω
Ω
Ω
CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN .
66
implicando
Z
Z
Z
1
1
2
2
(||∇u|| − f udx) ≤
||∇u|| dx + ( ||∇w||2 − f w)dx
2 Ω
Ω
Ω 2
e portanto
Z
Z
1
1
2
||∇u|| − f udx ≤ ( ||∇w||2 − f w)dx,
Ω 2
Ω 2
ou seja,
J[u] ≤ J[w],
donde w ∈ A é arbitrário, logo, u minimiza o funcional (8.4).
Suponha agora que u minimiza o funcional (8.4), então u satisfaz a equação de
Euler-Lagrange
Lu =
N
X
∂Lux
i
i=1
∂xi
,
(8.6)
onde a Lagrangiana L associada ao funcional (8.4) é
N
1
1X 2
L(x, u, ∇u) = h∇u, ∇ui − f u =
u − f u,
2
2 i=1 xi
daı́ segue que
Lu = −f
e ainda
Luxi = uxi ⇒
∂Luxi
= u xi xi
∂xi
e como u satisfaz a equação (8.6)
∆u =
N
X
uxi xi = −f
i=1
e como u ∈ A, segue que u é solução para o problema de Poisson (8.2).
8.3
O Problema de Plateau
Vejamos uma aplicação da equação de Euler-Lagrange a teoria de
superfı́cies mı́nimas1 . Seja então γ : [0, 1] → R2 uma curva, simples, suave
e fechada, e ainda Ω ⊆ R2 o subconjunto compacto em R2 , cuja fronteira
∂Ω = γ. Um problema, da Geometria Diferencial, bastante famoso é o
problema de Plateau2
1
2
Veja Manfredo Perdigão do Carmo, Differential Geometry of Curves and Surfaces.
Joseph Antoine Ferdinand Plateau(1801-1883), nascido em Bruxelas na Bélgica.
CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN .
67
“Qual, dentre as superfı́cies σ em R3 , possuindo γ como
fronteira, possui área mı́nima?”
Consideramos tais superfı́cies σ, parametrizadas por Φ : Ω → R3 ,
Φ(x, y) = (x, y, z(x, y)), onde z : Ω → R é uma função, a ser encontrada, de
classe C 2 . Vejamos então a formulação variacional de tal problema.
Temos que a área de σ, que representaremos por Sσ , é dada por
Z Z
Sσ =
||Φx ∧ Φy ||dxdy,
Ω
daı́ como Φx = (1, 0, zx ) e Φy = (0, 1, zy ), seguindo que Φx ∧Φy = (−zx , −zy , 1),
e portanto
Z Z p
Sσ =
1 + ||∇z||2 dxdy,
Ω
seguindo assim que a superfı́cie procurada minimiza o funcional
Z Z p
J[z] :=
1 + ||∇z||2 dxdy.
(8.7)
Ω
Temos então a lagrangiana
L(x, y, z, zx , zy ) =
p
1 + ||∇z||2
(8.8)
e portanto a função z : Ω → R procurada deve satisfazer a equação
Lu =
∂Lux ∂Luy
+
∂x
∂y
(8.9)
que é a equação de Euler-Lagrange associada ao funcional (8.7). Usando a
expressão da lagrangiana (8.8), segue
Lu = 0,
ux
Lux = p
1 + ||∇u||2
e portanto a equação (8.9) é dada por
!
∂
∂
ux
p
+
∂x
∂y
1 + ||∇u||2
,
1 + ||∇u||2
uy
p
1 + ||∇u||2
ou então,
div
∇u
p
uy
Luy = p
1 + ||∇u||2
!
= 0.
!
=0
CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN .
68
Dada uma superfı́cie regular em R2 , existem duas quantidades que são
intrı́nsecas de tal superfı́cie, tais quantidades são
1 eG − 2fF + gE
√
H=
,
2
EG − F2
eg − f 2
√
K=
EG − F2
onde K é de denominadas de curvatura gaussiana e H curvatura média e
{e, g, f} e {E, G, F} são os coeficientes da Segunda Forma Fundamental e
Primeira Forma Fundamental, respectivamente. Uma superfı́cie regular em
R3 é dita Mı́nima quando sua curvatura média é identicamente nula. No
caso em que estamos trabalhando onde as parametrizações são da forma
Φ(x, y) = (x, y, z(x, y)) é possı́vel mostrar que
!
p
∇u
,
2 1 + ||∇u||2 H = div p
1 + ||∇u||2
daı́ concluı́mos que uma superfı́cie σ é mı́nima se, e somente se, a mesma é
estacionária para o funcional (8.7).
Obs 8.3.1 Note que se a função z minimiza o funcional (8.7) então a superficie σ parametrizada por Φ é uma superfı́cie mı́nima. Entretanto se σ é uma
superfı́e mı́nima parametrizada por Φ tem-se que o funcional (8.7) é apenas
estacionário para função z, devido a equação de Euler-Lagrange ser apenas
uma condição necessária para tal funcional ser minimiza(maximizado).
Referências Bibliográficas
[1] Boyce, W. E., DiPrima, R. C., Equações Diferenciais Elementares e
Problemas de Valores de Contorno. Editora LTC 2002.
[2] Brezis, H., Analyse Functionelle, Maison, Paris 1983.
[3] Do Carmo, M. P., Differential Geometry of Curves and Surfaces,
Prentice Hall 1976.
[4] Evans, L. C., Partial Differential Equations, Graduate Studies in
Mathematics 1997.
[5] Figueiredo, D. G. de, Neves, A. F., Equações Diferenciais Aplicadas,
Coleção Matemática Universitária 1997.
[6] Gelfand, I. M., Fomin, S. V., Calculus of Variations., Editora Dover
2000.
[7] Lemos, N. A., Mecânica Analı́tica, Editora Livraria da Fı́sica 2003. 1979.
[8] Lima, L. E., Curso de Análise vol.2, Projeto Euclides 2000.
[9] Lima, L. E., Espaços Métricos, Projeto Euclides 1993.
[10] Lima, L. E., Álgebra Linear, Projeto Euclides 1998.
[11] Neto, J. B., Mecânica: Newtoniana, Lagrangiana e Hamiltoniana.,
Livraria da Fı́sica 2004.
[12] Sotomayor, J., Lições de Equações Diferenciais Ordinárias, Projeto Euclides
[13] Nussenzveig, H. M., Curso de Fı́sica Básica vol.4, Ótica, Relatividade e
Fı́sica Quântica., Editora Edgar Blücher 2002.
[14] Weinstock, R., Calculus of Variations with applications to physics &
engineering, Editora Dover 1974.
69

Documentos relacionados