dE EQUAÇÕES DE EULER
Transcrição
dE EQUAÇÕES DE EULER
UNIVERSIDADE FEDERAL DO CEARÁ DEPARTAMENTO DE MATEMÁTICA INTRODUÇÃO AO CÁLCULO DAS VARIAÇÕES. Juscelino Pereira Silva FORTALEZA-CE 2005 Sumário 1 Introdução 3 2 Elementos da Teoria 5 2.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.2 A Variação de um Funcional . . . . . . . . . . . . . . . . . . . 11 2.3 O Teorema da Divergência . . . . . . . . . . . . . . . . . . . . 17 3 Equações de Euler-Lagrange 21 3.1 A Equação de Euler-Lagrange. . . . . . . . . . . . . . . . . . . 21 3.2 O Princı́pio de Fermat . . . . . . . . . . . . . . . . . . . . . . 27 4 Problemas Variacionais 30 4.1 Distância mı́nima no plano. . . . . . . . . . . . . . . . . . . . 30 4.2 Braquistócrona . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4.3 Superfı́cie de revolução de área mı́nima . . . . . . . . . . . . . 34 5 Equação de Euler-Lagrange generalizada. 5.1 Equação de Euler-Lagrange generalizada. . 5.2 Geodésicas . . . . . . . . . . . . . . . . . . 5.3 Problemas Isoperimétricos . . . . . . . . . 5.4 A Catenária. . . . . . . . . . . . . . . . . . 5.5 O Problema Isoperimétrico Original. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 39 42 43 45 6 Equações de Hamilton 47 6.1 As Equações de Hamilton . . . . . . . . . . . . . . . . . . . . 47 6.2 Integral Primeira para as Equações de Hamilton . . . . . . . . 49 7 O Princı́pio Variacional de Hamilton 54 7.1 Dinâmica Lagrangiana . . . . . . . . . . . . . . . . . . . . . . 54 7.2 Oscilador Harmônico Simples . . . . . . . . . . . . . . . . . . 58 7.3 Forças Centrais. . . . . . . . . . . . . . . . . . . . . . . . . . . 59 1 2 8 A Equação de Euler-Lagrange em RN . 62 8.1 A Equação de Euler-Lagrange em RN . . . . . . . . . . . . . . 62 8.2 O Princı́pio de Dirichlet . . . . . . . . . . . . . . . . . . . . . 64 8.3 O Problema de Plateau . . . . . . . . . . . . . . . . . . . . . . 66 Referências Bibliográficas 69 Capı́tulo 1 Introdução Estas notas foram escritas no intuito de dar a alunos de graduação em matemática, fı́sica ou engenharia, que possuam um curso de cálculo de funções reais de várias variáveis e gosto pela matemática, uma breve introdução ao Cálculo das Variação. No capı́tulo 2 fizemos a breve apresentação de alguns conceitos fundamentais sobre Algebra Linear e Cálculo Diferencial indispensáveis ao desenvolvimento da teoria. No capı́tulo 3 é apresentadas as equações de Euler-Lagrange e como aplicação para a mesma é apresentado o prı́ncı́pio de Fermat para a propagação da luz. No capı́tulo 4 são apresentados alguns problemas variacionais clássicos como: curva que minimiza distância no plano euclidiano, o problema da Braquistócrona ou ainda conhecida como a curva que une dois pontos de forma a minimizar o tempo e o problema de encontrar a curva perfil que gera uma superfı́cie de rotação com área mı́nima. No capı́tulo 5 são introduzidas as equações de Euler-Lagrange para problemas com N graus de liberdade e como aplicação às mesmas são feitos alguns comentários sobre geodésicas sobre superfı́cies em R3 , entretanto o fato primordial de tal capı́tulo é o teorema do Multiplicador de Lagrange, que não é demonstrado mas é indicada uma referência. No capı́tulo 6 são apresentadas as equações de Hamilton e alguns exemplos onde tais equações podem ser aplicadas e ainda é dada uma condição necessária e suficiente para tal sistema de equações possuir uma integrau primeira. O capı́tulo 7 versa sobre a dinâmica lagrangiana e tem como ponto primordial o princı́pio variacional de Hamilton e ainda alguns exemplos. No caı́tulo 8 é apresentada a equação de Euler-Lagrange em RN e como aplicações às mesmas são apresentados o princı́pio de Dirichlet e problema de Plateau para superfı́cies em R3 . É de suma importância salientar que durante o decorrer destas notas fazemos o uso das equações de Euler-Lagrange para estudar os problemas variacionais admitindo, em várias circunstâncias, que as soluções das Equações de EulerLagrange são, de fato, mı́nimos(máximos) para os funcionais em questão, de3 CAPÍTULO 1. INTRODUÇÃO 4 vido as equações de Euler-Lagrange serem somente uma condição necessária para tais fato, e não suficiente. tais condições suficientes são dadas com o estudo mais profundo da segunda variação do funcional, o que pretendemos fazer em breve. por último resta comentar que tais notas não são, em sua totalidade, originais, boa parte dela é inspirada e tem como principal referência o excelente livro “Calculus of Variations”, dos autores Gelfand e Fomin, cujo mesmo está nas referências bibliográficas dessas notas. Agradeço ainda a Antonio Caminha M. Neto e Wilson Hugo C. Freire pela leitura, correções de vários erros e pelas valiosas sugestões. Juscelino P. Silva Fortaleza-Ce Junho de 2005 Capı́tulo 2 Elementos da Teoria 2.1 Conceitos Básicos Introduziremos aqui alguns conceitos fundamentais para o desenvolvimento da teoria que abordaremos nos próximos capı́tulos. Definição 2.1.1 O par (E, ||.||) será dito um R-Espaço Vetorial Normado se, dados x, y, z ∈ E e α, β ∈ R arbitrários, os seguintes axiomas forem satisfeitos: 1. x + y = y + x; 2. (x + y) + z = x + (y + z); 3. Existe um elemento 0(elemento zero) tal que x+0 = x para todo x ∈ E; 4. Para cada x ∈ E existe um elemento −x tal que x + (−x) = 0; 5. 1.x = x; 6. α(βx) = (αβ)x; 7. (α + β)x = αx + βx; 8. α(x + y) = αx + αy; 9. ||x|| ≥ 0 e ||x|| = 0 se e somente se x = 0; 10. ||αx|| = |α|.||x||; 11. ||x + y| ≤ ||x|| + ||y||.(Desigualdade Triangular) 5 CAPÍTULO 2. ELEMENTOS DA TEORIA 6 Obs 2.1.1 Os axiomas 9, 10 e 11 são relativos a definição de espaço normado. Definição 2.1.2 Um subconjunto X ⊆ E é dito um subespaço vetorial de E se dados quaisquer dois elementos x, y ∈ X e α ∈ R então x + αy ∈ X. Definição 2.1.3 Uma base {e1 , ..., ei , ...} é um conjunto de elementos de E tais que cada elemento x ∈ E é uma combinação linear finita de elementos {ei } da forma: k X x= αj ej , αj ∈ R j=1 e mais ainda tal conjunto {ei } é linearmente independente(l.i.), ou seja, dada combinação linear α1 x1 + ... + αk xk = 0 teremos então, obrigatoriamente, que todos os escalares αi devem ser nulos. Obs 2.1.2 Existem espaços vetoriais que não possuem base enumerável, e portanto, uma base para tais espaços é da forma {eλ }λ∈Λ onde Λ é um conjunto de ı́ndices não enumerável. Mas, por simplicidade, consideraremos aqui apenas espaços vetoriais que possuam base enumerável. Obs 2.1.3 Qualquer base de um espaço vetorial E possui a mesma quantidade de elementos. Definição 2.1.4 A dimensão dim E de um espaço vetorial E é definida como sendo o número de elementos de uma base de E. Definição 2.1.5 Sejam E e F dois R-espaços vetorais. Uma tranformação linear T : E → F é uma regra que associa a cada elemento x ∈ E um único elemento T (x) ∈ F e que satistaz as seguintes propriedades: 1. T (x + y) = T (x) + T (y); 2. T (αx) = αT (x). para quaisquer x, y ∈ E e α ∈ R. Quando F = R, tais tansformações recebem o nome de funcionais lineares. Definição 2.1.6 Uma transformação linear T : (E, ||.||1 ) → (F, ||.||2 ) é dita contı́nua em x ∈ E se dado > 0 existe δ > 0 tal que ||T (x) − T (y)||2 < se ||x − y||1 < δ. Tal transformação é dita contı́nua se a mesma o for em todos os pontos x ∈ E. CAPÍTULO 2. ELEMENTOS DA TEORIA 7 Teorema 2.1.1 Seja T : (E, ||.||1 ) → (F, ||.||2 ) uma transformação linear entre espaços vetoriais normados E e F. As seguintes afirmações são equivalentes: 1. T é contı́nua; 2. T é contı́nua em 0; 3. Existe M > 0 tal que ||T (x)||2 ≤ M ||x||1 (Limitação); 4. Existe M > 0 tal que ||T (x) − T (y)||2 ≤ M ||x − y||1 . Demonstração: (1) ⇒ (2) É óbvia. (2) ⇒ (3) Tomando = 1 tem-se que existe δ > 0 tal que ||x||1 < δ implica que ||T (x)||2 < 1, pela continuidade de T em 0. Escolha agora M qualquer tal que 0 < 1/M < δ. A relação ||T (x)||2 ≤ M ||x||1 é trivialmente satisfeita x para x = 0, daı́ considerando x 6= 0, tem norma 1/M , portanto M ||x||1 menor que δ. Logo, x ||T ( )||2 < 1 ⇒ ||T (x)||2 ≤ M ||x||1 . M ||x||1 (3) ⇒ (4) Decorre da linearidade de T . (4) ⇒ (1) Dado > 0 arbitrário basta tomar δ = /M . Definição 2.1.7 O conjunto formado pelos funcionais lineares f : E → R é chamado de espaço dual de E e representado por E∗ (dual algébrico). E∗ é um espaço vetorial munido das seguintes propriedades: 1. (f + g)(x) := f (x) + g(x) ∀x ∈ E; 2. (αf )(x) := αf (x) ∀x ∈ E λ ∈ R. A base canônica de E∗ é formada pelos funcionais lineares {dx1 , ..., dxi , ...} definidos pela seguinte sentença: dxi (ej ) = δij (delta de Kronecker) onde δij = 1, se i = j 0, se i 6= j Definição 2.1.8 E0 ⊆ E∗ (dual topológico) é o conjunto formado por todos os funcionais lineares f : E → R contı́nuos. Tem-se que (E0 , ||.||E0 ) é um subespaço vetorial normado de E∗ munido da seguinte norma: ||f ||E0 := sup |f (x)| ||x||=1 CAPÍTULO 2. ELEMENTOS DA TEORIA 8 Obs 2.1.4 Se dim E = ∞ então E0 6= E∗ e se dim E < ∞ então E0 = E∗ . Exemplo 1: Um funcional linear descontı́nuo. Seja E o conjunto dos polinômios reais com uma variável. E é um espaço vetorial normado munido pela norma ||p|| = sup |p(x)|. Considere agora f : E → R definida 0≤x≤1 por f (p) = p(2), é claro que f é um funcional linear. Mostraremos x nque f é descontı́nuo em 0 ∈ E(polinômio nulo). De fato seja pn (x) = uma 2 sequência de polinômios em E. Note que x n 1 1 = ||pn − 0|| = ||pn || = sup < n 2 2 n 0≤x≤1 e portanto temos que pn → 0 quando n → ∞. No entanto note que |f (pn ) − f (0)| = |f (pn )| = pn (2) = 1 > 1 2 implicando dessa forma que f (pn ) 6→ f (0) quando n → ∞, e portanto, f é descontı́nuo em 0. Exemplo 2: O espaço Euclidiano RN . Tem-se que o (RN , ||.||e ) é um Respaço vetorial normado munido com as seguintes operações: 1. (x1 , ..., xN ) + (y1 , ..., yN ) := (x1 + y1 , ..., xN + yN ); 2. α(x1 , ..., xN ) := (αx1 , ..., αxN ), α ∈ R. e com a seguinte norma: v u N uX p x2i . ||(x1 , ..., xN )||e := h(x1 , ..., xN ), (x1 , ..., xN )i = t i=1 onde h, i simboliza o produto interno canônico em RN . Seja ainda {e1 , ..., eN } i z}|{ a base canônica de RN , ou seja, ei = (0, ..., 0, 1 , 0, ..., 0) temos associada a mesma, a base dual {dx1 , ..., dxN } definida em (2.1.7). Exemplo 3: O espaço de funções C([0, 1], R). O conjunto formado pelas funções contı́nuas f : [0, 1] → R munido com as operações definidas em (2.1.7) e pela norma ||f ||0 := sup |f (x)| 0≤x≤1 CAPÍTULO 2. ELEMENTOS DA TEORIA 9 é um espaço vetorial normado. Em alguns contextos C([0, 1], R) é munido da norma s Z 1 f (x)2 dx. ||f ||L2 := 0 Tal norma provém do produto interno Z 1 hf, giL2 := f (x)g(x)dx. 0 Note que ||f ||L2 ≤ ||f ||0 . O espaço C([0, 1], R) é chamado de espaço vetorial das funções contı́nuas definidas em [0, 1]. Exemplo 4: O espaço de funções C 1 ([0, 1], R). O conjunto formado pelas funções f : [0, 1] → R deriváveis cujas derivadas são contı́nuas, munido com as operações definidas em 2.1.7 e pela norma ||f ||1 := sup |f (x)| + sup |f 0 (x)| = ||f ||0 + ||f 0 ||0 0≤x≤1 0≤x≤1 é um espaço vetorial normado. Em alguns contextos C 1 ([0, 1], R) é munido da norma s s Z 1 Z 1 ||f ||H 1 := |f (x)|2 dx + |f 0 (x)|2 dx. 0 0 Note que ||f ||0 ≤ ||f ||1 . O espaço C 1 ([0, 1], R) é chamado de espaço vetorial das funções de classe C 1 definidas em [0, 1]. Obs 2.1.5 O espaço de funções C k ([0, 1], R), onde k ≥ 1 é inteiro, é definido de forma análoga. Definição 2.1.9 Uma forma bilinear B : E×E → R é uma regra que associa a cada par de elementos (x, y) um único número real B(x, y) que satisfaz as seguintes propriedades: 1. Para cada x ∈ E fixado, y 7→ B(x, y) é linear; 2. Para cada y ∈ E fixado, x 7→ B(x, y) é linear. Definição 2.1.10 Uma forma bilinear B : E×E → R é dita contı́nua quando existe uma constante M > 0 tal que |B(x, y)| ≤ M ||x||.||y|| ∀x, y ∈ E e dita coerciva quando existe uma constante N > 0 tal que N ||x||2 ≤ B(x, x) ∀x ∈ E. CAPÍTULO 2. ELEMENTOS DA TEORIA 10 Obs 2.1.6 Um produto interno h, i é uma forma bilinear simétrica, ou seja, B(x, y) = B(y, x) para quaisquer x, y ∈ E. Definição 2.1.11 Uma forma quadrática Q : E → R associada a uma forma bilinear B (2.1.9) é uma regra que associa a cada x ∈ E um único número real Q(x) := B(x, x). Vejamos agora a deigualdade de Cauchy1 -Schwarz2 Lema 2.1.1 (Desigualdade de Cauchy-Schwarz) Seja (E, h, i) R-espaço vetorial com produto interno. Sejam x, y ∈ E então um | hx, yi | ≤ ||x||.||y|| e a igualdade vale se, e somente se, existe α ∈ R tal que x + αy = 0. Demonstração: Sejam x, y ∈ E fixados. Defina a seguinte função real g : R → R por g(t) = ||x + ty||2 . Usando a bilinearidade do produto interno segue que g(t) = ||x||2 + 2t hx, yi + t2 ||y||2 . Portanto g é uma função quadrática não-negativa na variável t, implicando assim que seu discriminante deve ser não positivo. Note que o discriminante de g é 4 hx, yi2 − 4||x||2 .||y||2 daı́, segue que | hx, yi | ≤ ||x||.||y||. Por último note que, a igualdade acima é válida se, e somente se, g possui uma raı́z real. Daı́ segue o resultado. Definição 2.1.12 Seja (E, h, i) um espaço vetorial com produto interno. Uma base {e1 , ..., ei , ...} de E é dita ortonormal se hei , ej i = δij . Obs 2.1.7 Existe um processo denominado de Ortogonalização de Gram-Schmidt pelo qual dada uma base qualquer é possı́vel transformá-la em uma base ortonormal. Vejamos o importante teorema de Riesz3 1 Augustin Louis Cauchy(1789-1857), nascido em Paris na França. Hermann Amandus Schwarz(1843-1921) nascido em Hermdorf na Polônia. 3 Frigyes Riesz(1880-1956) nascido em Györ na Hungria. 2 CAPÍTULO 2. ELEMENTOS DA TEORIA 11 Teorema 2.1.2 (Representação de Riesz) Seja (E, h, i) um espaço vetorial de dimensão finita e f : E → R um funcional linear, então existe um único elemento vf ∈ E que representa f , i.e., f (x) = hx, vf i ∀x ∈ E. Demonstração: PN Seja {e1 , ..., eN } uma base ortonormal PN de E, defina o elemento vf := f (e )e . Seja x ∈ E, então x = i i i=1 j=1 αj ej e portanto PN f (x) = j=1 αj f (ej ). Por outro lado, temos que * N + N N N X X X X hx, vf i = αj ej , f (ei )ei = αj f (ei )δij = αi f (ei ) = f (x). j=1 i=1 i,j=1 i=1 Daı́ está provada a existência. Suponhamos que existam dois representantes para f em E, digamos, vf e wf , então segue, pela representação que hx, vf i = hx, wf i ∀ x ∈ E e por linearidade segue que hx, vf − wf i = 0 ∀x ∈ E, em particular, para x = vf − wf e dessa forma ||vf − wf ||2 = 0, implicando que vf = wf , daı́ resultando a unicidade, e portanto o teorema está provado. Obs 2.1.8 O teorema de Riesz é válido ainda em dimensão infinita com as hipóteses de f ser contı́nuo e de E ser um espaço de Hilbert.45 2.2 A Variação de um Funcional Definição 2.2.1 Um subconjunto A ⊆ E, onde E é um espaço vetorial normado, é dito uma Variedade Afim quando a reta que une dois pontos quaisquer de A está contida em A. Assim, A ⊆ E é uma variedade afim se, e somente se, cumpre a seguinte condição: x, y ∈ A, t ∈ R ⇒ (1 − t)x + ty ∈ A. Obs 2.2.1 Todo espaço vetorial normado (E, ||.||) é um espaço é uma variedade afim. Obs 2.2.2 Encare A como um espaço vetorial transladado da origem, na realidade dado um y ∈ A existe um único F ⊆ E, subespaço vetorial de E, tal que A = y + F.6 F será chamado de Espaço Tangente a A. 4 David Hilbert(1862-1943) nascido em Königsberg na Prússia, hoje Rússia. Ver Brezis. 6 Ver Elon L. Lima, Álgebra Linear. 5 CAPÍTULO 2. ELEMENTOS DA TEORIA 12 Definição 2.2.2 Um funcional7 J : A → R é uma regra que a cada y ∈ A associa um único número real J[y] onde A é uma variedade afim. Obs 2.2.3 Em geral, funcionais não precisam ser definidos em uma variedade afim, entretando, para os propósitos desse trabalho, defini-los dessa forma é suficiente. Definição 2.2.3 Um funcional J é dito contı́nuo em y ∈ A se dado > 0 existe δ > 0 tal que |J[y] − J[x]| < se ||y − x|| < δ. Tal funcional é dito contı́nuo se o mesmo o for em todos os pontos y ∈ A. Definição 2.2.4 Sejam y ∈ A e h ∈ F ⊆ E o funcional J é dito diferenciável8 se J[y + h] − J[y] = Φy (h) + R(h)||h||. onde Φy : F → R é um funcional linear e R = R(h) é um funcional tal que lim R(h) = 0. ||h||→0 A parte linear Φy (h) de J[y + h] − J[y] é chamada de variação(ou diferencial) de J em y que denotaremos por δJ[y] = Φy . Obs 2.2.4 Perceba a natureza da variação δJ. Tem-se que δJ : A → E∗ é uma regra que associa a cada y ∈ A um único funcional linear δJ[y] : F → R, como mostra o seguinte diagrama: δJ : A −→ F∗ y 7−→ δJ[y] : F −→ R h 7−→ δJ[y]h Definição 2.2.5 Sejam y ∈ A e h ∈ F, definimos a derivada(funcional) de J em y “na direção de h” como J[y + th] − J[y] t→0 t δJ[y]h := lim quando tal limite existe. 7 O funcional J não é, em geral, um funcional linear. Em alguns livros, R é definido de uma forma um pouco diferente, mas equivalente a essa definição. 8 CAPÍTULO 2. ELEMENTOS DA TEORIA 13 Obs 2.2.5 Você pode achar estranho a nomenclatura “direcional”, pois h é uma função. Lembre-se que h ∈ F que é um espaço vetorial, logo funções como h são vetores num espaço de funções. A nomenclatura “direcional” é apenas no sentido de fazer uma analogia com o caso Euclidiano. Teorema 2.2.1 (Unicidade da diferencial) A diferencial de um funcional diferenciável é única. Demonstração: Seja y ∈ A fixado. Mostraremos inicialmente que se Φy é um funcional linear tal que Φy (h) →0 ||h|| quando ||h|| → 0, então Φy ≡ 0, i.e., Φy é o funcional nulo. De fato, suponha que existe um h0 6= 0 ∈ E tal que Φy (h0 ) 6= 0. Defina a seguinte sequência hn = h0 , n λ= Φy (h0 ) , ||h0 || note que ||hn || → 0 quanto n → ∞, entretanto Φy (hn ) nΦy (h0 ) = lim = λ 6= 0, n→∞ ||hn || n→∞ n||h0 || lim contrariando a nossa hipótese. Suponhamos agora que a diferencial de J em y não seja única, digamos Φy e Ψy , então J[y + h] − J[y] = Φy (h) + R1 (h)||h||, J[y + h] − J[y] = Ψy (h) + R2 (h)||h||, onde R1 (h), R2 (h) → 0 quando k|h|| → 0. Dessa forma temos (Φy − Ψy )(h) = R1 (h)||h|| − R2 (h)||h|| implicando assim que (Φy − Ψy )(h) = R1 (h) − R2 (h). ||h|| Tem-se que Φy − Ψy é um funcional linear e R1 (h) − R2 (h) → 0 quando ||h|| → 0, daı́ segue, pelo resultado provado inicialmente, que o funcional linear Φy −Ψy é identicamente nulo, dessa forma ficando provado o teorema. CAPÍTULO 2. ELEMENTOS DA TEORIA 14 Definição 2.2.6 O funcional J : A → R é dito de classe C 1 quando δJ : A → F0 ⊆ F∗ é contı́nua, isto dado y ∈ A arbitrário e > 0 existe δ > 0 tal que ||y − x|| < δ ⇒ ||δJ[y] − δJ[x]||F0 < . Definição 2.2.7 Um funcional J : A → R é dito duas vezes diferenciável se dado y ∈ A e h ∈ F tem-se que J[y + h] − J[y] = δJ[y]h + Ψy (h) + R(h)||h||2 onde Ψy : F → R é uma forma quadrática representada por δ 2 J[y] é denominada de segunda variação(ou diferencial segunda) de J no ponto y e R(h) → 0 quando ||h|| → 0. Obs 2.2.6 Na realidade, a diferencial segunda de J é uma regra que associa a cada ponto y ∈ A uma forma bilinear B(y) : F × F → R, no entanto, como o vetor h é fixado temos B(y)(h, h), i.e., a forma quadrática associada a B(y), que no caso acima é δ 2 J[y](h, h) = δ 2 J[y]h2 . Obs 2.2.7 A diferencial segunda de um funcional duas vezes diferenciável é única. Exemplo 5: Seja Ω ⊆ RN um domı́nio, i.e., um aberto conexo. E seja F : Ω → R uma função diferenciável de classe C 2 . Temos então que dados y, v ∈ Ω tal que y + v ∈ Ω segue que F(y + v) − F(y) = dF(y)v + d2 F(y)v 2 9 + R(v)||v|| onde R(v) → 0 quando ||v|| → 0. Onde aqui denotamos por dF a diferencial de F. Temos então que dF(y) : E → R é um funcional linear, daı́ pelo teorema de Riesz (2.1.2), existe um vetor, que representaremos por ∇F(y) que representa dF(y), i.e., dF(y)v = hv, ∇F(y)i . Como F é de classe C 2 , em particular C 1 , temos que a aplicação y 7→ ∇F(y) é contı́nua. Tal aplicação é uma função vetorial, i.e., associa a cada y ∈ Ω o vetor ∇F(y) denominado de Gradiente de F no ponto y. Vejamos quem são as coordenadas do Gradiente. Temos que a derivada direcional de F em y na direção de v é F(y + tv) − F(y) ∂F(y) = lim , t→0 ∂v t 9 2 d F(y)v 2 significa d2 F(y)(v, v). CAPÍTULO 2. ELEMENTOS DA TEORIA 15 ou seja, ∂F(y) = dF(y)v, ∂v no caso particular em que v = ei temos que tal derivada direcional recebe o nome de derivada parcial com respeito a coordenada yi , considerando y = (y1 , ..., yi , ..., yN ), e representada por ∂F(y) = dF(y)ei . ∂yi Escrevamos v como combinação linear do vetores canônicos ei , logo v = α1 e1 + ... + αN eN , logo tem-se que v = (α1 , ..., αN ) e daı́ segue que ! N N N X X X ∂F(y) dF(y)v = dF(y) αi ei = αi dF(y)ei = αi ∂yi i=1 i=1 i=1 implicando que ∂F(y) ∂F(y) dF(y)v = v, ( , ..., ) ∂y1 ∂yN no entanto, a representação de dF(y) é única, logo ∇F(y) = ( ∂F(y) ∂F(y) , ..., ). ∂y1 ∂yN Outra forma de chegar a tal resultado seria em lembrar que dF(y) ∈ (RN )∗ e portanto o mesmo é uma combinação linear do elemento da base dual {dx1 , ..., dxN }, logo N X dF(y) = βi dxi i=1 lembrando-se que dxi ej = δij , segue que ∂F(y) = dF(y)ei = βi ∂yi e daı́ decorrendo tudo da mesma forma. Usando que F é de classe C 2 temos, pelo teorema de Schwarz, que ∂ 2 F(y) ∂ 2 F(y) = (i, j = 1, ..., N) ∂yj ∂yi ∂yi ∂yj CAPÍTULO 2. ELEMENTOS DA TEORIA 16 e portanto d2 F(y)(u, v) = ∂ 2 F(y) ∂ 2 F(y) = = d2 F(y)(v, u) ∂v∂u ∂u∂v daı́ segue que 2 d F(y) = ∂ 2 F(y) ∂yj ∂yi 1≤i,j≤N onde d2 F(y) é denominada de matriz Hessiana10 associada a F aplicada no ponto y. A partir de agora, quando não for especificado, J : A → R será um funcional diferenciável. Definição 2.2.8 Um elemento y ∈ A é dito estacionário para J se δJ[y] ≡ 0, i.e., δJ[y]h = 0, ∀h ∈ F. Definição 2.2.9 Um elemento y ∈ A é dito um ponto de mı́nimo(máximo) local para J se existe δ > 0 tal que J[y] ≤ J[x] (≥) para todo x ∈ E tal que ||y − x|| < δ. Obs 2.2.8 No decorrer desse texto, frequentemente, iremos nos referir a mı́nimos e/ou máximos(locais) dos funcionais em questão apenas como extremos. Teorema 2.2.2 Uma condição necessária para que y ∈ A seja um ponto de mı́nimo(máximo) local para J é que y seja estacionário. Demonstração: Vamos supor, sem perda de generalidade, que y seja um ponto mı́nimo local para J. Então deve existir um δ > 0 tal que J[x] − J[y] ≥ 0 para ||y − x|| < δ. Seja então h ∈ E tal que ||h|| = 1, e consideremos x = y + th, segue então que ||y − x|| < δ ∀ t ∈ (−δ, δ). Dessa forma segue que para todo t ∈ (−δ, δ) temos que J[y + th] − J[y] ≤ 0. Usando agora o fato de que J é diferenciável temos que: J[y + th] − J[y] = tδJ[y]h + R(th)|t| 10 Quando F é de classe C 2 , d2 F(y) é uma forma bilinear simétrica para cada y. CAPÍTULO 2. ELEMENTOS DA TEORIA 17 onde R(th) → 0 quando t → 0. Portanto temos |t| J[y + th] − J[y] = δJ[y]h + R(th) . t t O limite da quantidade que está do lado direito da igualdade acima existe, e é igual a derivada direcional de J é y na direção de h 11 . Daı́ tem-se que lim+ t→0 J[y + th] − J[y] ≤0 t uma vez que J[y + th] − J[y] ≤ 0 para t ∈ (−δ, δ) e estamos considerando t > 0. Entretanto, note que lim− t→0 J[y + th] − J[y] ≥0 t uma vez que J[y+th]−J[y] ≤ 0 para t ∈ (−δ, δ) e agora estamos considerando t < 0. Daı́ como o limite em questão existe, segue que δJ[y]h = lim+ t→0 J[y + th] − J[y] J[y + th] − J[y] = lim− =0 t→0 t t implicando assim que y é estacionário. Obs 2.2.9 Note que, que pela linearidade de δJ[y], podemos considerar acima ||h|| = 1 sem haver perda de generalidade, uma vez que e h δJ[e h] = ||e h||δJ[y] . ||e h|| 2.3 O Teorema da Divergência Dedicaremos esta seção para breves comentários sobre o teorema da divergência de Gauss12 e algumas de suas aplicações. Definição 2.3.1 Seja X : Ω → RN , X(x) = (X1 (x), ..., XN (x)), um campo vetorial de classe C 1 (Ω, R), i.e., as funções Xi : Ω → RN são funcões de classe C 1 (Ω, R). Definimos o divergente do campo X por divX(x) := N X ∂Xi i=1 11 12 ∂xi (x). |t| Note que limt→0 R(th) |t| t = 0, mesmo não existindo limt→0 t . Johann Carl Friedrich Gauss(1777-1855) nascido em Brunswick na Alemanha. CAPÍTULO 2. ELEMENTOS DA TEORIA 18 Teorema 2.3.1 (Divergência de Gauss) Seja X : Ω → R um campo vetorial de classe C 1 (Ω, R), Ω ⊆ RN compacto, com fronteira ∂Ω suave, orientável, orientada e com o vetor normal unitário exterior η. Então Z Z divX dx = hX, ηi dSx (2.1) Ω ∂Ω Obs 2.3.1 Acima, dx é o elemento de volume em RN , dSx é o elemento de área em ∂Ω e as integrais são respectivas a tais elementos. Obs 2.3.2 O teorema de divergência de Gauss é também conhecido com integração por partes generalizada, devido a identidade entre a integral em Ω e a integral em ∂Ω. Obs 2.3.3 Em R2 , o teorema da divergência resulta do teorema de Green13 , I Z Z P(x, y)dx + Q(x, y)dy = (Qx (x, y) − Py (x, y))dxdy (2.2) γ Ω onde γ : [a, b] → ∂Ω ⊆ R2 é uma curva suave, simples e regular. A expressão do lado esquerdo da igualdade significa, considerando γ(t) = (x(t), y(t)), I Z b P(x, y)dx + Q(x, y)dy := (P(x(t), y(t))x0 (t) + Q(x(t), y(t))y 0 (t)) dt γ a donde P, Q : Ω → R são funções de classe C 1 . Obs 2.3.4 O teorema de Green em RN é chamado de teorema de Stokes.14 Obs 2.3.5 Seja Ω ⊆ R2 como nas hipóteses do teorema da divergência, temos pela expressão (2.2), que I Z Z 1 −ydx + xdy = dxdy = Área de Ω. 2 ∂Ω Ω Sejam u, v : Ω ⊆ RN → R funções de classe C 2 (Ω, R), considere o campo definido por X(x) = u∇v, é imediato que X é de classe C 1 . Seja η o vetor normal exterior a ∂Ω. Então hX, ηi = hu∇v, ηi = u 13 14 ∂v ∂η George Green(1793-1841) nascido em Nottingham na Inglaterra. George Gabriel Stokes(1819-1903) nascido em Skreen na Irlanda. CAPÍTULO 2. ELEMENTOS DA TEORIA donde 19 ∂v é chamada de derivada normal de v. Temos ainda ∂η divX = h∇u, ∇vi + u∆v onde ∆v = N X ∂2v i=1 ∂x2i chama-se Laplaciano15 de v, segue, pelo teorema da divergência (2.1), Z Z Z ∂v h∇u, ∇vi dx + u∆dx = u dSx (2.3) Ω Ω ∂Ω ∂η que é conhecida como primeira fórmula de Green. Se considerarmos o campo X = u∇v − v∇u segue, de forma análoga Z Z ∂v ∂u (u∆v − v∆u)dx = (u − v )dSx ∂η ∂η Ω ∂Ω (2.4) que é conhecida como segunda fórmula de Green. Vejamos uma aplicação, ao Problema de Dirichlet16 , das fórmulas de Green. Um famoso problema da teoria das equações diferenciais parciais é o problema de Dirichlet: ∆u = 0, em Ω (2.5) u = g, em ∂Ω onde u ∈ C 2 (Ω) ∩ C(∂Ω) é uma função, a priori, desconhecida, g ∈ C(∂Ω) uma função conhecida e Ω é um domı́nio em RN . Definição 2.3.2 Uma função u : Ω → R de classe C 2 (Ω) é dita harmônica se ∆u ≡ 0. Teorema 2.3.2 Seja u : Ω → R tal que u ∈ C 2 (Ω) ∩ C(∂Ω). Se u é harmônica em Ω e u = 0 em ∂Ω então u é constante. 15 Em homenagem a Pierre-Simon Laplace(1749-1827) nascido em Normadia na França. Johann Peter Gustav Lejeune Dirichlet(1805-1859) nascido em Düren na França, hoje, Alemanha. 16 CAPÍTULO 2. ELEMENTOS DA TEORIA 20 Demonstração: Usando a primeira fórmula de Green (2.3) para o campo X = u∇u, temos Z Z Z ∂u 2 ||∇u|| dx + u∆udx = u dSx Ω Ω ∂Ω ∂η e daı́ usando que ∆u = 0 em Ω e u = 0 em ∂Ω, segue Z ||∇u||2 dx = 0, Ω e portanto ||∇u|| = 0, implicando que u = C(cte). Entretanto u = em ∂Ω, seguindo assim que u ≡ 0. Teorema 2.3.3 (Unicidade) O problema de Dirichlet (2.5) possui, no máximo, uma solução. Demonstração: Sejam u, v : Ω → R funções pertencentes a C 2 (Ω) ∩ C(∂Ω) soluções do problema (2.5). Então w = u − v é solução do problema de Dirichlet ∆u = 0, em Ω u = 0, em ∂Ω no entanto, pelo teorema (2.3.2), tal problema possui somente a solução trivial, logo u − v ≡ 0. Capı́tulo 3 Equações de Euler-Lagrange 3.1 A Equação de Euler-Lagrange. Consideraremos, a partir de agora, funções L : [0, 1] × R × R → R as quais serão chamadas Lagrangianas, onde L = L(x, y(x), y 0 (x)) e y 0 simbolizará dy y 0 = dx , sempre que não for previamente especificado. Em vários momentos, com o intuito de não sobrecarregarmos a notação, escreveremos somente L = L(x, y, y 0 ). Desejaremos ainda que L possua derivadas parciais de 1a e 2a ordem contı́nuas, sendo assim, em particular, L diferenciável, como função de três variáveis. Definiremos agora alguns espaços(vetoriais) de funções reais que serão utilizados adiante: Definição 3.1.1 O conjunto das funções contı́nuas que se anulam na fronteira C0 ([0, 1], R) := {f : [0, 1] → R; f é contı́nua; f (0) = f (1) = 0} Definição 3.1.2 O conjunto das função de classe C k que se anulam na fronteira C0k ([0, 1], R) := {f : [0, 1] → R; f ∈ C k ; f (0) = f (1) = 0} onde k ≥ 1 é um inteiro. Obs 3.1.1 Note que tanto C0k ([0, 1], R) quanto C0 ([0, 1], R) são subespaços vetoriais de C([0, 1], R) munidos das operações herdadas do mesmo. Apresentemos agora um lema de suma importância: 21 CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 22 Lema 3.1.1 (Lema fundamental do Cálculo das Variações) Seja g : [0, 1] → R uma função contı́nua tal que Z 1 g(x)f (x)dx = 0 ∀f ∈ C0 ([0, 1], R) 0 Então g ≡ 0. Demonstração: Suponha, por absurdo, que g 6= 0. Então, sem perda de generalidade, podemos supor, devido a continuidade de g, que g > 0 em um intervalo [a, b] ⊆ [0, 1]. Defina h(x) := (a − x)(x − b) em [a, b] e h(x) = 0 em [0, 1] ∩ [a, b]c . É imediato que h ∈ C0 ([0, 1], R). Por outro lado Z 1 Z g(x)h(x)dx = 0 b g(x)h(x)dx > 0 a uma vez que g(x)h(x) > 0 em [a, b]. Portanto obtivemos uma contradição à nossa hipótese, donde g ≡ 0. Obs 3.1.2 Note que o lema acima poderia ser reformulado para f ∈ C0k ([0, 1], R) ao invés de f ∈ C0 ([0, 1], R), a demonstração seria, essencialmente a mesma, sendo feita apenas a definição de h(x) := ((a − x)(x − b))k em [a, b] e h(x) = 0 em [0, 1] ∩ [a, b]c . É fácil ver que h ∈ C0k ([0, 1], R). Definição 3.1.3 Fixados A, B ∈ R definiremos A(A,B) := {y : [0, 1] → R; y = y(x) ∈ C 1 ; y(0) = A e y(1) = B}. Chamaremos os elementos de A(A,B) de curvas admissı́veis. Obs 3.1.3 Note que A(A,B) é uma variedade afim contida em C 1 ([0, 1], R) com espaço tangente C01 ([0, 1], R), pois note que dadas duas curvas y1 , y2 ∈ A(A,B) ambas não pertencem a C01 ([0, 1], R), entretanto y1 − y2 ∈ C01 ([0, 1], R). Definição 3.1.4 Definiremos o funcional J : A(A,B) → R por Z J[y] := 1 L(x, y(x), y 0 (x))dx 0 onde L é a Lagrangiana definida em (3.1). CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 23 Exemplo 6: Sejam y1 (x) = x e y2 (x) = x2 pertencentes a A(0,1) e considere a seguinte lagrangiana 1 L(x, y, y 0 ) = (y 0 )2 + y 3 . 2 Assim segue L(x, y1 , y10 ) = L(x, x, 1) = 1 + x3 2 implicando assim que: Z 1 1 1 1 1 1 1 1 3 J[y1 ] = ( + x3 )dx = x0 + x4 0 = + = 2 4 2 4 4 0 2 Temos ainda que: 1 L(x, y2 , y20 ) = L(x, x2 , 2x) = (2x)2 + x6 2 implicando Z 1 2 1 1 1 2 1 17 (2x2 + x6 )dx = x3 0 + x7 0 = + = . 3 7 3 7 21 0 p Exemplo 7: Considere ainda A(0,1) e a lagrangiana L(x, y, y 0 ) = 1 + (y 0 )2 e portanto o funcional Z 1p J[y] = 1 + (y 0 )2 dx. J[y2 ] = 0 p 1 + |y 0 | 0 2 Usando o fato de que 1 + (y ) ≥ √ , temos que 2 Z 1p Z 1 Z 1 √ 1 + y0 1 + |y 0 | 0 2 √ √ dx = 2 J[y] = 1 + (y ) dx ≥ dx ≥ 2 2 0 0 0 √ Note agora que y1 (x) = x ∈ A(0,1) e J[y1 ] = 2. Logo y1 minimiza tal funcional. Daı́ eu diria que o objetivo é desenvolver uma teoria que permite minimizar(maximizar) funcionais y 7→ J[y] mais gerais, para os quais os métodos tradicionais do cálculo não dão suporte. Essa teoria é o Cálculo das Variações. Estaremos a partir de agora interessados em encontrar curvas admissı́veis, que sejam extremos para J, na realidade curvas y estacionárias para o funcional J , i.e, desejamos encontrar curvas admissı́veis y tais que δJ[y]h = 0 ∀ h ∈ C01 ([0, 1], R). CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 24 Consideremos então y ∈ A(A,B) uma curva admissı́vel que seja estacionária,i.e., δJ[y]h = 0 para toda curva h ∈ C0 ([0, 1], R). Fixada uma tal h, definamos a função “perturbação” para J por ξ : (−, ) → R, > 0, dada por ξ(t) := J[y + th]. O fato de y ∈ A(A,B) ser estacionária para J é equivalente a ξ 0 (0) = 0, uma vez que ξ 0 (0) = δJ[y]h. Por outro lado, Z 1 ξ(t) = J[y + th] = L(x, y + th, y 0 + th0 )dx. 0 Como o sinal da integral é relativo a x e a derivada de ξ é relativa a t, temos: Z 1 0 ξ (t) = [Ly (x, y + th, y 0 + th0 )h + Ly0 (x, y + th, y 0 + th0 )h0 ]dx 0 donde, integrando por partes, Z 1 1 0 ξ (t) = Ly (x, y + th, y 0 + th0 )hdx + Ly0 (x, y + th, y 0 + th0 )h0 0 Z 1 d Ly0 (x, y + th, y 0 + th0 )hdx − dx 0 Como h(0) = h(1) = 0, o segundo termo do lado direito da igualdade acima se anula e obtemos Z 1 d 0 ξ (t) = [Ly (x, y + th, y 0 + th0 ) − Ly0 (x, y + th, y 0 + th0 )]hdx dx 0 Fazendo t = 0, e usando que ξ 0 (0) = δJ[y]h = 0, chegamos finalmente a Z 1 d [Ly (x, y, y 0 ) − Ly0 (x, y, y 0 )]hdx = 0. dx 0 Como h ∈ C01 ([0, 1], R) é arbitrária, segue da observação (3.1.1) que: Ly (x, y, y 0 ) = d Ly0 (x, y, y 0 ). dx A equação acima é chamada de Equação de Euler1 -Lagrange2 associada ao funcional J. 1 2 Leonhard Euler(1707-1783) nascido em Basiléia na Suiça. Joseph-Louis Lagrange(1736-1813) nascido em Turim na Itália. CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 25 d Obs 3.1.4 : Note a diferença entre dx L e Lx . A primeira é a derivada de L como função da variável x. A segunda é a derivada parcial de L como função explicita de x, em outras palavras, se L = L(y, y 0 ) então terı́amos: d L = Ly y 0 + Ly0 y 00 e Lx = 0 dx O teorema abaixo nos dá uma condição necessária para uma curva y = y(x) ∈ A(A,B) seja uma curva extrema para J. Teorema 3.1.1 Seja y = y(x) ∈ A(A,B) uma curva extremo para o funcional J. Então y satisfaz a equação de Euler-Lagrange Ly (x, y, y 0 ) = d Ly0 (x, y, y 0 ). dx Sabemos que dada uma solução y = y(x) da equação de Euler-Lagrange d Ly0 = Ly dx temos que a mesma é de classe C 1 ([0, 1], R), pois lembre-se que y = y(x) é uma curva admissı́vel. Uma pergunta bastante pertinente seria tentar saber se y 00 existe e se é contı́nua, e que condições sobre L deverı́amos impor para que isso aconteça. O teorema a seguir responde tal pergunta. Teorema 3.1.2 Suponha que y = y(x) possui derivada primeira contı́nua e satisfaz a equação d Ly0 = Ly . dx Se L = L(x, y, y 0 ) possui derivadas parciais de primeira e segunda ordem contı́nuas com respeito a todos os argumentos, então y = y(x) possui derivada segunda contı́nua em todos os pontos x tais que Ly0 y0 (x, y(x), y 0 (x)) 6= 0. Demonstração: Seja g : [0, 1] → R dada por g(t) := Ly0 (x + t∆x, y + t∆y, y 0 + t∆y 0 ) onde ∆x, ∆y e ∆y 0 são pequenas variações nas respectivas coordenadas. Pelas hipóteses sobre L, g é de classe C 1 , e pelo teorema do valor médio de Lagrange, deve existir c ∈ (0, 1) tal que g(1) − g(0) = g 0 (c). CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 26 Temos então que g 0 (c) = (Ly0 x ∆x + Ly0 y ∆y + Ly0 y0 ∆y 0 ) |t=c . Fazendo ∆Ly0 = g(1) − g(0) = Ly0 (x + ∆x, y + ∆y, y 0 + ∆y 0 ) − Ly0 (x, y, y 0 ) temos que ∆Ly0 ∆y ∆y 0 − Ly0 x + Ly0 y = Ly 0 y 0 ∆x ∆x t=c ∆x t=c Note que existe o limite quando ∆x → 0 da expressão do lado esquerdo da igualdade acima e tal limite é Ly − Ly0 x − Ly0 y y 0 (∗) uma vez que as derivadas d parciais de L são contı́nuas e dx Ly0 = Ly . Daı́ segue que o limite quando ∆x → 0 da expressão do lado direito existe e é igual a (∗). Temos ainda que lim Ly0 y0 |t=c = Ly0 y0 ∆x→0 daı́ segue que se Ly0 y0 6= 0, então y 00 existe e ∆y 0 Ly − Ly0 x − Ly0 y y 0 = ∆x→0 ∆x Ly0 y0 y 00 (x) = lim e protanto contı́nua em x. Façamos agora algumas considerações sobre casos particulares da equação de Euler-Lagrange: Caso 1: (L = L(x, y 0 )) Temos nesse caso que a equação de Euler-Lagrange se reduz a : d Ly0 (x, y 0 ) = 0 dx e portanto Ly0 (x, y 0 ) = C(cte). Caso 2: (L = L(y, y 0 )) Assumiremos aqui Ly0 y0 6= 0 e portanto nas hipóteses do teorema anterior. Vejamos inicialmente que Ly − d Ly0 = Ly − Ly0 y y 0 − Ly0 y0 y 00 dx Multiplicando em ambos os lados por y 0 , temos: Ly y 0 − ( d Ly0 )y 0 = Ly y 0 − Ly0 y (y 0 )2 − Ly0 y0 y 00 y 0 . dx Note agora que d (L − y 0 Ly0 ) = Ly y 0 + Ly0 y 00 − y 00 Ly0 − y 0 Ly0 y y 0 − y 0 Lyy0 y 00 dx = Ly y 0 − Ly0 y (y 0 )2 − Ly0 y y 0 y 00 CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 27 E daı́ seguindo que: d d Ly0 )y 0 = (L − y 0 Ly0 ) . dx dx Daı́, como y satisfaz a equação de Euler-Lagrange, segue que tal equação é equivalente a L(y, y 0 ) − y 0 Ly0 (y, y 0 ) = C(cte). (Ly − Caso 3:(L = L(x, y)) A equação de Euler-Lagrange nesse caso é equivalente a: Ly (x, y) = 0. 3.2 O Princı́pio de Fermat Em 1657, Pierre de Fermat3 encontrou um novo método para determinar a trajetória dos raios luminosos, baseado na sua hipótese de que “a natureza sempre atua pelo caminho mais curto”. Tal hipótese é conhecida como princı́pio de Fermat e seu enunciado preciso é o seguinte é: “Dentre todos os caminhos possı́veis para ir de um ponto a outro, a luz segue aquele que é percorrido no tempo mı́nimo.” Tal caminho escolhido pela luz é denominado de caminho ótico mı́nimo. Para a propagação da luz num meio homogêneo, cujo ı́ndice de refração da luz é constante, o caminho ótico mı́nimo também corresponde à distância mı́nima, ou seja, o princı́pio de Fermat leva à propagação retilı́nea da luz entre dois pontos. Exemplo 8: (Propagação da luz em um meio inomogêneo). Um meio opticamente inomogêneo é um meio onde o ı́ndice de refração da luz (n) varia continuamente de ponto em ponto, e portanto o mesmo acontece com sua velocidade uma vez a velocidade da luz em tal meio que é dada por c v= n onde c é a velocidade da luz no vácuo. Suponha então que a luz se propague num meio inomogêneo bidimensional xy e sua velocidade seja dada por uma função contı́nua η = η(y). O caminho ótico mı́nimo y = y(x) da luz ligando os pontos (0, A) e (1, B) minimiza o funcional Z 1p 1 + y 02 J[y] = dx. η(y) 0 3 Pierre de Fermat(1601-1665) nascido em Beaumont-de-Lomagne na França. CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 28 Temos então que a lagrangiana associada a tal problema fı́sico é: p 1 + y 02 L = L(y, y 0 ) = . η(y) Temos que y deve satisfazer a equação de Euler-Lagrange para tal funcional, daı́ calculando-a temos p 1 + y 02 y 02 p L − y 0 Ly0 = − = C(cte) η(y) η(y) 1 + y 02 portanto p 1 + y 02 − y 02 = Cη(y) 1 + y 02 , implicando assim que p 1 η(y) 1 + y 02 = (cte). C (3.1) Seja φ = φ(x) o ângulo formado entre a reta tangente a y = y(x) no ponto x e o eixo y, temos então que: y 0 (x) = cotgφ(x) ⇒ 1 + y 02 = 1 + cotg2 φ(x) = 1 sen2 φ(x) . Segue então que a equação de Euler-Lagrange(3.1) é equivalente a senφ(x) = κ(cte) η(y(x)) que é conhecida como Lei de Snell da óptica geométrica. Aos leitores amantes da fı́sica façamos mais alguns comentários: Suponhamos que um determinado meio inomogêneo tenhamos η(y) = ρy, onde ρ é uma constante real, vejamos quem são os caminhos óticos mı́nimos: Temos y 2 (1 + y 02 ) = µ2 Note que |y| ≤ |µ|, daı́ podemos fazer a seguinte mudança de varı́ável y = µsent temos: dy dx = µcost ⇒ y 0 = µcost. dt dt Assim dy dx ( )2 = y 02 ( )2 dt dt e daı́ dx dx µ2 sen2 t[( )2 + µ2 cos2 t] = µ2 ( )2 . dt dt CAPÍTULO 3. EQUAÇÕES DE EULER-LAGRANGE 29 segue que µ2 ( dx dx 2 ) (1 − sen2 t) = µ4 sen2 tcos2 t ⇒ = ±µsent dt dt donde x(t) = ±µcost + x0 e os caminhos óticos mı́nimos os cı́rculos com centro sobre o eixo x dados por (x − x0 )2 + y 2 = µ2 . Capı́tulo 4 Problemas Variacionais Neste capı́tulo estaremos interessados em estudar três problemas variacionais clássicos: O problema de distância mı́nima no em R2 , o problema da Braquistócrona e o problema da superfı́cie de revolução de área mı́nima. Não seremos, para efeito didático, rigorosos na resolução de tais problemas, uma vez que iremos admitir que os funcionais associados a tais problemas admitem mı́nimos e iremos encontrá-los através das equações de Euler-Lagrange como curvas estacionárias. Lembre-se que o fato de uma curva admissı́vel y = y(x) ser solução para a equação de Euler-Lagrande é uma condição necessária para que a mesma seja um extremo para o funcional em questão, entretanto não é uma condição suficiente para tal propósito. Tais condições suficientes serão dadas nos capı́tulos adiante, quando fizermos um estudo analı́tico sobre a segunda variação de tais funcionais. 4.1 Distância mı́nima no plano. Talvez o problema variacional mais simples seja o da distância mı́nima no plano Dados dois pontos A e B fixados no plano cartesiano xy. Qual, dentre todas as curvas planas unindo tais pontos, possui comprimento minimo? Considere inicialmente os tais dois pontos A e B no plano xy, imagine agora uma curva unindo tais pontos. Sem nenhuma perda de generalidade, podemos considerar curvas α : [0, 1] → R2 onde α(0) = A e α(1) = B. Esperamos de tais curvas um pouco de regularidade e ainda, para efeito didático, imaginemos que tais curvas sejam gráficos de funções y = y(x) ou x = x(y) de classe C 1 , ou seja, estamos falando de curvas admissı́veis em A(A,B) . Qual das curvas em questão minimiza a distância entre tais pontos? 30 CAPÍTULO 4. PROBLEMAS VARIACIONAIS 31 Solução: Se y = y(x) ∈ A(A,B) , então o comprimento S(y) da curva y é dado pela seguinte integral: Z 1p S(y) = 1 + y 02 dx. 0 Logo, a curva desejada é tal que minimiza o seguinte funcional: Z 1p J[y] = 1 + y 02 dx. 0 A lagrangiana associada é p L(x, y, y 0 ) = 1 + y 02 , de forma que a curva desejada deve satisfazer a equação de Euler-Lagrange associada a tal funcional. Como y0 Ly0 = p 1 + y 02 e L não depende explicitamente de x, a equação de Euler-Lagrange associada é equivalente a L − y 0 Ly0 = p y 02 1 1 + y 02 − p =p = C(cte). 1 + y 02 1 + y 02 Portanto y 0 (x) = λ(cte), e daı́ y(t) = λt + β onde λ e β são constante tais que y(0) = A e y(1) = B. Reobtemos assim o resultado do exemplo 7, i.e., Temos assim que a curva que minimiza a distância entre tais pontos é tais pontos é o segmento de reta que os une. 4.2 Braquistócrona Um dos problemas famosos na história da matemática é o problema da braquistócrona1 1 “Braquistócrona” deriva do grego: brachistos, menor e chronos, tempo. CAPÍTULO 4. PROBLEMAS VARIACIONAIS 32 Qual a curva ao longo da qual uma partı́cula desliza, sem atrito, em tempo mı́nimo, atuando sobre a mesma apenas a aceleração gravitacional, de um ponto P dado para outro ponto Q, o segundo ponto estando mais abaixo do que o primeiro, mas não diretamente abaixo? Esse problema foi proposto por Johann Bernoulli2 em 1696 como um desafio aos matemáticos de sua época. Soluções corretas foram encontradas pelo próprio Johann Bernoulli e ainda pelo seu irmão Jakob(Jacques) Bernoulli3 , além de Isaac Newton4 , Gottfried Leibniz5 e o Marquês de L’Hôpital6 . Consideremos então um sistema de coordenadas cartesianas xy onde a orientação do eixo y é contrária a usual. E consideremos tais pontos como sendo P = (0, 0) e Q = (1, B). Solução: Considerando nula a velocidade inicial da partı́cula , temos, pela equação de Torricelli, que a velocidade da partı́cula em função de y é dada por p v(y) = 2gy onde g é a aceleração gravitacional. Temos ainda que o comprimento S da curva y ligando P ao ponto (x, y(x)) é dado por Z xp S= 1 + y 02 ds. 0 Dessa forma, temos p d S = 1 + y 02 dx p dS = 1 + y 02 dx e daı́ Lembrando que, v= d 1 S ⇒ dS = vdt ⇒ dt = dS, dt v obtemos p dt = 2 1 + y 02 √ dx, 2gy Johann Bernoulli(1667-1748) nascido em Basiléia na Suiça. Jakob(Jacques) Bernoulli(1654-1705) nascido em Basiléia na Suiça. 4 Sir Isaac Newton(1643-1727) nascido em Woolsthorpe na Inglaterra. 5 Gottfried Wilhelm von Leibniz(1646-1716) nascido em Leipzig na Alemanha. 6 Guillaume François Antoine Marquis de L’Hôpital(1661-1704) nascido em Paris na França. 3 CAPÍTULO 4. PROBLEMAS VARIACIONAIS 33 por sua vez, implicando que o tempo τ0,B gasto para ir de P a Q é dado por: Z 1p 1 + y 02 √ τ0,B = dx 2gy 0 Logo a curva procurada minimiza o funcional: Z 1p 1 + y 02 1 J[y] = √ dx, √ y 2g 0 com lagrangiana associada p 0 L = L(y, y ) = e portanto, 1 + y 02 . √ y y0 Ly0 = √ p . y 1 + y 02 A equação de Euler-Lagrange nesse caso é equivalente a p 1 + y 02 y 02 L − y 0 Ly0 = −√ p = C(cte) √ y y 1 + y 02 segue que √ p 1 + y 02 − y 02 = C y 1 + y 02 ⇒ y(1 + y 02 ) = κ2 (cte). Veja que |y| ≤ κ2 , daı́ chamando y = κ2 sen2 t, segue que dy dx = 2κ2 sent cost ⇒ 2κ2 sent cost = y 0 . dt dt Assim: y[( dx 2 dy dx ) + y 02 ( )2 ] = κ2 ( )2 , dt dt dt o que nos dá κ2 sen2 t[( dx 2 dx ) + 4k 4 sen2 t cos2 t] = κ2 ( )2 , dt dt ou ainda: 4κ6 sen4 t cos2 t = κ2 ( dx 2 ) (1 − sen2 t). dt Logo, 4κ4 sen4 t = ( dx 2 dx ) ⇒ = 2κ2 sen2 t dt dt CAPÍTULO 4. PROBLEMAS VARIACIONAIS 34 A escolha de dx > 0 é devido y 0 > 0, resultante orientação imposta, e ainda dt dy dx > 0, logo dt > 0. Usando agora o fato de que 2sen2 t = 1 − cos2t, segue dt que: dx = κ2 − κ2 cos2t dt implicando em sen2t κ2 ) e y(t) = (1 − cos2t) 2 2 finalmente, substituindo θ = 2t, temos: x(t) = κ2 (t − κ2 κ2 (θ − senθ) e y = (1 − cosθ) 2 2 Tal curva é conhecida como ciclóide. x= Obs 4.2.1 A ciclóide é obtida da seguinte forma: Considere um disco de raio r > 0, imagine que o disco está inerte com centro no ponto (0, r) e seja P o ponto do disco que está sobre a origem. Imagine agora que o disco começa a rolar sobre o eixo x, sem atrito. A curva descrita pelo ponto P ao longo do movimento é a ciclóide γ(t) = r(t − sent, 1 − cost). 4.3 Superfı́cie de revolução de área mı́nima Mais um dos problemas variaionais clássico famosos é o seguinte problema: Considere inicialmente uma curva y = y(x) ∈ A(A,B) , que não intercepta o eixo x, sem perda de generalidade, y(x) > 0 ∀x ∈ [a, b] e seja σ a superfı́cie de revolução gerada pela rotação de y em torno do eixo x Qual dentre as curvas perfis y admissı́veis, com tais hipóteses, gera a superfı́cie σ de área mı́nima? Solução: Podemos encarar tal curva y = y(x) em R3 como sendo γ : [0, 1] → R3 dada por γ(x) = (x, y(x), 0). Rotacionando γ em torno do eixo x, encontramos a seguinte superfı́cie parametrizada Φ : [0, 1] × [0, 2π] → R3 , dada por: 1 0 0 x Φ(x, θ) = 0 cosθ −senθ . y = (x, ycosθ, ysenθ) 0 senθ cosθ 0 Temos assim que a área Sσ de σ é dada por: Z 1 Z 2π Sσ = ||Φx ∧ Φθ ||dθdx 0 0 CAPÍTULO 4. PROBLEMAS VARIACIONAIS 35 onde o sinal “∧” simboliza o produto vetorial das derivadas parciais de Φ. Das derivadas parciais de Φ Φx (x, θ) = (1, y 0 cosθ, y 0 senθ), Φθ (x, θ) = (0, −ysenθ, ycosθ), obtemos Φx ∧ Φθ = (yy 0 , −ycosθ, −ysenθ) e daı́ uma vez que y > 0, ||Φx ∧ Φθ || = y p 1 + y 02 , logo, Z 1 Z Sσ = 2π y 0 p 1+ Z y 02 dθdx 1 = 2π 0 y p 1 + y 02 dx 0 Assim, a curva procurada é tal que minimiza o funcional Z 1 p J[y] = 2π y 1 + y 02 dx, 0 onde a lagrangiana associada é dada por L = L(y, y 0 ) = y e portanto p 1 + y 02 yy 0 Ly0 = p 1 + y 02 , Usando novamente o fato da não-dependência explı́cita de x da lagrangiana, a curva procurada deve satisfazer a equação de Euler-Lagrange associada a tal funcional, que nesse caso é equivalente a L − y 0 Ly0 = y y.(y 0 )2 1 + y 02 − p = C(cte), 1 + y 02 p ou ainda y=C p 1 + (y 0 )2 . Agora, y=C p 1 + y 02 ⇒ y 2 = C2 + C2 (y 0 )2 ⇒ C2 (y 0 )2 = y 2 − C2 e daı́, dy = dx r y 2 − C2 = C2 p y 2 − C2 . C CAPÍTULO 4. PROBLEMAS VARIACIONAIS 36 Separando variáveis, temos Cdy p y 2 − C2 = dx, donde x + C1 = C ln y+ p y 2 − C2 C ! e portanto y+ x + C1 = ln C p y 2 − C2 C ! e − x + C1 C = ln y− p y 2 − C2 C ! Assim, e x+C1 C = y+ p y 2 − C2 −( x+C1 ) y − C e = C Lembrando que cosh t = p y 2 − C2 C et + e−t , 2 segue finalmente que y(x) = C cosh x + C1 C . Tal curva é conhecida com catenária. Obs 4.3.1 A catenária será apresentada adiante como solução de um problema variacional isoperimétrico. Capı́tulo 5 Equação de Euler-Lagrange generalizada. 5.1 Equação de Euler-Lagrange generalizada. Consideremos agora a lagrangiana L : [0, 1] × RN × RN → R, onde 0 1 ≤ N é um número natural, L = L(x, y1 , ..., yN , y10 , ..., yN ), onde novamente L possui derivadas parciais contı́nuas de primeira e segunda ordem em relação a todas as coordenadas. O funcional associado a tal lagrangiana é Z 1 0 J[y1 , ..., yN ] = L(x, y1 , ..., yN , y10 , ..., yN )dx. 0 Calculemos então a equação de Euler-Lagrangre associada a tal funcional, portanto y1 , ..., yN curvas admissı́veis e h1 , ..., hN ∈ C01 ([0, 1], R), definindo novamente a “ perturbação” ξ : (−, ) → R por ξ(t) := J[y1 + th1 , ..., yN + thN ], Temos ξ 0 (t) = Z 0 Z = 1 N X Lyi hi + N X Lyi0 h0i dx i=1 N 1X i=1 N X i=1 i=1 Lyi hi dx + 0 ! 1 Lyi0 hi 0 − Z 0 N 1X i=1 d Ly0 hi dx, dx i onde realizamos integração por partes na segunda igualdade. Usando o fato de que hi (1) = hi (0) = 0, i = 1, ..., N e fazendo t = 0, temos N Z 1 X d 0 ξ (0) = δJ[y1 , ..., yN ](h1 , ..., hN ) = (Lyi − Lyi0 )hi dx. dx i=1 0 37 CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.38 Daı́, se y1 , ..., yN forem curvas que extremizem(estacionárias) o funcional, temos ξ 0 (0) = 0 e como hi é arbitrária, novamente segue Lyi = d Ly0 (i = 1, ..., N ).1 dx i Tais equações são chamadas de equações de Euler-Lagrange associadas ao funcional J[y1 , ..., yN ]. Vejamos agora uma versão do teorema (3.1.2) do capı́tulo 3 sobre regularidade das soluções para as equações de Euler-Lagrange generalizadas: Teorema 5.1.1 Suponha que y1 = y1 (x), ..., yN = yN (x) possuem derivadas primeira contı́nua e satisfazem as equações d Ly0 = Lyi (i = 1, ..., N ). dx i 0 Se L = L(x, y1 , ..., yN , y10 , ..., yN ) possui derivadas parciais de primeira e segunda ordem contı́nuas com relação a todos os argumentos, então yi = yi (x) (i = 1, ..., N ) possui derivada segunda contı́nua em todos os pontos x tais que det(Lyi0 yj0 )2 6= 0. Demonstração: : Imitando a demonstração do teorema (3.1.2), definamos gi : [0, 1] → R por 0 0 gi (t) = Lyi0 (x + t∆x, y1 + t∆y1 , ..., yN + t∆yN , y10 + t∆y10 , ..., yN + t∆yN ) Pelo teorema do valor médio de Lagrange, deve existir ci ∈ (0, 1) tal que gi (1) − gi (0) = gi0 (ci ). por outro lado, pela regra da cadeia, gi0 (ci ) = Lyi0 x ∆x + N X Lyi0 yj ∆yj + j=1 N X j=1 ! Lyi0 yj0 ∆yj0 t=ci e segue daı́ que d z }|i " # { N N X X ∆Lyi0 ∆yj0 ∆yj − Lyi0 x + Lyi0 yj ( ) = Lyi0 yj0 ( ) ∆x ∆x t=ci ∆x j=1 j=1 t=ci 1 2 A observação (3.1.2) é utilizada para cada integral em questão. (Lyi0 yj0 )1≤i,j≤N é uma matriz quadrada de ordem N . CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.39 Tal sistema de equações pode ser visto matricialmente da forma ∆y0 1 d1 |t=c1 ∆x . .. = Ly0 y0 .. . . i j dN |t=cN 0 ∆yN ∆x Pelas hipóteses sobre L, quando ∆x → 0 todos os limites das entradas da matriz (Lyi0 yj0 ) e das entradas da matriz coluna à esquerda existem e são funções contı́nuas. Assim, se det(Lyi0 yj0 ) 6= 0 então o limite quando ∆x → 0 de cada entrada da matriz coluna à direita,i.e., yi00 , existe,sendo contı́nuo pela identidade matricial. 5.2 Geodésicas Como uma aplicação as equações de Euler-Lagrange generalizadas falaremos de curvas sobre superfı́cies que minimizam distância. Consideremos então uma superfı́cie σ parametrizada por Φ = Φ(u, v) Dados A, B ∈ σ, uma curva suave γ : [0, 1] → σ é dita minimizante se γ possuir comprimento mı́nimo dentre todas as curvas suaves sobre σ ligando A e B. Se γ : [0, 1] → σ é uma curva suave tal que γ(0) = A e γ(1) = B, dada por γ(x) = Φ(u(x), v(x)) o seu comprimento `(γ)é dado por Z `(γ) = 1 ||γ 0 (x)||dx. 0 Pela regra da cadeia, temos y 0 (x) = u0 Φu + v 0 Φv , donde ||y 0 (x)||2 = hΦu , Φv i u02 + 2 hΦu , φv i u0 v 0 + hΦu , Φv i v 02 . Denotando hΦu , Φu i = E, hΦu , Φv i = F e hΦv , Φv i = G temos Z `(γ) = 0 1 √ Eu02 + 2F u0 v 0 + Gv 02 dx CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.40 Dessa forma as curvas minimizantes γ = γ(x) de σ minimizam o funcional Z 1√ J[u, v] = Eu02 + 2F u0 v 0 + Gv 02 dx, (5.1) 0 com lagrangiana associada L = L(x, u, v, u0 , v 0 ) = √ Eu02 + 2F u0 v 0 + Gv 02 . e as equações de Euler-Lagrange correspondentes são Lu = d d Lu0 e Lv = Lv0 . dx dx Derivando L2 = Eu02 + 2F u0 v 0 + Gv 02 implicitamente com respeito a u, temos: 2LLu = Eu u02 + 2Fu u0 v 0 + Gu v 02 e daı́ Lu = 1 Eu u02 + 2Fu u0 v 0 + Gu v 02 √ . 2 Eu02 + 2F u0 v 0 + Gv 02 Lv = 1 Ev u02 + 2Fv u0 v 0 + Gv v 02 √ . 2 Eu02 + 2F u0 v 0 + Gv 02 De forma análoga, Temos ainda que: 2LLu0 = 2Eu0 + 2F v 0 ⇒ Lu0 = √ Eu0 + F v 0 , Eu02 + 2F u0 v 0 + Gv 02 F u0 + Gv 0 . Eu02 + 2F u0 v 0 + Gv 02 Portanto as equações de Euler-Lagrange são: Eu u02 + 2Fu u0 v 0 + Gu v 02 d 2(Eu0 + F v 0 ) √ √ = dx Eu02 + 2F u0 v 0 + Gv 02 Eu02 + 2F u0 v 0 + Gv 02 Ev u02 + 2Fv u0 v 0 + Gv v 02 d 2(F u0 + Gv 0 ) √ √ = dx Eu02 + 2F u0 v 0 + Gv 02 Eu02 + 2F u0 v 0 + Gv 02 Exemplo 9: Seja σ o cilindro parametrizado por 2LLv0 = 2F u0 + 2Gv 0 ⇒ Lv0 = √ Φ : [0, 2π] × [0, 1] → R3 , Φ(θ, τ ) = (ρcosθ, ρsenθ, τ ) CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.41 então Φθ (θ, τ ) = (−ρsenθ, ρcosθ, 0), Φτ (θ, τ ) = (0, 0, 1) implicando em: E = hΦθ , Φθ i = ρ2 , F = hΦθ , Φτ i = 0 e G = hΦτ , Φτ i = 1 Logo, as curva minimizantes γ = γ(x) = Φ(θ(x), τ (x)) são tais que: " " # # d ρ2 θ 0 τ0 d p p =0 e = 0, dx dx ρ2 θ02 + τ 02 ρ2 θ02 + τ 02 i.e., ρ2 θ 0 p ρ2 θ02 + τ 02 = C1 τ0 e p ρ2 θ02 + τ 02 = C2 . Considerando τ = τ (θ(x)) segue, pela regra da cadeia, que τ 0 = dτ 0 θ. dθ Assim, dτ τ0 = 0 ⇒ τ = λθ + β(cte) dθ θ e daı́ γ(θ) = φ(θ(x), τ (θ(x))) = Φ(θ, λθ + β) = (ρcosθ, ρsenθ, λθ + β) é uma hélice(se λ 6= 0) ou um cı́rculo(se λ = 0.). Se θ = θ(τ (x)), um raciocı́nio análogo permite concluir que γ(x) = Φ(λτ + β, τ ) = (ρcos(λτ + β), ρsen(λτ + β), τ ), e dessa forma uma hélice(se λ 6= 0) ou um segmento de reta(λ = 0). Ademais, com |γ 0 (x)|2 = ρ2 (θ0 )2 + (τ 0 )2 6= 0, temos, para cada x ∈ [0, 1], θ0 (x) 6= 0 ou τ 0 (x) 6= 0. Portanto, numa vizinhança de cada x ∈ [0, 1], θ = θ(τ (x)) ou τ = τ (θ(x)), e é imediato concluir que as curvas acima constituem todas as soluções das equações de EulerLagrange. Exemplo 10: Seja σ o cilindro circular reto com base de raio r = 1 e parametrizado por: Φ(θ, τ ) = (cosθ, senθ, τ ) 0 ≤ θ ≤ 2π 0 ≤ τ ≤ 1. √ √ √ √ Sejam A = ( 2/2, − 2/2, 1/2) e B = (− 2/2, − 2/2, 1/2) segue, pelas afirmações feitas acima, que a curva γ : [0, 2π] → σ dada por 3 π 3 π 1 γ(θ) = cos( θ − ), sen( θ − ), 4 4 4 4 2 CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.42 é uma solução da equação de Euler-Lagrange associada ao funcional (5.1), entretanto tal curva não é minimizante, pois note que 3 3 π 3 π 0 γ (θ) = −sen( θ − ), −cos( θ − ), 0 4 4 4 4 4 e dessa forma ||γ 0 (θ)|| = 3 4 implicando que 3π >π 2 e portanto γ não pode ser minimizante, uma vez que tais pontos estão sobre um cı́rculo e portanto a distância entre os mesmos deve, obrigatoriamente, ser menor que π. `(γ) = Obs 5.2.1 O exemplo acima mostra que, apesar de as curvas minimizantes sobre uma superfı́cie parametrizada da forma Φ(u, v) serem solução das Equações de Euler-Lagrange para o funcional (5.1), nem toda solução de tais equações será minimizante. Contudo, fixado A ∈ σ é possı́vel mostrar que se B estiver suficientemente próximo de A(em R3 ), então dentre todas as soluções das equações de Euler-Lagrange associadas a (5.1) haverá uma que é minimizante.3 Definição 5.2.1 Uma curva γ solução das equações de Euler-Lagrange associadas ao funcional (5.1) é denominada de geodésica de σ. Obs 5.2.2 Note que γ minimizante ⇒ γ geodésica 6⇒ γ minimizante. 5.3 Problemas Isoperimétricos Alguns dos problemas variacionais podem vir acompanhados de vı́nculos, ou seja, uma condição adicional a qual as curvas admissı́veis devem ainda satisfazer. Um problema isoperimétrico é uma problema da seguinte forma: Encontrar a curva y = y(x) que extremiza o funcional Z 1 J[y] = L(x, x, y 0 )dx 0 3 Ver Manfredo P. do Carmo, Differential Geometry of Curves and Surfaces. CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.43 onde y(0) = A, y(1) = B e cujo funcional Z 1 K[y] = M(x, y, y 0 )dx 0 possua, sobre as curvas admissı́veis, valor fixado `. Para tentar resolver tais problemas enunciemos o seguinte teorema: Teorema 5.3.1 (Multiplicador de Lagrange) Considere o funcional Z 1 J[y] = L(x, x, y 0 )dx, 0 onde as curvas admissı́veis satisfazem as condições Z 1 y(0) = A e y(1) = B, K[y] = M(x, x, y 0 )dx = `, 0 K[y] sendo outro funcional, e se J[y] tem um extremo para y = y(x) e y não é um extremo para K[y] então existe uma constante λ tal que y = y(x) é um extremo do funcional Z 1 (L + λM)dx, 0 i.e., y = y(x) satisfaz a equação diferencial d d Ly − Ly0 + λ My − My0 = 0. dx dx Para uma demonstração do seguinte teorema veja I.M. Gelfand e S.V. Fomin, Calculus of Variations. 5.4 A Catenária. Um problema variacional isoperimétrico clássico bastante famoso é o problema da Catenária: Considere a determinação da forma tomada por um cabo flexı́vel, inextensı́vel, com densidade uniforme ρ e de comprimento `, suspenso entre dois pontos A e B, e sujeito somente ao seu próprio peso. Fisicamente falando, estamos à procura dentre todas as curvas de comprimento ` a que possua energia potencial mı́nima, uma vez que a única força atuando sobre a mesma é o seu peso. CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.44 Solução: A massa de pequena porção infinitesimal ∆si do cabo é dada por ρ∆si . Portanto a força P atuando sobre tal porção é, orientado o eixo y para cima, sendo g o módulo da aceleração gravitacional: P = −ρg∆si . Como tal força atua somente na direção y temos que a energia potencial(gravitacional) V de tal porção do cabo é dada por V = ρgyi ∆si . Dessa forma, energia potencial Ep do cabo é dada por Z 1 Z 1 p Ep = ρg yds = ρg y 1 + y 02 dx, 0 0 onde, sem perda de generalidade, as extremidades do cabo são dadas por y(0) = A e y(1) = B. Logo a curva y = y(x) que procuramos minimiza o funcional Z 1 p J[y] = ρg y 1 + y 02 dx, 0 sujeita ao vı́nculo Z K[y] = 1 p 1 + y 02 dx = `. 0 Temos então as lagrangianas p p L(y, y 0 ) = y 1 + y 02 e M(y, y 0 ) = 1 + y 02 Note que os funcionais J e K não possuem extremos em comum, uma vez que os extremos de K são retas e os extremos de J foram encontrados no problema da superfı́cie de rotação de área mı́nima. Daı́ usando o teorema e = L + λM, temos, pelo fato anterior e considerando a lagrangiana auxiliar L 0 e = L(y, e y ), que a equação de Euler-Lagrange é equivalente a de L e − y0L ey0 = C(cte) L ou ainda p y 02 (y + λ) (y + λ) 1 + y 02 − p = C. 1 + y 02 Segue daı́ y+λ p =C 1 + y 02 temos que tal EDO foi resolvida na seção AJEITAR!!!, donde x + C1 y(x) = coshC( ) + C2 C Concluı́mos assim que a curva procurada é a catenária. CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.45 5.5 O Problema Isoperimétrico Original. Sem dúvida nenhuma, o problema isoperimétrico mais famoso é: Considere como sendo as curvas admissı́veis o conjunto das curvas fechada, que não auto-intersectam, com comprimento total `. Qual, dentre tais curvas admissı́veis, encerra maior área? Solução: Sejam x = x(t), y = y(t) onde 0 ≤ t ≤ 1 e x(0) = x(1) = 0 e y(0) = y(1) = 0 a representação paramétrica das curvas adimı́ssı́veis discutidas acima. Tais curvas devem satisfazer Z 1p K[x, y] = ẋ2 + ẏ 2 dt = ` 0 e a curva admissı́vel procurada deve ser um extremo para o funcional Z 1 J[x, y] = (xẏ − y ẋ)dt, 0 pois tal expressão determina a área encerrada pela curva γ(t) = (x(t), y(t)), em virtude do teorema de Green. Temos que tais funcionais não possuem pontos extremos em comum, uma vez que os pontos extremos de K são segmentos de retas e não é difı́cil de verificar4 que os pontos extremos de J satisfazem y = C1 e x = C2 . Introduzindo novamente a lagrangiana auxiliar p e y, ẋ, ẏ) = 1 (xẏ − y ẋ) + λ ẋ2 + ẏ 2 . L(x, 2 Segue do teorema do multiplicador de Lagrange que a curva desejada satisfaz as equações eẋ e dL ex dLẏ = L ey , =L dt dt seguindo que ! ! 1 1 d 1 λẋ d 1 λẏ ẏ = − y+p , − ẋ = x+ p 2 dt 2 2 dt 2 ẋ2 + ẏ 2 ẋ2 + ẏ 2 e integrando com relação a t segue λẋ y + C1 = p ẋ2 + ẏ 2 4 − x + C2 = p λẏ ẏ 2 + ẏ 2 Decorre direto das equações de Euler-Lagrange associadas a J. . CAPÍTULO 5. EQUAÇÃO DE EULER-LAGRANGE GENERALIZADA.46 Note que ẋ 6= 0 ou ẏ 6= 0, daı́, usando que y 0 = ẏ , segue ẋ −x + C2 dy = , y + C1 dx separando variáveis (−x + C2 )dx = (y + C1 )dy, e integrando em ambos os lados, segue que a curva procurada é (y + C1 )2 + (x − C2 )2 = r2 como escolhemos curvas passando sobre a origem, segue y 2 + x2 = C21 + C22 . Portanto a curva procurada o cı́rculo de raio p ` C21 + C22 = . 2π Capı́tulo 6 Equações de Hamilton 6.1 As Equações de Hamilton Consideremos as equações de Euler-Lagrange dLyi0 = Lyi (i = 1, ..., N ) dx (6.1) associadas ao funcional Z J[y1 , ..., yN ] = 1 0 L(x, y1 , ..., yN , y10 , ..., yN )dx, 0 e suponhamos ainda que a lagrangiana L satisfaç a condição det Lyi0 yj0 6= 0. As equações (6.1) formam então um sistema de N equações diferenciais de segunda ordem. No entanto, tal sistema pode ser reduzido a um sistema de 2N equações de primeira ordem(a nomenclatura “reduzida” está associada à ordem da derivada e não ao número de equações), que, em várias circunstâncias, é bastante conveniente. Por seguinte, a partir de agora, iremos introduzir as chamadas variáveis canônicas. Escrevendo: pi = Lyi0 (i = 1, ..., N ), 0 em termos das variáveis gostarı́amos de expressar as funções y10 , ..., yN x, y1 , ..., yN , p1 , ..., pN , 47 (6.2) CAPÍTULO 6. EQUAÇÕES DE HAMILTON 48 ou seja, estamos interessados numa mudança de variável conveniente, dada por (6.2), que é perfeitamente possı́vel, uma vez que o jacobiano1 det( ∂pi ) = det(Lyi0 yj0 ) 6= 0. ∂yj0 Tal mudança de variável é garantida apenas localmente, pelo teorema da função inversa.2 0 Daı́ expressaremos a função L = L(x, y1 , ..., yN , y10 , ..., yN ) em termos uma 0 0 nova função H = H(x, y1 , ..., yN , y1 , ..., yN ) relativa a L dada por: H = −L + N X yi0 pi i=1 onde yi0 = yi0 (x, y1 , ..., yN , p1 , ..., pN ). A função H é denominada de Hamiltoniana correspondente a L. E finalmente introduzimos as novas variáveis x, y1 , ..., yN , p1 , ..., pN , H chamadas de variáveis canônicas. Vejamos como se transformam as equações de Euler-Lagrange associadas a J mediante as variáveis canônicas. Temos inicialmente, pela definição de H que N N X X 0 dH = −dL + pi dyi + yi0 dpi i=1 i=1 usando a expressão dL = Lx + N X Lyi dyi + i=1 N X Lyi0 dyi0 i=1 segue dH = −Lx − N X i=1 Lyi dyi − N X L yi0 dyi0 i=1 + N X i=1 pi dyi0 + N X yi0 dpi i=1 Encontrarı́amos agora o seguinte problema: Como expressar dyi0 em função de x, y1 , ..., yN , p1 , ..., pN ? 1 Em homenagem a Carl Gustav Jacob Jacobi(1804-1851) nascido em Potsdam na Prússia, hoje Rússia. 2 Para maiores informações veja Elon Lages Lima, Análise Real Vol.II. CAPÍTULO 6. EQUAÇÕES DE HAMILTON 49 No entanto, lembre-se que pi = Lyi0 (i = 1, ..., N ) e portanto dH = −Lx − N X Lyi dyi + i=1 N X yi0 dpi i=1 dyi0 . não envolvendo assim os Por outro lado, H = H(x, y1 , ..., yN , p1 , ..., pN ), e portanto dH = Hx − N X Hyi dyi + i=1 N X lembre-se que Hpi dpi i=1 daı́ pela unicidade da diferencial, segue que: Hx = −Lx , Hyi = −Lyi e Hpi = dyi (i = 1, ..., N ) dx Veja que as quantidades Lyi e yi0 são conectadas as derivadas de H pelas fórmulas acima. Supondo satisfeitas as equações de Euler-Lagrange dLyi0 = Lyi (i = 1, ..., N ) dx temos o seguinte sistema de equações: dyi = Hpi dx dpi = −Hyi (i = 1, ..., N ) dx As equações acima são chamadas de equações de Hamilton3 . 6.2 Integral Primeira para as Equações de Hamilton Definição 6.2.1 Uma função F = F(x, y1 , ..., yN , p1 , ..., pN ) é dita uma curva integral para um sistema de equações diferenciais se a mesma é constante ao longo de cada curva integral do sistema, ou seja, sejam yi = yi (x) e pi = pi (x) soluções de tal sistema, então d F(x, y1 (x), ..., yN (x), p1 (x), ..., pN (x)) = 0 dx 3 William Rowan Hamilton(1805-1865) nascido em Dublin na Irlanda. CAPÍTULO 6. EQUAÇÕES DE HAMILTON 50 0 Consideremos inicialmente uma Lagrangiana L = L(y1 , ..., yN , y10 , ..., yN ) que não dependa explicitamente de x, segue dai que a Hamiltoniana associada à mesma N X H = −L + yi0 pi i=1 também não depende explicitamente de x. Assim segue que N N N dH X dyi X dpi X dyi dpi = Hy i + Hpi = H yi + Hpi dx dx dx dx dx i=1 i=1 i=1 Supondo satisfeitas as equações de Hamilton dyi dpi = Hpi , = −Hyi (i = 1, ..., N ) dx dx e portanto N dH X = (Hyi Hpi − Hpi Hyi ) = 0, dx i=1 ao longo das curvas que extremizam J. Assim segue que se L não depende explicitamente de x então a Hamiltoniana H é uma curva integral para as equações de Hamilton. Caracterizemos agora quando uma função arbitrária Φ = Φ(y1 , ..., yN , p1 , ..., pN ) vem a ser uma curva integral para as equações de Hamilton. Temos, ao longo das curvas integrais para as equações de Hamilton N N N dΦ X dyi X dpi X = Φyi + Φpi = (Φyi Hpi − Φpi Hyi ) dx dx dx i=1 i=1 i=1 denotando [Φ, H] := N X (Φyi Hpi − Φpi Hyi ) i=1 segue dΦ = [Φ, H], dx donde a expressão do lado direito da igualdade acima é chamado de colchete de Poisson4 . Segue daı́ que a identidade acima determina uma condição necessária e suficiente para as equações de Hamilton possuı́rem Φ como integral primeira, ou seja, Φ é uma integral primeira para as equações de Hamilton se, e somente se o colchete de Poisson [Φ, H] é identicamente nulo. Obs 6.2.1 A condição suficiente acima é dada pelo teorema5 de Cauchy4 5 Siméon Denis Poisson(1781-1840) nascido em Pithiviers na França. Ver Jorge Sotomayor, Lições de Equações Diferenciais Ordinárias. CAPÍTULO 6. EQUAÇÕES DE HAMILTON 51 Picard6 . 0 Obs 6.2.2 Se Φ = Φ(x, y1 , ..., yN , y10 , ..., yN ) então a condição é substituı́da por d Φ = Φx + [Φ, H]. dx Exemplo 11: Usaremos as equações de Hamilton para encontrar extremos para o funcional Z p p x2 + y 2 1 + y 02 dx p x2 + y 2 1 + y 02 , e daı́ segue que p y 0 x2 + y 2 Ly0 = p 1 + y 02 Solução: Temos que L(x, y, y 0 ) = p fazendo p = Ly0 , temos p p2 (1 + y 02 ) = y 02 (x2 + y 2 ) ⇒ p2 = y 02 (x2 + y 2 − p2 ) ⇒ y 0 = p x2 como d y = Hp , segue dx p Hp = p x2 + y 2 − p2 + y 2 − p2 . Lembrando da expressão do Hamiltoniano, H = −L + y 0 p como p p x2 + y 2 x2 + y 2 02 = p 1+y = 2 ⇒ 1 + y x + y 2 − p2 x2 + y 2 − p2 02 temos x2 + y 2 L(x, y, y 0 ) = p x2 + y 2 − p2 e portanto p −(x2 + y 2 ) p2 p p H(x, y, p) = + = − x2 + y 2 − p2 x2 + y 2 − p2 x2 + y 2 − p2 6 Charles Émile Picard(1856-1941) nascido em Paris na França. , CAPÍTULO 6. EQUAÇÕES DE HAMILTON 52 lembrando que dp = −Hy dx implicando em y d p= p dx x2 + y 2 − p2 p d y=p dx x2 + y 2 − p2 Considerando p = p(y(x)), segue, pela regra da cadeia que y dp = dy p daı́ separando variáveis temos: pdp = ydy ⇒ p2 = y 2 + C2 (cte) substituindo o valor de p temos p y p ( )2 + 1 y 2 + C2 dy = √ = p Cx 2 dx (C) + 1 x 2 + C2 separando variáveis novamente dy ( Cy )2 p +1 =p dx ( Cx )2 +1 seguindo r ln y y ( )2 + 1 − C C r = ln x x ( )2 + 1 − C C + C1 vamos supor, por simplicidade, que C1 = 0. Então r r y 2 x 1 ( ) + 1 − ( )2 + 1 = (y − x) C C C elevando ao quadrado em ambos os lados r r y 2 x 2 y 2 x 2 y 2 x ( ) +2+( ) −2 ( ) +1 ( ) + 1 = ( )2 − xy + ( )2 C C C C C C C seguindo assim r C r y 2 x 2 ( ) +1 ( ) + 1 = C + xy C C CAPÍTULO 6. EQUAÇÕES DE HAMILTON e daı́ C 2 2 y2 x +1 + 1 = C2 + 2Cxy + x2 y 2 C2 C2 implicando C 2 y 2 x2 y2 x2 + 2 + 2 + 1 = C2 + 2Cxy + x2 y 2 C4 C C e portanto y 2 x2 + y 2 + x2 = 2Cxy + x2 y 2 2 C e finalmente a solução é: 1 2 2 − 1 + y 2 + x2 − 2Cxy = 0. y +x 2 C 53 Capı́tulo 7 O Princı́pio Variacional de Hamilton 7.1 Dinâmica Lagrangiana “Desde que existe como ciência, a Fı́sica tem como seu objetivo mais cobiçado a solução do problema de condensar todos os fenômenos naturais num único princı́pio. Dentre as leis mais ou menos gerais que marcam as conquistas da ciência fı́sica durante o curso dos últimos séculos, o princı́pio da mı́nima ação é talvez aquele que, no que se refere à forma e ao conteúdo, mais se aproxima desse objetivo final da pesquisa teórica”. Max Planck Vı́nculos cinemáticos são limitações às possı́veis posições e velocidades das partı́culas de um sistema mecânico, restringindo a priori o movimento. Se y1 , ..., yN são coordenadas arbitrárias usadas para descrever a configuração1 de um sistema mecânico, um vı́nculo é chamado holônomo2 quando pode ser expresso por uma equação da forma f (t, y1 , ..., yN ) = 0, (7.1) onde f é uma função com um certo grau de regularidade. Em sistemas holônomos é possı́vel introduzir um certo número N de variáveis independentes, denotadas genericamente por q1 , ..., qN e denominadas coordenadas generalizadas de sorte que: 1 A posição de cada uma das partı́culas de um sistema mecânico num dado instante define a configuração do sistema no referido instante. 2 Do grego hólos(inteiro, completo) e nómos(regra, lei). 54 CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON 55 • o vetor posição de cada partı́cula é determinado univocamente em cada instante pelos “qs”; • os vı́nculos, supostos todos da forma (7.1), são identicamente satisfeitos se expressos em termos dos “qs”. O espaço cartesiano N dimensional cujos pontos são as N -uplas formadas pelas coordenadas generalizadas é chamado de espaço de configuração. A medida que o tempo passa, o estado do sistema se modifica e o ponto representativo do sistema descreve uma curva no espaço de configuração, já que as equações q1 = q1 (t), ..., qN = qN (t) são a representação paramétrica de uma curva tendo t como parâmetro. Designaremos, por simplicidade, q = (q1 , ..., qN ). Princı́pio de Hamilton: Dado um sistema mecânico holônomo descrito pela lagrangiana L(t, q, q̇) seu movimento do instante t1 para o instante t2 é tal que a ação Z t2 A(q) = L(t, q, q̇)dt t1 é mı́nima(mais geralmente, estacionária) para a trajetória real, mantidos fixos os pontos inicial e final da trajetória no espaço de configuração. Obs 7.1.1 O princı́pio de Hamilton é também conhecido como princı́pio da mı́nima ação. Considere um sistema mecânico N partı́culas, onde não são impostos nenhum tipo de vı́nculo3 , suponha que tal sistema possua uma energia potencial V, i.e., existe uma função V = V(t, x1 , y1 , z1 , ..., xN , yN , zN ), tal que a força atuando na i-ésima partı́cula tem como componentes Xi = − ∂V ∂V ∂V , Yi = − , Zi = − . ∂xi ∂yi ∂zi A quantidade definida por, onde mi simboliza a massa da i-ésima partı́cula, N 1X T = mi (ẋ2i + ẏi2 + żi2 ) 2 i=1 3 Para uma apresentação com alguns vı́culos incluı́dos veja Robert Weinstock, Calculus of Variations. CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON 56 é chamada de energia cinética do sistema4 . A Lagrangiana que descreve tal sistema mecânico é defina por L = T − V. Tal lagrangiana é ainda conhecida com Potencial Cinético. Pelo princı́pio de Hamilton, a evolução de tal sistena dar-se-á de um instante t1 a um intante t2 de forma que a ação Z t2 A= Ldt t1 é estacionário. Portanto as equações de Euler-Lagrange Lxi = dLx˙i dLy˙i dLz˙i , Lyi = , Lzi = dt dt dt devem ser satisfeitas para i = 1, ..., N . Usando as expressões da energia cinética e da energia potencial, segue d mi ẋi dt d −Vyi = mi ẏi dt d −Vzi = mi z˙i . dt −Vxi = (7.2) Substituindo −Vxi = Xi , −Vyi = Yi e −Vzi = Zi o sistema acima é reduzido a mi ẍi = Xi , mi ÿi = Yi , mi z¨i = Zi , que são justamente as equações de Newton do movimento do sistema de N partı́culas. As variáveis canônicas correspondentes a ação A são pix = Lẋi = mi ẋi , piy = Lẏi = mi ẏi , piz = Lżi = mi z˙i , as quantidades pix , piy e piz são chamadas de momentos generalizados e a quantidade definida por H= N X (ẋi pix + ẏi piy + z˙i piz ) − L = 2T − (T − V) = T + V, i=1 4 Como não são impostos vı́nculos as própria coordenadas x1 , y1 , z1 , ..., xN , yN , zN são as coordenadas generalizadas do sistema. CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON 57 é denominada de energia mecânica ou energia total do sistema. Suponha que um dado sistema mecânico é conservativo, i.e., a energia potencial V não depende explicitamente do tempo, daı́ decorre que a energia mecânica é conservada, i.e., ele permanece constante das soluções do sistema (7.2). De fato, dT dV dH = + , dt dt dt usando as expressões da energia cinética e da energia potencial, segue N d 1X d d (T + V) = mi (ẋi 2 + ẏi 2 + z˙i 2 ) + V(x1 , y1 , z1 , ..., xN , yN , zN ) dt 2 i=1 dt dt = N X mi (ẋi ẍi + ẏi ÿi + +z˙i z¨i ) + i=1 N X (Vxi ẋi + Vyi ẏi + Vzi z˙i ) i=1 e daı́ N N N X X X d dH = (T +V) = ẋi (mi ẍi +Vxi )+ ẏi (mi ÿi +Vyi )+ z˙i (mi z¨i +Vzi ), dt dt i=1 i=1 i=1 daı́ usando d mi ẋi = mi ẍi dt d −Vyi = mi ẏi = mi ÿi dt d −Vzi = mi z˙i = mi z¨i , dt −Vxi = segue que dH = 0 ⇒ H = C(cte). dt A expressão acima é conhecida como Lei da Conservação da Energia Mecânica. Obs 7.1.2 Vejamos um exemplo simples onde a Lei da conservação da Energia Mecânica é obtida de forma mais simples. Considere um campo de forças F : Ω ⊆ R3 → R3 conservativo, atuando sobre uma partı́cula P de massa m e seja V o seu potencial, i.e., ∇V(x, y, z) = −F(x, y, z). Seja γ : [0, 1] → Ω uma curva suave descrevendo a trajetória de P sobre Ω ao longo do tempo. Seja A = γ(0) e B = γ(1), o trabalho W(A,B) a ser realizado para mover P de A até B é dado por Z 1 W(A,B) = F(γ(t)).γ 0 (t)dt 0 CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON 58 onde o ponto “ponto(.)” simboliza o produto interno em R3 . Pela segunda lei de Newton, F(γ(t)) = mγ 00 t), daı́ Z 1 Z 1 1 d 0 00 W(A,B) = m γ (t).γ (t)dt = m (||γ 0 (t)||2 )dt 2 dt 0 0 1 1 0 2 0 2 = m||γ (1)|| − m||γ (0)|| = TB − TA 2 2 donde as quantidades TA e TB representam a energia cinética da partı́culas nos pontos indicados. Por outro lado, Z 1 Z 1 0 W(A,B) = F(γ(t)).γ (t)dt = − ∇V(γ(t))γ 0 (t)dt 0 0 Z 1 d = − (V(γ(t))dt = V(γ(0)) − V(γ(1)) = VA − VB 0 dt donde as quantidades VA a VB representam a energia potencial da partı́cula nos pontos indicados, seguindo então que VA − VB = TB − TA ⇒ TA + VA = TB + VB , ou seja, a energia mecânica é a mesma nos pontos A e B, no entanto, o mesmo procedimento pode ser feito para quaisquer dois pontos sobre a curva γ, e portanto a energia mecânica é conservada. 7.2 Oscilador Harmônico Simples Considere uma partı́cula de massa m fixada a uma mola e sobre a mesma atuando uma força restauradora −κx, i.e., oscilador harmônico simples. Como a força atuando sobre a partı́cula é −κx, a energia potencial para a mesma é 1 V(x) = κx2 2 e a energia cinética 1 T (ẋ) = mẋ2 2 e portanto o potencial cinético associado a tal sistema fı́sico é 1 1 L(x, ẋ) = mẋ2 − κx2 2 2 e daı́ o funcional ação de tal sistema é Z 1 t1 J[x] = (mẋ2 − κx2 )dt. 2 t0 CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON 59 uma vez que Lẋ = mẋ, implicando que p = mẋ, seguindo que L(x, ẋ) = 1 2 1 2 ṗ − κx . 2m 2 Temos a Hamiltoniana associada 1 1 2 p2 1 1 2 H(x, p) = κx2 − p + = κx2 + p, 2 2m m 2 2m daı́, as equações de Hamilton são: ẋ = Hp , ṗ = −Hx ⇒ ẋ = p , ṗ = −κx m note daı́ que: mẍ = ṗ = −κx que é 2a lei de Newton. Calculemos ainda [x, H] = ∂x ∂x Hp − Hx = Hp = ẋ ∂x ∂p e mais [p, H] = como p = mẋ segue que ∂p ∂p Hp − Hx ∂x ∂p ∂p = 0, e portanto ∂x [p, H] = −Hx = ṗ. Vale a pena relembrar que fato de H não depender explicitamente de t implica que H é uma integral primeira para as equações de Hamilton associadas a J. 7.3 Forças Centrais. Usaremos aqui o princı́pio de Hamilton mı́nima para a formulação variacional do problema do movimento plano de uma partı́cula de massa m atraı́da para a origem do sistema de coordenadas por uma força inversamente proporcional ao quadrado da distância a origem, ou seja, uma força central5 . Usaremos coordenadas polares: x(t) = r(t)cosθ(t) e y(t) = r(t)senθ(t) 5 Uma força é dita central quando ela depende somente da distância do corpo a um referencial tomado. CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON 60 temos que a energia cinética T atuando na partı́cula é 1 T = m[ẋ2 + ẏ 2 ] 2 como ẋ = ṙcosθ − rsenθ θ̇ , ẏ = ṙsenθ + rcosθ θ̇, segue que 1 T (r, ṙ, θ, θ̇) = m(ṙ2 + r2 θ̇2 ). 2 Temos que o quadrado distância da partı́cula a origem é r2 , e portanto a força F atuando sobre a tal é F(r) = κ r2 implicando que κ V(r) = − , r onde V é a energia potencial da partı́cula. Daı́ segue que a Lagrangiana associada a este problema fı́sico é 1 1 κ H(r, θ, ṙ, θ̇) = mṙ2 + m2 θ̇2 + , 2 2 r daı́, pelo princı́pio de Hamilton, a evolução do sistema de instante t1 para o instante t2 dar-se-á de forma que o funcional ação Z t2 1 1 κ J[r, θ] = [ mṙ2 + mr2 θ̇ + ]dt 2 r t1 2 sejá minimizado(estacionário). Desejamos encontrar a Hamiltoniana H(r, θ, pr , pθ ) associada a Lagrangiana L. Temos que: pr m pθ pθ = Lθ̇ ⇒ pθ = mr2 θ̇ ⇒ θ̇ = mr2 Assim a Lagrangiana é pr = Lṙ ⇒ pr = mṙ ⇒ ṙ = L(r, θ, ṙ, θ̇) = 1 2 1 2 κ pr + p + 2m 2mr2 θ r e portanto a Hamiltoniana associada ao sistema é H(r, θ, pr , pθ ) = −L(r, θ, ṙ, θ̇) + ṙpr + θ̇pθ CAPÍTULO 7. O PRINCÍPIO VARIACIONAL DE HAMILTON 61 seguindo que H(r, θ, pr , pθ ) = 1 2 1 2 κ pr + p − 2m 2mr2 θ r daı́ as equações de Hamilton são ṙ = Hpr p˙r = −Hr usando que Hr = θ̇ = Hpθ p˙θ = −Hθ , κ pθ Hθ = 0 Hpr = mpr Hpθ = 2 r mr2 segue ṙ = mpr p˙r = − κ pθ θ̇ = p˙θ = 0. 2 r mr2 Calculemos os colchetes de Poisson [Pr , H] = − ∂pr κ Hr = − 2 ∂pr r [Pθ , H] = − ∂pθ HHθ = 0 ∂pθ Logo pθ é uma integral primeira para as equações de Hamilton de tal problema. Calculemos as equações(explı́citas) do movimento da partı́cula. Temos 1 1 κ L(r, θ, ṙ, θ̇) = mṙ2 + mr2 θ̇2 + 2 2 r logo as equações de Euler-Lagrange são L − ṙLṙ = C1 (cte) e daı́ L − θ̇θ̇ = C2 (cte), 1 1 κ − mṙ2 + mr2 θ̇2 + = C1 2 2 r e 1 2 1 2 2 κ mṙ − mr θ̇ + = C2 , 2 2 r 2κ implicando assim que = C1 + C2 ⇒ r = ρ(cte). Daı́ r mr2 θ̇2 = C1 − C2 implicando θ̇2 = cte ⇒ θ = µt + β onde µ e β são constantes. E finalmente as equações do movimento são x(t) = ρcos(µt + β) e x(t) = ρsen(µt + β) ou seja, a partı́cula está movendo-se sobre cı́rculo de raio ρ e centro na origem. Capı́tulo 8 A Equação de Euler-Lagrange em RN . 8.1 A Equação de Euler-Lagrange em RN . Consideremos agora L : Ω × R × RN → R onde Ω ⊆ RN é um aberto, conexo e limitado com fronteira ∂Ω suave e L possuindo derivadas parciais contı́nuas de primeira e segunda ordem com respeito a todas as variáveis em questão. Seja ainda funcional Z J[u] = L(x, u, ∇u)dx Ω 1 0 onde u ∈ C (Ω, R) ∩ C (∂Ω, R) e x = (x1 , ..., xN ), dx = dx1 ...dxN , tal integral simboliza a integral múltipla sobre a região Ω e ∇u = (ux1 , ..., uxN ) representa o vetor gradiente associado a função u = u(x). Segue um lema análogo ao do capı́tulo 3. Lema 8.1.1 (Lema fundamental do Cálculo das Variações) Seja g : Ω → R uma função contı́nua tal que Z g(x)f (x)dx = 0 ∀f ∈ C0 (Ω, R) Ω Então g ≡ 0. Demonstração: Suponha, por absurdo, que g 6= 0. Então, sem perda de generalidade, podemos supor, devido a continuidade de g, que g > 0 em uma bola aberta Br (x0 ) ⊆ Ω, para algum r > 0. Defina h(x) := r2 − ||x − x0 ||2 em Br (x0 ) e h(x) = 0 em Br (x0 )c ∩ Ω. É imediato que h ∈ C0 (Ω, R). Por outro lado Z Z g(x)h(x)dx = g(x)h(x)dx > 0 Ω Br (x0 ) 62 CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN . 63 uma vez que g(x)h(x) > 0 em Br (x0 ). Portanto obtivemos uma contradição à nossa hipótese, donde g ≡ 0. Obs 8.1.1 Da mesma forma como no capı́tulo 3, o lema acima pode ser modificado para h ∈ C0k (Ω), pois basta definir h(x) := (r2 − ||x − x0 ||2 )k . Vamos estabelecer as equações de Euler-Lagrange para o funcional J. Seja h ∈ C01 (Ω, R), i.e., uma função de classe C 1 em Ω que é identicamente nula sobre a fronteira ∂Ω. Definamos a “perturbação” para o funcional J, ξ : (−, ) → R, onde > 0, dada por ξ(t) := J[u + th] então ξ 0 (0) = δJ[u]h. Por definição, Z ξ(t) = L(x, u + th, ∇u + t∇h)dx Ω e, pela regra da cadeia, N X ∂L ξ (t) = (Lu h + hxi )dx ∂u x Ω i i=1 0 Z usaremos agora o teorema da divergência de Gauss (2.1) para o campo X = (hLux1 , ..., hLuxi ). Temos que X é C 1 e portanto N N N X X ∂(hLuxi ) X ∂Lux1 ∂h div X = = Luxi + h ∂xi ∂xi ∂xi i=1 i=1 i=1 Veja que X ≡ 0 ∈ ∂Ω, uma vez que h ≡ 0 ∈ ∂Ω, daı́ temos que: Z hX, υi dSx = 0 ∂Ω e portanto Z div Xdx = 0 Ω e portanto Z X Z X N N ∂Luxi ∂h Luxi dx + ( )hdx = 0. Ω i=1 ∂xi Ω i=1 ∂xi CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN . 64 Daı́, voltando a expressão de ξ 0 (t), segue Z 0 (Lu − ξ (t) = Ω N X ∂Lux i ∂xi i=1 )hdx e fazendo t = 0, 0 Z (Lu − ξ (0) = Ω N X ∂Lux i ∂xi i=1 )hdx Daı́ se u for um extremo para J, usando que ξ 0 (0) = δJ[u]h = 0 e a observação do lema (8.1.1), segue que Lu = N X ∂Lux i i=1 ∂xi . (8.1) A equação acima é chamada de equação de Euler-Lagrange associada ao funcional J. Vejamos uma aplicação da equação de Euler-Lagrange acima ao problema de Poisson. 8.2 O Princı́pio de Dirichlet Uma generalização do problema de Dirichlet, visto no capı́tulo 1, é o problema de Poisson: ∆u = f, em Ω (8.2) u = g, em ∂Ω onde u ∈ C 2 (Ω) ∩ C(∂Ω) é uma função, a priori, desconhecida, g ∈ C(∂Ω) e f ∈ C(Ω) funções conhecidas e ainda Ω um domı́nio limitado em RN com fronteira suave. Obs 8.2.1 Note que o problema de Dirichlet é uma caso particular do problema de Poisson quando f ≡ 0. Teorema 8.2.1 (Unicidade) O problema de Poisson (8.2) possui, no máximo, uma solução. Demonstração: A demonstração é idêntica ao teorema 1.3.3. Seja v ∈ C01 (Ω) e u satisfazendo −∆u = f em Ω CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN . 65 multiplicando ambos os lados da igualdade acima por v e integrando em Ω, temos Z Z − ∆u vdx = f vdx Ω Ω devido v = 0 em ∂Ω segue, pelo primeira fórmula de Green (2.3), que Z Z − ∆u vdx = ∇u∇vdx, Ω Ω e portanto Z Z ∇u∇vdx = f vdx. Ω (8.3) Ω Note que a expressão (8.3) é linear em relação a v, motivados por tal linearidade definamos o funcional Energia J : A → R por Z 1 (8.4) J[w] = ( ||∇w||2 − wf )dx, Ω 2 onde A = {w ∈ C 2 (Ω); u = g em ∂Ω}. variacional do problema de Poisson (8.2). Vejamos agora a versão Teorema 8.2.2 (Princı́pio de Dirichlet) Uma função u é uma solução para o problema de Poisson (8.2) se e somente se J[u] = min J[w] w∈A (8.5) Demonstração: Seja u uma solução para o problema de Poisson (8.2) e w ∈ A, segue que Z (−∆u − f )(u − w)dx = 0 Ω como u − w = 0 em ∂Ω, segue pela primeira fórmula de Green (2.3) que Z Z − ∆u(u − w)dx = ∇u(∇u − ∇w)dx, Ω Ω daı́ segue que Z 2 Z (||∇u|| − f u)dx = Ω (h∇u, ∇wi − f w)dx. Ω Por Cauchy-Schwarz, Z Z Z Z 1 1 2 h∇u, ∇wi dx ≤ ||∇u||.||∇w||dx ≤ ||∇u|| dx + ||∇w||2 dx, 2 2 Ω Ω Ω Ω CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN . 66 implicando Z Z Z 1 1 2 2 (||∇u|| − f udx) ≤ ||∇u|| dx + ( ||∇w||2 − f w)dx 2 Ω Ω Ω 2 e portanto Z Z 1 1 2 ||∇u|| − f udx ≤ ( ||∇w||2 − f w)dx, Ω 2 Ω 2 ou seja, J[u] ≤ J[w], donde w ∈ A é arbitrário, logo, u minimiza o funcional (8.4). Suponha agora que u minimiza o funcional (8.4), então u satisfaz a equação de Euler-Lagrange Lu = N X ∂Lux i i=1 ∂xi , (8.6) onde a Lagrangiana L associada ao funcional (8.4) é N 1 1X 2 L(x, u, ∇u) = h∇u, ∇ui − f u = u − f u, 2 2 i=1 xi daı́ segue que Lu = −f e ainda Luxi = uxi ⇒ ∂Luxi = u xi xi ∂xi e como u satisfaz a equação (8.6) ∆u = N X uxi xi = −f i=1 e como u ∈ A, segue que u é solução para o problema de Poisson (8.2). 8.3 O Problema de Plateau Vejamos uma aplicação da equação de Euler-Lagrange a teoria de superfı́cies mı́nimas1 . Seja então γ : [0, 1] → R2 uma curva, simples, suave e fechada, e ainda Ω ⊆ R2 o subconjunto compacto em R2 , cuja fronteira ∂Ω = γ. Um problema, da Geometria Diferencial, bastante famoso é o problema de Plateau2 1 2 Veja Manfredo Perdigão do Carmo, Differential Geometry of Curves and Surfaces. Joseph Antoine Ferdinand Plateau(1801-1883), nascido em Bruxelas na Bélgica. CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN . 67 “Qual, dentre as superfı́cies σ em R3 , possuindo γ como fronteira, possui área mı́nima?” Consideramos tais superfı́cies σ, parametrizadas por Φ : Ω → R3 , Φ(x, y) = (x, y, z(x, y)), onde z : Ω → R é uma função, a ser encontrada, de classe C 2 . Vejamos então a formulação variacional de tal problema. Temos que a área de σ, que representaremos por Sσ , é dada por Z Z Sσ = ||Φx ∧ Φy ||dxdy, Ω daı́ como Φx = (1, 0, zx ) e Φy = (0, 1, zy ), seguindo que Φx ∧Φy = (−zx , −zy , 1), e portanto Z Z p Sσ = 1 + ||∇z||2 dxdy, Ω seguindo assim que a superfı́cie procurada minimiza o funcional Z Z p J[z] := 1 + ||∇z||2 dxdy. (8.7) Ω Temos então a lagrangiana L(x, y, z, zx , zy ) = p 1 + ||∇z||2 (8.8) e portanto a função z : Ω → R procurada deve satisfazer a equação Lu = ∂Lux ∂Luy + ∂x ∂y (8.9) que é a equação de Euler-Lagrange associada ao funcional (8.7). Usando a expressão da lagrangiana (8.8), segue Lu = 0, ux Lux = p 1 + ||∇u||2 e portanto a equação (8.9) é dada por ! ∂ ∂ ux p + ∂x ∂y 1 + ||∇u||2 , 1 + ||∇u||2 uy p 1 + ||∇u||2 ou então, div ∇u p uy Luy = p 1 + ||∇u||2 ! = 0. ! =0 CAPÍTULO 8. A EQUAÇÃO DE EULER-LAGRANGE EM RN . 68 Dada uma superfı́cie regular em R2 , existem duas quantidades que são intrı́nsecas de tal superfı́cie, tais quantidades são 1 eG − 2fF + gE √ H= , 2 EG − F2 eg − f 2 √ K= EG − F2 onde K é de denominadas de curvatura gaussiana e H curvatura média e {e, g, f} e {E, G, F} são os coeficientes da Segunda Forma Fundamental e Primeira Forma Fundamental, respectivamente. Uma superfı́cie regular em R3 é dita Mı́nima quando sua curvatura média é identicamente nula. No caso em que estamos trabalhando onde as parametrizações são da forma Φ(x, y) = (x, y, z(x, y)) é possı́vel mostrar que ! p ∇u , 2 1 + ||∇u||2 H = div p 1 + ||∇u||2 daı́ concluı́mos que uma superfı́cie σ é mı́nima se, e somente se, a mesma é estacionária para o funcional (8.7). Obs 8.3.1 Note que se a função z minimiza o funcional (8.7) então a superficie σ parametrizada por Φ é uma superfı́cie mı́nima. Entretanto se σ é uma superfı́e mı́nima parametrizada por Φ tem-se que o funcional (8.7) é apenas estacionário para função z, devido a equação de Euler-Lagrange ser apenas uma condição necessária para tal funcional ser minimiza(maximizado). Referências Bibliográficas [1] Boyce, W. E., DiPrima, R. C., Equações Diferenciais Elementares e Problemas de Valores de Contorno. Editora LTC 2002. [2] Brezis, H., Analyse Functionelle, Maison, Paris 1983. [3] Do Carmo, M. P., Differential Geometry of Curves and Surfaces, Prentice Hall 1976. [4] Evans, L. C., Partial Differential Equations, Graduate Studies in Mathematics 1997. [5] Figueiredo, D. G. de, Neves, A. F., Equações Diferenciais Aplicadas, Coleção Matemática Universitária 1997. [6] Gelfand, I. M., Fomin, S. V., Calculus of Variations., Editora Dover 2000. [7] Lemos, N. A., Mecânica Analı́tica, Editora Livraria da Fı́sica 2003. 1979. [8] Lima, L. E., Curso de Análise vol.2, Projeto Euclides 2000. [9] Lima, L. E., Espaços Métricos, Projeto Euclides 1993. [10] Lima, L. E., Álgebra Linear, Projeto Euclides 1998. [11] Neto, J. B., Mecânica: Newtoniana, Lagrangiana e Hamiltoniana., Livraria da Fı́sica 2004. [12] Sotomayor, J., Lições de Equações Diferenciais Ordinárias, Projeto Euclides [13] Nussenzveig, H. M., Curso de Fı́sica Básica vol.4, Ótica, Relatividade e Fı́sica Quântica., Editora Edgar Blücher 2002. [14] Weinstock, R., Calculus of Variations with applications to physics & engineering, Editora Dover 1974. 69