Apontamentos de Física Moderna 2
Transcrição
Apontamentos de Física Moderna 2
Apontamentos de Fı́sica Moderna II José Amoreira Departamento de Fı́sica UNIVERSIDADE DA BEIRA INTERIOR Revision: 1.17 Date: 2005/07/05 00:13:39 Copyleft O autor deste texto é Luı́s José Maia Amoreira ([email protected]), do Departamento de Fı́sica da Universidade da Beira Interior. Não se garante a sua correcção. Este texto pode ser obtido a partir do URL http://www.dfisica.ubi.pt/~amoreira/0405/fm2/bibl.html Este texto pode ser copiado, alugado, vendido, emprestado ou oferecido, desde que este “Copyleft” permaneça inalterado. O texto pode ser adaptado, acrescentado ou diminuı́do, desde que sejam satisfeitas as seguintes condições: • no produto final, deve ser incluı́da uma indicação bem visı́vel de que se trata de uma adaptação deste trabalho • devem ser referidos os nomes dos autores deste trabalho • deve ser apresentado o URL deste documento (ver acima) Os autores agradecem ser informados da redacção de trabalhos baseados neste texto. Em resumo, os autores autorizam qualquer utilização desta obra que respeite as regras básicas da honestidade, do bom-senso e da boa-educação. Composto em LATEX. Índice 1 Introdução 1.1 A evolução histórica da hipótese atómica . 1.1.1 Da antiguidade até Dalton . . . . 1.1.2 A descoberta da estrutura atómica 1.1.3 Entram os quanta . . . . . . . . . 1.1.4 O neutrão . . . . . . . . . . . . . . 1.2 A estrutura atómica . . . . . . . . . . . . 1.3 Ligações quı́micas . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 2 6 7 8 12 14 14 2 Elementos de Cristalografia 2.1 Cristais ideais e cristais reais . . . 2.2 A estrutura cristalina . . . . . . . 2.3 Tipos de redes cristalinas . . . . . 2.4 Exemplos de estruturas cristalinas 2.5 Direcções e planos cristalinos . . . 2.6 Distância interplanar . . . . . . . . 2.7 Coordenadas fraccionárias . . . . . 2.8 Defeitos . . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 15 15 17 19 22 25 27 27 29 29 3 Dispersão elástica de radiação em cristais 3.1 Breve revisão sobre ondas . . . . . . . . . 3.2 Dipersão de radiação — Generalidades . . 3.3 A condição de Laue . . . . . . . . . . . . 3.4 A lei de Bragg . . . . . . . . . . . . . . . 3.5 Métodos experimentais . . . . . . . . . . . 3.6 Factor de estrutura . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 33 36 37 39 41 42 43 44 4 A capacidade térmica dos sólidos 4.1 A aproximação harmónica . . . . . . . . 4.2 Elementos da teoria das probabilidades . 4.2.1 Variáveis aleatórias discretas . . 4.2.2 Variáveis aleatórias contı́nuas . . 4.3 A lei de Dulong e Petit . . . . . . . . . . 4.3.1 Modelo Clássico . . . . . . . . . 4.3.2 Modelo de Einstein . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47 48 49 51 52 52 54 58 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i . . . . . . . . ii ÍNDICE Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5 Metais I: modelos de electrões livres 5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 O modelo de Drude-Lorentz . . . . . . . . . . . . . . . . . . . . 5.2.1 O calor especı́fico dos metais . . . . . . . . . . . . . . . 5.2.2 A lei de Ohm . . . . . . . . . . . . . . . . . . . . . . . . 5.2.3 O efeito de Hall . . . . . . . . . . . . . . . . . . . . . . . 5.2.4 Efeitos termoeléctricos . . . . . . . . . . . . . . . . . . . 5.2.5 Balanço do modelo de Drude . . . . . . . . . . . . . . . 5.3 O modelo de Sommerfeld . . . . . . . . . . . . . . . . . . . . . 5.3.1 Estados electrónicos . . . . . . . . . . . . . . . . . . . . 5.3.2 A densidade de estados electrónicos . . . . . . . . . . . 5.3.3 O estado fundamental de um gás de fermiões . . . . . . 5.3.4 O gás de electrões de condução à temperatura ambiente 5.3.5 A distribuição de Fermi-Dirac . . . . . . . . . . . . . . . 5.3.6 A condutividade eléctrica . . . . . . . . . . . . . . . . . 5.4 Crı́tica dos modelos de electrões livres . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Metais II: Teoria de bandas 6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . 6.2 O teorema de Bloch . . . . . . . . . . . . . . . . . . 6.3 Propriedades dos estados de Bloch . . . . . . . . . . 6.3.1 Periodicidade no espaço recı́proco . . . . . . 6.3.2 Nı́veis de energia dos estados de Bloch . . . . 6.3.3 Momento linear . . . . . . . . . . . . . . . . . 6.3.4 Velocidade média e momento linear cristalino 6.3.5 Massa efectiva dos electrões de Bloch . . . . . 6.3.6 O livre caminho médio . . . . . . . . . . . . . 6.4 Modelo de Krönig-Penney . . . . . . . . . . . . . . . 6.5 Número de estados por banda . . . . . . . . . . . . . 6.6 O estado fundamental da nuvem electrónica . . . . . 6.7 A condução eléctrica . . . . . . . . . . . . . . . . . . 6.8 O gás de Bloch à temperatura ambiente. . . . . . . . 6.9 Lacunas . . . . . . . . . . . . . . . . . . . . . . . . . 6.10 Contaminação de semi-condutores . . . . . . . . . . 6.11 O diodo semicondutor . . . . . . . . . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 . 77 . 79 . 82 . 82 . 83 . 84 . 85 . 87 . 88 . 88 . 93 . 94 . 96 . 97 . 98 . 99 . 101 . 103 . 104 7 Supercondutividade 7.1 Propriedades magnéticas dos supercondutores 7.2 A Equação de London . . . . . . . . . . . . . 7.3 Superfluidez . . . . . . . . . . . . . . . . . . . 7.4 A supercondutividade, outra vez . . . . . . . 7.5 Aplicações da supercondutividade . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 60 60 61 63 64 66 66 66 68 69 70 71 72 74 74 74 105 106 108 109 111 112 112 112 ÍNDICE iii 8 Fı́sica Nuclear I — Propriedades do núcleo 8.1 Núcleo atómico — Generalidades . . . . . . 8.2 A massa nuclear e a energia de ligação . . . 8.3 A força nuclear forte . . . . . . . . . . . . . 8.3.1 Saturação . . . . . . . . . . . . . . . 8.3.2 Alcance . . . . . . . . . . . . . . . . 8.3.3 Independência da carga . . . . . . . 8.3.4 O deuterão e a dependência do spin 8.4 Dois modelos para estrutura do núcleo . . . 8.4.1 O modelo da gota lı́quida . . . . . . 8.4.2 Modelo em camadas . . . . . . . . . Bibliografia . . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . atómico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 115 116 117 118 119 121 121 122 122 123 125 125 9 Fı́sica nuclear II — Reacções nucleares 9.1 Radioactividade . . . . . . . . . . . . . . . . 9.1.1 A região de estabilidade . . . . . . . 9.1.2 Fissões nucleares . . . . . . . . . . . 9.1.3 Conversões internas . . . . . . . . . 9.1.4 Decaimento-β . . . . . . . . . . . . . 9.2 A lei do decaimento . . . . . . . . . . . . . 9.2.1 Tempo de meia vida . . . . . . . . . 9.2.2 Duração média . . . . . . . . . . . . 9.2.3 Energia libertada no decaimento . . 9.3 Actividade e dosimetria . . . . . . . . . . . 9.3.1 Actividade . . . . . . . . . . . . . . 9.3.2 Dose absorvida . . . . . . . . . . . . 9.3.3 Dose equivalente . . . . . . . . . . . 9.3.4 Efeitos da exposição à radiação . . . 9.4 Aplicações da Fı́sica Nuclear . . . . . . . . 9.4.1 Análise por activação com neutrões . 9.4.2 Produção de energia por fissão . . . 9.4.3 Fusão nuclear . . . . . . . . . . . . . 9.4.4 Aplicações à medicina . . . . . . . . 9.4.5 Datação por carbono-14 . . . . . . . 9.5 Alguns tópicos de noticiário . . . . . . . . . 9.5.1 A radioactividade natural . . . . . . 9.5.2 A utilização de urânio empobrecido Bibliografia . . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 127 127 128 129 129 130 131 131 132 133 133 134 134 135 136 136 136 139 141 141 143 143 145 145 145 10 Elementos de Fı́sica Subatómica 10.1 A selva das partı́culas elementares . . . . . . . . . . . . . . 10.1.1 O positrão de Dirac . . . . . . . . . . . . . . . . . . 10.1.2 O neutrino de Pauli . . . . . . . . . . . . . . . . . . 10.1.3 O mesão π de Yukawa e um convidado inesperado . 10.1.4 Ordem no caos . . . . . . . . . . . . . . . . . . . . . 10.2 As quatro interacções fundamentais . . . . . . . . . . . . . . 10.2.1 Interacção fraca . . . . . . . . . . . . . . . . . . . . . 10.3 E agora, algo verdadeiramente estranho! . . . . . . . . . . . 10.3.1 Isospin . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3.2 Estranheza . . . . . . . . . . . . . . . . . . . . . . . 10.4 A via óctupla, quarks e gluões . . . . . . . . . . . . . . . . . 10.4.1 Descrição microscópica dos processos de decaimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 147 147 149 152 155 155 156 157 157 158 159 159 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv ÍNDICE 10.5 Leis de conservação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 10.6 Aceleradores e detectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 A Momento angular, spin e simetria de troca 161 A.1 Momento angular e spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 A.2 Simetria de troca de partı́culas idênticas . . . . . . . . . . . . . . . . . . . . . . . . 163 Prefácio Estas notas são o resultado de quatro anos de docência de Fı́sica Moderna II, disciplina do terceiro ano da Licenciatura em Ensino de Fı́sica e Quı́mica. Escrevo estes apontamentos (uso o tempo presente nesta frase porque não me parecem ainda acabados, apesar de ter chegado a altura de me desligar da disciplina) principalmente porque a actividade da escrita me ajuda a organizar as ideias sobre estes assuntos. As discussões que tenho comigo mesmo são, frequentemente, mais profundas (e sempre muito mais encarniçadas) do que as que tenho com os alunos. É também minha opinião que estes apontamentos ajudam os alunos, que encontram neles uma base para o estudo, em Lı́ngua Portuguesa, a partir da qual podem, se assim o desejarem, partir para voos mais altos, usando a vasta bibliografia existente, da qual uma parte razoável está disponı́vel na Biblioteca da Universidade. Este argumento é muito discutı́vel. Há quem opine que as “sebentas” fornecidas pelos professores favorecem uma atitude passiva dos estudantes, que são, em maior ou menor medida, dispensados de procurar por sua iniciativa os conhecimentos de que carecem em livros ou artigos, escritos por melhores e mais reputados autores. Eu compreendo este ponto de vista. Mas também compreendo a opinião segundo a qual o nosso papel como professores é facilitar a aprendizagem dos alunos e não sei ao certo até onde se deve ir, onde traçar a linha. Ao fim e ao cabo, Sócrates desprezava, com argumentos semelhantes, a palavra escrita em geral... Dadas estas dúvidas, prefiro deixar-me guiar pelo exemplo. A verdade é que os professores que mais apreciei redigiam notas das disciplinas que leccionavam e, apesar disso, não deixei de consultar a bibliografia recomendada (e a que ela, por seu turno, referia) nas bibliotecas que tinha ao meu alcance. Assim, tento imitá-los, na medida das minhas capacidades. Os Capı́tulos 2 a 6 estão baseados em apontamentos que redigi em colaboração com o Prof. Miguel de Jesus para a disciplina de Fı́sica do Estado Sólido que, na última reformulação do curso, foi afastada do currı́culo da licenciatura. Nos quatro anos que passaram desde então, estes capı́tulos foram sofrendo sucessivas alterações, ao ponto de termos os dois entendido que não se justificava já manter o seu nome como co-autor dos presentes apontamentos. Seja como for, devo-lhe um sincero agradecimento. Sem o seu empenhamento e as suas muitas contribuições, suspeito que estas notas não passariam agora de um conjunto de folhas semi-manuscritas, com gráficos colados, distribuidas por diferentes pastas e gavetas, com partes esquecidas nalgum canto (e outras definitivamente perdidas), ainda mais gravemente incompletas, ainda mais densamente povoadas de erros. Não tenho a menor hesitação em afirmar que o Prof. Miguel de Jesus constituiu um factor determinante para a redacção destes apontamentos, mesmo que, passados estes quatro anos, tenham restado poucas das suas contribuições originais. Por isso, quero aqui deixar um sincero bem hajas, Miguel. Covilhã, Agosto de 2005 J. A. v vi ÍNDICE Capı́tulo 1 Introdução 1.1 1.1.1 A evolução histórica da hipótese atómica Da antiguidade até Dalton A teoria atómica da matéria foi proposta pela primeira vez no séc. V a.c., por Leucipo e Demócrito, na Grécia antiga. Estes dois filósofos tentavam, com o seu trabalho, compatibilizar a ideia da existência de um princı́pio único e imutável subjacente à realidade com a percepção da mudança, do movimento, da morte e do nascimento evidentes no dia a dia. Sugeriram então que a natureza una e imutável da realidade não se manifesta directamente nos objectos que observamos e com que lidamos, mas sim a um nı́vel microscópico, uma vez que, segundo eles, toda a matéria seria constituı́da por pequenos grânulos ou átomos indestrutı́veis e indivisı́veis (é este, aliás, o significado da expressão grega que está na origem da palavra “átomo”). As diferentes substâncias e as diferentes fases observadas corresponderiam a diferentes formas de agregação dos átomos; as alterações verificadas num objecto corresponderiam a processos em que se alteraria a organização e a disposição dos átomos que os constituem. A teoria atómica (bem como os outros modelos da altura) foi preterida pela teoria dos quatro elementos, defendida por Aristóteles, e ficou quase esquecida até ao séc. XVIII, altura em que se volta a falar de átomos, já numa perspectiva cientı́fica. As investigações experimentais de Lavoisier (cerca de 1780) e outros permitiram determinar a composição quı́mica de vários compostos. Cerca de vinte anos mais tarde, em 1799, Proust pode enunciar a Lei das proporções definidas, que afirma que as razões entre as massas de dois elementos que reagem para formar um dado composto são sempre as mesmas (por exemplo, quando hidrogénio e oxigénio reagem para formar água, as massas dos dois reagentes estão sempre na proporção de 8:1). Logo no ano a seguir, Dalton apresentou a Lei das proporções múltiplas: quando um elemento reage com outro para formar duas substâncias diferentes, as proporções em que o faz nas duas reacções são múltiplas uma da outra. Por exemplo, o oxigénio reage com o carbono para formar monóxido de carbono, na proporção (mássica) de 16:12; os mesmo elementos podem reagir para formar dióxido de carbono, sendo agora a razão entre as massas de oxigénio e carbono igual a 32:12, isto é, exactamente o dobro da que se verifica na produção de monóxido de carbono. Estes factos levaram Dalton a propor a primeira versão moderna da teoria atómica, baseada nos seguintes pressupostos (a) A matéria é constituı́da por pequenas partı́culas indivisı́veis chamadas átomos (b) Os átomos são inalteráveis e indestrutı́veis (c) Os átomos de um dado elemento quı́mico são idênticos (d) Nas reacções quı́micas, átomos de diferentes elementos combinam-se em proporções racionais simples 1 2 CAPÍTULO 1. INTRODUÇÃO A descrição atómica foi usada com grande sucesso no estudo das propriedades dos gases, mas só muito mais tarde, já no séc. XX, foi possı́vel resolver as dificuldades apresentadas pela sua aplicação no estudo dos sólidos. Teremos ocasião de estudar em detalhe algumas destas dificuldades, como a da justificação do valor da capacidade térmica dos sólidos, e por isso não nos alargaremos mais sobre este assunto. Ainda assim, é interessante notar que um dos pensadores mais profundos do Séc. XIX, Ernst Mach, continuou a criticar a hipótese atómica até à sua morte, em 1915. 1.1.2 A descoberta da estrutura atómica Na segunda metade do século XIX, desenvolvimentos tecnológicos (como a invenção de bombas de vácuo melhoradas) permitiram o aprofundamento do estudo das descargas eléctricas em gases(a) . Este estudo era realizado experimentalmente estabelecendo uma diferença de potencial eléctrico entre dois eléctrodos no interior de um tubo a pressão reduzida (ver a Figura 1.1). Cátodo Ânodo Figura 1.1: Tubo de Crookes. O sombreado representa a luminescência observada por Plücker em 1858. Para pressões suficientementes baixas e diferenças de potencial suficientemente elevadas, notava-se o aparecimento de uma luminescência na região do ânodo (eléctrodo de potencial mais elevado). Esta luminescência devia-se a um fluxo de natureza desconhecida proveniente do cátodo, como se constatou, em 1869, quando se observaram sombras de objectos interpostos entre os dois eléctrodos. Eugen Goldstein chamou a este fluxo raios catódicos. Em 1858, J. Plucker notou que a trajectória seguida pelos raios catódicos era deflectida por campos magnéticos, demonstrando que eles eram carregados. Foi ainda Goldstein que nos anos setenta (do século XIX, atenção!) notou que os raios catódicos eram emitidos perpendicularmente à superfı́cie do cátodo e que as suas propriedades não dependiam da composição quı́mica do cátodo. Assim, os raios catódicos constituiam um fluxo carregado e pareciam ser arrancados ao cátodo pelo campo eléctrico nos pontos da sua superfı́cie. Em 1871, C. Varley propôs que os raios catódicos eram constituı́dos por partı́culas carregadas negativamente. Esta idéia não foi imediatamente aceite. Até ao inı́cio do século XX, manteve-se acesa uma disputa que opôs os partidários da natureza corpuscular dos raios catódicos aos que defendiam a sua natureza ondulatória. Esta questão foi encerrada por J. J. Thomson em 1897 a favor da hipótese corpuscular, após um conjunto de experiências de grande precisão, em que pode também determinar a relação entre a carga e a massa do electrão, nome com que foram baptizados os corpúsculos constituintes dos raios catódicos. Finalmente, em 1911, R. Millikan conseguiu determinar o valor da carga do electrão, numa experiência em que electrizava gotı́culas de óleo e analisava o seu movimento sob a accção conjunta da força da gravidade e de uma força eléctrica aplicada. O modelo de Thomson Destes e de outros trabalhos, cresceu a convicção de que os electrões eram parte constituinte da matéria, ou seja, dos átomos que a formam. Note-se que, isoladamente, os electrões não podiam ser confundidos com os átomos, porque a matéria aparece, em geral, electricamente descarregada, o que seria claramente impossı́vel caso fosse constituı́da apenas por partı́culas carregadas como electrões. Os electrões seriam então, juntamente com outras partı́culas ainda desconhecidas, constituintes do átomo, que era afinal, ao contrário do que afirmava Dalton, divisivel. (a) Uma descrição bastante detalhada destes estudos pode ser consultada no url http://library.thinkquest.org/19662/high/eng/cathoderays.html 1.1. A EVOLUÇÃO HISTÓRICA DA HIPÓTESE ATÓMICA 3 F 2+ α A θ Figura 1.2: Representação esquemática da experiência de Rutheford. Partı́culas α produzidas pela fonte F incidem numa alvo constituı́do por uma folha fina de ouro (A), determinando-se o ângulo em que são dispersas. Em 1904, J. J. Thomson propôs o seu modelo para a estrutura atómica, segundo o qual os átomos seriam pequenas esferas carregadas uniformemente com uma densidade de carga positiva, no interior das quais se encontravam electrões, em número suficiente para anular a carga total do átomo. Este modelo é carinhosamente conhecido como o “modelo do bolo de passas”, indicando uma analogia entre os electrões num átomo denso e uniforme e as passas de uvas num bolo de passas. Thomson descobriu também que o número de electrões de cada átomo era igual ao número atómico do seu elemento quı́mico. O tamanho dos átomos pôde ser estimado a partir do valor da densidade dos sólidos ou de análises envolvendo a teoria cinética dos gases. Todas as abordagens indicaram que os átomos teriam um raio de alguns angstrongs(b) Thomson tentou também calcular as posições de equilı́brio dos electrões em átomos de diferentes elementos e as frequências com que os electrões oscilariam em torno dessas posições, com o objectivo de explicar os espectros de emissão e absorção atómicos, por exemplo, as várias séries de riscas no espectro do hidrogénio. Este esforço não foi, no entanto, nada bem sucedido. O átomo nuclear Simultaneamente com estes desenvolvimentos na fı́sica atómica, verificaram-se uma série de descobertas que originaram o ramo da fı́sica que mais tarde viria a ser conhecido com o nome de Fı́sica Nuclear. Em 1896, Henri Bequerel descobriu a radioactividade natural; nos anos seguintes decorreram os trabalhos do casal Pierre e Marie Curie, que isolaram diversas substâncias radioactivas. Em 1899, Rutheford descobriu que a radiação do urânio era constiuı́da por partı́culas com diferentes cargas eléctricas, tendo chamado partı́culas-α às positivas e β às negativas. No mesmo ano, constatou que as partı́culas α não eram mais do que átomos de hélio duplamente ionizados e que as partı́culas-β eram electrões. Em 1909, Rutheford, Geiger e Marsden realizaram uma série de experiências cruciais, onde analisavam a dispersão angular de um feixe de partı́culas α incidente numa folha de ouro (ver a Figura 1.2). Surpreendentemente, verificou-se que uma fracção muito elevada de partı́culas α sofria desvios muito acentuados. É instrutiva uma análise um pouco mais detalhada desta experiência. De acordo com o modelo de Thomson aceite na altura, os átomos consistiriam em esferas densas, com carga positiva uniforme, onde se distribuı́am os electrões atómicos. Numa experiência como a de Rutheford, explicam-se os desvios sofridos pelas partı́culas α através da interação eléctrica entre elas e os átomos do alvo. Esta interacção é a soma de duas parcelas: a força de atracção entre as partı́culas α (positivas) e os electrões atómicos (negativos) e, por outro lado, a força de repulsão entre as partı́culas α e o substrato atómico, denso e positivo. Como as partı́culas α têm uma massa muito maior (quase 7300 vezes maior) que a dos electrões, a primeira destas interações deve ter um efeito imperceptı́vel sobre o movimento das partı́culas α. Um efeito semelhante verifica-se fazendo uma bola medicinal de 20 kg colidir com bolas de ténis de mesa, com uma massa de 3 gr. Não esperamos, decerto, observar uma grande alteração da trajectória da bola mais pesada como resultado da sua colisão com as bolas mais leves... (b) Um angstrong (Å) é 10−10 m. 4 CAPÍTULO 1. INTRODUÇÃO E EMax r a Figura 1.3: Gráfico do módulo do campo eléctrico gerado por um átomo esférico com raio a carregado uniformemente com uma carga Ze. Uma vez que desprezamos o efeito da interacção entre as partı́culas α e os electrões atómicos, resta a interacção com a distribuição de carga positiva para explicar a dispersão do feixe incidente. Como já se referiu, esta interação é de natureza eléctrica. A força sobre uma partı́cula α é proporcional ao campo eléctrico gerado pelos átomos de ouro do alvo na posição ocupada pela partı́cula incidente. Considerando, para simplificar, o efeito de apenas um átomo de ouro, com raio a e carga (positiva) Ze distribuida uniformemente (Z = 79 é o número atómico do ouro), com centro na origem de coordenadas, temos um campo eléctrico dado por ½ ~ r) = E(~ 1 4π²0 1 4π²0 Ze r a3 ~ Ze ~ r3 r se se r<a r > a. (Esta expressão é facilmente deduzida usando a Lei de Gauss.) O módulo do campo eléctrico é uma função que cresce linearmente com a distância à origem até atingir um máximo para r = a, após o que decresce proporcionalmente ao inverso do quadrado de r (ver o gráfico na Figura 1.3). O valor máximo atingido pelo campo é EMáx = E(a) = 1 Ze . 4π²0 a2 Como é patente nesta igualdade, o valor máximo do campo eléctrico que actua nas partı́culas α é fortemente limitado pelo tamanho da região do átomo onde se concentra a carga positiva e a massa do átomo. Considerando, nos termos do modelo de Thomson, que essa região coincidia com o volume atómico, Rutheford achava que as forças sobre as partı́culas α seriam pequenas e, por isso, não esperava observar desvios muito acentuados em número apreciável. Esta discussão está bem ilustrada na Figura 1.4, em que mostramos a trajectória seguida por uma partı́cula α incidindo em átomos com diferentes raios, apresentando-se também um gráfico da intensidade da força eléctrica exercida na partı́cula, como função do tempo. Constata-se claramente que átomos maiores produzem desvios menores. Na Figura 1.5 apresentam-se as distribuições angulares do feixe de partı́culas α produzidas (recorrendo a uma simulação computacional) por átomos de Thomson, com um raio de 1,5Å (à esquerda) e por um núcleo atómico com um raio de 2 fm(c) (à direita). Os resultados observados por Rutheford, Geiger e Marsden foram semelhantes aos apresentados no gráfico da direita. O facto de se terem observado, e em grande número, deflexões de 90◦ e até superiores, obrigou Rutheford a rever o modelo de Thomson, mantendo o raio atómico nos valores aceites (cerca de 10−10 m) mas reduzindo grandemente o tamanho da região onde se concentra a massa e a carga positiva por um factor de 105 . A fronteira do átomo ficaria assim definida pela posição dos electrões e, para os impedir de cair no “caroço” denso e positivo, Rutheford propôs que eles orbitariam em torno daquela região, formando uma espécie de sistema solar microscópico. (c) Um fermi (1 fm) é o mesmo que um fentometro, isto é, 10−15 m. 1.1. A EVOLUÇÃO HISTÓRICA DA HIPÓTESE ATÓMICA 5 R=1.5Å t R=1.2Å t R=0.9Å t R=0.6Å t Figura 1.4: Trajectórias seguidas por uma partı́cula α incidindo em átomos com a mesma carga mas diferentes raios. À direita pode apreciar-se a intensidade da força nela aplicada, como função do tempo. Nota-se claramente que a átomos menores correspondem intensidades da força eléctrica média superiores, ou seja, maiores desvios sofridos pelas partı́culas α. 700 700 600 600 500 500 400 400 300 300 200 200 100 100 -90 0 90 -90 0 90 Figura 1.5: Distribuições angulares do feixe de partı́culas α difractado por um átomo de Thomson com um raio de 1,5 Å (à esquerda) e por um núcleo atómico com um raio de 2,0 fm = 2,0 × 10−5 Å (à direita). Em abcissas representa-se o ângulo de deflexão, em ordenadas o número de partı́culas α que sofreram desvios com esses ângulos. A carga do centro dispersor é a mesma nos dois casos. 6 CAPÍTULO 1. INTRODUÇÃO 1.1.3 Entram os quanta Este novo modelo foi, logo após a sua apresentação, criticado (até pelo próprio Rutheford) porque tinha como consequência a instabilidade dos átomos. Com efeito, electrões em órbita do núcleo deveriam, nos termos da teoria electromagnética, emitir radiação, ou seja, energia. A energia mecânica destes electrões deveria, pois, ir diminuindo, ocupando os electrões orbitais cada vez mais próximas do núcleo, até que que se desse o choque final. Tudo isto aconteceria numa fracção de segundo, contrariando claramente toda a evidência experimental. Para resolver este impasse, Niels Bohr, que na altura (1913) era colaborador de Rutheford, propôs uma teoria inspirada nos então recentes modelos quânticos de Plank e de Einstein, baseada nos seguintes pontos de partida: (a) Ao contrário do que se passa no sistema solar, nem todas as órbitas electrónicas são permitidas, mas apenas aquelas com forma circular em que o momento angular electrónico é um múltiplo inteiro da constante de Plank reduzida, h̄ = h/2π. Enquanto um electrão ocupa uma destas órbitas, não emite radiação nenhuma. (b) Um electrão pode sofrer uma transição entre duas órbitas permitidas, emitindo (ou absorvendo) um fotão com energia igual à diferença entre as energias dos estados inicial e final. Fazendo apenas estas suposições, Bohr pode reproduzir com exactidão o espectro de emissão e absorsão do hidrogénio, como demonstramos a seguir. Um electrão na n-ésima órbita permitida descreve um movimento circular uniforme(d) em torno de um núcleo que o atrai electrostaticamente. Seja rn o raio desta órbita e vn o módulo da velocidade com que é descrita. A força que mantém o electrão na órbita é a força de Coulomb, F = 1 e2 , 4π²0 rn2 onde e é o módulo da carga de um electrão e ²0 o valor da permitividade eléctrica do vácuo. Esta força é também a força de um movimento circular uniforme, de forma que podemos escrever m vn2 1 e2 . = rn 4π²0 rn2 (1.1) Por outro lado, ela deve satisfazer a condição de quantização de Bohr, isto é, o momento angular electrónico deve ser um múltiplo da constante de Plank reduzida, mvn rn = nh̄. (1.2) Destas duas igualdades resultam imediatamente os valores permitidos para rn e vn : rn = vn = n2 h̄2 me2 1 e2 . 4π²0 nh̄ 4π²0 A energia mecânica de um electrão nesta órbita é a soma da sua energia potencial electrostática, Un = − com a energia cinética, Tn = 1 e2 , 4π²0 rn 1 mv 2 , 2 n (d) O movimento é uniforme porque este sistema é semelhante a um sistema planetário, logo, podemos aplicar a lei das áreas de Kepler, de onde se deduz que, sendo a trajectória circular, só pode ser descrita uniformemente. 1.1. A EVOLUÇÃO HISTÓRICA DA HIPÓTESE ATÓMICA ou seja, En = Un + Tn = − 1 2 µ e2 4π²0 ¶2 7 m . n2 h̄2 O fotão emitido numa transição entre dois nı́veis ni e nf (ni > nf ) deve então ter uma energia igual a à ! µ 2 ¶2 1 e m 1 1 ε = Eni − Enf = − 2 , 2 4π²0 ni h̄2 n2f e a frequência da radiação emitida é a definida pela lei de Plank, ν = = 1 1 ε = ε h 2πh̄ à ! µ 2 ¶2 1 m 1 1 e − 2 . 2 4π²0 ni 2πh̄3 n2f Finalmente, o comprimento de onda da radiação emitida na transição pode ser calculado como ! à ν 1 1 1 (1.3) = = RH − 2 , λ c n2f ni onde 1 RH = 2c µ e2 4π²0 ¶2 m ≈ 1,0974 × 107 m−1 2πh̄3 é uma constante, chamada constante de Rydberg. A Eq. (1.3), que nos permite calcular o comprimento de onda da radiação emitida (ou absorvida, se tomarmos em linha de conta um sinal) numa transição entre dois nı́veis de Bohr, tinha sido obtida de forma empı́rica no estudo do espectro do hidrogénio, por Rydberg, em 1890. Foi um tremendo sucesso para o modelo de Rutheford-Bohr que se pudesse, com ele, justificar teoricamente a fórmula de Rydberg. O modelo de Bohr não clarificava a natureza fundamental da estrutura atómica. Não se apresentava, com este modelo, uma explicação para o facto do electrão atómico não perder energia por irradiação; ele era, meramente, aceite. Para fazer esta clarificação foi preciso esperar mais 20 anos, até à formalização da Mecânica Quântica(e) . Um passo importante para esta formalização foi dado por Louis de Broglie em 1923, quando generalizou a dualidade onda-partı́cula, que até então se aplicava apenas à radiação, às partı́culas como electrões ou protões. Inspirado na teoria da relatividade restrita e na óptica, achou uma expressão para o comprimento de onda de partı́culas em movimento e constatou que as órbitas de Bohr eram exactamente aquelas que permitiam o estabelecimento de vibrações estacionárias da função de onda electrónica. 1.1.4 O neutrão Com o modelo de Rutheford e Bohr, foi possı́vel descrever com precisão o espectro do átomo de hidrogénio, como acabámos de mostrar. Infelizmente, este modelo não produzia resultados satisfatórios para os espectros dos restantes átomos. Apesar deste facto, e apesar de ser uma teoria insatisfatória por ter algumas premissas injustificáveis na altura, este modelo ajudou a convencer a comunidade cientı́fica a favor de uma estrutura atómica semelhante à que ainda hoje adoptamos: os átomos são constituı́dos por um núcleo muito pequeno, com uma carga +Ze (Z é o número atómico) e com a quase totalidade da massa atómica, à volta do qual se distribuem os electrões descrevendo, num certo sentido, movimentos orbitais, que os impedem de “cair” no núcleo que os atrai. (e) É discutı́vel dizer que a Mecânica Quântica clarifica as coisas. Bohr dizia, mais ou menos, o seguinte: “Quem acha que a mecânica quântica não é uma teoria misteriosa, ainda não a compreendeu,”coisa que também se pode dizer como: só aqueles que não compreendem a mecânica quântica acham que ela permite compreender bem a realidade. 8 CAPÍTULO 1. INTRODUÇÃO p+ ? α 2+ Be Parafina Figura 1.6: Representação esquemática da Experiência de Irène Curie e Frederick Joliot. O núcleo seria constituı́do por protões, partı́culas com carga igual (mas oposta) à do electrão, e com uma massa, igual à de um ião H+ , muito superior à do electrão. Um átomo de hidrogénio é, no quadro deste modelo, simplesmente constituı́do por um electrão em órbita à volta de um protão. Mas logo o átomo seguinte na escala de massas, o deutério(f) apresenta um problema. A sua massa é aproximadamente igual ao dobro da do hidrogénio, mas o seu núcleo não pode conter dois protões porque o número atómico (ou seja, o número de electrões circundantes) é, como o do hidrogénio, 1. Ora, um átomo com dois protões no núcleo e um electrão em órbita não é electricamente neutro. Para resolver esta dificuldade, que se verificava também para os átomos de todos os outros elementos, surgiu a ideia, que se manteve durante alguns anos, de que os núcleos dos átomos do elemento com número atómico Z e com número de massa A seriam constituı́dos por A protões e por A − Z electrões. Assim, a carga do núcleo seria Ae − (A − Z)e = Ze, e portanto a carga total do átomo anulava-se. Mas este modelo era muito insatisfatório. Em primeiro lugar estranhava-se que a dinâmica protão-electrão, que gera sistemas como o átomo, com dimensões de alguns angstrongs, pudesse também ser responsável por sistemas muito mais pequenos, com apenas alguns fentometros. Mas há ainda uma objecção mais fundamental. Tanto o protão como o electrão têm spin(g) 1/2. De acordo com este modelo, um núcleo como o do deutério 2 H, deveria conter dois protões e um electrão, ou seja, três partı́culas de spin 1/2. A composição dos momentos angulares destas três partı́culas tem, como resultado, os valores 1/2 ou 3/2. No entanto, o momento angular do deuterão foi medido e apresenta o valor 1. Esta inconsistência motivou especulações sobre a existência de uma partı́cula neutra, que não tinha ainda sido descoberta. A questão só foi resolvida com a descoberta do neutrão por Chadwick, em 1932. Chadwick analisou dados de uma experiência realizada pelo casal Irène Curie-Joliot (filha de Marie Curie) e Frederick Joliot na qual eram observados protões resultantes da travagem, em parafina, de uma radiação proveniente do bombardeamento de um alvo de berı́lio com partı́culas-α (ver a Figura 1.6). O casal Joliot supôs que a radiação que era travada na placa de parafina era radiação electromagnética e, dada a energia com que os protões eram ejectados da placa, tinha que ter uma energia muito, muito alta, como nunca antes tinha sido observada. Em vez de radiação electromagnética, Chadwick propôs que a radiação produzida pelo berı́lio devia antes ser constituida por partı́culas neutras e com uma massa semelhante à do protão, e realizou imediatamente uma série de experiências, em que substituia a parafina por outras substâncias, que provaram a sua hipótese. E estava, assim, descoberto o neutrão, o último dos ingredientes principais (juntamente com o electrão e o protão) da estrutura atómica. 1.2 A estrutura atómica Quando isolados, os sistemas atómicos (núcleo-nuvem electrónica) são estáveis. As propriedades destes sistemas são cabalmente descritas pelas leis da Mecânica Quântica. De acordo com estas leis, os electrões distribuem-se por diversos estados electrónicos, cujas propriedades se determinam resolvendo a Equação de Schrödinger. Os estados quânticos de electrões confinados a uma região (f) O deutério é um isótopo do hidrogénio, tendo o mesmo número atómico (claro) mas um número de massa duplo do do hidrogénio. (g) O spin de uma partı́cula é o seu momento angular intrı́nseco, que é independente do seu estado de movimento. Será objecto de um estudo mais aprofundado adiante. 1.2. A ESTRUTURA ATÓMICA 9 limitada do espaço (como é o caso dos electrões atómicos), podem ser distinguidos entre si por um conjunto de números inteiros, chamados números quânticos. Este facto é digno de nota porque significa que os estados possı́veis dos electrões atómicos estão discretizados. Repare-se que, em sistemas macroscópicos com interacções formalmente semelhantes, como o sistema solar, não se nota qualquer discretização dos estados possı́veis dos planetas; estruturas como a cintura de asteróides (entre as órbitas de Marte e de Júpiter) ou os anéis de Saturno, mostram claramente que o espectro de possibilidades para os estados dos corpos em órbitas gravitacionais é um conjunto contı́nuo, não discreto como se verifica nas escalas atómicas. Esta discretização do espaço de estados surge naturalmente da resolução da equação de Schrödinger. No caso dos estados electrónicos atómicos, esses números quânticos (n, l, ml , s) identificam a energia, o módulo do momento angular orbital, a componente z do momento angular orbital e a componente z do momento angular de spin. O número quântico principal (n) é um inteiro positivo, ou seja, pode tomar os valores 1, 2, 3,. . . O que se pretende significar com esta frase é que há estados electrónicos atómicos com n = 1, outros com n = 2 ou n = 3, mas não há estados com n = 1,5 ou n = −1. Em átomos monoatómicos (como o hidrogénio ou o deutério) ou em iões com apenas um electrão (como o He+ , o Li2+ , o Be3+ ), a energia de cada estado electrónico depende apenas deste ı́ndice. Em átomos ou iões com dois ou mais electrões, a energia depende também de l.(h) O número quântico de momento angular, l, é, um número inteiro não negativo, mas a Equação de Schrödinger não tem soluções para l >= n. Assim sendo, existem estados caracterizados por valores de (n, l) como (1, 0), (2, 0), (2, 1), mas não há estados (n, l) = (1, 1) ou (2, −1). Uma notação muito habitual em fı́sica consiste em designar os estados com diferentes valores de l através de letras do alfabeto, de acordo com a correspondência apresentada na tabela em baixo. l 0 1 2 3 4 ... sı́mbolo s p d f g ... A partir de l = 3 a correspodência segue a ordem alfabética. Usando esta nomenclatura, as orbitais (n, l) = (1, 0), (2, 0), (2, 1) a que nos referimos há pouco designam-se orbitais 1s, 2s e 2p, respectivamente. O número quântico de projecção de momento angular, ml , pode tomar todos os valores inteiros entre −l e +l e, por fim, o número quântico de spin, ms , pode tomar os valores ±1/2. Os electrões (tal como os protões e os neutrões) pertencem à classe dos fermiões, logo, satisfazem o Princı́pio de Exclusão de Pauli: não pode haver mais do que um electrão no mesmo estado quântico. Assim, num átomo no estado fundamental (isto é, de menor energia), os electrões distribuem-se pelos estados disponı́veis de menor energia possı́vel. A ordenação energética dos estados electrónicos pode obter-se a partir da regra da diagonal, ilustrada na Figura 1.7. De acordo com a aplicação desta regra, a ordem crescente dos valores da energia é a da sequência 1s 2s 2p 3s 3p 4s 3d 4p 5s 4d 5p 6s. . . Uma orbital (n, l) contém 2 × (2l + 1) estados electrónicos,(i) logo, pode albergar 2(2l + 1) electrões. Então, tendo em conta a ordenação energética das orbitais, podemos facilmente constatar que um átomo de lı́tio, que tem três electrões, deve ter a orbital 1s totalmente preenchida e um electrão sózinho na orbital 2s; um átomo de carbono (seis electrões) tem totalmente preenchidas as orbitais 1s e 2s e restam 2 electrões na orbital 2p; o germânio (32 electrões) tem as orbitais 1s 2s 2p 3s 3p 4s 3d totalmente preenchidas e 2 electrões na orbital 4p. (h) Há ainda uma muito ténue dependência de m e m , resultante do chamado acoplamento spin-órbita, mas s l vamos desprezar estes detalhes. (i) Note que m pode tomar os 2l + 1 estados m = −l, m = −l + 1, . . . m = l − 1, m = l e m pode tomar os s l l l l l dois valores ±1/2. 10 CAPÍTULO 1. INTRODUÇÃO 1s 2s 2p 3s 3p 3d 4s 4p 4d 4f 5s 5p 5d 5f 5g 6s 6p 6d 6f 6g 6h 7s 7p 7d 7f 7g 7h 7i Figura 1.7: A regra da diagonal. As setas indicam a ordem crescente para a energia electrónica. A Figura 1.8 representa graficamente, de forma qualitativa, as energias das várias orbitais, para dois átomos diferentes, com números atómicos Z (à esquerda) e Z + 1 (à direita). Esta figura põe em evidência duas propriedades dignas de nota. Em primeiro lugar, as orbitais não se encontram igualmente separadas; o hiato energético que separa as orbitais s das que as precedem é maior do que os restantes. O espectro energético de cada átomo fica assim dividido em grupos de orbitais com energias próximas umas das outras, separadas por intervalos “despovoados”. A estes grupos de orbitais dá-se o nome de camadas. Em segundo lugar, a energia das orbitais num átomo com dado número atómico é menor que a das orbitais correspondentes num átomo com maior número atómico. (O facto de a energia das orbitais ser negativa é essencialmente convencional: considerase nula a energia de um electrão em repouso desligado do átomo; para atingirmos esta situação, temos que fornecer energia ao átomo, logo, a sua energia inicial deve ser negativa.) A energia de cada orbital, ou seja, a energia de um electrão que ocupe um estado dessa orbital, é igual à soma da energia cinética com a energia potencial. Esta última é a da interacção electrostática entre duas cargas de sinal contrário, que, como deve ser bem sabido, é proporcional ao produto das duas cargas. É por isto que a energia de cada orbital diminui (ou melhor, torna-se mais negativa) à medida que aumenta o número atómico: aumentando a carga no núcleo aumenta o módulo do produto da carga do electrão com a carga do núcleo. Assim, em geral, a energia total de um átomo com um dado número atómico é maior (isto é, menos negativa) do que a energia do átomo com mais uma unidade de número atómico. Logo, estes são mais coesos do que aqueles, coisa que se nota, por exemplo, na energia necessária para arrancar um electrão ao átomo; como é sabido, esta energia aumenta, em geral, à medida que aumenta o número atómico. Mas esta regra tem excepções: sempre que o hiato energético é suficientemente largo, a diminuição das energias das orbitais causada pelo aumento do número atómico não compensa o dispêndio de energia necessário para “arrumar” mais um electrão, num nı́vel de energia bastante mais alto. Estas excepções verificam-se quando se inaugura uma nova camada. A Figura 1.9 mostra os gráficos do raio atómico (à esquerda) e da energia de ionização (à direita) como funções do número atómico, onde são patentes descontinuidades relacionadas com o preenchimento das camadas como as que referimos. Podemos agora compreender melhor algumas propriedades quı́micas dos elementos. Por exemplo, os átomos cujas nuvens electrónicas apresentam camadas completas são os dos gases raros, que aparecem na coluna mais à direita da tabela periódica. Como os electrões destes átomos se encontram muito fortemente ligados (por todos pertencerem a camadas completas), praticamente 1.2. A ESTRUTURA ATÓMICA 11 E E=0 6p 5d 4f 6s 6ª camada (32 electrões) 5p 5ª camada (18 electrões) 4d 5s 4p 4s 4ª camada (18 electrões) 3p 3s 3ª camada (8 electrões) 3d 2p 2s 2ª camada (8 electrões) 1s 1ª camada (2 electrões) Z Z+1 Figura 1.8: Representação qualitativa e esquemática das energias das orbitais de dois átomos com número atómico Z (à esquerda) e Z + 1 (à direita). Os números entre parêntesis representam a quantidade de electrões que cada camada pode albergar. (Consegue verificar estes valores?) Figura 1.9: Raio atómico (à esquerda) e energia de ionização (à direita), como funções do número atómico. São patentes as descontinuidades quando se completam camadas, ou seja, quando se atingem os gases raros. Fonte: www.webelements.com 12 CAPÍTULO 1. INTRODUÇÃO não sentem a proximidade de outros átomos. Assim, os átomos dos gases raros não têm facilidade em estabelecerem ligações quı́micas, como é bem sabido. Os átomos do sétimo grupo têm todas as suas orbitais totalmente preenchidas, restando apenas um estado vago na última camada(j) . Estes átomos experimentam um grande abaixamento de energia quando capturaram um electrão, porque esse electrão vai completar a camada de valência. Então, num ambiente rico em electrões livres ou quase livres, o estado natural de átomos do sétimo grupo deve ser o de iões negativos. É o que acontece com o cloro em solução aquosa: aparece na forma Cl− . Ao contrário do que acontece com os átomos do sétimo grupo, os átomos do primeiro grupo têm apenas um electrão na camada de valência. Pelas razões que já foram expostas, este electrão encontra-se muito fracamente ligado ao átomo, de forma que é fácil separar electrão e átomo. Num ambiente em que os átomos estejam sujeitos a colisões com vizinhos, deve verificar-se que muitos destes átomos se encontrem ionizados por lhes ter sido arrancado o electrão de valência. É o que acontece numa solução aquosa, em que os átomos dos elementos do primeiro grupo aparecem ionizados com carga negativa (Li+ , Na+ , etc.). 1.3 Ligações quı́micas As ligações entre átomos, através das quais se formam agregados de matéria, costumam dividirse em quatro classes principais, a saber: as ligações iónicas, as ligações covalentes, as ligações metálicas e as ligações de Van der Waals. Nas primeiras, não se notam grandes alterações da estrutura electrónica de cada um dos átomos que participa na ligação; dá-se, apenas, uma atracção electrostática forte entre dois iões de sinal contrário. Os átomos participam como um todo nas ligações iónicas, como se fossem pequenas esferas rı́gidas carregadas. No estabelecimento de ligações de Van der Waals também não se verifica uma grande modificação dos estado dos electrões de cada substância. O que se passa nestas ligações é que pequenas oscilações dipolares num dos átomos induzem oscilações dipolares nos átomos vizinhos, resultando uma atracção fraca entre o dipolo indutor e os dipolos induzidos. Nas ligações covalentes, ao contrário do que se passa nas ligações iónicas e de Van der Waals, nota-se uma profunda alteração das funções de onda dos electrões de valência. Quando se aproximam os dois átomos que estabelecem a ligação, os electrões de valência de cada um começam a sentir-se atraı́dos pelo outro. As suas funções de onda (que eram soluções de uma Equação de Schrödinger com um só centro atractivo) alteram-se de maneira tal que passa a ser mais provável encontrar os electrões de valência na região compreendida entre os dois átomos. Note-se que isto apenas se verifica para os electrões de valência, porque os outros estão tão fortemente ligados ao átomo a que pertencem que quase não sentem a influência do átomo vizinho. Estes estados ocupados pelos electrões de valência de um átomo quando ele estabelece uma ligação quı́mica chamam-se orbitais moleculares. As orbitais moleculares permitem o estabelecimento de uma ligação porque os cernes atómicos (carregados positivamente, uma vez que lhes faltam os electrões de valência) dos dois átomos sentem-se atraı́dos pela nuvem electrónica da orbital molecular situada na região entre os dois átomos. Este efeito encontra-se ilustrado na Figura 1.10. Numa ligação covalente, as funções de onda dos electrões que participam na ligação são, como acabámos de ver, muito alteradas. De facto, deixamos de poder identificar o átomo a que um dado electrão de ligação pertence, uma vez que passam a pertencer à molécula e cada electrão de ligação passa a ser partilhado pelos dois átomos ligados. Nalguns casos, esta modificacção da função de onda é ainda mais radical. Por exemplo, no benzeno (C6 H6 ) cada átomo de carbono está ligado a dois outros átomos de carbono formando uma cadeia hexagonal. Cada átomo de carbono encontra-se ainda ligado a um átomo de hidrogénio. Estas ligações são ligações covalentes como as (j) Para simplificar a linguagem, vamos definir agora alguns termos habituais na quı́mica: chama-se camada de valência de um átomo à camada desse átomo de mais alta energia (isto é, com energia menos negativa) que ainda contém electrões; electrões de valência são os electrões que ocupam essa camada; cerne atómico é o átomo subtraı́do dos electrões de valência, ou seja, o núcleo mais os electrões das camadas interiores. 1.3. LIGAÇÕES QUÍMICAS 13 Figura 1.10: Orbitais atómicas de dois átomos distantes um do outro (esquerda) e orbital molecular ligando os dois átomos (à direita). A região a cinzento representa a nuvem de electrões de valência e os cı́rculos pretos pequenos representam os cernes atómicos. Figura 1.11: Estrutura molecular hipotética (e errada) do benzeno (à esquerda). Os traços mais espessos representam ligações duplas. De acordo com as convenções usuais, considera-se um átomo de carbono presente em cada vértice e um de hidrogénio na extremidade de cada linha não ligada. Ao centro pode ver-se uma representação esquemática das orbitais cı́clicas do benzeno (de Wikipedia, the free encyclopedia). À direita, representação convencional da molécula de benzeno. que acabámos de descrever. Dos quatro electrões de valência que cada átomo de carbono possui, três ficam a ocupar as orbitais moleculares necessárias para estas ligações. Quanto ao electrão de valência restante, poderı́amos pensar que estabeleceria novas ligações covalentes, formando-se, entre os átomos de carbono, ligações duplas e simples alternadamente. Mas as ligações duplas têm comprimentos menores do que as ligações simples correspondente. A estrutura molecular do benzeno seria, então a representada na Figura 1.11, à esquerda. Uma tal estrutura deixaria uma assinatura nı́tida em análises espectrométricas. Nestes estudos, analiza-se o espectro de absorção da substância estudada. Dois tipos de ligações diferentes entre átomos de carbono deixariam dois picos de absorção facilmente identificáveis, coisa que não se vislumbra no espectro do benzeno. Todas as ligações C–C no benzeno são idênticas. Logo, os seis electrões (um por cada átomo) devem ficar igualmente distribuidos pelas seis ligações, definindo orbitais cı́clicas, estendidas a toda a molécula. Os electrões que ocupam estas orbitais podem mover-se quase livremente ao longo de toda a cadeia hexagonal de átomos de carbono. Um caso ainda mais extremo de deslocalização electrónica verifica-se na grafite. Nesta substância, várias cadeias hexagonais de átomos de carbono ligam-se umas às outras, formando uma macromolécula planar com uma estrutura que lembra as colmeias de abelhas ou os tabuleiros dos jogos de estratégia. Cada átomo estabelece três ligações covalentes com outros três átomos de carbono, restando ainda um electrão de valência por cada um, que vai ocupar uma orbital deslocalizada, podendo mover-se livremente ao longo de toda a molécula. Por esta razão, a grafite é boa condutora de electricidade. A ligação quı́mica na grafite é causada por dois tipos de deformações das orbitais atómicas: uma, que leva ao estabelecimento de ligações covalentes entre átomos de carbono contı́guos; a outra, que leva ao aparecimento de orbitais deslocalizadas que se estendem ao longo de toda a molécula. Nos metais, apenas esta última espécie de deformações se verifica. O que mantém ligados os cernes atómicos uns aos outros é a atracção que sentem pela nuvem electrónica associada às orbitais deslocalizadas; a presença dos iões, por seu turno, define o potencial que sustenta esta mesma orbital. Um metal é, então, um agregado de cernes atómicos, carregados positivamente, imersos num oceano de electrões essencialmente livres, sendo o conjunto globalmente descarregado. Este quadro tem algumas semelhanças com o modelo atómico de Thomson (o bolo de passas), mas como uma fotografia em negativo: No modelo atómico, cargas negativas (electrões) individualizavam-se 14 CAPÍTULO 1. INTRODUÇÃO num fundo positivo uniforme; no modelo metálico que acabámos de descrever, cargas positivas (os cernes atómicos) estão presentes num fundo negativo (a nuvem electrónica) mais ou menos uniforme. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • F. J. Blatt, Modern Physics (1992), Secções 5.1, 5.3, 5.4, 12.2 [F5.0/442] • P. A. Tipler,R. A. Llewellyn, Fı́sica Moderna (2001), Secções 4.1, 4.2, 4.3, 7.6, 9.1, 9.2, 9.3 [F5.0/273] PROBLEMAS 1.1 Considerando os átomos dos sólidos como pequenos cubos encostados uns aos outros, estime as dimensões atómicas (a largura destes cubos) para as seguintes substâncias, a partir dos valores das suas densidades e das suas massas atómicas (a) Ferro: ρ = 7,86 × 103 kg m−3 , m = 55, 8 u; (b) Alumı́nio:ρ = 2,70 × 103 kg m−3 , m = 27, 0 u; (c) Mercúrio:ρ = 1,36 × 104 kg m−3 , m = 200, 6 u; 1.2 A Equação de van der Waals para gases reais é p= ³ ´2 n nRT −a V − nb V , onde p, V , T , n representam, respectivamente, a pressão, o volume, a temperatura e o número de moles de uma amostra de gás, R é a constante dos gases (R = kB NA ≈ 8,314 J K−1 mol−1 ), e a e b são dois parâmetros caracterı́sticos de cada gás, o primeiro relacionado com detalhes da força intermolecular, o segundo com o volume molecular, dado por b = NA vm , onde vm é o volume de uma molécula. Dados os seguintes valores de a e b para os gases raros calcule os valores dos seus raios atómicos. Elemento He Ne Ar Kr Xe a (L2 atm mol−2 ) 0.034 0.211 1.340 2.320 4.190 b (L mol−1 ) 0.0237 0.0171 0.0322 0.0398 0.0510 Capı́tulo 2 Elementos de Cristalografia Neste capı́tulo, vamos introduzir a linguagem e os conceitos básicos utilizados no estudo dos cristais. Os tópicos aqui abordados serão usados ao longo de todo o curso e é, por isso, importante que sejam bem apreendidos. 2.1 Cristais ideais e cristais reais Como foi dito no capı́tulo anterior, os átomos dos sólidos cristalinos ocupam posições dispostas regularmente, formando padrões que se repetem espacialmente em todas as direcções. A esta estrutura dá-se o nome de cristal. Em rigor, os cristais reais não podem satisfazer esta definição, porque uma periodicidade absoluta é impossı́vel. Com efeito, as impurezas quı́micas, os defeitos fı́sicos no padrão de repetição, as oscilações térmicas, e até mesmo as fronteiras dos cristais reais destroem essa periodicidade. Reservamos então aquela definição para os cristais ideais, que serão então corpos infinitos, absolutamente puros do ponto de vista quı́mico, com átomos “congelados” nas suas posições de equilı́brio, etc, considerando os cristais reais aproximações mais ou menos razoáveis daqueles. 2.2 A estrutura cristalina Matematicamente, um cristal ideal pode ser descrito como um conjunto de átomos dispostos numa rede definida por três vectores linearmente independentes ~a, ~b, ~c, chamados vectores fundamentais de translação, tais que o arranjo atómico é, em todos os aspectos, semelhante quando observado de dois pontos com vectores posição ~r e ~r0 , relacionados através de ~r0 = ~r + h~a + k~b + l~c, (2.1) com h, k e l inteiros arbitrários. Com ~r fixo, ao conjunto de pontos que se obtem variando h, k, e l na equação (2.1) dá-se o nome de rede cristalina, ou de Bravais. De acordo com as definições apresentadas, não podemos confundir os conceitos de cristal e de rede cristalina. Esta é uma abstracção matemática que consiste num conjunto de pontos idênticos, dispostos regular e periodicamente no espaço, ao passo que o cristal é formado por um conjunto de átomos, que podem nem ser todos da mesma espécie quı́mica, como é o caso do cloreto de sódio. A estrutura do cristal pode ser gerada sobrepondo a cada ponto da rede cristalina uma base (ou motivo) de átomos, idêntica para todos os pontos da rede. Assim, a relação entre cristal, rede cristalina e motivo pode ser simbolizada como rede + motivo = cristal. Vejamos o seguinte exemplo para nos ajudar a sedimentar este novo conceito. Na Figura 2.1 está representado um cristal composto por três átomos diferentes. Este cristal pode ser recriado colocando uma réplica do motivo de três átomos junto a cada um dos pontos da rede. 15 16 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA motivo ponto da rede cristal=rede+motivo (a) (b) Figura 2.1: (a) base de três átomos; (b) cristal. Em cada ponto da rede é colocado a base de átomos de modo a formar o cristal. Uma outra abordagem, ilustrada com o seguinte exemplo bi-dimensional, consiste em determinar a rede a partir do cristal: a Figura 2.2 representa uma estrutura cristalina bi-dimensional, b’ b a’ y x (a) a (b) Figura 2.2: Exemplo de um cristal bi-dimensional. formada por átomos de duas espécies, “•” e “◦”. De acordo com a definição apresentada, os vectores fundamentais são tais que qualquer combinação linear com coeficientes inteiros destes vectores é igual à diferença entre as posições de dois pontos equivalentes no cristal. Logo, os vectores ~x e ~y representados na figura não são vectores fundamentais, porque unem pontos não equivalentes (a posição de um átomo “•” e de um outro “◦”). A figura da direita representa duas possibilidades de escolha de vectores fundamentais (~a, ~b e ~a0 , ~b0 ), a rede cristalina por eles gerada e os motivos correspondentes. Chamam-se vectores da rede cristalina aos vectores que unem dois quaisquer pontos da rede. No exemplo que acabámos de apresentar, ~a, ~b, ~a0 , ~b0 são vectores da rede, mas o mesmo não acontece com ~x ou com ~y . Se qualquer vector da rede puder ser escrito como combinação linear, com coeficientes inteiros, dos vectores fundamentais, então estes dizem-se vectores fundamentais primitivos. No exemplo apresentado, ~a0 e ~b0 são vectores fundamentais primitivos, ao passo que ~a e ~b não o são. Para verificar esta última preposição basta ver que, por exemplo, o vector ~b0 é uma 2.3. TIPOS DE REDES CRISTALINAS 17 combinação linear de ~a e ~b, mas com coeficientes fraccionários, ~b0 = 1 ~a + 2 1~ b. 2 (2.2) Ao paralelogramo formado pelos vectores fundamentais dá-se o nome de célula unitária. Se os vectores fundamentais forem, além disso, primitivos, a célula unitária por eles formada chama-se célula unitária primitiva. Em rigor, esta definição dá-nos apenas um exemplo de célula unitária primitiva. Uma definição formal é a seguinte: Célula unitária primitiva é uma porção de espaço que, copiada através de translações geradas por todos os vectores da rede, preenche todo o volume da rede cristalina, sem sobreposições ou espaços vazios. Desta definição deduz-se facilmente que uma célula unitária primitiva contém um, e apenas um, ponto de rede. Se n for a densidade espacial destes pontos (isto é, o número de pontos por unidade de volume) e v for o volume de uma célula unitária primitiva, então temos que nv = 1 e logo v = 1/n. Como este resultado é válido qualquer que seja a célula unitária primitiva (isto é, quaisquer que sejam os vectores fundamentais primitivos usados para a construir), concluı́mos que todas as células unitárias primitivas têm o mesmo volume. O volume da célula unitária é um parâmentro importante em muitos cálculos. De acordo com a expressão válida para paralelogramos, o volume de uma célula unitária primitiva é igual ao módulo do produto misto dos vectores fundamentais primitivos: τ = |~a · ~b × ~c|. (2.3) O resultado do produto misto de três vectores pode facilmente ser calculado como o determinante de uma matriz cujas linhas são as componentes (relativamente a uma base ortonormada) de cada vector, isto é, ¯ ¯ ¯ ax ay az ¯ ¯ ¯ ~a · ~b × ~c = ¯¯ bx by bz ¯¯ . ¯ cx cy cz ¯ Acabámos de ver que podemos construir uma célula unitária primitiva com o paralelogramo definido por um conjunto de vectores fundamentais primitivos. Uma outra possibilidade é a seguinte: unimos com segmentos de recta um dado ponto de rede a todos os seus vizinhos mais próximos; a região do espaço limitada pelos planos bissectores destes segmentos é uma célula unitária primitiva. As células construı́das desta forma chamam-se células unitárias primitivas de Wigner-Seitz. Note-se que, para a definição da células de Wigner-Seitz, não é necessário escolher um conjunto de vectores fundamentais primitivos; assim, a sua forma depende apenas do tipo de rede, ao contrário do que acontece com as células unitárias mais usuais definidas a partir do paralelogramo formado pelos vectores cristalográficos. A Figura 2.3 representa o processo de construção de uma destas células. 2.3 Tipos de redes cristalinas A classificação das redes cristalinas faz-se em termos das operações de simetria que cada uma aceita. Assim, e por exemplo, as redes cúbicas são aquelas que ficam inalteradas sob rotações de π2 em torno de certas direcções. Não faremos aqui este tipo de estudo por não ter uma importância fundamental no que se segue, neste curso de nı́vel introdutório. Faremos apenas uma descrição geométrica dos diferentes tipos de rede. Designamos por ~a, ~b e ~c os vectores fundamentais da rede, por a, b e c os seus módulos e por α, β e γ os ângulos entre eles, definidos de acordo com o esquema da Figura 2.4. Às quantidades a, b, c, α, β e γ dá-se o nome de parâmetros da rede cristalina. (a) Redes cúbicas De todos os tipos de redes cristalinas, o mais simples de visualizar é o cúbico, caracterizado em 18 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA Figura 2.3: Célula unitária primitiva de Wigner-Seitz. c α b γ β a Figura 2.4: Vectores e ângulos fundamentais. geral por a α = = b β = = c γ = π . 2 b β γ α a c Há três subespécies da rede cúbica: a rede cúbica simples, cujos pontos estão dispostos como os vértices de cubos iguais, arrumados contiguamente; a rede cúbica de corpo centrado, que, além dos pontos que constituem a rede cúbica simples, contém ainda um ponto no centro do corpo de um dos cubos que referimos; e a rede cúbica de faces centradas, que é formada pelos pontos que formam a rede cúbica simples, e contém ainda um ponto no centro das faces daqueles cubos. (b) Redes tetragonais Se comprimirmos ou alongarmos uma rede cúbica numa das suas direcções fundamentais, obtemos uma rede do tipo chamado rede tetragonal. Nesta, os pontos dispõem-se nos vértices de prismas rectos de base quadrada (variante simples) e nos centros dos corpos destes prismas (variante de corpo centrado). As redes tetragonais são então caracterizadas por a α = = b β 6= = c γ = π . 2 b a c Note-se que as redes tetragonais não apresentam a variante de faces centradas. (c) Redes ortorrômbicas As chamadas redes ortorrômbicas são as que se obtêm deformando a rede cúbica segundo duas das suas direcções fundamentais. Os ângulos fundamentais são ainda todos iguais a π2 , mas os módulos dos vectores fundamentais são diferentes entre si, ou seja, 2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS a α 6= = b β 6= = c γ π . 2 = β γ α b a 19 c Este tipo de rede cristalina apresenta as três variantes simples, de corpo centrado e de faces centradas, e ainda uma quarta, chamada rede de bases centradas, que é formada por pontos nos vértices de paralelipı́pedos iguais dispostos contiguamente e dois pontos, nos centros de duas faces opostas. As deformações que aplicámos até agora à rede cúbica, para obtermos as redes tetragonais e ortorrômbicas, têm a propriedade de manter os ângulos α, β e γ iguais a π2 . Vamos agora apresentar outras possibilidades. (d) Redes monoclı́nicas Deformemos uma rede ortorrômbica, por forma a alterar o valor de γ, deixando os outros parâmetros inalterados. Obtemos assim uma rede do tipo chamado rede monoclı́nica, que apresenta apenas as variantes simples e de bases centradas. As relações entre os parâmetros, neste tipo de rede, são: a α 6= = b β 6= = c π 2 6= γ. α γ β b a c (e) Redes triclı́nicas Finalmente, consideremos agora a rede cristalina mais geral, no sentido em que menos constrangimentos impomos aos parâmetros de rede. A rede triclı́nica fica definida por a α 6= b 6 = β 6= 6= c γ 6= β π 2. b γ α a c Há ainda que considerar dois tipos particulares de rede, que são casos especialmente importantes dos que já mencionámos. (f) Redes trigonais A rede trigonal pode obter-se por deformação da rede cúbica na direcção de uma das diagonais principais. É caracterizada por a = b = c α = β = γ < 2 π. 3 (g) Redes hexagonais São casos particulares da rede monoclı́nica, em que γ = 23 π. Assim, verificam a = α 2.4 = b 6= c π β= , 2 γ= 2 π. 3 Exemplos de estruturas cristalinas Nesta secção apresentaremos exemplos das estruturas cristalinas apresentadas por algumas substâncias quı́micas. 20 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA (a) Redes cúbicas simples Este tipo de estrutura não é energeticamente favorável para substâncias simples, e por isso poucos elementos a adoptam. O único exemplo é o polónio, na forma α. Em contrapartida, há vários compostos que apresentam redes cristalinas do tipo cúbico simples, como, por exemplo, o cloreto de césio, CsCl. Nos cristais de cloreto de césio, os átomos de uma espécie ocupam as posições definidas pela rede cúbica simples, enquanto que os da outra ocupam os centros dos corpos da célula unitária. Note-se que isto não define a rede como sendo cúbica de corpo centrado, porque os átomos de cloro e de césio são diferentes. Assim, não podem ocupar, ambos, posições da rede cristalina, que, por definição, é um conjunto de pontos equivalentes. A Tabela 2.1 apresenta alguns compostos que cristalizam numa estrutura cúbica simples. Substância CsCl CsBr CsI TlCl TlBr TlI a (Å) 4,11 4,29 4,56 3,84 3,97 3,74 Substância NH4 Cl CuZn AgMg LiHg AlNi BeCu a (Å) 3,87 2,94 3,28 3,29 2,88 2,70 Tabela 2.1: Alguns compostos que cristalizam em redes cúbicas simples. Também é apresentado o valor do parâmetro de rede a. (b) Redes cúbicas de faces centradas A rede cúbica de faces centradas é uma das redes que apresenta empacotamento máximo (ver adiante nesta secção) e por isso muitos elementos apresentam estruturas cristalinas deste tipo. Na Tabela 2.2 apresentam-se algumas substâncias (tanto elementos como compostos) que cristalizam em redes cúbicas simples. O silı́cio e o germânio (muito importantes na industria de semi-condutores) Elemento Cu Ag Au Al a (Å) 3,61 4,08 4,07 4,04 Composto NaCl LiF KCl LiBr a (Å) 5,63 4,02 6,28 5,49 Tabela 2.2: Substâncias que cristalizam em redes cfc. cristalizam também na rede cúbica de faces centradas, com valores para o parâmetro de rede a de 5,43 Å e 5,45 Å, respectivamente. Um outro exemplo importante é o carbono, na forma de diamante. A estrutura cristalina do diamante pode ser gerada associando a cada ponto de uma rede cúbica de faces centrada um motivo constituı́do por dois átomos de carbono com coordenadas fraccionárias(a) (0,0,0) e ( 14 , 41 , 14 ). O valor do parâmetro de rede do diamante é a = 3, 56 Å. (c) Redes cúbicas de corpo centrado Os metais alcalinos cristalizam todos em redes cúbicas de corpo centrado. Na Tabela 2.3 resumemse as propriedades da rede cristalina de alguns elementos que apresentam esta estrutura. (d) Redes de empacotamento máximo Em muitos metais e nos sólidos inertes, a ligação quı́mica é tal que favorece uma grande proximidade entre os átomos envolvidos. Nestes casos, as posições ocupadas pelos átomos podem (a) Mais adiante serão introduzidas estas coordenadas. Para os presentes efeitos, é suficiente saber que um ponto cujas coordenadas fraccionárias são (q, r, s) ocupa uma posição definida por q~a + r~b + s~c relativamente a uma origem convenientemente escolhida. 2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS Elemento Li Na K Rb Cs Ba a (Å) 3,50 4,28 5,25 5,69 6,08 5,01 21 Elemento V Nb Ta Cr Mo W a (Å) 3,03 3,29 3,29 2,88 3,14 3,16 Tabela 2.3: Alguns elementos que cristalizam em redes do tipo ccc. ser visualizadas imaginando-os como esferas rı́gidas, encostadas umas às outras por forma a minimizar o volume intersticial. Nestas condições diz-se que a rede cristalina é de empacotamento máximo. Há dois tipos de redes de empacotamento máximo: a rede cúbica de faces centradas e a chamada rede hexagonal compacta. Para compreendermos a razão de existirem apenas estas duas espécies, analisemos a Figura 2.5. Nela, está representado um plano de esferas iguais, dispostas B C B B A A C C B A C A C B B A A A ABA ABC Figura 2.5: As duas possibilidades para o empacotamento máximo. contiguamente, formando uma rede bi-dimensional hexagonal. Para formarmos um cristal tridimensional, devemos colocar, sobre o plano representado à esquerda, outros planos semelhantes. Para maximizar o volume ocupado, os centros das esferas do “segundo andar” deverão ficar nas verticais dos pontos B ou, em alternativa, dos pontos C. Suponhamos que se verifica a primeira possibilidade. Analisemos agora as possibilidades de colocação de um terceiro andar. Os centros das esferas desta nova camada devem ocupar posições nas verticais dos espaços intersticiais do segundo andar, ou seja, as verticais dos pontos A (dizendo-se então que se trata de um empacotamento do tipo ABABA . . .) ou, alternativamente, as verticais dos pontos B (empacotamento do tipo ABCABC . . .). As duas possibilidades estão representadas à direita na Figura 2.5. As redes com empacotamento do tipo ABC são, de facto, redes cúbicas de faces centradas, em que o plano apresentado na Figura 2.5 à esquerda é um plano perpendicular a uma direcção diagonal principal; as redes com empacotamento do tipo ABA são redes hexagonais compactas (ver a Figura 2.6). A rede hexagonal compacta não é, no sentido estrito, uma rede cristalina, pois os pontos que a formam não são todos equivalentes, como está patente na Figura 2.6: os pontos do plano central não são equivalentes aos das bases. No entanto, é uma estrutura apresentada por um número relativamente grande de substâncias quı́micas, e por essa razão a incluı́mos nesta discussão. Para que uma “rede” hexagonal compacta seja uma estrutura de empacotamento máximo, a relação entre os módulos dos vectores fundamentais ~a, ~b e ~c é a = b c = 1, 63a. (2.4) (2.5) Dados relativos a alguns elementos que cristalizam na rede hexagonal compacta estão apresentados na Tabela 2.4 (e) Outras estruturas — Exemplos com elementos 22 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA c b a Figura 2.6: A rede hexagonal compacta. Elemento Be Ce He (2K) Mg Ti Zn a (Å) 2,29 3,65 3,57 3,21 2,95 2,66 c (Å) 3,58 5,96 5,83 5,21 4,69 4,95 c/a 1,56 1,63 1,63 1,62 1,59 1,86 Tabela 2.4: Elementos com rede hexagonal compacta. Na Tabela 2.5 resumimos propriedades da rede cristalina de elementos que cristalizam em redes trigonais, ortorrômbicas e tetragonais. Elemento Hg (5K) Bi In Sn (branco) Ga Cl (113K) Tipo de rede Trigonal Trigonal Tetragonal Tetragonal Ortorrômbica Ortorrômbica a 2,99 4,75 4,59 5,82 4,51 6,24 b — — — — 4,52 8,26 c — — 4,94 3,17 7,64 4,48 θ 70◦ 450 57◦ 140 — — — — Tabela 2.5: Alguns elementos com redes trigonais, tetragonais e ortorrômbicas. Os módulos dos vectores fundamentais são indicados em Å. Os valores redundantes não estão explicitados. 2.5 Direcções e planos cristalinos ~ pode ser escrito como uma combinação linear Como já foi dito, qualquer vector da rede, R, (b) ~ inteira dos vectores ~a, b, ~c de um conjunto fundamental primitivo, isto é, ~ = h~a + k~b + l~c, R h, k, l ∈ ZZ, (2.6) onde ZZ designa o conjunto dos números inteiros. Como é evidente, se o conjunto de vectores ~a, ~b, ~c for um conjunto fundamental não primitivo, esta equação só pode manter-se, qualquer que seja ~ se permitirmos que h, k e l possam tomar valores racionais não inteiros. Em o vector de rede R, (b) Daqui em diante, usaremos esta expressão referindo-nos a uma combinação linear com coeficientes inteiros. 2.5. DIRECÇÕES E PLANOS CRISTALINOS 23 qualquer caso, os vectores de um conjunto fundamental formam uma base natural para a descrição geométrica e analı́tica do cristal. Devemos, no entanto, ter em atenção que, por norma, esta base não é ortonormada e que, portanto, muitas igualdades elementares da geometria analı́tica de uso comum não são aqui aplicáveis. Os cristalógrafos desenvolveram uma notação, baseada na utilização de bases formadas com vectores fundamentais, que permite especificar facilmente posições, direcções e planos num cristal, que vamos passar a descrever. Chamam-se direcções cristalinas a direcções definidas por dois pontos da rede cristalina. Con~ que une dois pontos contı́guos numa dada direcção (ver a Figura sideremos um vector de rede R 2.7). De acordo com a equação (2.6), existem três números inteiros (ou, quando muito, racionais) b a Figura 2.7: Exemplo de direcção cristalina. h, k, l, tais que ~ = h~a + k~b + l~c. R (2.7) Eliminando factores racionais comuns, obtemos três números inteiros r, s e t, que identificam a ~ como sendo a do vector r~a + s~b + t~c. Estes três números, na direcção (cristalina) do vector R, notação cristalográfica que iremos adoptar, apresentam-se entre parêntesis rectos e sem quaisquer separadores (vı́rgulas, espaços, etc.) entre eles, como em [rst]. Se algum destes inteiros for negativo, o sinal deve ser colocado sobre, e não atrás, do ı́ndice respectivo, como em [121]. Por exemplo, a direcção da diagonal principal numa rede cúbica (isto é, aquela que passa no centro do corpo da célula unitária, partindo da sua origem) fica identificada por [111]. Tal como as direcções cristalinas são as definidas por dois pontos da rede, planos cristalinos são os definidos por três pontos da rede cristalina. Devido à regularidade da rede, um dado plano cristalino contém, para além dos três pontos de rede que o definem, um número infinito de outros pontos de rede, que formam, nesse plano, uma rede cristalina bidimensional. Também por causa desta regularidade, é possı́vel, dado um qualquer plano cristalino, definir uma infinidade de outros planos cristalinos, paralelos ao primeiro. Os ı́ndices de Miller são uma forma prática de especificar a orientação de uma destas famı́lias de planos cristalinos paralelos. Para uma dada famı́lia definem-se da seguinte forma: (a) tomando, na famı́lia considerada, o plano que mais se aproxima da origem da célula unitária, determinam-se as distâncias que a separam dos pontos em que o plano escolhido intersecta as direcções dos vectores fundamentais ~a, ~b e ~c, e exprimem-se estas distâncias em unidades de a, b e c, respectivamente; (b) tomam-se os inversos dos resultados obtidos no primeiro ponto e reduzem-se a três inteiros nas mesmas proporções relativas, tendo o cuidado de eliminar eventuais(c) factores comuns. (c) Pode demonstrar-se que, se se usar na construcção dos ı́ndices de Miller o plano que mais se aproxima da origem, os ı́ndices obtidos não têm divisores comuns. 24 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA c c/l a/h b/k a b Figura 2.8: Plano cristalino com ı́ndices (hkl). O resultado é apresentado entre parêntesis curvos, sem separadores. Para o plano apresentado na Figura 2.8, os ı́ndices de Miller são (hkl), se os inteiros h, k e l não tiverem divisores comuns. Também para os ı́ndices de Miller se segue a convenção de colocar os sinais “-” sobre os ı́ndices negativos. Assim, se para uma dada famı́lia de planos resultarem os valores 2, -3, 1 para os ı́ndices de Miller, o resultado deve ser apresentado como (231). Se um dado plano é paralelo a um dos eixos fundamentais, então não o intersecta, obviamente; o valor do ı́ndice de Miller correspondente é, por definição, 0 (zero). Por exemplo, a famı́lia de planos paralela ao plano definido pelos vectores fundamentais ~a e ~b tem ı́ndices de Miller (001); os ı́ndices de Miller da famı́lia de planos paralela ao que contém as extremidades dos vectores ~a, ~b e ~c são (111); um plano que contenha os pontos cujos vectores posição ~a, ~b/2(d) , 2~c (ver figura 2.9) pertence a uma famı́lia com os ı́ndices de Miller (241). c a b Figura 2.9: Dois planos da famı́lia (241). O triângulo maior representa o plano que corta os eixos cristalográficos nos pontos ~a, ~b/2, 2~c; o triângulo menor, a tracejado, representa o plano que deve ser usado na determinação dos ı́ndices de Miller. Analisemos este caso em detalhe. O plano em questão cruza os eixos fundamentais em pontos que estão a distâncias a, b/2 e 2c da origem. Passa assim, em particular, num ponto de rede cujo vector posição é 2~c. Mas existem, nesta famı́lia de planos, elementos mais próximos da origem. Com efeito, existe um plano cristalino, paralelo ao que estamos a considerar, que passa no ponto cujo vector posição é ~c, e é este plano que, pela sua maior proximidade à origem, deve ser usado na construção da definição dos ı́ndices de Miller. Este plano cruza os eixos cristalográficos em pontos que estão a distâncias a/2, b/4 e c da origem. Usando como unidades para estas distâncias os módulos dos vectores vectores fundamentais correspondentes, obtemos os números racionais 1/2, (d) Note-se que o ponto cujo vector posição é ~ b/2 não é um ponto de rede. No entanto, o plano em questão é de facto um plano de rede, pois contém os pontos da rede cujos vectores posição são ~a, 2~c, ~b − 2~c. 2.6. DISTÂNCIA INTERPLANAR 25 1/4 e 1; os inversos destes números são 2, 4 e 1, e portanto esta famı́lia de planos tem os ı́ndices de Miller (241), como se afirmou. 2.6 Distância interplanar No próximo capı́tulo veremos que a distância entre dois planos consecutivos de uma famı́lia de planos paralelos é um parâmetro muito importante no estudo da difracção de radiação pelos cristais. Vamos por esta razão determiná-la de seguida. Na Figura 2.10 estão representados os vectores fundamentais de uma rede cristalina e dois planos de uma famı́lia cujos ı́ndices são (hkl). Pretendemos determinar a distância interplanar dhkl . Atendendo à figura da esquerda (desenhada c c dhkl P3 H G’ θ a O P2 a P1 F b Figura 2.10: Distância interplanar dos planos (hkl). segundo a direcção do vector ~b para a manter compreensı́vel), notamos que a distância requerida ~ 0 , que é igual ao comprimento da projecção do segmento OP1 segundo a direcção do vector G é escolhido perpendicular à famı́lia de planos (hkl). De acordo com a definição dos ı́ndices de Miller, o segmento OP1 tem comprimento a/h, e, portanto, dhkl = a/h cos θ. Podemos dar a esta ~ 0: igualdade uma forma mais prática usando o produto interno entre os vectores ~a e G dhkl = ~0 ~a G · , ~ 0| h |G (2.8) ~ 0 pode ser qualquer vector perpendicular ao plano (hkl). Uma forma simples de construir G ~0 onde G consiste em formar o produto vectorial de dois vectores não colineares deste plano, por exemplo ~ e F~ representados na Figura 2.10 à direita. Estes dois vectores, escritos como os vectores H combinações lineares dos vectores fundamentais, são ~b ~a − k h ~c ~b = − , l k F~ = P~2 − P~1 = ~ H = P~3 − P~2 (2.9) (2.10) onde representámos por P~k os vectores posição dos pontos Pk (k = 1, 2, 3). Fazendo o produto externo destes dois vectores resulta ~ 0 = F~ × H ~ = 1 ~a × ~b + 1 ~b × ~c + 1 ~c × ~a, G hk kl lh (2.11) e, substituindo em (2.8), obtemos dhkl = ~a · (~b × ~c) . ~ 0| hkl|G (2.12) (Note que produtos como ~a · (~a × ~b) anulam-se porque o o resultado do produto vectorial ~a × ~b é perpendicular ao outro factor (~a) no produto escalar.) Finalmente, notamos que o produto misto no numerador da fracção em (2.12) é igual ao volume da célula unitária definida pelos vectores 26 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA ~ hkl , fundamentais ~a, ~b e ~c [ver a Eq. (2.3)], que representaremos por τ . Introduzindo o vector G dado por ~ hkl = hkl 2π G ~ 0 = l 2π ~a × ~b + h 2π ~b × ~c + k 2π ~c × ~a, G (2.13) τ τ τ τ obtém-se para a distância interplanar, por fim, 2π ¯. dhkl = ¯¯ ¯ ~ ¯Ghkl ¯ (2.14) Esta expressão será usada no próximo capı́tulo, no estudo da difracção de radiação por cristais, ~ hkl (eq. 2.13), chamados onde também será discutida a importância dos vectores com a forma de G vectores da rede recı́proca. Uma vez determinada distância entre famı́lia de planos vamos agora analisar a densidade de pontos contidos em cada plano, i.e. o número de pontos por unidade de área da famı́lia de planos (hkl). Considere uma célula unitária formada por três vectores da rede. Dois destes vectores, ~u e ~v estão contidos num plano da famı́lia (hkl) (ver a Figura 2.11); o terceiro vector, w, ~ está ligado a um plano adjacente da mesma famı́lia. Note-se que a célula unitária assim construida contém apenas um ponto de rede e portanto é, de facto, primitiva. O volume da célula formada por este três vectores é, como já foi demonstrado, igual a τ . Este volume também é igual ao volume formado pelos vectores ~u e ~v e um terceiro (que em geral não é vector da rede) de módulo igual à distância interplanar, dhkl , perpendicular aos planos (hkl), e que une os dois planos adjacentes. Deste modo, temos que τ = A dhkl , e sendo o número de pontos da rede por unidade de área dado por 1 , A em que A é a área formada pelos vectores ~a e ~b, obtemos que a densidade de pontos num plano (hkl) vem dada por dhkl 1 = . A τ (hkl) w d hkl v A (hkl) u Figura 2.11: Construcção para o cálculo da densidade de pontos de rede nos planos de uma famı́lia (hkl). 2.7. COORDENADAS FRACCIONÁRIAS 2.7 27 Coordenadas fraccionárias Estudámos até agora vários conceitos úteis no estudo das redes cristalinas, mas pouco foi dito sobre os motivos, ou bases, que associados a estas redes, formam os cristais reais. Tal como as redes cristalinas, os motivos podem ser classificados em categorias gerais, segundo as transformações geométricas que aceitam como transformações de simetria. No entanto, este assunto é não será abordado neste curso, por não ser absolutamente indispensável para o estudo que se segue. O que sim é necessário é introduzir uma notação que permita a especificação das posições dos átomos que formam o motivo. Esta questão surge porque porque os átomos que formam o motivo ocupam, em geral, posições não coincidentes com as dos pontos que formam a rede cristalina; o seu vector posição não é pois, necessariamente, um vector da rede, ou seja, uma combinação linear inteira dos vectores fundamentais. Independentemente deste facto, usamos a base dos vectores fundamentais da rede cristalina para representar os vectores posição destes átomos, que, assim, podem apresentar coordenadas não inteiras, ou fraccionárias. Note-se que o mesmo acontece para alguns pontos da rede cristalina, sempre que os vectores fundamentais escolhidos para a representar forem não primitivos. Por exemplo, usando vectores os fundamentais convencionais para a rede cúbica de corpo centrado, as coordenadas do ponto central são ( 21 , 12 , 12 ). A rede cristalina do diamante é cúbica de faces centradas. Os pontos de rede de uma célula unitária convencional têm pois coordenadas (0, 0, 0), ( 12 , 12 , 0), ( 12 , 0, 21 ), (0, 12 , 12 ). Quando se usam para especificar a posição de pontos de rede numa célula unitária (não primitiva), as coordenadas fraccionárias têm origem num vértice da célula unitária; mas, quando se usam para indicar as posições dos átomos que formam o motivo, têm origem em cada ponto ponto da rede cristalina. Assim, por exemplo para o diamante, o motivo é formado por dois átomos, com coordenadas (0, 0, 0) e ( 41 , 14 , 14 ); para se obter um cristal de diamante, devemos sobrepor, em cada um dos quatro pontos de rede que referimos no parágrafo anterior, dois átomos de carbono, com estas coordenadas, relativamente a uma origem escolhida sobre cada um daqueles pontos. 2.8 Defeitos A descrição dos sólidos que foi apresentada neste capı́tulo é apenas uma idealização. Os cristais reais apresentam as regularidades mencionadas apenas de forma aproximada, apresentando sempre um número apreciável de imperfeições ou defeitos, isto é, de desvios à regularidade cristalina. Há vários tipos de defeitos cristalinos. Por exemplo, um átomo de espécie quı́mica diferente da dos que formam o cristal (como é o caso, muito útil, dos semicondutores “dopados”, do tipo “p” ou “n”),uma posição de rede desocupada, ou um átomo numa posição não definida pela rede. As próprias fronteiras do cristal são defeitos cristalinos, na medida em que quebram a periodicidade do cristal. Vamos agora estudar um pouco mais detalhadamente os principais tipos de defeitos cristalinos. (1) Vibrações dos átomos do cristal Os átomos que formam os cristais encontram-se permanentemente animados de um movimento de oscilação em torno de posições de equilı́brio, que correspondem às posições definidas pela estrutura cristalina. A este movimento dá-se o nome de agitação térmica. A amplitude destas oscilações diminui quando se baixa a temperatura, mas não se anula nunca, mantendo-se mesmo no zero absoluto da temperatura, como consequência do princı́pio de incerteza de Heisenberg. (2) Imperfeições pontuais Imperfeições pontuais são irregularidades que se verificam em pontos isolados, e há três espécies principais. As lacunas, as imperfeições intersticiais e as impurezas. Uma lacuna é uma posição da estrutura cristalina que se encontra desocupada. Uma imperfeição intersticial corresponde a um átomo que ocupa uma posição não prevista na estrutura cristalina. Um átomo de um cristal pode, sob certas circunstâncias(e) , abandonar a sua posição na estrutura cristalina (fazendo assim (e) Por exemplo, mediante um aquecimento excessivo. 28 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA F Deslocaçao Figura 2.12: Deslocações cristalinas. surgir uma lacuna) e fixar-se numa posição intersticial. A estes pares lacuna-interstı́cio dá-se o nome de pares de Frenkel. Nos cristais iónicos, as lacunas devem sempre aparecer aos pares, por forma a manter a neutralidade eléctrica do cristal. Estes pares de lacunas têm o nome de pares de Shottky. (f) As impurezas são átomos de espécie quı́mica diferente da dos que formam o cristal. Os átomos contaminantes podem ocupar posições da estrutura cristalina, substituindo assim os átomos originais, tomando o nome de impurezas substitucionais, ou ocupar posições que não estão definidas na estrutura, sendo então conhecidas como impurezas intersticiais. Por exemplo, o aço é uma solução de carbono em ferro, constituindo os átomos de carbono impurezas intersticiais na estrutura cristalina definida pelos átomos de ferro. Em contrapartida, o latão é uma liga de cobre e de zinco, onde os átomos de zinco substituem os de cobre nalgumas posições, constituindo assim impurezas substitucionais de um cristal de cobre. O funcionamento dos dispositivos semicondutores comuns, como os transı́stores ou os diodos, baseia-se na presença de impurezas substitucionais. Estes dispositivos consistem num cristal, normalmente de silı́cio ou de germânio, dividido em duas (no caso dos diodos) ou três (no caso dos transı́stores) regiões com impurezas substitucionais de tipo “n” (que consistem em átomos com um electrão de valência a mais do que os os átomos vizinhos) ou de tipo “p” (cujos átomos têm um electrão de valência a menos). (3) Imperfeições lineares Nas imperfeições lineares, os átomos que quebram a simetria cristalina dispõem-se ao longo de uma linha. Os exemplos mais importantes são as chamadas deslocações. Estas imperfeições podem ser o resultado de deformações do cristal, e verificam-se quando um plano cristalino se desloca sobre outro. Na Figura 2.12 está representada uma deslocação e o modo como as deformações do cristal podem fazer surgir deslocações. Há ainda outros tipos de deslocações mas não os estudaremos aqui. (4) Imperfeições superficiais As imperfeições superficiais são superficı́cies de separação entre regiões distintas dos cristais. Por exemplo, nos cristais de ferro é energeticamente favorável o alinhamento dos momentos magnéticos dos átomos. No entanto, a agitação térmica contraria esta tendência de alinhamento. Assim, à temperatura ambiente, os cristais de ferro encontram-se usualmente divididos em regiões, chamadas domı́nios ferromagnéticos, onde os momentos magnéticos dos átomos têm a mesma orientação, sendo diferente de domı́nio para domı́nio. As superfı́cies(g) que separam estes domı́nios constituem imperfeições superficiais. As próprias fronteiras dos cristais constituem, como já foi dito, defeitos, que podem ser classificados também como imperfeições superficiais. (f) Para cristais do tipo NaCl, evidentemente; nos casos de cristais do tipo AB , como o cloreto de cálcio (CaCL ), 2 2 a neutralidade eléctrica só pode ser assegurada através de “ternos” de lacunas — uma de A por cada duas de B. (g) Podem ser consideradas superfı́cies à escala macroscópica apenas, já que podem ter várias dezenas de milhar de átomos de espessura... 2. Problemas 29 Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • J. R. Christman, “Fundamentals of Solid State Physics” (1988), capı́tulos 2 e 3 (F5.0 257 e 258) • C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 1 (F5.0 82) • N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulos 4, 5, e 7 (F5.0 339) • C. Wert e R. Thomson, “Fı́sica de los solidos”, (????), capı́tulo 2 • Blakemore, “Solid State Physics” (????) capı́tulo 1 PROBLEMAS 2.1 Considere um cristal bidimensional semelhante a um tabuleiro de xadrez. (a) Determine dois conjuntos de vectores fundamentais não primitivos. (b) Determine dois conjuntos de vectores fundamentais primitivos. (c) Represente graficamente as células unitárias e os motivos associados aos conjuntos de vectores fundamentais determinados em (a) e em (b). 2.2 Considere a estrutura atómica plana ilustrada na figura, composta por átomos do tipo A, B e C: (a) Determine um conjunto de vectores fundamentais primitivos. (b) Indique quantos átomos de cada tipo existem na célula unitária primitiva. (c) Desenhe a célula unitária de Wigner-Seitz. ’ Atomo tipo A ’ Atomo tipo B 2.3 O Cloreto de Césio (CsCl) tem uma estrutura cúbica de parâmetro a = 4, 11 Å, com os átomos dispostos de acordo com a figura. Determine: (a) o tipo de estrutura cúbica de CsCl; (b) um conjunto de vectores fundamentais primitivos, e indique qual o volume da célula unitária primitiva; (c) a densidade do CsCl. ’ Atomo tipo C 30 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA 2.4 A estrutura do composto SrTiO3 é a seguinte: os átomos de estrôncio dispõem-se nos vértices de cubos idênticos dispostos regular e contiguamente; os de titânio, nos centros destes cubos; os de oxigénio, finalmente, nos centros das suas faces. (a) Qual o tipo de rede cristalina apresentada por este composto? (b) Indique um conjunto de vectores fundamentais primitivos. (c) Verifique que há um átomo de estrôncio, um de titânio e três de oxigénio numa célula unitária definida pelos três vectores escolhidos em (b). (d) Usando coordenadas fraccionárias, descreva o motivo que, associado à rede cristalina determinada em (a), gera o cristal de SrTiO3 . 2.5 As posições dos pontos de duas redes cristalinas são dadas por: (a) ~rn1 ,n2 ,n3 = 10n1 +9n2 +19n3 aêx 10 (b) ~rn1 ,n2 ,n3 = 2n1 +n2 aêx 2 + 3 + 6 n2 +n aêy + 2n3 aêz ; 5 √ 3n2 aêy 2 + 2n3 aêz . onde a é um número real fixo e n1 , n2 e n3 são inteiros arbitrários. Escolha, para os dois casos, um conjunto primitivo de vectores fundamentais e identifique o tipo de rede. 2.6 Para cada um dos seguintes conjuntos de vectores fundamentais primitivos, identifique o tipo de rede indicando as dimensões da célula convencional em termos dos parametros a, b e c: (a) 1 aêx 2 + 12 aêy , aêy , √1 aêz ; 2 (b) 1 aêx 2 + 12 aêy , aêy , aêz ; (c) aêx + 2bêy , bêy , cêz ; (d) 1 aêx 2 + 12 bêy , bêy , cêz . 2.7 Calcule o valor dos seguintes parâmetros para cada uma das três redes cúbicas (simples, de corpo centrado e de faces centradas): (a) volume da célula convencional; (b) volume da célula primitiva; (c) número de pontos de rede na célula convencional; (d) número de pontos na célula primitiva; (e) distância entre vizinhos mais próximos; (f) fracção de empacotamento(h) . 2.8 Prove que numa rede cúbica simples a direcção [hkl] é perpendicular aos planos da famı́lia (hkl). Verifique com exemplos que o mesmo não se passa, necessariamente, para outros tipos de rede. 2.9 À temperatura de 1190 K, o ferro apresenta uma rede cristalina de faces centradas com aresta a = 3, 647 Å, ao passo que, a 1670 K, a rede cristalina é de corpo centrado, com aresta a = 2, 932Å. Determine a sua densidade, para cada uma das temperaturas referidas. 2.10 O sulfeto de zinco Zn S cristaliza em duas estruturas distintas: a estrutura zinc blende (impregnação de zinco) e estrutura wurtzite (wurtzita), ilustradas na figura seguinte. (h) A fracção de empacotamento é a fracção de volume da rede ocupado, supondo os pontos da rede como esferas rı́gidas suficientemente grandes para se tocarem 2. Problemas 31 1/2 0 zinc blende 3/4 1/4 1/4 3/4 1/2 1/2 1/2 (a) (b) wurtzite 0 5/8 1/2 1/8 Nas Figuras (a) estão representadas células convencionais, As Figuras (b) representam projecções das respectivas células onde estão indicadas as posições verticais dos átomos em relação à altura da célula em questão. A estrutura zinc blende é constituida por a uma rede cúbica de face centrada associada a cada tipo de átomo e separadas ao longo da diagonal do cubo da célula convencional cúbica em ( 14 , 14 , 41 ). A estrutura wurtzite tem associada a cada tipo de átomo uma estrutura hexagonal compacta separadas em 58 da altura da célula hexagonal. Sabendo que os parâmetros das células são de a = 5, 41 Å para célula cúbica, e a = 3, 81 Å e c = 6, 23 Å para a célula hexagonal calcule a densidade de ambas as formas do sulfeto de zinco. 2.11 O Arsenito de Gálio cristaliza na forma de estrutura zinc blend. A ligação Ga − As tem 2, 45 Å de comprimento. (a) Determine a aresta da célula convencional cúbica. (b) Qual a separação Ga − Ga mais curta. (c) Qual a densidade do Ga As. 2.12 Considere um cristal com estrutura tipo wurtzite. Determine três vectores fundamentais primitivos assim como a respectiva base indicando a sua posição relativa. 2.13 Determine o quociente c/a para uma estrutura wurtzite. 2.14 Considere um conjunto seguinte de vectores fundamentais primitivos de uma rede tetragonal de corpo centrado: ~a = 1 1 1 1 1 1 a(êx + êy ) − cêz , ~b = a(−êx + êy ) + cêz , ~c = a(êx − êy ) + cêz 2 2 2 2 2 2 onde a representa o lado da base quadrada da célula convencional e c a altura da mesma. Considere que inicialmente temos c > a, e seguidamente imagine que a célula é comprimida na direcção do eixo z. (a) Para que valor de c a rede toma a forma de cúbica de corpo centrado? (b) Para que valor de c a rede toma a forma de cúbica de face centrada? 32 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA Dê os seus resultados em termos do parametro a. 2.15 Se uma célula unitária de uma dada rede cristalina contém N pontos de rede, então o seu volume é V = N Vp onde Vp é o volume das células unitárias primitivas da mesma rede. Demonstre esta preposição. 2.16 Determine a separação entre os pontos de uma rede cristalina ao longo das direcções seguintes: (a) [110]; (b) [111]; (c) [320]; (d) [321]. 2.17 Determine os ı́ndices de Miller de um plano que, numa rede cúbica simples, contém a aresta de uma célula unitária primitiva e intersecta duas outras arestas da mesma célula nos seus centros. 2.18 Compare a distância interplanar para os planos (210) numa rede cúbica simples, cúbica de corpo centrado e cúbica de faces centradas. 2.19 Demonstre que a fracção de empacotamento máximo para um cristal de estrutura tetragonal de corpo centrado (com uma base composta por um único átmo) é dada por: √ (a) π3 ac se c > 2a; √ 2 3 π a (b) 24 (2 + ac 2 ) 2 se c < 2a. c 2.20 Determine a densidade de pontos nos planos (111) de uma rede cúbica de face centrada. Compare com a densidade de pontos nos planos (110). Capı́tulo 3 Dispersão elástica de radiação em cristais Uma das ferramentas mais usadas na determinação da estrutura dos sólidos é a análise da difracção de radiação neles incidente. De facto, quase se pode marcar o nascimento da fı́sica do estado sólido com ramo autónomo da fı́sica em 1912, ano em que foi publicado o primeiro artigo(a) sobre difracção de raios-X em cristais. Neste capı́tulo, vamos estudar os processos de difracção de radiação por cristais e a sua utilização na determinação das estruturas cristalinas. Vamo-nos restringir à difracção elástica, em que a radiação difractada tem o mesmo comprimento de onda que a incidente. Antes, porém, faremos uma revisão dos conceitos envolvidos no estudo de processos ondulatórios. 3.1 Breve revisão sobre ondas Entre dois sistemas afastados pode haver fluxos de energia através da troca de partı́culas, que desempenham o papel de veı́culos para o transporte energético. Por exemplo, o Sol é fonte de partı́culas (electrões, positrões, etc.), que varrem o Sistema Solar e que, ao colidirem com os diferentes planetas, neles depositam a sua energia. Mas também são possı́veis trocas de energia não acompanhadas por correspondentes trocas de matéria. Por exemplo, a luz proveniente do Sol é a principal responsável pelo aquecimento diurno da superfı́cie terrestre, e consiste em radiação electromagnética (isto é, numa perturbação no valor dos campos eléctrico e magnético que se propaga no espaço), não num fluxo de partı́culas(b) . Um outro exemplo é o da energia sonora: a onda de choque de uma explosão que ocorre num dado lugar transporta energia que produz efeitos em pontos afastados, sem que se dê um deslocamento das moléculas de ar desde o ponto em que se dá a explosão até àquele em que ela é detectada. Chamamos onda a um veı́culo não corpuscular para o transporte de energia. Descrevemos as ondas através do valor de funções do espaço e do tempo (usualmente chamadas campos, na linguagem da fı́sica) como a pressão ou densidade atmosférica (para as ondas sonoras), os campos eléctrico e magnético (para as ondas electromagnéticas), o deslocamento transversal (para as ondas que se estabelecem nas cordas das guitarras), o nı́vel em cada ponto da superfı́cie para as ondas do mar, etc. Cada tipo de onda está sujeita a uma dinâmica especı́fica: a propagação das ondas electromagnéticas é regida pelas equações de Maxwell, as ondas de som no ar pela dinâmica de fluidos, as ondas das cordas pelas leis da elasticidade. Apesar desta diversidade, há aspectos comuns. Consideremos uma onda unidimensional(c) , descrita através de uma função ψ(x, t), que se desloca (a) Por W. Friedrich, P. Knipping e M. Laue dualidade onda-corpúsculo da Mecânica Quântica veio complicar esta descrição. (c) Isto é, a função que usamos para a descrever depende apenas de uma única coordenada espacial, x, e do tempo, (b) A t. 33 34 CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS sem alterar a sua forma, com velocidade v no sentido dos valores de x crescentes (ou seja, para a direita num gráfico vulgar). No instante t = 0, a função de onda é ψ(x, t = 0); num instante posterior t, os valores que a função ψ(x, 0) tomava em cada ponto passa a função ψ(x, t) a tomá-los em pontos deslocados para a direita uma distância vt, logo ψ(x + vt, t) = ψ(x, 0), ou seja, fazendo a substituição x → x − vt, ψ(x, t) = ψ(x − vt, 0). Vemos assim que as funções que descrevem ondas que se deslocam sem sofrerem alteração da forma dependem de x e de t apenas através da combinação x − vt. Funções que que se deslocam desta maneira, isto é, sem que se verifique qualquer alteração da sua forma, satisfazem a equação diferencial às derivadas parciais (verifique!) ∂2ψ 1 ∂2ψ − = 0. ∂x2 v 2 ∂t2 Generalizando para três dimensões, podemos escrever esta equação diferencial como lap ψ(x) − 1 ∂2ψ = 0, v 2 ∂t2 onde lap representa o operador laplaciano. Em coordenadas cartesianas, o laplaciano de uma função ψ é ∂2ψ ∂2ψ ∂2ψ lap ψ = + + . ∂x2 ∂x2 ∂y 2 Estudemos um exemplo particular, o das ondas electromagnéticas no vazio. Em pontos afastados de corpos materiais e de fontes de campo(d) , as equações de Maxwell reduzem-se a ~ =0 div E ~ =0 div B ~ ~ = − ∂B rot E ∂t ~ ~ = µ0 ²0 ∂ E rot B ∂t Se calcularmos o rotacional da segunda equação da primeira linha, obtemos ~ =− rot rot E ∂ ~ rot B ∂t Mas pode provar-se que ~ = grad div A ~ − lap A, ~ rot rot A ~ Aplicando esta igualdade ao caso, que mais no interessa, qualquer que seja a função derivável A. ~ de rot rot E, notamos que o primeiro termo se anula, como é patente na primeira equação de Maxell; por outro lado, o termo do lado direito desta equação pode ser calculado a partir da última equação de Maxell, obtendo-se 2~ ~ = µ0 ²0 ∂ E . lap E ∂t2 Esta expressão tem a forma geral da equação de onda, e as suas soluções descrevem uma onda que √ se propaga no espaço vazio com velocidade c = 1/ ²0 µ0 . Quando um sinal ondulatório (seja ele radiação electromagnética, ondas de som, vibrações de uma corda ou de outra natureza) incide num sistema deposita nele energia. A energia depositada por unidade de tempo chama-se intensidade da onda e, pode provar-se em cada caso, é proporcional ao quadrado da amplitude da onda. (d) Ou seja, considerando nulas a magnetização, a polarização eléctrica, a densidade de carga e a densidade de corrente. 3.1. BREVE REVISÃO SOBRE ONDAS 35 Ondas planas monocromáticas Um tipo particular de soluções da equação de onda merece uma análise mais detalhada. São as ondas planas monocromáticas, funções do tipo ~ ψ~k (~r, t) = Aei(k·~r−ωt) , (3.1) √ onde i é a unidade imaginária, definida como i = −1. A constante A nesta expressão tem o nome de amplitude da onda; ao factor (~k ·~r −ωt) dá-se o nome de fase. O interesse destas funções deve-se ao facto de ser possı́vel, usando uma técnica matemática chamada Análise de Fourier, escrever uma função arbitrária como combinação linear de ondas planas monocromáticas. Neste contexto, isto significa que qualquer solução da equação de onda se pode escrever como combinação linear destas funções. Recordemos que a exponencial de um número imaginário é um numero complexo, cujas partes real e imaginária são dadas pela fórmula de Euler, eix = cos x + i sin x. Assim sendo, verificamos que as ondas planas monocromáticas são funções complexas, cuja parte real corresponde à variável fı́sica em estudo, e que têm uma forma sinusoidal, que se desloca no espaço com velocidade constante. Chama-se comprimento de onda à distância que separa dois pontos com igual fase (dois máximos da função, por exemplo) sucessivos ao longo da direcção de propagação e perı́odo ao intervalo de tempo entre a chegada de dois pontos com igual fase sucessivos a um determinado ponto. O inverso do perı́odo chama-se frequência e é o número de ciclos da onda que atinge um determinado ponto por unidade de tempo. A frequência angular, ω, é a frequência multiplicada por 2π. Finalmente, ao inverso do comprimento de onda multiplicado por 2π dá-se o nome de número de onda. O parâmentro vectorial ~k que aparece na expressão de definição das ondas planas monocromáticas é um vector cujo módulo é igual ao número de onda e que tem a direcção e o sentido da propagação da onda. Então, se representarmos por k̂ o vector unitário com a direcção e sentido da propagação da onda e por λ o comprimento de onda, temos ~k = 2π k̂. λ Este vector chama-se vector de onda. Substituindo a função de onda plana monocromática na equação de onda da Eq. (3.1), obtemos a seguinte relação entre o módulo do vector de onda e a frequência angular, chamada relação de dispersão: ω = vk~kk. Ondas esféricas Numa onda plana monocromática, todos os pontos de um qualquer plano perpendicular à direcção de propagação têm a mesma fase. Logo, o valor da função de onda é o mesmo em todos os pontos de um dado plano perpendicular a ~k. Um sinal proveniente de uma fonte muito afastada tem, aproximadamente, esta forma(e) . No entanto, nos pontos muito próximos da fonte de um sinal ondulatório, a fase do sinal depende fundamentalmente da distância à fonte. Isto é, todos os pontos a uma mesma distância da fonte apresentam a mesma fase. A frente de onda tem então a forma de uma esfera, em vez de um plano. Ondas com esta forma chamam-se ondas esféricas e a sua expressão geral é ei(kk~r−~r0 k−ωt) , (3.2) ψ(~r, t) = A k~r − ~r0 k onde ~r0 é o vector posição da fonte emissora. Note-se que, na expressão da fase, aparece agora o produto dos módulos dos vectores ~k e ~r − ~r0 , que não depende das suas orientações. Assim, a (e) “Muito afastada” significa aqui situada a uma distância muito superior às dimensões da porção de frente de onda analisada. 36 CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS k Figura 3.1: Onda plana (à esquerda) e onda esférica (à direita). fase só depende do módulo do vector posição relativo ~r − ~r0 , e não da sua orientação, que é o que esperamos de uma onda esférica. O denominador k~r − ~r0 k na Eq. (3.2) dá conta da diminuição da intensidade do sinal com o quadrado da distância à fonte(f) . A Figura 3.1 apresenta uma representação gráfica de uma onda plana (à esquerda) e de uma onda esférica (à direita). 3.2 Dipersão de radiação — Generalidades Quando se faz incidir radiação electromagnética num objecto, cada ponto do objecto exposto à radiação é, de algum modo, excitado, tornando-se, por seu turno, fonte de radiação. Esta frase aplica-se a um grande número de processos diferentes, como a reflexão e refracção da óptica geométrica, a fluorescência, a fosforescência, etc. Por exemplo, na reflexão num espelho, a radiação incidente (isto é, os campos eléctrico e magnético que a constituem) exercem forças sobre os electrões livres da camada reflectora de alúminio, animando-os de um movimento de vibração com frequência igual à da radiação incidente; por seu turno, os electrões, por estarem em vibração, criam campos eléctricos e magnéticos igualmente oscilantes, ou seja, emitem radiação electromagnética. Esta emissão dá-se em todas as direcções mas, se se tratar de um espelho bem polido, só na direcção prevista pelas leis da óptica geométrica é que se verifica interferência construtiva das emissões dos vários electrões, logo, só nessa direccção é que se observa uma intensidade apreciável da radiação proveniente do espelho. Neste curso, consideramos apenas processos em que o comprimento de onda da radiação incidente é igual ao do da radiação secundária emitida pelo objecto exposto. Este tipo de dispersão de radiação por um objecto chama-se dispersão elástica (g) ou difracção elástica. A análise da difracção elástica de radiação por cristais é um método poderoso no estudo da sua estrutura. A informação que se obtém das experiências de difracção resulta fundamentalmente de processos de interferência das várias porções do cristal; assim, usa-se nestas experiências radiação com comprimento de onda próximo das distâncias interatómicas tı́picas nos cristais, ou seja, alguns Angstrongs. As experiências de difracção são realizadas com as seguintes três espécies de feixes: Raios-X Por ser muito simples a produção, detecção e manipulação (focagem, deflexão, etc.) de feixes de radiação electromagnética, este tipo de radiação é o mais frequentemente escolhido para experiências de difracção. A radiação interage principalmente com as nuvens electrónicas dos sólidos, e portanto a sua utilização permite a determinação da distribuição electrónica e, a partir daı́, da estrutura cristalográfica e de outras propriedades relevantes dos sólidos. (f) Recordemos que a intensidade de uma onda é proporcional ao quadrado da sua amplitude. razão de ser desta designação é fácil de compreender. Consideremos o processo de dispersão como uma colisão entre fotões e um objecto imóvel. Na linguagem tradicionalmente usada nos problemas de colisões, dizemos que os fotões que constituem a radiação incidente são os fotões antes da colisão, os fotões da rdiação dispersada são os fotões após a colisão. A energia cinética dos foões é proporcional à frequência da radiação (de acordo com a lei de Plank) que, por seu turno, é proporcional ao seu comprimento de onda. Assim, se o comprimento de onda da radiação incidente é igual ao da radiação dispersada, a energia cinética dos fotões antes e depois da colisão é a mesma. Como o objecto exposto está imóvel, verifica-se conservação da energia cinética, logo, trata-se de uma colisão elástica. (g) A 3.3. A CONDIÇÃO DE LAUE 37 Nas experiências de difracção com cristais, usa-se radiação electromagnética na região do espectro dos raios-X, por ser a que apresenta os comprimentos de onda na gama apropriada. Electrões Podem também usar-se feixes corpusculares, já que, de acordo com a Mecânica Quântica, estes evidenciam também comportamentos ondulatórios. Os electrões, por serem partı́culas carregadas e extremamente leves, sofrem muito fortemente a interacção com a matéria; assim, os feixes de electrões não têm um grande poder de penetração nos sólidos e, por esta razão, são usados apenas no estudo das suas superfı́cies. Os electrões devem estar animados com uma energia cinética de cerca de 150 eV(h) para que o comprimento de onda da sua função de onda quântica seja comparável com as distâncias interatómicas vulgares nos cristais. Neutrões Estas partı́culas, ao contrário dos electrões, têm um grande poder de penetração nos sólidos, por serem mais pesadas e também por serem electricamente neutras. Apesar da sua neutralidade eléctrica, os neutrões apresentam momento magnético não nulo e por isso sofrem interacções electromagnéticas, principalmente com os electrões responsáveis pelas propriedades magnéticas do meio em que se encontram. Estas interacções não são “mascaradas” pelas forças coulombianas, que seriam dominantes se se usassem feixes de partı́culas carregadas, como protões. Por esta razão, os feixes de neutrões são particularmente indicados no estudo da distribuição do momento magnético no interior dos sólidos. A energia do feixe com que as experiências devem ser conduzidas é de cerca de 0,1 eV. As funções usadas para descrever as ondas nos processos de composição e de interferência são, no caso dos raios-X, o campo electromagnético, ao passo que, no dos feixes corpusculares, é a função de onda das partı́culas que os constituem. No entanto, a intensidade medida pelos detectores é proporcional ao quadrado do módulo do campo electromagnético (no caso dos raios-X), ou da função de onda (no caso dos feixes de electrões ou de neutrões). 3.3 A condição de Laue Um cristal, conforme já foi muitas vezes dito, consiste num conjunto de objectos microscópicos idênticos (são as ocorrências do motivo do cristal) colocados, regularmente, nos pontos de uma rede de Bravais, que, quando neles incide radiação, a reemitem em todas as direcções. São então observadas fortes intensidades de difracção nas direcções em que a radiação reemitida por todos estes objectos interfere construtivamente. Consideremos dois destes centros dispersores, separados k^ δ1 ^ k’ R δ2 Figura 3.2: Dispersão elástica de radiação por duas células unitárias de um cristal. ~ Neles incide radiação com comprimento de onda λ, segundo a direcção por um vector de rede R. definida pelo versor k̂ (ver a Figura 3.2). Para que numa direcção definida pelo versor k̂ 0 se verifique interferência construtiva, é necessário que a diferença entre os comprimentos dos caminhos ópticos seguidos pelos raios que incidem em cada um dos dois centros dispersores considerados seja igual a um múltiplo inteiro do comprimento de onda da radiação. A distância que corresponde a esta (h) 1 eV é a energia cinética adquirida por um electrão acelerado por uma diferença de potencial de 1V, ou seja 1eV' 1.6 × 10−19 J. 38 CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS diferença está realçada na Figura 3.2, sendo dada por δ1 + δ2 . Mas δ1 = δ2 = ~ · k̂ R ~ · k̂ 0 , −R (3.3) (3.4) de forma que a condição para a interferência construtiva é ~ · (k̂ − k̂ 0 ) = nλ, R (3.5) onde n é um número inteiro qualquer. Multiplicando a Eq. (3.5) por 2π/λ e notando que ~k = 2π k̂/λ é o vector de onda da radiação incidente(i) , resulta ~ · (~k − k~0 ) = 2nπ. R (3.6) Esta é a condição para que a radiação reemitida pelas duas células unitárias representadas na Figura 3.2 interfira construtivamente na direcção do vector k~0 . Claro que, se considerarmos agora todo o cristal e não somente duas células unitárias, obtemos uma condição semelhante a (3.6), ~ mas que tem que se verificar para todos os vectores da rede cristalina R: ~ · (~k − k~0 ) = 2nπ, R ~ ∈ rede cristalina. n ∈ N, ∀R (3.7) ~ = (~k − k~0 ) que satisfazem Esta é a condição de Laue para a difracção. O conjunto dos vectores G a Eq. 3.7 é muito reduzido. Vamos provar que estes vectores formam também uma rede, que não ~ Começamos por definir os vectores(j) é a rede formada pelos vectores R. ~ A ~ B ~ C ~b × ~c ~a · (~b × ~c) ~c × ~a = 2π ~a · (~b × ~c) = 2π = 2π ~a × ~b ~a · (~b × ~c) (3.8a) (3.8b) (3.8c) onde ~a, ~b e ~c são os vectores fundamentais do cristal em estudo (ou seja, da rede definida pelos ~ É possı́vel provar que, se ~a, ~b, ~c não forem co-planares, então A, ~ B, ~ C ~ também não o vectores R). são (o leitor é aconselhado a tentar fazer esta demonstração). Assim, eles podem ser vistos como os vectores fundamentais de uma nova rede tridimensional de pontos, chamada rede recı́proca, que desempenha um papel importante em diferentes tópicos da Fı́sica do Estado Sólido (veremos já a seguir a sua importância no estudo da difracção de radiação). Para melhor distinguir os conceitos, chamamos por vezes rede directa à rede cristalina propriamente dita, gerada pelos vectores ~a, ~b e ~c. Os vectores fundamentais da rede recı́proca formam produtos escalares muito simples com os ~ · ~a: vectores fundamentais da rede directa. Por exemplo, tomemos o produto A ~ · ~a = A = 2π ~ b × ~c · ~a τ 2π, uma vez que o produto misto ~b × ~c · ~a é igual ao volume, τ , da célula unitária da rede directa. De igual maneira se verifica que ~ · ~b = C ~ · ~c = 2π. B ~ · ~b: Consideremos agora o produto escalar A ~ · ~b = 2π ~b × ~c · ~b. A τ da mesma maneira o vector de onda da radiação difractada ~k0 = 2πn̂0 /λ. ~ hkl = hA ~ + kB ~ + lC. ~ que, usando estas definições, a Eq. (2.13) na Secção 2.6 pode reescrever-se como G (i) Define-se (j) Note-se 3.4. A LEI DE BRAGG 39 Este resultado é nulo, porque o produto vectorial ~b × ~c é perpendicular a ~b, logo, o seu produto escalar com este vector anula-se. Vemos assim que ~ · ~b = A ~ · ~c = B ~ · ~a = B ~ · ~c = C ~ · ~a = C ~ · ~b = 0. A ~ B ~ e C ~ não são colineares, podem servir como base do espaço. Uma vez que os vectores A, Assim, podemos concerteza escrever ~ = xA ~ + yB ~ + z C, ~ G (3.9) onde x, y, z são três números adimensionais, não necessariamente inteiros, que são as componentes ~ nesta base. Por outro lado, como R ~ é um vector da rede cristalina, pode escrever-se como de G uma combinação linear inteira dos vectores ~a, ~b, ~c, ~ = h~a + k~b + l~c, R (3.10) com h, k, l inteiros. Vejamos quais os valores que x, y, z podem tomar para que se verifique ~ ·G ~ = 2nπ, de acordo com (3.7). De acordo com as expressões que já apresentámos para os R produtos escalares dos vectores fundamentais da rede recı́proca e da rede directa, temos ³ ´ ³ ´ ~ ·G ~ = ~ + yB ~ + zC ~ R h~a + k~b + l~c · xA = 2π (xh + yk + zl) . (3.11) Para que se verifique a condição de Laue, é necessário que a soma dentro dos parêntesis na Eq. (3.11) seja um número inteiro, quaisquer que sejam os inteiros h, k, l. Isto só é possı́vel ~ = (~k− k~0 ) (quaisquer que sejam h, k, l) se x, y e z forem também inteiros. O conjunto de vectores G que satisfaz a condição de Laue é pois da forma ~ = pA ~ + qB ~ + rC, ~ G (3.12) com p, q, r inteiros, ou seja, é formado pelas combinações lineares inteiras dos vectores fundamentais da rede recı́proca. Voltando agora à condição de Laue, podemos agora enunciá-la da seguinte forma: Pode ocorrer interferência construtiva (e portanto difracção) se a variação no vector ~ = k~0 − ~k, for um vector da rede recı́proca. de onda da radiação G Note-se que a condição de Laue é uma condição apenas necessária, não suficiente, para a difracção. Se o motivo cristalino não for trivial (isto é, se contiver mais do que um átomo por célula unitária), verificam-se processos de interferência no interior de cada célula unitária primitiva, que podem impedir a difracção numa dada direcção, mesmo que a condição de Laue (que diz respeito apenas à interferência entre diferentes células unitárias primitivas) a permita. Mais à frente abordaremos este assunto. 3.4 A lei de Bragg Como acabámos de ver, de acordo com a condição de Laue, para se dar difracção de radiação numa dada direcção, é necessário que a variação do vector de onda da radiação seja um vector da ~ rst , isto é, que rede recı́proca. Suponhamos que esta condição é satisfeita para o vector G ~ rst = rA ~ + sB ~ + tC, ~ ∆~k = G com r, s, t inteiros arbitrários. Os três números inteiros r, s e t são totalmente arbitrários e podem, ou não, ter divisores comuns. Sejam h, k e l três inteiros nas mesmas proporções, mas sem divisores comuns. Então r s = = t = nh nk nl, 40 CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS onde n é o maior divisor comum dos três inteiros r, s e t. Podemos então escrever a condição de Laue acima como ~ hkl . ∆~k = nG (hkl) k θ k θ k’ k - k’=Ghkl Nós tı́nhamos já encontrado os vectores da rede recı́proca, antes deste estudo da difracção de radiação, quando deduzimos a expressão da distância interplanar. Vimos, nessa altura, que o vector da rede ~ hkl é perpendicular à famı́lia de planos cristalinos com recı́proca G ı́ndices de Miller (hkl). Na figura junta, representa-se a disposição dos vários vectores envolvidos na Condição de Laue. A partir desta figura, é evidente que ~ hkl k nkG sin θ = , 2k~kk ou seja, 2 2π sin θ = nλ. ~ hkl k kG Mas, como vimos no capı́tulo anterior, ~ hkl k = kG 2π , dhkl onde dhkl é a distância interplanar da famı́lia de planos (hkl). Substituindo em cima, obtemos a famosa Lei de Bragg, 2dhkl sin θ = nλ, que é uma condição para a difracção equivalente à condição de Laue. A lei de Bragg pode ser deduzida de forma alternativa, fazendo a suposição (nada fácil de justificar) de que a difracção de radiação se faz por reflexão geométrica nos planos cristalinos. A Figura 3.3 representa o trajecto óptico de dois raios-X paralelos que sofrem uma reflexão em θ θ θθ θ l l d θ Figura 3.3: Reflexão de Bragg. dois planos consecutivos de uma dada famı́lia de planos cristalinos, que fazem com a direcção dos feixes um ângulo de θ. A diferença entre os caminhos percorridos pelos dois raios é 2l, ou seja, 2d sin θ, onde d é a distância interplanar. Para que haja interferência construtiva, esta diferença deve conter um número inteiro, n, de comprimentos de onda, λ, da radiação envolvida no processo. Assim, a condição para a existência de reflexão é 2d sin θ = nλ, (3.13) que é a lei de Bragg. Quando radiação de comprimento de onda bem definido incide num cristal, somente as famı́lias de planos que apresentam uma distância interplanar e uma orientação relativamente à radiação incidente que satisfazem a lei de Bragg participam na reflexão de radiação. Pode mesmo não haver reflexão (é até o caso mais frequente, para uma orientação fixa do cristal e da fonte da radiação) se não houver nenhuma famı́lia de planos nestas condições. Neste caso, a radiação incidente é totalmente absorvida pelo cristal. 3.5. MÉTODOS EXPERIMENTAIS 3.5 41 Métodos experimentais Há basicamente três métodos para o estudo experimental da difracção: o de Laue, o do cristal rotativo, e o do pó. No método de Laue, faz-se incidir raios-X com uma gama contı́nua de comprimentos de onda sobre um cristal imóvel (ver a Figura 3.4). O cristal difracta as componentes da Cristal Fonte de raios−X Écran Figura 3.4: Método de Laue. radiação incidente com comprimentos de onda para os quais existem no cristal famı́lias de planos com distância interplanar capaz de satisfazer a lei de Bragg. Estas componentes irão, após a difracção, incidir num ecrã, usualmente uma placa fotográfica, ou um detector eletrónico de raios-X, permitindo assim a análise. Os padrões de difracção consistem numa série de pontos, dispostos de forma simétrica relativamente ao ponto onde a direcção da radiação incidente intersecta o plano do écran. Como já foi dito, ao se iluminar um cristal imóvel com radiação monocromática poderá não se verificar qualquer difracção, por não haver no cristal nenhuma famı́lia de planos orientada de forma a permitir a satisfação da lei de Bragg. Mas se se rodar o cristal durante a exposição à radiação, verificar-se-ão várias difracções, cujo ângulo se altera bruscamente com a rotação do cristal. Cada famı́lia de planos “espera pacientemente” o instante em que a sua orientação relativamente à radiação incidente permita, nos termos da lei de Bragg, a sua participação na difracção. Este é o processo usado no chamado método do cristal rotativo. O cristal roda no interior de um cilindro Écran Cristal Fonte monocromática de raios−X ω Figura 3.5: Método do cristal rotativo. (ver a Figura 3.5) cujas paredes interiores estão revestidas com uma pelı́cula fotográfica. Um orifı́cio na superfı́cie lateral do cilindro permite a entrada do feixe incidente. No método do cristal rotativo, em cada instante, apenas algumas famı́lias de planos participa no processo de difracção, que são aquelas que estão correctamente alinhadas, e que apresentam uma distância interplanar capaz de satisfazer a lei de Bragg. Se, em vez de um único cristal, 42 CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS dispusessemos de um grande número cristais na região de incidência do feixe, e cada cristal estivesse orientado de maneira arbitrária, então, mesmo com a amostra fixa, qualquer famı́lia de planos teria, nalgum cristal, a orientação correcta para satisfazer a lei de Bragg, podendo assim participar da difracção. É nesta ideia que se baseia o chamado método do pó ou de Debye. Neste método, em vez de se usar um cristal inteiro na amostra, usa-se um cristal fragmentado em pequenos grãos, cada um dos quais funciona como um pequeno cristal(k) com as suas direcções privilegiadas de difracção (ver a Figura 3.6). película fotográfica os no sX mo c ati rom c amostra io Ra -180° -90° 0° 90° 180° Figura 3.6: Esquema da montagem usada no método do pó e aspecto da pelı́cula após revelação. 3.6 Factor de estrutura A condição de Laue impõe, como vimos, que a radiação difractada por pontos equivalentes do cristal (isto é, pontos separados por vectores da rede cristalina) interfira construtivamente. Assim sendo, não se consideram na descrição de Laue fenómenos de interferência entre centros dispersores a distâncias inferiores às que separam os pontos da rede cristalina e, em particular, não se descreve a interferência entre átomos diferentes no interior de cada instância do motivo cristalino. Pode pois dizer-se com propriedade que a análise de Laue é uma aproximação, na qual o motivo cristalino é encarado como um centro dispersor pontual. Desta maneira afastam-se da teoria os processos de interferência internos ao motivo, processos esses que podem eventualmente proibir a difracção segundo algumas das direcções permitidas pela lei de Laue. É esta a razão que nos levou a afirmar que a condição de Laue é apenas uma condição necessária, mas não suficiente, para a difracção de radiação. Devemos agora estudar os processos de interferência no interior de cada ocorrência do motivo cristalino. Porque não nos preocupamos já com a interferência entre diferentes ocorrências do motivo, vamos supôr a lei de Laue satisfeita à partida. Consideremos um cristal com um motivo constituı́do por N átomos. Quando incide radiação (vamos imaginá-la monocromática, para simplificar a linguagem) no cristal, proveniente de uma fonte F (ver a figura junta) cada um dos seus átomos funciona como fonte secundária de radiação, na forma de ondas esféricas com o mesmo com- (k) É trivial verificar que um grão de areia com cerca de 0,01 mm de diâmetro contém cerca de 1018 átomos, podendo pois ser ainda considerado um cristal macroscópico. 3.6. FACTOR DE ESTRUTURA 43 primento de onda da radiação incidente. Por exemplo, o j-ésimo átomo do motivo é fonte de radiação com função de onda que, na posição, ~r, do detector D, é dada por [ver a Eq. (3.2)] C k F k’ Rj O r D ψj (~r, t) = 0 Aj ~ ei(k k~r−Rj k−ωt) , ~ jk k~r − R ~ j é o seu vector posição e k 0 onde Aj é a amplitude da radiação difractada pelo j-ésimo átomo, R é o módulo do vector de onda da radiação difractada. A amplitude da radiação difractada por cada átomo é proporcional à amplitude da radiação nele incidente e a um factor, chamado factor de forma atómico que traduz a maior ou menor capacidade difractante de cada átomo e que pode ser escrito como função da variação do vector de onda, ∆~k = ~k − ~k 0 . Uma vez que a fonte de radiação está a uma distância do cristal muito superior às dimensões lineares do motivo, podemos supôr que a radiação incidente é uma onda plana, podemos tomar ~ ~ Aj = fj (∆~k)eik·Rj , ou seja, escrever a radiação difractada pelo j-ésimo átomo como ψj (~r, t) = 1 ~ ~ ~ jk k~r − R 0 ~ fj (∆~k) eik·Rj ei(k k~r−Rj k−ωt) . (3.14) ~ j e ~k 0 são paralelos, de forma que Note-se agora que os vectores ~r − R ~ j k = ~k 0 · (~r − R ~ j ). k 0 k~r − R ~ j k, é praticamente Por outro lado, a distância que separa os vários átomos do detector, k~r − R constante, de modo que podemos, no denominador da Eq. (3.14), substitui-la pela pelo valor médio dessa distância(l) , que vamos representar por d. A função de onda da radiação difractada pelo j-ésimo átomo que chega ao detector é, então, ψj (~r, t) = = 1 ~ ~ ~0 ~ f (∆~k) eik·Rj ei(k ·(~r−Rj )−ωt) d 1 i(~k0 ·~r−ωt) ~ ~ e fj (∆~k) ei∆k·Rj d Por fim, a radiação detectada é a soma das difractadas por cada átomo, ou seja, ψ(r, t) = N 1 i(~k0 ·~r−ωt) X ~ ~ e fj (∆~k) ei∆k·Rj . d j=1 Ao somatório no termo do lado direito desta equação dá-se o nome de factor de estrutura. Quanto maior for o módulo do factor de estrutura, mais intensa é a difracção da radiação pelo cristal. Se o factor de estrutura se anular para uma dada variação de vector de onda ∆~k, então não se verifica a difracção de radiação na direcção correspondente, mesmo que a difracção seja permitida pelas leis de Laue ou de Bragg. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • J. R. Christman, ”Fundamentals of Solid State Physics”(1988), capı́tulo 4 (F5.0 257 e 258) (l) Por que razão não o podemos fazer também no argumento da exponencial? 44 CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS • C. Kittel, ”Introduction to Solid State Physics”(1996), capı́tulo 2 (F5.0 82) • N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulo 6 (F5.0 339) PROBLEMAS 3.1 Prove que os volumes das células unitárias de uma dada rede (τ ) e da sua rede recı́proca (τ ∗ ) se relacionam através de (2π)3 τ∗ = τ 3.2 Prove que a recı́proca da rede recı́proca de uma dada rede é esta rede. 3.3 Mostre que a rede recı́proca de uma rede cúbica de faces centradas é uma rede cúbica de corpo centrado. 3.4 Qual é então a recı́proca de uma rede cúbica de corpo centrado? 3.5 Determine e classifique a rede recı́proca de cada uma das seguintes redes (a) hexagonal; (b) ortorrômbica; (c) tetragonal. 3.6 Considere uma rede trigonal. Seja θ o ângulo entre os seus vectores fundamentais primitivos. Prove que a rede recı́proca também é trigonal e que o ângulo θ∗ entre os seus vectores fundamentais primitivos é dado por cos θ cos θ∗ = − . 1 + cos θ 3.7 Determine os ângulos que a radiação difractada pode fazer com a incidente, numa experiência de difracção de raios-X com comprimento de onda λ = 1, 04 Å, incidindo numa rede rede cúbica simples, com parâmetro a = 4, 0 Å. 3.8 Numa experiência de difracção, onde raios-X com comprimento de onda λ = 1, 0 Å incidem sobre um cristal monoatómico com rede cúbica simples, o primeiro máximo de difracção faz com a direcção da radiação incidente um ângulo θ = 16, 4◦ . Determine o valor do parâmetro a da rede cristalina. 3.9 (*) Determine o factor de estrutura de uma rede cúbica de corpo centrado e de uma rede cúbica de faces centradas, associando a cada ponto de rede numa célula unitária convencional um factor de forma “atómico”. 3.10 (*) Construa uma tabela onde apresente os ângulos de difração de radiação por uma rede cúbica simples, ordenados de forma crescente. Indique na tabela quais os máximos que não são observados em experiências de difracção com redes cúbicas de corpo centrado e de faces centradas. 3.11 (*) Suponha que dois átomos da base de uma estrutura “zinc blende”têm factores de forma atómico =a e =b , respectivamente. (a) Obtenha uma expressão para o factor de estrutura em função dos ı́ndices (hkl) duma rede cúbica simples. (b) Mostre que o factor de estrutura, F , é 0 se h, k e l não forem simultaneamente números pares ou ı́mpares, 4(=a + =b ) se h + k + l = 4n, 4(=a − i=b ) se h + k + l = 4n + 1, 4(=a − =b ) se h + k + l = 4n + 2, 4(=a + i=b ) se h + k + l = 4n + 3, onde n é um número inteiro qualquer. 3. Problemas 45 3.12 (*) Determine a expressão para o factor de estrutura F associado a uma estrutura hexagonal compacta ideal, usando os ı́ndices da estrutura primitiva. Suponha que os dois átomos da base têm o mesmo factor de forma atómico, =, independente de ∆~k e classifique por ordem crescente de intensidade os picos de difracção associados aos planos: (100), (110), (111), (1̄11), (210) e (211). 3.13 Um cristal tetragonal é preparado para uma experiência de difracção usando o método de Debye com um comprimento de onda de raios-X de λ = 1, 54 Å. A célula convencional tem uma base quadrada de a = 3, 20 Å e altura c = 4, 63 Å. (a) Determine os três primeiros ângulos de difracção. (b) (*) Se a base consiste num átomo de um tipo no centro da célula e um outro diferente num dos vértices, classifique por ordem de intensidades os picos de difracção relativos ao ângulos da alı́nea anterior. Assuma que ambos factores de forma atómicos são reais e têm o mesmo sinal. 3.14 Partindo da condição de Laue para a difracção, prove que: ¯ ¯ ~k · G ~ ¯2 . ~ = − 1 ¯G 2 Capı́tulo 4 A capacidade térmica dos sólidos Nos capı́tulos anteriores foi apresentado um modelo dos sólidos cristalinos segundo o qual os átomos que os formam encontram-se em repouso nas posições determinadas pela rede e motivo cristalinos. No entanto, esta suposição da imobilidade é uma simplificação grosseira da realidade que apresenta, entre outros, os seguintes inconvenientes: • A temperatura de um objecto pode ser encarada como uma medida da energia cinética associada ao movimento microscópio dos átomos que o constituem. Supondo os átomos em repouso esta associação é impossı́vel. • O som consiste em ondas mecânicas, isto é, variações infinitesimais na posição dos átomos que se transmitem aos átomos vizinhos, propagando-se desta forma nos meios materiais. Aceitando a hipótese da imobilidade dos átomos nos sólidos cristalinos, estes deveriam ser isoladores sonoros, o que claramente, não se verifica. • O argumento anterior aplica-se também à condução de calor. Muitos outros argumentos desta natureza poderiam ainda ser apresentados (ver, por exemplo, o Cap. 21 do Ashcroft & Mermin). Neste capı́tulo, vamos melhorar este modelo dos sólidos, abandonando a hipótese da imobilidade atómica. Na nova descrição dos sólidos, considera-se que as posições definidas pela sua estrutura microscópica são as posições de equilı́brio dos átomos que lhes correspondem, mas supõe-se que são possı́veis pequenos deslocamentos dessas posições, que são contrariados pelas forças interatómicas responsáveis pela coesão do sólido. 4.1 A aproximação harmónica A interacção de cada átomo com os restantes átomos num sólido manifesta-se na forma de uma energia potencial φ(~r), que apresenta um valor mı́nimo quando esse átomo se encontra na sua ~ desta posição de equilı́brio (ver a Figura 4.1). Considerando pequenos deslocamentos δ~r = ~r − R posição, podemos aproximar a energia potencial pelo seu desenvolvimento de Taylor de segunda ordem · 2 ¸ 3 X ∂ φ ~ + δ~r · [∇φ(~r)] ~ + 1 φ(~r) ' φ(R) δx δxj . (4.1) i R 2! i,j=1 ∂xi ∂xj R~ O primeiro termo, de ordem zero em δ~r, é uma constante, e como tal não desempenha qualquer papel na dinâmica do sólido; representa a contribuição do átomo considerado para a energia de ligação do sólido. O termo de primeira ordem é nulo, uma vez que é proporcional ao gradiente da energia potencial do átomo, calculado na sua posição de equilı́brio, onde a energia potencial 47 48 CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS φ x X Figura 4.1: A energia potencial de um átomo de um sólido é mı́nima na sua posição de equilı́brio. apresenta um valor mı́nimo. Finalmente, o termo de segunda ordem pode ser escrito como (2) φ (~r) = = · 2 ¸ 3 1 X ∂ φ δxj δxi 2! i,j=1 ∂xi ∂xj R~ 3 1 X δxi Kij δxj , 2 i,j=1 com · Kij = ∂2φ ∂xi ∂xj (4.2) ¸ ~ R A Eq. (4.2) é a expressão mais geral para a energia potencial num oscilador harmónico tridimensional. Mas note-se que, como Kij é uma matriz simétrica, é possı́vel escolher um sistema de coordenadas x0 y 0 z 0 no qual a matriz K é diagonal. Usando esse sistema de coordenadas, o termo de segunda ordem na energia potencial fica φ(2) (~r) = 1 1 1 Kxx (δx0 )2 + Kyy (δy 0 )2 + Kzz (δz 0 )2 , 2 2 2 que representa a energia total de um sistema de três osciladores harmónicos independentes, com constantes elásticas Kxx , Kyy e Kzz . Assim, se limitarmos o nosso estudo às vibrações de pequena amplitude, podemos tratar as interacções entre os átomos como interacções elásticas, o que permite, como veremos, grandes simplificações. 4.2 Elementos da teoria das probabilidades Há experiências sobre as quais não podemos prever o resultado. Por exemplo, não sabemos antecipadamente que valor “sairá” no lançamento de um dado, nem se irá chover depois de amanhã. Estas experiências chamam-se experiências aleatórias. Os resultados das experiências aleatórias não são prédeterminados mas, muitas vezes, não são igualmente “esperáveis,” isto é, ficamos mais surpreendidos com uns resultados do que com outros. Quando atiramos uma moeda ao chão, esperamos que ela fique com uma, ou com a outra, face virada para cima, não esperamos que ela fique equilibrada sobre o seu bordo circular; quando uma folha se solta da árvore a que pertence, num dia de outono com pouco vento, é difı́cil prever a que distância atingirá o solo, mas esperamos que ela caia na vizinhança da árvore. Porque é que achamos alguns resultados de uma experiência aleatória mais “esperáveis” do que outros? Porque, se repetirmos muitas vezes essa experiência, alguns resultados ocorrem mais frequentemente do que outros: as moedas caem quase sempre com uma ou outra face virada para cima, quase nunca ficam equilibradas sobre o seu bordo; as folhas que caem das árvores em dias de 4.2. ELEMENTOS DA TEORIA DAS PROBABILIDADES 49 outono sem vento ficam quase todas perto das árvores a que pertenciam, quase nunca se afastam para muito longe. 4.2.1 Variáveis aleatórias discretas Numa série de repetições de uma experiência aleatória, o número de vezes que um resultado particular ocorre chama-se frequência absoluta desse resultado. Chama-se frequência relativa de um resultado ao quociente entre a frequência absoluta de um resultado e o número de vezes que se repetiu a experiência. Como é óbvio, a soma dos valores das frequências absolutas dos vários resultados numa série de repetições de uma experiênca aleatória deve ser igual ao número de repetições. Pela mesma razão,as frequências relativas dos vários resultados são todas menores do que 1 e a sua soma deve ser igual a 1. Consideremos um exemplo. Suponhamos que estudamos o lançamento simultâneo de dois dados. O resultado desta experiência aleatória é um número inteiro compreendido ente 2 e 12 (inclusive). Suponhamos que repetimos cinco vezes esta experiência e obtemos os valores 5, 10, 7, 7, 11. As frequências absolutas dos resultados desta série de repetições desta experiência aleatória são r F (r) 2 0 3 0 4 0 5 1 6 0 7 2 8 0 9 1 10 0 11 1 12 0 As frequências relativas são as frequências absolutas divididas pelo número de repetições da experiência, ou seja, neste caso, 5: r f (r) 2 0 3 0 4 0 5 0,2 6 0 7 0,4 8 0 9 0,2 10 0 11 0,2 12 0 Note-se que as somas dos valores das frequências absolutas e das frequências relativas valem, respectivamente, 5 e 1, como já esperávamos. Note-se também que, dada a natureza aleatória desta experiência, outra série de 5 repetições produziria, em princı́pio, outros resultados e, portanto, outros valores para as frequências dos resultados. Quando aumentamos muito o número de repetições de uma experiência aleatória, constatamos o emergir de uma certa “ordem no caos,” que se manifesta na Lei dos grandes números: As frequências relativas dos resultados de uma experiência aleatória tendem para valores bem determinados à medida que o número de repetições tende para infinito. Voltando ao exemplo que temos vindo a considerar, na Figura 4.2 mostra-se um gráfico onde se representam os valores das frequências relativas dos vários resultados numa série de 50 000 lançamentos de dois dados, como função do número de lançamentos. Como se pode ver, as frequências sofrem grandes oscilações no inı́cio de uma série de repetições mas, à medida que o número de repetições aumenta, estacionam em valores bem determinados. Os limites para que tendem as frequências dos resultados de uma experiência aleatória, quando o número de repetições tende para infinito chamam-se as probabilidades desses resultados. Dada a definição de probabilidade que apresentámos, as probabilidades devem ser sempre menores do que 1 e a soma das probabilidades de todos os resultados possı́veis de uma experiência aleatória deve ser igual a um. No caso do lançamento de dois dados, as probabilidades são as da tabela em baixo. r f (r) 2 0,028 3 0,056 4 0,083 5 0,111 6 0,139 7 0,167 8 0,139 9 0,111 10 0,083 11 0,056 12 0,028 Quando repetimos muitas vezes uma experiência aleatória, esperamos que o número de vezes, ni , que um resultado particular xi com probabilidade pi ocorre seja dado por ni = npi , 50 CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS 0.2 r=7 fn(r) r = 6; 8 r = 5; 9 0.1 r = 4; 10 r = 3; 11 r = 2; 12 0 0 10 20 30 40 50 n /1000 Figura 4.2: Evolução das frequências relativas, fn (r), do resultado do lançamento de dois dados como função do número de lançamentos, n (em milhares). onde n é o número de repetições. Esta expressão resulta directamente da definição de probabilidade. Claro que, uma vez que se trata de uma experiência aleatória, esta igualdade não se verifica exactamente, qualquer que seja o valor (finito) de n; à medida que n aumenta, as diferenças entre as frequências absolutas dos vários resultados e os seus valores esperados, dados pela igualdade acima, vai diminuindo, em termos relativos. Só no limite n → ∞ passamos a ter uma igualdade exacta. Consideremos agora uma experiência aleatória cujo resultado é um número pertencente ao conjunto Ω = {X1 , X2 , . . . , XR }, onde R, não necessariamente finito, é o número de resultados possı́veis(a) . Suponhamos que repetimos esta experiência aleatória muitas (digamos, n) vezes, obtendo os valores x1 , x2 , . . . , xn , e queremos agora calcular o valor médio dos resultados obtidos. Obviamente, temos n x̄ = 1X xi . n i=1 Mas os resultados que obtivemos na repetição desta experiência, os números x1 , x2 , . . . , xn , pertencem todos ao conjunto dos resultados possı́veis Ω. Entre os resultados obtidos, alguns (digamos, n1 ) serão iguais ao resultado possı́vel X1 , outros (digamos, n2 ) serão iguais ao resultado possı́vel X2 , e assim sucessivamente. Podemos então escrever a expressão para o cálculo do valor médio como R x̄ = 1X nk Xk . n k=1 No limite em que o número de repetições da experiência aleatória tende para infinito, as razões nk /n tendem para as probabilidades, pk de cada resultado. Nesse limite, obtemos o chamado valor expectável da variável aleatória X: hXi = R X pk Xk . k=1 (a) Por exemplo, no lançamento de dois dados, o resultado é um inteiro do conjunto {2, 3, . . . , 12}. O valor ded R é, aqui, 11. 4.2. ELEMENTOS DA TEORIA DAS PROBABILIDADES 7 6.5 r Na figura ao lado podemos ver como evolui o valor médio do resultado do lançamento de 2 dados, como função do número de repetições. É bem evidente que se aproxima do valor expectável, 7. O valor expectável de uma variável aleatória representa o seu centro de dispersão. Igualmente interessante é a amplitude dessa dispersão. Para avaliar a amplitude da dispersão dos valores de uma variável aleatória, define-se a variância, que é o valor expectável dos quadrados dos desvios relativamente ao valor expectável da variável. Isto é, tomando a sequência particular de resultados x1 , x2 , . . . que usámos acima, definimos 51 6 5.5 0 10 20 30 n / 1000 40 50 n s2 = 1X 2 (xi − hXi) , n i=1 que, quando n tende para infinito, tende para a variância da variável aleatória, σ 2 (X) = R X pk (Xk − hXi)2 . k=1 Os detalhes do cálculo que nos trazem a esta expressão a partir da de s2 são em tudo semelhantes ao que permitem deduzir a expressão do valor expectável da variável aleatória a partir do valor médio de uma amostra muito grande de valores dessa variável. 4.2.2 Variáveis aleatórias contı́nuas Quando o resultado de uma experiência aleatória é um número real (por exemplo, a distância a que uma folha fica, quando atinge o solo, da árvore de que se soltou) o cálculo das frequêcias dos resultados é mais complicado, porque é muito, muito difı́cil que ocorram dois resultados exactamente iguais. Duas folhas que se soltam da mesma árvore não ficam exactamente à mesma distância da árvore; posso apostar que não encontramos, na nossa cabeça, dois cabelos de igual comprimento, se os avaliarmos com medições rigorosas. O que se faz nestes casos é dividir o intervalo de reultados em subintervalos, ou classes. Se X fôr a variável aleatória estudada, e I = [Xi , Xf ] o intervalo em que os valores de X estão definidos, definimos uma partição de I em subintervalos disjuntos I1 , I2 , . . . , que, todos reunidos, definem I e consideramos a variável discreta “classe a que pertence o resultado de X”. Usando o exemplo do comprimento dos cabelos, poderı́amos definir a classe dos cabelos com comprimento no intervalo I1 = [2,0 cm, 2,5 cm[, a dos do intervalo I2 = [2,5 cm, 3,0 cm[, etc. Podemos agora falar então da frequência da classe I1 , da da classe I2 etc. As probabilidades das classes são os limites das frequências relativas dessas classes. Podemos ainda calcular a probabilidade por unidade de largura da classe. No limite em que essa largura tende para zero, obtemos a chamada função de densidade de probabilidade, f (x). O significado desta função é que a probabilidade da variável aleatória X tomar um valor compreendido entre x e x + dx é dp = f (x)dx. O valor expectável de uma variável aleatória contı́nua calcula-se com uma generalização óbvia da expressão usada no caso das variáveis discretas, a saber Z hXi = dx, f (x)x, I onde o integral é extendido ao intervalo de valores possı́veis para X. A variância, por seu turno, fica, neste caso, Z 2 σ = dx f (x)(x − hXi)2 . I 52 4.3 CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS A lei de Dulong e Petit A capacidade térmica molar de uma substância é o calor necessário para elevar a temperatura de uma mole dessa substância em 1◦ C. Se o processo de aquecimento for feito a volume constante, o trabalho realizado é nulo, e portanto o calor fornecido ao sistema é igual à sua variação de energia dE. Assim, a capacidade térmica a volume constante é definida como ¶ µ ∂E , (4.3) Cv = ∂T V A capacidade térmica dos sólidos apresenta uma dependência da temperatura caracterı́stica, representada na Figura 4.3. CV anula-se no zero absoluto de temperatura (0◦ K≈ −273◦ C) apreC V 3R αT3 0 T Figura 4.3: Capacidade térmica dos sólidos como função da temperatura. sentando, para valores baixos de temperatura uma proporcionalidade ao cubo da temperatura, CV ∝ T 3 ; para valores altos de T , a capacidade térmica é praticamente constante e igual a 3R(b) , para todos os sólidos. A esta constância da capacidade térmica a altas temperaturas dá-se o nome de Lei de Dulong e Petit. Vamos de seguida tentar explicar este comportamento da capacidade térmica, por aproximações sucessivas. 4.3.1 Modelo Clássico De acordo com o modelo que temos vindo a desenvolver, um sólido consiste num conjunto de átomos que podem oscilar em torno de posições de equilı́brio fixas nas posições que definem a sua estrutura cristalina. Aceitando que estes deslocamentos são pequenos, vimos já que podemos considerar cada átomo sujeito a forças elásticas. Note-se que, para além de átomos “presos” às suas posições de equilı́brio, os sólidos podem também conter electrões práticamente livres no seu interior, de acordo com o modelo clássico dos metais. Esta possibilidade introduz um termo adicional na análise que vamos agora desenvolver, que não será tomada em linha de conta. Assim, o que se segue é válido apenas para sólidos isoladores, e o problema da capacidade térmica dos condutores será abordado mais adiante, no próximo capı́tulo destes apontamentos. Consideremos, então, cada átomo como um oscilador harmónico tridimensional. É bem sabido que um oscilador harmónico tridimensional se pode descrever como a reunião de três osciladores unidimensionais independentes. Podemos então, em resumo, tratar um sólido com N átomos como um conjunto de 3N osciladores harmónicos unidimensionais. Considerando o sólido em equilı́brio (b) R é a constante dos gases ideais, com o valor R = 8, 3144 J/K mol. É igual ao produto da constante de Boltzmann, kB , com o número de Avogrado, NA , isto é, R = kNA . 4.3. A LEI DE DULONG E PETIT 53 termodinâmico, todos estes osciladores devem ter a mesma energia média hεi. A energia total do sólido é então E = 3N hεi. (4.4) A energia de cada oscilador, ε, pode ser calculada recorrendo à fı́sica estatı́stica. A probabilidade de que um oscilador harmónico unidimensional, em equilı́brio termodinâmico com um ambiente à temperatura T , esteja num estado com energia compreendida entre os valores ε e ε + dε é dada pela lei de Boltzmann: − ε dP (ε) = f (ε)dε = Ae kB T dε, (4.5) onde kB é a constante de Boltzmann(c) e A é uma constante de normalização, que deve ser ajustada por forma a que a soma das probabilidades seja unitária: Z ∞ dP (ε) = 1. (4.6) 1 . kB T (4.7) 0 Daqui resulta A= Podemos identificar a energia de cada oscilador no sólido com o calor expectável da energia, ou seja Z Z ∞ 1 − ε hεi = f (ε)εdε = (4.8) dε εe kB T . kB T 0 Este integral é facilmente resolvido por partes, obtendo-se hεi = kB T . (4.9) Substituindo este valor em (4.4), obtemos o valor total da energia do sólido: E = 3N kB T . (4.10) Refira-se que este resultado poderia ter sido obtido de forma equivalente usando o Teorema da Equipartição da Energia, de acordo com o qual cada termo quadrático na expressão da energia de um sistema de muitas partı́culas idênticas contribui com kB T /2 para a energia média do sistema em equilı́brio termodinâmico à temperatura T ; neste caso, em que cada partı́cula do sistema é um oscilador harmónico tridimensional, temos, por cada uma, seis termos quadráticos na energia, três para a energia potencial [k(x2 +y 2 +z 2 )/2] e outros três para a energia cinética [m(vx2 +vy2 +vz2 )/2], ou seja, uma contribuição de 6 × kB T /2 = 3kB T para a energia média do sistema. Uma vez que o número total de partı́culas é N , obtemos por multiplicação o resultado apresentado. Derivando agora a energia em ordem à temperatura obtemos a capacidade térmica, de acordo com a sua definição (4.3). Se considerarmos uma mole de átomos obtemos finalmente CV = 3NA kB T = 3R. (4.11) que está de acordo com a lei de Dulong e Petit mas não reproduz os resultados experimentais a baixas temperaturas. Este facto foi, durante algum tempo, argumento de peso contra a hipótese atómica da matéria, até que, em 1907 Einstein propôs um tratamento diferente, em que as oscilações da rede cristalina são “quantizadas”, de forma semelhante à quantização do campo electromagnético efectuada por Plank no estudo da radiação do corpo negro. Em analogia com o termo “fotão”que se refere aos quanta do campo electromagnético, designam-se por “fonões”os quanta das oscilações mecânicas nos sólidos. Vamos de seguida seguir este formalismo. (c) k B = 1, 381 × 10−23 J/K 54 CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS 4.3.2 Modelo de Einstein Em 1900, Plank verificou que o espectro de radiação térmica emitida pelos chamados corpos negros (corpos que absorvem toda a radiação electromagnética que neles incide) pode ser descrito com exactidão supondo que, na interacção entre a matéria e o campo electromagnético, só pode haver transferência de energia em quantidades múltiplas da unidade básica hν, onde h é a constante de Plank(d) e ν é a frequência envolvida no processo. Esta suposição era, na altura, completamente injustificável e foi considerada como um mero truque de “engenharia algébrica”por toda a comunidade cientı́fica, incluindo o próprio Plank, porque parecia indicar que a radiação electromagnética seria constituida por partı́culas. O debate sobre a natureza da luz (ondas ou partı́culas) vinha desde os tempos de Newton (partidário da Natureza corpuscular) e Huyghens (que apoiava a descrição ondulatória) e tinha, aparentemente, sido resolvido, experimentalmente, já no século XVIII, pelos trabalhos de Young e de Fresnel, a favor da hipótese ondulatória. O “truque”de Plank viria assim, caso fosse aceite como descrição de algo real, a baralhar (de novo) as cartas. Por esta razão, os fı́sicos acreditavam que, mais tarde ou mais cedo, um tratamento clássico do corpo negro seria elaborado, no qual a hipótese de Plank não fosse necessária, ou surgisse devidamente justificada no contexto da teoria ondulatória da radiação. Um dos poucos fı́sicos que não partilhavam esta opinião era Albert Einstein. Segundo Einstein, a radiação electromagnética é de facto constituida por partı́culas chamadas fotões com uma massa em repouso nula e com energia dada por hν, de acordo com a hipótese de Plank. No entanto, o carácter ondulatório da luz não é eliminado, até porque na própria expressão de energia, E = hν, está presente a frequência, ν, que é uma quantidade tipicamente ondulatória. Einstein compatibilizou estes aspectos aparentemente contraditórios interpretando estatisticamente o campo (ou função de onda) da radiação. Concretamente, Einstein propôs que a intensidade (caracterı́stica ondulatória) da radiação numa região do espaço é proporcional ao número de fotões nela presente. Com esta descrição da radiação, Einstein explicou quantitativamente os resultados das experiências sobre o efeito fotoeléctrico em 1905. Apesar deste sucesso, continuou relativamente isolado na defesa do carácter realista da hipótese de Plank, até ao ano 1922 em que Comptom expôs os seus trabalhos sobre a dispersão de electrões pela radiação, “encerrando”a questão a favor de Einstein. Para dar mais consistência à hipótese de Plank, Einstein tentou aplicá-la noutros domı́nios, nomeadamente naquele que aqui mais nos interessa, o problema da capacidade térmica dos sólidos. Suponhamos que, tal como o campo electromagnético, também o campo dos deslocamentos dos constituintes de um sólido está quantizado, no sentido em que as trocas de energia mecânicas entre estes constituintes só são possı́veis em quantidades múltiplas de hν, onde ν é a frequência das oscilações com que estão animados. Esta suposição parece indicar a existência de uma partı́cula à qual se dá o nome de fonão que tem uma energia hν, e que é trocado entre os átomos do sólido, aumentando ou diminuindo a energia das suas oscilações. De acordo com esta hipótese, a energia mecânica de cada átomo já não pode ser considerada uma variável continua, antes tomando valores de um conjunto discreto, distanciados entre si de h̄ω (e) (ver a Figura 4.4). O valor mı́nimo da energia, representado na Figura 4.4 por ε0 , obtém-se facilmente através de uma resolução quântica do oscilados harmónico (que continua a ser a nossa aproximação para os deslocamentos atómicos no cristal) e é dado por ε0 = 21 h̄ω. De que forma esta hipótese altera a descrição clássica do sólido? Vamos repetir o processo que seguimos para o modelo clássico. Consideremos 3N osciladores independentes, em equilı́brio termodinâmico à temperatura T . Supondo que todos estes osciladores têm a mesma frequência ω e a mesma energia, que identificamos com o valor expectável da energia de um oscilador quântico. A energia total do sólido é então, tal como em (4.4), E = 3N hεi. (d) h = 6, 626 × 10−34 Js = hν (e) h̄ω (4.12) 4.3. A LEI DE DULONG E PETIT 55 E ε +nhw o ε +3hw o o ε + hw o ε = 1 hw o 2 ε +2hw Figura 4.4: Nı́veis de energia de um oscilador quântico com frequência ω. A diferença principal relativamente ao tratamento clássico consiste no cálculo da energia média hεi. Como a variável ε é, nesta abordagem, discreta, este cálculo não pode ser levado a cabo usando a Eq. (4.8). Continuando a aceitar a distribuição de probabilidade de Maxwell-Boltzmann, temos, neste caso, que a probabilidade de um oscilador estar no nı́vel de energia εn , 1 εn = (n + )h̄ω 2 é P (εn ) = Be−βεn . (4.13) onde se introduzir a notação, usual em fı́sica estatı́stica, β = 1/kB T , e B é uma constante de normalização escolhida de maneira a garantir que a soma de todas as probabilidades seja 1. A constante B é então determinada impondo ∞ X P (εn ) = 1, (4.14) Be−βεn = 1, (4.15) n=0 ou seja, ∞ X n=0 e portanto 1 . −βεn n=0 e B = P∞ (4.16) O valor numérico desta constante não é um resultado particularmente interessante, mas pode facimente ser determinado. Usando a expressão da energia, o somatório no denominador em (4.16) pode ser escrito como ∞ ∞ X X 1 e−βεn = e− 2 βh̄ω (e−βh̄ω )n , (4.17) n=0 n=0 e o somatório no lado direito desta igualdade é uma série geométrica de razão x = e−βh̄ω < 1 . A série é pois convergente, e o seu valor é ∞ X 1 e−βεn = n=0 e− 2 βh̄ω . 1 − e−βh̄ω (4.18) Substituindo este resultado em (4.16), obtemos " 1 e− 2 βh̄ω B= 1 − e−βh̄ω #−1 . (4.19) 56 CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS A probabilidade de se encontrar um oscilador quântico no n-ésimo nı́vel de energia εn é e−βεn P (εn ) = P∞ −βε . n n=0 e (4.20) e o valor médio da energia é calculado usando a definição de valor expectável de uma variável aleatória X hεi = P (εn )εn (4.21) n [compare com (4.8)]. Substituindo aqui (4.20) obtemos P∞ −βεn εn n=0 e hεi = P , ∞ −βεn e n=0 (4.22) onde o denominador em (4.20) foi posto em evidência na soma em (4.21). Note-se que o lado direito da Eq (4.22) é o simétrico da derivada em ordem a β, de X ln e−βεn e portanto escrevemos ∞ hεi = − X ∂ ln e−βεn , ∂β n=0 (4.23) e o somatório que serve de argumento ao logaritmo foi calculado em (4.18). Resulta então à ! 1 e− 2 βh̄ω ∂ ln hεi = − ∂β 1 − e−βh̄ω · ¸ ¡ ¢ ∂ 1 −βh̄ω = − − βh̄ω − ln 1 − e . (4.24) ∂β 2 Efectuando a derivada em ordem a β, obtemos hεi = = 1 h̄ωe−βh̄ω h̄ω + 2 1 − e−βh̄ω h̄ω 1 h̄ω + βh̄ω . 2 e −1 A energia total do sólido é então segundo (4.12) µ ¶ 1 h̄ω E = 3N h̄ω + βh̄ω 2 e −1 (4.25) (4.26) e a capacidade térmica obtém-se derivando esta igualdade em ordem à temperatura, eliminando-se assim a constante 3N h̄ω/2, ¶ µ ∂E CV = ∂T V µ ¶ ∂β ∂E = ∂T ∂β V = 3N eβh̄ω (h̄ω)2 2. 2 kB T (eβh̄ω − 1) (4.27) É usual a introdução da chamada temperatura de Einstein, que é o factor constante definido por θE = h̄ω , kB (4.28) 4.3. A LEI DE DULONG E PETIT 57 em termos da qual a capacidade térmica resulta µ CV = 3R θE T ¶2 e ³ e θE T θE T ´2 , (4.29) −1 assumindo que o número de átomos N é igual ao número de Avogrado NA . A Figura 4.5 apresenta o gráfico da capacidade térmica, dividido por 3R. É evidente que o comportamento desta função C (T) /3R V 1 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 2 2.5 T/ θ E Figura 4.5: A capacidade térmica dos sólidos no modelo de Einstein. a altas temperaturas é o esperado µ ¶ CV −→ 1 ⇐⇒ (CV )T →∞ −→ 3R 3R T →∞ e que o limite para baixas temperaturas é também o correcto CV T →0 −→ 0. Podemos verificar estes resultados analiticamente. Quando T → ∞, θE /T → 0. O argumento das exponenciais é então pequeno e podemos por isso substitui-las pelos seus desenvolvimentos em série de Taylor, mantendo apenas os termos mais significativos. Isto é, podemos em (4.29) fazer a substituição θE θE e T '1+ , T para T elevado. Obtemos então # µ ¶2 "µ ¶2 θE T T CV ' 3R + T θE θE µ ¶ θE ' 3R + 3R T ' 3R, no limite quando T → ∞, de acordo com a lei de Dulong e Petit. No limite oposto, em que T → 0, o argumento das exponenciais θE /T é muito grande, e também as exponenciais o são. Podemos 58 CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS então desprezar, no denominador de (4.29), a unidade. Resulta então µ CV ' 3R θE T ¶2 e− θE T . (4.30) À medida que T se aproxima de zero, θE /T cresce, e a exponencial tende para zero. A diminuição do valor da exponencial “vence”o crescimento do termo (θE /T )2 e o limite do produto é zero, de acordo com o gráfico na Figura 4.5. De um ponto de vista mais fı́sico, a razão pela qual a capacidade térmica dos solidos se anula para temperaturas muito baixas é que a energia que é fornecida a um sólido para elevar a sua temperatura ligeiramente acima do zero absoluto não é suficiente para excitar os átomos para o primeiro estado excitado de oscilação. Para tal, é necessário fornecer a um átomo uma energia igual ou superior ao limiar h̄ω. Ora, a baixas temperaturas esta energia não está disponı́vel. Assim, a temperatura do sólido pode aumentar ligeiramente, sem que a sua energia (isto é, a energia dos átomos que o constituem) sofra qualquer variação apreciável, resultando, então, em valores muito reduzidos para a sua capacidade térmica. Estes resultados estão em melhor acordo com os dados experimentais, apoiando assim as ideias quânticas de Einstein. No entanto, o comportamento da capacidade térmica para baixas temperaturas [expresso em (4.30)] não verifica a proporcionalidade, verificada experimentalmente, com o cubo da temperatura. A origem desta discrepância reside na suposição que os 3N osciladores têm a mesma frequência ω, ou seja, que são independentes. Se incluirmos a possibilidade de correlação nos movimentos dos osciladores, isto é, considerando modos colectivos de movimento, esta discrepância é resolvida. Este é o ponto de partida para o chamado modelo de Debye, mas que já não estudaremos, por falta de tempo. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • F. J. Blatt, “Modern Physics” (1992), capı́tulo 4 (F5.0 448) • N. W. Ashcroft e N. D. Mermin, “Solid State Physics” (1976), capı́tulo 23 (F5.0 339) • C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 5 (F5.0 82) • J. R. Hall e H. E. Hook, “Solid State Physics” (1974), capı́tulo 2 PROBLEMAS 4.1 De acordo com o princı́pio de equipartição da energia, a capacidade térmica molar de um gás com moléculas diatómicas deveria ter o valor constante de 7R/2. No entanto, este valor verifica-se apenas no limite de altas temperaturas, tendo a capacidade térmica dos gases diatómicos um comportamento como o representado esquematicamente na figura junta. Compare o comportamento da capacidade térmica dos sólidos com o da dos gases diatómicos e diga porque razão esta não é constante. CV /R 7/2 5/2 3/2 T Capı́tulo 5 Metais I: modelos de electrões livres No conjunto dos sólidos os metais têm uma importância prática especial. As suas propriedades tornaram-nos particularmente úteis num grande número de aplicações, ao longo de parte importante da história da humanidade. O estudo dos metais tem pois um grande interesse, na área mais geral da fı́sica dos sólidos. Entre as muitas propriedades interessantes dos metais, podemos referir: baixos pontos de fusão; grandes condutividades eléctricas e térmicas; altas densidades de massa; grande resistência estrutural; boa reflectividade óptica. Vamos agora passar à descrição de algumas destas propriedades a partir dos princı́pios da fı́sica. O facto de os metais conduzirem bem calor e electricidade leva-nos a pensar que alguns dos electrões dos átomos que os constituem se podem deslocar grandes distâncias no seu interior, quando comparadas com as distâncias interatómicas tı́picas. Neste capı́tulo, vamos estudar estes electrões como sendo livres, isto é, supondo que as interacções que sofrem (com outros electrões de condução e com os iões que formam a rede cristalina) são tais, e de tal forma distribuı́das, que, em média, se cancelam. 5.1 Introdução As ligações quı́micas entre dois (ou mais) átomos são estabelecidas por deformação das nuvens electrónicas desses átomos. Evidentemente, esta deformação é mais pronunciada nos estados electrónicos mais fracamente ligados a cada um dos átomos, de tal forma que podemos dizer (cometendo um erro que, na esmagadora maioria das aplicações, é desprezável) que apenas estes estados participam na ligação. Aos electrões que ocupam estes estados dá-se o nome de electrões de valência. Nos metais, a ligação quı́mica envolve normalmente um grande número de átomos (1020 , ou mais) e esta deformação das camadas exteriores da nuvem electrónica de cada átomo é particularmente pronunciada, ficando distribuı́das por toda a extensão do metal. Os electrões que ocupam estas camadas podem assim mover-se ao longo de distâncias com ordem de grandeza macroscópica. Um cristal metálico consiste pois num arranjo periódico de iões positivos, imerso num “gás” de electrões. Naturalmente, os electrões interagem uns com os outros e com os iões da rede, mas podemos supôr que as forças que sentem, estando mais ou menos distribuı́das em todas as direcções, se cancelam globalmente, sendo nula a sua resultante. Esta aproximação, apesar de claramente grosseira, permite, como veremos, obter alguns resultados em bom acordo com os factos experimentais, pelo menos a nı́vel qualitativo. 59 60 5.2 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES O modelo de Drude-Lorentz O modelo de Drude-Lorentz consiste na descrição clássica do gás de electrões livres. Usando a fı́sica clássica, este gás assemelha-se bastante a um gás perfeito. As diferenças principais residem na alta densidade (num metal há, tipicamente, 1022 electrões por cm3 ) e no facto de os electrões se moverem num cristal, podendo sofrer colisões com os iões que formam o cristal. No modelo de Drude-Lorentz (de facto são dois modelos, mas a única diferença entre eles consiste apenas num pormenor técnico do tratamento estatı́stico) tratam-se então os electrões deslocalizados como um gás de electrões livres, em equilı́brio termodinâmico com o ambiente. Sendo os electrões livres, a sua energia é totalmente cinética. Usando métodos estatı́sticos, podemos calcular a energia total do gás de electrões e a partir daı́ várias propriedades mensuráveis experimentalmente dos metais, como o calor especı́fico, o módulo de compressibilidade, etc. O confronto dos resultados que obtivermos com os valores experimentais servirá para a avaliação das qualidades do modelo. 5.2.1 O calor especı́fico dos metais No quadro desta descrição dos electrões de condução, a energia de um sólido condutor é E = Ecr + Ee , (5.1) onde Ecr é a energia do cristal de iões, que pode ser avaliada com os métodos estudados no capı́tulo anterior, e Ee é a energia do gás de electrões de condução. A energia tem esta expressão simples porque consideramos os electrões livres e portanto sua energia de interacção com o cristal é uma constante (que pode não ser considerada), cujo único efeito observável é o de manter o gás de electrões confinado no interior do metal. A energia dos electrões de condução é puramente cinética uma vez que se consideram livres. De acordo com o teorema da equipartição da energia, a energia média de um conjunto de Q electrões de condução é pois Q × 3 × kB T /2 = 3QkB T /2. Consideremos um sólido com N átomos e seja u o número de electrões que cada átomo fornece para a ligação quı́mica. Temos então Q = N u e a energia média da nuvem electrónica fica então Ee = 3 uN kB T. 2 (5.2) A energia total da amostra considerada é 3 E = Ecr + uN kB T, 2 (5.3) 3 CV = CVcr + uN kB . 2 (5.4) e o calor especı́fico do metal vem Para altas temperaturas, CVcr = 3R, como vimos no capı́tulo anterior. Relembrando que R = NA kB , resulta u (5.5) CV = 3(1 + )R. 2 Concluı́mos então que, de acordo com este modelo, os metais apresentam um calor especı́fico cujo valor é igual a 9/2R para os metais monovalentes, 6R para os bivalentes, etc. Este resultado, o primeiro que obtivemos com este modelo, está em desacordo flagrante com os resultados experimentais. De facto, o calor especı́fico dos metais tem, a altas temperaturas, o valor definido pela lei de Dulong e Petit, ou seja, 3R. Veremos mais adiante que esta deficiência do modelo pode ser resolvida analisando quanticamente as propriedades do gás de electrões. 5.2. O MODELO DE DRUDE-LORENTZ 5.2.2 61 A lei de Ohm l i S A diferença de potencial entre as extremidades de um condutor é proporcional à corrente que o atravessa. Este é o enunciado da bem conhecida lei de Ohm. Consideremos um condutor filiforme com comprimento l e secção transversal de área S, percorrido por uma corrente i (ver a figura). A lei de Ohm pode então escrever-se como ∆V = Ri, (5.6) onde ∆V é a diferença de potencial entre as extremidades do condutor e R, a chamada resistência do condutor, é a constante da proporcionalidade referida acima. Multiplicando ambos os membros de (5.6) por 1/(lS) e notando, por um lado, que o campo eléctrico médio no interior do condutor, ~ tem um módulo dado por E = ∆V /l, e por outro que a densidade de corrente j é, por definição E, de corrente, j = i/S, obtemos ~ ~j = l E. (5.7) SR À constante σ = l/(SR) dá-se o nome de condutividade (a) . Deduzimos desta maneira a forma local da lei de Ohm, ~ ~j = σ E. (5.8) A lei de Ohm tem um aspecto que, à primeira vista, pode parecer perturbador. É que a força ~ onde e é o módulo da carga do electrão; exercida pelo campo eléctrico sobre os electrões vale −eE, assim, o lado direito da equação (5.8) é proporcional à força que actua sobre os electrões. Por outro lado, a densidade de corrente ~j é dada por ~j = ρl h~v i (5.9) onde ρl é a densidade de carga livre e h~v i é a velocidade média das cargas, neste caso, dos electrões; o lado esquerdo de (5.8) é então proporcional à velocidade dos electrões. Mas então a equação (5.8) traduz uma proporcionalidade entre a velocidade dos electrões e a força que neles actua, em contradição aparente com o previsto pela segunda lei de Newton(b) (força proporcional à aceleração). De facto, esta situação não constitui um paradoxo, e é até relativamente frequente na natureza. Por exemplo, o movimento de queda de um para-quedista é, segundos após o pára-quedas se abrir, uniforme (e não uniformemente acelerado) e o valor da velocidade é tanto maior quanto maior for o peso do para-quedista, ou seja, quanto maior for a força que o impele para o solo. Neste exemplo (e noutros que poderiam ser citados) está presente, para além da força mais directamente responsável pelo movimento (a força gravı́tica), uma resistência ao movimento por parte do meio onde ele se realiza. No caso dos electrões nos condutores esse meio é o cristal. No seu movimento no cristal, os electrões podem por vezes sofrer colisões com com os iões que o formam, comunicando-lhes parte da energia cinética que obtiveram pela acção do campo. Tentemos descrever quantitativamente este processo. Consideremos o movimento dos electrões que formam o gás em equilı́brio termodinâmico na ausência, para já, de campos eléctricos aplicados. A uma temperatura T 6= 0, a energia cinética média dos electrões, correspondente ao movimento caótico de agitação térmica, dada pelo teorema de equipartição da energia de Boltzmann, tem o valor de ε = 3kB T /2. A média dos módulos das velocidades, hv0 i, dos electrões que compõem a nuvem condutora nos metais é pois r 3kB T hv0 i = , (5.10) me (a) A condutividade é o inverso da resistividade, e ambos os parâmetros são uma medida da qualidade intrı́nseca (isto é, independente de factores geométricos) dos materiais como suportes da condução eléctrica. Um material (como o cobre, por exemplo) com uma elevada condutividade, ou baixa resistividade, é um bom condutor de electricidade, mesmo que uma amostra concreta desse material (por exemplo, um fio muito longo e/ou muito fino) apresente um grande valor da resistência eléctrica. (b) Note-se que, num tratamento clássico como o presente, as leis da mecânica de Newton devem ser consideradas válidas. 62 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES onde me é a massa electrónica; à temperatura ambiente T ≈ 300 K, hvi ≈ 1, 2 × 105 m/s. O movimento correspondente à agitação térmica é pois muito rápido. No entanto, o sentido do movimento de cada electrão é totalmente aleatório e, por isso, a média vectorial das velocidades dos electrões é nula. Assim, este movimento de agitação térmica não se traduz no estabelecimento de uma corrente eléctrica mensurável. Esta situação é em tudo análoga à do problema do passeio aleatório, onde se estuda o movimento de uma partı́cula que sofre uma sucessão de deslocamentos em direcções aleatórias. O deslocamento médio ao fim de N destes passos é nulo, isto é, o valor expectável da sua posição ao fim de N passos é igual à posição inicial. Apesar de se verificar movimento, é igualmente provável o deslocamento em todas as direcções e, portanto, em média, o valor expectável do deslocamento é nulo. Vejamos agora o que acontece quando se estabelece um campo eléctrico no interior do condutor. ~ na mesma direcção mas de sentido oposto ao Cada electrão passa a sentir uma força F~e = −eE, ~ campo eléctrico, e portanto adquire um movimento uniformemente acelerado (com ~a = −eE/m e ), mas apenas entre duas colisões sucessivas. Voltando ao problema do passeio aleatório, a situação agora é análoga a um passeio aleatório em que a direcção de cada passo é, ainda, aleatória, mas são mais prováveis passos longos numa dada orientação (a do campo) . Seja τ o intervalo de tempo médio que separa duas colisões de um dado electrão(c) . Em equilı́brio, esta situação é equivalente aos electrões de condução possuı́rem uma velocidade de condução comum (ver a Figura 5.1). A E=0 E deslocamento electrónico (b) (a) Figura 5.1: Esquema do percurso de um electrão. (a) Os electrões apresentam movimentos aleatórios com velocidade vectorial média nula; (b) sob a acção de um campo eléctrico, os electrões ficam animados de um movimento uniformemente acelerado entre duas colisões sucessivas, que tendem a restaurar a aleatoriedade na direcção do vector velocidade. Esta situação é equivalente a um movimento colectivo com uma velocidade de condução correspondente ao deslocamento electrónico representado. velocidade média dos electrões é então h~v i = h~v0 i + ~ −eE τ, me (5.11) onde h~v0 i é a velocidade inicial (imediatamente após uma colisão) média. Ora, a velocidade dos electrões após uma colisão está distribuı́da uniformemente em todos os sentidos, de forma que a sua média vectorial, h~v0 i, é nula. A velocidade média dos electrões sob a acção do campo eléctrico é pois ~ −eE τ. (5.12) h~v i = me Multiplicando a velocidade média que acabámos de obter pela densidade de carga de condução, ρl = −ne, (5.13) (c) São frequentes as designações de “tempo de relaxação”, “tempo de colisão”, “tempo médio de vida livre”, entre outras, para o parâmetro τ . 5.2. O MODELO DE DRUDE-LORENTZ Metal Li Na Cu Au n (m−3 ) 4,7×1028 2,7×1028 8,5×1028 5,9×1028 63 σ(Ω−1 m−1 ) 1,1×107 2,1×107 5,8×107 4,5×107 τ (s) 8,3×10−15 2,8×10−14 2,4×10−14 2,7×10−14 Tabela 5.1: Densidades electrónicas n (em m−3 ) e condutividades eléctricas (em Ω−1 m−1 ) a 295 K (de Kittel, “Introduction to Solid State Physics”) e tempo de relaxação para o lı́tio, o sódio, o cobre e o ouro. onde n é a densidade de electrões de condução, obtemos a densidade de corrente eléctrica, 2 ~ ~j = ne τ E. me (5.14) Mas esta equação tem a forma da lei de Ohm (5.8), com a condutividade eléctrica dada por σ= ne2 τ . me (5.15) Podemos estimar o tempo de relaxação de um metal usando valores tabelados da condutividade eléctrica e da densidade electrónica. A Tabela 5.1 apresenta alguns valores. O tempo de vida livre dos electrões nos metais é, como podemos verificar a partir da Tabela 5.1, extremamente curto. Durante um intervalo de tempo tão pequeno, a variação no módulo da velocidade dos electrões provocada pela acção de campos eléctricos tı́picos (de alguns volts por metro) é, certamente, pequena. Podemos pois considerar que o valor do módulo da velocidade dos electrões é, em média, o calculado a partir do princı́pio de equipartição da energia, hvi ≈ 105 m/s. Durante um intervalo de tempo τ ≈ 10−14 s, os electrões percorrem uma distância(d) de cerca de 10−9 m= 10 Å, que é da ordem de grandeza das distâncias interatómicas. Este resultado apoia a suposição de Drude de que os electrões sofrem colisões com os iões. De acordo com o princı́pio de equipartição da energia, o valor médio do módulo da velocidade de agitação térmica, hvi, diminui com a temperatura. Supondo que o caminho médio livre, λ, não depende fortemente da temperatura, o tempo de relaxação, τ = λ/hvi, deve crescer com a diminuição da temperatura. Assim, concluı́mos que a condutividade dos metais depende da temperatura de acordo com ne2 λ σ=√ . (5.16) 3me kT Ou seja, a condutividade dos metais é maior a baixas temperaturas, o que de facto se verifica experimentalmente, com a excepção de uma classe importante (em vista das aplicações industriais) de materiais — os semi-condutores. Devemos reconhecer agora que este acordo com resultados experimentais é, apenas, qualitativo, já que, para a maioria dos metais, a condutividade depende da temperatura de forma mais pronunciada do que a patente na Eq. (5.16). 5.2.3 O efeito de Hall O efeito de Hall consiste no aparecimento de um campo eléctrico transversal num condutor percorrido por corrente numa região onde está definido um campo magnético. É frequentemente usado para medir a intensidade de campos magnéticos estáticos. Na Figura 5.2 representa-se um circuito formado com uma placa metálica (à direita na figura), numa região onde está definido um campo ~ perpendicular ao plano da placa condutora. A velocidade dos electrões (oposta ao magnético B, (d) Esta distância tem a designação habitual de “caminho médio livre”. 64 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES i B - FM v EH + + + + + + Figura 5.2: Esquema da montagem usada para demonstrar o efeito de Hall. T1 T2 T1 + + + T1 > T2 T2 v ET - Figura 5.3: Esquema da montagem para o estabelecimento de um gradiente de temperatura num ~ T , resultante desse gradiente. metal (esquerda) e o campo eléctrico, E sentido da corrente) está representada na figura como ~v . Ao moverem-se numa região onde está definido um campo magnético, os electrões sentem uma força F~M , dada por ~ F~M = −e~v × B, (5.17) e como tal, sofrem uma aceleração para a esquerda (na figura), acumulando-se assim carga de sinal negativo deste lado da placa. Em contrapartida, no lado direito sente-se um defeito de carga de sinal negativo, ou seja, o lado direito fica carregado positivamente. Em resultado desta assimetria na distribuição de carga, no interior da placa metálica estabelece-se um campo eléctrico ~ H , chamado campo de Hall. Atinge-se uma situação estacionária quando a força eléctrica, E ~ ~ H , for igual (e, claro, oposta) à força magnética, ou seja quando FH = −eE −eEH = −evB. (5.18) Usando (5.13), obtemos a condição de estacionaridade EH = − 1 jB. ne (5.19) A constante −1/(ne) tem o nome de constante de Hall. O seu valor negativo reflecte o facto de os transportadores de carga nos metais serem electrões, com carga de sinal negativo. É relativamente simples medir experimentalmente o valor da constante de Hall, e esperaria-se, à luz deste modelo, obter sempre valores negativos. Ora, estranhamente, alguns metais apresentam valores positivos para a constante de Hall. Alguns exemplos são os estabelecidos pelo cádmio, o zinco, o berı́lio e o magnésio. 5.2.4 Efeitos termoeléctricos Consideremos um metal no qual se estabelece um gradiente de temperatura. Para concretizar a discussão, imaginemos que aquecemos com uma chama a extremidade de uma barra de cobre, e mergulhamos a outra num banho gelado (ver a Figura 5.3). Uma vez que os electrões de condução da extremidade quente têm maior energia cinética do que os da extremidade fria, deve verificar-se, durante alguns instantes, um fluxo lı́quido de electrões daquela extremidade para esta. Evidentemente, o acumular de electrões na extremidade fria, com a consequente carga positiva 5.2. O MODELO DE DRUDE-LORENTZ 65 resultante na extremidade quente, define, no interior do metal, um campo eléctrico que contraria a continuação indefinida deste processo. Atinge-se, então, um estado de equı́librio dinâmico, em que no interior do metal está definido um campo eléctrico que se manifesta como uma diferença de potencial entre as duas extremidades, sendo a mais quente a de potencial mais elevado. Este fenómeno tem o nome de efeito de Seebeck. Outro efeito termoeléctrico interessante manifesta-se nos pontos de contacto de dois metais com densidades de electrões de condução diferentes. Numa junção de dois metais diferentes, verifica-se, naturalmente, um processo de difusão dos electrões de condução do metal com maior concentração electrónica para o outro. Mas, assim, aquele metal fica com deficiência de electrões, ou seja, carregado positivamente. Inversamente, o metal que recebe o fluxo electrónico deste processo de difusão fica carregado negativamente (ver a Figura 5.4). Mais uma vez, o campo eléctrico criado nA V Vc A ++ − − + + − −e Vc nB A nA > nB B Figura 5.4: Potencial de contacto na junção de dois metais com diferentes concentrações electrónicas nA e nB e gráfico (à direita) do potencial electrostático na zona da junção. por esta redistribuição de cargas contraria a sua contiuação indefinida, estabelecendo-se um estado de equilı́brio dinâmico em que o gradiente da concentração electrónica (que favorece a continuação do processo de difusão) é compensado pelo campo eléctrico resultante. Chama-se potencial de contacto à diferença de potencial associada a este campo eléctrico. A grandeza do potencial de contacto depende das concentrações de carga resultantes deste processo de migração electrónica. Ou seja, o potencial de contacto é tanto maior quantos mais electrões tiverem sido difundidos do metal com maior concentração electrónica para o outro. Ora, quanto maior a temperatura, maior a energia cinética média dos electrões de condução, logo, maior o número de electrões com energia suficiente para ultrapassarem a barreira de potencial na junção. Ou seja, quanto maior a temperatura, maior o potencial de contacto na junção dos dois metais. Este efeito é aproveitado para a construcção de termómetros, chamados termómetros de termopar. Um esquema simplificado da construcção destes termómetros encontra-se representado na Figura 5.5. Basicamente, estes termómetros consistem num circuito constituı́do por dois ramos de metais diferentes. Nas duas junções (A e B, no esquema da figura) estabelecem-se potenciais de contacto diferentes se as suas temperaturas forem diferentes. Uma das junções deve ficar a uma temperatura conhecida, por exemplo, mergulhada numa mistura de água e gelo em equilı́brio térmico, ao passo que a outra é utilizada como sensor. Fica então definida uma força electromotriz no circuito, igual à diferença entre os dois potenciais de contacto, que é uma função crescente da diferença entre as temperaturas das duas junções. Esta força electromotriz é medida usando um voltı́metro, que interrompe um dos condutores, sendo necessário ter o cuidado, na utilização do termómetro, de assegurar que as duas junções para a ligação do voltı́metro (indicadas pelas letras C e D na figura) estão à mesma temperatura, para que se cancelem os seus potenciais de contacto. A existência do potencial de contacto na junção de dois metais diferentes tem ainda outro efeito interessante. Quando uma corrente atravessa a junção, as cargas que a compõem sofrem uma variação de energia, igual ao produto da sua carga pelo valor do potencial de contacto. VA B A C V D VB Figura 5.5: Termómetro de termopar. A tensão indicada pelo voltı́metro depende da diferença de temperatura das duas juções A e B. 66 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES Essa variação de energia, que numa junção é um aumento, na outra uma diminuição de energia, é fornecida ou absorvida pelo meio ambiente. Este fenómeno tem o nome de efeito de Peltier. Assim, um circuito constituı́do por dois metais diferentes no qual se estabelece uma corrente, funciona efectivamente como uma máquina térmica, absorvendo calor numa das junções e libertando-o na outra. 5.2.5 Balanço do modelo de Drude Estudámos algumas propriedades dos metais à luz de uma teoria clássica de electrões livres. Muitas outras caracterı́sticas poderiam ter sido estudadas, por exemplo, a condutividade térmica. Não o fizemos porque estamos já em condições de avaliar o modelo. O modelo permite explicar qualitativamente a lei de Ohm e a dependência da condutividade com a temperatura, bem como alguns efeitos termoeléctricos, nomeadamente o de Seebeck e o de Peltier, mas falha redondamente no que concerne ao calor especı́fico da nuvem electrónica. Não consegue descrever o comportamento dos semi-condutores, cuja condutividade aumenta com a temperatura, em geral. Não consegue, também, dar conta dos valores positivos para o coeficiente de Hall apresentados por alguns metais, nem justificar fisicamente os valores do livre caminho médio dos electrões de condução, notoriamente elevados a baixas temperaturas. Vamos de seguida verificar se é possı́vel resolver estas deficiências do modelo de electrões livres através de um tratamento quântico dos electrões. 5.3 O modelo de Sommerfeld O modelo de Drude é uma teoria clássica de electrões livres, isto é, os electrões são tratados como pequenas esferas rı́gidas idênticas mas distinguı́veis umas das outras. No entanto, apresentando os electrões um comportamento eminentemente quântico, este tratamento não se pode considerar correcto. Vamos agora estudar o gás de electrões livres usando o formalismo da Mecânica Quântica. Veremos que as principais diferenças relativamente ao modelo clássico têm origem nas particularidades estatı́sticas dos objectos quânticos, e, mais em particular, dos fermiões, classe de partı́culas que engloba os electrões. A classe dos fermiões é constituı́da pelas partı́culas com momento angular intrı́nseco (ou spin) semi-inteiro (isto é, 1/2, 3/2, etc.) e que satisfazem o Princı́pio de Exclusão de Pauli, segundo o qual dois fermiões idênticos não podem ocupar simultaneamente o mesmo estado quântico(e) . O Princı́pio de Exclusão de Pauli é incompatı́vel com a distribuição de Maxwell-Boltzmann, verificando-se antes que os fermiões satisfazem uma distribuição diferente (sendo a diferença particularmente notória a baixas temperaturas), com o nome de distribuição de Fermi-Dirac. 5.3.1 Estados electrónicos Os estados quânticos dos electrões são obtidos resolvendo a equação de Schrödinger independente do tempo, h̄2 2 − ∇ φ (~r) + V (~r)φ (~r) = εφ (~r) , (5.20) 2m onde φ (~r) é a parte da função de onda que depende da posição dos electrões, V (~r) é a sua função ~ é o operador de energia potencial, ε é a energia do estado definido pela função de onda φ e ∇ gradiente, que, como é bem sabido, é dado por ~ ∇ ∇2 ∂ ∂ ∂ + ~ey + ~ez , ∂x ∂y ∂z ∂2 ∂2 ∂2 + 2 + 2, 2 ∂x ∂y ∂z = ~ex = (e) Note-se que se trata aqui de estados quânticos e não de nı́veis de energia. Se dois estados estados quânticos diferentes apresentam um mesmo valor de energia electrónica, então esse nı́vel pode estar ocupado por dois electrões. 5.3. O MODELO DE SOMMERFELD 67 usando coordenadas cartesianas. Uma vez que neste tratamento os electrões são considerados livres, a sua energia potencial deve ser constante(f) , e podemos escolhê-la igual a zero. Assim, a equação (5.20) reduz-se a h̄2 2 ∇ φ (~r) + εφ (~r) = 0. (5.21) 2m As soluções desta equação são da forma ~ φ~k (~r) = Aeik·~r , (5.22) onde A é uma constante que é fixada impondo a normalização da função de onda, Z Z ~ ~ 2 ∗ dV φ (~r) φ (~r) = |A| dV e−ik·~r eik·~r V V = 2 |A| V = 1, de onde resulta, escolhendo A real 1 A= √ . V (5.23) Substituindo (5.22) em (5.21), obtemos a relação entre a energia dos electrões e o seu vector de onda ~k, ou seja, a chamada relação de dispersão, ε~k = h̄2 k 2 . 2m (5.24) Comparando esta expressão com a correspondente clássica, ε = p2 /2m, concluı́mos que o momento de um electrão num estado φ~k é p~ = h̄~k. (5.25) A dependência espacial(g) da função de onda dos electrões é então 1 φp~ = √ ei~p·~r/h̄ . V (5.26) Resolvemos a equação de Schrödinger supondo que os electrões são livres. No entanto, esta suposição só é válida no interior do metal. Na sua superfı́cie, os electrões sentem uma força, de natureza electrostática, que os impede de sair. Impomos esta restrição na função de onda dos electrões através de condições fronteira que esta função deve satisfazer sobre a superfı́cie do metal. As condições que impomos são as chamadas condições fronteira periódicas, em que se obriga a função de onda a tomar valores iguais em pontos correspondentes de faces opostas do cristal. Se o cristal fôr suficientemente volumoso, esperamos que as conclusões a que chegarmos sejam relativamente independentes das condições fronteira escolhidas. Assim, impomos as seguintes condições às soluções da equação de Schrödinger(h) (ver Figura 5.6). 1 ~ φ~k (~r) = √ eik·~r V = = = 1 ~ √ eik·[(x+L)~ex +y~ey +z~ez ] V 1 i~k·[x~ex +(y+L)~ey +z~ez ] √ e V 1 i~k·[x~ex +y~ey +(z+L)~ez ] √ e , V (f) Ao nı́vel quântico, as forças são sempre conservativas, isto é, podem ser obtidas como o gradiente da energia potencial. Se a força é nula, a energia potencial é constante (g) A dependência temporal é, apenas, ξ(t) = exp (−iεt/h̄). (h) Para simplificar, consideramos o metal com forma cúbica, de aresta L. 68 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES de onde resultam as equações de quantização para o vector de onda, ~k, kx = ky = kz = 2π n L 2π m L 2π l, L (5.27) com n, m, l inteiros arbitrários. Só os vectores de onda ~k cujas componentes satisfazem (5.27) são permitidos para os electrões de condução no metal. Estes vectores definem uma rede cúbica simples, de parâmetro 2π/L. z Lx U= ∞ L z U=0 y L x y Figura 5.6: Poço de potencial tridimensional. A energia é nula dentro da caixa de dimensões Lx Ly Lz e infinito fora desta. Os estados quânticos dos electrões são identificados pelos valores das componentes do vector de onda ~k, e pela orientação do seu spin, que, neste caso(i) , só pode tomar dois valores, com os nomes “para cima” (ou up, do inglês) e “para baixo” (ou down). O princı́pio de exclusão de Pauli proı́be que dois fermiões idênticos ocupem o mesmo estado quântico, de forma que pode haver, no máximo, dois electrões com o mesmo vector de onda ~k: um com spin up, o outro com spin down. 5.3.2 A densidade de estados electrónicos Pretendemos agora determinar a densidade de estados electrónicos, isto é, pretendemos determinar a função g(ε) tal que o número de estados electrónicos com energia compreendida entre ε e ε + dε seja g(ε)dε. Para tal, começamos por notar que a “relação de dispersão”, ε = ε(k), é isotrópica, isto é, só depende do módulo do vector de onda; então o número de estados com energia compreendida entre ε e ε + dε é igual ao existente na camada esférica oca com raios k e k + dk correspondentes àqueles valores de energia; é agora fácil contar o número destes estados usando as equações de quantização (5.27). Vejamos, então. O volume da camada esférica oca de raios k e k+dk é 4πk 2 dk; o número de vectores de onda permitidos presentes nesta porção de espaço-k é aproximadamente igual à razão entre o seu volume e o volume ocupado por cada modo quântico, que, de acordo com a Eq. (5.27), é (2π)3 /V , onde V é o volume do cristal; finalmente, para cada vector de onda ~k há dois estados possı́veis, correspondentes às duas orientações do spin electrónico. O número de estados electrónicos com energia compreendida entre ε e ε + dε é então dn = 2× = V (i) Recorde-se que os electrões têm spin 1/2. 4πk 2 dk (2π)3 /V k2 dk. π2 (5.28) 5.3. O MODELO DE SOMMERFELD 69 A relação de dispersão (ou seja, a relação entre a energia e o vector de onda) é a expressa na Eq. (5.24), de onde obtemos por diferenciação dε = h̄2 k dk. m (5.29) Substituindo em (5.28) resulta dn = = V m k dε π 2 h̄2 V √ 3 2m ε dε, 2 π h̄3 (5.30) onde se usou (5.24) para substituir k. A função densidade de estados é, então, g(ε) = 5.3.3 V √ 3 2m ε. π 2 h̄3 (5.31) O estado fundamental de um gás de fermiões Vamos agora considerar o gás de fermiões no estado fundamental, isto é, no estado de menor energia. Antes de começar, é importante desfazer eventuais confusões de nomenclatura. Cada electrão no gás de fermiões ocupa um dado estado individual, caracterizado por um dado vector de onda ~k e uma dada orientação de spin, estado esse a que corresponde uma certa energia, ε, do electrão que o ocupa. O conjunto dos electrões de valência num metal define o gás de fermiões de condução, gás esse que também é caracterizado por estados, mas que são agora estados colectivos, no sentido em que as suas propriedades se podem determinar a partir das dos estados individuais ocupados por cada um dos electrões que formam o gás. O estado fundamental do gás de electrões é aquele que, de entre todos os estados possı́veis, apresenta o menor valor para a energia. Logo, neste estado, todos os electrões que formam a nuvem de condução devem ocupar estados individuais com uma energia o menor possı́vel. Do ponto de vista clássico, estes estados são aqueles em que os electrões se encontram imóveis e, portanto, apresentam o valor mı́nimo para a sua energia cinética (ou seja, zero. No entanto, quanticamente esta situação é impossı́vel. Com efeito, estando todos os electrões imóveis, todos apresentam vector de onda ~k = 0. Ora, já notámos que o princı́pio de exclusão de Pauli não permite mais do que dois electrões com o mesmo vector de onda, cada um com sua orientação de spin. O quadro clássico para o estado fundamental de um gás de electrões é pois, à luz da mecânica quântica, uma impossibilidade. Sendo assim, o estado fundamental de um gás de fermiões deve ser construido ocupando, com os electrões de condução, estados quânticos individuais de energias progressivamente mais elevadas, começando pelos de menor energia, até que todos os electrões de condução estejam desta forma “estacionados”. Uma vez que a energia dos estados electrónicos depende apenas do módulo do vector de onda, devemos, nesta construção, preencher primeiro estados caracterizados por vectores de onda de módulo menor. O conjunto dos estados electrónicos ocupados no estado fundamental de um gás de electrões define, no espaço-k, uma região com a forma de uma esfera: todos os estados electrónicos com módulo do vector de onda menor que um certo limiar kF estão ocupados; os restantes, com k > kF , apresentam-se desocupados. A esta esfera, que representa o estado fundamental de um gás de fermiões (neste caso, electrões de condução num metal), dá-se o nome de esfera de Fermi ; chama-se energia de Fermi ao valor da energia dos electrões que ocupam estados na superfı́cie da esfera de Fermi, e, evidentemente, relaciona-se com o raio de Fermi através de εF = h̄2 2 k ; 2m F (5.32) define-se ainda a temperatura de Fermi, através de TF = εF /kB , onde kB é a constante de Boltzmann, como sendo o valor da temperatura necessário para que um número apreciável de fermiões adquiram uma energia cinética comparável com a energia de Fermi. 70 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES Elemento Li Na Cu Au n(m−3 ) 4,68×1028 2,64×1028 8,40×1028 5,90×1028 εF (eV) 4,74 3,24 7,00 5,53 TF (K) 5,51×104 3,77×104 8,16×104 6,42×104 kF (m−1 ) 1,12×1010 0,92×1010 1,36×1010 1,21×1010 vF (m/s) 1,29×106 1,07×106 1,57×106 1,40×106 Tabela 5.2: Valores das grandezas “de Fermi” para alguns elementos. Os valores destas grandezas, que caracterizam o estado fundamental de um gás de electrões, podem ser todos calculados a partir do valor da densidade electrónica de condução, que, por seu turno, é facilmente estimável em situações concretas. O cálculo destas quantidades parte do facto de que o número de estados electrónicos no interior da esfera de Fermi é, por construção, igual ao número total de electrões de condução, N , presentes no metal. Usando a função densidade de estados, obtida na subsecção anterior, esta igualdade traduz-se por Z εF dε g(ε), (5.33) N= 0 já que no lado esquerdo temos o número total de electrões e, à direita, o número total de estados electrónicos ocupados. Substituindo na Eq. (5.33) o resultado da Eq. (5.31), obtemos N n≡ V √ = = Z √ 2m3 εF dε ε 3 2 π h̄ 0 p 3 2 2m ε3F , 3 π 2 h̄3 (5.34) onde se representou por n a densidade electrónica. Desta equação, podemos determinar o valor da energia de Fermi (supondo conhecido o valor da densidade electrónica), a partir do qual se calcula facilmente o valor de kF , TF , etc. Para a maioria dos metais, a energia de Fermi apresenta valores de cerca de alguns eV(j) . O estado fundamental do gás de electrões de condução só pode ser produzido experimentalmente a uma temperatura de zero Kelvin (ou muito próxima deste limite) uma vez que, a temperaturas mais elevadas a agitação térmica dos átomos pode comunicar energia à nuvem electrónica, excitando alguns electrões para fora da esfera de Fermi. 5.3.4 O gás de electrões de condução à temperatura ambiente O estado fundamental do gás de electrões que acabámos de descrever só pode ser produzido à temperatura de zero kelvin uma vez que, a temperaturas mais elevadas, os átomos do sólido estão animados de movimentos de vibração que podem, através de colisões, excitar alguns electrões para fora da esfera de Fermi. A uma temperatura T , a energia disponı́vel para, deste modo, excitar electrões é da ordem de grandeza da energia dos movimentos atómicos que, sabêmo-lo já, é de cerca de kB T , de acordo com o princı́pio de equipartição de energia. À temperatura ambiente, T ' 300 K e kB T ' 0,03 eV, ou seja, cem vezes menos do que os valores tı́picos da energia de Fermi, como se pode constatar de uma leitura da Tabela 5.2. Mas, se assim é, apenas aqueles electrões que ocupam estados muito próximos da superfı́cie de Fermi (aqueles cuja energia difere de εF por menos do que kB T ) podem ser excitados, já que os restantes (profundamente “enterrados” na esfera de Fermi) iriam, após a excitação, ocupar estados já ocupados, o que é impossı́vel nos termos do princı́pio de exclusão de Pauli. À temperatura ambiente, a configuração da nuvem electrónica no espaço-k consiste ainda numa esfera (como a 0 K), mas que apresenta um ligeiro (j) 1 eV (lê-se electrão-Volt) é a energia adquirida por um electrão acelerado por uma diferença de potencial de 1V, ou seja, 1 eV' 1, 6 × 10−19 J. 5.3. O MODELO DE SOMMERFELD 71 “esboroamento” da sua superfı́cie, sendo possı́vel encontrar estados desocupados no seu interior e, em igual número, estados ocupados no exterior. Este facto marca a principal diferença relativamente ao tratamento clássico da nuvem electrónica, e iremos mais adiante abordar as suas consequências. 5.3.5 A distribuição de Fermi-Dirac À temperatura de zero Kelvin, todos os estados electrónicos com energia inferior ou igual à energia de Fermi estão ocupados. A probabilidade para que um estado de energia ε esteja ocupado é então, para T = 0 K e à parte uma constante de normalização, ½ 1, se ε ≤ εF fT =0 K (ε) = (5.35) 0, se ε > εF . À temperatura ambiente, em contrapartida, da discussão precedente concluı́mos que quase todos os estados quânticos com energia baixa (quando comparada com a do nı́vel de Fermi) estão ocupados; a fracção de estados ocupados só decresce sensivelmente em nı́veis com energia muito próxima de εF , numa região com largura aproximadamente igual a kB T . Pode mostrar-se (mas não o faremos aqui) que a função que descreve esta situação é a chamada função de distribuição de Fermi-Dirac, fT (ε) = 1 e(ε−µ)/kB T +1 , (5.36) onde µ é o potencial quı́mico do sistema. O limite da distribuição de Fermi-Dirac quando T → 0 deve ser a expressão (5.35), e podemos então concluir que lim µ = εF . (5.37) T →0 Quando a temperatura sobe, o valor do potencial quı́mico decresce ligeiramente; mas, mesmo à temperatura ambiente, o seu valor mantém-se muito aproximadamente igual ao da energia de Fermi. Por esta razão, não é, frequentemente, feita qualquer distinção entre os dois. Na Figura 5.7 está representada a forma da função de distribuição de Fermi-Dirac para T = 0 K e para temperaturas não nulas. 1 6000 3000 600 0 K K K K 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 Figura 5.7: Gráfico da função de distribuição de Fermi-Dirac, para T = 600 K (a tracejado), T = 3000 K (a pontilhado) e T = 6000 K (a cheio). O valor da energia de Fermi usado neste exemplo foi de εF = 5 eV. O facto de apenas alguns electrões serem excitados quando, partindo do estado fundamental, se aquece o gás de electrões de condução até à temperatura ambiente, tem, como deve ser evidente, 72 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES f(ε) g(ε) T=0K f(ε) g(ε) T=0K T>0K 0 ε F ε 0 ε F ε Figura 5.8: Distribuição energética dos electrões à temperatura do zero absoluto (esquerda) e a uma temperatura elevada (à direita). um efeito determinante sobre o calor especı́fico da nuvem electrónica. Com efeito, a energia total (da nuvem electrónica) não deve, neste aquecimento, aumentar tanto quanto o previsto usando o tratamento clássico, baseado na função de distribuição de Maxwell-Boltzmann. O número de electrões que ocupam estados excitados à temperatura ambiente representa uma fracção tão pequena do total, que a energia do gás de electrões de condução difere muito pouco da do estado fundamental do gás. A contribuição principal para o calor especı́fico dos metais a temperaturas não excessivamente altas é então a fornecida pela rede de iões e portanto verifica-se, mesmo para metais, a lei de Dulong e Petit. No estado fundamental do gás de electrões, todos os estados electrónicos com energia menor do que a energia de Fermi estão ocupados, e todos os que têm energia superior à energia de Fermi estão desocupados. A distribuição energética dos electrões é então determinada apenas pela densidade de estados electrónicos: para energia inferiores à energia de Fermi a distribuição de energias é igual à densidade de estados, para energias superiores, anula-se. Esta situação é representada na Figura 5.8, à esquerda. A uma temperatura finita, os electrões próximos da superfı́cie de Fermi podem sofrer excitações, ficando então alguns estados desocupados abaixo do nı́vel de Fermi, e alguns estados ocupados com energia superior à energia de Fermi (ver a Figura 5.8, à direita). 5.3.6 A condutividade eléctrica Como acabámos de discutir, os electrões mais profundamente “enterrados” na esfera de Fermi estão congelados, no sentido em que não podem, à temperatura ambiente, sofrer excitações de origem térmica. Vimos que, por esta razão, a nuvem electrónica contribui muito pouco para o calor especı́fico dos metais. Poder-se-ia pensar que este “congelamento” impede também a nuvem electrónica de contribuir para a condutividade eléctrica, já que, também aqui, é necessário que pelo menos alguns electrões sejam excitados. Com efeito, na ausência de campos eléctricos externos e no estado fundamental, a distribuição das velocidades electrónicas tem simetria esférica, ou seja, dado um qualquer electrão com velocidade ~v (vector de onda ~k), existe outro com velocidade −~v (vector de onda −~k) cuja contribuição para a corrente eléctrica anula a do primeiro. Como, no estado fundamental, todos os electrões estão desta forma “emparelhados”, a corrente total é nula. Para que se verifique condução eléctrica é pois necessário que (pelo menos) alguns electrões sofram uma transição para um estado “desemparelhado”, no exterior da esfera de Fermi. Como o número de electrões em estados com energia acima da do nı́vel de Fermi aumenta com a temperatura, poderı́amos pensar que também a condutividade eléctrica dos metais seria maior a temperaturas maiores, tomando valores muito baixos para temperaturas próximas do zero absoluto. Ora, esta conjectura contraria flagrantemente os dados experimentais. A condutividade dos metais é, regra geral, uma função decrescente da temperatura. Na discussão acima, cometemos o erro de supor que a população electrónica dos estados exteriores à esfera de Fermi tem apenas origem térmica, isto é, que apenas por absorção de energia vibracional da rede cristalina se podem promover transições electrónicas. Isto é evidentemente 5.3. O MODELO DE SOMMERFELD 73 errado! São possı́veis trocas de energia com um campo eléctrico externo, que contribuem determinantemente para a população de electrões em estados “desemparelhados”. Um campo eléctrico externo muda o estado de todos os electrões na nuvem de condução, comunicando-lhes uma aceleração oposta à direcção do campo (recordemos que a carga dos electrões é negativa). Este efeito, conjugado com a possibilidade de colisões com a rede cristalina, com defeitos, com fonões, tem como resultado que cada electrão atinge uma velocidade limite, e a diferença (vectorial) entre este limite e a velocidade inicial é a mesma para todos os electrões. Dada a relação entre as velocidades ~v e os vectores de onda ~k dos electrões, tudo se passa como se a esfera de Fermi, inicialmente centrada na origem do espaço-k, sofresse um deslocamento ~δ na direcção oposta à do campo aplicado (ver a Figura 5.9). ky ky kx kx E Figura 5.9: À esquerda, a esfera de Fermi na ausência de campo eléctrico. Os estados ocupados (zona sombreada) apresentam, no espaço-k simetria esférica e portanto a velocidade média, tomada para todos os electrões, é nula. À direita, a esfera de Fermi quando se aplica um campo eléctrico. O conjunto dos estados presentes na zona cinzento-claro apresenta um valor médio da velocidade nulo; os estados na região indicada a cinzento-escuro, que também estão ocupados, contribuem todos para a corrente eléctrica. Se designarmos por τ o tempo médio de colisão, cada electrão vai sofrer uma modificação na (k) ~ ~ e uma sua velocidade de cerca de −eτ E/m , uma variação de momento (~ p = m~v ) de −eEτ ~ ~ variação de vector de onda (k = p~/h̄) de −eEτ /h̄, que deve agora ser o valor médio do vector de onda. Uma vez que todos os electrões vão sofrer esta transição de estado, o princı́pio de exclusão de Pauli não se aplica. ~ A densidade A média das velocidades dos electrões deve agora ser h~v i = h̄/mh~ki = −eτ /mE. ~ de corrente, j = ρh~v i = −neh~v i, vem então 2 ~ ~j = ne τ E, m onde n é o número de electrões de condução por unidade de volume. Comparando esta expressão ~ obtemos a forma da condutividade eléctrica: com a da lei de Ohm (~j = σ E), σ= ne2 τ . m Este foi o resultado obtido no estudo clássico (ver a Secção 5.2.2). Apesar das diferenças importantes entre as duas abordagens ao problema da condução eléctrica, a expressão da condutividade como função das caracterı́sticas do material em que se processa, apresenta a mesma forma nas descrições clássica e quântica. O livre caminho médio dos electrões de condução pode ser obtido multiplicando o módulo da sua velocidade pelo tempo médio de colisão. Por exemplo, para o cobre, σ = 5, 8 × 107 Ω− 1 m− 1 e n = 8, 4 × 102 8 m− 3, de onde resulta τ = 2, 5 × 10−14 s. A velocidade dos electrões que ocupam (k) Esta expressão é simplesmente a que resulta do estudo do movimento uniformemente acelerado de uma partı́cula ~ durante um intervalo de tempo τ . de massa m, sob a acção de uma força constante −eE, 74 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES estados no nı́vel de Fermi pode ser calculada a partir da densidade electrónica, n, obtendo-se vF = 1, 6 × 106 m/s. O livre caminho médio para um electrão no nı́vel de Fermi de um cristal de cobre é então λ ≈ 390 Å, ou seja, cerca de 100 vezes as distâncias interatómicas tı́picas! Vemos assim que o problema do livre caminho médio de que enfermava o modelo clássico de electrões livres não é eliminado nesta descrição quântica. De facto, este problema não é eliminado senão quando se consideram as interacções dos electrões de condução com a rede cristalina. 5.4 Crı́tica dos modelos de electrões livres Tanto o modelo clássico de Drude como o modelo quântico de Sommerfeld apresentam graves deficiências. À parte a questão do calor especı́fico dos metais (e algumas outras propriedades que não abordámos), os dois modelos apresentam inconvenientes semelhantes, alguns dos quais são: (a) Não fornecem explicação para a existência de metais com coeficientes de Hall positivos; (b) não descrevem correctamente a dependência da condutividade com a temperatura. Em particular, o caso de certos materiais cuja condutividade aumenta com a temperatura, em certos intervalos de temperatura; (c) nalguns condutores, a condutividade depende da orientação do campo eléctrico, facto incompreensı́vel numa teoria de electrões livres; (d) Os modelos de electrões livres não respondem à pergunta mais imediata: Porque é que alguns sólidos são condutores e outros não? Para responder a este e outros problemas, teremos que considerar as interacções entre os electrões de condução e a rede cristalina. De facto, os electrões nos sólidos não são livres e esperar que um modelo que os trate como tal seja capaz de descrever com exactidão todas as propriedades electromagnéticas dos sólido é certamente optimismo em demasia. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulos 1, 2 e 3 (F5.0/339) • C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 6 (F5.0/82) • Blakemore, “Solid State Physics” (1985), secções 3.1, 3.2, 3.3 (F5.0/181) • J. Brehm e W. Mullin, “Introduction to the Structure of Matter”, (1989) secção 12.3 (F5.0/437) PROBLEMAS 5.1 Relacione a probabilidade de colisão por unidade de tempo, γ, com o tempo médio de colisão τ . 5.2 Prove, a partir da definição de densidade de corrente, ~j = ρl~v , que a corrente total que passa através de uma superfı́cie S é igual ao fluxo de ~j através de S, Z ~j · n̂dS, i= S onde n̂ é um vector unitário que, em cada ponto da superfı́cie S, lhe é perpendicular. 5.3 Relacione kF com ²F com pF . 5. Problemas 5.4 Calcule a energia do estado fundamental de um gás de fermiões com N partı́culas ocupando um volume V . 5.5 Escreva a expressão da energia de um gás de fermiões num estado arbitrário. 5.6 A resposta ao Problema 4 é E = 3/5 N ²F onde N é o número total de fermiões no gás e ²F é energia de Fermi. Obtenha a expressão da pressão do gás de fermiões (p = ∂E/∂V ) e do módulo de compressibilidade (B = −V ∂p/∂V ) de um gás de fermiões no estado fundamental. 5.7 O lı́tio tem condutividade eléctrica de σ =1,05×107 Ω−1 m−1 e uma densidade atómica de 4,80×1028 átomos por metro cúbico. (a) Determine a velocidade de condução média dos electrões no metal quando se aplica um campo eléctrico de 100 V/m, e compare o valor obtido com a velocidade dos electrões no nı́vel de Fermi. (b) Determine a velocidade dos electrões cuja energia é igual à energia média dos electrões no cristal, segundo o modelo de Sommerfeld. (c) Determine a velocidade média dos electrões à temperatura de 300 K, segundo o modelo de Drude-Lorentz. 5.8 O sódio tem densidade de ρ =0,97×103 kg/m3 , uma massa atómica relativa de 23 e condutividade eléctrica de 2, 1 × 107 Ω−1 m−1 . Determine a mobilidade dos electrões no sódio. 5.9 A densidade do bário é de 3, 5 × 103 kg/m3 e a massa atómica relativa é 137. Sabendo que este elemento tem dois electrões de valência, determine o raio da esfera de Fermi e o valor da energia de Fermi correspondente. 5.10 A grafite é um cristal laminar em que os átomos de carbono estão distribuı́dos (para uma determinada camada) nos vértices de hexágonos regulares de lado d = 1, 42 Å, que se encaixam entre si. Os electrões de valência da grafite, à razão de um electrão por átomo, podem mover-se basicamente no dito espaço bidimensional. Suponha que estes electrões são livres. Usando o modelo de Sommerfeld para estas camadas bidimensionais, determine: (a) a densidade electrónica; (b) a densidade de estados, g(ε); (c) a energia de Fermi; (d) a energia espectável dos electrões à temperatura de zero Kelvin. 5.11 O estrôncio tem uma estrutura cúbica de faces centradas de aresta a = 6, 08 Å. (a) Usando o modelo de electrões livres de Sommerfeld determine o raio da esfera de Fermi no zero absoluto. (b) Determine a velocidade de um electrão com energia Fermi à temperatura de 0◦ , 30◦ e 300◦ Kelvin. Comente os resultados. (c) Determine a velocidade média de condução dos electrões quando sujeitos a um campo eléctrico de 2,5 V/cm, sabendo que a condutividade eléctrica do estrôncio a 20◦ C é de 1, 66 × 105 Ω−1 m−1 . 75 Capı́tulo 6 Metais II: Teoria de bandas Deve ser evidente que alguns inconvenientes (de entre os que foram apresentados no final do capı́tulo anterior) das teorias de electrões livres têm origem exactamente no facto de se considerarem os electrões “desligados” de quaisquer interacções com o meio onde se deslocam. Por exemplo, o facto de a condutividade da grafite depender da direcção da corrente mostra bem que deve existir alguma interacção entre os electrões e o cristal, que torna mais fácil o movimento em certas direcções que noutras. É também evidente que uma teoria de electrões livres só se pode aplicar a condutores, sendo portanto incapaz de explicar a razão de alguns sólidos o serem e outros não. Estas considerações são evidentes e poderiam ter sido feitas ainda antes de termos desenvolvido a teoria de electrões livres. Parece então natural que um modelo que tenha em linha de conta a influência do meio cristalino sobre os electrões possa resolver estas dificuldades. A teoria que vamos passar a descrever, não só clarifica estas questões, como explica as restantes, discutidas no Capı́tulo anterior, como os elevados valores do livre caminho médio a baixa temperatura ou as colocadas pela existência de sólidos cuja condutividade aumenta com a temperatura, que apresentam coeficientes de Hall positivos, etc. 6.1 Introdução Nesta nova abordagem continuaremos a desprezar as interacções electrão-electrão. A razão principal para esta aproximação é a complexidade da teoria completa, que torna impraticável a sua resolução sem recorrer aos métodos, aproximados, da teoria quântica de muitos corpos. Com efeito, o problema é o seguinte: queremos determinar a função de onda dos electrões, resolvendo a Equação de Schrödinger. Mas antes temos que determinar o potencial a que os electrões estão sujeitos. Ora, considerando interacções electrão-electrão, só podemos conhecer o potencial depois de conhecida a função de onda do sistema, justamente o que se pretendia obter com a resolução da Equação de Schrödinger. Considerando, além disso, que a função de onda deve depender das 3N coordenadas de posição dos N electrões, sendo N da ordem de 1020 , fica-se com uma ideia da complexidade do problema. Felizmente, o modelo que iremos desenvolver é notavelmente preciso, demonstrando-se assim, a posteriori, que as interacções electrão-electrão são, de facto, pouco significativas na maior parte das aplicações(a) . Não considerando as interacções electrão-electrão, apenas as interacções com a rede cristalina contribuem para a energia potencial dos electrões. Cada electrão move-se numa região onde está definida uma função de potencial independente dos restantes electrões. A este tipo de aproximação para sistemas de muitos corpos dá-se o nome de aproximação de partı́cula única, ou de partı́culas independentes. Uma vez que a rede cristalina é, em primeira aproximação, um arranjo periódico tridimensional de átomos, o potencial electrónico por ela estabelecido também deve ser periódico, com a mesma periodicidade da rede. Uma vez que a força entre cargas de sinal contrário (os electrões e os (a) Uma excepção importante desta afirmação é o caso da supercondutividade. 77 78 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS iões que formam a rede) é atractiva, o potencial electrónico deve apresentar mı́nimos nas posições ocupadas pelos iões, como se mostra na Figura 6.1, numa representação unidimensional. V(x) x a a a Figura 6.1: Exemplo de potencial periódico unidimensional. A resolução da Equação de Schrödinger com um potencial periódico fica substancialmente simplificada pelo teorema de Bloch, que demonstramos na secção seguinte. Antes de o fazermos, podemos estudar de forma qualitativa a deformação das orbitais atómicas quando aproximamos vários átomos uns dos outros. Quando os átomos estão afastados uns dos outros, os electrões atómicos praticamente não sentem interacções senão com o átomo a que pertencem, e portanto as orbitais são essencialmente as previstas pela fı́sica atómica: um conjunto de nı́veis energéticos designados pelos sı́mbolos 1s, 2s, 2p, etc(b) . Um esquema destes nı́veis está representado na Figura 6.2. Se aproximarmos deste átomo um outro, idêntico, cada um destes nı́veis subdivideE V(x) 2p 2s 1s x Figura 6.2: Nı́veis de energia atómicos. se em dois, sendo a separação tanto maior quanto maior for a energia do nı́vel original (ver Figura 6.3). Se aproximarmos 3 átomos cada nı́vel subdivide-se em 3 e assim sucessivamente. Se considerarmos agora um cristal, que consiste num número elevado de átomos na vizinhança uns dos outros, cada nı́vel atómico subdivide-se em tantos subnı́veis quantos forem os átomos que formam o cristal. Estes subnı́veis estão tão próximos (em termos energéticos) uns dos outros que não é possı́vel detectar a sua separação. Cada nı́vel subdivide-se então um número enorme de vezes, criando assim uma banda de energias permitidas, como mostra a Figura 6.4. Este desdobramento dos nı́veis atómicos pode ser ilustrado usando a teoria da perturbações. Outra alternativa é a resolução da Equação de Schrödinger numericamente (usando métodos que estão descritos em qualquer livro de análise numérica) para uma partı́cula com uma energia potencial com uma série de mı́nimos dispostos contiguamente. É importante notar que neste desdobramento das orbitais atómicas não varia o número total de estados electrónicos. Com efeito, quando se aproximam dois átomos da mesma espécie quı́mica, cada orbital atómica divide-se em duas orbitais moleculares, mas inicialmente temos dois átomos, cada qual com o seu conjunto de orbitais atómicas, e no fim temos apenas uma molécula. As (b) Usou-se a notação espectroscópica (a mais habitual) para indicar os estados electrónicos. O número inteiro representa o número quântico principal; a letra que o segue representa o momento angular, de acordo com s → l = 0; p → l = 1; d → l = 2; etc. Assim, o estado 2p é o estado com número quântico principal n = 2 e número quântico de momento angular l = 1. 6.2. O TEOREMA DE BLOCH 79 E V(x) 2p 2s 1s Figura 6.3: Nı́veis de energia numa molécula biatómica. E V(x) 2p 2s 1s Figura 6.4: Bandas de energia num cristal. duas orbitais moleculares correspondentes a cada nı́vel atómico podem ver-se como combinações lineares das duas orbitais atómicas (uma de cada átomo) que as originam. Na Figura 6.4, os electrões que ocupam as bandas 1s e 2s estão localizados na proximidade dos átomos a que pertencem, porque as suas energias não são suficientes para ultrapassar as barreiras de potencial entre os átomos (estamos a desprezar a possibilidade de efeito de túnel). Os electrões da banda 2p podem mover-se ao longo do cristal, mas não se deve pensar por isso que estão livres de forças; uma partı́cula livre pode ter qualquer energia(c) , ao passo que estes electrões têm uma energia que deve estar compreendida entre os limites da banda a que pertencem. Um análogo clássico do movimento destes electrões consiste numa esfera movendo-se num terreno ondulado, com energia suficiente para vencer a altura das ondulações do terreno. No estado fundamental (à temperatura de 0 K), somente as bandas de menor energia estão ocupadas pelos electrões; destas, a de maior energia tem particular importância para o estudo das propriedades dos sólidos, e designa-se por banda de valência do sólido. Esta designação é herdada do nome da orbital atómica (chamada orbital de valência) que lhe dá origem. Vamos agora estudar as propriedades das funções de onda de electrões que se movem num potencial periódico. 6.2 O teorema de Bloch Já referimos que a função energia potencial dos electrões, sendo resultante da sua interacção com o meio cristalino, deve ser uma função periódica do espaço, com o mesmo perı́odo do cristal. A Equação de Schrödinger independente do tempo é então − h̄2 ~ 2 ∇ ψ(~r) + V (~r)ψ(~r) = εψ(~r), 2m (6.1) (c) Descontando o efeito de quantizações resultantes da imposição de condições fronteira que, de resto, é insignificante, neste contexto. 80 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS onde V (~r) é uma função periódica com a periodicidade da rede cristalina. O teorema de Bloch afirma que as soluções da Eq. (6.1) têm a forma(d) ~ ψ~k (~r) = eik·~r u~k (~r), (6.2) onde u~k (~r) é uma função periódica do cristal, isto é, que verifica ~ = u~ (~r), u~k (~r + R) k (6.3) ~ Um enunciado equivalente do teorema de Bloch é qualquer que seja o vector da rede cristalina R. o seguinte: as soluções da Equação de Schrödinger para potenciais cristalinos verificam a condição ~ ~ ~ = eik·R ψ~ (~r), ψ~k (~r + R) k (6.4) ~ É evidente que funções com a forma definida na qualquer que seja o vector da rede cristalina R. Eq. (6.2) gozam desta propriedade. Com efeito, ~ ψ~k (~r + R) = ~ ~ ~ ~ ~ ~ ~ eik·~r eik·R u~k (~r + R) = eik·~r eik·R u~k (~r) = eik·R ψ~k (~r). ~ ~ Para demonstrar a implicação inversa, notamos que é possı́vel escrever qualquer função (e, portanto, também as soluções da Equação de Schrödinger) na forma ~ ψ~k (~r) = eik·~r f (~r), desde que se escolha convenientemente a função f (~r). Mas então ~ ~ ~ + ~r) = eik·(R+~r) f (R ~ + ~r). ψ~k (R (6.5) Por outro lado, aceitando a propriedade enunciada na Eq. (6.4), temos ~ + ~r) = ψ~k (R = = ~ ~ eik·R ψ~k (~r) ~ ~ ~ eik·R eik·~r f (~r) e ~ r) i~ k·(R+~ f (~r). (6.6) (6.7) ~ = f (~r), qualquer que seja o vector da Comparando as eqs. (6.5) e (6.7) concluı́mos que f (~r + R) ~ ou seja, que f apresenta a periodicidade da rede cristalina exigida na Eq. (6.3). rede cristalina R, Agora que demonstrámos a equivalência dos dois enunciados do Teorema de Bloch, vamos passar à sua demonstração. Dada a periodicidade do arranjo atómico nos cristais (ideais), todas as funções da posição fisicamente observáveis devem apresentar a mesma periodicidade. A função de onda dos electrões não é uma função fisicamente observável, e por isso não é, necessariamente, ~ um vector da rede cristalina, não podemos garantir a uma função periódica. Assim, sendo R ~ = ψ(~r); podemos é, sem qualquer perda de generalidade, escrever igualdade ψ(~r + R) ~ = s(R)ψ(~ ~ ψ(~r + R) r), (6.8) ~ Em contrapartida, o quadrado do módulo da função escolhendo cuidadosamente a função s(R). de onda é, de acordo com a interpretação de Max Born, igual à densidade de probabilidade de presença do electrão, ou seja, é uma função fisicamente observável. Logo, de acordo com o que se (d)~ k é um parâmetro vectorial que identifica o estado electrónico. Ao contrário do parâmetro ~k que identifica os estados de electrões livres que temos estudado até agora, este não é proporcional ao momento linear dos electrões de Bloch. 6.2. O TEOREMA DE BLOCH 81 disse acima, deve ser uma função periódica da posição com a periodicidade da rede, isto é, deve verificar(e) ~ ~ = ψ ∗ (~r)ψ(~r). ψ ∗ (~r + R)ψ(~ r + R) (6.9) Substituindo aqui a Eq. (6.8), resulta que o quadrado do módulo da função s é unitário, qualquer ~ Logo, esta função tem necessariamente a forma que seja o vector de rede R. ~ ~ = eiχ(R) , s(R) ~ é alguma função escalar real de R. ~ Tomando então o caso particular R ~ = ~a, onde ~a é onde χ(R) um dos vectors fundamentais da rede cristalina, temos ψ(~r + ~a) = eiχ(~a) ψ(~r). Da mesma maneira, ψ(~r + 2~a) = ψ(~r + ~a + ~a) = eiχ(~a) ψ(~r + ~a) = e2iχ(~a) ψ(~r) ou seja ainda, com n inteiro arbitrário, ψ(~r + n~a) = einχ(~a) ψ(~r). Considerando agora deslocamentos nas direcções dos outros vectores fundamentais (~b e ~c), e repetindo os mesmos argumentos que se aplicaram até agora, podemos concluir que a relação entre os valores da função de onda em pontos equivalentes do cristal é ~ ~ = ei[hχ(~a)+kχ(b)+lχ(~c)] ψ(~r), ψ(~r + R) (6.10) ~ isto é, se tem onde os inteiros h, k, l são as componentes cristalográficas do vector de rede R, ~ = h~a + k~b + l~c. R Demonstrámos até agora que as soluções da Equação de Schrödinger numa região onde está definido um potencial cristalino se transformam, sob translacções segundo vectores de rede de acordo com a Eq. (6.10). Os valores das três quantidades χ(~a), χ(~b), χ(~c) distinguem as diferentes soluções entre si. Estas três quantidades podem podem ser usadas para definir as componentes de um vector ~k, através de ~k · ~a = ~k · ~b = ~k · ~c = χ(~a) χ(~b) χ(~c). ~ e a Eq. (6.10) fica Assim, a soma hχ(~a) + kχ(~b) + lχ(~c) pode escrever-se simplesmente como ~k · R, ~ ~ ~ = eik·R ψ(~r), ψ(~r + R) (6.11) em conformidade com o segundo enunciado do teorema de Bloch, concluindo-se assim a sua demonstração. A forma das funções de onda de electrões que se movem num cristal, apresentada na Eq. (6.2), ~ é a de ondas planas monocromáticas eik·~r , moduladas por funções com a periodicidade cristalina u~k (~r). Na Figura 6.5 apresenta-se um exemplo das funções uk (x) e ψk (x), numa situação unidimensional. (e) O asterisco em ψ ∗ representa o complexo conjugado de ψ. 82 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS uk(x) -2a -a a 2a a 2a 0 ψk(x) -2a -a 0 Figura 6.5: Exemplo de função de Bloch. No gráfico de cima está representada a função moduladora uk (x), com perı́odo a; no de baixo representa-se a função de onda propriamente dita, ψk (x), (a cheio), bem como a onda plana modulada exp(ikx) (a tracejado). 6.3 6.3.1 Propriedades dos estados de Bloch Periodicidade no espaço recı́proco Como já se disse, as diferentes soluções da Equação de Schrödinger para os electrões num cristal distinguem-se pela forma como se transformam sob translacções segundo vectores da rede cristalina. Mais concretamente, distinguem-se pelas componentes do vector ~k, de acordo com a Eq. (6.4). ~ onde G ~ é Consideremos duas soluções particulares caracterizadas pelos vectores ~k e ~k 0 = ~k + G, um vector da rede recı́proca do cristal qualquer. Segundo o teorema de Bloch, estas duas funções ~ como de onda transformam-se sob translacções segundo o vector da rede R ~ ~ ~ = ψ~k (~r + R) eik·R ψ~k (~r) ~ = ψ~k0 (~r + R) eik ·R ψ~k0 (~r). ~0 ~ Explicitemos o vector ~k 0 nesta última equação. Resulta então ~ R ~ ~ = ei(~k+G)· ψ~k+G r + R) ψ~k+G r). ~ (~ ~ (~ ~ ~ Recordemos agora que, por definição de vector da rede recı́proca, se tem que eiG·R = 1, para todos ~ da rede recı́proca e para todos os vectores, R, ~ da rede directa. Então a função os vectores, G, tem, sob translacções segundo vectores de rede, um comportamento idêntico ao de onda ψ~k+G ~ da função ψ~k ; logo, estas duas funções são indistinguı́veis, ou seja, representam o mesmo estado electrónico. Para se evitar, no cálculo das propriedades da nuvem electrónica, a contabilização repetida da contribuição de um dado estado, devemos ter cuidado com este tipo de indistinguibilidade escondida das funções de onda. A forma mais simples de assegurar que não se cometem erros relacionados com esta questão é considerar apenas vectores ~k pertencentes todos a uma mesma célula unitária primitiva da rede recı́proca. Como se sabe, é sempre possı́vel escolher para qualquer rede uma grande diversidade de formas para as células unitária primitivas. Neste caso, escolhe-se sempre a célula de Wigner-Seitz (ver a Secção 2.2, e a Figura 2.3) da rede recı́proca, mais usualmente conhecida como primeira zona de Brillouin. Uma consequência importante da indistinguibilidade de dois estados de Bloch cujos vectores ~k diferem entre si por um vector da rede recı́proca é que todas as propriedades fı́sicas dos estados electrónicos devem ser funções periódicas de ~k, com a periodicidade da rede recı́proca. Com efeito, seja X(~k) o valor da propriedade X para um electrão num estado cuja função de onda é ψ~k ; uma ~ vez que o mesmo estado pode ser representado por qualquer das funções ψ~k+G ~ , com G vector arbitrário da rede recı́proca, o cálculo da propriedade X deve produzir o mesmo valor quando 6.3. PROPRIEDADES DOS ESTADOS DE BLOCH 83 realizado a partir de qualquer destas funções, isto é, ~ = X(~k), X(~k + G) 6.3.2 ~ vector da rede recı́proca. ∀G Nı́veis de energia dos estados de Bloch Substituindo na Equação de Schrödinger as soluções de Bloch da Eq. (6.2), obtemos a equação diferencial a satisfazer pelas funções u~k (~r), − i2 h̄2 h ~ ∇ + i~k u~k (~r) + V (~r)u~k (~r) = ε(~k)u~k (~r). 2m (6.12) Esta equação, formalmente semelhante à Equação de Shrödinger, é uma equação de valores próprios para o operador i2 h̄2 h ~ ∇ + i~k + V (~r), H~k = − 2m que depende de um parâmetro vectorial que é o vector ~k. Para cada valor de ~k, este operador deve apresentar um conjunto de funções próprias, u1~k (~r), u2~k (~r), . . ., un~k (~r), . . ., às quais correspondem os valores próprios (nı́veis de energia) ε1 (~k), ε2 (~k), . . ., εn (~k), . . ., e tanto aquelas como estes devem ser funções contı́nuas do parâmetro ~k. Mais ainda, como vimos na Secção 6.3.1, os diversos nı́veis de energia εn (~k) devem ser funções periódicas de ~k. Ora, funções contı́nuas e periódicas são necessariamente funções limitadas, pelo que devemos ter cada nı́vel de energia εn (~k) a tomar valores num intervalo bem limitado de energias. O espectro energético dos electrões num metal deve pois ter um aspecto que pode, qualitativamente, ser representado como mostra a Figura 6.6. Chama-se banda ao conjunto de estados electrónicos un~k (~r) para cada valor de n. Nesta figura ε n ε n n=3 ε 3k n=2 ε 2k n=1 ε 1k − π /a (a) π /a k (b) Figura 6.6: (a) Nı́veis de energia atómicos, resultantes da resolução da Equação de Schrödinger para um potencial atómico; (b) Bandas de energia dos estados electrónicos de um sólido. As bandas propriamente ditas são os intervalos representados a sombreado, ao longo do eixo da energia. As formas apresentadas para as funções εn (~k) são arbitrárias. apenas estão representados os valores de ~k pertencentes à primeira zona de Brillouin porque, como já vimos, vectores ~k fora desta região representam estados que já têm correspondência nalgum vector ~k no seu interior e portanto, neste sentido, são redundantes. Na Figura 6.6 as bandas de energia estão separadas por um intervalo de energias proibidas: esta situação corresponde ao que de facto se passa em muitos sólidos, mas é possı́vel (se bem que pouco frequente) que duas bandas de energia se sobreponham. Ao intervalo de energias proibidas entre duas bandas dá-se o nome de hiato energético, mas é mais usual a utilização da expressão, “aportuguesada” do inglês, “gap de energia”. 84 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS Dentro de cada banda, a energia dos estados electrónicos é uma função periódica do vector ~k. Esta função é, em geral, muito mais complicada do que a que caracteriza os estados de electrões livres. A sua forma depende da estrutura cristalina do sólido em que se movem os electrões, que está representada, na equação que define a energia [Eq. (6.12)], pelo termo correspondente ao potencial electrónico V (~r). Em geral, a energia de um estado depende também da direcção do vector k e não apenas do seu módulo, como acontece com os estados de electrões livres. Mas esta dependência não é de todo arbitrária. Vamos de seguida demonstrar que a energia é uma função par de ~k, isto é, que εn (~k) = εn (−~k). (6.13) Tomando o complexo conjugado da Eq. (6.12) e fazendo a substituição ~k → −~k obtemos − i2 h̄2 h ~ ∇ + i~k u∗n −~k (~r) + V (~r)u∗n −~k (~r) = εn (−~k)u∗n −~k (~r). 2m (6.14) onde u∗ representa o complexo conjugado de u(f) . Mas as eqs. (6.12) e (6.14) são idênticas e por isso as suas soluções devem ser as mesmas; logo, podemos concluir que u∗n−~k (~r) = un~k (~r) e, mais importante para o que nos interessa, εn (~k) = εn (−~k), como querı́amos demonstrar. 6.3.3 Momento linear As funções de onda de Bloch, ψ~k (~r), representam os estados estacionários de electrões que se movem numa região (o cristal) onde a sua energia potencial, que traduz as interacções com o meio, é uma função periódica da posição. A expressão “estados estacionários” significa que um electrão que ocupe um destes estados permanece nele enquanto não for perturbado por agentes externos ou por alterações do meio em que se move (defeitos no cristal, por exemplo). Estes estados distinguem-se entre si pelo parâmetro vectorial ~k, que está relacionado com a forma como se transformam sob translacções segundo vectores da rede. Isto é, o vector ~k (de que não conhecemos ainda o significado fı́sico) é uma constante do movimento de um electrão de Bloch no estado ψ~k . Por outro lado, o momento linear de um electrão de Bloch não deve ser uma constante do movimento, já que um electrão que se move numa região onde está definido um potencial periódico está sujeito a forças que se traduzem em acelerações, ou seja, em alterações do seu momento linear. Assim, não podemos identificar h̄~k com o momento linear dos electrões no estado de Bloch ψ~k , como fizemos no estudo dos electrões livres. Esta conclusão é ainda reforçada pela aplicação do operador quantidade de movimento ao estado ψ~k . De acordo com as regras da Mecânica Quântica, os estados caracterizados por valores bem determidados do momento linear são os estados próprios ~ = −ih̄∇. ~ Ora, com ψ~ dado pela Eq. (6.2), temos do operador associado a este observável, P k ³ ´ ~ ~ (~r) = ei~k·~r h̄~k − ih̄∇ ~ u~ (~r), Pψ k k expressão que não corresponde a uma equação de valores próprios. Assim, as funções de Bloch não são funções próprias do operador do momento linear e, portanto, um electrão num estado de Bloch não apresenta um valor bem determinado deste observável. No entanto, o vector h̄~k tem, como veremos já de seguida, um papel importante na dinâmica dos electrões de condução nos metais, muito semelhante ao do momento linear de electrões livres. Para realçar esta semelhança formal, dá-se o nome de momento linear cristalino de um electrão no estado de Bloch ψ~k ao vector h̄~k. Usaremos também a expressão “vector de onda cristalino” para nos referirmos ao vector ~k. (f) As r) = V (~ r) e ε∗n (~k) = εn (~k). energias são grandezas reais e por isso V ∗ (~ 6.3. PROPRIEDADES DOS ESTADOS DE BLOCH 6.3.4 85 Velocidade média e momento linear cristalino A expressão para o cálculo da velocidade de electrões livres, ~v = h̄~k/m, não pode ser adoptada para electrões em estados de Bloch, uma vez que o seu momento linear não é dado por p~ = h̄~k. Como já se disse, electrões em estados de Bloch não apresentam um momento linear bem determinado e, logo, o mesmo se passa com a velocidade. Podemos, quando muito, determinar os resultados possı́veis de uma medição da velocidade e as respectivas probabilidades e, a partir destes valores, calcular o valor expectável da velocidade. Um problema relacionado com este é o da determinação da velocidade de propagação de um sinal que não é caracterizado por um comprimento de onda bem determinado. Uma perturbação puramente sinusoidal (isto é, uma onda com comprimento de onda, λ, e frequência, ν, bem determinados) propaga-se no meio que a suporta com uma velocidade, chamada velocidade de fase, cujo módulo é ω v = λν = , (6.15) k onde se introduziram os parâmetros ω = 2πν e k = 2π/λ. A dificuldade do cálculo da velocidade de sinais não puramente sinusoidais é a seguinte. Consideremos um sinal não sinusoidal arbitrário f (x, t) (esta função pode, por exemplo, representar o som de um trovão). É possı́vel escrever a função f (x, t) como combinação linear de funções sinusoidais com diferentes frequências e comprimentos de onda, usando as técnicas da análise de Fourier. Descrevemos desta maneira o sinal em questão como a sobreposição de várias funções puramente sinusoidais. Cada uma destas componentes sinusoidais, caracterizada por valores bem determinados de k e de ω, tem uma velocidade de fase dada pela Eq. (6.15), mas as velocidades das diferentes componentes não são, em geral, todas iguais, logo, não podem ser identificadas com a velocidade da propagação do sinal. Em vez disso, identifica-se esta velocidade de propagação com a do ponto onde o sinal tem amplitude máxima. Este valor tem o nome de velocidade de grupo do sinal. Pode demonstrar-se que a velocidade de grupo é dada por dω vG = . (6.16) dk Note-se que para ondas puramente sinusoidais, a velocidade de fase é igual à de grupo. Voltemos agora ao problema que motivou esta pequena digressão, o problema da velocidade dos electrões em cristais. A velocidade média das partı́culas quânticas é, em geral, identificada com a velocidade de grupo da sua função de onda. Assim, dizemos que o valor expectável da velocidade de um electrão num estado de Bloch ψk é v(k) = dω(k) 1 d²(k) = , dk h̄ dk onde se usou a bem conhecida igualdade de Plank ² = h̄ω. Considerando agora o mesmo problema em três dimensões, Introduzimos o operador gradiente no espaço recı́proco, dado por grad~k ≡ î ∂ ∂ ˆ ∂ + ĵ + ~k , ∂kx ∂ky ∂kz sendo então a velocidade média dos electrões de Bloch dada por ~vG = grad~k ω(~k) = 1 grad~k ε(~k). h̄ (6.17) Esta velocidade de grupo, que identificamos com a velocidade dos electrões, representa o valor expectável do observável velocidade. É, assim, o valor médio da velocidade dos electrões nos estados de Bloch. Como é bem sabido, o gradiente de uma função tem a direcção em que é máxima a variação da função, perpendicular às suas superfı́cies de nı́vel. Logo, a velocidade de um electrão de Bloch, num estado com vector de onda cristalino ~k, é perpendicular à superfı́cie de nı́vel da energia nesse ponto ~k. Em particular, os electrões que se encontram na superfı́ce de Fermi têm uma velocidade que é perpendicular a essa superfı́cie (veja a Figura 6.7). 86 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS ky v k k kx v Figura 6.7: A velocidade, ~v , e o vector de onda cristalino ~k. A velocidade é, para cada estado ~k, ~ . perpendicular à superfı́cie de nı́vel da energia para esse valor de k. Um electrão num estado de Bloch, sujeito apenas à interacção com um cristal ideal, tem uma energia bem definida, constante do movimento. Contudo, se se definir no cristal, para além dos campos que que são intrinsecamente caracterı́sticos, um campo de forças externas, F~ , então o electrão adquire desse campo de forças energia, a uma taxa temporal dada por dε = ~v · F~ , dt (6.18) sendo ~v o vector velocidade média do electrão em estudo. Mas a velocidade média é uma função de ~k; logo, ∂ε dki dε = . dt ∂ki dt Adoptou-se aqui a covenção de soma sobre ı́ndices repetidos de Einstein, isto é, subentende-se uma soma para todos os valores do ı́ndice i = 1, 2, 3 no lado direito desta expressão. Esta convenção será adoptada daqui em diante, salvo indicações explı́citas em contrário. Substituindo esta expressão na Eq. (6.18), obtemos ∂ε dkj = ~v · F~ . ∂kj dt Usando agora a fórmula da velocidade [Eq. (6.17)], podemos reescrever a expressão acima como h̄vj dkj = vecv · F~ , dt ~v · d(h̄k) = ~v · F~ , dt ou ainda o que autoriza a identificação d F~ = (h̄~k). dt Esta equação é semelhante à que traduz a segunda lei de Newton, (6.19) d~ p F~ = , dt com o vector h̄~k a desempenhar o papel de momento linear dos electrões de Bloch. No entanto, voltamos a recordar que, para a taxa de variação do momento linear dos electrões no cristal contribuem as forças exteriores F~ , mas contribuem também as forças de interacção com o cristal de iões, forças essas que não são contabilizadas na Eq. (6.19). Assim, podemos considerar o vector h̄~k como uma espécie de momento linear efectivo dos electrões num cristal, conceito que permite algumas simplificações, já que apenas as forças exteriores ao cristal contribuem para a sua modificação. 6.3. PROPRIEDADES DOS ESTADOS DE BLOCH 6.3.5 87 Massa efectiva dos electrões de Bloch Consideremos agora um electrão de Bloch sujeito a uma força externa F~ . A aceleração que adquire por estar sob a acção desta força pode ser calculada como ai = dvi ∂vi dkj = . dt ∂kj dt Substituindo aqui a expressão da velocidade dos electrões de Bloch e da derivada do momento linear cristalino [respectivamente, as eqs. (6.17) e (6.19)], obtemos ai = 1 ∂2ε Fj . h̄2 ∂ki ∂kj (6.20) Esta expressão é muito parecida com a da segunda lei de Newton(g) e exprime a aceleração de um electão que se move num cristal como resultado apenas das forças que sobre ele actuam exteriores ao cristal, não considerando a influência das interações com o cristal. Este resultado é, obviamente, extremamente útil e prático, mas o preço a pagar por esta simplificação é a introdução de um parâmetro matricial variável que substitui a massa dos electrões de Bloch, chamado tensor da massa efectiva, que se representa por m∗ e é a matriz inversa da matriz −1 [m∗ ]ij = 1 ∂2ε . h̄2 ∂ki ∂kj (6.21) Um electrão move-se num cristal de forma bastante complicada, sujeito como está às forças exercidas pelos átomos que formam o cristal, mas acabámos de ver que podemos simplificar bastante o seu estudo, substituindo na lei do movimento a sua massa pelo tensor da massa efectiva, após o que basta apenas considerar, nas leis do movimento, as forças exteriores, como campos eléctricos aplicados, etc. Claro que a matriz da massa efectiva tem que apresentar algumas particularidades que não esperamos encontrar na massa dos objectos comuns. Por exemplo, em geral a aceleração de um electrão de Bloch não tem a direcção da força que a provoca. Além disso, a matriz da massa efectiva é variável, as suas componentes têm valores diferentes conforme a magnitude e a orientação do vector ~k. Assim, pode acontecer que dois campos de forças iguais, mas com orientações diferentes, produzam acelerações diferentes. Desta maneira, podemos explicar porque é que alguns sólidos (a grafite, p. ex.) apresentam condutividades que variam com a orientação da corrente eléctrica. É também possı́vel que, para valores particulares de ~k, algumas componentes (ou mesmo todas) do tensor da massa efectiva sejam negativas; nestes casos, campos aplicados numa direcção produzem correntes com direcções opostas... Já agora, é interessante verificar qual a forma do tensor de massa efectiva para electrões livres, situação que conhecemos melhor. O movimento de electrões livres é, de facto, apenas condicionado pelas forças exteriores ao cristal, uma vez que as forças internas são desprezadas. Então esperamos que a massa efectiva seja neste caso igual à massa real. De facto, a aplicação da Eq. (6.21) com a função energia de electrões livres, dada por h̄2 k 2 ε(~k) = , 2m permite obter o resultado 1 δij , m é o sı́mbolo delta de Kronecker, cujos elementos são os da matriz identidade, ½ 0, i 6= j δij = 1, i = j. −1 [m∗ ]ij = onde δij (g) As leis da Fı́sica Clássica, não têm nada que ser satisfeitas por electrões, poderão dizer. Assim é, de facto. Mas note-se que a aceleração ~a em (6.20) é a derivada do valor expectável da velocidade que, de acordo com o teorema de Ehrenfest, satisfaz uma expressão formalmente semelhante à lei fundamental da dinâmica de Newton. 88 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS −1 Assim, a matriz [m∗ ] é diagonal e todos os seus elementos são iguais, logo a sua inversa, que é o tensor da massa efectiva, é, simplesmente, [m∗ ]ij = mδij , como já esperávamos. 6.3.6 O livre caminho médio Vimos no capı́tulo anterior que é difı́cil entender os valores obtidos no quadro dos modelos de electrões livres para o livre caminho médio dos electrões, que considerámos demasiado elevado. Com efeito, nos modelos de electrões livres, supõe-se que os electrões de condução sofrem colisões com os iões que formam o cristal, mas os valores previstos para o livre caminho médio resultam ser centenas de vezes superiores à distância interatómica, para temperaturas próximas da temperatura ambiente. Este problema é resolvido no quadro da teoria de Bloch, mas devemos, antes de mais, clarificar o significado de colisão. Uma colisão entre dois corpos é uma alteração dos seus estados de movimento como resultado da interacção mútua. Classicamente, caracterizamos o estado de movimento de uma massa pontual através do seu momento linear; uma colisão entre dois corpos clássicos pontuais é pois um processo de influência mútua em que se alteram os seu momentos lineares. Nos modelos de electrões livres, o estado de um electrão é especificado pelo vector ~k, que é proporcional ao momento linear. As colisões destas partı́culas com os iões da rede provocam alterações no vector ~k, ou seja, na quantidade de movimento. Na mesma ordem de idéias, devemos aceitar que, na teoria de Bloch, a colisão de um electrão com o que quer que seja deve manifestar-se como uma alteração do seu estado, isto é, como uma alteração do vector ~k. Mas, já se disse, um electrão que ocupa, num cristal ideal, um estado de Bloch ψn~k (~r), permanece nesse estado se não se verificarem influências externas que o perturbem, porque os estados de Bloch têm já em linha de conta as interacções com a rede cristalina. Assim, neste sentido, os electrões de Bloch não sofrem colisões com os iões da rede. Podem, isso sim, modificar o seu estado, mas apenas por colisões contra as fronteiras do cristal, contra fonões (vibrações do cristal), contra impurezas, em suma, contra defeitos no cristal, qualquer que seja a sua natureza. Ora, os defeitos cristalinos estão muito mais afastados entre si do que os iões da rede, pelo que se percebem agora os elevados valores que obtivemos para o livre caminho médio dos electrões. A conclusão é a seguinte: tanto quanto se possa considerar o cristal como perfeito (isto é, absolutamente periódico), os electrões não sofrem modificação de estado, ou seja, colisões; estas devem ocorrer nas excepções à periodicidade, isto é, nos defeitos cristalinos. Os electrões de Bloch não sofrem colisões com os átomos regularmente dispostos no cristal, mas apenas com os defeitos no cristal, que estão mais afastados entre si que os átomos que o constituem. Por esta razão, o caminho livre médio dos electrões de condução deve ser muito maior do que as distâncias interatómicas tı́picas nos sólidos, em conformidade com os resultados obtidos no quadro dos modelos de electrões livres. 6.4 Modelo de Krönig-Penney (Nota: O estudo desta Secção não é indispensável para a compreensão do resto da matéria e pode ser omitido.) Vamos agora ilustrar o conteúdo das secções precedentes recorrendo a um modelo simples de cristal unidimensional, o modelo de Krönig-Penney. Este modelo descreve os estados de uma partı́cula quântica que se move numa região onde está definido um potencial que é uma sucessão de barreiras de potencial rectangular idênticas, regularmente espaçadas entre si (ver a Figura 6.8). Nós vamos usar uma versão particularmente simples do deste modelo, em que a largura, l, das barreiras tende para zero, enquanto a sua altura, V , cresce de maneira a manter constante o produto lV . No limite, cada barreira fica igual a uma função delta de Dirac(h) . A função potencial (h) A função delta só é diferente de zero num único ponto, mas o seu integral em qualquer intervalo que contenha 6.4. MODELO DE KRÖNIG-PENNEY 89 V(x) V x a l V(x) x -2a -a 0 a 2a Figura 6.8: Potencial do modelo de Krönig-Penney (em cima). Em baixo, o potencial usado neste trabalho: a largura, l, das barreiras diminui até zero, enquanto a sua altura, V , aumenta indefinidamente, de tal forma que o produto lV permanece constante. que vamos usar é, então, V (x) = ∞ h̄2 λ X δ(x − na), 2m a n=−∞ (6.22) onde λ é um parâmetro adimensional que pode ser usado para regular a intensidade do potencial cristalino. Podemos até estudar o limite de electrões livres escolhendo λ = 0. Este potencial é um caso particular dos potenciais contı́nuos por intervalos que se constumam estudar nas disciplinas de introdução à Mecânica Quântica. A resolução da Equação de Schrödinger nestes casos é feita separadamente em cada região de continuidade do potencial, impondo-se em seguida condições de continuidade da função de onda nos pontos em que o potencial é descontı́nuo. Vamos então dividir a recta real em regiões de continuidade da função potencial, que designaremos por R0 , R±1 , R±2 . . . , sendo Rn o intervalo (n − 1)a < x < na. Em qualquer destas regiões, a Equação de Schrödinger escreve-se como h̄2 d2 − ψ = ²ψ 2m dx2 e, para ² positivo, admite soluções do tipo (tomamos a região Rn para concretizar a discussão) ψ (n) (x) = Xn eikx + Yn e−ikx ou, equivalentemente (basta tomar An = Xn eikna , Bn = Yn e−ikna ), ψ (n) (x) = An eik(x−na) + Bn e−ik(x−na) . (6.23) Nestas expressões, k está relacionado com a energia do estado, ², através de k2 = 2m² . h̄2 (6.24) esse ponto é 1. Mais rigorosamente, a função delta define-se através das seguintes propriedades: Z δ(x − a) = 0, se x 6= a f (x)δ(x − a) = f (a), ∀² > 0. a+² a−² 90 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS Na região contı́gua Rn+1 , e usando as mesmas convenções, a função de onda escreve-se ψ (n+1) (x) = An+1 eik(x−[n+1]a) + Bn+1 e−ik(x−[n+1]a) . (6.25) A solução da Equação de Schrödinger é a união das diferentes funções ψ (n) , união essa que deve ser feita de modo a satisfazer certas condições de continuidade. Antes, porém, de estudarmos a continuidade da função de onda, devemos notar que, sendo o potencial uma função periódica da posição, estamos nas condições do teorema de Bloch. Logo, as soluções da Equação de Schrödinger devem satisfazer a condição ψq (x + a) = eiqa ψq (x), onde q é um parâmetro real, que caracteriza a função de onda particular ψq tal como os números n, l, ml , ms caracterizam as funções de onda de electrões atómicos. Note-se que esta condição envolve o valor da função de onda em diferentes células unitárias do nosso cristal unidimensional, ou diferentes regiões, de acordo com a designação que temos usado. Tomando x na região Rn , x + a pertence à região Rn+1 ; a condição de Bloch pode pois escrever-se como ψq(n+1) (x + a) = eiqa ψq(n) (x), ou seja, h i An+1 eik(x−na) + Bn+1 e−ik(x−na) = eiqa An eik(x−na) + Bn e−ik(x−na) . Agrupando potências com expoentes iguais, obtemos £ ¤ £ ¤ eik(x−na) An+1 − eiqa An + e−ik(x−na) Bn+1 − eiqa Bn = 0, que só pode ser satisfeita para todos os valores de x se se anularem os coeficientes das exponenciais, isto é, se An+1 = eiqa An (6.26) Bn+1 = eiqa Bn Faremos uso destas relações mais adiante. Vamos agora estudar as condições fronteira a satisfazer pela função de onda. Em primeiro lugar, a função de onda deve ser uma função contı́nua. Assim, num ponto x = na que é partilhado pelas regiões Rn e Rn+1 , devemos ter ψ (n) (na) = ψ (n+1) (na), ou seja, An+1 e−ika + Bn+1 eika = An + Bn . (6.27) Quando o potencial não tem descontinuidades infinitas, a derivada da função de onda é, também, uma função contı́nua, mas esse não é o caso aqui. Para deduzirmos a forma das condições fronteira a satisfazer pela derivada da função de onda, integremos a Equação de Schrödinger, − h̄2 d2 ψ + V (x)ψ(x) = ²ψ(x), 2m dx2 num pequeno intervalo centrado num ponto x0 , com largura 2δ. Temos então h̄2 − 2m Z x0 +δ x0 −δ d2 ψ + dx2 Z Z x0 +δ x0 +δ V (x)ψ(x)dx = ² x0 −δ ψ(x)dx. x0 −δ No limite em que δ → 0, o integral no segundo membro desta equação anula-se, porque a função de onda é contı́nua; o primeiro integral é fácil de calcular, por ser o integral de uma derivada. Resulta então "µ ¶ # µ ¶ Z x0 +δ dψ dψ h̄2 lim − + lim V (x)ψ(x)dx = 0, − δ→0 x −δ 2m δ→0 dx x0 +δ dx x0 −δ 0 6.4. MODELO DE KRÖNIG-PENNEY ou ainda µ dψ dx ¶ µ − x0 + dψ dx 91 ¶ x0 − 2m = 2 lim h̄ δ→0 Z x0 +δ V (x)ψ(x)dx, (6.28) x0 −δ onde (F )x0 ± representa o limite de F quando o seu argumento tende para x0 por valores superiores a x0 (sinal +) ou por valores inferiores a x0 (sinal -). Esta condição de continuidade para a derivada da função de onda tem validade geral, em problemas unidimensionais. No nosso caso, atendendo à forma particular do potencial, temos, para x0 = na, Z na+δ h̄2 λ ψ(x = na). V (x)ψ(x)dx = 2m a na−δ Por outro lado, as duas derivadas obtêm-se facilmente a partir das expressões [eqs. (6.23) e (6.25)] da função de onda nas duas regiões separadas pelo ponto de abcissa x = na: dψ (n) dx dψ (n+1) dx = ikAn eik(x−na) − ikBn e−ik(x−na) = ikAn+1 eik(x−[n+1]a) − ikBn+1 e−ik(x−[n+1]a) . Então, podemos escrever a condição geral da Eq. (6.28) como µ ¶ µ ¶ iλ iλ −ika ika An+1 e − Bn+1 e = An 1 − − Bn 1 + . ka ka (6.29) Usando agora a Eq. (6.26) para eliminar os coeficientes An+1 e Bn+1 das eqs. (6.27) e (6.29), obtemos o seguinte sistema de duas equações homogéneas: h i h i ei(q−k)a − 1 An + ei(q+k)a − 1 Bn = 0 ¸ · ¸ · iλ iλ i(q+k)a i(q−k)a An − e −1− Bn = 0. e −1+ ka ka Como qualquer sistema homogénio, este admite a solução trivial An = 0 = Bn = 0, ou seja, ψ = 0, que não nos interessa. Soluções não triviais verificam-se apenas quando o determinante da matriz formada com os coeficientes do sistema se anular. Após algumas manipulações algébricas, esta condição leva à seguinte equação transcendental: cos qa = cos ka + λ sin ka . 2 ka (6.30) Esta igualdade define uma relação entre o parâmetro q que caracteriza as diferentes soluções da Equação de Schrödinger e o parâmetro k que define a energia dessas soluções. Dado um valor de q “basta” resolver esta equação em ordem a k para obter a energia correspondente, usando a relação da Eq. (6.24). Infelizmente, esta relação entre k e q é transcendental, logo, não pode ser resolvida analiticamente. Além disso, para certos valores de k não é possı́vel verificá-la. Com efeito, o lado esquerdo está limitado ao intervalo [−1, 1]; logo, não podem existir soluções para todos os valores de k em que o lado direito saia deste intervalo. Na Figura 6.9 apresenta-se o gráfico da função no lado direito desta equação, assinalando-se as regiões em que não existem soluções não triviais. Como a energia de um estado depende do valor de k [ver a Eq. (6.24)], estes intervalos para os quais não há soluções da Equação de Schrödinger correspondem a hiatos de energia. Não há estados estacinários de uma partı́cula num potencial de Krönig-Penney com energia situada nesses intervalos proibidos. Como se disse, a igualdade da Eq. (6.30) relaciona a energia dos estados permitidos (através da interposta “pessoa” do parâmetro k) com o parâmetro q que os carateriza. Essa relação não pode ser explicitada analiticamente, porque a Eq. (6.30) é uma equação transcendental. No entanto, podemos tentar a seguinte abordagem numérica: dado um valor de q, variamos k (e, portanto, ²) 92 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS 4 3 2 1 x=ka 0 2 4 6 8 10 12 -1 Figura 6.9: Gráfico da função no segundo membro da Eq. (6.30). Para os valores da abcissa (x = ka) nas regiões sombreadas, não existem soluções da Equação de Schrödinger; correspondem aos gaps de energia. ε (k) ε (k) 3a banda 2a banda 1a banda - π/ a 0 q π/ a q - π/ a 0 π/ a Figura 6.10: Estrutura de bandas do modelo de Krönig-Penney. Notam-se claramente os hiatos energéticos. Para comparação, apresenta-se à direita a estrutura de “bandas” no modelo de electrões livres, obtida escolhendo λ = 0 no potencial da Eq. (6.22). A presença do potencial periódico abre os gaps, deformando ligeiramente a curva ²(q) na fronteira da zona de Brillouin e “empurrando” para cima os ramos superiores dessa curva. 6.5. NÚMERO DE ESTADOS POR BANDA 93 até que a diferença entre os valores dos dois lados da Eq. (6.30) seja menor que um determinado limiar, caso em que dizemos que a igualdade foi satisfeita. Usando este processo, muito rudimentar, foi possı́vel desenhar o gráfico da Figura 6.10. Escolheu-se para λ o valor λ = 2π. Note-se que, com λ = 0, o potencial é constante, pelo que o potencial de Krönig-Penney nesse caso é o de partı́culas livres. Nesse caso, a Eq. (6.30) fica simplesmente cos qa = cos ka, que tem como solução k = q, e a energia fica ² = h̄2 q 2 /2m, a expressão caracterı́stica de partı́culas livres, que também é apresentada na Figura 6.10. 6.5 Número de estados por banda A resolução de uma equação diferencial (como a de Schrödinger) não fica completa sem a imposição de condições a satisfazer pela solução particular requerida. Apesar de não resolvermos completamente a Equação de Schrödinger [ou a sua versão de Bloch (6.12)] é útil a imposição de condições fronteira, que reduzem número de estados de Bloch que é necessário considerar. Como no estudo dos modelos de electrões livres, escolhemos as condições fronteira periódicas. No entanto, em vez de as aplicarmos a um volume cúbico de aresta L, é mais conveniente [devido à presença da função periódica un~k (~r) na expressão geral dos estados de Bloch (6.2)] considerar um volume com a forma da célula unitária primitiva do cristal em estudo, contendo um número inteiro, N , destas células unitárias primitivas (ver a Figura 6.11). As dimensões lineares desta região são Na |~a|, Nb |~b| e N c c N a a c b a N b b Figura 6.11: Forma da região considerada na imposição das condições fronteira. Nc |~c| onde Na , Nb e Nc são números inteiros, tais que o número de células unitárias, N , presentes no volume considerado é dado por N = Na Nb Nc . As condições fronteira periódicas podem então ser expressas como ψn~k (~r + Na~a) = ψn~k (~r + Nb~b) = ψn~k (~r) ψn~k (~r + Nc~c) = ψn~k (~r). ψn~k (~r) (6.31) De acordo com o teorema de Bloch, a primeira das equações em (6.31) pode ainda ser escrita na forma ~ eiNa k·~a ψn~k (~r) = ψn~k (~r) (6.32) ou ainda ~ eiNa k·~a = 1. (6.33) 94 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS De igual modo, obtemos para a segunda e terceira das eqs. (6.31) ~~ eiNb k·b e iNc~ k·~ c = = 1 1. Recordando a definição de vector da rede recı́proca, verificamos que estas igualdades são verificadas se o vector ~k fôr da forma ~k = ma A ~ + mb B ~ + mc C, ~ (6.34) Na Nb Nc ~ B ~ eC ~ são os vectores fundamentais primitivos da onde ma , mb e mc são inteiros arbitrários e A, rede recı́proca. Note-se que Eq. (6.34) não implica que ~k seja um vector da rede recı́proca, porque ma /Na , mb /Nb e mc /Nc não são, necessariamente, números inteiros. Tal como no estudo dos electrões livres, verificamos que os estados electrónicos permitidos formam um conjunto discreto, porque ~k só pode assumir os valores definidos pela Eq. (6.34). Os valores permitidos para o vector ~k formam uma rede cristalina, com vectores fundamentais primitivos A/N ~ a , B/N ~ b e C/N ~ c. Estamos agora em condições de determinar o número de estados numa banda. Como se disse, devemos considerar apenas vectores ~k pertencentes a uma única célula unitária primitiva da rede recı́proca, que tem um volume ~·B ~ × C|. ~ Ω = |A (6.35) Por outro lado, o volume de espaço-k ocupado por cada um dos vectores ~k permitidos é o volume da célula unitária primitiva da rede por eles definida, de acordo com a Eq. (6.34), ¯ ¯ ¯A ~ ~ ¯¯ C ¯ ~ B τ = ¯ · × ¯ ¯ Na Nb Nc ¯ ¯ ¯ 1 ¯~ ~ ~ ¯¯ = Ω . = ¯A · B × C Na Nb Nc N O número de vectores ~k que “cabem” numa célula é então o volume disponı́vel, Ω, a dividir pelo volume ocupado por cada um, τ , ou seja, N . Considerando ainda que para cada valor de ~k existem dois estados electrónicos (spin up ou spin down), concluimos que o número total de estados numa banda é 2N , onde, recorda-se, N é o número total de células unitárias primitivas que formam a região considerada para a imposição das condições fronteira. Este facto também se pode entender recordando que, no aparecimento das bandas de energia no processo de formação dos sólidos, não aumenta o número de estados electrónicos. A banda de valência resulta de combinações lineares de um grande número (seja N esse número) de orbitais atómicas (uma por cada átomo). Cada orbital atómica pode acomodar dois electrões (com orientações de spin opostas), logo, o conjunto deve conter 2N estados electrónicos. 6.6 O estado fundamental da nuvem electrónica Já vimos como a proximidade dos átomos num cristal leva ao desenvolvimento de um espectro de bandas, em vez dos nı́veis de energia bem definidos que caracterizam os átomos isolados. Cada uma destas bandas é populada por electrões provenientes de cada um dos átomos que formam o cristal. O estado fundamental do sistema de electrões de Bloch é, essencialmente, definido do mesmo modo que para os electrões livres: todos os estados de baixa energia devem estar ocupados por electrões. As bandas correspondentes aos nı́veis atómicos de mais baixa energia, que no estado fundamental de cada átomo estão totalmente preenchidas, ficam igualmente totalmente preenchidas. No estado fundamental de cada átomo, apenas a orbital de valência pode conter estados electrónicos desocupados. A banda que resulta desta orbital pode então estar também apenas parcialmente preenchida (ver a Figura 6.12). A esta banda dá-se o nome de banda de valência. 6.6. O ESTADO FUNDAMENTAL DA NUVEM ELECTRÓNICA 95 E Banda de valência < 2N electrões 2N electrões 2N electrões Figura 6.12: Ocupação das diferentes bandas de um metal. Tal como fizemos no estudo do modelo de electrões livres, podemos “construir” o estado fundamental do sistema de electrões de Bloch, ocupando com os electrões atómicos os nı́veis de Bloch de energia sucessivamente maior. Devemos pois começar na primeira banda, preenchendo-a totalmente antes de começar a ocupar a segunda, e assim sucessivamente até à banda de valência. Para cada banda, devemos começar a ocupar estados com ~k tal que correspondam a baixos valores de energia. No caso dos electrões livres, a energia era simplesmente ε(~k) = h̄2 k 2 /2m; dependendo a energia apenas do módulo do vector ~k, este processo de “estacionar” electrões livres em nı́veis de energia sucessivamente maior resultava em superfı́cies de Fermi com forma esférica. A situação é agora mais complicada, já que, em geral, as funções εn (~k) dependem também da direcção de ~k. Assim, para os electrões de Bloch, a forma da superfı́cie de Fermi não é, em geral, esférica, podendo apresentar configurações extremamente complexas. No entanto, estas formas devem manter as simetrias da rede recı́proca. Um caso particular destas simetrias é o da paridade da energia, expresso em (6.13). Uma vez que εn (~k) = εn (−~k), devemos, após o preenchimento do nı́vel ~k com dois electrões (um com spin up e outro com spin down) e antes de preencher outro nı́vel qualquer com energia superior, ocupar estados com energia igual a εn (~k) entre os quais, necessariamente, o estado com momento cristalino igual a −~k. No estado fundamental do sistema, então deve verificar-se que, se um estado ψn~k se encontra preenchido, também o estará o estado ψn−~k ; ao contrário, se o estado ψn~k está desocupado, também ψn−~k o está. Assim, vemos que a superfı́cie k y 1ª zona de Brillouim k x Figura 6.13: Forma possı́vel da superfı́cie de Fermi para um cristal quadrado 2D. Note-se que outras formas são possı́veis, a apresentada é apenas um exemplo. Note-se também que esta superfı́cie de Fermi corresponde a uma banda não totalmente preenchida, porque há ainda espaço disponı́vel na primeira zona de Brillouin para “albergar” outros electrões. 96 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS de Fermi deve apresentar simetria de inversão, isto é, deve ficar invariante sob a operação ~k → −~k. Na Figura 6.13 representa-se a superfı́cie de Fermi para um cristal quadrado bidimensional. Como já vimos, a velocidade média de um electrão de Bloch é a sua velocidade de grupo: 1 ~vn (~k) = grad~k εn (~k). h̄ (6.36) Sendo εn (~k) uma função par de ~k, o seu gradiente é uma função ı́mpar de ~k. Então a velocidade de um electrão cuja função de onda é ψn~k deve ser igual, mas oposta, à de outro com função de onda ψn−~k . Mas como já vimos atrás, os estados ψn~k e ψn−~k estão ambos ocupados ou ambos desocupados, no estado fundamental colectivo. Então, no cálculo da velocidade média dos electrões, as contribuições dos estados ψn~k e ψn−~k cancelam-se mutuamente. Como o vector de onda considerado nesta discussão é arbitrário, concluı́mos que a velocidade média dos electrões no estado fundamental colectivo é zero. Note-se que nos referimos a uma média vectorial, e que não consideramos a presença de campos de forças (eléctricas, por exemplo) que, deformando a superfı́cie de Fermi, destruı́riam esta argumentação. 6.7 A condução eléctrica Consideremos agora o efeito de um campo eléctrico (de grandeza tı́pica) na situação que acabámos de descrever. Tal como no caso dos electrões livres, um campo eléctrico manifesta-se através de um deslocamento da superfı́cie de Fermi na direcção contrária ao campo, deixando de ficar centrada na origem do espaço-k, se este deslocamento for possı́vel. Os argumentos apresentados no final da secção anterior já não se aplicam (porque, por exemplo, ψn~k pode estar ocupado sem que ψn−~k o esteja [veja a Figura 6.14]) e, a ser este deslocamento da superfı́cie de Fermi possı́vel, a velocidade média da nuvem electrónica deixa de ser nula, verificando-se o aparecimento de uma corrente eléctrica. Mas este deslocamento da superfı́cie de Fermi só é possı́vel se a banda de valência E =0 ky E kx ky kx Figura 6.14: Deslocamento da superfı́cie de Fermi sob o efeito de um campo eléctrico. Se a banda de valência estiver totalmente preenchida, a superfı́cie de Fermi é também a fronteira da região proı́bida, impossibilitando o deslocamento da superfı́cie de Fermi, ou seja, a condução eléctrica. não estiver totalmente preenchida, porque, em caso contrário, alguns electrões seriam obrigados a ocupar estados na região proibida. Assim, concluimos que uma banda totalmente preenchida não contribui para a condução eléctrica. Como apenas a banda de valência de um sólido pode, no estado fundamental (ou, seja à temperatura de 0 K), estar parcialmente preenchida, somente esta é responsável pelas propriedades eléctricas dos sólidos. A teoria de Bloch permite pois explicar porque é que alguns sólidos são condutores e outros isoladores: em princı́pio, se a banda de valência de um sólido estiver totalmente preenchida, o sólido é isolador; caso contrário, é condutor. Esta regra tem algumas excepções, já que nalguns sólidos a banda de condução sobrepõe-se com a banda de valência, permitindo a condução mesmo estando esta totalmente preenchida. 6.8. O GÁS DE BLOCH À TEMPERATURA AMBIENTE. 97 E (a) Isolador Condutor (b) T=0 T>0 Semicondutor Figura 6.15: Isoladores, condutores e semicondutores. Os isoladores (à esquerda no diagrama) têm a banda de valência totalmente preenchida e a de condução totalmente desocupada; os condutores (ao centro) têm a banda de valência ocupada, mas não totalmente preenchida, ou então verificase uma sobreposição das duas bandas; finalmente, os semicondutores (à direita) são isoladores à temperatura de zero kelvin, mas o hiato energético entre a banda de valência e a de condução é pequeno, e à temperatura ambiente muitos electrões estão excitados para esta última, possibilitando a condução. 6.8 O gás de Bloch à temperatura ambiente. Nos átomos isolados, para além da orbital de valência, existem outros estados electrónicos, com energia superior, que podem ser ocupados excitando o átomo. De igual modo, a banda de valência também não é a “última” banda no sentido em que há outras bandas de energia superior, que, no estado fundamental do sistema de fermiões de Bloch estão totalmente desocupadas, mas que podem estar parcialmente preenchidas em estados excitados. À banda de energia imediatamente superior à da banda de valência dá-se o nome de banda de condução. Mais uma vez, repetimos que à temperatura ambiente, é possı́vel que alguns electrões sejam excitados para esta banda, e esta possibilidade deve ser considerada no cálculo do valor de grandezas fı́sicas a temperaturas diferentes do zero absoluto. Claro que a probabilidade destas excitações é tanto maior quanto menor for a largura do hiato energético entre as duas bandas. Como vimos no capı́tulo anterior, a energia térmica média disponı́vel para excitar electrões à temperatura ambiente, T , é da ordem de grandeza de kB T , onde kB é a constante de Boltzman, e portanto a população da banda de condução só é apreciável à temperatura ambiente se o hiato energético tiver uma largura da mesma ordem de grandeza. Um sólido com esta caracterı́stica é um isolador(i) a temperaturas próximas do zero absoluto(j) mas pode conduzir electricidade à temperatura ambiente. Um aumento da temperatura produz um aumento na energia média dos fonões, e por conseguinte um aumento da população da banda de condução, ou seja, um aumento da condutividade. Para estes sólidos (com um hiato energético, ²g , de cerca de 1 eV) comportamento da condutividade é inverso do dos condutores, sendo uma função decrescente da temperatura. Este é outro sucesso da teoria de Bloch, já que este comportamento (aumento de condutividade com a temperatura) é inexplicável, como vimos, no quadro de uma teoria de electrões livres. Os sólidos isoladores que, como os que acabámos de referir, apresentam um hiato entre as bandas de valência e de condução suficiente pequeno para que, à temperatura ambiente, a população da banda de condução tenha efeitos apreciáveis, têm o nome de semicondutores. Na Figura 6.15 apresenta-se a configuração das bandas de valência e de condução para condutores, isoladores e semicondutores. (i) Partindo (j) Não do princı́pio que tem a banda de valência totalmente preenchida no seu estado fundamental. consideramos aqui o fenómeno de supercondutividade. 98 6.9 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS Lacunas A densidade de corrente eléctrica global de uma banda totalmente preenchida é, de acordo com o que já se disse, nula. Assim, representando por ~j~k (~r) a densidade de corrente de um electrão no estado ψ~k (k) e por J~B (~r) a densidade de corrente total da banda, podemos escrever J~B (~r) = X ~j~ (~r) = 0, k (6.37) banda onde o somatório se extende a todos os estados ψ~k da banda. Se quisermos calcular a densidade de corrente para uma banda parcialmente preenchida, devemos fazer um somatório semelhante ao anterior, mas considerando apenas os estados efectivamente ocupados por electrões, ou seja, X ~ r) = ~j~ (~r), J(~ (6.38) k e.o. onde as iniciais “e. o.” significam que para o somatório apenas se tomam os estados ocupados. De acordo com a Eq. (6.37), devemos ter X e.o. ~j~ (~r) + k X ~j~ (~r) = 0, k e.d. onde as iniciais “e. d.” indicam que a soma respectiva é feita apenas sobre os estados desocupados. Mas isto significa que os dois somatórios são simétricos, e portanto podemos escrever a densidade de corrente de uma banda parcialmente preenchida como X ~ r) = − ~j~ (~r), (6.39) J(~ k e.d. sendo este somatório, recordemo-lo, extendido apenas aos estados desocupados da banda. Dispomos então de duas formas alternativas para o cálculo da contribuição de uma banda parcialmente preenchida para a corrente elétrica, dadas pelas eqs. (6.38) e (6.39). Podemos interpretar esta segunda possibilidade considerando os estados electrónicos desocupados, sobre os quais se faz o somatório, como se estivessem ocupados por partı́culas semelhantes aos electrões, mas com carga de sinal contrário, justificando-se o sinal negativo na Eq. (6.39). A estas “partı́culas” dá-se o nome de lacunas. A condução eléctrica pode ser descrita recorrendo aos estados electrónicos [usando a Eq. (6.38)] ou, alternativamente, aos estados de lacunas [usando a Eq. (6.39)]. Reafirmemos que as lacunas são os estados electrónicos desocupados. Então, uma banda totalmente preenchida (de electrões) pode ser vista como uma banda vazia de lacunas. Dada a equivalência das duas descrições para os fenómenos de condução, podemos dizer que uma banda totalmente preenchida (de electrões) não pode conduzir porque não contém nenhuma lacuna para o transporte de carga. Num semicondutor, em que o gap de energia entre as bandas de valência e de condução é da ordem de grandeza da energia das vibrações atómicas, é relativamente fácil a excitação de um electrão da banda de valência para a banda de condução. Neste processo, é absorvido um fonão(l) e, simultaneamente, é produzida uma lacuna na banda de valência, correspondente ao estado deixado vago pelo electrão promovido (ver a Figura 6.16). Inversamente, pode também dar-se o processo de recombinação, em que um electrão na banda de condução emite um fonão (ou um fotão) transitando para a banda de valência, onde irá ocupar um estado previamente vago (ou seja, ocupado por uma lacuna). (k) Classicamente, a densidade de corrente é ~ j(~ r) = ρ(~ r)~v (~ r), onde ρ é a função densidade de carga e ~v velocidade das cargas. Numa descrição quântica, a densidade de corrente associada ¡a uma partı́cula¢com carga q é ~j(~ r) = q~g (~ r), ~ − ψ ∇ψ ~ ∗ /(2im) (ver qualquer livro onde ~g é a densidade de fluxo de probabilidade, dada por ~g = h̄ ψ ∗ ∇ψ elementar de Mecânica Quântica, p. ex. S. Gasiorowicz, ”Quantum Mechanics”.) (l) Recorde que os fonões são os quanta das vibrações atómicas (ver a Secção 4.3.2). 6.10. CONTAMINAÇÃO DE SEMI-CONDUTORES 99 Banda de condução f Banda de valência Figura 6.16: Processo de criação de um par electrão de condução-lacuna por absorção de um fonão. Num semicondutor à temperatura ambiente, há duas contribuições para a condução eléctrica: a da banda de condução, que está parcialmente populada com electrões termicamente excitados, e a da banda de valência, parcialmente populada com lacunas que correspondem aos estados deixados vagos pelos electrões promovidos para a banda de condução. Nos casos em que a segunda é mais importante do que a primeira, a corrente eléctrica é, sob todos os aspectos, semelhante à que seria conduzida por cargas de sinal positivo, nomeadamente na polarização da tensão de Hall (ver a secção 5.2.3), justificando-se assim os sinais anómalos do coeficiente de Hall apresentados por algumas substâncias. 6.10 Contaminação de semi-condutores Como vimos, à temperatura ambiente alguns electrões da banda de valência de um semicondutor como o silı́cio ou o germânio(m) ocupam estados excitados na banda de condução, possibilitando a condução eléctrica por estes materiais. Há, como se disse, duas contribuições para a condução eléctrica: a dos electrões na banda de condução e a das lacunas na banda de valência. Num semicondutor puro à temperatura ambiente, o número de lacunas iguala, evidentemente, o de electrões de condução. Mas é possı́vel, através da introdução no cristal semicondutor de impurezas judiciosamente escolhidas, variar independentemente o número dos dois tipos de transportadores de carga. Para concretizar a discussão, consideremos um cristal de silı́cio ou de germânio, no qual alguns átomos são substituı́dos por átomos de arsénico ou de fósforo. Estas impurezas constituem defeitos no arranjo periódico do cristal de silı́cio. O arsénico e o fósforo são substâncias pentavalentes, de forma que, quando um átomo de arsénico substitui num cristal um átomo de silı́cio (substância tetravalente), um dos seus electrões de valência fica por emparelhar. Este electrão fica fracamente ligado ao átomo de arsénico, que funciona como um centro de carga positiva (ver a Figura 6.17). O átomo de arsénico fornece um electrão a mais do que os de silı́cio, que definem a estrutura cristalina e, por isso, dizemos que o arsénico é um dador de electrões, ou ainda que se trata de uma contaminação de tipo-n. Estando o electrão desemparelhado muito fracamente ligado ao átomo de arsénico, basta uma pequena quantidade de energia, Ed , para exitá-lo para a banda de condução. O valor deste mini-gap de energia é de cerca de algumas dezenas de meV (mili-electrão-volt), tipicamente. Assim, concluı́mos que num cristal de silı́cio em que alguns átomos são substituidos por átomos de arsénico a estrutura de bandas usual vê-se modificada, aparecendo um conjunto de estados na zona proı́bida, imediatamente abaixo da banda de condução, aos quais se dá o nome de nı́vel dador. À temperatura de 0 K, a banda de valência está totalmente preenchida, e o nı́vel dador tem metade dos estados disponı́veis ocupados (porquê?); o cristal em estudo é, portanto, isolador. Mas basta elevar ligeiramente a temperatura para se exitarem os electrões do nı́vel dador para a banda de condução, sem que sejam criadas lacunas na banda de valência. A temperaturas mais elevadas, começa a fazer-se sentir o processo já estudado da excitação de electrões da banda de valência, e as lacunas resultantes passam a ter uma contribuição apreciável para a condução eléctrica. Vemos, assim, que contaminando por substituição um cristal de silı́cio ou germânio com (m) Estes são os dois semicondutores mais usados em aplicações industriais. 100 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS Orbital de electrão desemparelhado Banda de condução Ed Nível dador Eg Átomos de Silício + Banda de valência Átomo de Arsénico Figura 6.17: Cristal de silı́cio com uma impureza substitucional de arsénico (esquerda) e nı́veis de energia resultantes (direita). arsénico, podemos aumentar, a temperaturas não muito elevadas, o número de electrões na banda de condução, permanecendo o número de lacunas na banda de valência baixo. Banda de condução Lacuna resultante da captura de um electrão pelo átomo de boro + Eg Átomos de silício - Ea Nível aceitador Banda de valência Átomo de boro Figura 6.18: Cristal de silı́cio com uma impureza substitucional de boro (esquerda) e nı́veis de energia resultantes (direita). Também é possı́vel obter o efeito contrário, de estabecer num cristal semicondutor um grande número de lacunas na banda de valência com um reduzido número de electrões na banda de condução, substituindo alguns átomos num cristal de silı́cio ou de germânio por átomos de boro, alumı́nio, gálio ou ı́ndio (substâncias trivalentes). Substituindo um átomo de silı́cio num cristal puro por um de boro, fica uma ligação por estabelecer, já que o boro é trivalente. O átomo de boro pode, nesta situação, capturar facilmente um electrão da banda de valência do cristal, completando assim as quatro ligações com os seus vizinhos. Neste processo, cria-se uma lacuna na banda de valência, sem popular a banda de condução. As impurezas deste tipo aceitam os electrões da banda de valência, e por isso chamam-se impurezas aceitadoras, ou impurezas de tipo-p. Na Figura 6.18 representa-se esquematicamente o papel de uma impureza de tipo-p e o nı́vel intermédio, que agora aparece imediatamente acima da banda de valência, chamado nı́vel aceitador. A capacidade para variar independentemente as concentrações de lacunas e de electrões de condução num cristal semicondutor tem uma enorme aplicação prática, no fabrico de inúmeros dispositivos usados na indústria electrónica, como os diodos e os transı́stores. É até possı́vel, num único cristal de silı́cio, implantando diferentes contaminações em diferentes regiões, construir circuitos inteiros, contendo vários milhões daqueles elementos individuais. Vamos, de seguida, estudar o funcionamento do mais simples destes dispositivos, o diodo rectificador. 6.11. O DIODO SEMICONDUTOR 101 Fe n e- p l+ Ve Vc0 n p Figura 6.19: Junção p-n (acima) em equilı́brio e potencial de contacto na junção. Está representada o sentido da força sobre os electrões (Fe ) e a sua energia potencial. 6.11 O diodo semicondutor Consideremos um cristal semicondutor de silı́cio (ou germânio), com contaminações de tipo diferente em duas zonas contı́guas, em equilı́brio a uma temperatura T > 0. Temos então um cristal, no qual está definida uma região de tipo-p, outra de tipo-n, em contacto uma com a outra (ver a Figura 6.19). À temperatura T , na região-n há uma grande densidade de electrões de condução, como vimos na secção anterior; em contrapartida, na região-p é a concentração de lacunas que é elevada. Então, à semelhança do que se passa na junção de metais diferentes (ver a Secção 5.2.4), deve verificar-se uma difusão de electrões de condução da região-n (onde apresentam alta concentração) para a região-p, onde se recombinam com as lacunas, aqui maioritárias. As lacunas, por seu turno, sofrem uma migração inversa e recombinam-se com os electrões de condução da região-n. Consequentemente, estabelece-se um campo eléctrico na junção que impede a continuação indefinida deste processo, ou seja, verifica-se o aparecimento de uma diferença de potencial entre as duas regiões, que se chama potencial de contacto. Em resultado dos processos de recombinação, a proximidade da junção fica desprovida de transportadores de carga, efeito que é ainda agravado pelo aparecimento do campo de contacto, que varre electrostaticamente qualquer par lacuna-electrão de condução (o electrão para a região-n, a lacuna para a região−p), criado nesta zona por exitação térmica. Esta região, onde a densidade de transportadores de carga é praticamente nula, chama-se zona de deplecção. Na junção das duas regiões ocorrem, então, dois efeitos opostos: (a) difusão de transportadores, “empurrada” pelos gradientes de concentração. Alguns electrões (aqueles que à temperatura T têm energia suficiente para ultrapassarem a barreira estabelecida pelo potencial de contacto) da região-n difundem-se para a região-p, recombinando-se aı́ com lacunas. Inversamente, algumas lacunas da região-p sofrem uma migração para a regiãon. Ao fluxo de carga associado a estas migrações dá-se o nome de corrente de recombinação, que tem o sentido p-n; (b) deriva de trasportadores, “empurrada” pelo campo eléctrico de contacto. Os pares electrão de condução-lacuna criados por excitação térmica nas duas regiões são empurrados pelo campo eléctrico, realizando cada transportador uma migração em sentido inverso ao do ponto anterior. Esta corrente chama-se corrente de geração, no sentido n-p. Na migração de difusão, os transportadores movem-se empurrados pelos gradientes de concentração, vencendo gradientes de potencial electrostático; na migração de deriva, o movimento é induzido pelo gradiente do potencial electrostático, e opõe-se ao gradiente de concentração. Estabelece-se então um equilı́brio dinâmico em que os fluxos de carga se cancelam mutuamente, isto é, a corrente de recombinação, no sentido p-n, iguala a de geração, no sentido n-p. Deve dizer-se que o valor destas correntes é extremamente baixo, rondando os 10−6 A. Se se montar um circuito fechado incluindo a junção semicondutora p-n, devemos ter em atenção que, para além do potencial de contacto Vc0 na junção semicondutora, aparecem outros 102 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS VB n VB n Vc0 Vc V p p VA VA Figura 6.20: Quedas de potencial por contacto num curto-circuito da junção p-n (à esquerda) e polarização de uma junção p-n por uma fonte de tensão V . VB n VB n Vc > Vc0 Vc < Vc0 p VA p VA i Figura 6.21: Polarização directa (à esquerda) e polarização inversa de uma junção p-n. potenciais de contacto nos pontos onde se liga o condutor que fecha o circuito (ver a Figura 6.20). Evidentemente, a soma de todos estes potenciais é nula, de acordo com a lei de Kirchoff. Usando a notação da Figura 6.20, temos então Vc0 + VA + VB = 0, ou seja, VA + VB = −Vc0 . (6.40) O que acontece agora se polarizarmos a junção, ligando-a a uma fonte de tensão? Uma vez que a zona de deplecção é desprovida de cargas móveis, tem uma resistência muito elevada e, por isso, podemos considerar que é aı́ que se manifesta o efeito da fonte de tensão. Aplicando a lei de Kirchoff, temos agora Vc + Va + VB + V = 0, e portanto, usando a Eq. (6.40), concluimos que o potencial de contacto se vê alterado pela acção da tensão polarizadora V de acordo com Vc = Vc0 − V. (6.41) Quando o terminal positivo da fonte de tensão está ligado à região-p a junção diz-se polarizada no sentido directo; se o terminal positivo da fonte estiver ligado à região-n, falamos de polarização inversa. Quando a junção está em polarização directa, V tem sinal idêntico ao de Vc 0, e, portanto, o potencial de contacto fica diminuı́do pela polarização (ver a Figura 6.21, à esquerda). Logo, nestas condições, aumenta bastante a corrente de recombinação porque diminui a grandeaza da barreira de potencial que impede o fluxo por difusão. Em contrapartida, a corrente de geração mantém-se essencialmente constante, já que depende da taxa da criação de pares lacuna-electrão de condução. Então, as duas correntes deixam de se compensar, e verifica-se, portanto, um fluxo lı́quido de carga através da junção, no sentido p-n. Em resumo, a junção p-n permite a passagem de corrente quando se encontra em polarização directa. Em contrapartida, quando se inverte a polarização, aumenta o valor do potencial de contacto, diminuindo, consequentemente, o valor da corrente de recombinação. A corrente de geração permanece essencialmente a mesma, mantendo o seu valor de cerca de 10−6 A. Assim, para muitos efeitos 6.11. O DIODO SEMICONDUTOR 103 200 I (A) 150 100 50 0 -2 -1.5 -1 -0.5 V (V) 0 0.5 Figura 6.22: Curva de corrente-tensão caracterı́stica de um diodo semicondutor. práticos, podemos dizer que a junção semicondutora p-n não permite a passagem de corrente em polarização inversa. Uma vez que a fracção dos transportadores que tem, a uma certa temperatura T , uma energia superior ao valor do potencial de contacto (e que portanto está em condições de ultrapassar a barreira de potencial na junção) é dada pelo factor de Boltzmann e−βeVc , onde β = 1/kB T , a razão entre as correntes de recombinação em polarização directa e em vazio (sem qualquer fonte externa) é dada por Jr e−βeVc = −βeVc0 = eβeV . Jr0 e A corrente total é a soma das correntes de geração e de recombinação, J = Jr + Jg , mas a corrente de geração permanece sensivelmente constante, com o seu valor de vazio Jg0 que, por sua vez, é o simétrico da corrente de recombinação, também em vazio. Então, a funçao corrente tensão de uma junção p-n é J = Jg (eβeV − 1), (6.42) onde se toma V positivo quando a junção está em polarização directa. O gráfico desta função apresenta-se na Figura 6.22. A junção semicondutora p-n tem então a propriedade de só permitir a passagem de corrente num sentido, propriedade muito importante no desenho de circuitos electrónicos. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • J. R. Christman, ”Fundamentals of Solid State Physics” (1988), capı́tulo 14 (F5.0/257 +) • A. Yariv,“An Introduction to Theory and Applications of Quantum Mechanics” (1982), capı́tulo 20 (F5.0/461) • J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989), secção 12-7 (F5.0/437 +) • F. Blatt, “Modern Phisics” (1992), secção 13.4 (F5.0/448 +) • R. A. Serway e R. J. Beichner, “Physics for Scientists and Engineers” (2000), Secção 43.7 (F0.2/294) 104 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS PROBLEMAS 6.1 À luz da teoria das bandas determine, justificando, o número total de estados electrónicos existentes por banda de energia. 6.2 Justifique qualitativamente a condutividade, térmica e eléctrica, a zero graus Kelvin, dos sólidos cristalinos. Dê alguns exemplos. 6.3 Comente a seguinte afirmação: A condutividade dos metais alcalinos terrosos é devida a uma sobreposição da banda de valência com a banda de condução. Se tal não acontecesse estes elementos seriam isoladores a zero graus Kelvin. 6.4 Determine o valor do parâmetro de massa efectiva de electrões livres. 6.5 A densidade do bário é de 3, 5 × 103 kg/m3 , e a sua massa atómica relativa é 137. Sabendo que os átomos de bário têm dois electrões de valência, determine o raio da esfera de Fermi e o valor da energia da nuvem de electrões de condução por mole (de átomos) à temperatura de 0 K. 2 6.6 Mostre que a função ψ(~r) = N e−r , onde N é uma constante de normalização e r = ||~r||, não pode ser a função de onda de um electrão num potencial periódico. 6.7 Um diodo com corrente de geração de 20,0 µA, uma resistência de 1,5 kΩ e uma fonte de tensão estão ligados em série. Sabendo que o diodo se encontra a conduzir, qual o valor da força electromotriz da fonte, necessária para que a corrente através do circuito seja 25,0 mA, à temperatura de 300 K? 6.8 Coloca-se um diodo num circuito eléctrico para proteger o sistema contra o risco de alguém colocar as pilhas ao contrário. Na posição de fucionamento à temperatura ambiente, a corrente através do diodo é 200 mA sendo 100 mV a diferença de potencial entre os seus terminais; se se inverter a bateria, qual será o valor da corrente através do diodo? Capı́tulo 7 Supercondutividade A temperaturas suficientemente baixas, a resistividade de muitas substâncias anula-se, de forma brusca. Este facto foi, pela primeira vez, observado por Karmerlingh Onnes em 1911, quando notou que a resistência de uma amostra de mercúrio era, à temperatura de 4,2 K, subitamente reduzida em mais de um milhão de vezes (ver o gráfico da Figura 7.1, à esquerda). Outras substâncias sofrem este processo a diferentes temperaturas. A temperatura a que se dá a transição chama-se temperatura crı́tica. Alguns exemplos estão apresentados na Tabela 7.1. É importante notar que esta redução do valor da resistividade é, em certas condições, extremamente brusca. No caso dos estudos de Onnes com mercúrio, ela processa-se ao longo de, apenas, duas centésimas de grau. Muitas outras propriedades fı́sicas sofrem também alterações descontı́nuas importantes neste processo, o que identifica uma transição para uma fase diferente, chamada fase supercondutora. No lado direito da Figura 7.1 apresenta-se o comportamento da capacidade térmica com a temperatura, onde também se evidencia a discontinuidade quando T = Tc . Na presença de um campo magnético externo, a capacidade térmica apresenta até uma singularidade infinita (ou seja, um calor latente) para T = Tc , como se verifica nas transições de fase sólido-liquı́do ou liquı́do-gás. A resistividade de uma substância não se torna, apenas, muito pequena na transição para a fase supercondutora. Ela anula-se, completamente. Uma corrente eléctrica estabelecida num anel supercondutor mantém-se indefinidamente, por vários anos, assim o demonstram todas as experiências desenhadas para testar esta hipótese. O próprio Kamerlingh Onnes pôde verificá-lo quando arrefeceu um anel de chumbo até atingir a fase supercondutora, na presença de um campo magnético. Em seguida, diminuiu a intensidade do campo magnético até o anular. A variação do fluxo magnético através do anel induziu nele uma corrente, de acordo com a Lei de Faraday. Este fenómeno é bem conhecido, mesmo com condutores vulgares. Nun anel condutor com resistência R e indutância L, uma corrente assim induzida decai exponencialmente, anulando-se num intervalo de tempo de cerca de L/R. Para um anel com um metro de diâmetro e uma resistência de 0,1 Ω, Substância Hg Cd In La Nb La2−x Bax CuO4 Tl2 Ba2 Ca2 Cu3 O1 0 Tc (K) 4,15 0,56 3,40 6,06 9,26 35 125 Substância Al Ga Ir Mo Nb3 Ge YBa2 Sr3−x Cax Cu2 O8+δ HgBa2 Ca2 Cu3 O8+x Tc (K) 1,20 1,09 0,14 0,92 23,0 110 164 Tabela 7.1: Temperaturas da transição para a fase supercondutora. As substâncias das duas últimas linhas são chamadas supercondutores quentes, que foram descobertos a partir de 1986. 105 106 CAPÍTULO 7. SUPERCONDUTIVIDADE 4 0.15 3 -1 R (Ω) -1 C (mJ mol K ) 0.2 0.1 2 0.05 1 Tc 0 4.1 4.15 4.2 4.25 4.3 T (K) 4.35 4.4 0 0 0.5 1 T (K) 1.5 2 Figura 7.1: Resistência de uma amostra de mercúrio como função da temperatura, como foi observada por Kamerlingh Onnes (Commun. Phys. Lab. Univ. Leiden 12, 120, 1991) (à esquerda) e capacidade térmica molar do alumı́nio como função da temperatura (N.E. Phillips, Phys. Rev. 114, 676 (1959)) (à direita). este intervalo de tempo é de cerca de uma décima de milésima de segundo. No entanto, Onnes constatou que a corrente no anel de chumbo supercondutor se manteve inalterada durante mais do que duas horas! Uma tal lentidão na atenuação de uma corrente “transitória” só é possı́vel com resistências da ordem dos pΩ = 10−12 Ω. Mais recentemente, foi possı́vel verificar a continuação de uma destas correntes durante mais de dois anos! Daqui se vê que, de acordo com toda a evidência experimental, a resistividade dos supercondutores é, de facto, nula. Outro facto digo de nota é que as substâncias que com maior facilidade passam ao estado supercondutor (isto é, aquelas para as quais a transição se faz a temperatura mais elevada) não são particularmente boas condutoras à temperatura ambiente. Na mesma linha, verifica-se que os melhores condutores à temperatura ambiente só a muito baixas temperaturas passam à fase supercondutora. Nalguns casos (por exemplo, o do cobre e o do ouro), nem sequer se chega a atingir essa fase, por muito que se baixe a temperatura! Isto parece indicar que a transição é facilitada pela interacção entre os electrões de condução e os átomos da rede cristalina. 7.1 Propriedades magnéticas dos supercondutores Uma vez que a resistividade de uma substância se anula durante a transição para a fase supercondutora, a sua condutividade cresce ilimitadamente. A lei de Ohm, ~ ~j = σ E, impõe então que o campo eléctrico no interior de um supercondutor seja nulo. Mas, se o campo eléctrico é nulo, então o campo magnético é constante. Com efeito, de acordo com a lei de Faraday, ~ ~ = − ∂B , rot E ∂t resultando então, com campo eléctrico nulo, que a derivada parcial do campo mgnético se anula, ou seja, que o campo magnético não depende do tempo. É fácil compreender de forma mais intuitiva porque é que o campo magnético no interior de um supercondutor não depende do tempo. Tal 7.1. PROPRIEDADES MAGNÉTICAS DOS SUPERCONDUTORES 107 deve-se ao facto de qualquer variação do fluxo magnético induzir correntes no supercondutor que imediatamente a cancelam. Provámos, a partir das equações de Maxwell, que o campo magnético no interior de um supercondutor é constante, ou seja, não depende do tempo. Isto é verdade, mas não é toda a verdade. Com efeito, Meissner e Ochsenfeld verificaram em 1933 que o campo magnético no interior dos supercondutores é nulo, isto é, o módulo da indução magnética em cada ponto não é uma constante qualquer, é zero. Este facto tem o nome de efeito de Meissner O campo magnético anula-se no interior dos supercondutores porque se estabelecem na sua superfı́cie correntes que o magnetizam de forma tal que se cancela o campo em todos os pontos do seu interior. Este processo tem algumas semelhanças com a distribuição de carga pela superfı́cie de um condutor em equilı́brio electrostático na presença de um campo elécrico, de forma tal que se anula o campo no seu interior. A magnetização gerada num supercondutor pela presença de um campo magnético é, então, oposta ao campo que lhe dá origem. A este comportamento dá-se o nome de diamagnetismo. É um comportamento oposto ao chamado ferromagnetismo (evidenciado pelo ferro, por exemplo), em que a magnetização tem o sentido do campo magnetizador, reforçando-o. Uma vez que a magnetização gerada num supercondutor é tal que se anula completamente, nos pontos interiores, o campo magnetizante, diz-se que os supercondutores são perfeitamente diamagnéticos. De acordo com que acabámos de discutir, quando se aproxima um ı́mane de um supercondutor, este magnetiza-se, tendo o seu momento magnético sentido oposto ao do ı́mane. Logo, surge uma força de repulsão entre o ı́mane e o supercondutor, que pode ser suficiente, por exemplo, para manter o ı́mane a flutuar sobre o supercondutor, apoiado numa “almofada magnética.” É possı́vel forçar um supercondutor a passar à fase normal, mesmo abaixo da temperatura de transição, aplicando um campo magnético suficientemente intenso na sua vizinhança. A intensidade do campo magnético necessária para produzir este efeito chama-se valor crı́tico do campo. Quanto maior é a temperatura do supercondutor (mas ainda abaixo da temperatura de transição, claro) menor é o campo crı́tico. Numa aproximação muito razoável para a generalidade dos supercondutores, verifica-se a seguinte relação entre o campo crı́tico e a temperatura: à · T Bc (T ) = Bc (0) 1 − Tc ¸2 ! . (7.1) Nesta expressão, Bc (0) representa o campo crı́tico à temperatura do zero absoluto e Tc representa a temperatura de transição na ausência de campo. A transição para a fase normal forçada por um campo magnético de intensidade superior à intensidade crı́tica pode fazer-se de duas maneiras, dependendo da natureza do material usado. Nos chamados supercondutores do tipo I, o campo magnético penetra subitamente (se a forma e a orientação do material supercondutor forem adequadas) em todo o supercondutor, que assim passa para a fase normal. Se a forma e a orientação não forem cuidadosamente escolhidas, pode verificarse o aparecimento de um estado intermédio, em que o material estudado fica dividido em sectores supercondutores, onde o campo magnético é nulo, e sectores não supercondutores, penetrados pelo campo. Nos supercondutores de tipo II, quando a intensidade do campo magnético ultrapassa um primeiro valor crı́tico B1 , começa a penetrar no supercondutor, mas não o preenche na totalidade. Em vez disso, estabelece-se um estado misto (com algumas semelhanças com o estado intermédio dos supercondutores de tipo I), no qual o material se divide em zonas, com a forma de tubos com a direcção do campo, onde se passa à fase normal, permanecendo o restante material na fase supercondutora. À medida que aumenta a intensidade do campo magnético, a espessura destes tubos vai também aumentando até que, para uma intensidade magnética B2 , todo o material passa à fase normal. Note-se que enquanto uma parte de um supercondutor de tipo II permanecer na fase supercondutora, o material como um todo continua a apresentar resistência nula. Com efeito os tubos de fluxo (como são chamadas as regiões onde o campo penetra no supercondutor), com resistência finita, estão em paralelo com a fracção supercondutora, com resistência nula, e o paralelo com uma resistência nula apresenta, igualmente, resistência igual a zero. 108 7.2 CAPÍTULO 7. SUPERCONDUTIVIDADE A Equação de London A resistividade de um material supercondutor é, como vimos, zero. Isto leva-nos a pensar que alguns ou todos os electrões de condução passam a poder mover-se no interior do material sem sofrerem colisões. Na presença de um campo eléctrico, o seu movimento é, então acelerado, de acordo com a segunda lei de Newton. Para um destes electrões supercondutores, temos me d~v ~ = −eE, dt onde me e e são, respectivamente, a massa e o módulo da carga electrónica, ~v é a velocidade do ~ o campo eléctrico. Multiplicando ambos os membros desta equação pela densidade de electrão e E electrões supercondutores, ns , e pela carga electrónica e recordando que ~j = −en~v é a densidade de corrente electrónica, obtemos d~j ns e 2 ~ = E, dt me Se agora calcularmos o rotacional desta expressão e usarmos a Lei de Faraday, resulta µ ¶ ∂ ns e 2 ~ ~ rot j + B = 0. ∂t me (7.2) Esta equação diferencial, em conjugação com a Equação de Maxwell que traduz a Lei de Ampère(a) , ~ = µ0~j, rot B (7.3) ~ e a ~js . É fácil verificar que este sistema de equações admite podem ser resolvidas em ordem a B soluções em que o campo magnético, sendo estático, é diferente de zero. Com efeito, qualquer que seja o campo magnético independente do tempo, a lei de Ampère (7.3) leva a que a densidade de corrente seja também estacionária, pelo que a Eq. (7.2) fica automaticamente satisfeita. Assim, este formalismo, deduzido a partir das equações de Maxwell, não descreve o comportamento dos supercondutores, uma vez que não prevê o Efeito de Meissner. Esta insuficiência pode ser resolvida impondo que a função a derivanda na Eq. (7.2) se anule, isto é, rot ~j + ns e 2 ~ B = 0. me Esta igualdade é a chamada equação de London. A equação de London descreve correctamente o efeito de Meissner. Se calcularmos o rotacional da Eq. (7.3) e usarmos a equação de London para eliminar a densidade de corrente, obtemos 2 ~ = −µu ns e B. ~ rot rot B me O duplo rotacional de uma função vectorial qualquer pode ser calculado através da igualdade ~ = grad div X ~ − lap X; ~ rot rot X no caso em estudo, esta expressão assume até uma forma mais simples porque o campo magnético ~ = 0). Obtemos então é uma função solenoidal (div B 2 ~ ~ = µ0 ns e B. lap B me (7.4) Esta equação não admite soluções homogéneas não nulas. Com efeito, um campo homogéneo tem laplaciano nulo, de forma que somente campos nulos podem satisfazer esta igualdade. Além (a) Não se inclui nesta equação a corrente de deslocamento, 1/² ∂ E/∂t ~ porque, para simplificar, consideramos 0 apenas situações em que os campos variam lentamente com o tempo, em que é dominante a corrente de condução. 7.3. SUPERFLUIDEZ 109 disso, podemos demonstrar que o campo magnético é exponencialmente atenuado à medida que penetra no interior de um supercondutor. Para tal, consideremos um supercondutor muito grande com uma face plana, com a qual fazemos coincidir o plano xOy do sistema de coordenadas, com origem (situada obviamente neste plano) muito longe dos limites desta face. Suponhamos que o material supercondutor é tão grande que, na região da origem do sistema de coordenadas, é razoável aproximá-lo a um material com volume infinito, que se estende indefinidamente a toda ~ e o campo magnético no exterior, isto é, nos pontos tais que z < 0, e a região z > 0. Seja B suponhamos que se trata de um campo uniforme. Por razões de simetria, o campo magnético no interior do supercondutor deve ser apenas uma função da coordenada z, ou seja, da distância à superfı́cie de separação dos dois meios. A Eq. (7.4) fica então ~ d2 B ns e 2 ~ = µ0 B. 2 dz me Esta equação diferencial admite como solução geral a combinação de funções exponenciais ~ B(z) = ~aez/λ + ~be−z/λ , onde λ2 = (µ0 ns e2 /me )−1 , e ~a e ~b são duas constantes vectoriais que devem ser ajustadas de forma a que se verifiquem condições gerais de plausibilidade fı́sica e condições fronteira relevantes. Ora, primeiro termo, afectado pela constante ~a, representa um vector cujo módulo cresce exponencial e ilimitadamente à medida que penetramos no interior do supercondutor. Esta situação é claramente inverosı́mil, e pode ser afastada impondo ~a = 0. Por outro lado, a continuidade do campo magnético obriga a que o limite desta solução à medida que z tende para zero (isto é, à ~ e, medida que nos aproximamos da superfı́cie do supercondutor) seja o valor exterior do campo, B ~ ~ ~ ~ ou seja, limz→0 B(z) = Be , condição que é satisfeita com b = Be . O campo magnético no interior do supercondutor é então ~ ~ e e−z/λ , B(z) =B verificando-se assim ser essencialmente nulo em todos os pontos do interior do supercondutor, à excepção de uma camada superficial, cuja espessura é da ordem de grandeza de λ. Considerando que todos os electrões de condução têm um contribuem para o comportamento supercondutor, podemos calcular o valor deste parâmetro, usando os valores tabelados no Capı́tulo 5 e resulta λ ≈ 150 Å. Este parâmetro tem o nome de profundidade de penetração. 7.3 Superfluidez Como se referiu no estudo da teoria de London, a persistência, por tempo indeterminado, das correntes supercondutoras sugere que um número apreciável de electrões se movem no supercondutor sem sofrerem qualquer resistência ao seu movimento. Neste aspecto, a supercondutividade tem um ponto em comum com outro fenómeno verificável também a temperaturas muito baixas, o da superfluidez do hélio. Este fenómeno foi, pela primeira vez, parcialmente identificado por McLennan, Smith e Wilhelm em 1932 e consiste numa transição de fase, que pode ser identificada, por exemplo, pelo comportamento descontı́nuo da capacidade térmica como função da temperatura, que está ilustrado na Figura 7.2. À temperatura da transição para a fase superfluida deu-se o nome de ponto lambda, pela semelhança que o gráfico da capacidade térmica do hélio, na vizinhança da transição, tem com esta letra do alfabeto grego. As únicas substâncias que apresentam uma fase superfluida são o hélio “normal”, 4 He, e um seu isótopo, o 3 He,(b) porque todas as outras substâncias congelam a temperaturas superiores à da transição superfluida. (b) A notação AX explicita o número de massa, A, do elemento quı́mico X. 110 CAPÍTULO 7. SUPERCONDUTIVIDADE CV TΛ T Figura 7.2: Dependência da capacidade térmica do hélio lı́quido com a temperatura. T > Tλ φ1 = 0 φ2 = 0 T < Tλ φ1 φ 2= φ T < Tλ 1 T > Tλ O hélio superfluido tem uma série de propriedades notáveis, sendo a mais relevante para o nosso estudo (e aquela à qual se deve o nome de superfluidez) a sua capacidade para fluir através de tubos capilares com secção tão diminuta que não permitem o escoamento de hélio lı́quido na fase normal. (Estes tubos, que apenas permitem o escoamento de hélio superfluido, chamam-se tubos supercapilares.) Este efeito pode ser posto em evidência usando dois reservatórios contendo hélio lı́quido na fase normal, unidos por um tubo supercapilar, como mostra a figura ao lado. Enquanto a temperatura é superior à do ponto-λ, não há escoamento entre os dois reservatórios (figura em cima); baixando a temperatura até se dar a transição para a fase superfluida, o hélio começa a fluir através do tubo supercapilar, até se igualarem os nı́veis de hélio nos dois reservatórios, altura em que se estabelece um equilı́brio dinâmico, sendo os fluxos de hélio entre os dois reservatórios iguais (figura no centro). Se agora aquecermos um dos reservatórios até uma temperatura superior à do ponto-λ, o hélio presente nesse reservatório deixa de fluir para o outro, mas o fluxo inverso ainda se mantém, φ1 > 0 φ2 = 0 subindo, portanto, o nı́vel de hélio no reservatório aquecido (figura em baixo). A capacidade para o escoamento através de tubos supercapilares pode entender-se supondo que o hélio superfluido tem uma viscosidade nula. No entanto, experiências de outro tipo, por exemplo, a análise do movimento de um objecto que se mergulha em hélio superfluido, não apoiam esta hipótese. É certo que a viscosidade de um superfluido tende para zero à medida que a temperatura tende para zero mas tem sempre um valor finito (quando se determina a partir da queda de objectos no fluido) a temperaturas compreendidas entre zero e a temperatura de transição. Para compreender estes resultados aparentemente contraditórios, F. London propôs em 1938 o chamado modelo dos dois fluidos, segundo o qual a temperaturas abaixo da do ponto-λ, coexistiriam duas formas distintas de hélio: hélio numa fase lı́quida normal e hélio em fase superfluida propriamente dita, chamado hélio-II, desprovido de viscosidade. A aparente ausência de viscosidade verificável no escoamento através de supercapilares devia-se à fracção de hélio-II, ao passo que a que se notava na queda de objectos mergulhados se devia à componente em fase lı́quida ordinária. A proporção relativa das duas componentes dependia da temperatura, variando a fracção de hélio-II entre 100% e 0%, quando aquela aumentava desde zero até à temperatura do ponto-λ. A fim de percebermos porque é que o hélio-II é desprovido de viscosidade, devemos notar que 7.4. A SUPERCONDUTIVIDADE, OUTRA VEZ 111 os átomos de hélio (4 He) são bosões, logo, não são afectados pelo princı́pio de exclusão de Pauli. Dada uma amostra de hélio, não há, pois, qualquer mecanismo que impeça os seus átomos de se acumularem nos estados de energia mais reduzida(c) . A temperaturas muito baixas, uma fracção apreciável dos átomos desta amostra encontra-se no estado fundamental, não podendo, assim, participar em processos de dissipação de energia, como são os de atrito ou de viscosidade. Esta fracção dos átomos de hélio é a que constitui o hélio-II do modelo dos dois fluidos. Uma colecção de bosões (como os átomos de 4 He) dos quais uma percentagem apreciável se encontra no estado fundamental chama-se um condensado de Bose-Einstein. Para além dos exemplos fornecidos pela superfluidez do hélio 4 He e (veremos adiante os detalhes) dos electrões supercondutores, não se conheciam outros exemplos de condensados de Bose-Einstein, até ao ano de 1995, em que Eric Cornell e Carl Wieman (usando uma técnica de arrefecimento por laser inventada por Steven Chu, Claude Cohen-Tannoudji e and William D. Phillips, e pela qual ganharam prémio Nobel de 1997) conseguiram arrefecer uma nuvem de cerca de 2000 átomos de rubı́dio até formarem um condensado de Bose-Einstein. Por este sucesso, aqueles cientistas ganharam o prémio Nobel de 2001. 7.4 A supercondutividade, outra vez Fizemos esta digressão pelo fenómeno da superfluidez porque, de acordo com a teoria actualmente aceite, a supercondutividade deve-se a um comportamento superfluido dos electrões nos sólidos a temperaturas baixas. É difı́cil, em primeira abordagem, aceitar esta possibilidade porque os electrões de um supercondutor são fermiões, não podendo, assim, acumular-se em estados de baixa energia. A temperaturas suficientemente baixas, os electrões organizam-se definindo uma superfı́cie de Fermi, não um condensado de Bose-Einstein. De facto, não são os electrões propriamente ditos a formarem um condensado de Bose-Einstein, mas sim estados ligados de pares de electrões, que sendo formados por duas partı́culas com spin1/2, têm momento angular total inteiro (zero ou um), ou seja, são bosões. Estes pares são conhecidos como pares de Cooper. Como podem formar-se estados ligados de dois electrões? Dois electrões livres são partı́culas carregadas com cargas de sinal igual e, por isso, repelem-se, não formam estados ligados, para os quais é necessária uma força atractiva! Mas acontece que os electrões num supercondutor não são livres. Muito pelo contrário, nos materiais que passam mais facilmente à fase supercondutora, os electrões sofrem fortes interacções com a rede cristalina, como indica o facto de não serem, em geral, bons condutores eléctricos, na fase normal. De acordo com a teoria, a passagem de um electrão numa região do sólido provoca ligeiros deslocamentos dos iões (que constituem o cristal onde os electrões se movem) nessa região, provocados pelas forças com que o electrão de passagem os atrai. Assim, essa região fica, por breves instantes, positivamente carregada e, por isso, exerce forças de atracção sobre outros electrões na vizinhança. Deste modo, surge uma atracção efectiva entre electrões, mediada pelas deformações do cristal, que pode, em certas condições e apenas para certos estados electrónicos, vencer a repulsão electrostática e levar ao estabelecimento de estados ligados, os pares de Cooper. Evidentemente, esta atracção é muito fraca, de forma que os pares assim formados não permanecem ligados durante intervalos de tempo longos, senão a temperaturas extremamente baixas, justamente as necessárias para a passagem à fase supercondutora. A teoria que aqui foi sucintamente resumida está em bom acordo com os factos experimentais(d) . Os principais responsáveis pelo seu desenvolvimento até à forma presente foram J. Bardeen, L. Cooper e J. Schrieffer, cujos esforços foram premiados com a atribuição conjunta do prémio Nobel de 1972. (c) Repare-se que não nos referimos aqui, quando falamos de estados, aos estados quânticos dos electrões que integram os átomos de hélio, mas sim aos estados quânticos dos próprios átomos, vistos como partı́culas elementares (as energias envolvidas na transição para a fase superfluida são muito menores do que as necessárias para excitar os graus de liberdade internos a cada átomo), descritas por uma equação de Schrödinger própria. (d) Isto não é totalmente verdade no que se refere aos supercondutors “quentes,” aqueles cuja temperatura de transição é superior à temperatura de ebulição do azoto, 77,4 K. 112 7.5 CAPÍTULO 7. SUPERCONDUTIVIDADE Aplicações da supercondutividade A maioria das possı́veis aplicações da supercondutividade são as que resultam do facto de um supercondutor apresentar resistência nula. Com efeito, se se pudesse “desligar” o efeito de Joule no transporte de electricidade, usando linhas de distribuição supercondutoras, grandes economias seriam realizadas. Claro que o arrefecimento e a manutenção da baixa temperatura de várias toneladas de cabo, extendidas ao longo de dezenas ou centenas de qilómetros, coloca outros problemas e envolve outros custos... Por enquanto, continua a ser mais barata a factura do efeito de Joule. O efeito de Joule não se limita a implicar custos, por vezes estabelece limites para o rendimento de máquinas. O exemplo mais simples é o das bobines para gerar campos magnéticos. A intensidade do campo gerado por um solenóide é proporcional à corrente que o percorre. Mas a potência dissipada pelo solenóide é proporcional ao quadrado da corrente. Então, quanto mais intenso o campo gerado, mais potência é dissipada pelo solenóide. Esta potência manifesta-se num aquecimento que pode levar à fusão do condutor usado. Este facto obriga à utilização de solenóides constituı́dos por condutores muito espessos (logo, muito caros). Outra possibilidade é a utilização de solenóides supercondutores com resistividade nula. Já não se coloca aqui, pelo menos com a mesma gravidade, o problema da extensão espacial do condutor a que nos referimos no parágrafo anterior. É, então, comparativamente simples arrefecer um solenóide, mesmo que tenha dimensões avantajadas, e tais solenóides supercondutores são usados para gerar os campos magnéticos que orientam os feixes de protões e antiprotões no Tevatron, o acelerador de partı́culas mais poderoso da actualidade (2005), instalado no Fermilab, nos Estados Unidos da América. Esta tecnologia será igualmente usada no Large Hadron Collider do CERN que, em Junho de 2007, entrará em funcionamento. A facilidade da geração de campos intensos usando solenóides supercondutores será também, concerteza, aproveitada nos estudos experimentais da fusão nuclear. Outro campo, mais relacionado com o nosso dia a dia, onde esta possibilidade é utilizada é no da imagiologia médica, nalguns aparelhos de ressonância magnética nuclear. Outras aplicações da supercondutividade não estão tão relacionadas com a propriedade fundamental da resistividade nula. Em particular, refiram-se as que utilizam as chamadas junções de Josephson, que são constituı́das por dois supercondutores separados por uma camada isolante muito fina, capaz de permitir a passagem, por efeito de túnel, da corrente supercondutora. As junções de Josephson são usadas para medir campos magnéticos com enorme precisão (em dispositivos chamados SQUID’s, Superconductor QUantum Interference Devices). São também usadas na definição da unidade SI de diferença de potencial. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989), capı́tulo 13 (F5.0 437 +) • K. Mendelsson, “Em demanda do Zero Absoluto” (1968), capı́tulos 9 e 10 (mas leiam o resto também!) • F. Blatt, “Modern Phisics” (1992), secções 13.5 (supercondutividade) e 11.4 (superfluidez) (F5.0 448 +) PROBLEMAS 7.1 Considere um anel condutor com resistência R e indutância L. Suponha que induz neste condutor uma corrente transitória que num instante t = 0 tem o valor i0 . Como é que esta corrente evolui temporalmente? 7. Problemas 7.2 Num cilindro isolador com 50 mm de raio, enrola-se um sistema de bobines de Helmholtz (duas bobines circulares, separadas por uma distância igual ao seu raio), cada uma das quais constituı́da por apenas uma espira de fio de chumbo. O diâmetro do fio condutor usado é 1 mm. Funcionando mergulhado num banho de hélio lı́quido a 4,2 K, qual o valor máximo da corrente para a qual as bobines permanecem na fase condutora? Qual o valor máximo do campo criado no ponto central entre as duas espiras? 7.3 A temperatura crı́tica do alumı́nio é 1,140 K, ao passo que o valor crı́tico do campo magnético é 0,0105 T. Qual o maior valor da corrente (distribuı́da uniformemente) que pode percorrer um condutor de alumı́nio com secção transversal circular com um raio de 2 mm, a uma temperatura de 0,5 K? 7.4 O vanádio tem uma temperatura crı́tica de 5,4 K e um campo crı́tico a 0 K de 0,14 T. Determine o valor do campo magnético que destrói a fase supercondutora do vanádio a uma temperatura de 4,3 K. 7.5 O campo crı́tico para o chumbo tem um valor de 0,0803 T e uma densidade electrónica de 13,2×1028 m−3 . Calcule a profundidade de penetração do campo magnético em chumbo supercondutor e determine a densidade de corrente que se estabelece na superfı́cie de uma amostra de chumbo supercondutor na presença de um campo com intensidade de 0,03 T 113 Capı́tulo 8 Fı́sica Nuclear I — Propriedades do núcleo atómico Chegou a altura de abandonarmos o estudo dos sólidos para nos dedicarmos a outro tipo de sistemas de muitos corpos, os núcleos atómicos. É interessante notar que a Fı́sica dos Sólidos e a Fı́sica Nuclear são talvez os dois ramos da Fı́sica que mais impacto tiveram no desenvolvimento da sociedade ocidental do Séc. XX. A primeira, porque possibilitou o desenvolvimento da electrónica sem a qual a revolução informática e das telecomunicações não teria ocorrido; a segunda, não tanto pelas suas aplicações benéficas (que são muitas, como a radioterapia, algumas técnicas imagiológicas de diagnóstico, a datação de vestı́gios arqueológicos por determinação do teor de carbono-14, etc.), mas principalmente porque permitiu o desenvolvimento de armas de destruição maciça, com um poder capaz de destruir a civilização, que determinaram as polı́ticas mundiais durante a chamada guerra fria, na segunda metade do Séc. XX. Apesar de ter terminado a guerra fria, a mera existência dessas armas continua a colocar sérios problemas de segurança, que não podem ser tomados de ânimo leve pelos responsáveis polı́ticos. 8.1 Núcleo atómico — Generalidades Como vimos na Secção 1.1.2, o núcleo atómico é a região central do átomo, com carga eléctrica de sinal positivo, onde se concentra a quase totalidade da massa atómica(a) . Os núcleos atómicos de todas as substâncias têm uma carga múltipla da do de hidrogénio, o que sugere que os núcleos são estruturas compostas por partı́culas elementares, os protões. O núcleo dos átomos de hidrogénio será então a mais simples destas estruturas, consistindo apenas em um protão. Como também discutimos no Secção 1.1.2, para compreender os valores da massa e do momento angular dos diferentes núcleos, é necessário considerar ainda uma segunda partı́cula elementar, o neutrão. A Tabela 8.1 apresenta o valor de algumas propriedades destas duas partı́culas. Chamamos nucleão protão neutrão massa (u) 1,00728 1,00866 carga eléctrica e e spin 1/2 1/2 Tabela 8.1: Valores da massa, da carga eléctrica (e = 1,022×10−19 C é o simétrico da carga electrónica) e do spin dos protões e dos neutrões. a qualquer destas duas partı́culas. (a) 99,95%, no átomo de hidrogénio, mais ainda nos restantes. 115 116 CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO Ao número total de nucleões num núcleo dá-se o nome de número de massa; ao número de protões, número atómico (b) . Dois núcleos com iguais números de protões e de neutrões são idênticos (não considerando a possibilidade de um deles estar num estado excitado); dizemos que pertencem ao mesmo nuclı́deo. Um determinado nuclı́deo é então especificado indicando o seu número de protões e de neutrões. Como o primeiro destes números identifica a espécie quı́mica, resta apenas indicar o número de neutrões ou, mais frequentemente, o número de massa. A notação habitual consiste em preceder o sı́mbolo quı́mico com o número de massa, sobreescrito. Facultativamente, pode explicitar-se o número atómico em subscrito, precedendo também o sı́mbolo quı́mico, e o número de neutrões, subscrito, após o sı́mbolo quı́mico. Assim, por exemplo, todas as seguintes notações identificam um mesmo nuclı́deo do cloro, aquele que tem número de massa igual a trinta e cinco: 35 Cl 35 17 Cl 35 17 Cl18 Dois nuclı́deos com o mesmo número de massa chamam-se isóbaros; quando têm iguais números atómicos, chamam-se isótopos; finalmente, chamam-se isótonos aqueles com iguais números de neutrões. Assim, o 12 C e o 14 C são isótopos; o 14 C e o 16 O são isótonos; o 14 C e o 14 N são isóbaros. O núcleo atómico é então um agregado de nucleões, de dimensões extremamente reduzidas, da ordem de, apenas, alguns fentometros(c) . Por serem tão pequenos, a forma dos núcleos não pode ser determinada directamente, mas podem obter-se algumas indicações a partir da distribuição de carga eléctrica nuclear (que, por seu turno, pode ser avaliada a partir de experiências de dispersão de electrões de muito alta energia). Deste tipo de estudos, pode concluir-se que os núcleos têm formas muito aproximadamente esféricas, verificando-se também núcleos com deformações oblatas (como a da Terra, a das tangerinas ou, ainda, num exemplo mais extremo, a das pizzas) e com deformações prolatas (como a das bolas de rugby ou a dos charutos). 8.2 A massa nuclear e a energia de ligação A massa nuclear é uma quantidade apropriada para ilustrar a equivalência massa-energia expressa na famosa equação E = mc2 da teoria da relatividade restrita. Tomemos, por exemplo, o caso do hélio-4. Os núcleos de hélio-4 são constituı́dos por dois protões e dois neutrões e tem uma massa de 4,0015 u; a soma das massas dos quatro nucleões que o formam, em contrapartida, tem o valor de 4,0319 u. A diferença entre estes dois valores corresponde à energia de ligação, que é libertada no momento em que os quatro nucleões se juntam. É melhor estudarmos esta questão com um pouco mais de atenção. Antes de ser proposta a teoria da relatividade, eram tomadas como verdadeiras duas leis de conservação independentes, a da massa (que se devia a Lavoisier) e a da energia (que foi sendo refinada ao longo dos anos até ser enunciada na forma da primeira lei da Termodinâmica). Supunha-se, então, que quando o estado de um sistema isolado evoluı́a entre dois instantes ti e tf > ti , eram satisfeitas, de forma independente, as igualdades M (ti ) = M (tf ) E(ti ) = E(tf ), onde M (t) e E(t) representam, respectivamente, a massa e a energia do sistema como funções do tempo. Sabemos agora que a primeira destas igualdades não é, em geral, exactamente satisfeita. Verifica-se, sim, a segunda mas, no cálculo da energia total de um sistema, devemos incluir a sua energia de repouso, dada por ERep. = M c2 , onde c = 3 × 108 m/s é a velocidade da luz e M é a massa do sistema. (b) Por (c) Um último, ao número de neutrões num núcleo dá-se o nome de... bem, número de neutrões. fentometro, mais habitualmente designado por fermi, é 10−15 m. 8.3. A FORÇA NUCLEAR FORTE 117 Voltemos agora ao exemplo do 4 He. Imaginemos que fornecemos, a um núcleo de 4 He, uma quantidade de energia, B, apenas suficiente para separar os quatro nucleões que o constituem, e analisemos este processo em termos da conservação de energia. Inicialmente, temos um núcleo de hélio-4 e uma quantidade de energia B. A energia inicial total é, então, E(ti ) = M ¡4 ¢ He c2 + B, ¡ ¢ onde M 4 He representa a massa do núcleo em estudo. No final, temos dois protões e dois neutrões afastados uns dos outros, em repouso. A energia final é, pois, E(tf ) = 2(mN + mP )c2 , onde mN e mP representam, respectivamente, as massas do neutrão e do protão. Igualando estes dois valores, de acordo com o prı́ncipio da conservação da energia, obtemos £ ¡ ¢¤ B = 2(mP + mN ) − M 4 He c2 o que explicita, de forma mais fundamentada, o que há pouco dissemos sobre esta diferença de massas. Este cálculo pode ser repetido para qualquer núcleo, o que nos permite definir, em geral, a energia de ligação num dado nuclı́deo arbitrário A Z XN como B ¡A Z XN ¢ £ ¡ ¢¤ = c2 N mN + ZmP − M A . Z XN A energia de ligação por nucleão (isto é, a energia de ligação cada núcleo dividida pelo seu número de massa) é, tipicamente, cerca de alguns MeV(d) . Por esta razão, usa-se em Fı́sica Nuclear, como unidade de massa, o Mev/c2 , cuja relação com a unidade de massa atómica e com o quilograma é 1 MeV/c2 = 1,07354 × 10−3 u = 1,78266 × 10−30 kg. Frequentemente, não se explicita o factor c2 na unidade, aparecendo a unidade como “MeV” apenas. Esta notação pode confundir um principiante, mas quaisquer dúvidas podem ser resolvidas rapidamente com análise dimensional. A energia de ligação por nucleão, dada por b(A, Z) = B(A, Z)/A, pode ser facilmente calculada dispondo-se de uma tabela de massas nucleares ou atómicas, como a que se pode consultar no Apêndice B do Blatt[1992]. Os resultados que se obtêm para os nuclı́deos estáveis(e) são os apresentados na Figura 8.1. Como se pode constatar, a partir de valores relativamente moderados do número de massa (A ≈ 25), a energia de ligação por nucleão apresenta um valor aproximadamente constante de cerca de 8 MeV. 8.3 A força nuclear forte A força responsável pela coesão dos núcleos não é, com certeza, uma força de natureza eléctrica ou gravı́tica. Não pode ser uma força eléctrica porque confina no interior do núcleo os neutrões, que são electricamente neutros. Não é, também, uma força gravı́tica porque esta não é suficientemente intensa para vencer a repulsão electrostática entre os protões que constituem os núcleos. É uma força de um tipo novo, a que se deu o nome de força nuclear forte ou, simplesmente, força forte, que apresenta uma série de caracterı́sticas especiais. (d) 1 MeV (e) Mais = 106 eV = 1, 602 × 10−13 J. adiante veremos que nem todos os nuclı́deos são estáveis. 118 CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO BA HMeVL 8 6 4 2 50 100 150 200 A Figura 8.1: Energia de ligação por nucleão (em MeV) como função do número de massa, para os nuclı́deos estáveis. 8.3.1 Saturação Num sistema de N corpos estabilizado pela força eléctrica (como o átomo) ou pela força gravı́tica (como o sistema solar), a energia potencial total é N U= 1X Vij , 2 i6=j onde Vij é a energia de interacção entre as partı́culas i e j (f) . Admitindo que esta energia tem um valor médio Ṽ , ficamos com 1 U = Ṽ N (N − 1). 2 A energia de ligação por partı́cula é, então, u≡ U 1 = Ṽ (N − 1). N 2 Vemos assim que a energia média de ligação por constituinte de um sistema eléctrico ou gravı́tico é uma função aproximadamente linear do número de constituintes do sistema. Ora, o mesmo não acontece com o núcleo. Como se mostra na Figura 8.1, a energia de ligação por nucleão tem um valor aproximadamente constante. Tal pode ser explicado admitindo que a força nuclear satura, isto é, que cada nucleão pode apenas interagir com um número finito de outros nucleões. Se cada nucleão, dos A que constituem um núcleo, interagir, apenas, com R outros nucleões, com uma energia média Ṽ , a energia total de ligação é, aproximadamente, A B= R 1 1 XX Ṽ = Ṽ AR. 2 i=1 j=1 2 (f) Inclui-se o factor 1/2 para corrigir a contagem das interacções. Com efeito, para calcular bem a energia potencial total, devemos contar apenas um vez cada uma das interacções entre as partı́culas que formam o sistema, ou seja, devemos contar apenas uma vez cada par de partı́culas. Ora, o somatório nesta equação faz aparecer cada par duas vezes, à medida que i e j correm todos os valores possı́veis de 1 a N . 8.3. A FORÇA NUCLEAR FORTE 119 R(fm) 208Pb 7 150Nd 138Ba 109Ag 6 66Zn 56Fe 5 89Y 36Ar 23Na 16O 12C 4 3 2 1 A1/3 0 0 1 2 3 4 5 6 Figura 8.2: Raio nuclear como função da raiz cúbica do número de massa. A energia de ligação por nucleão fica então B/A = 1 Ṽ R, 2 uma constante independente do número de massa A. Outro indı́cio desta saturação da força forte é o facto da densidade nuclear ser praticamente a mesma para todos os nuclı́deos. A Figura 8.2 mostra o raio nuclear como função da raiz cúbica do número de massa. Nota-se claramente a relação de proporcionalidade R = R0 A1/3 , (8.1) com R0 ' 1,25 fm, de onde se conclui que o número de massa é proporcional ao volume nuclear. Num sistema em que cada partı́cula interage com todas as restantes a intensidade da ligação é tanto maior quanto maior for o número de partı́culas, e portanto esperamos que a densidade dos sistemas “grandes” seja maior que a dos sistemas “pequenos”. Por exemplo, consideremos os átomos, sistemas geridos pela interacção electromagnética; aı́, não se verifica a proporcionalidade do raio do sistema (raio atómico) com a raiz cúbica do número de partı́culas (número atómico). Antes pelo contrário, à parte a descontinuidade que ocorre de cada vez que se fecha uma camada, verifica-se que o raio atómico diminui com o aumento do número atómico, aumentando, portanto, a densidade. O aumento da densidade com o aumento do número de partı́culas verifica-se também nos sistemas gravı́ticos, onde se nota que a densidade das estrelas de maior massa é maior que a das estrelas mais leves. 8.3.2 Alcance Ao contrário das interacções electromagnéticas e gravı́ticas que se fazem sentir a distâncias muito grandes, a força forte tem um alcance muito reduzido. Esta conclusão pode retirar-se da análise dos resultados de experiências de dispersão de partı́culas α de alta energia por átomos, semelhantes à experiência de Rutheford. Na experiência de Rutheford, a energia das partı́culas α incidentes determina a profundidade com que conseguem penetrar no interior do átomo. De facto, a energia potencial eléctrica da 120 CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO Intensidade (unidades relativas) 1000 100 10 1 10 15 20 25 30 35 40 Energia das partículas α (MeV) 45 Figura 8.3: Intensidade de um feixe de partı́culas α, difractado segundo um ângulo de 60◦ por um alvo de átomos de chumbo 208 Pb, como função da energia do feixe incidente. Os valores experimentais estão representados por cruzes e a linha representa o resultado de um cálculo considerando apenas a interacção electrostática entre o núcleo e a partı́cula α. (Krane[1988], Fig. 3.11). interacção entre uma partı́cula α e o núcleo de um átomo com o qual colide é (tomando a partı́cula α como pontual) 1 2Ze2 V = , 4π²0 r onde r é a distância que separa a partı́cula α do centro do átomo, Z é o número atómico dos átomos que constituem o alvo, e o módulo da carga electrónica e ²0 é a permitividade eléctrica do vazio. Considerando, para maior simplicidade, que o núcleo alvo tem uma massa muito maior que a da partı́cula α incidente, de tal modo que se possa desprezar o efeito do seu recuo na colisão, o maior valor que esta energia pode tomar é o da energia total, E, com que a fonte de partı́culas α as anima. Logo, partı́culas α com energia E podem aproximar-se até uma distância r= 1 2Ze2 4π²0 E (8.2) do centro atómico. Tentemos interpretar, à luz desta relação, os resultados experimentais relativos à dispersão de partı́culas α por átomos de chumbo 208 Pb, apresentados na Figura 8.3. Nesta figura, notase claramente que, quando a energia das partı́culas α não excede um valor de cerca de 27 MeV, as medições experimentais (cruzes) estão em bom acordo com os valores teoricamente previstos, considerando apenas a interacção coulombiana entre os núcleo e as partı́culas α. Esta convergência entre valores teóricos e experimentais mostra que a força forte entre o núcleo dos átomos de chumbo e as partı́culas α não tem qualquer papel na dispersão destas partı́culas, ou seja, elas não a sentem. A distância mı́nima entre projécteis e alvo é, para partı́culas α com 27 MeV, cerca de 8,5 fm(g) . Assim, concluı́mos que a força forte não actua a distâncias de cerca de 8 fm ou superiores. Cálculos mais precisos mostram que o alcance da força forte é de cerca de 2 a 3 fentometro. (g) Este valor resulta da aplicação Eq. (8.2). Em rigor, esta fórmula só é válida para partı́culas α que sofrem colisões frontais com os núcleos dos átomos do alvo e que, consequentemente, são desviadas de 180◦ (backscattering). Ora, os dados que usamos são relativos a partı́culas α que são desviadas de 60◦ . Estas partı́culas não se aproximam tanto do centro do núcleo com o qual colidem. 8.3. A FORÇA NUCLEAR FORTE 121 -0.1 A = 19 A = 25 A = 31 A = 37 -0.15 ε (GeV) -0.2 -0.25 -0.3 -0.35 -0.4 5 10 15 20 Z Figura 8.4: Energia de ligação subtraı́da da energia electrostática (calculada supondo o núcleo como uma esfera uniformemente carregada), para diferentes números de massa, A, como função do número atómico. Verifica-se, em cada sequência, que os valores obtidos para núcleos espelho (assinalados com as setas) são praticamente iguais. Para energias superiores, a proximidade máxima entre as partı́culas α e os núcleos de chumbo já é tal que a força forte contribui para o desvio do feixe incidente, afastando-se assim os resultados experimentais da previsão teórica. 8.3.3 Independência da carga Núcleos com o mesmo número de massa e com os números de protões e de neutrões trocados chamam-se núcleos espelho. Por exemplo, o 31 H e o 32 He são núcleos espelho. Outros exemplos são 53 53 63 o do 63 31 Ga e 32 Ge ou o do 28 Ni e 25 Mn. Quando subtraı́mos à massa de dois núcleos espelho a massa dos nucleões que os constituem e a massa correspondente à energia de repulsão electrostática entre protões, obtemos valores que são muito parecidos, como se pode verificar analisando a Figura 8.4. Deste facto podemos concluir que a força forte prende com a mesma força os protões e os neutrões, isto é, não depende da carga dos nucleões. Uma conclusão semelhante pode deduzir-se da análise de experiências de dispersão. 8.3.4 O deuterão e a dependência do spin Podemos obter mais informação sobre as caracterı́sticas da força nuclear considerando o mais simples dos núcleos compostos, o deuterão. O deuterão é o único núcleo com dois nucleões, sendo constituı́do por um protão e por um neutrão. A sua energia de ligação é de, apenas, 2,2 MeV e o seu momento angular total (que resulta da soma dos momentos angulares orbitais e dos spins dos dois nucleões) é 1(h) . Como não há outros núcleos compostos por dois nucleões, concluı́mos que o deuterão é o estado fundamental do sistema nuclear de dois corpos. Mas o estado fundamental de um sistema de dois corpos é um estado com momento angular orbital l = 0(i) (como o nı́vel 1-s do átomo de hidrogénio), logo, sendo 0 o momento angular orbital deste sistema, concluı́mos que (h) Estamos aqui a cometer um (muito habitual) abuso de linguagem. Aquilo que, de facto, queremos dizer é que p √ j = 1 é o número quântico de momento angular; o módulo do momento angular do deuterão é h̄ (j(j + 1)) = h̄ 2. (i) Isto só é verdade quando a força entre os dois corpos é uma força radial, isto é, dirigida segundo a direcção do segmento de recta que os une. O estudo das propriedades do deutrão mostra que a força nuclear viola ligeiramente esta condição, traduzindo-se este facto numa ligeira “contaminação” da função de onda do deutério por componentes com momento angular orbital l = 2. 122 CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO o momento angular total j = 1 apresentado pelo deuterão se deve a um alinhamento dos spins do protão e do neutrão. A força nuclear entre dois nucleões é, então, tal, que apenas se formam estados ligados quando os seus spins estão alinhados, de maneira a formar estados com momento angular orbital nulo, mas momento angular total igual a um. Isto mostra claramente que a força nuclear depende fortemente do spin das partı́culas em interacção. 8.4 8.4.1 Dois modelos para estrutura do núcleo O modelo da gota lı́quida O facto de a força nuclear ter um alcance limitado e ser uma interacção que satura, bem como o facto de a densidade nuclear ser constante, leva-nos naturalmente a pensar num núcleo atómico como uma gota de água. Com efeito, a água é um lı́quido essencialmente incompressı́vel, ou seja, tem densidade constante. Assim, o volume de uma gota é proporcional ao número de moléculas de água que a formam, o que leva a uma relação entre o raio da gota e o número de moléculas semelhante à Eq. (8.1). Considerando a dinâmica de uma gota de lı́quido, von Weizsäcker propôs a seguinte fórmula para a energia de ligação nuclear: B = x1 A − x2 A2/3 − x3 − x3 Z(Z − 1)A−1/3 − x4 (A − 2Z)2 + δ(A, Z). A (8.3) Os coeficientes x1 , . . . , x4 e a função δ(A, Z) são ajustados de forma a obter um bom acordo com a experiência. Uma escolha possı́vel é x1 = 15,5 MeV x3 = 0,72 MeV e x5 A−3/4 , 0, δ(A, Z) = −x5 A−3/4 , x2 = 16,8 MeV x4 = 23,0 MeV se Z e N forem pares se A for ı́mpar se Z e N forem ı́mpares, com x5 = 34 MeV. Justifiquemos agora os vários termos na Eq. (8.3): Termo de volume: o primeiro termo na fórmula de Wizsäcker é proporcional ao número de nucleões, ou seja proporcional ao volume. Supõe-se que quanto maior o número de partı́culas num sistema em que interagem atractivamente, maior a energia de ligação Termo de superfı́cie: o segundo termo é proporcional à potência 2/3 do número de partı́culas. Dada a Eq. (8.1), este termo é proporcional ao quadrado do raio atómico, ou seja, proporcional à área da superfı́cie do núcleo. Este termo é negativo, o que significa que se subtrai à energia de ligação. Basicamente, este termo favorece a forma esférica, que é a que menor área superficial apresenta para um dado volume. Termo de Coulomb: este termo toma conta do facto de a repulsão electrostática entre os protões no núcleo contribuir para diminuir a energia de ligação. Note-se que Z(Z − 1) é o número de pares de protões e A−1/3 é proporcional ao inverso do raio nuclear. Termo de simetria: este termo é mı́nimo quando os números de protões e de neutrões são iguais, e é incluido para reflectir o facto de os núcleos mais estáveis apresentarem um equilı́brio aproximado dos números dos dois tipos de nucleão. Veremos melhor daqui a pouco o porquê deste facto. Termo de emparelhamento: acontece que a força nuclear favorece o emparelhamento de nucleões do mesmo tipo. Em geral são mais estáveis os núcleos em que os números de neutrões e de protões são pares. Esta fórmula semi-empı́rica produz resultados notavelmente próximos dos valores experimentais. 8.4. DOIS MODELOS PARA ESTRUTURA DO NÚCLEO 123 10 50 82 Número de nuclídeos estáveis Número de nuclídeos estáveis 12 20 28 8 126 6 4 2 0 20 28 50 82 10 8 6 4 2 0 0 20 40 60 80 100 Número de neutrões 120 140 0 10 20 30 40 50 60 Número de protões 70 80 90 Figura 8.5: Número de núclideos estáveis como função do número de neutrões (à esquerda) e do número de protões (à direita). Nota-se bem (pelo menos no gráfico da esquerda) que os máximos ocorrem quando estes números são números mágicos. 8.4.2 Modelo em camadas Muitas propriedades atómicas, vistas como funções do número atómico, sofrem variações muito bruscas quando aquele número toma os valores 2, 10, 18, 36, 54, e 86. Dois exemplos deste efeito foram apresentados na Figura 1.9. Como vimos no primeiro capı́tulo, estas variações bruscas verificam-se quando se completam camadas na estrutura electrónica. Na fı́sica nuclear verificam-se também variações bruscas dos valores das propriedades fı́sicas do núcleo, quando os números de protões e/ou neutrões tomam os valores 2, 8, 20, 28, 50, 82, 126, chamados os números mágicos. Por exemplo, há mais nuclı́deos estáveis quando o número de neutrões é um número mágico, como se pode verificar analisando a Figura 8.5. O mesmo se verifica, mas de forma menos evidente, quando se considera o número de protões. Outras propriedades fı́sicas apresentam descontinuidades quando um dos (ou ambos) números de nucleões é um número mágico. Este facto inspirou um modelo da estrutura nuclear semelhante ao da estrutura atómica, segundo o qual cada nucleão se move sujeito a um potencial efectivo médio, relativamente independente das particularidades do movimento dos restantes nucleões. A interacção entre diferentes nucleões manifesta-se apenas na definição do potencial nuclear médio. Cada nucleão move-se em função desse potencial, independentemente dos demais. Isto permite grandes simplificações no tratamento matemático do sistema nuclear. Por exemplo, a Equação de Schödinger de um núcleo com número de massa A pode decompor-se em A equações de partı́cula única, uma para cada nucleão no sistema, com a forma ih̄ ∂ψ(~r, t) h̄2 2 =− ∇ ψ(~r, t) + Vef (~r)ψ(~r, t), ∂t 2m onde Vef (~r) é o potencial nucelar médio. Não se conhece ao certo, mesmo para os núcleos mais simples (como o deuterão, constituı́do apenas por um protão e um neutrão), a expressão analı́tica do potencial nuclear médio. Ou seja, não dispomos do equivalente a uma “Lei de Coulomb” na fı́sica nuclear. É possı́vel justificar a priori várias formas diferentes, que são, a posteriori, avaliadas em função da comparação dos resultados obtidos com valores experimentais. A prática mostra que um simples poço de potencial rectangular finito, ½ 0 se r > R0 Vppr (~r) = −V0 se r < R0 , onde R0 é o raio nuclear e V0 é a energia de ligação por nucleão, permite justificar algumas propriedades nucleares (por exemplo, os valores dos números mágicos 2, 8, 20,2 8, 50, 82, 126). Um outro modelo, mais sofisticado, é o de Saxon-Woods, em que o potencial médio é VSW (r) = −V0 , 1 + e(r−R0 )/a 124 CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO 0 V(r) r R0 -V0 Figura 8.6: Potencial nuclear rectangular (a tracejado) e potencial de Saxon-Woods (a cheio). P N 2 H P N 3 H P N 3 He P N 4 He P N 7 Li Figura 8.7: Digramas de ocupação de nı́veis nucleares para alguns nuclı́deos de baixo número de massa. onde a é uma medida da expessura da fronteira do núcleo. Na Figura 8.6 apresentam-se os gráficos destas duas funções. Há muitas outras propostas para o potencial nuclear médio, com diferentes qualidades na capacidade de descrever o núcleo e as suas propriedades. As duas que apresentámos são, apenas, as mais simples. Feita uma escolha para o potencial nuclear, a resolução da Equação de Schrödinger permite-nos determinar os estados nucleónicos, ou seja as orbitais que serão ocupadas pelos diferentes nucleões, da mesma maneira que a resolução da Equação de Schrödinger do átomo de hidrogénio nos fornece as orbitais electrónicas. Uma diferença importante entre estes dois exercı́cios é que, ao contrário do que acontece na nuvem electrónica, o núcleo é partilhado por dois tipos diferentes de fermiões, os protões e os neutrões. Os dois tipos de nucleões devem satisfazer, separadamente, o Princı́pio de Exclusão de Pauli. Devemos então concluir que há orbitais de protão e orbitais de neutrão, nı́veis de energia de protão e nı́veis de energia de neutrão. A Figura 8.7 mostra um esquema de ocupação de nı́veis para alguns nuclı́deos de baixo número de massa. Podemos agora colocar a seguinte questão: se a força nuclear forte não depende da carga, isto é, se a força nuclear forte não distingue protões de neutrões, porque é que não existem outros estados ligados de dois nucleões? Mesmo aceitando a que a repulsão electrostática inviabilize os “diprotões”, porque é que não são possı́veis “dineutrões”? Estes estados não são possı́veis por causa do Princı́pio de Exclusão de Pauli. Os dois nucleões num “dinucleão” devem estar no estado fundamental, logo, devem ter momento angular orbital l = 0 (tal como na fı́sica atómica, no estado fundamental o número quântico de momento angular só pode tomar o valor l = 0), logo, ambos têm número quântico de projecção de momento angular ml = 0; além disso, devem ter os spins alinhados no mesmo sentido, porque a força nuclear depende do spin e só com os spins alinhados é atractiva a força entre dois nucleões. Temos então dois nucleões no mesmo estado, com números quânticos n = 1, l = 0, ml = 0, ms = 1/2. De acordo com o Princı́pio de Exclusão de Pauli, isto 8. Problemas 125 só pode acontecer se os dois nucleões não forem idênticos, ou seja, se um for um protão e o outro um neutrão. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • P. Tipler e R. Llewellyn, “Fı́sica Moderna” (3.a edição), Capı́tulo 11: Fı́sica Nuclear • F. Blatt, “Modern Phisics” (1992) Capı́tulo 14: Propriedades dos Núcleos (F5.0 448) • R. Serway e R. Beichner, “Physics” (5.a edição), Capı́tulo 44: Estrutura Nuclear PROBLEMAS 8.1 Quais os valores dos números de massa, atómico e de neutrões para os nuclı́deos indicados abaixo? 18 F, 25 Na, 51 V, 84 Kr, 120 Te, 148 Dy, 175 W, 222 Rn. 8.2 Electrões emitidos no decaimento-β têm energias até cerca de 1 MeV. Usando o Princı́pio da Incerteza, mostre que eles não podiam existir no núcleo antes do decaimento. 8.3 Escreva os sı́mbolos de dois isótopos, de dois isótonos e de dois isóbaros dos nuclı́deos 120 Sn. 8.4 Determine as energias de ligação dos seguintes isóbaros: 23 Ne, 23 Mg, 23 18 F, 208 Pb, Al. 8.5 Repita o problema anterior, mas usando agora a fórmula de Weizsäcker. 8.6 Algumas estrelas podem, numa fase final das suas existências, sofrer um processo cataclı́smico em que se dá uma captura electrónica generalizada, processo que será estudado no próximo capı́tulo destes apontamentos. O astro resultante deste processo é composto quase só por neutrões e a sua densidade é muito aproximada à densidade nuclear. Calcule o raio de uma estrela de neutrões com massa igual à do sol, cerca de 2×1030 Kg. 8.7 O spin do estado fundamental do 6 Li, que constitui 7,5% do lı́tio natural, é nulo. Mostre que este valor é incompatı́vel com a hipótese de que os neutrões são pares protão-electrão. Capı́tulo 9 Fı́sica nuclear II — Reacções nucleares 9.1 Radioactividade Dos cerca de três mil nuclı́deos conhecidos, somente 278 são estáveis. Todos os restantes têm tendência para, de algum modo, se modificarem, transformando-se em núcleos de outra espécie. Este processo, que é expontâneo, chama-se decaimento nuclear e é acompanhado de emissão de radições. É o decaimento nuclear que está por trás do fenómeno da radioactividade, cuja descoberta por Becquerel em 1897 iniciou o estudo da Fı́sica Nuclear, numa altura em que quase nada se sabia ainda sobre a estrutura atómica. Os elementos cujos átomos têm núcleos instáveis chamam-se radioactivos. Os elementos com número atómico acima do do bismuto (83) são todos radioactivos. Mas este fenómeno não se limita ao extremo superior da tabela periódica. Todos os elementos têm alguns isótopos radioactivos, logo a partir do hidrogénio (por exemplo, o 3 H). 9.1.1 A região de estabilidade Em primeira aproximação, pode dizer-se que os núcleos estáveis são aqueles que apresentam iguais números de protões e de neutrões. Isto só é rigorosamente verdade para núcleos com número de massa não muito elevado. Quando este aumenta muito, a repulsão electrostática entre protões é tão elevada, que se torna necessário “diluir” os protões num número ainda maior de neutrões. Assim, à medida que aumenta o número de massa, verifica-se um aumento do peso relativo dos neutrões no núcleo. Na Figura 9.1, representa-se num diagrama (Z, N ) o conjunto dos núcleos estáveis. Nota-se aı́ o que acabámos de indicar: para pequenos valores de Z, os núcleos estáveis apresentam um equilı́brio aproximado dos números de protões e neutrões e, à medida que aumenta o número atómico, verifica-se um aumento do número relativo de neutrões. É fácil de compreender a forma do “Vale da estabilidade” em termos do modelo em camadas. O núcleo é um sistema de várias partı́culas, que são, essencialmente, de dois tipos(a) , protões e neutrões. No estado fundamental, estas partı́culas devem ocupar os estados de menor energia disponı́veis mas, como são fermiões, aplica-se o princı́pio de Pauli. Um grande desiquilı́brio entre os números de protões e de neutrões leva a que sejam ocupados estados de elevada energia do nucleão em excesso, havendo estados vagos do outro nucleão com menor energia. Assim, um nuclı́deo com um grande excesso de um dos nucleões pode atingir uma configuração de menor energia sofrendo um decaimento que aproxime os números de protões e de neutrões. Há vários tipos de processos de decaimento diferentes, identificados pelos tipos de radiações por eles emitido. Podem classificar-se em três famı́lias principais que são as fissões nucleares, as conversões internas e os decaimentos-β. (a) Veremos adiante que a coisa é um pouco mais complicada... 127 128 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES N 120 100 80 60 40 20 20 40 60 80 Z Figura 9.1: O “Vale da estabilidade”. Cada ponto representa um nuclı́deo estável. Nota-se claramente que, para nuclı́deos pequenos e médios, é favorecido um equilı́brio aproximado entre os números de protões e de neutrões. 9.1.2 Fissões nucleares Neste tipo de decaimentos, um núcleo parte-se em duas ou mais porções. Dá-se então um processo descrito por equações como A1 A2 A Z XN →Z1 Y1 N1 +Z2 Y2 N2 + . . . onde se verifica A Z N = A1 + A2 + . . . = Z1 + Z2 + . . . = N1 + N2 + . . . Decaimento-α As fissões mais frequentes consistem na emissão de um núcleo de hélio-4(b) Por exemplo, este é o principal processo de decaimento do isótopo do urânio mais abundante na Terra, o 238 U, 238 U →4 He +234 Th. Emissão de protões ou neutrões Outros processos de fissão frequentes são a emissão de neutrões ou de protões. Os nuclı́deos que decaem por estes processos apresentam sempre um grande excesso da partı́cula que emitem. Por exemplo, o alumı́nio tem o número atómico 13. O único isótopo estável do alumı́nio é o 27 Al, que tem 13 protões (claro) e 14 neutrões. Esta deve, então, ser considerada a distribuição de equilı́brio dos números de protões e neutrões no alumı́nio. O isótopo 21 Al tem, relativamente a (b) Recorde α. que os núcleos de hélio-4, constituı́dos por dois protões e dois neutrões, são também chamados partı́culas 9.1. RADIOACTIVIDADE 129 esta distribuição, uma grande deficiência de neutrões, que pode ser corrigida libertando alguns protões. Este é, de facto, o processo de decaimento do alumı́nio-21: 21 Al →20 Mg +1 H. O 5 He têm o problema inverso, tem neutrões a mais. O seu processo de decaimento é, então, a emissão de neutrões. Mas este é um mau exemplo, porque o que resulta deste decaimento é um neutrão livre e um núcleo de 4 He, ou seja, um neutrão e uma partı́cula α! Porque há uma partı́cula α no estado final, a este decaimento também se pode chamar decaimento α. Um exemplo melhor é o do enxofre-49. O enxofre tem um número atómico Z = 16 e o seu isótopo mais abundante é o 32 S. O 49 S tem pois 33 neutrões. Pode aliviar este desiquilı́brio neutrónico libertando neutrões, que é o processo pelo qual, efectivamente, decai: 49 S →48 S + n. Outros processos de emissão Para além da emissão de nucleões isolados e da emissão de partı́culas α, verificam-se ainda outros processos de emissão, como a emissão de protões dupla (é um dos processos de decaimento do berı́lio 6 Be, por exemplo), ou a emissão de núcleos mais complexos do que uma partı́cula α. Estes processos ocorrem sempre em concorrência com outros e nunca são os dominantes. Por exemplo, um em cada 7,7×1010 núcleos de protactı́neo 231 Pa decaem por emissão de núcleos de néon, através do processo 231 Pa →211 Tl +20 Ne. O processo dominante de decaimento deste nuclı́deo, no entanto, é o decaimento-α. Fissões propriamente ditas Apesar de termos definido todos os processos de divisão nuclear como fissões, reserva-se em geral este nome para processos em que um núcleo se parte em dois bocados mais ou menos semelhantes, com emissão de alguns nucleões isolados. Estes processos só se verificam expontaneamente para núcleos com número de massa muito grande, como o férmio 242 Fm, sendo, mesmo neste domı́nio, relativamente raros. 9.1.3 Conversões internas Num decaimento por conversão interna não há alteração de nuclı́deo, isto é permanecem constantes os valores dos números de neutrões e de protões (logo, permanece, também, constante o número de massa). Verifica-se apenas a emissão de radiação electromagnética de altı́ssima energia, que tem o nome de radiação gama. Os fotões deste tipo de radiação transportam um energia da ordem dos MeV, ou seja, são mil a um milhão de vezes mais energéticos do que os dos raios-X. O que se passa nestes processos é que um núcleo num estado energeticamente excitado decai para o seu estado fundamental, como acontece com os electrões atómicos nos processos de emissão e absorção tı́picos dos métodos da espectrometria. 9.1.4 Decaimento-β Num decaimento-β verifica-se a conversão de um protão num neutrão, ou vice-versa. O decaimentoβ mais frequente é o chamado β − , em que um neutrão se transforma num protão, sendo simultaneamente emitido um electrão. Outro processo-β possı́vel consiste na transformação de um protão num neutrão, com a emissão de um positrão.(c) Este processo tem um efeito semelhante (em termos de composição dos nuclı́deos ininical e final) ao da captura electrónica, em que um electrão e um protão colidem, aniquilando-se, criando-se, neste processo, um neutrão. Estes processos 130 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES e+ en p+ p+ n ep+ n Figura 9.2: Três processos de decaimento-β: β − (à esquerda); β + (ao centro); captura electrónica (à direita). Mais adiante veremos que se verifica a produção ou aniquilação de uma terceira partı́cula nestes processos, que não representámos nos diagramas. estão representados graficamente na Figura 9.2. Para além das partı́culas referidas, uma partı́cula adicional está envolvida; é o neutrino, que estudaremos mais em detalhe daqui a pouco. Os decaimentos β − e de captura electrónica são os mais frequentes em nuclı́deos que apresentam um grande desiquilı́brio entre os números de protões e neutrões. Os que têm excesso de neutrões sofrem, regra geral, decaimentos β − (transformando protões em neutrões) e os que excesso de protões tendem a decair por captura electrónica (realizando a transformação inversa). Por exemplo, apresentam-se em baixo os mecanismos de decaimento de alguns nuclı́deos, indicando-se entre parêntesis os valores da diferença entre o número de protões e neutrões: 46 26 Fe 75 27 Co 9.2 (Z − N = 6) c.e. −→ β − (Z − N = −21) −→ 46 25 Mn 75 28 Ni (Z − N = 4) (Z − N = −19) A lei do decaimento Todos os núcleos de um determinado nuclı́deo são, exactamente, iguais. Todas as propriedades de um núcleo de carbono 14 C são iguais às de outro núcleo de carbono 14 C. Em particular, a probabilidade de que se dê o decaimento de um dado núcleo de 14 C no próximo segundo tem o mesmo valor para todos os núcleos de carbono 14 C, quer tenham sido formados há dezenas de milhares de anos, quer tenham acabado de ser produzidos nalgum laboratório de Fı́sica Nuclear. Assim sendo, devemos concluir que a probabilidade de decaimento por unidade de tempo tem um mesmo valor, constante, para todos os núcleos de um dado nuclı́deo. A esta constante dá-se o nome de constante de decaimento. Seja ν a cosntante de decaimento para um dado nuclı́deo. Então, a probabilidade que um dado núcleo desse nuclı́deo sofra decaimento num intervalo de tempo infinitesimal dt é dP = ν dt. Considerando agora uma amostra com N núcleos deste nuclı́deo, o número expectável de decaimentos no mesmo intervalo de tempo é dado por N νdt, logo o número de núcleos na amostra sofre uma variação de dN = −N νdt, onde o sinal − traduz o facto de se tratar de uma diminuição. Desta equação resulta imediatamente a eqaução diferencial que rege a evolução daquele número, dN = −νN, dt cuja solução é N (t) = N0 e−ν(t−t0 ) , (9.1) onde representámos por N0 o número de núcleos presente na amostra num instante de referência t0 . A Figura 9.3 apresenta o gráfico desta função. (c) Um positrão é uma partı́cula idêntica ao electrão mas com carga oposta. É a anti-partı́cula do electrão, que discutiremos mais tarde. 9.2. A LEI DO DECAIMENTO 131 1 0.8 N/N0 0.6 0.4 0.2 0 0 1 2 3 t ν/ ln 2 4 5 6 Figura 9.3: Evolução do número de átomos que restam numa amostra de um isótopo radioactivo com constante de decaimento ν, contendo inicialmente N0 átomos. 9.2.1 Tempo de meia vida Como é bem visı́vel na Figura 9.3, em iguais intervalos de tempo, o número de núcleos da população inicial de uma amostra que não sofre decaimento é dividido por iguais factores, como é caracterı́stico da função exponencial. Podemos, pois, perguntar quanto tempo é necessário para que a uma população de núcleos radioactivos se reduza a metade. A este intervalo de tempo dá-se o nome de tempo de meia vida ou perı́odo de semi-desintegração. Representando-o por T1/2 e substituindo na lei do decaimento, temos N0 = N0 e−νT1/2 , 2 de onde resulta ln 2 . ν A “força” radioactiva de um nuclı́deo é mais frequentemente avaliada pelo perı́odo de semidesintegração do que pela constante de decaimento. T1/2 = 9.2.2 Duração média É impossı́vel saber, a priori, quanto tempo passará até que um dado núcleo de um nuclı́deo radioactivo sofra decaimento. Trata-se de um processo compleatamente aleatório. Apesar desta aleatoriedade, podemos calcular a duração média de um núcleo radioactivo. Esta duração média depende, obviamente, da constante de decaimento: quanto maior esta, menor deve ser aquela, naturalente. Podemos estimar a duração média de um núcleo de um nuclı́deo radioactivo considerando uma amostra com um grande número de núcleos desse nuclı́deo acabados de produzir(d) e fazendo a média estatı́stica das suas durações. Ou seja, calculamos a duração média, τ , dos núcleos deste nuclı́deo como N0 1 X τn , τ= N0 n=1 onde N0 é o número de núcleos inicialmente presentes na amostra e τn é a duração do n-ésimo. Se a amostra for suficientemente numerosa para que o cálculo tenha significado estatı́stico, não (d) Pouco importa de que modo esta amostra é produzida. Pode ser, por exemplo, através de um processo de activação por neutrões, mas os detalhes são, de facto, irrelevantes para esta discussão. 132 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES nos é possı́vel, por razões práticas, acompanhar o decaimento de cada um dos N0 núcleos. Assim, não podemos conhecer os valores, τn , das suas durações e, portanto, esta expressão é, de facto, inútil. O que podemos fazer é agrupar os vários núcleos da amostra em classes caracterizadas pela sua duração e tentar usar esta divisão para simplificar o cálculo. Consideremos então o intervalo temporal [t0 = 0, ∞] dividido em vários (infinitos, até) subintervalos I0 = [t0 , t1 [, I1 = [t1 , t2 [,. . . , Ik = [tk , tk+1 [,. . . (com t0 < t1 < t2 < . . . < tk < . . .) e sejam δN0 , δN1 ,. . . , δNk ,. . . os números de núcleos que decaem nos subintervalos I0 , I1 ,. . . , respectivamente. O somatório na expressão acima é dado aproximadamente por N0 X τn = n=1 ∞ X tk δNk . k=0 Se os subintervalos Ik forem suficientemente curtos, podemos fazer a aproximação µ ¶ dN δnk ' −δtk , dt t=tk onde δtk é a duração do k-ésimo intervalo e N (t) representa o número de núcleos da população inicial ainda presente na amostra no instante t. (O sinal menos aparece nesta igualdade porque a variação de N é negativa.) Considerando agora o limite em que a duração de cada subintervalo tende para zero, o somatório na expressão acima tende para um integral, N0 X Z ∞ τn = − t 0 n=1 dN dt dt Mas o número de núcleos presente na amostra é dado pela lei do decaimento, que deduzimos na secção anterior. Podemos, então, escrever N0 X Z τn = νN0 = N0 . ν ∞ t e−νt dt 0 n=1 Substituindo este valor na expressão do valor médio, obtemos, por fim, τ= 1 , ν ou seja, que a duração média de um núcleo radioactivo é igual ao inverso da sua constante de decaimento. 9.2.3 Energia libertada no decaimento Como já vimos quando discutimos a energia de ligação nuclear, a energia envolvida nos processos nucleares é da ordem de grandeza da energia de repouso dos núcleos envolvidos. Assim, não se verificam separadamente leis de conservação da massa e da energia, como nas reacções quı́micas, verifica-se antes uma lei da conservação da energia que deve incluir as energias de repouso das partı́culas que participam na reacção. Por exemplo, no decaimento de um núcleo radioactivo X, ele transforma-se no núcleo W, com emissão das partı́culas Y e Z (estas partı́culas podem ser um electrão e um neutrino, ou um núcleo e um neutrão, pouco importa). Esquematicamente, o processo pode ser representado como X → W + Y + Z. Analizado o processo no referencial do núcleo original, a energia total antes do decaimento é apenas a sua energia de repouso, mX c2 . Depois do decaimento, contabilizamos as energias de repouso das 9.3. ACTIVIDADE E DOSIMETRIA 133 partı́culas W, Y e Z, ([mY + mW + mZ ]c2 ) e a soma das suas energias cinéticas, que representamos globalmente por Q. O balanço energético permite-nos escrever Q = (mX − mY − mW − mZ )c2 . A quantidade Q é a energia libertada pelo decaimento. Por exemplo, o urânio-238 é o isótopo do urânio dominante na Terra. A sua massa atómica é 238,050784 u. Trata-se de um nuclı́deo instável, que decai por decaimento α com uma meia vida de cerca de 4,5 × 109 anos. O processo é 238 U→ 234 Th + α. Dado que as massas atómicas do tório e da partı́cula α são, respectivamente, 234,043593 u e 4,002603 u, concluimos que a energia libertada no decaimento de um núcleo de 238 U é Q = 4,588 × 10−3 uc2 ' 4,3 MeV. Este processo é a principal fonte de calor do interior da Terra. É graças à presença de urânio na Terra que o seu interior permanece no estado lı́quido, causando a actividade geológica do planeta. Esta expressão para o cálculo da energia libertada num decaimento pode ser generalizada a qualquer reacção, definido-se o chamado factor-Q do processo como sendo a diferença entre as energias de repouso dos reagentes e dos produtos da reacção. Assim, num processo A + B → C + D, o factor Q é Q = (mA + mB − mC − mD )c2 . O factor-Q de um decaimento é, de facto, a energia libertada no processo, porque é possı́vel tomar a energia cinética do núcleo no estado inicial igual a zero, escolhendo-se o seu referencial próprio para fazer o cálculo. Mas, num processo arbitrário como o que acabámos de considerar, o factor-Q já não é a energia libertada, mas antes a diferença entre a energia libertada e a soma das energias cinéticas dos reagentes. Isto é assim porque, para se dar a colisão entre os dois núcleos, eles não podem estar os dois em repouso no estado inicial, seja qual for o referencial que se considere. Assim, a energia do estado inicial inclui não só a energia de repouso dos reagentes, mas também a sua energia cinética, indispensável para que a colisão se dê, e este termo deve também ser incluido no balanço energético da reacção. 9.3 9.3.1 Actividade e dosimetria Actividade Chama-se actividade de uma amostra de um material radioactivo ao número de decaimentos nucleares que, nela, ocorrem por unidade de tempo. A unidade de actividade do Sistema Internacional é o bequerel (Bq) em honra ao cientista francês que descobriu a radioactividade. É uma unidade derivada com dimensões do inverso do tempo, isto é, 1 Bq = 1 s−1 . Regra geral, a radioactividade de uma amostra radioactiva deve-se a vários processos que ocorrem simultaneamente. Por exemplo, numa amostra de urânio dá-se o decaimento α dos núcleos de 238 U. Mas o resultado deste decaimento é o 234 Th, que sofre decaimento β, tranformando-se em 234 Pa que, por sua vez decai para 234 U por decaimento β, e a história não acaba aqui! Num dado instante, todos estes processos ocorrem e todos contribuem para a radioactividade daquela amostra. A actividade devida apenas ao decaimento de um nuclı́deo particular é, obviamente, igual à taxa de diminuição do número de núcleos desse nuclı́deo presentes na amostra, ou seja, A(t) = − dN , dt 134 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES onde N representa o número de núcleos do nuclı́deo considerado e A representa a actividade devida ao decaimento desses núcleos. Mas N é dado pela lei do decaimento, de forma que temos A(t) = νN (t) = νN0 e−νt = A0 e−νt , onde N0 representa o número de núcleos do nuclı́deo considerado presentes na amostra no instante inicial t0 = 0 e A0 representa a actividade devida ao decaimento desses núcleos, nesses mesmo instante. Vemos assim que a actividade devida a um decaimento particular segue uma evolução temporal semelhante à lei do decaimento. 9.3.2 Dose absorvida As partı́culas α β e γ produzidas nas reacções nucleares têm energias muito superiores às que normalmente estão envolvidas em reacções quı́micas. Assim, a sua absorção num meio material, e a consequente libertação da sua energia cinética, induz vários processos atómicos nesse material, como ionizações, deslocalizações de átomos(e) e reacções quı́micas. Estes efeitos são proporcionais à densidade de energia depositada no meio pela radiação. Para quantificar esta deposição de energia, definiu-se uma quantidade chamada dose absorvida, que é a energia absorvida por unidade de massa do meio exposto à radiação. A unidade do Sistema Internacional de dose é o gray (Gy) e é igual a um joule por quilograma: 1 Gy = 1 J kg−1 . Na Inglaterra e nos Estados Unidos é mais frequente a utilização do rad (iniciais de Radiation Absorved Dose) que é 100 vezes menor que o gray: 1 rad = 10−2 Gy. 9.3.3 Dose equivalente Todos os tipos de radiação transportam energia e a taxa temporal a que essa energia é depositada num meio material que a absorva pode ser muito elevada, se a radiação incidente for suficientemente intensa. Mas a intensidade da radiação apenas determina o número de quanta (fotões, no caso da radiação electromagnética, partı́culas α, β, neutrões, etc., no caso das radiações corpusculares) que, por unidade de tempo, são depositados no alvo. Os efeitos da exposição à radiação que referimos acima resultam da absorção destes quanta de energia e, portanto, dependem fortemente das suas caracterı́sticas, particularmente da sua energia. Por exemplo, a dose absorvida em meia hora de exposição ao sol num dia limpo, a meio da tarde, é aproximadamente igual à absorvida durante uma exposição de 6 horas à luz de uma lâmpada de 100 W (desde que o sujeito se mantenha a uma distância de cerca de 1 m da lâmpada). No entanto, a primeira exposição bronzeia-nos a pele (e pode alterar o funcionamento de algumas células da derme, provocando, nos casos mais graves, cancro da pele); a segunda exposição não tem efeitos apreciáveis. Isto é assim porque os fotões de radiação visı́vel têm uma energia de alguns eV apenas, ao passo que os fotões mais energéticos que chegam até nós vindos do sol (os da radiação utravioleta UVB) podem ter 100 a 1000 vezes mais. Estes fotões, ao contrário daqueles, têm energia suficiente para induzir reacções quı́micas como as que levam à produção de melanina na nossa pele, mas também a capacidade de ionizar moléculas de água e outras alterações bioquı́micas conducentes a patologias como o cancro de pele. Num contexto mais familiar para nós, são também estas questões que justificam que só com radiação com frequência suficientemente elevada se verifique o efeito fotoeléctrico, independentemente da intensidade dessa radiação. Para dar conta destes diferentes efeitos dos diferentes tipos de radiação, introduz-se uma nova quantidade, chamada equivalente de dose. O equivalente de dose de uma dada exposição é a dose (e) Em cristais, este processo faz aparecer lacunas cristalinas e átomos em posições intersticiais. 9.3. ACTIVIDADE E DOSIMETRIA 135 Radiação UVB,X,γ β neutrões lentos neutrões rápidos, protões, α núcleos pesados factor de qualidade 1 1 3 10 20 Tabela 9.1: Valores do factor de qualidade para diferentes tipos de radiação. de raios-X que produz os mesmos efeitos que essa exposição. Na prática, calcula-se o equivalente de dose, H, a partir da dose absorvida, D, através da expressão H = D Q, onde Q é um factor adimensional, chamado factor de qualidade, caracterı́stico da radiação absorvida, que é uma medida da sua perigosidade. Alguns valores do factor de qualidade estão apresentados na Tabela 9.1. A unidade de equivalente de dose é também, como a da dose absorvida, o J kg−1 , mas recebe agora o nome de sievert (Sv), para evitar ambiguidades em situações de emergência. Dados os valores apresentados na Tabela 9.1, podemos dizer que uma dose absorvida de 1 Gy de neutrões lentos é três vezes mais perigosa do que a mesma dose de raios γ e cerca de três vezes menos perigosa do que igual exposição a partı́culas α. À primeira corresponde um equivalente de dose de 3 Sv, à segunda 1 Sv, à terceira 10 Sv. Como para a dose absorvida, na Inglaterra e nos Estados Unidos não se costuma usar a unidade SI de equivalente de dose, é mais frequente a utilização do rem (Radiation Equivalent on Man), e que é cem vezes menor do que o Sv: 1 rem = 0,01 Sv. Refira-se, por fim, que a expressão “dose” indica mais frequentemente o equivalente de dose do que a dose absorvida. 9.3.4 Efeitos da exposição à radiação Em tecidos vivos, os processos de ionização podem ter um efeito muito negativo na fisiologia celular, porque esta depende muito de pequenos gradientes de potencial eléctrico através das várias membranas celulares, gradientes que se vêm fortemente perturbados pela presença dos iões causados pela irradiação. Além disso, a energia destas partı́culas radioactivas é mais do que suficiente para quebrar ligações quı́micas em proteı́nas, que são fundamentais para o bom funcionamento celular. A exposição à radiação é pois, em geral, extremamente prejudicial à saúde. Exposições moderadas podem causar náusea e vómitos e nota-se diminuição na produção de células sanguı́neas durante alguns dias. Exposições mais intensas podem agravar esta deficiência, causando anemia e debilidade face a infecções. Uma ainda maior exposição pode causar diversas formas de cancro. Uma exposição a uma fonte muito intensa pode causar morte em poucos dias ou, até, em breves minutos, por destruição pura e simples dos tecidos. Os limites legais para a exposição foram definidos pelo Decreto Regulamentar n.o 9/90 de 19-041990. Este Decreto determina doses máximas anuais de 50 mSv para a exposição uniforme de todo o corpo, e de 500 mSv para orgãos ou partes do corpo (por exemplo, as mãos)(f) . Para crianças, mulheres em idade reprodutora e mulheres grávidas, os máximos legais são mais reduzidos. (f) Note-se que, quando se calcula a dose absorvida por um órgão apenas, se divide a energia absorvida por esse órgão pela sua massa. Assim, um sujeito pode apresentar grandes doses absorvidas por orgãos particulares com uma dose absorvida pelo corpo todo relativamente baixa. 136 9.4 9.4.1 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES Aplicações da Fı́sica Nuclear Análise por activação com neutrões Consideremos um processo de captura neutrões genérico A X+n → A+1 X. Como resultado do processo de captura, o núcleo resultante fica num estado excitado, pelo que decai através de conversão interna e/ou outros processos como a fissão ou o decaimento β. O tipo de decaimento e a energia da radiação produzida dependem fortemente do núcleo resultante do processo de captura, ou seja, do núcleo original. Assim, é possı́vel determinar (qualitativa e quantitativamente) a composição de uma amostra de material desconhecido através da análise cuidada da radiação que se obtém por bombardeamento da amostra com neutrões. Esta técnica chama-se análise por activação com neutrões. 9.4.2 Produção de energia por fissão Quando o alvo num processo de captura de neutrões é de um nuclı́deo muito pesado, uma das possibilidades para o decaimento do núcleo resultante é a fissão. Por exemplo, consideremos o processo de captura de neutrões do urânio 235 U, 235 U+n → 236 U, no referencial do centro de massa do sistema, relativamente ao qual o 236 U resultante se encontra em repouso. O factor-Q desta reacção, Q = 6,544 MeV, não aparece como energia cinética dos produtos(g) mas como uma excitação interna do núcleo resultante. Esta energia é suficiente para vencer a barreira de potencial nuclear, de forma que o núcleo parte-se em vários bocados, incluindo vários neutrões (em média, 2,5, no caso da fissão do 235 U). Por exemplo, uma reacção usual é 235 U + n →93 Rb +141 Cs + 2n. O factor-Q desta reacção é cerca de 180 MeV. A energia libertada neste processo é, pois, enorme! Corresponde a 73 GJ por cada grama de urânio! Se todos os átomos de urânio de uma amostra sofressem este processo, bastavam perto de 60 kg de urânio para produzir energia energia semelhante à libertada por uma bomba de 1 MT(h) A possibilidade do aproveitamento desta imensa fonte de energia foi considerada imediatamente após a descoberta da fissão nuclear pelos fı́sicos alemães Otto Hahan e Fritz Strassmann, em 1938. Após apenas quatro anos, construiu-se o primeiro reactor nuclear experimental em Chicago, um esforço liderado pelo fı́sico italiano Enrico Fermi, e iniciou-se o Projecto Manhattan para a construcção da bomba atómica que viria a ter um papel decisivo no final da Segunda Grande Guerra. Reacções em cadeia, moderação de neutrões e enriquecimento de urânio O aproveitamento da energia libertada na fissão nuclear baseia-se na possibilidade do estabelecimento de reacções em cadeia, nas quais parte ou a totalidade dos neutrões libertados na fissão de um núcleo são capturados por outros núcleos vizinhos, provocando também a sua fissão e assim sucessivamente. Um problema que é necessário resolver para que se possa estabelecer uma reacção em cadeia é que os neutrões libertados por um processo de fissão nuclear têm uma energia cinética muito elevada; mas a probabilidade de captura de neutrões rápidos é muito baixa, logo, é necessário travar os neutrões, processo conhecido como moderação dos neutrões. (g) Há apenas um produto e encontra-se em repouso relativamente ao referencial considerado... megatonelada (MT) é a energia libertada por uma bomba com um milhão de toneladas de TNT. É o bastante para abrir no chão uma cratera com 1 km de diâmetro. Para se ter uma idéia, a energia libertada pela explosão da Bomba de Hiroxima foi 0,013 MT. (h) Uma 9.4. APLICAÇÕES DA FÍSICA NUCLEAR 137 Figura 9.4: Reacção em cadeia com um factor de reprodução próximo de 8/5. Representam-se os núcleos de urânio que sofrem fissão com cı́rculos negros, os neutrões que são capturados como setas a cheio, os que escapam sem induzir novas fissões com setas a tracejado. Não são representados os produtos da fissão. Os reactores de fissão mais vulgares usam urânio como material fissil. Mas o urânio é constituı́do principalmente por 238 U (99,3%) e 235 U (0,7%). Só o segundo destes isótopos, muito minoritário, decai por fissão após a captura de num neutrão. Os átomos de 238 U desempenham também um papel importante, na moderação dos neutrões. Nas colisões entre neutrões altamente energéticos e estes núcleos, aqueles induzem excitações nestes, perdendo parte da energia. Após algumas destas colisões, os neutrões já não têm energia suficiente para excitar os núcleos de 238 U, mas ainda são suficientemente rápidos para ser demasiado baixa a probabilidade de captura por um núcleo de 235 . Nesta fase, um neutrão pode apenas sofrer colisões elásticas com os núcleos dos átomos da amostra. Mas nestas colisões perde muito pouca energia, porque a sua massa é muito menor do que as dos núcleos com os que colide.(i) Numa colisão elástica, a partilha de energia entre os dois intervenientes só é apreciável se as suas massas forem semelhantes. Por esta razão mergulha-se o material fissil em água. As colisões de um neutrão rápido com os protões que constituem os núcleos de hidrogénio baixam rapidamente a sua energia até aos valores requeridos. Esta técnica tem um inconveniente: é que, na colisão entre neutrões e protões pode formar-se deutério, isto é, no processo de moderação de neutrões, os protões do hidrogénio competem com os núcleos de 235 U na captura de protões. Face a isto, ou se usa como moderador água pesada (as moléculas de água pesada têm átomos de deutério em vez de átomos de hidrogénio, e a probabilidade de captura de neutrões pelo deutério é praticamente nula) ou, em alternativa, aumenta-se a concentração de urânio 235 U, para compensar a diminuição da produção efectiva de neutrões capazes de induzir novas fissões. Para que se possa manter uma reacção em cadeia usando água vulgar como moderador, o teor de 235 U tem que ser elevado até cerca de 3%, cerca de quatro vezes mais do que o que se verifica no urânio natural. Este processo tem o nome de enriquecimento do urânio. Controle da taxa da reacção Chama-se constante de reprodução ao número médio de neutrões libertados na fissão de um núcleo que efectivamente induz novas fissões noutros núcleos. Note-se que o valor da constante de reprodução não depende apenas do número de neutrões libertado, porque alguns neutrões escapam da região onde se encontra o material fissil, ou são capturados por núcleos que não sofrem fissão (como os do hidrogénio da água usada na moderação). Na Figura 9.4 representa-se uma situação em que se pode estimar o factor de reprodução em 8/5. Pensemos numa reacção em cadeia como uma série de gerações, no sentido em que a fissão de um núcleo liberta neutrões que vão iniciar uma nova geração de fissões noutros núcleos. A constante de reprodução indica a razão entre os números de fissões que se dão em duas gerações sucessivas. Quando a constante de reprodução tem um valor inferior à unidade, a reacção em cadeia extingue-se: em cada nova geração, ocorrem (i) Da mesma maneira, quando atiramos uma bola de ping-pong contra outra de bilhar, vemos que a a primeira altera a direcção do seu movimento, mas o módulo da sua velocidade permace aproximadamente constante, ao passo que a bola de bilhar permanece num estado de movimento praticamente inalterado. 138 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES Barras de urânio Barras de controle (Cd) Figura 9.5: O controle do valor da constante de reprodução faz-se variando a posição e o número de barras de controle (a cinzento na figura). Estas barras são compostas por materiais com grande facilidade de captura de neutrões, por exemplo, cádmio. menos fissões do que na anterior; pelo contrário, quando a constante de reprodução é superior a um, então o ritmo a que a reacção se dá aumenta exponencialmente, já que em cada geração se dão mais fissões do que na anterior. Neste caso, lidamos com uma explosão nuclear como as das bombas atómicas. Do que acabámos de dizer, compreende-se que uma central nuclear para a produção de energia deve trabalhar num regime em que a constante de reprodução mantém, sempre, um valor exactamente igual a 1. Isso consegue-se dividindo o material fissil (urânio enriquecido) em várias amostras separadas (com a forma de barras cilı́ndricas) e introduzindo no reactor, itercaladas entre as barras de urânio, barras de materiais com elevada facilidade de captura de neutrões. A fracção dos neutrões que elas capturam pode ser regulada variando o número de barras ou a sua posição no reactor, o que permite uma variação em tempo real do valor da constante de reprodução. Produção da energia eléctrica A transformação da energia da reacção nuclear em energia eléctrica procede agora como numa central térmica vulgar: o calor libertado na reacção aquece água até a vaporizar a alta pressão; este vapor, por seu turno, empurra as pás de uma turbina electromagnética. Perigos da utilização da energia nuclear de fissão Além do perigo de uma reacção em cadeia explosiva, que se verifica quando a constante de reprodução ultrapassa o valor da unidade e que está relativamente bem controlado nos reactores nucleares, há uma série de riscos envolvidos na utilização da fissão nuclear controlada para a produção de electricidade. Um dos mais graves é o do sobreaquecimento do reactor. O interior de um reactor nuclear está normalmente a uma temperatura e pressão muito elevadas. Se se dá um aumento anormal destas duas variáveis, a blindagem que protege o reactor pode fundir-se e deixar escapar o material altamente radioactivo que se encontra no interior. Este material é, principalmente, a água usada no processo de moderação, mas é água activada pelo bombardeamento com neutrões, o que inclui uma série de substâncias altamente radioactivas e/ou, muitas vezes, quimicamente venenosas. O acidente deste tipo mais grave ocorreu em 1986 em Chernobyl, na Ucrânia. Este acidente causou a morte imediata a 30 pessoas e dados das autoriadas ucranianas estimam em mais de 2500 vı́timas mortais nos anos seguintes. O acidente obrigou à evacuação de mais do que 3500̇00 pessoas e os seus efeitos ainda se fazem sentir nas regiões próximas, nomeadamente numa maior radioactividade “natural” à qual está associada uma maior taxa de incidência de vários problemas de saúde, como cancro da tiróide (após o acidente, aumentou dez vezes em todo o território da Ucrânia) e mal-formações fetais. Outro problema grave prende-se com o que fazer do urânio quando o teor em urânio-235 se torna demasiado baixo para que se possa manter a reacção em cadeia activa. Este material é quimicamente venenoso e radioactivo pelo que o seu acondicionamento coloca graves proble- 9.4. APLICAÇÕES DA FÍSICA NUCLEAR 139 mas ambientais. Até agora, têm-se armazenado estes restos em instalações situadas em regiões desérticas ou encerrado em contentores estanques que são depositados em minas profundas ou no mar alto, mas não se sabe com certeza se estas soluções se podem considerar definitivas. 9.4.3 Fusão nuclear Dada a forma do gráfico da energia de ligação por nucleão (rever a Figura 8.1), compreende-se bem que seja possı́vel obter energia por fissão de núcleos grandes ou por junção de núcleos pequenos. A processos deste último tipo dá-se o nome de reacções de fusão. O sol e as estrelas produzem a sua energia por reacções de fusão. As estrelas não muito antigas são constituı́das essencialmente por hidrogénio. Na zona mais interna de uma estrela, a temperatura é tão elevada que os átomos de hidrogénio se encontram ionizados (ou seja, contitui-se um plasma de electrões e protões) e movem-se com uma velocidade tal que, quando chocam uns com os outros, têm energia suficiente para vencerem a repulsão electrostática mútua, aproximando-se tanto que entra em jogo a força nuclear forte. Por outro lado, nestas regiões a densidade é tão elevada que estas colisões ocorrem frequentemente, dando-se uma reacção de fusão (note-se que um dos protões sofre decaimento β) que produz deutério p + p → 2 H + e+ + νe . Uma colisão entre dois núcleos de deutério produziria directamente hélio-4 mas, como é muito maior a densidade de protões do que a de deuterões, estas colisões são muito menos prováveis do que colisões deuterão-protão, que produzem hélio-3: 2 H + p → 3 He. Dada a enorme densidade de protões no interior das estrelas, esta “promoção” do deutério a hélio-3 é muito rápida. Poderı́amos agora pensar que uma nova colisão com um protão, acompanhada do decaimento β de um dos protões produziria hélio, mas tal não é o caso, porque o núcleo de 4 Li formado pela colisão de um núcleo de 3 He com um protão decai (pela interacção forte) de novo num núcleo de hélio-3 e um protão, antes que o decaimento β que transforma um protão num neutrão possa ocorrer: 3 He + p → 4 Li →3 He + p. Por outro lado, como a densidade de deuterões é muito baixa (assim que são produzidos nas colisões p-p são imediatamente transformados em 3 He, as reações 3 He-2 H são também muito pouco improváveis. Os núcleos de hélio-3 vivem então tempos comparativamente longos (mesmo que assumindo fugazmente a forma de 4 Li), até que sofrem uma colisão com outro núcleo idêntico, em que, por fim, se produzem núcleos de hélio, através da reacção 3 He +3 He → 4 He + 2p. Este processo todo, que é a pricipal fonte de energia nas estrelas, vai consumindo o hidrogénio nas estrelas e transformando-o em hélio. Tem o nome de sequência protão-protão e está esquematizado na Figura 9.6 A sequência toda é equivalente à reacção 4p → 4 He + e+ + νe , e tem um factor-Q global de 26,7 MeV. Isto corresponde a 640 GJ por cada grama de hidrogénio consumido. É interessante comparar este valor com a energia libertada num processo quı́mico usual. Por exemplo, a combustão de hidrogénio para produzir água liberta 1, 4 × 105 J/g. A diferença é abissal. Desde o final dos anos quarenta, cientistas de vários paı́ses tentam reproduzir reacções como as da sequência protão-protão na Terra, de forma controlada, com o objectivo da produção industrial de energia. Estas reacções são muito vantajosas quando comparadas com as de fissão, porque nelas não se produzem isótopos radioactivos de longo perı́odo de semidesintegração. Com efeito, o principal produto é hélio, que não só não é radioactivo, é também quimicamente inerte (logo, 140 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES p p 2 p p ν e+ ν e+ p p 2 p H 4 He H p Figura 9.6: A sequência protão-protão. não é venenoso). Como se discute já a seguir, obrigar dois núcleos a colidirem é muito difı́cil. Por esta razão, todas as possibilidades actualmente em estudo para a produção industrial de energia através da fusão nuclear não consideram a utilização de hidrogénio 1 H como combustı́vel. Em vez disso, “saltam” os primeiros passos na sequência protão-protão e usam deutério (2 H) ou então uma mistura de deutério e trı́tio (3 H), aproveitando-se neste último caso a reacção 2 H + 3 H → 4 He + n. Para que se dê uma reacção nuclear, os dois núcleos envolvidos devem estar animados com uma energia cinética muito elevada, para que seja vencida a repulsão electrostática mútua. Podemos aumentar a energia cinética média dos átomos de uma amostra gasosa aquecendo-a. Para que sejam possı́veis reacções nucleares, um gás de hidrogénio (ou deutério, 2 H, ou trı́tio, 3 H) tem que ser aquecido até temperaturas da ordem de 108 K. A esta temperatura a agitação térmica é suficiente para, só por si, partir as moléculas e ionizar os átomos, formando aquilo que se chama um plasma, um gás de partı́culas carregadas. O aquecimento do gás, só por si, não chega para produzir reacções de fusão com a frequência necessária, porque, à medida que se vai aquecendo o gás, vai também aumentando o seu volume, se nada for feito para o impedir. Assim, diminui a densidade do gás, ou seja, os átomos que o compõem ficam mais afastados uns dos outros, logo, diminui a probabilidade da ocorrência de colisões atómicas. Assim, devemos também confinar o gás, de maneira a evitar a sua dilatação. O confinamento não pode ser feito pelas paredes do contentor onde se dá a reacção, pois das duas, uma: ou o contentor se encontra à temperatura do plasma, caso em que se vaporiza imediatamente, ou está a uma temperatura inferior, caso em que arrefece o plasma. Em vez disso, duas possibilidades têm sido investigadas: o confinamento magnético e o confinamento inercial. No confinamento magnético, usam-se forças magnéticas para manter o gás confinado. Mas, para que estas forças (que dependem da velocidade das partı́culas sobre as quais actuam) tenham um papel confinante, é necessário que as partı́culas carregadas que formam o plasma estejam animadas de uma velocidade colectiva bastante grande (quando comparada com a da agitação térmica). Para tal, aceleram-se estas partı́culas numa trajectória circular, dentro de um tubo que tem a forma de um grande donut, chamado tokamak, em torno do qual se enrolam condutores que criam no interior do tokamak um campo com a direcção do seu eixo. O efeito combinado deste campo com o criado pelo movimento do plasma mantém as partı́culas que o formam afastadas das paredes do tokamak. O maior tokamak construı́do até hoje é o JET (iniciais de Join European Torus), na Inglaterra. É o resultado de uma colaboração internacional de âmbito europeu. O próximo passo é tão dispendioso que se torna necessária uma colaboração ainda mais vasta, envolvendo a União Europeia, o Japão, a Rússia, os Estados Unidos e muitos outros. O resultado desta colaboração será a construção de um novo tokamak, maior que o JET, chamado ITER (International Thermonuclear Experimental Reactor) em Cadarache, na França. Espera-se que com este reactor seja possı́vel 9.4. APLICAÇÕES DA FÍSICA NUCLEAR 141 manter o regime de funcionamento durante perı́odos de tempo longos, provando-se a viabilidade de um reactor industrial. O segundo método de confinamento referido, o confinamento inercial, encontra-se numa fase mais atrasada de desenvolvimento, e tem sido investigado principalmente pro grupos norteamericanos. Neste método, usa-se uma gotinha de deutério e trı́tio, que é exposta a uma série de feixes de raios laser, que vaporizam as camadas exteriores da gota, comprimindo as interiores, tentando-se assim que estas atinjam as temperaturas e densidades necessárias para as reacções de fusão se iniciarem. Apesar dos meios astronómicos que se têm investido na investigação da fusão nuclear controlada, este esforço não foi ainda coroado de êxito. Ainda assim, deve dizer-se que a fusão nuclear “incontrolada” foi já dominada pelo homem. As bombas termonucleares(j) produzem a energia que libertam na explosão por processos de fusão, mas fazem-no de forma incontrolada. A temperatura e densidade necessárias para a fusão são possibilitadas por uma bomba atómica de fissão auxiliar, que rodeia o “combustı́vel” da bomba de fusão e que, ao explodir, comprime e aquece o material que compõe a bomba de fusão. 9.4.4 Aplicações à medicina Falta escrever esta subsecção. Os tópicos são: Ressonância magnética nuclear Imagiologia Radioterapia 9.4.5 Datação por carbono-14 O nosso planeta é continuamente bombardeado por partı́culas carregadas provenientes do Sol e também do exterior do sistema solar. A maior parte destas partı́culas são núcleos de todos os elementos da tabela periódica. Estas partı́culas têm origem em tempestades magnéticas na superfı́cie do Sol e de outras estrelas ou em supernovas e outros eventos cataclı́smicos. Muitas destas partı́culas carregadas são capturadas pelo campo magnético terreste, formando as chamadas cinturas de Van Allen, regiões com alta densidade de partı́culas carregadas circundando a Terra.(k) Os raios cósmicos que conseguem penetrar a blindagem magnética do nosso planeta chocam com as moléculas da atmosfera, produzindo um chuveiro de partı́culas secundárias, como raios-X e γ, electrões, positrões, neutrões, piões e muões que, por seu turno, participam em novas reacções nucleares quando colidem com moléculas de ar. Por exemplo, os neutrões reagem com núcleos de azoto, de acordo com 14 N + n → 14 C +1 H(l) . Este isótopo do carbono existe na Terra devido a este processo. O carbono-14 é instável, sofrendo o decaimento-β 14 C → 14 N + β − + ν̄e com um perı́odo de semidesintegração de 5730 anos. O facto de se dar a produção de átomos de carbono-14 a uma taxa constante não se traduz num aumento progressivo no seu número na Terra porque, paralelamente, se vai verificando o seu decaimento. Se T for a taxa de produção de 14 C e A a actividade (isto é, o número de decaimentos por unidade de tempo) deste nuclı́deo na Terra, então, num intervalo de tempo dt, o número, N , de (j) Também chamadas (erradamente) bombas de hidrogénio. partı́culas aproximam-se mais da atmosfera na região dos polos, onde ionizam as moléculas de ar em grandes quantidades, dando origem às auroras boreais. (l) Este processo ocorre, possivelmente, da seguinte forma: o núcleo de azoto (7 protões e sete neutrões) absorve o neutrão, mas fica num estado fortemente exitado, e liberta a energia em excesso emitindo um protão, resultando um nı́cleo com 6 protões e 8 neutrões, ou seja, um núcleo de 14 C. (k) Estas 142 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES 1.2 1 Nν/T 0.8 0.6 0.4 0.2 0 0 1 2 3 4 νt 5 6 7 8 Figura 9.7: Gráfico da evolução do número de núcleos de um nuclı́deo radioactivo com constante de decaimento ν, produzido a uma taxa constante T , partindo de uma contagem inicial de zero. átomos de carbono-14 presentes na Terra sofre uma variação dada por dN = T dt − Adt. Como já vimos, a actividade de uma amostra com N átomos de é A = νN . Substituindo acima, obtemos dN = T dt − νN dt, ou seja, dN = T − νN. dt Esta é uma equação diferencial ordinária, com coeficientes constantes, não homogénia, cujas soluções, bem conhecidas, são (verifique!) N (t) = ¢ T ¡ 1 − e−νt . ν O aspecto mais interessante da solução que encontrámos é o facto de o número de núcleos do nuclı́deo em questão tender para um valor de equilı́brio T /ν, como se pode verificar analisando a Figura 9.7, onde se representa o gráfico da função N (t). No caso que aqui nos interessa, verifica-se que a produção de carbono 14 C na alta atmosfera é tal que a fracção deste isótopo no carbono atmosférico é de 1,316 × 10−10 %, isto é, que, em cada 7,599 × 1011 átomos de carbono, um é de 14 C. O carbono existe na atmosfera na forma de dióxido de carbono, e é incorporado por muitas plantas nos seus tecidos através da fotossı́ntese. As relações alimentares distribuem depois o carbono por todos os seres vivos, de forma que podemos dizer que o teor de carbono-14 em todos os tecidos vivos (vegetais ou animais) é semelhante ao que se observa na atmosfera. Assim, uma pessoa com 67 kg de massa, dos quais 18 %, ou seja, 12 kg, são carbono, é constituı́da por cerca de 1000 mol ' 6 × 1026 átomos de carbono, o que corresponde a cerca de 8 × 1011 átomos de 14 C. Dada a constante de decaimento deste nuclı́deo, uma pessoa com 67 kg de peso deve apresentar uma actividade devida ao 14 C de cerca de 3 kBq. Após a morte de um ser vivo, a incorporação de carbono, pela fotossı́ntese ou pela alimentação, pára, evidentemente e, com o passar dos anos, vai diminuindo o número de átomos deste isótopo do carbono presentes nos restos mortais daquele ser vivo. A actividade radioactiva destes restos vai, portanto diminuindo. Comparando a actividade do carbono-14 de vestı́gios arqueológicos orgânicos (ossos, restos de peles, cabelo, lascas de madeira) com a esperada para seres vivos, pode deduzir-se a idade desses vestı́gios, isto é, quanto tempo passou desde que deixaram de pertencer a um organismo vivo. 9.5. ALGUNS TÓPICOS DE NOTICIÁRIO 143 Assim, se retirarmos uma amostra de 1,0 g de carbono de um organismo vivo, ou seja, 0,08 mol de átomos de carbono , esperamos que 1,316 × 10−10 % sejam átomos de carbono-14, o que corresponde a 1,1 × 10−13 mol ' 6,6 × 1010 átomos. A actividade desta amostra é A = νN = 0, 25 Bq. Uma vez que a actividade de uma amostra radioactiva segue o mesmo comportamento exponencial que o número de átomos presentes na amostra, o valor que determinámos para a actividade desta amostra deve ir diminuindo com o tempo. Assim, se retirarmos uma amostra igual de carbono de vestı́gios arqueológicos com 3000 anos, a sua actividade de ter-se-á reduzido, relativamente à de uma amostra idêntica mas “fresquinha,” por um factor igual a exp (−νt) ' 0, 70, ou seja, deve ter o valor de 0,17 Bq. Imaginemos agora que medı́amos a actividade de uma amostra de átomos de carbono com 0,5 g, retirada de restos recolhidos numa escavação, e determinávamos um valor de A(t) = 0,028 Bq. Dado o teor de carbono-14 na atmosfera, verificamos facilmente que a actividade de uma amostra semelhante recolhida de um tecido vivo é A0 = 0,127 Bq. A lei do decaimento, que podemos escrever como A(t) = A0 e−νt , pode agora ser resolvida em ordem a t, e obtemos t= 1 A0 ln ' 12500 anos. ν A(t) Este método não produz resultados fiáveis para datar vestı́gios recentes, digamos, com algumas centenas de anos, por exemplo, das invasões napoleónicas. Isto, porque num tão curto intervalo de tempo (quando comparado com o perı́odo de semi-desintegração do 14 C) o teor de carbono-14 não sofre uma variação discernı́vel. No extremo oposto, restos muito antigos, digamos, com mais do que 10 perı́odos de semidesintegração do 14 C (ou seja, cerca 50000 anos) não têm já uma actividade de carbono-14 detectável, porque o teor deste nuclı́deo que apresentam é já demasiado baixo. O processo de datação por carbono-14 serve então para datar vestı́gios arqueológicos mais antigos do que 500 anos e menos antigos do que 50000 anos. O método de datação que acabámos de ilustrar só é válido se o teor de carbono-14 se tiver mantido constante ao longo do perı́odo histórico (ou pré-histórico) ao qual se pretende aplicar. Mas este teor depende da concentração de azoto na atmosfera e do fluxo de raios cósmicos que atinge a atmosfera, que, por seu turno, depende da intensidade do campo magnético terreste. Ora, tanto a concentração de azoto como a intensidade do campo magnético terreste têm variado ao longo dos anos, de forma que na verdade os cálculos necessários para fazer datações com base no teor de 14 C são bastante mais complicados do que o que aqui exemplificámos. Outra possı́vel fonte de erro resulta da utilização de combustı́veis fósseis, generalizada a partir do sec. XX. A combustão de matéria orgânica é uma importante fonte de dióxido de carbono atmosférico.(m) Mas os combustı́veis fósseis, resultam da degradação de matéria orgânica ao longo de perı́odos de milhões de anos. Assim, o teor de 14 C do petróleo e do carvão e gás naturais é nulo. A utilização generalizada destes combustı́veis inunda a atmosfera de CO2 virtualmente desprovido de carbono14. Como as medições do teor deste isótopo na atmosfera foram todas feitas nas últimas dezenas de anos, é possı́vel que o tenhamos estimado por defeito. 9.5 9.5.1 Alguns tópicos de noticiário A radioactividade natural A matéria que compõe o nosso planeta inclui alguns isótopos instáveis, o que faz com que a Terra seja uma fonte naturalmente radioactiva. Recordemos, a propósito, que o inı́cio do estudo da Fı́sica (m) Este é um problema fulcral dos nossos dias, por causa do efeito de estufa global. 144 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES 124 126 128 130 132 134 136 138 140 142 144 146 N Z U U 92 Pa Th Ra Rn Po Po Po Bi 90 88 86 84 Bi Pb Pb Th Pb 82 Tl Hg 80 Figura 9.8: Cadeia de decaimentos do 238 U. Note-se que o chumbo 210 Pb pode sofrer decaimento α para 206 Hg ou decaimento β para 210 Bi. Nuclear deu-se com a descoberta desta radioactividade natural em 1897, por Becquerel, como já se disse. Alguns destes isótopos integram a composição da Terra desde a sua formação, há cerca de 4,5 × 109 anos. Por exemplo, o 238 U é relativamente abundante, pertencendo à composição de rochas como o granito. Outros, como o 14 C que já referimos, são produzidos pela interacção entre o planeta e a radiação cósmica, ou resultam do decaimento dos átomos do primeiro grupo, como o radão 222 Rn, que é um dos produtos da sequência de decaimentos que se inicia com o do 238 U. A presença de urânio (principalmente 238 U) na Terra é extremamente importante. O seu decaimento (e o do dos seus produtos) é a principal fonte de calor do interior da Terra. É, assim, ao urânio que devemos o facto de a Terra ter um núcleo lı́quido, logo, ser um planeta geologicamente activo. O urânio-238 sofre decaimento α com um perı́odo de semidesintegração de 4,5 × 109 anos, de acordo com o processo 238 U → 234 Th + α. O factor-Q deste decaimento é 4,27 MeV. O tório 234 Th é, também, instável, sofrendo decaimento β − com um perı́odo de semi-vida de 24,1 dias para o proctacnı́dio 234 Pa. A sequência completa termina no mercúrio 206 Hg e é ilustrada na Figura 9.8. Todos os nuclı́deos presentes no diagrama da Figura 9.8 são relativamente abundantes nas zonas ricas em granito, porque o urânio é um dos componentes deste mineral. O aspecto mais relevante, para a nossa vida no dia a dia, desta cadeia de decaimentos, é a presença do radão 226 Rn. Como se pode constatar, o radão-226 sofre decaimento α, e fá-lo com um perı́odo de semivida de 7,4 min. Mas o pior é que o radão é um gás, que se vai libertando das camadas superficiais das rochas onde é produzido, pelo que pode ser inspirado por animais e pessoas, depositando-se no organismo. Como é óbvio, a presença no interior do corpo de uma pessoa de uma fonte radioactiva não é nada benéfica para a sua saúde. Em cavernas, ou habitações pouco arejadas, a concentração de radão pode atingir valores suficientemente elevados para que as questões relacionadas com a exposição à radiação natural se tornem preocupantes. Este problema nota-se mais nas regiões granı́ticas (como a nossa), onde se verifica uma incidência ligeiramente maior de alguns tipos de cancro, resultantes da exposição à actividade do radão. 9. Problemas 9.5.2 145 A utilização de urânio empobrecido Comojá vimos, para a produção de energia por fissão nuclear de urânio, é necessário proceder ao enriquecimento do material fı́ssil, que consiste em elevar o teor de 235 U de 0,7 % (valor apresentado no urânio natural) para 3 %. Isto consegue-se através de processos fı́sicos, seleccionando átomos de 235 U e rejeitando os de 238 U de forma a serem obtidas as proporções requeridas dos dois isótopos. Um efeito secundário deste processo é a produção de grandes quantidades de urânio empobrecido, isto é, urânio em que o teor de 235 U é muito inferior ao que se verifica na natureza. Este facto coloca problemas delicados. Como quase todos os metais pesados, o urânio é um veneno quı́mico poderoso; logo não se pode, simplemente, despejá-lo no solo ou na corrente de um rio este resultado secundário do processo de produção. O seu armazenamento em grandes quantidades num local também não é aconselhável, porque, sendo o 238 U radioactivo (ainda que fracamente), a actividade do local de armazenamento pode atingir valores muito elevados. Mas note-se que este urânio empobrecido é menos radioactivo do que o urânio natural. Com efeito, dos dois isótopos mais frequentes na terra, o 235 U, que se aproveita no processo de enriquecimento, é o mais radioactivo, apresentando uma constante de decaimento cem mil vezes maior do que a do 238 U. Por ser tão fracamente radioactivo e por ser um metal extremamente duro e denso, o excedente de urânio empobrecido tem sido aproveitado para a produção de blindagens de veı́culos militares (tanques, etc.) e de munições capazes de as penetrar. Esta utilização tem causado alguma polémica porque tem sido associada a problemas de saúde (muitas vezes fatais) experimentados por soldados com missões em zonas de combate, mesmo quando escapam sem ferimentos dessas missões. Possivelmente, estes problemas de saúde devem-se a envenenamentos causados pela inspiração de fumos e poeiras ricos em urânio, resultantes das explosões de projécteis (e dos seus alvos) fabricados com urânio empobrecido. Bibliografia (Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI) • K. Krane, “Modern Physics” (1992) Capı́tulo 9,10: Fı́sica nuclear (F5.0 453) • K. Krane, “Introductory Nuclear Phisics” (1988) (F5.0 360) • F. Blatt, “Modern Phisics” (1992) Capı́tulo 14,15,16: Fı́sica nuclear (F5.0 448) • J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989) Capı́tulos 14 e 15: Fı́sica Nuclear (F5.0 437) • P. Tipler e R. Llewellyn, ”Fı́sica Moderna (3.a edição), Capı́tulos 11 e 12: Fı́sica Nuclear • Decreto regulamentar n.o 9/99 de 19-04-1990: http://www.diramb.gov.pt/data/basedoc/TXT_LN_2472_2_0001.htm PROBLEMAS 9.1 A taxa de contagem de uma fonte radioactiva é 4000 contagens por segundo num certo instante. Passados 10 s este valor reduz-se para 1000 contagens por segundo. (a) Qual o tempo de semidesintegração do material desta fonte? (b) Qual a taxa de contagem desta fonte passados 30 s do instante inicial? 9.2 Uma amostra de um isótopo radioactivo tem uma actividade 115,0 Bq num certo instante; passado 2 h 15 min, a actividade reduziu-se a 85,2 Bq. (a) Qual o valor da constante de decaimento? (b) Quantos núcleos radioactivos estavam presentes na amostra no instante inicial? 146 CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES 9.3 O nuclı́deo 62 Cu é produzido a uma taxa constante e sofre decaimento β + com uma meia vida de 10 min. Quanto tempo é necessário para produzir 90% do valor de equilı́brio de 62 Cu? 9.4 O urânio-238 sofre decaimento α com um perı́odo de semi-desintegração de cerca de 4,5×109 anos. (a) Qual o isótopo que resulta deste decaimento? (b) Qual o valor da actividade de uma amostra pura de 238 U com 1 g de massa? (c) Qual o valor da potência irradiada pela amostra da alı́nea anterior? 9.5 Calcule a energia libertada no decaimento α do por emissão de um nucleão isolado. 233 Np. Mostre que este nuclı́deo não pode decair 9.6 Identifique a partı́cula ou nuclı́deo X em cada um dos processos seguintes: (a) X → 65 Ni + γ (b) 215 Po → X + α (c) X → 55 Fe + e+ (d) 109 (e) 14 Cd + X → 109 Ag N +4 He → X + 17 O 9.7 Uma amostra de madeira, retirada de uma escavação arqueológica, com 21,0 mg de carbono apresenta uma actividade de 837 decaimentos por semana. Qual a idade desta amostra? 9.8 Bombardeando ouro natural (197 Au) com neutrões lentos, nota-se a emissão de radiação β − . Que reacção ocorre e qual o valor do seu factor-Q? 9.9 Um edifı́cio ficou acidentalmente contaminado com material radioactivo. Suponha que a substância com maior tempo de vida neste edifı́cio é o estrôncio-90, que tem uma massa atómica de 89,91 u e um perı́odo de semi-desintegração de 29,1 anos. Suponha que, como resultado do acidente, 5,0 kg de estrôncio-90 se espalharam pelo edifı́cio. Considerando que um nı́vel de radiação seguro é 10 decaimentos por minuto ou menos, durante quanto tempo deverá o edifı́cio manter-se encerrado ao público? 9.10 Uma fonte radioactiva tem uma actividade tal que, a 3,0 m de distância, se podem contar 3 fotões γ por segundo e por cm2 , com uma energia de 2 MeV. Uma pessoa com 70 kg, situada a esta distância, que dose absorve por minuto (considere que esta pessoa apresenta à fonte uma área eficaz de 0,8 m2 )? Quanto tempo pode a pessoa permanecer nesta posição antes de absorvem um equivalente de dose de 5 Sv? E se se tratasse de partı́culas α com a mesma energia? Capı́tulo 10 Elementos de Fı́sica Subatómica Terminámos o Capı́tulo 1 destes apontamentos com uma descrição bastante simples da realidade, segundo a qual a matéria seria constituı́da por apenas três tipos de partı́culas elementares: os electrões, os protões e os neutrões. A dualidade onda-corpúsculo veio complicar um pouco este estado de coisas, tendo obrigado à introdução dos fotões, as partı́culas de campo electromagnético, e fizémos já referência aos fonões, que são as partı́culas do campo das vibrações atómicas. Outra complicação foi a introdução dos positrões, a propósito do decaimento β + , no capı́tulo anterior. Na verdade, as coisas são muito mais complicadas. Muitos fenómenos não são compreensı́veis num quadro tão simplista. Por exemplo, os decaimentos β seriam incompatı́veis com as leis da conservação da energia e do momento se neles apenas intervissem protões, neutrões e electrões (ou positrões), como veremos daqui a pouco. Por outro lado, a dualidade ondas-partı́culas obriga (tal como para a força electromagnética e os fotões) à existência de quanta do campo da força nuclear forte. A decoberta destas partı́culas, necessárias por razões teóricas, foi acompanhada da de muitas outras que ninguém previra. No final dos anos cinquenta, começou até a falar-se do jardim zoológico das partı́culas elementares(a) . É este o assunto que nos vai ocupar agora. 10.1 A selva das partı́culas elementares 10.1.1 O positrão de Dirac Como deve já ser bem sabido, no formalismo da Mecânica Quântica cada variável fı́sica é representada por um operador que actua num espaço de funções, ou espaço de estados. À energia corresponde o operador ih̄∂/∂t, ao momento linear (na representação das coordenadas) o operador ~ à posição (na mesma representação) o operador de multiplicação pelo vector posição, isto −ih̄∇ é, ~r×. Assim, a Equação de Schrödinger, ih̄ ∂ψ(~r, t) h̄2 2 =− ∇ ψ(~r, t) + V (~r)ψ(~r, t), ∂t 2m corresponde à equação clássica p2 + V (~r). 2m Os dois termos no lado direito desta equação são, como é bem sabido,a energia cinética e a energia potencial, respectivamente. Mas a energia cinética aparece nesta expressão na forma não relativı́stica. Logo a Equação de Schrödinger é uma equação não relativı́stica também(b) . Tentemos deduzir uma equação de onda relativı́stica mas, para simplificar, consideremos apenas partı́culas E= (a) Talvez fosse mais adequada a expressão selva das particulas elementares. era preciso tanto para chegarmos a esta conclusão, bastava notar que as derivadas em ordem ao tempo e às coordenadas espaciais não têm a amesma ordem. Nas equações relativı́sticas, tempo e espaço desempenham papéis formalmente semelhantes. (b) Não 147 148 CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA livres, isto é, não sujeitas a forças, logo, com energia potencial constante que pode ser escolhida nula. A expressão clássica da energia cinética relativı́stica é E 2 = p2 c2 + m2 c4 . Fazendo a correspondência anterior entre variáveis fı́sicas e operadores quânticos, ∂ ∂t ~ p~ → −ih̄∇, E → ih̄ obtemos uma equação equação de onda relativı́stica para partı́culas livres, chamada Equação de Klein-Gordon: ∂ 2 ψ(~r, t) −h̄2 = −h̄2 c2 ∇2 ψ(~r, t) + m2 c4 ψ(~r, t). ∂t2 Esta equação levanta alguns problemas. O mais relevante para a presente discussão é o facto de, para um dado vector momento linear (qualquer), haver dois estados distintos com energias simétricas uma da outra, dadas por p E = ± p2 c2 + m2 c4 . É difı́cil compreender como é que uma partı́cula livre pode ter energia cinética negativa ou qual o significado dum tal valor energético. Deve dizer-se, a propósito, que Schrödinger começou por tentar uma descrição relativı́stica dos electrões, tendo deduzido inicialmente a Equação de KleinGordon. No entanto, face às dificuladades que descrevemos, desistiu e contentou-se com um formalismo não relativı́stico. A gravidade da existência de estados com energia negativa pode ser melhor apreciada se considerarmos um electrão livre, parado. Classicamente, este electrão está num estado em que a sua energia é mc2 , onde m é a massa electrónica. Em contrapartida, de um ponto de vista quântico, esta partı́cula, no estado de repouso, tem à sua disposição um estado com energia −mc2 , logo deveria ser possı́vel uma transição para este estado, acompanhada da emissão de radiação com energia 2mc2 . Um tal fenómeno parece pouco menos que absurdo. Com efeito, é difı́cil dar um significado fı́sico à energia de uma partı́cula livre, se ela puder tomar valores inferiores ao que apresenta no estado de repouso. Este problema do significado das soluções da equação de onda com energia negativa começou a ser resolvido por P. A. M. Dirac no final dos anos vinte. Dirac deduziu uma equação de onda relativı́stica de primeira ordem, cujas soluções com energia positiva descreviam correctamente o comportamento dos electrões. Tomando o limite não relativı́stico da Equação de Dirac resultava a Equação de Schrödinger, e o momento angular intrı́nseco (ou spin) surgia naturalmente neste limite. Apesar destes sucessos, as soluções da Equação de Dirac apresentavam também dois valores de energia simétricos. Considerando electrões livres, os dois valores são os mesmos que resultam da Eqaução de Klein-Gordon. Neste aspecto, a Equação de Dirac, por si só, não representou um grande avanço. Considerando que a sua equação descrevia electrões, que são fermiões, Dirac fez uma suposição arrojada para tentar resolver o problema colocado pelas soluções de energia negativa: afirmou que estes estados existem, de facto, mas estão, em condições normais, todos ocupados. Assim, um electrão com energia positiva não pode sofrer uma transição para um estado com energia negativa porque o Princı́pio de Exclusão de Pauli proı́be-o. Deste modo, Dirac preencheu todo o universo com electrões com densidade infinita, inobserváveis porque distribuidos uniformemente. A estes electrões (em número infinito), que ocupam todos os estados com energia negativa, dá-se o nome de mar de Dirac. Esta hipótese permite fazer previsões interessantes. Por exemplo, tal como as vibrações atómicas num semicondutor podem excitar um electrão da banda de valência para a de condução, deixando, na primeira, uma lacuna, também deve ser possı́vel um fotão com energia igual ou superior a 2mc2 excitar um electrão do mar para um estado com energia positiva. Neste processo, um estado com energia negativa fica vago, podendo ser identificado com uma partı́cula com massa igua à do electrão mas carga 10.1. A SELVA DAS PARTÍCULAS ELEMENTARES γ 149 e- e+ e+ γ γ eE mc 2 E γ mc 2 0 0 -mc 2 -mc 2 γ Figura 10.1: Criação (à esquerda) e aniquilação (à direita) de pares electrão-positrão. Em cima, diagramas esquemáticos dos processo; em baixo, interpretação de Dirac. com sinal oposto — um positrão. Este processo tem o nome de criação de pares e ocorre muito frequentemente em experiências de alta energia. Dirac previu também a possibilidade da ocorrência do processo inverso, em que um electrão e um positrão colidem, aniquilando-se mutuamente, produzindo radiação. Para Dirac, acontecimentos deste tipo ocorreriam quando um electrão com energia positiva sofresse uma transição para um estado vago (lacuna ou positrão) de energia negativa. Este processo é hoje em dia bem conhecido e tem o nome de aniquilação de pares. A criação e aniquilação de pares estão representados graficamente na Figura 10.1. O positrão foi descoberto em 1933, por C. Anderson, quando analizava a radiação cósmica. 10.1.2 O neutrino de Pauli O decaimento β, tal como o descrevemos até agora, tem alguns aspectos que causam preplexidade. Consideremos, por exemplo, o caso do bismuto 210 Bi. Este nuclı́deo sofre decaimento β com um perı́odo de semidesintegração de cerca de 5 dias. De acordo com o que estudámos no capı́tulo anterior, o decaimento deste nuclı́deo é 210 Bi → 210 Po + e− , com um factor-Q aproximadamente igual a 1,2 MeV. Consideremos o decaimento usando o referencial do centro de massa do sistema, relativamente ao qual o núcleo de bismuto se encontra em repouso. De acordo com a lei da conservação do momento linear, após o decaimento, o electrão e o núcleo de polónio devem seguir em sentidos opostos, com momentos lineares com módulos iguais. Mas a massa do núcleo de polónio é cerca de 200 000 vezes maior do que a do electrão, logo, a velocidade daquele deverá ser menor do que a deste na mesma proporção. Pela mesma razão, a energia cinética do núcleo de polónio será, também, 200 000 vezes menor do que a do electrão, ou seja, o electrão emitido no decaimento β do 210 Bi deve ficar animado com uma energia cinética que é praticamente igual ao factor Q do decaimento, 1,2 MeV. E, no entanto, a análise da energia dos electrões resultantes do decaimento β do bismuto (ou de outras substâncias) revela uma realidade bem diferente. Em vez de terem uma energia bem determinada (1,2 MeV no decaimento do bismuto, outros valores para outros nuclı́deos) os electrões emitidos durante o decaimento β têm energias que se distribuem continuamente num intervalo que é limitado superiormente pelo factor Q do decaimento. Por exemplo, para o bismuto 210 Bi, Ellis e Wooster fizeram, em 1927, uma determinação da curva de distribuição dos electrões emitidos, como função da sua energia, cujo resultado se ilustra na Figura 10.2. O facto de alguns (quase todos) os electrões serem emitidos 150 CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA Figura 10.2: Distribuição energética dos electrões emitidos no decaimento β do 210 Bi (Proc. Royal Soc. A117 109 (1927). no decaimento beta com uma energia cinética tão menor do que o factor Q do decaimento parece constituir uma violação do princı́pio da conservação da energia.(c) Outro aspecto estranho do decaimento beta pode ser mais facilmente ilustrado quando se considera o mais simples destes processos, o decaimento de um neutrão. Mais uma vez, consideremos o processo relativamente ao referencial do centro de massa do sistema. Antes do decaimento, o sistema consiste num neutrão em repouso. O momento angular deste sistema reduz-se então ao spin do neutrão, 1/2. Depois do decaimento, o sistema consiste num protão e num electrão, que se movem(d) em direcções opostas com momentos lineares de igual módulo, logo, com momento angular orbital nulo. O momento angular total deste sistema é o que resulta da composição dos spins das duas partı́culas. Mas o momento angular total de um sistema de dois fermiões com spin 1/2 com momento angular orbital nulo pode ser 0 ou 1, nunca 1/2. Assim, aparentemente, o decaimento β não só não verifica a lei da conservação da energia como também viola a da conservação do momento angular. Pauli conseguiu resolver este problema com uma hipótese que começou a desenvolver em 1930, e que foi sendo refinada nos anos seguintes, por ele e por Fermi. De acordo com esta hipótese, no decaimento β seria emitida uma terceira partı́cula, com spin 1/2 (de maneira a garantir a satisfação da lei da conservação do momento angular), com carga nula (para satisfazer a lei da conservação da carga eléctrica) e com massa muito, muito pequena, muito menor do que a do electrão, eventualmente nula (como a do fotão), que repartiria com o electrão a energia disponı́vel resultante do decaimento. A massa dos neutrinos (como vieram a ser conhecidas estas novas partı́culas) tinha que ser mesmo muito reduzida, porque alguns electrões são emitidos no decaimento β com uma energia muito próxima do valor máximo, isto é, do factor-Q do decaimento(e) . O neutrino foi descoberto só em 1952, por F. Reynes e C. Cowan. Este atraso justifica-se em parte pelo eclodir da Segunda Grande Guerra, mas principalmente pelo carácter esquivo dos neutrinos. Note-se que, para se observar uma partı́cula, ela deve, de algum modo, interagir com o instrumento detector. Assim, por exemplo, os nossos olhos são capazes de detectar fotões, através de um processo de captura que se dá na retina. Ora, os neutrinos não têm carga eléctrica e verifica-se que são insensı́veis, tal como os electrões, às interacções fortes. Assim, restam as possibilidades de interagirem através de interacções dipolares magnéticas (muito menos intensas que as eléctricas), caso tenham momento magnético, questão que ainda está em aberto, ou através (c) Niels Bohr chegou a considerar a hipótese da violação efectiva dessa lei nos processos microscópicos. bem dizer, o protão fica praticamente parado, por ser muito mais pesado do que o electrão... (e) A questão da massa dos neutrinos ficou em aberto até muito recentemente, quando a colaboração SuperKamiokande anunciou (em 1998, 46 anos depois da descoberta dos neutrinos!) resultados que mostravam indubitavelmente que o seu valor é não nulo. (d) A 10.1. A SELVA DAS PARTÍCULAS ELEMENTARES 151 ν ν ν e+ en p+ p+ n ep+ n Figura 10.3: Diagramas da Figura 9.2, agora incluindo os neutrinos. Representam-se as linhas de neutrinos com o sı́mbolo ν e as de antineutrinos com ν̄. de uma outra força por enquanto ainda não referida, com intensidade muito baixa. Seja como for, os neutrinos praticamente não interagem com a matéria e, portanto, é extremamente difı́cil detectá-los. Esta propriedade inspirou o poeta norte-americano Jonh Updike para a escrita do seguinte poema, publicado pela primeira vez em 1960: Cosmic Gall: Neutrinos, they are very small. They have no charge and have no mass And do not interact at all. The earth is just a silly ball To them, through which they simply pass, Like dustmaids through a drafty hall Or photons through a sheet of glass. They snub the most exquisite gas, Ignore the most substantial wall, Cold-shoulder steel and sounding brass, Insult the stallion in his stall, And scorning barriers of class, Infiltrate you and me! Like tall And painless guillotines, they fall Down through our heads into the grass. At night, they enter at Nepal And pierce the lover and his lass From underneath the bed-you call It wonderful; I call it crass.(f) Por razões que serão explicadas mais adiante, convencionou-se que, no decaimento-β do neutrão, era emitida a anti-partı́cula do neutrino, ao passo que os neutrinos seriam emitidos nos decaimentos-β + . Podemos agora desenhar completar mais correctamente os diagramas da Figura 9.2, incluindo o neutrino (ou anti-neutrino). Os diagramas corrigidos estão apresentados na Figura 10.3. (f) Desconsideração cósmica: Neutrinos, são muito pequeninos./Eles não têm carga e não têm massa/E não interagem com nada./A Terra é apenas uma bola tonta para eles, através da qual eles simplesmente passam/Como criadas limpando o pó, através de uma sala ventosa/Ou fotões através de uma lâmina de vidro./Eles desprezam o gás mais fino,/ Ignoram a barreira mais substancial/O duro aço e o sonoro bronze/Insultam o garanhão no seu pedestal/E desrespeitando as barreiras de classe,/Infiltram-se em ti e em mim! Como altas/E indolores guilhotinas, eles caem/através das nossas cabeças até à relva./À noite, entram no Nepal, perfuram o amante e a sua amada/De debaixo do seu leito — Tu acha-los/ Maravilhosos; eu acho-os estúpidos. (Traduzido “às três pancadas”.) 152 CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA e- eγ e- e- Figura 10.4: Dispersão de Rutheford de dois electrões. e- γ e- γ e- e- Figura 10.5: As duas interacções que compõem o processo da Figura 10.4. 10.1.3 O mesão π de Yukawa e um convidado inesperado Quantização das interacções electromagnéticas Noutras disciplinas, estudou-se já a descoberta das caracterı́sticas corpusculares da luz e a importância que essa descoberta teve para o emergir da Fı́sica Moderna. Vejamos, por outro ângulo, essas caracterı́sticas. É que a luz, sabe-se desde Maxwell e Hertz, é campo electromagnético; por seu turno, o campo electromagnético é o intermediário das interacções eléctricas e magnéticas. Quer isto dizer que duas cargas na proximidade uma da outra não se influenciam directamente uma à outra, cada uma é influenciada pelos campos eléctrico e magnético gerados pela outra. O facto destes campos terem carterı́sticas corpusculares deve traduzir-se na descrição que fazemos da interacção entre as duas partı́culas carregadas. De facto, assim é. Nos termos da Mecânica Quântica, cada partı́cula carregada é fonte constante de fotões; a colisão desses fotões com outra partı́cula carregada altera o seu estado de movimento, traduzindo-se este processo numa interacção efectiva entre as duas partı́culas carregadas. O mais simples dos processos deste tipo chama-se dispersão de Rutheford e consiste na colisão entre duas partı́culas com carga eléctrica do mesmo sinal. A dispersão de Rutheford de dois electrões está representada graficamente, na sua forma mais elementar, na Figura 10.4. Um dos electrões (digamos, aquele que está representado à esquerda) emite, na direcção do outro electrão um fotão, sofrendo um recuo no sentido oposto, ou seja, para a esquerda; quando este fotão colide com o outro electrão empurra-o, afastando-o do primeiro. Assim, o efeito desta troca de fotões é semelhante ao de uma força repulsiva entre os dois electrões(g) . O processo que acabámos de descrever consiste, de facto, em duas interacções: a emissão de um fotão por um electrão e a absorção desse fotão por outro electrão. Estes dois acontecimentos podem representar-se graficamente como se mostra na Figura 10.5. O fotão trocado entre os dois electrões não pode ser um fotão “normal”. Consideremos o processo de emissão, por exemplo (o vértice representado à esquerda na Figura 10.5). No referencial do centro de massa do sistema, antes da colisão, o sistema consiste apenas num electrão parado, com momento linear nulo e energia Ei = me c2 . Depois da colisão, o sistema consiste em duas (g) Mas esta descrição, nos termos clássicos de efeitos de recuo e colisão quando se emite e absorve um fotão não deve ser tomada à letra. Por exemplo, é muito difı́cil descrever desta forma a atracção entra cargas de sinal diferente... Como veremos já a seguir, estes fotões são partı́culas não muito “normais”. Chega a noção que eles transportam, de algum modo, a interacção entre partı́culas carregadas. 10.1. A SELVA DAS PARTÍCULAS ELEMENTARES 153 partı́culas, um fotão e um electrão, respectivamente com energias Eγ e E 0 e. De acordo com as bem conhecidas leis de conservação, deve conservar-se o momento linear total e a energia. Assim, o fotão e o electrão devem mover-se em sentidos opostos, com iguais módulos do momento linear. Mas então a energia total do sistema depois da colisão, dada por Ef = = Eγ + Ee0 p h̄ω + m2e c4 + p2 c4 , onde p é o módulo do momento linear das duas partı́culas e ω é a frequência da radiação associada ao fotão emitido, é superior à energia total do sistema antes da colisão! Dá-se, assim, uma violação da lei da conservação da energia?! Uma análise semelhante levaria a um paradoxo semelhante a propósito do processo de absorção do fotão, no vértice do lado direito na Figura 10.5. Apesar de ser impossı́vel a verificação das leis da conservação da energia e do momento linear em cada um dos processos de emissão e absorção que compõem esta interacção entre os dois electrões, ao nı́vel mais global não se verifica este problema. É perfeitamente possı́vel satisfazer aquelas leis considerando as energias e momentos lineares dos electrões, porque as violações que se verificam nos dois vértices têm sinal contrário: na emissão, a energia final é necessariamente maior do que a inicial, na absorção é ao contrário. Uma vez que este paradoxo se manifesta apenas quando se considera o estado intermédio (aquele que existe entre os instantes de emissão e absorção do fotão trocado), a sua gravidade (a sua efectividade, até) depende de forma fulcral da precisão com que conseguimos medir a energia deste estado intermédio. Ora, de acordo com um importante teorema da Mecânica Quântica, a energia de um estado quântico é tanto melhor definida quanto maior for o seu tempo de vida, de acordo com(h) ∆E τ ≥ h̄, onde ∆E é a incerteza do valor da energia de um estado, τ o seu tempo médio de vida e h̄ é a constante de Plank reduzida. Então, se o fotão trocado entre os dois electrões tiver uma duração suficientemente breve, não se pode propriamente falar em violação da lei da conservação da energia, porque a precisão com que determinamos a sua energia não é suficiente para tal. Se este fotão fosse detectado (isto é, se fosse aborvido por um detector), em vez de ser absorvido pelo outro electrão, a sua energia deste fotão poderia ser determinada com precisão se se utilizasse um detector apropriado. Nesta situação, o paradoxo seria inevitável. Constatarı́amos que não se verificava a lei da conservação da energia! Como nunca se observou uma tal violação, como não acreditamos que esta possibilidade se possa verificar, devemos aceitar que não é possı́vel detectar estes fotões. Por esta razão, os fotões intermediários nas interacções electromagnéticas chamam-se fotões virtuais. A distância que um destes fotões virtuais, com um tempo de vida τ , pode percorrer antes de ser absorvido por uma partı́cula carregada é, evidentemente, d = cτ . Ora, de acordo com a desigualdade acima, τ ≥ h̄/∆E. Tomando o limite inferior para estimar uma ordem de grandeza, obtemos ch̄ d' . ∆E Mas, para salvaguardar o princı́pio da conservação da energia, a incerteza na energia do estado intermédio tem que ser da ordem de grandeza da energia do fotão trocado, e essa pode tomar valores arbitrariamente baixos, porque os fotões têm massa em repouso nula. Logo, os fotões virtuais podem alcançar distâncias arbitráriamente grandes. Assim, este processo de troca de fotões virtuais pode, de facto, descrever a interacção electromagnética que tem, como se sabe, um alcance infinito. Força nuclear e mesões π Em 1935, um fı́sico japonês chamado Hideki Yukawa propôs uma descrição da força nuclear em termos semelhantes aos que acabámos de estudar a propósito das interacções electromagnéticas. (h) Costuma dar-se a esta desigualdade o nome de relação de incerteza tempo-energia, apesar desta designação não ser muito apropriada. 154 CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA n p π0 n n π0 p p π+ p πn Figura 10.6: Vértices fundamentais da força nuclear, nos termos da descrição de Yukawa. Compare com o vértice fundamental da electrodinâmica, representado na Figura 10.5. Yukawa considerou que a interacção nuclear se dava por troca de partı́culas a que chamou mesões π ou piões, que desempenhariam, relativamente à força nuclear, o mesmo papel que os fotões desempenham na electrodinâmica. Como o alcance da força nuclear está limitado a cerca de 1 fm, Yukawa supôs que estas partı́culas teriam, ao contrário dos fotões, massa em repouso não nula. Considerando que a energia mı́nima de um pião é a sua energia de repouso, mπ c2 , e substituindo na igualdade aproximada acima, Yukawa concluiu que a massa desta partı́cula deveria ser cerca de h mπ ' ' 200 MeV. cd A partı́cula intermediária na electrodinâmica, o fotão, não tem carga eléctrica, logo, nos vértices fundamentais desta teoria não pode haver mudança da carga da partı́cula que emite ou absorve um quanta de campo. Mas esta suposição não pode fazer-se, à priori, para a força forte. Devemos pois considerar a possibilidade de um nucleão emitir um pião, transformando-se num nucleão diferente, por exemplo, um neutrão transformar-se num protão quando emite um pião(i) . Quando isto acontece, o pião emitido tem, necessariamente, carga eléctrica. Yukawa foi assim levado a propôr a existência, não de uma partı́cula, mas sim de três, com cargas +e, 0 e −e, que seriam as intermediárias da força nuclear. As massas dos três piões seriam forçosamente muito parecidas porque, como vimos, a força nuclear é independente da carga: as interacções entre dois protões, dois neutrões ou um protão e um neutrão são todas iguais, desde que se possa “desligar” a força electromagnética. Os vértices fundamentais das interacções nucleares estão ilustrados na Figura 10.6. Como deve ser evidente, os piões devem ter spin 0 ou spin 1, de maneira a que nestes vértices possa ser satisfeita a lei da conservação do momento angular. No final dos anos trinta, a análise da radiação cósmica revelou a presença de partı́culas com uma massa de cerca de 100 MeV. A proximidade deste valor com a estimativa feita por Yukawa sugeria que estas novas partı́culas fossem os seus mesões π. No entanto, estas partı́culas tinham uma elevada capacidade de penetração na matéria sólida, facto inesperado para partı́culas sujeitas às interações fortes. Estudos posteriores vieram, até, a revelar que os muões eram totalmente insensı́veis a estas forças. Por outro lado, veio a revelar-se que estas novas partı́culas são fermiões, com spin-1/2, o que é completamente incompatı́vel com a hipótese de Yukawa. Durante alguns anos, continuaram a ser conhecidas como mesões, mas hoje em dia têm o nome de muões e são representados pelo sı́mbolo µ− . São partı́culas em tudo semelhantes aos electrões, à parte o valor da massa. A descoberta dos muões foi, como acabámos de ver, completamente inesperada. Se as restantes partı́culas “novas” de que falámos até aqui desempenhavam algum papel no quadro geral que ia emergindo da actividade cientı́fica nos anos trinta e quarenta, não se vislumbrava nenhuma justificação teórica para estes electrões pesados. O laureado com o prémio Nobel Isaac Rabi chegou, a este propósito, a perguntar, irritado, “Who ordered that?! ”(j) Os mesões π de Yukawa acabaram por ser descobertos, mas só em 1947, por uma equipa da Universidade de Bristol liderada por C. F. Powell. Esta descoberta foi feita também por análise de raios cósmicos, mas detectados em altitude, numa estação meteorológica situada seis mil metros (i) Note-se (j) “Quem que este processo nada tem que ver com o decaimento β do neutrão. é que encomendou isso?! ”, em inglês. 10.2. AS QUATRO INTERACÇÕES FUNDAMENTAIS Leptões 155 Hadrões Bariões SIM 0, 1, 2, . . . 1/2, 3/2, . . . π0 , π± p+ , n Mesões Sensibilidade à força forte spin exemplos NÃO 1/2 e− , νe , µ− , νµ Tabela 10.1: Classificação das partı́culas elementares nas famı́lias dos leptões, dos mesões e dos hadrões. acima do nı́vel do mar, na Bolı́via. Powell notou que os piões tinham uma massa de perto 140 MeV e que decaı́am rapidamente para muões. Mais tarde, em 1962, usando já um acelerador de partı́culas, L. Lederman, M. Schwartz e J. Steinberger descobriram um tipo diferente de neutrinos, produzidos em processos que envolviam muões. A estes neutrinos chamou-se neutrinos muónicos, e constumam ser representados pelo sı́mbolo νµ . 10.1.4 Ordem no caos A partir dos anos cinquenta, a construcção de aceleradores de partı́culas cada vez mais poderosos permitiu o estudo de processos subatómicos de cada vez mais energia, tendo-se multiplicado a descoberta de novas partı́culas. Actualmente, são conhecidas e observadas várias centenas de partı́culas elementares, a maior parte das quais tem um tempo de vida muito curto. Põe-se, então, a questão de como organizar este conhecimento, como classificar todas estas partı́culas, como transformar esta selva num jardim zoológico. Qualquer classificação é feita agrupando partı́culas com propriedades semelhantes. Numa primeira tentativa, separaram-se as partı́culas de acordo com a sua massa, tendo-se definido três famı́lias principais: os bariões, os mesões e os leptões. A primeira era constituı́da pelas partı́culas mais pesadas, ou seja, os protões e neutrões; a última, pelas de massa mais reduzida, ou seja, os electrões e neutrinos; por fim, à segunda famı́lia, a dos mesões, pertenciam as partı́culas com massa intermédia, ou seja, os piões e os muões(k) . Esta classificação permitia evidenciar outras regularidades, pelo menos de forma aproximada. Por exemplo, todos os leptões e bariões são fermiões (spin semi-inteiro) mas, se é verdade que os piões são bosões (spin 0), já os muões têm spin 1/2 e, portanto, são fermiões. Vemos assim, que os muões são então a excepção numa regra (leptões e bariões são fermiões, mesões são bosões) que permitia reforçar a classificação das partı́culas baseada no valor da massa. Os leptões (isto é, por enquanto, os electrões e os neutrinos) apresentavam outra propriedade caracterı́stica: a sua insensibilidade à força nuclear forte. Com efeito, a interacção entre os electrões e os núcleos atómicos é puramente electromagnética. Em contrapartida, todos os bariões e os piões sentem a interacção forte. Poderı́amos ser levados agora a escrever uma nova regra: os leptões não sentem a força forte, os mesões e os bariões sentem esta força, mas, mais uma vez, os muões constituem uma excepção, porque são, também, insensı́veis à interacção forte. Para normalizar os muões, optou-se então por uma classificação das partı́culas baseada na sensibilidade à interacção forte. Assim, são leptões todas as partı́culas que não sujeitas a interacções fortes e hadrões as que estão. Esta última famı́lia é ainda subdividida em mesões, que têm spin inteiro e, por isso, são bosões, e bariões, que são fermiões, com spin semi-inteiro. Esta classificação encontra-se esquematizada na Tabela 10.1. 10.2 As quatro interacções fundamentais Ao longo deste semestre, considerámos frequentemente o efeito de dois tipos de interacções entre partı́culas, a saber, a força electromagnética e a força nuclear forte. Temos também, de estudos (k) Os muões foram mais tarde reclassificados como leptões, já veremos porquê. 156 CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA anteriores, alguma familiaridade com uma terceira força, a gravı́tica. Destes três tipos de interacção, as forças fortes são (como o seu nome pretende indicar) as mais intensas. Apesar de só terem efeitos quando as partı́culas em interacção estão muito próximas (a cerca de 10−15 m, como já vimos), a força forte mostra-se capaz de vencer a tremenda repulsão electrostática entre os protões que constituem os núcleos atómicos. A interacção electromagnética vem a seguir em intensidade. É a responsável pela estabilidade atómica (assim como a força forte assegura a estabilidade nuclear) e molecular. As interações electromagnéticas regem as reacções quı́micas, ou seja, determinam grande parte das propriedades macroscópicas da matéria, bem como a maior parte dos processos relevantes para nós, incluindo a própria vida. A terceira das interacções referida é a menos intensa de todas mas, apesar disso, é a responsável pela estabilidade das maiores estruturas conhecidas (planetas, estrelas, galáxias) e pelas propriedades de larga escala do universo. Isto deve-se ao facto de a interacção gravı́tica ter um alcance infinito e ser sempre atractiva, o que não acontece com as interacções fortes (que têm alcance finito e podem ser também repulsivas) ou com as electromagnéticas (têm alcance infinito, mas podem ser repulsivas). Por ter uma intensidade tão reduzida, a interacção gravı́tica não desempenha, em condições normais(l) , qualquer papel nas reacções subatómicas. 10.2.1 Interacção fraca A estas três forças, devemos agora juntar uma quarta, mais intensa que a gravidade mas menos intensa que o electromagnetismo, a chamada força fraca. A questão é que ocorrem na natureza processos que não são compreensı́veis considerando apenas as três forças já referidas. Um aspectos muito caracterı́stico da força fraca é a sua baixa intensidade, ou seja, a longa duração temporal dos processos que são regidos por ela. Este aspecto pode ser evidenciado comparando os tempos de vida de algumas partı́culas. Considerando os bariões, temos o protão (estável), o multipleto ∆, formado pelas partı́culas ∆++ , ∆+ , ∆0 e ∆− , com tempos de vida de cerca de 5 × 10−24 s; os N(1440) e N(1520)(m) têm tempos de vida semelhantes. Estas partı́culas instáveis decaem para nucleão, com emissão de piões e/ou fotões. Muitos outros exemplos poderiam ainda ser apresentados de bariões com tempos de vida semelhante. Mas há também o neutrão, que tem um tempo médio de vida de cerca de 15 min! Isto é, o neutrão, sendo uma partı́cula instável, tem um tempo de vida 26 ordens de grandeza superior ao de outras partı́culas relativamente próximas, em termos de massa e de spin! Além deste tempo de vida tão dilatado, no decaimento do neutrão dáse a emissão de neutrinos, outro facto caracterı́stico. Algo de similar ocorre no sector dos mesões. Assim, temos os piões neutros, que decaem (quase sempre) emitindo fotões, de acordo com π 0 → 2γ, em cerca de 8 × 10−17 s, e temos os piões carregados, que apresentam muito maior longevidade (3 × 10−8 s) e que decaem através do processo π + → µ+ + νµ , onde se constata, também aqui, a presença de neutrinos. Por fim, considerando a famı́lia dos leptões, notamos que o electrão é estável, mas que o muão não é. Este tem um tempo de vida de 2,6 × 10−6 s, pouco caracterı́stico de um decaimento regido pelas forças forte (que, de qualquer forma, já foi afastada do conjunto das forças capazes de afectar os muões) ou electromagnética. O decaimento do muão procede de acordo com µ− → e− + νµ + ν̄e , verificando-se a emissão de um neutrino muónico e um antineutrino electrónico. Estes dois sinais (longa duração e presença de neutrinos) são sinais caraterı́sticos de processos que não são geridos pela interacção forte ou electromagnética, sendo portanto necessária a introdução desta nova força. (l) Isto é, longe de fontes de campo gravı́tico muito intenso, como buracos negros. letra “N” indica que se trata de partı́culas semelhantes ao nucleão, o número entre parêntesis indica a massa em MeV. (m) A 10.3. E AGORA, ALGO VERDADEIRAMENTE ESTRANHO! 157 Mas o sinal mais claro da existência de uma nova força, com propriedades diferentes das três que já estudámos, é a violação da conservação da paridade. A paridade é uma propriedade da função de onda de sistemas quânticos que apresentam simetria sob operações de inversão de coordenadas. Por exemplo, uma partı́cula encerrada num poço de potencial rectangular (como os electrões livres que estudámos no Capı́tulo 5), descrita usando coordenadas espaciais com origem no centro do poço de potencial, tem uma função de onda cujo módulo fica inalterado em cada ponto, se trocarmos o sinal das coordenadas, isto é, |ψ(~r)| = |ψ(−~r)|, de onde se conclui que ψ(~r) = ±ψ(−~r). A paridade de um sistema quântico é o sinal que modifica a sua função de onda numa destas operações de inversão de coordenadas (ou reflexão espacial.) Em quase todos os processos conhecidos, a paridade de um sistema mantém-se constante, ou seja, por exemplo, um sistema com função de onda inicial par evolui até um estado final em que a sua função de onda é, igualmente, par. Os únicos processos em que esta lei de conservação pode não se verificar são aqueles que envolvem emissão ou absorção de neutrinos, isto é, são os processos regidos pelas interacções fracas. Esta é mais uma assinatura identificadora da intervenção das interacções fracas num processo subatómico. A violação desta lei de conservação foi descrita teoricamente em 1957 por T. D. Lee, C. N. Yang e a sua observação experimental ocorreu no mesmo ano, por C.-S. Wu. 10.3 E agora, algo verdadeiramente estranho! 10.3.1 Isospin Como vimos no capı́tulo anterior, a interacção forte actua da mesma maneira em protões e neutrões. Por outro lado, as massas dos hadrões encontram-se distribuı́das de forma muito pouco homogénia. Pelo contrário, os hadrões podem agrupar-se claramente em conjuntos de partı́culas com massas muito semelhantes semelhantes. Assim, temos os três piões, com massas de 139,6 MeV (π ± ) e 135,0 Mev (π 0 ); a seguir no espectro, vem o η, com 547,8 Mev, o σ com 600 Mev (este valor é muito incerto...), três ρ (ρ± e ρ0 ), com 775,8 MeV... No sector bariónico, temos os protão e o neutrão (respectivamente com massas de 938,3 MeV e 939,6 MeV); os quatro delta, com 1232 MeV; dois N(1440) com 1440 MeV... As massas de algumas destas partı́culas estão representadas na Figura 10.7 Este agrupamento tão nı́tido justifica que se considerem as diferentes partı́culas de cada grupo como diferentes estados de uma mesma partı́cula, estados que se distinguem entre si pelo valor de uma nova variável quântica. As pequenas diferenças entre as massas das partı́culas de cada grupo devem-se às interacções fraca e electromagnética, assim como as diferenças entre as energias dos estados atómicos com iguais valores dos números quânticos principais e dos números quânticos de momento angular (a chamada estrutura fina do espectro atómico) se devem à interação entre os momentos magnéticos orbital e intrı́nseco de cada electrão. A nova variável, cujo valor distingue os vários estados de uma destas super-partı́culas, chama-se isospin(n) ou spin isotópico. Assim como um electrão com spin 1/2 pode apresentar dois valores para a componente Sz do seu momento angular, usualmente designados “spin up” (Sz = +h̄/2) e “spin down”(Sz = −h̄/2), o nucleão é uma partı́cula com isospin 1/2, sendo possı́veis dois valores para a projecção Tz do isospin, usualmente chamados “protão” (Tz = +1/2) e “neutrão” (Tz = −1/2). Os piões π ± e π 0 , por seu turno, são os três estados possı́veis de uma partı́cula com isospin 1 e que, portanto, pode apresentar três estados, caracterizados pelos diferentes valores da projecção z do isospin, Tz = ±1 (para os piões carregados π ± , respectivamente) e Tz = 0 (para o pião neutro). Também aqui se nota uma semelhança com o momento angular, relativamente ao qual se verifica, por exemplo, que um electrão atómico numa orbital p (ou seja, com l = 1) tem à sua disposição três estados, caracterizados pelos valores do número quântico de projecção de momento angular ml = ±1 e ml = 0. (n) Isto é, “semelhante ao spin.” 158 CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA 1000 1400 - _ρ Massa (MeV) 800 0 _ρ + _ρ 1200 _σ _η 600 _∆_ - Σ _∆0 _0 Σ _∆+ _+ _∆++ Σ _ Λ 400 1000 _ 200 0 - _π -2 0 _π n + _π -1 0 1 Carga (em unidades de e) 2 800 -2 _ p -1 0 1 Carga (em unidades de e) 2 Figura 10.7: Porção inferior do espectro hadrónico. À esquerda apresenta-se o sector mesónico, à direita o bariónico. 10.3.2 Estranheza Nos anos cinquenta, processos como p + π− p + π− → → Λ0 + K 0 Σ− + K + intrigavam os fı́sicos de partı́culas. Estes processos são geridos pela interacção forte, como se pode deduzir da frequência com que ocorrem, mas as partı́culas produzidas, os mesões K ± e os bariões Λ0 e Σ− , decaem lentamente, nos processos fracos Λ0 Σ− K0 K+ → → → → → p + π− n + π− π+ + π− 2π + + π − 2π 0 + π + . O problema era por que razão estas partı́culas, produzidas por processos fortes, não decaı́am igualmente por processos fortes? Por exemplo, os bariões ∆ sofrem um decaimento semelhante (quanto às partı́culas produzidas) ao dos bariões Σ e Λ, mas o seu tempo de vida médio é cerca de 10− 23 s (ou seja, sofrem decaimento forte). Só para efeitos de comparação, os tempos médios de vida destas partı́culas estranhas (como vieram a ser chamadas) são 2,6×10−10 s (Λ0 ), 1,5×10− 10 s (Σ) e 1,2 × 10−8 s (K + ). (O mesão K 0 é uma partı́cula mais complicada, que pode ser vista como uma sobreposição quântica de duas partı́culas com tempos de vida muito diferentes, 0,9 × 10−10 s e 5,2 × 10− 8 s.) Porque razão o ∆0 mais pode sofrer um decaimento forte e o Λ0 não pode? A resposta a esta pergunta começou a ser dada pelo fı́sico americano Abraham Pais em 1952, quando notou que estas partı́culas estranhas eram sempre produzidas aos pares. A interacção forte parecia ser incapaz de produzir uma partı́cula estranha isoladamente. Aceitando esta incapacidade, era natural que também não fosse possı́vel a aniquilação destas partı́culas isoladamente, através 10.4. A VIA ÓCTUPLA, QUARKS E GLUÕES 159 de processos fortes, pelo que o seu decaimento só poderia ocorrer através de processos de outra natureza, muito mais lentos. Pouco depois, Gell-Mann (1953) e Nishijima (1955) sugeriram uma explicação para este mistério, que explicava ao mesmo tempo a produção aos pares de Pais. Segundo esta explicação, as partı́culas subatómicas seriam caracterizadas por uma nova variável, a que deram o nome de estranheza, que seria sempre conservada nas interacções fortes, mas que podia não se conservar nas interacções fracas. Somente as partı́culas estranhas (Σ, Λ0 , K,...) teriam valores não nulos desta nova carga de estranheza; os nucleões, deltas, piões, etc., seriam todos partı́culas com estranheza nula. Assim, a interacção forte podia produzir duas partı́culas estranhas, desde que tivessem estranhezas opostas, mas era incapaz de mediar um processo de decaimento de uma destas partı́culas. O processo p + π − → Λ0 + K 0 pode ocorrer pela interacção forte porque a estranheza do Λ0 é −1, ao passo que a do K 0 é +1. Assim a estranheza total antes da interacção (S = 0) é igual à estranheza total depois da interacção (S = +1 − 1 = 0). Em contrapartida, no decaimento Λ0 → p + π − , ocorre uma variação da estranheza (-1 antes, 0 depois), logo, não pode ocorrer pela interacção forte, tem que ser mediado pela interacção fraca. 10.4 A via óctupla, quarks e gluões A Tabela 10.2 apresenta os valores da massa, da carga, do isospin total (T ), da componente-z de isospin (Tz ) e da estranheza de alguns hadrões. Partı́cula π+ π0 π− η massa (MeV) 140 135 140 549 carga (/e) 1 0 -1 0 T 1 1 1 0 Tz 1 0 -1 0 S 0 0 0 0 Tabela 10.2: Propriedades fı́sica de alguns hadrões. 10.4.1 Quarks com cor e sabor 10.4.2 Descrição microscópica dos processos de decaimento 10.5 Leis de conservação 10.6 Aceleradores e detectores PROBLEMAS 10.1 Qual é a menor energia do fotão incidente no processo de produção de um par electrão-positrão? e de um par protão-antiprotão? 10.2 Um fotão com energia ² = 2, 09 GeV cria um par pp̄ (protão-antiprotão). O protão assim produzido tem uma energia de 95 MeV. Qual é a energia do antiprotão? 10.3 Na reacção µ+ e− → 2ν, que espécie(s) de neutrinos (e/ou antineutrinos) são produzidos? 160 CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA 10.4 Qual a energia, comprimento de onda e frequência dos dois fotões emitidos no decaimento do pião neutro π 0 → 2γ? 10.5 Recorrendo aos diagramas mais fundamentais de cada tipo de interacção quântica, tente construir um processo em que se verifique violação do número total de quarks. Que pode concluir? 10.6 Qual pode ser a partı́cula X no processo Xp → nµ+ ? 10.7 Nenhum dos seguintes processos ocorre. Porquê? (a) (c) (e) (g) pp̄ → µ+ e− Σ − → K 0 µ− γp → nπ 0 pp → ppn (b) (d) (f) (h) π − → e− γ π − p → pπ + pp → pπ + Λ → K −p 10.8 O decaimento β de protões não se observa em protões isolados, mas ocorre no interior de alguns núcleos radioactivos, sendo o processo de decaimento principal dos isótopos mais leves de elementos com massa intermédia, como o oxigénio. Porque razão não se observa este processo entre protões isolados? 10.9 Os processos de decaimento dos piões são, maioritariamente, os seguintes: π+ → µ+ νµ π− → µ− ν̄µ 0 → 2γ. π (a) Descreva microscopicamente, através de diagramas, estes processos. (b) O tempo médio de vida dos piões carregados é 2,6×10−8 s, ao passo que o dos piões neutros é 8,4×−17 s. Porquê? 10.10 Descreva microscopicamente os seguintes processos e identifique os tipos de interacções que participam em cada um (a) n → p+ e− ν̄e (b) Σ+ → pπ 0 (c) Σ0 → Λγ 10.11 Os piões carregados π ± têm um tempo médio de vida de cerca de 2,6 × 108 s, ao passo que o do pião neutro π 0 é, apenas 8,4 × 10−17 s. A que se deve tão grande diferença? Apêndice A Momento angular, spin e simetria de troca A.1 Momento angular e spin Classicamente, o momento angular de um sistema está associado ao seu movimento. É uma propriedade fı́sica vectorial dada pelo produto externo do vector posição e do vector momento linear, isto é, ~ = ~r × p~. L As componentes cartesianas do momento angular são, explicitamente, as seguintes: Lx Ly Lz = = = ypz − zpy zpx − xpz xpy − ypx . Os operadores que, em Mecânica Quântica, associamos a estas quantidades, obtêm-se substituindo as componentes do vector posição e as do momento linear pelas dos operadores quânticos corres~ resultando pondentes ~r → ~r e p~ → −ih̄∇, Lx Ly Lz = = = −ih̄ (y∂z − z∂y ) −ih̄ (z∂x − x∂z ) −ih̄ (x∂y − y∂x ) , (A.1) onde se usaram as abreviaturas ∂x = ∂/∂x, etc. Estes operadores não comutam uns com os outros, antes se tendo [Lx , Ly ] [Ly , Lz ] = = ih̄Lz ih̄Lx [Lz , Lx ] = ih̄Ly . Uma vez que as três componentes do momento angular não comutam entre si, não são possı́veis estados em que duas quaisquer componentes do momento angular apresentem valores bem determinados. Apenas uma das componentes do momento angular de um sistema quântico pode apresentar valores precisos. Por convenção, escolhe-se a componente z. Apesar de não comutarem umas com as outras, as componentes do momento angular comutam com o quadrado do módulo do momento angular, L2 = L2x + L2y + L2z . Então, os valores da componente z do momento angular e do quadrado do módulo do momento angular podem ser simultaneamente determinados com precisão ilimitada (ou melhor, sem limitações de natureza teórica). 161 162 APÊNDICE A. MOMENTO ANGULAR, SPIN E SIMETRIA DE TROCA l=1 dB/dz l=0 l=-1 Figura A.1: Montagem para a experiência de Stern-Gerlach. Pretende-se agora dar resposta à seguinte questão: Que valores podemos obter de uma medição de L2 e de Lz ? Como sabemos, estes valores são os dos valores próprios destes operadores. Para responder a esta questão devemos pois resolver as equações de valores próprios L2 ψ(~r) = L2z ψ(~r) = Λ2 ψ(~r) M ψ(~r), onde representámos por Λ2 os valores próprios de L2 , por M os de Lz e ψ(~r) representa as funções próprias destes dois operadores. Estas duas equações são equações às derivadas parciais para ψ, cujas soluções formam o conjunto de funções próprias de L2 e Lz . O aspecto mais interessante para a presente discussão é que estas equações só têm solução se os valores próprios tiverem valores muito bem determinados, que são os que satisfazem as condições Λ2 M = = l(l + 1)h̄2 , mh̄, onde l é um número inteiro não negativo arbitrário e m é um inteiro que toma valores compreendidos entre −l e l. Assim, para cada valor de l (relacionado com o módulo do momento angular) há 2l + 1 estados, cada um com um valor diferente da componente z do momento angular. Esta situação é familiar a todos, pelo menos no contexto da Fı́sica Atómica, em que se caracterizam os estados electrónicos através dos valores dos chamados número quântico de momento angular (l) e número quântico de projecção (no eixo dos z) do momento angular (m). Nos átomos, o momento angular está intimamente ligado ao momento magnético. É fácil entender porquê: o momento angular é o reflexo do movimento dos electrões que, por outro lado, está na origem de um campo magnético, que se descreve através do momento magnético atómico. Esta ligação entre o momento angular e o momento magnético traduz-se numa proporcionalidade entre as componentes-z dos dois observáveis, Mz = gLz , onde g, a constante de proporcionalidade, se chama razão giromagnética. Esta relação entre as duas quantidades pode ser usada para distinguir estados atómicos que diferem apenas pelo vaalor da componente-z do momento angular. Fazendo um feixe de átomos idênticos atravessar uma região onde está definido um campo magnético não homogéneo e orientado segundo o eixo dos zz, átomos com diferentes valores de Lz são desviados em direcções diferentes porque a componente do momento magnético segundo a direcção do campo tem valores diferentes (ver a Figura A.1). Experiências deste tipo chamam-se experiências de Stern-Gerlach, em homenagem aos dois fı́sicos que, pela primeira vez em 1922, as realizaram. Se não se tem nenhum cuidado especial na preparação do feixe incidente (à parte os de garantir que todos pertencem à mesma espécie quı́mica e têm a mesma energia) os átomos que o constituem apresentam valores diferentes de Lz e, portanto, sofrem desvios diferentes. O feixe incidente desdobra-se então em vários subfeixes, cada qual incluindo átomos com um determinado valor da componente-z do momento angular. Assim, se realizamos uma experiência de Stern-Gerlach com átomos com momento angular l, esperamos ver o feixe incidente desdobrar-se em 2l + 1 subfeixes. O momento angular total de um sistema quântico é, do ponto de vista clássico, uma função dos estados de movimento dos constituintes desse sistema. Assim, o momento angular dos átomos A.2. SIMETRIA DE TROCA DE PARTÍCULAS IDÊNTICAS 163 é a soma dos momentos angulares dos electrões que os constituem, cada um dos quais é descrito em Mecânica Quântica por um operador do tipo dos apresentados na eq. (A.1), cada um dos quais pode apresentar, como vimos, um valor L2 = l(l + 1)h̄2 , com l inteiro não negativo. Assim, esperamos que o resultado de uma experiência de SternGerlach seja o desdobramento do feixe incidente num número ı́mpar (2l + 1) de subfeixes. Ora, o resultado mais interessante deste tipo de experiências é que, para alguns átomos (aqueles que têm número atómico ı́mpar), verifica-se o desdobramento do feixe incidente num número par de subfeixes, indicando que o momento angular dos átomos usados é um número semi-inteiro. Este facto indica claramente que há, ao nı́vel microscópico, contribuições para o momento angular de um sistema quântico que não têm relação com o movimento dos seus constituintes, ou seja, que não têm qualquer correspondência com a noção clássica de momento angular. A estas parcelas do momento angular dá-se o nome de momento angular intrı́nseco ou simplesmente, spin. O spin é uma caracterı́stica de cada partı́cula. Os electrões têm spin 1/2, os fotões têm spin 1, os piões, spin 0. O momento angular de um átomo é a soma dos momentos angulares dos seus electrões e dos spins desses electrões. Nos casos em que o número atómico ı́mpar, essa soma não pode resultar num número quântico de momento angular total inteiro. A.2 Simetria de troca de partı́culas idênticas A identidade de duas partı́culas tem um significado muito mais forte em Mecânica Quântica do que na Fı́sica Clássica. Duas partı́culas idênticas do ponto de vista clássico podem ainda ser distinguidas, fazendo numa delas uma marca de tinta, ou acompanhando, instante a instante, o seu movimento, de forma a que se possa dizer “a partı́cula que, há pouco, estava ali, está agora aqui; aquela outra, moveu-se de acolá para a direita...”Assim, as duas partı́culas são idênticas porque as suas caracterı́sticas intrı́nsecas (massa, carga, forma, etc.) são as mesmas, mas é sempre possı́vel distinguir as duas e dizer qual é qual. Do ponto de vista quântico, isto é impossı́vel. Tomemos um exemplo para o ilustrar. Imaginemos que fazemos uma experiência em que bombardeamos hidrogénio atómico(a) com um feixe de electrões. O resultado da colisão de um electrão com um átomo de hidrogénio é um dos seguintes: (a) o electrão incidente é capturado pelo átomo de hidrogénio, formando-se um ião H− ; (b) após a interacção, o átomo de hidrogénio e o electrão seguem os seus caminhos; (c) o electrão incidente ioniza o átomo de hidrogénio, resultando então um ião H+ e dois electrões, todos livres uns dos outros. Nos casos em que se verifica a hipótese (b) não há procedimento experimental que nos permita saber se o electrão livre no final é o incidente ou se este foi capturado tendo o electrão atómico sido expulso do átomo. Isto, porque não é possı́vel acompanhar as trajectórias do electrão incidente e do electrão atómico como acompanhamos o movimento de duas bolas de bilhar numa colisão num jogo de snooker. A função de onda do electrão incidente tem uma certa extensão, assim como a do electrão atómico. Enquanto se dá a colisão, as duas funções de onda sobrepõem-se e, assim sendo, não fazemos a menor ideia, no final, de qual electrão se “materializou” no átomo e qual foi deixado livre. A indistinguibilidade de partı́culas quânticas idênticas tem uma importante consequência: é que duas descrições de um sistema quântico que difiram entre si apenas pela troca das variáveis dinâmicas de duas partı́culas idênticas têm que ser equivalentes, isto é, devem produzir os mesmos valores no cálculo de propriedades observáveis do sistema. Vejamos que consequências podemos retirar daqui. Seja ψA,B (~r1 , ~r2 ) = ψA (~r1 )ψB (~r2 ) (a) O argumento não é alterado se o alvo for hidrogénio molecular. 164 APÊNDICE A. MOMENTO ANGULAR, SPIN E SIMETRIA DE TROCA a função de onda de um sistema de duas partı́culas idênticas e indistinguı́veis independentes, que ocupam os estados ψA e ψB e sejam ~r1 e ~r2 as suas coordenadas. Se trocarmos, na função de onda, as posições das duas partı́culas, as diversas propriedades observáveis do sistema devem, como se disse, permanecer inalteradas. Este resultado deve verificar-se, em particular, para a densidade de presença das partı́culas quânticas. Assim, deve verificar-se 2 2 |ψA,B (~r1 , ~r2 )| = |ψA,B (~r2 , ~r1 )| , ou seja, ao nı́vel da função de onda, ψA,B (~r1 , ~r2 ) = eiδ ψA,B (~r2 , ~r1 ), onde δ é um número real arbitrário. Se voltarmos a trocar as coordenadas das duas partı́culas, obtemos ψA,B (~r1 , ~r2 ) = eiδ ψA,B (~r2 , ~r1 ) = e2iδ ψA,B (~r1 , ~r2 ), o que nos leva a escrever que exp(2iδ) = 1, ou seja que exp(iδ) = ±1. O efeito da troca dos dois conjuntos de coordenadas na função de onda do sistema é pois o de multiplicar a função de onda do sistema por um ou por menos um. Qual das possibilidades se verifica depende da natureza das duas partı́culas idênticas. Há partı́culas cuja função de onda é antissimétrica (troca o sinal) sob operações de troca, e outras cuja função de onda é simétrica, isto é, que se mantém inalterada sob a referida troca. As primeiras chamam-se fermiões e incluem os electrões, os protões e neutrões, entre outras partı́culas; as segundas chamam-se bosões e incluem os fotões, os piões, e muitas outras também. Devido à antissemetria da função de um sistema de fermiões, verifica-se uma grande limitação à possibilidade de dois fermiões idênticos ocuparem o mesmo estado de partı́cula única. Com efeito, se dois fermiões ocupam o mesmo estado ψ1 , então efectuando uma troca das duas partı́culas resulta ψ1,1 (~r1 , ~r2 ) = −ψ1,1 (~r1 , ~r2 ), que só pode ser satisfeita se a função de onda se anular. Demonstrámos assim o importante princı́pio de exclusão de Pauli: dois fermiões idênticos não podem ocupar simultaneamente o mesmo estado individual. Esta regra tem importantes consequências, como já vimos no estudo da condução em metais. Outro exemplo da importância do princı́pio de exclusão de Pauli é o facto de diferentes elementos terem diferentes propriedades quı́micas. Com efeito, se este princı́pio não se verificasse, ou se os electrões fossem bosões, no estado fundamental de cada átomo todos os electrões ocupariam o nı́vel de mais baixa energia, o estado 1s, pelo que não se verificaria a diversidade de comportamenetos quı́micos. A simetria de troca da função de onda de um sistema de partı́culas idênticas está relacionada, de uma forma complexa, com o momento angular intrı́nseco (spin) dessas partı́culas. Todas as partı́culas com spin inteiro (como os fotões) são bosões; todas as partı́culas com spin semi-inteiro (como os electrões) são fermiões.