Apontamentos de Física Moderna 2

Transcrição

Apontamentos de Física Moderna 2
Apontamentos de
Fı́sica Moderna II
José Amoreira
Departamento de Fı́sica
UNIVERSIDADE DA BEIRA INTERIOR
Revision: 1.17
Date: 2005/07/05 00:13:39
Copyleft
O autor deste texto é Luı́s José Maia Amoreira ([email protected]), do Departamento de Fı́sica
da Universidade da Beira Interior. Não se garante a sua correcção.
Este texto pode ser obtido a partir do URL
http://www.dfisica.ubi.pt/~amoreira/0405/fm2/bibl.html
Este texto pode ser copiado, alugado, vendido, emprestado ou oferecido, desde que este “Copyleft”
permaneça inalterado. O texto pode ser adaptado, acrescentado ou diminuı́do, desde que sejam
satisfeitas as seguintes condições:
• no produto final, deve ser incluı́da uma indicação bem visı́vel de que se trata de uma
adaptação deste trabalho
• devem ser referidos os nomes dos autores deste trabalho
• deve ser apresentado o URL deste documento (ver acima)
Os autores agradecem ser informados da redacção de trabalhos baseados neste texto. Em resumo,
os autores autorizam qualquer utilização desta obra que respeite as regras básicas da honestidade,
do bom-senso e da boa-educação.
Composto em LATEX.
Índice
1 Introdução
1.1 A evolução histórica da hipótese atómica .
1.1.1 Da antiguidade até Dalton . . . .
1.1.2 A descoberta da estrutura atómica
1.1.3 Entram os quanta . . . . . . . . .
1.1.4 O neutrão . . . . . . . . . . . . . .
1.2 A estrutura atómica . . . . . . . . . . . .
1.3 Ligações quı́micas . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
2
6
7
8
12
14
14
2 Elementos de Cristalografia
2.1 Cristais ideais e cristais reais . . .
2.2 A estrutura cristalina . . . . . . .
2.3 Tipos de redes cristalinas . . . . .
2.4 Exemplos de estruturas cristalinas
2.5 Direcções e planos cristalinos . . .
2.6 Distância interplanar . . . . . . . .
2.7 Coordenadas fraccionárias . . . . .
2.8 Defeitos . . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
15
15
17
19
22
25
27
27
29
29
3 Dispersão elástica de radiação em cristais
3.1 Breve revisão sobre ondas . . . . . . . . .
3.2 Dipersão de radiação — Generalidades . .
3.3 A condição de Laue . . . . . . . . . . . .
3.4 A lei de Bragg . . . . . . . . . . . . . . .
3.5 Métodos experimentais . . . . . . . . . . .
3.6 Factor de estrutura . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
33
33
36
37
39
41
42
43
44
4 A capacidade térmica dos sólidos
4.1 A aproximação harmónica . . . . . . . .
4.2 Elementos da teoria das probabilidades .
4.2.1 Variáveis aleatórias discretas . .
4.2.2 Variáveis aleatórias contı́nuas . .
4.3 A lei de Dulong e Petit . . . . . . . . . .
4.3.1 Modelo Clássico . . . . . . . . .
4.3.2 Modelo de Einstein . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
47
48
49
51
52
52
54
58
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i
.
.
.
.
.
.
.
.
ii
ÍNDICE
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
5 Metais I: modelos de electrões livres
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 O modelo de Drude-Lorentz . . . . . . . . . . . . . . . . . . . .
5.2.1 O calor especı́fico dos metais . . . . . . . . . . . . . . .
5.2.2 A lei de Ohm . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 O efeito de Hall . . . . . . . . . . . . . . . . . . . . . . .
5.2.4 Efeitos termoeléctricos . . . . . . . . . . . . . . . . . . .
5.2.5 Balanço do modelo de Drude . . . . . . . . . . . . . . .
5.3 O modelo de Sommerfeld . . . . . . . . . . . . . . . . . . . . .
5.3.1 Estados electrónicos . . . . . . . . . . . . . . . . . . . .
5.3.2 A densidade de estados electrónicos . . . . . . . . . . .
5.3.3 O estado fundamental de um gás de fermiões . . . . . .
5.3.4 O gás de electrões de condução à temperatura ambiente
5.3.5 A distribuição de Fermi-Dirac . . . . . . . . . . . . . . .
5.3.6 A condutividade eléctrica . . . . . . . . . . . . . . . . .
5.4 Crı́tica dos modelos de electrões livres . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Metais II: Teoria de bandas
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . .
6.2 O teorema de Bloch . . . . . . . . . . . . . . . . . .
6.3 Propriedades dos estados de Bloch . . . . . . . . . .
6.3.1 Periodicidade no espaço recı́proco . . . . . .
6.3.2 Nı́veis de energia dos estados de Bloch . . . .
6.3.3 Momento linear . . . . . . . . . . . . . . . . .
6.3.4 Velocidade média e momento linear cristalino
6.3.5 Massa efectiva dos electrões de Bloch . . . . .
6.3.6 O livre caminho médio . . . . . . . . . . . . .
6.4 Modelo de Krönig-Penney . . . . . . . . . . . . . . .
6.5 Número de estados por banda . . . . . . . . . . . . .
6.6 O estado fundamental da nuvem electrónica . . . . .
6.7 A condução eléctrica . . . . . . . . . . . . . . . . . .
6.8 O gás de Bloch à temperatura ambiente. . . . . . . .
6.9 Lacunas . . . . . . . . . . . . . . . . . . . . . . . . .
6.10 Contaminação de semi-condutores . . . . . . . . . .
6.11 O diodo semicondutor . . . . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
. 77
. 79
. 82
. 82
. 83
. 84
. 85
. 87
. 88
. 88
. 93
. 94
. 96
. 97
. 98
. 99
. 101
. 103
. 104
7 Supercondutividade
7.1 Propriedades magnéticas dos supercondutores
7.2 A Equação de London . . . . . . . . . . . . .
7.3 Superfluidez . . . . . . . . . . . . . . . . . . .
7.4 A supercondutividade, outra vez . . . . . . .
7.5 Aplicações da supercondutividade . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
60
60
61
63
64
66
66
66
68
69
70
71
72
74
74
74
105
106
108
109
111
112
112
112
ÍNDICE
iii
8 Fı́sica Nuclear I — Propriedades do núcleo
8.1 Núcleo atómico — Generalidades . . . . . .
8.2 A massa nuclear e a energia de ligação . . .
8.3 A força nuclear forte . . . . . . . . . . . . .
8.3.1 Saturação . . . . . . . . . . . . . . .
8.3.2 Alcance . . . . . . . . . . . . . . . .
8.3.3 Independência da carga . . . . . . .
8.3.4 O deuterão e a dependência do spin
8.4 Dois modelos para estrutura do núcleo . . .
8.4.1 O modelo da gota lı́quida . . . . . .
8.4.2 Modelo em camadas . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . .
atómico
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
115
115
116
117
118
119
121
121
122
122
123
125
125
9 Fı́sica nuclear II — Reacções nucleares
9.1 Radioactividade . . . . . . . . . . . . . . . .
9.1.1 A região de estabilidade . . . . . . .
9.1.2 Fissões nucleares . . . . . . . . . . .
9.1.3 Conversões internas . . . . . . . . .
9.1.4 Decaimento-β . . . . . . . . . . . . .
9.2 A lei do decaimento . . . . . . . . . . . . .
9.2.1 Tempo de meia vida . . . . . . . . .
9.2.2 Duração média . . . . . . . . . . . .
9.2.3 Energia libertada no decaimento . .
9.3 Actividade e dosimetria . . . . . . . . . . .
9.3.1 Actividade . . . . . . . . . . . . . .
9.3.2 Dose absorvida . . . . . . . . . . . .
9.3.3 Dose equivalente . . . . . . . . . . .
9.3.4 Efeitos da exposição à radiação . . .
9.4 Aplicações da Fı́sica Nuclear . . . . . . . .
9.4.1 Análise por activação com neutrões .
9.4.2 Produção de energia por fissão . . .
9.4.3 Fusão nuclear . . . . . . . . . . . . .
9.4.4 Aplicações à medicina . . . . . . . .
9.4.5 Datação por carbono-14 . . . . . . .
9.5 Alguns tópicos de noticiário . . . . . . . . .
9.5.1 A radioactividade natural . . . . . .
9.5.2 A utilização de urânio empobrecido
Bibliografia . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
127
127
128
129
129
130
131
131
132
133
133
134
134
135
136
136
136
139
141
141
143
143
145
145
145
10 Elementos de Fı́sica Subatómica
10.1 A selva das partı́culas elementares . . . . . . . . . . . . . .
10.1.1 O positrão de Dirac . . . . . . . . . . . . . . . . . .
10.1.2 O neutrino de Pauli . . . . . . . . . . . . . . . . . .
10.1.3 O mesão π de Yukawa e um convidado inesperado .
10.1.4 Ordem no caos . . . . . . . . . . . . . . . . . . . . .
10.2 As quatro interacções fundamentais . . . . . . . . . . . . . .
10.2.1 Interacção fraca . . . . . . . . . . . . . . . . . . . . .
10.3 E agora, algo verdadeiramente estranho! . . . . . . . . . . .
10.3.1 Isospin . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.2 Estranheza . . . . . . . . . . . . . . . . . . . . . . .
10.4 A via óctupla, quarks e gluões . . . . . . . . . . . . . . . . .
10.4.1 Descrição microscópica dos processos de decaimento
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
147
147
147
149
152
155
155
156
157
157
158
159
159
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
ÍNDICE
10.5 Leis de conservação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
10.6 Aceleradores e detectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
A Momento angular, spin e simetria de troca
161
A.1 Momento angular e spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
A.2 Simetria de troca de partı́culas idênticas . . . . . . . . . . . . . . . . . . . . . . . . 163
Prefácio
Estas notas são o resultado de quatro anos de docência de Fı́sica Moderna II, disciplina do terceiro
ano da Licenciatura em Ensino de Fı́sica e Quı́mica.
Escrevo estes apontamentos (uso o tempo presente nesta frase porque não me parecem ainda
acabados, apesar de ter chegado a altura de me desligar da disciplina) principalmente porque a
actividade da escrita me ajuda a organizar as ideias sobre estes assuntos. As discussões que tenho
comigo mesmo são, frequentemente, mais profundas (e sempre muito mais encarniçadas) do que
as que tenho com os alunos.
É também minha opinião que estes apontamentos ajudam os alunos, que encontram neles
uma base para o estudo, em Lı́ngua Portuguesa, a partir da qual podem, se assim o desejarem,
partir para voos mais altos, usando a vasta bibliografia existente, da qual uma parte razoável está
disponı́vel na Biblioteca da Universidade. Este argumento é muito discutı́vel. Há quem opine que
as “sebentas” fornecidas pelos professores favorecem uma atitude passiva dos estudantes, que são,
em maior ou menor medida, dispensados de procurar por sua iniciativa os conhecimentos de que
carecem em livros ou artigos, escritos por melhores e mais reputados autores. Eu compreendo
este ponto de vista. Mas também compreendo a opinião segundo a qual o nosso papel como
professores é facilitar a aprendizagem dos alunos e não sei ao certo até onde se deve ir, onde traçar
a linha. Ao fim e ao cabo, Sócrates desprezava, com argumentos semelhantes, a palavra escrita em
geral... Dadas estas dúvidas, prefiro deixar-me guiar pelo exemplo. A verdade é que os professores
que mais apreciei redigiam notas das disciplinas que leccionavam e, apesar disso, não deixei de
consultar a bibliografia recomendada (e a que ela, por seu turno, referia) nas bibliotecas que tinha
ao meu alcance. Assim, tento imitá-los, na medida das minhas capacidades.
Os Capı́tulos 2 a 6 estão baseados em apontamentos que redigi em colaboração com o Prof. Miguel de Jesus para a disciplina de Fı́sica do Estado Sólido que, na última reformulação do curso, foi
afastada do currı́culo da licenciatura. Nos quatro anos que passaram desde então, estes capı́tulos
foram sofrendo sucessivas alterações, ao ponto de termos os dois entendido que não se justificava
já manter o seu nome como co-autor dos presentes apontamentos. Seja como for, devo-lhe um
sincero agradecimento. Sem o seu empenhamento e as suas muitas contribuições, suspeito que
estas notas não passariam agora de um conjunto de folhas semi-manuscritas, com gráficos colados, distribuidas por diferentes pastas e gavetas, com partes esquecidas nalgum canto (e outras
definitivamente perdidas), ainda mais gravemente incompletas, ainda mais densamente povoadas
de erros. Não tenho a menor hesitação em afirmar que o Prof. Miguel de Jesus constituiu um factor determinante para a redacção destes apontamentos, mesmo que, passados estes quatro anos,
tenham restado poucas das suas contribuições originais. Por isso, quero aqui deixar um sincero
bem hajas, Miguel.
Covilhã, Agosto de 2005
J. A.
v
vi
ÍNDICE
Capı́tulo 1
Introdução
1.1
1.1.1
A evolução histórica da hipótese atómica
Da antiguidade até Dalton
A teoria atómica da matéria foi proposta pela primeira vez no séc. V a.c., por Leucipo e Demócrito,
na Grécia antiga. Estes dois filósofos tentavam, com o seu trabalho, compatibilizar a ideia da
existência de um princı́pio único e imutável subjacente à realidade com a percepção da mudança,
do movimento, da morte e do nascimento evidentes no dia a dia. Sugeriram então que a natureza
una e imutável da realidade não se manifesta directamente nos objectos que observamos e com
que lidamos, mas sim a um nı́vel microscópico, uma vez que, segundo eles, toda a matéria seria
constituı́da por pequenos grânulos ou átomos indestrutı́veis e indivisı́veis (é este, aliás, o significado da expressão grega que está na origem da palavra “átomo”). As diferentes substâncias e
as diferentes fases observadas corresponderiam a diferentes formas de agregação dos átomos; as
alterações verificadas num objecto corresponderiam a processos em que se alteraria a organização
e a disposição dos átomos que os constituem.
A teoria atómica (bem como os outros modelos da altura) foi preterida pela teoria dos quatro
elementos, defendida por Aristóteles, e ficou quase esquecida até ao séc. XVIII, altura em que se
volta a falar de átomos, já numa perspectiva cientı́fica. As investigações experimentais de Lavoisier
(cerca de 1780) e outros permitiram determinar a composição quı́mica de vários compostos. Cerca
de vinte anos mais tarde, em 1799, Proust pode enunciar a Lei das proporções definidas, que afirma
que as razões entre as massas de dois elementos que reagem para formar um dado composto são
sempre as mesmas (por exemplo, quando hidrogénio e oxigénio reagem para formar água, as
massas dos dois reagentes estão sempre na proporção de 8:1). Logo no ano a seguir, Dalton
apresentou a Lei das proporções múltiplas: quando um elemento reage com outro para formar
duas substâncias diferentes, as proporções em que o faz nas duas reacções são múltiplas uma
da outra. Por exemplo, o oxigénio reage com o carbono para formar monóxido de carbono, na
proporção (mássica) de 16:12; os mesmo elementos podem reagir para formar dióxido de carbono,
sendo agora a razão entre as massas de oxigénio e carbono igual a 32:12, isto é, exactamente o
dobro da que se verifica na produção de monóxido de carbono. Estes factos levaram Dalton a
propor a primeira versão moderna da teoria atómica, baseada nos seguintes pressupostos
(a) A matéria é constituı́da por pequenas partı́culas indivisı́veis chamadas átomos
(b) Os átomos são inalteráveis e indestrutı́veis
(c) Os átomos de um dado elemento quı́mico são idênticos
(d) Nas reacções quı́micas, átomos de diferentes elementos combinam-se em proporções racionais
simples
1
2
CAPÍTULO 1. INTRODUÇÃO
A descrição atómica foi usada com grande sucesso no estudo das propriedades dos gases, mas só
muito mais tarde, já no séc. XX, foi possı́vel resolver as dificuldades apresentadas pela sua aplicação
no estudo dos sólidos. Teremos ocasião de estudar em detalhe algumas destas dificuldades, como
a da justificação do valor da capacidade térmica dos sólidos, e por isso não nos alargaremos mais
sobre este assunto. Ainda assim, é interessante notar que um dos pensadores mais profundos do
Séc. XIX, Ernst Mach, continuou a criticar a hipótese atómica até à sua morte, em 1915.
1.1.2
A descoberta da estrutura atómica
Na segunda metade do século XIX, desenvolvimentos tecnológicos (como a invenção de bombas de
vácuo melhoradas) permitiram o aprofundamento do estudo das descargas eléctricas em gases(a) .
Este estudo era realizado experimentalmente estabelecendo uma diferença de potencial eléctrico
entre dois eléctrodos no interior de um tubo a pressão reduzida (ver a Figura 1.1).
Cátodo
Ânodo
Figura 1.1: Tubo de Crookes. O sombreado representa a luminescência observada por Plücker em
1858.
Para pressões suficientementes baixas e diferenças de potencial suficientemente elevadas, notava-se o aparecimento de uma luminescência na região do ânodo (eléctrodo de potencial mais
elevado). Esta luminescência devia-se a um fluxo de natureza desconhecida proveniente do cátodo,
como se constatou, em 1869, quando se observaram sombras de objectos interpostos entre os dois
eléctrodos. Eugen Goldstein chamou a este fluxo raios catódicos. Em 1858, J. Plucker notou que
a trajectória seguida pelos raios catódicos era deflectida por campos magnéticos, demonstrando
que eles eram carregados. Foi ainda Goldstein que nos anos setenta (do século XIX, atenção!)
notou que os raios catódicos eram emitidos perpendicularmente à superfı́cie do cátodo e que as
suas propriedades não dependiam da composição quı́mica do cátodo. Assim, os raios catódicos
constituiam um fluxo carregado e pareciam ser arrancados ao cátodo pelo campo eléctrico nos
pontos da sua superfı́cie.
Em 1871, C. Varley propôs que os raios catódicos eram constituı́dos por partı́culas carregadas
negativamente. Esta idéia não foi imediatamente aceite. Até ao inı́cio do século XX, manteve-se
acesa uma disputa que opôs os partidários da natureza corpuscular dos raios catódicos aos que
defendiam a sua natureza ondulatória. Esta questão foi encerrada por J. J. Thomson em 1897
a favor da hipótese corpuscular, após um conjunto de experiências de grande precisão, em que
pode também determinar a relação entre a carga e a massa do electrão, nome com que foram
baptizados os corpúsculos constituintes dos raios catódicos. Finalmente, em 1911, R. Millikan
conseguiu determinar o valor da carga do electrão, numa experiência em que electrizava gotı́culas
de óleo e analisava o seu movimento sob a accção conjunta da força da gravidade e de uma força
eléctrica aplicada.
O modelo de Thomson
Destes e de outros trabalhos, cresceu a convicção de que os electrões eram parte constituinte da
matéria, ou seja, dos átomos que a formam. Note-se que, isoladamente, os electrões não podiam
ser confundidos com os átomos, porque a matéria aparece, em geral, electricamente descarregada, o que seria claramente impossı́vel caso fosse constituı́da apenas por partı́culas carregadas
como electrões. Os electrões seriam então, juntamente com outras partı́culas ainda desconhecidas,
constituintes do átomo, que era afinal, ao contrário do que afirmava Dalton, divisivel.
(a) Uma
descrição bastante detalhada destes estudos pode ser consultada no url
http://library.thinkquest.org/19662/high/eng/cathoderays.html
1.1. A EVOLUÇÃO HISTÓRICA DA HIPÓTESE ATÓMICA
3
F
2+
α
A
θ
Figura 1.2: Representação esquemática da experiência de Rutheford. Partı́culas α produzidas pela
fonte F incidem numa alvo constituı́do por uma folha fina de ouro (A), determinando-se o ângulo
em que são dispersas.
Em 1904, J. J. Thomson propôs o seu modelo para a estrutura atómica, segundo o qual os
átomos seriam pequenas esferas carregadas uniformemente com uma densidade de carga positiva,
no interior das quais se encontravam electrões, em número suficiente para anular a carga total do
átomo. Este modelo é carinhosamente conhecido como o “modelo do bolo de passas”, indicando
uma analogia entre os electrões num átomo denso e uniforme e as passas de uvas num bolo de
passas. Thomson descobriu também que o número de electrões de cada átomo era igual ao número
atómico do seu elemento quı́mico. O tamanho dos átomos pôde ser estimado a partir do valor da
densidade dos sólidos ou de análises envolvendo a teoria cinética dos gases. Todas as abordagens
indicaram que os átomos teriam um raio de alguns angstrongs(b)
Thomson tentou também calcular as posições de equilı́brio dos electrões em átomos de diferentes elementos e as frequências com que os electrões oscilariam em torno dessas posições, com
o objectivo de explicar os espectros de emissão e absorção atómicos, por exemplo, as várias séries
de riscas no espectro do hidrogénio. Este esforço não foi, no entanto, nada bem sucedido.
O átomo nuclear
Simultaneamente com estes desenvolvimentos na fı́sica atómica, verificaram-se uma série de descobertas que originaram o ramo da fı́sica que mais tarde viria a ser conhecido com o nome de
Fı́sica Nuclear. Em 1896, Henri Bequerel descobriu a radioactividade natural; nos anos seguintes
decorreram os trabalhos do casal Pierre e Marie Curie, que isolaram diversas substâncias radioactivas. Em 1899, Rutheford descobriu que a radiação do urânio era constiuı́da por partı́culas com
diferentes cargas eléctricas, tendo chamado partı́culas-α às positivas e β às negativas. No mesmo
ano, constatou que as partı́culas α não eram mais do que átomos de hélio duplamente ionizados e
que as partı́culas-β eram electrões.
Em 1909, Rutheford, Geiger e Marsden realizaram uma série de experiências cruciais, onde
analisavam a dispersão angular de um feixe de partı́culas α incidente numa folha de ouro (ver
a Figura 1.2). Surpreendentemente, verificou-se que uma fracção muito elevada de partı́culas α
sofria desvios muito acentuados.
É instrutiva uma análise um pouco mais detalhada desta experiência. De acordo com o modelo de Thomson aceite na altura, os átomos consistiriam em esferas densas, com carga positiva uniforme, onde se distribuı́am os electrões atómicos. Numa experiência como a de Rutheford, explicam-se os desvios sofridos pelas partı́culas α através da interação eléctrica entre elas
e os átomos do alvo. Esta interacção é a soma de duas parcelas: a força de atracção entre as
partı́culas α (positivas) e os electrões atómicos (negativos) e, por outro lado, a força de repulsão
entre as partı́culas α e o substrato atómico, denso e positivo. Como as partı́culas α têm uma
massa muito maior (quase 7300 vezes maior) que a dos electrões, a primeira destas interações deve
ter um efeito imperceptı́vel sobre o movimento das partı́culas α. Um efeito semelhante verifica-se
fazendo uma bola medicinal de 20 kg colidir com bolas de ténis de mesa, com uma massa de 3 gr.
Não esperamos, decerto, observar uma grande alteração da trajectória da bola mais pesada como
resultado da sua colisão com as bolas mais leves...
(b) Um
angstrong (Å) é 10−10 m.
4
CAPÍTULO 1. INTRODUÇÃO
E
EMax
r
a
Figura 1.3: Gráfico do módulo do campo eléctrico gerado por um átomo esférico com raio a carregado
uniformemente com uma carga Ze.
Uma vez que desprezamos o efeito da interacção entre as partı́culas α e os electrões atómicos,
resta a interacção com a distribuição de carga positiva para explicar a dispersão do feixe incidente.
Como já se referiu, esta interação é de natureza eléctrica. A força sobre uma partı́cula α é
proporcional ao campo eléctrico gerado pelos átomos de ouro do alvo na posição ocupada pela
partı́cula incidente. Considerando, para simplificar, o efeito de apenas um átomo de ouro, com
raio a e carga (positiva) Ze distribuida uniformemente (Z = 79 é o número atómico do ouro), com
centro na origem de coordenadas, temos um campo eléctrico dado por
½
~ r) =
E(~
1
4π²0
1
4π²0
Ze
r
a3 ~
Ze
~
r3 r
se
se
r<a
r > a.
(Esta expressão é facilmente deduzida usando a Lei de Gauss.) O módulo do campo eléctrico é
uma função que cresce linearmente com a distância à origem até atingir um máximo para r = a,
após o que decresce proporcionalmente ao inverso do quadrado de r (ver o gráfico na Figura 1.3).
O valor máximo atingido pelo campo é
EMáx = E(a) =
1 Ze
.
4π²0 a2
Como é patente nesta igualdade, o valor máximo do campo eléctrico que actua nas partı́culas α
é fortemente limitado pelo tamanho da região do átomo onde se concentra a carga positiva e a
massa do átomo. Considerando, nos termos do modelo de Thomson, que essa região coincidia
com o volume atómico, Rutheford achava que as forças sobre as partı́culas α seriam pequenas e,
por isso, não esperava observar desvios muito acentuados em número apreciável. Esta discussão
está bem ilustrada na Figura 1.4, em que mostramos a trajectória seguida por uma partı́cula α
incidindo em átomos com diferentes raios, apresentando-se também um gráfico da intensidade da
força eléctrica exercida na partı́cula, como função do tempo. Constata-se claramente que átomos
maiores produzem desvios menores.
Na Figura 1.5 apresentam-se as distribuições angulares do feixe de partı́culas α produzidas
(recorrendo a uma simulação computacional) por átomos de Thomson, com um raio de 1,5Å (à
esquerda) e por um núcleo atómico com um raio de 2 fm(c) (à direita). Os resultados observados
por Rutheford, Geiger e Marsden foram semelhantes aos apresentados no gráfico da direita.
O facto de se terem observado, e em grande número, deflexões de 90◦ e até superiores, obrigou
Rutheford a rever o modelo de Thomson, mantendo o raio atómico nos valores aceites (cerca de
10−10 m) mas reduzindo grandemente o tamanho da região onde se concentra a massa e a carga
positiva por um factor de 105 . A fronteira do átomo ficaria assim definida pela posição dos electrões
e, para os impedir de cair no “caroço” denso e positivo, Rutheford propôs que eles orbitariam em
torno daquela região, formando uma espécie de sistema solar microscópico.
(c) Um
fermi (1 fm) é o mesmo que um fentometro, isto é, 10−15 m.
1.1. A EVOLUÇÃO HISTÓRICA DA HIPÓTESE ATÓMICA
5
R=1.5Å
t
R=1.2Å
t
R=0.9Å
t
R=0.6Å
t
Figura 1.4: Trajectórias seguidas por uma partı́cula α incidindo em átomos com a mesma carga
mas diferentes raios. À direita pode apreciar-se a intensidade da força nela aplicada, como função
do tempo. Nota-se claramente que a átomos menores correspondem intensidades da força eléctrica
média superiores, ou seja, maiores desvios sofridos pelas partı́culas α.
700
700
600
600
500
500
400
400
300
300
200
200
100
100
-90
0
90
-90
0
90
Figura 1.5: Distribuições angulares do feixe de partı́culas α difractado por um átomo de Thomson
com um raio de 1,5 Å (à esquerda) e por um núcleo atómico com um raio de 2,0 fm = 2,0 × 10−5 Å
(à direita). Em abcissas representa-se o ângulo de deflexão, em ordenadas o número de partı́culas α
que sofreram desvios com esses ângulos. A carga do centro dispersor é a mesma nos dois casos.
6
CAPÍTULO 1. INTRODUÇÃO
1.1.3
Entram os quanta
Este novo modelo foi, logo após a sua apresentação, criticado (até pelo próprio Rutheford) porque
tinha como consequência a instabilidade dos átomos. Com efeito, electrões em órbita do núcleo
deveriam, nos termos da teoria electromagnética, emitir radiação, ou seja, energia. A energia
mecânica destes electrões deveria, pois, ir diminuindo, ocupando os electrões orbitais cada vez
mais próximas do núcleo, até que que se desse o choque final. Tudo isto aconteceria numa fracção
de segundo, contrariando claramente toda a evidência experimental.
Para resolver este impasse, Niels Bohr, que na altura (1913) era colaborador de Rutheford,
propôs uma teoria inspirada nos então recentes modelos quânticos de Plank e de Einstein, baseada
nos seguintes pontos de partida:
(a) Ao contrário do que se passa no sistema solar, nem todas as órbitas electrónicas são permitidas, mas apenas aquelas com forma circular em que o momento angular electrónico é um
múltiplo inteiro da constante de Plank reduzida, h̄ = h/2π. Enquanto um electrão ocupa
uma destas órbitas, não emite radiação nenhuma.
(b) Um electrão pode sofrer uma transição entre duas órbitas permitidas, emitindo (ou absorvendo) um fotão com energia igual à diferença entre as energias dos estados inicial e final.
Fazendo apenas estas suposições, Bohr pode reproduzir com exactidão o espectro de emissão e
absorsão do hidrogénio, como demonstramos a seguir.
Um electrão na n-ésima órbita permitida descreve um movimento circular uniforme(d) em
torno de um núcleo que o atrai electrostaticamente. Seja rn o raio desta órbita e vn o módulo da
velocidade com que é descrita. A força que mantém o electrão na órbita é a força de Coulomb,
F =
1 e2
,
4π²0 rn2
onde e é o módulo da carga de um electrão e ²0 o valor da permitividade eléctrica do vácuo. Esta
força é também a força de um movimento circular uniforme, de forma que podemos escrever
m
vn2
1 e2
.
=
rn
4π²0 rn2
(1.1)
Por outro lado, ela deve satisfazer a condição de quantização de Bohr, isto é, o momento angular
electrónico deve ser um múltiplo da constante de Plank reduzida,
mvn rn = nh̄.
(1.2)
Destas duas igualdades resultam imediatamente os valores permitidos para rn e vn :
rn
=
vn
=
n2 h̄2
me2
1 e2
.
4π²0 nh̄
4π²0
A energia mecânica de um electrão nesta órbita é a soma da sua energia potencial electrostática,
Un = −
com a energia cinética,
Tn =
1 e2
,
4π²0 rn
1
mv 2 ,
2 n
(d) O movimento é uniforme porque este sistema é semelhante a um sistema planetário, logo, podemos aplicar a
lei das áreas de Kepler, de onde se deduz que, sendo a trajectória circular, só pode ser descrita uniformemente.
1.1. A EVOLUÇÃO HISTÓRICA DA HIPÓTESE ATÓMICA
ou seja,
En = Un + Tn = −
1
2
µ
e2
4π²0
¶2
7
m
.
n2 h̄2
O fotão emitido numa transição entre dois nı́veis ni e nf (ni > nf ) deve então ter uma energia
igual a
Ã
!
µ 2 ¶2
1
e
m
1
1
ε = Eni − Enf =
− 2 ,
2 4π²0
ni
h̄2 n2f
e a frequência da radiação emitida é a definida pela lei de Plank,
ν
=
=
1
1
ε =
ε
h
2πh̄
Ã
!
µ 2 ¶2
1
m
1
1
e
− 2 .
2 4π²0
ni
2πh̄3 n2f
Finalmente, o comprimento de onda da radiação emitida na transição pode ser calculado como
!
Ã
ν
1
1
1
(1.3)
= = RH
− 2 ,
λ
c
n2f
ni
onde
1
RH =
2c
µ
e2
4π²0
¶2
m
≈ 1,0974 × 107 m−1
2πh̄3
é uma constante, chamada constante de Rydberg. A Eq. (1.3), que nos permite calcular o comprimento de onda da radiação emitida (ou absorvida, se tomarmos em linha de conta um sinal) numa
transição entre dois nı́veis de Bohr, tinha sido obtida de forma empı́rica no estudo do espectro do
hidrogénio, por Rydberg, em 1890. Foi um tremendo sucesso para o modelo de Rutheford-Bohr
que se pudesse, com ele, justificar teoricamente a fórmula de Rydberg.
O modelo de Bohr não clarificava a natureza fundamental da estrutura atómica. Não se
apresentava, com este modelo, uma explicação para o facto do electrão atómico não perder energia
por irradiação; ele era, meramente, aceite. Para fazer esta clarificação foi preciso esperar mais 20
anos, até à formalização da Mecânica Quântica(e) . Um passo importante para esta formalização foi
dado por Louis de Broglie em 1923, quando generalizou a dualidade onda-partı́cula, que até então
se aplicava apenas à radiação, às partı́culas como electrões ou protões. Inspirado na teoria da
relatividade restrita e na óptica, achou uma expressão para o comprimento de onda de partı́culas
em movimento e constatou que as órbitas de Bohr eram exactamente aquelas que permitiam o
estabelecimento de vibrações estacionárias da função de onda electrónica.
1.1.4
O neutrão
Com o modelo de Rutheford e Bohr, foi possı́vel descrever com precisão o espectro do átomo
de hidrogénio, como acabámos de mostrar. Infelizmente, este modelo não produzia resultados
satisfatórios para os espectros dos restantes átomos. Apesar deste facto, e apesar de ser uma
teoria insatisfatória por ter algumas premissas injustificáveis na altura, este modelo ajudou a
convencer a comunidade cientı́fica a favor de uma estrutura atómica semelhante à que ainda hoje
adoptamos: os átomos são constituı́dos por um núcleo muito pequeno, com uma carga +Ze (Z
é o número atómico) e com a quase totalidade da massa atómica, à volta do qual se distribuem
os electrões descrevendo, num certo sentido, movimentos orbitais, que os impedem de “cair” no
núcleo que os atrai.
(e) É discutı́vel dizer que a Mecânica Quântica clarifica as coisas. Bohr dizia, mais ou menos, o seguinte: “Quem
acha que a mecânica quântica não é uma teoria misteriosa, ainda não a compreendeu,”coisa que também se pode
dizer como: só aqueles que não compreendem a mecânica quântica acham que ela permite compreender bem a
realidade.
8
CAPÍTULO 1. INTRODUÇÃO
p+
?
α 2+
Be
Parafina
Figura 1.6: Representação esquemática da Experiência de Irène Curie e Frederick Joliot.
O núcleo seria constituı́do por protões, partı́culas com carga igual (mas oposta) à do electrão,
e com uma massa, igual à de um ião H+ , muito superior à do electrão.
Um átomo de hidrogénio é, no quadro deste modelo, simplesmente constituı́do por um electrão
em órbita à volta de um protão. Mas logo o átomo seguinte na escala de massas, o deutério(f)
apresenta um problema. A sua massa é aproximadamente igual ao dobro da do hidrogénio, mas o
seu núcleo não pode conter dois protões porque o número atómico (ou seja, o número de electrões
circundantes) é, como o do hidrogénio, 1. Ora, um átomo com dois protões no núcleo e um electrão
em órbita não é electricamente neutro.
Para resolver esta dificuldade, que se verificava também para os átomos de todos os outros
elementos, surgiu a ideia, que se manteve durante alguns anos, de que os núcleos dos átomos do
elemento com número atómico Z e com número de massa A seriam constituı́dos por A protões e
por A − Z electrões. Assim, a carga do núcleo seria Ae − (A − Z)e = Ze, e portanto a carga total
do átomo anulava-se.
Mas este modelo era muito insatisfatório. Em primeiro lugar estranhava-se que a dinâmica
protão-electrão, que gera sistemas como o átomo, com dimensões de alguns angstrongs, pudesse
também ser responsável por sistemas muito mais pequenos, com apenas alguns fentometros. Mas
há ainda uma objecção mais fundamental. Tanto o protão como o electrão têm spin(g) 1/2.
De acordo com este modelo, um núcleo como o do deutério 2 H, deveria conter dois protões e
um electrão, ou seja, três partı́culas de spin 1/2. A composição dos momentos angulares destas
três partı́culas tem, como resultado, os valores 1/2 ou 3/2. No entanto, o momento angular
do deuterão foi medido e apresenta o valor 1. Esta inconsistência motivou especulações sobre
a existência de uma partı́cula neutra, que não tinha ainda sido descoberta. A questão só foi
resolvida com a descoberta do neutrão por Chadwick, em 1932. Chadwick analisou dados de uma
experiência realizada pelo casal Irène Curie-Joliot (filha de Marie Curie) e Frederick Joliot na
qual eram observados protões resultantes da travagem, em parafina, de uma radiação proveniente
do bombardeamento de um alvo de berı́lio com partı́culas-α (ver a Figura 1.6). O casal Joliot
supôs que a radiação que era travada na placa de parafina era radiação electromagnética e, dada
a energia com que os protões eram ejectados da placa, tinha que ter uma energia muito, muito
alta, como nunca antes tinha sido observada. Em vez de radiação electromagnética, Chadwick
propôs que a radiação produzida pelo berı́lio devia antes ser constituida por partı́culas neutras e
com uma massa semelhante à do protão, e realizou imediatamente uma série de experiências, em
que substituia a parafina por outras substâncias, que provaram a sua hipótese. E estava, assim,
descoberto o neutrão, o último dos ingredientes principais (juntamente com o electrão e o protão)
da estrutura atómica.
1.2
A estrutura atómica
Quando isolados, os sistemas atómicos (núcleo-nuvem electrónica) são estáveis. As propriedades
destes sistemas são cabalmente descritas pelas leis da Mecânica Quântica. De acordo com estas
leis, os electrões distribuem-se por diversos estados electrónicos, cujas propriedades se determinam
resolvendo a Equação de Schrödinger. Os estados quânticos de electrões confinados a uma região
(f) O deutério é um isótopo do hidrogénio, tendo o mesmo número atómico (claro) mas um número de massa duplo
do do hidrogénio.
(g) O spin de uma partı́cula é o seu momento angular intrı́nseco, que é independente do seu estado de movimento.
Será objecto de um estudo mais aprofundado adiante.
1.2. A ESTRUTURA ATÓMICA
9
limitada do espaço (como é o caso dos electrões atómicos), podem ser distinguidos entre si por um
conjunto de números inteiros, chamados números quânticos. Este facto é digno de nota porque
significa que os estados possı́veis dos electrões atómicos estão discretizados. Repare-se que, em
sistemas macroscópicos com interacções formalmente semelhantes, como o sistema solar, não se
nota qualquer discretização dos estados possı́veis dos planetas; estruturas como a cintura de asteróides (entre as órbitas de Marte e de Júpiter) ou os anéis de Saturno, mostram claramente que
o espectro de possibilidades para os estados dos corpos em órbitas gravitacionais é um conjunto
contı́nuo, não discreto como se verifica nas escalas atómicas.
Esta discretização do espaço de estados surge naturalmente da resolução da equação de Schrödinger. No caso dos estados electrónicos atómicos, esses números quânticos (n, l, ml , s) identificam
a energia, o módulo do momento angular orbital, a componente z do momento angular orbital
e a componente z do momento angular de spin. O número quântico principal (n) é um inteiro
positivo, ou seja, pode tomar os valores 1, 2, 3,. . . O que se pretende significar com esta frase é
que há estados electrónicos atómicos com n = 1, outros com n = 2 ou n = 3, mas não há estados
com n = 1,5 ou n = −1. Em átomos monoatómicos (como o hidrogénio ou o deutério) ou em
iões com apenas um electrão (como o He+ , o Li2+ , o Be3+ ), a energia de cada estado electrónico
depende apenas deste ı́ndice. Em átomos ou iões com dois ou mais electrões, a energia depende
também de l.(h) O número quântico de momento angular, l, é, um número inteiro não negativo,
mas a Equação de Schrödinger não tem soluções para l >= n. Assim sendo, existem estados
caracterizados por valores de (n, l) como (1, 0), (2, 0), (2, 1), mas não há estados (n, l) = (1, 1)
ou (2, −1). Uma notação muito habitual em fı́sica consiste em designar os estados com diferentes
valores de l através de letras do alfabeto, de acordo com a correspondência apresentada na tabela
em baixo.
l
0
1
2
3
4
...
sı́mbolo
s
p
d
f
g
...
A partir de l = 3 a correspodência segue a ordem alfabética. Usando esta nomenclatura, as
orbitais (n, l) = (1, 0), (2, 0), (2, 1) a que nos referimos há pouco designam-se orbitais 1s, 2s e 2p,
respectivamente. O número quântico de projecção de momento angular, ml , pode tomar todos os
valores inteiros entre −l e +l e, por fim, o número quântico de spin, ms , pode tomar os valores
±1/2.
Os electrões (tal como os protões e os neutrões) pertencem à classe dos fermiões, logo, satisfazem
o Princı́pio de Exclusão de Pauli: não pode haver mais do que um electrão no mesmo estado
quântico. Assim, num átomo no estado fundamental (isto é, de menor energia), os electrões
distribuem-se pelos estados disponı́veis de menor energia possı́vel. A ordenação energética dos
estados electrónicos pode obter-se a partir da regra da diagonal, ilustrada na Figura 1.7. De
acordo com a aplicação desta regra, a ordem crescente dos valores da energia é a da sequência 1s
2s 2p 3s 3p 4s 3d 4p 5s 4d 5p 6s. . .
Uma orbital (n, l) contém 2 × (2l + 1) estados electrónicos,(i) logo, pode albergar 2(2l + 1)
electrões. Então, tendo em conta a ordenação energética das orbitais, podemos facilmente constatar que um átomo de lı́tio, que tem três electrões, deve ter a orbital 1s totalmente preenchida e um
electrão sózinho na orbital 2s; um átomo de carbono (seis electrões) tem totalmente preenchidas
as orbitais 1s e 2s e restam 2 electrões na orbital 2p; o germânio (32 electrões) tem as orbitais 1s
2s 2p 3s 3p 4s 3d totalmente preenchidas e 2 electrões na orbital 4p.
(h) Há ainda uma muito ténue dependência de m e m , resultante do chamado acoplamento spin-órbita, mas
s
l
vamos desprezar estes detalhes.
(i) Note que m pode tomar os 2l + 1 estados m = −l, m = −l + 1, . . . m = l − 1, m = l e m pode tomar os
s
l
l
l
l
l
dois valores ±1/2.
10
CAPÍTULO 1. INTRODUÇÃO
1s
2s
2p
3s
3p
3d
4s
4p
4d
4f
5s
5p
5d
5f
5g
6s
6p
6d
6f
6g
6h
7s
7p
7d
7f
7g
7h
7i
Figura 1.7: A regra da diagonal. As setas indicam a ordem crescente para a energia electrónica.
A Figura 1.8 representa graficamente, de forma qualitativa, as energias das várias orbitais, para
dois átomos diferentes, com números atómicos Z (à esquerda) e Z + 1 (à direita). Esta figura põe
em evidência duas propriedades dignas de nota. Em primeiro lugar, as orbitais não se encontram
igualmente separadas; o hiato energético que separa as orbitais s das que as precedem é maior do
que os restantes. O espectro energético de cada átomo fica assim dividido em grupos de orbitais
com energias próximas umas das outras, separadas por intervalos “despovoados”. A estes grupos
de orbitais dá-se o nome de camadas. Em segundo lugar, a energia das orbitais num átomo com
dado número atómico é menor que a das orbitais correspondentes num átomo com maior número
atómico. (O facto de a energia das orbitais ser negativa é essencialmente convencional: considerase nula a energia de um electrão em repouso desligado do átomo; para atingirmos esta situação,
temos que fornecer energia ao átomo, logo, a sua energia inicial deve ser negativa.) A energia de
cada orbital, ou seja, a energia de um electrão que ocupe um estado dessa orbital, é igual à soma
da energia cinética com a energia potencial. Esta última é a da interacção electrostática entre
duas cargas de sinal contrário, que, como deve ser bem sabido, é proporcional ao produto das
duas cargas. É por isto que a energia de cada orbital diminui (ou melhor, torna-se mais negativa)
à medida que aumenta o número atómico: aumentando a carga no núcleo aumenta o módulo do
produto da carga do electrão com a carga do núcleo.
Assim, em geral, a energia total de um átomo com um dado número atómico é maior (isto é,
menos negativa) do que a energia do átomo com mais uma unidade de número atómico. Logo,
estes são mais coesos do que aqueles, coisa que se nota, por exemplo, na energia necessária para
arrancar um electrão ao átomo; como é sabido, esta energia aumenta, em geral, à medida que
aumenta o número atómico. Mas esta regra tem excepções: sempre que o hiato energético é
suficientemente largo, a diminuição das energias das orbitais causada pelo aumento do número
atómico não compensa o dispêndio de energia necessário para “arrumar” mais um electrão, num
nı́vel de energia bastante mais alto. Estas excepções verificam-se quando se inaugura uma nova
camada. A Figura 1.9 mostra os gráficos do raio atómico (à esquerda) e da energia de ionização (à
direita) como funções do número atómico, onde são patentes descontinuidades relacionadas com o
preenchimento das camadas como as que referimos.
Podemos agora compreender melhor algumas propriedades quı́micas dos elementos. Por exemplo, os átomos cujas nuvens electrónicas apresentam camadas completas são os dos gases raros,
que aparecem na coluna mais à direita da tabela periódica. Como os electrões destes átomos se
encontram muito fortemente ligados (por todos pertencerem a camadas completas), praticamente
1.2. A ESTRUTURA ATÓMICA
11
E
E=0
6p
5d
4f
6s
6ª camada
(32 electrões)
5p
5ª camada
(18 electrões)
4d
5s
4p
4s
4ª camada
(18 electrões)
3p
3s
3ª camada
(8 electrões)
3d
2p
2s
2ª camada
(8 electrões)
1s
1ª camada
(2 electrões)
Z
Z+1
Figura 1.8: Representação qualitativa e esquemática das energias das orbitais de dois átomos com
número atómico Z (à esquerda) e Z + 1 (à direita). Os números entre parêntesis representam a
quantidade de electrões que cada camada pode albergar. (Consegue verificar estes valores?)
Figura 1.9: Raio atómico (à esquerda) e energia de ionização (à direita), como funções do número
atómico. São patentes as descontinuidades quando se completam camadas, ou seja, quando se atingem os gases raros. Fonte: www.webelements.com
12
CAPÍTULO 1. INTRODUÇÃO
não sentem a proximidade de outros átomos. Assim, os átomos dos gases raros não têm facilidade
em estabelecerem ligações quı́micas, como é bem sabido.
Os átomos do sétimo grupo têm todas as suas orbitais totalmente preenchidas, restando apenas
um estado vago na última camada(j) . Estes átomos experimentam um grande abaixamento de
energia quando capturaram um electrão, porque esse electrão vai completar a camada de valência.
Então, num ambiente rico em electrões livres ou quase livres, o estado natural de átomos do sétimo
grupo deve ser o de iões negativos. É o que acontece com o cloro em solução aquosa: aparece na
forma Cl− .
Ao contrário do que acontece com os átomos do sétimo grupo, os átomos do primeiro grupo
têm apenas um electrão na camada de valência. Pelas razões que já foram expostas, este electrão
encontra-se muito fracamente ligado ao átomo, de forma que é fácil separar electrão e átomo. Num
ambiente em que os átomos estejam sujeitos a colisões com vizinhos, deve verificar-se que muitos
destes átomos se encontrem ionizados por lhes ter sido arrancado o electrão de valência. É o
que acontece numa solução aquosa, em que os átomos dos elementos do primeiro grupo aparecem
ionizados com carga negativa (Li+ , Na+ , etc.).
1.3
Ligações quı́micas
As ligações entre átomos, através das quais se formam agregados de matéria, costumam dividirse em quatro classes principais, a saber: as ligações iónicas, as ligações covalentes, as ligações
metálicas e as ligações de Van der Waals.
Nas primeiras, não se notam grandes alterações da estrutura electrónica de cada um dos átomos
que participa na ligação; dá-se, apenas, uma atracção electrostática forte entre dois iões de sinal
contrário. Os átomos participam como um todo nas ligações iónicas, como se fossem pequenas
esferas rı́gidas carregadas.
No estabelecimento de ligações de Van der Waals também não se verifica uma grande modificação dos estado dos electrões de cada substância. O que se passa nestas ligações é que pequenas
oscilações dipolares num dos átomos induzem oscilações dipolares nos átomos vizinhos, resultando
uma atracção fraca entre o dipolo indutor e os dipolos induzidos.
Nas ligações covalentes, ao contrário do que se passa nas ligações iónicas e de Van der Waals,
nota-se uma profunda alteração das funções de onda dos electrões de valência. Quando se aproximam os dois átomos que estabelecem a ligação, os electrões de valência de cada um começam
a sentir-se atraı́dos pelo outro. As suas funções de onda (que eram soluções de uma Equação de
Schrödinger com um só centro atractivo) alteram-se de maneira tal que passa a ser mais provável
encontrar os electrões de valência na região compreendida entre os dois átomos. Note-se que isto
apenas se verifica para os electrões de valência, porque os outros estão tão fortemente ligados ao
átomo a que pertencem que quase não sentem a influência do átomo vizinho. Estes estados ocupados pelos electrões de valência de um átomo quando ele estabelece uma ligação quı́mica chamam-se
orbitais moleculares. As orbitais moleculares permitem o estabelecimento de uma ligação porque
os cernes atómicos (carregados positivamente, uma vez que lhes faltam os electrões de valência)
dos dois átomos sentem-se atraı́dos pela nuvem electrónica da orbital molecular situada na região
entre os dois átomos. Este efeito encontra-se ilustrado na Figura 1.10.
Numa ligação covalente, as funções de onda dos electrões que participam na ligação são, como
acabámos de ver, muito alteradas. De facto, deixamos de poder identificar o átomo a que um
dado electrão de ligação pertence, uma vez que passam a pertencer à molécula e cada electrão
de ligação passa a ser partilhado pelos dois átomos ligados. Nalguns casos, esta modificacção da
função de onda é ainda mais radical. Por exemplo, no benzeno (C6 H6 ) cada átomo de carbono está
ligado a dois outros átomos de carbono formando uma cadeia hexagonal. Cada átomo de carbono
encontra-se ainda ligado a um átomo de hidrogénio. Estas ligações são ligações covalentes como as
(j) Para simplificar a linguagem, vamos definir agora alguns termos habituais na quı́mica: chama-se camada de
valência de um átomo à camada desse átomo de mais alta energia (isto é, com energia menos negativa) que ainda
contém electrões; electrões de valência são os electrões que ocupam essa camada; cerne atómico é o átomo subtraı́do
dos electrões de valência, ou seja, o núcleo mais os electrões das camadas interiores.
1.3. LIGAÇÕES QUÍMICAS
13
Figura 1.10: Orbitais atómicas de dois átomos distantes um do outro (esquerda) e orbital molecular
ligando os dois átomos (à direita). A região a cinzento representa a nuvem de electrões de valência
e os cı́rculos pretos pequenos representam os cernes atómicos.
Figura 1.11: Estrutura molecular hipotética (e errada) do benzeno (à esquerda). Os traços mais
espessos representam ligações duplas. De acordo com as convenções usuais, considera-se um átomo
de carbono presente em cada vértice e um de hidrogénio na extremidade de cada linha não ligada. Ao
centro pode ver-se uma representação esquemática das orbitais cı́clicas do benzeno (de Wikipedia,
the free encyclopedia). À direita, representação convencional da molécula de benzeno.
que acabámos de descrever. Dos quatro electrões de valência que cada átomo de carbono possui,
três ficam a ocupar as orbitais moleculares necessárias para estas ligações. Quanto ao electrão
de valência restante, poderı́amos pensar que estabeleceria novas ligações covalentes, formando-se,
entre os átomos de carbono, ligações duplas e simples alternadamente. Mas as ligações duplas
têm comprimentos menores do que as ligações simples correspondente. A estrutura molecular do
benzeno seria, então a representada na Figura 1.11, à esquerda. Uma tal estrutura deixaria uma
assinatura nı́tida em análises espectrométricas. Nestes estudos, analiza-se o espectro de absorção
da substância estudada. Dois tipos de ligações diferentes entre átomos de carbono deixariam dois
picos de absorção facilmente identificáveis, coisa que não se vislumbra no espectro do benzeno.
Todas as ligações C–C no benzeno são idênticas. Logo, os seis electrões (um por cada átomo)
devem ficar igualmente distribuidos pelas seis ligações, definindo orbitais cı́clicas, estendidas a
toda a molécula. Os electrões que ocupam estas orbitais podem mover-se quase livremente ao
longo de toda a cadeia hexagonal de átomos de carbono.
Um caso ainda mais extremo de deslocalização electrónica verifica-se na grafite. Nesta substância, várias cadeias hexagonais de átomos de carbono ligam-se umas às outras, formando uma
macromolécula planar com uma estrutura que lembra as colmeias de abelhas ou os tabuleiros
dos jogos de estratégia. Cada átomo estabelece três ligações covalentes com outros três átomos
de carbono, restando ainda um electrão de valência por cada um, que vai ocupar uma orbital
deslocalizada, podendo mover-se livremente ao longo de toda a molécula. Por esta razão, a grafite
é boa condutora de electricidade.
A ligação quı́mica na grafite é causada por dois tipos de deformações das orbitais atómicas:
uma, que leva ao estabelecimento de ligações covalentes entre átomos de carbono contı́guos; a outra,
que leva ao aparecimento de orbitais deslocalizadas que se estendem ao longo de toda a molécula.
Nos metais, apenas esta última espécie de deformações se verifica. O que mantém ligados os cernes
atómicos uns aos outros é a atracção que sentem pela nuvem electrónica associada às orbitais
deslocalizadas; a presença dos iões, por seu turno, define o potencial que sustenta esta mesma
orbital. Um metal é, então, um agregado de cernes atómicos, carregados positivamente, imersos
num oceano de electrões essencialmente livres, sendo o conjunto globalmente descarregado. Este
quadro tem algumas semelhanças com o modelo atómico de Thomson (o bolo de passas), mas como
uma fotografia em negativo: No modelo atómico, cargas negativas (electrões) individualizavam-se
14
CAPÍTULO 1. INTRODUÇÃO
num fundo positivo uniforme; no modelo metálico que acabámos de descrever, cargas positivas
(os cernes atómicos) estão presentes num fundo negativo (a nuvem electrónica) mais ou menos
uniforme.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• F. J. Blatt, Modern Physics (1992), Secções 5.1, 5.3, 5.4, 12.2 [F5.0/442]
• P. A. Tipler,R. A. Llewellyn, Fı́sica Moderna (2001), Secções 4.1, 4.2, 4.3, 7.6, 9.1, 9.2, 9.3
[F5.0/273]
PROBLEMAS
1.1 Considerando os átomos dos sólidos como pequenos cubos encostados uns aos outros, estime as
dimensões atómicas (a largura destes cubos) para as seguintes substâncias, a partir dos valores
das suas densidades e das suas massas atómicas
(a) Ferro: ρ = 7,86 × 103 kg m−3 , m = 55, 8 u;
(b) Alumı́nio:ρ = 2,70 × 103 kg m−3 , m = 27, 0 u;
(c) Mercúrio:ρ = 1,36 × 104 kg m−3 , m = 200, 6 u;
1.2 A Equação de van der Waals para gases reais é
p=
³ ´2
n
nRT
−a
V − nb
V
,
onde p, V , T , n representam, respectivamente, a pressão, o volume, a temperatura e o número
de moles de uma amostra de gás, R é a constante dos gases (R = kB NA ≈ 8,314 J K−1 mol−1 ),
e a e b são dois parâmetros caracterı́sticos de cada gás, o primeiro relacionado com detalhes da
força intermolecular, o segundo com o volume molecular, dado por
b = NA vm ,
onde vm é o volume de uma molécula. Dados os seguintes valores de a e b para os gases raros
calcule os valores dos seus raios atómicos.
Elemento
He
Ne
Ar
Kr
Xe
a (L2 atm mol−2 )
0.034
0.211
1.340
2.320
4.190
b (L mol−1 )
0.0237
0.0171
0.0322
0.0398
0.0510
Capı́tulo 2
Elementos de Cristalografia
Neste capı́tulo, vamos introduzir a linguagem e os conceitos básicos utilizados no estudo dos
cristais. Os tópicos aqui abordados serão usados ao longo de todo o curso e é, por isso, importante
que sejam bem apreendidos.
2.1
Cristais ideais e cristais reais
Como foi dito no capı́tulo anterior, os átomos dos sólidos cristalinos ocupam posições dispostas
regularmente, formando padrões que se repetem espacialmente em todas as direcções. A esta
estrutura dá-se o nome de cristal.
Em rigor, os cristais reais não podem satisfazer esta definição, porque uma periodicidade absoluta é impossı́vel. Com efeito, as impurezas quı́micas, os defeitos fı́sicos no padrão de repetição,
as oscilações térmicas, e até mesmo as fronteiras dos cristais reais destroem essa periodicidade.
Reservamos então aquela definição para os cristais ideais, que serão então corpos infinitos, absolutamente puros do ponto de vista quı́mico, com átomos “congelados” nas suas posições de
equilı́brio, etc, considerando os cristais reais aproximações mais ou menos razoáveis daqueles.
2.2
A estrutura cristalina
Matematicamente, um cristal ideal pode ser descrito como um conjunto de átomos dispostos numa
rede definida por três vectores linearmente independentes ~a, ~b, ~c, chamados vectores fundamentais
de translação, tais que o arranjo atómico é, em todos os aspectos, semelhante quando observado
de dois pontos com vectores posição ~r e ~r0 , relacionados através de
~r0 = ~r + h~a + k~b + l~c,
(2.1)
com h, k e l inteiros arbitrários. Com ~r fixo, ao conjunto de pontos que se obtem variando h, k, e
l na equação (2.1) dá-se o nome de rede cristalina, ou de Bravais.
De acordo com as definições apresentadas, não podemos confundir os conceitos de cristal e de
rede cristalina. Esta é uma abstracção matemática que consiste num conjunto de pontos idênticos,
dispostos regular e periodicamente no espaço, ao passo que o cristal é formado por um conjunto de
átomos, que podem nem ser todos da mesma espécie quı́mica, como é o caso do cloreto de sódio.
A estrutura do cristal pode ser gerada sobrepondo a cada ponto da rede cristalina uma base (ou
motivo) de átomos, idêntica para todos os pontos da rede. Assim, a relação entre cristal, rede
cristalina e motivo pode ser simbolizada como
rede + motivo = cristal.
Vejamos o seguinte exemplo para nos ajudar a sedimentar este novo conceito. Na Figura 2.1
está representado um cristal composto por três átomos diferentes. Este cristal pode ser recriado
colocando uma réplica do motivo de três átomos junto a cada um dos pontos da rede.
15
16
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
motivo
ponto
da rede
cristal=rede+motivo
(a)
(b)
Figura 2.1: (a) base de três átomos; (b) cristal. Em cada ponto da rede é colocado a base de átomos
de modo a formar o cristal.
Uma outra abordagem, ilustrada com o seguinte exemplo bi-dimensional, consiste em determinar a rede a partir do cristal: a Figura 2.2 representa uma estrutura cristalina bi-dimensional,
b’
b
a’
y
x
(a)
a
(b)
Figura 2.2: Exemplo de um cristal bi-dimensional.
formada por átomos de duas espécies, “•” e “◦”. De acordo com a definição apresentada, os vectores fundamentais são tais que qualquer combinação linear com coeficientes inteiros destes vectores
é igual à diferença entre as posições de dois pontos equivalentes no cristal. Logo, os vectores ~x e ~y
representados na figura não são vectores fundamentais, porque unem pontos não equivalentes (a
posição de um átomo “•” e de um outro “◦”). A figura da direita representa duas possibilidades
de escolha de vectores fundamentais (~a, ~b e ~a0 , ~b0 ), a rede cristalina por eles gerada e os motivos
correspondentes.
Chamam-se vectores da rede cristalina aos vectores que unem dois quaisquer pontos da rede.
No exemplo que acabámos de apresentar, ~a, ~b, ~a0 , ~b0 são vectores da rede, mas o mesmo não
acontece com ~x ou com ~y . Se qualquer vector da rede puder ser escrito como combinação linear,
com coeficientes inteiros, dos vectores fundamentais, então estes dizem-se vectores fundamentais
primitivos. No exemplo apresentado, ~a0 e ~b0 são vectores fundamentais primitivos, ao passo que ~a
e ~b não o são. Para verificar esta última preposição basta ver que, por exemplo, o vector ~b0 é uma
2.3. TIPOS DE REDES CRISTALINAS
17
combinação linear de ~a e ~b, mas com coeficientes fraccionários,
~b0 = 1 ~a +
2
1~
b.
2
(2.2)
Ao paralelogramo formado pelos vectores fundamentais dá-se o nome de célula unitária. Se os
vectores fundamentais forem, além disso, primitivos, a célula unitária por eles formada chama-se
célula unitária primitiva. Em rigor, esta definição dá-nos apenas um exemplo de célula unitária
primitiva. Uma definição formal é a seguinte:
Célula unitária primitiva é uma porção de espaço que, copiada através de translações
geradas por todos os vectores da rede, preenche todo o volume da rede cristalina, sem
sobreposições ou espaços vazios.
Desta definição deduz-se facilmente que uma célula unitária primitiva contém um, e apenas um,
ponto de rede. Se n for a densidade espacial destes pontos (isto é, o número de pontos por
unidade de volume) e v for o volume de uma célula unitária primitiva, então temos que nv = 1
e logo v = 1/n. Como este resultado é válido qualquer que seja a célula unitária primitiva (isto
é, quaisquer que sejam os vectores fundamentais primitivos usados para a construir), concluı́mos
que todas as células unitárias primitivas têm o mesmo volume.
O volume da célula unitária é um parâmentro importante em muitos cálculos. De acordo com
a expressão válida para paralelogramos, o volume de uma célula unitária primitiva é igual ao
módulo do produto misto dos vectores fundamentais primitivos:
τ = |~a · ~b × ~c|.
(2.3)
O resultado do produto misto de três vectores pode facilmente ser calculado como o determinante
de uma matriz cujas linhas são as componentes (relativamente a uma base ortonormada) de cada
vector, isto é,
¯
¯
¯ ax ay az ¯
¯
¯
~a · ~b × ~c = ¯¯ bx by bz ¯¯ .
¯ cx cy cz ¯
Acabámos de ver que podemos construir uma célula unitária primitiva com o paralelogramo
definido por um conjunto de vectores fundamentais primitivos. Uma outra possibilidade é a
seguinte: unimos com segmentos de recta um dado ponto de rede a todos os seus vizinhos mais
próximos; a região do espaço limitada pelos planos bissectores destes segmentos é uma célula
unitária primitiva. As células construı́das desta forma chamam-se células unitárias primitivas de
Wigner-Seitz. Note-se que, para a definição da células de Wigner-Seitz, não é necessário escolher
um conjunto de vectores fundamentais primitivos; assim, a sua forma depende apenas do tipo
de rede, ao contrário do que acontece com as células unitárias mais usuais definidas a partir
do paralelogramo formado pelos vectores cristalográficos. A Figura 2.3 representa o processo de
construção de uma destas células.
2.3
Tipos de redes cristalinas
A classificação das redes cristalinas faz-se em termos das operações de simetria que cada uma
aceita. Assim, e por exemplo, as redes cúbicas são aquelas que ficam inalteradas sob rotações de π2
em torno de certas direcções. Não faremos aqui este tipo de estudo por não ter uma importância
fundamental no que se segue, neste curso de nı́vel introdutório. Faremos apenas uma descrição
geométrica dos diferentes tipos de rede. Designamos por ~a, ~b e ~c os vectores fundamentais da
rede, por a, b e c os seus módulos e por α, β e γ os ângulos entre eles, definidos de acordo com
o esquema da Figura 2.4. Às quantidades a, b, c, α, β e γ dá-se o nome de parâmetros da rede
cristalina.
(a) Redes cúbicas
De todos os tipos de redes cristalinas, o mais simples de visualizar é o cúbico, caracterizado em
18
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
Figura 2.3: Célula unitária primitiva de Wigner-Seitz.
c
α
b γ
β
a
Figura 2.4: Vectores e ângulos fundamentais.
geral por
a
α
=
=
b
β
=
=
c
γ
=
π
.
2
b
β
γ α
a c
Há três subespécies da rede cúbica: a rede cúbica simples, cujos pontos estão dispostos como
os vértices de cubos iguais, arrumados contiguamente; a rede cúbica de corpo centrado, que, além
dos pontos que constituem a rede cúbica simples, contém ainda um ponto no centro do corpo de
um dos cubos que referimos; e a rede cúbica de faces centradas, que é formada pelos pontos que
formam a rede cúbica simples, e contém ainda um ponto no centro das faces daqueles cubos.
(b) Redes tetragonais
Se comprimirmos ou alongarmos uma rede cúbica numa das suas direcções fundamentais, obtemos
uma rede do tipo chamado rede tetragonal. Nesta, os pontos dispõem-se nos vértices de prismas
rectos de base quadrada (variante simples) e nos centros dos corpos destes prismas (variante de
corpo centrado). As redes tetragonais são então caracterizadas por
a
α
=
=
b
β
6=
=
c
γ
=
π
.
2
b
a c
Note-se que as redes tetragonais não apresentam a variante de faces centradas.
(c) Redes ortorrômbicas
As chamadas redes ortorrômbicas são as que se obtêm deformando a rede cúbica segundo duas
das suas direcções fundamentais. Os ângulos fundamentais são ainda todos iguais a π2 , mas os
módulos dos vectores fundamentais são diferentes entre si, ou seja,
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
a
α
6=
=
b
β
6=
=
c
γ
π
.
2
=
β
γ α
b
a
19
c
Este tipo de rede cristalina apresenta as três variantes simples, de corpo centrado e de faces
centradas, e ainda uma quarta, chamada rede de bases centradas, que é formada por pontos nos
vértices de paralelipı́pedos iguais dispostos contiguamente e dois pontos, nos centros de duas faces
opostas.
As deformações que aplicámos até agora à rede cúbica, para obtermos as redes tetragonais
e ortorrômbicas, têm a propriedade de manter os ângulos α, β e γ iguais a π2 . Vamos agora
apresentar outras possibilidades.
(d) Redes monoclı́nicas
Deformemos uma rede ortorrômbica, por forma a alterar o valor de γ, deixando os outros parâmetros inalterados. Obtemos assim uma rede do tipo chamado rede monoclı́nica, que apresenta
apenas as variantes simples e de bases centradas. As relações entre os parâmetros, neste tipo de
rede, são:
a
α
6=
=
b
β
6=
=
c
π
2
6=
γ.
α
γ β
b
a
c
(e) Redes triclı́nicas
Finalmente, consideremos agora a rede cristalina mais geral, no sentido em que menos constrangimentos impomos aos parâmetros de rede. A rede triclı́nica fica definida por
a
α
6= b
6
=
β
6=
6=
c
γ
6=
β
π
2.
b
γ
α
a
c
Há ainda que considerar dois tipos particulares de rede, que são casos especialmente importantes dos que já mencionámos.
(f) Redes trigonais
A rede trigonal pode obter-se por deformação da rede cúbica na direcção de uma das diagonais
principais. É caracterizada por
a
=
b
=
c
α
=
β
= γ
<
2
π.
3
(g) Redes hexagonais
São casos particulares da rede monoclı́nica, em que γ = 23 π. Assim, verificam
a =
α
2.4
=
b 6= c
π
β= ,
2
γ=
2
π.
3
Exemplos de estruturas cristalinas
Nesta secção apresentaremos exemplos das estruturas cristalinas apresentadas por algumas substâncias quı́micas.
20
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
(a) Redes cúbicas simples
Este tipo de estrutura não é energeticamente favorável para substâncias simples, e por isso poucos
elementos a adoptam. O único exemplo é o polónio, na forma α. Em contrapartida, há vários
compostos que apresentam redes cristalinas do tipo cúbico simples, como, por exemplo, o cloreto
de césio, CsCl. Nos cristais de cloreto de césio, os átomos de uma espécie ocupam as posições
definidas pela rede cúbica simples, enquanto que os da outra ocupam os centros dos corpos da
célula unitária. Note-se que isto não define a rede como sendo cúbica de corpo centrado, porque
os átomos de cloro e de césio são diferentes. Assim, não podem ocupar, ambos, posições da rede
cristalina, que, por definição, é um conjunto de pontos equivalentes. A Tabela 2.1 apresenta alguns
compostos que cristalizam numa estrutura cúbica simples.
Substância
CsCl
CsBr
CsI
TlCl
TlBr
TlI
a (Å)
4,11
4,29
4,56
3,84
3,97
3,74
Substância
NH4 Cl
CuZn
AgMg
LiHg
AlNi
BeCu
a (Å)
3,87
2,94
3,28
3,29
2,88
2,70
Tabela 2.1: Alguns compostos que cristalizam em redes cúbicas simples. Também é apresentado o
valor do parâmetro de rede a.
(b) Redes cúbicas de faces centradas
A rede cúbica de faces centradas é uma das redes que apresenta empacotamento máximo (ver adiante nesta secção) e por isso muitos elementos apresentam estruturas cristalinas deste tipo. Na Tabela 2.2 apresentam-se algumas substâncias (tanto elementos como compostos) que cristalizam em
redes cúbicas simples. O silı́cio e o germânio (muito importantes na industria de semi-condutores)
Elemento
Cu
Ag
Au
Al
a (Å)
3,61
4,08
4,07
4,04
Composto
NaCl
LiF
KCl
LiBr
a (Å)
5,63
4,02
6,28
5,49
Tabela 2.2: Substâncias que cristalizam em redes cfc.
cristalizam também na rede cúbica de faces centradas, com valores para o parâmetro de rede a
de 5,43 Å e 5,45 Å, respectivamente. Um outro exemplo importante é o carbono, na forma de
diamante. A estrutura cristalina do diamante pode ser gerada associando a cada ponto de uma
rede cúbica de faces centrada um motivo constituı́do por dois átomos de carbono com coordenadas
fraccionárias(a) (0,0,0) e ( 14 , 41 , 14 ). O valor do parâmetro de rede do diamante é a = 3, 56 Å.
(c) Redes cúbicas de corpo centrado
Os metais alcalinos cristalizam todos em redes cúbicas de corpo centrado. Na Tabela 2.3 resumemse as propriedades da rede cristalina de alguns elementos que apresentam esta estrutura.
(d) Redes de empacotamento máximo
Em muitos metais e nos sólidos inertes, a ligação quı́mica é tal que favorece uma grande proximidade entre os átomos envolvidos. Nestes casos, as posições ocupadas pelos átomos podem
(a) Mais
adiante serão introduzidas estas coordenadas. Para os presentes efeitos, é suficiente saber que um ponto
cujas coordenadas fraccionárias são (q, r, s) ocupa uma posição definida por q~a + r~b + s~c relativamente a uma origem
convenientemente escolhida.
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
Elemento
Li
Na
K
Rb
Cs
Ba
a (Å)
3,50
4,28
5,25
5,69
6,08
5,01
21
Elemento
V
Nb
Ta
Cr
Mo
W
a (Å)
3,03
3,29
3,29
2,88
3,14
3,16
Tabela 2.3: Alguns elementos que cristalizam em redes do tipo ccc.
ser visualizadas imaginando-os como esferas rı́gidas, encostadas umas às outras por forma a minimizar o volume intersticial. Nestas condições diz-se que a rede cristalina é de empacotamento
máximo. Há dois tipos de redes de empacotamento máximo: a rede cúbica de faces centradas e a
chamada rede hexagonal compacta. Para compreendermos a razão de existirem apenas estas duas
espécies, analisemos a Figura 2.5. Nela, está representado um plano de esferas iguais, dispostas
B
C
B
B
A
A
C
C
B
A
C
A
C
B
B
A
A
A
ABA
ABC
Figura 2.5: As duas possibilidades para o empacotamento máximo.
contiguamente, formando uma rede bi-dimensional hexagonal. Para formarmos um cristal tridimensional, devemos colocar, sobre o plano representado à esquerda, outros planos semelhantes.
Para maximizar o volume ocupado, os centros das esferas do “segundo andar” deverão ficar nas
verticais dos pontos B ou, em alternativa, dos pontos C. Suponhamos que se verifica a primeira
possibilidade. Analisemos agora as possibilidades de colocação de um terceiro andar. Os centros
das esferas desta nova camada devem ocupar posições nas verticais dos espaços intersticiais do
segundo andar, ou seja, as verticais dos pontos A (dizendo-se então que se trata de um empacotamento do tipo ABABA . . .) ou, alternativamente, as verticais dos pontos B (empacotamento do
tipo ABCABC . . .). As duas possibilidades estão representadas à direita na Figura 2.5. As redes
com empacotamento do tipo ABC são, de facto, redes cúbicas de faces centradas, em que o plano
apresentado na Figura 2.5 à esquerda é um plano perpendicular a uma direcção diagonal principal;
as redes com empacotamento do tipo ABA são redes hexagonais compactas (ver a Figura 2.6).
A rede hexagonal compacta não é, no sentido estrito, uma rede cristalina, pois os pontos que a
formam não são todos equivalentes, como está patente na Figura 2.6: os pontos do plano central
não são equivalentes aos das bases. No entanto, é uma estrutura apresentada por um número
relativamente grande de substâncias quı́micas, e por essa razão a incluı́mos nesta discussão. Para
que uma “rede” hexagonal compacta seja uma estrutura de empacotamento máximo, a relação
entre os módulos dos vectores fundamentais ~a, ~b e ~c é
a = b
c = 1, 63a.
(2.4)
(2.5)
Dados relativos a alguns elementos que cristalizam na rede hexagonal compacta estão apresentados
na Tabela 2.4
(e) Outras estruturas — Exemplos com elementos
22
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
c
b
a
Figura 2.6: A rede hexagonal compacta.
Elemento
Be
Ce
He (2K)
Mg
Ti
Zn
a (Å)
2,29
3,65
3,57
3,21
2,95
2,66
c (Å)
3,58
5,96
5,83
5,21
4,69
4,95
c/a
1,56
1,63
1,63
1,62
1,59
1,86
Tabela 2.4: Elementos com rede hexagonal compacta.
Na Tabela 2.5 resumimos propriedades da rede cristalina de elementos que cristalizam em redes
trigonais, ortorrômbicas e tetragonais.
Elemento
Hg (5K)
Bi
In
Sn (branco)
Ga
Cl (113K)
Tipo de rede
Trigonal
Trigonal
Tetragonal
Tetragonal
Ortorrômbica
Ortorrômbica
a
2,99
4,75
4,59
5,82
4,51
6,24
b
—
—
—
—
4,52
8,26
c
—
—
4,94
3,17
7,64
4,48
θ
70◦ 450
57◦ 140
—
—
—
—
Tabela 2.5: Alguns elementos com redes trigonais, tetragonais e ortorrômbicas. Os módulos dos
vectores fundamentais são indicados em Å. Os valores redundantes não estão explicitados.
2.5
Direcções e planos cristalinos
~ pode ser escrito como uma combinação linear
Como já foi dito, qualquer vector da rede, R,
(b)
~
inteira dos vectores ~a, b, ~c de um conjunto fundamental primitivo, isto é,
~ = h~a + k~b + l~c,
R
h, k, l ∈ ZZ,
(2.6)
onde ZZ designa o conjunto dos números inteiros. Como é evidente, se o conjunto de vectores ~a, ~b,
~c for um conjunto fundamental não primitivo, esta equação só pode manter-se, qualquer que seja
~ se permitirmos que h, k e l possam tomar valores racionais não inteiros. Em
o vector de rede R,
(b) Daqui
em diante, usaremos esta expressão referindo-nos a uma combinação linear com coeficientes inteiros.
2.5. DIRECÇÕES E PLANOS CRISTALINOS
23
qualquer caso, os vectores de um conjunto fundamental formam uma base natural para a descrição
geométrica e analı́tica do cristal. Devemos, no entanto, ter em atenção que, por norma, esta base
não é ortonormada e que, portanto, muitas igualdades elementares da geometria analı́tica de uso
comum não são aqui aplicáveis.
Os cristalógrafos desenvolveram uma notação, baseada na utilização de bases formadas com
vectores fundamentais, que permite especificar facilmente posições, direcções e planos num cristal,
que vamos passar a descrever.
Chamam-se direcções cristalinas a direcções definidas por dois pontos da rede cristalina. Con~ que une dois pontos contı́guos numa dada direcção (ver a Figura
sideremos um vector de rede R
2.7). De acordo com a equação (2.6), existem três números inteiros (ou, quando muito, racionais)
b
a
Figura 2.7: Exemplo de direcção cristalina.
h, k, l, tais que
~ = h~a + k~b + l~c.
R
(2.7)
Eliminando factores racionais comuns, obtemos três números inteiros r, s e t, que identificam a
~ como sendo a do vector r~a + s~b + t~c. Estes três números, na
direcção (cristalina) do vector R,
notação cristalográfica que iremos adoptar, apresentam-se entre parêntesis rectos e sem quaisquer
separadores (vı́rgulas, espaços, etc.) entre eles, como em [rst]. Se algum destes inteiros for
negativo, o sinal deve ser colocado sobre, e não atrás, do ı́ndice respectivo, como em [121]. Por
exemplo, a direcção da diagonal principal numa rede cúbica (isto é, aquela que passa no centro do
corpo da célula unitária, partindo da sua origem) fica identificada por [111].
Tal como as direcções cristalinas são as definidas por dois pontos da rede, planos cristalinos
são os definidos por três pontos da rede cristalina. Devido à regularidade da rede, um dado
plano cristalino contém, para além dos três pontos de rede que o definem, um número infinito de
outros pontos de rede, que formam, nesse plano, uma rede cristalina bidimensional. Também por
causa desta regularidade, é possı́vel, dado um qualquer plano cristalino, definir uma infinidade de
outros planos cristalinos, paralelos ao primeiro. Os ı́ndices de Miller são uma forma prática de
especificar a orientação de uma destas famı́lias de planos cristalinos paralelos. Para uma dada
famı́lia definem-se da seguinte forma:
(a) tomando, na famı́lia considerada, o plano que mais se aproxima da origem da célula unitária,
determinam-se as distâncias que a separam dos pontos em que o plano escolhido intersecta
as direcções dos vectores fundamentais ~a, ~b e ~c, e exprimem-se estas distâncias em unidades
de a, b e c, respectivamente;
(b) tomam-se os inversos dos resultados obtidos no primeiro ponto e reduzem-se a três inteiros
nas mesmas proporções relativas, tendo o cuidado de eliminar eventuais(c) factores comuns.
(c) Pode demonstrar-se que, se se usar na construcção dos ı́ndices de Miller o plano que mais se aproxima da
origem, os ı́ndices obtidos não têm divisores comuns.
24
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
c
c/l
a/h
b/k
a
b
Figura 2.8: Plano cristalino com ı́ndices (hkl).
O resultado é apresentado entre parêntesis curvos, sem separadores.
Para o plano apresentado na Figura 2.8, os ı́ndices de Miller são (hkl), se os inteiros h, k e l não
tiverem divisores comuns. Também para os ı́ndices de Miller se segue a convenção de colocar os
sinais “-” sobre os ı́ndices negativos. Assim, se para uma dada famı́lia de planos resultarem os
valores 2, -3, 1 para os ı́ndices de Miller, o resultado deve ser apresentado como (231). Se um
dado plano é paralelo a um dos eixos fundamentais, então não o intersecta, obviamente; o valor
do ı́ndice de Miller correspondente é, por definição, 0 (zero).
Por exemplo, a famı́lia de planos paralela ao plano definido pelos vectores fundamentais ~a e
~b tem ı́ndices de Miller (001); os ı́ndices de Miller da famı́lia de planos paralela ao que contém
as extremidades dos vectores ~a, ~b e ~c são (111); um plano que contenha os pontos cujos vectores
posição ~a, ~b/2(d) , 2~c (ver figura 2.9) pertence a uma famı́lia com os ı́ndices de Miller (241).
c
a
b
Figura 2.9: Dois planos da famı́lia (241). O triângulo maior representa o plano que corta os eixos
cristalográficos nos pontos ~a, ~b/2, 2~c; o triângulo menor, a tracejado, representa o plano que deve
ser usado na determinação dos ı́ndices de Miller.
Analisemos este caso em detalhe. O plano em questão cruza os eixos fundamentais em pontos
que estão a distâncias a, b/2 e 2c da origem. Passa assim, em particular, num ponto de rede cujo
vector posição é 2~c. Mas existem, nesta famı́lia de planos, elementos mais próximos da origem.
Com efeito, existe um plano cristalino, paralelo ao que estamos a considerar, que passa no ponto
cujo vector posição é ~c, e é este plano que, pela sua maior proximidade à origem, deve ser usado na
construção da definição dos ı́ndices de Miller. Este plano cruza os eixos cristalográficos em pontos
que estão a distâncias a/2, b/4 e c da origem. Usando como unidades para estas distâncias os
módulos dos vectores vectores fundamentais correspondentes, obtemos os números racionais 1/2,
(d) Note-se que o ponto cujo vector posição é ~
b/2 não é um ponto de rede. No entanto, o plano em questão é de
facto um plano de rede, pois contém os pontos da rede cujos vectores posição são ~a, 2~c, ~b − 2~c.
2.6. DISTÂNCIA INTERPLANAR
25
1/4 e 1; os inversos destes números são 2, 4 e 1, e portanto esta famı́lia de planos tem os ı́ndices
de Miller (241), como se afirmou.
2.6
Distância interplanar
No próximo capı́tulo veremos que a distância entre dois planos consecutivos de uma famı́lia de
planos paralelos é um parâmetro muito importante no estudo da difracção de radiação pelos
cristais. Vamos por esta razão determiná-la de seguida. Na Figura 2.10 estão representados os
vectores fundamentais de uma rede cristalina e dois planos de uma famı́lia cujos ı́ndices são (hkl).
Pretendemos determinar a distância interplanar dhkl . Atendendo à figura da esquerda (desenhada
c
c
dhkl
P3
H
G’
θ
a
O
P2
a
P1
F
b
Figura 2.10: Distância interplanar dos planos (hkl).
segundo a direcção do vector ~b para a manter compreensı́vel), notamos que a distância requerida
~ 0 , que
é igual ao comprimento da projecção do segmento OP1 segundo a direcção do vector G
é escolhido perpendicular à famı́lia de planos (hkl). De acordo com a definição dos ı́ndices de
Miller, o segmento OP1 tem comprimento a/h, e, portanto, dhkl = a/h cos θ. Podemos dar a esta
~ 0:
igualdade uma forma mais prática usando o produto interno entre os vectores ~a e G
dhkl =
~0
~a G
·
,
~ 0|
h |G
(2.8)
~ 0 pode ser qualquer vector perpendicular ao plano (hkl). Uma forma simples de construir G
~0
onde G
consiste em formar o produto vectorial de dois vectores não colineares deste plano, por exemplo
~ e F~ representados na Figura 2.10 à direita. Estes dois vectores, escritos como
os vectores H
combinações lineares dos vectores fundamentais, são
~b ~a
−
k h
~c ~b
=
− ,
l
k
F~
=
P~2 − P~1 =
~
H
=
P~3 − P~2
(2.9)
(2.10)
onde representámos por P~k os vectores posição dos pontos Pk (k = 1, 2, 3). Fazendo o produto
externo destes dois vectores resulta
~ 0 = F~ × H
~ = 1 ~a × ~b + 1 ~b × ~c + 1 ~c × ~a,
G
hk
kl
lh
(2.11)
e, substituindo em (2.8), obtemos
dhkl =
~a · (~b × ~c)
.
~ 0|
hkl|G
(2.12)
(Note que produtos como ~a · (~a × ~b) anulam-se porque o o resultado do produto vectorial ~a × ~b é
perpendicular ao outro factor (~a) no produto escalar.) Finalmente, notamos que o produto misto
no numerador da fracção em (2.12) é igual ao volume da célula unitária definida pelos vectores
26
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
~ hkl ,
fundamentais ~a, ~b e ~c [ver a Eq. (2.3)], que representaremos por τ . Introduzindo o vector G
dado por
~ hkl = hkl 2π G
~ 0 = l 2π ~a × ~b + h 2π ~b × ~c + k 2π ~c × ~a,
G
(2.13)
τ
τ
τ
τ
obtém-se para a distância interplanar, por fim,
2π
¯.
dhkl = ¯¯
¯
~
¯Ghkl ¯
(2.14)
Esta expressão será usada no próximo capı́tulo, no estudo da difracção de radiação por cristais,
~ hkl (eq. 2.13), chamados
onde também será discutida a importância dos vectores com a forma de G
vectores da rede recı́proca.
Uma vez determinada distância entre famı́lia de planos vamos agora analisar a densidade de
pontos contidos em cada plano, i.e. o número de pontos por unidade de área da famı́lia de planos
(hkl).
Considere uma célula unitária formada por três vectores da rede. Dois destes vectores, ~u e ~v
estão contidos num plano da famı́lia (hkl) (ver a Figura 2.11); o terceiro vector, w,
~ está ligado
a um plano adjacente da mesma famı́lia. Note-se que a célula unitária assim construida contém
apenas um ponto de rede e portanto é, de facto, primitiva. O volume da célula formada por
este três vectores é, como já foi demonstrado, igual a τ . Este volume também é igual ao volume
formado pelos vectores ~u e ~v e um terceiro (que em geral não é vector da rede) de módulo igual
à distância interplanar, dhkl , perpendicular aos planos (hkl), e que une os dois planos adjacentes.
Deste modo, temos que
τ = A dhkl ,
e sendo o número de pontos da rede por unidade de área dado por
1
,
A
em que A é a área formada pelos vectores ~a e ~b, obtemos que a densidade de pontos num plano
(hkl) vem dada por
dhkl
1
=
.
A
τ
(hkl)
w
d hkl
v
A
(hkl)
u
Figura 2.11: Construcção para o cálculo da densidade de pontos de rede nos planos de uma famı́lia
(hkl).
2.7. COORDENADAS FRACCIONÁRIAS
2.7
27
Coordenadas fraccionárias
Estudámos até agora vários conceitos úteis no estudo das redes cristalinas, mas pouco foi dito
sobre os motivos, ou bases, que associados a estas redes, formam os cristais reais.
Tal como as redes cristalinas, os motivos podem ser classificados em categorias gerais, segundo
as transformações geométricas que aceitam como transformações de simetria. No entanto, este
assunto é não será abordado neste curso, por não ser absolutamente indispensável para o estudo
que se segue. O que sim é necessário é introduzir uma notação que permita a especificação das
posições dos átomos que formam o motivo. Esta questão surge porque porque os átomos que
formam o motivo ocupam, em geral, posições não coincidentes com as dos pontos que formam
a rede cristalina; o seu vector posição não é pois, necessariamente, um vector da rede, ou seja,
uma combinação linear inteira dos vectores fundamentais. Independentemente deste facto, usamos
a base dos vectores fundamentais da rede cristalina para representar os vectores posição destes
átomos, que, assim, podem apresentar coordenadas não inteiras, ou fraccionárias. Note-se que
o mesmo acontece para alguns pontos da rede cristalina, sempre que os vectores fundamentais
escolhidos para a representar forem não primitivos.
Por exemplo, usando vectores os fundamentais convencionais para a rede cúbica de corpo
centrado, as coordenadas do ponto central são ( 21 , 12 , 12 ). A rede cristalina do diamante é cúbica
de faces centradas. Os pontos de rede de uma célula unitária convencional têm pois coordenadas
(0, 0, 0), ( 12 , 12 , 0), ( 12 , 0, 21 ), (0, 12 , 12 ).
Quando se usam para especificar a posição de pontos de rede numa célula unitária (não primitiva), as coordenadas fraccionárias têm origem num vértice da célula unitária; mas, quando se
usam para indicar as posições dos átomos que formam o motivo, têm origem em cada ponto ponto
da rede cristalina. Assim, por exemplo para o diamante, o motivo é formado por dois átomos,
com coordenadas (0, 0, 0) e ( 41 , 14 , 14 ); para se obter um cristal de diamante, devemos sobrepor, em
cada um dos quatro pontos de rede que referimos no parágrafo anterior, dois átomos de carbono,
com estas coordenadas, relativamente a uma origem escolhida sobre cada um daqueles pontos.
2.8
Defeitos
A descrição dos sólidos que foi apresentada neste capı́tulo é apenas uma idealização. Os cristais
reais apresentam as regularidades mencionadas apenas de forma aproximada, apresentando sempre
um número apreciável de imperfeições ou defeitos, isto é, de desvios à regularidade cristalina.
Há vários tipos de defeitos cristalinos. Por exemplo, um átomo de espécie quı́mica diferente da
dos que formam o cristal (como é o caso, muito útil, dos semicondutores “dopados”, do tipo “p”
ou “n”),uma posição de rede desocupada, ou um átomo numa posição não definida pela rede. As
próprias fronteiras do cristal são defeitos cristalinos, na medida em que quebram a periodicidade
do cristal.
Vamos agora estudar um pouco mais detalhadamente os principais tipos de defeitos cristalinos.
(1) Vibrações dos átomos do cristal
Os átomos que formam os cristais encontram-se permanentemente animados de um movimento de
oscilação em torno de posições de equilı́brio, que correspondem às posições definidas pela estrutura
cristalina. A este movimento dá-se o nome de agitação térmica. A amplitude destas oscilações
diminui quando se baixa a temperatura, mas não se anula nunca, mantendo-se mesmo no zero
absoluto da temperatura, como consequência do princı́pio de incerteza de Heisenberg.
(2) Imperfeições pontuais
Imperfeições pontuais são irregularidades que se verificam em pontos isolados, e há três espécies
principais. As lacunas, as imperfeições intersticiais e as impurezas. Uma lacuna é uma posição
da estrutura cristalina que se encontra desocupada. Uma imperfeição intersticial corresponde a
um átomo que ocupa uma posição não prevista na estrutura cristalina. Um átomo de um cristal
pode, sob certas circunstâncias(e) , abandonar a sua posição na estrutura cristalina (fazendo assim
(e) Por
exemplo, mediante um aquecimento excessivo.
28
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
F
Deslocaçao
Figura 2.12: Deslocações cristalinas.
surgir uma lacuna) e fixar-se numa posição intersticial. A estes pares lacuna-interstı́cio dá-se o
nome de pares de Frenkel.
Nos cristais iónicos, as lacunas devem sempre aparecer aos pares, por forma a manter a neutralidade eléctrica do cristal. Estes pares de lacunas têm o nome de pares de Shottky. (f)
As impurezas são átomos de espécie quı́mica diferente da dos que formam o cristal. Os átomos
contaminantes podem ocupar posições da estrutura cristalina, substituindo assim os átomos originais, tomando o nome de impurezas substitucionais, ou ocupar posições que não estão definidas
na estrutura, sendo então conhecidas como impurezas intersticiais. Por exemplo, o aço é uma
solução de carbono em ferro, constituindo os átomos de carbono impurezas intersticiais na estrutura cristalina definida pelos átomos de ferro. Em contrapartida, o latão é uma liga de cobre e
de zinco, onde os átomos de zinco substituem os de cobre nalgumas posições, constituindo assim
impurezas substitucionais de um cristal de cobre.
O funcionamento dos dispositivos semicondutores comuns, como os transı́stores ou os diodos,
baseia-se na presença de impurezas substitucionais. Estes dispositivos consistem num cristal,
normalmente de silı́cio ou de germânio, dividido em duas (no caso dos diodos) ou três (no caso dos
transı́stores) regiões com impurezas substitucionais de tipo “n” (que consistem em átomos com
um electrão de valência a mais do que os os átomos vizinhos) ou de tipo “p” (cujos átomos têm
um electrão de valência a menos).
(3) Imperfeições lineares
Nas imperfeições lineares, os átomos que quebram a simetria cristalina dispõem-se ao longo de uma
linha. Os exemplos mais importantes são as chamadas deslocações. Estas imperfeições podem ser
o resultado de deformações do cristal, e verificam-se quando um plano cristalino se desloca sobre
outro. Na Figura 2.12 está representada uma deslocação e o modo como as deformações do cristal
podem fazer surgir deslocações. Há ainda outros tipos de deslocações mas não os estudaremos
aqui.
(4) Imperfeições superficiais
As imperfeições superficiais são superficı́cies de separação entre regiões distintas dos cristais. Por
exemplo, nos cristais de ferro é energeticamente favorável o alinhamento dos momentos magnéticos
dos átomos. No entanto, a agitação térmica contraria esta tendência de alinhamento. Assim, à
temperatura ambiente, os cristais de ferro encontram-se usualmente divididos em regiões, chamadas domı́nios ferromagnéticos, onde os momentos magnéticos dos átomos têm a mesma orientação,
sendo diferente de domı́nio para domı́nio. As superfı́cies(g) que separam estes domı́nios constituem
imperfeições superficiais.
As próprias fronteiras dos cristais constituem, como já foi dito, defeitos, que podem ser classificados também como imperfeições superficiais.
(f) Para cristais do tipo NaCl, evidentemente; nos casos de cristais do tipo AB , como o cloreto de cálcio (CaCL ),
2
2
a neutralidade eléctrica só pode ser assegurada através de “ternos” de lacunas — uma de A por cada duas de B.
(g) Podem ser consideradas superfı́cies à escala macroscópica apenas, já que podem ter várias dezenas de milhar
de átomos de espessura...
2. Problemas
29
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• J. R. Christman, “Fundamentals of Solid State Physics” (1988), capı́tulos 2 e 3 (F5.0 257
e 258)
• C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 1 (F5.0 82)
• N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulos 4, 5, e 7 (F5.0 339)
• C. Wert e R. Thomson, “Fı́sica de los solidos”, (????), capı́tulo 2
• Blakemore, “Solid State Physics” (????) capı́tulo 1
PROBLEMAS
2.1 Considere um cristal bidimensional semelhante a um tabuleiro de xadrez.
(a) Determine dois conjuntos de vectores fundamentais não primitivos.
(b) Determine dois conjuntos de vectores fundamentais primitivos.
(c) Represente graficamente as células unitárias e os motivos associados aos conjuntos de vectores fundamentais determinados em (a) e em (b).
2.2 Considere a estrutura atómica plana ilustrada na figura, composta por átomos do tipo A, B e C:
(a) Determine um conjunto de vectores fundamentais primitivos.
(b) Indique quantos átomos de cada tipo existem na célula unitária primitiva.
(c) Desenhe a célula unitária de Wigner-Seitz.
’
Atomo
tipo A
’
Atomo
tipo B
2.3 O Cloreto de Césio (CsCl) tem uma estrutura cúbica
de parâmetro a = 4, 11 Å, com os átomos dispostos
de acordo com a figura. Determine:
(a) o tipo de estrutura cúbica de CsCl;
(b) um conjunto de vectores fundamentais primitivos, e indique qual o volume da célula
unitária primitiva;
(c) a densidade do CsCl.
’
Atomo
tipo C
30
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
2.4 A estrutura do composto SrTiO3 é a seguinte: os átomos de estrôncio dispõem-se nos vértices de
cubos idênticos dispostos regular e contiguamente; os de titânio, nos centros destes cubos; os de
oxigénio, finalmente, nos centros das suas faces.
(a) Qual o tipo de rede cristalina apresentada por este composto?
(b) Indique um conjunto de vectores fundamentais primitivos.
(c) Verifique que há um átomo de estrôncio, um de titânio e três de oxigénio numa célula unitária
definida pelos três vectores escolhidos em (b).
(d) Usando coordenadas fraccionárias, descreva o motivo que, associado à rede cristalina determinada em (a), gera o cristal de SrTiO3 .
2.5 As posições dos pontos de duas redes cristalinas são dadas por:
(a) ~rn1 ,n2 ,n3 =
10n1 +9n2 +19n3
aêx
10
(b) ~rn1 ,n2 ,n3 =
2n1 +n2
aêx
2
+
3
+ 6 n2 +n
aêy + 2n3 aêz ;
5
√
3n2
aêy
2
+ 2n3 aêz .
onde a é um número real fixo e n1 , n2 e n3 são inteiros arbitrários. Escolha, para os dois casos,
um conjunto primitivo de vectores fundamentais e identifique o tipo de rede.
2.6 Para cada um dos seguintes conjuntos de vectores fundamentais primitivos, identifique o tipo de
rede indicando as dimensões da célula convencional em termos dos parametros a, b e c:
(a)
1
aêx
2
+ 12 aêy , aêy ,
√1 aêz ;
2
(b)
1
aêx
2
+ 12 aêy , aêy , aêz ;
(c) aêx + 2bêy , bêy , cêz ;
(d)
1
aêx
2
+ 12 bêy , bêy , cêz .
2.7 Calcule o valor dos seguintes parâmetros para cada uma das três redes cúbicas (simples, de corpo
centrado e de faces centradas):
(a) volume da célula convencional;
(b) volume da célula primitiva;
(c) número de pontos de rede na célula convencional;
(d) número de pontos na célula primitiva;
(e) distância entre vizinhos mais próximos;
(f) fracção de empacotamento(h) .
2.8 Prove que numa rede cúbica simples a direcção [hkl] é perpendicular aos planos da famı́lia (hkl).
Verifique com exemplos que o mesmo não se passa, necessariamente, para outros tipos de rede.
2.9 À temperatura de 1190 K, o ferro apresenta uma rede cristalina de faces centradas com aresta
a = 3, 647 Å, ao passo que, a 1670 K, a rede cristalina é de corpo centrado, com aresta a =
2, 932Å. Determine a sua densidade, para cada uma das temperaturas referidas.
2.10 O sulfeto de zinco Zn S cristaliza em duas estruturas distintas: a estrutura zinc blende (impregnação de zinco) e estrutura wurtzite (wurtzita), ilustradas na figura seguinte.
(h) A fracção de empacotamento é a fracção de volume da rede ocupado, supondo os pontos da rede como esferas
rı́gidas suficientemente grandes para se tocarem
2. Problemas
31
1/2
0
zinc blende
3/4
1/4
1/4
3/4
1/2
1/2
1/2
(a)
(b)
wurtzite
0
5/8
1/2
1/8
Nas Figuras (a) estão representadas células convencionais, As Figuras (b) representam projecções das
respectivas células onde estão indicadas as posições verticais dos átomos em relação à altura da célula em
questão.
A estrutura zinc blende é constituida por a uma rede cúbica de face centrada associada a cada tipo
de átomo e separadas ao longo da diagonal do cubo da célula convencional cúbica em ( 14 , 14 , 41 ).
A estrutura wurtzite tem associada a cada tipo de átomo uma estrutura hexagonal compacta
separadas em 58 da altura da célula hexagonal. Sabendo que os parâmetros das células são de
a = 5, 41 Å para célula cúbica, e a = 3, 81 Å e c = 6, 23 Å para a célula hexagonal calcule a
densidade de ambas as formas do sulfeto de zinco.
2.11 O Arsenito de Gálio cristaliza na forma de estrutura zinc blend. A ligação Ga − As tem 2, 45 Å
de comprimento.
(a) Determine a aresta da célula convencional cúbica.
(b) Qual a separação Ga − Ga mais curta.
(c) Qual a densidade do Ga As.
2.12 Considere um cristal com estrutura tipo wurtzite. Determine três vectores fundamentais primitivos
assim como a respectiva base indicando a sua posição relativa.
2.13 Determine o quociente c/a para uma estrutura wurtzite.
2.14 Considere um conjunto seguinte de vectores fundamentais primitivos de uma rede tetragonal de
corpo centrado:
~a =
1
1
1
1
1
1
a(êx + êy ) − cêz , ~b = a(−êx + êy ) + cêz , ~c = a(êx − êy ) + cêz
2
2
2
2
2
2
onde a representa o lado da base quadrada da célula convencional e c a altura da mesma. Considere
que inicialmente temos c > a, e seguidamente imagine que a célula é comprimida na direcção do
eixo z.
(a) Para que valor de c a rede toma a forma de cúbica de corpo centrado?
(b) Para que valor de c a rede toma a forma de cúbica de face centrada?
32
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
Dê os seus resultados em termos do parametro a.
2.15 Se uma célula unitária de uma dada rede cristalina contém N pontos de rede, então o seu volume
é V = N Vp onde Vp é o volume das células unitárias primitivas da mesma rede. Demonstre esta
preposição.
2.16 Determine a separação entre os pontos de uma rede cristalina ao longo das direcções seguintes:
(a) [110]; (b) [111]; (c) [320]; (d) [321].
2.17 Determine os ı́ndices de Miller de um plano que, numa rede cúbica simples, contém a aresta de
uma célula unitária primitiva e intersecta duas outras arestas da mesma célula nos seus centros.
2.18 Compare a distância interplanar para os planos (210) numa rede cúbica simples, cúbica de corpo
centrado e cúbica de faces centradas.
2.19 Demonstre que a fracção de empacotamento máximo para um cristal de estrutura tetragonal de
corpo centrado (com uma base composta por um único átmo) é dada por:
√
(a) π3 ac se c > 2a;
√
2 3
π a
(b) 24
(2 + ac 2 ) 2 se c < 2a.
c
2.20 Determine a densidade de pontos nos planos (111) de uma rede cúbica de face centrada. Compare
com a densidade de pontos nos planos (110).
Capı́tulo 3
Dispersão elástica de radiação em
cristais
Uma das ferramentas mais usadas na determinação da estrutura dos sólidos é a análise da difracção
de radiação neles incidente. De facto, quase se pode marcar o nascimento da fı́sica do estado sólido
com ramo autónomo da fı́sica em 1912, ano em que foi publicado o primeiro artigo(a) sobre difracção
de raios-X em cristais.
Neste capı́tulo, vamos estudar os processos de difracção de radiação por cristais e a sua utilização na determinação das estruturas cristalinas. Vamo-nos restringir à difracção elástica, em
que a radiação difractada tem o mesmo comprimento de onda que a incidente. Antes, porém,
faremos uma revisão dos conceitos envolvidos no estudo de processos ondulatórios.
3.1
Breve revisão sobre ondas
Entre dois sistemas afastados pode haver fluxos de energia através da troca de partı́culas, que
desempenham o papel de veı́culos para o transporte energético. Por exemplo, o Sol é fonte de
partı́culas (electrões, positrões, etc.), que varrem o Sistema Solar e que, ao colidirem com os
diferentes planetas, neles depositam a sua energia. Mas também são possı́veis trocas de energia
não acompanhadas por correspondentes trocas de matéria. Por exemplo, a luz proveniente do Sol
é a principal responsável pelo aquecimento diurno da superfı́cie terrestre, e consiste em radiação
electromagnética (isto é, numa perturbação no valor dos campos eléctrico e magnético que se
propaga no espaço), não num fluxo de partı́culas(b) . Um outro exemplo é o da energia sonora: a
onda de choque de uma explosão que ocorre num dado lugar transporta energia que produz efeitos
em pontos afastados, sem que se dê um deslocamento das moléculas de ar desde o ponto em que
se dá a explosão até àquele em que ela é detectada.
Chamamos onda a um veı́culo não corpuscular para o transporte de energia. Descrevemos
as ondas através do valor de funções do espaço e do tempo (usualmente chamadas campos, na
linguagem da fı́sica) como a pressão ou densidade atmosférica (para as ondas sonoras), os campos
eléctrico e magnético (para as ondas electromagnéticas), o deslocamento transversal (para as ondas
que se estabelecem nas cordas das guitarras), o nı́vel em cada ponto da superfı́cie para as ondas
do mar, etc.
Cada tipo de onda está sujeita a uma dinâmica especı́fica: a propagação das ondas electromagnéticas é regida pelas equações de Maxwell, as ondas de som no ar pela dinâmica de fluidos,
as ondas das cordas pelas leis da elasticidade. Apesar desta diversidade, há aspectos comuns.
Consideremos uma onda unidimensional(c) , descrita através de uma função ψ(x, t), que se desloca
(a) Por
W. Friedrich, P. Knipping e M. Laue
dualidade onda-corpúsculo da Mecânica Quântica veio complicar esta descrição.
(c) Isto é, a função que usamos para a descrever depende apenas de uma única coordenada espacial, x, e do tempo,
(b) A
t.
33
34
CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS
sem alterar a sua forma, com velocidade v no sentido dos valores de x crescentes (ou seja, para
a direita num gráfico vulgar). No instante t = 0, a função de onda é ψ(x, t = 0); num instante
posterior t, os valores que a função ψ(x, 0) tomava em cada ponto passa a função ψ(x, t) a tomá-los
em pontos deslocados para a direita uma distância vt, logo
ψ(x + vt, t) = ψ(x, 0),
ou seja, fazendo a substituição x → x − vt,
ψ(x, t) = ψ(x − vt, 0).
Vemos assim que as funções que descrevem ondas que se deslocam sem sofrerem alteração da forma
dependem de x e de t apenas através da combinação x − vt.
Funções que que se deslocam desta maneira, isto é, sem que se verifique qualquer alteração da
sua forma, satisfazem a equação diferencial às derivadas parciais (verifique!)
∂2ψ
1 ∂2ψ
−
= 0.
∂x2
v 2 ∂t2
Generalizando para três dimensões, podemos escrever esta equação diferencial como
lap ψ(x) −
1 ∂2ψ
= 0,
v 2 ∂t2
onde lap representa o operador laplaciano. Em coordenadas cartesianas, o laplaciano de uma
função ψ é
∂2ψ ∂2ψ ∂2ψ
lap ψ =
+
+
.
∂x2
∂x2
∂y 2
Estudemos um exemplo particular, o das ondas electromagnéticas no vazio. Em pontos afastados de corpos materiais e de fontes de campo(d) , as equações de Maxwell reduzem-se a
~ =0
div E
~ =0
div B
~
~ = − ∂B
rot E
∂t
~
~ = µ0 ²0 ∂ E
rot B
∂t
Se calcularmos o rotacional da segunda equação da primeira linha, obtemos
~ =−
rot rot E
∂
~
rot B
∂t
Mas pode provar-se que
~ = grad div A
~ − lap A,
~
rot rot A
~ Aplicando esta igualdade ao caso, que mais no interessa,
qualquer que seja a função derivável A.
~
de rot rot E, notamos que o primeiro termo se anula, como é patente na primeira equação de
Maxell; por outro lado, o termo do lado direito desta equação pode ser calculado a partir da
última equação de Maxell, obtendo-se
2~
~ = µ0 ²0 ∂ E .
lap E
∂t2
Esta expressão tem a forma geral da equação de onda, e as suas soluções descrevem uma onda que
√
se propaga no espaço vazio com velocidade c = 1/ ²0 µ0 .
Quando um sinal ondulatório (seja ele radiação electromagnética, ondas de som, vibrações de
uma corda ou de outra natureza) incide num sistema deposita nele energia. A energia depositada
por unidade de tempo chama-se intensidade da onda e, pode provar-se em cada caso, é proporcional
ao quadrado da amplitude da onda.
(d) Ou seja, considerando nulas a magnetização, a polarização eléctrica, a densidade de carga e a densidade de
corrente.
3.1. BREVE REVISÃO SOBRE ONDAS
35
Ondas planas monocromáticas
Um tipo particular de soluções da equação de onda merece uma análise mais detalhada. São as
ondas planas monocromáticas, funções do tipo
~
ψ~k (~r, t) = Aei(k·~r−ωt) ,
(3.1)
√
onde i é a unidade imaginária, definida como i = −1. A constante A nesta expressão tem o nome
de amplitude da onda; ao factor (~k ·~r −ωt) dá-se o nome de fase. O interesse destas funções deve-se
ao facto de ser possı́vel, usando uma técnica matemática chamada Análise de Fourier, escrever
uma função arbitrária como combinação linear de ondas planas monocromáticas. Neste contexto,
isto significa que qualquer solução da equação de onda se pode escrever como combinação linear
destas funções.
Recordemos que a exponencial de um número imaginário é um numero complexo, cujas partes
real e imaginária são dadas pela fórmula de Euler,
eix = cos x + i sin x.
Assim sendo, verificamos que as ondas planas monocromáticas são funções complexas, cuja parte
real corresponde à variável fı́sica em estudo, e que têm uma forma sinusoidal, que se desloca no
espaço com velocidade constante. Chama-se comprimento de onda à distância que separa dois
pontos com igual fase (dois máximos da função, por exemplo) sucessivos ao longo da direcção
de propagação e perı́odo ao intervalo de tempo entre a chegada de dois pontos com igual fase
sucessivos a um determinado ponto. O inverso do perı́odo chama-se frequência e é o número de
ciclos da onda que atinge um determinado ponto por unidade de tempo. A frequência angular, ω,
é a frequência multiplicada por 2π. Finalmente, ao inverso do comprimento de onda multiplicado
por 2π dá-se o nome de número de onda. O parâmentro vectorial ~k que aparece na expressão de
definição das ondas planas monocromáticas é um vector cujo módulo é igual ao número de onda
e que tem a direcção e o sentido da propagação da onda. Então, se representarmos por k̂ o vector
unitário com a direcção e sentido da propagação da onda e por λ o comprimento de onda, temos
~k = 2π k̂.
λ
Este vector chama-se vector de onda.
Substituindo a função de onda plana monocromática na equação de onda da Eq. (3.1), obtemos
a seguinte relação entre o módulo do vector de onda e a frequência angular, chamada relação de
dispersão:
ω = vk~kk.
Ondas esféricas
Numa onda plana monocromática, todos os pontos de um qualquer plano perpendicular à direcção
de propagação têm a mesma fase. Logo, o valor da função de onda é o mesmo em todos os pontos
de um dado plano perpendicular a ~k. Um sinal proveniente de uma fonte muito afastada tem,
aproximadamente, esta forma(e) . No entanto, nos pontos muito próximos da fonte de um sinal
ondulatório, a fase do sinal depende fundamentalmente da distância à fonte. Isto é, todos os
pontos a uma mesma distância da fonte apresentam a mesma fase. A frente de onda tem então a
forma de uma esfera, em vez de um plano. Ondas com esta forma chamam-se ondas esféricas e a
sua expressão geral é
ei(kk~r−~r0 k−ωt)
,
(3.2)
ψ(~r, t) = A
k~r − ~r0 k
onde ~r0 é o vector posição da fonte emissora. Note-se que, na expressão da fase, aparece agora
o produto dos módulos dos vectores ~k e ~r − ~r0 , que não depende das suas orientações. Assim, a
(e) “Muito afastada” significa aqui situada a uma distância muito superior às dimensões da porção de frente de
onda analisada.
36
CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS
k
Figura 3.1: Onda plana (à esquerda) e onda esférica (à direita).
fase só depende do módulo do vector posição relativo ~r − ~r0 , e não da sua orientação, que é o que
esperamos de uma onda esférica. O denominador k~r − ~r0 k na Eq. (3.2) dá conta da diminuição
da intensidade do sinal com o quadrado da distância à fonte(f) .
A Figura 3.1 apresenta uma representação gráfica de uma onda plana (à esquerda) e de uma
onda esférica (à direita).
3.2
Dipersão de radiação — Generalidades
Quando se faz incidir radiação electromagnética num objecto, cada ponto do objecto exposto
à radiação é, de algum modo, excitado, tornando-se, por seu turno, fonte de radiação. Esta
frase aplica-se a um grande número de processos diferentes, como a reflexão e refracção da óptica
geométrica, a fluorescência, a fosforescência, etc. Por exemplo, na reflexão num espelho, a radiação
incidente (isto é, os campos eléctrico e magnético que a constituem) exercem forças sobre os
electrões livres da camada reflectora de alúminio, animando-os de um movimento de vibração com
frequência igual à da radiação incidente; por seu turno, os electrões, por estarem em vibração, criam
campos eléctricos e magnéticos igualmente oscilantes, ou seja, emitem radiação electromagnética.
Esta emissão dá-se em todas as direcções mas, se se tratar de um espelho bem polido, só na
direcção prevista pelas leis da óptica geométrica é que se verifica interferência construtiva das
emissões dos vários electrões, logo, só nessa direccção é que se observa uma intensidade apreciável
da radiação proveniente do espelho.
Neste curso, consideramos apenas processos em que o comprimento de onda da radiação incidente é igual ao do da radiação secundária emitida pelo objecto exposto. Este tipo de dispersão
de radiação por um objecto chama-se dispersão elástica (g) ou difracção elástica.
A análise da difracção elástica de radiação por cristais é um método poderoso no estudo da sua
estrutura. A informação que se obtém das experiências de difracção resulta fundamentalmente de
processos de interferência das várias porções do cristal; assim, usa-se nestas experiências radiação
com comprimento de onda próximo das distâncias interatómicas tı́picas nos cristais, ou seja, alguns
Angstrongs.
As experiências de difracção são realizadas com as seguintes três espécies de feixes:
Raios-X Por ser muito simples a produção, detecção e manipulação (focagem, deflexão, etc.) de feixes
de radiação electromagnética, este tipo de radiação é o mais frequentemente escolhido para
experiências de difracção. A radiação interage principalmente com as nuvens electrónicas
dos sólidos, e portanto a sua utilização permite a determinação da distribuição electrónica
e, a partir daı́, da estrutura cristalográfica e de outras propriedades relevantes dos sólidos.
(f) Recordemos
que a intensidade de uma onda é proporcional ao quadrado da sua amplitude.
razão de ser desta designação é fácil de compreender. Consideremos o processo de dispersão como uma
colisão entre fotões e um objecto imóvel. Na linguagem tradicionalmente usada nos problemas de colisões, dizemos
que os fotões que constituem a radiação incidente são os fotões antes da colisão, os fotões da rdiação dispersada
são os fotões após a colisão. A energia cinética dos foões é proporcional à frequência da radiação (de acordo com
a lei de Plank) que, por seu turno, é proporcional ao seu comprimento de onda. Assim, se o comprimento de onda
da radiação incidente é igual ao da radiação dispersada, a energia cinética dos fotões antes e depois da colisão é
a mesma. Como o objecto exposto está imóvel, verifica-se conservação da energia cinética, logo, trata-se de uma
colisão elástica.
(g) A
3.3. A CONDIÇÃO DE LAUE
37
Nas experiências de difracção com cristais, usa-se radiação electromagnética na região do
espectro dos raios-X, por ser a que apresenta os comprimentos de onda na gama apropriada.
Electrões Podem também usar-se feixes corpusculares, já que, de acordo com a Mecânica Quântica,
estes evidenciam também comportamentos ondulatórios. Os electrões, por serem partı́culas
carregadas e extremamente leves, sofrem muito fortemente a interacção com a matéria; assim,
os feixes de electrões não têm um grande poder de penetração nos sólidos e, por esta razão,
são usados apenas no estudo das suas superfı́cies. Os electrões devem estar animados com
uma energia cinética de cerca de 150 eV(h) para que o comprimento de onda da sua função
de onda quântica seja comparável com as distâncias interatómicas vulgares nos cristais.
Neutrões Estas partı́culas, ao contrário dos electrões, têm um grande poder de penetração nos sólidos,
por serem mais pesadas e também por serem electricamente neutras. Apesar da sua neutralidade eléctrica, os neutrões apresentam momento magnético não nulo e por isso sofrem
interacções electromagnéticas, principalmente com os electrões responsáveis pelas propriedades magnéticas do meio em que se encontram. Estas interacções não são “mascaradas” pelas
forças coulombianas, que seriam dominantes se se usassem feixes de partı́culas carregadas,
como protões. Por esta razão, os feixes de neutrões são particularmente indicados no estudo
da distribuição do momento magnético no interior dos sólidos. A energia do feixe com que
as experiências devem ser conduzidas é de cerca de 0,1 eV.
As funções usadas para descrever as ondas nos processos de composição e de interferência são, no
caso dos raios-X, o campo electromagnético, ao passo que, no dos feixes corpusculares, é a função
de onda das partı́culas que os constituem. No entanto, a intensidade medida pelos detectores é
proporcional ao quadrado do módulo do campo electromagnético (no caso dos raios-X), ou da
função de onda (no caso dos feixes de electrões ou de neutrões).
3.3
A condição de Laue
Um cristal, conforme já foi muitas vezes dito, consiste num conjunto de objectos microscópicos
idênticos (são as ocorrências do motivo do cristal) colocados, regularmente, nos pontos de uma
rede de Bravais, que, quando neles incide radiação, a reemitem em todas as direcções. São então
observadas fortes intensidades de difracção nas direcções em que a radiação reemitida por todos
estes objectos interfere construtivamente. Consideremos dois destes centros dispersores, separados
k^
δ1
^
k’
R
δ2
Figura 3.2: Dispersão elástica de radiação por duas células unitárias de um cristal.
~ Neles incide radiação com comprimento de onda λ, segundo a direcção
por um vector de rede R.
definida pelo versor k̂ (ver a Figura 3.2). Para que numa direcção definida pelo versor k̂ 0 se verifique
interferência construtiva, é necessário que a diferença entre os comprimentos dos caminhos ópticos
seguidos pelos raios que incidem em cada um dos dois centros dispersores considerados seja igual
a um múltiplo inteiro do comprimento de onda da radiação. A distância que corresponde a esta
(h) 1 eV é a energia cinética adquirida por um electrão acelerado por uma diferença de potencial de 1V, ou seja
1eV' 1.6 × 10−19 J.
38
CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS
diferença está realçada na Figura 3.2, sendo dada por δ1 + δ2 . Mas
δ1
=
δ2
=
~ · k̂
R
~ · k̂ 0 ,
−R
(3.3)
(3.4)
de forma que a condição para a interferência construtiva é
~ · (k̂ − k̂ 0 ) = nλ,
R
(3.5)
onde n é um número inteiro qualquer. Multiplicando a Eq. (3.5) por 2π/λ e notando que ~k = 2π k̂/λ
é o vector de onda da radiação incidente(i) , resulta
~ · (~k − k~0 ) = 2nπ.
R
(3.6)
Esta é a condição para que a radiação reemitida pelas duas células unitárias representadas na
Figura 3.2 interfira construtivamente na direcção do vector k~0 . Claro que, se considerarmos agora
todo o cristal e não somente duas células unitárias, obtemos uma condição semelhante a (3.6),
~
mas que tem que se verificar para todos os vectores da rede cristalina R:
~ · (~k − k~0 ) = 2nπ,
R
~ ∈ rede cristalina.
n ∈ N, ∀R
(3.7)
~ = (~k − k~0 ) que satisfazem
Esta é a condição de Laue para a difracção. O conjunto dos vectores G
a Eq. 3.7 é muito reduzido. Vamos provar que estes vectores formam também uma rede, que não
~ Começamos por definir os vectores(j)
é a rede formada pelos vectores R.
~
A
~
B
~
C
~b × ~c
~a · (~b × ~c)
~c × ~a
= 2π
~a · (~b × ~c)
= 2π
= 2π
~a × ~b
~a · (~b × ~c)
(3.8a)
(3.8b)
(3.8c)
onde ~a, ~b e ~c são os vectores fundamentais do cristal em estudo (ou seja, da rede definida pelos
~ É possı́vel provar que, se ~a, ~b, ~c não forem co-planares, então A,
~ B,
~ C
~ também não o
vectores R).
são (o leitor é aconselhado a tentar fazer esta demonstração). Assim, eles podem ser vistos como
os vectores fundamentais de uma nova rede tridimensional de pontos, chamada rede recı́proca, que
desempenha um papel importante em diferentes tópicos da Fı́sica do Estado Sólido (veremos já a
seguir a sua importância no estudo da difracção de radiação). Para melhor distinguir os conceitos,
chamamos por vezes rede directa à rede cristalina propriamente dita, gerada pelos vectores ~a, ~b e
~c.
Os vectores fundamentais da rede recı́proca formam produtos escalares muito simples com os
~ · ~a:
vectores fundamentais da rede directa. Por exemplo, tomemos o produto A
~ · ~a =
A
=
2π ~
b × ~c · ~a
τ
2π,
uma vez que o produto misto ~b × ~c · ~a é igual ao volume, τ , da célula unitária da rede directa. De
igual maneira se verifica que
~ · ~b = C
~ · ~c = 2π.
B
~ · ~b:
Consideremos agora o produto escalar A
~ · ~b = 2π ~b × ~c · ~b.
A
τ
da mesma maneira o vector de onda da radiação difractada ~k0 = 2πn̂0 /λ.
~ hkl = hA
~ + kB
~ + lC.
~
que, usando estas definições, a Eq. (2.13) na Secção 2.6 pode reescrever-se como G
(i) Define-se
(j) Note-se
3.4. A LEI DE BRAGG
39
Este resultado é nulo, porque o produto vectorial ~b × ~c é perpendicular a ~b, logo, o seu produto
escalar com este vector anula-se. Vemos assim que
~ · ~b = A
~ · ~c = B
~ · ~a = B
~ · ~c = C
~ · ~a = C
~ · ~b = 0.
A
~ B
~ e C
~ não são colineares, podem servir como base do espaço.
Uma vez que os vectores A,
Assim, podemos concerteza escrever
~ = xA
~ + yB
~ + z C,
~
G
(3.9)
onde x, y, z são três números adimensionais, não necessariamente inteiros, que são as componentes
~ nesta base. Por outro lado, como R
~ é um vector da rede cristalina, pode escrever-se como
de G
uma combinação linear inteira dos vectores ~a, ~b, ~c,
~ = h~a + k~b + l~c,
R
(3.10)
com h, k, l inteiros. Vejamos quais os valores que x, y, z podem tomar para que se verifique
~ ·G
~ = 2nπ, de acordo com (3.7). De acordo com as expressões que já apresentámos para os
R
produtos escalares dos vectores fundamentais da rede recı́proca e da rede directa, temos
³
´ ³
´
~ ·G
~ =
~ + yB
~ + zC
~
R
h~a + k~b + l~c · xA
= 2π (xh + yk + zl) .
(3.11)
Para que se verifique a condição de Laue, é necessário que a soma dentro dos parêntesis na
Eq. (3.11) seja um número inteiro, quaisquer que sejam os inteiros h, k, l. Isto só é possı́vel
~ = (~k− k~0 )
(quaisquer que sejam h, k, l) se x, y e z forem também inteiros. O conjunto de vectores G
que satisfaz a condição de Laue é pois da forma
~ = pA
~ + qB
~ + rC,
~
G
(3.12)
com p, q, r inteiros, ou seja, é formado pelas combinações lineares inteiras dos vectores fundamentais da rede recı́proca. Voltando agora à condição de Laue, podemos agora enunciá-la da seguinte
forma:
Pode ocorrer interferência construtiva (e portanto difracção) se a variação no vector
~ = k~0 − ~k, for um vector da rede recı́proca.
de onda da radiação G
Note-se que a condição de Laue é uma condição apenas necessária, não suficiente, para a
difracção. Se o motivo cristalino não for trivial (isto é, se contiver mais do que um átomo por
célula unitária), verificam-se processos de interferência no interior de cada célula unitária primitiva,
que podem impedir a difracção numa dada direcção, mesmo que a condição de Laue (que diz
respeito apenas à interferência entre diferentes células unitárias primitivas) a permita. Mais à
frente abordaremos este assunto.
3.4
A lei de Bragg
Como acabámos de ver, de acordo com a condição de Laue, para se dar difracção de radiação
numa dada direcção, é necessário que a variação do vector de onda da radiação seja um vector da
~ rst , isto é, que
rede recı́proca. Suponhamos que esta condição é satisfeita para o vector G
~ rst = rA
~ + sB
~ + tC,
~
∆~k = G
com r, s, t inteiros arbitrários.
Os três números inteiros r, s e t são totalmente arbitrários e podem, ou não, ter divisores comuns.
Sejam h, k e l três inteiros nas mesmas proporções, mas sem divisores comuns. Então
r
s
=
=
t =
nh
nk
nl,
40
CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS
onde n é o maior divisor comum dos três inteiros r, s e t. Podemos então escrever a condição de
Laue acima como
~ hkl .
∆~k = nG
(hkl)
k
θ
k
θ
k’
k - k’=Ghkl
Nós tı́nhamos já encontrado os vectores da rede recı́proca, antes deste
estudo da difracção de radiação, quando deduzimos a expressão da
distância interplanar. Vimos, nessa altura, que o vector da rede
~ hkl é perpendicular à famı́lia de planos cristalinos com
recı́proca G
ı́ndices de Miller (hkl). Na figura junta, representa-se a disposição
dos vários vectores envolvidos na Condição de Laue. A partir desta
figura, é evidente que
~ hkl k
nkG
sin θ =
,
2k~kk
ou seja,
2
2π
sin θ = nλ.
~ hkl k
kG
Mas, como vimos no capı́tulo anterior,
~ hkl k =
kG
2π
,
dhkl
onde dhkl é a distância interplanar da famı́lia de planos (hkl). Substituindo em cima, obtemos a
famosa Lei de Bragg,
2dhkl sin θ = nλ,
que é uma condição para a difracção equivalente à condição de Laue.
A lei de Bragg pode ser deduzida de forma alternativa, fazendo a suposição (nada fácil de
justificar) de que a difracção de radiação se faz por reflexão geométrica nos planos cristalinos.
A Figura 3.3 representa o trajecto óptico de dois raios-X paralelos que sofrem uma reflexão em
θ
θ
θθ
θ
l
l
d
θ
Figura 3.3: Reflexão de Bragg.
dois planos consecutivos de uma dada famı́lia de planos cristalinos, que fazem com a direcção dos
feixes um ângulo de θ. A diferença entre os caminhos percorridos pelos dois raios é 2l, ou seja,
2d sin θ, onde d é a distância interplanar. Para que haja interferência construtiva, esta diferença
deve conter um número inteiro, n, de comprimentos de onda, λ, da radiação envolvida no processo.
Assim, a condição para a existência de reflexão é
2d sin θ = nλ,
(3.13)
que é a lei de Bragg. Quando radiação de comprimento de onda bem definido incide num cristal,
somente as famı́lias de planos que apresentam uma distância interplanar e uma orientação relativamente à radiação incidente que satisfazem a lei de Bragg participam na reflexão de radiação.
Pode mesmo não haver reflexão (é até o caso mais frequente, para uma orientação fixa do cristal
e da fonte da radiação) se não houver nenhuma famı́lia de planos nestas condições. Neste caso, a
radiação incidente é totalmente absorvida pelo cristal.
3.5. MÉTODOS EXPERIMENTAIS
3.5
41
Métodos experimentais
Há basicamente três métodos para o estudo experimental da difracção: o de Laue, o do cristal
rotativo, e o do pó. No método de Laue, faz-se incidir raios-X com uma gama contı́nua de comprimentos de onda sobre um cristal imóvel (ver a Figura 3.4). O cristal difracta as componentes da
Cristal
Fonte de
raios−X
Écran
Figura 3.4: Método de Laue.
radiação incidente com comprimentos de onda para os quais existem no cristal famı́lias de planos
com distância interplanar capaz de satisfazer a lei de Bragg. Estas componentes irão, após a difracção, incidir num ecrã, usualmente uma placa fotográfica, ou um detector eletrónico de raios-X,
permitindo assim a análise. Os padrões de difracção consistem numa série de pontos, dispostos de
forma simétrica relativamente ao ponto onde a direcção da radiação incidente intersecta o plano
do écran.
Como já foi dito, ao se iluminar um cristal imóvel com radiação monocromática poderá não se
verificar qualquer difracção, por não haver no cristal nenhuma famı́lia de planos orientada de forma
a permitir a satisfação da lei de Bragg. Mas se se rodar o cristal durante a exposição à radiação,
verificar-se-ão várias difracções, cujo ângulo se altera bruscamente com a rotação do cristal. Cada
famı́lia de planos “espera pacientemente” o instante em que a sua orientação relativamente à
radiação incidente permita, nos termos da lei de Bragg, a sua participação na difracção. Este é o
processo usado no chamado método do cristal rotativo. O cristal roda no interior de um cilindro
Écran
Cristal
Fonte monocromática
de raios−X
ω
Figura 3.5: Método do cristal rotativo.
(ver a Figura 3.5) cujas paredes interiores estão revestidas com uma pelı́cula fotográfica. Um
orifı́cio na superfı́cie lateral do cilindro permite a entrada do feixe incidente.
No método do cristal rotativo, em cada instante, apenas algumas famı́lias de planos participa
no processo de difracção, que são aquelas que estão correctamente alinhadas, e que apresentam
uma distância interplanar capaz de satisfazer a lei de Bragg. Se, em vez de um único cristal,
42
CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS
dispusessemos de um grande número cristais na região de incidência do feixe, e cada cristal estivesse
orientado de maneira arbitrária, então, mesmo com a amostra fixa, qualquer famı́lia de planos teria,
nalgum cristal, a orientação correcta para satisfazer a lei de Bragg, podendo assim participar da
difracção. É nesta ideia que se baseia o chamado método do pó ou de Debye. Neste método, em
vez de se usar um cristal inteiro na amostra, usa-se um cristal fragmentado em pequenos grãos,
cada um dos quais funciona como um pequeno cristal(k) com as suas direcções privilegiadas de
difracção (ver a Figura 3.6).
película
fotográfica
os
no
sX
mo
c
ati
rom
c
amostra
io
Ra
-180°
-90°
0°
90°
180°
Figura 3.6: Esquema da montagem usada no método do pó e aspecto da pelı́cula após revelação.
3.6
Factor de estrutura
A condição de Laue impõe, como vimos, que a radiação difractada por pontos equivalentes do
cristal (isto é, pontos separados por vectores da rede cristalina) interfira construtivamente. Assim
sendo, não se consideram na descrição de Laue fenómenos de interferência entre centros dispersores
a distâncias inferiores às que separam os pontos da rede cristalina e, em particular, não se descreve
a interferência entre átomos diferentes no interior de cada instância do motivo cristalino. Pode pois
dizer-se com propriedade que a análise de Laue é uma aproximação, na qual o motivo cristalino
é encarado como um centro dispersor pontual. Desta maneira afastam-se da teoria os processos
de interferência internos ao motivo, processos esses que podem eventualmente proibir a difracção
segundo algumas das direcções permitidas pela lei de Laue. É esta a razão que nos levou a afirmar
que a condição de Laue é apenas uma condição necessária, mas não suficiente, para a difracção de
radiação.
Devemos agora estudar os processos de interferência no interior de cada ocorrência do motivo
cristalino. Porque não nos preocupamos já com a interferência entre diferentes ocorrências do
motivo, vamos supôr a lei de Laue satisfeita à partida. Consideremos um cristal com um motivo
constituı́do por N átomos. Quando incide radiação (vamos imaginá-la monocromática, para simplificar a linguagem) no cristal, proveniente de uma fonte F (ver a figura junta) cada um dos seus
átomos funciona como fonte secundária de radiação, na forma de ondas esféricas com o mesmo com-
(k) É trivial verificar que um grão de areia com cerca de 0,01 mm de diâmetro contém cerca de 1018 átomos,
podendo pois ser ainda considerado um cristal macroscópico.
3.6. FACTOR DE ESTRUTURA
43
primento de onda da radiação incidente. Por exemplo, o j-ésimo átomo do motivo é fonte de radiação
com função de onda que, na posição, ~r, do detector
D, é dada por [ver a Eq. (3.2)]
C
k
F
k’
Rj
O
r
D
ψj (~r, t) =
0
Aj
~
ei(k k~r−Rj k−ωt) ,
~ jk
k~r − R
~ j é o seu vector posição e k 0
onde Aj é a amplitude da radiação difractada pelo j-ésimo átomo, R
é o módulo do vector de onda da radiação difractada. A amplitude da radiação difractada por
cada átomo é proporcional à amplitude da radiação nele incidente e a um factor, chamado factor
de forma atómico que traduz a maior ou menor capacidade difractante de cada átomo e que pode
ser escrito como função da variação do vector de onda, ∆~k = ~k − ~k 0 . Uma vez que a fonte de
radiação está a uma distância do cristal muito superior às dimensões lineares do motivo, podemos
supôr que a radiação incidente é uma onda plana, podemos tomar
~ ~
Aj = fj (∆~k)eik·Rj ,
ou seja, escrever a radiação difractada pelo j-ésimo átomo como
ψj (~r, t) =
1
~ ~
~ jk
k~r − R
0
~
fj (∆~k) eik·Rj ei(k k~r−Rj k−ωt) .
(3.14)
~ j e ~k 0 são paralelos, de forma que
Note-se agora que os vectores ~r − R
~ j k = ~k 0 · (~r − R
~ j ).
k 0 k~r − R
~ j k, é praticamente
Por outro lado, a distância que separa os vários átomos do detector, k~r − R
constante, de modo que podemos, no denominador da Eq. (3.14), substitui-la pela pelo valor médio
dessa distância(l) , que vamos representar por d. A função de onda da radiação difractada pelo
j-ésimo átomo que chega ao detector é, então,
ψj (~r, t) =
=
1
~ ~
~0
~
f (∆~k) eik·Rj ei(k ·(~r−Rj )−ωt)
d
1 i(~k0 ·~r−ωt)
~ ~
e
fj (∆~k) ei∆k·Rj
d
Por fim, a radiação detectada é a soma das difractadas por cada átomo, ou seja,
ψ(r, t) =
N
1 i(~k0 ·~r−ωt) X
~ ~
e
fj (∆~k) ei∆k·Rj .
d
j=1
Ao somatório no termo do lado direito desta equação dá-se o nome de factor de estrutura. Quanto
maior for o módulo do factor de estrutura, mais intensa é a difracção da radiação pelo cristal. Se o
factor de estrutura se anular para uma dada variação de vector de onda ∆~k, então não se verifica
a difracção de radiação na direcção correspondente, mesmo que a difracção seja permitida pelas
leis de Laue ou de Bragg.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• J. R. Christman, ”Fundamentals of Solid State Physics”(1988), capı́tulo 4 (F5.0 257 e 258)
(l) Por
que razão não o podemos fazer também no argumento da exponencial?
44
CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS
• C. Kittel, ”Introduction to Solid State Physics”(1996), capı́tulo 2 (F5.0 82)
• N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulo 6 (F5.0 339)
PROBLEMAS
3.1 Prove que os volumes das células unitárias de uma dada rede (τ ) e da sua rede recı́proca (τ ∗ ) se
relacionam através de
(2π)3
τ∗ =
τ
3.2 Prove que a recı́proca da rede recı́proca de uma dada rede é esta rede.
3.3 Mostre que a rede recı́proca de uma rede cúbica de faces centradas é uma rede cúbica de corpo
centrado.
3.4 Qual é então a recı́proca de uma rede cúbica de corpo centrado?
3.5 Determine e classifique a rede recı́proca de cada uma das seguintes redes
(a) hexagonal;
(b) ortorrômbica;
(c) tetragonal.
3.6 Considere uma rede trigonal. Seja θ o ângulo entre os seus vectores fundamentais primitivos. Prove
que a rede recı́proca também é trigonal e que o ângulo θ∗ entre os seus vectores fundamentais
primitivos é dado por
cos θ
cos θ∗ = −
.
1 + cos θ
3.7 Determine os ângulos que a radiação difractada pode fazer com a incidente, numa experiência
de difracção de raios-X com comprimento de onda λ = 1, 04 Å, incidindo numa rede rede cúbica
simples, com parâmetro a = 4, 0 Å.
3.8 Numa experiência de difracção, onde raios-X com comprimento de onda λ = 1, 0 Å incidem sobre
um cristal monoatómico com rede cúbica simples, o primeiro máximo de difracção faz com a
direcção da radiação incidente um ângulo θ = 16, 4◦ . Determine o valor do parâmetro a da rede
cristalina.
3.9 (*) Determine o factor de estrutura de uma rede cúbica de corpo centrado e de uma rede cúbica
de faces centradas, associando a cada ponto de rede numa célula unitária convencional um factor
de forma “atómico”.
3.10 (*) Construa uma tabela onde apresente os ângulos de difração de radiação por uma rede cúbica
simples, ordenados de forma crescente. Indique na tabela quais os máximos que não são observados
em experiências de difracção com redes cúbicas de corpo centrado e de faces centradas.
3.11 (*) Suponha que dois átomos da base de uma estrutura “zinc blende”têm factores de forma
atómico =a e =b , respectivamente.
(a) Obtenha uma expressão para o factor de estrutura em função dos ı́ndices (hkl) duma rede
cúbica simples.
(b) Mostre que o factor de estrutura, F , é
0
se h, k e l não forem simultaneamente números pares
ou ı́mpares,
4(=a + =b )
se h + k + l = 4n,
4(=a − i=b ) se h + k + l = 4n + 1,
4(=a − =b )
se h + k + l = 4n + 2,
4(=a + i=b ) se h + k + l = 4n + 3,
onde n é um número inteiro qualquer.
3. Problemas
45
3.12 (*) Determine a expressão para o factor de estrutura F associado a uma estrutura hexagonal
compacta ideal, usando os ı́ndices da estrutura primitiva. Suponha que os dois átomos da base
têm o mesmo factor de forma atómico, =, independente de ∆~k e classifique por ordem crescente
de intensidade os picos de difracção associados aos planos: (100), (110), (111), (1̄11), (210) e
(211).
3.13 Um cristal tetragonal é preparado para uma experiência de difracção usando o método de Debye
com um comprimento de onda de raios-X de λ = 1, 54 Å. A célula convencional tem uma base
quadrada de a = 3, 20 Å e altura c = 4, 63 Å.
(a) Determine os três primeiros ângulos de difracção.
(b) (*) Se a base consiste num átomo de um tipo no centro da célula e um outro diferente num
dos vértices, classifique por ordem de intensidades os picos de difracção relativos ao ângulos
da alı́nea anterior. Assuma que ambos factores de forma atómicos são reais e têm o mesmo
sinal.
3.14 Partindo da condição de Laue para a difracção, prove que:
¯ ¯
~k · G
~ ¯2 .
~ = − 1 ¯G
2
Capı́tulo 4
A capacidade térmica dos sólidos
Nos capı́tulos anteriores foi apresentado um modelo dos sólidos cristalinos segundo o qual os
átomos que os formam encontram-se em repouso nas posições determinadas pela rede e motivo
cristalinos. No entanto, esta suposição da imobilidade é uma simplificação grosseira da realidade
que apresenta, entre outros, os seguintes inconvenientes:
• A temperatura de um objecto pode ser encarada como uma medida da energia cinética
associada ao movimento microscópio dos átomos que o constituem. Supondo os átomos em
repouso esta associação é impossı́vel.
• O som consiste em ondas mecânicas, isto é, variações infinitesimais na posição dos átomos
que se transmitem aos átomos vizinhos, propagando-se desta forma nos meios materiais.
Aceitando a hipótese da imobilidade dos átomos nos sólidos cristalinos, estes deveriam ser
isoladores sonoros, o que claramente, não se verifica.
• O argumento anterior aplica-se também à condução de calor.
Muitos outros argumentos desta natureza poderiam ainda ser apresentados (ver, por exemplo, o
Cap. 21 do Ashcroft & Mermin).
Neste capı́tulo, vamos melhorar este modelo dos sólidos, abandonando a hipótese da imobilidade
atómica. Na nova descrição dos sólidos, considera-se que as posições definidas pela sua estrutura
microscópica são as posições de equilı́brio dos átomos que lhes correspondem, mas supõe-se que são
possı́veis pequenos deslocamentos dessas posições, que são contrariados pelas forças interatómicas
responsáveis pela coesão do sólido.
4.1
A aproximação harmónica
A interacção de cada átomo com os restantes átomos num sólido manifesta-se na forma de uma
energia potencial φ(~r), que apresenta um valor mı́nimo quando esse átomo se encontra na sua
~ desta
posição de equilı́brio (ver a Figura 4.1). Considerando pequenos deslocamentos δ~r = ~r − R
posição, podemos aproximar a energia potencial pelo seu desenvolvimento de Taylor de segunda
ordem
· 2 ¸
3
X
∂ φ
~ + δ~r · [∇φ(~r)] ~ + 1
φ(~r) ' φ(R)
δx
δxj .
(4.1)
i
R
2! i,j=1
∂xi ∂xj R~
O primeiro termo, de ordem zero em δ~r, é uma constante, e como tal não desempenha qualquer
papel na dinâmica do sólido; representa a contribuição do átomo considerado para a energia de
ligação do sólido. O termo de primeira ordem é nulo, uma vez que é proporcional ao gradiente
da energia potencial do átomo, calculado na sua posição de equilı́brio, onde a energia potencial
47
48
CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS
φ
x
X
Figura 4.1: A energia potencial de um átomo de um sólido é mı́nima na sua posição de equilı́brio.
apresenta um valor mı́nimo. Finalmente, o termo de segunda ordem pode ser escrito como
(2)
φ
(~r) =
=
· 2 ¸
3
1 X
∂ φ
δxj
δxi
2! i,j=1
∂xi ∂xj R~
3
1 X
δxi Kij δxj ,
2 i,j=1
com
·
Kij =
∂2φ
∂xi ∂xj
(4.2)
¸
~
R
A Eq. (4.2) é a expressão mais geral para a energia potencial num oscilador harmónico tridimensional. Mas note-se que, como Kij é uma matriz simétrica, é possı́vel escolher um sistema
de coordenadas x0 y 0 z 0 no qual a matriz K é diagonal. Usando esse sistema de coordenadas, o
termo de segunda ordem na energia potencial fica
φ(2) (~r) =
1
1
1
Kxx (δx0 )2 + Kyy (δy 0 )2 + Kzz (δz 0 )2 ,
2
2
2
que representa a energia total de um sistema de três osciladores harmónicos independentes, com
constantes elásticas Kxx , Kyy e Kzz . Assim, se limitarmos o nosso estudo às vibrações de pequena amplitude, podemos tratar as interacções entre os átomos como interacções elásticas, o que
permite, como veremos, grandes simplificações.
4.2
Elementos da teoria das probabilidades
Há experiências sobre as quais não podemos prever o resultado. Por exemplo, não sabemos
antecipadamente que valor “sairá” no lançamento de um dado, nem se irá chover depois de amanhã.
Estas experiências chamam-se experiências aleatórias. Os resultados das experiências aleatórias
não são prédeterminados mas, muitas vezes, não são igualmente “esperáveis,” isto é, ficamos mais
surpreendidos com uns resultados do que com outros. Quando atiramos uma moeda ao chão,
esperamos que ela fique com uma, ou com a outra, face virada para cima, não esperamos que ela
fique equilibrada sobre o seu bordo circular; quando uma folha se solta da árvore a que pertence,
num dia de outono com pouco vento, é difı́cil prever a que distância atingirá o solo, mas esperamos
que ela caia na vizinhança da árvore.
Porque é que achamos alguns resultados de uma experiência aleatória mais “esperáveis” do
que outros? Porque, se repetirmos muitas vezes essa experiência, alguns resultados ocorrem mais
frequentemente do que outros: as moedas caem quase sempre com uma ou outra face virada para
cima, quase nunca ficam equilibradas sobre o seu bordo; as folhas que caem das árvores em dias de
4.2. ELEMENTOS DA TEORIA DAS PROBABILIDADES
49
outono sem vento ficam quase todas perto das árvores a que pertenciam, quase nunca se afastam
para muito longe.
4.2.1
Variáveis aleatórias discretas
Numa série de repetições de uma experiência aleatória, o número de vezes que um resultado
particular ocorre chama-se frequência absoluta desse resultado. Chama-se frequência relativa de
um resultado ao quociente entre a frequência absoluta de um resultado e o número de vezes que
se repetiu a experiência. Como é óbvio, a soma dos valores das frequências absolutas dos vários
resultados numa série de repetições de uma experiênca aleatória deve ser igual ao número de
repetições. Pela mesma razão,as frequências relativas dos vários resultados são todas menores do
que 1 e a sua soma deve ser igual a 1.
Consideremos um exemplo. Suponhamos que estudamos o lançamento simultâneo de dois
dados. O resultado desta experiência aleatória é um número inteiro compreendido ente 2 e 12
(inclusive). Suponhamos que repetimos cinco vezes esta experiência e obtemos os valores 5, 10, 7,
7, 11. As frequências absolutas dos resultados desta série de repetições desta experiência aleatória
são
r
F (r)
2
0
3
0
4
0
5
1
6
0
7
2
8
0
9
1
10
0
11
1
12
0
As frequências relativas são as frequências absolutas divididas pelo número de repetições da experiência, ou seja, neste caso, 5:
r
f (r)
2
0
3
0
4
0
5
0,2
6
0
7
0,4
8
0
9
0,2
10
0
11
0,2
12
0
Note-se que as somas dos valores das frequências absolutas e das frequências relativas valem,
respectivamente, 5 e 1, como já esperávamos. Note-se também que, dada a natureza aleatória desta
experiência, outra série de 5 repetições produziria, em princı́pio, outros resultados e, portanto,
outros valores para as frequências dos resultados.
Quando aumentamos muito o número de repetições de uma experiência aleatória, constatamos
o emergir de uma certa “ordem no caos,” que se manifesta na Lei dos grandes números:
As frequências relativas dos resultados de uma experiência aleatória tendem para valores bem determinados à medida que o número de repetições tende para infinito.
Voltando ao exemplo que temos vindo a considerar, na Figura 4.2 mostra-se um gráfico onde
se representam os valores das frequências relativas dos vários resultados numa série de 50 000
lançamentos de dois dados, como função do número de lançamentos. Como se pode ver, as
frequências sofrem grandes oscilações no inı́cio de uma série de repetições mas, à medida que o
número de repetições aumenta, estacionam em valores bem determinados.
Os limites para que tendem as frequências dos resultados de uma experiência aleatória, quando
o número de repetições tende para infinito chamam-se as probabilidades desses resultados. Dada
a definição de probabilidade que apresentámos, as probabilidades devem ser sempre menores do
que 1 e a soma das probabilidades de todos os resultados possı́veis de uma experiência aleatória
deve ser igual a um.
No caso do lançamento de dois dados, as probabilidades são as da tabela em baixo.
r
f (r)
2
0,028
3
0,056
4
0,083
5
0,111
6
0,139
7
0,167
8
0,139
9
0,111
10
0,083
11
0,056
12
0,028
Quando repetimos muitas vezes uma experiência aleatória, esperamos que o número de vezes,
ni , que um resultado particular xi com probabilidade pi ocorre seja dado por
ni = npi ,
50
CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS
0.2
r=7
fn(r)
r = 6; 8
r = 5; 9
0.1
r = 4; 10
r = 3; 11
r = 2; 12
0
0
10
20
30
40
50
n /1000
Figura 4.2: Evolução das frequências relativas, fn (r), do resultado do lançamento de dois dados
como função do número de lançamentos, n (em milhares).
onde n é o número de repetições. Esta expressão resulta directamente da definição de probabilidade. Claro que, uma vez que se trata de uma experiência aleatória, esta igualdade não se verifica
exactamente, qualquer que seja o valor (finito) de n; à medida que n aumenta, as diferenças entre
as frequências absolutas dos vários resultados e os seus valores esperados, dados pela igualdade
acima, vai diminuindo, em termos relativos. Só no limite n → ∞ passamos a ter uma igualdade
exacta.
Consideremos agora uma experiência aleatória cujo resultado é um número pertencente ao
conjunto Ω = {X1 , X2 , . . . , XR }, onde R, não necessariamente finito, é o número de resultados
possı́veis(a) . Suponhamos que repetimos esta experiência aleatória muitas (digamos, n) vezes,
obtendo os valores x1 , x2 , . . . , xn , e queremos agora calcular o valor médio dos resultados obtidos.
Obviamente, temos
n
x̄ =
1X
xi .
n i=1
Mas os resultados que obtivemos na repetição desta experiência, os números x1 , x2 , . . . , xn , pertencem todos ao conjunto dos resultados possı́veis Ω. Entre os resultados obtidos, alguns (digamos,
n1 ) serão iguais ao resultado possı́vel X1 , outros (digamos, n2 ) serão iguais ao resultado possı́vel
X2 , e assim sucessivamente. Podemos então escrever a expressão para o cálculo do valor médio
como
R
x̄ =
1X
nk Xk .
n
k=1
No limite em que o número de repetições da experiência aleatória tende para infinito, as razões
nk /n tendem para as probabilidades, pk de cada resultado. Nesse limite, obtemos o chamado valor
expectável da variável aleatória X:
hXi =
R
X
pk Xk .
k=1
(a) Por exemplo, no lançamento de dois dados, o resultado é um inteiro do conjunto {2, 3, . . . , 12}. O valor ded R
é, aqui, 11.
4.2. ELEMENTOS DA TEORIA DAS PROBABILIDADES
7
6.5
r
Na figura ao lado podemos ver como evolui o valor médio
do resultado do lançamento de 2 dados, como função do
número de repetições. É bem evidente que se aproxima do
valor expectável, 7.
O valor expectável de uma variável aleatória representa
o seu centro de dispersão. Igualmente interessante é a amplitude dessa dispersão. Para avaliar a amplitude da dispersão dos valores de uma variável aleatória, define-se a
variância, que é o valor expectável dos quadrados dos desvios relativamente ao valor expectável da variável. Isto é,
tomando a sequência particular de resultados x1 , x2 , . . . que
usámos acima, definimos
51
6
5.5
0
10
20
30
n / 1000
40
50
n
s2 =
1X
2
(xi − hXi) ,
n i=1
que, quando n tende para infinito, tende para a variância da variável aleatória,
σ 2 (X) =
R
X
pk (Xk − hXi)2 .
k=1
Os detalhes do cálculo que nos trazem a esta expressão a partir da de s2 são em tudo semelhantes
ao que permitem deduzir a expressão do valor expectável da variável aleatória a partir do valor
médio de uma amostra muito grande de valores dessa variável.
4.2.2
Variáveis aleatórias contı́nuas
Quando o resultado de uma experiência aleatória é um número real (por exemplo, a distância a
que uma folha fica, quando atinge o solo, da árvore de que se soltou) o cálculo das frequêcias
dos resultados é mais complicado, porque é muito, muito difı́cil que ocorram dois resultados
exactamente iguais. Duas folhas que se soltam da mesma árvore não ficam exactamente à mesma
distância da árvore; posso apostar que não encontramos, na nossa cabeça, dois cabelos de igual
comprimento, se os avaliarmos com medições rigorosas. O que se faz nestes casos é dividir o
intervalo de reultados em subintervalos, ou classes. Se X fôr a variável aleatória estudada, e
I = [Xi , Xf ] o intervalo em que os valores de X estão definidos, definimos uma partição de I
em subintervalos disjuntos I1 , I2 , . . . , que, todos reunidos, definem I e consideramos a variável
discreta “classe a que pertence o resultado de X”. Usando o exemplo do comprimento dos cabelos,
poderı́amos definir a classe dos cabelos com comprimento no intervalo I1 = [2,0 cm, 2,5 cm[, a dos
do intervalo I2 = [2,5 cm, 3,0 cm[, etc. Podemos agora falar então da frequência da classe I1 ,
da da classe I2 etc. As probabilidades das classes são os limites das frequências relativas dessas
classes. Podemos ainda calcular a probabilidade por unidade de largura da classe. No limite
em que essa largura tende para zero, obtemos a chamada função de densidade de probabilidade,
f (x). O significado desta função é que a probabilidade da variável aleatória X tomar um valor
compreendido entre x e x + dx é
dp = f (x)dx.
O valor expectável de uma variável aleatória contı́nua calcula-se com uma generalização óbvia da
expressão usada no caso das variáveis discretas, a saber
Z
hXi = dx, f (x)x,
I
onde o integral é extendido ao intervalo de valores possı́veis para X. A variância, por seu turno,
fica, neste caso,
Z
2
σ = dx f (x)(x − hXi)2 .
I
52
4.3
CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS
A lei de Dulong e Petit
A capacidade térmica molar de uma substância é o calor necessário para elevar a temperatura de
uma mole dessa substância em 1◦ C. Se o processo de aquecimento for feito a volume constante, o
trabalho realizado é nulo, e portanto o calor fornecido ao sistema é igual à sua variação de energia
dE. Assim, a capacidade térmica a volume constante é definida como
¶
µ
∂E
,
(4.3)
Cv =
∂T V
A capacidade térmica dos sólidos apresenta uma dependência da temperatura caracterı́stica, representada na Figura 4.3. CV anula-se no zero absoluto de temperatura (0◦ K≈ −273◦ C) apreC
V
3R
αT3
0
T
Figura 4.3: Capacidade térmica dos sólidos como função da temperatura.
sentando, para valores baixos de temperatura uma proporcionalidade ao cubo da temperatura,
CV ∝ T 3 ; para valores altos de T , a capacidade térmica é praticamente constante e igual a 3R(b) ,
para todos os sólidos. A esta constância da capacidade térmica a altas temperaturas dá-se o nome
de Lei de Dulong e Petit. Vamos de seguida tentar explicar este comportamento da capacidade
térmica, por aproximações sucessivas.
4.3.1
Modelo Clássico
De acordo com o modelo que temos vindo a desenvolver, um sólido consiste num conjunto de
átomos que podem oscilar em torno de posições de equilı́brio fixas nas posições que definem a
sua estrutura cristalina. Aceitando que estes deslocamentos são pequenos, vimos já que podemos
considerar cada átomo sujeito a forças elásticas.
Note-se que, para além de átomos “presos” às suas posições de equilı́brio, os sólidos podem
também conter electrões práticamente livres no seu interior, de acordo com o modelo clássico dos
metais. Esta possibilidade introduz um termo adicional na análise que vamos agora desenvolver,
que não será tomada em linha de conta. Assim, o que se segue é válido apenas para sólidos
isoladores, e o problema da capacidade térmica dos condutores será abordado mais adiante, no
próximo capı́tulo destes apontamentos.
Consideremos, então, cada átomo como um oscilador harmónico tridimensional. É bem sabido
que um oscilador harmónico tridimensional se pode descrever como a reunião de três osciladores
unidimensionais independentes. Podemos então, em resumo, tratar um sólido com N átomos como
um conjunto de 3N osciladores harmónicos unidimensionais. Considerando o sólido em equilı́brio
(b) R é a constante dos gases ideais, com o valor R = 8, 3144 J/K mol. É igual ao produto da constante de
Boltzmann, kB , com o número de Avogrado, NA , isto é, R = kNA .
4.3. A LEI DE DULONG E PETIT
53
termodinâmico, todos estes osciladores devem ter a mesma energia média hεi. A energia total do
sólido é então
E = 3N hεi.
(4.4)
A energia de cada oscilador, ε, pode ser calculada recorrendo à fı́sica estatı́stica. A probabilidade
de que um oscilador harmónico unidimensional, em equilı́brio termodinâmico com um ambiente à
temperatura T , esteja num estado com energia compreendida entre os valores ε e ε + dε é dada
pela lei de Boltzmann:
− ε
dP (ε) = f (ε)dε = Ae kB T dε,
(4.5)
onde kB é a constante de Boltzmann(c) e A é uma constante de normalização, que deve ser ajustada
por forma a que a soma das probabilidades seja unitária:
Z
∞
dP (ε) = 1.
(4.6)
1
.
kB T
(4.7)
0
Daqui resulta
A=
Podemos identificar a energia de cada oscilador no sólido com o calor expectável da energia, ou
seja
Z
Z ∞
1
− ε
hεi = f (ε)εdε =
(4.8)
dε εe kB T .
kB T 0
Este integral é facilmente resolvido por partes, obtendo-se
hεi = kB T .
(4.9)
Substituindo este valor em (4.4), obtemos o valor total da energia do sólido:
E = 3N kB T .
(4.10)
Refira-se que este resultado poderia ter sido obtido de forma equivalente usando o Teorema da
Equipartição da Energia, de acordo com o qual cada termo quadrático na expressão da energia de
um sistema de muitas partı́culas idênticas contribui com kB T /2 para a energia média do sistema
em equilı́brio termodinâmico à temperatura T ; neste caso, em que cada partı́cula do sistema é um
oscilador harmónico tridimensional, temos, por cada uma, seis termos quadráticos na energia, três
para a energia potencial [k(x2 +y 2 +z 2 )/2] e outros três para a energia cinética [m(vx2 +vy2 +vz2 )/2],
ou seja, uma contribuição de 6 × kB T /2 = 3kB T para a energia média do sistema. Uma vez que
o número total de partı́culas é N , obtemos por multiplicação o resultado apresentado.
Derivando agora a energia em ordem à temperatura obtemos a capacidade térmica, de acordo
com a sua definição (4.3). Se considerarmos uma mole de átomos obtemos finalmente
CV = 3NA kB T = 3R.
(4.11)
que está de acordo com a lei de Dulong e Petit mas não reproduz os resultados experimentais a
baixas temperaturas. Este facto foi, durante algum tempo, argumento de peso contra a hipótese
atómica da matéria, até que, em 1907 Einstein propôs um tratamento diferente, em que as oscilações da rede cristalina são “quantizadas”, de forma semelhante à quantização do campo electromagnético efectuada por Plank no estudo da radiação do corpo negro. Em analogia com o
termo “fotão”que se refere aos quanta do campo electromagnético, designam-se por “fonões”os
quanta das oscilações mecânicas nos sólidos. Vamos de seguida seguir este formalismo.
(c) k
B
= 1, 381 × 10−23 J/K
54
CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS
4.3.2
Modelo de Einstein
Em 1900, Plank verificou que o espectro de radiação térmica emitida pelos chamados corpos negros
(corpos que absorvem toda a radiação electromagnética que neles incide) pode ser descrito com
exactidão supondo que, na interacção entre a matéria e o campo electromagnético, só pode haver
transferência de energia em quantidades múltiplas da unidade básica hν, onde h é a constante de
Plank(d) e ν é a frequência envolvida no processo.
Esta suposição era, na altura, completamente injustificável e foi considerada como um mero
truque de “engenharia algébrica”por toda a comunidade cientı́fica, incluindo o próprio Plank,
porque parecia indicar que a radiação electromagnética seria constituida por partı́culas. O debate
sobre a natureza da luz (ondas ou partı́culas) vinha desde os tempos de Newton (partidário da
Natureza corpuscular) e Huyghens (que apoiava a descrição ondulatória) e tinha, aparentemente,
sido resolvido, experimentalmente, já no século XVIII, pelos trabalhos de Young e de Fresnel, a
favor da hipótese ondulatória. O “truque”de Plank viria assim, caso fosse aceite como descrição
de algo real, a baralhar (de novo) as cartas. Por esta razão, os fı́sicos acreditavam que, mais
tarde ou mais cedo, um tratamento clássico do corpo negro seria elaborado, no qual a hipótese de
Plank não fosse necessária, ou surgisse devidamente justificada no contexto da teoria ondulatória
da radiação. Um dos poucos fı́sicos que não partilhavam esta opinião era Albert Einstein.
Segundo Einstein, a radiação electromagnética é de facto constituida por partı́culas chamadas
fotões com uma massa em repouso nula e com energia dada por hν, de acordo com a hipótese
de Plank. No entanto, o carácter ondulatório da luz não é eliminado, até porque na própria
expressão de energia, E = hν, está presente a frequência, ν, que é uma quantidade tipicamente
ondulatória. Einstein compatibilizou estes aspectos aparentemente contraditórios interpretando
estatisticamente o campo (ou função de onda) da radiação. Concretamente, Einstein propôs que
a intensidade (caracterı́stica ondulatória) da radiação numa região do espaço é proporcional ao
número de fotões nela presente.
Com esta descrição da radiação, Einstein explicou quantitativamente os resultados das experiências sobre o efeito fotoeléctrico em 1905. Apesar deste sucesso, continuou relativamente
isolado na defesa do carácter realista da hipótese de Plank, até ao ano 1922 em que Comptom
expôs os seus trabalhos sobre a dispersão de electrões pela radiação, “encerrando”a questão a favor
de Einstein. Para dar mais consistência à hipótese de Plank, Einstein tentou aplicá-la noutros
domı́nios, nomeadamente naquele que aqui mais nos interessa, o problema da capacidade térmica
dos sólidos.
Suponhamos que, tal como o campo electromagnético, também o campo dos deslocamentos
dos constituintes de um sólido está quantizado, no sentido em que as trocas de energia mecânicas
entre estes constituintes só são possı́veis em quantidades múltiplas de hν, onde ν é a frequência das
oscilações com que estão animados. Esta suposição parece indicar a existência de uma partı́cula à
qual se dá o nome de fonão que tem uma energia hν, e que é trocado entre os átomos do sólido,
aumentando ou diminuindo a energia das suas oscilações. De acordo com esta hipótese, a energia
mecânica de cada átomo já não pode ser considerada uma variável continua, antes tomando valores
de um conjunto discreto, distanciados entre si de h̄ω (e) (ver a Figura 4.4). O valor mı́nimo da
energia, representado na Figura 4.4 por ε0 , obtém-se facilmente através de uma resolução quântica
do oscilados harmónico (que continua a ser a nossa aproximação para os deslocamentos atómicos
no cristal) e é dado por ε0 = 21 h̄ω.
De que forma esta hipótese altera a descrição clássica do sólido? Vamos repetir o processo
que seguimos para o modelo clássico. Consideremos 3N osciladores independentes, em equilı́brio
termodinâmico à temperatura T . Supondo que todos estes osciladores têm a mesma frequência ω
e a mesma energia, que identificamos com o valor expectável da energia de um oscilador quântico.
A energia total do sólido é então, tal como em (4.4),
E = 3N hεi.
(d) h
= 6, 626 × 10−34 Js
= hν
(e) h̄ω
(4.12)
4.3. A LEI DE DULONG E PETIT
55
E
ε +nhw
o
ε +3hw
o
o
ε + hw
o
ε = 1 hw
o 2
ε +2hw
Figura 4.4: Nı́veis de energia de um oscilador quântico com frequência ω.
A diferença principal relativamente ao tratamento clássico consiste no cálculo da energia média hεi.
Como a variável ε é, nesta abordagem, discreta, este cálculo não pode ser levado a cabo usando a
Eq. (4.8). Continuando a aceitar a distribuição de probabilidade de Maxwell-Boltzmann, temos,
neste caso, que a probabilidade de um oscilador estar no nı́vel de energia εn ,
1
εn = (n + )h̄ω
2
é
P (εn ) = Be−βεn .
(4.13)
onde se introduzir a notação, usual em fı́sica estatı́stica, β = 1/kB T , e B é uma constante de
normalização escolhida de maneira a garantir que a soma de todas as probabilidades seja 1. A
constante B é então determinada impondo
∞
X
P (εn ) = 1,
(4.14)
Be−βεn = 1,
(4.15)
n=0
ou seja,
∞
X
n=0
e portanto
1
.
−βεn
n=0 e
B = P∞
(4.16)
O valor numérico desta constante não é um resultado particularmente interessante, mas pode
facimente ser determinado. Usando a expressão da energia, o somatório no denominador em (4.16)
pode ser escrito como
∞
∞
X
X
1
e−βεn = e− 2 βh̄ω
(e−βh̄ω )n ,
(4.17)
n=0
n=0
e o somatório no lado direito desta igualdade é uma série geométrica de razão
x = e−βh̄ω < 1 .
A série é pois convergente, e o seu valor é
∞
X
1
e−βεn =
n=0
e− 2 βh̄ω
.
1 − e−βh̄ω
(4.18)
Substituindo este resultado em (4.16), obtemos
"
1
e− 2 βh̄ω
B=
1 − e−βh̄ω
#−1
.
(4.19)
56
CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS
A probabilidade de se encontrar um oscilador quântico no n-ésimo nı́vel de energia εn é
e−βεn
P (εn ) = P∞ −βε .
n
n=0 e
(4.20)
e o valor médio da energia é calculado usando a definição de valor expectável de uma variável
aleatória
X
hεi =
P (εn )εn
(4.21)
n
[compare com (4.8)]. Substituindo aqui (4.20) obtemos
P∞ −βεn
εn
n=0 e
hεi = P
,
∞
−βεn
e
n=0
(4.22)
onde o denominador em (4.20) foi posto em evidência na soma em (4.21). Note-se que o lado
direito da Eq (4.22) é o simétrico da derivada em ordem a β, de
X
ln
e−βεn
e portanto escrevemos
∞
hεi = −
X
∂
ln
e−βεn ,
∂β n=0
(4.23)
e o somatório que serve de argumento ao logaritmo foi calculado em (4.18). Resulta então
Ã
!
1
e− 2 βh̄ω
∂
ln
hεi = −
∂β
1 − e−βh̄ω
·
¸
¡
¢
∂
1
−βh̄ω
= −
− βh̄ω − ln 1 − e
.
(4.24)
∂β
2
Efectuando a derivada em ordem a β, obtemos
hεi =
=
1
h̄ωe−βh̄ω
h̄ω +
2
1 − e−βh̄ω
h̄ω
1
h̄ω + βh̄ω
.
2
e
−1
A energia total do sólido é então segundo (4.12)
µ
¶
1
h̄ω
E = 3N
h̄ω + βh̄ω
2
e
−1
(4.25)
(4.26)
e a capacidade térmica obtém-se derivando esta igualdade em ordem à temperatura, eliminando-se
assim a constante 3N h̄ω/2,
¶
µ
∂E
CV =
∂T V
µ
¶
∂β ∂E
=
∂T ∂β V
=
3N
eβh̄ω
(h̄ω)2
2.
2
kB T
(eβh̄ω − 1)
(4.27)
É usual a introdução da chamada temperatura de Einstein, que é o factor constante definido por
θE =
h̄ω
,
kB
(4.28)
4.3. A LEI DE DULONG E PETIT
57
em termos da qual a capacidade térmica resulta
µ
CV = 3R
θE
T
¶2
e
³
e
θE
T
θE
T
´2 ,
(4.29)
−1
assumindo que o número de átomos N é igual ao número de Avogrado NA . A Figura 4.5 apresenta
o gráfico da capacidade térmica, dividido por 3R. É evidente que o comportamento desta função
C (T) /3R
V
1
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
2
2.5
T/ θ
E
Figura 4.5: A capacidade térmica dos sólidos no modelo de Einstein.
a altas temperaturas é o esperado
µ
¶
CV
−→ 1 ⇐⇒ (CV )T →∞ −→ 3R
3R T →∞
e que o limite para baixas temperaturas é também o correcto
CV T →0 −→ 0.
Podemos verificar estes resultados analiticamente. Quando T → ∞, θE /T → 0. O argumento
das exponenciais é então pequeno e podemos por isso substitui-las pelos seus desenvolvimentos em
série de Taylor, mantendo apenas os termos mais significativos. Isto é, podemos em (4.29) fazer a
substituição
θE
θE
e T '1+
,
T
para T elevado. Obtemos então
#
µ ¶2 "µ ¶2
θE
T
T
CV ' 3R
+
T
θE
θE
µ ¶
θE
' 3R + 3R
T
' 3R,
no limite quando T → ∞, de acordo com a lei de Dulong e Petit. No limite oposto, em que T → 0,
o argumento das exponenciais θE /T é muito grande, e também as exponenciais o são. Podemos
58
CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS
então desprezar, no denominador de (4.29), a unidade. Resulta então
µ
CV ' 3R
θE
T
¶2
e−
θE
T
.
(4.30)
À medida que T se aproxima de zero, θE /T cresce, e a exponencial tende para zero. A diminuição
do valor da exponencial “vence”o crescimento do termo (θE /T )2 e o limite do produto é zero, de
acordo com o gráfico na Figura 4.5.
De um ponto de vista mais fı́sico, a razão pela qual a capacidade térmica dos solidos se anula
para temperaturas muito baixas é que a energia que é fornecida a um sólido para elevar a sua
temperatura ligeiramente acima do zero absoluto não é suficiente para excitar os átomos para o
primeiro estado excitado de oscilação. Para tal, é necessário fornecer a um átomo uma energia
igual ou superior ao limiar h̄ω. Ora, a baixas temperaturas esta energia não está disponı́vel. Assim,
a temperatura do sólido pode aumentar ligeiramente, sem que a sua energia (isto é, a energia dos
átomos que o constituem) sofra qualquer variação apreciável, resultando, então, em valores muito
reduzidos para a sua capacidade térmica.
Estes resultados estão em melhor acordo com os dados experimentais, apoiando assim as ideias
quânticas de Einstein. No entanto, o comportamento da capacidade térmica para baixas temperaturas [expresso em (4.30)] não verifica a proporcionalidade, verificada experimentalmente, com
o cubo da temperatura.
A origem desta discrepância reside na suposição que os 3N osciladores têm a mesma frequência
ω, ou seja, que são independentes. Se incluirmos a possibilidade de correlação nos movimentos
dos osciladores, isto é, considerando modos colectivos de movimento, esta discrepância é resolvida.
Este é o ponto de partida para o chamado modelo de Debye, mas que já não estudaremos, por
falta de tempo.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• F. J. Blatt, “Modern Physics” (1992), capı́tulo 4 (F5.0 448)
• N. W. Ashcroft e N. D. Mermin, “Solid State Physics” (1976), capı́tulo 23 (F5.0 339)
• C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 5 (F5.0 82)
• J. R. Hall e H. E. Hook, “Solid State Physics” (1974), capı́tulo 2
PROBLEMAS
4.1 De acordo com o princı́pio de equipartição da energia, a capacidade térmica molar de um gás com
moléculas diatómicas deveria ter o valor constante de 7R/2. No entanto, este valor verifica-se
apenas no limite de altas temperaturas, tendo a capacidade térmica dos gases diatómicos um comportamento como o representado esquematicamente na figura junta. Compare o comportamento
da capacidade térmica dos sólidos com o da dos gases diatómicos e diga porque razão esta não é
constante.
CV /R
7/2
5/2
3/2
T
Capı́tulo 5
Metais I: modelos de electrões
livres
No conjunto dos sólidos os metais têm uma importância prática especial. As suas propriedades
tornaram-nos particularmente úteis num grande número de aplicações, ao longo de parte importante da história da humanidade. O estudo dos metais tem pois um grande interesse, na área mais
geral da fı́sica dos sólidos.
Entre as muitas propriedades interessantes dos metais, podemos referir: baixos pontos de
fusão; grandes condutividades eléctricas e térmicas; altas densidades de massa; grande resistência
estrutural; boa reflectividade óptica.
Vamos agora passar à descrição de algumas destas propriedades a partir dos princı́pios da
fı́sica. O facto de os metais conduzirem bem calor e electricidade leva-nos a pensar que alguns
dos electrões dos átomos que os constituem se podem deslocar grandes distâncias no seu interior,
quando comparadas com as distâncias interatómicas tı́picas. Neste capı́tulo, vamos estudar estes
electrões como sendo livres, isto é, supondo que as interacções que sofrem (com outros electrões
de condução e com os iões que formam a rede cristalina) são tais, e de tal forma distribuı́das, que,
em média, se cancelam.
5.1
Introdução
As ligações quı́micas entre dois (ou mais) átomos são estabelecidas por deformação das nuvens
electrónicas desses átomos. Evidentemente, esta deformação é mais pronunciada nos estados
electrónicos mais fracamente ligados a cada um dos átomos, de tal forma que podemos dizer
(cometendo um erro que, na esmagadora maioria das aplicações, é desprezável) que apenas estes
estados participam na ligação. Aos electrões que ocupam estes estados dá-se o nome de electrões
de valência.
Nos metais, a ligação quı́mica envolve normalmente um grande número de átomos (1020 , ou
mais) e esta deformação das camadas exteriores da nuvem electrónica de cada átomo é particularmente pronunciada, ficando distribuı́das por toda a extensão do metal. Os electrões que ocupam
estas camadas podem assim mover-se ao longo de distâncias com ordem de grandeza macroscópica.
Um cristal metálico consiste pois num arranjo periódico de iões positivos, imerso num “gás”
de electrões. Naturalmente, os electrões interagem uns com os outros e com os iões da rede,
mas podemos supôr que as forças que sentem, estando mais ou menos distribuı́das em todas as
direcções, se cancelam globalmente, sendo nula a sua resultante. Esta aproximação, apesar de
claramente grosseira, permite, como veremos, obter alguns resultados em bom acordo com os
factos experimentais, pelo menos a nı́vel qualitativo.
59
60
5.2
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
O modelo de Drude-Lorentz
O modelo de Drude-Lorentz consiste na descrição clássica do gás de electrões livres. Usando a
fı́sica clássica, este gás assemelha-se bastante a um gás perfeito. As diferenças principais residem
na alta densidade (num metal há, tipicamente, 1022 electrões por cm3 ) e no facto de os electrões
se moverem num cristal, podendo sofrer colisões com os iões que formam o cristal.
No modelo de Drude-Lorentz (de facto são dois modelos, mas a única diferença entre eles
consiste apenas num pormenor técnico do tratamento estatı́stico) tratam-se então os electrões
deslocalizados como um gás de electrões livres, em equilı́brio termodinâmico com o ambiente.
Sendo os electrões livres, a sua energia é totalmente cinética. Usando métodos estatı́sticos, podemos calcular a energia total do gás de electrões e a partir daı́ várias propriedades mensuráveis
experimentalmente dos metais, como o calor especı́fico, o módulo de compressibilidade, etc. O
confronto dos resultados que obtivermos com os valores experimentais servirá para a avaliação das
qualidades do modelo.
5.2.1
O calor especı́fico dos metais
No quadro desta descrição dos electrões de condução, a energia de um sólido condutor é
E = Ecr + Ee ,
(5.1)
onde Ecr é a energia do cristal de iões, que pode ser avaliada com os métodos estudados no capı́tulo
anterior, e Ee é a energia do gás de electrões de condução. A energia tem esta expressão simples
porque consideramos os electrões livres e portanto sua energia de interacção com o cristal é uma
constante (que pode não ser considerada), cujo único efeito observável é o de manter o gás de
electrões confinado no interior do metal.
A energia dos electrões de condução é puramente cinética uma vez que se consideram livres. De
acordo com o teorema da equipartição da energia, a energia média de um conjunto de Q electrões
de condução é pois Q × 3 × kB T /2 = 3QkB T /2. Consideremos um sólido com N átomos e seja u
o número de electrões que cada átomo fornece para a ligação quı́mica. Temos então Q = N u e a
energia média da nuvem electrónica fica então
Ee =
3
uN kB T.
2
(5.2)
A energia total da amostra considerada é
3
E = Ecr + uN kB T,
2
(5.3)
3
CV = CVcr + uN kB .
2
(5.4)
e o calor especı́fico do metal vem
Para altas temperaturas, CVcr = 3R, como vimos no capı́tulo anterior. Relembrando que R =
NA kB , resulta
u
(5.5)
CV = 3(1 + )R.
2
Concluı́mos então que, de acordo com este modelo, os metais apresentam um calor especı́fico cujo
valor é igual a 9/2R para os metais monovalentes, 6R para os bivalentes, etc.
Este resultado, o primeiro que obtivemos com este modelo, está em desacordo flagrante com
os resultados experimentais. De facto, o calor especı́fico dos metais tem, a altas temperaturas, o
valor definido pela lei de Dulong e Petit, ou seja, 3R. Veremos mais adiante que esta deficiência
do modelo pode ser resolvida analisando quanticamente as propriedades do gás de electrões.
5.2. O MODELO DE DRUDE-LORENTZ
5.2.2
61
A lei de Ohm
l
i
S
A diferença de potencial entre as extremidades de um condutor é
proporcional à corrente que o atravessa. Este é o enunciado da bem
conhecida lei de Ohm. Consideremos um condutor filiforme com
comprimento l e secção transversal de área S, percorrido por uma
corrente i (ver a figura). A lei de Ohm pode então escrever-se como
∆V = Ri,
(5.6)
onde ∆V é a diferença de potencial entre as extremidades do condutor e R, a chamada resistência
do condutor, é a constante da proporcionalidade referida acima. Multiplicando ambos os membros
de (5.6) por 1/(lS) e notando, por um lado, que o campo eléctrico médio no interior do condutor,
~ tem um módulo dado por E = ∆V /l, e por outro que a densidade de corrente j é, por definição
E,
de corrente, j = i/S, obtemos
~
~j = l E.
(5.7)
SR
À constante σ = l/(SR) dá-se o nome de condutividade (a) . Deduzimos desta maneira a forma
local da lei de Ohm,
~
~j = σ E.
(5.8)
A lei de Ohm tem um aspecto que, à primeira vista, pode parecer perturbador. É que a força
~ onde e é o módulo da carga do electrão;
exercida pelo campo eléctrico sobre os electrões vale −eE,
assim, o lado direito da equação (5.8) é proporcional à força que actua sobre os electrões. Por
outro lado, a densidade de corrente ~j é dada por
~j = ρl h~v i
(5.9)
onde ρl é a densidade de carga livre e h~v i é a velocidade média das cargas, neste caso, dos electrões;
o lado esquerdo de (5.8) é então proporcional à velocidade dos electrões. Mas então a equação
(5.8) traduz uma proporcionalidade entre a velocidade dos electrões e a força que neles actua,
em contradição aparente com o previsto pela segunda lei de Newton(b) (força proporcional à
aceleração).
De facto, esta situação não constitui um paradoxo, e é até relativamente frequente na natureza.
Por exemplo, o movimento de queda de um para-quedista é, segundos após o pára-quedas se abrir,
uniforme (e não uniformemente acelerado) e o valor da velocidade é tanto maior quanto maior for o
peso do para-quedista, ou seja, quanto maior for a força que o impele para o solo. Neste exemplo (e
noutros que poderiam ser citados) está presente, para além da força mais directamente responsável
pelo movimento (a força gravı́tica), uma resistência ao movimento por parte do meio onde ele se
realiza. No caso dos electrões nos condutores esse meio é o cristal. No seu movimento no cristal, os
electrões podem por vezes sofrer colisões com com os iões que o formam, comunicando-lhes parte
da energia cinética que obtiveram pela acção do campo.
Tentemos descrever quantitativamente este processo. Consideremos o movimento dos electrões
que formam o gás em equilı́brio termodinâmico na ausência, para já, de campos eléctricos aplicados.
A uma temperatura T 6= 0, a energia cinética média dos electrões, correspondente ao movimento
caótico de agitação térmica, dada pelo teorema de equipartição da energia de Boltzmann, tem o
valor de ε = 3kB T /2. A média dos módulos das velocidades, hv0 i, dos electrões que compõem a
nuvem condutora nos metais é pois
r
3kB T
hv0 i =
,
(5.10)
me
(a) A condutividade é o inverso da resistividade, e ambos os parâmetros são uma medida da qualidade intrı́nseca
(isto é, independente de factores geométricos) dos materiais como suportes da condução eléctrica. Um material
(como o cobre, por exemplo) com uma elevada condutividade, ou baixa resistividade, é um bom condutor de
electricidade, mesmo que uma amostra concreta desse material (por exemplo, um fio muito longo e/ou muito fino)
apresente um grande valor da resistência eléctrica.
(b) Note-se que, num tratamento clássico como o presente, as leis da mecânica de Newton devem ser consideradas
válidas.
62
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
onde me é a massa electrónica; à temperatura ambiente T ≈ 300 K, hvi ≈ 1, 2 × 105 m/s. O
movimento correspondente à agitação térmica é pois muito rápido. No entanto, o sentido do
movimento de cada electrão é totalmente aleatório e, por isso, a média vectorial das velocidades
dos electrões é nula. Assim, este movimento de agitação térmica não se traduz no estabelecimento
de uma corrente eléctrica mensurável. Esta situação é em tudo análoga à do problema do passeio
aleatório, onde se estuda o movimento de uma partı́cula que sofre uma sucessão de deslocamentos
em direcções aleatórias. O deslocamento médio ao fim de N destes passos é nulo, isto é, o valor
expectável da sua posição ao fim de N passos é igual à posição inicial. Apesar de se verificar
movimento, é igualmente provável o deslocamento em todas as direcções e, portanto, em média,
o valor expectável do deslocamento é nulo.
Vejamos agora o que acontece quando se estabelece um campo eléctrico no interior do condutor.
~ na mesma direcção mas de sentido oposto ao
Cada electrão passa a sentir uma força F~e = −eE,
~
campo eléctrico, e portanto adquire um movimento uniformemente acelerado (com ~a = −eE/m
e ),
mas apenas entre duas colisões sucessivas. Voltando ao problema do passeio aleatório, a situação
agora é análoga a um passeio aleatório em que a direcção de cada passo é, ainda, aleatória, mas
são mais prováveis passos longos numa dada orientação (a do campo) . Seja τ o intervalo de tempo
médio que separa duas colisões de um dado electrão(c) . Em equilı́brio, esta situação é equivalente
aos electrões de condução possuı́rem uma velocidade de condução comum (ver a Figura 5.1). A
E=0
E
deslocamento electrónico
(b)
(a)
Figura 5.1: Esquema do percurso de um electrão. (a) Os electrões apresentam movimentos aleatórios
com velocidade vectorial média nula; (b) sob a acção de um campo eléctrico, os electrões ficam
animados de um movimento uniformemente acelerado entre duas colisões sucessivas, que tendem
a restaurar a aleatoriedade na direcção do vector velocidade. Esta situação é equivalente a um
movimento colectivo com uma velocidade de condução correspondente ao deslocamento electrónico
representado.
velocidade média dos electrões é então
h~v i = h~v0 i +
~
−eE
τ,
me
(5.11)
onde h~v0 i é a velocidade inicial (imediatamente após uma colisão) média. Ora, a velocidade dos
electrões após uma colisão está distribuı́da uniformemente em todos os sentidos, de forma que a
sua média vectorial, h~v0 i, é nula. A velocidade média dos electrões sob a acção do campo eléctrico
é pois
~
−eE
τ.
(5.12)
h~v i =
me
Multiplicando a velocidade média que acabámos de obter pela densidade de carga de condução,
ρl = −ne,
(5.13)
(c) São frequentes as designações de “tempo de relaxação”, “tempo de colisão”, “tempo médio de vida livre”, entre
outras, para o parâmetro τ .
5.2. O MODELO DE DRUDE-LORENTZ
Metal
Li
Na
Cu
Au
n (m−3 )
4,7×1028
2,7×1028
8,5×1028
5,9×1028
63
σ(Ω−1 m−1 )
1,1×107
2,1×107
5,8×107
4,5×107
τ (s)
8,3×10−15
2,8×10−14
2,4×10−14
2,7×10−14
Tabela 5.1: Densidades electrónicas n (em m−3 ) e condutividades eléctricas (em Ω−1 m−1 ) a 295 K
(de Kittel, “Introduction to Solid State Physics”) e tempo de relaxação para o lı́tio, o sódio, o cobre
e o ouro.
onde n é a densidade de electrões de condução, obtemos a densidade de corrente eléctrica,
2
~
~j = ne τ E.
me
(5.14)
Mas esta equação tem a forma da lei de Ohm (5.8), com a condutividade eléctrica dada por
σ=
ne2 τ
.
me
(5.15)
Podemos estimar o tempo de relaxação de um metal usando valores tabelados da condutividade
eléctrica e da densidade electrónica. A Tabela 5.1 apresenta alguns valores.
O tempo de vida livre dos electrões nos metais é, como podemos verificar a partir da Tabela 5.1,
extremamente curto. Durante um intervalo de tempo tão pequeno, a variação no módulo da
velocidade dos electrões provocada pela acção de campos eléctricos tı́picos (de alguns volts por
metro) é, certamente, pequena. Podemos pois considerar que o valor do módulo da velocidade dos
electrões é, em média, o calculado a partir do princı́pio de equipartição da energia, hvi ≈ 105 m/s.
Durante um intervalo de tempo τ ≈ 10−14 s, os electrões percorrem uma distância(d) de cerca de
10−9 m= 10 Å, que é da ordem de grandeza das distâncias interatómicas. Este resultado apoia a
suposição de Drude de que os electrões sofrem colisões com os iões.
De acordo com o princı́pio de equipartição da energia, o valor médio do módulo da velocidade
de agitação térmica, hvi, diminui com a temperatura. Supondo que o caminho médio livre, λ,
não depende fortemente da temperatura, o tempo de relaxação, τ = λ/hvi, deve crescer com
a diminuição da temperatura. Assim, concluı́mos que a condutividade dos metais depende da
temperatura de acordo com
ne2 λ
σ=√
.
(5.16)
3me kT
Ou seja, a condutividade dos metais é maior a baixas temperaturas, o que de facto se verifica
experimentalmente, com a excepção de uma classe importante (em vista das aplicações industriais)
de materiais — os semi-condutores.
Devemos reconhecer agora que este acordo com resultados experimentais é, apenas, qualitativo, já que, para a maioria dos metais, a condutividade depende da temperatura de forma mais
pronunciada do que a patente na Eq. (5.16).
5.2.3
O efeito de Hall
O efeito de Hall consiste no aparecimento de um campo eléctrico transversal num condutor percorrido por corrente numa região onde está definido um campo magnético. É frequentemente usado
para medir a intensidade de campos magnéticos estáticos. Na Figura 5.2 representa-se um circuito
formado com uma placa metálica (à direita na figura), numa região onde está definido um campo
~ perpendicular ao plano da placa condutora. A velocidade dos electrões (oposta ao
magnético B,
(d) Esta
distância tem a designação habitual de “caminho médio livre”.
64
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
i
B
-
FM
v
EH
+
+
+
+
+
+
Figura 5.2: Esquema da montagem usada para demonstrar o efeito de Hall.
T1
T2
T1
+
+
+
T1 > T2
T2
v
ET
-
Figura 5.3: Esquema da montagem para o estabelecimento de um gradiente de temperatura num
~ T , resultante desse gradiente.
metal (esquerda) e o campo eléctrico, E
sentido da corrente) está representada na figura como ~v . Ao moverem-se numa região onde está
definido um campo magnético, os electrões sentem uma força F~M , dada por
~
F~M = −e~v × B,
(5.17)
e como tal, sofrem uma aceleração para a esquerda (na figura), acumulando-se assim carga de
sinal negativo deste lado da placa. Em contrapartida, no lado direito sente-se um defeito de
carga de sinal negativo, ou seja, o lado direito fica carregado positivamente. Em resultado desta
assimetria na distribuição de carga, no interior da placa metálica estabelece-se um campo eléctrico
~ H , chamado campo de Hall. Atinge-se uma situação estacionária quando a força eléctrica,
E
~
~ H , for igual (e, claro, oposta) à força magnética, ou seja quando
FH = −eE
−eEH = −evB.
(5.18)
Usando (5.13), obtemos a condição de estacionaridade
EH = −
1
jB.
ne
(5.19)
A constante −1/(ne) tem o nome de constante de Hall. O seu valor negativo reflecte o facto de os
transportadores de carga nos metais serem electrões, com carga de sinal negativo. É relativamente
simples medir experimentalmente o valor da constante de Hall, e esperaria-se, à luz deste modelo,
obter sempre valores negativos. Ora, estranhamente, alguns metais apresentam valores positivos
para a constante de Hall. Alguns exemplos são os estabelecidos pelo cádmio, o zinco, o berı́lio e
o magnésio.
5.2.4
Efeitos termoeléctricos
Consideremos um metal no qual se estabelece um gradiente de temperatura. Para concretizar
a discussão, imaginemos que aquecemos com uma chama a extremidade de uma barra de cobre,
e mergulhamos a outra num banho gelado (ver a Figura 5.3). Uma vez que os electrões de
condução da extremidade quente têm maior energia cinética do que os da extremidade fria, deve
verificar-se, durante alguns instantes, um fluxo lı́quido de electrões daquela extremidade para esta.
Evidentemente, o acumular de electrões na extremidade fria, com a consequente carga positiva
5.2. O MODELO DE DRUDE-LORENTZ
65
resultante na extremidade quente, define, no interior do metal, um campo eléctrico que contraria
a continuação indefinida deste processo. Atinge-se, então, um estado de equı́librio dinâmico, em
que no interior do metal está definido um campo eléctrico que se manifesta como uma diferença
de potencial entre as duas extremidades, sendo a mais quente a de potencial mais elevado. Este
fenómeno tem o nome de efeito de Seebeck.
Outro efeito termoeléctrico interessante manifesta-se nos pontos de contacto de dois metais com
densidades de electrões de condução diferentes. Numa junção de dois metais diferentes, verifica-se,
naturalmente, um processo de difusão dos electrões de condução do metal com maior concentração
electrónica para o outro. Mas, assim, aquele metal fica com deficiência de electrões, ou seja,
carregado positivamente. Inversamente, o metal que recebe o fluxo electrónico deste processo de
difusão fica carregado negativamente (ver a Figura 5.4). Mais uma vez, o campo eléctrico criado
nA
V
Vc
A
++ − −
+ + − −e
Vc
nB
A
nA > nB
B
Figura 5.4: Potencial de contacto na junção de dois metais com diferentes concentrações electrónicas
nA e nB e gráfico (à direita) do potencial electrostático na zona da junção.
por esta redistribuição de cargas contraria a sua contiuação indefinida, estabelecendo-se um estado
de equilı́brio dinâmico em que o gradiente da concentração electrónica (que favorece a continuação
do processo de difusão) é compensado pelo campo eléctrico resultante. Chama-se potencial de
contacto à diferença de potencial associada a este campo eléctrico. A grandeza do potencial de
contacto depende das concentrações de carga resultantes deste processo de migração electrónica.
Ou seja, o potencial de contacto é tanto maior quantos mais electrões tiverem sido difundidos
do metal com maior concentração electrónica para o outro. Ora, quanto maior a temperatura,
maior a energia cinética média dos electrões de condução, logo, maior o número de electrões com
energia suficiente para ultrapassarem a barreira de potencial na junção. Ou seja, quanto maior a
temperatura, maior o potencial de contacto na junção dos dois metais.
Este efeito é aproveitado para a construcção de termómetros, chamados termómetros de termopar. Um esquema simplificado da construcção destes termómetros encontra-se representado na
Figura 5.5. Basicamente, estes termómetros consistem num circuito constituı́do por dois ramos
de metais diferentes. Nas duas junções (A e B, no esquema da figura) estabelecem-se potenciais
de contacto diferentes se as suas temperaturas forem diferentes. Uma das junções deve ficar a
uma temperatura conhecida, por exemplo, mergulhada numa mistura de água e gelo em equilı́brio
térmico, ao passo que a outra é utilizada como sensor. Fica então definida uma força electromotriz
no circuito, igual à diferença entre os dois potenciais de contacto, que é uma função crescente da
diferença entre as temperaturas das duas junções. Esta força electromotriz é medida usando um
voltı́metro, que interrompe um dos condutores, sendo necessário ter o cuidado, na utilização do
termómetro, de assegurar que as duas junções para a ligação do voltı́metro (indicadas pelas letras
C e D na figura) estão à mesma temperatura, para que se cancelem os seus potenciais de contacto.
A existência do potencial de contacto na junção de dois metais diferentes tem ainda outro
efeito interessante. Quando uma corrente atravessa a junção, as cargas que a compõem sofrem
uma variação de energia, igual ao produto da sua carga pelo valor do potencial de contacto.
VA
B
A
C
V
D
VB
Figura 5.5: Termómetro de termopar. A tensão indicada pelo voltı́metro depende da diferença de
temperatura das duas juções A e B.
66
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
Essa variação de energia, que numa junção é um aumento, na outra uma diminuição de energia, é
fornecida ou absorvida pelo meio ambiente. Este fenómeno tem o nome de efeito de Peltier. Assim,
um circuito constituı́do por dois metais diferentes no qual se estabelece uma corrente, funciona
efectivamente como uma máquina térmica, absorvendo calor numa das junções e libertando-o na
outra.
5.2.5
Balanço do modelo de Drude
Estudámos algumas propriedades dos metais à luz de uma teoria clássica de electrões livres. Muitas
outras caracterı́sticas poderiam ter sido estudadas, por exemplo, a condutividade térmica. Não o
fizemos porque estamos já em condições de avaliar o modelo.
O modelo permite explicar qualitativamente a lei de Ohm e a dependência da condutividade
com a temperatura, bem como alguns efeitos termoeléctricos, nomeadamente o de Seebeck e o de
Peltier, mas falha redondamente no que concerne ao calor especı́fico da nuvem electrónica. Não
consegue descrever o comportamento dos semi-condutores, cuja condutividade aumenta com a
temperatura, em geral. Não consegue, também, dar conta dos valores positivos para o coeficiente
de Hall apresentados por alguns metais, nem justificar fisicamente os valores do livre caminho
médio dos electrões de condução, notoriamente elevados a baixas temperaturas.
Vamos de seguida verificar se é possı́vel resolver estas deficiências do modelo de electrões livres
através de um tratamento quântico dos electrões.
5.3
O modelo de Sommerfeld
O modelo de Drude é uma teoria clássica de electrões livres, isto é, os electrões são tratados como
pequenas esferas rı́gidas idênticas mas distinguı́veis umas das outras. No entanto, apresentando
os electrões um comportamento eminentemente quântico, este tratamento não se pode considerar correcto. Vamos agora estudar o gás de electrões livres usando o formalismo da Mecânica
Quântica. Veremos que as principais diferenças relativamente ao modelo clássico têm origem nas
particularidades estatı́sticas dos objectos quânticos, e, mais em particular, dos fermiões, classe de
partı́culas que engloba os electrões.
A classe dos fermiões é constituı́da pelas partı́culas com momento angular intrı́nseco (ou spin)
semi-inteiro (isto é, 1/2, 3/2, etc.) e que satisfazem o Princı́pio de Exclusão de Pauli, segundo o
qual dois fermiões idênticos não podem ocupar simultaneamente o mesmo estado quântico(e) .
O Princı́pio de Exclusão de Pauli é incompatı́vel com a distribuição de Maxwell-Boltzmann,
verificando-se antes que os fermiões satisfazem uma distribuição diferente (sendo a diferença particularmente notória a baixas temperaturas), com o nome de distribuição de Fermi-Dirac.
5.3.1
Estados electrónicos
Os estados quânticos dos electrões são obtidos resolvendo a equação de Schrödinger independente
do tempo,
h̄2 2
−
∇ φ (~r) + V (~r)φ (~r) = εφ (~r) ,
(5.20)
2m
onde φ (~r) é a parte da função de onda que depende da posição dos electrões, V (~r) é a sua função
~ é o operador
de energia potencial, ε é a energia do estado definido pela função de onda φ e ∇
gradiente, que, como é bem sabido, é dado por
~
∇
∇2
∂
∂
∂
+ ~ey
+ ~ez ,
∂x
∂y
∂z
∂2
∂2
∂2
+ 2 + 2,
2
∂x
∂y
∂z
= ~ex
=
(e) Note-se que se trata aqui de estados quânticos e não de nı́veis de energia. Se dois estados estados quânticos
diferentes apresentam um mesmo valor de energia electrónica, então esse nı́vel pode estar ocupado por dois electrões.
5.3. O MODELO DE SOMMERFELD
67
usando coordenadas cartesianas. Uma vez que neste tratamento os electrões são considerados
livres, a sua energia potencial deve ser constante(f) , e podemos escolhê-la igual a zero. Assim, a
equação (5.20) reduz-se a
h̄2 2
∇ φ (~r) + εφ (~r) = 0.
(5.21)
2m
As soluções desta equação são da forma
~
φ~k (~r) = Aeik·~r ,
(5.22)
onde A é uma constante que é fixada impondo a normalização da função de onda,
Z
Z
~
~
2
∗
dV φ (~r) φ (~r) = |A|
dV e−ik·~r eik·~r
V
V
=
2
|A| V = 1,
de onde resulta, escolhendo A real
1
A= √ .
V
(5.23)
Substituindo (5.22) em (5.21), obtemos a relação entre a energia dos electrões e o seu vector de
onda ~k, ou seja, a chamada relação de dispersão,
ε~k =
h̄2 k 2
.
2m
(5.24)
Comparando esta expressão com a correspondente clássica, ε = p2 /2m, concluı́mos que o momento
de um electrão num estado φ~k é
p~ = h̄~k.
(5.25)
A dependência espacial(g) da função de onda dos electrões é então
1
φp~ = √ ei~p·~r/h̄ .
V
(5.26)
Resolvemos a equação de Schrödinger supondo que os electrões são livres. No entanto, esta
suposição só é válida no interior do metal. Na sua superfı́cie, os electrões sentem uma força, de
natureza electrostática, que os impede de sair. Impomos esta restrição na função de onda dos
electrões através de condições fronteira que esta função deve satisfazer sobre a superfı́cie do metal.
As condições que impomos são as chamadas condições fronteira periódicas, em que se obriga a
função de onda a tomar valores iguais em pontos correspondentes de faces opostas do cristal.
Se o cristal fôr suficientemente volumoso, esperamos que as conclusões a que chegarmos sejam
relativamente independentes das condições fronteira escolhidas. Assim, impomos as seguintes
condições às soluções da equação de Schrödinger(h) (ver Figura 5.6).
1 ~
φ~k (~r) = √ eik·~r
V
=
=
=
1 ~
√ eik·[(x+L)~ex +y~ey +z~ez ]
V
1 i~k·[x~ex +(y+L)~ey +z~ez ]
√ e
V
1 i~k·[x~ex +y~ey +(z+L)~ez ]
√ e
,
V
(f) Ao nı́vel quântico, as forças são sempre conservativas, isto é, podem ser obtidas como o gradiente da energia
potencial. Se a força é nula, a energia potencial é constante
(g) A dependência temporal é, apenas, ξ(t) = exp (−iεt/h̄).
(h) Para simplificar, consideramos o metal com forma cúbica, de aresta L.
68
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
de onde resultam as equações de quantização para o vector de onda, ~k,
kx
=
ky
=
kz
=
2π
n
L
2π
m
L
2π
l,
L
(5.27)
com n, m, l inteiros arbitrários. Só os vectores de onda ~k cujas componentes satisfazem (5.27)
são permitidos para os electrões de condução no metal. Estes vectores definem uma rede cúbica
simples, de parâmetro 2π/L.
z
Lx
U= ∞
L
z
U=0
y
L
x
y
Figura 5.6: Poço de potencial tridimensional. A energia é nula dentro da caixa de dimensões
Lx Ly Lz e infinito fora desta.
Os estados quânticos dos electrões são identificados pelos valores das componentes do vector
de onda ~k, e pela orientação do seu spin, que, neste caso(i) , só pode tomar dois valores, com os
nomes “para cima” (ou up, do inglês) e “para baixo” (ou down). O princı́pio de exclusão de Pauli
proı́be que dois fermiões idênticos ocupem o mesmo estado quântico, de forma que pode haver, no
máximo, dois electrões com o mesmo vector de onda ~k: um com spin up, o outro com spin down.
5.3.2
A densidade de estados electrónicos
Pretendemos agora determinar a densidade de estados electrónicos, isto é, pretendemos determinar
a função g(ε) tal que o número de estados electrónicos com energia compreendida entre ε e ε + dε
seja g(ε)dε. Para tal, começamos por notar que a “relação de dispersão”, ε = ε(k), é isotrópica, isto
é, só depende do módulo do vector de onda; então o número de estados com energia compreendida
entre ε e ε + dε é igual ao existente na camada esférica oca com raios k e k + dk correspondentes
àqueles valores de energia; é agora fácil contar o número destes estados usando as equações de
quantização (5.27). Vejamos, então. O volume da camada esférica oca de raios k e k+dk é 4πk 2 dk;
o número de vectores de onda permitidos presentes nesta porção de espaço-k é aproximadamente
igual à razão entre o seu volume e o volume ocupado por cada modo quântico, que, de acordo com
a Eq. (5.27), é (2π)3 /V , onde V é o volume do cristal; finalmente, para cada vector de onda ~k
há dois estados possı́veis, correspondentes às duas orientações do spin electrónico. O número de
estados electrónicos com energia compreendida entre ε e ε + dε é então
dn
= 2×
= V
(i) Recorde-se
que os electrões têm spin 1/2.
4πk 2 dk
(2π)3 /V
k2
dk.
π2
(5.28)
5.3. O MODELO DE SOMMERFELD
69
A relação de dispersão (ou seja, a relação entre a energia e o vector de onda) é a expressa na
Eq. (5.24), de onde obtemos por diferenciação
dε =
h̄2
k dk.
m
(5.29)
Substituindo em (5.28) resulta
dn =
=
V m
k dε
π 2 h̄2
V √ 3
2m ε dε,
2
π h̄3
(5.30)
onde se usou (5.24) para substituir k. A função densidade de estados é, então,
g(ε) =
5.3.3
V √ 3
2m ε.
π 2 h̄3
(5.31)
O estado fundamental de um gás de fermiões
Vamos agora considerar o gás de fermiões no estado fundamental, isto é, no estado de menor
energia. Antes de começar, é importante desfazer eventuais confusões de nomenclatura. Cada
electrão no gás de fermiões ocupa um dado estado individual, caracterizado por um dado vector
de onda ~k e uma dada orientação de spin, estado esse a que corresponde uma certa energia, ε, do
electrão que o ocupa. O conjunto dos electrões de valência num metal define o gás de fermiões de
condução, gás esse que também é caracterizado por estados, mas que são agora estados colectivos,
no sentido em que as suas propriedades se podem determinar a partir das dos estados individuais
ocupados por cada um dos electrões que formam o gás.
O estado fundamental do gás de electrões é aquele que, de entre todos os estados possı́veis,
apresenta o menor valor para a energia. Logo, neste estado, todos os electrões que formam a
nuvem de condução devem ocupar estados individuais com uma energia o menor possı́vel. Do
ponto de vista clássico, estes estados são aqueles em que os electrões se encontram imóveis e,
portanto, apresentam o valor mı́nimo para a sua energia cinética (ou seja, zero. No entanto,
quanticamente esta situação é impossı́vel. Com efeito, estando todos os electrões imóveis, todos
apresentam vector de onda ~k = 0. Ora, já notámos que o princı́pio de exclusão de Pauli não
permite mais do que dois electrões com o mesmo vector de onda, cada um com sua orientação de
spin. O quadro clássico para o estado fundamental de um gás de electrões é pois, à luz da mecânica
quântica, uma impossibilidade. Sendo assim, o estado fundamental de um gás de fermiões deve
ser construido ocupando, com os electrões de condução, estados quânticos individuais de energias
progressivamente mais elevadas, começando pelos de menor energia, até que todos os electrões de
condução estejam desta forma “estacionados”. Uma vez que a energia dos estados electrónicos
depende apenas do módulo do vector de onda, devemos, nesta construção, preencher primeiro
estados caracterizados por vectores de onda de módulo menor.
O conjunto dos estados electrónicos ocupados no estado fundamental de um gás de electrões
define, no espaço-k, uma região com a forma de uma esfera: todos os estados electrónicos com
módulo do vector de onda menor que um certo limiar kF estão ocupados; os restantes, com
k > kF , apresentam-se desocupados. A esta esfera, que representa o estado fundamental de um
gás de fermiões (neste caso, electrões de condução num metal), dá-se o nome de esfera de Fermi ;
chama-se energia de Fermi ao valor da energia dos electrões que ocupam estados na superfı́cie da
esfera de Fermi, e, evidentemente, relaciona-se com o raio de Fermi através de
εF =
h̄2 2
k ;
2m F
(5.32)
define-se ainda a temperatura de Fermi, através de TF = εF /kB , onde kB é a constante de Boltzmann, como sendo o valor da temperatura necessário para que um número apreciável de fermiões
adquiram uma energia cinética comparável com a energia de Fermi.
70
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
Elemento
Li
Na
Cu
Au
n(m−3 )
4,68×1028
2,64×1028
8,40×1028
5,90×1028
εF (eV)
4,74
3,24
7,00
5,53
TF (K)
5,51×104
3,77×104
8,16×104
6,42×104
kF (m−1 )
1,12×1010
0,92×1010
1,36×1010
1,21×1010
vF (m/s)
1,29×106
1,07×106
1,57×106
1,40×106
Tabela 5.2: Valores das grandezas “de Fermi” para alguns elementos.
Os valores destas grandezas, que caracterizam o estado fundamental de um gás de electrões,
podem ser todos calculados a partir do valor da densidade electrónica de condução, que, por seu
turno, é facilmente estimável em situações concretas. O cálculo destas quantidades parte do facto
de que o número de estados electrónicos no interior da esfera de Fermi é, por construção, igual
ao número total de electrões de condução, N , presentes no metal. Usando a função densidade de
estados, obtida na subsecção anterior, esta igualdade traduz-se por
Z εF
dε g(ε),
(5.33)
N=
0
já que no lado esquerdo temos o número total de electrões e, à direita, o número total de estados
electrónicos ocupados. Substituindo na Eq. (5.33) o resultado da Eq. (5.31), obtemos
N
n≡
V
√
=
=
Z
√
2m3 εF
dε ε
3
2
π h̄
0
p
3
2 2m ε3F
,
3 π 2 h̄3
(5.34)
onde se representou por n a densidade electrónica. Desta equação, podemos determinar o valor da
energia de Fermi (supondo conhecido o valor da densidade electrónica), a partir do qual se calcula
facilmente o valor de kF , TF , etc. Para a maioria dos metais, a energia de Fermi apresenta valores
de cerca de alguns eV(j) .
O estado fundamental do gás de electrões de condução só pode ser produzido experimentalmente a uma temperatura de zero Kelvin (ou muito próxima deste limite) uma vez que, a temperaturas mais elevadas a agitação térmica dos átomos pode comunicar energia à nuvem electrónica,
excitando alguns electrões para fora da esfera de Fermi.
5.3.4
O gás de electrões de condução à temperatura ambiente
O estado fundamental do gás de electrões que acabámos de descrever só pode ser produzido à
temperatura de zero kelvin uma vez que, a temperaturas mais elevadas, os átomos do sólido estão
animados de movimentos de vibração que podem, através de colisões, excitar alguns electrões para
fora da esfera de Fermi. A uma temperatura T , a energia disponı́vel para, deste modo, excitar
electrões é da ordem de grandeza da energia dos movimentos atómicos que, sabêmo-lo já, é de
cerca de kB T , de acordo com o princı́pio de equipartição de energia. À temperatura ambiente,
T ' 300 K e kB T ' 0,03 eV, ou seja, cem vezes menos do que os valores tı́picos da energia de
Fermi, como se pode constatar de uma leitura da Tabela 5.2. Mas, se assim é, apenas aqueles
electrões que ocupam estados muito próximos da superfı́cie de Fermi (aqueles cuja energia difere de
εF por menos do que kB T ) podem ser excitados, já que os restantes (profundamente “enterrados”
na esfera de Fermi) iriam, após a excitação, ocupar estados já ocupados, o que é impossı́vel nos
termos do princı́pio de exclusão de Pauli. À temperatura ambiente, a configuração da nuvem
electrónica no espaço-k consiste ainda numa esfera (como a 0 K), mas que apresenta um ligeiro
(j) 1 eV (lê-se electrão-Volt) é a energia adquirida por um electrão acelerado por uma diferença de potencial de
1V, ou seja, 1 eV' 1, 6 × 10−19 J.
5.3. O MODELO DE SOMMERFELD
71
“esboroamento” da sua superfı́cie, sendo possı́vel encontrar estados desocupados no seu interior e,
em igual número, estados ocupados no exterior.
Este facto marca a principal diferença relativamente ao tratamento clássico da nuvem electrónica, e iremos mais adiante abordar as suas consequências.
5.3.5
A distribuição de Fermi-Dirac
À temperatura de zero Kelvin, todos os estados electrónicos com energia inferior ou igual à energia
de Fermi estão ocupados. A probabilidade para que um estado de energia ε esteja ocupado é então,
para T = 0 K e à parte uma constante de normalização,
½
1,
se ε ≤ εF
fT =0 K (ε) =
(5.35)
0,
se ε > εF .
À temperatura ambiente, em contrapartida, da discussão precedente concluı́mos que quase todos os
estados quânticos com energia baixa (quando comparada com a do nı́vel de Fermi) estão ocupados;
a fracção de estados ocupados só decresce sensivelmente em nı́veis com energia muito próxima de
εF , numa região com largura aproximadamente igual a kB T . Pode mostrar-se (mas não o faremos
aqui) que a função que descreve esta situação é a chamada função de distribuição de Fermi-Dirac,
fT (ε) =
1
e(ε−µ)/kB T
+1
,
(5.36)
onde µ é o potencial quı́mico do sistema. O limite da distribuição de Fermi-Dirac quando T → 0
deve ser a expressão (5.35), e podemos então concluir que
lim µ = εF .
(5.37)
T →0
Quando a temperatura sobe, o valor do potencial quı́mico decresce ligeiramente; mas, mesmo à
temperatura ambiente, o seu valor mantém-se muito aproximadamente igual ao da energia de
Fermi. Por esta razão, não é, frequentemente, feita qualquer distinção entre os dois.
Na Figura 5.7 está representada a forma da função de distribuição de Fermi-Dirac para T = 0 K
e para temperaturas não nulas.
1
6000
3000
600
0
K
K
K
K
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
Figura 5.7: Gráfico da função de distribuição de Fermi-Dirac, para T = 600 K (a tracejado), T =
3000 K (a pontilhado) e T = 6000 K (a cheio). O valor da energia de Fermi usado neste exemplo foi
de εF = 5 eV.
O facto de apenas alguns electrões serem excitados quando, partindo do estado fundamental, se
aquece o gás de electrões de condução até à temperatura ambiente, tem, como deve ser evidente,
72
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
f(ε) g(ε)
T=0K
f(ε) g(ε)
T=0K
T>0K
0
ε
F
ε
0
ε
F
ε
Figura 5.8: Distribuição energética dos electrões à temperatura do zero absoluto (esquerda) e a uma
temperatura elevada (à direita).
um efeito determinante sobre o calor especı́fico da nuvem electrónica. Com efeito, a energia
total (da nuvem electrónica) não deve, neste aquecimento, aumentar tanto quanto o previsto
usando o tratamento clássico, baseado na função de distribuição de Maxwell-Boltzmann. O número
de electrões que ocupam estados excitados à temperatura ambiente representa uma fracção tão
pequena do total, que a energia do gás de electrões de condução difere muito pouco da do estado
fundamental do gás. A contribuição principal para o calor especı́fico dos metais a temperaturas
não excessivamente altas é então a fornecida pela rede de iões e portanto verifica-se, mesmo para
metais, a lei de Dulong e Petit.
No estado fundamental do gás de electrões, todos os estados electrónicos com energia menor do
que a energia de Fermi estão ocupados, e todos os que têm energia superior à energia de Fermi estão
desocupados. A distribuição energética dos electrões é então determinada apenas pela densidade
de estados electrónicos: para energia inferiores à energia de Fermi a distribuição de energias é
igual à densidade de estados, para energias superiores, anula-se. Esta situação é representada na
Figura 5.8, à esquerda. A uma temperatura finita, os electrões próximos da superfı́cie de Fermi
podem sofrer excitações, ficando então alguns estados desocupados abaixo do nı́vel de Fermi, e
alguns estados ocupados com energia superior à energia de Fermi (ver a Figura 5.8, à direita).
5.3.6
A condutividade eléctrica
Como acabámos de discutir, os electrões mais profundamente “enterrados” na esfera de Fermi
estão congelados, no sentido em que não podem, à temperatura ambiente, sofrer excitações de
origem térmica. Vimos que, por esta razão, a nuvem electrónica contribui muito pouco para o
calor especı́fico dos metais.
Poder-se-ia pensar que este “congelamento” impede também a nuvem electrónica de contribuir
para a condutividade eléctrica, já que, também aqui, é necessário que pelo menos alguns electrões
sejam excitados. Com efeito, na ausência de campos eléctricos externos e no estado fundamental, a
distribuição das velocidades electrónicas tem simetria esférica, ou seja, dado um qualquer electrão
com velocidade ~v (vector de onda ~k), existe outro com velocidade −~v (vector de onda −~k) cuja
contribuição para a corrente eléctrica anula a do primeiro. Como, no estado fundamental, todos
os electrões estão desta forma “emparelhados”, a corrente total é nula. Para que se verifique
condução eléctrica é pois necessário que (pelo menos) alguns electrões sofram uma transição para
um estado “desemparelhado”, no exterior da esfera de Fermi. Como o número de electrões em
estados com energia acima da do nı́vel de Fermi aumenta com a temperatura, poderı́amos pensar
que também a condutividade eléctrica dos metais seria maior a temperaturas maiores, tomando
valores muito baixos para temperaturas próximas do zero absoluto. Ora, esta conjectura contraria
flagrantemente os dados experimentais. A condutividade dos metais é, regra geral, uma função
decrescente da temperatura.
Na discussão acima, cometemos o erro de supor que a população electrónica dos estados exteriores à esfera de Fermi tem apenas origem térmica, isto é, que apenas por absorção de energia
vibracional da rede cristalina se podem promover transições electrónicas. Isto é evidentemente
5.3. O MODELO DE SOMMERFELD
73
errado! São possı́veis trocas de energia com um campo eléctrico externo, que contribuem determinantemente para a população de electrões em estados “desemparelhados”. Um campo eléctrico
externo muda o estado de todos os electrões na nuvem de condução, comunicando-lhes uma aceleração oposta à direcção do campo (recordemos que a carga dos electrões é negativa). Este efeito,
conjugado com a possibilidade de colisões com a rede cristalina, com defeitos, com fonões, tem
como resultado que cada electrão atinge uma velocidade limite, e a diferença (vectorial) entre este
limite e a velocidade inicial é a mesma para todos os electrões. Dada a relação entre as velocidades
~v e os vectores de onda ~k dos electrões, tudo se passa como se a esfera de Fermi, inicialmente centrada na origem do espaço-k, sofresse um deslocamento ~δ na direcção oposta à do campo aplicado
(ver a Figura 5.9).
ky
ky
kx
kx
E
Figura 5.9: À esquerda, a esfera de Fermi na ausência de campo eléctrico. Os estados ocupados
(zona sombreada) apresentam, no espaço-k simetria esférica e portanto a velocidade média, tomada
para todos os electrões, é nula. À direita, a esfera de Fermi quando se aplica um campo eléctrico. O
conjunto dos estados presentes na zona cinzento-claro apresenta um valor médio da velocidade nulo;
os estados na região indicada a cinzento-escuro, que também estão ocupados, contribuem todos para
a corrente eléctrica.
Se designarmos por τ o tempo médio de colisão, cada electrão vai sofrer uma modificação na
(k)
~
~ e uma
sua velocidade de cerca de −eτ E/m
, uma variação de momento (~
p = m~v ) de −eEτ
~
~
variação de vector de onda (k = p~/h̄) de −eEτ /h̄, que deve agora ser o valor médio do vector de
onda. Uma vez que todos os electrões vão sofrer esta transição de estado, o princı́pio de exclusão
de Pauli não se aplica.
~ A densidade
A média das velocidades dos electrões deve agora ser h~v i = h̄/mh~ki = −eτ /mE.
~
de corrente, j = ρh~v i = −neh~v i, vem então
2
~
~j = ne τ E,
m
onde n é o número de electrões de condução por unidade de volume. Comparando esta expressão
~ obtemos a forma da condutividade eléctrica:
com a da lei de Ohm (~j = σ E),
σ=
ne2 τ
.
m
Este foi o resultado obtido no estudo clássico (ver a Secção 5.2.2). Apesar das diferenças importantes entre as duas abordagens ao problema da condução eléctrica, a expressão da condutividade
como função das caracterı́sticas do material em que se processa, apresenta a mesma forma nas
descrições clássica e quântica.
O livre caminho médio dos electrões de condução pode ser obtido multiplicando o módulo da
sua velocidade pelo tempo médio de colisão. Por exemplo, para o cobre, σ = 5, 8 × 107 Ω− 1 m− 1
e n = 8, 4 × 102 8 m− 3, de onde resulta τ = 2, 5 × 10−14 s. A velocidade dos electrões que ocupam
(k) Esta expressão é simplesmente a que resulta do estudo do movimento uniformemente acelerado de uma partı́cula
~ durante um intervalo de tempo τ .
de massa m, sob a acção de uma força constante −eE,
74
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
estados no nı́vel de Fermi pode ser calculada a partir da densidade electrónica, n, obtendo-se
vF = 1, 6 × 106 m/s. O livre caminho médio para um electrão no nı́vel de Fermi de um cristal de
cobre é então λ ≈ 390 Å, ou seja, cerca de 100 vezes as distâncias interatómicas tı́picas!
Vemos assim que o problema do livre caminho médio de que enfermava o modelo clássico de
electrões livres não é eliminado nesta descrição quântica. De facto, este problema não é eliminado
senão quando se consideram as interacções dos electrões de condução com a rede cristalina.
5.4
Crı́tica dos modelos de electrões livres
Tanto o modelo clássico de Drude como o modelo quântico de Sommerfeld apresentam graves
deficiências. À parte a questão do calor especı́fico dos metais (e algumas outras propriedades que
não abordámos), os dois modelos apresentam inconvenientes semelhantes, alguns dos quais são:
(a) Não fornecem explicação para a existência de metais com coeficientes de Hall positivos;
(b) não descrevem correctamente a dependência da condutividade com a temperatura. Em
particular, o caso de certos materiais cuja condutividade aumenta com a temperatura, em
certos intervalos de temperatura;
(c) nalguns condutores, a condutividade depende da orientação do campo eléctrico, facto incompreensı́vel numa teoria de electrões livres;
(d) Os modelos de electrões livres não respondem à pergunta mais imediata: Porque é que alguns
sólidos são condutores e outros não?
Para responder a este e outros problemas, teremos que considerar as interacções entre os
electrões de condução e a rede cristalina. De facto, os electrões nos sólidos não são livres e esperar
que um modelo que os trate como tal seja capaz de descrever com exactidão todas as propriedades
electromagnéticas dos sólido é certamente optimismo em demasia.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulos 1, 2 e 3 (F5.0/339)
• C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 6 (F5.0/82)
• Blakemore, “Solid State Physics” (1985), secções 3.1, 3.2, 3.3 (F5.0/181)
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter”, (1989) secção 12.3
(F5.0/437)
PROBLEMAS
5.1 Relacione a probabilidade de colisão por unidade de tempo, γ, com o tempo médio de colisão τ .
5.2 Prove, a partir da definição de densidade de corrente, ~j = ρl~v , que a corrente total que passa
através de uma superfı́cie S é igual ao fluxo de ~j através de S,
Z
~j · n̂dS,
i=
S
onde n̂ é um vector unitário que, em cada ponto da superfı́cie S, lhe é perpendicular.
5.3 Relacione kF com ²F com pF .
5. Problemas
5.4 Calcule a energia do estado fundamental de um gás de fermiões com N partı́culas ocupando um
volume V .
5.5 Escreva a expressão da energia de um gás de fermiões num estado arbitrário.
5.6 A resposta ao Problema 4 é E = 3/5 N ²F onde N é o número total de fermiões no gás e ²F é
energia de Fermi. Obtenha a expressão da pressão do gás de fermiões (p = ∂E/∂V ) e do módulo
de compressibilidade (B = −V ∂p/∂V ) de um gás de fermiões no estado fundamental.
5.7 O lı́tio tem condutividade eléctrica de σ =1,05×107 Ω−1 m−1 e uma densidade atómica de
4,80×1028 átomos por metro cúbico.
(a) Determine a velocidade de condução média dos electrões no metal quando se aplica um
campo eléctrico de 100 V/m, e compare o valor obtido com a velocidade dos electrões no
nı́vel de Fermi.
(b) Determine a velocidade dos electrões cuja energia é igual à energia média dos electrões no
cristal, segundo o modelo de Sommerfeld.
(c) Determine a velocidade média dos electrões à temperatura de 300 K, segundo o modelo de
Drude-Lorentz.
5.8 O sódio tem densidade de ρ =0,97×103 kg/m3 , uma massa atómica relativa de 23 e condutividade
eléctrica de 2, 1 × 107 Ω−1 m−1 . Determine a mobilidade dos electrões no sódio.
5.9 A densidade do bário é de 3, 5 × 103 kg/m3 e a massa atómica relativa é 137. Sabendo que este
elemento tem dois electrões de valência, determine o raio da esfera de Fermi e o valor da energia
de Fermi correspondente.
5.10 A grafite é um cristal laminar em que os átomos de carbono estão distribuı́dos (para uma determinada camada) nos vértices de hexágonos regulares de lado d = 1, 42 Å, que se encaixam entre
si. Os electrões de valência da grafite, à razão de um electrão por átomo, podem mover-se basicamente no dito espaço bidimensional. Suponha que estes electrões são livres. Usando o modelo
de Sommerfeld para estas camadas bidimensionais, determine:
(a) a densidade electrónica;
(b) a densidade de estados, g(ε);
(c) a energia de Fermi;
(d) a energia espectável dos electrões à temperatura de zero Kelvin.
5.11 O estrôncio tem uma estrutura cúbica de faces centradas de aresta a = 6, 08 Å.
(a) Usando o modelo de electrões livres de Sommerfeld determine o raio da esfera de Fermi no
zero absoluto.
(b) Determine a velocidade de um electrão com energia Fermi à temperatura de 0◦ , 30◦ e 300◦
Kelvin. Comente os resultados.
(c) Determine a velocidade média de condução dos electrões quando sujeitos a um campo
eléctrico de 2,5 V/cm, sabendo que a condutividade eléctrica do estrôncio a 20◦ C é de
1, 66 × 105 Ω−1 m−1 .
75
Capı́tulo 6
Metais II: Teoria de bandas
Deve ser evidente que alguns inconvenientes (de entre os que foram apresentados no final do
capı́tulo anterior) das teorias de electrões livres têm origem exactamente no facto de se considerarem os electrões “desligados” de quaisquer interacções com o meio onde se deslocam. Por exemplo,
o facto de a condutividade da grafite depender da direcção da corrente mostra bem que deve existir alguma interacção entre os electrões e o cristal, que torna mais fácil o movimento em certas
direcções que noutras. É também evidente que uma teoria de electrões livres só se pode aplicar
a condutores, sendo portanto incapaz de explicar a razão de alguns sólidos o serem e outros não.
Estas considerações são evidentes e poderiam ter sido feitas ainda antes de termos desenvolvido
a teoria de electrões livres. Parece então natural que um modelo que tenha em linha de conta
a influência do meio cristalino sobre os electrões possa resolver estas dificuldades. A teoria que
vamos passar a descrever, não só clarifica estas questões, como explica as restantes, discutidas no
Capı́tulo anterior, como os elevados valores do livre caminho médio a baixa temperatura ou as colocadas pela existência de sólidos cuja condutividade aumenta com a temperatura, que apresentam
coeficientes de Hall positivos, etc.
6.1
Introdução
Nesta nova abordagem continuaremos a desprezar as interacções electrão-electrão. A razão principal para esta aproximação é a complexidade da teoria completa, que torna impraticável a sua
resolução sem recorrer aos métodos, aproximados, da teoria quântica de muitos corpos. Com
efeito, o problema é o seguinte: queremos determinar a função de onda dos electrões, resolvendo
a Equação de Schrödinger. Mas antes temos que determinar o potencial a que os electrões estão
sujeitos. Ora, considerando interacções electrão-electrão, só podemos conhecer o potencial depois
de conhecida a função de onda do sistema, justamente o que se pretendia obter com a resolução
da Equação de Schrödinger. Considerando, além disso, que a função de onda deve depender das
3N coordenadas de posição dos N electrões, sendo N da ordem de 1020 , fica-se com uma ideia
da complexidade do problema. Felizmente, o modelo que iremos desenvolver é notavelmente preciso, demonstrando-se assim, a posteriori, que as interacções electrão-electrão são, de facto, pouco
significativas na maior parte das aplicações(a) .
Não considerando as interacções electrão-electrão, apenas as interacções com a rede cristalina
contribuem para a energia potencial dos electrões. Cada electrão move-se numa região onde está
definida uma função de potencial independente dos restantes electrões. A este tipo de aproximação
para sistemas de muitos corpos dá-se o nome de aproximação de partı́cula única, ou de partı́culas
independentes.
Uma vez que a rede cristalina é, em primeira aproximação, um arranjo periódico tridimensional
de átomos, o potencial electrónico por ela estabelecido também deve ser periódico, com a mesma
periodicidade da rede. Uma vez que a força entre cargas de sinal contrário (os electrões e os
(a) Uma
excepção importante desta afirmação é o caso da supercondutividade.
77
78
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
iões que formam a rede) é atractiva, o potencial electrónico deve apresentar mı́nimos nas posições
ocupadas pelos iões, como se mostra na Figura 6.1, numa representação unidimensional.
V(x)
x
a
a
a
Figura 6.1: Exemplo de potencial periódico unidimensional.
A resolução da Equação de Schrödinger com um potencial periódico fica substancialmente
simplificada pelo teorema de Bloch, que demonstramos na secção seguinte. Antes de o fazermos,
podemos estudar de forma qualitativa a deformação das orbitais atómicas quando aproximamos
vários átomos uns dos outros. Quando os átomos estão afastados uns dos outros, os electrões
atómicos praticamente não sentem interacções senão com o átomo a que pertencem, e portanto
as orbitais são essencialmente as previstas pela fı́sica atómica: um conjunto de nı́veis energéticos
designados pelos sı́mbolos 1s, 2s, 2p, etc(b) . Um esquema destes nı́veis está representado na
Figura 6.2. Se aproximarmos deste átomo um outro, idêntico, cada um destes nı́veis subdivideE
V(x)
2p
2s
1s
x
Figura 6.2: Nı́veis de energia atómicos.
se em dois, sendo a separação tanto maior quanto maior for a energia do nı́vel original (ver
Figura 6.3). Se aproximarmos 3 átomos cada nı́vel subdivide-se em 3 e assim sucessivamente. Se
considerarmos agora um cristal, que consiste num número elevado de átomos na vizinhança uns dos
outros, cada nı́vel atómico subdivide-se em tantos subnı́veis quantos forem os átomos que formam
o cristal. Estes subnı́veis estão tão próximos (em termos energéticos) uns dos outros que não é
possı́vel detectar a sua separação. Cada nı́vel subdivide-se então um número enorme de vezes,
criando assim uma banda de energias permitidas, como mostra a Figura 6.4. Este desdobramento
dos nı́veis atómicos pode ser ilustrado usando a teoria da perturbações. Outra alternativa é a
resolução da Equação de Schrödinger numericamente (usando métodos que estão descritos em
qualquer livro de análise numérica) para uma partı́cula com uma energia potencial com uma série
de mı́nimos dispostos contiguamente.
É importante notar que neste desdobramento das orbitais atómicas não varia o número total
de estados electrónicos. Com efeito, quando se aproximam dois átomos da mesma espécie quı́mica,
cada orbital atómica divide-se em duas orbitais moleculares, mas inicialmente temos dois átomos,
cada qual com o seu conjunto de orbitais atómicas, e no fim temos apenas uma molécula. As
(b) Usou-se a notação espectroscópica (a mais habitual) para indicar os estados electrónicos. O número inteiro
representa o número quântico principal; a letra que o segue representa o momento angular, de acordo com s → l = 0;
p → l = 1; d → l = 2; etc. Assim, o estado 2p é o estado com número quântico principal n = 2 e número quântico
de momento angular l = 1.
6.2. O TEOREMA DE BLOCH
79
E
V(x)
2p
2s
1s
Figura 6.3: Nı́veis de energia numa molécula biatómica.
E
V(x)
2p
2s
1s
Figura 6.4: Bandas de energia num cristal.
duas orbitais moleculares correspondentes a cada nı́vel atómico podem ver-se como combinações
lineares das duas orbitais atómicas (uma de cada átomo) que as originam.
Na Figura 6.4, os electrões que ocupam as bandas 1s e 2s estão localizados na proximidade dos
átomos a que pertencem, porque as suas energias não são suficientes para ultrapassar as barreiras
de potencial entre os átomos (estamos a desprezar a possibilidade de efeito de túnel). Os electrões
da banda 2p podem mover-se ao longo do cristal, mas não se deve pensar por isso que estão livres
de forças; uma partı́cula livre pode ter qualquer energia(c) , ao passo que estes electrões têm uma
energia que deve estar compreendida entre os limites da banda a que pertencem. Um análogo
clássico do movimento destes electrões consiste numa esfera movendo-se num terreno ondulado,
com energia suficiente para vencer a altura das ondulações do terreno.
No estado fundamental (à temperatura de 0 K), somente as bandas de menor energia estão
ocupadas pelos electrões; destas, a de maior energia tem particular importância para o estudo das
propriedades dos sólidos, e designa-se por banda de valência do sólido. Esta designação é herdada
do nome da orbital atómica (chamada orbital de valência) que lhe dá origem.
Vamos agora estudar as propriedades das funções de onda de electrões que se movem num
potencial periódico.
6.2
O teorema de Bloch
Já referimos que a função energia potencial dos electrões, sendo resultante da sua interacção com
o meio cristalino, deve ser uma função periódica do espaço, com o mesmo perı́odo do cristal. A
Equação de Schrödinger independente do tempo é então
−
h̄2 ~ 2
∇ ψ(~r) + V (~r)ψ(~r) = εψ(~r),
2m
(6.1)
(c) Descontando o efeito de quantizações resultantes da imposição de condições fronteira que, de resto, é insignificante, neste contexto.
80
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
onde V (~r) é uma função periódica com a periodicidade da rede cristalina. O teorema de Bloch
afirma que as soluções da Eq. (6.1) têm a forma(d)
~
ψ~k (~r) = eik·~r u~k (~r),
(6.2)
onde u~k (~r) é uma função periódica do cristal, isto é, que verifica
~ = u~ (~r),
u~k (~r + R)
k
(6.3)
~ Um enunciado equivalente do teorema de Bloch é
qualquer que seja o vector da rede cristalina R.
o seguinte: as soluções da Equação de Schrödinger para potenciais cristalinos verificam a condição
~ ~
~ = eik·R ψ~ (~r),
ψ~k (~r + R)
k
(6.4)
~ É evidente que funções com a forma definida na
qualquer que seja o vector da rede cristalina R.
Eq. (6.2) gozam desta propriedade. Com efeito,
~
ψ~k (~r + R)
=
~
~ ~
~
~ ~
~
eik·~r eik·R u~k (~r + R)
=
eik·~r eik·R u~k (~r)
=
eik·R ψ~k (~r).
~ ~
Para demonstrar a implicação inversa, notamos que é possı́vel escrever qualquer função (e, portanto, também as soluções da Equação de Schrödinger) na forma
~
ψ~k (~r) = eik·~r f (~r),
desde que se escolha convenientemente a função f (~r). Mas então
~
~
~ + ~r) = eik·(R+~r) f (R
~ + ~r).
ψ~k (R
(6.5)
Por outro lado, aceitando a propriedade enunciada na Eq. (6.4), temos
~ + ~r) =
ψ~k (R
=
=
~ ~
eik·R ψ~k (~r)
~ ~
~
eik·R eik·~r f (~r)
e
~ r)
i~
k·(R+~
f (~r).
(6.6)
(6.7)
~ = f (~r), qualquer que seja o vector da
Comparando as eqs. (6.5) e (6.7) concluı́mos que f (~r + R)
~ ou seja, que f apresenta a periodicidade da rede cristalina exigida na Eq. (6.3).
rede cristalina R,
Agora que demonstrámos a equivalência dos dois enunciados do Teorema de Bloch, vamos
passar à sua demonstração. Dada a periodicidade do arranjo atómico nos cristais (ideais), todas
as funções da posição fisicamente observáveis devem apresentar a mesma periodicidade. A função
de onda dos electrões não é uma função fisicamente observável, e por isso não é, necessariamente,
~ um vector da rede cristalina, não podemos garantir a
uma função periódica. Assim, sendo R
~ = ψ(~r); podemos é, sem qualquer perda de generalidade, escrever
igualdade ψ(~r + R)
~ = s(R)ψ(~
~
ψ(~r + R)
r),
(6.8)
~ Em contrapartida, o quadrado do módulo da função
escolhendo cuidadosamente a função s(R).
de onda é, de acordo com a interpretação de Max Born, igual à densidade de probabilidade de
presença do electrão, ou seja, é uma função fisicamente observável. Logo, de acordo com o que se
(d)~
k
é um parâmetro vectorial que identifica o estado electrónico. Ao contrário do parâmetro ~k que identifica os
estados de electrões livres que temos estudado até agora, este não é proporcional ao momento linear dos electrões
de Bloch.
6.2. O TEOREMA DE BLOCH
81
disse acima, deve ser uma função periódica da posição com a periodicidade da rede, isto é, deve
verificar(e)
~
~ = ψ ∗ (~r)ψ(~r).
ψ ∗ (~r + R)ψ(~
r + R)
(6.9)
Substituindo aqui a Eq. (6.8), resulta que o quadrado do módulo da função s é unitário, qualquer
~ Logo, esta função tem necessariamente a forma
que seja o vector de rede R.
~
~ = eiχ(R) ,
s(R)
~ é alguma função escalar real de R.
~ Tomando então o caso particular R
~ = ~a, onde ~a é
onde χ(R)
um dos vectors fundamentais da rede cristalina, temos
ψ(~r + ~a) = eiχ(~a) ψ(~r).
Da mesma maneira,
ψ(~r + 2~a)
= ψ(~r + ~a + ~a)
= eiχ(~a) ψ(~r + ~a)
= e2iχ(~a) ψ(~r)
ou seja ainda, com n inteiro arbitrário,
ψ(~r + n~a) = einχ(~a) ψ(~r).
Considerando agora deslocamentos nas direcções dos outros vectores fundamentais (~b e ~c), e repetindo os mesmos argumentos que se aplicaram até agora, podemos concluir que a relação entre os
valores da função de onda em pontos equivalentes do cristal é
~
~ = ei[hχ(~a)+kχ(b)+lχ(~c)] ψ(~r),
ψ(~r + R)
(6.10)
~ isto é, se tem
onde os inteiros h, k, l são as componentes cristalográficas do vector de rede R,
~ = h~a + k~b + l~c.
R
Demonstrámos até agora que as soluções da Equação de Schrödinger numa região onde está definido
um potencial cristalino se transformam, sob translacções segundo vectores de rede de acordo com
a Eq. (6.10). Os valores das três quantidades χ(~a), χ(~b), χ(~c) distinguem as diferentes soluções
entre si. Estas três quantidades podem podem ser usadas para definir as componentes de um
vector ~k, através de
~k · ~a =
~k · ~b =
~k · ~c =
χ(~a)
χ(~b)
χ(~c).
~ e a Eq. (6.10) fica
Assim, a soma hχ(~a) + kχ(~b) + lχ(~c) pode escrever-se simplesmente como ~k · R,
~ ~
~ = eik·R ψ(~r),
ψ(~r + R)
(6.11)
em conformidade com o segundo enunciado do teorema de Bloch, concluindo-se assim a sua demonstração.
A forma das funções de onda de electrões que se movem num cristal, apresentada na Eq. (6.2),
~
é a de ondas planas monocromáticas eik·~r , moduladas por funções com a periodicidade cristalina u~k (~r). Na Figura 6.5 apresenta-se um exemplo das funções uk (x) e ψk (x), numa situação
unidimensional.
(e) O
asterisco em ψ ∗ representa o complexo conjugado de ψ.
82
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
uk(x)
-2a
-a
a
2a
a
2a
0
ψk(x)
-2a
-a
0
Figura 6.5: Exemplo de função de Bloch. No gráfico de cima está representada a função moduladora
uk (x), com perı́odo a; no de baixo representa-se a função de onda propriamente dita, ψk (x), (a cheio),
bem como a onda plana modulada exp(ikx) (a tracejado).
6.3
6.3.1
Propriedades dos estados de Bloch
Periodicidade no espaço recı́proco
Como já se disse, as diferentes soluções da Equação de Schrödinger para os electrões num cristal
distinguem-se pela forma como se transformam sob translacções segundo vectores da rede cristalina. Mais concretamente, distinguem-se pelas componentes do vector ~k, de acordo com a Eq. (6.4).
~ onde G
~ é
Consideremos duas soluções particulares caracterizadas pelos vectores ~k e ~k 0 = ~k + G,
um vector da rede recı́proca do cristal qualquer. Segundo o teorema de Bloch, estas duas funções
~ como
de onda transformam-se sob translacções segundo o vector da rede R
~ ~
~
=
ψ~k (~r + R)
eik·R ψ~k (~r)
~
=
ψ~k0 (~r + R)
eik ·R ψ~k0 (~r).
~0 ~
Explicitemos o vector ~k 0 nesta última equação. Resulta então
~ R
~
~ = ei(~k+G)·
ψ~k+G
r + R)
ψ~k+G
r).
~ (~
~ (~
~ ~
Recordemos agora que, por definição de vector da rede recı́proca, se tem que eiG·R = 1, para todos
~ da rede recı́proca e para todos os vectores, R,
~ da rede directa. Então a função
os vectores, G,
tem,
sob
translacções
segundo
vectores
de
rede,
um comportamento idêntico ao
de onda ψ~k+G
~
da função ψ~k ; logo, estas duas funções são indistinguı́veis, ou seja, representam o mesmo estado
electrónico. Para se evitar, no cálculo das propriedades da nuvem electrónica, a contabilização
repetida da contribuição de um dado estado, devemos ter cuidado com este tipo de indistinguibilidade escondida das funções de onda. A forma mais simples de assegurar que não se cometem
erros relacionados com esta questão é considerar apenas vectores ~k pertencentes todos a uma
mesma célula unitária primitiva da rede recı́proca. Como se sabe, é sempre possı́vel escolher para
qualquer rede uma grande diversidade de formas para as células unitária primitivas. Neste caso,
escolhe-se sempre a célula de Wigner-Seitz (ver a Secção 2.2, e a Figura 2.3) da rede recı́proca,
mais usualmente conhecida como primeira zona de Brillouin.
Uma consequência importante da indistinguibilidade de dois estados de Bloch cujos vectores
~k diferem entre si por um vector da rede recı́proca é que todas as propriedades fı́sicas dos estados
electrónicos devem ser funções periódicas de ~k, com a periodicidade da rede recı́proca. Com efeito,
seja X(~k) o valor da propriedade X para um electrão num estado cuja função de onda é ψ~k ; uma
~
vez que o mesmo estado pode ser representado por qualquer das funções ψ~k+G
~ , com G vector
arbitrário da rede recı́proca, o cálculo da propriedade X deve produzir o mesmo valor quando
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
83
realizado a partir de qualquer destas funções, isto é,
~ = X(~k),
X(~k + G)
6.3.2
~ vector da rede recı́proca.
∀G
Nı́veis de energia dos estados de Bloch
Substituindo na Equação de Schrödinger as soluções de Bloch da Eq. (6.2), obtemos a equação
diferencial a satisfazer pelas funções u~k (~r),
−
i2
h̄2 h ~
∇ + i~k u~k (~r) + V (~r)u~k (~r) = ε(~k)u~k (~r).
2m
(6.12)
Esta equação, formalmente semelhante à Equação de Shrödinger, é uma equação de valores
próprios para o operador
i2
h̄2 h ~
∇ + i~k + V (~r),
H~k = −
2m
que depende de um parâmetro vectorial que é o vector ~k. Para cada valor de ~k, este operador deve
apresentar um conjunto de funções próprias, u1~k (~r), u2~k (~r), . . ., un~k (~r), . . ., às quais correspondem
os valores próprios (nı́veis de energia) ε1 (~k), ε2 (~k), . . ., εn (~k), . . ., e tanto aquelas como estes
devem ser funções contı́nuas do parâmetro ~k. Mais ainda, como vimos na Secção 6.3.1, os diversos
nı́veis de energia εn (~k) devem ser funções periódicas de ~k. Ora, funções contı́nuas e periódicas
são necessariamente funções limitadas, pelo que devemos ter cada nı́vel de energia εn (~k) a tomar
valores num intervalo bem limitado de energias. O espectro energético dos electrões num metal
deve pois ter um aspecto que pode, qualitativamente, ser representado como mostra a Figura 6.6.
Chama-se banda ao conjunto de estados electrónicos un~k (~r) para cada valor de n. Nesta figura
ε
n
ε
n
n=3
ε
3k
n=2
ε
2k
n=1
ε
1k
− π /a
(a)
π /a
k
(b)
Figura 6.6: (a) Nı́veis de energia atómicos, resultantes da resolução da Equação de Schrödinger
para um potencial atómico; (b) Bandas de energia dos estados electrónicos de um sólido. As bandas
propriamente ditas são os intervalos representados a sombreado, ao longo do eixo da energia. As
formas apresentadas para as funções εn (~k) são arbitrárias.
apenas estão representados os valores de ~k pertencentes à primeira zona de Brillouin porque, como
já vimos, vectores ~k fora desta região representam estados que já têm correspondência nalgum
vector ~k no seu interior e portanto, neste sentido, são redundantes. Na Figura 6.6 as bandas de
energia estão separadas por um intervalo de energias proibidas: esta situação corresponde ao que
de facto se passa em muitos sólidos, mas é possı́vel (se bem que pouco frequente) que duas bandas
de energia se sobreponham. Ao intervalo de energias proibidas entre duas bandas dá-se o nome
de hiato energético, mas é mais usual a utilização da expressão, “aportuguesada” do inglês, “gap
de energia”.
84
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
Dentro de cada banda, a energia dos estados electrónicos é uma função periódica do vector ~k.
Esta função é, em geral, muito mais complicada do que a que caracteriza os estados de electrões
livres. A sua forma depende da estrutura cristalina do sólido em que se movem os electrões, que
está representada, na equação que define a energia [Eq. (6.12)], pelo termo correspondente ao
potencial electrónico V (~r). Em geral, a energia de um estado depende também da direcção do
vector k e não apenas do seu módulo, como acontece com os estados de electrões livres. Mas esta
dependência não é de todo arbitrária. Vamos de seguida demonstrar que a energia é uma função
par de ~k, isto é, que
εn (~k) = εn (−~k).
(6.13)
Tomando o complexo conjugado da Eq. (6.12) e fazendo a substituição ~k → −~k obtemos
−
i2
h̄2 h ~
∇ + i~k u∗n −~k (~r) + V (~r)u∗n −~k (~r) = εn (−~k)u∗n −~k (~r).
2m
(6.14)
onde u∗ representa o complexo conjugado de u(f) . Mas as eqs. (6.12) e (6.14) são idênticas e por
isso as suas soluções devem ser as mesmas; logo, podemos concluir que u∗n−~k (~r) = un~k (~r) e, mais
importante para o que nos interessa,
εn (~k) = εn (−~k),
como querı́amos demonstrar.
6.3.3
Momento linear
As funções de onda de Bloch, ψ~k (~r), representam os estados estacionários de electrões que se movem
numa região (o cristal) onde a sua energia potencial, que traduz as interacções com o meio, é uma
função periódica da posição. A expressão “estados estacionários” significa que um electrão que
ocupe um destes estados permanece nele enquanto não for perturbado por agentes externos ou por
alterações do meio em que se move (defeitos no cristal, por exemplo). Estes estados distinguem-se entre si pelo parâmetro vectorial ~k, que está relacionado com a forma como se transformam
sob translacções segundo vectores da rede. Isto é, o vector ~k (de que não conhecemos ainda o
significado fı́sico) é uma constante do movimento de um electrão de Bloch no estado ψ~k . Por
outro lado, o momento linear de um electrão de Bloch não deve ser uma constante do movimento,
já que um electrão que se move numa região onde está definido um potencial periódico está
sujeito a forças que se traduzem em acelerações, ou seja, em alterações do seu momento linear.
Assim, não podemos identificar h̄~k com o momento linear dos electrões no estado de Bloch ψ~k ,
como fizemos no estudo dos electrões livres. Esta conclusão é ainda reforçada pela aplicação do
operador quantidade de movimento ao estado ψ~k . De acordo com as regras da Mecânica Quântica,
os estados caracterizados por valores bem determidados do momento linear são os estados próprios
~ = −ih̄∇.
~ Ora, com ψ~ dado pela Eq. (6.2), temos
do operador associado a este observável, P
k
³
´
~ ~ (~r) = ei~k·~r h̄~k − ih̄∇
~ u~ (~r),
Pψ
k
k
expressão que não corresponde a uma equação de valores próprios. Assim, as funções de Bloch não
são funções próprias do operador do momento linear e, portanto, um electrão num estado de Bloch
não apresenta um valor bem determinado deste observável. No entanto, o vector h̄~k tem, como
veremos já de seguida, um papel importante na dinâmica dos electrões de condução nos metais,
muito semelhante ao do momento linear de electrões livres. Para realçar esta semelhança formal,
dá-se o nome de momento linear cristalino de um electrão no estado de Bloch ψ~k ao vector h̄~k.
Usaremos também a expressão “vector de onda cristalino” para nos referirmos ao vector ~k.
(f) As
r) = V (~
r) e ε∗n (~k) = εn (~k).
energias são grandezas reais e por isso V ∗ (~
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
6.3.4
85
Velocidade média e momento linear cristalino
A expressão para o cálculo da velocidade de electrões livres, ~v = h̄~k/m, não pode ser adoptada para
electrões em estados de Bloch, uma vez que o seu momento linear não é dado por p~ = h̄~k. Como
já se disse, electrões em estados de Bloch não apresentam um momento linear bem determinado
e, logo, o mesmo se passa com a velocidade. Podemos, quando muito, determinar os resultados
possı́veis de uma medição da velocidade e as respectivas probabilidades e, a partir destes valores,
calcular o valor expectável da velocidade.
Um problema relacionado com este é o da determinação da velocidade de propagação de um
sinal que não é caracterizado por um comprimento de onda bem determinado. Uma perturbação
puramente sinusoidal (isto é, uma onda com comprimento de onda, λ, e frequência, ν, bem determinados) propaga-se no meio que a suporta com uma velocidade, chamada velocidade de fase,
cujo módulo é
ω
v = λν = ,
(6.15)
k
onde se introduziram os parâmetros ω = 2πν e k = 2π/λ. A dificuldade do cálculo da velocidade
de sinais não puramente sinusoidais é a seguinte. Consideremos um sinal não sinusoidal arbitrário
f (x, t) (esta função pode, por exemplo, representar o som de um trovão). É possı́vel escrever a
função f (x, t) como combinação linear de funções sinusoidais com diferentes frequências e comprimentos de onda, usando as técnicas da análise de Fourier. Descrevemos desta maneira o sinal em
questão como a sobreposição de várias funções puramente sinusoidais. Cada uma destas componentes sinusoidais, caracterizada por valores bem determinados de k e de ω, tem uma velocidade de
fase dada pela Eq. (6.15), mas as velocidades das diferentes componentes não são, em geral, todas
iguais, logo, não podem ser identificadas com a velocidade da propagação do sinal. Em vez disso,
identifica-se esta velocidade de propagação com a do ponto onde o sinal tem amplitude máxima.
Este valor tem o nome de velocidade de grupo do sinal. Pode demonstrar-se que a velocidade de
grupo é dada por
dω
vG =
.
(6.16)
dk
Note-se que para ondas puramente sinusoidais, a velocidade de fase é igual à de grupo.
Voltemos agora ao problema que motivou esta pequena digressão, o problema da velocidade
dos electrões em cristais. A velocidade média das partı́culas quânticas é, em geral, identificada
com a velocidade de grupo da sua função de onda. Assim, dizemos que o valor expectável da
velocidade de um electrão num estado de Bloch ψk é
v(k) =
dω(k)
1 d²(k)
=
,
dk
h̄ dk
onde se usou a bem conhecida igualdade de Plank ² = h̄ω. Considerando agora o mesmo problema
em três dimensões, Introduzimos o operador gradiente no espaço recı́proco, dado por
grad~k ≡ î
∂
∂
ˆ ∂
+ ĵ
+ ~k
,
∂kx
∂ky
∂kz
sendo então a velocidade média dos electrões de Bloch dada por
~vG = grad~k ω(~k) =
1
grad~k ε(~k).
h̄
(6.17)
Esta velocidade de grupo, que identificamos com a velocidade dos electrões, representa o valor
expectável do observável velocidade. É, assim, o valor médio da velocidade dos electrões nos
estados de Bloch.
Como é bem sabido, o gradiente de uma função tem a direcção em que é máxima a variação
da função, perpendicular às suas superfı́cies de nı́vel. Logo, a velocidade de um electrão de Bloch,
num estado com vector de onda cristalino ~k, é perpendicular à superfı́cie de nı́vel da energia nesse
ponto ~k. Em particular, os electrões que se encontram na superfı́ce de Fermi têm uma velocidade
que é perpendicular a essa superfı́cie (veja a Figura 6.7).
86
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
ky
v
k
k
kx
v
Figura 6.7: A velocidade, ~v , e o vector de onda cristalino ~k. A velocidade é, para cada estado ~k,
~
. perpendicular à superfı́cie de nı́vel da energia para esse valor de k.
Um electrão num estado de Bloch, sujeito apenas à interacção com um cristal ideal, tem uma
energia bem definida, constante do movimento. Contudo, se se definir no cristal, para além dos
campos que que são intrinsecamente caracterı́sticos, um campo de forças externas, F~ , então o
electrão adquire desse campo de forças energia, a uma taxa temporal dada por
dε
= ~v · F~ ,
dt
(6.18)
sendo ~v o vector velocidade média do electrão em estudo. Mas a velocidade média é uma função
de ~k; logo,
∂ε dki
dε
=
.
dt
∂ki dt
Adoptou-se aqui a covenção de soma sobre ı́ndices repetidos de Einstein, isto é, subentende-se uma
soma para todos os valores do ı́ndice i = 1, 2, 3 no lado direito desta expressão. Esta convenção será
adoptada daqui em diante, salvo indicações explı́citas em contrário. Substituindo esta expressão
na Eq. (6.18), obtemos
∂ε dkj
= ~v · F~ .
∂kj dt
Usando agora a fórmula da velocidade [Eq. (6.17)], podemos reescrever a expressão acima como
h̄vj
dkj
= vecv · F~ ,
dt
~v ·
d(h̄k)
= ~v · F~ ,
dt
ou ainda
o que autoriza a identificação
d
F~ = (h̄~k).
dt
Esta equação é semelhante à que traduz a segunda lei de Newton,
(6.19)
d~
p
F~ =
,
dt
com o vector h̄~k a desempenhar o papel de momento linear dos electrões de Bloch. No entanto,
voltamos a recordar que, para a taxa de variação do momento linear dos electrões no cristal
contribuem as forças exteriores F~ , mas contribuem também as forças de interacção com o cristal
de iões, forças essas que não são contabilizadas na Eq. (6.19). Assim, podemos considerar o
vector h̄~k como uma espécie de momento linear efectivo dos electrões num cristal, conceito que
permite algumas simplificações, já que apenas as forças exteriores ao cristal contribuem para a
sua modificação.
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
6.3.5
87
Massa efectiva dos electrões de Bloch
Consideremos agora um electrão de Bloch sujeito a uma força externa F~ . A aceleração que adquire
por estar sob a acção desta força pode ser calculada como
ai =
dvi
∂vi dkj
=
.
dt
∂kj dt
Substituindo aqui a expressão da velocidade dos electrões de Bloch e da derivada do momento
linear cristalino [respectivamente, as eqs. (6.17) e (6.19)], obtemos
ai =
1 ∂2ε
Fj .
h̄2 ∂ki ∂kj
(6.20)
Esta expressão é muito parecida com a da segunda lei de Newton(g) e exprime a aceleração de
um electão que se move num cristal como resultado apenas das forças que sobre ele actuam
exteriores ao cristal, não considerando a influência das interações com o cristal. Este resultado é,
obviamente, extremamente útil e prático, mas o preço a pagar por esta simplificação é a introdução
de um parâmetro matricial variável que substitui a massa dos electrões de Bloch, chamado tensor
da massa efectiva, que se representa por m∗ e é a matriz inversa da matriz
−1
[m∗ ]ij =
1 ∂2ε
.
h̄2 ∂ki ∂kj
(6.21)
Um electrão move-se num cristal de forma bastante complicada, sujeito como está às forças
exercidas pelos átomos que formam o cristal, mas acabámos de ver que podemos simplificar bastante o seu estudo, substituindo na lei do movimento a sua massa pelo tensor da massa efectiva,
após o que basta apenas considerar, nas leis do movimento, as forças exteriores, como campos
eléctricos aplicados, etc. Claro que a matriz da massa efectiva tem que apresentar algumas particularidades que não esperamos encontrar na massa dos objectos comuns. Por exemplo, em geral
a aceleração de um electrão de Bloch não tem a direcção da força que a provoca. Além disso, a
matriz da massa efectiva é variável, as suas componentes têm valores diferentes conforme a magnitude e a orientação do vector ~k. Assim, pode acontecer que dois campos de forças iguais, mas com
orientações diferentes, produzam acelerações diferentes. Desta maneira, podemos explicar porque
é que alguns sólidos (a grafite, p. ex.) apresentam condutividades que variam com a orientação da
corrente eléctrica. É também possı́vel que, para valores particulares de ~k, algumas componentes
(ou mesmo todas) do tensor da massa efectiva sejam negativas; nestes casos, campos aplicados
numa direcção produzem correntes com direcções opostas...
Já agora, é interessante verificar qual a forma do tensor de massa efectiva para electrões livres,
situação que conhecemos melhor. O movimento de electrões livres é, de facto, apenas condicionado
pelas forças exteriores ao cristal, uma vez que as forças internas são desprezadas. Então esperamos
que a massa efectiva seja neste caso igual à massa real. De facto, a aplicação da Eq. (6.21) com a
função energia de electrões livres, dada por
h̄2 k 2
ε(~k) =
,
2m
permite obter o resultado
1
δij ,
m
é o sı́mbolo delta de Kronecker, cujos elementos são os da matriz identidade,
½
0,
i 6= j
δij =
1,
i = j.
−1
[m∗ ]ij =
onde δij
(g) As
leis da Fı́sica Clássica, não têm nada que ser satisfeitas por electrões, poderão dizer. Assim é, de facto. Mas
note-se que a aceleração ~a em (6.20) é a derivada do valor expectável da velocidade que, de acordo com o teorema
de Ehrenfest, satisfaz uma expressão formalmente semelhante à lei fundamental da dinâmica de Newton.
88
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
−1
Assim, a matriz [m∗ ] é diagonal e todos os seus elementos são iguais, logo a sua inversa, que é
o tensor da massa efectiva, é, simplesmente,
[m∗ ]ij = mδij ,
como já esperávamos.
6.3.6
O livre caminho médio
Vimos no capı́tulo anterior que é difı́cil entender os valores obtidos no quadro dos modelos de
electrões livres para o livre caminho médio dos electrões, que considerámos demasiado elevado.
Com efeito, nos modelos de electrões livres, supõe-se que os electrões de condução sofrem colisões
com os iões que formam o cristal, mas os valores previstos para o livre caminho médio resultam ser
centenas de vezes superiores à distância interatómica, para temperaturas próximas da temperatura
ambiente.
Este problema é resolvido no quadro da teoria de Bloch, mas devemos, antes de mais, clarificar o significado de colisão. Uma colisão entre dois corpos é uma alteração dos seus estados
de movimento como resultado da interacção mútua. Classicamente, caracterizamos o estado de
movimento de uma massa pontual através do seu momento linear; uma colisão entre dois corpos
clássicos pontuais é pois um processo de influência mútua em que se alteram os seu momentos
lineares. Nos modelos de electrões livres, o estado de um electrão é especificado pelo vector ~k, que
é proporcional ao momento linear. As colisões destas partı́culas com os iões da rede provocam
alterações no vector ~k, ou seja, na quantidade de movimento. Na mesma ordem de idéias, devemos
aceitar que, na teoria de Bloch, a colisão de um electrão com o que quer que seja deve manifestar-se
como uma alteração do seu estado, isto é, como uma alteração do vector ~k. Mas, já se disse, um
electrão que ocupa, num cristal ideal, um estado de Bloch ψn~k (~r), permanece nesse estado se não
se verificarem influências externas que o perturbem, porque os estados de Bloch têm já em linha de
conta as interacções com a rede cristalina. Assim, neste sentido, os electrões de Bloch não sofrem
colisões com os iões da rede. Podem, isso sim, modificar o seu estado, mas apenas por colisões
contra as fronteiras do cristal, contra fonões (vibrações do cristal), contra impurezas, em suma,
contra defeitos no cristal, qualquer que seja a sua natureza. Ora, os defeitos cristalinos estão muito
mais afastados entre si do que os iões da rede, pelo que se percebem agora os elevados valores que
obtivemos para o livre caminho médio dos electrões. A conclusão é a seguinte: tanto quanto se
possa considerar o cristal como perfeito (isto é, absolutamente periódico), os electrões não sofrem
modificação de estado, ou seja, colisões; estas devem ocorrer nas excepções à periodicidade, isto
é, nos defeitos cristalinos. Os electrões de Bloch não sofrem colisões com os átomos regularmente
dispostos no cristal, mas apenas com os defeitos no cristal, que estão mais afastados entre si que
os átomos que o constituem. Por esta razão, o caminho livre médio dos electrões de condução deve
ser muito maior do que as distâncias interatómicas tı́picas nos sólidos, em conformidade com os
resultados obtidos no quadro dos modelos de electrões livres.
6.4
Modelo de Krönig-Penney
(Nota: O estudo desta Secção não é indispensável para a compreensão do resto da matéria e pode ser
omitido.)
Vamos agora ilustrar o conteúdo das secções precedentes recorrendo a um modelo simples de
cristal unidimensional, o modelo de Krönig-Penney. Este modelo descreve os estados de uma
partı́cula quântica que se move numa região onde está definido um potencial que é uma sucessão
de barreiras de potencial rectangular idênticas, regularmente espaçadas entre si (ver a Figura 6.8).
Nós vamos usar uma versão particularmente simples do deste modelo, em que a largura, l, das
barreiras tende para zero, enquanto a sua altura, V , cresce de maneira a manter constante o
produto lV . No limite, cada barreira fica igual a uma função delta de Dirac(h) . A função potencial
(h) A
função delta só é diferente de zero num único ponto, mas o seu integral em qualquer intervalo que contenha
6.4. MODELO DE KRÖNIG-PENNEY
89
V(x)
V
x
a
l
V(x)
x
-2a
-a
0
a
2a
Figura 6.8: Potencial do modelo de Krönig-Penney (em cima). Em baixo, o potencial usado neste
trabalho: a largura, l, das barreiras diminui até zero, enquanto a sua altura, V , aumenta indefinidamente, de tal forma que o produto lV permanece constante.
que vamos usar é, então,
V (x) =
∞
h̄2 λ X
δ(x − na),
2m a n=−∞
(6.22)
onde λ é um parâmetro adimensional que pode ser usado para regular a intensidade do potencial
cristalino. Podemos até estudar o limite de electrões livres escolhendo λ = 0. Este potencial é um
caso particular dos potenciais contı́nuos por intervalos que se constumam estudar nas disciplinas
de introdução à Mecânica Quântica. A resolução da Equação de Schrödinger nestes casos é feita
separadamente em cada região de continuidade do potencial, impondo-se em seguida condições
de continuidade da função de onda nos pontos em que o potencial é descontı́nuo. Vamos então
dividir a recta real em regiões de continuidade da função potencial, que designaremos por R0 ,
R±1 , R±2 . . . , sendo Rn o intervalo (n − 1)a < x < na. Em qualquer destas regiões, a Equação de
Schrödinger escreve-se como
h̄2 d2
−
ψ = ²ψ
2m dx2
e, para ² positivo, admite soluções do tipo (tomamos a região Rn para concretizar a discussão)
ψ (n) (x) = Xn eikx + Yn e−ikx
ou, equivalentemente (basta tomar An = Xn eikna , Bn = Yn e−ikna ),
ψ (n) (x) = An eik(x−na) + Bn e−ik(x−na) .
(6.23)
Nestas expressões, k está relacionado com a energia do estado, ², através de
k2 =
2m²
.
h̄2
(6.24)
esse ponto é 1. Mais rigorosamente, a função delta define-se através das seguintes propriedades:
Z
δ(x − a)
=
0,
se x 6= a
f (x)δ(x − a)
=
f (a),
∀² > 0.
a+²
a−²
90
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
Na região contı́gua Rn+1 , e usando as mesmas convenções, a função de onda escreve-se
ψ (n+1) (x) = An+1 eik(x−[n+1]a) + Bn+1 e−ik(x−[n+1]a) .
(6.25)
A solução da Equação de Schrödinger é a união das diferentes funções ψ (n) , união essa que deve
ser feita de modo a satisfazer certas condições de continuidade. Antes, porém, de estudarmos a
continuidade da função de onda, devemos notar que, sendo o potencial uma função periódica da
posição, estamos nas condições do teorema de Bloch. Logo, as soluções da Equação de Schrödinger
devem satisfazer a condição
ψq (x + a) = eiqa ψq (x),
onde q é um parâmetro real, que caracteriza a função de onda particular ψq tal como os números
n, l, ml , ms caracterizam as funções de onda de electrões atómicos. Note-se que esta condição
envolve o valor da função de onda em diferentes células unitárias do nosso cristal unidimensional,
ou diferentes regiões, de acordo com a designação que temos usado. Tomando x na região Rn ,
x + a pertence à região Rn+1 ; a condição de Bloch pode pois escrever-se como
ψq(n+1) (x + a) = eiqa ψq(n) (x),
ou seja,
h
i
An+1 eik(x−na) + Bn+1 e−ik(x−na) = eiqa An eik(x−na) + Bn e−ik(x−na) .
Agrupando potências com expoentes iguais, obtemos
£
¤
£
¤
eik(x−na) An+1 − eiqa An + e−ik(x−na) Bn+1 − eiqa Bn = 0,
que só pode ser satisfeita para todos os valores de x se se anularem os coeficientes das exponenciais,
isto é, se
An+1 = eiqa An
(6.26)
Bn+1 = eiqa Bn
Faremos uso destas relações mais adiante. Vamos agora estudar as condições fronteira a satisfazer
pela função de onda. Em primeiro lugar, a função de onda deve ser uma função contı́nua. Assim,
num ponto x = na que é partilhado pelas regiões Rn e Rn+1 , devemos ter ψ (n) (na) = ψ (n+1) (na),
ou seja,
An+1 e−ika + Bn+1 eika = An + Bn .
(6.27)
Quando o potencial não tem descontinuidades infinitas, a derivada da função de onda é, também,
uma função contı́nua, mas esse não é o caso aqui.
Para deduzirmos a forma das condições fronteira a satisfazer pela derivada da função de onda,
integremos a Equação de Schrödinger,
−
h̄2 d2 ψ
+ V (x)ψ(x) = ²ψ(x),
2m dx2
num pequeno intervalo centrado num ponto x0 , com largura 2δ. Temos então
h̄2
−
2m
Z
x0 +δ
x0 −δ
d2 ψ
+
dx2
Z
Z
x0 +δ
x0 +δ
V (x)ψ(x)dx = ²
x0 −δ
ψ(x)dx.
x0 −δ
No limite em que δ → 0, o integral no segundo membro desta equação anula-se, porque a função
de onda é contı́nua; o primeiro integral é fácil de calcular, por ser o integral de uma derivada.
Resulta então
"µ ¶
#
µ ¶
Z x0 +δ
dψ
dψ
h̄2
lim
−
+ lim
V (x)ψ(x)dx = 0,
−
δ→0 x −δ
2m δ→0
dx x0 +δ
dx x0 −δ
0
6.4. MODELO DE KRÖNIG-PENNEY
ou ainda
µ
dψ
dx
¶
µ
−
x0 +
dψ
dx
91
¶
x0 −
2m
= 2 lim
h̄ δ→0
Z
x0 +δ
V (x)ψ(x)dx,
(6.28)
x0 −δ
onde (F )x0 ± representa o limite de F quando o seu argumento tende para x0 por valores superiores
a x0 (sinal +) ou por valores inferiores a x0 (sinal -). Esta condição de continuidade para a derivada
da função de onda tem validade geral, em problemas unidimensionais. No nosso caso, atendendo
à forma particular do potencial, temos, para x0 = na,
Z na+δ
h̄2 λ
ψ(x = na).
V (x)ψ(x)dx =
2m a
na−δ
Por outro lado, as duas derivadas obtêm-se facilmente a partir das expressões [eqs. (6.23) e (6.25)]
da função de onda nas duas regiões separadas pelo ponto de abcissa x = na:
dψ (n)
dx
dψ (n+1)
dx
= ikAn eik(x−na) − ikBn e−ik(x−na)
= ikAn+1 eik(x−[n+1]a) − ikBn+1 e−ik(x−[n+1]a) .
Então, podemos escrever a condição geral da Eq. (6.28) como
µ
¶
µ
¶
iλ
iλ
−ika
ika
An+1 e
− Bn+1 e = An 1 −
− Bn 1 +
.
ka
ka
(6.29)
Usando agora a Eq. (6.26) para eliminar os coeficientes An+1 e Bn+1 das eqs. (6.27) e (6.29),
obtemos o seguinte sistema de duas equações homogéneas:
h
i
h
i
ei(q−k)a − 1 An + ei(q+k)a − 1 Bn = 0
¸
·
¸
·
iλ
iλ
i(q+k)a
i(q−k)a
An − e
−1−
Bn = 0.
e
−1+
ka
ka
Como qualquer sistema homogénio, este admite a solução trivial An = 0 = Bn = 0, ou seja, ψ = 0,
que não nos interessa. Soluções não triviais verificam-se apenas quando o determinante da matriz
formada com os coeficientes do sistema se anular. Após algumas manipulações algébricas, esta
condição leva à seguinte equação transcendental:
cos qa = cos ka +
λ sin ka
.
2 ka
(6.30)
Esta igualdade define uma relação entre o parâmetro q que caracteriza as diferentes soluções da
Equação de Schrödinger e o parâmetro k que define a energia dessas soluções. Dado um valor de q
“basta” resolver esta equação em ordem a k para obter a energia correspondente, usando a relação
da Eq. (6.24). Infelizmente, esta relação entre k e q é transcendental, logo, não pode ser resolvida
analiticamente. Além disso, para certos valores de k não é possı́vel verificá-la. Com efeito, o
lado esquerdo está limitado ao intervalo [−1, 1]; logo, não podem existir soluções para todos os
valores de k em que o lado direito saia deste intervalo. Na Figura 6.9 apresenta-se o gráfico da
função no lado direito desta equação, assinalando-se as regiões em que não existem soluções não
triviais. Como a energia de um estado depende do valor de k [ver a Eq. (6.24)], estes intervalos
para os quais não há soluções da Equação de Schrödinger correspondem a hiatos de energia. Não
há estados estacinários de uma partı́cula num potencial de Krönig-Penney com energia situada
nesses intervalos proibidos.
Como se disse, a igualdade da Eq. (6.30) relaciona a energia dos estados permitidos (através da
interposta “pessoa” do parâmetro k) com o parâmetro q que os carateriza. Essa relação não pode
ser explicitada analiticamente, porque a Eq. (6.30) é uma equação transcendental. No entanto,
podemos tentar a seguinte abordagem numérica: dado um valor de q, variamos k (e, portanto, ²)
92
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
4
3
2
1
x=ka
0
2
4
6
8
10
12
-1
Figura 6.9: Gráfico da função no segundo membro da Eq. (6.30). Para os valores da abcissa (x = ka)
nas regiões sombreadas, não existem soluções da Equação de Schrödinger; correspondem aos gaps de
energia.
ε (k)
ε (k)
3a banda
2a banda
1a banda
-
π/ a
0
q
π/ a
q
-
π/ a
0
π/ a
Figura 6.10: Estrutura de bandas do modelo de Krönig-Penney. Notam-se claramente os hiatos
energéticos. Para comparação, apresenta-se à direita a estrutura de “bandas” no modelo de electrões
livres, obtida escolhendo λ = 0 no potencial da Eq. (6.22). A presença do potencial periódico abre os
gaps, deformando ligeiramente a curva ²(q) na fronteira da zona de Brillouin e “empurrando” para
cima os ramos superiores dessa curva.
6.5. NÚMERO DE ESTADOS POR BANDA
93
até que a diferença entre os valores dos dois lados da Eq. (6.30) seja menor que um determinado
limiar, caso em que dizemos que a igualdade foi satisfeita. Usando este processo, muito rudimentar,
foi possı́vel desenhar o gráfico da Figura 6.10. Escolheu-se para λ o valor λ = 2π. Note-se que,
com λ = 0, o potencial é constante, pelo que o potencial de Krönig-Penney nesse caso é o de
partı́culas livres. Nesse caso, a Eq. (6.30) fica simplesmente
cos qa = cos ka,
que tem como solução k = q, e a energia fica ² = h̄2 q 2 /2m, a expressão caracterı́stica de partı́culas
livres, que também é apresentada na Figura 6.10.
6.5
Número de estados por banda
A resolução de uma equação diferencial (como a de Schrödinger) não fica completa sem a imposição
de condições a satisfazer pela solução particular requerida. Apesar de não resolvermos completamente a Equação de Schrödinger [ou a sua versão de Bloch (6.12)] é útil a imposição de condições
fronteira, que reduzem número de estados de Bloch que é necessário considerar. Como no estudo
dos modelos de electrões livres, escolhemos as condições fronteira periódicas. No entanto, em vez
de as aplicarmos a um volume cúbico de aresta L, é mais conveniente [devido à presença da função
periódica un~k (~r) na expressão geral dos estados de Bloch (6.2)] considerar um volume com a forma
da célula unitária primitiva do cristal em estudo, contendo um número inteiro, N , destas células
unitárias primitivas (ver a Figura 6.11). As dimensões lineares desta região são Na |~a|, Nb |~b| e
N c
c
N a
a
c
b
a
N b
b
Figura 6.11: Forma da região considerada na imposição das condições fronteira.
Nc |~c| onde Na , Nb e Nc são números inteiros, tais que o número de células unitárias, N , presentes
no volume considerado é dado por
N = Na Nb Nc .
As condições fronteira periódicas podem então ser expressas como
ψn~k (~r + Na~a) =
ψn~k (~r + Nb~b) =
ψn~k (~r)
ψn~k (~r + Nc~c) =
ψn~k (~r).
ψn~k (~r)
(6.31)
De acordo com o teorema de Bloch, a primeira das equações em (6.31) pode ainda ser escrita na
forma
~
eiNa k·~a ψn~k (~r) = ψn~k (~r)
(6.32)
ou ainda
~
eiNa k·~a = 1.
(6.33)
94
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
De igual modo, obtemos para a segunda e terceira das eqs. (6.31)
~~
eiNb k·b
e
iNc~
k·~
c
=
=
1
1.
Recordando a definição de vector da rede recı́proca, verificamos que estas igualdades são verificadas
se o vector ~k fôr da forma
~k = ma A
~ + mb B
~ + mc C,
~
(6.34)
Na
Nb
Nc
~ B
~ eC
~ são os vectores fundamentais primitivos da
onde ma , mb e mc são inteiros arbitrários e A,
rede recı́proca. Note-se que Eq. (6.34) não implica que ~k seja um vector da rede recı́proca, porque
ma /Na , mb /Nb e mc /Nc não são, necessariamente, números inteiros. Tal como no estudo dos
electrões livres, verificamos que os estados electrónicos permitidos formam um conjunto discreto,
porque ~k só pode assumir os valores definidos pela Eq. (6.34). Os valores permitidos para o vector
~k formam uma rede cristalina, com vectores fundamentais primitivos A/N
~ a , B/N
~ b e C/N
~ c.
Estamos agora em condições de determinar o número de estados numa banda. Como se disse,
devemos considerar apenas vectores ~k pertencentes a uma única célula unitária primitiva da rede
recı́proca, que tem um volume
~·B
~ × C|.
~
Ω = |A
(6.35)
Por outro lado, o volume de espaço-k ocupado por cada um dos vectores ~k permitidos é o volume
da célula unitária primitiva da rede por eles definida, de acordo com a Eq. (6.34),
¯
¯
¯A
~
~ ¯¯
C
¯ ~ B
τ = ¯
·
×
¯
¯ Na Nb
Nc ¯
¯
¯
1
¯~ ~
~ ¯¯ = Ω .
=
¯A · B × C
Na Nb Nc
N
O número de vectores ~k que “cabem” numa célula é então o volume disponı́vel, Ω, a dividir pelo
volume ocupado por cada um, τ , ou seja, N . Considerando ainda que para cada valor de ~k existem
dois estados electrónicos (spin up ou spin down), concluimos que o número total de estados numa
banda é 2N , onde, recorda-se, N é o número total de células unitárias primitivas que formam a
região considerada para a imposição das condições fronteira. Este facto também se pode entender
recordando que, no aparecimento das bandas de energia no processo de formação dos sólidos, não
aumenta o número de estados electrónicos. A banda de valência resulta de combinações lineares
de um grande número (seja N esse número) de orbitais atómicas (uma por cada átomo). Cada
orbital atómica pode acomodar dois electrões (com orientações de spin opostas), logo, o conjunto
deve conter 2N estados electrónicos.
6.6
O estado fundamental da nuvem electrónica
Já vimos como a proximidade dos átomos num cristal leva ao desenvolvimento de um espectro de
bandas, em vez dos nı́veis de energia bem definidos que caracterizam os átomos isolados. Cada
uma destas bandas é populada por electrões provenientes de cada um dos átomos que formam o
cristal.
O estado fundamental do sistema de electrões de Bloch é, essencialmente, definido do mesmo
modo que para os electrões livres: todos os estados de baixa energia devem estar ocupados por
electrões. As bandas correspondentes aos nı́veis atómicos de mais baixa energia, que no estado
fundamental de cada átomo estão totalmente preenchidas, ficam igualmente totalmente preenchidas. No estado fundamental de cada átomo, apenas a orbital de valência pode conter estados
electrónicos desocupados. A banda que resulta desta orbital pode então estar também apenas
parcialmente preenchida (ver a Figura 6.12). A esta banda dá-se o nome de banda de valência.
6.6. O ESTADO FUNDAMENTAL DA NUVEM ELECTRÓNICA
95
E
Banda de
valência
< 2N electrões
2N electrões
2N electrões
Figura 6.12: Ocupação das diferentes bandas de um metal.
Tal como fizemos no estudo do modelo de electrões livres, podemos “construir” o estado fundamental do sistema de electrões de Bloch, ocupando com os electrões atómicos os nı́veis de Bloch
de energia sucessivamente maior. Devemos pois começar na primeira banda, preenchendo-a totalmente antes de começar a ocupar a segunda, e assim sucessivamente até à banda de valência. Para
cada banda, devemos começar a ocupar estados com ~k tal que correspondam a baixos valores de
energia. No caso dos electrões livres, a energia era simplesmente ε(~k) = h̄2 k 2 /2m; dependendo a
energia apenas do módulo do vector ~k, este processo de “estacionar” electrões livres em nı́veis de
energia sucessivamente maior resultava em superfı́cies de Fermi com forma esférica. A situação é
agora mais complicada, já que, em geral, as funções εn (~k) dependem também da direcção de ~k.
Assim, para os electrões de Bloch, a forma da superfı́cie de Fermi não é, em geral, esférica, podendo apresentar configurações extremamente complexas. No entanto, estas formas devem manter
as simetrias da rede recı́proca. Um caso particular destas simetrias é o da paridade da energia,
expresso em (6.13). Uma vez que εn (~k) = εn (−~k), devemos, após o preenchimento do nı́vel ~k com
dois electrões (um com spin up e outro com spin down) e antes de preencher outro nı́vel qualquer
com energia superior, ocupar estados com energia igual a εn (~k) entre os quais, necessariamente,
o estado com momento cristalino igual a −~k. No estado fundamental do sistema, então deve
verificar-se que, se um estado ψn~k se encontra preenchido, também o estará o estado ψn−~k ; ao
contrário, se o estado ψn~k está desocupado, também ψn−~k o está. Assim, vemos que a superfı́cie
k
y
1ª zona de Brillouim
k
x
Figura 6.13: Forma possı́vel da superfı́cie de Fermi para um cristal quadrado 2D. Note-se que outras
formas são possı́veis, a apresentada é apenas um exemplo. Note-se também que esta superfı́cie de
Fermi corresponde a uma banda não totalmente preenchida, porque há ainda espaço disponı́vel na
primeira zona de Brillouin para “albergar” outros electrões.
96
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
de Fermi deve apresentar simetria de inversão, isto é, deve ficar invariante sob a operação ~k → −~k.
Na Figura 6.13 representa-se a superfı́cie de Fermi para um cristal quadrado bidimensional.
Como já vimos, a velocidade média de um electrão de Bloch é a sua velocidade de grupo:
1
~vn (~k) = grad~k εn (~k).
h̄
(6.36)
Sendo εn (~k) uma função par de ~k, o seu gradiente é uma função ı́mpar de ~k. Então a velocidade
de um electrão cuja função de onda é ψn~k deve ser igual, mas oposta, à de outro com função
de onda ψn−~k . Mas como já vimos atrás, os estados ψn~k e ψn−~k estão ambos ocupados ou
ambos desocupados, no estado fundamental colectivo. Então, no cálculo da velocidade média dos
electrões, as contribuições dos estados ψn~k e ψn−~k cancelam-se mutuamente. Como o vector de
onda considerado nesta discussão é arbitrário, concluı́mos que a velocidade média dos electrões
no estado fundamental colectivo é zero. Note-se que nos referimos a uma média vectorial, e que
não consideramos a presença de campos de forças (eléctricas, por exemplo) que, deformando a
superfı́cie de Fermi, destruı́riam esta argumentação.
6.7
A condução eléctrica
Consideremos agora o efeito de um campo eléctrico (de grandeza tı́pica) na situação que acabámos
de descrever. Tal como no caso dos electrões livres, um campo eléctrico manifesta-se através de um
deslocamento da superfı́cie de Fermi na direcção contrária ao campo, deixando de ficar centrada
na origem do espaço-k, se este deslocamento for possı́vel. Os argumentos apresentados no final da
secção anterior já não se aplicam (porque, por exemplo, ψn~k pode estar ocupado sem que ψn−~k o
esteja [veja a Figura 6.14]) e, a ser este deslocamento da superfı́cie de Fermi possı́vel, a velocidade
média da nuvem electrónica deixa de ser nula, verificando-se o aparecimento de uma corrente
eléctrica. Mas este deslocamento da superfı́cie de Fermi só é possı́vel se a banda de valência
E =0
ky
E
kx
ky
kx
Figura 6.14: Deslocamento da superfı́cie de Fermi sob o efeito de um campo eléctrico. Se a banda de
valência estiver totalmente preenchida, a superfı́cie de Fermi é também a fronteira da região proı́bida,
impossibilitando o deslocamento da superfı́cie de Fermi, ou seja, a condução eléctrica.
não estiver totalmente preenchida, porque, em caso contrário, alguns electrões seriam obrigados a
ocupar estados na região proibida. Assim, concluimos que uma banda totalmente preenchida não
contribui para a condução eléctrica.
Como apenas a banda de valência de um sólido pode, no estado fundamental (ou, seja à
temperatura de 0 K), estar parcialmente preenchida, somente esta é responsável pelas propriedades
eléctricas dos sólidos. A teoria de Bloch permite pois explicar porque é que alguns sólidos são
condutores e outros isoladores: em princı́pio, se a banda de valência de um sólido estiver totalmente
preenchida, o sólido é isolador; caso contrário, é condutor. Esta regra tem algumas excepções, já
que nalguns sólidos a banda de condução sobrepõe-se com a banda de valência, permitindo a
condução mesmo estando esta totalmente preenchida.
6.8. O GÁS DE BLOCH À TEMPERATURA AMBIENTE.
97
E
(a)
Isolador
Condutor
(b)
T=0
T>0
Semicondutor
Figura 6.15: Isoladores, condutores e semicondutores. Os isoladores (à esquerda no diagrama) têm
a banda de valência totalmente preenchida e a de condução totalmente desocupada; os condutores
(ao centro) têm a banda de valência ocupada, mas não totalmente preenchida, ou então verificase uma sobreposição das duas bandas; finalmente, os semicondutores (à direita) são isoladores à
temperatura de zero kelvin, mas o hiato energético entre a banda de valência e a de condução é
pequeno, e à temperatura ambiente muitos electrões estão excitados para esta última, possibilitando
a condução.
6.8
O gás de Bloch à temperatura ambiente.
Nos átomos isolados, para além da orbital de valência, existem outros estados electrónicos, com
energia superior, que podem ser ocupados excitando o átomo. De igual modo, a banda de valência
também não é a “última” banda no sentido em que há outras bandas de energia superior, que,
no estado fundamental do sistema de fermiões de Bloch estão totalmente desocupadas, mas que
podem estar parcialmente preenchidas em estados excitados. À banda de energia imediatamente
superior à da banda de valência dá-se o nome de banda de condução. Mais uma vez, repetimos
que à temperatura ambiente, é possı́vel que alguns electrões sejam excitados para esta banda, e
esta possibilidade deve ser considerada no cálculo do valor de grandezas fı́sicas a temperaturas
diferentes do zero absoluto. Claro que a probabilidade destas excitações é tanto maior quanto
menor for a largura do hiato energético entre as duas bandas. Como vimos no capı́tulo anterior,
a energia térmica média disponı́vel para excitar electrões à temperatura ambiente, T , é da ordem
de grandeza de kB T , onde kB é a constante de Boltzman, e portanto a população da banda de
condução só é apreciável à temperatura ambiente se o hiato energético tiver uma largura da mesma
ordem de grandeza. Um sólido com esta caracterı́stica é um isolador(i) a temperaturas próximas
do zero absoluto(j) mas pode conduzir electricidade à temperatura ambiente. Um aumento da
temperatura produz um aumento na energia média dos fonões, e por conseguinte um aumento
da população da banda de condução, ou seja, um aumento da condutividade. Para estes sólidos
(com um hiato energético, ²g , de cerca de 1 eV) comportamento da condutividade é inverso do
dos condutores, sendo uma função decrescente da temperatura. Este é outro sucesso da teoria de
Bloch, já que este comportamento (aumento de condutividade com a temperatura) é inexplicável,
como vimos, no quadro de uma teoria de electrões livres.
Os sólidos isoladores que, como os que acabámos de referir, apresentam um hiato entre as bandas de valência e de condução suficiente pequeno para que, à temperatura ambiente, a população
da banda de condução tenha efeitos apreciáveis, têm o nome de semicondutores. Na Figura 6.15
apresenta-se a configuração das bandas de valência e de condução para condutores, isoladores e
semicondutores.
(i) Partindo
(j) Não
do princı́pio que tem a banda de valência totalmente preenchida no seu estado fundamental.
consideramos aqui o fenómeno de supercondutividade.
98
6.9
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
Lacunas
A densidade de corrente eléctrica global de uma banda totalmente preenchida é, de acordo com o
que já se disse, nula. Assim, representando por ~j~k (~r) a densidade de corrente de um electrão no
estado ψ~k (k) e por J~B (~r) a densidade de corrente total da banda, podemos escrever
J~B (~r) =
X
~j~ (~r) = 0,
k
(6.37)
banda
onde o somatório se extende a todos os estados ψ~k da banda. Se quisermos calcular a densidade
de corrente para uma banda parcialmente preenchida, devemos fazer um somatório semelhante ao
anterior, mas considerando apenas os estados efectivamente ocupados por electrões, ou seja,
X
~ r) =
~j~ (~r),
J(~
(6.38)
k
e.o.
onde as iniciais “e. o.” significam que para o somatório apenas se tomam os estados ocupados.
De acordo com a Eq. (6.37), devemos ter
X
e.o.
~j~ (~r) +
k
X
~j~ (~r) = 0,
k
e.d.
onde as iniciais “e. d.” indicam que a soma respectiva é feita apenas sobre os estados desocupados.
Mas isto significa que os dois somatórios são simétricos, e portanto podemos escrever a densidade
de corrente de uma banda parcialmente preenchida como
X
~ r) = −
~j~ (~r),
(6.39)
J(~
k
e.d.
sendo este somatório, recordemo-lo, extendido apenas aos estados desocupados da banda. Dispomos então de duas formas alternativas para o cálculo da contribuição de uma banda parcialmente
preenchida para a corrente elétrica, dadas pelas eqs. (6.38) e (6.39). Podemos interpretar esta
segunda possibilidade considerando os estados electrónicos desocupados, sobre os quais se faz o
somatório, como se estivessem ocupados por partı́culas semelhantes aos electrões, mas com carga
de sinal contrário, justificando-se o sinal negativo na Eq. (6.39). A estas “partı́culas” dá-se o nome
de lacunas. A condução eléctrica pode ser descrita recorrendo aos estados electrónicos [usando a
Eq. (6.38)] ou, alternativamente, aos estados de lacunas [usando a Eq. (6.39)].
Reafirmemos que as lacunas são os estados electrónicos desocupados. Então, uma banda totalmente preenchida (de electrões) pode ser vista como uma banda vazia de lacunas. Dada a
equivalência das duas descrições para os fenómenos de condução, podemos dizer que uma banda
totalmente preenchida (de electrões) não pode conduzir porque não contém nenhuma lacuna para
o transporte de carga.
Num semicondutor, em que o gap de energia entre as bandas de valência e de condução é
da ordem de grandeza da energia das vibrações atómicas, é relativamente fácil a excitação de
um electrão da banda de valência para a banda de condução. Neste processo, é absorvido um
fonão(l) e, simultaneamente, é produzida uma lacuna na banda de valência, correspondente ao
estado deixado vago pelo electrão promovido (ver a Figura 6.16). Inversamente, pode também
dar-se o processo de recombinação, em que um electrão na banda de condução emite um fonão (ou
um fotão) transitando para a banda de valência, onde irá ocupar um estado previamente vago (ou
seja, ocupado por uma lacuna).
(k) Classicamente, a densidade de corrente é ~
j(~
r) = ρ(~
r)~v (~
r), onde ρ é a função densidade de carga e ~v velocidade das
cargas. Numa descrição quântica, a densidade de corrente associada ¡a uma partı́cula¢com carga q é ~j(~
r) = q~g (~
r),
~ − ψ ∇ψ
~ ∗ /(2im) (ver qualquer livro
onde ~g é a densidade de fluxo de probabilidade, dada por ~g = h̄ ψ ∗ ∇ψ
elementar de Mecânica Quântica, p. ex. S. Gasiorowicz, ”Quantum Mechanics”.)
(l) Recorde que os fonões são os quanta das vibrações atómicas (ver a Secção 4.3.2).
6.10. CONTAMINAÇÃO DE SEMI-CONDUTORES
99
Banda de
condução
f
Banda de
valência
Figura 6.16: Processo de criação de um par electrão de condução-lacuna por absorção de um fonão.
Num semicondutor à temperatura ambiente, há duas contribuições para a condução eléctrica: a
da banda de condução, que está parcialmente populada com electrões termicamente excitados, e a
da banda de valência, parcialmente populada com lacunas que correspondem aos estados deixados
vagos pelos electrões promovidos para a banda de condução. Nos casos em que a segunda é mais
importante do que a primeira, a corrente eléctrica é, sob todos os aspectos, semelhante à que
seria conduzida por cargas de sinal positivo, nomeadamente na polarização da tensão de Hall (ver
a secção 5.2.3), justificando-se assim os sinais anómalos do coeficiente de Hall apresentados por
algumas substâncias.
6.10
Contaminação de semi-condutores
Como vimos, à temperatura ambiente alguns electrões da banda de valência de um semicondutor
como o silı́cio ou o germânio(m) ocupam estados excitados na banda de condução, possibilitando
a condução eléctrica por estes materiais. Há, como se disse, duas contribuições para a condução
eléctrica: a dos electrões na banda de condução e a das lacunas na banda de valência. Num
semicondutor puro à temperatura ambiente, o número de lacunas iguala, evidentemente, o de
electrões de condução. Mas é possı́vel, através da introdução no cristal semicondutor de impurezas
judiciosamente escolhidas, variar independentemente o número dos dois tipos de transportadores
de carga.
Para concretizar a discussão, consideremos um cristal de silı́cio ou de germânio, no qual alguns
átomos são substituı́dos por átomos de arsénico ou de fósforo. Estas impurezas constituem defeitos
no arranjo periódico do cristal de silı́cio. O arsénico e o fósforo são substâncias pentavalentes, de
forma que, quando um átomo de arsénico substitui num cristal um átomo de silı́cio (substância
tetravalente), um dos seus electrões de valência fica por emparelhar. Este electrão fica fracamente
ligado ao átomo de arsénico, que funciona como um centro de carga positiva (ver a Figura 6.17).
O átomo de arsénico fornece um electrão a mais do que os de silı́cio, que definem a estrutura
cristalina e, por isso, dizemos que o arsénico é um dador de electrões, ou ainda que se trata de
uma contaminação de tipo-n. Estando o electrão desemparelhado muito fracamente ligado ao
átomo de arsénico, basta uma pequena quantidade de energia, Ed , para exitá-lo para a banda
de condução. O valor deste mini-gap de energia é de cerca de algumas dezenas de meV (mili-electrão-volt), tipicamente. Assim, concluı́mos que num cristal de silı́cio em que alguns átomos
são substituidos por átomos de arsénico a estrutura de bandas usual vê-se modificada, aparecendo
um conjunto de estados na zona proı́bida, imediatamente abaixo da banda de condução, aos quais
se dá o nome de nı́vel dador.
À temperatura de 0 K, a banda de valência está totalmente preenchida, e o nı́vel dador tem
metade dos estados disponı́veis ocupados (porquê?); o cristal em estudo é, portanto, isolador. Mas
basta elevar ligeiramente a temperatura para se exitarem os electrões do nı́vel dador para a banda
de condução, sem que sejam criadas lacunas na banda de valência. A temperaturas mais elevadas,
começa a fazer-se sentir o processo já estudado da excitação de electrões da banda de valência, e
as lacunas resultantes passam a ter uma contribuição apreciável para a condução eléctrica.
Vemos, assim, que contaminando por substituição um cristal de silı́cio ou germânio com
(m) Estes
são os dois semicondutores mais usados em aplicações industriais.
100
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
Orbital de electrão
desemparelhado
Banda de condução
Ed
Nível dador
Eg
Átomos de Silício
+
Banda de
valência
Átomo de Arsénico
Figura 6.17: Cristal de silı́cio com uma impureza substitucional de arsénico (esquerda) e nı́veis de
energia resultantes (direita).
arsénico, podemos aumentar, a temperaturas não muito elevadas, o número de electrões na banda
de condução, permanecendo o número de lacunas na banda de valência baixo.
Banda de condução
Lacuna resultante da
captura de um electrão
pelo átomo de boro
+
Eg
Átomos de silício
-
Ea
Nível aceitador
Banda de
valência
Átomo de boro
Figura 6.18: Cristal de silı́cio com uma impureza substitucional de boro (esquerda) e nı́veis de
energia resultantes (direita).
Também é possı́vel obter o efeito contrário, de estabecer num cristal semicondutor um grande
número de lacunas na banda de valência com um reduzido número de electrões na banda de
condução, substituindo alguns átomos num cristal de silı́cio ou de germânio por átomos de boro,
alumı́nio, gálio ou ı́ndio (substâncias trivalentes). Substituindo um átomo de silı́cio num cristal
puro por um de boro, fica uma ligação por estabelecer, já que o boro é trivalente. O átomo de boro
pode, nesta situação, capturar facilmente um electrão da banda de valência do cristal, completando
assim as quatro ligações com os seus vizinhos. Neste processo, cria-se uma lacuna na banda de
valência, sem popular a banda de condução. As impurezas deste tipo aceitam os electrões da banda
de valência, e por isso chamam-se impurezas aceitadoras, ou impurezas de tipo-p. Na Figura 6.18
representa-se esquematicamente o papel de uma impureza de tipo-p e o nı́vel intermédio, que agora
aparece imediatamente acima da banda de valência, chamado nı́vel aceitador.
A capacidade para variar independentemente as concentrações de lacunas e de electrões de
condução num cristal semicondutor tem uma enorme aplicação prática, no fabrico de inúmeros
dispositivos usados na indústria electrónica, como os diodos e os transı́stores. É até possı́vel,
num único cristal de silı́cio, implantando diferentes contaminações em diferentes regiões, construir
circuitos inteiros, contendo vários milhões daqueles elementos individuais. Vamos, de seguida,
estudar o funcionamento do mais simples destes dispositivos, o diodo rectificador.
6.11. O DIODO SEMICONDUTOR
101
Fe
n
e-
p
l+
Ve
Vc0
n
p
Figura 6.19: Junção p-n (acima) em equilı́brio e potencial de contacto na junção. Está representada
o sentido da força sobre os electrões (Fe ) e a sua energia potencial.
6.11
O diodo semicondutor
Consideremos um cristal semicondutor de silı́cio (ou germânio), com contaminações de tipo diferente em duas zonas contı́guas, em equilı́brio a uma temperatura T > 0. Temos então um cristal,
no qual está definida uma região de tipo-p, outra de tipo-n, em contacto uma com a outra (ver a
Figura 6.19). À temperatura T , na região-n há uma grande densidade de electrões de condução,
como vimos na secção anterior; em contrapartida, na região-p é a concentração de lacunas que é
elevada. Então, à semelhança do que se passa na junção de metais diferentes (ver a Secção 5.2.4),
deve verificar-se uma difusão de electrões de condução da região-n (onde apresentam alta concentração) para a região-p, onde se recombinam com as lacunas, aqui maioritárias. As lacunas,
por seu turno, sofrem uma migração inversa e recombinam-se com os electrões de condução da
região-n. Consequentemente, estabelece-se um campo eléctrico na junção que impede a continuação indefinida deste processo, ou seja, verifica-se o aparecimento de uma diferença de potencial
entre as duas regiões, que se chama potencial de contacto. Em resultado dos processos de recombinação, a proximidade da junção fica desprovida de transportadores de carga, efeito que é
ainda agravado pelo aparecimento do campo de contacto, que varre electrostaticamente qualquer
par lacuna-electrão de condução (o electrão para a região-n, a lacuna para a região−p), criado
nesta zona por exitação térmica. Esta região, onde a densidade de transportadores de carga é
praticamente nula, chama-se zona de deplecção.
Na junção das duas regiões ocorrem, então, dois efeitos opostos:
(a) difusão de transportadores, “empurrada” pelos gradientes de concentração. Alguns electrões
(aqueles que à temperatura T têm energia suficiente para ultrapassarem a barreira estabelecida pelo potencial de contacto) da região-n difundem-se para a região-p, recombinando-se aı́
com lacunas. Inversamente, algumas lacunas da região-p sofrem uma migração para a regiãon. Ao fluxo de carga associado a estas migrações dá-se o nome de corrente de recombinação,
que tem o sentido p-n;
(b) deriva de trasportadores, “empurrada” pelo campo eléctrico de contacto. Os pares electrão
de condução-lacuna criados por excitação térmica nas duas regiões são empurrados pelo
campo eléctrico, realizando cada transportador uma migração em sentido inverso ao do
ponto anterior. Esta corrente chama-se corrente de geração, no sentido n-p.
Na migração de difusão, os transportadores movem-se empurrados pelos gradientes de concentração, vencendo gradientes de potencial electrostático; na migração de deriva, o movimento
é induzido pelo gradiente do potencial electrostático, e opõe-se ao gradiente de concentração.
Estabelece-se então um equilı́brio dinâmico em que os fluxos de carga se cancelam mutuamente,
isto é, a corrente de recombinação, no sentido p-n, iguala a de geração, no sentido n-p. Deve
dizer-se que o valor destas correntes é extremamente baixo, rondando os 10−6 A.
Se se montar um circuito fechado incluindo a junção semicondutora p-n, devemos ter em
atenção que, para além do potencial de contacto Vc0 na junção semicondutora, aparecem outros
102
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
VB
n
VB
n
Vc0
Vc
V
p
p
VA
VA
Figura 6.20: Quedas de potencial por contacto num curto-circuito da junção p-n (à esquerda) e
polarização de uma junção p-n por uma fonte de tensão V .
VB
n
VB
n
Vc > Vc0
Vc < Vc0
p
VA
p
VA
i
Figura 6.21: Polarização directa (à esquerda) e polarização inversa de uma junção p-n.
potenciais de contacto nos pontos onde se liga o condutor que fecha o circuito (ver a Figura 6.20).
Evidentemente, a soma de todos estes potenciais é nula, de acordo com a lei de Kirchoff. Usando
a notação da Figura 6.20, temos então
Vc0 + VA + VB = 0,
ou seja,
VA + VB = −Vc0 .
(6.40)
O que acontece agora se polarizarmos a junção, ligando-a a uma fonte de tensão? Uma vez
que a zona de deplecção é desprovida de cargas móveis, tem uma resistência muito elevada e, por
isso, podemos considerar que é aı́ que se manifesta o efeito da fonte de tensão. Aplicando a lei de
Kirchoff, temos agora
Vc + Va + VB + V = 0,
e portanto, usando a Eq. (6.40), concluimos que o potencial de contacto se vê alterado pela acção
da tensão polarizadora V de acordo com
Vc = Vc0 − V.
(6.41)
Quando o terminal positivo da fonte de tensão está ligado à região-p a junção diz-se polarizada no
sentido directo; se o terminal positivo da fonte estiver ligado à região-n, falamos de polarização
inversa. Quando a junção está em polarização directa, V tem sinal idêntico ao de Vc 0, e, portanto,
o potencial de contacto fica diminuı́do pela polarização (ver a Figura 6.21, à esquerda). Logo,
nestas condições, aumenta bastante a corrente de recombinação porque diminui a grandeaza da
barreira de potencial que impede o fluxo por difusão. Em contrapartida, a corrente de geração
mantém-se essencialmente constante, já que depende da taxa da criação de pares lacuna-electrão
de condução. Então, as duas correntes deixam de se compensar, e verifica-se, portanto, um fluxo
lı́quido de carga através da junção, no sentido p-n. Em resumo, a junção p-n permite a passagem
de corrente quando se encontra em polarização directa.
Em contrapartida, quando se inverte a polarização, aumenta o valor do potencial de contacto,
diminuindo, consequentemente, o valor da corrente de recombinação. A corrente de geração permanece essencialmente a mesma, mantendo o seu valor de cerca de 10−6 A. Assim, para muitos efeitos
6.11. O DIODO SEMICONDUTOR
103
200
I (A)
150
100
50
0
-2
-1.5
-1
-0.5
V (V)
0
0.5
Figura 6.22: Curva de corrente-tensão caracterı́stica de um diodo semicondutor.
práticos, podemos dizer que a junção semicondutora p-n não permite a passagem de corrente em
polarização inversa.
Uma vez que a fracção dos transportadores que tem, a uma certa temperatura T , uma energia
superior ao valor do potencial de contacto (e que portanto está em condições de ultrapassar a
barreira de potencial na junção) é dada pelo factor de Boltzmann e−βeVc , onde β = 1/kB T , a
razão entre as correntes de recombinação em polarização directa e em vazio (sem qualquer fonte
externa) é dada por
Jr
e−βeVc
= −βeVc0 = eβeV .
Jr0
e
A corrente total é a soma das correntes de geração e de recombinação, J = Jr + Jg , mas a corrente
de geração permanece sensivelmente constante, com o seu valor de vazio Jg0 que, por sua vez, é
o simétrico da corrente de recombinação, também em vazio. Então, a funçao corrente tensão de
uma junção p-n é
J = Jg (eβeV − 1),
(6.42)
onde se toma V positivo quando a junção está em polarização directa. O gráfico desta função
apresenta-se na Figura 6.22. A junção semicondutora p-n tem então a propriedade de só permitir a passagem de corrente num sentido, propriedade muito importante no desenho de circuitos
electrónicos.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• J. R. Christman, ”Fundamentals of Solid State Physics” (1988), capı́tulo 14 (F5.0/257 +)
• A. Yariv,“An Introduction to Theory and Applications of Quantum Mechanics” (1982),
capı́tulo 20 (F5.0/461)
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989), secção 12-7
(F5.0/437 +)
• F. Blatt, “Modern Phisics” (1992), secção 13.4 (F5.0/448 +)
• R. A. Serway e R. J. Beichner, “Physics for Scientists and Engineers” (2000), Secção 43.7
(F0.2/294)
104
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
PROBLEMAS
6.1 À luz da teoria das bandas determine, justificando, o número total de estados electrónicos existentes por banda de energia.
6.2 Justifique qualitativamente a condutividade, térmica e eléctrica, a zero graus Kelvin, dos sólidos
cristalinos. Dê alguns exemplos.
6.3 Comente a seguinte afirmação:
A condutividade dos metais alcalinos terrosos é devida a uma sobreposição da banda
de valência com a banda de condução. Se tal não acontecesse estes elementos seriam
isoladores a zero graus Kelvin.
6.4 Determine o valor do parâmetro de massa efectiva de electrões livres.
6.5 A densidade do bário é de 3, 5 × 103 kg/m3 , e a sua massa atómica relativa é 137. Sabendo que
os átomos de bário têm dois electrões de valência, determine o raio da esfera de Fermi e o valor
da energia da nuvem de electrões de condução por mole (de átomos) à temperatura de 0 K.
2
6.6 Mostre que a função ψ(~r) = N e−r , onde N é uma constante de normalização e r = ||~r||, não
pode ser a função de onda de um electrão num potencial periódico.
6.7 Um diodo com corrente de geração de 20,0 µA, uma resistência de 1,5 kΩ e uma fonte de tensão
estão ligados em série. Sabendo que o diodo se encontra a conduzir, qual o valor da força electromotriz da fonte, necessária para que a corrente através do circuito seja 25,0 mA, à temperatura
de 300 K?
6.8 Coloca-se um diodo num circuito eléctrico para proteger o sistema contra o risco de alguém colocar
as pilhas ao contrário. Na posição de fucionamento à temperatura ambiente, a corrente através
do diodo é 200 mA sendo 100 mV a diferença de potencial entre os seus terminais; se se inverter
a bateria, qual será o valor da corrente através do diodo?
Capı́tulo 7
Supercondutividade
A temperaturas suficientemente baixas, a resistividade de muitas substâncias anula-se, de forma
brusca. Este facto foi, pela primeira vez, observado por Karmerlingh Onnes em 1911, quando notou
que a resistência de uma amostra de mercúrio era, à temperatura de 4,2 K, subitamente reduzida
em mais de um milhão de vezes (ver o gráfico da Figura 7.1, à esquerda). Outras substâncias
sofrem este processo a diferentes temperaturas. A temperatura a que se dá a transição chama-se
temperatura crı́tica. Alguns exemplos estão apresentados na Tabela 7.1.
É importante notar que esta redução do valor da resistividade é, em certas condições, extremamente brusca. No caso dos estudos de Onnes com mercúrio, ela processa-se ao longo de,
apenas, duas centésimas de grau. Muitas outras propriedades fı́sicas sofrem também alterações
descontı́nuas importantes neste processo, o que identifica uma transição para uma fase diferente,
chamada fase supercondutora. No lado direito da Figura 7.1 apresenta-se o comportamento da capacidade térmica com a temperatura, onde também se evidencia a discontinuidade quando T = Tc .
Na presença de um campo magnético externo, a capacidade térmica apresenta até uma singularidade infinita (ou seja, um calor latente) para T = Tc , como se verifica nas transições de fase
sólido-liquı́do ou liquı́do-gás.
A resistividade de uma substância não se torna, apenas, muito pequena na transição para
a fase supercondutora. Ela anula-se, completamente. Uma corrente eléctrica estabelecida num
anel supercondutor mantém-se indefinidamente, por vários anos, assim o demonstram todas as
experiências desenhadas para testar esta hipótese. O próprio Kamerlingh Onnes pôde verificá-lo
quando arrefeceu um anel de chumbo até atingir a fase supercondutora, na presença de um campo
magnético. Em seguida, diminuiu a intensidade do campo magnético até o anular. A variação do
fluxo magnético através do anel induziu nele uma corrente, de acordo com a Lei de Faraday. Este
fenómeno é bem conhecido, mesmo com condutores vulgares. Nun anel condutor com resistência R
e indutância L, uma corrente assim induzida decai exponencialmente, anulando-se num intervalo
de tempo de cerca de L/R. Para um anel com um metro de diâmetro e uma resistência de 0,1 Ω,
Substância
Hg
Cd
In
La
Nb
La2−x Bax CuO4
Tl2 Ba2 Ca2 Cu3 O1 0
Tc (K)
4,15
0,56
3,40
6,06
9,26
35
125
Substância
Al
Ga
Ir
Mo
Nb3 Ge
YBa2 Sr3−x Cax Cu2 O8+δ
HgBa2 Ca2 Cu3 O8+x
Tc (K)
1,20
1,09
0,14
0,92
23,0
110
164
Tabela 7.1: Temperaturas da transição para a fase supercondutora. As substâncias das duas últimas
linhas são chamadas supercondutores quentes, que foram descobertos a partir de 1986.
105
106
CAPÍTULO 7. SUPERCONDUTIVIDADE
4
0.15
3
-1
R (Ω)
-1
C (mJ mol K )
0.2
0.1
2
0.05
1
Tc
0
4.1
4.15
4.2
4.25 4.3
T (K)
4.35
4.4
0
0
0.5
1
T (K)
1.5
2
Figura 7.1: Resistência de uma amostra de mercúrio como função da temperatura, como foi observada por Kamerlingh Onnes (Commun. Phys. Lab. Univ. Leiden 12, 120, 1991) (à esquerda) e
capacidade térmica molar do alumı́nio como função da temperatura (N.E. Phillips, Phys. Rev. 114,
676 (1959)) (à direita).
este intervalo de tempo é de cerca de uma décima de milésima de segundo. No entanto, Onnes
constatou que a corrente no anel de chumbo supercondutor se manteve inalterada durante mais
do que duas horas! Uma tal lentidão na atenuação de uma corrente “transitória” só é possı́vel com
resistências da ordem dos pΩ = 10−12 Ω. Mais recentemente, foi possı́vel verificar a continuação de
uma destas correntes durante mais de dois anos! Daqui se vê que, de acordo com toda a evidência
experimental, a resistividade dos supercondutores é, de facto, nula.
Outro facto digo de nota é que as substâncias que com maior facilidade passam ao estado
supercondutor (isto é, aquelas para as quais a transição se faz a temperatura mais elevada) não
são particularmente boas condutoras à temperatura ambiente. Na mesma linha, verifica-se que
os melhores condutores à temperatura ambiente só a muito baixas temperaturas passam à fase
supercondutora. Nalguns casos (por exemplo, o do cobre e o do ouro), nem sequer se chega a
atingir essa fase, por muito que se baixe a temperatura! Isto parece indicar que a transição é
facilitada pela interacção entre os electrões de condução e os átomos da rede cristalina.
7.1
Propriedades magnéticas dos supercondutores
Uma vez que a resistividade de uma substância se anula durante a transição para a fase supercondutora, a sua condutividade cresce ilimitadamente. A lei de Ohm,
~
~j = σ E,
impõe então que o campo eléctrico no interior de um supercondutor seja nulo. Mas, se o campo
eléctrico é nulo, então o campo magnético é constante. Com efeito, de acordo com a lei de Faraday,
~
~ = − ∂B ,
rot E
∂t
resultando então, com campo eléctrico nulo, que a derivada parcial do campo mgnético se anula, ou
seja, que o campo magnético não depende do tempo. É fácil compreender de forma mais intuitiva
porque é que o campo magnético no interior de um supercondutor não depende do tempo. Tal
7.1. PROPRIEDADES MAGNÉTICAS DOS SUPERCONDUTORES
107
deve-se ao facto de qualquer variação do fluxo magnético induzir correntes no supercondutor que
imediatamente a cancelam.
Provámos, a partir das equações de Maxwell, que o campo magnético no interior de um supercondutor é constante, ou seja, não depende do tempo. Isto é verdade, mas não é toda a verdade.
Com efeito, Meissner e Ochsenfeld verificaram em 1933 que o campo magnético no interior dos
supercondutores é nulo, isto é, o módulo da indução magnética em cada ponto não é uma constante
qualquer, é zero. Este facto tem o nome de efeito de Meissner
O campo magnético anula-se no interior dos supercondutores porque se estabelecem na sua superfı́cie correntes que o magnetizam de forma tal que se cancela o campo em todos os pontos do seu
interior. Este processo tem algumas semelhanças com a distribuição de carga pela superfı́cie de um
condutor em equilı́brio electrostático na presença de um campo elécrico, de forma tal que se anula
o campo no seu interior. A magnetização gerada num supercondutor pela presença de um campo
magnético é, então, oposta ao campo que lhe dá origem. A este comportamento dá-se o nome
de diamagnetismo. É um comportamento oposto ao chamado ferromagnetismo (evidenciado pelo
ferro, por exemplo), em que a magnetização tem o sentido do campo magnetizador, reforçando-o. Uma vez que a magnetização gerada num supercondutor é tal que se anula completamente,
nos pontos interiores, o campo magnetizante, diz-se que os supercondutores são perfeitamente
diamagnéticos.
De acordo com que acabámos de discutir, quando se aproxima um ı́mane de um supercondutor,
este magnetiza-se, tendo o seu momento magnético sentido oposto ao do ı́mane. Logo, surge uma
força de repulsão entre o ı́mane e o supercondutor, que pode ser suficiente, por exemplo, para
manter o ı́mane a flutuar sobre o supercondutor, apoiado numa “almofada magnética.”
É possı́vel forçar um supercondutor a passar à fase normal, mesmo abaixo da temperatura de
transição, aplicando um campo magnético suficientemente intenso na sua vizinhança. A intensidade do campo magnético necessária para produzir este efeito chama-se valor crı́tico do campo.
Quanto maior é a temperatura do supercondutor (mas ainda abaixo da temperatura de transição,
claro) menor é o campo crı́tico. Numa aproximação muito razoável para a generalidade dos supercondutores, verifica-se a seguinte relação entre o campo crı́tico e a temperatura:
Ã
·
T
Bc (T ) = Bc (0) 1 −
Tc
¸2 !
.
(7.1)
Nesta expressão, Bc (0) representa o campo crı́tico à temperatura do zero absoluto e Tc representa
a temperatura de transição na ausência de campo.
A transição para a fase normal forçada por um campo magnético de intensidade superior à
intensidade crı́tica pode fazer-se de duas maneiras, dependendo da natureza do material usado.
Nos chamados supercondutores do tipo I, o campo magnético penetra subitamente (se a forma e a
orientação do material supercondutor forem adequadas) em todo o supercondutor, que assim passa
para a fase normal. Se a forma e a orientação não forem cuidadosamente escolhidas, pode verificarse o aparecimento de um estado intermédio, em que o material estudado fica dividido em sectores
supercondutores, onde o campo magnético é nulo, e sectores não supercondutores, penetrados pelo
campo. Nos supercondutores de tipo II, quando a intensidade do campo magnético ultrapassa um
primeiro valor crı́tico B1 , começa a penetrar no supercondutor, mas não o preenche na totalidade.
Em vez disso, estabelece-se um estado misto (com algumas semelhanças com o estado intermédio
dos supercondutores de tipo I), no qual o material se divide em zonas, com a forma de tubos
com a direcção do campo, onde se passa à fase normal, permanecendo o restante material na fase
supercondutora. À medida que aumenta a intensidade do campo magnético, a espessura destes
tubos vai também aumentando até que, para uma intensidade magnética B2 , todo o material
passa à fase normal. Note-se que enquanto uma parte de um supercondutor de tipo II permanecer
na fase supercondutora, o material como um todo continua a apresentar resistência nula. Com
efeito os tubos de fluxo (como são chamadas as regiões onde o campo penetra no supercondutor),
com resistência finita, estão em paralelo com a fracção supercondutora, com resistência nula, e o
paralelo com uma resistência nula apresenta, igualmente, resistência igual a zero.
108
7.2
CAPÍTULO 7. SUPERCONDUTIVIDADE
A Equação de London
A resistividade de um material supercondutor é, como vimos, zero. Isto leva-nos a pensar que
alguns ou todos os electrões de condução passam a poder mover-se no interior do material sem
sofrerem colisões. Na presença de um campo eléctrico, o seu movimento é, então acelerado, de
acordo com a segunda lei de Newton. Para um destes electrões supercondutores, temos
me
d~v
~
= −eE,
dt
onde me e e são, respectivamente, a massa e o módulo da carga electrónica, ~v é a velocidade do
~ o campo eléctrico. Multiplicando ambos os membros desta equação pela densidade de
electrão e E
electrões supercondutores, ns , e pela carga electrónica e recordando que ~j = −en~v é a densidade
de corrente electrónica, obtemos
d~j
ns e 2 ~
=
E,
dt
me
Se agora calcularmos o rotacional desta expressão e usarmos a Lei de Faraday, resulta
µ
¶
∂
ns e 2 ~
~
rot j +
B = 0.
∂t
me
(7.2)
Esta equação diferencial, em conjugação com a Equação de Maxwell que traduz a Lei de Ampère(a) ,
~ = µ0~j,
rot B
(7.3)
~ e a ~js . É fácil verificar que este sistema de equações admite
podem ser resolvidas em ordem a B
soluções em que o campo magnético, sendo estático, é diferente de zero. Com efeito, qualquer que
seja o campo magnético independente do tempo, a lei de Ampère (7.3) leva a que a densidade de
corrente seja também estacionária, pelo que a Eq. (7.2) fica automaticamente satisfeita. Assim,
este formalismo, deduzido a partir das equações de Maxwell, não descreve o comportamento dos
supercondutores, uma vez que não prevê o Efeito de Meissner. Esta insuficiência pode ser resolvida
impondo que a função a derivanda na Eq. (7.2) se anule, isto é,
rot ~j +
ns e 2 ~
B = 0.
me
Esta igualdade é a chamada equação de London. A equação de London descreve correctamente o
efeito de Meissner. Se calcularmos o rotacional da Eq. (7.3) e usarmos a equação de London para
eliminar a densidade de corrente, obtemos
2
~ = −µu ns e B.
~
rot rot B
me
O duplo rotacional de uma função vectorial qualquer pode ser calculado através da igualdade
~ = grad div X
~ − lap X;
~
rot rot X
no caso em estudo, esta expressão assume até uma forma mais simples porque o campo magnético
~ = 0). Obtemos então
é uma função solenoidal (div B
2
~
~ = µ0 ns e B.
lap B
me
(7.4)
Esta equação não admite soluções homogéneas não nulas. Com efeito, um campo homogéneo
tem laplaciano nulo, de forma que somente campos nulos podem satisfazer esta igualdade. Além
(a) Não se inclui nesta equação a corrente de deslocamento, 1/² ∂ E/∂t
~
porque, para simplificar, consideramos
0
apenas situações em que os campos variam lentamente com o tempo, em que é dominante a corrente de condução.
7.3. SUPERFLUIDEZ
109
disso, podemos demonstrar que o campo magnético é exponencialmente atenuado à medida que
penetra no interior de um supercondutor. Para tal, consideremos um supercondutor muito grande
com uma face plana, com a qual fazemos coincidir o plano xOy do sistema de coordenadas, com
origem (situada obviamente neste plano) muito longe dos limites desta face. Suponhamos que
o material supercondutor é tão grande que, na região da origem do sistema de coordenadas, é
razoável aproximá-lo a um material com volume infinito, que se estende indefinidamente a toda
~ e o campo magnético no exterior, isto é, nos pontos tais que z < 0, e
a região z > 0. Seja B
suponhamos que se trata de um campo uniforme. Por razões de simetria, o campo magnético no
interior do supercondutor deve ser apenas uma função da coordenada z, ou seja, da distância à
superfı́cie de separação dos dois meios. A Eq. (7.4) fica então
~
d2 B
ns e 2 ~
= µ0
B.
2
dz
me
Esta equação diferencial admite como solução geral a combinação de funções exponenciais
~
B(z)
= ~aez/λ + ~be−z/λ ,
onde λ2 = (µ0 ns e2 /me )−1 , e ~a e ~b são duas constantes vectoriais que devem ser ajustadas de
forma a que se verifiquem condições gerais de plausibilidade fı́sica e condições fronteira relevantes.
Ora, primeiro termo, afectado pela constante ~a, representa um vector cujo módulo cresce exponencial e ilimitadamente à medida que penetramos no interior do supercondutor. Esta situação
é claramente inverosı́mil, e pode ser afastada impondo ~a = 0. Por outro lado, a continuidade do
campo magnético obriga a que o limite desta solução à medida que z tende para zero (isto é, à
~ e,
medida que nos aproximamos da superfı́cie do supercondutor) seja o valor exterior do campo, B
~
~
~
~
ou seja, limz→0 B(z) = Be , condição que é satisfeita com b = Be . O campo magnético no interior
do supercondutor é então
~
~ e e−z/λ ,
B(z)
=B
verificando-se assim ser essencialmente nulo em todos os pontos do interior do supercondutor, à
excepção de uma camada superficial, cuja espessura é da ordem de grandeza de λ. Considerando
que todos os electrões de condução têm um contribuem para o comportamento supercondutor,
podemos calcular o valor deste parâmetro, usando os valores tabelados no Capı́tulo 5 e resulta
λ ≈ 150 Å. Este parâmetro tem o nome de profundidade de penetração.
7.3
Superfluidez
Como se referiu no estudo da teoria de London, a persistência, por tempo indeterminado, das correntes supercondutoras sugere que um número apreciável de electrões se movem no supercondutor
sem sofrerem qualquer resistência ao seu movimento. Neste aspecto, a supercondutividade tem
um ponto em comum com outro fenómeno verificável também a temperaturas muito baixas, o da
superfluidez do hélio. Este fenómeno foi, pela primeira vez, parcialmente identificado por McLennan, Smith e Wilhelm em 1932 e consiste numa transição de fase, que pode ser identificada, por
exemplo, pelo comportamento descontı́nuo da capacidade térmica como função da temperatura,
que está ilustrado na Figura 7.2. À temperatura da transição para a fase superfluida deu-se o nome
de ponto lambda, pela semelhança que o gráfico da capacidade térmica do hélio, na vizinhança da
transição, tem com esta letra do alfabeto grego.
As únicas substâncias que apresentam uma fase superfluida são o hélio “normal”, 4 He, e um
seu isótopo, o 3 He,(b) porque todas as outras substâncias congelam a temperaturas superiores à
da transição superfluida.
(b) A
notação
AX
explicita o número de massa, A, do elemento quı́mico X.
110
CAPÍTULO 7. SUPERCONDUTIVIDADE
CV
TΛ
T
Figura 7.2: Dependência da capacidade térmica do hélio lı́quido com a temperatura.
T > Tλ
φ1 = 0
φ2 = 0
T < Tλ
φ1
φ 2= φ
T < Tλ
1
T > Tλ
O hélio superfluido tem uma série de propriedades notáveis,
sendo a mais relevante para o nosso estudo (e aquela à qual se
deve o nome de superfluidez) a sua capacidade para fluir através de
tubos capilares com secção tão diminuta que não permitem o escoamento de hélio lı́quido na fase normal. (Estes tubos, que apenas
permitem o escoamento de hélio superfluido, chamam-se tubos supercapilares.) Este efeito pode ser posto em evidência usando dois
reservatórios contendo hélio lı́quido na fase normal, unidos por um
tubo supercapilar, como mostra a figura ao lado. Enquanto a temperatura é superior à do ponto-λ, não há escoamento entre os dois
reservatórios (figura em cima); baixando a temperatura até se dar
a transição para a fase superfluida, o hélio começa a fluir através
do tubo supercapilar, até se igualarem os nı́veis de hélio nos dois
reservatórios, altura em que se estabelece um equilı́brio dinâmico,
sendo os fluxos de hélio entre os dois reservatórios iguais (figura no
centro). Se agora aquecermos um dos reservatórios até uma temperatura superior à do ponto-λ, o hélio presente nesse reservatório
deixa de fluir para o outro, mas o fluxo inverso ainda se mantém,
φ1 > 0
φ2 = 0
subindo, portanto, o nı́vel de hélio no reservatório aquecido (figura em baixo).
A capacidade para o escoamento através de tubos supercapilares pode entender-se supondo que
o hélio superfluido tem uma viscosidade nula. No entanto, experiências de outro tipo, por exemplo,
a análise do movimento de um objecto que se mergulha em hélio superfluido, não apoiam esta
hipótese. É certo que a viscosidade de um superfluido tende para zero à medida que a temperatura
tende para zero mas tem sempre um valor finito (quando se determina a partir da queda de objectos
no fluido) a temperaturas compreendidas entre zero e a temperatura de transição.
Para compreender estes resultados aparentemente contraditórios, F. London propôs em 1938
o chamado modelo dos dois fluidos, segundo o qual a temperaturas abaixo da do ponto-λ, coexistiriam duas formas distintas de hélio: hélio numa fase lı́quida normal e hélio em fase superfluida
propriamente dita, chamado hélio-II, desprovido de viscosidade. A aparente ausência de viscosidade verificável no escoamento através de supercapilares devia-se à fracção de hélio-II, ao passo
que a que se notava na queda de objectos mergulhados se devia à componente em fase lı́quida ordinária. A proporção relativa das duas componentes dependia da temperatura, variando a fracção
de hélio-II entre 100% e 0%, quando aquela aumentava desde zero até à temperatura do ponto-λ.
A fim de percebermos porque é que o hélio-II é desprovido de viscosidade, devemos notar que
7.4. A SUPERCONDUTIVIDADE, OUTRA VEZ
111
os átomos de hélio (4 He) são bosões, logo, não são afectados pelo princı́pio de exclusão de Pauli.
Dada uma amostra de hélio, não há, pois, qualquer mecanismo que impeça os seus átomos de se
acumularem nos estados de energia mais reduzida(c) . A temperaturas muito baixas, uma fracção
apreciável dos átomos desta amostra encontra-se no estado fundamental, não podendo, assim,
participar em processos de dissipação de energia, como são os de atrito ou de viscosidade. Esta
fracção dos átomos de hélio é a que constitui o hélio-II do modelo dos dois fluidos.
Uma colecção de bosões (como os átomos de 4 He) dos quais uma percentagem apreciável
se encontra no estado fundamental chama-se um condensado de Bose-Einstein. Para além dos
exemplos fornecidos pela superfluidez do hélio 4 He e (veremos adiante os detalhes) dos electrões
supercondutores, não se conheciam outros exemplos de condensados de Bose-Einstein, até ao
ano de 1995, em que Eric Cornell e Carl Wieman (usando uma técnica de arrefecimento por
laser inventada por Steven Chu, Claude Cohen-Tannoudji e and William D. Phillips, e pela qual
ganharam prémio Nobel de 1997) conseguiram arrefecer uma nuvem de cerca de 2000 átomos
de rubı́dio até formarem um condensado de Bose-Einstein. Por este sucesso, aqueles cientistas
ganharam o prémio Nobel de 2001.
7.4
A supercondutividade, outra vez
Fizemos esta digressão pelo fenómeno da superfluidez porque, de acordo com a teoria actualmente
aceite, a supercondutividade deve-se a um comportamento superfluido dos electrões nos sólidos
a temperaturas baixas. É difı́cil, em primeira abordagem, aceitar esta possibilidade porque os
electrões de um supercondutor são fermiões, não podendo, assim, acumular-se em estados de
baixa energia. A temperaturas suficientemente baixas, os electrões organizam-se definindo uma
superfı́cie de Fermi, não um condensado de Bose-Einstein.
De facto, não são os electrões propriamente ditos a formarem um condensado de Bose-Einstein,
mas sim estados ligados de pares de electrões, que sendo formados por duas partı́culas com spin1/2, têm momento angular total inteiro (zero ou um), ou seja, são bosões. Estes pares são conhecidos como pares de Cooper.
Como podem formar-se estados ligados de dois electrões? Dois electrões livres são partı́culas
carregadas com cargas de sinal igual e, por isso, repelem-se, não formam estados ligados, para os
quais é necessária uma força atractiva! Mas acontece que os electrões num supercondutor não são
livres. Muito pelo contrário, nos materiais que passam mais facilmente à fase supercondutora, os
electrões sofrem fortes interacções com a rede cristalina, como indica o facto de não serem, em
geral, bons condutores eléctricos, na fase normal. De acordo com a teoria, a passagem de um
electrão numa região do sólido provoca ligeiros deslocamentos dos iões (que constituem o cristal
onde os electrões se movem) nessa região, provocados pelas forças com que o electrão de passagem
os atrai. Assim, essa região fica, por breves instantes, positivamente carregada e, por isso, exerce
forças de atracção sobre outros electrões na vizinhança. Deste modo, surge uma atracção efectiva
entre electrões, mediada pelas deformações do cristal, que pode, em certas condições e apenas para
certos estados electrónicos, vencer a repulsão electrostática e levar ao estabelecimento de estados
ligados, os pares de Cooper. Evidentemente, esta atracção é muito fraca, de forma que os pares
assim formados não permanecem ligados durante intervalos de tempo longos, senão a temperaturas
extremamente baixas, justamente as necessárias para a passagem à fase supercondutora.
A teoria que aqui foi sucintamente resumida está em bom acordo com os factos experimentais(d) . Os principais responsáveis pelo seu desenvolvimento até à forma presente foram J. Bardeen,
L. Cooper e J. Schrieffer, cujos esforços foram premiados com a atribuição conjunta do prémio
Nobel de 1972.
(c) Repare-se que não nos referimos aqui, quando falamos de estados, aos estados quânticos dos electrões que
integram os átomos de hélio, mas sim aos estados quânticos dos próprios átomos, vistos como partı́culas elementares
(as energias envolvidas na transição para a fase superfluida são muito menores do que as necessárias para excitar
os graus de liberdade internos a cada átomo), descritas por uma equação de Schrödinger própria.
(d) Isto não é totalmente verdade no que se refere aos supercondutors “quentes,” aqueles cuja temperatura de
transição é superior à temperatura de ebulição do azoto, 77,4 K.
112
7.5
CAPÍTULO 7. SUPERCONDUTIVIDADE
Aplicações da supercondutividade
A maioria das possı́veis aplicações da supercondutividade são as que resultam do facto de um
supercondutor apresentar resistência nula. Com efeito, se se pudesse “desligar” o efeito de Joule
no transporte de electricidade, usando linhas de distribuição supercondutoras, grandes economias
seriam realizadas. Claro que o arrefecimento e a manutenção da baixa temperatura de várias toneladas de cabo, extendidas ao longo de dezenas ou centenas de qilómetros, coloca outros problemas
e envolve outros custos... Por enquanto, continua a ser mais barata a factura do efeito de Joule.
O efeito de Joule não se limita a implicar custos, por vezes estabelece limites para o rendimento de máquinas. O exemplo mais simples é o das bobines para gerar campos magnéticos. A
intensidade do campo gerado por um solenóide é proporcional à corrente que o percorre. Mas a
potência dissipada pelo solenóide é proporcional ao quadrado da corrente. Então, quanto mais
intenso o campo gerado, mais potência é dissipada pelo solenóide. Esta potência manifesta-se num
aquecimento que pode levar à fusão do condutor usado. Este facto obriga à utilização de solenóides
constituı́dos por condutores muito espessos (logo, muito caros). Outra possibilidade é a utilização
de solenóides supercondutores com resistividade nula. Já não se coloca aqui, pelo menos com a
mesma gravidade, o problema da extensão espacial do condutor a que nos referimos no parágrafo
anterior. É, então, comparativamente simples arrefecer um solenóide, mesmo que tenha dimensões
avantajadas, e tais solenóides supercondutores são usados para gerar os campos magnéticos que
orientam os feixes de protões e antiprotões no Tevatron, o acelerador de partı́culas mais poderoso
da actualidade (2005), instalado no Fermilab, nos Estados Unidos da América. Esta tecnologia
será igualmente usada no Large Hadron Collider do CERN que, em Junho de 2007, entrará em
funcionamento. A facilidade da geração de campos intensos usando solenóides supercondutores
será também, concerteza, aproveitada nos estudos experimentais da fusão nuclear. Outro campo,
mais relacionado com o nosso dia a dia, onde esta possibilidade é utilizada é no da imagiologia
médica, nalguns aparelhos de ressonância magnética nuclear.
Outras aplicações da supercondutividade não estão tão relacionadas com a propriedade fundamental da resistividade nula. Em particular, refiram-se as que utilizam as chamadas junções
de Josephson, que são constituı́das por dois supercondutores separados por uma camada isolante
muito fina, capaz de permitir a passagem, por efeito de túnel, da corrente supercondutora. As
junções de Josephson são usadas para medir campos magnéticos com enorme precisão (em dispositivos chamados SQUID’s, Superconductor QUantum Interference Devices). São também usadas
na definição da unidade SI de diferença de potencial.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989), capı́tulo 13 (F5.0
437 +)
• K. Mendelsson, “Em demanda do Zero Absoluto” (1968), capı́tulos 9 e 10 (mas leiam o resto
também!)
• F. Blatt, “Modern Phisics” (1992), secções 13.5 (supercondutividade) e 11.4 (superfluidez)
(F5.0 448 +)
PROBLEMAS
7.1 Considere um anel condutor com resistência R e indutância L. Suponha que induz neste condutor
uma corrente transitória que num instante t = 0 tem o valor i0 . Como é que esta corrente evolui
temporalmente?
7. Problemas
7.2 Num cilindro isolador com 50 mm de raio, enrola-se um sistema de bobines de Helmholtz (duas
bobines circulares, separadas por uma distância igual ao seu raio), cada uma das quais constituı́da
por apenas uma espira de fio de chumbo. O diâmetro do fio condutor usado é 1 mm. Funcionando
mergulhado num banho de hélio lı́quido a 4,2 K, qual o valor máximo da corrente para a qual as
bobines permanecem na fase condutora? Qual o valor máximo do campo criado no ponto central
entre as duas espiras?
7.3 A temperatura crı́tica do alumı́nio é 1,140 K, ao passo que o valor crı́tico do campo magnético
é 0,0105 T. Qual o maior valor da corrente (distribuı́da uniformemente) que pode percorrer um
condutor de alumı́nio com secção transversal circular com um raio de 2 mm, a uma temperatura
de 0,5 K?
7.4 O vanádio tem uma temperatura crı́tica de 5,4 K e um campo crı́tico a 0 K de 0,14 T. Determine
o valor do campo magnético que destrói a fase supercondutora do vanádio a uma temperatura de
4,3 K.
7.5 O campo crı́tico para o chumbo tem um valor de 0,0803 T e uma densidade electrónica de
13,2×1028 m−3 . Calcule a profundidade de penetração do campo magnético em chumbo supercondutor e determine a densidade de corrente que se estabelece na superfı́cie de uma amostra
de chumbo supercondutor na presença de um campo com intensidade de 0,03 T
113
Capı́tulo 8
Fı́sica Nuclear I — Propriedades
do núcleo atómico
Chegou a altura de abandonarmos o estudo dos sólidos para nos dedicarmos a outro tipo de
sistemas de muitos corpos, os núcleos atómicos.
É interessante notar que a Fı́sica dos Sólidos e a Fı́sica Nuclear são talvez os dois ramos da Fı́sica
que mais impacto tiveram no desenvolvimento da sociedade ocidental do Séc. XX. A primeira,
porque possibilitou o desenvolvimento da electrónica sem a qual a revolução informática e das
telecomunicações não teria ocorrido; a segunda, não tanto pelas suas aplicações benéficas (que são
muitas, como a radioterapia, algumas técnicas imagiológicas de diagnóstico, a datação de vestı́gios
arqueológicos por determinação do teor de carbono-14, etc.), mas principalmente porque permitiu
o desenvolvimento de armas de destruição maciça, com um poder capaz de destruir a civilização,
que determinaram as polı́ticas mundiais durante a chamada guerra fria, na segunda metade do
Séc. XX. Apesar de ter terminado a guerra fria, a mera existência dessas armas continua a colocar
sérios problemas de segurança, que não podem ser tomados de ânimo leve pelos responsáveis
polı́ticos.
8.1
Núcleo atómico — Generalidades
Como vimos na Secção 1.1.2, o núcleo atómico é a região central do átomo, com carga eléctrica de
sinal positivo, onde se concentra a quase totalidade da massa atómica(a) . Os núcleos atómicos de
todas as substâncias têm uma carga múltipla da do de hidrogénio, o que sugere que os núcleos são
estruturas compostas por partı́culas elementares, os protões. O núcleo dos átomos de hidrogénio
será então a mais simples destas estruturas, consistindo apenas em um protão. Como também
discutimos no Secção 1.1.2, para compreender os valores da massa e do momento angular dos
diferentes núcleos, é necessário considerar ainda uma segunda partı́cula elementar, o neutrão. A
Tabela 8.1 apresenta o valor de algumas propriedades destas duas partı́culas. Chamamos nucleão
protão
neutrão
massa (u)
1,00728
1,00866
carga eléctrica
e
e
spin
1/2
1/2
Tabela 8.1: Valores da massa, da carga eléctrica (e = 1,022×10−19 C é o simétrico da carga
electrónica) e do spin dos protões e dos neutrões.
a qualquer destas duas partı́culas.
(a) 99,95%,
no átomo de hidrogénio, mais ainda nos restantes.
115
116
CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO
Ao número total de nucleões num núcleo dá-se o nome de número de massa; ao número
de protões, número atómico (b) . Dois núcleos com iguais números de protões e de neutrões são
idênticos (não considerando a possibilidade de um deles estar num estado excitado); dizemos que
pertencem ao mesmo nuclı́deo. Um determinado nuclı́deo é então especificado indicando o seu
número de protões e de neutrões. Como o primeiro destes números identifica a espécie quı́mica,
resta apenas indicar o número de neutrões ou, mais frequentemente, o número de massa. A notação
habitual consiste em preceder o sı́mbolo quı́mico com o número de massa, sobreescrito. Facultativamente, pode explicitar-se o número atómico em subscrito, precedendo também o sı́mbolo
quı́mico, e o número de neutrões, subscrito, após o sı́mbolo quı́mico. Assim, por exemplo, todas
as seguintes notações identificam um mesmo nuclı́deo do cloro, aquele que tem número de massa
igual a trinta e cinco:
35
Cl
35
17 Cl
35
17 Cl18
Dois nuclı́deos com o mesmo número de massa chamam-se isóbaros; quando têm iguais números
atómicos, chamam-se isótopos; finalmente, chamam-se isótonos aqueles com iguais números de
neutrões. Assim, o 12 C e o 14 C são isótopos; o 14 C e o 16 O são isótonos; o 14 C e o 14 N são
isóbaros.
O núcleo atómico é então um agregado de nucleões, de dimensões extremamente reduzidas, da
ordem de, apenas, alguns fentometros(c) . Por serem tão pequenos, a forma dos núcleos não pode
ser determinada directamente, mas podem obter-se algumas indicações a partir da distribuição de
carga eléctrica nuclear (que, por seu turno, pode ser avaliada a partir de experiências de dispersão
de electrões de muito alta energia). Deste tipo de estudos, pode concluir-se que os núcleos têm
formas muito aproximadamente esféricas, verificando-se também núcleos com deformações oblatas
(como a da Terra, a das tangerinas ou, ainda, num exemplo mais extremo, a das pizzas) e com
deformações prolatas (como a das bolas de rugby ou a dos charutos).
8.2
A massa nuclear e a energia de ligação
A massa nuclear é uma quantidade apropriada para ilustrar a equivalência massa-energia expressa
na famosa equação E = mc2 da teoria da relatividade restrita. Tomemos, por exemplo, o caso do
hélio-4. Os núcleos de hélio-4 são constituı́dos por dois protões e dois neutrões e tem uma massa
de 4,0015 u; a soma das massas dos quatro nucleões que o formam, em contrapartida, tem o valor
de 4,0319 u. A diferença entre estes dois valores corresponde à energia de ligação, que é libertada
no momento em que os quatro nucleões se juntam.
É melhor estudarmos esta questão com um pouco mais de atenção. Antes de ser proposta a
teoria da relatividade, eram tomadas como verdadeiras duas leis de conservação independentes,
a da massa (que se devia a Lavoisier) e a da energia (que foi sendo refinada ao longo dos anos
até ser enunciada na forma da primeira lei da Termodinâmica). Supunha-se, então, que quando o
estado de um sistema isolado evoluı́a entre dois instantes ti e tf > ti , eram satisfeitas, de forma
independente, as igualdades
M (ti ) =
M (tf )
E(ti ) =
E(tf ),
onde M (t) e E(t) representam, respectivamente, a massa e a energia do sistema como funções do
tempo. Sabemos agora que a primeira destas igualdades não é, em geral, exactamente satisfeita.
Verifica-se, sim, a segunda mas, no cálculo da energia total de um sistema, devemos incluir a sua
energia de repouso, dada por
ERep. = M c2 ,
onde c = 3 × 108 m/s é a velocidade da luz e M é a massa do sistema.
(b) Por
(c) Um
último, ao número de neutrões num núcleo dá-se o nome de... bem, número de neutrões.
fentometro, mais habitualmente designado por fermi, é 10−15 m.
8.3. A FORÇA NUCLEAR FORTE
117
Voltemos agora ao exemplo do 4 He. Imaginemos que fornecemos, a um núcleo de 4 He, uma
quantidade de energia, B, apenas suficiente para separar os quatro nucleões que o constituem, e
analisemos este processo em termos da conservação de energia. Inicialmente, temos um núcleo de
hélio-4 e uma quantidade de energia B. A energia inicial total é, então,
E(ti ) = M
¡4
¢
He c2 + B,
¡
¢
onde M 4 He representa a massa do núcleo em estudo. No final, temos dois protões e dois neutrões
afastados uns dos outros, em repouso. A energia final é, pois,
E(tf ) = 2(mN + mP )c2 ,
onde mN e mP representam, respectivamente, as massas do neutrão e do protão. Igualando estes
dois valores, de acordo com o prı́ncipio da conservação da energia, obtemos
£
¡
¢¤
B = 2(mP + mN ) − M 4 He c2
o que explicita, de forma mais fundamentada, o que há pouco dissemos sobre esta diferença de
massas. Este cálculo pode ser repetido para qualquer núcleo, o que nos permite definir, em geral,
a energia de ligação num dado nuclı́deo arbitrário A
Z XN como
B
¡A
Z XN
¢
£
¡
¢¤
= c2 N mN + ZmP − M A
.
Z XN
A energia de ligação por nucleão (isto é, a energia de ligação cada núcleo dividida pelo seu
número de massa) é, tipicamente, cerca de alguns MeV(d) . Por esta razão, usa-se em Fı́sica Nuclear, como unidade de massa, o Mev/c2 , cuja relação com a unidade de massa atómica e com o
quilograma é
1 MeV/c2 = 1,07354 × 10−3 u = 1,78266 × 10−30 kg.
Frequentemente, não se explicita o factor c2 na unidade, aparecendo a unidade como “MeV”
apenas. Esta notação pode confundir um principiante, mas quaisquer dúvidas podem ser resolvidas
rapidamente com análise dimensional.
A energia de ligação por nucleão, dada por
b(A, Z) = B(A, Z)/A,
pode ser facilmente calculada dispondo-se de uma tabela de massas nucleares ou atómicas, como
a que se pode consultar no Apêndice B do Blatt[1992]. Os resultados que se obtêm para os
nuclı́deos estáveis(e) são os apresentados na Figura 8.1. Como se pode constatar, a partir de
valores relativamente moderados do número de massa (A ≈ 25), a energia de ligação por nucleão
apresenta um valor aproximadamente constante de cerca de 8 MeV.
8.3
A força nuclear forte
A força responsável pela coesão dos núcleos não é, com certeza, uma força de natureza eléctrica ou
gravı́tica. Não pode ser uma força eléctrica porque confina no interior do núcleo os neutrões, que
são electricamente neutros. Não é, também, uma força gravı́tica porque esta não é suficientemente
intensa para vencer a repulsão electrostática entre os protões que constituem os núcleos. É uma
força de um tipo novo, a que se deu o nome de força nuclear forte ou, simplesmente, força forte,
que apresenta uma série de caracterı́sticas especiais.
(d) 1 MeV
(e) Mais
= 106 eV = 1, 602 × 10−13 J.
adiante veremos que nem todos os nuclı́deos são estáveis.
118
CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO
BA HMeVL
8
6
4
2
50
100
150
200
A
Figura 8.1: Energia de ligação por nucleão (em MeV) como função do número de massa, para os
nuclı́deos estáveis.
8.3.1
Saturação
Num sistema de N corpos estabilizado pela força eléctrica (como o átomo) ou pela força gravı́tica
(como o sistema solar), a energia potencial total é
N
U=
1X
Vij ,
2
i6=j
onde Vij é a energia de interacção entre as partı́culas i e j (f) . Admitindo que esta energia tem um
valor médio Ṽ , ficamos com
1
U = Ṽ N (N − 1).
2
A energia de ligação por partı́cula é, então,
u≡
U
1
= Ṽ (N − 1).
N
2
Vemos assim que a energia média de ligação por constituinte de um sistema eléctrico ou gravı́tico
é uma função aproximadamente linear do número de constituintes do sistema. Ora, o mesmo não
acontece com o núcleo. Como se mostra na Figura 8.1, a energia de ligação por nucleão tem um
valor aproximadamente constante. Tal pode ser explicado admitindo que a força nuclear satura,
isto é, que cada nucleão pode apenas interagir com um número finito de outros nucleões. Se cada
nucleão, dos A que constituem um núcleo, interagir, apenas, com R outros nucleões, com uma
energia média Ṽ , a energia total de ligação é, aproximadamente,
A
B=
R
1
1 XX
Ṽ = Ṽ AR.
2 i=1 j=1
2
(f) Inclui-se o factor 1/2 para corrigir a contagem das interacções. Com efeito, para calcular bem a energia potencial
total, devemos contar apenas um vez cada uma das interacções entre as partı́culas que formam o sistema, ou seja,
devemos contar apenas uma vez cada par de partı́culas. Ora, o somatório nesta equação faz aparecer cada par duas
vezes, à medida que i e j correm todos os valores possı́veis de 1 a N .
8.3. A FORÇA NUCLEAR FORTE
119
R(fm)
208Pb
7
150Nd
138Ba
109Ag
6
66Zn
56Fe
5
89Y
36Ar
23Na
16O
12C
4
3
2
1
A1/3
0
0
1
2
3
4
5
6
Figura 8.2: Raio nuclear como função da raiz cúbica do número de massa.
A energia de ligação por nucleão fica então
B/A =
1
Ṽ R,
2
uma constante independente do número de massa A.
Outro indı́cio desta saturação da força forte é o facto da densidade nuclear ser praticamente a
mesma para todos os nuclı́deos. A Figura 8.2 mostra o raio nuclear como função da raiz cúbica
do número de massa. Nota-se claramente a relação de proporcionalidade
R = R0 A1/3 ,
(8.1)
com R0 ' 1,25 fm, de onde se conclui que o número de massa é proporcional ao volume nuclear.
Num sistema em que cada partı́cula interage com todas as restantes a intensidade da ligação é
tanto maior quanto maior for o número de partı́culas, e portanto esperamos que a densidade dos
sistemas “grandes” seja maior que a dos sistemas “pequenos”. Por exemplo, consideremos os
átomos, sistemas geridos pela interacção electromagnética; aı́, não se verifica a proporcionalidade
do raio do sistema (raio atómico) com a raiz cúbica do número de partı́culas (número atómico).
Antes pelo contrário, à parte a descontinuidade que ocorre de cada vez que se fecha uma camada,
verifica-se que o raio atómico diminui com o aumento do número atómico, aumentando, portanto,
a densidade. O aumento da densidade com o aumento do número de partı́culas verifica-se também
nos sistemas gravı́ticos, onde se nota que a densidade das estrelas de maior massa é maior que a
das estrelas mais leves.
8.3.2
Alcance
Ao contrário das interacções electromagnéticas e gravı́ticas que se fazem sentir a distâncias muito
grandes, a força forte tem um alcance muito reduzido. Esta conclusão pode retirar-se da análise
dos resultados de experiências de dispersão de partı́culas α de alta energia por átomos, semelhantes
à experiência de Rutheford.
Na experiência de Rutheford, a energia das partı́culas α incidentes determina a profundidade
com que conseguem penetrar no interior do átomo. De facto, a energia potencial eléctrica da
120
CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO
Intensidade (unidades relativas)
1000
100
10
1
10
15 20 25 30 35 40
Energia das partículas α (MeV)
45
Figura 8.3: Intensidade de um feixe de partı́culas α, difractado segundo um ângulo de 60◦ por um
alvo de átomos de chumbo 208 Pb, como função da energia do feixe incidente. Os valores experimentais
estão representados por cruzes e a linha representa o resultado de um cálculo considerando apenas a
interacção electrostática entre o núcleo e a partı́cula α. (Krane[1988], Fig. 3.11).
interacção entre uma partı́cula α e o núcleo de um átomo com o qual colide é (tomando a partı́cula α
como pontual)
1 2Ze2
V =
,
4π²0 r
onde r é a distância que separa a partı́cula α do centro do átomo, Z é o número atómico dos
átomos que constituem o alvo, e o módulo da carga electrónica e ²0 é a permitividade eléctrica do
vazio. Considerando, para maior simplicidade, que o núcleo alvo tem uma massa muito maior que
a da partı́cula α incidente, de tal modo que se possa desprezar o efeito do seu recuo na colisão, o
maior valor que esta energia pode tomar é o da energia total, E, com que a fonte de partı́culas α
as anima. Logo, partı́culas α com energia E podem aproximar-se até uma distância
r=
1 2Ze2
4π²0 E
(8.2)
do centro atómico.
Tentemos interpretar, à luz desta relação, os resultados experimentais relativos à dispersão
de partı́culas α por átomos de chumbo 208 Pb, apresentados na Figura 8.3. Nesta figura, notase claramente que, quando a energia das partı́culas α não excede um valor de cerca de 27 MeV,
as medições experimentais (cruzes) estão em bom acordo com os valores teoricamente previstos,
considerando apenas a interacção coulombiana entre os núcleo e as partı́culas α. Esta convergência
entre valores teóricos e experimentais mostra que a força forte entre o núcleo dos átomos de chumbo
e as partı́culas α não tem qualquer papel na dispersão destas partı́culas, ou seja, elas não a sentem.
A distância mı́nima entre projécteis e alvo é, para partı́culas α com 27 MeV, cerca de 8,5 fm(g) .
Assim, concluı́mos que a força forte não actua a distâncias de cerca de 8 fm ou superiores. Cálculos
mais precisos mostram que o alcance da força forte é de cerca de 2 a 3 fentometro.
(g) Este valor resulta da aplicação Eq. (8.2). Em rigor, esta fórmula só é válida para partı́culas α que sofrem colisões
frontais com os núcleos dos átomos do alvo e que, consequentemente, são desviadas de 180◦ (backscattering). Ora,
os dados que usamos são relativos a partı́culas α que são desviadas de 60◦ . Estas partı́culas não se aproximam
tanto do centro do núcleo com o qual colidem.
8.3. A FORÇA NUCLEAR FORTE
121
-0.1
A = 19
A = 25
A = 31
A = 37
-0.15
ε (GeV)
-0.2
-0.25
-0.3
-0.35
-0.4
5
10
15
20
Z
Figura 8.4: Energia de ligação subtraı́da da energia electrostática (calculada supondo o núcleo como
uma esfera uniformemente carregada), para diferentes números de massa, A, como função do número
atómico. Verifica-se, em cada sequência, que os valores obtidos para núcleos espelho (assinalados
com as setas) são praticamente iguais.
Para energias superiores, a proximidade máxima entre as partı́culas α e os núcleos de chumbo
já é tal que a força forte contribui para o desvio do feixe incidente, afastando-se assim os resultados
experimentais da previsão teórica.
8.3.3
Independência da carga
Núcleos com o mesmo número de massa e com os números de protões e de neutrões trocados
chamam-se núcleos espelho. Por exemplo, o 31 H e o 32 He são núcleos espelho. Outros exemplos são
53
53
63
o do 63
31 Ga e 32 Ge ou o do 28 Ni e 25 Mn. Quando subtraı́mos à massa de dois núcleos espelho a massa
dos nucleões que os constituem e a massa correspondente à energia de repulsão electrostática entre
protões, obtemos valores que são muito parecidos, como se pode verificar analisando a Figura 8.4.
Deste facto podemos concluir que a força forte prende com a mesma força os protões e os neutrões,
isto é, não depende da carga dos nucleões. Uma conclusão semelhante pode deduzir-se da análise
de experiências de dispersão.
8.3.4
O deuterão e a dependência do spin
Podemos obter mais informação sobre as caracterı́sticas da força nuclear considerando o mais
simples dos núcleos compostos, o deuterão. O deuterão é o único núcleo com dois nucleões, sendo
constituı́do por um protão e por um neutrão. A sua energia de ligação é de, apenas, 2,2 MeV e o
seu momento angular total (que resulta da soma dos momentos angulares orbitais e dos spins dos
dois nucleões) é 1(h) . Como não há outros núcleos compostos por dois nucleões, concluı́mos que o
deuterão é o estado fundamental do sistema nuclear de dois corpos. Mas o estado fundamental de
um sistema de dois corpos é um estado com momento angular orbital l = 0(i) (como o nı́vel 1-s
do átomo de hidrogénio), logo, sendo 0 o momento angular orbital deste sistema, concluı́mos que
(h) Estamos
aqui a cometer um (muito habitual) abuso de linguagem. Aquilo que, de facto, queremos
dizer é que
p
√
j = 1 é o número quântico de momento angular; o módulo do momento angular do deuterão é h̄ (j(j + 1)) = h̄ 2.
(i) Isto só é verdade quando a força entre os dois corpos é uma força radial, isto é, dirigida segundo a direcção do
segmento de recta que os une. O estudo das propriedades do deutrão mostra que a força nuclear viola ligeiramente
esta condição, traduzindo-se este facto numa ligeira “contaminação” da função de onda do deutério por componentes
com momento angular orbital l = 2.
122
CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO
o momento angular total j = 1 apresentado pelo deuterão se deve a um alinhamento dos spins do
protão e do neutrão.
A força nuclear entre dois nucleões é, então, tal, que apenas se formam estados ligados quando
os seus spins estão alinhados, de maneira a formar estados com momento angular orbital nulo, mas
momento angular total igual a um. Isto mostra claramente que a força nuclear depende fortemente
do spin das partı́culas em interacção.
8.4
8.4.1
Dois modelos para estrutura do núcleo
O modelo da gota lı́quida
O facto de a força nuclear ter um alcance limitado e ser uma interacção que satura, bem como o
facto de a densidade nuclear ser constante, leva-nos naturalmente a pensar num núcleo atómico
como uma gota de água. Com efeito, a água é um lı́quido essencialmente incompressı́vel, ou seja,
tem densidade constante. Assim, o volume de uma gota é proporcional ao número de moléculas
de água que a formam, o que leva a uma relação entre o raio da gota e o número de moléculas
semelhante à Eq. (8.1).
Considerando a dinâmica de uma gota de lı́quido, von Weizsäcker propôs a seguinte fórmula
para a energia de ligação nuclear:
B = x1 A − x2 A2/3 − x3 − x3 Z(Z − 1)A−1/3 − x4
(A − 2Z)2
+ δ(A, Z).
A
(8.3)
Os coeficientes x1 , . . . , x4 e a função δ(A, Z) são ajustados de forma a obter um bom acordo com
a experiência. Uma escolha possı́vel é
x1 = 15,5 MeV
x3 = 0,72 MeV
e

 x5 A−3/4 ,
0,
δ(A, Z) =

−x5 A−3/4 ,
x2 = 16,8 MeV
x4 = 23,0 MeV
se Z e N forem pares
se A for ı́mpar
se Z e N forem ı́mpares,
com x5 = 34 MeV. Justifiquemos agora os vários termos na Eq. (8.3):
Termo de volume: o primeiro termo na fórmula de Wizsäcker é proporcional ao número de
nucleões, ou seja proporcional ao volume. Supõe-se que quanto maior o número de partı́culas
num sistema em que interagem atractivamente, maior a energia de ligação
Termo de superfı́cie: o segundo termo é proporcional à potência 2/3 do número de partı́culas.
Dada a Eq. (8.1), este termo é proporcional ao quadrado do raio atómico, ou seja, proporcional à área da superfı́cie do núcleo. Este termo é negativo, o que significa que se subtrai
à energia de ligação. Basicamente, este termo favorece a forma esférica, que é a que menor
área superficial apresenta para um dado volume.
Termo de Coulomb: este termo toma conta do facto de a repulsão electrostática entre os protões
no núcleo contribuir para diminuir a energia de ligação. Note-se que Z(Z − 1) é o número
de pares de protões e A−1/3 é proporcional ao inverso do raio nuclear.
Termo de simetria: este termo é mı́nimo quando os números de protões e de neutrões são iguais,
e é incluido para reflectir o facto de os núcleos mais estáveis apresentarem um equilı́brio
aproximado dos números dos dois tipos de nucleão. Veremos melhor daqui a pouco o porquê
deste facto.
Termo de emparelhamento: acontece que a força nuclear favorece o emparelhamento de nucleões do mesmo tipo. Em geral são mais estáveis os núcleos em que os números de neutrões
e de protões são pares.
Esta fórmula semi-empı́rica produz resultados notavelmente próximos dos valores experimentais.
8.4. DOIS MODELOS PARA ESTRUTURA DO NÚCLEO
123
10
50
82
Número de nuclídeos estáveis
Número de nuclídeos estáveis
12
20 28
8
126
6
4
2
0
20
28
50
82
10
8
6
4
2
0
0
20
40
60
80
100
Número de neutrões
120
140
0
10
20
30
40
50
60
Número de protões
70
80
90
Figura 8.5: Número de núclideos estáveis como função do número de neutrões (à esquerda) e do
número de protões (à direita). Nota-se bem (pelo menos no gráfico da esquerda) que os máximos
ocorrem quando estes números são números mágicos.
8.4.2
Modelo em camadas
Muitas propriedades atómicas, vistas como funções do número atómico, sofrem variações muito
bruscas quando aquele número toma os valores 2, 10, 18, 36, 54, e 86. Dois exemplos deste efeito
foram apresentados na Figura 1.9. Como vimos no primeiro capı́tulo, estas variações bruscas
verificam-se quando se completam camadas na estrutura electrónica. Na fı́sica nuclear verificam-se também variações bruscas dos valores das propriedades fı́sicas do núcleo, quando os números de
protões e/ou neutrões tomam os valores 2, 8, 20, 28, 50, 82, 126, chamados os números mágicos. Por
exemplo, há mais nuclı́deos estáveis quando o número de neutrões é um número mágico, como se
pode verificar analisando a Figura 8.5. O mesmo se verifica, mas de forma menos evidente, quando
se considera o número de protões. Outras propriedades fı́sicas apresentam descontinuidades quando
um dos (ou ambos) números de nucleões é um número mágico. Este facto inspirou um modelo da
estrutura nuclear semelhante ao da estrutura atómica, segundo o qual cada nucleão se move sujeito
a um potencial efectivo médio, relativamente independente das particularidades do movimento
dos restantes nucleões. A interacção entre diferentes nucleões manifesta-se apenas na definição do
potencial nuclear médio. Cada nucleão move-se em função desse potencial, independentemente
dos demais. Isto permite grandes simplificações no tratamento matemático do sistema nuclear.
Por exemplo, a Equação de Schödinger de um núcleo com número de massa A pode decompor-se
em A equações de partı́cula única, uma para cada nucleão no sistema, com a forma
ih̄
∂ψ(~r, t)
h̄2 2
=−
∇ ψ(~r, t) + Vef (~r)ψ(~r, t),
∂t
2m
onde Vef (~r) é o potencial nucelar médio.
Não se conhece ao certo, mesmo para os núcleos mais simples (como o deuterão, constituı́do
apenas por um protão e um neutrão), a expressão analı́tica do potencial nuclear médio. Ou seja,
não dispomos do equivalente a uma “Lei de Coulomb” na fı́sica nuclear. É possı́vel justificar a
priori várias formas diferentes, que são, a posteriori, avaliadas em função da comparação dos
resultados obtidos com valores experimentais. A prática mostra que um simples poço de potencial
rectangular finito,
½
0
se r > R0
Vppr (~r) =
−V0
se r < R0 ,
onde R0 é o raio nuclear e V0 é a energia de ligação por nucleão, permite justificar algumas
propriedades nucleares (por exemplo, os valores dos números mágicos 2, 8, 20,2 8, 50, 82, 126).
Um outro modelo, mais sofisticado, é o de Saxon-Woods, em que o potencial médio é
VSW (r) =
−V0
,
1 + e(r−R0 )/a
124
CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO
0
V(r)
r
R0
-V0
Figura 8.6: Potencial nuclear rectangular (a tracejado) e potencial de Saxon-Woods (a cheio).
P
N
2
H
P
N
3
H
P
N
3
He
P
N
4
He
P
N
7
Li
Figura 8.7: Digramas de ocupação de nı́veis nucleares para alguns nuclı́deos de baixo número de
massa.
onde a é uma medida da expessura da fronteira do núcleo. Na Figura 8.6 apresentam-se os gráficos
destas duas funções. Há muitas outras propostas para o potencial nuclear médio, com diferentes
qualidades na capacidade de descrever o núcleo e as suas propriedades. As duas que apresentámos
são, apenas, as mais simples.
Feita uma escolha para o potencial nuclear, a resolução da Equação de Schrödinger permite-nos
determinar os estados nucleónicos, ou seja as orbitais que serão ocupadas pelos diferentes nucleões,
da mesma maneira que a resolução da Equação de Schrödinger do átomo de hidrogénio nos fornece
as orbitais electrónicas. Uma diferença importante entre estes dois exercı́cios é que, ao contrário
do que acontece na nuvem electrónica, o núcleo é partilhado por dois tipos diferentes de fermiões,
os protões e os neutrões. Os dois tipos de nucleões devem satisfazer, separadamente, o Princı́pio
de Exclusão de Pauli. Devemos então concluir que há orbitais de protão e orbitais de neutrão,
nı́veis de energia de protão e nı́veis de energia de neutrão. A Figura 8.7 mostra um esquema de
ocupação de nı́veis para alguns nuclı́deos de baixo número de massa.
Podemos agora colocar a seguinte questão: se a força nuclear forte não depende da carga, isto
é, se a força nuclear forte não distingue protões de neutrões, porque é que não existem outros
estados ligados de dois nucleões? Mesmo aceitando a que a repulsão electrostática inviabilize os
“diprotões”, porque é que não são possı́veis “dineutrões”? Estes estados não são possı́veis por
causa do Princı́pio de Exclusão de Pauli. Os dois nucleões num “dinucleão” devem estar no estado
fundamental, logo, devem ter momento angular orbital l = 0 (tal como na fı́sica atómica, no estado
fundamental o número quântico de momento angular só pode tomar o valor l = 0), logo, ambos
têm número quântico de projecção de momento angular ml = 0; além disso, devem ter os spins
alinhados no mesmo sentido, porque a força nuclear depende do spin e só com os spins alinhados
é atractiva a força entre dois nucleões. Temos então dois nucleões no mesmo estado, com números
quânticos n = 1, l = 0, ml = 0, ms = 1/2. De acordo com o Princı́pio de Exclusão de Pauli, isto
8. Problemas
125
só pode acontecer se os dois nucleões não forem idênticos, ou seja, se um for um protão e o outro
um neutrão.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• P. Tipler e R. Llewellyn, “Fı́sica Moderna” (3.a edição), Capı́tulo 11: Fı́sica Nuclear
• F. Blatt, “Modern Phisics” (1992) Capı́tulo 14: Propriedades dos Núcleos (F5.0 448)
• R. Serway e R. Beichner, “Physics” (5.a edição), Capı́tulo 44: Estrutura Nuclear
PROBLEMAS
8.1 Quais os valores dos números de massa, atómico e de neutrões para os nuclı́deos indicados abaixo?
18
F,
25
Na,
51
V,
84
Kr,
120
Te,
148
Dy,
175
W,
222
Rn.
8.2 Electrões emitidos no decaimento-β têm energias até cerca de 1 MeV. Usando o Princı́pio da
Incerteza, mostre que eles não podiam existir no núcleo antes do decaimento.
8.3 Escreva os sı́mbolos de dois isótopos, de dois isótonos e de dois isóbaros dos nuclı́deos
120
Sn.
8.4 Determine as energias de ligação dos seguintes isóbaros:
23
Ne,
23
Mg,
23
18
F, 208 Pb,
Al.
8.5 Repita o problema anterior, mas usando agora a fórmula de Weizsäcker.
8.6 Algumas estrelas podem, numa fase final das suas existências, sofrer um processo cataclı́smico em
que se dá uma captura electrónica generalizada, processo que será estudado no próximo capı́tulo
destes apontamentos. O astro resultante deste processo é composto quase só por neutrões e a
sua densidade é muito aproximada à densidade nuclear. Calcule o raio de uma estrela de neutrões
com massa igual à do sol, cerca de 2×1030 Kg.
8.7 O spin do estado fundamental do 6 Li, que constitui 7,5% do lı́tio natural, é nulo. Mostre que este
valor é incompatı́vel com a hipótese de que os neutrões são pares protão-electrão.
Capı́tulo 9
Fı́sica nuclear II — Reacções
nucleares
9.1
Radioactividade
Dos cerca de três mil nuclı́deos conhecidos, somente 278 são estáveis. Todos os restantes têm
tendência para, de algum modo, se modificarem, transformando-se em núcleos de outra espécie.
Este processo, que é expontâneo, chama-se decaimento nuclear e é acompanhado de emissão de
radições. É o decaimento nuclear que está por trás do fenómeno da radioactividade, cuja descoberta
por Becquerel em 1897 iniciou o estudo da Fı́sica Nuclear, numa altura em que quase nada se sabia
ainda sobre a estrutura atómica.
Os elementos cujos átomos têm núcleos instáveis chamam-se radioactivos. Os elementos com
número atómico acima do do bismuto (83) são todos radioactivos. Mas este fenómeno não se limita
ao extremo superior da tabela periódica. Todos os elementos têm alguns isótopos radioactivos,
logo a partir do hidrogénio (por exemplo, o 3 H).
9.1.1
A região de estabilidade
Em primeira aproximação, pode dizer-se que os núcleos estáveis são aqueles que apresentam iguais
números de protões e de neutrões. Isto só é rigorosamente verdade para núcleos com número de
massa não muito elevado. Quando este aumenta muito, a repulsão electrostática entre protões
é tão elevada, que se torna necessário “diluir” os protões num número ainda maior de neutrões.
Assim, à medida que aumenta o número de massa, verifica-se um aumento do peso relativo dos
neutrões no núcleo. Na Figura 9.1, representa-se num diagrama (Z, N ) o conjunto dos núcleos
estáveis. Nota-se aı́ o que acabámos de indicar: para pequenos valores de Z, os núcleos estáveis
apresentam um equilı́brio aproximado dos números de protões e neutrões e, à medida que aumenta
o número atómico, verifica-se um aumento do número relativo de neutrões. É fácil de compreender
a forma do “Vale da estabilidade” em termos do modelo em camadas. O núcleo é um sistema
de várias partı́culas, que são, essencialmente, de dois tipos(a) , protões e neutrões. No estado
fundamental, estas partı́culas devem ocupar os estados de menor energia disponı́veis mas, como
são fermiões, aplica-se o princı́pio de Pauli. Um grande desiquilı́brio entre os números de protões e
de neutrões leva a que sejam ocupados estados de elevada energia do nucleão em excesso, havendo
estados vagos do outro nucleão com menor energia. Assim, um nuclı́deo com um grande excesso
de um dos nucleões pode atingir uma configuração de menor energia sofrendo um decaimento que
aproxime os números de protões e de neutrões.
Há vários tipos de processos de decaimento diferentes, identificados pelos tipos de radiações
por eles emitido. Podem classificar-se em três famı́lias principais que são as fissões nucleares, as
conversões internas e os decaimentos-β.
(a) Veremos
adiante que a coisa é um pouco mais complicada...
127
128
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
N
120
100
80
60
40
20
20
40
60
80
Z
Figura 9.1: O “Vale da estabilidade”. Cada ponto representa um nuclı́deo estável. Nota-se claramente que, para nuclı́deos pequenos e médios, é favorecido um equilı́brio aproximado entre os
números de protões e de neutrões.
9.1.2
Fissões nucleares
Neste tipo de decaimentos, um núcleo parte-se em duas ou mais porções. Dá-se então um processo
descrito por equações como
A1
A2
A
Z XN →Z1 Y1 N1 +Z2 Y2 N2 + . . .
onde se verifica
A
Z
N
= A1 + A2 + . . .
= Z1 + Z2 + . . .
= N1 + N2 + . . .
Decaimento-α
As fissões mais frequentes consistem na emissão de um núcleo de hélio-4(b) Por exemplo, este é o
principal processo de decaimento do isótopo do urânio mais abundante na Terra, o 238 U,
238
U →4 He +234 Th.
Emissão de protões ou neutrões
Outros processos de fissão frequentes são a emissão de neutrões ou de protões. Os nuclı́deos que
decaem por estes processos apresentam sempre um grande excesso da partı́cula que emitem. Por
exemplo, o alumı́nio tem o número atómico 13. O único isótopo estável do alumı́nio é o 27 Al,
que tem 13 protões (claro) e 14 neutrões. Esta deve, então, ser considerada a distribuição de
equilı́brio dos números de protões e neutrões no alumı́nio. O isótopo 21 Al tem, relativamente a
(b) Recorde
α.
que os núcleos de hélio-4, constituı́dos por dois protões e dois neutrões, são também chamados partı́culas
9.1. RADIOACTIVIDADE
129
esta distribuição, uma grande deficiência de neutrões, que pode ser corrigida libertando alguns
protões. Este é, de facto, o processo de decaimento do alumı́nio-21:
21
Al →20 Mg +1 H.
O 5 He têm o problema inverso, tem neutrões a mais. O seu processo de decaimento é, então, a
emissão de neutrões. Mas este é um mau exemplo, porque o que resulta deste decaimento é um
neutrão livre e um núcleo de 4 He, ou seja, um neutrão e uma partı́cula α! Porque há uma partı́cula
α no estado final, a este decaimento também se pode chamar decaimento α. Um exemplo melhor
é o do enxofre-49. O enxofre tem um número atómico Z = 16 e o seu isótopo mais abundante é
o 32 S. O 49 S tem pois 33 neutrões. Pode aliviar este desiquilı́brio neutrónico libertando neutrões,
que é o processo pelo qual, efectivamente, decai:
49
S →48 S + n.
Outros processos de emissão
Para além da emissão de nucleões isolados e da emissão de partı́culas α, verificam-se ainda outros
processos de emissão, como a emissão de protões dupla (é um dos processos de decaimento do
berı́lio 6 Be, por exemplo), ou a emissão de núcleos mais complexos do que uma partı́cula α. Estes
processos ocorrem sempre em concorrência com outros e nunca são os dominantes. Por exemplo,
um em cada 7,7×1010 núcleos de protactı́neo 231 Pa decaem por emissão de núcleos de néon, através
do processo
231
Pa →211 Tl +20 Ne.
O processo dominante de decaimento deste nuclı́deo, no entanto, é o decaimento-α.
Fissões propriamente ditas
Apesar de termos definido todos os processos de divisão nuclear como fissões, reserva-se em geral
este nome para processos em que um núcleo se parte em dois bocados mais ou menos semelhantes,
com emissão de alguns nucleões isolados. Estes processos só se verificam expontaneamente para
núcleos com número de massa muito grande, como o férmio 242 Fm, sendo, mesmo neste domı́nio,
relativamente raros.
9.1.3
Conversões internas
Num decaimento por conversão interna não há alteração de nuclı́deo, isto é permanecem constantes
os valores dos números de neutrões e de protões (logo, permanece, também, constante o número
de massa). Verifica-se apenas a emissão de radiação electromagnética de altı́ssima energia, que
tem o nome de radiação gama. Os fotões deste tipo de radiação transportam um energia da ordem
dos MeV, ou seja, são mil a um milhão de vezes mais energéticos do que os dos raios-X. O que
se passa nestes processos é que um núcleo num estado energeticamente excitado decai para o seu
estado fundamental, como acontece com os electrões atómicos nos processos de emissão e absorção
tı́picos dos métodos da espectrometria.
9.1.4
Decaimento-β
Num decaimento-β verifica-se a conversão de um protão num neutrão, ou vice-versa. O decaimentoβ mais frequente é o chamado β − , em que um neutrão se transforma num protão, sendo simultaneamente emitido um electrão. Outro processo-β possı́vel consiste na transformação de um protão
num neutrão, com a emissão de um positrão.(c) Este processo tem um efeito semelhante (em
termos de composição dos nuclı́deos ininical e final) ao da captura electrónica, em que um electrão
e um protão colidem, aniquilando-se, criando-se, neste processo, um neutrão. Estes processos
130
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
e+
en
p+
p+
n
ep+
n
Figura 9.2: Três processos de decaimento-β: β − (à esquerda); β + (ao centro); captura electrónica
(à direita). Mais adiante veremos que se verifica a produção ou aniquilação de uma terceira partı́cula
nestes processos, que não representámos nos diagramas.
estão representados graficamente na Figura 9.2. Para além das partı́culas referidas, uma partı́cula
adicional está envolvida; é o neutrino, que estudaremos mais em detalhe daqui a pouco.
Os decaimentos β − e de captura electrónica são os mais frequentes em nuclı́deos que apresentam um grande desiquilı́brio entre os números de protões e neutrões. Os que têm excesso de
neutrões sofrem, regra geral, decaimentos β − (transformando protões em neutrões) e os que excesso de protões tendem a decair por captura electrónica (realizando a transformação inversa). Por
exemplo, apresentam-se em baixo os mecanismos de decaimento de alguns nuclı́deos, indicando-se
entre parêntesis os valores da diferença entre o número de protões e neutrões:
46
26 Fe
75
27 Co
9.2
(Z − N = 6)
c.e.
−→
β
−
(Z − N = −21) −→
46
25 Mn
75
28 Ni
(Z − N = 4)
(Z − N = −19)
A lei do decaimento
Todos os núcleos de um determinado nuclı́deo são, exactamente, iguais. Todas as propriedades
de um núcleo de carbono 14 C são iguais às de outro núcleo de carbono 14 C. Em particular, a
probabilidade de que se dê o decaimento de um dado núcleo de 14 C no próximo segundo tem o
mesmo valor para todos os núcleos de carbono 14 C, quer tenham sido formados há dezenas de
milhares de anos, quer tenham acabado de ser produzidos nalgum laboratório de Fı́sica Nuclear.
Assim sendo, devemos concluir que a probabilidade de decaimento por unidade de tempo tem
um mesmo valor, constante, para todos os núcleos de um dado nuclı́deo. A esta constante dá-se
o nome de constante de decaimento. Seja ν a cosntante de decaimento para um dado nuclı́deo.
Então, a probabilidade que um dado núcleo desse nuclı́deo sofra decaimento num intervalo de
tempo infinitesimal dt é
dP = ν dt.
Considerando agora uma amostra com N núcleos deste nuclı́deo, o número expectável de decaimentos no mesmo intervalo de tempo é dado por N νdt, logo o número de núcleos na amostra sofre
uma variação de
dN = −N νdt,
onde o sinal − traduz o facto de se tratar de uma diminuição. Desta equação resulta imediatamente
a eqaução diferencial que rege a evolução daquele número,
dN
= −νN,
dt
cuja solução é
N (t) = N0 e−ν(t−t0 ) ,
(9.1)
onde representámos por N0 o número de núcleos presente na amostra num instante de referência
t0 . A Figura 9.3 apresenta o gráfico desta função.
(c) Um positrão é uma partı́cula idêntica ao electrão mas com carga oposta. É a anti-partı́cula do electrão, que
discutiremos mais tarde.
9.2. A LEI DO DECAIMENTO
131
1
0.8
N/N0
0.6
0.4
0.2
0
0
1
2
3
t ν/ ln 2
4
5
6
Figura 9.3: Evolução do número de átomos que restam numa amostra de um isótopo radioactivo
com constante de decaimento ν, contendo inicialmente N0 átomos.
9.2.1
Tempo de meia vida
Como é bem visı́vel na Figura 9.3, em iguais intervalos de tempo, o número de núcleos da população inicial de uma amostra que não sofre decaimento é dividido por iguais factores, como é
caracterı́stico da função exponencial. Podemos, pois, perguntar quanto tempo é necessário para
que a uma população de núcleos radioactivos se reduza a metade. A este intervalo de tempo dá-se
o nome de tempo de meia vida ou perı́odo de semi-desintegração. Representando-o por T1/2 e
substituindo na lei do decaimento, temos
N0
= N0 e−νT1/2 ,
2
de onde resulta
ln 2
.
ν
A “força” radioactiva de um nuclı́deo é mais frequentemente avaliada pelo perı́odo de semidesintegração do que pela constante de decaimento.
T1/2 =
9.2.2
Duração média
É impossı́vel saber, a priori, quanto tempo passará até que um dado núcleo de um nuclı́deo
radioactivo sofra decaimento. Trata-se de um processo compleatamente aleatório. Apesar desta
aleatoriedade, podemos calcular a duração média de um núcleo radioactivo. Esta duração média
depende, obviamente, da constante de decaimento: quanto maior esta, menor deve ser aquela,
naturalente.
Podemos estimar a duração média de um núcleo de um nuclı́deo radioactivo considerando uma
amostra com um grande número de núcleos desse nuclı́deo acabados de produzir(d) e fazendo a
média estatı́stica das suas durações. Ou seja, calculamos a duração média, τ , dos núcleos deste
nuclı́deo como
N0
1 X
τn ,
τ=
N0 n=1
onde N0 é o número de núcleos inicialmente presentes na amostra e τn é a duração do n-ésimo.
Se a amostra for suficientemente numerosa para que o cálculo tenha significado estatı́stico, não
(d) Pouco importa de que modo esta amostra é produzida. Pode ser, por exemplo, através de um processo de
activação por neutrões, mas os detalhes são, de facto, irrelevantes para esta discussão.
132
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
nos é possı́vel, por razões práticas, acompanhar o decaimento de cada um dos N0 núcleos. Assim,
não podemos conhecer os valores, τn , das suas durações e, portanto, esta expressão é, de facto,
inútil. O que podemos fazer é agrupar os vários núcleos da amostra em classes caracterizadas pela
sua duração e tentar usar esta divisão para simplificar o cálculo. Consideremos então o intervalo
temporal [t0 = 0, ∞] dividido em vários (infinitos, até) subintervalos I0 = [t0 , t1 [, I1 = [t1 , t2 [,. . . ,
Ik = [tk , tk+1 [,. . . (com t0 < t1 < t2 < . . . < tk < . . .) e sejam δN0 , δN1 ,. . . , δNk ,. . . os números
de núcleos que decaem nos subintervalos I0 , I1 ,. . . , respectivamente. O somatório na expressão
acima é dado aproximadamente por
N0
X
τn =
n=1
∞
X
tk δNk .
k=0
Se os subintervalos Ik forem suficientemente curtos, podemos fazer a aproximação
µ
¶
dN
δnk ' −δtk
,
dt t=tk
onde δtk é a duração do k-ésimo intervalo e N (t) representa o número de núcleos da população
inicial ainda presente na amostra no instante t. (O sinal menos aparece nesta igualdade porque a
variação de N é negativa.) Considerando agora o limite em que a duração de cada subintervalo
tende para zero, o somatório na expressão acima tende para um integral,
N0
X
Z
∞
τn = −
t
0
n=1
dN
dt
dt
Mas o número de núcleos presente na amostra é dado pela lei do decaimento, que deduzimos na
secção anterior. Podemos, então, escrever
N0
X
Z
τn
=
νN0
=
N0
.
ν
∞
t e−νt dt
0
n=1
Substituindo este valor na expressão do valor médio, obtemos, por fim,
τ=
1
,
ν
ou seja, que a duração média de um núcleo radioactivo é igual ao inverso da sua constante de
decaimento.
9.2.3
Energia libertada no decaimento
Como já vimos quando discutimos a energia de ligação nuclear, a energia envolvida nos processos
nucleares é da ordem de grandeza da energia de repouso dos núcleos envolvidos. Assim, não se
verificam separadamente leis de conservação da massa e da energia, como nas reacções quı́micas,
verifica-se antes uma lei da conservação da energia que deve incluir as energias de repouso das
partı́culas que participam na reacção. Por exemplo, no decaimento de um núcleo radioactivo X,
ele transforma-se no núcleo W, com emissão das partı́culas Y e Z (estas partı́culas podem ser
um electrão e um neutrino, ou um núcleo e um neutrão, pouco importa). Esquematicamente, o
processo pode ser representado como
X → W + Y + Z.
Analizado o processo no referencial do núcleo original, a energia total antes do decaimento é apenas
a sua energia de repouso, mX c2 . Depois do decaimento, contabilizamos as energias de repouso das
9.3. ACTIVIDADE E DOSIMETRIA
133
partı́culas W, Y e Z, ([mY + mW + mZ ]c2 ) e a soma das suas energias cinéticas, que representamos
globalmente por Q. O balanço energético permite-nos escrever
Q = (mX − mY − mW − mZ )c2 .
A quantidade Q é a energia libertada pelo decaimento.
Por exemplo, o urânio-238 é o isótopo do urânio dominante na Terra. A sua massa atómica é
238,050784 u. Trata-se de um nuclı́deo instável, que decai por decaimento α com uma meia vida
de cerca de 4,5 × 109 anos. O processo é
238
U→
234
Th + α.
Dado que as massas atómicas do tório e da partı́cula α são, respectivamente, 234,043593 u e
4,002603 u, concluimos que a energia libertada no decaimento de um núcleo de 238 U é Q = 4,588 ×
10−3 uc2 ' 4,3 MeV. Este processo é a principal fonte de calor do interior da Terra. É graças à
presença de urânio na Terra que o seu interior permanece no estado lı́quido, causando a actividade
geológica do planeta.
Esta expressão para o cálculo da energia libertada num decaimento pode ser generalizada a
qualquer reacção, definido-se o chamado factor-Q do processo como sendo a diferença entre as
energias de repouso dos reagentes e dos produtos da reacção. Assim, num processo
A + B → C + D,
o factor Q é
Q = (mA + mB − mC − mD )c2 .
O factor-Q de um decaimento é, de facto, a energia libertada no processo, porque é possı́vel tomar
a energia cinética do núcleo no estado inicial igual a zero, escolhendo-se o seu referencial próprio
para fazer o cálculo. Mas, num processo arbitrário como o que acabámos de considerar, o factor-Q
já não é a energia libertada, mas antes a diferença entre a energia libertada e a soma das energias
cinéticas dos reagentes. Isto é assim porque, para se dar a colisão entre os dois núcleos, eles não
podem estar os dois em repouso no estado inicial, seja qual for o referencial que se considere.
Assim, a energia do estado inicial inclui não só a energia de repouso dos reagentes, mas também a
sua energia cinética, indispensável para que a colisão se dê, e este termo deve também ser incluido
no balanço energético da reacção.
9.3
9.3.1
Actividade e dosimetria
Actividade
Chama-se actividade de uma amostra de um material radioactivo ao número de decaimentos nucleares que, nela, ocorrem por unidade de tempo. A unidade de actividade do Sistema Internacional
é o bequerel (Bq) em honra ao cientista francês que descobriu a radioactividade. É uma unidade
derivada com dimensões do inverso do tempo, isto é, 1 Bq = 1 s−1 .
Regra geral, a radioactividade de uma amostra radioactiva deve-se a vários processos que
ocorrem simultaneamente. Por exemplo, numa amostra de urânio dá-se o decaimento α dos núcleos
de 238 U. Mas o resultado deste decaimento é o 234 Th, que sofre decaimento β, tranformando-se
em 234 Pa que, por sua vez decai para 234 U por decaimento β, e a história não acaba aqui! Num
dado instante, todos estes processos ocorrem e todos contribuem para a radioactividade daquela
amostra. A actividade devida apenas ao decaimento de um nuclı́deo particular é, obviamente,
igual à taxa de diminuição do número de núcleos desse nuclı́deo presentes na amostra, ou seja,
A(t) = −
dN
,
dt
134
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
onde N representa o número de núcleos do nuclı́deo considerado e A representa a actividade devida
ao decaimento desses núcleos. Mas N é dado pela lei do decaimento, de forma que temos
A(t)
= νN (t)
= νN0 e−νt
= A0 e−νt ,
onde N0 representa o número de núcleos do nuclı́deo considerado presentes na amostra no instante
inicial t0 = 0 e A0 representa a actividade devida ao decaimento desses núcleos, nesses mesmo
instante. Vemos assim que a actividade devida a um decaimento particular segue uma evolução
temporal semelhante à lei do decaimento.
9.3.2
Dose absorvida
As partı́culas α β e γ produzidas nas reacções nucleares têm energias muito superiores às que
normalmente estão envolvidas em reacções quı́micas. Assim, a sua absorção num meio material, e
a consequente libertação da sua energia cinética, induz vários processos atómicos nesse material,
como ionizações, deslocalizações de átomos(e) e reacções quı́micas. Estes efeitos são proporcionais
à densidade de energia depositada no meio pela radiação. Para quantificar esta deposição de
energia, definiu-se uma quantidade chamada dose absorvida, que é a energia absorvida por unidade
de massa do meio exposto à radiação. A unidade do Sistema Internacional de dose é o gray (Gy)
e é igual a um joule por quilograma:
1 Gy = 1 J kg−1 .
Na Inglaterra e nos Estados Unidos é mais frequente a utilização do rad (iniciais de Radiation
Absorved Dose) que é 100 vezes menor que o gray:
1 rad = 10−2 Gy.
9.3.3
Dose equivalente
Todos os tipos de radiação transportam energia e a taxa temporal a que essa energia é depositada
num meio material que a absorva pode ser muito elevada, se a radiação incidente for suficientemente
intensa. Mas a intensidade da radiação apenas determina o número de quanta (fotões, no caso da
radiação electromagnética, partı́culas α, β, neutrões, etc., no caso das radiações corpusculares) que,
por unidade de tempo, são depositados no alvo. Os efeitos da exposição à radiação que referimos
acima resultam da absorção destes quanta de energia e, portanto, dependem fortemente das suas
caracterı́sticas, particularmente da sua energia. Por exemplo, a dose absorvida em meia hora de
exposição ao sol num dia limpo, a meio da tarde, é aproximadamente igual à absorvida durante
uma exposição de 6 horas à luz de uma lâmpada de 100 W (desde que o sujeito se mantenha a
uma distância de cerca de 1 m da lâmpada). No entanto, a primeira exposição bronzeia-nos a pele
(e pode alterar o funcionamento de algumas células da derme, provocando, nos casos mais graves,
cancro da pele); a segunda exposição não tem efeitos apreciáveis. Isto é assim porque os fotões de
radiação visı́vel têm uma energia de alguns eV apenas, ao passo que os fotões mais energéticos que
chegam até nós vindos do sol (os da radiação utravioleta UVB) podem ter 100 a 1000 vezes mais.
Estes fotões, ao contrário daqueles, têm energia suficiente para induzir reacções quı́micas como as
que levam à produção de melanina na nossa pele, mas também a capacidade de ionizar moléculas
de água e outras alterações bioquı́micas conducentes a patologias como o cancro de pele.
Num contexto mais familiar para nós, são também estas questões que justificam que só com
radiação com frequência suficientemente elevada se verifique o efeito fotoeléctrico, independentemente da intensidade dessa radiação.
Para dar conta destes diferentes efeitos dos diferentes tipos de radiação, introduz-se uma nova
quantidade, chamada equivalente de dose. O equivalente de dose de uma dada exposição é a dose
(e) Em
cristais, este processo faz aparecer lacunas cristalinas e átomos em posições intersticiais.
9.3. ACTIVIDADE E DOSIMETRIA
135
Radiação
UVB,X,γ
β
neutrões lentos
neutrões rápidos, protões, α
núcleos pesados
factor de qualidade
1
1
3
10
20
Tabela 9.1: Valores do factor de qualidade para diferentes tipos de radiação.
de raios-X que produz os mesmos efeitos que essa exposição. Na prática, calcula-se o equivalente
de dose, H, a partir da dose absorvida, D, através da expressão
H = D Q,
onde Q é um factor adimensional, chamado factor de qualidade, caracterı́stico da radiação absorvida, que é uma medida da sua perigosidade. Alguns valores do factor de qualidade estão
apresentados na Tabela 9.1. A unidade de equivalente de dose é também, como a da dose absorvida, o J kg−1 , mas recebe agora o nome de sievert (Sv), para evitar ambiguidades em situações de
emergência. Dados os valores apresentados na Tabela 9.1, podemos dizer que uma dose absorvida
de 1 Gy de neutrões lentos é três vezes mais perigosa do que a mesma dose de raios γ e cerca
de três vezes menos perigosa do que igual exposição a partı́culas α. À primeira corresponde um
equivalente de dose de 3 Sv, à segunda 1 Sv, à terceira 10 Sv.
Como para a dose absorvida, na Inglaterra e nos Estados Unidos não se costuma usar a unidade
SI de equivalente de dose, é mais frequente a utilização do rem (Radiation Equivalent on Man), e
que é cem vezes menor do que o Sv:
1 rem = 0,01 Sv.
Refira-se, por fim, que a expressão “dose” indica mais frequentemente o equivalente de dose do
que a dose absorvida.
9.3.4
Efeitos da exposição à radiação
Em tecidos vivos, os processos de ionização podem ter um efeito muito negativo na fisiologia
celular, porque esta depende muito de pequenos gradientes de potencial eléctrico através das
várias membranas celulares, gradientes que se vêm fortemente perturbados pela presença dos
iões causados pela irradiação. Além disso, a energia destas partı́culas radioactivas é mais do
que suficiente para quebrar ligações quı́micas em proteı́nas, que são fundamentais para o bom
funcionamento celular. A exposição à radiação é pois, em geral, extremamente prejudicial à
saúde. Exposições moderadas podem causar náusea e vómitos e nota-se diminuição na produção de
células sanguı́neas durante alguns dias. Exposições mais intensas podem agravar esta deficiência,
causando anemia e debilidade face a infecções. Uma ainda maior exposição pode causar diversas
formas de cancro. Uma exposição a uma fonte muito intensa pode causar morte em poucos dias
ou, até, em breves minutos, por destruição pura e simples dos tecidos.
Os limites legais para a exposição foram definidos pelo Decreto Regulamentar n.o 9/90 de 19-041990. Este Decreto determina doses máximas anuais de 50 mSv para a exposição uniforme de todo
o corpo, e de 500 mSv para orgãos ou partes do corpo (por exemplo, as mãos)(f) . Para crianças,
mulheres em idade reprodutora e mulheres grávidas, os máximos legais são mais reduzidos.
(f) Note-se
que, quando se calcula a dose absorvida por um órgão apenas, se divide a energia absorvida por esse
órgão pela sua massa. Assim, um sujeito pode apresentar grandes doses absorvidas por orgãos particulares com
uma dose absorvida pelo corpo todo relativamente baixa.
136
9.4
9.4.1
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
Aplicações da Fı́sica Nuclear
Análise por activação com neutrões
Consideremos um processo de captura neutrões genérico
A
X+n →
A+1
X.
Como resultado do processo de captura, o núcleo resultante fica num estado excitado, pelo que
decai através de conversão interna e/ou outros processos como a fissão ou o decaimento β. O
tipo de decaimento e a energia da radiação produzida dependem fortemente do núcleo resultante
do processo de captura, ou seja, do núcleo original. Assim, é possı́vel determinar (qualitativa e
quantitativamente) a composição de uma amostra de material desconhecido através da análise
cuidada da radiação que se obtém por bombardeamento da amostra com neutrões. Esta técnica
chama-se análise por activação com neutrões.
9.4.2
Produção de energia por fissão
Quando o alvo num processo de captura de neutrões é de um nuclı́deo muito pesado, uma das
possibilidades para o decaimento do núcleo resultante é a fissão.
Por exemplo, consideremos o processo de captura de neutrões do urânio 235 U,
235
U+n →
236
U,
no referencial do centro de massa do sistema, relativamente ao qual o 236 U resultante se encontra
em repouso. O factor-Q desta reacção, Q = 6,544 MeV, não aparece como energia cinética dos
produtos(g) mas como uma excitação interna do núcleo resultante. Esta energia é suficiente para
vencer a barreira de potencial nuclear, de forma que o núcleo parte-se em vários bocados, incluindo
vários neutrões (em média, 2,5, no caso da fissão do 235 U). Por exemplo, uma reacção usual é
235
U + n →93 Rb +141 Cs + 2n.
O factor-Q desta reacção é cerca de 180 MeV. A energia libertada neste processo é, pois, enorme!
Corresponde a 73 GJ por cada grama de urânio! Se todos os átomos de urânio de uma amostra
sofressem este processo, bastavam perto de 60 kg de urânio para produzir energia energia semelhante à libertada por uma bomba de 1 MT(h) A possibilidade do aproveitamento desta imensa
fonte de energia foi considerada imediatamente após a descoberta da fissão nuclear pelos fı́sicos
alemães Otto Hahan e Fritz Strassmann, em 1938. Após apenas quatro anos, construiu-se o primeiro reactor nuclear experimental em Chicago, um esforço liderado pelo fı́sico italiano Enrico
Fermi, e iniciou-se o Projecto Manhattan para a construcção da bomba atómica que viria a ter
um papel decisivo no final da Segunda Grande Guerra.
Reacções em cadeia, moderação de neutrões e enriquecimento de urânio
O aproveitamento da energia libertada na fissão nuclear baseia-se na possibilidade do estabelecimento de reacções em cadeia, nas quais parte ou a totalidade dos neutrões libertados na fissão
de um núcleo são capturados por outros núcleos vizinhos, provocando também a sua fissão e assim sucessivamente. Um problema que é necessário resolver para que se possa estabelecer uma
reacção em cadeia é que os neutrões libertados por um processo de fissão nuclear têm uma energia
cinética muito elevada; mas a probabilidade de captura de neutrões rápidos é muito baixa, logo, é
necessário travar os neutrões, processo conhecido como moderação dos neutrões.
(g) Há
apenas um produto e encontra-se em repouso relativamente ao referencial considerado...
megatonelada (MT) é a energia libertada por uma bomba com um milhão de toneladas de TNT. É o
bastante para abrir no chão uma cratera com 1 km de diâmetro. Para se ter uma idéia, a energia libertada pela
explosão da Bomba de Hiroxima foi 0,013 MT.
(h) Uma
9.4. APLICAÇÕES DA FÍSICA NUCLEAR
137
Figura 9.4: Reacção em cadeia com um factor de reprodução próximo de 8/5. Representam-se os
núcleos de urânio que sofrem fissão com cı́rculos negros, os neutrões que são capturados como setas
a cheio, os que escapam sem induzir novas fissões com setas a tracejado. Não são representados os
produtos da fissão.
Os reactores de fissão mais vulgares usam urânio como material fissil. Mas o urânio é constituı́do principalmente por 238 U (99,3%) e 235 U (0,7%). Só o segundo destes isótopos, muito
minoritário, decai por fissão após a captura de num neutrão. Os átomos de 238 U desempenham
também um papel importante, na moderação dos neutrões. Nas colisões entre neutrões altamente
energéticos e estes núcleos, aqueles induzem excitações nestes, perdendo parte da energia. Após
algumas destas colisões, os neutrões já não têm energia suficiente para excitar os núcleos de 238 U,
mas ainda são suficientemente rápidos para ser demasiado baixa a probabilidade de captura por
um núcleo de 235 . Nesta fase, um neutrão pode apenas sofrer colisões elásticas com os núcleos
dos átomos da amostra. Mas nestas colisões perde muito pouca energia, porque a sua massa é
muito menor do que as dos núcleos com os que colide.(i) Numa colisão elástica, a partilha de
energia entre os dois intervenientes só é apreciável se as suas massas forem semelhantes. Por esta
razão mergulha-se o material fissil em água. As colisões de um neutrão rápido com os protões que
constituem os núcleos de hidrogénio baixam rapidamente a sua energia até aos valores requeridos.
Esta técnica tem um inconveniente: é que, na colisão entre neutrões e protões pode formar-se
deutério, isto é, no processo de moderação de neutrões, os protões do hidrogénio competem com
os núcleos de 235 U na captura de protões. Face a isto, ou se usa como moderador água pesada (as
moléculas de água pesada têm átomos de deutério em vez de átomos de hidrogénio, e a probabilidade de captura de neutrões pelo deutério é praticamente nula) ou, em alternativa, aumenta-se
a concentração de urânio 235 U, para compensar a diminuição da produção efectiva de neutrões
capazes de induzir novas fissões. Para que se possa manter uma reacção em cadeia usando água
vulgar como moderador, o teor de 235 U tem que ser elevado até cerca de 3%, cerca de quatro vezes
mais do que o que se verifica no urânio natural. Este processo tem o nome de enriquecimento do
urânio.
Controle da taxa da reacção
Chama-se constante de reprodução ao número médio de neutrões libertados na fissão de um núcleo
que efectivamente induz novas fissões noutros núcleos. Note-se que o valor da constante de reprodução não depende apenas do número de neutrões libertado, porque alguns neutrões escapam
da região onde se encontra o material fissil, ou são capturados por núcleos que não sofrem fissão
(como os do hidrogénio da água usada na moderação). Na Figura 9.4 representa-se uma situação
em que se pode estimar o factor de reprodução em 8/5. Pensemos numa reacção em cadeia como
uma série de gerações, no sentido em que a fissão de um núcleo liberta neutrões que vão iniciar
uma nova geração de fissões noutros núcleos. A constante de reprodução indica a razão entre os
números de fissões que se dão em duas gerações sucessivas. Quando a constante de reprodução
tem um valor inferior à unidade, a reacção em cadeia extingue-se: em cada nova geração, ocorrem
(i) Da
mesma maneira, quando atiramos uma bola de ping-pong contra outra de bilhar, vemos que a a primeira
altera a direcção do seu movimento, mas o módulo da sua velocidade permace aproximadamente constante, ao
passo que a bola de bilhar permanece num estado de movimento praticamente inalterado.
138
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
Barras de
urânio
Barras de
controle (Cd)
Figura 9.5: O controle do valor da constante de reprodução faz-se variando a posição e o número
de barras de controle (a cinzento na figura). Estas barras são compostas por materiais com grande
facilidade de captura de neutrões, por exemplo, cádmio.
menos fissões do que na anterior; pelo contrário, quando a constante de reprodução é superior a
um, então o ritmo a que a reacção se dá aumenta exponencialmente, já que em cada geração se dão
mais fissões do que na anterior. Neste caso, lidamos com uma explosão nuclear como as das bombas
atómicas. Do que acabámos de dizer, compreende-se que uma central nuclear para a produção de
energia deve trabalhar num regime em que a constante de reprodução mantém, sempre, um valor
exactamente igual a 1. Isso consegue-se dividindo o material fissil (urânio enriquecido) em várias
amostras separadas (com a forma de barras cilı́ndricas) e introduzindo no reactor, itercaladas entre
as barras de urânio, barras de materiais com elevada facilidade de captura de neutrões. A fracção
dos neutrões que elas capturam pode ser regulada variando o número de barras ou a sua posição
no reactor, o que permite uma variação em tempo real do valor da constante de reprodução.
Produção da energia eléctrica
A transformação da energia da reacção nuclear em energia eléctrica procede agora como numa
central térmica vulgar: o calor libertado na reacção aquece água até a vaporizar a alta pressão;
este vapor, por seu turno, empurra as pás de uma turbina electromagnética.
Perigos da utilização da energia nuclear de fissão
Além do perigo de uma reacção em cadeia explosiva, que se verifica quando a constante de reprodução ultrapassa o valor da unidade e que está relativamente bem controlado nos reactores
nucleares, há uma série de riscos envolvidos na utilização da fissão nuclear controlada para a
produção de electricidade. Um dos mais graves é o do sobreaquecimento do reactor. O interior
de um reactor nuclear está normalmente a uma temperatura e pressão muito elevadas. Se se dá
um aumento anormal destas duas variáveis, a blindagem que protege o reactor pode fundir-se e
deixar escapar o material altamente radioactivo que se encontra no interior. Este material é, principalmente, a água usada no processo de moderação, mas é água activada pelo bombardeamento
com neutrões, o que inclui uma série de substâncias altamente radioactivas e/ou, muitas vezes,
quimicamente venenosas. O acidente deste tipo mais grave ocorreu em 1986 em Chernobyl, na
Ucrânia. Este acidente causou a morte imediata a 30 pessoas e dados das autoriadas ucranianas
estimam em mais de 2500 vı́timas mortais nos anos seguintes. O acidente obrigou à evacuação de
mais do que 3500̇00 pessoas e os seus efeitos ainda se fazem sentir nas regiões próximas, nomeadamente numa maior radioactividade “natural” à qual está associada uma maior taxa de incidência
de vários problemas de saúde, como cancro da tiróide (após o acidente, aumentou dez vezes em
todo o território da Ucrânia) e mal-formações fetais.
Outro problema grave prende-se com o que fazer do urânio quando o teor em urânio-235
se torna demasiado baixo para que se possa manter a reacção em cadeia activa. Este material
é quimicamente venenoso e radioactivo pelo que o seu acondicionamento coloca graves proble-
9.4. APLICAÇÕES DA FÍSICA NUCLEAR
139
mas ambientais. Até agora, têm-se armazenado estes restos em instalações situadas em regiões
desérticas ou encerrado em contentores estanques que são depositados em minas profundas ou no
mar alto, mas não se sabe com certeza se estas soluções se podem considerar definitivas.
9.4.3
Fusão nuclear
Dada a forma do gráfico da energia de ligação por nucleão (rever a Figura 8.1), compreende-se bem
que seja possı́vel obter energia por fissão de núcleos grandes ou por junção de núcleos pequenos.
A processos deste último tipo dá-se o nome de reacções de fusão. O sol e as estrelas produzem a
sua energia por reacções de fusão. As estrelas não muito antigas são constituı́das essencialmente
por hidrogénio. Na zona mais interna de uma estrela, a temperatura é tão elevada que os átomos
de hidrogénio se encontram ionizados (ou seja, contitui-se um plasma de electrões e protões) e
movem-se com uma velocidade tal que, quando chocam uns com os outros, têm energia suficiente
para vencerem a repulsão electrostática mútua, aproximando-se tanto que entra em jogo a força
nuclear forte. Por outro lado, nestas regiões a densidade é tão elevada que estas colisões ocorrem
frequentemente, dando-se uma reacção de fusão (note-se que um dos protões sofre decaimento β)
que produz deutério
p + p → 2 H + e+ + νe .
Uma colisão entre dois núcleos de deutério produziria directamente hélio-4 mas, como é muito
maior a densidade de protões do que a de deuterões, estas colisões são muito menos prováveis do
que colisões deuterão-protão, que produzem hélio-3:
2
H + p → 3 He.
Dada a enorme densidade de protões no interior das estrelas, esta “promoção” do deutério a hélio-3
é muito rápida. Poderı́amos agora pensar que uma nova colisão com um protão, acompanhada do
decaimento β de um dos protões produziria hélio, mas tal não é o caso, porque o núcleo de 4 Li
formado pela colisão de um núcleo de 3 He com um protão decai (pela interacção forte) de novo
num núcleo de hélio-3 e um protão, antes que o decaimento β que transforma um protão num
neutrão possa ocorrer:
3
He + p → 4 Li →3 He + p.
Por outro lado, como a densidade de deuterões é muito baixa (assim que são produzidos nas
colisões p-p são imediatamente transformados em 3 He, as reações 3 He-2 H são também muito
pouco improváveis. Os núcleos de hélio-3 vivem então tempos comparativamente longos (mesmo
que assumindo fugazmente a forma de 4 Li), até que sofrem uma colisão com outro núcleo idêntico,
em que, por fim, se produzem núcleos de hélio, através da reacção
3
He +3 He → 4 He + 2p.
Este processo todo, que é a pricipal fonte de energia nas estrelas, vai consumindo o hidrogénio nas
estrelas e transformando-o em hélio. Tem o nome de sequência protão-protão e está esquematizado
na Figura 9.6 A sequência toda é equivalente à reacção
4p → 4 He + e+ + νe ,
e tem um factor-Q global de 26,7 MeV. Isto corresponde a 640 GJ por cada grama de hidrogénio
consumido. É interessante comparar este valor com a energia libertada num processo quı́mico
usual. Por exemplo, a combustão de hidrogénio para produzir água liberta 1, 4 × 105 J/g. A
diferença é abissal.
Desde o final dos anos quarenta, cientistas de vários paı́ses tentam reproduzir reacções como as
da sequência protão-protão na Terra, de forma controlada, com o objectivo da produção industrial
de energia. Estas reacções são muito vantajosas quando comparadas com as de fissão, porque
nelas não se produzem isótopos radioactivos de longo perı́odo de semidesintegração. Com efeito,
o principal produto é hélio, que não só não é radioactivo, é também quimicamente inerte (logo,
140
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
p
p
2
p
p
ν
e+
ν
e+
p
p
2
p
H
4
He
H
p
Figura 9.6: A sequência protão-protão.
não é venenoso). Como se discute já a seguir, obrigar dois núcleos a colidirem é muito difı́cil. Por
esta razão, todas as possibilidades actualmente em estudo para a produção industrial de energia
através da fusão nuclear não consideram a utilização de hidrogénio 1 H como combustı́vel. Em
vez disso, “saltam” os primeiros passos na sequência protão-protão e usam deutério (2 H) ou então
uma mistura de deutério e trı́tio (3 H), aproveitando-se neste último caso a reacção
2
H + 3 H → 4 He + n.
Para que se dê uma reacção nuclear, os dois núcleos envolvidos devem estar animados com uma
energia cinética muito elevada, para que seja vencida a repulsão electrostática mútua. Podemos
aumentar a energia cinética média dos átomos de uma amostra gasosa aquecendo-a. Para que
sejam possı́veis reacções nucleares, um gás de hidrogénio (ou deutério, 2 H, ou trı́tio, 3 H) tem
que ser aquecido até temperaturas da ordem de 108 K. A esta temperatura a agitação térmica é
suficiente para, só por si, partir as moléculas e ionizar os átomos, formando aquilo que se chama
um plasma, um gás de partı́culas carregadas.
O aquecimento do gás, só por si, não chega para produzir reacções de fusão com a frequência
necessária, porque, à medida que se vai aquecendo o gás, vai também aumentando o seu volume,
se nada for feito para o impedir. Assim, diminui a densidade do gás, ou seja, os átomos que o
compõem ficam mais afastados uns dos outros, logo, diminui a probabilidade da ocorrência de
colisões atómicas. Assim, devemos também confinar o gás, de maneira a evitar a sua dilatação. O
confinamento não pode ser feito pelas paredes do contentor onde se dá a reacção, pois das duas,
uma: ou o contentor se encontra à temperatura do plasma, caso em que se vaporiza imediatamente, ou está a uma temperatura inferior, caso em que arrefece o plasma. Em vez disso, duas
possibilidades têm sido investigadas: o confinamento magnético e o confinamento inercial.
No confinamento magnético, usam-se forças magnéticas para manter o gás confinado. Mas,
para que estas forças (que dependem da velocidade das partı́culas sobre as quais actuam) tenham
um papel confinante, é necessário que as partı́culas carregadas que formam o plasma estejam
animadas de uma velocidade colectiva bastante grande (quando comparada com a da agitação
térmica). Para tal, aceleram-se estas partı́culas numa trajectória circular, dentro de um tubo que
tem a forma de um grande donut, chamado tokamak, em torno do qual se enrolam condutores que
criam no interior do tokamak um campo com a direcção do seu eixo. O efeito combinado deste
campo com o criado pelo movimento do plasma mantém as partı́culas que o formam afastadas das
paredes do tokamak.
O maior tokamak construı́do até hoje é o JET (iniciais de Join European Torus), na Inglaterra. É o resultado de uma colaboração internacional de âmbito europeu. O próximo passo é tão
dispendioso que se torna necessária uma colaboração ainda mais vasta, envolvendo a União Europeia, o Japão, a Rússia, os Estados Unidos e muitos outros. O resultado desta colaboração será a
construção de um novo tokamak, maior que o JET, chamado ITER (International Thermonuclear
Experimental Reactor) em Cadarache, na França. Espera-se que com este reactor seja possı́vel
9.4. APLICAÇÕES DA FÍSICA NUCLEAR
141
manter o regime de funcionamento durante perı́odos de tempo longos, provando-se a viabilidade
de um reactor industrial.
O segundo método de confinamento referido, o confinamento inercial, encontra-se numa fase
mais atrasada de desenvolvimento, e tem sido investigado principalmente pro grupos norteamericanos. Neste método, usa-se uma gotinha de deutério e trı́tio, que é exposta a uma série de
feixes de raios laser, que vaporizam as camadas exteriores da gota, comprimindo as interiores,
tentando-se assim que estas atinjam as temperaturas e densidades necessárias para as reacções de
fusão se iniciarem.
Apesar dos meios astronómicos que se têm investido na investigação da fusão nuclear controlada, este esforço não foi ainda coroado de êxito. Ainda assim, deve dizer-se que a fusão nuclear
“incontrolada” foi já dominada pelo homem. As bombas termonucleares(j) produzem a energia que
libertam na explosão por processos de fusão, mas fazem-no de forma incontrolada. A temperatura
e densidade necessárias para a fusão são possibilitadas por uma bomba atómica de fissão auxiliar,
que rodeia o “combustı́vel” da bomba de fusão e que, ao explodir, comprime e aquece o material
que compõe a bomba de fusão.
9.4.4
Aplicações à medicina
Falta escrever esta subsecção. Os tópicos são:
Ressonância magnética nuclear
Imagiologia
Radioterapia
9.4.5
Datação por carbono-14
O nosso planeta é continuamente bombardeado por partı́culas carregadas provenientes do Sol
e também do exterior do sistema solar. A maior parte destas partı́culas são núcleos de todos
os elementos da tabela periódica. Estas partı́culas têm origem em tempestades magnéticas na
superfı́cie do Sol e de outras estrelas ou em supernovas e outros eventos cataclı́smicos. Muitas
destas partı́culas carregadas são capturadas pelo campo magnético terreste, formando as chamadas
cinturas de Van Allen, regiões com alta densidade de partı́culas carregadas circundando a Terra.(k)
Os raios cósmicos que conseguem penetrar a blindagem magnética do nosso planeta chocam com
as moléculas da atmosfera, produzindo um chuveiro de partı́culas secundárias, como raios-X e γ,
electrões, positrões, neutrões, piões e muões que, por seu turno, participam em novas reacções
nucleares quando colidem com moléculas de ar. Por exemplo, os neutrões reagem com núcleos de
azoto, de acordo com
14
N + n → 14 C +1 H(l) .
Este isótopo do carbono existe na Terra devido a este processo. O carbono-14 é instável, sofrendo
o decaimento-β
14
C → 14 N + β − + ν̄e
com um perı́odo de semidesintegração de 5730 anos. O facto de se dar a produção de átomos de
carbono-14 a uma taxa constante não se traduz num aumento progressivo no seu número na Terra
porque, paralelamente, se vai verificando o seu decaimento.
Se T for a taxa de produção de 14 C e A a actividade (isto é, o número de decaimentos por
unidade de tempo) deste nuclı́deo na Terra, então, num intervalo de tempo dt, o número, N , de
(j) Também
chamadas (erradamente) bombas de hidrogénio.
partı́culas aproximam-se mais da atmosfera na região dos polos, onde ionizam as moléculas de ar em
grandes quantidades, dando origem às auroras boreais.
(l) Este processo ocorre, possivelmente, da seguinte forma: o núcleo de azoto (7 protões e sete neutrões) absorve
o neutrão, mas fica num estado fortemente exitado, e liberta a energia em excesso emitindo um protão, resultando
um nı́cleo com 6 protões e 8 neutrões, ou seja, um núcleo de 14 C.
(k) Estas
142
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
1.2
1
Nν/T
0.8
0.6
0.4
0.2
0
0
1
2
3
4
νt
5
6
7
8
Figura 9.7: Gráfico da evolução do número de núcleos de um nuclı́deo radioactivo com constante
de decaimento ν, produzido a uma taxa constante T , partindo de uma contagem inicial de zero.
átomos de carbono-14 presentes na Terra sofre uma variação dada por
dN = T dt − Adt.
Como já vimos, a actividade de uma amostra com N átomos de é A = νN . Substituindo acima,
obtemos
dN = T dt − νN dt,
ou seja,
dN
= T − νN.
dt
Esta é uma equação diferencial ordinária, com coeficientes constantes, não homogénia, cujas
soluções, bem conhecidas, são (verifique!)
N (t) =
¢
T ¡
1 − e−νt .
ν
O aspecto mais interessante da solução que encontrámos é o facto de o número de núcleos do
nuclı́deo em questão tender para um valor de equilı́brio T /ν, como se pode verificar analisando a
Figura 9.7, onde se representa o gráfico da função N (t). No caso que aqui nos interessa, verifica-se
que a produção de carbono 14 C na alta atmosfera é tal que a fracção deste isótopo no carbono
atmosférico é de 1,316 × 10−10 %, isto é, que, em cada 7,599 × 1011 átomos de carbono, um é de
14
C.
O carbono existe na atmosfera na forma de dióxido de carbono, e é incorporado por muitas
plantas nos seus tecidos através da fotossı́ntese. As relações alimentares distribuem depois o
carbono por todos os seres vivos, de forma que podemos dizer que o teor de carbono-14 em todos
os tecidos vivos (vegetais ou animais) é semelhante ao que se observa na atmosfera. Assim, uma
pessoa com 67 kg de massa, dos quais 18 %, ou seja, 12 kg, são carbono, é constituı́da por cerca
de 1000 mol ' 6 × 1026 átomos de carbono, o que corresponde a cerca de 8 × 1011 átomos de 14 C.
Dada a constante de decaimento deste nuclı́deo, uma pessoa com 67 kg de peso deve apresentar
uma actividade devida ao 14 C de cerca de 3 kBq. Após a morte de um ser vivo, a incorporação de
carbono, pela fotossı́ntese ou pela alimentação, pára, evidentemente e, com o passar dos anos, vai
diminuindo o número de átomos deste isótopo do carbono presentes nos restos mortais daquele ser
vivo. A actividade radioactiva destes restos vai, portanto diminuindo. Comparando a actividade do
carbono-14 de vestı́gios arqueológicos orgânicos (ossos, restos de peles, cabelo, lascas de madeira)
com a esperada para seres vivos, pode deduzir-se a idade desses vestı́gios, isto é, quanto tempo
passou desde que deixaram de pertencer a um organismo vivo.
9.5. ALGUNS TÓPICOS DE NOTICIÁRIO
143
Assim, se retirarmos uma amostra de 1,0 g de carbono de um organismo vivo, ou seja, 0,08 mol
de átomos de carbono , esperamos que 1,316 × 10−10 % sejam átomos de carbono-14, o que corresponde a 1,1 × 10−13 mol ' 6,6 × 1010 átomos. A actividade desta amostra é
A
= νN
= 0, 25 Bq.
Uma vez que a actividade de uma amostra radioactiva segue o mesmo comportamento exponencial
que o número de átomos presentes na amostra, o valor que determinámos para a actividade desta
amostra deve ir diminuindo com o tempo. Assim, se retirarmos uma amostra igual de carbono de
vestı́gios arqueológicos com 3000 anos, a sua actividade de ter-se-á reduzido, relativamente à de
uma amostra idêntica mas “fresquinha,” por um factor igual a exp (−νt) ' 0, 70, ou seja, deve ter
o valor de 0,17 Bq.
Imaginemos agora que medı́amos a actividade de uma amostra de átomos de carbono com 0,5 g,
retirada de restos recolhidos numa escavação, e determinávamos um valor de A(t) = 0,028 Bq.
Dado o teor de carbono-14 na atmosfera, verificamos facilmente que a actividade de uma amostra
semelhante recolhida de um tecido vivo é A0 = 0,127 Bq. A lei do decaimento, que podemos
escrever como
A(t) = A0 e−νt ,
pode agora ser resolvida em ordem a t, e obtemos
t=
1
A0
ln
' 12500 anos.
ν A(t)
Este método não produz resultados fiáveis para datar vestı́gios recentes, digamos, com algumas
centenas de anos, por exemplo, das invasões napoleónicas. Isto, porque num tão curto intervalo de
tempo (quando comparado com o perı́odo de semi-desintegração do 14 C) o teor de carbono-14 não
sofre uma variação discernı́vel. No extremo oposto, restos muito antigos, digamos, com mais do
que 10 perı́odos de semidesintegração do 14 C (ou seja, cerca 50000 anos) não têm já uma actividade
de carbono-14 detectável, porque o teor deste nuclı́deo que apresentam é já demasiado baixo. O
processo de datação por carbono-14 serve então para datar vestı́gios arqueológicos mais antigos
do que 500 anos e menos antigos do que 50000 anos.
O método de datação que acabámos de ilustrar só é válido se o teor de carbono-14 se tiver
mantido constante ao longo do perı́odo histórico (ou pré-histórico) ao qual se pretende aplicar.
Mas este teor depende da concentração de azoto na atmosfera e do fluxo de raios cósmicos que
atinge a atmosfera, que, por seu turno, depende da intensidade do campo magnético terreste. Ora,
tanto a concentração de azoto como a intensidade do campo magnético terreste têm variado ao
longo dos anos, de forma que na verdade os cálculos necessários para fazer datações com base
no teor de 14 C são bastante mais complicados do que o que aqui exemplificámos. Outra possı́vel
fonte de erro resulta da utilização de combustı́veis fósseis, generalizada a partir do sec. XX. A
combustão de matéria orgânica é uma importante fonte de dióxido de carbono atmosférico.(m)
Mas os combustı́veis fósseis, resultam da degradação de matéria orgânica ao longo de perı́odos de
milhões de anos. Assim, o teor de 14 C do petróleo e do carvão e gás naturais é nulo. A utilização
generalizada destes combustı́veis inunda a atmosfera de CO2 virtualmente desprovido de carbono14. Como as medições do teor deste isótopo na atmosfera foram todas feitas nas últimas dezenas
de anos, é possı́vel que o tenhamos estimado por defeito.
9.5
9.5.1
Alguns tópicos de noticiário
A radioactividade natural
A matéria que compõe o nosso planeta inclui alguns isótopos instáveis, o que faz com que a Terra
seja uma fonte naturalmente radioactiva. Recordemos, a propósito, que o inı́cio do estudo da Fı́sica
(m) Este
é um problema fulcral dos nossos dias, por causa do efeito de estufa global.
144
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
124
126
128
130
132
134
136
138
140
142
144
146
N
Z
U
U
92
Pa
Th
Ra
Rn
Po
Po
Po
Bi
90
88
86
84
Bi
Pb
Pb
Th
Pb
82
Tl
Hg
80
Figura 9.8: Cadeia de decaimentos do 238 U. Note-se que o chumbo 210 Pb pode sofrer decaimento α
para
206
Hg ou decaimento β para
210
Bi.
Nuclear deu-se com a descoberta desta radioactividade natural em 1897, por Becquerel, como já
se disse. Alguns destes isótopos integram a composição da Terra desde a sua formação, há cerca
de 4,5 × 109 anos. Por exemplo, o 238 U é relativamente abundante, pertencendo à composição de
rochas como o granito. Outros, como o 14 C que já referimos, são produzidos pela interacção entre
o planeta e a radiação cósmica, ou resultam do decaimento dos átomos do primeiro grupo, como
o radão 222 Rn, que é um dos produtos da sequência de decaimentos que se inicia com o do 238 U.
A presença de urânio (principalmente 238 U) na Terra é extremamente importante. O seu
decaimento (e o do dos seus produtos) é a principal fonte de calor do interior da Terra. É,
assim, ao urânio que devemos o facto de a Terra ter um núcleo lı́quido, logo, ser um planeta
geologicamente activo. O urânio-238 sofre decaimento α com um perı́odo de semidesintegração de
4,5 × 109 anos, de acordo com o processo
238
U → 234 Th + α.
O factor-Q deste decaimento é 4,27 MeV. O tório 234 Th é, também, instável, sofrendo decaimento
β − com um perı́odo de semi-vida de 24,1 dias para o proctacnı́dio 234 Pa. A sequência completa
termina no mercúrio 206 Hg e é ilustrada na Figura 9.8. Todos os nuclı́deos presentes no diagrama
da Figura 9.8 são relativamente abundantes nas zonas ricas em granito, porque o urânio é um
dos componentes deste mineral. O aspecto mais relevante, para a nossa vida no dia a dia, desta
cadeia de decaimentos, é a presença do radão 226 Rn. Como se pode constatar, o radão-226 sofre
decaimento α, e fá-lo com um perı́odo de semivida de 7,4 min. Mas o pior é que o radão é um
gás, que se vai libertando das camadas superficiais das rochas onde é produzido, pelo que pode
ser inspirado por animais e pessoas, depositando-se no organismo. Como é óbvio, a presença
no interior do corpo de uma pessoa de uma fonte radioactiva não é nada benéfica para a sua
saúde. Em cavernas, ou habitações pouco arejadas, a concentração de radão pode atingir valores
suficientemente elevados para que as questões relacionadas com a exposição à radiação natural se
tornem preocupantes. Este problema nota-se mais nas regiões granı́ticas (como a nossa), onde se
verifica uma incidência ligeiramente maior de alguns tipos de cancro, resultantes da exposição à
actividade do radão.
9. Problemas
9.5.2
145
A utilização de urânio empobrecido
Comojá vimos, para a produção de energia por fissão nuclear de urânio, é necessário proceder ao
enriquecimento do material fı́ssil, que consiste em elevar o teor de 235 U de 0,7 % (valor apresentado
no urânio natural) para 3 %. Isto consegue-se através de processos fı́sicos, seleccionando átomos
de 235 U e rejeitando os de 238 U de forma a serem obtidas as proporções requeridas dos dois
isótopos. Um efeito secundário deste processo é a produção de grandes quantidades de urânio
empobrecido, isto é, urânio em que o teor de 235 U é muito inferior ao que se verifica na natureza.
Este facto coloca problemas delicados. Como quase todos os metais pesados, o urânio é um
veneno quı́mico poderoso; logo não se pode, simplemente, despejá-lo no solo ou na corrente de
um rio este resultado secundário do processo de produção. O seu armazenamento em grandes
quantidades num local também não é aconselhável, porque, sendo o 238 U radioactivo (ainda que
fracamente), a actividade do local de armazenamento pode atingir valores muito elevados. Mas
note-se que este urânio empobrecido é menos radioactivo do que o urânio natural. Com efeito, dos
dois isótopos mais frequentes na terra, o 235 U, que se aproveita no processo de enriquecimento, é
o mais radioactivo, apresentando uma constante de decaimento cem mil vezes maior do que a do
238
U.
Por ser tão fracamente radioactivo e por ser um metal extremamente duro e denso, o excedente
de urânio empobrecido tem sido aproveitado para a produção de blindagens de veı́culos militares (tanques, etc.) e de munições capazes de as penetrar. Esta utilização tem causado alguma
polémica porque tem sido associada a problemas de saúde (muitas vezes fatais) experimentados
por soldados com missões em zonas de combate, mesmo quando escapam sem ferimentos dessas
missões. Possivelmente, estes problemas de saúde devem-se a envenenamentos causados pela inspiração de fumos e poeiras ricos em urânio, resultantes das explosões de projécteis (e dos seus
alvos) fabricados com urânio empobrecido.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• K. Krane, “Modern Physics” (1992) Capı́tulo 9,10: Fı́sica nuclear (F5.0 453)
• K. Krane, “Introductory Nuclear Phisics” (1988) (F5.0 360)
• F. Blatt, “Modern Phisics” (1992) Capı́tulo 14,15,16: Fı́sica nuclear (F5.0 448)
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989) Capı́tulos 14 e 15:
Fı́sica Nuclear (F5.0 437)
• P. Tipler e R. Llewellyn, ”Fı́sica Moderna (3.a edição), Capı́tulos 11 e 12: Fı́sica Nuclear
• Decreto regulamentar n.o 9/99 de 19-04-1990:
http://www.diramb.gov.pt/data/basedoc/TXT_LN_2472_2_0001.htm
PROBLEMAS
9.1 A taxa de contagem de uma fonte radioactiva é 4000 contagens por segundo num certo instante.
Passados 10 s este valor reduz-se para 1000 contagens por segundo. (a) Qual o tempo de semidesintegração do material desta fonte? (b) Qual a taxa de contagem desta fonte passados 30 s do
instante inicial?
9.2 Uma amostra de um isótopo radioactivo tem uma actividade 115,0 Bq num certo instante; passado
2 h 15 min, a actividade reduziu-se a 85,2 Bq. (a) Qual o valor da constante de decaimento? (b)
Quantos núcleos radioactivos estavam presentes na amostra no instante inicial?
146
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
9.3 O nuclı́deo 62 Cu é produzido a uma taxa constante e sofre decaimento β + com uma meia vida de
10 min. Quanto tempo é necessário para produzir 90% do valor de equilı́brio de 62 Cu?
9.4 O urânio-238 sofre decaimento α com um perı́odo de semi-desintegração de cerca de 4,5×109 anos.
(a) Qual o isótopo que resulta deste decaimento?
(b) Qual o valor da actividade de uma amostra pura de
238
U com 1 g de massa?
(c) Qual o valor da potência irradiada pela amostra da alı́nea anterior?
9.5 Calcule a energia libertada no decaimento α do
por emissão de um nucleão isolado.
233
Np. Mostre que este nuclı́deo não pode decair
9.6 Identifique a partı́cula ou nuclı́deo X em cada um dos processos seguintes:
(a) X → 65 Ni + γ
(b)
215
Po → X + α
(c) X → 55 Fe + e+
(d)
109
(e)
14
Cd + X → 109 Ag
N +4 He → X + 17 O
9.7 Uma amostra de madeira, retirada de uma escavação arqueológica, com 21,0 mg de carbono
apresenta uma actividade de 837 decaimentos por semana. Qual a idade desta amostra?
9.8 Bombardeando ouro natural (197 Au) com neutrões lentos, nota-se a emissão de radiação β − . Que
reacção ocorre e qual o valor do seu factor-Q?
9.9 Um edifı́cio ficou acidentalmente contaminado com material radioactivo. Suponha que a substância com maior tempo de vida neste edifı́cio é o estrôncio-90, que tem uma massa atómica de 89,91 u
e um perı́odo de semi-desintegração de 29,1 anos. Suponha que, como resultado do acidente, 5,0 kg
de estrôncio-90 se espalharam pelo edifı́cio. Considerando que um nı́vel de radiação seguro é 10
decaimentos por minuto ou menos, durante quanto tempo deverá o edifı́cio manter-se encerrado
ao público?
9.10 Uma fonte radioactiva tem uma actividade tal que, a 3,0 m de distância, se podem contar 3
fotões γ por segundo e por cm2 , com uma energia de 2 MeV. Uma pessoa com 70 kg, situada a
esta distância, que dose absorve por minuto (considere que esta pessoa apresenta à fonte uma área
eficaz de 0,8 m2 )? Quanto tempo pode a pessoa permanecer nesta posição antes de absorvem um
equivalente de dose de 5 Sv? E se se tratasse de partı́culas α com a mesma energia?
Capı́tulo 10
Elementos de Fı́sica Subatómica
Terminámos o Capı́tulo 1 destes apontamentos com uma descrição bastante simples da realidade,
segundo a qual a matéria seria constituı́da por apenas três tipos de partı́culas elementares: os
electrões, os protões e os neutrões. A dualidade onda-corpúsculo veio complicar um pouco este
estado de coisas, tendo obrigado à introdução dos fotões, as partı́culas de campo electromagnético,
e fizémos já referência aos fonões, que são as partı́culas do campo das vibrações atómicas. Outra
complicação foi a introdução dos positrões, a propósito do decaimento β + , no capı́tulo anterior.
Na verdade, as coisas são muito mais complicadas. Muitos fenómenos não são compreensı́veis
num quadro tão simplista. Por exemplo, os decaimentos β seriam incompatı́veis com as leis da
conservação da energia e do momento se neles apenas intervissem protões, neutrões e electrões
(ou positrões), como veremos daqui a pouco. Por outro lado, a dualidade ondas-partı́culas obriga
(tal como para a força electromagnética e os fotões) à existência de quanta do campo da força
nuclear forte. A decoberta destas partı́culas, necessárias por razões teóricas, foi acompanhada da
de muitas outras que ninguém previra. No final dos anos cinquenta, começou até a falar-se do
jardim zoológico das partı́culas elementares(a)
. É este o assunto que nos vai ocupar agora.
10.1
A selva das partı́culas elementares
10.1.1
O positrão de Dirac
Como deve já ser bem sabido, no formalismo da Mecânica Quântica cada variável fı́sica é representada por um operador que actua num espaço de funções, ou espaço de estados. À energia
corresponde o operador ih̄∂/∂t, ao momento linear (na representação das coordenadas) o operador
~ à posição (na mesma representação) o operador de multiplicação pelo vector posição, isto
−ih̄∇
é, ~r×. Assim, a Equação de Schrödinger,
ih̄
∂ψ(~r, t)
h̄2 2
=−
∇ ψ(~r, t) + V (~r)ψ(~r, t),
∂t
2m
corresponde à equação clássica
p2
+ V (~r).
2m
Os dois termos no lado direito desta equação são, como é bem sabido,a energia cinética e a
energia potencial, respectivamente. Mas a energia cinética aparece nesta expressão na forma não
relativı́stica. Logo a Equação de Schrödinger é uma equação não relativı́stica também(b)
. Tentemos
deduzir uma equação de onda relativı́stica mas, para simplificar, consideremos apenas partı́culas
E=
(a) Talvez
fosse mais adequada a expressão selva das particulas elementares.
era preciso tanto para chegarmos a esta conclusão, bastava notar que as derivadas em ordem ao tempo
e às coordenadas espaciais não têm a amesma ordem. Nas equações relativı́sticas, tempo e espaço desempenham
papéis formalmente semelhantes.
(b) Não
147
148
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
livres, isto é, não sujeitas a forças, logo, com energia potencial constante que pode ser escolhida
nula. A expressão clássica da energia cinética relativı́stica é
E 2 = p2 c2 + m2 c4 .
Fazendo a correspondência anterior entre variáveis fı́sicas e operadores quânticos,
∂
∂t
~
p~ → −ih̄∇,
E
→ ih̄
obtemos uma equação equação de onda relativı́stica para partı́culas livres, chamada Equação de
Klein-Gordon:
∂ 2 ψ(~r, t)
−h̄2
= −h̄2 c2 ∇2 ψ(~r, t) + m2 c4 ψ(~r, t).
∂t2
Esta equação levanta alguns problemas. O mais relevante para a presente discussão é o facto
de, para um dado vector momento linear (qualquer), haver dois estados distintos com energias
simétricas uma da outra, dadas por
p
E = ± p2 c2 + m2 c4 .
É difı́cil compreender como é que uma partı́cula livre pode ter energia cinética negativa ou qual
o significado dum tal valor energético. Deve dizer-se, a propósito, que Schrödinger começou por
tentar uma descrição relativı́stica dos electrões, tendo deduzido inicialmente a Equação de KleinGordon. No entanto, face às dificuladades que descrevemos, desistiu e contentou-se com um
formalismo não relativı́stico.
A gravidade da existência de estados com energia negativa pode ser melhor apreciada se considerarmos um electrão livre, parado. Classicamente, este electrão está num estado em que a sua
energia é mc2 , onde m é a massa electrónica. Em contrapartida, de um ponto de vista quântico,
esta partı́cula, no estado de repouso, tem à sua disposição um estado com energia −mc2 , logo
deveria ser possı́vel uma transição para este estado, acompanhada da emissão de radiação com
energia 2mc2 . Um tal fenómeno parece pouco menos que absurdo. Com efeito, é difı́cil dar um
significado fı́sico à energia de uma partı́cula livre, se ela puder tomar valores inferiores ao que
apresenta no estado de repouso.
Este problema do significado das soluções da equação de onda com energia negativa começou
a ser resolvido por P. A. M. Dirac no final dos anos vinte. Dirac deduziu uma equação de onda
relativı́stica de primeira ordem, cujas soluções com energia positiva descreviam correctamente o
comportamento dos electrões. Tomando o limite não relativı́stico da Equação de Dirac resultava
a Equação de Schrödinger, e o momento angular intrı́nseco (ou spin) surgia naturalmente neste
limite. Apesar destes sucessos, as soluções da Equação de Dirac apresentavam também dois valores
de energia simétricos. Considerando electrões livres, os dois valores são os mesmos que resultam
da Eqaução de Klein-Gordon. Neste aspecto, a Equação de Dirac, por si só, não representou
um grande avanço. Considerando que a sua equação descrevia electrões, que são fermiões, Dirac
fez uma suposição arrojada para tentar resolver o problema colocado pelas soluções de energia
negativa: afirmou que estes estados existem, de facto, mas estão, em condições normais, todos
ocupados. Assim, um electrão com energia positiva não pode sofrer uma transição para um estado
com energia negativa porque o Princı́pio de Exclusão de Pauli proı́be-o.
Deste modo, Dirac preencheu todo o universo com electrões com densidade infinita, inobserváveis porque distribuidos uniformemente. A estes electrões (em número infinito), que ocupam
todos os estados com energia negativa, dá-se o nome de mar de Dirac. Esta hipótese permite fazer
previsões interessantes. Por exemplo, tal como as vibrações atómicas num semicondutor podem
excitar um electrão da banda de valência para a de condução, deixando, na primeira, uma lacuna,
também deve ser possı́vel um fotão com energia igual ou superior a 2mc2 excitar um electrão
do mar para um estado com energia positiva. Neste processo, um estado com energia negativa
fica vago, podendo ser identificado com uma partı́cula com massa igua à do electrão mas carga
10.1. A SELVA DAS PARTÍCULAS ELEMENTARES
γ
149
e-
e+
e+
γ
γ
eE
mc 2
E
γ
mc 2
0
0
-mc 2
-mc 2
γ
Figura 10.1: Criação (à esquerda) e aniquilação (à direita) de pares electrão-positrão. Em cima,
diagramas esquemáticos dos processo; em baixo, interpretação de Dirac.
com sinal oposto — um positrão. Este processo tem o nome de criação de pares e ocorre muito
frequentemente em experiências de alta energia.
Dirac previu também a possibilidade da ocorrência do processo inverso, em que um electrão e
um positrão colidem, aniquilando-se mutuamente, produzindo radiação. Para Dirac, acontecimentos deste tipo ocorreriam quando um electrão com energia positiva sofresse uma transição para um
estado vago (lacuna ou positrão) de energia negativa. Este processo é hoje em dia bem conhecido
e tem o nome de aniquilação de pares.
A criação e aniquilação de pares estão representados graficamente na Figura 10.1.
O positrão foi descoberto em 1933, por C. Anderson, quando analizava a radiação cósmica.
10.1.2
O neutrino de Pauli
O decaimento β, tal como o descrevemos até agora, tem alguns aspectos que causam preplexidade.
Consideremos, por exemplo, o caso do bismuto 210 Bi. Este nuclı́deo sofre decaimento β com um
perı́odo de semidesintegração de cerca de 5 dias. De acordo com o que estudámos no capı́tulo
anterior, o decaimento deste nuclı́deo é
210
Bi → 210 Po + e− ,
com um factor-Q aproximadamente igual a 1,2 MeV. Consideremos o decaimento usando o referencial do centro de massa do sistema, relativamente ao qual o núcleo de bismuto se encontra em
repouso. De acordo com a lei da conservação do momento linear, após o decaimento, o electrão e o
núcleo de polónio devem seguir em sentidos opostos, com momentos lineares com módulos iguais.
Mas a massa do núcleo de polónio é cerca de 200 000 vezes maior do que a do electrão, logo, a
velocidade daquele deverá ser menor do que a deste na mesma proporção. Pela mesma razão, a
energia cinética do núcleo de polónio será, também, 200 000 vezes menor do que a do electrão, ou
seja, o electrão emitido no decaimento β do 210 Bi deve ficar animado com uma energia cinética
que é praticamente igual ao factor Q do decaimento, 1,2 MeV. E, no entanto, a análise da energia
dos electrões resultantes do decaimento β do bismuto (ou de outras substâncias) revela uma realidade bem diferente. Em vez de terem uma energia bem determinada (1,2 MeV no decaimento do
bismuto, outros valores para outros nuclı́deos) os electrões emitidos durante o decaimento β têm
energias que se distribuem continuamente num intervalo que é limitado superiormente pelo factor Q do decaimento. Por exemplo, para o bismuto 210 Bi, Ellis e Wooster fizeram, em 1927, uma
determinação da curva de distribuição dos electrões emitidos, como função da sua energia, cujo
resultado se ilustra na Figura 10.2. O facto de alguns (quase todos) os electrões serem emitidos
150
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
Figura 10.2: Distribuição energética dos electrões emitidos no decaimento β do
210
Bi (Proc. Royal
Soc. A117 109 (1927).
no decaimento beta com uma energia cinética tão menor do que o factor Q do decaimento parece
constituir uma violação do princı́pio da conservação da energia.(c)
Outro aspecto estranho do decaimento beta pode ser mais facilmente ilustrado quando se considera o mais simples destes processos, o decaimento de um neutrão. Mais uma vez, consideremos
o processo relativamente ao referencial do centro de massa do sistema. Antes do decaimento, o
sistema consiste num neutrão em repouso. O momento angular deste sistema reduz-se então ao
spin do neutrão, 1/2. Depois do decaimento, o sistema consiste num protão e num electrão, que
se movem(d) em direcções opostas com momentos lineares de igual módulo, logo, com momento
angular orbital nulo. O momento angular total deste sistema é o que resulta da composição dos
spins das duas partı́culas. Mas o momento angular total de um sistema de dois fermiões com spin
1/2 com momento angular orbital nulo pode ser 0 ou 1, nunca 1/2. Assim, aparentemente, o decaimento β não só não verifica a lei da conservação da energia como também viola a da conservação
do momento angular.
Pauli conseguiu resolver este problema com uma hipótese que começou a desenvolver em 1930,
e que foi sendo refinada nos anos seguintes, por ele e por Fermi. De acordo com esta hipótese, no
decaimento β seria emitida uma terceira partı́cula, com spin 1/2 (de maneira a garantir a satisfação
da lei da conservação do momento angular), com carga nula (para satisfazer a lei da conservação
da carga eléctrica) e com massa muito, muito pequena, muito menor do que a do electrão, eventualmente nula (como a do fotão), que repartiria com o electrão a energia disponı́vel resultante do
decaimento. A massa dos neutrinos (como vieram a ser conhecidas estas novas partı́culas) tinha
que ser mesmo muito reduzida, porque alguns electrões são emitidos no decaimento β com uma
energia muito próxima do valor máximo, isto é, do factor-Q do decaimento(e) .
O neutrino foi descoberto só em 1952, por F. Reynes e C. Cowan. Este atraso justifica-se
em parte pelo eclodir da Segunda Grande Guerra, mas principalmente pelo carácter esquivo dos
neutrinos. Note-se que, para se observar uma partı́cula, ela deve, de algum modo, interagir com
o instrumento detector. Assim, por exemplo, os nossos olhos são capazes de detectar fotões,
através de um processo de captura que se dá na retina. Ora, os neutrinos não têm carga eléctrica
e verifica-se que são insensı́veis, tal como os electrões, às interacções fortes. Assim, restam as
possibilidades de interagirem através de interacções dipolares magnéticas (muito menos intensas
que as eléctricas), caso tenham momento magnético, questão que ainda está em aberto, ou através
(c) Niels
Bohr chegou a considerar a hipótese da violação efectiva dessa lei nos processos microscópicos.
bem dizer, o protão fica praticamente parado, por ser muito mais pesado do que o electrão...
(e) A questão da massa dos neutrinos ficou em aberto até muito recentemente, quando a colaboração SuperKamiokande anunciou (em 1998, 46 anos depois da descoberta dos neutrinos!) resultados que mostravam indubitavelmente que o seu valor é não nulo.
(d) A
10.1. A SELVA DAS PARTÍCULAS ELEMENTARES
151
ν
ν
ν
e+
en
p+
p+
n
ep+
n
Figura 10.3: Diagramas da Figura 9.2, agora incluindo os neutrinos. Representam-se as linhas de
neutrinos com o sı́mbolo ν e as de antineutrinos com ν̄.
de uma outra força por enquanto ainda não referida, com intensidade muito baixa. Seja como
for, os neutrinos praticamente não interagem com a matéria e, portanto, é extremamente difı́cil
detectá-los. Esta propriedade inspirou o poeta norte-americano Jonh Updike para a escrita do
seguinte poema, publicado pela primeira vez em 1960:
Cosmic Gall:
Neutrinos, they are very small.
They have no charge and have no mass
And do not interact at all.
The earth is just a silly ball
To them, through which they simply pass,
Like dustmaids through a drafty hall
Or photons through a sheet of glass.
They snub the most exquisite gas,
Ignore the most substantial wall,
Cold-shoulder steel and sounding brass,
Insult the stallion in his stall,
And scorning barriers of class,
Infiltrate you and me! Like tall
And painless guillotines, they fall
Down through our heads into the grass.
At night, they enter at Nepal
And pierce the lover and his lass
From underneath the bed-you call
It wonderful; I call it crass.(f)
Por razões que serão explicadas mais adiante, convencionou-se que, no decaimento-β do neutrão, era emitida a anti-partı́cula do neutrino, ao passo que os neutrinos seriam emitidos nos
decaimentos-β + . Podemos agora desenhar completar mais correctamente os diagramas da Figura 9.2, incluindo o neutrino (ou anti-neutrino). Os diagramas corrigidos estão apresentados na
Figura 10.3.
(f) Desconsideração cósmica: Neutrinos, são muito pequeninos./Eles não têm carga e não têm massa/E não interagem com nada./A Terra é apenas uma bola tonta para eles, através da qual eles simplesmente passam/Como
criadas limpando o pó, através de uma sala ventosa/Ou fotões através de uma lâmina de vidro./Eles desprezam
o gás mais fino,/ Ignoram a barreira mais substancial/O duro aço e o sonoro bronze/Insultam o garanhão no seu
pedestal/E desrespeitando as barreiras de classe,/Infiltram-se em ti e em mim! Como altas/E indolores guilhotinas,
eles caem/através das nossas cabeças até à relva./À noite, entram no Nepal, perfuram o amante e a sua amada/De
debaixo do seu leito — Tu acha-los/ Maravilhosos; eu acho-os estúpidos. (Traduzido “às três pancadas”.)
152
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
e-
eγ
e-
e-
Figura 10.4: Dispersão de Rutheford de dois electrões.
e-
γ
e-
γ
e-
e-
Figura 10.5: As duas interacções que compõem o processo da Figura 10.4.
10.1.3
O mesão π de Yukawa e um convidado inesperado
Quantização das interacções electromagnéticas
Noutras disciplinas, estudou-se já a descoberta das caracterı́sticas corpusculares da luz e a importância que essa descoberta teve para o emergir da Fı́sica Moderna. Vejamos, por outro ângulo,
essas caracterı́sticas. É que a luz, sabe-se desde Maxwell e Hertz, é campo electromagnético; por
seu turno, o campo electromagnético é o intermediário das interacções eléctricas e magnéticas.
Quer isto dizer que duas cargas na proximidade uma da outra não se influenciam directamente
uma à outra, cada uma é influenciada pelos campos eléctrico e magnético gerados pela outra. O
facto destes campos terem carterı́sticas corpusculares deve traduzir-se na descrição que fazemos
da interacção entre as duas partı́culas carregadas. De facto, assim é. Nos termos da Mecânica
Quântica, cada partı́cula carregada é fonte constante de fotões; a colisão desses fotões com outra
partı́cula carregada altera o seu estado de movimento, traduzindo-se este processo numa interacção
efectiva entre as duas partı́culas carregadas.
O mais simples dos processos deste tipo chama-se dispersão de Rutheford e consiste na colisão
entre duas partı́culas com carga eléctrica do mesmo sinal. A dispersão de Rutheford de dois
electrões está representada graficamente, na sua forma mais elementar, na Figura 10.4. Um dos
electrões (digamos, aquele que está representado à esquerda) emite, na direcção do outro electrão
um fotão, sofrendo um recuo no sentido oposto, ou seja, para a esquerda; quando este fotão colide
com o outro electrão empurra-o, afastando-o do primeiro. Assim, o efeito desta troca de fotões é
semelhante ao de uma força repulsiva entre os dois electrões(g) .
O processo que acabámos de descrever consiste, de facto, em duas interacções: a emissão de
um fotão por um electrão e a absorção desse fotão por outro electrão. Estes dois acontecimentos
podem representar-se graficamente como se mostra na Figura 10.5.
O fotão trocado entre os dois electrões não pode ser um fotão “normal”. Consideremos o
processo de emissão, por exemplo (o vértice representado à esquerda na Figura 10.5). No referencial
do centro de massa do sistema, antes da colisão, o sistema consiste apenas num electrão parado,
com momento linear nulo e energia Ei = me c2 . Depois da colisão, o sistema consiste em duas
(g) Mas esta descrição, nos termos clássicos de efeitos de recuo e colisão quando se emite e absorve um fotão
não deve ser tomada à letra. Por exemplo, é muito difı́cil descrever desta forma a atracção entra cargas de sinal
diferente... Como veremos já a seguir, estes fotões são partı́culas não muito “normais”. Chega a noção que eles
transportam, de algum modo, a interacção entre partı́culas carregadas.
10.1. A SELVA DAS PARTÍCULAS ELEMENTARES
153
partı́culas, um fotão e um electrão, respectivamente com energias Eγ e E 0 e. De acordo com as
bem conhecidas leis de conservação, deve conservar-se o momento linear total e a energia. Assim,
o fotão e o electrão devem mover-se em sentidos opostos, com iguais módulos do momento linear.
Mas então a energia total do sistema depois da colisão, dada por
Ef
=
=
Eγ + Ee0
p
h̄ω + m2e c4 + p2 c4 ,
onde p é o módulo do momento linear das duas partı́culas e ω é a frequência da radiação associada
ao fotão emitido, é superior à energia total do sistema antes da colisão! Dá-se, assim, uma violação
da lei da conservação da energia?! Uma análise semelhante levaria a um paradoxo semelhante a
propósito do processo de absorção do fotão, no vértice do lado direito na Figura 10.5.
Apesar de ser impossı́vel a verificação das leis da conservação da energia e do momento linear
em cada um dos processos de emissão e absorção que compõem esta interacção entre os dois
electrões, ao nı́vel mais global não se verifica este problema. É perfeitamente possı́vel satisfazer
aquelas leis considerando as energias e momentos lineares dos electrões, porque as violações que
se verificam nos dois vértices têm sinal contrário: na emissão, a energia final é necessariamente
maior do que a inicial, na absorção é ao contrário. Uma vez que este paradoxo se manifesta
apenas quando se considera o estado intermédio (aquele que existe entre os instantes de emissão
e absorção do fotão trocado), a sua gravidade (a sua efectividade, até) depende de forma fulcral
da precisão com que conseguimos medir a energia deste estado intermédio. Ora, de acordo com
um importante teorema da Mecânica Quântica, a energia de um estado quântico é tanto melhor
definida quanto maior for o seu tempo de vida, de acordo com(h)
∆E τ ≥ h̄,
onde ∆E é a incerteza do valor da energia de um estado, τ o seu tempo médio de vida e h̄
é a constante de Plank reduzida. Então, se o fotão trocado entre os dois electrões tiver uma
duração suficientemente breve, não se pode propriamente falar em violação da lei da conservação
da energia, porque a precisão com que determinamos a sua energia não é suficiente para tal. Se
este fotão fosse detectado (isto é, se fosse aborvido por um detector), em vez de ser absorvido
pelo outro electrão, a sua energia deste fotão poderia ser determinada com precisão se se utilizasse
um detector apropriado. Nesta situação, o paradoxo seria inevitável. Constatarı́amos que não se
verificava a lei da conservação da energia! Como nunca se observou uma tal violação, como não
acreditamos que esta possibilidade se possa verificar, devemos aceitar que não é possı́vel detectar
estes fotões. Por esta razão, os fotões intermediários nas interacções electromagnéticas chamam-se
fotões virtuais.
A distância que um destes fotões virtuais, com um tempo de vida τ , pode percorrer antes
de ser absorvido por uma partı́cula carregada é, evidentemente, d = cτ . Ora, de acordo com a
desigualdade acima, τ ≥ h̄/∆E. Tomando o limite inferior para estimar uma ordem de grandeza,
obtemos
ch̄
d'
.
∆E
Mas, para salvaguardar o princı́pio da conservação da energia, a incerteza na energia do estado
intermédio tem que ser da ordem de grandeza da energia do fotão trocado, e essa pode tomar
valores arbitrariamente baixos, porque os fotões têm massa em repouso nula. Logo, os fotões
virtuais podem alcançar distâncias arbitráriamente grandes. Assim, este processo de troca de
fotões virtuais pode, de facto, descrever a interacção electromagnética que tem, como se sabe, um
alcance infinito.
Força nuclear e mesões π
Em 1935, um fı́sico japonês chamado Hideki Yukawa propôs uma descrição da força nuclear em
termos semelhantes aos que acabámos de estudar a propósito das interacções electromagnéticas.
(h) Costuma dar-se a esta desigualdade o nome de relação de incerteza tempo-energia, apesar desta designação
não ser muito apropriada.
154
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
n
p
π0
n
n
π0
p
p
π+
p
πn
Figura 10.6: Vértices fundamentais da força nuclear, nos termos da descrição de Yukawa. Compare
com o vértice fundamental da electrodinâmica, representado na Figura 10.5.
Yukawa considerou que a interacção nuclear se dava por troca de partı́culas a que chamou mesões π
ou piões, que desempenhariam, relativamente à força nuclear, o mesmo papel que os fotões desempenham na electrodinâmica. Como o alcance da força nuclear está limitado a cerca de 1 fm,
Yukawa supôs que estas partı́culas teriam, ao contrário dos fotões, massa em repouso não nula.
Considerando que a energia mı́nima de um pião é a sua energia de repouso, mπ c2 , e substituindo
na igualdade aproximada acima, Yukawa concluiu que a massa desta partı́cula deveria ser cerca
de
h
mπ '
' 200 MeV.
cd
A partı́cula intermediária na electrodinâmica, o fotão, não tem carga eléctrica, logo, nos vértices
fundamentais desta teoria não pode haver mudança da carga da partı́cula que emite ou absorve
um quanta de campo. Mas esta suposição não pode fazer-se, à priori, para a força forte. Devemos
pois considerar a possibilidade de um nucleão emitir um pião, transformando-se num nucleão
diferente, por exemplo, um neutrão transformar-se num protão quando emite um pião(i) . Quando
isto acontece, o pião emitido tem, necessariamente, carga eléctrica. Yukawa foi assim levado a
propôr a existência, não de uma partı́cula, mas sim de três, com cargas +e, 0 e −e, que seriam
as intermediárias da força nuclear. As massas dos três piões seriam forçosamente muito parecidas
porque, como vimos, a força nuclear é independente da carga: as interacções entre dois protões,
dois neutrões ou um protão e um neutrão são todas iguais, desde que se possa “desligar” a força
electromagnética.
Os vértices fundamentais das interacções nucleares estão ilustrados na Figura 10.6. Como deve
ser evidente, os piões devem ter spin 0 ou spin 1, de maneira a que nestes vértices possa ser
satisfeita a lei da conservação do momento angular.
No final dos anos trinta, a análise da radiação cósmica revelou a presença de partı́culas com
uma massa de cerca de 100 MeV. A proximidade deste valor com a estimativa feita por Yukawa
sugeria que estas novas partı́culas fossem os seus mesões π. No entanto, estas partı́culas tinham
uma elevada capacidade de penetração na matéria sólida, facto inesperado para partı́culas sujeitas
às interações fortes. Estudos posteriores vieram, até, a revelar que os muões eram totalmente
insensı́veis a estas forças. Por outro lado, veio a revelar-se que estas novas partı́culas são fermiões,
com spin-1/2, o que é completamente incompatı́vel com a hipótese de Yukawa. Durante alguns
anos, continuaram a ser conhecidas como mesões, mas hoje em dia têm o nome de muões e são
representados pelo sı́mbolo µ− . São partı́culas em tudo semelhantes aos electrões, à parte o valor
da massa.
A descoberta dos muões foi, como acabámos de ver, completamente inesperada. Se as restantes
partı́culas “novas” de que falámos até aqui desempenhavam algum papel no quadro geral que
ia emergindo da actividade cientı́fica nos anos trinta e quarenta, não se vislumbrava nenhuma
justificação teórica para estes electrões pesados. O laureado com o prémio Nobel Isaac Rabi
chegou, a este propósito, a perguntar, irritado, “Who ordered that?! ”(j)
Os mesões π de Yukawa acabaram por ser descobertos, mas só em 1947, por uma equipa da
Universidade de Bristol liderada por C. F. Powell. Esta descoberta foi feita também por análise de
raios cósmicos, mas detectados em altitude, numa estação meteorológica situada seis mil metros
(i) Note-se
(j) “Quem
que este processo nada tem que ver com o decaimento β do neutrão.
é que encomendou isso?! ”, em inglês.
10.2. AS QUATRO INTERACÇÕES FUNDAMENTAIS
Leptões
155
Hadrões
Bariões
SIM
0, 1, 2, . . . 1/2, 3/2, . . .
π0 , π±
p+ , n
Mesões
Sensibilidade à força forte
spin
exemplos
NÃO
1/2
e− , νe , µ− , νµ
Tabela 10.1: Classificação das partı́culas elementares nas famı́lias dos leptões, dos mesões e dos
hadrões.
acima do nı́vel do mar, na Bolı́via. Powell notou que os piões tinham uma massa de perto 140 MeV
e que decaı́am rapidamente para muões.
Mais tarde, em 1962, usando já um acelerador de partı́culas, L. Lederman, M. Schwartz e
J. Steinberger descobriram um tipo diferente de neutrinos, produzidos em processos que envolviam
muões. A estes neutrinos chamou-se neutrinos muónicos, e constumam ser representados pelo
sı́mbolo νµ .
10.1.4
Ordem no caos
A partir dos anos cinquenta, a construcção de aceleradores de partı́culas cada vez mais poderosos
permitiu o estudo de processos subatómicos de cada vez mais energia, tendo-se multiplicado a
descoberta de novas partı́culas. Actualmente, são conhecidas e observadas várias centenas de
partı́culas elementares, a maior parte das quais tem um tempo de vida muito curto. Põe-se, então,
a questão de como organizar este conhecimento, como classificar todas estas partı́culas, como
transformar esta selva num jardim zoológico.
Qualquer classificação é feita agrupando partı́culas com propriedades semelhantes. Numa primeira tentativa, separaram-se as partı́culas de acordo com a sua massa, tendo-se definido três
famı́lias principais: os bariões, os mesões e os leptões. A primeira era constituı́da pelas partı́culas
mais pesadas, ou seja, os protões e neutrões; a última, pelas de massa mais reduzida, ou seja,
os electrões e neutrinos; por fim, à segunda famı́lia, a dos mesões, pertenciam as partı́culas com
massa intermédia, ou seja, os piões e os muões(k) . Esta classificação permitia evidenciar outras
regularidades, pelo menos de forma aproximada. Por exemplo, todos os leptões e bariões são
fermiões (spin semi-inteiro) mas, se é verdade que os piões são bosões (spin 0), já os muões têm
spin 1/2 e, portanto, são fermiões. Vemos assim, que os muões são então a excepção numa regra (leptões e bariões são fermiões, mesões são bosões) que permitia reforçar a classificação das
partı́culas baseada no valor da massa.
Os leptões (isto é, por enquanto, os electrões e os neutrinos) apresentavam outra propriedade
caracterı́stica: a sua insensibilidade à força nuclear forte. Com efeito, a interacção entre os electrões
e os núcleos atómicos é puramente electromagnética. Em contrapartida, todos os bariões e os piões
sentem a interacção forte. Poderı́amos ser levados agora a escrever uma nova regra: os leptões
não sentem a força forte, os mesões e os bariões sentem esta força, mas, mais uma vez, os muões
constituem uma excepção, porque são, também, insensı́veis à interacção forte.
Para normalizar os muões, optou-se então por uma classificação das partı́culas baseada na sensibilidade à interacção forte. Assim, são leptões todas as partı́culas que não sujeitas a interacções
fortes e hadrões as que estão. Esta última famı́lia é ainda subdividida em mesões, que têm spin
inteiro e, por isso, são bosões, e bariões, que são fermiões, com spin semi-inteiro. Esta classificação
encontra-se esquematizada na Tabela 10.1.
10.2
As quatro interacções fundamentais
Ao longo deste semestre, considerámos frequentemente o efeito de dois tipos de interacções entre
partı́culas, a saber, a força electromagnética e a força nuclear forte. Temos também, de estudos
(k) Os
muões foram mais tarde reclassificados como leptões, já veremos porquê.
156
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
anteriores, alguma familiaridade com uma terceira força, a gravı́tica.
Destes três tipos de interacção, as forças fortes são (como o seu nome pretende indicar) as mais
intensas. Apesar de só terem efeitos quando as partı́culas em interacção estão muito próximas (a
cerca de 10−15 m, como já vimos), a força forte mostra-se capaz de vencer a tremenda repulsão
electrostática entre os protões que constituem os núcleos atómicos. A interacção electromagnética
vem a seguir em intensidade. É a responsável pela estabilidade atómica (assim como a força forte
assegura a estabilidade nuclear) e molecular. As interações electromagnéticas regem as reacções
quı́micas, ou seja, determinam grande parte das propriedades macroscópicas da matéria, bem
como a maior parte dos processos relevantes para nós, incluindo a própria vida. A terceira das
interacções referida é a menos intensa de todas mas, apesar disso, é a responsável pela estabilidade
das maiores estruturas conhecidas (planetas, estrelas, galáxias) e pelas propriedades de larga escala
do universo. Isto deve-se ao facto de a interacção gravı́tica ter um alcance infinito e ser sempre
atractiva, o que não acontece com as interacções fortes (que têm alcance finito e podem ser também
repulsivas) ou com as electromagnéticas (têm alcance infinito, mas podem ser repulsivas). Por ter
uma intensidade tão reduzida, a interacção gravı́tica não desempenha, em condições normais(l) ,
qualquer papel nas reacções subatómicas.
10.2.1
Interacção fraca
A estas três forças, devemos agora juntar uma quarta, mais intensa que a gravidade mas menos
intensa que o electromagnetismo, a chamada força fraca. A questão é que ocorrem na natureza
processos que não são compreensı́veis considerando apenas as três forças já referidas. Um aspectos
muito caracterı́stico da força fraca é a sua baixa intensidade, ou seja, a longa duração temporal
dos processos que são regidos por ela. Este aspecto pode ser evidenciado comparando os tempos
de vida de algumas partı́culas. Considerando os bariões, temos o protão (estável), o multipleto
∆, formado pelas partı́culas ∆++ , ∆+ , ∆0 e ∆− , com tempos de vida de cerca de 5 × 10−24 s;
os N(1440) e N(1520)(m) têm tempos de vida semelhantes. Estas partı́culas instáveis decaem
para nucleão, com emissão de piões e/ou fotões. Muitos outros exemplos poderiam ainda ser
apresentados de bariões com tempos de vida semelhante. Mas há também o neutrão, que tem um
tempo médio de vida de cerca de 15 min! Isto é, o neutrão, sendo uma partı́cula instável, tem um
tempo de vida 26 ordens de grandeza superior ao de outras partı́culas relativamente próximas, em
termos de massa e de spin! Além deste tempo de vida tão dilatado, no decaimento do neutrão dáse a emissão de neutrinos, outro facto caracterı́stico. Algo de similar ocorre no sector dos mesões.
Assim, temos os piões neutros, que decaem (quase sempre) emitindo fotões, de acordo com
π 0 → 2γ,
em cerca de 8 × 10−17 s, e temos os piões carregados, que apresentam muito maior longevidade
(3 × 10−8 s) e que decaem através do processo
π + → µ+ + νµ ,
onde se constata, também aqui, a presença de neutrinos. Por fim, considerando a famı́lia dos
leptões, notamos que o electrão é estável, mas que o muão não é. Este tem um tempo de vida
de 2,6 × 10−6 s, pouco caracterı́stico de um decaimento regido pelas forças forte (que, de qualquer
forma, já foi afastada do conjunto das forças capazes de afectar os muões) ou electromagnética. O
decaimento do muão procede de acordo com
µ− → e− + νµ + ν̄e ,
verificando-se a emissão de um neutrino muónico e um antineutrino electrónico. Estes dois sinais
(longa duração e presença de neutrinos) são sinais caraterı́sticos de processos que não são geridos
pela interacção forte ou electromagnética, sendo portanto necessária a introdução desta nova força.
(l) Isto
é, longe de fontes de campo gravı́tico muito intenso, como buracos negros.
letra “N” indica que se trata de partı́culas semelhantes ao nucleão, o número entre parêntesis indica a massa
em MeV.
(m) A
10.3. E AGORA, ALGO VERDADEIRAMENTE ESTRANHO!
157
Mas o sinal mais claro da existência de uma nova força, com propriedades diferentes das
três que já estudámos, é a violação da conservação da paridade. A paridade é uma propriedade
da função de onda de sistemas quânticos que apresentam simetria sob operações de inversão de
coordenadas. Por exemplo, uma partı́cula encerrada num poço de potencial rectangular (como os
electrões livres que estudámos no Capı́tulo 5), descrita usando coordenadas espaciais com origem
no centro do poço de potencial, tem uma função de onda cujo módulo fica inalterado em cada
ponto, se trocarmos o sinal das coordenadas, isto é,
|ψ(~r)| = |ψ(−~r)|,
de onde se conclui que
ψ(~r) = ±ψ(−~r).
A paridade de um sistema quântico é o sinal que modifica a sua função de onda numa destas
operações de inversão de coordenadas (ou reflexão espacial.) Em quase todos os processos conhecidos, a paridade de um sistema mantém-se constante, ou seja, por exemplo, um sistema com
função de onda inicial par evolui até um estado final em que a sua função de onda é, igualmente,
par. Os únicos processos em que esta lei de conservação pode não se verificar são aqueles que
envolvem emissão ou absorção de neutrinos, isto é, são os processos regidos pelas interacções fracas. Esta é mais uma assinatura identificadora da intervenção das interacções fracas num processo
subatómico. A violação desta lei de conservação foi descrita teoricamente em 1957 por T. D. Lee,
C. N. Yang e a sua observação experimental ocorreu no mesmo ano, por C.-S. Wu.
10.3
E agora, algo verdadeiramente estranho!
10.3.1
Isospin
Como vimos no capı́tulo anterior, a interacção forte actua da mesma maneira em protões e neutrões.
Por outro lado, as massas dos hadrões encontram-se distribuı́das de forma muito pouco homogénia.
Pelo contrário, os hadrões podem agrupar-se claramente em conjuntos de partı́culas com massas
muito semelhantes semelhantes. Assim, temos os três piões, com massas de 139,6 MeV (π ± ) e
135,0 Mev (π 0 ); a seguir no espectro, vem o η, com 547,8 Mev, o σ com 600 Mev (este valor
é muito incerto...), três ρ (ρ± e ρ0 ), com 775,8 MeV... No sector bariónico, temos os protão e o
neutrão (respectivamente com massas de 938,3 MeV e 939,6 MeV); os quatro delta, com 1232 MeV;
dois N(1440) com 1440 MeV... As massas de algumas destas partı́culas estão representadas na
Figura 10.7 Este agrupamento tão nı́tido justifica que se considerem as diferentes partı́culas de cada
grupo como diferentes estados de uma mesma partı́cula, estados que se distinguem entre si pelo
valor de uma nova variável quântica. As pequenas diferenças entre as massas das partı́culas de cada
grupo devem-se às interacções fraca e electromagnética, assim como as diferenças entre as energias
dos estados atómicos com iguais valores dos números quânticos principais e dos números quânticos
de momento angular (a chamada estrutura fina do espectro atómico) se devem à interação entre
os momentos magnéticos orbital e intrı́nseco de cada electrão.
A nova variável, cujo valor distingue os vários estados de uma destas super-partı́culas, chama-se isospin(n) ou spin isotópico. Assim como um electrão com spin 1/2 pode apresentar dois valores
para a componente Sz do seu momento angular, usualmente designados “spin up” (Sz = +h̄/2)
e “spin down”(Sz = −h̄/2), o nucleão é uma partı́cula com isospin 1/2, sendo possı́veis dois
valores para a projecção Tz do isospin, usualmente chamados “protão” (Tz = +1/2) e “neutrão”
(Tz = −1/2). Os piões π ± e π 0 , por seu turno, são os três estados possı́veis de uma partı́cula com
isospin 1 e que, portanto, pode apresentar três estados, caracterizados pelos diferentes valores da
projecção z do isospin, Tz = ±1 (para os piões carregados π ± , respectivamente) e Tz = 0 (para o
pião neutro). Também aqui se nota uma semelhança com o momento angular, relativamente ao
qual se verifica, por exemplo, que um electrão atómico numa orbital p (ou seja, com l = 1) tem
à sua disposição três estados, caracterizados pelos valores do número quântico de projecção de
momento angular ml = ±1 e ml = 0.
(n) Isto
é, “semelhante ao spin.”
158
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
1000
1400
-
_ρ
Massa (MeV)
800
0
_ρ
+
_ρ
1200
_σ
_η
600
_∆_
-
Σ
_∆0
_0
Σ
_∆+
_+
_∆++
Σ
_
Λ
400
1000
_
200
0
-
_π
-2
0
_π
n
+
_π
-1
0
1
Carga (em unidades de e)
2
800
-2
_
p
-1
0
1
Carga (em unidades de e)
2
Figura 10.7: Porção inferior do espectro hadrónico. À esquerda apresenta-se o sector mesónico, à
direita o bariónico.
10.3.2
Estranheza
Nos anos cinquenta, processos como
p + π−
p + π−
→
→
Λ0 + K 0
Σ− + K +
intrigavam os fı́sicos de partı́culas. Estes processos são geridos pela interacção forte, como se pode
deduzir da frequência com que ocorrem, mas as partı́culas produzidas, os mesões K ± e os bariões
Λ0 e Σ− , decaem lentamente, nos processos fracos
Λ0
Σ−
K0
K+
→
→
→
→
→
p + π−
n + π−
π+ + π−
2π + + π −
2π 0 + π + .
O problema era por que razão estas partı́culas, produzidas por processos fortes, não decaı́am
igualmente por processos fortes? Por exemplo, os bariões ∆ sofrem um decaimento semelhante
(quanto às partı́culas produzidas) ao dos bariões Σ e Λ, mas o seu tempo de vida médio é cerca de
10− 23 s (ou seja, sofrem decaimento forte). Só para efeitos de comparação, os tempos médios de
vida destas partı́culas estranhas (como vieram a ser chamadas) são 2,6×10−10 s (Λ0 ), 1,5×10− 10 s
(Σ) e 1,2 × 10−8 s (K + ). (O mesão K 0 é uma partı́cula mais complicada, que pode ser vista como
uma sobreposição quântica de duas partı́culas com tempos de vida muito diferentes, 0,9 × 10−10 s
e 5,2 × 10− 8 s.) Porque razão o ∆0 mais pode sofrer um decaimento forte e o Λ0 não pode?
A resposta a esta pergunta começou a ser dada pelo fı́sico americano Abraham Pais em 1952,
quando notou que estas partı́culas estranhas eram sempre produzidas aos pares. A interacção forte
parecia ser incapaz de produzir uma partı́cula estranha isoladamente. Aceitando esta incapacidade,
era natural que também não fosse possı́vel a aniquilação destas partı́culas isoladamente, através
10.4. A VIA ÓCTUPLA, QUARKS E GLUÕES
159
de processos fortes, pelo que o seu decaimento só poderia ocorrer através de processos de outra
natureza, muito mais lentos.
Pouco depois, Gell-Mann (1953) e Nishijima (1955) sugeriram uma explicação para este mistério, que explicava ao mesmo tempo a produção aos pares de Pais. Segundo esta explicação,
as partı́culas subatómicas seriam caracterizadas por uma nova variável, a que deram o nome de
estranheza, que seria sempre conservada nas interacções fortes, mas que podia não se conservar nas
interacções fracas. Somente as partı́culas estranhas (Σ, Λ0 , K,...) teriam valores não nulos desta
nova carga de estranheza; os nucleões, deltas, piões, etc., seriam todos partı́culas com estranheza
nula. Assim, a interacção forte podia produzir duas partı́culas estranhas, desde que tivessem estranhezas opostas, mas era incapaz de mediar um processo de decaimento de uma destas partı́culas.
O processo
p + π − → Λ0 + K 0
pode ocorrer pela interacção forte porque a estranheza do Λ0 é −1, ao passo que a do K 0 é +1.
Assim a estranheza total antes da interacção (S = 0) é igual à estranheza total depois da interacção
(S = +1 − 1 = 0). Em contrapartida, no decaimento
Λ0 → p + π − ,
ocorre uma variação da estranheza (-1 antes, 0 depois), logo, não pode ocorrer pela interacção
forte, tem que ser mediado pela interacção fraca.
10.4
A via óctupla, quarks e gluões
A Tabela 10.2 apresenta os valores da massa, da carga, do isospin total (T ), da componente-z de
isospin (Tz ) e da estranheza de alguns hadrões.
Partı́cula
π+
π0
π−
η
massa (MeV)
140
135
140
549
carga (/e)
1
0
-1
0
T
1
1
1
0
Tz
1
0
-1
0
S
0
0
0
0
Tabela 10.2: Propriedades fı́sica de alguns hadrões.
10.4.1
Quarks com cor e sabor
10.4.2
Descrição microscópica dos processos de decaimento
10.5
Leis de conservação
10.6
Aceleradores e detectores
PROBLEMAS
10.1 Qual é a menor energia do fotão incidente no processo de produção de um par electrão-positrão?
e de um par protão-antiprotão?
10.2 Um fotão com energia ² = 2, 09 GeV cria um par pp̄ (protão-antiprotão). O protão assim produzido
tem uma energia de 95 MeV. Qual é a energia do antiprotão?
10.3 Na reacção µ+ e− → 2ν, que espécie(s) de neutrinos (e/ou antineutrinos) são produzidos?
160
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
10.4 Qual a energia, comprimento de onda e frequência dos dois fotões emitidos no decaimento do pião
neutro π 0 → 2γ?
10.5 Recorrendo aos diagramas mais fundamentais de cada tipo de interacção quântica, tente construir
um processo em que se verifique violação do número total de quarks. Que pode concluir?
10.6 Qual pode ser a partı́cula X no processo Xp → nµ+ ?
10.7 Nenhum dos seguintes processos ocorre. Porquê?
(a)
(c)
(e)
(g)
pp̄ → µ+ e−
Σ − → K 0 µ−
γp → nπ 0
pp → ppn
(b)
(d)
(f)
(h)
π − → e− γ
π − p → pπ +
pp → pπ +
Λ → K −p
10.8 O decaimento β de protões não se observa em protões isolados, mas ocorre no interior de alguns
núcleos radioactivos, sendo o processo de decaimento principal dos isótopos mais leves de elementos com massa intermédia, como o oxigénio. Porque razão não se observa este processo entre
protões isolados?
10.9 Os processos de decaimento dos piões são, maioritariamente, os seguintes:
π+
→
µ+ νµ
π−
→
µ− ν̄µ
0
→
2γ.
π
(a) Descreva microscopicamente, através de diagramas, estes processos.
(b) O tempo médio de vida dos piões carregados é 2,6×10−8 s, ao passo que o dos piões neutros
é 8,4×−17 s. Porquê?
10.10 Descreva microscopicamente os seguintes processos e identifique os tipos de interacções que
participam em cada um
(a) n → p+ e− ν̄e
(b) Σ+ → pπ 0
(c) Σ0 → Λγ
10.11 Os piões carregados π ± têm um tempo médio de vida de cerca de 2,6 × 108 s, ao passo que o do
pião neutro π 0 é, apenas 8,4 × 10−17 s. A que se deve tão grande diferença?
Apêndice A
Momento angular, spin e simetria
de troca
A.1
Momento angular e spin
Classicamente, o momento angular de um sistema está associado ao seu movimento. É uma
propriedade fı́sica vectorial dada pelo produto externo do vector posição e do vector momento
linear, isto é,
~ = ~r × p~.
L
As componentes cartesianas do momento angular são, explicitamente, as seguintes:
Lx
Ly
Lz
=
=
=
ypz − zpy
zpx − xpz
xpy − ypx .
Os operadores que, em Mecânica Quântica, associamos a estas quantidades, obtêm-se substituindo
as componentes do vector posição e as do momento linear pelas dos operadores quânticos corres~ resultando
pondentes ~r → ~r e p~ → −ih̄∇,
Lx
Ly
Lz
=
=
=
−ih̄ (y∂z − z∂y )
−ih̄ (z∂x − x∂z )
−ih̄ (x∂y − y∂x ) ,
(A.1)
onde se usaram as abreviaturas ∂x = ∂/∂x, etc. Estes operadores não comutam uns com os outros,
antes se tendo
[Lx , Ly ]
[Ly , Lz ]
=
=
ih̄Lz
ih̄Lx
[Lz , Lx ]
=
ih̄Ly .
Uma vez que as três componentes do momento angular não comutam entre si, não são possı́veis
estados em que duas quaisquer componentes do momento angular apresentem valores bem determinados. Apenas uma das componentes do momento angular de um sistema quântico pode
apresentar valores precisos. Por convenção, escolhe-se a componente z. Apesar de não comutarem
umas com as outras, as componentes do momento angular comutam com o quadrado do módulo
do momento angular, L2 = L2x + L2y + L2z . Então, os valores da componente z do momento angular
e do quadrado do módulo do momento angular podem ser simultaneamente determinados com
precisão ilimitada (ou melhor, sem limitações de natureza teórica).
161
162
APÊNDICE A. MOMENTO ANGULAR, SPIN E SIMETRIA DE TROCA
l=1
dB/dz
l=0
l=-1
Figura A.1: Montagem para a experiência de Stern-Gerlach.
Pretende-se agora dar resposta à seguinte questão: Que valores podemos obter de uma medição
de L2 e de Lz ? Como sabemos, estes valores são os dos valores próprios destes operadores. Para
responder a esta questão devemos pois resolver as equações de valores próprios
L2 ψ(~r) =
L2z ψ(~r) =
Λ2 ψ(~r)
M ψ(~r),
onde representámos por Λ2 os valores próprios de L2 , por M os de Lz e ψ(~r) representa as funções
próprias destes dois operadores. Estas duas equações são equações às derivadas parciais para ψ,
cujas soluções formam o conjunto de funções próprias de L2 e Lz . O aspecto mais interessante
para a presente discussão é que estas equações só têm solução se os valores próprios tiverem valores
muito bem determinados, que são os que satisfazem as condições
Λ2
M
=
=
l(l + 1)h̄2 ,
mh̄,
onde l é um número inteiro não negativo arbitrário e m é um inteiro que toma valores compreendidos entre −l e l. Assim, para cada valor de l (relacionado com o módulo do momento angular)
há 2l + 1 estados, cada um com um valor diferente da componente z do momento angular. Esta
situação é familiar a todos, pelo menos no contexto da Fı́sica Atómica, em que se caracterizam os
estados electrónicos através dos valores dos chamados número quântico de momento angular (l) e
número quântico de projecção (no eixo dos z) do momento angular (m).
Nos átomos, o momento angular está intimamente ligado ao momento magnético. É fácil
entender porquê: o momento angular é o reflexo do movimento dos electrões que, por outro lado,
está na origem de um campo magnético, que se descreve através do momento magnético atómico.
Esta ligação entre o momento angular e o momento magnético traduz-se numa proporcionalidade
entre as componentes-z dos dois observáveis,
Mz = gLz ,
onde g, a constante de proporcionalidade, se chama razão giromagnética. Esta relação entre as
duas quantidades pode ser usada para distinguir estados atómicos que diferem apenas pelo vaalor
da componente-z do momento angular. Fazendo um feixe de átomos idênticos atravessar uma
região onde está definido um campo magnético não homogéneo e orientado segundo o eixo dos zz,
átomos com diferentes valores de Lz são desviados em direcções diferentes porque a componente
do momento magnético segundo a direcção do campo tem valores diferentes (ver a Figura A.1).
Experiências deste tipo chamam-se experiências de Stern-Gerlach, em homenagem aos dois fı́sicos
que, pela primeira vez em 1922, as realizaram. Se não se tem nenhum cuidado especial na preparação do feixe incidente (à parte os de garantir que todos pertencem à mesma espécie quı́mica
e têm a mesma energia) os átomos que o constituem apresentam valores diferentes de Lz e, portanto, sofrem desvios diferentes. O feixe incidente desdobra-se então em vários subfeixes, cada
qual incluindo átomos com um determinado valor da componente-z do momento angular. Assim,
se realizamos uma experiência de Stern-Gerlach com átomos com momento angular l, esperamos
ver o feixe incidente desdobrar-se em 2l + 1 subfeixes.
O momento angular total de um sistema quântico é, do ponto de vista clássico, uma função
dos estados de movimento dos constituintes desse sistema. Assim, o momento angular dos átomos
A.2. SIMETRIA DE TROCA DE PARTÍCULAS IDÊNTICAS
163
é a soma dos momentos angulares dos electrões que os constituem, cada um dos quais é descrito
em Mecânica Quântica por um operador do tipo dos apresentados na eq. (A.1), cada um dos quais
pode apresentar, como vimos, um valor
L2 = l(l + 1)h̄2 ,
com l inteiro não negativo. Assim, esperamos que o resultado de uma experiência de SternGerlach seja o desdobramento do feixe incidente num número ı́mpar (2l + 1) de subfeixes. Ora,
o resultado mais interessante deste tipo de experiências é que, para alguns átomos (aqueles que
têm número atómico ı́mpar), verifica-se o desdobramento do feixe incidente num número par de
subfeixes, indicando que o momento angular dos átomos usados é um número semi-inteiro. Este
facto indica claramente que há, ao nı́vel microscópico, contribuições para o momento angular de
um sistema quântico que não têm relação com o movimento dos seus constituintes, ou seja, que
não têm qualquer correspondência com a noção clássica de momento angular.
A estas parcelas do momento angular dá-se o nome de momento angular intrı́nseco ou simplesmente, spin. O spin é uma caracterı́stica de cada partı́cula. Os electrões têm spin 1/2, os fotões
têm spin 1, os piões, spin 0. O momento angular de um átomo é a soma dos momentos angulares
dos seus electrões e dos spins desses electrões. Nos casos em que o número atómico ı́mpar, essa
soma não pode resultar num número quântico de momento angular total inteiro.
A.2
Simetria de troca de partı́culas idênticas
A identidade de duas partı́culas tem um significado muito mais forte em Mecânica Quântica
do que na Fı́sica Clássica. Duas partı́culas idênticas do ponto de vista clássico podem ainda ser
distinguidas, fazendo numa delas uma marca de tinta, ou acompanhando, instante a instante, o seu
movimento, de forma a que se possa dizer “a partı́cula que, há pouco, estava ali, está agora aqui;
aquela outra, moveu-se de acolá para a direita...”Assim, as duas partı́culas são idênticas porque as
suas caracterı́sticas intrı́nsecas (massa, carga, forma, etc.) são as mesmas, mas é sempre possı́vel
distinguir as duas e dizer qual é qual. Do ponto de vista quântico, isto é impossı́vel. Tomemos
um exemplo para o ilustrar. Imaginemos que fazemos uma experiência em que bombardeamos
hidrogénio atómico(a) com um feixe de electrões. O resultado da colisão de um electrão com um
átomo de hidrogénio é um dos seguintes:
(a) o electrão incidente é capturado pelo átomo de hidrogénio, formando-se um ião H− ;
(b) após a interacção, o átomo de hidrogénio e o electrão seguem os seus caminhos;
(c) o electrão incidente ioniza o átomo de hidrogénio, resultando então um ião H+ e dois
electrões, todos livres uns dos outros.
Nos casos em que se verifica a hipótese (b) não há procedimento experimental que nos permita
saber se o electrão livre no final é o incidente ou se este foi capturado tendo o electrão atómico sido
expulso do átomo. Isto, porque não é possı́vel acompanhar as trajectórias do electrão incidente e
do electrão atómico como acompanhamos o movimento de duas bolas de bilhar numa colisão num
jogo de snooker. A função de onda do electrão incidente tem uma certa extensão, assim como a
do electrão atómico. Enquanto se dá a colisão, as duas funções de onda sobrepõem-se e, assim
sendo, não fazemos a menor ideia, no final, de qual electrão se “materializou” no átomo e qual foi
deixado livre.
A indistinguibilidade de partı́culas quânticas idênticas tem uma importante consequência: é
que duas descrições de um sistema quântico que difiram entre si apenas pela troca das variáveis
dinâmicas de duas partı́culas idênticas têm que ser equivalentes, isto é, devem produzir os mesmos
valores no cálculo de propriedades observáveis do sistema. Vejamos que consequências podemos
retirar daqui. Seja
ψA,B (~r1 , ~r2 ) = ψA (~r1 )ψB (~r2 )
(a) O
argumento não é alterado se o alvo for hidrogénio molecular.
164
APÊNDICE A. MOMENTO ANGULAR, SPIN E SIMETRIA DE TROCA
a função de onda de um sistema de duas partı́culas idênticas e indistinguı́veis independentes, que
ocupam os estados ψA e ψB e sejam ~r1 e ~r2 as suas coordenadas. Se trocarmos, na função de onda,
as posições das duas partı́culas, as diversas propriedades observáveis do sistema devem, como se
disse, permanecer inalteradas. Este resultado deve verificar-se, em particular, para a densidade
de presença das partı́culas quânticas. Assim, deve verificar-se
2
2
|ψA,B (~r1 , ~r2 )| = |ψA,B (~r2 , ~r1 )| ,
ou seja, ao nı́vel da função de onda,
ψA,B (~r1 , ~r2 ) = eiδ ψA,B (~r2 , ~r1 ),
onde δ é um número real arbitrário. Se voltarmos a trocar as coordenadas das duas partı́culas,
obtemos
ψA,B (~r1 , ~r2 ) = eiδ ψA,B (~r2 , ~r1 ) = e2iδ ψA,B (~r1 , ~r2 ),
o que nos leva a escrever que exp(2iδ) = 1, ou seja que exp(iδ) = ±1. O efeito da troca dos dois
conjuntos de coordenadas na função de onda do sistema é pois o de multiplicar a função de onda
do sistema por um ou por menos um. Qual das possibilidades se verifica depende da natureza das
duas partı́culas idênticas. Há partı́culas cuja função de onda é antissimétrica (troca o sinal) sob
operações de troca, e outras cuja função de onda é simétrica, isto é, que se mantém inalterada sob
a referida troca. As primeiras chamam-se fermiões e incluem os electrões, os protões e neutrões,
entre outras partı́culas; as segundas chamam-se bosões e incluem os fotões, os piões, e muitas
outras também.
Devido à antissemetria da função de um sistema de fermiões, verifica-se uma grande limitação à
possibilidade de dois fermiões idênticos ocuparem o mesmo estado de partı́cula única. Com efeito,
se dois fermiões ocupam o mesmo estado ψ1 , então efectuando uma troca das duas partı́culas
resulta
ψ1,1 (~r1 , ~r2 ) = −ψ1,1 (~r1 , ~r2 ),
que só pode ser satisfeita se a função de onda se anular. Demonstrámos assim o importante
princı́pio de exclusão de Pauli: dois fermiões idênticos não podem ocupar simultaneamente o
mesmo estado individual. Esta regra tem importantes consequências, como já vimos no estudo
da condução em metais. Outro exemplo da importância do princı́pio de exclusão de Pauli é o
facto de diferentes elementos terem diferentes propriedades quı́micas. Com efeito, se este princı́pio
não se verificasse, ou se os electrões fossem bosões, no estado fundamental de cada átomo todos
os electrões ocupariam o nı́vel de mais baixa energia, o estado 1s, pelo que não se verificaria a
diversidade de comportamenetos quı́micos.
A simetria de troca da função de onda de um sistema de partı́culas idênticas está relacionada,
de uma forma complexa, com o momento angular intrı́nseco (spin) dessas partı́culas. Todas as
partı́culas com spin inteiro (como os fotões) são bosões; todas as partı́culas com spin semi-inteiro
(como os electrões) são fermiões.

Documentos relacionados