Apontamentos de Física Moderna 2

Transcrição

Apontamentos de
Fı́sica Moderna II
José Amoreira
Departamento de Fı́sica
UNIVERSIDADE DA BEIRA INTERIOR
Revision: 1.17
Date: 2005/07/05 00:13:39
Copyleft
O autor deste texto é Luı́s José Maia Amoreira ([email protected]), do Departamento de Fı́sica
da Universidade da Beira Interior. Não se garante a sua correcção.
Este texto pode ser obtido a partir do URL
http://www.dfisica.ubi.pt/~amoreira/0405/fm2/bibl.html
Este texto pode ser copiado, alugado, vendido, emprestado ou oferecido, desde que este “Copyleft”
permaneça inalterado. O texto pode ser adaptado, acrescentado ou diminuı́do, desde que sejam
satisfeitas as seguintes condições:
• no produto final, deve ser incluı́da uma indicação bem visı́vel de que se trata de uma
adaptação deste trabalho
• devem ser referidos os nomes dos autores deste trabalho
• deve ser apresentado o URL deste documento (ver acima)
Os autores agradecem ser informados da redacção de trabalhos baseados neste texto. Em resumo,
os autores autorizam qualquer utilização desta obra que respeite as regras básicas da honestidade,
do bom-senso e da boa-educação.
Composto em LATEX.
Índice
1 Introdução
1.1 A evolução histórica da hipótese atómica .
1.1.1 Da antiguidade até Dalton . . . .
1.1.2 A descoberta da estrutura atómica
1.1.3 Entram os quanta . . . . . . . . .
1.1.4 O neutrão . . . . . . . . . . . . . .
1.2 A estrutura atómica . . . . . . . . . . . .
1.3 Ligações quı́micas . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
2
6
7
8
12
14
14
2 Elementos de Cristalografia
2.1 Cristais ideais e cristais reais . . .
2.2 A estrutura cristalina . . . . . . .
2.3 Tipos de redes cristalinas . . . . .
2.4 Exemplos de estruturas cristalinas
2.5 Direcções e planos cristalinos . . .
2.6 Distância interplanar . . . . . . . .
2.7 Coordenadas fraccionárias . . . . .
2.8 Defeitos . . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
15
15
17
19
22
25
27
27
29
29
3 Dispersão elástica de radiação em cristais
3.1 Breve revisão sobre ondas . . . . . . . . .
3.2 Dipersão de radiação — Generalidades . .
3.3 A condição de Laue . . . . . . . . . . . .
3.4 A lei de Bragg . . . . . . . . . . . . . . .
3.5 Métodos experimentais . . . . . . . . . . .
3.6 Factor de estrutura . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
33
33
36
37
39
41
42
43
44
4 A capacidade térmica dos sólidos
4.1 A aproximação harmónica . . . . . . . .
4.2 Elementos da teoria das probabilidades .
4.2.1 Variáveis aleatórias discretas . .
4.2.2 Variáveis aleatórias contı́nuas . .
4.3 A lei de Dulong e Petit . . . . . . . . . .
4.3.1 Modelo Clássico . . . . . . . . .
4.3.2 Modelo de Einstein . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
47
48
49
51
52
52
54
58
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i
.
.
.
.
.
.
.
.
ii
ÍNDICE
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
5 Metais I: modelos de electrões livres
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 O modelo de Drude-Lorentz . . . . . . . . . . . . . . . . . . . .
5.2.1 O calor especı́fico dos metais . . . . . . . . . . . . . . .
5.2.2 A lei de Ohm . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 O efeito de Hall . . . . . . . . . . . . . . . . . . . . . . .
5.2.4 Efeitos termoeléctricos . . . . . . . . . . . . . . . . . . .
5.2.5 Balanço do modelo de Drude . . . . . . . . . . . . . . .
5.3 O modelo de Sommerfeld . . . . . . . . . . . . . . . . . . . . .
5.3.1 Estados electrónicos . . . . . . . . . . . . . . . . . . . .
5.3.2 A densidade de estados electrónicos . . . . . . . . . . .
5.3.3 O estado fundamental de um gás de fermiões . . . . . .
5.3.4 O gás de electrões de condução à temperatura ambiente
5.3.5 A distribuição de Fermi-Dirac . . . . . . . . . . . . . . .
5.3.6 A condutividade eléctrica . . . . . . . . . . . . . . . . .
5.4 Crı́tica dos modelos de electrões livres . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Metais II: Teoria de bandas
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . .
6.2 O teorema de Bloch . . . . . . . . . . . . . . . . . .
6.3 Propriedades dos estados de Bloch . . . . . . . . . .
6.3.1 Periodicidade no espaço recı́proco . . . . . .
6.3.2 Nı́veis de energia dos estados de Bloch . . . .
6.3.3 Momento linear . . . . . . . . . . . . . . . . .
6.3.4 Velocidade média e momento linear cristalino
6.3.5 Massa efectiva dos electrões de Bloch . . . . .
6.3.6 O livre caminho médio . . . . . . . . . . . . .
6.4 Modelo de Krönig-Penney . . . . . . . . . . . . . . .
6.5 Número de estados por banda . . . . . . . . . . . . .
6.6 O estado fundamental da nuvem electrónica . . . . .
6.7 A condução eléctrica . . . . . . . . . . . . . . . . . .
6.8 O gás de Bloch à temperatura ambiente. . . . . . . .
6.9 Lacunas . . . . . . . . . . . . . . . . . . . . . . . . .
6.10 Contaminação de semi-condutores . . . . . . . . . .
6.11 O diodo semicondutor . . . . . . . . . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
77
. 77
. 79
. 82
. 82
. 83
. 84
. 85
. 87
. 88
. 88
. 93
. 94
. 96
. 97
. 98
. 99
. 101
. 103
. 104
7 Supercondutividade
7.1 Propriedades magnéticas dos supercondutores
7.2 A Equação de London . . . . . . . . . . . . .
7.3 Superfluidez . . . . . . . . . . . . . . . . . . .
7.4 A supercondutividade, outra vez . . . . . . .
7.5 Aplicações da supercondutividade . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
60
60
61
63
64
66
66
66
68
69
70
71
72
74
74
74
105
106
108
109
111
112
112
112
ÍNDICE
iii
8 Fı́sica Nuclear I — Propriedades do núcleo
8.1 Núcleo atómico — Generalidades . . . . . .
8.2 A massa nuclear e a energia de ligação . . .
8.3 A força nuclear forte . . . . . . . . . . . . .
8.3.1 Saturação . . . . . . . . . . . . . . .
8.3.2 Alcance . . . . . . . . . . . . . . . .
8.3.3 Independência da carga . . . . . . .
8.3.4 O deuterão e a dependência do spin
8.4 Dois modelos para estrutura do núcleo . . .
8.4.1 O modelo da gota lı́quida . . . . . .
8.4.2 Modelo em camadas . . . . . . . . .
Bibliografia . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . .
atómico
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
115
115
116
117
118
119
121
121
122
122
123
125
125
9 Fı́sica nuclear II — Reacções nucleares
9.1 Radioactividade . . . . . . . . . . . . . . . .
9.1.1 A região de estabilidade . . . . . . .
9.1.2 Fissões nucleares . . . . . . . . . . .
9.1.3 Conversões internas . . . . . . . . .
9.1.4 Decaimento-β . . . . . . . . . . . . .
9.2 A lei do decaimento . . . . . . . . . . . . .
9.2.1 Tempo de meia vida . . . . . . . . .
9.2.2 Duração média . . . . . . . . . . . .
9.2.3 Energia libertada no decaimento . .
9.3 Actividade e dosimetria . . . . . . . . . . .
9.3.1 Actividade . . . . . . . . . . . . . .
9.3.2 Dose absorvida . . . . . . . . . . . .
9.3.3 Dose equivalente . . . . . . . . . . .
9.3.4 Efeitos da exposição à radiação . . .
9.4 Aplicações da Fı́sica Nuclear . . . . . . . .
9.4.1 Análise por activação com neutrões .
9.4.2 Produção de energia por fissão . . .
9.4.3 Fusão nuclear . . . . . . . . . . . . .
9.4.4 Aplicações à medicina . . . . . . . .
9.4.5 Datação por carbono-14 . . . . . . .
9.5 Alguns tópicos de noticiário . . . . . . . . .
9.5.1 A radioactividade natural . . . . . .
9.5.2 A utilização de urânio empobrecido
Bibliografia . . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
127
127
128
129
129
130
131
131
132
133
133
134
134
135
136
136
136
139
141
141
143
143
145
145
145
10 Elementos de Fı́sica Subatómica
10.1 A selva das partı́culas elementares . . . . . . . . . . . . . .
10.1.1 O positrão de Dirac . . . . . . . . . . . . . . . . . .
10.1.2 O neutrino de Pauli . . . . . . . . . . . . . . . . . .
10.1.3 O mesão π de Yukawa e um convidado inesperado .
10.1.4 Ordem no caos . . . . . . . . . . . . . . . . . . . . .
10.2 As quatro interacções fundamentais . . . . . . . . . . . . . .
10.2.1 Interacção fraca . . . . . . . . . . . . . . . . . . . . .
10.3 E agora, algo verdadeiramente estranho! . . . . . . . . . . .
10.3.1 Isospin . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.2 Estranheza . . . . . . . . . . . . . . . . . . . . . . .
10.4 A via óctupla, quarks e gluões . . . . . . . . . . . . . . . . .
10.4.1 Descrição microscópica dos processos de decaimento
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
147
147
147
149
152
155
155
156
157
157
158
159
159
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
ÍNDICE
10.5 Leis de conservação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
10.6 Aceleradores e detectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
A Momento angular, spin e simetria de troca
161
A.1 Momento angular e spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
A.2 Simetria de troca de partı́culas idênticas . . . . . . . . . . . . . . . . . . . . . . . . 163
Prefácio
Estas notas são o resultado de quatro anos de docência de Fı́sica Moderna II, disciplina do terceiro
ano da Licenciatura em Ensino de Fı́sica e Quı́mica.
Escrevo estes apontamentos (uso o tempo presente nesta frase porque não me parecem ainda
acabados, apesar de ter chegado a altura de me desligar da disciplina) principalmente porque a
actividade da escrita me ajuda a organizar as ideias sobre estes assuntos. As discussões que tenho
comigo mesmo são, frequentemente, mais profundas (e sempre muito mais encarniçadas) do que
as que tenho com os alunos.
É também minha opinião que estes apontamentos ajudam os alunos, que encontram neles
uma base para o estudo, em Lı́ngua Portuguesa, a partir da qual podem, se assim o desejarem,
partir para voos mais altos, usando a vasta bibliografia existente, da qual uma parte razoável está
disponı́vel na Biblioteca da Universidade. Este argumento é muito discutı́vel. Há quem opine que
as “sebentas” fornecidas pelos professores favorecem uma atitude passiva dos estudantes, que são,
em maior ou menor medida, dispensados de procurar por sua iniciativa os conhecimentos de que
carecem em livros ou artigos, escritos por melhores e mais reputados autores. Eu compreendo
este ponto de vista. Mas também compreendo a opinião segundo a qual o nosso papel como
professores é facilitar a aprendizagem dos alunos e não sei ao certo até onde se deve ir, onde traçar
a linha. Ao fim e ao cabo, Sócrates desprezava, com argumentos semelhantes, a palavra escrita em
geral... Dadas estas dúvidas, prefiro deixar-me guiar pelo exemplo. A verdade é que os professores
que mais apreciei redigiam notas das disciplinas que leccionavam e, apesar disso, não deixei de
consultar a bibliografia recomendada (e a que ela, por seu turno, referia) nas bibliotecas que tinha
ao meu alcance. Assim, tento imitá-los, na medida das minhas capacidades.
Os Capı́tulos 2 a 6 estão baseados em apontamentos que redigi em colaboração com o Prof. Miguel de Jesus para a disciplina de Fı́sica do Estado Sólido que, na última reformulação do curso, foi
afastada do currı́culo da licenciatura. Nos quatro anos que passaram desde então, estes capı́tulos
foram sofrendo sucessivas alterações, ao ponto de termos os dois entendido que não se justificava
já manter o seu nome como co-autor dos presentes apontamentos. Seja como for, devo-lhe um
sincero agradecimento. Sem o seu empenhamento e as suas muitas contribuições, suspeito que
estas notas não passariam agora de um conjunto de folhas semi-manuscritas, com gráficos colados, distribuidas por diferentes pastas e gavetas, com partes esquecidas nalgum canto (e outras
definitivamente perdidas), ainda mais gravemente incompletas, ainda mais densamente povoadas
de erros. Não tenho a menor hesitação em afirmar que o Prof. Miguel de Jesus constituiu um factor determinante para a redacção destes apontamentos, mesmo que, passados estes quatro anos,
tenham restado poucas das suas contribuições originais. Por isso, quero aqui deixar um sincero
bem hajas, Miguel.
Covilhã, Agosto de 2005
J. A.
v
vi
ÍNDICE
Capı́tulo 1
Introdução
1.1
1.1.1
A evolução histórica da hipótese atómica
Da antiguidade até Dalton
A teoria atómica da matéria foi proposta pela primeira vez no séc. V a.c., por Leucipo e Demócrito,
na Grécia antiga. Estes dois filósofos tentavam, com o seu trabalho, compatibilizar a ideia da
existência de um princı́pio único e imutável subjacente à realidade com a percepção da mudança,
do movimento, da morte e do nascimento evidentes no dia a dia. Sugeriram então que a natureza
una e imutável da realidade não se manifesta directamente nos objectos que observamos e com
que lidamos, mas sim a um nı́vel microscópico, uma vez que, segundo eles, toda a matéria seria
constituı́da por pequenos grânulos ou átomos indestrutı́veis e indivisı́veis (é este, aliás, o significado da expressão grega que está na origem da palavra “átomo”). As diferentes substâncias e
as diferentes fases observadas corresponderiam a diferentes formas de agregação dos átomos; as
alterações verificadas num objecto corresponderiam a processos em que se alteraria a organização
e a disposição dos átomos que os constituem.
A teoria atómica (bem como os outros modelos da altura) foi preterida pela teoria dos quatro
elementos, defendida por Aristóteles, e ficou quase esquecida até ao séc. XVIII, altura em que se
volta a falar de átomos, já numa perspectiva cientı́fica. As investigações experimentais de Lavoisier
(cerca de 1780) e outros permitiram determinar a composição quı́mica de vários compostos. Cerca
de vinte anos mais tarde, em 1799, Proust pode enunciar a Lei das proporções definidas, que afirma
que as razões entre as massas de dois elementos que reagem para formar um dado composto são
sempre as mesmas (por exemplo, quando hidrogénio e oxigénio reagem para formar água, as
massas dos dois reagentes estão sempre na proporção de 8:1). Logo no ano a seguir, Dalton
apresentou a Lei das proporções múltiplas: quando um elemento reage com outro para formar
duas substâncias diferentes, as proporções em que o faz nas duas reacções são múltiplas uma
da outra. Por exemplo, o oxigénio reage com o carbono para formar monóxido de carbono, na
proporção (mássica) de 16:12; os mesmo elementos podem reagir para formar dióxido de carbono,
sendo agora a razão entre as massas de oxigénio e carbono igual a 32:12, isto é, exactamente o
dobro da que se verifica na produção de monóxido de carbono. Estes factos levaram Dalton a
propor a primeira versão moderna da teoria atómica, baseada nos seguintes pressupostos
(a) A matéria é constituı́da por pequenas partı́culas indivisı́veis chamadas átomos
(b) Os átomos são inalteráveis e indestrutı́veis
(c) Os átomos de um dado elemento quı́mico são idênticos
(d) Nas reacções quı́micas, átomos de diferentes elementos combinam-se em proporções racionais
simples
1
2
CAPÍTULO 1. INTRODUÇÃO
A descrição atómica foi usada com grande sucesso no estudo das propriedades dos gases, mas só
muito mais tarde, já no séc. XX, foi possı́vel resolver as dificuldades apresentadas pela sua aplicação
no estudo dos sólidos. Teremos ocasião de estudar em detalhe algumas destas dificuldades, como
a da justificação do valor da capacidade térmica dos sólidos, e por isso não nos alargaremos mais
sobre este assunto. Ainda assim, é interessante notar que um dos pensadores mais profundos do
Séc. XIX, Ernst Mach, continuou a criticar a hipótese atómica até à sua morte, em 1915.
1.1.2
A descoberta da estrutura atómica
Na segunda metade do século XIX, desenvolvimentos tecnológicos (como a invenção de bombas de
vácuo melhoradas) permitiram o aprofundamento do estudo das descargas eléctricas em gases(a) .
Este estudo era realizado experimentalmente estabelecendo uma diferença de potencial eléctrico
entre dois eléctrodos no interior de um tubo a pressão reduzida (ver a Figura 1.1).
Cátodo
Ânodo
Figura 1.1: Tubo de Crookes. O sombreado representa a luminescência observada por Plücker em
1858.
Para pressões suficientementes baixas e diferenças de potencial suficientemente elevadas, notava-se o aparecimento de uma luminescência na região do ânodo (eléctrodo de potencial mais
elevado). Esta luminescência devia-se a um fluxo de natureza desconhecida proveniente do cátodo,
como se constatou, em 1869, quando se observaram sombras de objectos interpostos entre os dois
eléctrodos. Eugen Goldstein chamou a este fluxo raios catódicos. Em 1858, J. Plucker notou que
a trajectória seguida pelos raios catódicos era deflectida por campos magnéticos, demonstrando
que eles eram carregados. Foi ainda Goldstein que nos anos setenta (do século XIX, atenção!)
notou que os raios catódicos eram emitidos perpendicularmente à superfı́cie do cátodo e que as
suas propriedades não dependiam da composição quı́mica do cátodo. Assim, os raios catódicos
constituiam um fluxo carregado e pareciam ser arrancados ao cátodo pelo campo eléctrico nos
pontos da sua superfı́cie.
Em 1871, C. Varley propôs que os raios catódicos eram constituı́dos por partı́culas carregadas
negativamente. Esta idéia não foi imediatamente aceite. Até ao inı́cio do século XX, manteve-se
acesa uma disputa que opôs os partidários da natureza corpuscular dos raios catódicos aos que
defendiam a sua natureza ondulatória. Esta questão foi encerrada por J. J. Thomson em 1897
a favor da hipótese corpuscular, após um conjunto de experiências de grande precisão, em que
pode também determinar a relação entre a carga e a massa do electrão, nome com que foram
baptizados os corpúsculos constituintes dos raios catódicos. Finalmente, em 1911, R. Millikan
conseguiu determinar o valor da carga do electrão, numa experiência em que electrizava gotı́culas
de óleo e analisava o seu movimento sob a accção conjunta da força da gravidade e de uma força
eléctrica aplicada.
O modelo de Thomson
Destes e de outros trabalhos, cresceu a convicção de que os electrões eram parte constituinte da
matéria, ou seja, dos átomos que a formam. Note-se que, isoladamente, os electrões não podiam
ser confundidos com os átomos, porque a matéria aparece, em geral, electricamente descarregada, o que seria claramente impossı́vel caso fosse constituı́da apenas por partı́culas carregadas
como electrões. Os electrões seriam então, juntamente com outras partı́culas ainda desconhecidas,
constituintes do átomo, que era afinal, ao contrário do que afirmava Dalton, divisivel.
(a) Uma
descrição bastante detalhada destes estudos pode ser consultada no url
http://library.thinkquest.org/19662/high/eng/cathoderays.html
1.1. A EVOLUÇÃO HISTÓRICA DA HIPÓTESE ATÓMICA
3
F
2+
α
A
θ
Figura 1.2: Representação esquemática da experiência de Rutheford. Partı́culas α produzidas pela
fonte F incidem numa alvo constituı́do por uma folha fina de ouro (A), determinando-se o ângulo
em que são dispersas.
Em 1904, J. J. Thomson propôs o seu modelo para a estrutura atómica, segundo o qual os
átomos seriam pequenas esferas carregadas uniformemente com uma densidade de carga positiva,
no interior das quais se encontravam electrões, em número suficiente para anular a carga total do
átomo. Este modelo é carinhosamente conhecido como o “modelo do bolo de passas”, indicando
uma analogia entre os electrões num átomo denso e uniforme e as passas de uvas num bolo de
passas. Thomson descobriu também que o número de electrões de cada átomo era igual ao número
atómico do seu elemento quı́mico. O tamanho dos átomos pôde ser estimado a partir do valor da
densidade dos sólidos ou de análises envolvendo a teoria cinética dos gases. Todas as abordagens
indicaram que os átomos teriam um raio de alguns angstrongs(b)
Thomson tentou também calcular as posições de equilı́brio dos electrões em átomos de diferentes elementos e as frequências com que os electrões oscilariam em torno dessas posições, com
o objectivo de explicar os espectros de emissão e absorção atómicos, por exemplo, as várias séries
de riscas no espectro do hidrogénio. Este esforço não foi, no entanto, nada bem sucedido.
O átomo nuclear
Simultaneamente com estes desenvolvimentos na fı́sica atómica, verificaram-se uma série de descobertas que originaram o ramo da fı́sica que mais tarde viria a ser conhecido com o nome de
Fı́sica Nuclear. Em 1896, Henri Bequerel descobriu a radioactividade natural; nos anos seguintes
decorreram os trabalhos do casal Pierre e Marie Curie, que isolaram diversas substâncias radioactivas. Em 1899, Rutheford descobriu que a radiação do urânio era constiuı́da por partı́culas com
diferentes cargas eléctricas, tendo chamado partı́culas-α às positivas e β às negativas. No mesmo
ano, constatou que as partı́culas α não eram mais do que átomos de hélio duplamente ionizados e
que as partı́culas-β eram electrões.
Em 1909, Rutheford, Geiger e Marsden realizaram uma série de experiências cruciais, onde
analisavam a dispersão angular de um feixe de partı́culas α incidente numa folha de ouro (ver
a Figura 1.2). Surpreendentemente, verificou-se que uma fracção muito elevada de partı́culas α
sofria desvios muito acentuados.
É instrutiva uma análise um pouco mais detalhada desta experiência. De acordo com o modelo de Thomson aceite na altura, os átomos consistiriam em esferas densas, com carga positiva uniforme, onde se distribuı́am os electrões atómicos. Numa experiência como a de Rutheford, explicam-se os desvios sofridos pelas partı́culas α através da interação eléctrica entre elas
e os átomos do alvo. Esta interacção é a soma de duas parcelas: a força de atracção entre as
partı́culas α (positivas) e os electrões atómicos (negativos) e, por outro lado, a força de repulsão
entre as partı́culas α e o substrato atómico, denso e positivo. Como as partı́culas α têm uma
massa muito maior (quase 7300 vezes maior) que a dos electrões, a primeira destas interações deve
ter um efeito imperceptı́vel sobre o movimento das partı́culas α. Um efeito semelhante verifica-se
fazendo uma bola medicinal de 20 kg colidir com bolas de ténis de mesa, com uma massa de 3 gr.
Não esperamos, decerto, observar uma grande alteração da trajectória da bola mais pesada como
resultado da sua colisão com as bolas mais leves...
(b) Um
angstrong (Å) é 10−10 m.
4
E
EMax
r
a
Figura 1.3: Gráfico do módulo do campo eléctrico gerado por um átomo esférico com raio a carregado
uniformemente com uma carga Ze.
Uma vez que desprezamos o efeito da interacção entre as partı́culas α e os electrões atómicos,
resta a interacção com a distribuição de carga positiva para explicar a dispersão do feixe incidente.
Como já se referiu, esta interação é de natureza eléctrica. A força sobre uma partı́cula α é
proporcional ao campo eléctrico gerado pelos átomos de ouro do alvo na posição ocupada pela
partı́cula incidente. Considerando, para simplificar, o efeito de apenas um átomo de ouro, com
raio a e carga (positiva) Ze distribuida uniformemente (Z = 79 é o número atómico do ouro), com
centro na origem de coordenadas, temos um campo eléctrico dado por
½
~ r) =
E(~
1
4π²0
1
4π²0
Ze
r
a3 ~
Ze
~
r3 r
se
se
r<a
r > a.
(Esta expressão é facilmente deduzida usando a Lei de Gauss.) O módulo do campo eléctrico é
uma função que cresce linearmente com a distância à origem até atingir um máximo para r = a,
após o que decresce proporcionalmente ao inverso do quadrado de r (ver o gráfico na Figura 1.3).
O valor máximo atingido pelo campo é
EMáx = E(a) =
1 Ze
.
4π²0 a2
Como é patente nesta igualdade, o valor máximo do campo eléctrico que actua nas partı́culas α
é fortemente limitado pelo tamanho da região do átomo onde se concentra a carga positiva e a
massa do átomo. Considerando, nos termos do modelo de Thomson, que essa região coincidia
com o volume atómico, Rutheford achava que as forças sobre as partı́culas α seriam pequenas e,
por isso, não esperava observar desvios muito acentuados em número apreciável. Esta discussão
está bem ilustrada na Figura 1.4, em que mostramos a trajectória seguida por uma partı́cula α
incidindo em átomos com diferentes raios, apresentando-se também um gráfico da intensidade da
força eléctrica exercida na partı́cula, como função do tempo. Constata-se claramente que átomos
maiores produzem desvios menores.
Na Figura 1.5 apresentam-se as distribuições angulares do feixe de partı́culas α produzidas
(recorrendo a uma simulação computacional) por átomos de Thomson, com um raio de 1,5Å (à
esquerda) e por um núcleo atómico com um raio de 2 fm(c) (à direita). Os resultados observados
por Rutheford, Geiger e Marsden foram semelhantes aos apresentados no gráfico da direita.
O facto de se terem observado, e em grande número, deflexões de 90◦ e até superiores, obrigou
Rutheford a rever o modelo de Thomson, mantendo o raio atómico nos valores aceites (cerca de
10−10 m) mas reduzindo grandemente o tamanho da região onde se concentra a massa e a carga
positiva por um factor de 105 . A fronteira do átomo ficaria assim definida pela posição dos electrões
e, para os impedir de cair no “caroço” denso e positivo, Rutheford propôs que eles orbitariam em
torno daquela região, formando uma espécie de sistema solar microscópico.
(c) Um
fermi (1 fm) é o mesmo que um fentometro, isto é, 10−15 m.
5
R=1.5Å
t
R=1.2Å
t
R=0.9Å
t
R=0.6Å
t
Figura 1.4: Trajectórias seguidas por uma partı́cula α incidindo em átomos com a mesma carga
mas diferentes raios. À direita pode apreciar-se a intensidade da força nela aplicada, como função
do tempo. Nota-se claramente que a átomos menores correspondem intensidades da força eléctrica
média superiores, ou seja, maiores desvios sofridos pelas partı́culas α.
700
700
600
600
500
500
400
400
300
300
200
200
100
100
-90
0
90
-90
0
90
Figura 1.5: Distribuições angulares do feixe de partı́culas α difractado por um átomo de Thomson
com um raio de 1,5 Å (à esquerda) e por um núcleo atómico com um raio de 2,0 fm = 2,0 × 10−5 Å
(à direita). Em abcissas representa-se o ângulo de deflexão, em ordenadas o número de partı́culas α
que sofreram desvios com esses ângulos. A carga do centro dispersor é a mesma nos dois casos.
6
1.1.3
Entram os quanta
Este novo modelo foi, logo após a sua apresentação, criticado (até pelo próprio Rutheford) porque
tinha como consequência a instabilidade dos átomos. Com efeito, electrões em órbita do núcleo
deveriam, nos termos da teoria electromagnética, emitir radiação, ou seja, energia. A energia
mecânica destes electrões deveria, pois, ir diminuindo, ocupando os electrões orbitais cada vez
mais próximas do núcleo, até que que se desse o choque final. Tudo isto aconteceria numa fracção
de segundo, contrariando claramente toda a evidência experimental.
Para resolver este impasse, Niels Bohr, que na altura (1913) era colaborador de Rutheford,
propôs uma teoria inspirada nos então recentes modelos quânticos de Plank e de Einstein, baseada
nos seguintes pontos de partida:
(a) Ao contrário do que se passa no sistema solar, nem todas as órbitas electrónicas são permitidas, mas apenas aquelas com forma circular em que o momento angular electrónico é um
múltiplo inteiro da constante de Plank reduzida, h̄ = h/2π. Enquanto um electrão ocupa
uma destas órbitas, não emite radiação nenhuma.
(b) Um electrão pode sofrer uma transição entre duas órbitas permitidas, emitindo (ou absorvendo) um fotão com energia igual à diferença entre as energias dos estados inicial e final.
Fazendo apenas estas suposições, Bohr pode reproduzir com exactidão o espectro de emissão e
absorsão do hidrogénio, como demonstramos a seguir.
Um electrão na n-ésima órbita permitida descreve um movimento circular uniforme(d) em
torno de um núcleo que o atrai electrostaticamente. Seja rn o raio desta órbita e vn o módulo da
velocidade com que é descrita. A força que mantém o electrão na órbita é a força de Coulomb,
F =
1 e2
,
4π²0 rn2
onde e é o módulo da carga de um electrão e ²0 o valor da permitividade eléctrica do vácuo. Esta
força é também a força de um movimento circular uniforme, de forma que podemos escrever
m
vn2
1 e2
.
=
rn
4π²0 rn2
(1.1)
Por outro lado, ela deve satisfazer a condição de quantização de Bohr, isto é, o momento angular
electrónico deve ser um múltiplo da constante de Plank reduzida,
mvn rn = nh̄.
(1.2)
Destas duas igualdades resultam imediatamente os valores permitidos para rn e vn :
rn
=
vn
=
n2 h̄2
me2
1 e2
.
4π²0 nh̄
4π²0
A energia mecânica de um electrão nesta órbita é a soma da sua energia potencial electrostática,
Un = −
com a energia cinética,
Tn =
1 e2
,
4π²0 rn
1
mv 2 ,
2 n
(d) O movimento é uniforme porque este sistema é semelhante a um sistema planetário, logo, podemos aplicar a
lei das áreas de Kepler, de onde se deduz que, sendo a trajectória circular, só pode ser descrita uniformemente.
ou seja,
En = Un + Tn = −
1
2
µ
e2
4π²0
¶2
7
m
.
n2 h̄2
O fotão emitido numa transição entre dois nı́veis ni e nf (ni > nf ) deve então ter uma energia
igual a
Ã
!
µ 2 ¶2
1
e
m
1
1
ε = Eni − Enf =
− 2 ,
2 4π²0
ni
h̄2 n2f
e a frequência da radiação emitida é a definida pela lei de Plank,
ν
=
=
1
1
ε =
ε
h
2πh̄
Ã
!
µ 2 ¶2
1
m
1
1
e
− 2 .
2 4π²0
ni
2πh̄3 n2f
Finalmente, o comprimento de onda da radiação emitida na transição pode ser calculado como
!
Ã
ν
1
1
1
(1.3)
= = RH
− 2 ,
λ
c
n2f
ni
onde
1
RH =
2c
µ
e2
4π²0
¶2
m
≈ 1,0974 × 107 m−1
2πh̄3
é uma constante, chamada constante de Rydberg. A Eq. (1.3), que nos permite calcular o comprimento de onda da radiação emitida (ou absorvida, se tomarmos em linha de conta um sinal) numa
transição entre dois nı́veis de Bohr, tinha sido obtida de forma empı́rica no estudo do espectro do
hidrogénio, por Rydberg, em 1890. Foi um tremendo sucesso para o modelo de Rutheford-Bohr
que se pudesse, com ele, justificar teoricamente a fórmula de Rydberg.
O modelo de Bohr não clarificava a natureza fundamental da estrutura atómica. Não se
apresentava, com este modelo, uma explicação para o facto do electrão atómico não perder energia
por irradiação; ele era, meramente, aceite. Para fazer esta clarificação foi preciso esperar mais 20
anos, até à formalização da Mecânica Quântica(e) . Um passo importante para esta formalização foi
dado por Louis de Broglie em 1923, quando generalizou a dualidade onda-partı́cula, que até então
se aplicava apenas à radiação, às partı́culas como electrões ou protões. Inspirado na teoria da
relatividade restrita e na óptica, achou uma expressão para o comprimento de onda de partı́culas
em movimento e constatou que as órbitas de Bohr eram exactamente aquelas que permitiam o
estabelecimento de vibrações estacionárias da função de onda electrónica.
1.1.4
O neutrão
Com o modelo de Rutheford e Bohr, foi possı́vel descrever com precisão o espectro do átomo
de hidrogénio, como acabámos de mostrar. Infelizmente, este modelo não produzia resultados
satisfatórios para os espectros dos restantes átomos. Apesar deste facto, e apesar de ser uma
teoria insatisfatória por ter algumas premissas injustificáveis na altura, este modelo ajudou a
convencer a comunidade cientı́fica a favor de uma estrutura atómica semelhante à que ainda hoje
adoptamos: os átomos são constituı́dos por um núcleo muito pequeno, com uma carga +Ze (Z
é o número atómico) e com a quase totalidade da massa atómica, à volta do qual se distribuem
os electrões descrevendo, num certo sentido, movimentos orbitais, que os impedem de “cair” no
núcleo que os atrai.
(e) É discutı́vel dizer que a Mecânica Quântica clarifica as coisas. Bohr dizia, mais ou menos, o seguinte: “Quem
acha que a mecânica quântica não é uma teoria misteriosa, ainda não a compreendeu,”coisa que também se pode
dizer como: só aqueles que não compreendem a mecânica quântica acham que ela permite compreender bem a
realidade.
8
p+
?
α 2+
Be
Parafina
Figura 1.6: Representação esquemática da Experiência de Irène Curie e Frederick Joliot.
O núcleo seria constituı́do por protões, partı́culas com carga igual (mas oposta) à do electrão,
e com uma massa, igual à de um ião H+ , muito superior à do electrão.
Um átomo de hidrogénio é, no quadro deste modelo, simplesmente constituı́do por um electrão
em órbita à volta de um protão. Mas logo o átomo seguinte na escala de massas, o deutério(f)
apresenta um problema. A sua massa é aproximadamente igual ao dobro da do hidrogénio, mas o
seu núcleo não pode conter dois protões porque o número atómico (ou seja, o número de electrões
circundantes) é, como o do hidrogénio, 1. Ora, um átomo com dois protões no núcleo e um electrão
em órbita não é electricamente neutro.
Para resolver esta dificuldade, que se verificava também para os átomos de todos os outros
elementos, surgiu a ideia, que se manteve durante alguns anos, de que os núcleos dos átomos do
elemento com número atómico Z e com número de massa A seriam constituı́dos por A protões e
por A − Z electrões. Assim, a carga do núcleo seria Ae − (A − Z)e = Ze, e portanto a carga total
do átomo anulava-se.
Mas este modelo era muito insatisfatório. Em primeiro lugar estranhava-se que a dinâmica
protão-electrão, que gera sistemas como o átomo, com dimensões de alguns angstrongs, pudesse
também ser responsável por sistemas muito mais pequenos, com apenas alguns fentometros. Mas
há ainda uma objecção mais fundamental. Tanto o protão como o electrão têm spin(g) 1/2.
De acordo com este modelo, um núcleo como o do deutério 2 H, deveria conter dois protões e
um electrão, ou seja, três partı́culas de spin 1/2. A composição dos momentos angulares destas
três partı́culas tem, como resultado, os valores 1/2 ou 3/2. No entanto, o momento angular
do deuterão foi medido e apresenta o valor 1. Esta inconsistência motivou especulações sobre
a existência de uma partı́cula neutra, que não tinha ainda sido descoberta. A questão só foi
resolvida com a descoberta do neutrão por Chadwick, em 1932. Chadwick analisou dados de uma
experiência realizada pelo casal Irène Curie-Joliot (filha de Marie Curie) e Frederick Joliot na
qual eram observados protões resultantes da travagem, em parafina, de uma radiação proveniente
do bombardeamento de um alvo de berı́lio com partı́culas-α (ver a Figura 1.6). O casal Joliot
supôs que a radiação que era travada na placa de parafina era radiação electromagnética e, dada
a energia com que os protões eram ejectados da placa, tinha que ter uma energia muito, muito
alta, como nunca antes tinha sido observada. Em vez de radiação electromagnética, Chadwick
propôs que a radiação produzida pelo berı́lio devia antes ser constituida por partı́culas neutras e
com uma massa semelhante à do protão, e realizou imediatamente uma série de experiências, em
que substituia a parafina por outras substâncias, que provaram a sua hipótese. E estava, assim,
descoberto o neutrão, o último dos ingredientes principais (juntamente com o electrão e o protão)
da estrutura atómica.
1.2
A estrutura atómica
Quando isolados, os sistemas atómicos (núcleo-nuvem electrónica) são estáveis. As propriedades
destes sistemas são cabalmente descritas pelas leis da Mecânica Quântica. De acordo com estas
leis, os electrões distribuem-se por diversos estados electrónicos, cujas propriedades se determinam
resolvendo a Equação de Schrödinger. Os estados quânticos de electrões confinados a uma região
(f) O deutério é um isótopo do hidrogénio, tendo o mesmo número atómico (claro) mas um número de massa duplo
do do hidrogénio.
(g) O spin de uma partı́cula é o seu momento angular intrı́nseco, que é independente do seu estado de movimento.
Será objecto de um estudo mais aprofundado adiante.
1.2. A ESTRUTURA ATÓMICA
9
limitada do espaço (como é o caso dos electrões atómicos), podem ser distinguidos entre si por um
conjunto de números inteiros, chamados números quânticos. Este facto é digno de nota porque
significa que os estados possı́veis dos electrões atómicos estão discretizados. Repare-se que, em
sistemas macroscópicos com interacções formalmente semelhantes, como o sistema solar, não se
nota qualquer discretização dos estados possı́veis dos planetas; estruturas como a cintura de asteróides (entre as órbitas de Marte e de Júpiter) ou os anéis de Saturno, mostram claramente que
o espectro de possibilidades para os estados dos corpos em órbitas gravitacionais é um conjunto
contı́nuo, não discreto como se verifica nas escalas atómicas.
Esta discretização do espaço de estados surge naturalmente da resolução da equação de Schrödinger. No caso dos estados electrónicos atómicos, esses números quânticos (n, l, ml , s) identificam
a energia, o módulo do momento angular orbital, a componente z do momento angular orbital
e a componente z do momento angular de spin. O número quântico principal (n) é um inteiro
positivo, ou seja, pode tomar os valores 1, 2, 3,. . . O que se pretende significar com esta frase é
que há estados electrónicos atómicos com n = 1, outros com n = 2 ou n = 3, mas não há estados
com n = 1,5 ou n = −1. Em átomos monoatómicos (como o hidrogénio ou o deutério) ou em
iões com apenas um electrão (como o He+ , o Li2+ , o Be3+ ), a energia de cada estado electrónico
depende apenas deste ı́ndice. Em átomos ou iões com dois ou mais electrões, a energia depende
também de l.(h) O número quântico de momento angular, l, é, um número inteiro não negativo,
mas a Equação de Schrödinger não tem soluções para l >= n. Assim sendo, existem estados
caracterizados por valores de (n, l) como (1, 0), (2, 0), (2, 1), mas não há estados (n, l) = (1, 1)
ou (2, −1). Uma notação muito habitual em fı́sica consiste em designar os estados com diferentes
valores de l através de letras do alfabeto, de acordo com a correspondência apresentada na tabela
em baixo.
l
0
1
2
3
4
...
sı́mbolo
s
p
d
f
g
...
A partir de l = 3 a correspodência segue a ordem alfabética. Usando esta nomenclatura, as
orbitais (n, l) = (1, 0), (2, 0), (2, 1) a que nos referimos há pouco designam-se orbitais 1s, 2s e 2p,
respectivamente. O número quântico de projecção de momento angular, ml , pode tomar todos os
valores inteiros entre −l e +l e, por fim, o número quântico de spin, ms , pode tomar os valores
±1/2.
Os electrões (tal como os protões e os neutrões) pertencem à classe dos fermiões, logo, satisfazem
o Princı́pio de Exclusão de Pauli: não pode haver mais do que um electrão no mesmo estado
quântico. Assim, num átomo no estado fundamental (isto é, de menor energia), os electrões
distribuem-se pelos estados disponı́veis de menor energia possı́vel. A ordenação energética dos
estados electrónicos pode obter-se a partir da regra da diagonal, ilustrada na Figura 1.7. De
acordo com a aplicação desta regra, a ordem crescente dos valores da energia é a da sequência 1s
2s 2p 3s 3p 4s 3d 4p 5s 4d 5p 6s. . .
Uma orbital (n, l) contém 2 × (2l + 1) estados electrónicos,(i) logo, pode albergar 2(2l + 1)
electrões. Então, tendo em conta a ordenação energética das orbitais, podemos facilmente constatar que um átomo de lı́tio, que tem três electrões, deve ter a orbital 1s totalmente preenchida e um
electrão sózinho na orbital 2s; um átomo de carbono (seis electrões) tem totalmente preenchidas
as orbitais 1s e 2s e restam 2 electrões na orbital 2p; o germânio (32 electrões) tem as orbitais 1s
2s 2p 3s 3p 4s 3d totalmente preenchidas e 2 electrões na orbital 4p.
(h) Há ainda uma muito ténue dependência de m e m , resultante do chamado acoplamento spin-órbita, mas
s
l
vamos desprezar estes detalhes.
(i) Note que m pode tomar os 2l + 1 estados m = −l, m = −l + 1, . . . m = l − 1, m = l e m pode tomar os
s
l
l
l
l
l
dois valores ±1/2.
10
1s
2s
2p
3s
3p
3d
4s
4p
4d
4f
5s
5p
5d
5f
5g
6s
6p
6d
6f
6g
6h
7s
7p
7d
7f
7g
7h
7i
Figura 1.7: A regra da diagonal. As setas indicam a ordem crescente para a energia electrónica.
A Figura 1.8 representa graficamente, de forma qualitativa, as energias das várias orbitais, para
dois átomos diferentes, com números atómicos Z (à esquerda) e Z + 1 (à direita). Esta figura põe
em evidência duas propriedades dignas de nota. Em primeiro lugar, as orbitais não se encontram
igualmente separadas; o hiato energético que separa as orbitais s das que as precedem é maior do
que os restantes. O espectro energético de cada átomo fica assim dividido em grupos de orbitais
com energias próximas umas das outras, separadas por intervalos “despovoados”. A estes grupos
de orbitais dá-se o nome de camadas. Em segundo lugar, a energia das orbitais num átomo com
dado número atómico é menor que a das orbitais correspondentes num átomo com maior número
atómico. (O facto de a energia das orbitais ser negativa é essencialmente convencional: considerase nula a energia de um electrão em repouso desligado do átomo; para atingirmos esta situação,
temos que fornecer energia ao átomo, logo, a sua energia inicial deve ser negativa.) A energia de
cada orbital, ou seja, a energia de um electrão que ocupe um estado dessa orbital, é igual à soma
da energia cinética com a energia potencial. Esta última é a da interacção electrostática entre
duas cargas de sinal contrário, que, como deve ser bem sabido, é proporcional ao produto das
duas cargas. É por isto que a energia de cada orbital diminui (ou melhor, torna-se mais negativa)
à medida que aumenta o número atómico: aumentando a carga no núcleo aumenta o módulo do
produto da carga do electrão com a carga do núcleo.
Assim, em geral, a energia total de um átomo com um dado número atómico é maior (isto é,
menos negativa) do que a energia do átomo com mais uma unidade de número atómico. Logo,
estes são mais coesos do que aqueles, coisa que se nota, por exemplo, na energia necessária para
arrancar um electrão ao átomo; como é sabido, esta energia aumenta, em geral, à medida que
aumenta o número atómico. Mas esta regra tem excepções: sempre que o hiato energético é
suficientemente largo, a diminuição das energias das orbitais causada pelo aumento do número
atómico não compensa o dispêndio de energia necessário para “arrumar” mais um electrão, num
nı́vel de energia bastante mais alto. Estas excepções verificam-se quando se inaugura uma nova
camada. A Figura 1.9 mostra os gráficos do raio atómico (à esquerda) e da energia de ionização (à
direita) como funções do número atómico, onde são patentes descontinuidades relacionadas com o
preenchimento das camadas como as que referimos.
Podemos agora compreender melhor algumas propriedades quı́micas dos elementos. Por exemplo, os átomos cujas nuvens electrónicas apresentam camadas completas são os dos gases raros,
que aparecem na coluna mais à direita da tabela periódica. Como os electrões destes átomos se
encontram muito fortemente ligados (por todos pertencerem a camadas completas), praticamente
1.2. A ESTRUTURA ATÓMICA
11
E
E=0
6p
5d
4f
6s
6ª camada
(32 electrões)
5p
5ª camada
(18 electrões)
4d
5s
4p
4s
4ª camada
(18 electrões)
3p
3s
3ª camada
(8 electrões)
3d
2p
2s
2ª camada
(8 electrões)
1s
1ª camada
(2 electrões)
Z
Z+1
Figura 1.8: Representação qualitativa e esquemática das energias das orbitais de dois átomos com
número atómico Z (à esquerda) e Z + 1 (à direita). Os números entre parêntesis representam a
quantidade de electrões que cada camada pode albergar. (Consegue verificar estes valores?)
Figura 1.9: Raio atómico (à esquerda) e energia de ionização (à direita), como funções do número
atómico. São patentes as descontinuidades quando se completam camadas, ou seja, quando se atingem os gases raros. Fonte: www.webelements.com
12
não sentem a proximidade de outros átomos. Assim, os átomos dos gases raros não têm facilidade
em estabelecerem ligações quı́micas, como é bem sabido.
Os átomos do sétimo grupo têm todas as suas orbitais totalmente preenchidas, restando apenas
um estado vago na última camada(j) . Estes átomos experimentam um grande abaixamento de
energia quando capturaram um electrão, porque esse electrão vai completar a camada de valência.
Então, num ambiente rico em electrões livres ou quase livres, o estado natural de átomos do sétimo
grupo deve ser o de iões negativos. É o que acontece com o cloro em solução aquosa: aparece na
forma Cl− .
Ao contrário do que acontece com os átomos do sétimo grupo, os átomos do primeiro grupo
têm apenas um electrão na camada de valência. Pelas razões que já foram expostas, este electrão
encontra-se muito fracamente ligado ao átomo, de forma que é fácil separar electrão e átomo. Num
ambiente em que os átomos estejam sujeitos a colisões com vizinhos, deve verificar-se que muitos
destes átomos se encontrem ionizados por lhes ter sido arrancado o electrão de valência. É o
que acontece numa solução aquosa, em que os átomos dos elementos do primeiro grupo aparecem
ionizados com carga negativa (Li+ , Na+ , etc.).
1.3
Ligações quı́micas
As ligações entre átomos, através das quais se formam agregados de matéria, costumam dividirse em quatro classes principais, a saber: as ligações iónicas, as ligações covalentes, as ligações
metálicas e as ligações de Van der Waals.
Nas primeiras, não se notam grandes alterações da estrutura electrónica de cada um dos átomos
que participa na ligação; dá-se, apenas, uma atracção electrostática forte entre dois iões de sinal
contrário. Os átomos participam como um todo nas ligações iónicas, como se fossem pequenas
esferas rı́gidas carregadas.
No estabelecimento de ligações de Van der Waals também não se verifica uma grande modificação dos estado dos electrões de cada substância. O que se passa nestas ligações é que pequenas
oscilações dipolares num dos átomos induzem oscilações dipolares nos átomos vizinhos, resultando
uma atracção fraca entre o dipolo indutor e os dipolos induzidos.
Nas ligações covalentes, ao contrário do que se passa nas ligações iónicas e de Van der Waals,
nota-se uma profunda alteração das funções de onda dos electrões de valência. Quando se aproximam os dois átomos que estabelecem a ligação, os electrões de valência de cada um começam
a sentir-se atraı́dos pelo outro. As suas funções de onda (que eram soluções de uma Equação de
Schrödinger com um só centro atractivo) alteram-se de maneira tal que passa a ser mais provável
encontrar os electrões de valência na região compreendida entre os dois átomos. Note-se que isto
apenas se verifica para os electrões de valência, porque os outros estão tão fortemente ligados ao
átomo a que pertencem que quase não sentem a influência do átomo vizinho. Estes estados ocupados pelos electrões de valência de um átomo quando ele estabelece uma ligação quı́mica chamam-se
orbitais moleculares. As orbitais moleculares permitem o estabelecimento de uma ligação porque
os cernes atómicos (carregados positivamente, uma vez que lhes faltam os electrões de valência)
dos dois átomos sentem-se atraı́dos pela nuvem electrónica da orbital molecular situada na região
entre os dois átomos. Este efeito encontra-se ilustrado na Figura 1.10.
Numa ligação covalente, as funções de onda dos electrões que participam na ligação são, como
acabámos de ver, muito alteradas. De facto, deixamos de poder identificar o átomo a que um
dado electrão de ligação pertence, uma vez que passam a pertencer à molécula e cada electrão
de ligação passa a ser partilhado pelos dois átomos ligados. Nalguns casos, esta modificacção da
função de onda é ainda mais radical. Por exemplo, no benzeno (C6 H6 ) cada átomo de carbono está
ligado a dois outros átomos de carbono formando uma cadeia hexagonal. Cada átomo de carbono
encontra-se ainda ligado a um átomo de hidrogénio. Estas ligações são ligações covalentes como as
(j) Para simplificar a linguagem, vamos definir agora alguns termos habituais na quı́mica: chama-se camada de
valência de um átomo à camada desse átomo de mais alta energia (isto é, com energia menos negativa) que ainda
contém electrões; electrões de valência são os electrões que ocupam essa camada; cerne atómico é o átomo subtraı́do
dos electrões de valência, ou seja, o núcleo mais os electrões das camadas interiores.
1.3. LIGAÇÕES QUÍMICAS
13
Figura 1.10: Orbitais atómicas de dois átomos distantes um do outro (esquerda) e orbital molecular
ligando os dois átomos (à direita). A região a cinzento representa a nuvem de electrões de valência
e os cı́rculos pretos pequenos representam os cernes atómicos.
Figura 1.11: Estrutura molecular hipotética (e errada) do benzeno (à esquerda). Os traços mais
espessos representam ligações duplas. De acordo com as convenções usuais, considera-se um átomo
de carbono presente em cada vértice e um de hidrogénio na extremidade de cada linha não ligada. Ao
centro pode ver-se uma representação esquemática das orbitais cı́clicas do benzeno (de Wikipedia,
the free encyclopedia). À direita, representação convencional da molécula de benzeno.
que acabámos de descrever. Dos quatro electrões de valência que cada átomo de carbono possui,
três ficam a ocupar as orbitais moleculares necessárias para estas ligações. Quanto ao electrão
de valência restante, poderı́amos pensar que estabeleceria novas ligações covalentes, formando-se,
entre os átomos de carbono, ligações duplas e simples alternadamente. Mas as ligações duplas
têm comprimentos menores do que as ligações simples correspondente. A estrutura molecular do
benzeno seria, então a representada na Figura 1.11, à esquerda. Uma tal estrutura deixaria uma
assinatura nı́tida em análises espectrométricas. Nestes estudos, analiza-se o espectro de absorção
da substância estudada. Dois tipos de ligações diferentes entre átomos de carbono deixariam dois
picos de absorção facilmente identificáveis, coisa que não se vislumbra no espectro do benzeno.
Todas as ligações C–C no benzeno são idênticas. Logo, os seis electrões (um por cada átomo)
devem ficar igualmente distribuidos pelas seis ligações, definindo orbitais cı́clicas, estendidas a
toda a molécula. Os electrões que ocupam estas orbitais podem mover-se quase livremente ao
longo de toda a cadeia hexagonal de átomos de carbono.
Um caso ainda mais extremo de deslocalização electrónica verifica-se na grafite. Nesta substância, várias cadeias hexagonais de átomos de carbono ligam-se umas às outras, formando uma
macromolécula planar com uma estrutura que lembra as colmeias de abelhas ou os tabuleiros
dos jogos de estratégia. Cada átomo estabelece três ligações covalentes com outros três átomos
de carbono, restando ainda um electrão de valência por cada um, que vai ocupar uma orbital
deslocalizada, podendo mover-se livremente ao longo de toda a molécula. Por esta razão, a grafite
é boa condutora de electricidade.
A ligação quı́mica na grafite é causada por dois tipos de deformações das orbitais atómicas:
uma, que leva ao estabelecimento de ligações covalentes entre átomos de carbono contı́guos; a outra,
que leva ao aparecimento de orbitais deslocalizadas que se estendem ao longo de toda a molécula.
Nos metais, apenas esta última espécie de deformações se verifica. O que mantém ligados os cernes
atómicos uns aos outros é a atracção que sentem pela nuvem electrónica associada às orbitais
deslocalizadas; a presença dos iões, por seu turno, define o potencial que sustenta esta mesma
orbital. Um metal é, então, um agregado de cernes atómicos, carregados positivamente, imersos
num oceano de electrões essencialmente livres, sendo o conjunto globalmente descarregado. Este
quadro tem algumas semelhanças com o modelo atómico de Thomson (o bolo de passas), mas como
uma fotografia em negativo: No modelo atómico, cargas negativas (electrões) individualizavam-se
14
num fundo positivo uniforme; no modelo metálico que acabámos de descrever, cargas positivas
(os cernes atómicos) estão presentes num fundo negativo (a nuvem electrónica) mais ou menos
uniforme.
Bibliografia
(Os sı́mbolos no final de cada entrada indicam o código do livro na Biblioteca da UBI)
• F. J. Blatt, Modern Physics (1992), Secções 5.1, 5.3, 5.4, 12.2 [F5.0/442]
• P. A. Tipler,R. A. Llewellyn, Fı́sica Moderna (2001), Secções 4.1, 4.2, 4.3, 7.6, 9.1, 9.2, 9.3
[F5.0/273]
PROBLEMAS
1.1 Considerando os átomos dos sólidos como pequenos cubos encostados uns aos outros, estime as
dimensões atómicas (a largura destes cubos) para as seguintes substâncias, a partir dos valores
das suas densidades e das suas massas atómicas
(a) Ferro: ρ = 7,86 × 103 kg m−3 , m = 55, 8 u;
(b) Alumı́nio:ρ = 2,70 × 103 kg m−3 , m = 27, 0 u;
(c) Mercúrio:ρ = 1,36 × 104 kg m−3 , m = 200, 6 u;
1.2 A Equação de van der Waals para gases reais é
p=
³ ´2
n
nRT
−a
V − nb
V
,
onde p, V , T , n representam, respectivamente, a pressão, o volume, a temperatura e o número
de moles de uma amostra de gás, R é a constante dos gases (R = kB NA ≈ 8,314 J K−1 mol−1 ),
e a e b são dois parâmetros caracterı́sticos de cada gás, o primeiro relacionado com detalhes da
força intermolecular, o segundo com o volume molecular, dado por
b = NA vm ,
onde vm é o volume de uma molécula. Dados os seguintes valores de a e b para os gases raros
calcule os valores dos seus raios atómicos.
Elemento
He
Ne
Ar
Kr
Xe
a (L2 atm mol−2 )
0.034
0.211
1.340
2.320
4.190
b (L mol−1 )
0.0237
0.0171
0.0322
0.0398
0.0510
Capı́tulo 2
Elementos de Cristalografia
Neste capı́tulo, vamos introduzir a linguagem e os conceitos básicos utilizados no estudo dos
cristais. Os tópicos aqui abordados serão usados ao longo de todo o curso e é, por isso, importante
que sejam bem apreendidos.
2.1
Cristais ideais e cristais reais
Como foi dito no capı́tulo anterior, os átomos dos sólidos cristalinos ocupam posições dispostas
regularmente, formando padrões que se repetem espacialmente em todas as direcções. A esta
estrutura dá-se o nome de cristal.
Em rigor, os cristais reais não podem satisfazer esta definição, porque uma periodicidade absoluta é impossı́vel. Com efeito, as impurezas quı́micas, os defeitos fı́sicos no padrão de repetição,
as oscilações térmicas, e até mesmo as fronteiras dos cristais reais destroem essa periodicidade.
Reservamos então aquela definição para os cristais ideais, que serão então corpos infinitos, absolutamente puros do ponto de vista quı́mico, com átomos “congelados” nas suas posições de
equilı́brio, etc, considerando os cristais reais aproximações mais ou menos razoáveis daqueles.
2.2
A estrutura cristalina
Matematicamente, um cristal ideal pode ser descrito como um conjunto de átomos dispostos numa
rede definida por três vectores linearmente independentes ~a, ~b, ~c, chamados vectores fundamentais
de translação, tais que o arranjo atómico é, em todos os aspectos, semelhante quando observado
de dois pontos com vectores posição ~r e ~r0 , relacionados através de
~r0 = ~r + h~a + k~b + l~c,
(2.1)
com h, k e l inteiros arbitrários. Com ~r fixo, ao conjunto de pontos que se obtem variando h, k, e
l na equação (2.1) dá-se o nome de rede cristalina, ou de Bravais.
De acordo com as definições apresentadas, não podemos confundir os conceitos de cristal e de
rede cristalina. Esta é uma abstracção matemática que consiste num conjunto de pontos idênticos,
dispostos regular e periodicamente no espaço, ao passo que o cristal é formado por um conjunto de
átomos, que podem nem ser todos da mesma espécie quı́mica, como é o caso do cloreto de sódio.
A estrutura do cristal pode ser gerada sobrepondo a cada ponto da rede cristalina uma base (ou
motivo) de átomos, idêntica para todos os pontos da rede. Assim, a relação entre cristal, rede
cristalina e motivo pode ser simbolizada como
rede + motivo = cristal.
Vejamos o seguinte exemplo para nos ajudar a sedimentar este novo conceito. Na Figura 2.1
está representado um cristal composto por três átomos diferentes. Este cristal pode ser recriado
colocando uma réplica do motivo de três átomos junto a cada um dos pontos da rede.
15
16
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
motivo
ponto
da rede
cristal=rede+motivo
(a)
(b)
Figura 2.1: (a) base de três átomos; (b) cristal. Em cada ponto da rede é colocado a base de átomos
de modo a formar o cristal.
Uma outra abordagem, ilustrada com o seguinte exemplo bi-dimensional, consiste em determinar a rede a partir do cristal: a Figura 2.2 representa uma estrutura cristalina bi-dimensional,
b’
b
a’
y
x
(a)
a
(b)
Figura 2.2: Exemplo de um cristal bi-dimensional.
formada por átomos de duas espécies, “•” e “◦”. De acordo com a definição apresentada, os vectores fundamentais são tais que qualquer combinação linear com coeficientes inteiros destes vectores
é igual à diferença entre as posições de dois pontos equivalentes no cristal. Logo, os vectores ~x e ~y
representados na figura não são vectores fundamentais, porque unem pontos não equivalentes (a
posição de um átomo “•” e de um outro “◦”). A figura da direita representa duas possibilidades
de escolha de vectores fundamentais (~a, ~b e ~a0 , ~b0 ), a rede cristalina por eles gerada e os motivos
correspondentes.
Chamam-se vectores da rede cristalina aos vectores que unem dois quaisquer pontos da rede.
No exemplo que acabámos de apresentar, ~a, ~b, ~a0 , ~b0 são vectores da rede, mas o mesmo não
acontece com ~x ou com ~y . Se qualquer vector da rede puder ser escrito como combinação linear,
com coeficientes inteiros, dos vectores fundamentais, então estes dizem-se vectores fundamentais
primitivos. No exemplo apresentado, ~a0 e ~b0 são vectores fundamentais primitivos, ao passo que ~a
e ~b não o são. Para verificar esta última preposição basta ver que, por exemplo, o vector ~b0 é uma
2.3. TIPOS DE REDES CRISTALINAS
17
combinação linear de ~a e ~b, mas com coeficientes fraccionários,
~b0 = 1 ~a +
2
1~
b.
2
(2.2)
Ao paralelogramo formado pelos vectores fundamentais dá-se o nome de célula unitária. Se os
vectores fundamentais forem, além disso, primitivos, a célula unitária por eles formada chama-se
célula unitária primitiva. Em rigor, esta definição dá-nos apenas um exemplo de célula unitária
primitiva. Uma definição formal é a seguinte:
Célula unitária primitiva é uma porção de espaço que, copiada através de translações
geradas por todos os vectores da rede, preenche todo o volume da rede cristalina, sem
sobreposições ou espaços vazios.
Desta definição deduz-se facilmente que uma célula unitária primitiva contém um, e apenas um,
ponto de rede. Se n for a densidade espacial destes pontos (isto é, o número de pontos por
unidade de volume) e v for o volume de uma célula unitária primitiva, então temos que nv = 1
e logo v = 1/n. Como este resultado é válido qualquer que seja a célula unitária primitiva (isto
é, quaisquer que sejam os vectores fundamentais primitivos usados para a construir), concluı́mos
que todas as células unitárias primitivas têm o mesmo volume.
O volume da célula unitária é um parâmentro importante em muitos cálculos. De acordo com
a expressão válida para paralelogramos, o volume de uma célula unitária primitiva é igual ao
módulo do produto misto dos vectores fundamentais primitivos:
τ = |~a · ~b × ~c|.
(2.3)
O resultado do produto misto de três vectores pode facilmente ser calculado como o determinante
de uma matriz cujas linhas são as componentes (relativamente a uma base ortonormada) de cada
vector, isto é,
¯
¯
¯ ax ay az ¯
¯
¯
~a · ~b × ~c = ¯¯ bx by bz ¯¯ .
¯ cx cy cz ¯
Acabámos de ver que podemos construir uma célula unitária primitiva com o paralelogramo
definido por um conjunto de vectores fundamentais primitivos. Uma outra possibilidade é a
seguinte: unimos com segmentos de recta um dado ponto de rede a todos os seus vizinhos mais
próximos; a região do espaço limitada pelos planos bissectores destes segmentos é uma célula
unitária primitiva. As células construı́das desta forma chamam-se células unitárias primitivas de
Wigner-Seitz. Note-se que, para a definição da células de Wigner-Seitz, não é necessário escolher
um conjunto de vectores fundamentais primitivos; assim, a sua forma depende apenas do tipo
de rede, ao contrário do que acontece com as células unitárias mais usuais definidas a partir
do paralelogramo formado pelos vectores cristalográficos. A Figura 2.3 representa o processo de
construção de uma destas células.
2.3
Tipos de redes cristalinas
A classificação das redes cristalinas faz-se em termos das operações de simetria que cada uma
aceita. Assim, e por exemplo, as redes cúbicas são aquelas que ficam inalteradas sob rotações de π2
em torno de certas direcções. Não faremos aqui este tipo de estudo por não ter uma importância
fundamental no que se segue, neste curso de nı́vel introdutório. Faremos apenas uma descrição
geométrica dos diferentes tipos de rede. Designamos por ~a, ~b e ~c os vectores fundamentais da
rede, por a, b e c os seus módulos e por α, β e γ os ângulos entre eles, definidos de acordo com
o esquema da Figura 2.4. Às quantidades a, b, c, α, β e γ dá-se o nome de parâmetros da rede
cristalina.
(a) Redes cúbicas
De todos os tipos de redes cristalinas, o mais simples de visualizar é o cúbico, caracterizado em
18
Figura 2.3: Célula unitária primitiva de Wigner-Seitz.
c
α
b γ
β
a
Figura 2.4: Vectores e ângulos fundamentais.
geral por
a
α
=
=
b
β
=
=
c
γ
=
π
.
2
b
β
γ α
a c
Há três subespécies da rede cúbica: a rede cúbica simples, cujos pontos estão dispostos como
os vértices de cubos iguais, arrumados contiguamente; a rede cúbica de corpo centrado, que, além
dos pontos que constituem a rede cúbica simples, contém ainda um ponto no centro do corpo de
um dos cubos que referimos; e a rede cúbica de faces centradas, que é formada pelos pontos que
formam a rede cúbica simples, e contém ainda um ponto no centro das faces daqueles cubos.
(b) Redes tetragonais
Se comprimirmos ou alongarmos uma rede cúbica numa das suas direcções fundamentais, obtemos
uma rede do tipo chamado rede tetragonal. Nesta, os pontos dispõem-se nos vértices de prismas
rectos de base quadrada (variante simples) e nos centros dos corpos destes prismas (variante de
corpo centrado). As redes tetragonais são então caracterizadas por
a
α
=
=
b
β
6=
=
c
γ
=
π
.
2
b
a c
Note-se que as redes tetragonais não apresentam a variante de faces centradas.
(c) Redes ortorrômbicas
As chamadas redes ortorrômbicas são as que se obtêm deformando a rede cúbica segundo duas
das suas direcções fundamentais. Os ângulos fundamentais são ainda todos iguais a π2 , mas os
módulos dos vectores fundamentais são diferentes entre si, ou seja,
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
a
α
6=
=
b
β
6=
=
c
γ
π
.
2
=
β
γ α
b
a
19
c
Este tipo de rede cristalina apresenta as três variantes simples, de corpo centrado e de faces
centradas, e ainda uma quarta, chamada rede de bases centradas, que é formada por pontos nos
vértices de paralelipı́pedos iguais dispostos contiguamente e dois pontos, nos centros de duas faces
opostas.
As deformações que aplicámos até agora à rede cúbica, para obtermos as redes tetragonais
e ortorrômbicas, têm a propriedade de manter os ângulos α, β e γ iguais a π2 . Vamos agora
apresentar outras possibilidades.
(d) Redes monoclı́nicas
Deformemos uma rede ortorrômbica, por forma a alterar o valor de γ, deixando os outros parâmetros inalterados. Obtemos assim uma rede do tipo chamado rede monoclı́nica, que apresenta
apenas as variantes simples e de bases centradas. As relações entre os parâmetros, neste tipo de
rede, são:
a
α
6=
=
b
β
6=
=
c
π
2
6=
γ.
α
γ β
b
a
c
(e) Redes triclı́nicas
Finalmente, consideremos agora a rede cristalina mais geral, no sentido em que menos constrangimentos impomos aos parâmetros de rede. A rede triclı́nica fica definida por
a
α
6= b
6
=
β
6=
6=
c
γ
6=
β
π
2.
b
γ
α
a
c
Há ainda que considerar dois tipos particulares de rede, que são casos especialmente importantes dos que já mencionámos.
(f) Redes trigonais
A rede trigonal pode obter-se por deformação da rede cúbica na direcção de uma das diagonais
principais. É caracterizada por
a
=
b
=
c
α
=
β
= γ
<
2
π.
3
(g) Redes hexagonais
São casos particulares da rede monoclı́nica, em que γ = 23 π. Assim, verificam
a =
α
2.4
=
b 6= c
π
β= ,
2
γ=
2
π.
3
Exemplos de estruturas cristalinas
Nesta secção apresentaremos exemplos das estruturas cristalinas apresentadas por algumas substâncias quı́micas.
20
(a) Redes cúbicas simples
Este tipo de estrutura não é energeticamente favorável para substâncias simples, e por isso poucos
elementos a adoptam. O único exemplo é o polónio, na forma α. Em contrapartida, há vários
compostos que apresentam redes cristalinas do tipo cúbico simples, como, por exemplo, o cloreto
de césio, CsCl. Nos cristais de cloreto de césio, os átomos de uma espécie ocupam as posições
definidas pela rede cúbica simples, enquanto que os da outra ocupam os centros dos corpos da
célula unitária. Note-se que isto não define a rede como sendo cúbica de corpo centrado, porque
os átomos de cloro e de césio são diferentes. Assim, não podem ocupar, ambos, posições da rede
cristalina, que, por definição, é um conjunto de pontos equivalentes. A Tabela 2.1 apresenta alguns
compostos que cristalizam numa estrutura cúbica simples.
Substância
CsCl
CsBr
CsI
TlCl
TlBr
TlI
a (Å)
4,11
4,29
4,56
3,84
3,97
3,74
Substância
NH4 Cl
CuZn
AgMg
LiHg
AlNi
BeCu
a (Å)
3,87
2,94
3,28
3,29
2,88
2,70
Tabela 2.1: Alguns compostos que cristalizam em redes cúbicas simples. Também é apresentado o
valor do parâmetro de rede a.
(b) Redes cúbicas de faces centradas
A rede cúbica de faces centradas é uma das redes que apresenta empacotamento máximo (ver adiante nesta secção) e por isso muitos elementos apresentam estruturas cristalinas deste tipo. Na Tabela 2.2 apresentam-se algumas substâncias (tanto elementos como compostos) que cristalizam em
redes cúbicas simples. O silı́cio e o germânio (muito importantes na industria de semi-condutores)
Elemento
Cu
Ag
Au
Al
a (Å)
3,61
4,08
4,07
4,04
Composto
NaCl
LiF
KCl
LiBr
a (Å)
5,63
4,02
6,28
5,49
Tabela 2.2: Substâncias que cristalizam em redes cfc.
cristalizam também na rede cúbica de faces centradas, com valores para o parâmetro de rede a
de 5,43 Å e 5,45 Å, respectivamente. Um outro exemplo importante é o carbono, na forma de
diamante. A estrutura cristalina do diamante pode ser gerada associando a cada ponto de uma
rede cúbica de faces centrada um motivo constituı́do por dois átomos de carbono com coordenadas
fraccionárias(a) (0,0,0) e ( 14 , 41 , 14 ). O valor do parâmetro de rede do diamante é a = 3, 56 Å.
(c) Redes cúbicas de corpo centrado
Os metais alcalinos cristalizam todos em redes cúbicas de corpo centrado. Na Tabela 2.3 resumemse as propriedades da rede cristalina de alguns elementos que apresentam esta estrutura.
(d) Redes de empacotamento máximo
Em muitos metais e nos sólidos inertes, a ligação quı́mica é tal que favorece uma grande proximidade entre os átomos envolvidos. Nestes casos, as posições ocupadas pelos átomos podem
(a) Mais
adiante serão introduzidas estas coordenadas. Para os presentes efeitos, é suficiente saber que um ponto
cujas coordenadas fraccionárias são (q, r, s) ocupa uma posição definida por q~a + r~b + s~c relativamente a uma origem
convenientemente escolhida.
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
Elemento
Li
Na
K
Rb
Cs
Ba
a (Å)
3,50
4,28
5,25
5,69
6,08
5,01
21
Elemento
V
Nb
Ta
Cr
Mo
W
a (Å)
3,03
3,29
3,29
2,88
3,14
3,16
Tabela 2.3: Alguns elementos que cristalizam em redes do tipo ccc.
ser visualizadas imaginando-os como esferas rı́gidas, encostadas umas às outras por forma a minimizar o volume intersticial. Nestas condições diz-se que a rede cristalina é de empacotamento
máximo. Há dois tipos de redes de empacotamento máximo: a rede cúbica de faces centradas e a
chamada rede hexagonal compacta. Para compreendermos a razão de existirem apenas estas duas
espécies, analisemos a Figura 2.5. Nela, está representado um plano de esferas iguais, dispostas
B
C
B
B
A
A
C
C
B
A
C
A
C
B
B
A
A
A
ABA
ABC
Figura 2.5: As duas possibilidades para o empacotamento máximo.
contiguamente, formando uma rede bi-dimensional hexagonal. Para formarmos um cristal tridimensional, devemos colocar, sobre o plano representado à esquerda, outros planos semelhantes.
Para maximizar o volume ocupado, os centros das esferas do “segundo andar” deverão ficar nas
verticais dos pontos B ou, em alternativa, dos pontos C. Suponhamos que se verifica a primeira
possibilidade. Analisemos agora as possibilidades de colocação de um terceiro andar. Os centros
das esferas desta nova camada devem ocupar posições nas verticais dos espaços intersticiais do
segundo andar, ou seja, as verticais dos pontos A (dizendo-se então que se trata de um empacotamento do tipo ABABA . . .) ou, alternativamente, as verticais dos pontos B (empacotamento do
tipo ABCABC . . .). As duas possibilidades estão representadas à direita na Figura 2.5. As redes
com empacotamento do tipo ABC são, de facto, redes cúbicas de faces centradas, em que o plano
apresentado na Figura 2.5 à esquerda é um plano perpendicular a uma direcção diagonal principal;
as redes com empacotamento do tipo ABA são redes hexagonais compactas (ver a Figura 2.6).
A rede hexagonal compacta não é, no sentido estrito, uma rede cristalina, pois os pontos que a
formam não são todos equivalentes, como está patente na Figura 2.6: os pontos do plano central
não são equivalentes aos das bases. No entanto, é uma estrutura apresentada por um número
relativamente grande de substâncias quı́micas, e por essa razão a incluı́mos nesta discussão. Para
que uma “rede” hexagonal compacta seja uma estrutura de empacotamento máximo, a relação
entre os módulos dos vectores fundamentais ~a, ~b e ~c é
a = b
c = 1, 63a.
(2.4)
(2.5)
Dados relativos a alguns elementos que cristalizam na rede hexagonal compacta estão apresentados
na Tabela 2.4
(e) Outras estruturas — Exemplos com elementos
22
c
b
a
Figura 2.6: A rede hexagonal compacta.
Elemento
Be
Ce
He (2K)
Mg
Ti
Zn
a (Å)
2,29
3,65
3,57
3,21
2,95
2,66
c (Å)
3,58
5,96
5,83
5,21
4,69
4,95
c/a
1,56
1,63
1,63
1,62
1,59
1,86
Tabela 2.4: Elementos com rede hexagonal compacta.
Na Tabela 2.5 resumimos propriedades da rede cristalina de elementos que cristalizam em redes
trigonais, ortorrômbicas e tetragonais.
Elemento
Hg (5K)
Bi
In
Sn (branco)
Ga
Cl (113K)
Tipo de rede
Trigonal
Trigonal
Tetragonal
Tetragonal
Ortorrômbica
Ortorrômbica
a
2,99
4,75
4,59
5,82
4,51
6,24
b
—
—
—
—
4,52
8,26
c
—
—
4,94
3,17
7,64
4,48
θ
70◦ 450
57◦ 140
—
—
—
—
Tabela 2.5: Alguns elementos com redes trigonais, tetragonais e ortorrômbicas. Os módulos dos
vectores fundamentais são indicados em Å. Os valores redundantes não estão explicitados.
2.5
Direcções e planos cristalinos
~ pode ser escrito como uma combinação linear
Como já foi dito, qualquer vector da rede, R,
(b)
~
inteira dos vectores ~a, b, ~c de um conjunto fundamental primitivo, isto é,
~ = h~a + k~b + l~c,
R
h, k, l ∈ ZZ,
(2.6)
onde ZZ designa o conjunto dos números inteiros. Como é evidente, se o conjunto de vectores ~a, ~b,
~c for um conjunto fundamental não primitivo, esta equação só pode manter-se, qualquer que seja
~ se permitirmos que h, k e l possam tomar valores racionais não inteiros. Em
o vector de rede R,
(b) Daqui
em diante, usaremos esta expressão referindo-nos a uma combinação linear com coeficientes inteiros.
2.5. DIRECÇÕES E PLANOS CRISTALINOS
23
qualquer caso, os vectores de um conjunto fundamental formam uma base natural para a descrição
geométrica e analı́tica do cristal. Devemos, no entanto, ter em atenção que, por norma, esta base
não é ortonormada e que, portanto, muitas igualdades elementares da geometria analı́tica de uso
comum não são aqui aplicáveis.
Os cristalógrafos desenvolveram uma notação, baseada na utilização de bases formadas com
vectores fundamentais, que permite especificar facilmente posições, direcções e planos num cristal,
que vamos passar a descrever.
Chamam-se direcções cristalinas a direcções definidas por dois pontos da rede cristalina. Con~ que une dois pontos contı́guos numa dada direcção (ver a Figura
sideremos um vector de rede R
2.7). De acordo com a equação (2.6), existem três números inteiros (ou, quando muito, racionais)
b
a
Figura 2.7: Exemplo de direcção cristalina.
h, k, l, tais que
~ = h~a + k~b + l~c.
R
(2.7)
Eliminando factores racionais comuns, obtemos três números inteiros r, s e t, que identificam a
~ como sendo a do vector r~a + s~b + t~c. Estes três números, na
direcção (cristalina) do vector R,
notação cristalográfica que iremos adoptar, apresentam-se entre parêntesis rectos e sem quaisquer
separadores (vı́rgulas, espaços, etc.) entre eles, como em [rst]. Se algum destes inteiros for
negativo, o sinal deve ser colocado sobre, e não atrás, do ı́ndice respectivo, como em [121]. Por
exemplo, a direcção da diagonal principal numa rede cúbica (isto é, aquela que passa no centro do
corpo da célula unitária, partindo da sua origem) fica identificada por [111].
Tal como as direcções cristalinas são as definidas por dois pontos da rede, planos cristalinos
são os definidos por três pontos da rede cristalina. Devido à regularidade da rede, um dado
plano cristalino contém, para além dos três pontos de rede que o definem, um número infinito de
outros pontos de rede, que formam, nesse plano, uma rede cristalina bidimensional. Também por
causa desta regularidade, é possı́vel, dado um qualquer plano cristalino, definir uma infinidade de
outros planos cristalinos, paralelos ao primeiro. Os ı́ndices de Miller são uma forma prática de
especificar a orientação de uma destas famı́lias de planos cristalinos paralelos. Para uma dada
famı́lia definem-se da seguinte forma:
(a) tomando, na famı́lia considerada, o plano que mais se aproxima da origem da célula unitária,
determinam-se as distâncias que a separam dos pontos em que o plano escolhido intersecta
as direcções dos vectores fundamentais ~a, ~b e ~c, e exprimem-se estas distâncias em unidades
de a, b e c, respectivamente;
(b) tomam-se os inversos dos resultados obtidos no primeiro ponto e reduzem-se a três inteiros
nas mesmas proporções relativas, tendo o cuidado de eliminar eventuais(c) factores comuns.
(c) Pode demonstrar-se que, se se usar na construcção dos ı́ndices de Miller o plano que mais se aproxima da
origem, os ı́ndices obtidos não têm divisores comuns.
24
c
c/l
a/h
b/k
a
b
Figura 2.8: Plano cristalino com ı́ndices (hkl).
O resultado é apresentado entre parêntesis curvos, sem separadores.
Para o plano apresentado na Figura 2.8, os ı́ndices de Miller são (hkl), se os inteiros h, k e l não
tiverem divisores comuns. Também para os ı́ndices de Miller se segue a convenção de colocar os
sinais “-” sobre os ı́ndices negativos. Assim, se para uma dada famı́lia de planos resultarem os
valores 2, -3, 1 para os ı́ndices de Miller, o resultado deve ser apresentado como (231). Se um
dado plano é paralelo a um dos eixos fundamentais, então não o intersecta, obviamente; o valor
do ı́ndice de Miller correspondente é, por definição, 0 (zero).
Por exemplo, a famı́lia de planos paralela ao plano definido pelos vectores fundamentais ~a e
~b tem ı́ndices de Miller (001); os ı́ndices de Miller da famı́lia de planos paralela ao que contém
as extremidades dos vectores ~a, ~b e ~c são (111); um plano que contenha os pontos cujos vectores
posição ~a, ~b/2(d) , 2~c (ver figura 2.9) pertence a uma famı́lia com os ı́ndices de Miller (241).
c
a
b
Figura 2.9: Dois planos da famı́lia (241). O triângulo maior representa o plano que corta os eixos
cristalográficos nos pontos ~a, ~b/2, 2~c; o triângulo menor, a tracejado, representa o plano que deve
ser usado na determinação dos ı́ndices de Miller.
Analisemos este caso em detalhe. O plano em questão cruza os eixos fundamentais em pontos
que estão a distâncias a, b/2 e 2c da origem. Passa assim, em particular, num ponto de rede cujo
vector posição é 2~c. Mas existem, nesta famı́lia de planos, elementos mais próximos da origem.
Com efeito, existe um plano cristalino, paralelo ao que estamos a considerar, que passa no ponto
cujo vector posição é ~c, e é este plano que, pela sua maior proximidade à origem, deve ser usado na
construção da definição dos ı́ndices de Miller. Este plano cruza os eixos cristalográficos em pontos
que estão a distâncias a/2, b/4 e c da origem. Usando como unidades para estas distâncias os
módulos dos vectores vectores fundamentais correspondentes, obtemos os números racionais 1/2,
(d) Note-se que o ponto cujo vector posição é ~
b/2 não é um ponto de rede. No entanto, o plano em questão é de
facto um plano de rede, pois contém os pontos da rede cujos vectores posição são ~a, 2~c, ~b − 2~c.
2.6. DISTÂNCIA INTERPLANAR
25
1/4 e 1; os inversos destes números são 2, 4 e 1, e portanto esta famı́lia de planos tem os ı́ndices
de Miller (241), como se afirmou.
2.6
Distância interplanar
No próximo capı́tulo veremos que a distância entre dois planos consecutivos de uma famı́lia de
planos paralelos é um parâmetro muito importante no estudo da difracção de radiação pelos
cristais. Vamos por esta razão determiná-la de seguida. Na Figura 2.10 estão representados os
vectores fundamentais de uma rede cristalina e dois planos de uma famı́lia cujos ı́ndices são (hkl).
Pretendemos determinar a distância interplanar dhkl . Atendendo à figura da esquerda (desenhada
c
c
dhkl
P3
H
G’
θ
a
O
P2
a
P1
F
b
Figura 2.10: Distância interplanar dos planos (hkl).
segundo a direcção do vector ~b para a manter compreensı́vel), notamos que a distância requerida
~ 0 , que
é igual ao comprimento da projecção do segmento OP1 segundo a direcção do vector G
é escolhido perpendicular à famı́lia de planos (hkl). De acordo com a definição dos ı́ndices de
Miller, o segmento OP1 tem comprimento a/h, e, portanto, dhkl = a/h cos θ. Podemos dar a esta
~ 0:
igualdade uma forma mais prática usando o produto interno entre os vectores ~a e G
dhkl =
~0
~a G
·
,
~ 0|
h |G
(2.8)
~ 0 pode ser qualquer vector perpendicular ao plano (hkl). Uma forma simples de construir G
~0
onde G
consiste em formar o produto vectorial de dois vectores não colineares deste plano, por exemplo
~ e F~ representados na Figura 2.10 à direita. Estes dois vectores, escritos como
os vectores H
combinações lineares dos vectores fundamentais, são
~b ~a
−
k h
~c ~b
=
− ,
l
k
F~
=
P~2 − P~1 =
~
H
=
P~3 − P~2
(2.9)
(2.10)
onde representámos por P~k os vectores posição dos pontos Pk (k = 1, 2, 3). Fazendo o produto
externo destes dois vectores resulta
~ 0 = F~ × H
~ = 1 ~a × ~b + 1 ~b × ~c + 1 ~c × ~a,
G
hk
kl
lh
(2.11)
e, substituindo em (2.8), obtemos
dhkl =
~a · (~b × ~c)
.
~ 0|
hkl|G
(2.12)
(Note que produtos como ~a · (~a × ~b) anulam-se porque o o resultado do produto vectorial ~a × ~b é
perpendicular ao outro factor (~a) no produto escalar.) Finalmente, notamos que o produto misto
no numerador da fracção em (2.12) é igual ao volume da célula unitária definida pelos vectores
26
~ hkl ,
fundamentais ~a, ~b e ~c [ver a Eq. (2.3)], que representaremos por τ . Introduzindo o vector G
dado por
~ hkl = hkl 2π G
~ 0 = l 2π ~a × ~b + h 2π ~b × ~c + k 2π ~c × ~a,
G
(2.13)
τ
τ
τ
τ
obtém-se para a distância interplanar, por fim,
2π
¯.
dhkl = ¯¯
¯
~
¯Ghkl ¯
(2.14)
Esta expressão será usada no próximo capı́tulo, no estudo da difracção de radiação por cristais,
~ hkl (eq. 2.13), chamados
onde também será discutida a importância dos vectores com a forma de G
vectores da rede recı́proca.
Uma vez determinada distância entre famı́lia de planos vamos agora analisar a densidade de
pontos contidos em cada plano, i.e. o número de pontos por unidade de área da famı́lia de planos
(hkl).
Considere uma célula unitária formada por três vectores da rede. Dois destes vectores, ~u e ~v
estão contidos num plano da famı́lia (hkl) (ver a Figura 2.11); o terceiro vector, w,
~ está ligado
a um plano adjacente da mesma famı́lia. Note-se que a célula unitária assim construida contém
apenas um ponto de rede e portanto é, de facto, primitiva. O volume da célula formada por
este três vectores é, como já foi demonstrado, igual a τ . Este volume também é igual ao volume
formado pelos vectores ~u e ~v e um terceiro (que em geral não é vector da rede) de módulo igual
à distância interplanar, dhkl , perpendicular aos planos (hkl), e que une os dois planos adjacentes.
Deste modo, temos que
τ = A dhkl ,
e sendo o número de pontos da rede por unidade de área dado por
1
,
A
em que A é a área formada pelos vectores ~a e ~b, obtemos que a densidade de pontos num plano
(hkl) vem dada por
dhkl
1
=
.
A
τ
(hkl)
w
d hkl
v
A
(hkl)
u
Figura 2.11: Construcção para o cálculo da densidade de pontos de rede nos planos de uma famı́lia
(hkl).
2.7. COORDENADAS FRACCIONÁRIAS
2.7
27
Coordenadas fraccionárias
Estudámos até agora vários conceitos úteis no estudo das redes cristalinas, mas pouco foi dito
sobre os motivos, ou bases, que associados a estas redes, formam os cristais reais.
Tal como as redes cristalinas, os motivos podem ser classificados em categorias gerais, segundo
as transformações geométricas que aceitam como transformações de simetria. No entanto, este
assunto é não será abordado neste curso, por não ser absolutamente indispensável para o estudo
que se segue. O que sim é necessário é introduzir uma notação que permita a especificação das
posições dos átomos que formam o motivo. Esta questão surge porque porque os átomos que
formam o motivo ocupam, em geral, posições não coincidentes com as dos pontos que formam
a rede cristalina; o seu vector posição não é pois, necessariamente, um vector da rede, ou seja,
uma combinação linear inteira dos vectores fundamentais. Independentemente deste facto, usamos
a base dos vectores fundamentais da rede cristalina para representar os vectores posição destes
átomos, que, assim, podem apresentar coordenadas não inteiras, ou fraccionárias. Note-se que
o mesmo acontece para alguns pontos da rede cristalina, sempre que os vectores fundamentais
escolhidos para a representar forem não primitivos.
Por exemplo, usando vectores os fundamentais convencionais para a rede cúbica de corpo
centrado, as coordenadas do ponto central são ( 21 , 12 , 12 ). A rede cristalina do diamante é cúbica
de faces centradas. Os pontos de rede de uma célula unitária convencional têm pois coordenadas
(0, 0, 0), ( 12 , 12 , 0), ( 12 , 0, 21 ), (0, 12 , 12 ).
Quando se usam para especificar a posição de pontos de rede numa célula unitária (não primitiva), as coordenadas fraccionárias têm origem num vértice da célula unitária; mas, quando se
usam para indicar as posições dos átomos que formam o motivo, têm origem em cada ponto ponto
da rede cristalina. Assim, por exemplo para o diamante, o motivo é formado por dois átomos,
com coordenadas (0, 0, 0) e ( 41 , 14 , 14 ); para se obter um cristal de diamante, devemos sobrepor, em
cada um dos quatro pontos de rede que referimos no parágrafo anterior, dois átomos de carbono,
com estas coordenadas, relativamente a uma origem escolhida sobre cada um daqueles pontos.
2.8
Defeitos
A descrição dos sólidos que foi apresentada neste capı́tulo é apenas uma idealização. Os cristais
reais apresentam as regularidades mencionadas apenas de forma aproximada, apresentando sempre
um número apreciável de imperfeições ou defeitos, isto é, de desvios à regularidade cristalina.
Há vários tipos de defeitos cristalinos. Por exemplo, um átomo de espécie quı́mica diferente da
dos que formam o cristal (como é o caso, muito útil, dos semicondutores “dopados”, do tipo “p”
ou “n”),uma posição de rede desocupada, ou um átomo numa posição não definida pela rede. As
próprias fronteiras do cristal são defeitos cristalinos, na medida em que quebram a periodicidade
do cristal.
Vamos agora estudar um pouco mais detalhadamente os principais tipos de defeitos cristalinos.
(1) Vibrações dos átomos do cristal
Os átomos que formam os cristais encontram-se permanentemente animados de um movimento de
oscilação em torno de posições de equilı́brio, que correspondem às posições definidas pela estrutura
cristalina. A este movimento dá-se o nome de agitação térmica. A amplitude destas oscilações
diminui quando se baixa a temperatura, mas não se anula nunca, mantendo-se mesmo no zero
absoluto da temperatura, como consequência do princı́pio de incerteza de Heisenberg.
(2) Imperfeições pontuais
Imperfeições pontuais são irregularidades que se verificam em pontos isolados, e há três espécies
principais. As lacunas, as imperfeições intersticiais e as impurezas. Uma lacuna é uma posição
da estrutura cristalina que se encontra desocupada. Uma imperfeição intersticial corresponde a
um átomo que ocupa uma posição não prevista na estrutura cristalina. Um átomo de um cristal
pode, sob certas circunstâncias(e) , abandonar a sua posição na estrutura cristalina (fazendo assim
(e) Por
exemplo, mediante um aquecimento excessivo.
28
F
Deslocaçao
Figura 2.12: Deslocações cristalinas.
surgir uma lacuna) e fixar-se numa posição intersticial. A estes pares lacuna-interstı́cio dá-se o
nome de pares de Frenkel.
Nos cristais iónicos, as lacunas devem sempre aparecer aos pares, por forma a manter a neutralidade eléctrica do cristal. Estes pares de lacunas têm o nome de pares de Shottky. (f)
As impurezas são átomos de espécie quı́mica diferente da dos que formam o cristal. Os átomos
contaminantes podem ocupar posições da estrutura cristalina, substituindo assim os átomos originais, tomando o nome de impurezas substitucionais, ou ocupar posições que não estão definidas
na estrutura, sendo então conhecidas como impurezas intersticiais. Por exemplo, o aço é uma
solução de carbono em ferro, constituindo os átomos de carbono impurezas intersticiais na estrutura cristalina definida pelos átomos de ferro. Em contrapartida, o latão é uma liga de cobre e
de zinco, onde os átomos de zinco substituem os de cobre nalgumas posições, constituindo assim
impurezas substitucionais de um cristal de cobre.
O funcionamento dos dispositivos semicondutores comuns, como os transı́stores ou os diodos,
baseia-se na presença de impurezas substitucionais. Estes dispositivos consistem num cristal,
normalmente de silı́cio ou de germânio, dividido em duas (no caso dos diodos) ou três (no caso dos
transı́stores) regiões com impurezas substitucionais de tipo “n” (que consistem em átomos com
um electrão de valência a mais do que os os átomos vizinhos) ou de tipo “p” (cujos átomos têm
um electrão de valência a menos).
(3) Imperfeições lineares
Nas imperfeições lineares, os átomos que quebram a simetria cristalina dispõem-se ao longo de uma
linha. Os exemplos mais importantes são as chamadas deslocações. Estas imperfeições podem ser
o resultado de deformações do cristal, e verificam-se quando um plano cristalino se desloca sobre
outro. Na Figura 2.12 está representada uma deslocação e o modo como as deformações do cristal
podem fazer surgir deslocações. Há ainda outros tipos de deslocações mas não os estudaremos
aqui.
(4) Imperfeições superficiais
As imperfeições superficiais são superficı́cies de separação entre regiões distintas dos cristais. Por
exemplo, nos cristais de ferro é energeticamente favorável o alinhamento dos momentos magnéticos
dos átomos. No entanto, a agitação térmica contraria esta tendência de alinhamento. Assim, à
temperatura ambiente, os cristais de ferro encontram-se usualmente divididos em regiões, chamadas domı́nios ferromagnéticos, onde os momentos magnéticos dos átomos têm a mesma orientação,
sendo diferente de domı́nio para domı́nio. As superfı́cies(g) que separam estes domı́nios constituem
imperfeições superficiais.
As próprias fronteiras dos cristais constituem, como já foi dito, defeitos, que podem ser classificados também como imperfeições superficiais.
(f) Para cristais do tipo NaCl, evidentemente; nos casos de cristais do tipo AB , como o cloreto de cálcio (CaCL ),
2
2
a neutralidade eléctrica só pode ser assegurada através de “ternos” de lacunas — uma de A por cada duas de B.
(g) Podem ser consideradas superfı́cies à escala macroscópica apenas, já que podem ter várias dezenas de milhar
de átomos de espessura...
2. Problemas
29
Bibliografia
• J. R. Christman, “Fundamentals of Solid State Physics” (1988), capı́tulos 2 e 3 (F5.0 257
e 258)
• C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 1 (F5.0 82)
• N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulos 4, 5, e 7 (F5.0 339)
• C. Wert e R. Thomson, “Fı́sica de los solidos”, (????), capı́tulo 2
• Blakemore, “Solid State Physics” (????) capı́tulo 1
PROBLEMAS
2.1 Considere um cristal bidimensional semelhante a um tabuleiro de xadrez.
(a) Determine dois conjuntos de vectores fundamentais não primitivos.
(b) Determine dois conjuntos de vectores fundamentais primitivos.
(c) Represente graficamente as células unitárias e os motivos associados aos conjuntos de vectores fundamentais determinados em (a) e em (b).
2.2 Considere a estrutura atómica plana ilustrada na figura, composta por átomos do tipo A, B e C:
(a) Determine um conjunto de vectores fundamentais primitivos.
(b) Indique quantos átomos de cada tipo existem na célula unitária primitiva.
(c) Desenhe a célula unitária de Wigner-Seitz.
’
Atomo
tipo A
’
Atomo
tipo B
2.3 O Cloreto de Césio (CsCl) tem uma estrutura cúbica
de parâmetro a = 4, 11 Å, com os átomos dispostos
de acordo com a figura. Determine:
(a) o tipo de estrutura cúbica de CsCl;
(b) um conjunto de vectores fundamentais primitivos, e indique qual o volume da célula
unitária primitiva;
(c) a densidade do CsCl.
’
Atomo
tipo C
30
2.4 A estrutura do composto SrTiO3 é a seguinte: os átomos de estrôncio dispõem-se nos vértices de
cubos idênticos dispostos regular e contiguamente; os de titânio, nos centros destes cubos; os de
oxigénio, finalmente, nos centros das suas faces.
(a) Qual o tipo de rede cristalina apresentada por este composto?
(b) Indique um conjunto de vectores fundamentais primitivos.
(c) Verifique que há um átomo de estrôncio, um de titânio e três de oxigénio numa célula unitária
definida pelos três vectores escolhidos em (b).
(d) Usando coordenadas fraccionárias, descreva o motivo que, associado à rede cristalina determinada em (a), gera o cristal de SrTiO3 .
2.5 As posições dos pontos de duas redes cristalinas são dadas por:
(a) ~rn1 ,n2 ,n3 =
10n1 +9n2 +19n3
aêx
10
(b) ~rn1 ,n2 ,n3 =
2n1 +n2
aêx
2
+
3
+ 6 n2 +n
aêy + 2n3 aêz ;
5
√
3n2
aêy
2
+ 2n3 aêz .
onde a é um número real fixo e n1 , n2 e n3 são inteiros arbitrários. Escolha, para os dois casos,
um conjunto primitivo de vectores fundamentais e identifique o tipo de rede.
2.6 Para cada um dos seguintes conjuntos de vectores fundamentais primitivos, identifique o tipo de
rede indicando as dimensões da célula convencional em termos dos parametros a, b e c:
(a)
1
aêx
2
+ 12 aêy , aêy ,
√1 aêz ;
2
(b)
1
aêx
2
+ 12 aêy , aêy , aêz ;
(c) aêx + 2bêy , bêy , cêz ;
(d)
1
aêx
2
+ 12 bêy , bêy , cêz .
2.7 Calcule o valor dos seguintes parâmetros para cada uma das três redes cúbicas (simples, de corpo
centrado e de faces centradas):
(a) volume da célula convencional;
(b) volume da célula primitiva;
(c) número de pontos de rede na célula convencional;
(d) número de pontos na célula primitiva;
(e) distância entre vizinhos mais próximos;
(f) fracção de empacotamento(h) .
2.8 Prove que numa rede cúbica simples a direcção [hkl] é perpendicular aos planos da famı́lia (hkl).
Verifique com exemplos que o mesmo não se passa, necessariamente, para outros tipos de rede.
2.9 À temperatura de 1190 K, o ferro apresenta uma rede cristalina de faces centradas com aresta
a = 3, 647 Å, ao passo que, a 1670 K, a rede cristalina é de corpo centrado, com aresta a =
2, 932Å. Determine a sua densidade, para cada uma das temperaturas referidas.
2.10 O sulfeto de zinco Zn S cristaliza em duas estruturas distintas: a estrutura zinc blende (impregnação de zinco) e estrutura wurtzite (wurtzita), ilustradas na figura seguinte.
(h) A fracção de empacotamento é a fracção de volume da rede ocupado, supondo os pontos da rede como esferas
rı́gidas suficientemente grandes para se tocarem
2. Problemas
31
1/2
0
zinc blende
3/4
1/4
1/4
3/4
1/2
1/2
1/2
(a)
(b)
wurtzite
0
5/8
1/2
1/8
Nas Figuras (a) estão representadas células convencionais, As Figuras (b) representam projecções das
respectivas células onde estão indicadas as posições verticais dos átomos em relação à altura da célula em
questão.
A estrutura zinc blende é constituida por a uma rede cúbica de face centrada associada a cada tipo
de átomo e separadas ao longo da diagonal do cubo da célula convencional cúbica em ( 14 , 14 , 41 ).
A estrutura wurtzite tem associada a cada tipo de átomo uma estrutura hexagonal compacta
separadas em 58 da altura da célula hexagonal. Sabendo que os parâmetros das células são de
a = 5, 41 Å para célula cúbica, e a = 3, 81 Å e c = 6, 23 Å para a célula hexagonal calcule a
densidade de ambas as formas do sulfeto de zinco.
2.11 O Arsenito de Gálio cristaliza na forma de estrutura zinc blend. A ligação Ga − As tem 2, 45 Å
de comprimento.
(a) Determine a aresta da célula convencional cúbica.
(b) Qual a separação Ga − Ga mais curta.
(c) Qual a densidade do Ga As.
2.12 Considere um cristal com estrutura tipo wurtzite. Determine três vectores fundamentais primitivos
assim como a respectiva base indicando a sua posição relativa.
2.13 Determine o quociente c/a para uma estrutura wurtzite.
2.14 Considere um conjunto seguinte de vectores fundamentais primitivos de uma rede tetragonal de
corpo centrado:
~a =
1
1
1
1
1
1
a(êx + êy ) − cêz , ~b = a(−êx + êy ) + cêz , ~c = a(êx − êy ) + cêz
2
2
2
2
2
2
onde a representa o lado da base quadrada da célula convencional e c a altura da mesma. Considere
que inicialmente temos c > a, e seguidamente imagine que a célula é comprimida na direcção do
eixo z.
(a) Para que valor de c a rede toma a forma de cúbica de corpo centrado?
(b) Para que valor de c a rede toma a forma de cúbica de face centrada?
32
Dê os seus resultados em termos do parametro a.
2.15 Se uma célula unitária de uma dada rede cristalina contém N pontos de rede, então o seu volume
é V = N Vp onde Vp é o volume das células unitárias primitivas da mesma rede. Demonstre esta
preposição.
2.16 Determine a separação entre os pontos de uma rede cristalina ao longo das direcções seguintes:
(a) [110]; (b) [111]; (c) [320]; (d) [321].
2.17 Determine os ı́ndices de Miller de um plano que, numa rede cúbica simples, contém a aresta de
uma célula unitária primitiva e intersecta duas outras arestas da mesma célula nos seus centros.
2.18 Compare a distância interplanar para os planos (210) numa rede cúbica simples, cúbica de corpo
centrado e cúbica de faces centradas.
2.19 Demonstre que a fracção de empacotamento máximo para um cristal de estrutura tetragonal de
corpo centrado (com uma base composta por um único átmo) é dada por:
√
(a) π3 ac se c > 2a;
√
2 3
π a
(b) 24
(2 + ac 2 ) 2 se c < 2a.
c
2.20 Determine a densidade de pontos nos planos (111) de uma rede cúbica de face centrada. Compare
com a densidade de pontos nos planos (110).
Capı́tulo 3
Dispersão elástica de radiação em
cristais
Uma das ferramentas mais usadas na determinação da estrutura dos sólidos é a análise da difracção
de radiação neles incidente. De facto, quase se pode marcar o nascimento da fı́sica do estado sólido
com ramo autónomo da fı́sica em 1912, ano em que foi publicado o primeiro artigo(a) sobre difracção
de raios-X em cristais.
Neste capı́tulo, vamos estudar os processos de difracção de radiação por cristais e a sua utilização na determinação das estruturas cristalinas. Vamo-nos restringir à difracção elástica, em
que a radiação difractada tem o mesmo comprimento de onda que a incidente. Antes, porém,
faremos uma revisão dos conceitos envolvidos no estudo de processos ondulatórios.
3.1
Breve revisão sobre ondas
Entre dois sistemas afastados pode haver fluxos de energia através da troca de partı́culas, que
desempenham o papel de veı́culos para o transporte energético. Por exemplo, o Sol é fonte de
partı́culas (electrões, positrões, etc.), que varrem o Sistema Solar e que, ao colidirem com os
diferentes planetas, neles depositam a sua energia. Mas também são possı́veis trocas de energia
não acompanhadas por correspondentes trocas de matéria. Por exemplo, a luz proveniente do Sol
é a principal responsável pelo aquecimento diurno da superfı́cie terrestre, e consiste em radiação
electromagnética (isto é, numa perturbação no valor dos campos eléctrico e magnético que se
propaga no espaço), não num fluxo de partı́culas(b) . Um outro exemplo é o da energia sonora: a
onda de choque de uma explosão que ocorre num dado lugar transporta energia que produz efeitos
em pontos afastados, sem que se dê um deslocamento das moléculas de ar desde o ponto em que
se dá a explosão até àquele em que ela é detectada.
Chamamos onda a um veı́culo não corpuscular para o transporte de energia. Descrevemos
as ondas através do valor de funções do espaço e do tempo (usualmente chamadas campos, na
linguagem da fı́sica) como a pressão ou densidade atmosférica (para as ondas sonoras), os campos
eléctrico e magnético (para as ondas electromagnéticas), o deslocamento transversal (para as ondas
que se estabelecem nas cordas das guitarras), o nı́vel em cada ponto da superfı́cie para as ondas
do mar, etc.
Cada tipo de onda está sujeita a uma dinâmica especı́fica: a propagação das ondas electromagnéticas é regida pelas equações de Maxwell, as ondas de som no ar pela dinâmica de fluidos,
as ondas das cordas pelas leis da elasticidade. Apesar desta diversidade, há aspectos comuns.
Consideremos uma onda unidimensional(c) , descrita através de uma função ψ(x, t), que se desloca
(a) Por
W. Friedrich, P. Knipping e M. Laue
dualidade onda-corpúsculo da Mecânica Quântica veio complicar esta descrição.
(c) Isto é, a função que usamos para a descrever depende apenas de uma única coordenada espacial, x, e do tempo,
(b) A
t.
33
34
CAPÍTULO 3. DISPERSÃO ELÁSTICA DE RADIAÇÃO EM CRISTAIS
sem alterar a sua forma, com velocidade v no sentido dos valores de x crescentes (ou seja, para
a direita num gráfico vulgar). No instante t = 0, a função de onda é ψ(x, t = 0); num instante
posterior t, os valores que a função ψ(x, 0) tomava em cada ponto passa a função ψ(x, t) a tomá-los
em pontos deslocados para a direita uma distância vt, logo
ψ(x + vt, t) = ψ(x, 0),
ou seja, fazendo a substituição x → x − vt,
ψ(x, t) = ψ(x − vt, 0).
Vemos assim que as funções que descrevem ondas que se deslocam sem sofrerem alteração da forma
dependem de x e de t apenas através da combinação x − vt.
Funções que que se deslocam desta maneira, isto é, sem que se verifique qualquer alteração da
sua forma, satisfazem a equação diferencial às derivadas parciais (verifique!)
∂2ψ
1 ∂2ψ
−
= 0.
∂x2
v 2 ∂t2
Generalizando para três dimensões, podemos escrever esta equação diferencial como
lap ψ(x) −
1 ∂2ψ
= 0,
v 2 ∂t2
onde lap representa o operador laplaciano. Em coordenadas cartesianas, o laplaciano de uma
função ψ é
∂2ψ ∂2ψ ∂2ψ
lap ψ =
+
+
.
∂x2
∂x2
∂y 2
Estudemos um exemplo particular, o das ondas electromagnéticas no vazio. Em pontos afastados de corpos materiais e de fontes de campo(d) , as equações de Maxwell reduzem-se a
~ =0
div E
~ =0
div B
~
~ = − ∂B
rot E
∂t
~
~ = µ0 ²0 ∂ E
rot B
∂t
Se calcularmos o rotacional da segunda equação da primeira linha, obtemos
~ =−
rot rot E
∂
~
rot B
∂t
Mas pode provar-se que
~ = grad div A
~ − lap A,
~
rot rot A
~ Aplicando esta igualdade ao caso, que mais no interessa,
qualquer que seja a função derivável A.
~
de rot rot E, notamos que o primeiro termo se anula, como é patente na primeira equação de
Maxell; por outro lado, o termo do lado direito desta equação pode ser calculado a partir da
última equação de Maxell, obtendo-se
2~
~ = µ0 ²0 ∂ E .
lap E
∂t2
Esta expressão tem a forma geral da equação de onda, e as suas soluções descrevem uma onda que
√
se propaga no espaço vazio com velocidade c = 1/ ²0 µ0 .
Quando um sinal ondulatório (seja ele radiação electromagnética, ondas de som, vibrações de
uma corda ou de outra natureza) incide num sistema deposita nele energia. A energia depositada
por unidade de tempo chama-se intensidade da onda e, pode provar-se em cada caso, é proporcional
ao quadrado da amplitude da onda.
(d) Ou seja, considerando nulas a magnetização, a polarização eléctrica, a densidade de carga e a densidade de
corrente.
3.1. BREVE REVISÃO SOBRE ONDAS
35
Ondas planas monocromáticas
Um tipo particular de soluções da equação de onda merece uma análise mais detalhada. São as
ondas planas monocromáticas, funções do tipo
~
ψ~k (~r, t) = Aei(k·~r−ωt) ,
(3.1)
√
onde i é a unidade imaginária, definida como i = −1. A constante A nesta expressão tem o nome
de amplitude da onda; ao factor (~k ·~r −ωt) dá-se o nome de fase. O interesse destas funções deve-se
ao facto de ser possı́vel, usando uma técnica matemática chamada Análise de Fourier, escrever
uma função arbitrária como combinação linear de ondas planas monocromáticas. Neste contexto,
isto significa que qualquer solução da equação de onda se pode escrever como combinação linear
destas funções.
Recordemos que a exponencial de um número imaginário é um numero complexo, cujas partes
real e imaginária são dadas pela fórmula de Euler,
eix = cos x + i sin x.
Assim sendo, verificamos que as ondas planas monocromáticas são funções complexas, cuja parte
real corresponde à variável fı́sica em estudo, e que têm uma forma sinusoidal, que se desloca no
espaço com velocidade constante. Chama-se comprimento de onda à distância que separa dois
pontos com igual fase (dois máximos da função, por exemplo) sucessivos ao longo da direcção
de propagação e perı́odo ao intervalo de tempo entre a chegada de dois pontos com igual fase
sucessivos a um determinado ponto. O inverso do perı́odo chama-se frequência e é o número de
ciclos da onda que atinge um determinado ponto por unidade de tempo. A frequência angular, ω,
é a frequência multiplicada por 2π. Finalmente, ao inverso do comprimento de onda multiplicado
por 2π dá-se o nome de número de onda. O parâmentro vectorial ~k que aparece na expressão de
definição das ondas planas monocromáticas é um vector cujo módulo é igual ao número de onda
e que tem a direcção e o sentido da propagação da onda. Então, se representarmos por k̂ o vector
unitário com a direcção e sentido da propagação da onda e por λ o comprimento de onda, temos
~k = 2π k̂.
λ
Este vector chama-se vector de onda.
Substituindo a função de onda plana monocromática na equação de onda da Eq. (3.1), obtemos
a seguinte relação entre o módulo do vector de onda e a frequência angular, chamada relação de
dispersão:
ω = vk~kk.
Ondas esféricas
Numa onda plana monocromática, todos os pontos de um qualquer plano perpendicular à direcção
de propagação têm a mesma fase. Logo, o valor da função de onda é o mesmo em todos os pontos
de um dado plano perpendicular a ~k. Um sinal proveniente de uma fonte muito afastada tem,
aproximadamente, esta forma(e) . No entanto, nos pontos muito próximos da fonte de um sinal
ondulatório, a fase do sinal depende fundamentalmente da distância à fonte. Isto é, todos os
pontos a uma mesma distância da fonte apresentam a mesma fase. A frente de onda tem então a
forma de uma esfera, em vez de um plano. Ondas com esta forma chamam-se ondas esféricas e a
sua expressão geral é
ei(kk~r−~r0 k−ωt)
,
(3.2)
ψ(~r, t) = A
k~r − ~r0 k
onde ~r0 é o vector posição da fonte emissora. Note-se que, na expressão da fase, aparece agora
o produto dos módulos dos vectores ~k e ~r − ~r0 , que não depende das suas orientações. Assim, a
(e) “Muito afastada” significa aqui situada a uma distância muito superior às dimensões da porção de frente de
onda analisada.
36
k
Figura 3.1: Onda plana (à esquerda) e onda esférica (à direita).
fase só depende do módulo do vector posição relativo ~r − ~r0 , e não da sua orientação, que é o que
esperamos de uma onda esférica. O denominador k~r − ~r0 k na Eq. (3.2) dá conta da diminuição
da intensidade do sinal com o quadrado da distância à fonte(f) .
A Figura 3.1 apresenta uma representação gráfica de uma onda plana (à esquerda) e de uma
onda esférica (à direita).
3.2
Dipersão de radiação — Generalidades
Quando se faz incidir radiação electromagnética num objecto, cada ponto do objecto exposto
à radiação é, de algum modo, excitado, tornando-se, por seu turno, fonte de radiação. Esta
frase aplica-se a um grande número de processos diferentes, como a reflexão e refracção da óptica
geométrica, a fluorescência, a fosforescência, etc. Por exemplo, na reflexão num espelho, a radiação
incidente (isto é, os campos eléctrico e magnético que a constituem) exercem forças sobre os
electrões livres da camada reflectora de alúminio, animando-os de um movimento de vibração com
frequência igual à da radiação incidente; por seu turno, os electrões, por estarem em vibração, criam
campos eléctricos e magnéticos igualmente oscilantes, ou seja, emitem radiação electromagnética.
Esta emissão dá-se em todas as direcções mas, se se tratar de um espelho bem polido, só na
direcção prevista pelas leis da óptica geométrica é que se verifica interferência construtiva das
emissões dos vários electrões, logo, só nessa direccção é que se observa uma intensidade apreciável
da radiação proveniente do espelho.
Neste curso, consideramos apenas processos em que o comprimento de onda da radiação incidente é igual ao do da radiação secundária emitida pelo objecto exposto. Este tipo de dispersão
de radiação por um objecto chama-se dispersão elástica (g) ou difracção elástica.
A análise da difracção elástica de radiação por cristais é um método poderoso no estudo da sua
estrutura. A informação que se obtém das experiências de difracção resulta fundamentalmente de
processos de interferência das várias porções do cristal; assim, usa-se nestas experiências radiação
com comprimento de onda próximo das distâncias interatómicas tı́picas nos cristais, ou seja, alguns
Angstrongs.
As experiências de difracção são realizadas com as seguintes três espécies de feixes:
Raios-X Por ser muito simples a produção, detecção e manipulação (focagem, deflexão, etc.) de feixes
de radiação electromagnética, este tipo de radiação é o mais frequentemente escolhido para
experiências de difracção. A radiação interage principalmente com as nuvens electrónicas
dos sólidos, e portanto a sua utilização permite a determinação da distribuição electrónica
e, a partir daı́, da estrutura cristalográfica e de outras propriedades relevantes dos sólidos.
(f) Recordemos
que a intensidade de uma onda é proporcional ao quadrado da sua amplitude.
razão de ser desta designação é fácil de compreender. Consideremos o processo de dispersão como uma
colisão entre fotões e um objecto imóvel. Na linguagem tradicionalmente usada nos problemas de colisões, dizemos
que os fotões que constituem a radiação incidente são os fotões antes da colisão, os fotões da rdiação dispersada
são os fotões após a colisão. A energia cinética dos foões é proporcional à frequência da radiação (de acordo com
a lei de Plank) que, por seu turno, é proporcional ao seu comprimento de onda. Assim, se o comprimento de onda
da radiação incidente é igual ao da radiação dispersada, a energia cinética dos fotões antes e depois da colisão é
a mesma. Como o objecto exposto está imóvel, verifica-se conservação da energia cinética, logo, trata-se de uma
colisão elástica.
(g) A
3.3. A CONDIÇÃO DE LAUE
37
Nas experiências de difracção com cristais, usa-se radiação electromagnética na região do
espectro dos raios-X, por ser a que apresenta os comprimentos de onda na gama apropriada.
Electrões Podem também usar-se feixes corpusculares, já que, de acordo com a Mecânica Quântica,
estes evidenciam também comportamentos ondulatórios. Os electrões, por serem partı́culas
carregadas e extremamente leves, sofrem muito fortemente a interacção com a matéria; assim,
os feixes de electrões não têm um grande poder de penetração nos sólidos e, por esta razão,
são usados apenas no estudo das suas superfı́cies. Os electrões devem estar animados com
uma energia cinética de cerca de 150 eV(h) para que o comprimento de onda da sua função
de onda quântica seja comparável com as distâncias interatómicas vulgares nos cristais.
Neutrões Estas partı́culas, ao contrário dos electrões, têm um grande poder de penetração nos sólidos,
por serem mais pesadas e também por serem electricamente neutras. Apesar da sua neutralidade eléctrica, os neutrões apresentam momento magnético não nulo e por isso sofrem
interacções electromagnéticas, principalmente com os electrões responsáveis pelas propriedades magnéticas do meio em que se encontram. Estas interacções não são “mascaradas” pelas
forças coulombianas, que seriam dominantes se se usassem feixes de partı́culas carregadas,
como protões. Por esta razão, os feixes de neutrões são particularmente indicados no estudo
da distribuição do momento magnético no interior dos sólidos. A energia do feixe com que
as experiências devem ser conduzidas é de cerca de 0,1 eV.
As funções usadas para descrever as ondas nos processos de composição e de interferência são, no
caso dos raios-X, o campo electromagnético, ao passo que, no dos feixes corpusculares, é a função
de onda das partı́culas que os constituem. No entanto, a intensidade medida pelos detectores é
proporcional ao quadrado do módulo do campo electromagnético (no caso dos raios-X), ou da
função de onda (no caso dos feixes de electrões ou de neutrões).
3.3
A condição de Laue
Um cristal, conforme já foi muitas vezes dito, consiste num conjunto de objectos microscópicos
idênticos (são as ocorrências do motivo do cristal) colocados, regularmente, nos pontos de uma
rede de Bravais, que, quando neles incide radiação, a reemitem em todas as direcções. São então
observadas fortes intensidades de difracção nas direcções em que a radiação reemitida por todos
estes objectos interfere construtivamente. Consideremos dois destes centros dispersores, separados
k^
δ1
^
k’
R
δ2
Figura 3.2: Dispersão elástica de radiação por duas células unitárias de um cristal.
~ Neles incide radiação com comprimento de onda λ, segundo a direcção
por um vector de rede R.
definida pelo versor k̂ (ver a Figura 3.2). Para que numa direcção definida pelo versor k̂ 0 se verifique
interferência construtiva, é necessário que a diferença entre os comprimentos dos caminhos ópticos
seguidos pelos raios que incidem em cada um dos dois centros dispersores considerados seja igual
a um múltiplo inteiro do comprimento de onda da radiação. A distância que corresponde a esta
(h) 1 eV é a energia cinética adquirida por um electrão acelerado por uma diferença de potencial de 1V, ou seja
1eV' 1.6 × 10−19 J.
38
diferença está realçada na Figura 3.2, sendo dada por δ1 + δ2 . Mas
δ1
=
δ2
=
~ · k̂
R
~ · k̂ 0 ,
−R
(3.3)
(3.4)
de forma que a condição para a interferência construtiva é
~ · (k̂ − k̂ 0 ) = nλ,
R
(3.5)
onde n é um número inteiro qualquer. Multiplicando a Eq. (3.5) por 2π/λ e notando que ~k = 2π k̂/λ
é o vector de onda da radiação incidente(i) , resulta
~ · (~k − k~0 ) = 2nπ.
R
(3.6)
Esta é a condição para que a radiação reemitida pelas duas células unitárias representadas na
Figura 3.2 interfira construtivamente na direcção do vector k~0 . Claro que, se considerarmos agora
todo o cristal e não somente duas células unitárias, obtemos uma condição semelhante a (3.6),
~
mas que tem que se verificar para todos os vectores da rede cristalina R:
~ · (~k − k~0 ) = 2nπ,
R
~ ∈ rede cristalina.
n ∈ N, ∀R
(3.7)
~ = (~k − k~0 ) que satisfazem
Esta é a condição de Laue para a difracção. O conjunto dos vectores G
a Eq. 3.7 é muito reduzido. Vamos provar que estes vectores formam também uma rede, que não
~ Começamos por definir os vectores(j)
é a rede formada pelos vectores R.
~
A
~
B
~
C
~b × ~c
~a · (~b × ~c)
~c × ~a
= 2π
~a · (~b × ~c)
= 2π
= 2π
~a × ~b
~a · (~b × ~c)
(3.8a)
(3.8b)
(3.8c)
onde ~a, ~b e ~c são os vectores fundamentais do cristal em estudo (ou seja, da rede definida pelos
~ É possı́vel provar que, se ~a, ~b, ~c não forem co-planares, então A,
~ B,
~ C
~ também não o
vectores R).
são (o leitor é aconselhado a tentar fazer esta demonstração). Assim, eles podem ser vistos como
os vectores fundamentais de uma nova rede tridimensional de pontos, chamada rede recı́proca, que
desempenha um papel importante em diferentes tópicos da Fı́sica do Estado Sólido (veremos já a
seguir a sua importância no estudo da difracção de radiação). Para melhor distinguir os conceitos,
chamamos por vezes rede directa à rede cristalina propriamente dita, gerada pelos vectores ~a, ~b e
~c.
Os vectores fundamentais da rede recı́proca formam produtos escalares muito simples com os
~ · ~a:
vectores fundamentais da rede directa. Por exemplo, tomemos o produto A
~ · ~a =
A
=
2π ~
b × ~c · ~a
τ
2π,
uma vez que o produto misto ~b × ~c · ~a é igual ao volume, τ , da célula unitária da rede directa. De
igual maneira se verifica que
~ · ~b = C
~ · ~c = 2π.
B
~ · ~b:
Consideremos agora o produto escalar A
~ · ~b = 2π ~b × ~c · ~b.
A
τ
da mesma maneira o vector de onda da radiação difractada ~k0 = 2πn̂0 /λ.
~ hkl = hA
~ + kB
~ + lC.
~
que, usando estas definições, a Eq. (2.13) na Secção 2.6 pode reescrever-se como G
(i) Define-se
(j) Note-se
3.4. A LEI DE BRAGG
39
Este resultado é nulo, porque o produto vectorial ~b × ~c é perpendicular a ~b, logo, o seu produto
escalar com este vector anula-se. Vemos assim que
~ · ~b = A
~ · ~c = B
~ · ~a = B
~ · ~c = C
~ · ~a = C
~ · ~b = 0.
A
~ B
~ e C
~ não são colineares, podem servir como base do espaço.
Uma vez que os vectores A,
Assim, podemos concerteza escrever
~ = xA
~ + yB
~ + z C,
~
G
(3.9)
onde x, y, z são três números adimensionais, não necessariamente inteiros, que são as componentes
~ nesta base. Por outro lado, como R
~ é um vector da rede cristalina, pode escrever-se como
de G
uma combinação linear inteira dos vectores ~a, ~b, ~c,
~ = h~a + k~b + l~c,
R
(3.10)
com h, k, l inteiros. Vejamos quais os valores que x, y, z podem tomar para que se verifique
~ ·G
~ = 2nπ, de acordo com (3.7). De acordo com as expressões que já apresentámos para os
R
produtos escalares dos vectores fundamentais da rede recı́proca e da rede directa, temos
³
´ ³
´
~ ·G
~ =
~ + yB
~ + zC
~
R
h~a + k~b + l~c · xA
= 2π (xh + yk + zl) .
(3.11)
Para que se verifique a condição de Laue, é necessário que a soma dentro dos parêntesis na
Eq. (3.11) seja um número inteiro, quaisquer que sejam os inteiros h, k, l. Isto só é possı́vel
~ = (~k− k~0 )
(quaisquer que sejam h, k, l) se x, y e z forem também inteiros. O conjunto de vectores G
que satisfaz a condição de Laue é pois da forma
~ = pA
~ + qB
~ + rC,
~
G
(3.12)
com p, q, r inteiros, ou seja, é formado pelas combinações lineares inteiras dos vectores fundamentais da rede recı́proca. Voltando agora à condição de Laue, podemos agora enunciá-la da seguinte
forma:
Pode ocorrer interferência construtiva (e portanto difracção) se a variação no vector
~ = k~0 − ~k, for um vector da rede recı́proca.
de onda da radiação G
Note-se que a condição de Laue é uma condição apenas necessária, não suficiente, para a
difracção. Se o motivo cristalino não for trivial (isto é, se contiver mais do que um átomo por
célula unitária), verificam-se processos de interferência no interior de cada célula unitária primitiva,
que podem impedir a difracção numa dada direcção, mesmo que a condição de Laue (que diz
respeito apenas à interferência entre diferentes células unitárias primitivas) a permita. Mais à
frente abordaremos este assunto.
3.4
A lei de Bragg
Como acabámos de ver, de acordo com a condição de Laue, para se dar difracção de radiação
numa dada direcção, é necessário que a variação do vector de onda da radiação seja um vector da
~ rst , isto é, que
rede recı́proca. Suponhamos que esta condição é satisfeita para o vector G
~ rst = rA
~ + sB
~ + tC,
~
∆~k = G
com r, s, t inteiros arbitrários.
Os três números inteiros r, s e t são totalmente arbitrários e podem, ou não, ter divisores comuns.
Sejam h, k e l três inteiros nas mesmas proporções, mas sem divisores comuns. Então
r
s
=
=
t =
nh
nk
nl,
40
onde n é o maior divisor comum dos três inteiros r, s e t. Podemos então escrever a condição de
Laue acima como
~ hkl .
∆~k = nG
(hkl)
k
θ
k
θ
k’
k - k’=Ghkl
Nós tı́nhamos já encontrado os vectores da rede recı́proca, antes deste
estudo da difracção de radiação, quando deduzimos a expressão da
distância interplanar. Vimos, nessa altura, que o vector da rede
~ hkl é perpendicular à famı́lia de planos cristalinos com
recı́proca G
ı́ndices de Miller (hkl). Na figura junta, representa-se a disposição
dos vários vectores envolvidos na Condição de Laue. A partir desta
figura, é evidente que
~ hkl k
nkG
sin θ =
,
2k~kk
ou seja,
2
2π
sin θ = nλ.
~ hkl k
kG
Mas, como vimos no capı́tulo anterior,
~ hkl k =
kG
2π
,
dhkl
onde dhkl é a distância interplanar da famı́lia de planos (hkl). Substituindo em cima, obtemos a
famosa Lei de Bragg,
2dhkl sin θ = nλ,
que é uma condição para a difracção equivalente à condição de Laue.
A lei de Bragg pode ser deduzida de forma alternativa, fazendo a suposição (nada fácil de
justificar) de que a difracção de radiação se faz por reflexão geométrica nos planos cristalinos.
A Figura 3.3 representa o trajecto óptico de dois raios-X paralelos que sofrem uma reflexão em
θ
θ
θθ
θ
l
l
d
θ
Figura 3.3: Reflexão de Bragg.
dois planos consecutivos de uma dada famı́lia de planos cristalinos, que fazem com a direcção dos
feixes um ângulo de θ. A diferença entre os caminhos percorridos pelos dois raios é 2l, ou seja,
2d sin θ, onde d é a distância interplanar. Para que haja interferência construtiva, esta diferença
deve conter um número inteiro, n, de comprimentos de onda, λ, da radiação envolvida no processo.
Assim, a condição para a existência de reflexão é
2d sin θ = nλ,
(3.13)
que é a lei de Bragg. Quando radiação de comprimento de onda bem definido incide num cristal,
somente as famı́lias de planos que apresentam uma distância interplanar e uma orientação relativamente à radiação incidente que satisfazem a lei de Bragg participam na reflexão de radiação.
Pode mesmo não haver reflexão (é até o caso mais frequente, para uma orientação fixa do cristal
e da fonte da radiação) se não houver nenhuma famı́lia de planos nestas condições. Neste caso, a
radiação incidente é totalmente absorvida pelo cristal.
3.5. MÉTODOS EXPERIMENTAIS
3.5
41
Métodos experimentais
Há basicamente três métodos para o estudo experimental da difracção: o de Laue, o do cristal
rotativo, e o do pó. No método de Laue, faz-se incidir raios-X com uma gama contı́nua de comprimentos de onda sobre um cristal imóvel (ver a Figura 3.4). O cristal difracta as componentes da
Cristal
Fonte de
raios−X
Écran
Figura 3.4: Método de Laue.
radiação incidente com comprimentos de onda para os quais existem no cristal famı́lias de planos
com distância interplanar capaz de satisfazer a lei de Bragg. Estas componentes irão, após a difracção, incidir num ecrã, usualmente uma placa fotográfica, ou um detector eletrónico de raios-X,
permitindo assim a análise. Os padrões de difracção consistem numa série de pontos, dispostos de
forma simétrica relativamente ao ponto onde a direcção da radiação incidente intersecta o plano
do écran.
Como já foi dito, ao se iluminar um cristal imóvel com radiação monocromática poderá não se
verificar qualquer difracção, por não haver no cristal nenhuma famı́lia de planos orientada de forma
a permitir a satisfação da lei de Bragg. Mas se se rodar o cristal durante a exposição à radiação,
verificar-se-ão várias difracções, cujo ângulo se altera bruscamente com a rotação do cristal. Cada
famı́lia de planos “espera pacientemente” o instante em que a sua orientação relativamente à
radiação incidente permita, nos termos da lei de Bragg, a sua participação na difracção. Este é o
processo usado no chamado método do cristal rotativo. O cristal roda no interior de um cilindro
Écran
Cristal
Fonte monocromática
de raios−X
ω
Figura 3.5: Método do cristal rotativo.
(ver a Figura 3.5) cujas paredes interiores estão revestidas com uma pelı́cula fotográfica. Um
orifı́cio na superfı́cie lateral do cilindro permite a entrada do feixe incidente.
No método do cristal rotativo, em cada instante, apenas algumas famı́lias de planos participa
no processo de difracção, que são aquelas que estão correctamente alinhadas, e que apresentam
uma distância interplanar capaz de satisfazer a lei de Bragg. Se, em vez de um único cristal,
42
dispusessemos de um grande número cristais na região de incidência do feixe, e cada cristal estivesse
orientado de maneira arbitrária, então, mesmo com a amostra fixa, qualquer famı́lia de planos teria,
nalgum cristal, a orientação correcta para satisfazer a lei de Bragg, podendo assim participar da
difracção. É nesta ideia que se baseia o chamado método do pó ou de Debye. Neste método, em
vez de se usar um cristal inteiro na amostra, usa-se um cristal fragmentado em pequenos grãos,
cada um dos quais funciona como um pequeno cristal(k) com as suas direcções privilegiadas de
difracção (ver a Figura 3.6).
película
fotográfica
os
no
sX
mo
c
ati
rom
c
amostra
io
Ra
-180°
-90°
0°
90°
180°
Figura 3.6: Esquema da montagem usada no método do pó e aspecto da pelı́cula após revelação.
3.6
Factor de estrutura
A condição de Laue impõe, como vimos, que a radiação difractada por pontos equivalentes do
cristal (isto é, pontos separados por vectores da rede cristalina) interfira construtivamente. Assim
sendo, não se consideram na descrição de Laue fenómenos de interferência entre centros dispersores
a distâncias inferiores às que separam os pontos da rede cristalina e, em particular, não se descreve
a interferência entre átomos diferentes no interior de cada instância do motivo cristalino. Pode pois
dizer-se com propriedade que a análise de Laue é uma aproximação, na qual o motivo cristalino
é encarado como um centro dispersor pontual. Desta maneira afastam-se da teoria os processos
de interferência internos ao motivo, processos esses que podem eventualmente proibir a difracção
segundo algumas das direcções permitidas pela lei de Laue. É esta a razão que nos levou a afirmar
que a condição de Laue é apenas uma condição necessária, mas não suficiente, para a difracção de
radiação.
Devemos agora estudar os processos de interferência no interior de cada ocorrência do motivo
cristalino. Porque não nos preocupamos já com a interferência entre diferentes ocorrências do
motivo, vamos supôr a lei de Laue satisfeita à partida. Consideremos um cristal com um motivo
constituı́do por N átomos. Quando incide radiação (vamos imaginá-la monocromática, para simplificar a linguagem) no cristal, proveniente de uma fonte F (ver a figura junta) cada um dos seus
átomos funciona como fonte secundária de radiação, na forma de ondas esféricas com o mesmo com-
(k) É trivial verificar que um grão de areia com cerca de 0,01 mm de diâmetro contém cerca de 1018 átomos,
podendo pois ser ainda considerado um cristal macroscópico.
3.6. FACTOR DE ESTRUTURA
43
primento de onda da radiação incidente. Por exemplo, o j-ésimo átomo do motivo é fonte de radiação
com função de onda que, na posição, ~r, do detector
D, é dada por [ver a Eq. (3.2)]
C
k
F
k’
Rj
O
r
D
ψj (~r, t) =
0
Aj
~
ei(k k~r−Rj k−ωt) ,
~ jk
k~r − R
~ j é o seu vector posição e k 0
onde Aj é a amplitude da radiação difractada pelo j-ésimo átomo, R
é o módulo do vector de onda da radiação difractada. A amplitude da radiação difractada por
cada átomo é proporcional à amplitude da radiação nele incidente e a um factor, chamado factor
de forma atómico que traduz a maior ou menor capacidade difractante de cada átomo e que pode
ser escrito como função da variação do vector de onda, ∆~k = ~k − ~k 0 . Uma vez que a fonte de
radiação está a uma distância do cristal muito superior às dimensões lineares do motivo, podemos
supôr que a radiação incidente é uma onda plana, podemos tomar
~ ~
Aj = fj (∆~k)eik·Rj ,
ou seja, escrever a radiação difractada pelo j-ésimo átomo como
ψj (~r, t) =
1
~ ~
~ jk
k~r − R
0
~
fj (∆~k) eik·Rj ei(k k~r−Rj k−ωt) .
(3.14)
~ j e ~k 0 são paralelos, de forma que
Note-se agora que os vectores ~r − R
~ j k = ~k 0 · (~r − R
~ j ).
k 0 k~r − R
~ j k, é praticamente
Por outro lado, a distância que separa os vários átomos do detector, k~r − R
constante, de modo que podemos, no denominador da Eq. (3.14), substitui-la pela pelo valor médio
dessa distância(l) , que vamos representar por d. A função de onda da radiação difractada pelo
j-ésimo átomo que chega ao detector é, então,
ψj (~r, t) =
=
1
~ ~
~0
~
f (∆~k) eik·Rj ei(k ·(~r−Rj )−ωt)
d
1 i(~k0 ·~r−ωt)
~ ~
e
fj (∆~k) ei∆k·Rj
d
Por fim, a radiação detectada é a soma das difractadas por cada átomo, ou seja,
ψ(r, t) =
N
1 i(~k0 ·~r−ωt) X
~ ~
e
fj (∆~k) ei∆k·Rj .
d
j=1
Ao somatório no termo do lado direito desta equação dá-se o nome de factor de estrutura. Quanto
maior for o módulo do factor de estrutura, mais intensa é a difracção da radiação pelo cristal. Se o
factor de estrutura se anular para uma dada variação de vector de onda ∆~k, então não se verifica
a difracção de radiação na direcção correspondente, mesmo que a difracção seja permitida pelas
leis de Laue ou de Bragg.
Bibliografia
• J. R. Christman, ”Fundamentals of Solid State Physics”(1988), capı́tulo 4 (F5.0 257 e 258)
(l) Por
que razão não o podemos fazer também no argumento da exponencial?
44
• C. Kittel, ”Introduction to Solid State Physics”(1996), capı́tulo 2 (F5.0 82)
• N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulo 6 (F5.0 339)
PROBLEMAS
3.1 Prove que os volumes das células unitárias de uma dada rede (τ ) e da sua rede recı́proca (τ ∗ ) se
relacionam através de
(2π)3
τ∗ =
τ
3.2 Prove que a recı́proca da rede recı́proca de uma dada rede é esta rede.
3.3 Mostre que a rede recı́proca de uma rede cúbica de faces centradas é uma rede cúbica de corpo
centrado.
3.4 Qual é então a recı́proca de uma rede cúbica de corpo centrado?
3.5 Determine e classifique a rede recı́proca de cada uma das seguintes redes
(a) hexagonal;
(b) ortorrômbica;
(c) tetragonal.
3.6 Considere uma rede trigonal. Seja θ o ângulo entre os seus vectores fundamentais primitivos. Prove
que a rede recı́proca também é trigonal e que o ângulo θ∗ entre os seus vectores fundamentais
primitivos é dado por
cos θ
cos θ∗ = −
.
1 + cos θ
3.7 Determine os ângulos que a radiação difractada pode fazer com a incidente, numa experiência
de difracção de raios-X com comprimento de onda λ = 1, 04 Å, incidindo numa rede rede cúbica
simples, com parâmetro a = 4, 0 Å.
3.8 Numa experiência de difracção, onde raios-X com comprimento de onda λ = 1, 0 Å incidem sobre
um cristal monoatómico com rede cúbica simples, o primeiro máximo de difracção faz com a
direcção da radiação incidente um ângulo θ = 16, 4◦ . Determine o valor do parâmetro a da rede
cristalina.
3.9 (*) Determine o factor de estrutura de uma rede cúbica de corpo centrado e de uma rede cúbica
de faces centradas, associando a cada ponto de rede numa célula unitária convencional um factor
de forma “atómico”.
3.10 (*) Construa uma tabela onde apresente os ângulos de difração de radiação por uma rede cúbica
simples, ordenados de forma crescente. Indique na tabela quais os máximos que não são observados
em experiências de difracção com redes cúbicas de corpo centrado e de faces centradas.
3.11 (*) Suponha que dois átomos da base de uma estrutura “zinc blende”têm factores de forma
atómico =a e =b , respectivamente.
(a) Obtenha uma expressão para o factor de estrutura em função dos ı́ndices (hkl) duma rede
cúbica simples.
(b) Mostre que o factor de estrutura, F , é
0
se h, k e l não forem simultaneamente números pares
ou ı́mpares,
4(=a + =b )
se h + k + l = 4n,
4(=a − i=b ) se h + k + l = 4n + 1,
4(=a − =b )
se h + k + l = 4n + 2,
4(=a + i=b ) se h + k + l = 4n + 3,
onde n é um número inteiro qualquer.
3. Problemas
45
3.12 (*) Determine a expressão para o factor de estrutura F associado a uma estrutura hexagonal
compacta ideal, usando os ı́ndices da estrutura primitiva. Suponha que os dois átomos da base
têm o mesmo factor de forma atómico, =, independente de ∆~k e classifique por ordem crescente
de intensidade os picos de difracção associados aos planos: (100), (110), (111), (1̄11), (210) e
(211).
3.13 Um cristal tetragonal é preparado para uma experiência de difracção usando o método de Debye
com um comprimento de onda de raios-X de λ = 1, 54 Å. A célula convencional tem uma base
quadrada de a = 3, 20 Å e altura c = 4, 63 Å.
(a) Determine os três primeiros ângulos de difracção.
(b) (*) Se a base consiste num átomo de um tipo no centro da célula e um outro diferente num
dos vértices, classifique por ordem de intensidades os picos de difracção relativos ao ângulos
da alı́nea anterior. Assuma que ambos factores de forma atómicos são reais e têm o mesmo
sinal.
3.14 Partindo da condição de Laue para a difracção, prove que:
¯ ¯
~k · G
~ ¯2 .
~ = − 1 ¯G
2
Capı́tulo 4
A capacidade térmica dos sólidos
Nos capı́tulos anteriores foi apresentado um modelo dos sólidos cristalinos segundo o qual os
átomos que os formam encontram-se em repouso nas posições determinadas pela rede e motivo
cristalinos. No entanto, esta suposição da imobilidade é uma simplificação grosseira da realidade
que apresenta, entre outros, os seguintes inconvenientes:
• A temperatura de um objecto pode ser encarada como uma medida da energia cinética
associada ao movimento microscópio dos átomos que o constituem. Supondo os átomos em
repouso esta associação é impossı́vel.
• O som consiste em ondas mecânicas, isto é, variações infinitesimais na posição dos átomos
que se transmitem aos átomos vizinhos, propagando-se desta forma nos meios materiais.
Aceitando a hipótese da imobilidade dos átomos nos sólidos cristalinos, estes deveriam ser
isoladores sonoros, o que claramente, não se verifica.
• O argumento anterior aplica-se também à condução de calor.
Muitos outros argumentos desta natureza poderiam ainda ser apresentados (ver, por exemplo, o
Cap. 21 do Ashcroft & Mermin).
Neste capı́tulo, vamos melhorar este modelo dos sólidos, abandonando a hipótese da imobilidade
atómica. Na nova descrição dos sólidos, considera-se que as posições definidas pela sua estrutura
microscópica são as posições de equilı́brio dos átomos que lhes correspondem, mas supõe-se que são
possı́veis pequenos deslocamentos dessas posições, que são contrariados pelas forças interatómicas
responsáveis pela coesão do sólido.
4.1
A aproximação harmónica
A interacção de cada átomo com os restantes átomos num sólido manifesta-se na forma de uma
energia potencial φ(~r), que apresenta um valor mı́nimo quando esse átomo se encontra na sua
~ desta
posição de equilı́brio (ver a Figura 4.1). Considerando pequenos deslocamentos δ~r = ~r − R
posição, podemos aproximar a energia potencial pelo seu desenvolvimento de Taylor de segunda
ordem
· 2 ¸
3
X
∂ φ
~ + δ~r · [∇φ(~r)] ~ + 1
φ(~r) ' φ(R)
δx
δxj .
(4.1)
i
R
2! i,j=1
∂xi ∂xj R~
O primeiro termo, de ordem zero em δ~r, é uma constante, e como tal não desempenha qualquer
papel na dinâmica do sólido; representa a contribuição do átomo considerado para a energia de
ligação do sólido. O termo de primeira ordem é nulo, uma vez que é proporcional ao gradiente
da energia potencial do átomo, calculado na sua posição de equilı́brio, onde a energia potencial
47
48
CAPÍTULO 4. A CAPACIDADE TÉRMICA DOS SÓLIDOS
φ
x
X
Figura 4.1: A energia potencial de um átomo de um sólido é mı́nima na sua posição de equilı́brio.
apresenta um valor mı́nimo. Finalmente, o termo de segunda ordem pode ser escrito como
(2)
φ
(~r) =
=
· 2 ¸
3
1 X
∂ φ
δxj
δxi
2! i,j=1
∂xi ∂xj R~
3
1 X
δxi Kij δxj ,
2 i,j=1
com
·
Kij =
∂2φ
∂xi ∂xj
(4.2)
¸
~
R
A Eq. (4.2) é a expressão mais geral para a energia potencial num oscilador harmónico tridimensional. Mas note-se que, como Kij é uma matriz simétrica, é possı́vel escolher um sistema
de coordenadas x0 y 0 z 0 no qual a matriz K é diagonal. Usando esse sistema de coordenadas, o
termo de segunda ordem na energia potencial fica
φ(2) (~r) =
1
1
1
Kxx (δx0 )2 + Kyy (δy 0 )2 + Kzz (δz 0 )2 ,
2
2
2
que representa a energia total de um sistema de três osciladores harmónicos independentes, com
constantes elásticas Kxx , Kyy e Kzz . Assim, se limitarmos o nosso estudo às vibrações de pequena amplitude, podemos tratar as interacções entre os átomos como interacções elásticas, o que
permite, como veremos, grandes simplificações.
4.2
Elementos da teoria das probabilidades
Há experiências sobre as quais não podemos prever o resultado. Por exemplo, não sabemos
antecipadamente que valor “sairá” no lançamento de um dado, nem se irá chover depois de amanhã.
Estas experiências chamam-se experiências aleatórias. Os resultados das experiências aleatórias
não são prédeterminados mas, muitas vezes, não são igualmente “esperáveis,” isto é, ficamos mais
surpreendidos com uns resultados do que com outros. Quando atiramos uma moeda ao chão,
esperamos que ela fique com uma, ou com a outra, face virada para cima, não esperamos que ela
fique equilibrada sobre o seu bordo circular; quando uma folha se solta da árvore a que pertence,
num dia de outono com pouco vento, é difı́cil prever a que distância atingirá o solo, mas esperamos
que ela caia na vizinhança da árvore.
Porque é que achamos alguns resultados de uma experiência aleatória mais “esperáveis” do
que outros? Porque, se repetirmos muitas vezes essa experiência, alguns resultados ocorrem mais
frequentemente do que outros: as moedas caem quase sempre com uma ou outra face virada para
cima, quase nunca ficam equilibradas sobre o seu bordo; as folhas que caem das árvores em dias de
4.2. ELEMENTOS DA TEORIA DAS PROBABILIDADES
49
outono sem vento ficam quase todas perto das árvores a que pertenciam, quase nunca se afastam
para muito longe.
4.2.1
Variáveis aleatórias discretas
Numa série de repetições de uma experiência aleatória, o número de vezes que um resultado
particular ocorre chama-se frequência absoluta desse resultado. Chama-se frequência relativa de
um resultado ao quociente entre a frequência absoluta de um resultado e o número de vezes que
se repetiu a experiência. Como é óbvio, a soma dos valores das frequências absolutas dos vários
resultados numa série de repetições de uma experiênca aleatória deve ser igual ao número de
repetições. Pela mesma razão,as frequências relativas dos vários resultados são todas menores do
que 1 e a sua soma deve ser igual a 1.
Consideremos um exemplo. Suponhamos que estudamos o lançamento simultâneo de dois
dados. O resultado desta experiência aleatória é um número inteiro compreendido ente 2 e 12
(inclusive). Suponhamos que repetimos cinco vezes esta experiência e obtemos os valores 5, 10, 7,
7, 11. As frequências absolutas dos resultados desta série de repetições desta experiência aleatória
são
r
F (r)
2
0
3
0
4
0
5
1
6
0
7
2
8
0
9
1
10
0
11
1
12
0
As frequências relativas são as frequências absolutas divididas pelo número de repetições da experiência, ou seja, neste caso, 5:
r
f (r)
2
0
3
0
4
0
5
0,2
6
0
7
0,4
8
0
9
0,2
10
0
11
0,2
12
0
Note-se que as somas dos valores das frequências absolutas e das frequências relativas valem,
respectivamente, 5 e 1, como já esperávamos. Note-se também que, dada a natureza aleatória desta
experiência, outra série de 5 repetições produziria, em princı́pio, outros resultados e, portanto,
outros valores para as frequências dos resultados.
Quando aumentamos muito o número de repetições de uma experiência aleatória, constatamos
o emergir de uma certa “ordem no caos,” que se manifesta na Lei dos grandes números:
As frequências relativas dos resultados de uma experiência aleatória tendem para valores bem determinados à medida que o número de repetições tende para infinito.
Voltando ao exemplo que temos vindo a considerar, na Figura 4.2 mostra-se um gráfico onde
se representam os valores das frequências relativas dos vários resultados numa série de 50 000
lançamentos de dois dados, como função do número de lançamentos. Como se pode ver, as
frequências sofrem grandes oscilações no inı́cio de uma série de repetições mas, à medida que o
número de repetições aumenta, estacionam em valores bem determinados.
Os limites para que tendem as frequências dos resultados de uma experiência aleatória, quando
o número de repetições tende para infinito chamam-se as probabilidades desses resultados. Dada
a definição de probabilidade que apresentámos, as probabilidades devem ser sempre menores do
que 1 e a soma das probabilidades de todos os resultados possı́veis de uma experiência aleatória
deve ser igual a um.
No caso do lançamento de dois dados, as probabilidades são as da tabela em baixo.
r
f (r)
2
0,028
3
0,056
4
0,083
5
0,111
6
0,139
7
0,167
8
0,139
9
0,111
10
0,083
11
0,056
12
0,028
Quando repetimos muitas vezes uma experiência aleatória, esperamos que o número de vezes,
ni , que um resultado particular xi com probabilidade pi ocorre seja dado por
ni = npi ,
50
0.2
r=7
fn(r)
r = 6; 8
r = 5; 9
0.1
r = 4; 10
r = 3; 11
r = 2; 12
0
0
10
20
30
40
50
n /1000
Figura 4.2: Evolução das frequências relativas, fn (r), do resultado do lançamento de dois dados
como função do número de lançamentos, n (em milhares).
onde n é o número de repetições. Esta expressão resulta directamente da definição de probabilidade. Claro que, uma vez que se trata de uma experiência aleatória, esta igualdade não se verifica
exactamente, qualquer que seja o valor (finito) de n; à medida que n aumenta, as diferenças entre
as frequências absolutas dos vários resultados e os seus valores esperados, dados pela igualdade
acima, vai diminuindo, em termos relativos. Só no limite n → ∞ passamos a ter uma igualdade
exacta.
Consideremos agora uma experiência aleatória cujo resultado é um número pertencente ao
conjunto Ω = {X1 , X2 , . . . , XR }, onde R, não necessariamente finito, é o número de resultados
possı́veis(a) . Suponhamos que repetimos esta experiência aleatória muitas (digamos, n) vezes,
obtendo os valores x1 , x2 , . . . , xn , e queremos agora calcular o valor médio dos resultados obtidos.
Obviamente, temos
n
x̄ =
1X
xi .
n i=1
Mas os resultados que obtivemos na repetição desta experiência, os números x1 , x2 , . . . , xn , pertencem todos ao conjunto dos resultados possı́veis Ω. Entre os resultados obtidos, alguns (digamos,
n1 ) serão iguais ao resultado possı́vel X1 , outros (digamos, n2 ) serão iguais ao resultado possı́vel
X2 , e assim sucessivamente. Podemos então escrever a expressão para o cálculo do valor médio
como
R
x̄ =
1X
nk Xk .
n
k=1
No limite em que o número de repetições da experiência aleatória tende para infinito, as razões
nk /n tendem para as probabilidades, pk de cada resultado. Nesse limite, obtemos o chamado valor
expectável da variável aleatória X:
hXi =
R
X
pk Xk .
k=1
(a) Por exemplo, no lançamento de dois dados, o resultado é um inteiro do conjunto {2, 3, . . . , 12}. O valor ded R
é, aqui, 11.
4.2. ELEMENTOS DA TEORIA DAS PROBABILIDADES
7
6.5
r
Na figura ao lado podemos ver como evolui o valor médio
do resultado do lançamento de 2 dados, como função do
número de repetições. É bem evidente que se aproxima do
valor expectável, 7.
O valor expectável de uma variável aleatória representa
o seu centro de dispersão. Igualmente interessante é a amplitude dessa dispersão. Para avaliar a amplitude da dispersão dos valores de uma variável aleatória, define-se a
variância, que é o valor expectável dos quadrados dos desvios relativamente ao valor expectável da variável. Isto é,
tomando a sequência particular de resultados x1 , x2 , . . . que
usámos acima, definimos
51
6
5.5
0
10
20
30
n / 1000
40
50
n
s2 =
1X
2
(xi − hXi) ,
n i=1
que, quando n tende para infinito, tende para a variância da variável aleatória,
σ 2 (X) =
R
X
pk (Xk − hXi)2 .
k=1
Os detalhes do cálculo que nos trazem a esta expressão a partir da de s2 são em tudo semelhantes
ao que permitem deduzir a expressão do valor expectável da variável aleatória a partir do valor
médio de uma amostra muito grande de valores dessa variável.
4.2.2
Variáveis aleatórias contı́nuas
Quando o resultado de uma experiência aleatória é um número real (por exemplo, a distância a
que uma folha fica, quando atinge o solo, da árvore de que se soltou) o cálculo das frequêcias
dos resultados é mais complicado, porque é muito, muito difı́cil que ocorram dois resultados
exactamente iguais. Duas folhas que se soltam da mesma árvore não ficam exactamente à mesma
distância da árvore; posso apostar que não encontramos, na nossa cabeça, dois cabelos de igual
comprimento, se os avaliarmos com medições rigorosas. O que se faz nestes casos é dividir o
intervalo de reultados em subintervalos, ou classes. Se X fôr a variável aleatória estudada, e
I = [Xi , Xf ] o intervalo em que os valores de X estão definidos, definimos uma partição de I
em subintervalos disjuntos I1 , I2 , . . . , que, todos reunidos, definem I e consideramos a variável
discreta “classe a que pertence o resultado de X”. Usando o exemplo do comprimento dos cabelos,
poderı́amos definir a classe dos cabelos com comprimento no intervalo I1 = [2,0 cm, 2,5 cm[, a dos
do intervalo I2 = [2,5 cm, 3,0 cm[, etc. Podemos agora falar então da frequência da classe I1 ,
da da classe I2 etc. As probabilidades das classes são os limites das frequências relativas dessas
classes. Podemos ainda calcular a probabilidade por unidade de largura da classe. No limite
em que essa largura tende para zero, obtemos a chamada função de densidade de probabilidade,
f (x). O significado desta função é que a probabilidade da variável aleatória X tomar um valor
compreendido entre x e x + dx é
dp = f (x)dx.
O valor expectável de uma variável aleatória contı́nua calcula-se com uma generalização óbvia da
expressão usada no caso das variáveis discretas, a saber
Z
hXi = dx, f (x)x,
I
onde o integral é extendido ao intervalo de valores possı́veis para X. A variância, por seu turno,
fica, neste caso,
Z
2
σ = dx f (x)(x − hXi)2 .
I
52
4.3
A lei de Dulong e Petit
A capacidade térmica molar de uma substância é o calor necessário para elevar a temperatura de
uma mole dessa substância em 1◦ C. Se o processo de aquecimento for feito a volume constante, o
trabalho realizado é nulo, e portanto o calor fornecido ao sistema é igual à sua variação de energia
dE. Assim, a capacidade térmica a volume constante é definida como
¶
µ
∂E
,
(4.3)
Cv =
∂T V
A capacidade térmica dos sólidos apresenta uma dependência da temperatura caracterı́stica, representada na Figura 4.3. CV anula-se no zero absoluto de temperatura (0◦ K≈ −273◦ C) apreC
V
3R
αT3
0
T
Figura 4.3: Capacidade térmica dos sólidos como função da temperatura.
sentando, para valores baixos de temperatura uma proporcionalidade ao cubo da temperatura,
CV ∝ T 3 ; para valores altos de T , a capacidade térmica é praticamente constante e igual a 3R(b) ,
para todos os sólidos. A esta constância da capacidade térmica a altas temperaturas dá-se o nome
de Lei de Dulong e Petit. Vamos de seguida tentar explicar este comportamento da capacidade
térmica, por aproximações sucessivas.
4.3.1
Modelo Clássico
De acordo com o modelo que temos vindo a desenvolver, um sólido consiste num conjunto de
átomos que podem oscilar em torno de posições de equilı́brio fixas nas posições que definem a
sua estrutura cristalina. Aceitando que estes deslocamentos são pequenos, vimos já que podemos
considerar cada átomo sujeito a forças elásticas.
Note-se que, para além de átomos “presos” às suas posições de equilı́brio, os sólidos podem
também conter electrões práticamente livres no seu interior, de acordo com o modelo clássico dos
metais. Esta possibilidade introduz um termo adicional na análise que vamos agora desenvolver,
que não será tomada em linha de conta. Assim, o que se segue é válido apenas para sólidos
isoladores, e o problema da capacidade térmica dos condutores será abordado mais adiante, no
próximo capı́tulo destes apontamentos.
Consideremos, então, cada átomo como um oscilador harmónico tridimensional. É bem sabido
que um oscilador harmónico tridimensional se pode descrever como a reunião de três osciladores
unidimensionais independentes. Podemos então, em resumo, tratar um sólido com N átomos como
um conjunto de 3N osciladores harmónicos unidimensionais. Considerando o sólido em equilı́brio
(b) R é a constante dos gases ideais, com o valor R = 8, 3144 J/K mol. É igual ao produto da constante de
Boltzmann, kB , com o número de Avogrado, NA , isto é, R = kNA .
4.3. A LEI DE DULONG E PETIT
53
termodinâmico, todos estes osciladores devem ter a mesma energia média hεi. A energia total do
sólido é então
E = 3N hεi.
(4.4)
A energia de cada oscilador, ε, pode ser calculada recorrendo à fı́sica estatı́stica. A probabilidade
de que um oscilador harmónico unidimensional, em equilı́brio termodinâmico com um ambiente à
temperatura T , esteja num estado com energia compreendida entre os valores ε e ε + dε é dada
pela lei de Boltzmann:
− ε
dP (ε) = f (ε)dε = Ae kB T dε,
(4.5)
onde kB é a constante de Boltzmann(c) e A é uma constante de normalização, que deve ser ajustada
por forma a que a soma das probabilidades seja unitária:
Z
∞
dP (ε) = 1.
(4.6)
1
.
kB T
(4.7)
0
Daqui resulta
A=
Podemos identificar a energia de cada oscilador no sólido com o calor expectável da energia, ou
seja
Z
Z ∞
1
− ε
hεi = f (ε)εdε =
(4.8)
dε εe kB T .
kB T 0
Este integral é facilmente resolvido por partes, obtendo-se
hεi = kB T .
(4.9)
Substituindo este valor em (4.4), obtemos o valor total da energia do sólido:
E = 3N kB T .
(4.10)
Refira-se que este resultado poderia ter sido obtido de forma equivalente usando o Teorema da
Equipartição da Energia, de acordo com o qual cada termo quadrático na expressão da energia de
um sistema de muitas partı́culas idênticas contribui com kB T /2 para a energia média do sistema
em equilı́brio termodinâmico à temperatura T ; neste caso, em que cada partı́cula do sistema é um
oscilador harmónico tridimensional, temos, por cada uma, seis termos quadráticos na energia, três
para a energia potencial [k(x2 +y 2 +z 2 )/2] e outros três para a energia cinética [m(vx2 +vy2 +vz2 )/2],
ou seja, uma contribuição de 6 × kB T /2 = 3kB T para a energia média do sistema. Uma vez que
o número total de partı́culas é N , obtemos por multiplicação o resultado apresentado.
Derivando agora a energia em ordem à temperatura obtemos a capacidade térmica, de acordo
com a sua definição (4.3). Se considerarmos uma mole de átomos obtemos finalmente
CV = 3NA kB T = 3R.
(4.11)
que está de acordo com a lei de Dulong e Petit mas não reproduz os resultados experimentais a
baixas temperaturas. Este facto foi, durante algum tempo, argumento de peso contra a hipótese
atómica da matéria, até que, em 1907 Einstein propôs um tratamento diferente, em que as oscilações da rede cristalina são “quantizadas”, de forma semelhante à quantização do campo electromagnético efectuada por Plank no estudo da radiação do corpo negro. Em analogia com o
termo “fotão”que se refere aos quanta do campo electromagnético, designam-se por “fonões”os
quanta das oscilações mecânicas nos sólidos. Vamos de seguida seguir este formalismo.
(c) k
B
= 1, 381 × 10−23 J/K
54
4.3.2
Modelo de Einstein
Em 1900, Plank verificou que o espectro de radiação térmica emitida pelos chamados corpos negros
(corpos que absorvem toda a radiação electromagnética que neles incide) pode ser descrito com
exactidão supondo que, na interacção entre a matéria e o campo electromagnético, só pode haver
transferência de energia em quantidades múltiplas da unidade básica hν, onde h é a constante de
Plank(d) e ν é a frequência envolvida no processo.
Esta suposição era, na altura, completamente injustificável e foi considerada como um mero
truque de “engenharia algébrica”por toda a comunidade cientı́fica, incluindo o próprio Plank,
porque parecia indicar que a radiação electromagnética seria constituida por partı́culas. O debate
sobre a natureza da luz (ondas ou partı́culas) vinha desde os tempos de Newton (partidário da
Natureza corpuscular) e Huyghens (que apoiava a descrição ondulatória) e tinha, aparentemente,
sido resolvido, experimentalmente, já no século XVIII, pelos trabalhos de Young e de Fresnel, a
favor da hipótese ondulatória. O “truque”de Plank viria assim, caso fosse aceite como descrição
de algo real, a baralhar (de novo) as cartas. Por esta razão, os fı́sicos acreditavam que, mais
tarde ou mais cedo, um tratamento clássico do corpo negro seria elaborado, no qual a hipótese de
Plank não fosse necessária, ou surgisse devidamente justificada no contexto da teoria ondulatória
da radiação. Um dos poucos fı́sicos que não partilhavam esta opinião era Albert Einstein.
Segundo Einstein, a radiação electromagnética é de facto constituida por partı́culas chamadas
fotões com uma massa em repouso nula e com energia dada por hν, de acordo com a hipótese
de Plank. No entanto, o carácter ondulatório da luz não é eliminado, até porque na própria
expressão de energia, E = hν, está presente a frequência, ν, que é uma quantidade tipicamente
ondulatória. Einstein compatibilizou estes aspectos aparentemente contraditórios interpretando
estatisticamente o campo (ou função de onda) da radiação. Concretamente, Einstein propôs que
a intensidade (caracterı́stica ondulatória) da radiação numa região do espaço é proporcional ao
número de fotões nela presente.
Com esta descrição da radiação, Einstein explicou quantitativamente os resultados das experiências sobre o efeito fotoeléctrico em 1905. Apesar deste sucesso, continuou relativamente
isolado na defesa do carácter realista da hipótese de Plank, até ao ano 1922 em que Comptom
expôs os seus trabalhos sobre a dispersão de electrões pela radiação, “encerrando”a questão a favor
de Einstein. Para dar mais consistência à hipótese de Plank, Einstein tentou aplicá-la noutros
domı́nios, nomeadamente naquele que aqui mais nos interessa, o problema da capacidade térmica
dos sólidos.
Suponhamos que, tal como o campo electromagnético, também o campo dos deslocamentos
dos constituintes de um sólido está quantizado, no sentido em que as trocas de energia mecânicas
entre estes constituintes só são possı́veis em quantidades múltiplas de hν, onde ν é a frequência das
oscilações com que estão animados. Esta suposição parece indicar a existência de uma partı́cula à
qual se dá o nome de fonão que tem uma energia hν, e que é trocado entre os átomos do sólido,
aumentando ou diminuindo a energia das suas oscilações. De acordo com esta hipótese, a energia
mecânica de cada átomo já não pode ser considerada uma variável continua, antes tomando valores
de um conjunto discreto, distanciados entre si de h̄ω (e) (ver a Figura 4.4). O valor mı́nimo da
energia, representado na Figura 4.4 por ε0 , obtém-se facilmente através de uma resolução quântica
do oscilados harmónico (que continua a ser a nossa aproximação para os deslocamentos atómicos
no cristal) e é dado por ε0 = 21 h̄ω.
De que forma esta hipótese altera a descrição clássica do sólido? Vamos repetir o processo
que seguimos para o modelo clássico. Consideremos 3N osciladores independentes, em equilı́brio
termodinâmico à temperatura T . Supondo que todos estes osciladores têm a mesma frequência ω
e a mesma energia, que identificamos com o valor expectável da energia de um oscilador quântico.
A energia total do sólido é então, tal como em (4.4),
E = 3N hεi.
(d) h
= 6, 626 × 10−34 Js
= hν
(e) h̄ω
(4.12)
55
E
ε +nhw
o
ε +3hw
o
o
ε + hw
o
ε = 1 hw
o 2
ε +2hw
Figura 4.4: Nı́veis de energia de um oscilador quântico com frequência ω.
A diferença principal relativamente ao tratamento clássico consiste no cálculo da energia média hεi.
Como a variável ε é, nesta abordagem, discreta, este cálculo não pode ser levado a cabo usando a
Eq. (4.8). Continuando a aceitar a distribuição de probabilidade de Maxwell-Boltzmann, temos,
neste caso, que a probabilidade de um oscilador estar no nı́vel de energia εn ,
1
εn = (n + )h̄ω
2
é
P (εn ) = Be−βεn .
(4.13)
onde se introduzir a notação, usual em fı́sica estatı́stica, β = 1/kB T , e B é uma constante de
normalização escolhida de maneira a garantir que a soma de todas as probabilidades seja 1. A
constante B é então determinada impondo
∞
X
P (εn ) = 1,
(4.14)
Be−βεn = 1,
(4.15)
n=0
ou seja,
∞
X
n=0
e portanto
1
.
−βεn
n=0 e
B = P∞
(4.16)
O valor numérico desta constante não é um resultado particularmente interessante, mas pode
facimente ser determinado. Usando a expressão da energia, o somatório no denominador em (4.16)
pode ser escrito como
∞
∞
X
X
1
e−βεn = e− 2 βh̄ω
(e−βh̄ω )n ,
(4.17)
n=0
n=0
e o somatório no lado direito desta igualdade é uma série geométrica de razão
x = e−βh̄ω < 1 .
A série é pois convergente, e o seu valor é
∞
X
1
e−βεn =
n=0
e− 2 βh̄ω
.
1 − e−βh̄ω
(4.18)
Substituindo este resultado em (4.16), obtemos
"
1
e− 2 βh̄ω
B=
1 − e−βh̄ω
#−1
.
(4.19)
56
A probabilidade de se encontrar um oscilador quântico no n-ésimo nı́vel de energia εn é
e−βεn
P (εn ) = P∞ −βε .
n
n=0 e
(4.20)
e o valor médio da energia é calculado usando a definição de valor expectável de uma variável
aleatória
X
hεi =
P (εn )εn
(4.21)
n
[compare com (4.8)]. Substituindo aqui (4.20) obtemos
P∞ −βεn
εn
n=0 e
hεi = P
,
∞
−βεn
e
n=0
(4.22)
onde o denominador em (4.20) foi posto em evidência na soma em (4.21). Note-se que o lado
direito da Eq (4.22) é o simétrico da derivada em ordem a β, de
X
ln
e−βεn
e portanto escrevemos
∞
hεi = −
X
∂
ln
e−βεn ,
∂β n=0
(4.23)
e o somatório que serve de argumento ao logaritmo foi calculado em (4.18). Resulta então
Ã
!
1
e− 2 βh̄ω
∂
ln
hεi = −
∂β
1 − e−βh̄ω
·
¸
¡
¢
∂
1
−βh̄ω
= −
− βh̄ω − ln 1 − e
.
(4.24)
∂β
2
Efectuando a derivada em ordem a β, obtemos
hεi =
=
1
h̄ωe−βh̄ω
h̄ω +
2
1 − e−βh̄ω
h̄ω
1
h̄ω + βh̄ω
.
2
e
−1
A energia total do sólido é então segundo (4.12)
µ
¶
1
h̄ω
E = 3N
h̄ω + βh̄ω
2
e
−1
(4.25)
(4.26)
e a capacidade térmica obtém-se derivando esta igualdade em ordem à temperatura, eliminando-se
assim a constante 3N h̄ω/2,
¶
µ
∂E
CV =
∂T V
µ
¶
∂β ∂E
=
∂T ∂β V
=
3N
eβh̄ω
(h̄ω)2
2.
2
kB T
(eβh̄ω − 1)
(4.27)
É usual a introdução da chamada temperatura de Einstein, que é o factor constante definido por
θE =
h̄ω
,
kB
(4.28)
57
em termos da qual a capacidade térmica resulta
µ
CV = 3R
θE
T
¶2
e
³
e
θE
T
θE
T
´2 ,
(4.29)
−1
assumindo que o número de átomos N é igual ao número de Avogrado NA . A Figura 4.5 apresenta
o gráfico da capacidade térmica, dividido por 3R. É evidente que o comportamento desta função
C (T) /3R
V
1
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
2
2.5
T/ θ
E
Figura 4.5: A capacidade térmica dos sólidos no modelo de Einstein.
a altas temperaturas é o esperado
µ
¶
CV
−→ 1 ⇐⇒ (CV )T →∞ −→ 3R
3R T →∞
e que o limite para baixas temperaturas é também o correcto
CV T →0 −→ 0.
Podemos verificar estes resultados analiticamente. Quando T → ∞, θE /T → 0. O argumento
das exponenciais é então pequeno e podemos por isso substitui-las pelos seus desenvolvimentos em
série de Taylor, mantendo apenas os termos mais significativos. Isto é, podemos em (4.29) fazer a
substituição
θE
θE
e T '1+
,
T
para T elevado. Obtemos então
#
µ ¶2 "µ ¶2
θE
T
T
CV ' 3R
+
T
θE
θE
µ ¶
θE
' 3R + 3R
T
' 3R,
no limite quando T → ∞, de acordo com a lei de Dulong e Petit. No limite oposto, em que T → 0,
o argumento das exponenciais θE /T é muito grande, e também as exponenciais o são. Podemos
58
então desprezar, no denominador de (4.29), a unidade. Resulta então
µ
CV ' 3R
θE
T
¶2
e−
θE
T
.
(4.30)
À medida que T se aproxima de zero, θE /T cresce, e a exponencial tende para zero. A diminuição
do valor da exponencial “vence”o crescimento do termo (θE /T )2 e o limite do produto é zero, de
acordo com o gráfico na Figura 4.5.
De um ponto de vista mais fı́sico, a razão pela qual a capacidade térmica dos solidos se anula
para temperaturas muito baixas é que a energia que é fornecida a um sólido para elevar a sua
temperatura ligeiramente acima do zero absoluto não é suficiente para excitar os átomos para o
primeiro estado excitado de oscilação. Para tal, é necessário fornecer a um átomo uma energia
igual ou superior ao limiar h̄ω. Ora, a baixas temperaturas esta energia não está disponı́vel. Assim,
a temperatura do sólido pode aumentar ligeiramente, sem que a sua energia (isto é, a energia dos
átomos que o constituem) sofra qualquer variação apreciável, resultando, então, em valores muito
reduzidos para a sua capacidade térmica.
Estes resultados estão em melhor acordo com os dados experimentais, apoiando assim as ideias
quânticas de Einstein. No entanto, o comportamento da capacidade térmica para baixas temperaturas [expresso em (4.30)] não verifica a proporcionalidade, verificada experimentalmente, com
o cubo da temperatura.
A origem desta discrepância reside na suposição que os 3N osciladores têm a mesma frequência
ω, ou seja, que são independentes. Se incluirmos a possibilidade de correlação nos movimentos
dos osciladores, isto é, considerando modos colectivos de movimento, esta discrepância é resolvida.
Este é o ponto de partida para o chamado modelo de Debye, mas que já não estudaremos, por
falta de tempo.
Bibliografia
• F. J. Blatt, “Modern Physics” (1992), capı́tulo 4 (F5.0 448)
• N. W. Ashcroft e N. D. Mermin, “Solid State Physics” (1976), capı́tulo 23 (F5.0 339)
• C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 5 (F5.0 82)
• J. R. Hall e H. E. Hook, “Solid State Physics” (1974), capı́tulo 2
PROBLEMAS
4.1 De acordo com o princı́pio de equipartição da energia, a capacidade térmica molar de um gás com
moléculas diatómicas deveria ter o valor constante de 7R/2. No entanto, este valor verifica-se
apenas no limite de altas temperaturas, tendo a capacidade térmica dos gases diatómicos um comportamento como o representado esquematicamente na figura junta. Compare o comportamento
da capacidade térmica dos sólidos com o da dos gases diatómicos e diga porque razão esta não é
constante.
CV /R
7/2
5/2
3/2
T
Capı́tulo 5
Metais I: modelos de electrões
livres
No conjunto dos sólidos os metais têm uma importância prática especial. As suas propriedades
tornaram-nos particularmente úteis num grande número de aplicações, ao longo de parte importante da história da humanidade. O estudo dos metais tem pois um grande interesse, na área mais
geral da fı́sica dos sólidos.
Entre as muitas propriedades interessantes dos metais, podemos referir: baixos pontos de
fusão; grandes condutividades eléctricas e térmicas; altas densidades de massa; grande resistência
estrutural; boa reflectividade óptica.
Vamos agora passar à descrição de algumas destas propriedades a partir dos princı́pios da
fı́sica. O facto de os metais conduzirem bem calor e electricidade leva-nos a pensar que alguns
dos electrões dos átomos que os constituem se podem deslocar grandes distâncias no seu interior,
quando comparadas com as distâncias interatómicas tı́picas. Neste capı́tulo, vamos estudar estes
electrões como sendo livres, isto é, supondo que as interacções que sofrem (com outros electrões
de condução e com os iões que formam a rede cristalina) são tais, e de tal forma distribuı́das, que,
em média, se cancelam.
5.1
Introdução
As ligações quı́micas entre dois (ou mais) átomos são estabelecidas por deformação das nuvens
electrónicas desses átomos. Evidentemente, esta deformação é mais pronunciada nos estados
electrónicos mais fracamente ligados a cada um dos átomos, de tal forma que podemos dizer
(cometendo um erro que, na esmagadora maioria das aplicações, é desprezável) que apenas estes
estados participam na ligação. Aos electrões que ocupam estes estados dá-se o nome de electrões
de valência.
Nos metais, a ligação quı́mica envolve normalmente um grande número de átomos (1020 , ou
mais) e esta deformação das camadas exteriores da nuvem electrónica de cada átomo é particularmente pronunciada, ficando distribuı́das por toda a extensão do metal. Os electrões que ocupam
estas camadas podem assim mover-se ao longo de distâncias com ordem de grandeza macroscópica.
Um cristal metálico consiste pois num arranjo periódico de iões positivos, imerso num “gás”
de electrões. Naturalmente, os electrões interagem uns com os outros e com os iões da rede,
mas podemos supôr que as forças que sentem, estando mais ou menos distribuı́das em todas as
direcções, se cancelam globalmente, sendo nula a sua resultante. Esta aproximação, apesar de
claramente grosseira, permite, como veremos, obter alguns resultados em bom acordo com os
factos experimentais, pelo menos a nı́vel qualitativo.
59
60
5.2
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
O modelo de Drude-Lorentz
O modelo de Drude-Lorentz consiste na descrição clássica do gás de electrões livres. Usando a
fı́sica clássica, este gás assemelha-se bastante a um gás perfeito. As diferenças principais residem
na alta densidade (num metal há, tipicamente, 1022 electrões por cm3 ) e no facto de os electrões
se moverem num cristal, podendo sofrer colisões com os iões que formam o cristal.
No modelo de Drude-Lorentz (de facto são dois modelos, mas a única diferença entre eles
consiste apenas num pormenor técnico do tratamento estatı́stico) tratam-se então os electrões
deslocalizados como um gás de electrões livres, em equilı́brio termodinâmico com o ambiente.
Sendo os electrões livres, a sua energia é totalmente cinética. Usando métodos estatı́sticos, podemos calcular a energia total do gás de electrões e a partir daı́ várias propriedades mensuráveis
experimentalmente dos metais, como o calor especı́fico, o módulo de compressibilidade, etc. O
confronto dos resultados que obtivermos com os valores experimentais servirá para a avaliação das
qualidades do modelo.
5.2.1
O calor especı́fico dos metais
No quadro desta descrição dos electrões de condução, a energia de um sólido condutor é
E = Ecr + Ee ,
(5.1)
onde Ecr é a energia do cristal de iões, que pode ser avaliada com os métodos estudados no capı́tulo
anterior, e Ee é a energia do gás de electrões de condução. A energia tem esta expressão simples
porque consideramos os electrões livres e portanto sua energia de interacção com o cristal é uma
constante (que pode não ser considerada), cujo único efeito observável é o de manter o gás de
electrões confinado no interior do metal.
A energia dos electrões de condução é puramente cinética uma vez que se consideram livres. De
acordo com o teorema da equipartição da energia, a energia média de um conjunto de Q electrões
de condução é pois Q × 3 × kB T /2 = 3QkB T /2. Consideremos um sólido com N átomos e seja u
o número de electrões que cada átomo fornece para a ligação quı́mica. Temos então Q = N u e a
energia média da nuvem electrónica fica então
Ee =
3
uN kB T.
2
(5.2)
A energia total da amostra considerada é
3
E = Ecr + uN kB T,
2
(5.3)
3
CV = CVcr + uN kB .
2
(5.4)
e o calor especı́fico do metal vem
Para altas temperaturas, CVcr = 3R, como vimos no capı́tulo anterior. Relembrando que R =
NA kB , resulta
u
(5.5)
CV = 3(1 + )R.
2
Concluı́mos então que, de acordo com este modelo, os metais apresentam um calor especı́fico cujo
valor é igual a 9/2R para os metais monovalentes, 6R para os bivalentes, etc.
Este resultado, o primeiro que obtivemos com este modelo, está em desacordo flagrante com
os resultados experimentais. De facto, o calor especı́fico dos metais tem, a altas temperaturas, o
valor definido pela lei de Dulong e Petit, ou seja, 3R. Veremos mais adiante que esta deficiência
do modelo pode ser resolvida analisando quanticamente as propriedades do gás de electrões.
5.2. O MODELO DE DRUDE-LORENTZ
5.2.2
61
A lei de Ohm
l
i
S
A diferença de potencial entre as extremidades de um condutor é
proporcional à corrente que o atravessa. Este é o enunciado da bem
conhecida lei de Ohm. Consideremos um condutor filiforme com
comprimento l e secção transversal de área S, percorrido por uma
corrente i (ver a figura). A lei de Ohm pode então escrever-se como
∆V = Ri,
(5.6)
onde ∆V é a diferença de potencial entre as extremidades do condutor e R, a chamada resistência
do condutor, é a constante da proporcionalidade referida acima. Multiplicando ambos os membros
de (5.6) por 1/(lS) e notando, por um lado, que o campo eléctrico médio no interior do condutor,
~ tem um módulo dado por E = ∆V /l, e por outro que a densidade de corrente j é, por definição
E,
de corrente, j = i/S, obtemos
~
~j = l E.
(5.7)
SR
À constante σ = l/(SR) dá-se o nome de condutividade (a) . Deduzimos desta maneira a forma
local da lei de Ohm,
~
~j = σ E.
(5.8)
A lei de Ohm tem um aspecto que, à primeira vista, pode parecer perturbador. É que a força
~ onde e é o módulo da carga do electrão;
exercida pelo campo eléctrico sobre os electrões vale −eE,
assim, o lado direito da equação (5.8) é proporcional à força que actua sobre os electrões. Por
outro lado, a densidade de corrente ~j é dada por
~j = ρl h~v i
(5.9)
onde ρl é a densidade de carga livre e h~v i é a velocidade média das cargas, neste caso, dos electrões;
o lado esquerdo de (5.8) é então proporcional à velocidade dos electrões. Mas então a equação
(5.8) traduz uma proporcionalidade entre a velocidade dos electrões e a força que neles actua,
em contradição aparente com o previsto pela segunda lei de Newton(b) (força proporcional à
aceleração).
De facto, esta situação não constitui um paradoxo, e é até relativamente frequente na natureza.
Por exemplo, o movimento de queda de um para-quedista é, segundos após o pára-quedas se abrir,
uniforme (e não uniformemente acelerado) e o valor da velocidade é tanto maior quanto maior for o
peso do para-quedista, ou seja, quanto maior for a força que o impele para o solo. Neste exemplo (e
noutros que poderiam ser citados) está presente, para além da força mais directamente responsável
pelo movimento (a força gravı́tica), uma resistência ao movimento por parte do meio onde ele se
realiza. No caso dos electrões nos condutores esse meio é o cristal. No seu movimento no cristal, os
electrões podem por vezes sofrer colisões com com os iões que o formam, comunicando-lhes parte
da energia cinética que obtiveram pela acção do campo.
Tentemos descrever quantitativamente este processo. Consideremos o movimento dos electrões
que formam o gás em equilı́brio termodinâmico na ausência, para já, de campos eléctricos aplicados.
A uma temperatura T 6= 0, a energia cinética média dos electrões, correspondente ao movimento
caótico de agitação térmica, dada pelo teorema de equipartição da energia de Boltzmann, tem o
valor de ε = 3kB T /2. A média dos módulos das velocidades, hv0 i, dos electrões que compõem a
nuvem condutora nos metais é pois
r
3kB T
hv0 i =
,
(5.10)
me
(a) A condutividade é o inverso da resistividade, e ambos os parâmetros são uma medida da qualidade intrı́nseca
(isto é, independente de factores geométricos) dos materiais como suportes da condução eléctrica. Um material
(como o cobre, por exemplo) com uma elevada condutividade, ou baixa resistividade, é um bom condutor de
electricidade, mesmo que uma amostra concreta desse material (por exemplo, um fio muito longo e/ou muito fino)
apresente um grande valor da resistência eléctrica.
(b) Note-se que, num tratamento clássico como o presente, as leis da mecânica de Newton devem ser consideradas
válidas.
62
onde me é a massa electrónica; à temperatura ambiente T ≈ 300 K, hvi ≈ 1, 2 × 105 m/s. O
movimento correspondente à agitação térmica é pois muito rápido. No entanto, o sentido do
movimento de cada electrão é totalmente aleatório e, por isso, a média vectorial das velocidades
dos electrões é nula. Assim, este movimento de agitação térmica não se traduz no estabelecimento
de uma corrente eléctrica mensurável. Esta situação é em tudo análoga à do problema do passeio
aleatório, onde se estuda o movimento de uma partı́cula que sofre uma sucessão de deslocamentos
em direcções aleatórias. O deslocamento médio ao fim de N destes passos é nulo, isto é, o valor
expectável da sua posição ao fim de N passos é igual à posição inicial. Apesar de se verificar
movimento, é igualmente provável o deslocamento em todas as direcções e, portanto, em média,
o valor expectável do deslocamento é nulo.
Vejamos agora o que acontece quando se estabelece um campo eléctrico no interior do condutor.
~ na mesma direcção mas de sentido oposto ao
Cada electrão passa a sentir uma força F~e = −eE,
~
campo eléctrico, e portanto adquire um movimento uniformemente acelerado (com ~a = −eE/m
e ),
mas apenas entre duas colisões sucessivas. Voltando ao problema do passeio aleatório, a situação
agora é análoga a um passeio aleatório em que a direcção de cada passo é, ainda, aleatória, mas
são mais prováveis passos longos numa dada orientação (a do campo) . Seja τ o intervalo de tempo
médio que separa duas colisões de um dado electrão(c) . Em equilı́brio, esta situação é equivalente
aos electrões de condução possuı́rem uma velocidade de condução comum (ver a Figura 5.1). A
E=0
E
deslocamento electrónico
(b)
(a)
Figura 5.1: Esquema do percurso de um electrão. (a) Os electrões apresentam movimentos aleatórios
com velocidade vectorial média nula; (b) sob a acção de um campo eléctrico, os electrões ficam
animados de um movimento uniformemente acelerado entre duas colisões sucessivas, que tendem
a restaurar a aleatoriedade na direcção do vector velocidade. Esta situação é equivalente a um
movimento colectivo com uma velocidade de condução correspondente ao deslocamento electrónico
representado.
velocidade média dos electrões é então
h~v i = h~v0 i +
~
−eE
τ,
me
(5.11)
onde h~v0 i é a velocidade inicial (imediatamente após uma colisão) média. Ora, a velocidade dos
electrões após uma colisão está distribuı́da uniformemente em todos os sentidos, de forma que a
sua média vectorial, h~v0 i, é nula. A velocidade média dos electrões sob a acção do campo eléctrico
é pois
~
−eE
τ.
(5.12)
h~v i =
me
Multiplicando a velocidade média que acabámos de obter pela densidade de carga de condução,
ρl = −ne,
(5.13)
(c) São frequentes as designações de “tempo de relaxação”, “tempo de colisão”, “tempo médio de vida livre”, entre
outras, para o parâmetro τ .
Metal
Li
Na
Cu
Au
n (m−3 )
4,7×1028
2,7×1028
8,5×1028
5,9×1028
63
σ(Ω−1 m−1 )
1,1×107
2,1×107
5,8×107
4,5×107
τ (s)
8,3×10−15
2,8×10−14
2,4×10−14
2,7×10−14
Tabela 5.1: Densidades electrónicas n (em m−3 ) e condutividades eléctricas (em Ω−1 m−1 ) a 295 K
(de Kittel, “Introduction to Solid State Physics”) e tempo de relaxação para o lı́tio, o sódio, o cobre
e o ouro.
onde n é a densidade de electrões de condução, obtemos a densidade de corrente eléctrica,
2
~
~j = ne τ E.
me
(5.14)
Mas esta equação tem a forma da lei de Ohm (5.8), com a condutividade eléctrica dada por
σ=
ne2 τ
.
me
(5.15)
Podemos estimar o tempo de relaxação de um metal usando valores tabelados da condutividade
eléctrica e da densidade electrónica. A Tabela 5.1 apresenta alguns valores.
O tempo de vida livre dos electrões nos metais é, como podemos verificar a partir da Tabela 5.1,
extremamente curto. Durante um intervalo de tempo tão pequeno, a variação no módulo da
velocidade dos electrões provocada pela acção de campos eléctricos tı́picos (de alguns volts por
metro) é, certamente, pequena. Podemos pois considerar que o valor do módulo da velocidade dos
electrões é, em média, o calculado a partir do princı́pio de equipartição da energia, hvi ≈ 105 m/s.
Durante um intervalo de tempo τ ≈ 10−14 s, os electrões percorrem uma distância(d) de cerca de
10−9 m= 10 Å, que é da ordem de grandeza das distâncias interatómicas. Este resultado apoia a
suposição de Drude de que os electrões sofrem colisões com os iões.
De acordo com o princı́pio de equipartição da energia, o valor médio do módulo da velocidade
de agitação térmica, hvi, diminui com a temperatura. Supondo que o caminho médio livre, λ,
não depende fortemente da temperatura, o tempo de relaxação, τ = λ/hvi, deve crescer com
a diminuição da temperatura. Assim, concluı́mos que a condutividade dos metais depende da
temperatura de acordo com
ne2 λ
σ=√
.
(5.16)
3me kT
Ou seja, a condutividade dos metais é maior a baixas temperaturas, o que de facto se verifica
experimentalmente, com a excepção de uma classe importante (em vista das aplicações industriais)
de materiais — os semi-condutores.
Devemos reconhecer agora que este acordo com resultados experimentais é, apenas, qualitativo, já que, para a maioria dos metais, a condutividade depende da temperatura de forma mais
pronunciada do que a patente na Eq. (5.16).
5.2.3
O efeito de Hall
O efeito de Hall consiste no aparecimento de um campo eléctrico transversal num condutor percorrido por corrente numa região onde está definido um campo magnético. É frequentemente usado
para medir a intensidade de campos magnéticos estáticos. Na Figura 5.2 representa-se um circuito
formado com uma placa metálica (à direita na figura), numa região onde está definido um campo
~ perpendicular ao plano da placa condutora. A velocidade dos electrões (oposta ao
magnético B,
(d) Esta
distância tem a designação habitual de “caminho médio livre”.
64
i
B
-
FM
v
EH
+
+
+
+
+
+
Figura 5.2: Esquema da montagem usada para demonstrar o efeito de Hall.
T1
T2
T1
+
+
+
T1 > T2
T2
v
ET
-
Figura 5.3: Esquema da montagem para o estabelecimento de um gradiente de temperatura num
~ T , resultante desse gradiente.
metal (esquerda) e o campo eléctrico, E
sentido da corrente) está representada na figura como ~v . Ao moverem-se numa região onde está
definido um campo magnético, os electrões sentem uma força F~M , dada por
~
F~M = −e~v × B,
(5.17)
e como tal, sofrem uma aceleração para a esquerda (na figura), acumulando-se assim carga de
sinal negativo deste lado da placa. Em contrapartida, no lado direito sente-se um defeito de
carga de sinal negativo, ou seja, o lado direito fica carregado positivamente. Em resultado desta
assimetria na distribuição de carga, no interior da placa metálica estabelece-se um campo eléctrico
~ H , chamado campo de Hall. Atinge-se uma situação estacionária quando a força eléctrica,
E
~
~ H , for igual (e, claro, oposta) à força magnética, ou seja quando
FH = −eE
−eEH = −evB.
(5.18)
Usando (5.13), obtemos a condição de estacionaridade
EH = −
1
jB.
ne
(5.19)
A constante −1/(ne) tem o nome de constante de Hall. O seu valor negativo reflecte o facto de os
transportadores de carga nos metais serem electrões, com carga de sinal negativo. É relativamente
simples medir experimentalmente o valor da constante de Hall, e esperaria-se, à luz deste modelo,
obter sempre valores negativos. Ora, estranhamente, alguns metais apresentam valores positivos
para a constante de Hall. Alguns exemplos são os estabelecidos pelo cádmio, o zinco, o berı́lio e
o magnésio.
5.2.4
Efeitos termoeléctricos
Consideremos um metal no qual se estabelece um gradiente de temperatura. Para concretizar
a discussão, imaginemos que aquecemos com uma chama a extremidade de uma barra de cobre,
e mergulhamos a outra num banho gelado (ver a Figura 5.3). Uma vez que os electrões de
condução da extremidade quente têm maior energia cinética do que os da extremidade fria, deve
verificar-se, durante alguns instantes, um fluxo lı́quido de electrões daquela extremidade para esta.
Evidentemente, o acumular de electrões na extremidade fria, com a consequente carga positiva
65
resultante na extremidade quente, define, no interior do metal, um campo eléctrico que contraria
a continuação indefinida deste processo. Atinge-se, então, um estado de equı́librio dinâmico, em
que no interior do metal está definido um campo eléctrico que se manifesta como uma diferença
de potencial entre as duas extremidades, sendo a mais quente a de potencial mais elevado. Este
fenómeno tem o nome de efeito de Seebeck.
Outro efeito termoeléctrico interessante manifesta-se nos pontos de contacto de dois metais com
densidades de electrões de condução diferentes. Numa junção de dois metais diferentes, verifica-se,
naturalmente, um processo de difusão dos electrões de condução do metal com maior concentração
electrónica para o outro. Mas, assim, aquele metal fica com deficiência de electrões, ou seja,
carregado positivamente. Inversamente, o metal que recebe o fluxo electrónico deste processo de
difusão fica carregado negativamente (ver a Figura 5.4). Mais uma vez, o campo eléctrico criado
nA
V
Vc
A
++ − −
+ + − −e
Vc
nB
A
nA > nB
B
Figura 5.4: Potencial de contacto na junção de dois metais com diferentes concentrações electrónicas
nA e nB e gráfico (à direita) do potencial electrostático na zona da junção.
por esta redistribuição de cargas contraria a sua contiuação indefinida, estabelecendo-se um estado
de equilı́brio dinâmico em que o gradiente da concentração electrónica (que favorece a continuação
do processo de difusão) é compensado pelo campo eléctrico resultante. Chama-se potencial de
contacto à diferença de potencial associada a este campo eléctrico. A grandeza do potencial de
contacto depende das concentrações de carga resultantes deste processo de migração electrónica.
Ou seja, o potencial de contacto é tanto maior quantos mais electrões tiverem sido difundidos
do metal com maior concentração electrónica para o outro. Ora, quanto maior a temperatura,
maior a energia cinética média dos electrões de condução, logo, maior o número de electrões com
energia suficiente para ultrapassarem a barreira de potencial na junção. Ou seja, quanto maior a
temperatura, maior o potencial de contacto na junção dos dois metais.
Este efeito é aproveitado para a construcção de termómetros, chamados termómetros de termopar. Um esquema simplificado da construcção destes termómetros encontra-se representado na
Figura 5.5. Basicamente, estes termómetros consistem num circuito constituı́do por dois ramos
de metais diferentes. Nas duas junções (A e B, no esquema da figura) estabelecem-se potenciais
de contacto diferentes se as suas temperaturas forem diferentes. Uma das junções deve ficar a
uma temperatura conhecida, por exemplo, mergulhada numa mistura de água e gelo em equilı́brio
térmico, ao passo que a outra é utilizada como sensor. Fica então definida uma força electromotriz
no circuito, igual à diferença entre os dois potenciais de contacto, que é uma função crescente da
diferença entre as temperaturas das duas junções. Esta força electromotriz é medida usando um
voltı́metro, que interrompe um dos condutores, sendo necessário ter o cuidado, na utilização do
termómetro, de assegurar que as duas junções para a ligação do voltı́metro (indicadas pelas letras
C e D na figura) estão à mesma temperatura, para que se cancelem os seus potenciais de contacto.
A existência do potencial de contacto na junção de dois metais diferentes tem ainda outro
efeito interessante. Quando uma corrente atravessa a junção, as cargas que a compõem sofrem
uma variação de energia, igual ao produto da sua carga pelo valor do potencial de contacto.
VA
B
A
C
V
D
VB
Figura 5.5: Termómetro de termopar. A tensão indicada pelo voltı́metro depende da diferença de
temperatura das duas juções A e B.
66
Essa variação de energia, que numa junção é um aumento, na outra uma diminuição de energia, é
fornecida ou absorvida pelo meio ambiente. Este fenómeno tem o nome de efeito de Peltier. Assim,
um circuito constituı́do por dois metais diferentes no qual se estabelece uma corrente, funciona
efectivamente como uma máquina térmica, absorvendo calor numa das junções e libertando-o na
outra.
5.2.5
Balanço do modelo de Drude
Estudámos algumas propriedades dos metais à luz de uma teoria clássica de electrões livres. Muitas
outras caracterı́sticas poderiam ter sido estudadas, por exemplo, a condutividade térmica. Não o
fizemos porque estamos já em condições de avaliar o modelo.
O modelo permite explicar qualitativamente a lei de Ohm e a dependência da condutividade
com a temperatura, bem como alguns efeitos termoeléctricos, nomeadamente o de Seebeck e o de
Peltier, mas falha redondamente no que concerne ao calor especı́fico da nuvem electrónica. Não
consegue descrever o comportamento dos semi-condutores, cuja condutividade aumenta com a
temperatura, em geral. Não consegue, também, dar conta dos valores positivos para o coeficiente
de Hall apresentados por alguns metais, nem justificar fisicamente os valores do livre caminho
médio dos electrões de condução, notoriamente elevados a baixas temperaturas.
Vamos de seguida verificar se é possı́vel resolver estas deficiências do modelo de electrões livres
através de um tratamento quântico dos electrões.
5.3
O modelo de Sommerfeld
O modelo de Drude é uma teoria clássica de electrões livres, isto é, os electrões são tratados como
pequenas esferas rı́gidas idênticas mas distinguı́veis umas das outras. No entanto, apresentando
os electrões um comportamento eminentemente quântico, este tratamento não se pode considerar correcto. Vamos agora estudar o gás de electrões livres usando o formalismo da Mecânica
Quântica. Veremos que as principais diferenças relativamente ao modelo clássico têm origem nas
particularidades estatı́sticas dos objectos quânticos, e, mais em particular, dos fermiões, classe de
partı́culas que engloba os electrões.
A classe dos fermiões é constituı́da pelas partı́culas com momento angular intrı́nseco (ou spin)
semi-inteiro (isto é, 1/2, 3/2, etc.) e que satisfazem o Princı́pio de Exclusão de Pauli, segundo o
qual dois fermiões idênticos não podem ocupar simultaneamente o mesmo estado quântico(e) .
O Princı́pio de Exclusão de Pauli é incompatı́vel com a distribuição de Maxwell-Boltzmann,
verificando-se antes que os fermiões satisfazem uma distribuição diferente (sendo a diferença particularmente notória a baixas temperaturas), com o nome de distribuição de Fermi-Dirac.
5.3.1
Estados electrónicos
Os estados quânticos dos electrões são obtidos resolvendo a equação de Schrödinger independente
do tempo,
h̄2 2
−
∇ φ (~r) + V (~r)φ (~r) = εφ (~r) ,
(5.20)
2m
onde φ (~r) é a parte da função de onda que depende da posição dos electrões, V (~r) é a sua função
~ é o operador
de energia potencial, ε é a energia do estado definido pela função de onda φ e ∇
gradiente, que, como é bem sabido, é dado por
~
∇
∇2
∂
∂
∂
+ ~ey
+ ~ez ,
∂x
∂y
∂z
∂2
∂2
∂2
+ 2 + 2,
2
∂x
∂y
∂z
= ~ex
=
(e) Note-se que se trata aqui de estados quânticos e não de nı́veis de energia. Se dois estados estados quânticos
diferentes apresentam um mesmo valor de energia electrónica, então esse nı́vel pode estar ocupado por dois electrões.
5.3. O MODELO DE SOMMERFELD
67
usando coordenadas cartesianas. Uma vez que neste tratamento os electrões são considerados
livres, a sua energia potencial deve ser constante(f) , e podemos escolhê-la igual a zero. Assim, a
equação (5.20) reduz-se a
h̄2 2
∇ φ (~r) + εφ (~r) = 0.
(5.21)
2m
As soluções desta equação são da forma
~
φ~k (~r) = Aeik·~r ,
(5.22)
onde A é uma constante que é fixada impondo a normalização da função de onda,
Z
Z
~
~
2
∗
dV φ (~r) φ (~r) = |A|
dV e−ik·~r eik·~r
V
V
=
2
|A| V = 1,
de onde resulta, escolhendo A real
1
A= √ .
V
(5.23)
Substituindo (5.22) em (5.21), obtemos a relação entre a energia dos electrões e o seu vector de
onda ~k, ou seja, a chamada relação de dispersão,
ε~k =
h̄2 k 2
.
2m
(5.24)
Comparando esta expressão com a correspondente clássica, ε = p2 /2m, concluı́mos que o momento
de um electrão num estado φ~k é
p~ = h̄~k.
(5.25)
A dependência espacial(g) da função de onda dos electrões é então
1
φp~ = √ ei~p·~r/h̄ .
V
(5.26)
Resolvemos a equação de Schrödinger supondo que os electrões são livres. No entanto, esta
suposição só é válida no interior do metal. Na sua superfı́cie, os electrões sentem uma força, de
natureza electrostática, que os impede de sair. Impomos esta restrição na função de onda dos
electrões através de condições fronteira que esta função deve satisfazer sobre a superfı́cie do metal.
As condições que impomos são as chamadas condições fronteira periódicas, em que se obriga a
função de onda a tomar valores iguais em pontos correspondentes de faces opostas do cristal.
Se o cristal fôr suficientemente volumoso, esperamos que as conclusões a que chegarmos sejam
relativamente independentes das condições fronteira escolhidas. Assim, impomos as seguintes
condições às soluções da equação de Schrödinger(h) (ver Figura 5.6).
1 ~
φ~k (~r) = √ eik·~r
V
=
=
=
1 ~
√ eik·[(x+L)~ex +y~ey +z~ez ]
V
1 i~k·[x~ex +(y+L)~ey +z~ez ]
√ e
V
1 i~k·[x~ex +y~ey +(z+L)~ez ]
√ e
,
V
(f) Ao nı́vel quântico, as forças são sempre conservativas, isto é, podem ser obtidas como o gradiente da energia
potencial. Se a força é nula, a energia potencial é constante
(g) A dependência temporal é, apenas, ξ(t) = exp (−iεt/h̄).
(h) Para simplificar, consideramos o metal com forma cúbica, de aresta L.
68
de onde resultam as equações de quantização para o vector de onda, ~k,
kx
=
ky
=
kz
=
2π
n
L
2π
m
L
2π
l,
L
(5.27)
com n, m, l inteiros arbitrários. Só os vectores de onda ~k cujas componentes satisfazem (5.27)
são permitidos para os electrões de condução no metal. Estes vectores definem uma rede cúbica
simples, de parâmetro 2π/L.
z
Lx
U= ∞
L
z
U=0
y
L
x
y
Figura 5.6: Poço de potencial tridimensional. A energia é nula dentro da caixa de dimensões
Lx Ly Lz e infinito fora desta.
Os estados quânticos dos electrões são identificados pelos valores das componentes do vector
de onda ~k, e pela orientação do seu spin, que, neste caso(i) , só pode tomar dois valores, com os
nomes “para cima” (ou up, do inglês) e “para baixo” (ou down). O princı́pio de exclusão de Pauli
proı́be que dois fermiões idênticos ocupem o mesmo estado quântico, de forma que pode haver, no
máximo, dois electrões com o mesmo vector de onda ~k: um com spin up, o outro com spin down.
5.3.2
A densidade de estados electrónicos
Pretendemos agora determinar a densidade de estados electrónicos, isto é, pretendemos determinar
a função g(ε) tal que o número de estados electrónicos com energia compreendida entre ε e ε + dε
seja g(ε)dε. Para tal, começamos por notar que a “relação de dispersão”, ε = ε(k), é isotrópica, isto
é, só depende do módulo do vector de onda; então o número de estados com energia compreendida
entre ε e ε + dε é igual ao existente na camada esférica oca com raios k e k + dk correspondentes
àqueles valores de energia; é agora fácil contar o número destes estados usando as equações de
quantização (5.27). Vejamos, então. O volume da camada esférica oca de raios k e k+dk é 4πk 2 dk;
o número de vectores de onda permitidos presentes nesta porção de espaço-k é aproximadamente
igual à razão entre o seu volume e o volume ocupado por cada modo quântico, que, de acordo com
a Eq. (5.27), é (2π)3 /V , onde V é o volume do cristal; finalmente, para cada vector de onda ~k
há dois estados possı́veis, correspondentes às duas orientações do spin electrónico. O número de
estados electrónicos com energia compreendida entre ε e ε + dε é então
dn
= 2×
= V
(i) Recorde-se
que os electrões têm spin 1/2.
4πk 2 dk
(2π)3 /V
k2
dk.
π2
(5.28)
69
A relação de dispersão (ou seja, a relação entre a energia e o vector de onda) é a expressa na
Eq. (5.24), de onde obtemos por diferenciação
dε =
h̄2
k dk.
m
(5.29)
Substituindo em (5.28) resulta
dn =
=
V m
k dε
π 2 h̄2
V √ 3
2m ε dε,
2
π h̄3
(5.30)
onde se usou (5.24) para substituir k. A função densidade de estados é, então,
g(ε) =
5.3.3
V √ 3
2m ε.
π 2 h̄3
(5.31)
O estado fundamental de um gás de fermiões
Vamos agora considerar o gás de fermiões no estado fundamental, isto é, no estado de menor
energia. Antes de começar, é importante desfazer eventuais confusões de nomenclatura. Cada
electrão no gás de fermiões ocupa um dado estado individual, caracterizado por um dado vector
de onda ~k e uma dada orientação de spin, estado esse a que corresponde uma certa energia, ε, do
electrão que o ocupa. O conjunto dos electrões de valência num metal define o gás de fermiões de
condução, gás esse que também é caracterizado por estados, mas que são agora estados colectivos,
no sentido em que as suas propriedades se podem determinar a partir das dos estados individuais
ocupados por cada um dos electrões que formam o gás.
O estado fundamental do gás de electrões é aquele que, de entre todos os estados possı́veis,
apresenta o menor valor para a energia. Logo, neste estado, todos os electrões que formam a
nuvem de condução devem ocupar estados individuais com uma energia o menor possı́vel. Do
ponto de vista clássico, estes estados são aqueles em que os electrões se encontram imóveis e,
portanto, apresentam o valor mı́nimo para a sua energia cinética (ou seja, zero. No entanto,
quanticamente esta situação é impossı́vel. Com efeito, estando todos os electrões imóveis, todos
apresentam vector de onda ~k = 0. Ora, já notámos que o princı́pio de exclusão de Pauli não
permite mais do que dois electrões com o mesmo vector de onda, cada um com sua orientação de
spin. O quadro clássico para o estado fundamental de um gás de electrões é pois, à luz da mecânica
quântica, uma impossibilidade. Sendo assim, o estado fundamental de um gás de fermiões deve
ser construido ocupando, com os electrões de condução, estados quânticos individuais de energias
progressivamente mais elevadas, começando pelos de menor energia, até que todos os electrões de
condução estejam desta forma “estacionados”. Uma vez que a energia dos estados electrónicos
depende apenas do módulo do vector de onda, devemos, nesta construção, preencher primeiro
estados caracterizados por vectores de onda de módulo menor.
O conjunto dos estados electrónicos ocupados no estado fundamental de um gás de electrões
define, no espaço-k, uma região com a forma de uma esfera: todos os estados electrónicos com
módulo do vector de onda menor que um certo limiar kF estão ocupados; os restantes, com
k > kF , apresentam-se desocupados. A esta esfera, que representa o estado fundamental de um
gás de fermiões (neste caso, electrões de condução num metal), dá-se o nome de esfera de Fermi ;
chama-se energia de Fermi ao valor da energia dos electrões que ocupam estados na superfı́cie da
esfera de Fermi, e, evidentemente, relaciona-se com o raio de Fermi através de
εF =
h̄2 2
k ;
2m F
(5.32)
define-se ainda a temperatura de Fermi, através de TF = εF /kB , onde kB é a constante de Boltzmann, como sendo o valor da temperatura necessário para que um número apreciável de fermiões
adquiram uma energia cinética comparável com a energia de Fermi.
70
Elemento
Li
Na
Cu
Au
n(m−3 )
4,68×1028
2,64×1028
8,40×1028
5,90×1028
εF (eV)
4,74
3,24
7,00
5,53
TF (K)
5,51×104
3,77×104
8,16×104
6,42×104
kF (m−1 )
1,12×1010
0,92×1010
1,36×1010
1,21×1010
vF (m/s)
1,29×106
1,07×106
1,57×106
1,40×106
Tabela 5.2: Valores das grandezas “de Fermi” para alguns elementos.
Os valores destas grandezas, que caracterizam o estado fundamental de um gás de electrões,
podem ser todos calculados a partir do valor da densidade electrónica de condução, que, por seu
turno, é facilmente estimável em situações concretas. O cálculo destas quantidades parte do facto
de que o número de estados electrónicos no interior da esfera de Fermi é, por construção, igual
ao número total de electrões de condução, N , presentes no metal. Usando a função densidade de
estados, obtida na subsecção anterior, esta igualdade traduz-se por
Z εF
dε g(ε),
(5.33)
N=
0
já que no lado esquerdo temos o número total de electrões e, à direita, o número total de estados
electrónicos ocupados. Substituindo na Eq. (5.33) o resultado da Eq. (5.31), obtemos
N
n≡
V
√
=
=
Z
√
2m3 εF
dε ε
3
2
π h̄
0
p
3
2 2m ε3F
,
3 π 2 h̄3
(5.34)
onde se representou por n a densidade electrónica. Desta equação, podemos determinar o valor da
energia de Fermi (supondo conhecido o valor da densidade electrónica), a partir do qual se calcula
facilmente o valor de kF , TF , etc. Para a maioria dos metais, a energia de Fermi apresenta valores
de cerca de alguns eV(j) .
O estado fundamental do gás de electrões de condução só pode ser produzido experimentalmente a uma temperatura de zero Kelvin (ou muito próxima deste limite) uma vez que, a temperaturas mais elevadas a agitação térmica dos átomos pode comunicar energia à nuvem electrónica,
excitando alguns electrões para fora da esfera de Fermi.
5.3.4
O gás de electrões de condução à temperatura ambiente
O estado fundamental do gás de electrões que acabámos de descrever só pode ser produzido à
temperatura de zero kelvin uma vez que, a temperaturas mais elevadas, os átomos do sólido estão
animados de movimentos de vibração que podem, através de colisões, excitar alguns electrões para
fora da esfera de Fermi. A uma temperatura T , a energia disponı́vel para, deste modo, excitar
electrões é da ordem de grandeza da energia dos movimentos atómicos que, sabêmo-lo já, é de
cerca de kB T , de acordo com o princı́pio de equipartição de energia. À temperatura ambiente,
T ' 300 K e kB T ' 0,03 eV, ou seja, cem vezes menos do que os valores tı́picos da energia de
Fermi, como se pode constatar de uma leitura da Tabela 5.2. Mas, se assim é, apenas aqueles
electrões que ocupam estados muito próximos da superfı́cie de Fermi (aqueles cuja energia difere de
εF por menos do que kB T ) podem ser excitados, já que os restantes (profundamente “enterrados”
na esfera de Fermi) iriam, após a excitação, ocupar estados já ocupados, o que é impossı́vel nos
termos do princı́pio de exclusão de Pauli. À temperatura ambiente, a configuração da nuvem
electrónica no espaço-k consiste ainda numa esfera (como a 0 K), mas que apresenta um ligeiro
(j) 1 eV (lê-se electrão-Volt) é a energia adquirida por um electrão acelerado por uma diferença de potencial de
1V, ou seja, 1 eV' 1, 6 × 10−19 J.
71
“esboroamento” da sua superfı́cie, sendo possı́vel encontrar estados desocupados no seu interior e,
em igual número, estados ocupados no exterior.
Este facto marca a principal diferença relativamente ao tratamento clássico da nuvem electrónica, e iremos mais adiante abordar as suas consequências.
5.3.5
A distribuição de Fermi-Dirac
À temperatura de zero Kelvin, todos os estados electrónicos com energia inferior ou igual à energia
de Fermi estão ocupados. A probabilidade para que um estado de energia ε esteja ocupado é então,
para T = 0 K e à parte uma constante de normalização,
½
1,
se ε ≤ εF
fT =0 K (ε) =
(5.35)
0,
se ε > εF .
À temperatura ambiente, em contrapartida, da discussão precedente concluı́mos que quase todos os
estados quânticos com energia baixa (quando comparada com a do nı́vel de Fermi) estão ocupados;
a fracção de estados ocupados só decresce sensivelmente em nı́veis com energia muito próxima de
εF , numa região com largura aproximadamente igual a kB T . Pode mostrar-se (mas não o faremos
aqui) que a função que descreve esta situação é a chamada função de distribuição de Fermi-Dirac,
fT (ε) =
1
e(ε−µ)/kB T
+1
,
(5.36)
onde µ é o potencial quı́mico do sistema. O limite da distribuição de Fermi-Dirac quando T → 0
deve ser a expressão (5.35), e podemos então concluir que
lim µ = εF .
(5.37)
T →0
Quando a temperatura sobe, o valor do potencial quı́mico decresce ligeiramente; mas, mesmo à
temperatura ambiente, o seu valor mantém-se muito aproximadamente igual ao da energia de
Fermi. Por esta razão, não é, frequentemente, feita qualquer distinção entre os dois.
Na Figura 5.7 está representada a forma da função de distribuição de Fermi-Dirac para T = 0 K
e para temperaturas não nulas.
1
6000
3000
600
0
K
K
K
K
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
Figura 5.7: Gráfico da função de distribuição de Fermi-Dirac, para T = 600 K (a tracejado), T =
3000 K (a pontilhado) e T = 6000 K (a cheio). O valor da energia de Fermi usado neste exemplo foi
de εF = 5 eV.
O facto de apenas alguns electrões serem excitados quando, partindo do estado fundamental, se
aquece o gás de electrões de condução até à temperatura ambiente, tem, como deve ser evidente,
72
f(ε) g(ε)
T=0K
f(ε) g(ε)
T=0K
T>0K
0
ε
F
ε
0
ε
F
ε
Figura 5.8: Distribuição energética dos electrões à temperatura do zero absoluto (esquerda) e a uma
temperatura elevada (à direita).
um efeito determinante sobre o calor especı́fico da nuvem electrónica. Com efeito, a energia
total (da nuvem electrónica) não deve, neste aquecimento, aumentar tanto quanto o previsto
usando o tratamento clássico, baseado na função de distribuição de Maxwell-Boltzmann. O número
de electrões que ocupam estados excitados à temperatura ambiente representa uma fracção tão
pequena do total, que a energia do gás de electrões de condução difere muito pouco da do estado
fundamental do gás. A contribuição principal para o calor especı́fico dos metais a temperaturas
não excessivamente altas é então a fornecida pela rede de iões e portanto verifica-se, mesmo para
metais, a lei de Dulong e Petit.
No estado fundamental do gás de electrões, todos os estados electrónicos com energia menor do
que a energia de Fermi estão ocupados, e todos os que têm energia superior à energia de Fermi estão
desocupados. A distribuição energética dos electrões é então determinada apenas pela densidade
de estados electrónicos: para energia inferiores à energia de Fermi a distribuição de energias é
igual à densidade de estados, para energias superiores, anula-se. Esta situação é representada na
Figura 5.8, à esquerda. A uma temperatura finita, os electrões próximos da superfı́cie de Fermi
podem sofrer excitações, ficando então alguns estados desocupados abaixo do nı́vel de Fermi, e
alguns estados ocupados com energia superior à energia de Fermi (ver a Figura 5.8, à direita).
5.3.6
A condutividade eléctrica
Como acabámos de discutir, os electrões mais profundamente “enterrados” na esfera de Fermi
estão congelados, no sentido em que não podem, à temperatura ambiente, sofrer excitações de
origem térmica. Vimos que, por esta razão, a nuvem electrónica contribui muito pouco para o
calor especı́fico dos metais.
Poder-se-ia pensar que este “congelamento” impede também a nuvem electrónica de contribuir
para a condutividade eléctrica, já que, também aqui, é necessário que pelo menos alguns electrões
sejam excitados. Com efeito, na ausência de campos eléctricos externos e no estado fundamental, a
distribuição das velocidades electrónicas tem simetria esférica, ou seja, dado um qualquer electrão
com velocidade ~v (vector de onda ~k), existe outro com velocidade −~v (vector de onda −~k) cuja
contribuição para a corrente eléctrica anula a do primeiro. Como, no estado fundamental, todos
os electrões estão desta forma “emparelhados”, a corrente total é nula. Para que se verifique
condução eléctrica é pois necessário que (pelo menos) alguns electrões sofram uma transição para
um estado “desemparelhado”, no exterior da esfera de Fermi. Como o número de electrões em
estados com energia acima da do nı́vel de Fermi aumenta com a temperatura, poderı́amos pensar
que também a condutividade eléctrica dos metais seria maior a temperaturas maiores, tomando
valores muito baixos para temperaturas próximas do zero absoluto. Ora, esta conjectura contraria
flagrantemente os dados experimentais. A condutividade dos metais é, regra geral, uma função
decrescente da temperatura.
Na discussão acima, cometemos o erro de supor que a população electrónica dos estados exteriores à esfera de Fermi tem apenas origem térmica, isto é, que apenas por absorção de energia
vibracional da rede cristalina se podem promover transições electrónicas. Isto é evidentemente
73
errado! São possı́veis trocas de energia com um campo eléctrico externo, que contribuem determinantemente para a população de electrões em estados “desemparelhados”. Um campo eléctrico
externo muda o estado de todos os electrões na nuvem de condução, comunicando-lhes uma aceleração oposta à direcção do campo (recordemos que a carga dos electrões é negativa). Este efeito,
conjugado com a possibilidade de colisões com a rede cristalina, com defeitos, com fonões, tem
como resultado que cada electrão atinge uma velocidade limite, e a diferença (vectorial) entre este
limite e a velocidade inicial é a mesma para todos os electrões. Dada a relação entre as velocidades
~v e os vectores de onda ~k dos electrões, tudo se passa como se a esfera de Fermi, inicialmente centrada na origem do espaço-k, sofresse um deslocamento ~δ na direcção oposta à do campo aplicado
(ver a Figura 5.9).
ky
ky
kx
kx
E
Figura 5.9: À esquerda, a esfera de Fermi na ausência de campo eléctrico. Os estados ocupados
(zona sombreada) apresentam, no espaço-k simetria esférica e portanto a velocidade média, tomada
para todos os electrões, é nula. À direita, a esfera de Fermi quando se aplica um campo eléctrico. O
conjunto dos estados presentes na zona cinzento-claro apresenta um valor médio da velocidade nulo;
os estados na região indicada a cinzento-escuro, que também estão ocupados, contribuem todos para
a corrente eléctrica.
Se designarmos por τ o tempo médio de colisão, cada electrão vai sofrer uma modificação na
(k)
~
~ e uma
sua velocidade de cerca de −eτ E/m
, uma variação de momento (~
p = m~v ) de −eEτ
~
~
variação de vector de onda (k = p~/h̄) de −eEτ /h̄, que deve agora ser o valor médio do vector de
onda. Uma vez que todos os electrões vão sofrer esta transição de estado, o princı́pio de exclusão
de Pauli não se aplica.
~ A densidade
A média das velocidades dos electrões deve agora ser h~v i = h̄/mh~ki = −eτ /mE.
~
de corrente, j = ρh~v i = −neh~v i, vem então
2
~
~j = ne τ E,
m
onde n é o número de electrões de condução por unidade de volume. Comparando esta expressão
~ obtemos a forma da condutividade eléctrica:
com a da lei de Ohm (~j = σ E),
σ=
ne2 τ
.
m
Este foi o resultado obtido no estudo clássico (ver a Secção 5.2.2). Apesar das diferenças importantes entre as duas abordagens ao problema da condução eléctrica, a expressão da condutividade
como função das caracterı́sticas do material em que se processa, apresenta a mesma forma nas
descrições clássica e quântica.
O livre caminho médio dos electrões de condução pode ser obtido multiplicando o módulo da
sua velocidade pelo tempo médio de colisão. Por exemplo, para o cobre, σ = 5, 8 × 107 Ω− 1 m− 1
e n = 8, 4 × 102 8 m− 3, de onde resulta τ = 2, 5 × 10−14 s. A velocidade dos electrões que ocupam
(k) Esta expressão é simplesmente a que resulta do estudo do movimento uniformemente acelerado de uma partı́cula
~ durante um intervalo de tempo τ .
de massa m, sob a acção de uma força constante −eE,
74
estados no nı́vel de Fermi pode ser calculada a partir da densidade electrónica, n, obtendo-se
vF = 1, 6 × 106 m/s. O livre caminho médio para um electrão no nı́vel de Fermi de um cristal de
cobre é então λ ≈ 390 Å, ou seja, cerca de 100 vezes as distâncias interatómicas tı́picas!
Vemos assim que o problema do livre caminho médio de que enfermava o modelo clássico de
electrões livres não é eliminado nesta descrição quântica. De facto, este problema não é eliminado
senão quando se consideram as interacções dos electrões de condução com a rede cristalina.
5.4
Crı́tica dos modelos de electrões livres
Tanto o modelo clássico de Drude como o modelo quântico de Sommerfeld apresentam graves
deficiências. À parte a questão do calor especı́fico dos metais (e algumas outras propriedades que
não abordámos), os dois modelos apresentam inconvenientes semelhantes, alguns dos quais são:
(a) Não fornecem explicação para a existência de metais com coeficientes de Hall positivos;
(b) não descrevem correctamente a dependência da condutividade com a temperatura. Em
particular, o caso de certos materiais cuja condutividade aumenta com a temperatura, em
certos intervalos de temperatura;
(c) nalguns condutores, a condutividade depende da orientação do campo eléctrico, facto incompreensı́vel numa teoria de electrões livres;
(d) Os modelos de electrões livres não respondem à pergunta mais imediata: Porque é que alguns
sólidos são condutores e outros não?
Para responder a este e outros problemas, teremos que considerar as interacções entre os
electrões de condução e a rede cristalina. De facto, os electrões nos sólidos não são livres e esperar
que um modelo que os trate como tal seja capaz de descrever com exactidão todas as propriedades
electromagnéticas dos sólido é certamente optimismo em demasia.
Bibliografia
• N. Ashcroft e N. Mermin, “Solid State Physics” (1976), capı́tulos 1, 2 e 3 (F5.0/339)
• C. Kittel, “Introduction to Solid State Physics” (1996), capı́tulo 6 (F5.0/82)
• Blakemore, “Solid State Physics” (1985), secções 3.1, 3.2, 3.3 (F5.0/181)
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter”, (1989) secção 12.3
(F5.0/437)
PROBLEMAS
5.1 Relacione a probabilidade de colisão por unidade de tempo, γ, com o tempo médio de colisão τ .
5.2 Prove, a partir da definição de densidade de corrente, ~j = ρl~v , que a corrente total que passa
através de uma superfı́cie S é igual ao fluxo de ~j através de S,
Z
~j · n̂dS,
i=
S
onde n̂ é um vector unitário que, em cada ponto da superfı́cie S, lhe é perpendicular.
5.3 Relacione kF com ²F com pF .
5. Problemas
5.4 Calcule a energia do estado fundamental de um gás de fermiões com N partı́culas ocupando um
volume V .
5.5 Escreva a expressão da energia de um gás de fermiões num estado arbitrário.
5.6 A resposta ao Problema 4 é E = 3/5 N ²F onde N é o número total de fermiões no gás e ²F é
energia de Fermi. Obtenha a expressão da pressão do gás de fermiões (p = ∂E/∂V ) e do módulo
de compressibilidade (B = −V ∂p/∂V ) de um gás de fermiões no estado fundamental.
5.7 O lı́tio tem condutividade eléctrica de σ =1,05×107 Ω−1 m−1 e uma densidade atómica de
4,80×1028 átomos por metro cúbico.
(a) Determine a velocidade de condução média dos electrões no metal quando se aplica um
campo eléctrico de 100 V/m, e compare o valor obtido com a velocidade dos electrões no
nı́vel de Fermi.
(b) Determine a velocidade dos electrões cuja energia é igual à energia média dos electrões no
cristal, segundo o modelo de Sommerfeld.
(c) Determine a velocidade média dos electrões à temperatura de 300 K, segundo o modelo de
Drude-Lorentz.
5.8 O sódio tem densidade de ρ =0,97×103 kg/m3 , uma massa atómica relativa de 23 e condutividade
eléctrica de 2, 1 × 107 Ω−1 m−1 . Determine a mobilidade dos electrões no sódio.
5.9 A densidade do bário é de 3, 5 × 103 kg/m3 e a massa atómica relativa é 137. Sabendo que este
elemento tem dois electrões de valência, determine o raio da esfera de Fermi e o valor da energia
de Fermi correspondente.
5.10 A grafite é um cristal laminar em que os átomos de carbono estão distribuı́dos (para uma determinada camada) nos vértices de hexágonos regulares de lado d = 1, 42 Å, que se encaixam entre
si. Os electrões de valência da grafite, à razão de um electrão por átomo, podem mover-se basicamente no dito espaço bidimensional. Suponha que estes electrões são livres. Usando o modelo
de Sommerfeld para estas camadas bidimensionais, determine:
(a) a densidade electrónica;
(b) a densidade de estados, g(ε);
(c) a energia de Fermi;
(d) a energia espectável dos electrões à temperatura de zero Kelvin.
5.11 O estrôncio tem uma estrutura cúbica de faces centradas de aresta a = 6, 08 Å.
(a) Usando o modelo de electrões livres de Sommerfeld determine o raio da esfera de Fermi no
zero absoluto.
(b) Determine a velocidade de um electrão com energia Fermi à temperatura de 0◦ , 30◦ e 300◦
Kelvin. Comente os resultados.
(c) Determine a velocidade média de condução dos electrões quando sujeitos a um campo
eléctrico de 2,5 V/cm, sabendo que a condutividade eléctrica do estrôncio a 20◦ C é de
1, 66 × 105 Ω−1 m−1 .
75
Capı́tulo 6
Metais II: Teoria de bandas
Deve ser evidente que alguns inconvenientes (de entre os que foram apresentados no final do
capı́tulo anterior) das teorias de electrões livres têm origem exactamente no facto de se considerarem os electrões “desligados” de quaisquer interacções com o meio onde se deslocam. Por exemplo,
o facto de a condutividade da grafite depender da direcção da corrente mostra bem que deve existir alguma interacção entre os electrões e o cristal, que torna mais fácil o movimento em certas
direcções que noutras. É também evidente que uma teoria de electrões livres só se pode aplicar
a condutores, sendo portanto incapaz de explicar a razão de alguns sólidos o serem e outros não.
Estas considerações são evidentes e poderiam ter sido feitas ainda antes de termos desenvolvido
a teoria de electrões livres. Parece então natural que um modelo que tenha em linha de conta
a influência do meio cristalino sobre os electrões possa resolver estas dificuldades. A teoria que
vamos passar a descrever, não só clarifica estas questões, como explica as restantes, discutidas no
Capı́tulo anterior, como os elevados valores do livre caminho médio a baixa temperatura ou as colocadas pela existência de sólidos cuja condutividade aumenta com a temperatura, que apresentam
coeficientes de Hall positivos, etc.
6.1
Introdução
Nesta nova abordagem continuaremos a desprezar as interacções electrão-electrão. A razão principal para esta aproximação é a complexidade da teoria completa, que torna impraticável a sua
resolução sem recorrer aos métodos, aproximados, da teoria quântica de muitos corpos. Com
efeito, o problema é o seguinte: queremos determinar a função de onda dos electrões, resolvendo
a Equação de Schrödinger. Mas antes temos que determinar o potencial a que os electrões estão
sujeitos. Ora, considerando interacções electrão-electrão, só podemos conhecer o potencial depois
de conhecida a função de onda do sistema, justamente o que se pretendia obter com a resolução
da Equação de Schrödinger. Considerando, além disso, que a função de onda deve depender das
3N coordenadas de posição dos N electrões, sendo N da ordem de 1020 , fica-se com uma ideia
da complexidade do problema. Felizmente, o modelo que iremos desenvolver é notavelmente preciso, demonstrando-se assim, a posteriori, que as interacções electrão-electrão são, de facto, pouco
significativas na maior parte das aplicações(a) .
Não considerando as interacções electrão-electrão, apenas as interacções com a rede cristalina
contribuem para a energia potencial dos electrões. Cada electrão move-se numa região onde está
definida uma função de potencial independente dos restantes electrões. A este tipo de aproximação
para sistemas de muitos corpos dá-se o nome de aproximação de partı́cula única, ou de partı́culas
independentes.
Uma vez que a rede cristalina é, em primeira aproximação, um arranjo periódico tridimensional
de átomos, o potencial electrónico por ela estabelecido também deve ser periódico, com a mesma
periodicidade da rede. Uma vez que a força entre cargas de sinal contrário (os electrões e os
(a) Uma
excepção importante desta afirmação é o caso da supercondutividade.
77
78
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
iões que formam a rede) é atractiva, o potencial electrónico deve apresentar mı́nimos nas posições
ocupadas pelos iões, como se mostra na Figura 6.1, numa representação unidimensional.
V(x)
x
a
a
a
Figura 6.1: Exemplo de potencial periódico unidimensional.
A resolução da Equação de Schrödinger com um potencial periódico fica substancialmente
simplificada pelo teorema de Bloch, que demonstramos na secção seguinte. Antes de o fazermos,
podemos estudar de forma qualitativa a deformação das orbitais atómicas quando aproximamos
vários átomos uns dos outros. Quando os átomos estão afastados uns dos outros, os electrões
atómicos praticamente não sentem interacções senão com o átomo a que pertencem, e portanto
as orbitais são essencialmente as previstas pela fı́sica atómica: um conjunto de nı́veis energéticos
designados pelos sı́mbolos 1s, 2s, 2p, etc(b) . Um esquema destes nı́veis está representado na
Figura 6.2. Se aproximarmos deste átomo um outro, idêntico, cada um destes nı́veis subdivideE
V(x)
2p
2s
1s
x
Figura 6.2: Nı́veis de energia atómicos.
se em dois, sendo a separação tanto maior quanto maior for a energia do nı́vel original (ver
Figura 6.3). Se aproximarmos 3 átomos cada nı́vel subdivide-se em 3 e assim sucessivamente. Se
considerarmos agora um cristal, que consiste num número elevado de átomos na vizinhança uns dos
outros, cada nı́vel atómico subdivide-se em tantos subnı́veis quantos forem os átomos que formam
o cristal. Estes subnı́veis estão tão próximos (em termos energéticos) uns dos outros que não é
possı́vel detectar a sua separação. Cada nı́vel subdivide-se então um número enorme de vezes,
criando assim uma banda de energias permitidas, como mostra a Figura 6.4. Este desdobramento
dos nı́veis atómicos pode ser ilustrado usando a teoria da perturbações. Outra alternativa é a
resolução da Equação de Schrödinger numericamente (usando métodos que estão descritos em
qualquer livro de análise numérica) para uma partı́cula com uma energia potencial com uma série
de mı́nimos dispostos contiguamente.
É importante notar que neste desdobramento das orbitais atómicas não varia o número total
de estados electrónicos. Com efeito, quando se aproximam dois átomos da mesma espécie quı́mica,
cada orbital atómica divide-se em duas orbitais moleculares, mas inicialmente temos dois átomos,
cada qual com o seu conjunto de orbitais atómicas, e no fim temos apenas uma molécula. As
(b) Usou-se a notação espectroscópica (a mais habitual) para indicar os estados electrónicos. O número inteiro
representa o número quântico principal; a letra que o segue representa o momento angular, de acordo com s → l = 0;
p → l = 1; d → l = 2; etc. Assim, o estado 2p é o estado com número quântico principal n = 2 e número quântico
de momento angular l = 1.
6.2. O TEOREMA DE BLOCH
79
E
V(x)
2p
2s
1s
Figura 6.3: Nı́veis de energia numa molécula biatómica.
E
V(x)
2p
2s
1s
Figura 6.4: Bandas de energia num cristal.
duas orbitais moleculares correspondentes a cada nı́vel atómico podem ver-se como combinações
lineares das duas orbitais atómicas (uma de cada átomo) que as originam.
Na Figura 6.4, os electrões que ocupam as bandas 1s e 2s estão localizados na proximidade dos
átomos a que pertencem, porque as suas energias não são suficientes para ultrapassar as barreiras
de potencial entre os átomos (estamos a desprezar a possibilidade de efeito de túnel). Os electrões
da banda 2p podem mover-se ao longo do cristal, mas não se deve pensar por isso que estão livres
de forças; uma partı́cula livre pode ter qualquer energia(c) , ao passo que estes electrões têm uma
energia que deve estar compreendida entre os limites da banda a que pertencem. Um análogo
clássico do movimento destes electrões consiste numa esfera movendo-se num terreno ondulado,
com energia suficiente para vencer a altura das ondulações do terreno.
No estado fundamental (à temperatura de 0 K), somente as bandas de menor energia estão
ocupadas pelos electrões; destas, a de maior energia tem particular importância para o estudo das
propriedades dos sólidos, e designa-se por banda de valência do sólido. Esta designação é herdada
do nome da orbital atómica (chamada orbital de valência) que lhe dá origem.
Vamos agora estudar as propriedades das funções de onda de electrões que se movem num
potencial periódico.
6.2
O teorema de Bloch
Já referimos que a função energia potencial dos electrões, sendo resultante da sua interacção com
o meio cristalino, deve ser uma função periódica do espaço, com o mesmo perı́odo do cristal. A
Equação de Schrödinger independente do tempo é então
−
h̄2 ~ 2
∇ ψ(~r) + V (~r)ψ(~r) = εψ(~r),
2m
(6.1)
(c) Descontando o efeito de quantizações resultantes da imposição de condições fronteira que, de resto, é insignificante, neste contexto.
80
onde V (~r) é uma função periódica com a periodicidade da rede cristalina. O teorema de Bloch
afirma que as soluções da Eq. (6.1) têm a forma(d)
~
ψ~k (~r) = eik·~r u~k (~r),
(6.2)
onde u~k (~r) é uma função periódica do cristal, isto é, que verifica
~ = u~ (~r),
u~k (~r + R)
k
(6.3)
~ Um enunciado equivalente do teorema de Bloch é
qualquer que seja o vector da rede cristalina R.
o seguinte: as soluções da Equação de Schrödinger para potenciais cristalinos verificam a condição
~ ~
~ = eik·R ψ~ (~r),
ψ~k (~r + R)
k
(6.4)
~ É evidente que funções com a forma definida na
qualquer que seja o vector da rede cristalina R.
Eq. (6.2) gozam desta propriedade. Com efeito,
~
ψ~k (~r + R)
=
~
~ ~
~
~ ~
~
eik·~r eik·R u~k (~r + R)
=
eik·~r eik·R u~k (~r)
=
eik·R ψ~k (~r).
~ ~
Para demonstrar a implicação inversa, notamos que é possı́vel escrever qualquer função (e, portanto, também as soluções da Equação de Schrödinger) na forma
~
ψ~k (~r) = eik·~r f (~r),
desde que se escolha convenientemente a função f (~r). Mas então
~
~
~ + ~r) = eik·(R+~r) f (R
~ + ~r).
ψ~k (R
(6.5)
Por outro lado, aceitando a propriedade enunciada na Eq. (6.4), temos
~ + ~r) =
ψ~k (R
=
=
~ ~
eik·R ψ~k (~r)
~ ~
~
eik·R eik·~r f (~r)
e
~ r)
i~
k·(R+~
f (~r).
(6.6)
(6.7)
~ = f (~r), qualquer que seja o vector da
Comparando as eqs. (6.5) e (6.7) concluı́mos que f (~r + R)
~ ou seja, que f apresenta a periodicidade da rede cristalina exigida na Eq. (6.3).
rede cristalina R,
Agora que demonstrámos a equivalência dos dois enunciados do Teorema de Bloch, vamos
passar à sua demonstração. Dada a periodicidade do arranjo atómico nos cristais (ideais), todas
as funções da posição fisicamente observáveis devem apresentar a mesma periodicidade. A função
de onda dos electrões não é uma função fisicamente observável, e por isso não é, necessariamente,
~ um vector da rede cristalina, não podemos garantir a
uma função periódica. Assim, sendo R
~ = ψ(~r); podemos é, sem qualquer perda de generalidade, escrever
igualdade ψ(~r + R)
~ = s(R)ψ(~
~
ψ(~r + R)
r),
(6.8)
~ Em contrapartida, o quadrado do módulo da função
escolhendo cuidadosamente a função s(R).
de onda é, de acordo com a interpretação de Max Born, igual à densidade de probabilidade de
presença do electrão, ou seja, é uma função fisicamente observável. Logo, de acordo com o que se
(d)~
k
é um parâmetro vectorial que identifica o estado electrónico. Ao contrário do parâmetro ~k que identifica os
estados de electrões livres que temos estudado até agora, este não é proporcional ao momento linear dos electrões
de Bloch.
6.2. O TEOREMA DE BLOCH
81
disse acima, deve ser uma função periódica da posição com a periodicidade da rede, isto é, deve
verificar(e)
~
~ = ψ ∗ (~r)ψ(~r).
ψ ∗ (~r + R)ψ(~
r + R)
(6.9)
Substituindo aqui a Eq. (6.8), resulta que o quadrado do módulo da função s é unitário, qualquer
~ Logo, esta função tem necessariamente a forma
que seja o vector de rede R.
~
~ = eiχ(R) ,
s(R)
~ é alguma função escalar real de R.
~ Tomando então o caso particular R
~ = ~a, onde ~a é
onde χ(R)
um dos vectors fundamentais da rede cristalina, temos
ψ(~r + ~a) = eiχ(~a) ψ(~r).
Da mesma maneira,
ψ(~r + 2~a)
= ψ(~r + ~a + ~a)
= eiχ(~a) ψ(~r + ~a)
= e2iχ(~a) ψ(~r)
ou seja ainda, com n inteiro arbitrário,
ψ(~r + n~a) = einχ(~a) ψ(~r).
Considerando agora deslocamentos nas direcções dos outros vectores fundamentais (~b e ~c), e repetindo os mesmos argumentos que se aplicaram até agora, podemos concluir que a relação entre os
valores da função de onda em pontos equivalentes do cristal é
~
~ = ei[hχ(~a)+kχ(b)+lχ(~c)] ψ(~r),
ψ(~r + R)
(6.10)
~ isto é, se tem
onde os inteiros h, k, l são as componentes cristalográficas do vector de rede R,
~ = h~a + k~b + l~c.
R
Demonstrámos até agora que as soluções da Equação de Schrödinger numa região onde está definido
um potencial cristalino se transformam, sob translacções segundo vectores de rede de acordo com
a Eq. (6.10). Os valores das três quantidades χ(~a), χ(~b), χ(~c) distinguem as diferentes soluções
entre si. Estas três quantidades podem podem ser usadas para definir as componentes de um
vector ~k, através de
~k · ~a =
~k · ~b =
~k · ~c =
χ(~a)
χ(~b)
χ(~c).
~ e a Eq. (6.10) fica
Assim, a soma hχ(~a) + kχ(~b) + lχ(~c) pode escrever-se simplesmente como ~k · R,
~ ~
~ = eik·R ψ(~r),
ψ(~r + R)
(6.11)
em conformidade com o segundo enunciado do teorema de Bloch, concluindo-se assim a sua demonstração.
A forma das funções de onda de electrões que se movem num cristal, apresentada na Eq. (6.2),
~
é a de ondas planas monocromáticas eik·~r , moduladas por funções com a periodicidade cristalina u~k (~r). Na Figura 6.5 apresenta-se um exemplo das funções uk (x) e ψk (x), numa situação
unidimensional.
(e) O
asterisco em ψ ∗ representa o complexo conjugado de ψ.
82
uk(x)
-2a
-a
a
2a
a
2a
0
ψk(x)
-2a
-a
0
Figura 6.5: Exemplo de função de Bloch. No gráfico de cima está representada a função moduladora
uk (x), com perı́odo a; no de baixo representa-se a função de onda propriamente dita, ψk (x), (a cheio),
bem como a onda plana modulada exp(ikx) (a tracejado).
6.3
6.3.1
Propriedades dos estados de Bloch
Periodicidade no espaço recı́proco
Como já se disse, as diferentes soluções da Equação de Schrödinger para os electrões num cristal
distinguem-se pela forma como se transformam sob translacções segundo vectores da rede cristalina. Mais concretamente, distinguem-se pelas componentes do vector ~k, de acordo com a Eq. (6.4).
~ onde G
~ é
Consideremos duas soluções particulares caracterizadas pelos vectores ~k e ~k 0 = ~k + G,
um vector da rede recı́proca do cristal qualquer. Segundo o teorema de Bloch, estas duas funções
~ como
de onda transformam-se sob translacções segundo o vector da rede R
~ ~
~
=
ψ~k (~r + R)
eik·R ψ~k (~r)
~
=
ψ~k0 (~r + R)
eik ·R ψ~k0 (~r).
~0 ~
Explicitemos o vector ~k 0 nesta última equação. Resulta então
~ R
~
~ = ei(~k+G)·
ψ~k+G
r + R)
ψ~k+G
r).
~ (~
~ (~
~ ~
Recordemos agora que, por definição de vector da rede recı́proca, se tem que eiG·R = 1, para todos
~ da rede recı́proca e para todos os vectores, R,
~ da rede directa. Então a função
os vectores, G,
tem,
sob
translacções
segundo
vectores
de
rede,
um comportamento idêntico ao
de onda ψ~k+G
~
da função ψ~k ; logo, estas duas funções são indistinguı́veis, ou seja, representam o mesmo estado
electrónico. Para se evitar, no cálculo das propriedades da nuvem electrónica, a contabilização
repetida da contribuição de um dado estado, devemos ter cuidado com este tipo de indistinguibilidade escondida das funções de onda. A forma mais simples de assegurar que não se cometem
erros relacionados com esta questão é considerar apenas vectores ~k pertencentes todos a uma
mesma célula unitária primitiva da rede recı́proca. Como se sabe, é sempre possı́vel escolher para
qualquer rede uma grande diversidade de formas para as células unitária primitivas. Neste caso,
escolhe-se sempre a célula de Wigner-Seitz (ver a Secção 2.2, e a Figura 2.3) da rede recı́proca,
mais usualmente conhecida como primeira zona de Brillouin.
Uma consequência importante da indistinguibilidade de dois estados de Bloch cujos vectores
~k diferem entre si por um vector da rede recı́proca é que todas as propriedades fı́sicas dos estados
electrónicos devem ser funções periódicas de ~k, com a periodicidade da rede recı́proca. Com efeito,
seja X(~k) o valor da propriedade X para um electrão num estado cuja função de onda é ψ~k ; uma
~
vez que o mesmo estado pode ser representado por qualquer das funções ψ~k+G
~ , com G vector
arbitrário da rede recı́proca, o cálculo da propriedade X deve produzir o mesmo valor quando
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
83
realizado a partir de qualquer destas funções, isto é,
~ = X(~k),
X(~k + G)
6.3.2
~ vector da rede recı́proca.
∀G
Nı́veis de energia dos estados de Bloch
Substituindo na Equação de Schrödinger as soluções de Bloch da Eq. (6.2), obtemos a equação
diferencial a satisfazer pelas funções u~k (~r),
−
i2
h̄2 h ~
∇ + i~k u~k (~r) + V (~r)u~k (~r) = ε(~k)u~k (~r).
2m
(6.12)
Esta equação, formalmente semelhante à Equação de Shrödinger, é uma equação de valores
próprios para o operador
i2
h̄2 h ~
∇ + i~k + V (~r),
H~k = −
2m
que depende de um parâmetro vectorial que é o vector ~k. Para cada valor de ~k, este operador deve
apresentar um conjunto de funções próprias, u1~k (~r), u2~k (~r), . . ., un~k (~r), . . ., às quais correspondem
os valores próprios (nı́veis de energia) ε1 (~k), ε2 (~k), . . ., εn (~k), . . ., e tanto aquelas como estes
devem ser funções contı́nuas do parâmetro ~k. Mais ainda, como vimos na Secção 6.3.1, os diversos
nı́veis de energia εn (~k) devem ser funções periódicas de ~k. Ora, funções contı́nuas e periódicas
são necessariamente funções limitadas, pelo que devemos ter cada nı́vel de energia εn (~k) a tomar
valores num intervalo bem limitado de energias. O espectro energético dos electrões num metal
deve pois ter um aspecto que pode, qualitativamente, ser representado como mostra a Figura 6.6.
Chama-se banda ao conjunto de estados electrónicos un~k (~r) para cada valor de n. Nesta figura
ε
n
ε
n
n=3
ε
3k
n=2
ε
2k
n=1
ε
1k
− π /a
(a)
π /a
k
(b)
Figura 6.6: (a) Nı́veis de energia atómicos, resultantes da resolução da Equação de Schrödinger
para um potencial atómico; (b) Bandas de energia dos estados electrónicos de um sólido. As bandas
propriamente ditas são os intervalos representados a sombreado, ao longo do eixo da energia. As
formas apresentadas para as funções εn (~k) são arbitrárias.
apenas estão representados os valores de ~k pertencentes à primeira zona de Brillouin porque, como
já vimos, vectores ~k fora desta região representam estados que já têm correspondência nalgum
vector ~k no seu interior e portanto, neste sentido, são redundantes. Na Figura 6.6 as bandas de
energia estão separadas por um intervalo de energias proibidas: esta situação corresponde ao que
de facto se passa em muitos sólidos, mas é possı́vel (se bem que pouco frequente) que duas bandas
de energia se sobreponham. Ao intervalo de energias proibidas entre duas bandas dá-se o nome
de hiato energético, mas é mais usual a utilização da expressão, “aportuguesada” do inglês, “gap
de energia”.
84
Dentro de cada banda, a energia dos estados electrónicos é uma função periódica do vector ~k.
Esta função é, em geral, muito mais complicada do que a que caracteriza os estados de electrões
livres. A sua forma depende da estrutura cristalina do sólido em que se movem os electrões, que
está representada, na equação que define a energia [Eq. (6.12)], pelo termo correspondente ao
potencial electrónico V (~r). Em geral, a energia de um estado depende também da direcção do
vector k e não apenas do seu módulo, como acontece com os estados de electrões livres. Mas esta
dependência não é de todo arbitrária. Vamos de seguida demonstrar que a energia é uma função
par de ~k, isto é, que
εn (~k) = εn (−~k).
(6.13)
Tomando o complexo conjugado da Eq. (6.12) e fazendo a substituição ~k → −~k obtemos
−
i2
h̄2 h ~
∇ + i~k u∗n −~k (~r) + V (~r)u∗n −~k (~r) = εn (−~k)u∗n −~k (~r).
2m
(6.14)
onde u∗ representa o complexo conjugado de u(f) . Mas as eqs. (6.12) e (6.14) são idênticas e por
isso as suas soluções devem ser as mesmas; logo, podemos concluir que u∗n−~k (~r) = un~k (~r) e, mais
importante para o que nos interessa,
εn (~k) = εn (−~k),
como querı́amos demonstrar.
6.3.3
Momento linear
As funções de onda de Bloch, ψ~k (~r), representam os estados estacionários de electrões que se movem
numa região (o cristal) onde a sua energia potencial, que traduz as interacções com o meio, é uma
função periódica da posição. A expressão “estados estacionários” significa que um electrão que
ocupe um destes estados permanece nele enquanto não for perturbado por agentes externos ou por
alterações do meio em que se move (defeitos no cristal, por exemplo). Estes estados distinguem-se entre si pelo parâmetro vectorial ~k, que está relacionado com a forma como se transformam
sob translacções segundo vectores da rede. Isto é, o vector ~k (de que não conhecemos ainda o
significado fı́sico) é uma constante do movimento de um electrão de Bloch no estado ψ~k . Por
outro lado, o momento linear de um electrão de Bloch não deve ser uma constante do movimento,
já que um electrão que se move numa região onde está definido um potencial periódico está
sujeito a forças que se traduzem em acelerações, ou seja, em alterações do seu momento linear.
Assim, não podemos identificar h̄~k com o momento linear dos electrões no estado de Bloch ψ~k ,
como fizemos no estudo dos electrões livres. Esta conclusão é ainda reforçada pela aplicação do
operador quantidade de movimento ao estado ψ~k . De acordo com as regras da Mecânica Quântica,
os estados caracterizados por valores bem determidados do momento linear são os estados próprios
~ = −ih̄∇.
~ Ora, com ψ~ dado pela Eq. (6.2), temos
do operador associado a este observável, P
k
³
´
~ ~ (~r) = ei~k·~r h̄~k − ih̄∇
~ u~ (~r),
Pψ
k
k
expressão que não corresponde a uma equação de valores próprios. Assim, as funções de Bloch não
são funções próprias do operador do momento linear e, portanto, um electrão num estado de Bloch
não apresenta um valor bem determinado deste observável. No entanto, o vector h̄~k tem, como
veremos já de seguida, um papel importante na dinâmica dos electrões de condução nos metais,
muito semelhante ao do momento linear de electrões livres. Para realçar esta semelhança formal,
dá-se o nome de momento linear cristalino de um electrão no estado de Bloch ψ~k ao vector h̄~k.
Usaremos também a expressão “vector de onda cristalino” para nos referirmos ao vector ~k.
(f) As
r) = V (~
r) e ε∗n (~k) = εn (~k).
energias são grandezas reais e por isso V ∗ (~
6.3.4
85
Velocidade média e momento linear cristalino
A expressão para o cálculo da velocidade de electrões livres, ~v = h̄~k/m, não pode ser adoptada para
electrões em estados de Bloch, uma vez que o seu momento linear não é dado por p~ = h̄~k. Como
já se disse, electrões em estados de Bloch não apresentam um momento linear bem determinado
e, logo, o mesmo se passa com a velocidade. Podemos, quando muito, determinar os resultados
possı́veis de uma medição da velocidade e as respectivas probabilidades e, a partir destes valores,
calcular o valor expectável da velocidade.
Um problema relacionado com este é o da determinação da velocidade de propagação de um
sinal que não é caracterizado por um comprimento de onda bem determinado. Uma perturbação
puramente sinusoidal (isto é, uma onda com comprimento de onda, λ, e frequência, ν, bem determinados) propaga-se no meio que a suporta com uma velocidade, chamada velocidade de fase,
cujo módulo é
ω
v = λν = ,
(6.15)
k
onde se introduziram os parâmetros ω = 2πν e k = 2π/λ. A dificuldade do cálculo da velocidade
de sinais não puramente sinusoidais é a seguinte. Consideremos um sinal não sinusoidal arbitrário
f (x, t) (esta função pode, por exemplo, representar o som de um trovão). É possı́vel escrever a
função f (x, t) como combinação linear de funções sinusoidais com diferentes frequências e comprimentos de onda, usando as técnicas da análise de Fourier. Descrevemos desta maneira o sinal em
questão como a sobreposição de várias funções puramente sinusoidais. Cada uma destas componentes sinusoidais, caracterizada por valores bem determinados de k e de ω, tem uma velocidade de
fase dada pela Eq. (6.15), mas as velocidades das diferentes componentes não são, em geral, todas
iguais, logo, não podem ser identificadas com a velocidade da propagação do sinal. Em vez disso,
identifica-se esta velocidade de propagação com a do ponto onde o sinal tem amplitude máxima.
Este valor tem o nome de velocidade de grupo do sinal. Pode demonstrar-se que a velocidade de
grupo é dada por
dω
vG =
.
(6.16)
dk
Note-se que para ondas puramente sinusoidais, a velocidade de fase é igual à de grupo.
Voltemos agora ao problema que motivou esta pequena digressão, o problema da velocidade
dos electrões em cristais. A velocidade média das partı́culas quânticas é, em geral, identificada
com a velocidade de grupo da sua função de onda. Assim, dizemos que o valor expectável da
velocidade de um electrão num estado de Bloch ψk é
v(k) =
dω(k)
1 d²(k)
=
,
dk
h̄ dk
onde se usou a bem conhecida igualdade de Plank ² = h̄ω. Considerando agora o mesmo problema
em três dimensões, Introduzimos o operador gradiente no espaço recı́proco, dado por
grad~k ≡ î
∂
∂
ˆ ∂
+ ĵ
+ ~k
,
∂kx
∂ky
∂kz
sendo então a velocidade média dos electrões de Bloch dada por
~vG = grad~k ω(~k) =
1
grad~k ε(~k).
h̄
(6.17)
Esta velocidade de grupo, que identificamos com a velocidade dos electrões, representa o valor
expectável do observável velocidade. É, assim, o valor médio da velocidade dos electrões nos
estados de Bloch.
Como é bem sabido, o gradiente de uma função tem a direcção em que é máxima a variação
da função, perpendicular às suas superfı́cies de nı́vel. Logo, a velocidade de um electrão de Bloch,
num estado com vector de onda cristalino ~k, é perpendicular à superfı́cie de nı́vel da energia nesse
ponto ~k. Em particular, os electrões que se encontram na superfı́ce de Fermi têm uma velocidade
que é perpendicular a essa superfı́cie (veja a Figura 6.7).
86
ky
v
k
k
kx
v
Figura 6.7: A velocidade, ~v , e o vector de onda cristalino ~k. A velocidade é, para cada estado ~k,
~
. perpendicular à superfı́cie de nı́vel da energia para esse valor de k.
Um electrão num estado de Bloch, sujeito apenas à interacção com um cristal ideal, tem uma
energia bem definida, constante do movimento. Contudo, se se definir no cristal, para além dos
campos que que são intrinsecamente caracterı́sticos, um campo de forças externas, F~ , então o
electrão adquire desse campo de forças energia, a uma taxa temporal dada por
dε
= ~v · F~ ,
dt
(6.18)
sendo ~v o vector velocidade média do electrão em estudo. Mas a velocidade média é uma função
de ~k; logo,
∂ε dki
dε
=
.
dt
∂ki dt
Adoptou-se aqui a covenção de soma sobre ı́ndices repetidos de Einstein, isto é, subentende-se uma
soma para todos os valores do ı́ndice i = 1, 2, 3 no lado direito desta expressão. Esta convenção será
adoptada daqui em diante, salvo indicações explı́citas em contrário. Substituindo esta expressão
na Eq. (6.18), obtemos
∂ε dkj
= ~v · F~ .
∂kj dt
Usando agora a fórmula da velocidade [Eq. (6.17)], podemos reescrever a expressão acima como
h̄vj
dkj
= vecv · F~ ,
dt
~v ·
d(h̄k)
= ~v · F~ ,
dt
ou ainda
o que autoriza a identificação
d
F~ = (h̄~k).
dt
Esta equação é semelhante à que traduz a segunda lei de Newton,
(6.19)
d~
p
F~ =
,
dt
com o vector h̄~k a desempenhar o papel de momento linear dos electrões de Bloch. No entanto,
voltamos a recordar que, para a taxa de variação do momento linear dos electrões no cristal
contribuem as forças exteriores F~ , mas contribuem também as forças de interacção com o cristal
de iões, forças essas que não são contabilizadas na Eq. (6.19). Assim, podemos considerar o
vector h̄~k como uma espécie de momento linear efectivo dos electrões num cristal, conceito que
permite algumas simplificações, já que apenas as forças exteriores ao cristal contribuem para a
sua modificação.
6.3.5
87
Massa efectiva dos electrões de Bloch
Consideremos agora um electrão de Bloch sujeito a uma força externa F~ . A aceleração que adquire
por estar sob a acção desta força pode ser calculada como
ai =
dvi
∂vi dkj
=
.
dt
∂kj dt
Substituindo aqui a expressão da velocidade dos electrões de Bloch e da derivada do momento
linear cristalino [respectivamente, as eqs. (6.17) e (6.19)], obtemos
ai =
1 ∂2ε
Fj .
h̄2 ∂ki ∂kj
(6.20)
Esta expressão é muito parecida com a da segunda lei de Newton(g) e exprime a aceleração de
um electão que se move num cristal como resultado apenas das forças que sobre ele actuam
exteriores ao cristal, não considerando a influência das interações com o cristal. Este resultado é,
obviamente, extremamente útil e prático, mas o preço a pagar por esta simplificação é a introdução
de um parâmetro matricial variável que substitui a massa dos electrões de Bloch, chamado tensor
da massa efectiva, que se representa por m∗ e é a matriz inversa da matriz
−1
[m∗ ]ij =
1 ∂2ε
.
h̄2 ∂ki ∂kj
(6.21)
Um electrão move-se num cristal de forma bastante complicada, sujeito como está às forças
exercidas pelos átomos que formam o cristal, mas acabámos de ver que podemos simplificar bastante o seu estudo, substituindo na lei do movimento a sua massa pelo tensor da massa efectiva,
após o que basta apenas considerar, nas leis do movimento, as forças exteriores, como campos
eléctricos aplicados, etc. Claro que a matriz da massa efectiva tem que apresentar algumas particularidades que não esperamos encontrar na massa dos objectos comuns. Por exemplo, em geral
a aceleração de um electrão de Bloch não tem a direcção da força que a provoca. Além disso, a
matriz da massa efectiva é variável, as suas componentes têm valores diferentes conforme a magnitude e a orientação do vector ~k. Assim, pode acontecer que dois campos de forças iguais, mas com
orientações diferentes, produzam acelerações diferentes. Desta maneira, podemos explicar porque
é que alguns sólidos (a grafite, p. ex.) apresentam condutividades que variam com a orientação da
corrente eléctrica. É também possı́vel que, para valores particulares de ~k, algumas componentes
(ou mesmo todas) do tensor da massa efectiva sejam negativas; nestes casos, campos aplicados
numa direcção produzem correntes com direcções opostas...
Já agora, é interessante verificar qual a forma do tensor de massa efectiva para electrões livres,
situação que conhecemos melhor. O movimento de electrões livres é, de facto, apenas condicionado
pelas forças exteriores ao cristal, uma vez que as forças internas são desprezadas. Então esperamos
que a massa efectiva seja neste caso igual à massa real. De facto, a aplicação da Eq. (6.21) com a
função energia de electrões livres, dada por
h̄2 k 2
ε(~k) =
,
2m
permite obter o resultado
1
δij ,
m
é o sı́mbolo delta de Kronecker, cujos elementos são os da matriz identidade,
½
0,
i 6= j
δij =
1,
i = j.
−1
[m∗ ]ij =
onde δij
(g) As
leis da Fı́sica Clássica, não têm nada que ser satisfeitas por electrões, poderão dizer. Assim é, de facto. Mas
note-se que a aceleração ~a em (6.20) é a derivada do valor expectável da velocidade que, de acordo com o teorema
de Ehrenfest, satisfaz uma expressão formalmente semelhante à lei fundamental da dinâmica de Newton.
88
−1
Assim, a matriz [m∗ ] é diagonal e todos os seus elementos são iguais, logo a sua inversa, que é
o tensor da massa efectiva, é, simplesmente,
[m∗ ]ij = mδij ,
como já esperávamos.
6.3.6
O livre caminho médio
Vimos no capı́tulo anterior que é difı́cil entender os valores obtidos no quadro dos modelos de
electrões livres para o livre caminho médio dos electrões, que considerámos demasiado elevado.
Com efeito, nos modelos de electrões livres, supõe-se que os electrões de condução sofrem colisões
com os iões que formam o cristal, mas os valores previstos para o livre caminho médio resultam ser
centenas de vezes superiores à distância interatómica, para temperaturas próximas da temperatura
ambiente.
Este problema é resolvido no quadro da teoria de Bloch, mas devemos, antes de mais, clarificar o significado de colisão. Uma colisão entre dois corpos é uma alteração dos seus estados
de movimento como resultado da interacção mútua. Classicamente, caracterizamos o estado de
movimento de uma massa pontual através do seu momento linear; uma colisão entre dois corpos
clássicos pontuais é pois um processo de influência mútua em que se alteram os seu momentos
lineares. Nos modelos de electrões livres, o estado de um electrão é especificado pelo vector ~k, que
é proporcional ao momento linear. As colisões destas partı́culas com os iões da rede provocam
alterações no vector ~k, ou seja, na quantidade de movimento. Na mesma ordem de idéias, devemos
aceitar que, na teoria de Bloch, a colisão de um electrão com o que quer que seja deve manifestar-se
como uma alteração do seu estado, isto é, como uma alteração do vector ~k. Mas, já se disse, um
electrão que ocupa, num cristal ideal, um estado de Bloch ψn~k (~r), permanece nesse estado se não
se verificarem influências externas que o perturbem, porque os estados de Bloch têm já em linha de
conta as interacções com a rede cristalina. Assim, neste sentido, os electrões de Bloch não sofrem
colisões com os iões da rede. Podem, isso sim, modificar o seu estado, mas apenas por colisões
contra as fronteiras do cristal, contra fonões (vibrações do cristal), contra impurezas, em suma,
contra defeitos no cristal, qualquer que seja a sua natureza. Ora, os defeitos cristalinos estão muito
mais afastados entre si do que os iões da rede, pelo que se percebem agora os elevados valores que
obtivemos para o livre caminho médio dos electrões. A conclusão é a seguinte: tanto quanto se
possa considerar o cristal como perfeito (isto é, absolutamente periódico), os electrões não sofrem
modificação de estado, ou seja, colisões; estas devem ocorrer nas excepções à periodicidade, isto
é, nos defeitos cristalinos. Os electrões de Bloch não sofrem colisões com os átomos regularmente
dispostos no cristal, mas apenas com os defeitos no cristal, que estão mais afastados entre si que
os átomos que o constituem. Por esta razão, o caminho livre médio dos electrões de condução deve
ser muito maior do que as distâncias interatómicas tı́picas nos sólidos, em conformidade com os
resultados obtidos no quadro dos modelos de electrões livres.
6.4
Modelo de Krönig-Penney
(Nota: O estudo desta Secção não é indispensável para a compreensão do resto da matéria e pode ser
omitido.)
Vamos agora ilustrar o conteúdo das secções precedentes recorrendo a um modelo simples de
cristal unidimensional, o modelo de Krönig-Penney. Este modelo descreve os estados de uma
partı́cula quântica que se move numa região onde está definido um potencial que é uma sucessão
de barreiras de potencial rectangular idênticas, regularmente espaçadas entre si (ver a Figura 6.8).
Nós vamos usar uma versão particularmente simples do deste modelo, em que a largura, l, das
barreiras tende para zero, enquanto a sua altura, V , cresce de maneira a manter constante o
produto lV . No limite, cada barreira fica igual a uma função delta de Dirac(h) . A função potencial
(h) A
função delta só é diferente de zero num único ponto, mas o seu integral em qualquer intervalo que contenha
6.4. MODELO DE KRÖNIG-PENNEY
89
V(x)
V
x
a
l
V(x)
x
-2a
-a
0
a
2a
Figura 6.8: Potencial do modelo de Krönig-Penney (em cima). Em baixo, o potencial usado neste
trabalho: a largura, l, das barreiras diminui até zero, enquanto a sua altura, V , aumenta indefinidamente, de tal forma que o produto lV permanece constante.
que vamos usar é, então,
V (x) =
∞
h̄2 λ X
δ(x − na),
2m a n=−∞
(6.22)
onde λ é um parâmetro adimensional que pode ser usado para regular a intensidade do potencial
cristalino. Podemos até estudar o limite de electrões livres escolhendo λ = 0. Este potencial é um
caso particular dos potenciais contı́nuos por intervalos que se constumam estudar nas disciplinas
de introdução à Mecânica Quântica. A resolução da Equação de Schrödinger nestes casos é feita
separadamente em cada região de continuidade do potencial, impondo-se em seguida condições
de continuidade da função de onda nos pontos em que o potencial é descontı́nuo. Vamos então
dividir a recta real em regiões de continuidade da função potencial, que designaremos por R0 ,
R±1 , R±2 . . . , sendo Rn o intervalo (n − 1)a < x < na. Em qualquer destas regiões, a Equação de
Schrödinger escreve-se como
h̄2 d2
−
ψ = ²ψ
2m dx2
e, para ² positivo, admite soluções do tipo (tomamos a região Rn para concretizar a discussão)
ψ (n) (x) = Xn eikx + Yn e−ikx
ou, equivalentemente (basta tomar An = Xn eikna , Bn = Yn e−ikna ),
ψ (n) (x) = An eik(x−na) + Bn e−ik(x−na) .
(6.23)
Nestas expressões, k está relacionado com a energia do estado, ², através de
k2 =
2m²
.
h̄2
(6.24)
esse ponto é 1. Mais rigorosamente, a função delta define-se através das seguintes propriedades:
Z
δ(x − a)
=
0,
se x 6= a
f (x)δ(x − a)
=
f (a),
∀² > 0.
a+²
a−²
90
Na região contı́gua Rn+1 , e usando as mesmas convenções, a função de onda escreve-se
ψ (n+1) (x) = An+1 eik(x−[n+1]a) + Bn+1 e−ik(x−[n+1]a) .
(6.25)
A solução da Equação de Schrödinger é a união das diferentes funções ψ (n) , união essa que deve
ser feita de modo a satisfazer certas condições de continuidade. Antes, porém, de estudarmos a
continuidade da função de onda, devemos notar que, sendo o potencial uma função periódica da
posição, estamos nas condições do teorema de Bloch. Logo, as soluções da Equação de Schrödinger
devem satisfazer a condição
ψq (x + a) = eiqa ψq (x),
onde q é um parâmetro real, que caracteriza a função de onda particular ψq tal como os números
n, l, ml , ms caracterizam as funções de onda de electrões atómicos. Note-se que esta condição
envolve o valor da função de onda em diferentes células unitárias do nosso cristal unidimensional,
ou diferentes regiões, de acordo com a designação que temos usado. Tomando x na região Rn ,
x + a pertence à região Rn+1 ; a condição de Bloch pode pois escrever-se como
ψq(n+1) (x + a) = eiqa ψq(n) (x),
ou seja,
h
i
An+1 eik(x−na) + Bn+1 e−ik(x−na) = eiqa An eik(x−na) + Bn e−ik(x−na) .
Agrupando potências com expoentes iguais, obtemos
£
¤
£
¤
eik(x−na) An+1 − eiqa An + e−ik(x−na) Bn+1 − eiqa Bn = 0,
que só pode ser satisfeita para todos os valores de x se se anularem os coeficientes das exponenciais,
isto é, se
An+1 = eiqa An
(6.26)
Bn+1 = eiqa Bn
Faremos uso destas relações mais adiante. Vamos agora estudar as condições fronteira a satisfazer
pela função de onda. Em primeiro lugar, a função de onda deve ser uma função contı́nua. Assim,
num ponto x = na que é partilhado pelas regiões Rn e Rn+1 , devemos ter ψ (n) (na) = ψ (n+1) (na),
ou seja,
An+1 e−ika + Bn+1 eika = An + Bn .
(6.27)
Quando o potencial não tem descontinuidades infinitas, a derivada da função de onda é, também,
uma função contı́nua, mas esse não é o caso aqui.
Para deduzirmos a forma das condições fronteira a satisfazer pela derivada da função de onda,
integremos a Equação de Schrödinger,
−
h̄2 d2 ψ
+ V (x)ψ(x) = ²ψ(x),
2m dx2
num pequeno intervalo centrado num ponto x0 , com largura 2δ. Temos então
h̄2
−
2m
Z
x0 +δ
x0 −δ
d2 ψ
+
dx2
Z
Z
x0 +δ
x0 +δ
V (x)ψ(x)dx = ²
x0 −δ
ψ(x)dx.
x0 −δ
No limite em que δ → 0, o integral no segundo membro desta equação anula-se, porque a função
de onda é contı́nua; o primeiro integral é fácil de calcular, por ser o integral de uma derivada.
Resulta então
"µ ¶
#
µ ¶
Z x0 +δ
dψ
dψ
h̄2
lim
−
+ lim
V (x)ψ(x)dx = 0,
−
δ→0 x −δ
2m δ→0
dx x0 +δ
dx x0 −δ
0
6.4. MODELO DE KRÖNIG-PENNEY
ou ainda
µ
dψ
dx
¶
µ
−
x0 +
dψ
dx
91
¶
x0 −
2m
= 2 lim
h̄ δ→0
Z
x0 +δ
V (x)ψ(x)dx,
(6.28)
x0 −δ
onde (F )x0 ± representa o limite de F quando o seu argumento tende para x0 por valores superiores
a x0 (sinal +) ou por valores inferiores a x0 (sinal -). Esta condição de continuidade para a derivada
da função de onda tem validade geral, em problemas unidimensionais. No nosso caso, atendendo
à forma particular do potencial, temos, para x0 = na,
Z na+δ
h̄2 λ
ψ(x = na).
V (x)ψ(x)dx =
2m a
na−δ
Por outro lado, as duas derivadas obtêm-se facilmente a partir das expressões [eqs. (6.23) e (6.25)]
da função de onda nas duas regiões separadas pelo ponto de abcissa x = na:
dψ (n)
dx
dψ (n+1)
dx
= ikAn eik(x−na) − ikBn e−ik(x−na)
= ikAn+1 eik(x−[n+1]a) − ikBn+1 e−ik(x−[n+1]a) .
Então, podemos escrever a condição geral da Eq. (6.28) como
µ
¶
µ
¶
iλ
iλ
−ika
ika
An+1 e
− Bn+1 e = An 1 −
− Bn 1 +
.
ka
ka
(6.29)
Usando agora a Eq. (6.26) para eliminar os coeficientes An+1 e Bn+1 das eqs. (6.27) e (6.29),
obtemos o seguinte sistema de duas equações homogéneas:
h
i
h
i
ei(q−k)a − 1 An + ei(q+k)a − 1 Bn = 0
¸
·
¸
·
iλ
iλ
i(q+k)a
i(q−k)a
An − e
−1−
Bn = 0.
e
−1+
ka
ka
Como qualquer sistema homogénio, este admite a solução trivial An = 0 = Bn = 0, ou seja, ψ = 0,
que não nos interessa. Soluções não triviais verificam-se apenas quando o determinante da matriz
formada com os coeficientes do sistema se anular. Após algumas manipulações algébricas, esta
condição leva à seguinte equação transcendental:
cos qa = cos ka +
λ sin ka
.
2 ka
(6.30)
Esta igualdade define uma relação entre o parâmetro q que caracteriza as diferentes soluções da
Equação de Schrödinger e o parâmetro k que define a energia dessas soluções. Dado um valor de q
“basta” resolver esta equação em ordem a k para obter a energia correspondente, usando a relação
da Eq. (6.24). Infelizmente, esta relação entre k e q é transcendental, logo, não pode ser resolvida
analiticamente. Além disso, para certos valores de k não é possı́vel verificá-la. Com efeito, o
lado esquerdo está limitado ao intervalo [−1, 1]; logo, não podem existir soluções para todos os
valores de k em que o lado direito saia deste intervalo. Na Figura 6.9 apresenta-se o gráfico da
função no lado direito desta equação, assinalando-se as regiões em que não existem soluções não
triviais. Como a energia de um estado depende do valor de k [ver a Eq. (6.24)], estes intervalos
para os quais não há soluções da Equação de Schrödinger correspondem a hiatos de energia. Não
há estados estacinários de uma partı́cula num potencial de Krönig-Penney com energia situada
nesses intervalos proibidos.
Como se disse, a igualdade da Eq. (6.30) relaciona a energia dos estados permitidos (através da
interposta “pessoa” do parâmetro k) com o parâmetro q que os carateriza. Essa relação não pode
ser explicitada analiticamente, porque a Eq. (6.30) é uma equação transcendental. No entanto,
podemos tentar a seguinte abordagem numérica: dado um valor de q, variamos k (e, portanto, ²)
92
4
3
2
1
x=ka
0
2
4
6
8
10
12
-1
Figura 6.9: Gráfico da função no segundo membro da Eq. (6.30). Para os valores da abcissa (x = ka)
nas regiões sombreadas, não existem soluções da Equação de Schrödinger; correspondem aos gaps de
energia.
ε (k)
ε (k)
3a banda
2a banda
1a banda
-
π/ a
0
q
π/ a
q
-
π/ a
0
π/ a
Figura 6.10: Estrutura de bandas do modelo de Krönig-Penney. Notam-se claramente os hiatos
energéticos. Para comparação, apresenta-se à direita a estrutura de “bandas” no modelo de electrões
livres, obtida escolhendo λ = 0 no potencial da Eq. (6.22). A presença do potencial periódico abre os
gaps, deformando ligeiramente a curva ²(q) na fronteira da zona de Brillouin e “empurrando” para
cima os ramos superiores dessa curva.
6.5. NÚMERO DE ESTADOS POR BANDA
93
até que a diferença entre os valores dos dois lados da Eq. (6.30) seja menor que um determinado
limiar, caso em que dizemos que a igualdade foi satisfeita. Usando este processo, muito rudimentar,
foi possı́vel desenhar o gráfico da Figura 6.10. Escolheu-se para λ o valor λ = 2π. Note-se que,
com λ = 0, o potencial é constante, pelo que o potencial de Krönig-Penney nesse caso é o de
partı́culas livres. Nesse caso, a Eq. (6.30) fica simplesmente
cos qa = cos ka,
que tem como solução k = q, e a energia fica ² = h̄2 q 2 /2m, a expressão caracterı́stica de partı́culas
livres, que também é apresentada na Figura 6.10.
6.5
Número de estados por banda
A resolução de uma equação diferencial (como a de Schrödinger) não fica completa sem a imposição
de condições a satisfazer pela solução particular requerida. Apesar de não resolvermos completamente a Equação de Schrödinger [ou a sua versão de Bloch (6.12)] é útil a imposição de condições
fronteira, que reduzem número de estados de Bloch que é necessário considerar. Como no estudo
dos modelos de electrões livres, escolhemos as condições fronteira periódicas. No entanto, em vez
de as aplicarmos a um volume cúbico de aresta L, é mais conveniente [devido à presença da função
periódica un~k (~r) na expressão geral dos estados de Bloch (6.2)] considerar um volume com a forma
da célula unitária primitiva do cristal em estudo, contendo um número inteiro, N , destas células
unitárias primitivas (ver a Figura 6.11). As dimensões lineares desta região são Na |~a|, Nb |~b| e
N c
c
N a
a
c
b
a
N b
b
Figura 6.11: Forma da região considerada na imposição das condições fronteira.
Nc |~c| onde Na , Nb e Nc são números inteiros, tais que o número de células unitárias, N , presentes
no volume considerado é dado por
N = Na Nb Nc .
As condições fronteira periódicas podem então ser expressas como
ψn~k (~r + Na~a) =
ψn~k (~r + Nb~b) =
ψn~k (~r)
ψn~k (~r + Nc~c) =
ψn~k (~r).
ψn~k (~r)
(6.31)
De acordo com o teorema de Bloch, a primeira das equações em (6.31) pode ainda ser escrita na
forma
~
eiNa k·~a ψn~k (~r) = ψn~k (~r)
(6.32)
ou ainda
~
eiNa k·~a = 1.
(6.33)
94
De igual modo, obtemos para a segunda e terceira das eqs. (6.31)
~~
eiNb k·b
e
iNc~
k·~
c
=
=
1
1.
Recordando a definição de vector da rede recı́proca, verificamos que estas igualdades são verificadas
se o vector ~k fôr da forma
~k = ma A
~ + mb B
~ + mc C,
~
(6.34)
Na
Nb
Nc
~ B
~ eC
~ são os vectores fundamentais primitivos da
onde ma , mb e mc são inteiros arbitrários e A,
rede recı́proca. Note-se que Eq. (6.34) não implica que ~k seja um vector da rede recı́proca, porque
ma /Na , mb /Nb e mc /Nc não são, necessariamente, números inteiros. Tal como no estudo dos
electrões livres, verificamos que os estados electrónicos permitidos formam um conjunto discreto,
porque ~k só pode assumir os valores definidos pela Eq. (6.34). Os valores permitidos para o vector
~k formam uma rede cristalina, com vectores fundamentais primitivos A/N
~ a , B/N
~ b e C/N
~ c.
Estamos agora em condições de determinar o número de estados numa banda. Como se disse,
devemos considerar apenas vectores ~k pertencentes a uma única célula unitária primitiva da rede
recı́proca, que tem um volume
~·B
~ × C|.
~
Ω = |A
(6.35)
Por outro lado, o volume de espaço-k ocupado por cada um dos vectores ~k permitidos é o volume
da célula unitária primitiva da rede por eles definida, de acordo com a Eq. (6.34),
¯
¯
¯A
~
~ ¯¯
C
¯ ~ B
τ = ¯
·
×
¯
¯ Na Nb
Nc ¯
¯
¯
1
¯~ ~
~ ¯¯ = Ω .
=
¯A · B × C
Na Nb Nc
N
O número de vectores ~k que “cabem” numa célula é então o volume disponı́vel, Ω, a dividir pelo
volume ocupado por cada um, τ , ou seja, N . Considerando ainda que para cada valor de ~k existem
dois estados electrónicos (spin up ou spin down), concluimos que o número total de estados numa
banda é 2N , onde, recorda-se, N é o número total de células unitárias primitivas que formam a
região considerada para a imposição das condições fronteira. Este facto também se pode entender
recordando que, no aparecimento das bandas de energia no processo de formação dos sólidos, não
aumenta o número de estados electrónicos. A banda de valência resulta de combinações lineares
de um grande número (seja N esse número) de orbitais atómicas (uma por cada átomo). Cada
orbital atómica pode acomodar dois electrões (com orientações de spin opostas), logo, o conjunto
deve conter 2N estados electrónicos.
6.6
O estado fundamental da nuvem electrónica
Já vimos como a proximidade dos átomos num cristal leva ao desenvolvimento de um espectro de
bandas, em vez dos nı́veis de energia bem definidos que caracterizam os átomos isolados. Cada
uma destas bandas é populada por electrões provenientes de cada um dos átomos que formam o
cristal.
O estado fundamental do sistema de electrões de Bloch é, essencialmente, definido do mesmo
modo que para os electrões livres: todos os estados de baixa energia devem estar ocupados por
electrões. As bandas correspondentes aos nı́veis atómicos de mais baixa energia, que no estado
fundamental de cada átomo estão totalmente preenchidas, ficam igualmente totalmente preenchidas. No estado fundamental de cada átomo, apenas a orbital de valência pode conter estados
electrónicos desocupados. A banda que resulta desta orbital pode então estar também apenas
parcialmente preenchida (ver a Figura 6.12). A esta banda dá-se o nome de banda de valência.
6.6. O ESTADO FUNDAMENTAL DA NUVEM ELECTRÓNICA
95
E
Banda de
valência
< 2N electrões
2N electrões
2N electrões
Figura 6.12: Ocupação das diferentes bandas de um metal.
Tal como fizemos no estudo do modelo de electrões livres, podemos “construir” o estado fundamental do sistema de electrões de Bloch, ocupando com os electrões atómicos os nı́veis de Bloch
de energia sucessivamente maior. Devemos pois começar na primeira banda, preenchendo-a totalmente antes de começar a ocupar a segunda, e assim sucessivamente até à banda de valência. Para
cada banda, devemos começar a ocupar estados com ~k tal que correspondam a baixos valores de
energia. No caso dos electrões livres, a energia era simplesmente ε(~k) = h̄2 k 2 /2m; dependendo a
energia apenas do módulo do vector ~k, este processo de “estacionar” electrões livres em nı́veis de
energia sucessivamente maior resultava em superfı́cies de Fermi com forma esférica. A situação é
agora mais complicada, já que, em geral, as funções εn (~k) dependem também da direcção de ~k.
Assim, para os electrões de Bloch, a forma da superfı́cie de Fermi não é, em geral, esférica, podendo apresentar configurações extremamente complexas. No entanto, estas formas devem manter
as simetrias da rede recı́proca. Um caso particular destas simetrias é o da paridade da energia,
expresso em (6.13). Uma vez que εn (~k) = εn (−~k), devemos, após o preenchimento do nı́vel ~k com
dois electrões (um com spin up e outro com spin down) e antes de preencher outro nı́vel qualquer
com energia superior, ocupar estados com energia igual a εn (~k) entre os quais, necessariamente,
o estado com momento cristalino igual a −~k. No estado fundamental do sistema, então deve
verificar-se que, se um estado ψn~k se encontra preenchido, também o estará o estado ψn−~k ; ao
contrário, se o estado ψn~k está desocupado, também ψn−~k o está. Assim, vemos que a superfı́cie
k
y
1ª zona de Brillouim
k
x
Figura 6.13: Forma possı́vel da superfı́cie de Fermi para um cristal quadrado 2D. Note-se que outras
formas são possı́veis, a apresentada é apenas um exemplo. Note-se também que esta superfı́cie de
Fermi corresponde a uma banda não totalmente preenchida, porque há ainda espaço disponı́vel na
primeira zona de Brillouin para “albergar” outros electrões.
96
de Fermi deve apresentar simetria de inversão, isto é, deve ficar invariante sob a operação ~k → −~k.
Na Figura 6.13 representa-se a superfı́cie de Fermi para um cristal quadrado bidimensional.
Como já vimos, a velocidade média de um electrão de Bloch é a sua velocidade de grupo:
1
~vn (~k) = grad~k εn (~k).
h̄
(6.36)
Sendo εn (~k) uma função par de ~k, o seu gradiente é uma função ı́mpar de ~k. Então a velocidade
de um electrão cuja função de onda é ψn~k deve ser igual, mas oposta, à de outro com função
de onda ψn−~k . Mas como já vimos atrás, os estados ψn~k e ψn−~k estão ambos ocupados ou
ambos desocupados, no estado fundamental colectivo. Então, no cálculo da velocidade média dos
electrões, as contribuições dos estados ψn~k e ψn−~k cancelam-se mutuamente. Como o vector de
onda considerado nesta discussão é arbitrário, concluı́mos que a velocidade média dos electrões
no estado fundamental colectivo é zero. Note-se que nos referimos a uma média vectorial, e que
não consideramos a presença de campos de forças (eléctricas, por exemplo) que, deformando a
superfı́cie de Fermi, destruı́riam esta argumentação.
6.7
A condução eléctrica
Consideremos agora o efeito de um campo eléctrico (de grandeza tı́pica) na situação que acabámos
de descrever. Tal como no caso dos electrões livres, um campo eléctrico manifesta-se através de um
deslocamento da superfı́cie de Fermi na direcção contrária ao campo, deixando de ficar centrada
na origem do espaço-k, se este deslocamento for possı́vel. Os argumentos apresentados no final da
secção anterior já não se aplicam (porque, por exemplo, ψn~k pode estar ocupado sem que ψn−~k o
esteja [veja a Figura 6.14]) e, a ser este deslocamento da superfı́cie de Fermi possı́vel, a velocidade
média da nuvem electrónica deixa de ser nula, verificando-se o aparecimento de uma corrente
eléctrica. Mas este deslocamento da superfı́cie de Fermi só é possı́vel se a banda de valência
E =0
ky
E
kx
ky
kx
Figura 6.14: Deslocamento da superfı́cie de Fermi sob o efeito de um campo eléctrico. Se a banda de
valência estiver totalmente preenchida, a superfı́cie de Fermi é também a fronteira da região proı́bida,
impossibilitando o deslocamento da superfı́cie de Fermi, ou seja, a condução eléctrica.
não estiver totalmente preenchida, porque, em caso contrário, alguns electrões seriam obrigados a
ocupar estados na região proibida. Assim, concluimos que uma banda totalmente preenchida não
contribui para a condução eléctrica.
Como apenas a banda de valência de um sólido pode, no estado fundamental (ou, seja à
temperatura de 0 K), estar parcialmente preenchida, somente esta é responsável pelas propriedades
eléctricas dos sólidos. A teoria de Bloch permite pois explicar porque é que alguns sólidos são
condutores e outros isoladores: em princı́pio, se a banda de valência de um sólido estiver totalmente
preenchida, o sólido é isolador; caso contrário, é condutor. Esta regra tem algumas excepções, já
que nalguns sólidos a banda de condução sobrepõe-se com a banda de valência, permitindo a
condução mesmo estando esta totalmente preenchida.
6.8. O GÁS DE BLOCH À TEMPERATURA AMBIENTE.
97
E
(a)
Isolador
Condutor
(b)
T=0
T>0
Semicondutor
Figura 6.15: Isoladores, condutores e semicondutores. Os isoladores (à esquerda no diagrama) têm
a banda de valência totalmente preenchida e a de condução totalmente desocupada; os condutores
(ao centro) têm a banda de valência ocupada, mas não totalmente preenchida, ou então verificase uma sobreposição das duas bandas; finalmente, os semicondutores (à direita) são isoladores à
temperatura de zero kelvin, mas o hiato energético entre a banda de valência e a de condução é
pequeno, e à temperatura ambiente muitos electrões estão excitados para esta última, possibilitando
a condução.
6.8
O gás de Bloch à temperatura ambiente.
Nos átomos isolados, para além da orbital de valência, existem outros estados electrónicos, com
energia superior, que podem ser ocupados excitando o átomo. De igual modo, a banda de valência
também não é a “última” banda no sentido em que há outras bandas de energia superior, que,
no estado fundamental do sistema de fermiões de Bloch estão totalmente desocupadas, mas que
podem estar parcialmente preenchidas em estados excitados. À banda de energia imediatamente
superior à da banda de valência dá-se o nome de banda de condução. Mais uma vez, repetimos
que à temperatura ambiente, é possı́vel que alguns electrões sejam excitados para esta banda, e
esta possibilidade deve ser considerada no cálculo do valor de grandezas fı́sicas a temperaturas
diferentes do zero absoluto. Claro que a probabilidade destas excitações é tanto maior quanto
menor for a largura do hiato energético entre as duas bandas. Como vimos no capı́tulo anterior,
a energia térmica média disponı́vel para excitar electrões à temperatura ambiente, T , é da ordem
de grandeza de kB T , onde kB é a constante de Boltzman, e portanto a população da banda de
condução só é apreciável à temperatura ambiente se o hiato energético tiver uma largura da mesma
ordem de grandeza. Um sólido com esta caracterı́stica é um isolador(i) a temperaturas próximas
do zero absoluto(j) mas pode conduzir electricidade à temperatura ambiente. Um aumento da
temperatura produz um aumento na energia média dos fonões, e por conseguinte um aumento
da população da banda de condução, ou seja, um aumento da condutividade. Para estes sólidos
(com um hiato energético, ²g , de cerca de 1 eV) comportamento da condutividade é inverso do
dos condutores, sendo uma função decrescente da temperatura. Este é outro sucesso da teoria de
Bloch, já que este comportamento (aumento de condutividade com a temperatura) é inexplicável,
como vimos, no quadro de uma teoria de electrões livres.
Os sólidos isoladores que, como os que acabámos de referir, apresentam um hiato entre as bandas de valência e de condução suficiente pequeno para que, à temperatura ambiente, a população
da banda de condução tenha efeitos apreciáveis, têm o nome de semicondutores. Na Figura 6.15
apresenta-se a configuração das bandas de valência e de condução para condutores, isoladores e
semicondutores.
(i) Partindo
(j) Não
do princı́pio que tem a banda de valência totalmente preenchida no seu estado fundamental.
consideramos aqui o fenómeno de supercondutividade.
98
6.9
Lacunas
A densidade de corrente eléctrica global de uma banda totalmente preenchida é, de acordo com o
que já se disse, nula. Assim, representando por ~j~k (~r) a densidade de corrente de um electrão no
estado ψ~k (k) e por J~B (~r) a densidade de corrente total da banda, podemos escrever
J~B (~r) =
X
~j~ (~r) = 0,
k
(6.37)
banda
onde o somatório se extende a todos os estados ψ~k da banda. Se quisermos calcular a densidade
de corrente para uma banda parcialmente preenchida, devemos fazer um somatório semelhante ao
anterior, mas considerando apenas os estados efectivamente ocupados por electrões, ou seja,
X
~ r) =
~j~ (~r),
J(~
(6.38)
k
e.o.
onde as iniciais “e. o.” significam que para o somatório apenas se tomam os estados ocupados.
De acordo com a Eq. (6.37), devemos ter
X
e.o.
~j~ (~r) +
k
X
~j~ (~r) = 0,
k
e.d.
onde as iniciais “e. d.” indicam que a soma respectiva é feita apenas sobre os estados desocupados.
Mas isto significa que os dois somatórios são simétricos, e portanto podemos escrever a densidade
de corrente de uma banda parcialmente preenchida como
X
~ r) = −
~j~ (~r),
(6.39)
J(~
k
e.d.
sendo este somatório, recordemo-lo, extendido apenas aos estados desocupados da banda. Dispomos então de duas formas alternativas para o cálculo da contribuição de uma banda parcialmente
preenchida para a corrente elétrica, dadas pelas eqs. (6.38) e (6.39). Podemos interpretar esta
segunda possibilidade considerando os estados electrónicos desocupados, sobre os quais se faz o
somatório, como se estivessem ocupados por partı́culas semelhantes aos electrões, mas com carga
de sinal contrário, justificando-se o sinal negativo na Eq. (6.39). A estas “partı́culas” dá-se o nome
de lacunas. A condução eléctrica pode ser descrita recorrendo aos estados electrónicos [usando a
Eq. (6.38)] ou, alternativamente, aos estados de lacunas [usando a Eq. (6.39)].
Reafirmemos que as lacunas são os estados electrónicos desocupados. Então, uma banda totalmente preenchida (de electrões) pode ser vista como uma banda vazia de lacunas. Dada a
equivalência das duas descrições para os fenómenos de condução, podemos dizer que uma banda
totalmente preenchida (de electrões) não pode conduzir porque não contém nenhuma lacuna para
o transporte de carga.
Num semicondutor, em que o gap de energia entre as bandas de valência e de condução é
da ordem de grandeza da energia das vibrações atómicas, é relativamente fácil a excitação de
um electrão da banda de valência para a banda de condução. Neste processo, é absorvido um
fonão(l) e, simultaneamente, é produzida uma lacuna na banda de valência, correspondente ao
estado deixado vago pelo electrão promovido (ver a Figura 6.16). Inversamente, pode também
dar-se o processo de recombinação, em que um electrão na banda de condução emite um fonão (ou
um fotão) transitando para a banda de valência, onde irá ocupar um estado previamente vago (ou
seja, ocupado por uma lacuna).
(k) Classicamente, a densidade de corrente é ~
j(~
r) = ρ(~
r)~v (~
r), onde ρ é a função densidade de carga e ~v velocidade das
cargas. Numa descrição quântica, a densidade de corrente associada ¡a uma partı́cula¢com carga q é ~j(~
r) = q~g (~
r),
~ − ψ ∇ψ
~ ∗ /(2im) (ver qualquer livro
onde ~g é a densidade de fluxo de probabilidade, dada por ~g = h̄ ψ ∗ ∇ψ
elementar de Mecânica Quântica, p. ex. S. Gasiorowicz, ”Quantum Mechanics”.)
(l) Recorde que os fonões são os quanta das vibrações atómicas (ver a Secção 4.3.2).
6.10. CONTAMINAÇÃO DE SEMI-CONDUTORES
99
Banda de
condução
f
Banda de
valência
Figura 6.16: Processo de criação de um par electrão de condução-lacuna por absorção de um fonão.
Num semicondutor à temperatura ambiente, há duas contribuições para a condução eléctrica: a
da banda de condução, que está parcialmente populada com electrões termicamente excitados, e a
da banda de valência, parcialmente populada com lacunas que correspondem aos estados deixados
vagos pelos electrões promovidos para a banda de condução. Nos casos em que a segunda é mais
importante do que a primeira, a corrente eléctrica é, sob todos os aspectos, semelhante à que
seria conduzida por cargas de sinal positivo, nomeadamente na polarização da tensão de Hall (ver
a secção 5.2.3), justificando-se assim os sinais anómalos do coeficiente de Hall apresentados por
algumas substâncias.
6.10
Contaminação de semi-condutores
Como vimos, à temperatura ambiente alguns electrões da banda de valência de um semicondutor
como o silı́cio ou o germânio(m) ocupam estados excitados na banda de condução, possibilitando
a condução eléctrica por estes materiais. Há, como se disse, duas contribuições para a condução
eléctrica: a dos electrões na banda de condução e a das lacunas na banda de valência. Num
semicondutor puro à temperatura ambiente, o número de lacunas iguala, evidentemente, o de
electrões de condução. Mas é possı́vel, através da introdução no cristal semicondutor de impurezas
judiciosamente escolhidas, variar independentemente o número dos dois tipos de transportadores
de carga.
Para concretizar a discussão, consideremos um cristal de silı́cio ou de germânio, no qual alguns
átomos são substituı́dos por átomos de arsénico ou de fósforo. Estas impurezas constituem defeitos
no arranjo periódico do cristal de silı́cio. O arsénico e o fósforo são substâncias pentavalentes, de
forma que, quando um átomo de arsénico substitui num cristal um átomo de silı́cio (substância
tetravalente), um dos seus electrões de valência fica por emparelhar. Este electrão fica fracamente
ligado ao átomo de arsénico, que funciona como um centro de carga positiva (ver a Figura 6.17).
O átomo de arsénico fornece um electrão a mais do que os de silı́cio, que definem a estrutura
cristalina e, por isso, dizemos que o arsénico é um dador de electrões, ou ainda que se trata de
uma contaminação de tipo-n. Estando o electrão desemparelhado muito fracamente ligado ao
átomo de arsénico, basta uma pequena quantidade de energia, Ed , para exitá-lo para a banda
de condução. O valor deste mini-gap de energia é de cerca de algumas dezenas de meV (mili-electrão-volt), tipicamente. Assim, concluı́mos que num cristal de silı́cio em que alguns átomos
são substituidos por átomos de arsénico a estrutura de bandas usual vê-se modificada, aparecendo
um conjunto de estados na zona proı́bida, imediatamente abaixo da banda de condução, aos quais
se dá o nome de nı́vel dador.
À temperatura de 0 K, a banda de valência está totalmente preenchida, e o nı́vel dador tem
metade dos estados disponı́veis ocupados (porquê?); o cristal em estudo é, portanto, isolador. Mas
basta elevar ligeiramente a temperatura para se exitarem os electrões do nı́vel dador para a banda
de condução, sem que sejam criadas lacunas na banda de valência. A temperaturas mais elevadas,
começa a fazer-se sentir o processo já estudado da excitação de electrões da banda de valência, e
as lacunas resultantes passam a ter uma contribuição apreciável para a condução eléctrica.
Vemos, assim, que contaminando por substituição um cristal de silı́cio ou germânio com
(m) Estes
são os dois semicondutores mais usados em aplicações industriais.
100
Orbital de electrão
desemparelhado
Banda de condução
Ed
Nível dador
Eg
Átomos de Silício
+
Banda de
valência
Átomo de Arsénico
Figura 6.17: Cristal de silı́cio com uma impureza substitucional de arsénico (esquerda) e nı́veis de
energia resultantes (direita).
arsénico, podemos aumentar, a temperaturas não muito elevadas, o número de electrões na banda
de condução, permanecendo o número de lacunas na banda de valência baixo.
Banda de condução
Lacuna resultante da
captura de um electrão
pelo átomo de boro
+
Eg
Átomos de silício
-
Ea
Nível aceitador
Banda de
valência
Átomo de boro
Figura 6.18: Cristal de silı́cio com uma impureza substitucional de boro (esquerda) e nı́veis de
energia resultantes (direita).
Também é possı́vel obter o efeito contrário, de estabecer num cristal semicondutor um grande
número de lacunas na banda de valência com um reduzido número de electrões na banda de
condução, substituindo alguns átomos num cristal de silı́cio ou de germânio por átomos de boro,
alumı́nio, gálio ou ı́ndio (substâncias trivalentes). Substituindo um átomo de silı́cio num cristal
puro por um de boro, fica uma ligação por estabelecer, já que o boro é trivalente. O átomo de boro
pode, nesta situação, capturar facilmente um electrão da banda de valência do cristal, completando
assim as quatro ligações com os seus vizinhos. Neste processo, cria-se uma lacuna na banda de
valência, sem popular a banda de condução. As impurezas deste tipo aceitam os electrões da banda
de valência, e por isso chamam-se impurezas aceitadoras, ou impurezas de tipo-p. Na Figura 6.18
representa-se esquematicamente o papel de uma impureza de tipo-p e o nı́vel intermédio, que agora
aparece imediatamente acima da banda de valência, chamado nı́vel aceitador.
A capacidade para variar independentemente as concentrações de lacunas e de electrões de
condução num cristal semicondutor tem uma enorme aplicação prática, no fabrico de inúmeros
dispositivos usados na indústria electrónica, como os diodos e os transı́stores. É até possı́vel,
num único cristal de silı́cio, implantando diferentes contaminações em diferentes regiões, construir
circuitos inteiros, contendo vários milhões daqueles elementos individuais. Vamos, de seguida,
estudar o funcionamento do mais simples destes dispositivos, o diodo rectificador.
6.11. O DIODO SEMICONDUTOR
101
Fe
n
e-
p
l+
Ve
Vc0
n
p
Figura 6.19: Junção p-n (acima) em equilı́brio e potencial de contacto na junção. Está representada
o sentido da força sobre os electrões (Fe ) e a sua energia potencial.
6.11
O diodo semicondutor
Consideremos um cristal semicondutor de silı́cio (ou germânio), com contaminações de tipo diferente em duas zonas contı́guas, em equilı́brio a uma temperatura T > 0. Temos então um cristal,
no qual está definida uma região de tipo-p, outra de tipo-n, em contacto uma com a outra (ver a
Figura 6.19). À temperatura T , na região-n há uma grande densidade de electrões de condução,
como vimos na secção anterior; em contrapartida, na região-p é a concentração de lacunas que é
elevada. Então, à semelhança do que se passa na junção de metais diferentes (ver a Secção 5.2.4),
deve verificar-se uma difusão de electrões de condução da região-n (onde apresentam alta concentração) para a região-p, onde se recombinam com as lacunas, aqui maioritárias. As lacunas,
por seu turno, sofrem uma migração inversa e recombinam-se com os electrões de condução da
região-n. Consequentemente, estabelece-se um campo eléctrico na junção que impede a continuação indefinida deste processo, ou seja, verifica-se o aparecimento de uma diferença de potencial
entre as duas regiões, que se chama potencial de contacto. Em resultado dos processos de recombinação, a proximidade da junção fica desprovida de transportadores de carga, efeito que é
ainda agravado pelo aparecimento do campo de contacto, que varre electrostaticamente qualquer
par lacuna-electrão de condução (o electrão para a região-n, a lacuna para a região−p), criado
nesta zona por exitação térmica. Esta região, onde a densidade de transportadores de carga é
praticamente nula, chama-se zona de deplecção.
Na junção das duas regiões ocorrem, então, dois efeitos opostos:
(a) difusão de transportadores, “empurrada” pelos gradientes de concentração. Alguns electrões
(aqueles que à temperatura T têm energia suficiente para ultrapassarem a barreira estabelecida pelo potencial de contacto) da região-n difundem-se para a região-p, recombinando-se aı́
com lacunas. Inversamente, algumas lacunas da região-p sofrem uma migração para a regiãon. Ao fluxo de carga associado a estas migrações dá-se o nome de corrente de recombinação,
que tem o sentido p-n;
(b) deriva de trasportadores, “empurrada” pelo campo eléctrico de contacto. Os pares electrão
de condução-lacuna criados por excitação térmica nas duas regiões são empurrados pelo
campo eléctrico, realizando cada transportador uma migração em sentido inverso ao do
ponto anterior. Esta corrente chama-se corrente de geração, no sentido n-p.
Na migração de difusão, os transportadores movem-se empurrados pelos gradientes de concentração, vencendo gradientes de potencial electrostático; na migração de deriva, o movimento
é induzido pelo gradiente do potencial electrostático, e opõe-se ao gradiente de concentração.
Estabelece-se então um equilı́brio dinâmico em que os fluxos de carga se cancelam mutuamente,
isto é, a corrente de recombinação, no sentido p-n, iguala a de geração, no sentido n-p. Deve
dizer-se que o valor destas correntes é extremamente baixo, rondando os 10−6 A.
Se se montar um circuito fechado incluindo a junção semicondutora p-n, devemos ter em
atenção que, para além do potencial de contacto Vc0 na junção semicondutora, aparecem outros
102
VB
n
VB
n
Vc0
Vc
V
p
p
VA
VA
Figura 6.20: Quedas de potencial por contacto num curto-circuito da junção p-n (à esquerda) e
polarização de uma junção p-n por uma fonte de tensão V .
VB
n
VB
n
Vc > Vc0
Vc < Vc0
p
VA
p
VA
i
Figura 6.21: Polarização directa (à esquerda) e polarização inversa de uma junção p-n.
potenciais de contacto nos pontos onde se liga o condutor que fecha o circuito (ver a Figura 6.20).
Evidentemente, a soma de todos estes potenciais é nula, de acordo com a lei de Kirchoff. Usando
a notação da Figura 6.20, temos então
Vc0 + VA + VB = 0,
ou seja,
VA + VB = −Vc0 .
(6.40)
O que acontece agora se polarizarmos a junção, ligando-a a uma fonte de tensão? Uma vez
que a zona de deplecção é desprovida de cargas móveis, tem uma resistência muito elevada e, por
isso, podemos considerar que é aı́ que se manifesta o efeito da fonte de tensão. Aplicando a lei de
Kirchoff, temos agora
Vc + Va + VB + V = 0,
e portanto, usando a Eq. (6.40), concluimos que o potencial de contacto se vê alterado pela acção
da tensão polarizadora V de acordo com
Vc = Vc0 − V.
(6.41)
Quando o terminal positivo da fonte de tensão está ligado à região-p a junção diz-se polarizada no
sentido directo; se o terminal positivo da fonte estiver ligado à região-n, falamos de polarização
inversa. Quando a junção está em polarização directa, V tem sinal idêntico ao de Vc 0, e, portanto,
o potencial de contacto fica diminuı́do pela polarização (ver a Figura 6.21, à esquerda). Logo,
nestas condições, aumenta bastante a corrente de recombinação porque diminui a grandeaza da
barreira de potencial que impede o fluxo por difusão. Em contrapartida, a corrente de geração
mantém-se essencialmente constante, já que depende da taxa da criação de pares lacuna-electrão
de condução. Então, as duas correntes deixam de se compensar, e verifica-se, portanto, um fluxo
lı́quido de carga através da junção, no sentido p-n. Em resumo, a junção p-n permite a passagem
de corrente quando se encontra em polarização directa.
Em contrapartida, quando se inverte a polarização, aumenta o valor do potencial de contacto,
diminuindo, consequentemente, o valor da corrente de recombinação. A corrente de geração permanece essencialmente a mesma, mantendo o seu valor de cerca de 10−6 A. Assim, para muitos efeitos
6.11. O DIODO SEMICONDUTOR
103
200
I (A)
150
100
50
0
-2
-1.5
-1
-0.5
V (V)
0
0.5
Figura 6.22: Curva de corrente-tensão caracterı́stica de um diodo semicondutor.
práticos, podemos dizer que a junção semicondutora p-n não permite a passagem de corrente em
polarização inversa.
Uma vez que a fracção dos transportadores que tem, a uma certa temperatura T , uma energia
superior ao valor do potencial de contacto (e que portanto está em condições de ultrapassar a
barreira de potencial na junção) é dada pelo factor de Boltzmann e−βeVc , onde β = 1/kB T , a
razão entre as correntes de recombinação em polarização directa e em vazio (sem qualquer fonte
externa) é dada por
Jr
e−βeVc
= −βeVc0 = eβeV .
Jr0
e
A corrente total é a soma das correntes de geração e de recombinação, J = Jr + Jg , mas a corrente
de geração permanece sensivelmente constante, com o seu valor de vazio Jg0 que, por sua vez, é
o simétrico da corrente de recombinação, também em vazio. Então, a funçao corrente tensão de
uma junção p-n é
J = Jg (eβeV − 1),
(6.42)
onde se toma V positivo quando a junção está em polarização directa. O gráfico desta função
apresenta-se na Figura 6.22. A junção semicondutora p-n tem então a propriedade de só permitir a passagem de corrente num sentido, propriedade muito importante no desenho de circuitos
electrónicos.
Bibliografia
• J. R. Christman, ”Fundamentals of Solid State Physics” (1988), capı́tulo 14 (F5.0/257 +)
• A. Yariv,“An Introduction to Theory and Applications of Quantum Mechanics” (1982),
capı́tulo 20 (F5.0/461)
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989), secção 12-7
(F5.0/437 +)
• F. Blatt, “Modern Phisics” (1992), secção 13.4 (F5.0/448 +)
• R. A. Serway e R. J. Beichner, “Physics for Scientists and Engineers” (2000), Secção 43.7
(F0.2/294)
104
PROBLEMAS
6.1 À luz da teoria das bandas determine, justificando, o número total de estados electrónicos existentes por banda de energia.
6.2 Justifique qualitativamente a condutividade, térmica e eléctrica, a zero graus Kelvin, dos sólidos
cristalinos. Dê alguns exemplos.
6.3 Comente a seguinte afirmação:
A condutividade dos metais alcalinos terrosos é devida a uma sobreposição da banda
de valência com a banda de condução. Se tal não acontecesse estes elementos seriam
isoladores a zero graus Kelvin.
6.4 Determine o valor do parâmetro de massa efectiva de electrões livres.
6.5 A densidade do bário é de 3, 5 × 103 kg/m3 , e a sua massa atómica relativa é 137. Sabendo que
os átomos de bário têm dois electrões de valência, determine o raio da esfera de Fermi e o valor
da energia da nuvem de electrões de condução por mole (de átomos) à temperatura de 0 K.
2
6.6 Mostre que a função ψ(~r) = N e−r , onde N é uma constante de normalização e r = ||~r||, não
pode ser a função de onda de um electrão num potencial periódico.
6.7 Um diodo com corrente de geração de 20,0 µA, uma resistência de 1,5 kΩ e uma fonte de tensão
estão ligados em série. Sabendo que o diodo se encontra a conduzir, qual o valor da força electromotriz da fonte, necessária para que a corrente através do circuito seja 25,0 mA, à temperatura
de 300 K?
6.8 Coloca-se um diodo num circuito eléctrico para proteger o sistema contra o risco de alguém colocar
as pilhas ao contrário. Na posição de fucionamento à temperatura ambiente, a corrente através
do diodo é 200 mA sendo 100 mV a diferença de potencial entre os seus terminais; se se inverter
a bateria, qual será o valor da corrente através do diodo?
Capı́tulo 7
Supercondutividade
A temperaturas suficientemente baixas, a resistividade de muitas substâncias anula-se, de forma
brusca. Este facto foi, pela primeira vez, observado por Karmerlingh Onnes em 1911, quando notou
que a resistência de uma amostra de mercúrio era, à temperatura de 4,2 K, subitamente reduzida
em mais de um milhão de vezes (ver o gráfico da Figura 7.1, à esquerda). Outras substâncias
sofrem este processo a diferentes temperaturas. A temperatura a que se dá a transição chama-se
temperatura crı́tica. Alguns exemplos estão apresentados na Tabela 7.1.
É importante notar que esta redução do valor da resistividade é, em certas condições, extremamente brusca. No caso dos estudos de Onnes com mercúrio, ela processa-se ao longo de,
apenas, duas centésimas de grau. Muitas outras propriedades fı́sicas sofrem também alterações
descontı́nuas importantes neste processo, o que identifica uma transição para uma fase diferente,
chamada fase supercondutora. No lado direito da Figura 7.1 apresenta-se o comportamento da capacidade térmica com a temperatura, onde também se evidencia a discontinuidade quando T = Tc .
Na presença de um campo magnético externo, a capacidade térmica apresenta até uma singularidade infinita (ou seja, um calor latente) para T = Tc , como se verifica nas transições de fase
sólido-liquı́do ou liquı́do-gás.
A resistividade de uma substância não se torna, apenas, muito pequena na transição para
a fase supercondutora. Ela anula-se, completamente. Uma corrente eléctrica estabelecida num
anel supercondutor mantém-se indefinidamente, por vários anos, assim o demonstram todas as
experiências desenhadas para testar esta hipótese. O próprio Kamerlingh Onnes pôde verificá-lo
quando arrefeceu um anel de chumbo até atingir a fase supercondutora, na presença de um campo
magnético. Em seguida, diminuiu a intensidade do campo magnético até o anular. A variação do
fluxo magnético através do anel induziu nele uma corrente, de acordo com a Lei de Faraday. Este
fenómeno é bem conhecido, mesmo com condutores vulgares. Nun anel condutor com resistência R
e indutância L, uma corrente assim induzida decai exponencialmente, anulando-se num intervalo
de tempo de cerca de L/R. Para um anel com um metro de diâmetro e uma resistência de 0,1 Ω,
Substância
Hg
Cd
In
La
Nb
La2−x Bax CuO4
Tl2 Ba2 Ca2 Cu3 O1 0
Tc (K)
4,15
0,56
3,40
6,06
9,26
35
125
Substância
Al
Ga
Ir
Mo
Nb3 Ge
YBa2 Sr3−x Cax Cu2 O8+δ
HgBa2 Ca2 Cu3 O8+x
Tc (K)
1,20
1,09
0,14
0,92
23,0
110
164
Tabela 7.1: Temperaturas da transição para a fase supercondutora. As substâncias das duas últimas
linhas são chamadas supercondutores quentes, que foram descobertos a partir de 1986.
105
106
CAPÍTULO 7. SUPERCONDUTIVIDADE
4
0.15
3
-1
R (Ω)
-1
C (mJ mol K )
0.2
0.1
2
0.05
1
Tc
0
4.1
4.15
4.2
4.25 4.3
T (K)
4.35
4.4
0
0
0.5
1
T (K)
1.5
2
Figura 7.1: Resistência de uma amostra de mercúrio como função da temperatura, como foi observada por Kamerlingh Onnes (Commun. Phys. Lab. Univ. Leiden 12, 120, 1991) (à esquerda) e
capacidade térmica molar do alumı́nio como função da temperatura (N.E. Phillips, Phys. Rev. 114,
676 (1959)) (à direita).
este intervalo de tempo é de cerca de uma décima de milésima de segundo. No entanto, Onnes
constatou que a corrente no anel de chumbo supercondutor se manteve inalterada durante mais
do que duas horas! Uma tal lentidão na atenuação de uma corrente “transitória” só é possı́vel com
resistências da ordem dos pΩ = 10−12 Ω. Mais recentemente, foi possı́vel verificar a continuação de
uma destas correntes durante mais de dois anos! Daqui se vê que, de acordo com toda a evidência
experimental, a resistividade dos supercondutores é, de facto, nula.
Outro facto digo de nota é que as substâncias que com maior facilidade passam ao estado
supercondutor (isto é, aquelas para as quais a transição se faz a temperatura mais elevada) não
são particularmente boas condutoras à temperatura ambiente. Na mesma linha, verifica-se que
os melhores condutores à temperatura ambiente só a muito baixas temperaturas passam à fase
supercondutora. Nalguns casos (por exemplo, o do cobre e o do ouro), nem sequer se chega a
atingir essa fase, por muito que se baixe a temperatura! Isto parece indicar que a transição é
facilitada pela interacção entre os electrões de condução e os átomos da rede cristalina.
7.1
Propriedades magnéticas dos supercondutores
Uma vez que a resistividade de uma substância se anula durante a transição para a fase supercondutora, a sua condutividade cresce ilimitadamente. A lei de Ohm,
~
~j = σ E,
impõe então que o campo eléctrico no interior de um supercondutor seja nulo. Mas, se o campo
eléctrico é nulo, então o campo magnético é constante. Com efeito, de acordo com a lei de Faraday,
~
~ = − ∂B ,
rot E
∂t
resultando então, com campo eléctrico nulo, que a derivada parcial do campo mgnético se anula, ou
seja, que o campo magnético não depende do tempo. É fácil compreender de forma mais intuitiva
porque é que o campo magnético no interior de um supercondutor não depende do tempo. Tal
7.1. PROPRIEDADES MAGNÉTICAS DOS SUPERCONDUTORES
107
deve-se ao facto de qualquer variação do fluxo magnético induzir correntes no supercondutor que
imediatamente a cancelam.
Provámos, a partir das equações de Maxwell, que o campo magnético no interior de um supercondutor é constante, ou seja, não depende do tempo. Isto é verdade, mas não é toda a verdade.
Com efeito, Meissner e Ochsenfeld verificaram em 1933 que o campo magnético no interior dos
supercondutores é nulo, isto é, o módulo da indução magnética em cada ponto não é uma constante
qualquer, é zero. Este facto tem o nome de efeito de Meissner
O campo magnético anula-se no interior dos supercondutores porque se estabelecem na sua superfı́cie correntes que o magnetizam de forma tal que se cancela o campo em todos os pontos do seu
interior. Este processo tem algumas semelhanças com a distribuição de carga pela superfı́cie de um
condutor em equilı́brio electrostático na presença de um campo elécrico, de forma tal que se anula
o campo no seu interior. A magnetização gerada num supercondutor pela presença de um campo
magnético é, então, oposta ao campo que lhe dá origem. A este comportamento dá-se o nome
de diamagnetismo. É um comportamento oposto ao chamado ferromagnetismo (evidenciado pelo
ferro, por exemplo), em que a magnetização tem o sentido do campo magnetizador, reforçando-o. Uma vez que a magnetização gerada num supercondutor é tal que se anula completamente,
nos pontos interiores, o campo magnetizante, diz-se que os supercondutores são perfeitamente
diamagnéticos.
De acordo com que acabámos de discutir, quando se aproxima um ı́mane de um supercondutor,
este magnetiza-se, tendo o seu momento magnético sentido oposto ao do ı́mane. Logo, surge uma
força de repulsão entre o ı́mane e o supercondutor, que pode ser suficiente, por exemplo, para
manter o ı́mane a flutuar sobre o supercondutor, apoiado numa “almofada magnética.”
É possı́vel forçar um supercondutor a passar à fase normal, mesmo abaixo da temperatura de
transição, aplicando um campo magnético suficientemente intenso na sua vizinhança. A intensidade do campo magnético necessária para produzir este efeito chama-se valor crı́tico do campo.
Quanto maior é a temperatura do supercondutor (mas ainda abaixo da temperatura de transição,
claro) menor é o campo crı́tico. Numa aproximação muito razoável para a generalidade dos supercondutores, verifica-se a seguinte relação entre o campo crı́tico e a temperatura:
Ã
·
T
Bc (T ) = Bc (0) 1 −
Tc
¸2 !
.
(7.1)
Nesta expressão, Bc (0) representa o campo crı́tico à temperatura do zero absoluto e Tc representa
a temperatura de transição na ausência de campo.
A transição para a fase normal forçada por um campo magnético de intensidade superior à
intensidade crı́tica pode fazer-se de duas maneiras, dependendo da natureza do material usado.
Nos chamados supercondutores do tipo I, o campo magnético penetra subitamente (se a forma e a
orientação do material supercondutor forem adequadas) em todo o supercondutor, que assim passa
para a fase normal. Se a forma e a orientação não forem cuidadosamente escolhidas, pode verificarse o aparecimento de um estado intermédio, em que o material estudado fica dividido em sectores
supercondutores, onde o campo magnético é nulo, e sectores não supercondutores, penetrados pelo
campo. Nos supercondutores de tipo II, quando a intensidade do campo magnético ultrapassa um
primeiro valor crı́tico B1 , começa a penetrar no supercondutor, mas não o preenche na totalidade.
Em vez disso, estabelece-se um estado misto (com algumas semelhanças com o estado intermédio
dos supercondutores de tipo I), no qual o material se divide em zonas, com a forma de tubos
com a direcção do campo, onde se passa à fase normal, permanecendo o restante material na fase
supercondutora. À medida que aumenta a intensidade do campo magnético, a espessura destes
tubos vai também aumentando até que, para uma intensidade magnética B2 , todo o material
passa à fase normal. Note-se que enquanto uma parte de um supercondutor de tipo II permanecer
na fase supercondutora, o material como um todo continua a apresentar resistência nula. Com
efeito os tubos de fluxo (como são chamadas as regiões onde o campo penetra no supercondutor),
com resistência finita, estão em paralelo com a fracção supercondutora, com resistência nula, e o
paralelo com uma resistência nula apresenta, igualmente, resistência igual a zero.
108
7.2
A Equação de London
A resistividade de um material supercondutor é, como vimos, zero. Isto leva-nos a pensar que
alguns ou todos os electrões de condução passam a poder mover-se no interior do material sem
sofrerem colisões. Na presença de um campo eléctrico, o seu movimento é, então acelerado, de
acordo com a segunda lei de Newton. Para um destes electrões supercondutores, temos
me
d~v
~
= −eE,
dt
onde me e e são, respectivamente, a massa e o módulo da carga electrónica, ~v é a velocidade do
~ o campo eléctrico. Multiplicando ambos os membros desta equação pela densidade de
electrão e E
electrões supercondutores, ns , e pela carga electrónica e recordando que ~j = −en~v é a densidade
de corrente electrónica, obtemos
d~j
ns e 2 ~
=
E,
dt
me
Se agora calcularmos o rotacional desta expressão e usarmos a Lei de Faraday, resulta
µ
¶
∂
ns e 2 ~
~
rot j +
B = 0.
∂t
me
(7.2)
Esta equação diferencial, em conjugação com a Equação de Maxwell que traduz a Lei de Ampère(a) ,
~ = µ0~j,
rot B
(7.3)
~ e a ~js . É fácil verificar que este sistema de equações admite
podem ser resolvidas em ordem a B
soluções em que o campo magnético, sendo estático, é diferente de zero. Com efeito, qualquer que
seja o campo magnético independente do tempo, a lei de Ampère (7.3) leva a que a densidade de
corrente seja também estacionária, pelo que a Eq. (7.2) fica automaticamente satisfeita. Assim,
este formalismo, deduzido a partir das equações de Maxwell, não descreve o comportamento dos
supercondutores, uma vez que não prevê o Efeito de Meissner. Esta insuficiência pode ser resolvida
impondo que a função a derivanda na Eq. (7.2) se anule, isto é,
rot ~j +
ns e 2 ~
B = 0.
me
Esta igualdade é a chamada equação de London. A equação de London descreve correctamente o
efeito de Meissner. Se calcularmos o rotacional da Eq. (7.3) e usarmos a equação de London para
eliminar a densidade de corrente, obtemos
2
~ = −µu ns e B.
~
rot rot B
me
O duplo rotacional de uma função vectorial qualquer pode ser calculado através da igualdade
~ = grad div X
~ − lap X;
~
rot rot X
no caso em estudo, esta expressão assume até uma forma mais simples porque o campo magnético
~ = 0). Obtemos então
é uma função solenoidal (div B
2
~
~ = µ0 ns e B.
lap B
me
(7.4)
Esta equação não admite soluções homogéneas não nulas. Com efeito, um campo homogéneo
tem laplaciano nulo, de forma que somente campos nulos podem satisfazer esta igualdade. Além
(a) Não se inclui nesta equação a corrente de deslocamento, 1/² ∂ E/∂t
~
porque, para simplificar, consideramos
0
apenas situações em que os campos variam lentamente com o tempo, em que é dominante a corrente de condução.
7.3. SUPERFLUIDEZ
109
disso, podemos demonstrar que o campo magnético é exponencialmente atenuado à medida que
penetra no interior de um supercondutor. Para tal, consideremos um supercondutor muito grande
com uma face plana, com a qual fazemos coincidir o plano xOy do sistema de coordenadas, com
origem (situada obviamente neste plano) muito longe dos limites desta face. Suponhamos que
o material supercondutor é tão grande que, na região da origem do sistema de coordenadas, é
razoável aproximá-lo a um material com volume infinito, que se estende indefinidamente a toda
~ e o campo magnético no exterior, isto é, nos pontos tais que z < 0, e
a região z > 0. Seja B
suponhamos que se trata de um campo uniforme. Por razões de simetria, o campo magnético no
interior do supercondutor deve ser apenas uma função da coordenada z, ou seja, da distância à
superfı́cie de separação dos dois meios. A Eq. (7.4) fica então
~
d2 B
ns e 2 ~
= µ0
B.
2
dz
me
Esta equação diferencial admite como solução geral a combinação de funções exponenciais
~
B(z)
= ~aez/λ + ~be−z/λ ,
onde λ2 = (µ0 ns e2 /me )−1 , e ~a e ~b são duas constantes vectoriais que devem ser ajustadas de
forma a que se verifiquem condições gerais de plausibilidade fı́sica e condições fronteira relevantes.
Ora, primeiro termo, afectado pela constante ~a, representa um vector cujo módulo cresce exponencial e ilimitadamente à medida que penetramos no interior do supercondutor. Esta situação
é claramente inverosı́mil, e pode ser afastada impondo ~a = 0. Por outro lado, a continuidade do
campo magnético obriga a que o limite desta solução à medida que z tende para zero (isto é, à
~ e,
medida que nos aproximamos da superfı́cie do supercondutor) seja o valor exterior do campo, B
~
~
~
~
ou seja, limz→0 B(z) = Be , condição que é satisfeita com b = Be . O campo magnético no interior
do supercondutor é então
~
~ e e−z/λ ,
B(z)
=B
verificando-se assim ser essencialmente nulo em todos os pontos do interior do supercondutor, à
excepção de uma camada superficial, cuja espessura é da ordem de grandeza de λ. Considerando
que todos os electrões de condução têm um contribuem para o comportamento supercondutor,
podemos calcular o valor deste parâmetro, usando os valores tabelados no Capı́tulo 5 e resulta
λ ≈ 150 Å. Este parâmetro tem o nome de profundidade de penetração.
7.3
Superfluidez
Como se referiu no estudo da teoria de London, a persistência, por tempo indeterminado, das correntes supercondutoras sugere que um número apreciável de electrões se movem no supercondutor
sem sofrerem qualquer resistência ao seu movimento. Neste aspecto, a supercondutividade tem
um ponto em comum com outro fenómeno verificável também a temperaturas muito baixas, o da
superfluidez do hélio. Este fenómeno foi, pela primeira vez, parcialmente identificado por McLennan, Smith e Wilhelm em 1932 e consiste numa transição de fase, que pode ser identificada, por
exemplo, pelo comportamento descontı́nuo da capacidade térmica como função da temperatura,
que está ilustrado na Figura 7.2. À temperatura da transição para a fase superfluida deu-se o nome
de ponto lambda, pela semelhança que o gráfico da capacidade térmica do hélio, na vizinhança da
transição, tem com esta letra do alfabeto grego.
As únicas substâncias que apresentam uma fase superfluida são o hélio “normal”, 4 He, e um
seu isótopo, o 3 He,(b) porque todas as outras substâncias congelam a temperaturas superiores à
da transição superfluida.
(b) A
notação
AX
explicita o número de massa, A, do elemento quı́mico X.
110
CV
TΛ
T
Figura 7.2: Dependência da capacidade térmica do hélio lı́quido com a temperatura.
T > Tλ
φ1 = 0
φ2 = 0
T < Tλ
φ1
φ 2= φ
T < Tλ
1
T > Tλ
O hélio superfluido tem uma série de propriedades notáveis,
sendo a mais relevante para o nosso estudo (e aquela à qual se
deve o nome de superfluidez) a sua capacidade para fluir através de
tubos capilares com secção tão diminuta que não permitem o escoamento de hélio lı́quido na fase normal. (Estes tubos, que apenas
permitem o escoamento de hélio superfluido, chamam-se tubos supercapilares.) Este efeito pode ser posto em evidência usando dois
reservatórios contendo hélio lı́quido na fase normal, unidos por um
tubo supercapilar, como mostra a figura ao lado. Enquanto a temperatura é superior à do ponto-λ, não há escoamento entre os dois
reservatórios (figura em cima); baixando a temperatura até se dar
a transição para a fase superfluida, o hélio começa a fluir através
do tubo supercapilar, até se igualarem os nı́veis de hélio nos dois
reservatórios, altura em que se estabelece um equilı́brio dinâmico,
sendo os fluxos de hélio entre os dois reservatórios iguais (figura no
centro). Se agora aquecermos um dos reservatórios até uma temperatura superior à do ponto-λ, o hélio presente nesse reservatório
deixa de fluir para o outro, mas o fluxo inverso ainda se mantém,
φ1 > 0
φ2 = 0
subindo, portanto, o nı́vel de hélio no reservatório aquecido (figura em baixo).
A capacidade para o escoamento através de tubos supercapilares pode entender-se supondo que
o hélio superfluido tem uma viscosidade nula. No entanto, experiências de outro tipo, por exemplo,
a análise do movimento de um objecto que se mergulha em hélio superfluido, não apoiam esta
hipótese. É certo que a viscosidade de um superfluido tende para zero à medida que a temperatura
tende para zero mas tem sempre um valor finito (quando se determina a partir da queda de objectos
no fluido) a temperaturas compreendidas entre zero e a temperatura de transição.
Para compreender estes resultados aparentemente contraditórios, F. London propôs em 1938
o chamado modelo dos dois fluidos, segundo o qual a temperaturas abaixo da do ponto-λ, coexistiriam duas formas distintas de hélio: hélio numa fase lı́quida normal e hélio em fase superfluida
propriamente dita, chamado hélio-II, desprovido de viscosidade. A aparente ausência de viscosidade verificável no escoamento através de supercapilares devia-se à fracção de hélio-II, ao passo
que a que se notava na queda de objectos mergulhados se devia à componente em fase lı́quida ordinária. A proporção relativa das duas componentes dependia da temperatura, variando a fracção
de hélio-II entre 100% e 0%, quando aquela aumentava desde zero até à temperatura do ponto-λ.
A fim de percebermos porque é que o hélio-II é desprovido de viscosidade, devemos notar que
7.4. A SUPERCONDUTIVIDADE, OUTRA VEZ
111
os átomos de hélio (4 He) são bosões, logo, não são afectados pelo princı́pio de exclusão de Pauli.
Dada uma amostra de hélio, não há, pois, qualquer mecanismo que impeça os seus átomos de se
acumularem nos estados de energia mais reduzida(c) . A temperaturas muito baixas, uma fracção
apreciável dos átomos desta amostra encontra-se no estado fundamental, não podendo, assim,
participar em processos de dissipação de energia, como são os de atrito ou de viscosidade. Esta
fracção dos átomos de hélio é a que constitui o hélio-II do modelo dos dois fluidos.
Uma colecção de bosões (como os átomos de 4 He) dos quais uma percentagem apreciável
se encontra no estado fundamental chama-se um condensado de Bose-Einstein. Para além dos
exemplos fornecidos pela superfluidez do hélio 4 He e (veremos adiante os detalhes) dos electrões
supercondutores, não se conheciam outros exemplos de condensados de Bose-Einstein, até ao
ano de 1995, em que Eric Cornell e Carl Wieman (usando uma técnica de arrefecimento por
laser inventada por Steven Chu, Claude Cohen-Tannoudji e and William D. Phillips, e pela qual
ganharam prémio Nobel de 1997) conseguiram arrefecer uma nuvem de cerca de 2000 átomos
de rubı́dio até formarem um condensado de Bose-Einstein. Por este sucesso, aqueles cientistas
ganharam o prémio Nobel de 2001.
7.4
A supercondutividade, outra vez
Fizemos esta digressão pelo fenómeno da superfluidez porque, de acordo com a teoria actualmente
aceite, a supercondutividade deve-se a um comportamento superfluido dos electrões nos sólidos
a temperaturas baixas. É difı́cil, em primeira abordagem, aceitar esta possibilidade porque os
electrões de um supercondutor são fermiões, não podendo, assim, acumular-se em estados de
baixa energia. A temperaturas suficientemente baixas, os electrões organizam-se definindo uma
superfı́cie de Fermi, não um condensado de Bose-Einstein.
De facto, não são os electrões propriamente ditos a formarem um condensado de Bose-Einstein,
mas sim estados ligados de pares de electrões, que sendo formados por duas partı́culas com spin1/2, têm momento angular total inteiro (zero ou um), ou seja, são bosões. Estes pares são conhecidos como pares de Cooper.
Como podem formar-se estados ligados de dois electrões? Dois electrões livres são partı́culas
carregadas com cargas de sinal igual e, por isso, repelem-se, não formam estados ligados, para os
quais é necessária uma força atractiva! Mas acontece que os electrões num supercondutor não são
livres. Muito pelo contrário, nos materiais que passam mais facilmente à fase supercondutora, os
electrões sofrem fortes interacções com a rede cristalina, como indica o facto de não serem, em
geral, bons condutores eléctricos, na fase normal. De acordo com a teoria, a passagem de um
electrão numa região do sólido provoca ligeiros deslocamentos dos iões (que constituem o cristal
onde os electrões se movem) nessa região, provocados pelas forças com que o electrão de passagem
os atrai. Assim, essa região fica, por breves instantes, positivamente carregada e, por isso, exerce
forças de atracção sobre outros electrões na vizinhança. Deste modo, surge uma atracção efectiva
entre electrões, mediada pelas deformações do cristal, que pode, em certas condições e apenas para
certos estados electrónicos, vencer a repulsão electrostática e levar ao estabelecimento de estados
ligados, os pares de Cooper. Evidentemente, esta atracção é muito fraca, de forma que os pares
assim formados não permanecem ligados durante intervalos de tempo longos, senão a temperaturas
extremamente baixas, justamente as necessárias para a passagem à fase supercondutora.
A teoria que aqui foi sucintamente resumida está em bom acordo com os factos experimentais(d) . Os principais responsáveis pelo seu desenvolvimento até à forma presente foram J. Bardeen,
L. Cooper e J. Schrieffer, cujos esforços foram premiados com a atribuição conjunta do prémio
Nobel de 1972.
(c) Repare-se que não nos referimos aqui, quando falamos de estados, aos estados quânticos dos electrões que
integram os átomos de hélio, mas sim aos estados quânticos dos próprios átomos, vistos como partı́culas elementares
(as energias envolvidas na transição para a fase superfluida são muito menores do que as necessárias para excitar
os graus de liberdade internos a cada átomo), descritas por uma equação de Schrödinger própria.
(d) Isto não é totalmente verdade no que se refere aos supercondutors “quentes,” aqueles cuja temperatura de
transição é superior à temperatura de ebulição do azoto, 77,4 K.
112
7.5
Aplicações da supercondutividade
A maioria das possı́veis aplicações da supercondutividade são as que resultam do facto de um
supercondutor apresentar resistência nula. Com efeito, se se pudesse “desligar” o efeito de Joule
no transporte de electricidade, usando linhas de distribuição supercondutoras, grandes economias
seriam realizadas. Claro que o arrefecimento e a manutenção da baixa temperatura de várias toneladas de cabo, extendidas ao longo de dezenas ou centenas de qilómetros, coloca outros problemas
e envolve outros custos... Por enquanto, continua a ser mais barata a factura do efeito de Joule.
O efeito de Joule não se limita a implicar custos, por vezes estabelece limites para o rendimento de máquinas. O exemplo mais simples é o das bobines para gerar campos magnéticos. A
intensidade do campo gerado por um solenóide é proporcional à corrente que o percorre. Mas a
potência dissipada pelo solenóide é proporcional ao quadrado da corrente. Então, quanto mais
intenso o campo gerado, mais potência é dissipada pelo solenóide. Esta potência manifesta-se num
aquecimento que pode levar à fusão do condutor usado. Este facto obriga à utilização de solenóides
constituı́dos por condutores muito espessos (logo, muito caros). Outra possibilidade é a utilização
de solenóides supercondutores com resistividade nula. Já não se coloca aqui, pelo menos com a
mesma gravidade, o problema da extensão espacial do condutor a que nos referimos no parágrafo
anterior. É, então, comparativamente simples arrefecer um solenóide, mesmo que tenha dimensões
avantajadas, e tais solenóides supercondutores são usados para gerar os campos magnéticos que
orientam os feixes de protões e antiprotões no Tevatron, o acelerador de partı́culas mais poderoso
da actualidade (2005), instalado no Fermilab, nos Estados Unidos da América. Esta tecnologia
será igualmente usada no Large Hadron Collider do CERN que, em Junho de 2007, entrará em
funcionamento. A facilidade da geração de campos intensos usando solenóides supercondutores
será também, concerteza, aproveitada nos estudos experimentais da fusão nuclear. Outro campo,
mais relacionado com o nosso dia a dia, onde esta possibilidade é utilizada é no da imagiologia
médica, nalguns aparelhos de ressonância magnética nuclear.
Outras aplicações da supercondutividade não estão tão relacionadas com a propriedade fundamental da resistividade nula. Em particular, refiram-se as que utilizam as chamadas junções
de Josephson, que são constituı́das por dois supercondutores separados por uma camada isolante
muito fina, capaz de permitir a passagem, por efeito de túnel, da corrente supercondutora. As
junções de Josephson são usadas para medir campos magnéticos com enorme precisão (em dispositivos chamados SQUID’s, Superconductor QUantum Interference Devices). São também usadas
na definição da unidade SI de diferença de potencial.
Bibliografia
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989), capı́tulo 13 (F5.0
437 +)
• K. Mendelsson, “Em demanda do Zero Absoluto” (1968), capı́tulos 9 e 10 (mas leiam o resto
também!)
• F. Blatt, “Modern Phisics” (1992), secções 13.5 (supercondutividade) e 11.4 (superfluidez)
(F5.0 448 +)
PROBLEMAS
7.1 Considere um anel condutor com resistência R e indutância L. Suponha que induz neste condutor
uma corrente transitória que num instante t = 0 tem o valor i0 . Como é que esta corrente evolui
temporalmente?
7. Problemas
7.2 Num cilindro isolador com 50 mm de raio, enrola-se um sistema de bobines de Helmholtz (duas
bobines circulares, separadas por uma distância igual ao seu raio), cada uma das quais constituı́da
por apenas uma espira de fio de chumbo. O diâmetro do fio condutor usado é 1 mm. Funcionando
mergulhado num banho de hélio lı́quido a 4,2 K, qual o valor máximo da corrente para a qual as
bobines permanecem na fase condutora? Qual o valor máximo do campo criado no ponto central
entre as duas espiras?
7.3 A temperatura crı́tica do alumı́nio é 1,140 K, ao passo que o valor crı́tico do campo magnético
é 0,0105 T. Qual o maior valor da corrente (distribuı́da uniformemente) que pode percorrer um
condutor de alumı́nio com secção transversal circular com um raio de 2 mm, a uma temperatura
de 0,5 K?
7.4 O vanádio tem uma temperatura crı́tica de 5,4 K e um campo crı́tico a 0 K de 0,14 T. Determine
o valor do campo magnético que destrói a fase supercondutora do vanádio a uma temperatura de
4,3 K.
7.5 O campo crı́tico para o chumbo tem um valor de 0,0803 T e uma densidade electrónica de
13,2×1028 m−3 . Calcule a profundidade de penetração do campo magnético em chumbo supercondutor e determine a densidade de corrente que se estabelece na superfı́cie de uma amostra
de chumbo supercondutor na presença de um campo com intensidade de 0,03 T
113
Capı́tulo 8
Fı́sica Nuclear I — Propriedades
do núcleo atómico
Chegou a altura de abandonarmos o estudo dos sólidos para nos dedicarmos a outro tipo de
sistemas de muitos corpos, os núcleos atómicos.
É interessante notar que a Fı́sica dos Sólidos e a Fı́sica Nuclear são talvez os dois ramos da Fı́sica
que mais impacto tiveram no desenvolvimento da sociedade ocidental do Séc. XX. A primeira,
porque possibilitou o desenvolvimento da electrónica sem a qual a revolução informática e das
telecomunicações não teria ocorrido; a segunda, não tanto pelas suas aplicações benéficas (que são
muitas, como a radioterapia, algumas técnicas imagiológicas de diagnóstico, a datação de vestı́gios
arqueológicos por determinação do teor de carbono-14, etc.), mas principalmente porque permitiu
o desenvolvimento de armas de destruição maciça, com um poder capaz de destruir a civilização,
que determinaram as polı́ticas mundiais durante a chamada guerra fria, na segunda metade do
Séc. XX. Apesar de ter terminado a guerra fria, a mera existência dessas armas continua a colocar
sérios problemas de segurança, que não podem ser tomados de ânimo leve pelos responsáveis
polı́ticos.
8.1
Núcleo atómico — Generalidades
Como vimos na Secção 1.1.2, o núcleo atómico é a região central do átomo, com carga eléctrica de
sinal positivo, onde se concentra a quase totalidade da massa atómica(a) . Os núcleos atómicos de
todas as substâncias têm uma carga múltipla da do de hidrogénio, o que sugere que os núcleos são
estruturas compostas por partı́culas elementares, os protões. O núcleo dos átomos de hidrogénio
será então a mais simples destas estruturas, consistindo apenas em um protão. Como também
discutimos no Secção 1.1.2, para compreender os valores da massa e do momento angular dos
diferentes núcleos, é necessário considerar ainda uma segunda partı́cula elementar, o neutrão. A
Tabela 8.1 apresenta o valor de algumas propriedades destas duas partı́culas. Chamamos nucleão
protão
neutrão
massa (u)
1,00728
1,00866
carga eléctrica
e
e
spin
1/2
1/2
Tabela 8.1: Valores da massa, da carga eléctrica (e = 1,022×10−19 C é o simétrico da carga
electrónica) e do spin dos protões e dos neutrões.
a qualquer destas duas partı́culas.
(a) 99,95%,
no átomo de hidrogénio, mais ainda nos restantes.
115
116
CAPÍTULO 8. FÍSICA NUCLEAR I — PROPRIEDADES DO NÚCLEO ATÓMICO
Ao número total de nucleões num núcleo dá-se o nome de número de massa; ao número
de protões, número atómico (b) . Dois núcleos com iguais números de protões e de neutrões são
idênticos (não considerando a possibilidade de um deles estar num estado excitado); dizemos que
pertencem ao mesmo nuclı́deo. Um determinado nuclı́deo é então especificado indicando o seu
número de protões e de neutrões. Como o primeiro destes números identifica a espécie quı́mica,
resta apenas indicar o número de neutrões ou, mais frequentemente, o número de massa. A notação
habitual consiste em preceder o sı́mbolo quı́mico com o número de massa, sobreescrito. Facultativamente, pode explicitar-se o número atómico em subscrito, precedendo também o sı́mbolo
quı́mico, e o número de neutrões, subscrito, após o sı́mbolo quı́mico. Assim, por exemplo, todas
as seguintes notações identificam um mesmo nuclı́deo do cloro, aquele que tem número de massa
igual a trinta e cinco:
35
Cl
35
17 Cl
35
17 Cl18
Dois nuclı́deos com o mesmo número de massa chamam-se isóbaros; quando têm iguais números
atómicos, chamam-se isótopos; finalmente, chamam-se isótonos aqueles com iguais números de
neutrões. Assim, o 12 C e o 14 C são isótopos; o 14 C e o 16 O são isótonos; o 14 C e o 14 N são
isóbaros.
O núcleo atómico é então um agregado de nucleões, de dimensões extremamente reduzidas, da
ordem de, apenas, alguns fentometros(c) . Por serem tão pequenos, a forma dos núcleos não pode
ser determinada directamente, mas podem obter-se algumas indicações a partir da distribuição de
carga eléctrica nuclear (que, por seu turno, pode ser avaliada a partir de experiências de dispersão
de electrões de muito alta energia). Deste tipo de estudos, pode concluir-se que os núcleos têm
formas muito aproximadamente esféricas, verificando-se também núcleos com deformações oblatas
(como a da Terra, a das tangerinas ou, ainda, num exemplo mais extremo, a das pizzas) e com
deformações prolatas (como a das bolas de rugby ou a dos charutos).
8.2
A massa nuclear e a energia de ligação
A massa nuclear é uma quantidade apropriada para ilustrar a equivalência massa-energia expressa
na famosa equação E = mc2 da teoria da relatividade restrita. Tomemos, por exemplo, o caso do
hélio-4. Os núcleos de hélio-4 são constituı́dos por dois protões e dois neutrões e tem uma massa
de 4,0015 u; a soma das massas dos quatro nucleões que o formam, em contrapartida, tem o valor
de 4,0319 u. A diferença entre estes dois valores corresponde à energia de ligação, que é libertada
no momento em que os quatro nucleões se juntam.
É melhor estudarmos esta questão com um pouco mais de atenção. Antes de ser proposta a
teoria da relatividade, eram tomadas como verdadeiras duas leis de conservação independentes,
a da massa (que se devia a Lavoisier) e a da energia (que foi sendo refinada ao longo dos anos
até ser enunciada na forma da primeira lei da Termodinâmica). Supunha-se, então, que quando o
estado de um sistema isolado evoluı́a entre dois instantes ti e tf > ti , eram satisfeitas, de forma
independente, as igualdades
M (ti ) =
M (tf )
E(ti ) =
E(tf ),
onde M (t) e E(t) representam, respectivamente, a massa e a energia do sistema como funções do
tempo. Sabemos agora que a primeira destas igualdades não é, em geral, exactamente satisfeita.
Verifica-se, sim, a segunda mas, no cálculo da energia total de um sistema, devemos incluir a sua
energia de repouso, dada por
ERep. = M c2 ,
onde c = 3 × 108 m/s é a velocidade da luz e M é a massa do sistema.
(b) Por
(c) Um
último, ao número de neutrões num núcleo dá-se o nome de... bem, número de neutrões.
fentometro, mais habitualmente designado por fermi, é 10−15 m.
8.3. A FORÇA NUCLEAR FORTE
117
Voltemos agora ao exemplo do 4 He. Imaginemos que fornecemos, a um núcleo de 4 He, uma
quantidade de energia, B, apenas suficiente para separar os quatro nucleões que o constituem, e
analisemos este processo em termos da conservação de energia. Inicialmente, temos um núcleo de
hélio-4 e uma quantidade de energia B. A energia inicial total é, então,
E(ti ) = M
¡4
¢
He c2 + B,
¡
¢
onde M 4 He representa a massa do núcleo em estudo. No final, temos dois protões e dois neutrões
afastados uns dos outros, em repouso. A energia final é, pois,
E(tf ) = 2(mN + mP )c2 ,
onde mN e mP representam, respectivamente, as massas do neutrão e do protão. Igualando estes
dois valores, de acordo com o prı́ncipio da conservação da energia, obtemos
£
¡
¢¤
B = 2(mP + mN ) − M 4 He c2
o que explicita, de forma mais fundamentada, o que há pouco dissemos sobre esta diferença de
massas. Este cálculo pode ser repetido para qualquer núcleo, o que nos permite definir, em geral,
a energia de ligação num dado nuclı́deo arbitrário A
Z XN como
B
¡A
Z XN
¢
£
¡
¢¤
= c2 N mN + ZmP − M A
.
Z XN
A energia de ligação por nucleão (isto é, a energia de ligação cada núcleo dividida pelo seu
número de massa) é, tipicamente, cerca de alguns MeV(d) . Por esta razão, usa-se em Fı́sica Nuclear, como unidade de massa, o Mev/c2 , cuja relação com a unidade de massa atómica e com o
quilograma é
1 MeV/c2 = 1,07354 × 10−3 u = 1,78266 × 10−30 kg.
Frequentemente, não se explicita o factor c2 na unidade, aparecendo a unidade como “MeV”
apenas. Esta notação pode confundir um principiante, mas quaisquer dúvidas podem ser resolvidas
rapidamente com análise dimensional.
A energia de ligação por nucleão, dada por
b(A, Z) = B(A, Z)/A,
pode ser facilmente calculada dispondo-se de uma tabela de massas nucleares ou atómicas, como
a que se pode consultar no Apêndice B do Blatt[1992]. Os resultados que se obtêm para os
nuclı́deos estáveis(e) são os apresentados na Figura 8.1. Como se pode constatar, a partir de
valores relativamente moderados do número de massa (A ≈ 25), a energia de ligação por nucleão
apresenta um valor aproximadamente constante de cerca de 8 MeV.
8.3
A força nuclear forte
A força responsável pela coesão dos núcleos não é, com certeza, uma força de natureza eléctrica ou
gravı́tica. Não pode ser uma força eléctrica porque confina no interior do núcleo os neutrões, que
são electricamente neutros. Não é, também, uma força gravı́tica porque esta não é suficientemente
intensa para vencer a repulsão electrostática entre os protões que constituem os núcleos. É uma
força de um tipo novo, a que se deu o nome de força nuclear forte ou, simplesmente, força forte,
que apresenta uma série de caracterı́sticas especiais.
(d) 1 MeV
(e) Mais
= 106 eV = 1, 602 × 10−13 J.
adiante veremos que nem todos os nuclı́deos são estáveis.
118
BA HMeVL
8
6
4
2
50
100
150
200
A
Figura 8.1: Energia de ligação por nucleão (em MeV) como função do número de massa, para os
nuclı́deos estáveis.
8.3.1
Saturação
Num sistema de N corpos estabilizado pela força eléctrica (como o átomo) ou pela força gravı́tica
(como o sistema solar), a energia potencial total é
N
U=
1X
Vij ,
2
i6=j
onde Vij é a energia de interacção entre as partı́culas i e j (f) . Admitindo que esta energia tem um
valor médio Ṽ , ficamos com
1
U = Ṽ N (N − 1).
2
A energia de ligação por partı́cula é, então,
u≡
U
1
= Ṽ (N − 1).
N
2
Vemos assim que a energia média de ligação por constituinte de um sistema eléctrico ou gravı́tico
é uma função aproximadamente linear do número de constituintes do sistema. Ora, o mesmo não
acontece com o núcleo. Como se mostra na Figura 8.1, a energia de ligação por nucleão tem um
valor aproximadamente constante. Tal pode ser explicado admitindo que a força nuclear satura,
isto é, que cada nucleão pode apenas interagir com um número finito de outros nucleões. Se cada
nucleão, dos A que constituem um núcleo, interagir, apenas, com R outros nucleões, com uma
energia média Ṽ , a energia total de ligação é, aproximadamente,
A
B=
R
1
1 XX
Ṽ = Ṽ AR.
2 i=1 j=1
2
(f) Inclui-se o factor 1/2 para corrigir a contagem das interacções. Com efeito, para calcular bem a energia potencial
total, devemos contar apenas um vez cada uma das interacções entre as partı́culas que formam o sistema, ou seja,
devemos contar apenas uma vez cada par de partı́culas. Ora, o somatório nesta equação faz aparecer cada par duas
vezes, à medida que i e j correm todos os valores possı́veis de 1 a N .
119
R(fm)
208Pb
7
150Nd
138Ba
109Ag
6
66Zn
56Fe
5
89Y
36Ar
23Na
16O
12C
4
3
2
1
A1/3
0
0
1
2
3
4
5
6
Figura 8.2: Raio nuclear como função da raiz cúbica do número de massa.
A energia de ligação por nucleão fica então
B/A =
1
Ṽ R,
2
uma constante independente do número de massa A.
Outro indı́cio desta saturação da força forte é o facto da densidade nuclear ser praticamente a
mesma para todos os nuclı́deos. A Figura 8.2 mostra o raio nuclear como função da raiz cúbica
do número de massa. Nota-se claramente a relação de proporcionalidade
R = R0 A1/3 ,
(8.1)
com R0 ' 1,25 fm, de onde se conclui que o número de massa é proporcional ao volume nuclear.
Num sistema em que cada partı́cula interage com todas as restantes a intensidade da ligação é
tanto maior quanto maior for o número de partı́culas, e portanto esperamos que a densidade dos
sistemas “grandes” seja maior que a dos sistemas “pequenos”. Por exemplo, consideremos os
átomos, sistemas geridos pela interacção electromagnética; aı́, não se verifica a proporcionalidade
do raio do sistema (raio atómico) com a raiz cúbica do número de partı́culas (número atómico).
Antes pelo contrário, à parte a descontinuidade que ocorre de cada vez que se fecha uma camada,
verifica-se que o raio atómico diminui com o aumento do número atómico, aumentando, portanto,
a densidade. O aumento da densidade com o aumento do número de partı́culas verifica-se também
nos sistemas gravı́ticos, onde se nota que a densidade das estrelas de maior massa é maior que a
das estrelas mais leves.
8.3.2
Alcance
Ao contrário das interacções electromagnéticas e gravı́ticas que se fazem sentir a distâncias muito
grandes, a força forte tem um alcance muito reduzido. Esta conclusão pode retirar-se da análise
dos resultados de experiências de dispersão de partı́culas α de alta energia por átomos, semelhantes
à experiência de Rutheford.
Na experiência de Rutheford, a energia das partı́culas α incidentes determina a profundidade
com que conseguem penetrar no interior do átomo. De facto, a energia potencial eléctrica da
120
Intensidade (unidades relativas)
1000
100
10
1
10
15 20 25 30 35 40
Energia das partículas α (MeV)
45
Figura 8.3: Intensidade de um feixe de partı́culas α, difractado segundo um ângulo de 60◦ por um
alvo de átomos de chumbo 208 Pb, como função da energia do feixe incidente. Os valores experimentais
estão representados por cruzes e a linha representa o resultado de um cálculo considerando apenas a
interacção electrostática entre o núcleo e a partı́cula α. (Krane[1988], Fig. 3.11).
interacção entre uma partı́cula α e o núcleo de um átomo com o qual colide é (tomando a partı́cula α
como pontual)
1 2Ze2
V =
,
4π²0 r
onde r é a distância que separa a partı́cula α do centro do átomo, Z é o número atómico dos
átomos que constituem o alvo, e o módulo da carga electrónica e ²0 é a permitividade eléctrica do
vazio. Considerando, para maior simplicidade, que o núcleo alvo tem uma massa muito maior que
a da partı́cula α incidente, de tal modo que se possa desprezar o efeito do seu recuo na colisão, o
maior valor que esta energia pode tomar é o da energia total, E, com que a fonte de partı́culas α
as anima. Logo, partı́culas α com energia E podem aproximar-se até uma distância
r=
1 2Ze2
4π²0 E
(8.2)
do centro atómico.
Tentemos interpretar, à luz desta relação, os resultados experimentais relativos à dispersão
de partı́culas α por átomos de chumbo 208 Pb, apresentados na Figura 8.3. Nesta figura, notase claramente que, quando a energia das partı́culas α não excede um valor de cerca de 27 MeV,
as medições experimentais (cruzes) estão em bom acordo com os valores teoricamente previstos,
considerando apenas a interacção coulombiana entre os núcleo e as partı́culas α. Esta convergência
entre valores teóricos e experimentais mostra que a força forte entre o núcleo dos átomos de chumbo
e as partı́culas α não tem qualquer papel na dispersão destas partı́culas, ou seja, elas não a sentem.
A distância mı́nima entre projécteis e alvo é, para partı́culas α com 27 MeV, cerca de 8,5 fm(g) .
Assim, concluı́mos que a força forte não actua a distâncias de cerca de 8 fm ou superiores. Cálculos
mais precisos mostram que o alcance da força forte é de cerca de 2 a 3 fentometro.
(g) Este valor resulta da aplicação Eq. (8.2). Em rigor, esta fórmula só é válida para partı́culas α que sofrem colisões
frontais com os núcleos dos átomos do alvo e que, consequentemente, são desviadas de 180◦ (backscattering). Ora,
os dados que usamos são relativos a partı́culas α que são desviadas de 60◦ . Estas partı́culas não se aproximam
tanto do centro do núcleo com o qual colidem.
121
-0.1
A = 19
A = 25
A = 31
A = 37
-0.15
ε (GeV)
-0.2
-0.25
-0.3
-0.35
-0.4
5
10
15
20
Z
Figura 8.4: Energia de ligação subtraı́da da energia electrostática (calculada supondo o núcleo como
uma esfera uniformemente carregada), para diferentes números de massa, A, como função do número
atómico. Verifica-se, em cada sequência, que os valores obtidos para núcleos espelho (assinalados
com as setas) são praticamente iguais.
Para energias superiores, a proximidade máxima entre as partı́culas α e os núcleos de chumbo
já é tal que a força forte contribui para o desvio do feixe incidente, afastando-se assim os resultados
experimentais da previsão teórica.
8.3.3
Independência da carga
Núcleos com o mesmo número de massa e com os números de protões e de neutrões trocados
chamam-se núcleos espelho. Por exemplo, o 31 H e o 32 He são núcleos espelho. Outros exemplos são
53
53
63
o do 63
31 Ga e 32 Ge ou o do 28 Ni e 25 Mn. Quando subtraı́mos à massa de dois núcleos espelho a massa
dos nucleões que os constituem e a massa correspondente à energia de repulsão electrostática entre
protões, obtemos valores que são muito parecidos, como se pode verificar analisando a Figura 8.4.
Deste facto podemos concluir que a força forte prende com a mesma força os protões e os neutrões,
isto é, não depende da carga dos nucleões. Uma conclusão semelhante pode deduzir-se da análise
de experiências de dispersão.
8.3.4
O deuterão e a dependência do spin
Podemos obter mais informação sobre as caracterı́sticas da força nuclear considerando o mais
simples dos núcleos compostos, o deuterão. O deuterão é o único núcleo com dois nucleões, sendo
constituı́do por um protão e por um neutrão. A sua energia de ligação é de, apenas, 2,2 MeV e o
seu momento angular total (que resulta da soma dos momentos angulares orbitais e dos spins dos
dois nucleões) é 1(h) . Como não há outros núcleos compostos por dois nucleões, concluı́mos que o
deuterão é o estado fundamental do sistema nuclear de dois corpos. Mas o estado fundamental de
um sistema de dois corpos é um estado com momento angular orbital l = 0(i) (como o nı́vel 1-s
do átomo de hidrogénio), logo, sendo 0 o momento angular orbital deste sistema, concluı́mos que
(h) Estamos
aqui a cometer um (muito habitual) abuso de linguagem. Aquilo que, de facto, queremos
dizer é que
p
√
j = 1 é o número quântico de momento angular; o módulo do momento angular do deuterão é h̄ (j(j + 1)) = h̄ 2.
(i) Isto só é verdade quando a força entre os dois corpos é uma força radial, isto é, dirigida segundo a direcção do
segmento de recta que os une. O estudo das propriedades do deutrão mostra que a força nuclear viola ligeiramente
esta condição, traduzindo-se este facto numa ligeira “contaminação” da função de onda do deutério por componentes
com momento angular orbital l = 2.
122
o momento angular total j = 1 apresentado pelo deuterão se deve a um alinhamento dos spins do
protão e do neutrão.
A força nuclear entre dois nucleões é, então, tal, que apenas se formam estados ligados quando
os seus spins estão alinhados, de maneira a formar estados com momento angular orbital nulo, mas
momento angular total igual a um. Isto mostra claramente que a força nuclear depende fortemente
do spin das partı́culas em interacção.
8.4
8.4.1
Dois modelos para estrutura do núcleo
O modelo da gota lı́quida
O facto de a força nuclear ter um alcance limitado e ser uma interacção que satura, bem como o
facto de a densidade nuclear ser constante, leva-nos naturalmente a pensar num núcleo atómico
como uma gota de água. Com efeito, a água é um lı́quido essencialmente incompressı́vel, ou seja,
tem densidade constante. Assim, o volume de uma gota é proporcional ao número de moléculas
de água que a formam, o que leva a uma relação entre o raio da gota e o número de moléculas
semelhante à Eq. (8.1).
Considerando a dinâmica de uma gota de lı́quido, von Weizsäcker propôs a seguinte fórmula
para a energia de ligação nuclear:
B = x1 A − x2 A2/3 − x3 − x3 Z(Z − 1)A−1/3 − x4
(A − 2Z)2
+ δ(A, Z).
A
(8.3)
Os coeficientes x1 , . . . , x4 e a função δ(A, Z) são ajustados de forma a obter um bom acordo com
a experiência. Uma escolha possı́vel é
x1 = 15,5 MeV
x3 = 0,72 MeV
e

 x5 A−3/4 ,
0,
δ(A, Z) =

−x5 A−3/4 ,
x2 = 16,8 MeV
x4 = 23,0 MeV
se Z e N forem pares
se A for ı́mpar
se Z e N forem ı́mpares,
com x5 = 34 MeV. Justifiquemos agora os vários termos na Eq. (8.3):
Termo de volume: o primeiro termo na fórmula de Wizsäcker é proporcional ao número de
nucleões, ou seja proporcional ao volume. Supõe-se que quanto maior o número de partı́culas
num sistema em que interagem atractivamente, maior a energia de ligação
Termo de superfı́cie: o segundo termo é proporcional à potência 2/3 do número de partı́culas.
Dada a Eq. (8.1), este termo é proporcional ao quadrado do raio atómico, ou seja, proporcional à área da superfı́cie do núcleo. Este termo é negativo, o que significa que se subtrai
à energia de ligação. Basicamente, este termo favorece a forma esférica, que é a que menor
área superficial apresenta para um dado volume.
Termo de Coulomb: este termo toma conta do facto de a repulsão electrostática entre os protões
no núcleo contribuir para diminuir a energia de ligação. Note-se que Z(Z − 1) é o número
de pares de protões e A−1/3 é proporcional ao inverso do raio nuclear.
Termo de simetria: este termo é mı́nimo quando os números de protões e de neutrões são iguais,
e é incluido para reflectir o facto de os núcleos mais estáveis apresentarem um equilı́brio
aproximado dos números dos dois tipos de nucleão. Veremos melhor daqui a pouco o porquê
deste facto.
Termo de emparelhamento: acontece que a força nuclear favorece o emparelhamento de nucleões do mesmo tipo. Em geral são mais estáveis os núcleos em que os números de neutrões
e de protões são pares.
Esta fórmula semi-empı́rica produz resultados notavelmente próximos dos valores experimentais.
8.4. DOIS MODELOS PARA ESTRUTURA DO NÚCLEO
123
10
50
82
Número de nuclídeos estáveis
Número de nuclídeos estáveis
12
20 28
8
126
6
4
2
0
20
28
50
82
10
8
6
4
2
0
0
20
40
60
80
100
Número de neutrões
120
140
0
10
20
30
40
50
60
Número de protões
70
80
90
Figura 8.5: Número de núclideos estáveis como função do número de neutrões (à esquerda) e do
número de protões (à direita). Nota-se bem (pelo menos no gráfico da esquerda) que os máximos
ocorrem quando estes números são números mágicos.
8.4.2
Modelo em camadas
Muitas propriedades atómicas, vistas como funções do número atómico, sofrem variações muito
bruscas quando aquele número toma os valores 2, 10, 18, 36, 54, e 86. Dois exemplos deste efeito
foram apresentados na Figura 1.9. Como vimos no primeiro capı́tulo, estas variações bruscas
verificam-se quando se completam camadas na estrutura electrónica. Na fı́sica nuclear verificam-se também variações bruscas dos valores das propriedades fı́sicas do núcleo, quando os números de
protões e/ou neutrões tomam os valores 2, 8, 20, 28, 50, 82, 126, chamados os números mágicos. Por
exemplo, há mais nuclı́deos estáveis quando o número de neutrões é um número mágico, como se
pode verificar analisando a Figura 8.5. O mesmo se verifica, mas de forma menos evidente, quando
se considera o número de protões. Outras propriedades fı́sicas apresentam descontinuidades quando
um dos (ou ambos) números de nucleões é um número mágico. Este facto inspirou um modelo da
estrutura nuclear semelhante ao da estrutura atómica, segundo o qual cada nucleão se move sujeito
a um potencial efectivo médio, relativamente independente das particularidades do movimento
dos restantes nucleões. A interacção entre diferentes nucleões manifesta-se apenas na definição do
potencial nuclear médio. Cada nucleão move-se em função desse potencial, independentemente
dos demais. Isto permite grandes simplificações no tratamento matemático do sistema nuclear.
Por exemplo, a Equação de Schödinger de um núcleo com número de massa A pode decompor-se
em A equações de partı́cula única, uma para cada nucleão no sistema, com a forma
ih̄
∂ψ(~r, t)
h̄2 2
=−
∇ ψ(~r, t) + Vef (~r)ψ(~r, t),
∂t
2m
onde Vef (~r) é o potencial nucelar médio.
Não se conhece ao certo, mesmo para os núcleos mais simples (como o deuterão, constituı́do
apenas por um protão e um neutrão), a expressão analı́tica do potencial nuclear médio. Ou seja,
não dispomos do equivalente a uma “Lei de Coulomb” na fı́sica nuclear. É possı́vel justificar a
priori várias formas diferentes, que são, a posteriori, avaliadas em função da comparação dos
resultados obtidos com valores experimentais. A prática mostra que um simples poço de potencial
rectangular finito,
½
0
se r > R0
Vppr (~r) =
−V0
se r < R0 ,
onde R0 é o raio nuclear e V0 é a energia de ligação por nucleão, permite justificar algumas
propriedades nucleares (por exemplo, os valores dos números mágicos 2, 8, 20,2 8, 50, 82, 126).
Um outro modelo, mais sofisticado, é o de Saxon-Woods, em que o potencial médio é
VSW (r) =
−V0
,
1 + e(r−R0 )/a
124
0
V(r)
r
R0
-V0
Figura 8.6: Potencial nuclear rectangular (a tracejado) e potencial de Saxon-Woods (a cheio).
P
N
2
H
P
N
3
H
P
N
3
He
P
N
4
He
P
N
7
Li
Figura 8.7: Digramas de ocupação de nı́veis nucleares para alguns nuclı́deos de baixo número de
massa.
onde a é uma medida da expessura da fronteira do núcleo. Na Figura 8.6 apresentam-se os gráficos
destas duas funções. Há muitas outras propostas para o potencial nuclear médio, com diferentes
qualidades na capacidade de descrever o núcleo e as suas propriedades. As duas que apresentámos
são, apenas, as mais simples.
Feita uma escolha para o potencial nuclear, a resolução da Equação de Schrödinger permite-nos
determinar os estados nucleónicos, ou seja as orbitais que serão ocupadas pelos diferentes nucleões,
da mesma maneira que a resolução da Equação de Schrödinger do átomo de hidrogénio nos fornece
as orbitais electrónicas. Uma diferença importante entre estes dois exercı́cios é que, ao contrário
do que acontece na nuvem electrónica, o núcleo é partilhado por dois tipos diferentes de fermiões,
os protões e os neutrões. Os dois tipos de nucleões devem satisfazer, separadamente, o Princı́pio
de Exclusão de Pauli. Devemos então concluir que há orbitais de protão e orbitais de neutrão,
nı́veis de energia de protão e nı́veis de energia de neutrão. A Figura 8.7 mostra um esquema de
ocupação de nı́veis para alguns nuclı́deos de baixo número de massa.
Podemos agora colocar a seguinte questão: se a força nuclear forte não depende da carga, isto
é, se a força nuclear forte não distingue protões de neutrões, porque é que não existem outros
estados ligados de dois nucleões? Mesmo aceitando a que a repulsão electrostática inviabilize os
“diprotões”, porque é que não são possı́veis “dineutrões”? Estes estados não são possı́veis por
causa do Princı́pio de Exclusão de Pauli. Os dois nucleões num “dinucleão” devem estar no estado
fundamental, logo, devem ter momento angular orbital l = 0 (tal como na fı́sica atómica, no estado
fundamental o número quântico de momento angular só pode tomar o valor l = 0), logo, ambos
têm número quântico de projecção de momento angular ml = 0; além disso, devem ter os spins
alinhados no mesmo sentido, porque a força nuclear depende do spin e só com os spins alinhados
é atractiva a força entre dois nucleões. Temos então dois nucleões no mesmo estado, com números
quânticos n = 1, l = 0, ml = 0, ms = 1/2. De acordo com o Princı́pio de Exclusão de Pauli, isto
8. Problemas
125
só pode acontecer se os dois nucleões não forem idênticos, ou seja, se um for um protão e o outro
um neutrão.
Bibliografia
• P. Tipler e R. Llewellyn, “Fı́sica Moderna” (3.a edição), Capı́tulo 11: Fı́sica Nuclear
• F. Blatt, “Modern Phisics” (1992) Capı́tulo 14: Propriedades dos Núcleos (F5.0 448)
• R. Serway e R. Beichner, “Physics” (5.a edição), Capı́tulo 44: Estrutura Nuclear
PROBLEMAS
8.1 Quais os valores dos números de massa, atómico e de neutrões para os nuclı́deos indicados abaixo?
18
F,
25
Na,
51
V,
84
Kr,
120
Te,
148
Dy,
175
W,
222
Rn.
8.2 Electrões emitidos no decaimento-β têm energias até cerca de 1 MeV. Usando o Princı́pio da
Incerteza, mostre que eles não podiam existir no núcleo antes do decaimento.
8.3 Escreva os sı́mbolos de dois isótopos, de dois isótonos e de dois isóbaros dos nuclı́deos
120
Sn.
8.4 Determine as energias de ligação dos seguintes isóbaros:
23
Ne,
23
Mg,
23
18
F, 208 Pb,
Al.
8.5 Repita o problema anterior, mas usando agora a fórmula de Weizsäcker.
8.6 Algumas estrelas podem, numa fase final das suas existências, sofrer um processo cataclı́smico em
que se dá uma captura electrónica generalizada, processo que será estudado no próximo capı́tulo
destes apontamentos. O astro resultante deste processo é composto quase só por neutrões e a
sua densidade é muito aproximada à densidade nuclear. Calcule o raio de uma estrela de neutrões
com massa igual à do sol, cerca de 2×1030 Kg.
8.7 O spin do estado fundamental do 6 Li, que constitui 7,5% do lı́tio natural, é nulo. Mostre que este
valor é incompatı́vel com a hipótese de que os neutrões são pares protão-electrão.
Capı́tulo 9
Fı́sica nuclear II — Reacções
nucleares
9.1
Radioactividade
Dos cerca de três mil nuclı́deos conhecidos, somente 278 são estáveis. Todos os restantes têm
tendência para, de algum modo, se modificarem, transformando-se em núcleos de outra espécie.
Este processo, que é expontâneo, chama-se decaimento nuclear e é acompanhado de emissão de
radições. É o decaimento nuclear que está por trás do fenómeno da radioactividade, cuja descoberta
por Becquerel em 1897 iniciou o estudo da Fı́sica Nuclear, numa altura em que quase nada se sabia
ainda sobre a estrutura atómica.
Os elementos cujos átomos têm núcleos instáveis chamam-se radioactivos. Os elementos com
número atómico acima do do bismuto (83) são todos radioactivos. Mas este fenómeno não se limita
ao extremo superior da tabela periódica. Todos os elementos têm alguns isótopos radioactivos,
logo a partir do hidrogénio (por exemplo, o 3 H).
9.1.1
A região de estabilidade
Em primeira aproximação, pode dizer-se que os núcleos estáveis são aqueles que apresentam iguais
números de protões e de neutrões. Isto só é rigorosamente verdade para núcleos com número de
massa não muito elevado. Quando este aumenta muito, a repulsão electrostática entre protões
é tão elevada, que se torna necessário “diluir” os protões num número ainda maior de neutrões.
Assim, à medida que aumenta o número de massa, verifica-se um aumento do peso relativo dos
neutrões no núcleo. Na Figura 9.1, representa-se num diagrama (Z, N ) o conjunto dos núcleos
estáveis. Nota-se aı́ o que acabámos de indicar: para pequenos valores de Z, os núcleos estáveis
apresentam um equilı́brio aproximado dos números de protões e neutrões e, à medida que aumenta
o número atómico, verifica-se um aumento do número relativo de neutrões. É fácil de compreender
a forma do “Vale da estabilidade” em termos do modelo em camadas. O núcleo é um sistema
de várias partı́culas, que são, essencialmente, de dois tipos(a) , protões e neutrões. No estado
fundamental, estas partı́culas devem ocupar os estados de menor energia disponı́veis mas, como
são fermiões, aplica-se o princı́pio de Pauli. Um grande desiquilı́brio entre os números de protões e
de neutrões leva a que sejam ocupados estados de elevada energia do nucleão em excesso, havendo
estados vagos do outro nucleão com menor energia. Assim, um nuclı́deo com um grande excesso
de um dos nucleões pode atingir uma configuração de menor energia sofrendo um decaimento que
aproxime os números de protões e de neutrões.
Há vários tipos de processos de decaimento diferentes, identificados pelos tipos de radiações
por eles emitido. Podem classificar-se em três famı́lias principais que são as fissões nucleares, as
conversões internas e os decaimentos-β.
(a) Veremos
adiante que a coisa é um pouco mais complicada...
127
128
CAPÍTULO 9. FÍSICA NUCLEAR II — REACÇÕES NUCLEARES
N
120
100
80
60
40
20
20
40
60
80
Z
Figura 9.1: O “Vale da estabilidade”. Cada ponto representa um nuclı́deo estável. Nota-se claramente que, para nuclı́deos pequenos e médios, é favorecido um equilı́brio aproximado entre os
números de protões e de neutrões.
9.1.2
Fissões nucleares
Neste tipo de decaimentos, um núcleo parte-se em duas ou mais porções. Dá-se então um processo
descrito por equações como
A1
A2
A
Z XN →Z1 Y1 N1 +Z2 Y2 N2 + . . .
onde se verifica
A
Z
N
= A1 + A2 + . . .
= Z1 + Z2 + . . .
= N1 + N2 + . . .
Decaimento-α
As fissões mais frequentes consistem na emissão de um núcleo de hélio-4(b) Por exemplo, este é o
principal processo de decaimento do isótopo do urânio mais abundante na Terra, o 238 U,
238
U →4 He +234 Th.
Emissão de protões ou neutrões
Outros processos de fissão frequentes são a emissão de neutrões ou de protões. Os nuclı́deos que
decaem por estes processos apresentam sempre um grande excesso da partı́cula que emitem. Por
exemplo, o alumı́nio tem o número atómico 13. O único isótopo estável do alumı́nio é o 27 Al,
que tem 13 protões (claro) e 14 neutrões. Esta deve, então, ser considerada a distribuição de
equilı́brio dos números de protões e neutrões no alumı́nio. O isótopo 21 Al tem, relativamente a
(b) Recorde
α.
que os núcleos de hélio-4, constituı́dos por dois protões e dois neutrões, são também chamados partı́culas
9.1. RADIOACTIVIDADE
129
esta distribuição, uma grande deficiência de neutrões, que pode ser corrigida libertando alguns
protões. Este é, de facto, o processo de decaimento do alumı́nio-21:
21
Al →20 Mg +1 H.
O 5 He têm o problema inverso, tem neutrões a mais. O seu processo de decaimento é, então, a
emissão de neutrões. Mas este é um mau exemplo, porque o que resulta deste decaimento é um
neutrão livre e um núcleo de 4 He, ou seja, um neutrão e uma partı́cula α! Porque há uma partı́cula
α no estado final, a este decaimento também se pode chamar decaimento α. Um exemplo melhor
é o do enxofre-49. O enxofre tem um número atómico Z = 16 e o seu isótopo mais abundante é
o 32 S. O 49 S tem pois 33 neutrões. Pode aliviar este desiquilı́brio neutrónico libertando neutrões,
que é o processo pelo qual, efectivamente, decai:
49
S →48 S + n.
Outros processos de emissão
Para além da emissão de nucleões isolados e da emissão de partı́culas α, verificam-se ainda outros
processos de emissão, como a emissão de protões dupla (é um dos processos de decaimento do
berı́lio 6 Be, por exemplo), ou a emissão de núcleos mais complexos do que uma partı́cula α. Estes
processos ocorrem sempre em concorrência com outros e nunca são os dominantes. Por exemplo,
um em cada 7,7×1010 núcleos de protactı́neo 231 Pa decaem por emissão de núcleos de néon, através
do processo
231
Pa →211 Tl +20 Ne.
O processo dominante de decaimento deste nuclı́deo, no entanto, é o decaimento-α.
Fissões propriamente ditas
Apesar de termos definido todos os processos de divisão nuclear como fissões, reserva-se em geral
este nome para processos em que um núcleo se parte em dois bocados mais ou menos semelhantes,
com emissão de alguns nucleões isolados. Estes processos só se verificam expontaneamente para
núcleos com número de massa muito grande, como o férmio 242 Fm, sendo, mesmo neste domı́nio,
relativamente raros.
9.1.3
Conversões internas
Num decaimento por conversão interna não há alteração de nuclı́deo, isto é permanecem constantes
os valores dos números de neutrões e de protões (logo, permanece, também, constante o número
de massa). Verifica-se apenas a emissão de radiação electromagnética de altı́ssima energia, que
tem o nome de radiação gama. Os fotões deste tipo de radiação transportam um energia da ordem
dos MeV, ou seja, são mil a um milhão de vezes mais energéticos do que os dos raios-X. O que
se passa nestes processos é que um núcleo num estado energeticamente excitado decai para o seu
estado fundamental, como acontece com os electrões atómicos nos processos de emissão e absorção
tı́picos dos métodos da espectrometria.
9.1.4
Decaimento-β
Num decaimento-β verifica-se a conversão de um protão num neutrão, ou vice-versa. O decaimentoβ mais frequente é o chamado β − , em que um neutrão se transforma num protão, sendo simultaneamente emitido um electrão. Outro processo-β possı́vel consiste na transformação de um protão
num neutrão, com a emissão de um positrão.(c) Este processo tem um efeito semelhante (em
termos de composição dos nuclı́deos ininical e final) ao da captura electrónica, em que um electrão
e um protão colidem, aniquilando-se, criando-se, neste processo, um neutrão. Estes processos
130
e+
en
p+
p+
n
ep+
n
Figura 9.2: Três processos de decaimento-β: β − (à esquerda); β + (ao centro); captura electrónica
(à direita). Mais adiante veremos que se verifica a produção ou aniquilação de uma terceira partı́cula
nestes processos, que não representámos nos diagramas.
estão representados graficamente na Figura 9.2. Para além das partı́culas referidas, uma partı́cula
adicional está envolvida; é o neutrino, que estudaremos mais em detalhe daqui a pouco.
Os decaimentos β − e de captura electrónica são os mais frequentes em nuclı́deos que apresentam um grande desiquilı́brio entre os números de protões e neutrões. Os que têm excesso de
neutrões sofrem, regra geral, decaimentos β − (transformando protões em neutrões) e os que excesso de protões tendem a decair por captura electrónica (realizando a transformação inversa). Por
exemplo, apresentam-se em baixo os mecanismos de decaimento de alguns nuclı́deos, indicando-se
entre parêntesis os valores da diferença entre o número de protões e neutrões:
46
26 Fe
75
27 Co
9.2
(Z − N = 6)
c.e.
−→
β
−
(Z − N = −21) −→
46
25 Mn
75
28 Ni
(Z − N = 4)
(Z − N = −19)
A lei do decaimento
Todos os núcleos de um determinado nuclı́deo são, exactamente, iguais. Todas as propriedades
de um núcleo de carbono 14 C são iguais às de outro núcleo de carbono 14 C. Em particular, a
probabilidade de que se dê o decaimento de um dado núcleo de 14 C no próximo segundo tem o
mesmo valor para todos os núcleos de carbono 14 C, quer tenham sido formados há dezenas de
milhares de anos, quer tenham acabado de ser produzidos nalgum laboratório de Fı́sica Nuclear.
Assim sendo, devemos concluir que a probabilidade de decaimento por unidade de tempo tem
um mesmo valor, constante, para todos os núcleos de um dado nuclı́deo. A esta constante dá-se
o nome de constante de decaimento. Seja ν a cosntante de decaimento para um dado nuclı́deo.
Então, a probabilidade que um dado núcleo desse nuclı́deo sofra decaimento num intervalo de
tempo infinitesimal dt é
dP = ν dt.
Considerando agora uma amostra com N núcleos deste nuclı́deo, o número expectável de decaimentos no mesmo intervalo de tempo é dado por N νdt, logo o número de núcleos na amostra sofre
uma variação de
dN = −N νdt,
onde o sinal − traduz o facto de se tratar de uma diminuição. Desta equação resulta imediatamente
a eqaução diferencial que rege a evolução daquele número,
dN
= −νN,
dt
cuja solução é
N (t) = N0 e−ν(t−t0 ) ,
(9.1)
onde representámos por N0 o número de núcleos presente na amostra num instante de referência
t0 . A Figura 9.3 apresenta o gráfico desta função.
(c) Um positrão é uma partı́cula idêntica ao electrão mas com carga oposta. É a anti-partı́cula do electrão, que
discutiremos mais tarde.
9.2. A LEI DO DECAIMENTO
131
1
0.8
N/N0
0.6
0.4
0.2
0
0
1
2
3
t ν/ ln 2
4
5
6
Figura 9.3: Evolução do número de átomos que restam numa amostra de um isótopo radioactivo
com constante de decaimento ν, contendo inicialmente N0 átomos.
9.2.1
Tempo de meia vida
Como é bem visı́vel na Figura 9.3, em iguais intervalos de tempo, o número de núcleos da população inicial de uma amostra que não sofre decaimento é dividido por iguais factores, como é
caracterı́stico da função exponencial. Podemos, pois, perguntar quanto tempo é necessário para
que a uma população de núcleos radioactivos se reduza a metade. A este intervalo de tempo dá-se
o nome de tempo de meia vida ou perı́odo de semi-desintegração. Representando-o por T1/2 e
substituindo na lei do decaimento, temos
N0
= N0 e−νT1/2 ,
2
de onde resulta
ln 2
.
ν
A “força” radioactiva de um nuclı́deo é mais frequentemente avaliada pelo perı́odo de semidesintegração do que pela constante de decaimento.
T1/2 =
9.2.2
Duração média
É impossı́vel saber, a priori, quanto tempo passará até que um dado núcleo de um nuclı́deo
radioactivo sofra decaimento. Trata-se de um processo compleatamente aleatório. Apesar desta
aleatoriedade, podemos calcular a duração média de um núcleo radioactivo. Esta duração média
depende, obviamente, da constante de decaimento: quanto maior esta, menor deve ser aquela,
naturalente.
Podemos estimar a duração média de um núcleo de um nuclı́deo radioactivo considerando uma
amostra com um grande número de núcleos desse nuclı́deo acabados de produzir(d) e fazendo a
média estatı́stica das suas durações. Ou seja, calculamos a duração média, τ , dos núcleos deste
nuclı́deo como
N0
1 X
τn ,
τ=
N0 n=1
onde N0 é o número de núcleos inicialmente presentes na amostra e τn é a duração do n-ésimo.
Se a amostra for suficientemente numerosa para que o cálculo tenha significado estatı́stico, não
(d) Pouco importa de que modo esta amostra é produzida. Pode ser, por exemplo, através de um processo de
activação por neutrões, mas os detalhes são, de facto, irrelevantes para esta discussão.
132
nos é possı́vel, por razões práticas, acompanhar o decaimento de cada um dos N0 núcleos. Assim,
não podemos conhecer os valores, τn , das suas durações e, portanto, esta expressão é, de facto,
inútil. O que podemos fazer é agrupar os vários núcleos da amostra em classes caracterizadas pela
sua duração e tentar usar esta divisão para simplificar o cálculo. Consideremos então o intervalo
temporal [t0 = 0, ∞] dividido em vários (infinitos, até) subintervalos I0 = [t0 , t1 [, I1 = [t1 , t2 [,. . . ,
Ik = [tk , tk+1 [,. . . (com t0 < t1 < t2 < . . . < tk < . . .) e sejam δN0 , δN1 ,. . . , δNk ,. . . os números
de núcleos que decaem nos subintervalos I0 , I1 ,. . . , respectivamente. O somatório na expressão
acima é dado aproximadamente por
N0
X
τn =
n=1
∞
X
tk δNk .
k=0
Se os subintervalos Ik forem suficientemente curtos, podemos fazer a aproximação
µ
¶
dN
δnk ' −δtk
,
dt t=tk
onde δtk é a duração do k-ésimo intervalo e N (t) representa o número de núcleos da população
inicial ainda presente na amostra no instante t. (O sinal menos aparece nesta igualdade porque a
variação de N é negativa.) Considerando agora o limite em que a duração de cada subintervalo
tende para zero, o somatório na expressão acima tende para um integral,
N0
X
Z
∞
τn = −
t
0
n=1
dN
dt
dt
Mas o número de núcleos presente na amostra é dado pela lei do decaimento, que deduzimos na
secção anterior. Podemos, então, escrever
N0
X
Z
τn
=
νN0
=
N0
.
ν
∞
t e−νt dt
0
n=1
Substituindo este valor na expressão do valor médio, obtemos, por fim,
τ=
1
,
ν
ou seja, que a duração média de um núcleo radioactivo é igual ao inverso da sua constante de
decaimento.
9.2.3
Energia libertada no decaimento
Como já vimos quando discutimos a energia de ligação nuclear, a energia envolvida nos processos
nucleares é da ordem de grandeza da energia de repouso dos núcleos envolvidos. Assim, não se
verificam separadamente leis de conservação da massa e da energia, como nas reacções quı́micas,
verifica-se antes uma lei da conservação da energia que deve incluir as energias de repouso das
partı́culas que participam na reacção. Por exemplo, no decaimento de um núcleo radioactivo X,
ele transforma-se no núcleo W, com emissão das partı́culas Y e Z (estas partı́culas podem ser
um electrão e um neutrino, ou um núcleo e um neutrão, pouco importa). Esquematicamente, o
processo pode ser representado como
X → W + Y + Z.
Analizado o processo no referencial do núcleo original, a energia total antes do decaimento é apenas
a sua energia de repouso, mX c2 . Depois do decaimento, contabilizamos as energias de repouso das
9.3. ACTIVIDADE E DOSIMETRIA
133
partı́culas W, Y e Z, ([mY + mW + mZ ]c2 ) e a soma das suas energias cinéticas, que representamos
globalmente por Q. O balanço energético permite-nos escrever
Q = (mX − mY − mW − mZ )c2 .
A quantidade Q é a energia libertada pelo decaimento.
Por exemplo, o urânio-238 é o isótopo do urânio dominante na Terra. A sua massa atómica é
238,050784 u. Trata-se de um nuclı́deo instável, que decai por decaimento α com uma meia vida
de cerca de 4,5 × 109 anos. O processo é
238
U→
234
Th + α.
Dado que as massas atómicas do tório e da partı́cula α são, respectivamente, 234,043593 u e
4,002603 u, concluimos que a energia libertada no decaimento de um núcleo de 238 U é Q = 4,588 ×
10−3 uc2 ' 4,3 MeV. Este processo é a principal fonte de calor do interior da Terra. É graças à
presença de urânio na Terra que o seu interior permanece no estado lı́quido, causando a actividade
geológica do planeta.
Esta expressão para o cálculo da energia libertada num decaimento pode ser generalizada a
qualquer reacção, definido-se o chamado factor-Q do processo como sendo a diferença entre as
energias de repouso dos reagentes e dos produtos da reacção. Assim, num processo
A + B → C + D,
o factor Q é
Q = (mA + mB − mC − mD )c2 .
O factor-Q de um decaimento é, de facto, a energia libertada no processo, porque é possı́vel tomar
a energia cinética do núcleo no estado inicial igual a zero, escolhendo-se o seu referencial próprio
para fazer o cálculo. Mas, num processo arbitrário como o que acabámos de considerar, o factor-Q
já não é a energia libertada, mas antes a diferença entre a energia libertada e a soma das energias
cinéticas dos reagentes. Isto é assim porque, para se dar a colisão entre os dois núcleos, eles não
podem estar os dois em repouso no estado inicial, seja qual for o referencial que se considere.
Assim, a energia do estado inicial inclui não só a energia de repouso dos reagentes, mas também a
sua energia cinética, indispensável para que a colisão se dê, e este termo deve também ser incluido
no balanço energético da reacção.
9.3
9.3.1
Actividade e dosimetria
Actividade
Chama-se actividade de uma amostra de um material radioactivo ao número de decaimentos nucleares que, nela, ocorrem por unidade de tempo. A unidade de actividade do Sistema Internacional
é o bequerel (Bq) em honra ao cientista francês que descobriu a radioactividade. É uma unidade
derivada com dimensões do inverso do tempo, isto é, 1 Bq = 1 s−1 .
Regra geral, a radioactividade de uma amostra radioactiva deve-se a vários processos que
ocorrem simultaneamente. Por exemplo, numa amostra de urânio dá-se o decaimento α dos núcleos
de 238 U. Mas o resultado deste decaimento é o 234 Th, que sofre decaimento β, tranformando-se
em 234 Pa que, por sua vez decai para 234 U por decaimento β, e a história não acaba aqui! Num
dado instante, todos estes processos ocorrem e todos contribuem para a radioactividade daquela
amostra. A actividade devida apenas ao decaimento de um nuclı́deo particular é, obviamente,
igual à taxa de diminuição do número de núcleos desse nuclı́deo presentes na amostra, ou seja,
A(t) = −
dN
,
dt
134
onde N representa o número de núcleos do nuclı́deo considerado e A representa a actividade devida
ao decaimento desses núcleos. Mas N é dado pela lei do decaimento, de forma que temos
A(t)
= νN (t)
= νN0 e−νt
= A0 e−νt ,
onde N0 representa o número de núcleos do nuclı́deo considerado presentes na amostra no instante
inicial t0 = 0 e A0 representa a actividade devida ao decaimento desses núcleos, nesses mesmo
instante. Vemos assim que a actividade devida a um decaimento particular segue uma evolução
temporal semelhante à lei do decaimento.
9.3.2
Dose absorvida
As partı́culas α β e γ produzidas nas reacções nucleares têm energias muito superiores às que
normalmente estão envolvidas em reacções quı́micas. Assim, a sua absorção num meio material, e
a consequente libertação da sua energia cinética, induz vários processos atómicos nesse material,
como ionizações, deslocalizações de átomos(e) e reacções quı́micas. Estes efeitos são proporcionais
à densidade de energia depositada no meio pela radiação. Para quantificar esta deposição de
energia, definiu-se uma quantidade chamada dose absorvida, que é a energia absorvida por unidade
de massa do meio exposto à radiação. A unidade do Sistema Internacional de dose é o gray (Gy)
e é igual a um joule por quilograma:
1 Gy = 1 J kg−1 .
Na Inglaterra e nos Estados Unidos é mais frequente a utilização do rad (iniciais de Radiation
Absorved Dose) que é 100 vezes menor que o gray:
1 rad = 10−2 Gy.
9.3.3
Dose equivalente
Todos os tipos de radiação transportam energia e a taxa temporal a que essa energia é depositada
num meio material que a absorva pode ser muito elevada, se a radiação incidente for suficientemente
intensa. Mas a intensidade da radiação apenas determina o número de quanta (fotões, no caso da
radiação electromagnética, partı́culas α, β, neutrões, etc., no caso das radiações corpusculares) que,
por unidade de tempo, são depositados no alvo. Os efeitos da exposição à radiação que referimos
acima resultam da absorção destes quanta de energia e, portanto, dependem fortemente das suas
caracterı́sticas, particularmente da sua energia. Por exemplo, a dose absorvida em meia hora de
exposição ao sol num dia limpo, a meio da tarde, é aproximadamente igual à absorvida durante
uma exposição de 6 horas à luz de uma lâmpada de 100 W (desde que o sujeito se mantenha a
uma distância de cerca de 1 m da lâmpada). No entanto, a primeira exposição bronzeia-nos a pele
(e pode alterar o funcionamento de algumas células da derme, provocando, nos casos mais graves,
cancro da pele); a segunda exposição não tem efeitos apreciáveis. Isto é assim porque os fotões de
radiação visı́vel têm uma energia de alguns eV apenas, ao passo que os fotões mais energéticos que
chegam até nós vindos do sol (os da radiação utravioleta UVB) podem ter 100 a 1000 vezes mais.
Estes fotões, ao contrário daqueles, têm energia suficiente para induzir reacções quı́micas como as
que levam à produção de melanina na nossa pele, mas também a capacidade de ionizar moléculas
de água e outras alterações bioquı́micas conducentes a patologias como o cancro de pele.
Num contexto mais familiar para nós, são também estas questões que justificam que só com
radiação com frequência suficientemente elevada se verifique o efeito fotoeléctrico, independentemente da intensidade dessa radiação.
Para dar conta destes diferentes efeitos dos diferentes tipos de radiação, introduz-se uma nova
quantidade, chamada equivalente de dose. O equivalente de dose de uma dada exposição é a dose
(e) Em
cristais, este processo faz aparecer lacunas cristalinas e átomos em posições intersticiais.
9.3. ACTIVIDADE E DOSIMETRIA
135
Radiação
UVB,X,γ
β
neutrões lentos
neutrões rápidos, protões, α
núcleos pesados
factor de qualidade
1
1
3
10
20
Tabela 9.1: Valores do factor de qualidade para diferentes tipos de radiação.
de raios-X que produz os mesmos efeitos que essa exposição. Na prática, calcula-se o equivalente
de dose, H, a partir da dose absorvida, D, através da expressão
H = D Q,
onde Q é um factor adimensional, chamado factor de qualidade, caracterı́stico da radiação absorvida, que é uma medida da sua perigosidade. Alguns valores do factor de qualidade estão
apresentados na Tabela 9.1. A unidade de equivalente de dose é também, como a da dose absorvida, o J kg−1 , mas recebe agora o nome de sievert (Sv), para evitar ambiguidades em situações de
emergência. Dados os valores apresentados na Tabela 9.1, podemos dizer que uma dose absorvida
de 1 Gy de neutrões lentos é três vezes mais perigosa do que a mesma dose de raios γ e cerca
de três vezes menos perigosa do que igual exposição a partı́culas α. À primeira corresponde um
equivalente de dose de 3 Sv, à segunda 1 Sv, à terceira 10 Sv.
Como para a dose absorvida, na Inglaterra e nos Estados Unidos não se costuma usar a unidade
SI de equivalente de dose, é mais frequente a utilização do rem (Radiation Equivalent on Man), e
que é cem vezes menor do que o Sv:
1 rem = 0,01 Sv.
Refira-se, por fim, que a expressão “dose” indica mais frequentemente o equivalente de dose do
que a dose absorvida.
9.3.4
Efeitos da exposição à radiação
Em tecidos vivos, os processos de ionização podem ter um efeito muito negativo na fisiologia
celular, porque esta depende muito de pequenos gradientes de potencial eléctrico através das
várias membranas celulares, gradientes que se vêm fortemente perturbados pela presença dos
iões causados pela irradiação. Além disso, a energia destas partı́culas radioactivas é mais do
que suficiente para quebrar ligações quı́micas em proteı́nas, que são fundamentais para o bom
funcionamento celular. A exposição à radiação é pois, em geral, extremamente prejudicial à
saúde. Exposições moderadas podem causar náusea e vómitos e nota-se diminuição na produção de
células sanguı́neas durante alguns dias. Exposições mais intensas podem agravar esta deficiência,
causando anemia e debilidade face a infecções. Uma ainda maior exposição pode causar diversas
formas de cancro. Uma exposição a uma fonte muito intensa pode causar morte em poucos dias
ou, até, em breves minutos, por destruição pura e simples dos tecidos.
Os limites legais para a exposição foram definidos pelo Decreto Regulamentar n.o 9/90 de 19-041990. Este Decreto determina doses máximas anuais de 50 mSv para a exposição uniforme de todo
o corpo, e de 500 mSv para orgãos ou partes do corpo (por exemplo, as mãos)(f) . Para crianças,
mulheres em idade reprodutora e mulheres grávidas, os máximos legais são mais reduzidos.
(f) Note-se
que, quando se calcula a dose absorvida por um órgão apenas, se divide a energia absorvida por esse
órgão pela sua massa. Assim, um sujeito pode apresentar grandes doses absorvidas por orgãos particulares com
uma dose absorvida pelo corpo todo relativamente baixa.
136
9.4
9.4.1
Aplicações da Fı́sica Nuclear
Análise por activação com neutrões
Consideremos um processo de captura neutrões genérico
A
X+n →
A+1
X.
Como resultado do processo de captura, o núcleo resultante fica num estado excitado, pelo que
decai através de conversão interna e/ou outros processos como a fissão ou o decaimento β. O
tipo de decaimento e a energia da radiação produzida dependem fortemente do núcleo resultante
do processo de captura, ou seja, do núcleo original. Assim, é possı́vel determinar (qualitativa e
quantitativamente) a composição de uma amostra de material desconhecido através da análise
cuidada da radiação que se obtém por bombardeamento da amostra com neutrões. Esta técnica
chama-se análise por activação com neutrões.
9.4.2
Produção de energia por fissão
Quando o alvo num processo de captura de neutrões é de um nuclı́deo muito pesado, uma das
possibilidades para o decaimento do núcleo resultante é a fissão.
Por exemplo, consideremos o processo de captura de neutrões do urânio 235 U,
235
U+n →
236
U,
no referencial do centro de massa do sistema, relativamente ao qual o 236 U resultante se encontra
em repouso. O factor-Q desta reacção, Q = 6,544 MeV, não aparece como energia cinética dos
produtos(g) mas como uma excitação interna do núcleo resultante. Esta energia é suficiente para
vencer a barreira de potencial nuclear, de forma que o núcleo parte-se em vários bocados, incluindo
vários neutrões (em média, 2,5, no caso da fissão do 235 U). Por exemplo, uma reacção usual é
235
U + n →93 Rb +141 Cs + 2n.
O factor-Q desta reacção é cerca de 180 MeV. A energia libertada neste processo é, pois, enorme!
Corresponde a 73 GJ por cada grama de urânio! Se todos os átomos de urânio de uma amostra
sofressem este processo, bastavam perto de 60 kg de urânio para produzir energia energia semelhante à libertada por uma bomba de 1 MT(h) A possibilidade do aproveitamento desta imensa
fonte de energia foi considerada imediatamente após a descoberta da fissão nuclear pelos fı́sicos
alemães Otto Hahan e Fritz Strassmann, em 1938. Após apenas quatro anos, construiu-se o primeiro reactor nuclear experimental em Chicago, um esforço liderado pelo fı́sico italiano Enrico
Fermi, e iniciou-se o Projecto Manhattan para a construcção da bomba atómica que viria a ter
um papel decisivo no final da Segunda Grande Guerra.
Reacções em cadeia, moderação de neutrões e enriquecimento de urânio
O aproveitamento da energia libertada na fissão nuclear baseia-se na possibilidade do estabelecimento de reacções em cadeia, nas quais parte ou a totalidade dos neutrões libertados na fissão
de um núcleo são capturados por outros núcleos vizinhos, provocando também a sua fissão e assim sucessivamente. Um problema que é necessário resolver para que se possa estabelecer uma
reacção em cadeia é que os neutrões libertados por um processo de fissão nuclear têm uma energia
cinética muito elevada; mas a probabilidade de captura de neutrões rápidos é muito baixa, logo, é
necessário travar os neutrões, processo conhecido como moderação dos neutrões.
(g) Há
apenas um produto e encontra-se em repouso relativamente ao referencial considerado...
megatonelada (MT) é a energia libertada por uma bomba com um milhão de toneladas de TNT. É o
bastante para abrir no chão uma cratera com 1 km de diâmetro. Para se ter uma idéia, a energia libertada pela
explosão da Bomba de Hiroxima foi 0,013 MT.
(h) Uma
9.4. APLICAÇÕES DA FÍSICA NUCLEAR
137
Figura 9.4: Reacção em cadeia com um factor de reprodução próximo de 8/5. Representam-se os
núcleos de urânio que sofrem fissão com cı́rculos negros, os neutrões que são capturados como setas
a cheio, os que escapam sem induzir novas fissões com setas a tracejado. Não são representados os
produtos da fissão.
Os reactores de fissão mais vulgares usam urânio como material fissil. Mas o urânio é constituı́do principalmente por 238 U (99,3%) e 235 U (0,7%). Só o segundo destes isótopos, muito
minoritário, decai por fissão após a captura de num neutrão. Os átomos de 238 U desempenham
também um papel importante, na moderação dos neutrões. Nas colisões entre neutrões altamente
energéticos e estes núcleos, aqueles induzem excitações nestes, perdendo parte da energia. Após
algumas destas colisões, os neutrões já não têm energia suficiente para excitar os núcleos de 238 U,
mas ainda são suficientemente rápidos para ser demasiado baixa a probabilidade de captura por
um núcleo de 235 . Nesta fase, um neutrão pode apenas sofrer colisões elásticas com os núcleos
dos átomos da amostra. Mas nestas colisões perde muito pouca energia, porque a sua massa é
muito menor do que as dos núcleos com os que colide.(i) Numa colisão elástica, a partilha de
energia entre os dois intervenientes só é apreciável se as suas massas forem semelhantes. Por esta
razão mergulha-se o material fissil em água. As colisões de um neutrão rápido com os protões que
constituem os núcleos de hidrogénio baixam rapidamente a sua energia até aos valores requeridos.
Esta técnica tem um inconveniente: é que, na colisão entre neutrões e protões pode formar-se
deutério, isto é, no processo de moderação de neutrões, os protões do hidrogénio competem com
os núcleos de 235 U na captura de protões. Face a isto, ou se usa como moderador água pesada (as
moléculas de água pesada têm átomos de deutério em vez de átomos de hidrogénio, e a probabilidade de captura de neutrões pelo deutério é praticamente nula) ou, em alternativa, aumenta-se
a concentração de urânio 235 U, para compensar a diminuição da produção efectiva de neutrões
capazes de induzir novas fissões. Para que se possa manter uma reacção em cadeia usando água
vulgar como moderador, o teor de 235 U tem que ser elevado até cerca de 3%, cerca de quatro vezes
mais do que o que se verifica no urânio natural. Este processo tem o nome de enriquecimento do
urânio.
Controle da taxa da reacção
Chama-se constante de reprodução ao número médio de neutrões libertados na fissão de um núcleo
que efectivamente induz novas fissões noutros núcleos. Note-se que o valor da constante de reprodução não depende apenas do número de neutrões libertado, porque alguns neutrões escapam
da região onde se encontra o material fissil, ou são capturados por núcleos que não sofrem fissão
(como os do hidrogénio da água usada na moderação). Na Figura 9.4 representa-se uma situação
em que se pode estimar o factor de reprodução em 8/5. Pensemos numa reacção em cadeia como
uma série de gerações, no sentido em que a fissão de um núcleo liberta neutrões que vão iniciar
uma nova geração de fissões noutros núcleos. A constante de reprodução indica a razão entre os
números de fissões que se dão em duas gerações sucessivas. Quando a constante de reprodução
tem um valor inferior à unidade, a reacção em cadeia extingue-se: em cada nova geração, ocorrem
(i) Da
mesma maneira, quando atiramos uma bola de ping-pong contra outra de bilhar, vemos que a a primeira
altera a direcção do seu movimento, mas o módulo da sua velocidade permace aproximadamente constante, ao
passo que a bola de bilhar permanece num estado de movimento praticamente inalterado.
138
Barras de
urânio
Barras de
controle (Cd)
Figura 9.5: O controle do valor da constante de reprodução faz-se variando a posição e o número
de barras de controle (a cinzento na figura). Estas barras são compostas por materiais com grande
facilidade de captura de neutrões, por exemplo, cádmio.
menos fissões do que na anterior; pelo contrário, quando a constante de reprodução é superior a
um, então o ritmo a que a reacção se dá aumenta exponencialmente, já que em cada geração se dão
mais fissões do que na anterior. Neste caso, lidamos com uma explosão nuclear como as das bombas
atómicas. Do que acabámos de dizer, compreende-se que uma central nuclear para a produção de
energia deve trabalhar num regime em que a constante de reprodução mantém, sempre, um valor
exactamente igual a 1. Isso consegue-se dividindo o material fissil (urânio enriquecido) em várias
amostras separadas (com a forma de barras cilı́ndricas) e introduzindo no reactor, itercaladas entre
as barras de urânio, barras de materiais com elevada facilidade de captura de neutrões. A fracção
dos neutrões que elas capturam pode ser regulada variando o número de barras ou a sua posição
no reactor, o que permite uma variação em tempo real do valor da constante de reprodução.
Produção da energia eléctrica
A transformação da energia da reacção nuclear em energia eléctrica procede agora como numa
central térmica vulgar: o calor libertado na reacção aquece água até a vaporizar a alta pressão;
este vapor, por seu turno, empurra as pás de uma turbina electromagnética.
Perigos da utilização da energia nuclear de fissão
Além do perigo de uma reacção em cadeia explosiva, que se verifica quando a constante de reprodução ultrapassa o valor da unidade e que está relativamente bem controlado nos reactores
nucleares, há uma série de riscos envolvidos na utilização da fissão nuclear controlada para a
produção de electricidade. Um dos mais graves é o do sobreaquecimento do reactor. O interior
de um reactor nuclear está normalmente a uma temperatura e pressão muito elevadas. Se se dá
um aumento anormal destas duas variáveis, a blindagem que protege o reactor pode fundir-se e
deixar escapar o material altamente radioactivo que se encontra no interior. Este material é, principalmente, a água usada no processo de moderação, mas é água activada pelo bombardeamento
com neutrões, o que inclui uma série de substâncias altamente radioactivas e/ou, muitas vezes,
quimicamente venenosas. O acidente deste tipo mais grave ocorreu em 1986 em Chernobyl, na
Ucrânia. Este acidente causou a morte imediata a 30 pessoas e dados das autoriadas ucranianas
estimam em mais de 2500 vı́timas mortais nos anos seguintes. O acidente obrigou à evacuação de
mais do que 3500̇00 pessoas e os seus efeitos ainda se fazem sentir nas regiões próximas, nomeadamente numa maior radioactividade “natural” à qual está associada uma maior taxa de incidência
de vários problemas de saúde, como cancro da tiróide (após o acidente, aumentou dez vezes em
todo o território da Ucrânia) e mal-formações fetais.
Outro problema grave prende-se com o que fazer do urânio quando o teor em urânio-235
se torna demasiado baixo para que se possa manter a reacção em cadeia activa. Este material
é quimicamente venenoso e radioactivo pelo que o seu acondicionamento coloca graves proble-
139
mas ambientais. Até agora, têm-se armazenado estes restos em instalações situadas em regiões
desérticas ou encerrado em contentores estanques que são depositados em minas profundas ou no
mar alto, mas não se sabe com certeza se estas soluções se podem considerar definitivas.
9.4.3
Fusão nuclear
Dada a forma do gráfico da energia de ligação por nucleão (rever a Figura 8.1), compreende-se bem
que seja possı́vel obter energia por fissão de núcleos grandes ou por junção de núcleos pequenos.
A processos deste último tipo dá-se o nome de reacções de fusão. O sol e as estrelas produzem a
sua energia por reacções de fusão. As estrelas não muito antigas são constituı́das essencialmente
por hidrogénio. Na zona mais interna de uma estrela, a temperatura é tão elevada que os átomos
de hidrogénio se encontram ionizados (ou seja, contitui-se um plasma de electrões e protões) e
movem-se com uma velocidade tal que, quando chocam uns com os outros, têm energia suficiente
para vencerem a repulsão electrostática mútua, aproximando-se tanto que entra em jogo a força
nuclear forte. Por outro lado, nestas regiões a densidade é tão elevada que estas colisões ocorrem
frequentemente, dando-se uma reacção de fusão (note-se que um dos protões sofre decaimento β)
que produz deutério
p + p → 2 H + e+ + νe .
Uma colisão entre dois núcleos de deutério produziria directamente hélio-4 mas, como é muito
maior a densidade de protões do que a de deuterões, estas colisões são muito menos prováveis do
que colisões deuterão-protão, que produzem hélio-3:
2
H + p → 3 He.
Dada a enorme densidade de protões no interior das estrelas, esta “promoção” do deutério a hélio-3
é muito rápida. Poderı́amos agora pensar que uma nova colisão com um protão, acompanhada do
decaimento β de um dos protões produziria hélio, mas tal não é o caso, porque o núcleo de 4 Li
formado pela colisão de um núcleo de 3 He com um protão decai (pela interacção forte) de novo
num núcleo de hélio-3 e um protão, antes que o decaimento β que transforma um protão num
neutrão possa ocorrer:
3
He + p → 4 Li →3 He + p.
Por outro lado, como a densidade de deuterões é muito baixa (assim que são produzidos nas
colisões p-p são imediatamente transformados em 3 He, as reações 3 He-2 H são também muito
pouco improváveis. Os núcleos de hélio-3 vivem então tempos comparativamente longos (mesmo
que assumindo fugazmente a forma de 4 Li), até que sofrem uma colisão com outro núcleo idêntico,
em que, por fim, se produzem núcleos de hélio, através da reacção
3
He +3 He → 4 He + 2p.
Este processo todo, que é a pricipal fonte de energia nas estrelas, vai consumindo o hidrogénio nas
estrelas e transformando-o em hélio. Tem o nome de sequência protão-protão e está esquematizado
na Figura 9.6 A sequência toda é equivalente à reacção
4p → 4 He + e+ + νe ,
e tem um factor-Q global de 26,7 MeV. Isto corresponde a 640 GJ por cada grama de hidrogénio
consumido. É interessante comparar este valor com a energia libertada num processo quı́mico
usual. Por exemplo, a combustão de hidrogénio para produzir água liberta 1, 4 × 105 J/g. A
diferença é abissal.
Desde o final dos anos quarenta, cientistas de vários paı́ses tentam reproduzir reacções como as
da sequência protão-protão na Terra, de forma controlada, com o objectivo da produção industrial
de energia. Estas reacções são muito vantajosas quando comparadas com as de fissão, porque
nelas não se produzem isótopos radioactivos de longo perı́odo de semidesintegração. Com efeito,
o principal produto é hélio, que não só não é radioactivo, é também quimicamente inerte (logo,
140
p
p
2
p
p
ν
e+
ν
e+
p
p
2
p
H
4
He
H
p
Figura 9.6: A sequência protão-protão.
não é venenoso). Como se discute já a seguir, obrigar dois núcleos a colidirem é muito difı́cil. Por
esta razão, todas as possibilidades actualmente em estudo para a produção industrial de energia
através da fusão nuclear não consideram a utilização de hidrogénio 1 H como combustı́vel. Em
vez disso, “saltam” os primeiros passos na sequência protão-protão e usam deutério (2 H) ou então
uma mistura de deutério e trı́tio (3 H), aproveitando-se neste último caso a reacção
2
H + 3 H → 4 He + n.
Para que se dê uma reacção nuclear, os dois núcleos envolvidos devem estar animados com uma
energia cinética muito elevada, para que seja vencida a repulsão electrostática mútua. Podemos
aumentar a energia cinética média dos átomos de uma amostra gasosa aquecendo-a. Para que
sejam possı́veis reacções nucleares, um gás de hidrogénio (ou deutério, 2 H, ou trı́tio, 3 H) tem
que ser aquecido até temperaturas da ordem de 108 K. A esta temperatura a agitação térmica é
suficiente para, só por si, partir as moléculas e ionizar os átomos, formando aquilo que se chama
um plasma, um gás de partı́culas carregadas.
O aquecimento do gás, só por si, não chega para produzir reacções de fusão com a frequência
necessária, porque, à medida que se vai aquecendo o gás, vai também aumentando o seu volume,
se nada for feito para o impedir. Assim, diminui a densidade do gás, ou seja, os átomos que o
compõem ficam mais afastados uns dos outros, logo, diminui a probabilidade da ocorrência de
colisões atómicas. Assim, devemos também confinar o gás, de maneira a evitar a sua dilatação. O
confinamento não pode ser feito pelas paredes do contentor onde se dá a reacção, pois das duas,
uma: ou o contentor se encontra à temperatura do plasma, caso em que se vaporiza imediatamente, ou está a uma temperatura inferior, caso em que arrefece o plasma. Em vez disso, duas
possibilidades têm sido investigadas: o confinamento magnético e o confinamento inercial.
No confinamento magnético, usam-se forças magnéticas para manter o gás confinado. Mas,
para que estas forças (que dependem da velocidade das partı́culas sobre as quais actuam) tenham
um papel confinante, é necessário que as partı́culas carregadas que formam o plasma estejam
animadas de uma velocidade colectiva bastante grande (quando comparada com a da agitação
térmica). Para tal, aceleram-se estas partı́culas numa trajectória circular, dentro de um tubo que
tem a forma de um grande donut, chamado tokamak, em torno do qual se enrolam condutores que
criam no interior do tokamak um campo com a direcção do seu eixo. O efeito combinado deste
campo com o criado pelo movimento do plasma mantém as partı́culas que o formam afastadas das
paredes do tokamak.
O maior tokamak construı́do até hoje é o JET (iniciais de Join European Torus), na Inglaterra. É o resultado de uma colaboração internacional de âmbito europeu. O próximo passo é tão
dispendioso que se torna necessária uma colaboração ainda mais vasta, envolvendo a União Europeia, o Japão, a Rússia, os Estados Unidos e muitos outros. O resultado desta colaboração será a
construção de um novo tokamak, maior que o JET, chamado ITER (International Thermonuclear
Experimental Reactor) em Cadarache, na França. Espera-se que com este reactor seja possı́vel
141
manter o regime de funcionamento durante perı́odos de tempo longos, provando-se a viabilidade
de um reactor industrial.
O segundo método de confinamento referido, o confinamento inercial, encontra-se numa fase
mais atrasada de desenvolvimento, e tem sido investigado principalmente pro grupos norteamericanos. Neste método, usa-se uma gotinha de deutério e trı́tio, que é exposta a uma série de
feixes de raios laser, que vaporizam as camadas exteriores da gota, comprimindo as interiores,
tentando-se assim que estas atinjam as temperaturas e densidades necessárias para as reacções de
fusão se iniciarem.
Apesar dos meios astronómicos que se têm investido na investigação da fusão nuclear controlada, este esforço não foi ainda coroado de êxito. Ainda assim, deve dizer-se que a fusão nuclear
“incontrolada” foi já dominada pelo homem. As bombas termonucleares(j) produzem a energia que
libertam na explosão por processos de fusão, mas fazem-no de forma incontrolada. A temperatura
e densidade necessárias para a fusão são possibilitadas por uma bomba atómica de fissão auxiliar,
que rodeia o “combustı́vel” da bomba de fusão e que, ao explodir, comprime e aquece o material
que compõe a bomba de fusão.
9.4.4
Aplicações à medicina
Falta escrever esta subsecção. Os tópicos são:
Ressonância magnética nuclear
Imagiologia
Radioterapia
9.4.5
Datação por carbono-14
O nosso planeta é continuamente bombardeado por partı́culas carregadas provenientes do Sol
e também do exterior do sistema solar. A maior parte destas partı́culas são núcleos de todos
os elementos da tabela periódica. Estas partı́culas têm origem em tempestades magnéticas na
superfı́cie do Sol e de outras estrelas ou em supernovas e outros eventos cataclı́smicos. Muitas
destas partı́culas carregadas são capturadas pelo campo magnético terreste, formando as chamadas
cinturas de Van Allen, regiões com alta densidade de partı́culas carregadas circundando a Terra.(k)
Os raios cósmicos que conseguem penetrar a blindagem magnética do nosso planeta chocam com
as moléculas da atmosfera, produzindo um chuveiro de partı́culas secundárias, como raios-X e γ,
electrões, positrões, neutrões, piões e muões que, por seu turno, participam em novas reacções
nucleares quando colidem com moléculas de ar. Por exemplo, os neutrões reagem com núcleos de
azoto, de acordo com
14
N + n → 14 C +1 H(l) .
Este isótopo do carbono existe na Terra devido a este processo. O carbono-14 é instável, sofrendo
o decaimento-β
14
C → 14 N + β − + ν̄e
com um perı́odo de semidesintegração de 5730 anos. O facto de se dar a produção de átomos de
carbono-14 a uma taxa constante não se traduz num aumento progressivo no seu número na Terra
porque, paralelamente, se vai verificando o seu decaimento.
Se T for a taxa de produção de 14 C e A a actividade (isto é, o número de decaimentos por
unidade de tempo) deste nuclı́deo na Terra, então, num intervalo de tempo dt, o número, N , de
(j) Também
chamadas (erradamente) bombas de hidrogénio.
partı́culas aproximam-se mais da atmosfera na região dos polos, onde ionizam as moléculas de ar em
grandes quantidades, dando origem às auroras boreais.
(l) Este processo ocorre, possivelmente, da seguinte forma: o núcleo de azoto (7 protões e sete neutrões) absorve
o neutrão, mas fica num estado fortemente exitado, e liberta a energia em excesso emitindo um protão, resultando
um nı́cleo com 6 protões e 8 neutrões, ou seja, um núcleo de 14 C.
(k) Estas
142
1.2
1
Nν/T
0.8
0.6
0.4
0.2
0
0
1
2
3
4
νt
5
6
7
8
Figura 9.7: Gráfico da evolução do número de núcleos de um nuclı́deo radioactivo com constante
de decaimento ν, produzido a uma taxa constante T , partindo de uma contagem inicial de zero.
átomos de carbono-14 presentes na Terra sofre uma variação dada por
dN = T dt − Adt.
Como já vimos, a actividade de uma amostra com N átomos de é A = νN . Substituindo acima,
obtemos
dN = T dt − νN dt,
ou seja,
dN
= T − νN.
dt
Esta é uma equação diferencial ordinária, com coeficientes constantes, não homogénia, cujas
soluções, bem conhecidas, são (verifique!)
N (t) =
¢
T ¡
1 − e−νt .
ν
O aspecto mais interessante da solução que encontrámos é o facto de o número de núcleos do
nuclı́deo em questão tender para um valor de equilı́brio T /ν, como se pode verificar analisando a
Figura 9.7, onde se representa o gráfico da função N (t). No caso que aqui nos interessa, verifica-se
que a produção de carbono 14 C na alta atmosfera é tal que a fracção deste isótopo no carbono
atmosférico é de 1,316 × 10−10 %, isto é, que, em cada 7,599 × 1011 átomos de carbono, um é de
14
C.
O carbono existe na atmosfera na forma de dióxido de carbono, e é incorporado por muitas
plantas nos seus tecidos através da fotossı́ntese. As relações alimentares distribuem depois o
carbono por todos os seres vivos, de forma que podemos dizer que o teor de carbono-14 em todos
os tecidos vivos (vegetais ou animais) é semelhante ao que se observa na atmosfera. Assim, uma
pessoa com 67 kg de massa, dos quais 18 %, ou seja, 12 kg, são carbono, é constituı́da por cerca
de 1000 mol ' 6 × 1026 átomos de carbono, o que corresponde a cerca de 8 × 1011 átomos de 14 C.
Dada a constante de decaimento deste nuclı́deo, uma pessoa com 67 kg de peso deve apresentar
uma actividade devida ao 14 C de cerca de 3 kBq. Após a morte de um ser vivo, a incorporação de
carbono, pela fotossı́ntese ou pela alimentação, pára, evidentemente e, com o passar dos anos, vai
diminuindo o número de átomos deste isótopo do carbono presentes nos restos mortais daquele ser
vivo. A actividade radioactiva destes restos vai, portanto diminuindo. Comparando a actividade do
carbono-14 de vestı́gios arqueológicos orgânicos (ossos, restos de peles, cabelo, lascas de madeira)
com a esperada para seres vivos, pode deduzir-se a idade desses vestı́gios, isto é, quanto tempo
passou desde que deixaram de pertencer a um organismo vivo.
9.5. ALGUNS TÓPICOS DE NOTICIÁRIO
143
Assim, se retirarmos uma amostra de 1,0 g de carbono de um organismo vivo, ou seja, 0,08 mol
de átomos de carbono , esperamos que 1,316 × 10−10 % sejam átomos de carbono-14, o que corresponde a 1,1 × 10−13 mol ' 6,6 × 1010 átomos. A actividade desta amostra é
A
= νN
= 0, 25 Bq.
Uma vez que a actividade de uma amostra radioactiva segue o mesmo comportamento exponencial
que o número de átomos presentes na amostra, o valor que determinámos para a actividade desta
amostra deve ir diminuindo com o tempo. Assim, se retirarmos uma amostra igual de carbono de
vestı́gios arqueológicos com 3000 anos, a sua actividade de ter-se-á reduzido, relativamente à de
uma amostra idêntica mas “fresquinha,” por um factor igual a exp (−νt) ' 0, 70, ou seja, deve ter
o valor de 0,17 Bq.
Imaginemos agora que medı́amos a actividade de uma amostra de átomos de carbono com 0,5 g,
retirada de restos recolhidos numa escavação, e determinávamos um valor de A(t) = 0,028 Bq.
Dado o teor de carbono-14 na atmosfera, verificamos facilmente que a actividade de uma amostra
semelhante recolhida de um tecido vivo é A0 = 0,127 Bq. A lei do decaimento, que podemos
escrever como
A(t) = A0 e−νt ,
pode agora ser resolvida em ordem a t, e obtemos
t=
1
A0
ln
' 12500 anos.
ν A(t)
Este método não produz resultados fiáveis para datar vestı́gios recentes, digamos, com algumas
centenas de anos, por exemplo, das invasões napoleónicas. Isto, porque num tão curto intervalo de
tempo (quando comparado com o perı́odo de semi-desintegração do 14 C) o teor de carbono-14 não
sofre uma variação discernı́vel. No extremo oposto, restos muito antigos, digamos, com mais do
que 10 perı́odos de semidesintegração do 14 C (ou seja, cerca 50000 anos) não têm já uma actividade
de carbono-14 detectável, porque o teor deste nuclı́deo que apresentam é já demasiado baixo. O
processo de datação por carbono-14 serve então para datar vestı́gios arqueológicos mais antigos
do que 500 anos e menos antigos do que 50000 anos.
O método de datação que acabámos de ilustrar só é válido se o teor de carbono-14 se tiver
mantido constante ao longo do perı́odo histórico (ou pré-histórico) ao qual se pretende aplicar.
Mas este teor depende da concentração de azoto na atmosfera e do fluxo de raios cósmicos que
atinge a atmosfera, que, por seu turno, depende da intensidade do campo magnético terreste. Ora,
tanto a concentração de azoto como a intensidade do campo magnético terreste têm variado ao
longo dos anos, de forma que na verdade os cálculos necessários para fazer datações com base
no teor de 14 C são bastante mais complicados do que o que aqui exemplificámos. Outra possı́vel
fonte de erro resulta da utilização de combustı́veis fósseis, generalizada a partir do sec. XX. A
combustão de matéria orgânica é uma importante fonte de dióxido de carbono atmosférico.(m)
Mas os combustı́veis fósseis, resultam da degradação de matéria orgânica ao longo de perı́odos de
milhões de anos. Assim, o teor de 14 C do petróleo e do carvão e gás naturais é nulo. A utilização
generalizada destes combustı́veis inunda a atmosfera de CO2 virtualmente desprovido de carbono14. Como as medições do teor deste isótopo na atmosfera foram todas feitas nas últimas dezenas
de anos, é possı́vel que o tenhamos estimado por defeito.
9.5
9.5.1
Alguns tópicos de noticiário
A radioactividade natural
A matéria que compõe o nosso planeta inclui alguns isótopos instáveis, o que faz com que a Terra
seja uma fonte naturalmente radioactiva. Recordemos, a propósito, que o inı́cio do estudo da Fı́sica
(m) Este
é um problema fulcral dos nossos dias, por causa do efeito de estufa global.
144
124
126
128
130
132
134
136
138
140
142
144
146
N
Z
U
U
92
Pa
Th
Ra
Rn
Po
Po
Po
Bi
90
88
86
84
Bi
Pb
Pb
Th
Pb
82
Tl
Hg
80
Figura 9.8: Cadeia de decaimentos do 238 U. Note-se que o chumbo 210 Pb pode sofrer decaimento α
para
206
Hg ou decaimento β para
210
Bi.
Nuclear deu-se com a descoberta desta radioactividade natural em 1897, por Becquerel, como já
se disse. Alguns destes isótopos integram a composição da Terra desde a sua formação, há cerca
de 4,5 × 109 anos. Por exemplo, o 238 U é relativamente abundante, pertencendo à composição de
rochas como o granito. Outros, como o 14 C que já referimos, são produzidos pela interacção entre
o planeta e a radiação cósmica, ou resultam do decaimento dos átomos do primeiro grupo, como
o radão 222 Rn, que é um dos produtos da sequência de decaimentos que se inicia com o do 238 U.
A presença de urânio (principalmente 238 U) na Terra é extremamente importante. O seu
decaimento (e o do dos seus produtos) é a principal fonte de calor do interior da Terra. É,
assim, ao urânio que devemos o facto de a Terra ter um núcleo lı́quido, logo, ser um planeta
geologicamente activo. O urânio-238 sofre decaimento α com um perı́odo de semidesintegração de
4,5 × 109 anos, de acordo com o processo
238
U → 234 Th + α.
O factor-Q deste decaimento é 4,27 MeV. O tório 234 Th é, também, instável, sofrendo decaimento
β − com um perı́odo de semi-vida de 24,1 dias para o proctacnı́dio 234 Pa. A sequência completa
termina no mercúrio 206 Hg e é ilustrada na Figura 9.8. Todos os nuclı́deos presentes no diagrama
da Figura 9.8 são relativamente abundantes nas zonas ricas em granito, porque o urânio é um
dos componentes deste mineral. O aspecto mais relevante, para a nossa vida no dia a dia, desta
cadeia de decaimentos, é a presença do radão 226 Rn. Como se pode constatar, o radão-226 sofre
decaimento α, e fá-lo com um perı́odo de semivida de 7,4 min. Mas o pior é que o radão é um
gás, que se vai libertando das camadas superficiais das rochas onde é produzido, pelo que pode
ser inspirado por animais e pessoas, depositando-se no organismo. Como é óbvio, a presença
no interior do corpo de uma pessoa de uma fonte radioactiva não é nada benéfica para a sua
saúde. Em cavernas, ou habitações pouco arejadas, a concentração de radão pode atingir valores
suficientemente elevados para que as questões relacionadas com a exposição à radiação natural se
tornem preocupantes. Este problema nota-se mais nas regiões granı́ticas (como a nossa), onde se
verifica uma incidência ligeiramente maior de alguns tipos de cancro, resultantes da exposição à
actividade do radão.
9. Problemas
9.5.2
145
A utilização de urânio empobrecido
Comojá vimos, para a produção de energia por fissão nuclear de urânio, é necessário proceder ao
enriquecimento do material fı́ssil, que consiste em elevar o teor de 235 U de 0,7 % (valor apresentado
no urânio natural) para 3 %. Isto consegue-se através de processos fı́sicos, seleccionando átomos
de 235 U e rejeitando os de 238 U de forma a serem obtidas as proporções requeridas dos dois
isótopos. Um efeito secundário deste processo é a produção de grandes quantidades de urânio
empobrecido, isto é, urânio em que o teor de 235 U é muito inferior ao que se verifica na natureza.
Este facto coloca problemas delicados. Como quase todos os metais pesados, o urânio é um
veneno quı́mico poderoso; logo não se pode, simplemente, despejá-lo no solo ou na corrente de
um rio este resultado secundário do processo de produção. O seu armazenamento em grandes
quantidades num local também não é aconselhável, porque, sendo o 238 U radioactivo (ainda que
fracamente), a actividade do local de armazenamento pode atingir valores muito elevados. Mas
note-se que este urânio empobrecido é menos radioactivo do que o urânio natural. Com efeito, dos
dois isótopos mais frequentes na terra, o 235 U, que se aproveita no processo de enriquecimento, é
o mais radioactivo, apresentando uma constante de decaimento cem mil vezes maior do que a do
238
U.
Por ser tão fracamente radioactivo e por ser um metal extremamente duro e denso, o excedente
de urânio empobrecido tem sido aproveitado para a produção de blindagens de veı́culos militares (tanques, etc.) e de munições capazes de as penetrar. Esta utilização tem causado alguma
polémica porque tem sido associada a problemas de saúde (muitas vezes fatais) experimentados
por soldados com missões em zonas de combate, mesmo quando escapam sem ferimentos dessas
missões. Possivelmente, estes problemas de saúde devem-se a envenenamentos causados pela inspiração de fumos e poeiras ricos em urânio, resultantes das explosões de projécteis (e dos seus
alvos) fabricados com urânio empobrecido.
Bibliografia
• K. Krane, “Modern Physics” (1992) Capı́tulo 9,10: Fı́sica nuclear (F5.0 453)
• K. Krane, “Introductory Nuclear Phisics” (1988) (F5.0 360)
• F. Blatt, “Modern Phisics” (1992) Capı́tulo 14,15,16: Fı́sica nuclear (F5.0 448)
• J. Brehm e W. Mullin, “Introduction to the Structure of Matter” (1989) Capı́tulos 14 e 15:
Fı́sica Nuclear (F5.0 437)
• P. Tipler e R. Llewellyn, ”Fı́sica Moderna (3.a edição), Capı́tulos 11 e 12: Fı́sica Nuclear
• Decreto regulamentar n.o 9/99 de 19-04-1990:
http://www.diramb.gov.pt/data/basedoc/TXT_LN_2472_2_0001.htm
PROBLEMAS
9.1 A taxa de contagem de uma fonte radioactiva é 4000 contagens por segundo num certo instante.
Passados 10 s este valor reduz-se para 1000 contagens por segundo. (a) Qual o tempo de semidesintegração do material desta fonte? (b) Qual a taxa de contagem desta fonte passados 30 s do
instante inicial?
9.2 Uma amostra de um isótopo radioactivo tem uma actividade 115,0 Bq num certo instante; passado
2 h 15 min, a actividade reduziu-se a 85,2 Bq. (a) Qual o valor da constante de decaimento? (b)
Quantos núcleos radioactivos estavam presentes na amostra no instante inicial?
146
9.3 O nuclı́deo 62 Cu é produzido a uma taxa constante e sofre decaimento β + com uma meia vida de
10 min. Quanto tempo é necessário para produzir 90% do valor de equilı́brio de 62 Cu?
9.4 O urânio-238 sofre decaimento α com um perı́odo de semi-desintegração de cerca de 4,5×109 anos.
(a) Qual o isótopo que resulta deste decaimento?
(b) Qual o valor da actividade de uma amostra pura de
238
U com 1 g de massa?
(c) Qual o valor da potência irradiada pela amostra da alı́nea anterior?
9.5 Calcule a energia libertada no decaimento α do
por emissão de um nucleão isolado.
233
Np. Mostre que este nuclı́deo não pode decair
9.6 Identifique a partı́cula ou nuclı́deo X em cada um dos processos seguintes:
(a) X → 65 Ni + γ
(b)
215
Po → X + α
(c) X → 55 Fe + e+
(d)
109
(e)
14
Cd + X → 109 Ag
N +4 He → X + 17 O
9.7 Uma amostra de madeira, retirada de uma escavação arqueológica, com 21,0 mg de carbono
apresenta uma actividade de 837 decaimentos por semana. Qual a idade desta amostra?
9.8 Bombardeando ouro natural (197 Au) com neutrões lentos, nota-se a emissão de radiação β − . Que
reacção ocorre e qual o valor do seu factor-Q?
9.9 Um edifı́cio ficou acidentalmente contaminado com material radioactivo. Suponha que a substância com maior tempo de vida neste edifı́cio é o estrôncio-90, que tem uma massa atómica de 89,91 u
e um perı́odo de semi-desintegração de 29,1 anos. Suponha que, como resultado do acidente, 5,0 kg
de estrôncio-90 se espalharam pelo edifı́cio. Considerando que um nı́vel de radiação seguro é 10
decaimentos por minuto ou menos, durante quanto tempo deverá o edifı́cio manter-se encerrado
ao público?
9.10 Uma fonte radioactiva tem uma actividade tal que, a 3,0 m de distância, se podem contar 3
fotões γ por segundo e por cm2 , com uma energia de 2 MeV. Uma pessoa com 70 kg, situada a
esta distância, que dose absorve por minuto (considere que esta pessoa apresenta à fonte uma área
eficaz de 0,8 m2 )? Quanto tempo pode a pessoa permanecer nesta posição antes de absorvem um
equivalente de dose de 5 Sv? E se se tratasse de partı́culas α com a mesma energia?
Capı́tulo 10
Elementos de Fı́sica Subatómica
Terminámos o Capı́tulo 1 destes apontamentos com uma descrição bastante simples da realidade,
segundo a qual a matéria seria constituı́da por apenas três tipos de partı́culas elementares: os
electrões, os protões e os neutrões. A dualidade onda-corpúsculo veio complicar um pouco este
estado de coisas, tendo obrigado à introdução dos fotões, as partı́culas de campo electromagnético,
e fizémos já referência aos fonões, que são as partı́culas do campo das vibrações atómicas. Outra
complicação foi a introdução dos positrões, a propósito do decaimento β + , no capı́tulo anterior.
Na verdade, as coisas são muito mais complicadas. Muitos fenómenos não são compreensı́veis
num quadro tão simplista. Por exemplo, os decaimentos β seriam incompatı́veis com as leis da
conservação da energia e do momento se neles apenas intervissem protões, neutrões e electrões
(ou positrões), como veremos daqui a pouco. Por outro lado, a dualidade ondas-partı́culas obriga
(tal como para a força electromagnética e os fotões) à existência de quanta do campo da força
nuclear forte. A decoberta destas partı́culas, necessárias por razões teóricas, foi acompanhada da
de muitas outras que ninguém previra. No final dos anos cinquenta, começou até a falar-se do
jardim zoológico das partı́culas elementares(a)
. É este o assunto que nos vai ocupar agora.
10.1
A selva das partı́culas elementares
10.1.1
O positrão de Dirac
Como deve já ser bem sabido, no formalismo da Mecânica Quântica cada variável fı́sica é representada por um operador que actua num espaço de funções, ou espaço de estados. À energia
corresponde o operador ih̄∂/∂t, ao momento linear (na representação das coordenadas) o operador
~ à posição (na mesma representação) o operador de multiplicação pelo vector posição, isto
−ih̄∇
é, ~r×. Assim, a Equação de Schrödinger,
ih̄
∂ψ(~r, t)
h̄2 2
=−
∇ ψ(~r, t) + V (~r)ψ(~r, t),
∂t
2m
corresponde à equação clássica
p2
+ V (~r).
2m
Os dois termos no lado direito desta equação são, como é bem sabido,a energia cinética e a
energia potencial, respectivamente. Mas a energia cinética aparece nesta expressão na forma não
relativı́stica. Logo a Equação de Schrödinger é uma equação não relativı́stica também(b)
. Tentemos
deduzir uma equação de onda relativı́stica mas, para simplificar, consideremos apenas partı́culas
E=
(a) Talvez
fosse mais adequada a expressão selva das particulas elementares.
era preciso tanto para chegarmos a esta conclusão, bastava notar que as derivadas em ordem ao tempo
e às coordenadas espaciais não têm a amesma ordem. Nas equações relativı́sticas, tempo e espaço desempenham
papéis formalmente semelhantes.
(b) Não
147
148
CAPÍTULO 10. ELEMENTOS DE FÍSICA SUBATÓMICA
livres, isto é, não sujeitas a forças, logo, com energia potencial constante que pode ser escolhida
nula. A expressão clássica da energia cinética relativı́stica é
E 2 = p2 c2 + m2 c4 .
Fazendo a correspondência anterior entre variáveis fı́sicas e operadores quânticos,
∂
∂t
~
p~ → −ih̄∇,
E
→ ih̄
obtemos uma equação equação de onda relativı́stica para partı́culas livres, chamada Equação de
Klein-Gordon:
∂ 2 ψ(~r, t)
−h̄2
= −h̄2 c2 ∇2 ψ(~r, t) + m2 c4 ψ(~r, t).
∂t2
Esta equação levanta alguns problemas. O mais relevante para a presente discussão é o facto
de, para um dado vector momento linear (qualquer), haver dois estados distintos com energias
simétricas uma da outra, dadas por
p
E = ± p2 c2 + m2 c4 .
É difı́cil compreender como é que uma partı́cula livre pode ter energia cinética negativa ou qual
o significado dum tal valor energético. Deve dizer-se, a propósito, que Schrödinger começou por
tentar uma descrição relativı́stica dos electrões, tendo deduzido inicialmente a Equação de KleinGordon. No entanto, face às dificuladades que descrevemos, desistiu e contentou-se com um
formalismo não relativı́stico.
A gravidade da existência de estados com energia negativa pode ser melhor apreciada se considerarmos um electrão livre, parado. Classicamente, este electrão está num estado em que a sua
energia é mc2 , onde m é a massa electrónica. Em contrapartida, de um ponto de vista quântico,
esta partı́cula, no estado de repouso, tem à sua disposição um estado com energia −mc2 , logo
deveria ser possı́vel uma transição para este estado, acompanhada da emissão de radiação com
energia 2mc2 . Um tal fenómeno parece pouco menos que absurdo. Com efeito, é difı́cil dar um
significado fı́sico à energia de uma partı́cula livre, se ela puder tomar valores inferiores ao que
apresenta no estado de repouso.
Este problema do significado das soluções da equação de onda com energia negativa começou
a ser resolvido por P. A. M. Dirac no final dos anos vinte. Dirac deduziu uma equação de onda
relativı́stica de primeira ordem, cujas soluções com energia positiva descreviam correctamente o
comportamento dos electrões. Tomando o limite não relativı́stico da Equação de Dirac resultava
a Equação de Schrödinger, e o momento angular intrı́nseco (ou spin) surgia naturalmente neste
limite. Apesar destes sucessos, as soluções da Equação de Dirac apresentavam também dois valores
de energia simétricos. Considerando electrões livres, os dois valores são os mesmos que resultam
da Eqaução de Klein-Gordon. Neste aspecto, a Equação de Dirac, por si só, não representou
um grande avanço. Considerando que a sua equação descrevia electrões, que são fermiões, Dirac
fez uma suposição arrojada para tentar resolver o problema colocado pelas soluções de energia
negativa: afirmou que estes estados existem, de facto, mas estão, em condições normais, todos
ocupados. Assim, um electrão com energia positiva não pode sofrer uma transição para um estado
com energia negativa porque o Princı́pio de Exclusão de Pauli proı́be-o.
Deste modo, Dirac preencheu todo o universo com electrões com densidade infinita, inobserváveis porque distribuidos uniformemente. A estes electrões (em número infinito), que ocupam
todos os estados com energia negativa, dá-se o nome de mar de Dirac. Esta hipótese permite fazer
previsões interessantes. Por exemplo, tal como as vibrações atómicas num semicondutor podem
excitar um electrão da banda de valência para a de condução, deixando, na primeira, uma lacuna,
também deve ser possı́vel um fotão com energia igual ou superior a 2mc2 excitar um electrão
do mar para um estado com energia positiva. Neste processo, um estado com energia negativa
fica vago, podendo ser identificado com uma partı́cula com massa igua à do electrão mas carga
10.1. A SELVA DAS PARTÍCULAS ELEMENTARES
γ
149
e-
e+
e+
γ
γ
eE
mc 2
E
γ
mc 2
0
0
-mc 2
-mc 2
γ
Figura 10.1: Criação (à esquerda) e aniquilação (à direita) de pares electrão-positrão. Em cima,
diagramas esquemáticos dos processo; em baixo, interpretação de Dirac.
com sinal oposto — um positrão. Este processo tem o nome de criação de pares e ocorre muito
frequentemente em experiências de alta energia.
Dirac previu também a possibilidade da ocorrência do processo inverso, em que um electrão e
um positrão colidem, aniquilando-se mutuamente, produzindo radiação. Para Dirac, acontecimentos deste tipo ocorreriam quando um electrão com energia positiva sofresse uma transição para um
estado vago (lacuna ou positrão) de energia negativa. Este processo é hoje em dia bem conhecido
e tem o nome de aniquilação de pares.
A criação e aniquilação de pares estão representados graficamente na Figura 10.1.
O positrão foi descoberto em 1933, por C. Anderson, quando analizava a radiação cósmica.
10.1.2
O neutrino de Pauli
O decaimento β, tal como o descrevemos até agora, tem alguns aspectos que causam preplexidade.
Consideremos, por exemplo, o caso do bismuto 210 Bi. Este nuclı́deo sofre decaimento β com um
perı́odo de semidesintegração de cerca de 5 dias. De acordo com o que estudámos no capı́tulo
anterior, o decaimento deste nuclı́deo é
210
Bi → 210 Po + e− ,
com um factor-Q aproximadamente igual a 1,2 MeV. Consideremos o decaimento usando o referencial do centro de massa do sistema, relativamente ao qual o núcleo de bismuto se encontra em
repouso. De acordo com a lei da conservação do momento linear, após o decaimento, o electrão e o
núcleo de polónio devem seguir em sentidos opostos, com momentos lineares com módulos iguais.
Mas a massa do núcleo de polónio é cerca de 200 000 vezes maior do que a do electrão, logo, a
velocidade daquele deverá ser menor do que a deste na mesma proporção. Pela mesma razão, a
energia cinética do núcleo de polónio será, também, 200 000 vezes menor do que a do electrão, ou
seja, o electrão emitido no decaimento β do 210 Bi deve ficar animado com uma energia cinética
que é praticamente igual ao factor Q do decaimento, 1,2 MeV. E, no entanto, a análise da energia
dos electrões resultantes do decaimento β do bismuto (ou de outras substâncias) revela uma realidade bem diferente. Em vez de terem uma energia bem determinada (1,2 MeV no decaimento do
bismuto, outros valores para outros nuclı́deos) os electrões emitidos durante o decaimento β têm
energias que se distribuem continuamente num intervalo que é limitado superiormente pelo factor Q do decaimento. Por exemplo, para o bismuto 210 Bi, Ellis e Wooster fizeram, em 1927, uma
determinação da curva de distribuição dos electrões emitidos, como função da sua energia, cujo
resultado se ilustra na Figura 10.2. O facto de alguns (quase todos) os electrões serem emitidos
150
Figura 10.2: Distribuição energética dos electrões emitidos no decaimento β do
210
Bi (Proc. Royal
Soc. A117 109 (1927).
no decaimento beta com uma energia cinética tão menor do que o factor Q do decaimento parece
constituir uma violação do princı́pio da conservação da energia.(c)
Outro aspecto estranho do decaimento beta pode ser mais facilmente ilustrado quando se considera o mais simples destes processos, o decaimento de um neutrão. Mais uma vez, consideremos
o processo relativamente ao referencial do centro de massa do sistema. Antes do decaimento, o
sistema consiste num neutrão em repouso. O momento angular deste sistema reduz-se então ao
spin do neutrão, 1/2. Depois do decaimento, o sistema consiste num protão e num electrão, que
se movem(d) em direcções opostas com momentos lineares de igual módulo, logo, com momento
angular orbital nulo. O momento angular total deste sistema é o que resulta da composição dos
spins das duas partı́culas. Mas o momento angular total de um sistema de dois fermiões com spin
1/2 com momento angular orbital nulo pode ser 0 ou 1, nunca 1/2. Assim, aparentemente, o decaimento β não só não verifica a lei da conservação da energia como também viola a da conservação
do momento angular.
Pauli conseguiu resolver este problema com uma hipótese que começou a desenvolver em 1930,
e que foi sendo refinada nos anos seguintes, por ele e por Fermi. De acordo com esta hipótese, no
decaimento β seria emitida uma terceira partı́cula, com spin 1/2 (de maneira a garantir a satisfação
da lei da conservação do momento angular), com carga nula (para satisfazer a lei da conservação
da carga eléctrica) e com massa muito, muito pequena, muito menor do que a do electrão, eventualmente nula (como a do fotão), que repartiria com o electrão a energia disponı́vel resultante do
decaimento. A massa dos neutrinos (como vieram a ser conhecidas estas novas partı́culas) tinha
que ser mesmo muito reduzida, porque alguns electrões são emitidos no decaimento β com uma
energia muito próxima do valor máximo, isto é, do factor-Q do decaimento(e) .
O neutrino foi descoberto só em 1952, por F. Reynes e C. Cowan. Este atraso justifica-se
em parte pelo eclodir da Segunda Grande Guerra, mas principalmente pelo carácter esquivo dos
neutrinos. Note-se que, para se observar uma partı́cula, ela deve, de algum modo, interagir com
o instrumento detector. Assim, por exemplo, os nossos olhos são capazes de detectar fotões,
através de um processo de captura que se dá na retina. Ora, os neutrinos não têm carga eléctrica
e verifica-se que são insensı́veis, tal como os electrões, às interacções fortes. Assim, restam as
possibilidades de interagirem através de interacções dipolares magnéticas (muito menos intensas
que as eléctricas), caso tenham momento magnético, questão que ainda está em aberto, ou através
(c) Niels
Bohr chegou a considerar a hipótese da violação efectiva dessa lei nos processos microscópicos.
bem dizer, o protão fica praticamente parado, por ser muito mais pesado do que o electrão...
(e) A questão da massa dos neutrinos ficou em aberto até muito recentemente, quando a colaboração SuperKamiokande anunciou (em 1998, 46 anos depois da descoberta dos neutrinos!) resultados que mostravam indubitavelmente que o seu valor é não nulo.
(d) A
151
ν
ν
ν
e+
en
p+
p+
n
ep+
n
Figura 10.3: Diagramas da Figura 9.2, agora incluindo os neutrinos. Representam-se as linhas de
neutrinos com o sı́mbolo ν e as de antineutrinos com ν̄.
de uma outra força por enquanto ainda não referida, com intensidade muito baixa. Seja como
for, os neutrinos praticamente não interagem com a matéria e, portanto, é extremamente difı́cil
detectá-los. Esta propriedade inspirou o poeta norte-americano Jonh Updike para a escrita do
seguinte poema, publicado pela primeira vez em 1960:
Cosmic Gall:
Neutrinos, they are very small.
They have no charge and have no mass
And do not interact at all.
The earth is just a silly ball
To them, through which they simply pass,
Like dustmaids through a drafty hall
Or photons through a sheet of glass.
They snub the most exquisite gas,
Ignore the most substantial wall,
Cold-shoulder steel and sounding brass,
Insult the stallion in his stall,
And scorning barriers of class,
Infiltrate you and me! Like tall
And painless guillotines, they fall
Down through our heads into the grass.
At night, they enter at Nepal
And pierce the lover and his lass
From underneath the bed-you call
It wonderful; I call it crass.(f)
Por razões que serão explicadas mais adiante, convencionou-se que, no decaimento-β do neutrão, era emitida a anti-partı́cula do neutrino, ao passo que os neutrinos seriam emitidos nos
decaimentos-β + . Podemos agora desenhar completar mais correctamente os diagramas da Figura 9.2, incluindo o neutrino (ou anti-neutrino). Os diagramas corrigidos estão apresentados na
Figura 10.3.
(f) Desconsideração cósmica: Neutrinos, são muito pequeninos./Eles não têm carga e não têm massa/E não interagem com nada./A Terra é apenas uma bola tonta para eles, através da qual eles simplesmente passam/Como
criadas limpando o pó, através de uma sala ventosa/Ou fotões através de uma lâmina de vidro./Eles desprezam
o gás mais fino,/ Ignoram a barreira mais substancial/O duro aço e o sonoro bronze/Insultam o garanhão no seu
pedestal/E desrespeitando as barreiras de classe,/Infiltram-se em ti e em mim! Como altas/E indolores guilhotinas,
eles caem/através das nossas cabeças até à relva./À noite, entram no Nepal, perfuram o amante e a sua amada/De
debaixo do seu leito — Tu acha-los/ Maravilhosos; eu acho-os estúpidos. (Traduzido “às três pancadas”.)
152
e-
eγ
e-
e-
Figura 10.4: Dispersão de Rutheford de dois electrões.
e-
γ
e-
γ
e-
e-
Figura 10.5: As duas interacções que compõem o processo da Figura 10.4.
10.1.3
O mesão π de Yukawa e um convidado inesperado
Quantização das interacções electromagnéticas
Noutras disciplinas, estudou-se já a descoberta das caracterı́sticas corpusculares da luz e a importância que essa descoberta teve para o emergir da Fı́sica Moderna. Vejamos, por outro ângulo,
essas caracterı́sticas. É que a luz, sabe-se desde Maxwell e Hertz, é campo electromagnético; por
seu turno, o campo electromagnético é o intermediário das interacções eléctricas e magnéticas.
Quer isto dizer que duas cargas na proximidade uma da outra não se influenciam directamente
uma à outra, cada uma é influenciada pelos campos eléctrico e magnético gerados pela outra. O
facto destes campos terem carterı́sticas corpusculares deve traduzir-se na descrição que fazemos
da interacção entre as duas partı́culas carregadas. De facto, assim é. Nos termos da Mecânica
Quântica, cada partı́cula carregada é fonte constante de fotões; a colisão desses fotões com outra
partı́cula carregada altera o seu estado de movimento, traduzindo-se este processo numa interacção
efectiva entre as duas partı́culas carregadas.
O mais simples dos processos deste tipo chama-se dispersão de Rutheford e consiste na colisão
entre duas partı́culas com carga eléctrica do mesmo sinal. A dispersão de Rutheford de dois
electrões está representada graficamente, na sua forma mais elementar, na Figura 10.4. Um dos
electrões (digamos, aquele que está representado à esquerda) emite, na direcção do outro electrão
um fotão, sofrendo um recuo no sentido oposto, ou seja, para a esquerda; quando este fotão colide
com o outro electrão empurra-o, afastando-o do primeiro. Assim, o efeito desta troca de fotões é
semelhante ao de uma força repulsiva entre os dois electrões(g) .
O processo que acabámos de descrever consiste, de facto, em duas interacções: a emissão de
um fotão por um electrão e a absorção desse fotão por outro electrão. Estes dois acontecimentos
podem representar-se graficamente como se mostra na Figura 10.5.
O fotão trocado entre os dois electrões não pode ser um fotão “normal”. Consideremos o
processo de emissão, por exemplo (o vértice representado à esquerda na Figura 10.5). No referencial
do centro de massa do sistema, antes da colisão, o sistema consiste apenas num electrão parado,
com momento linear nulo e energia Ei = me c2 . Depois da colisão, o sistema consiste em duas
(g) Mas esta descrição, nos termos clássicos de efeitos de recuo e colisão quando se emite e absorve um fotão
não deve ser tomada à letra. Por exemplo, é muito difı́cil descrever desta forma a atracção entra cargas de sinal
diferente... Como veremos já a seguir, estes fotões são partı́culas não muito “normais”. Chega a noção que eles
transportam, de algum modo, a interacção entre partı́culas carregadas.
153
partı́culas, um fotão e um electrão, respectivamente com energias Eγ e E 0 e. De acordo com as
bem conhecidas leis de conservação, deve conservar-se o momento linear total e a energia. Assim,
o fotão e o electrão devem mover-se em sentidos opostos, com iguais módulos do momento linear.
Mas então a energia total do sistema depois da colisão, dada por
Ef
=
=
Eγ + Ee0
p
h̄ω + m2e c4 + p2 c4 ,
onde p é o módulo do momento linear das duas partı́culas e ω é a frequência da radiação associada
ao fotão emitido, é superior à energia total do sistema antes da colisão! Dá-se, assim, uma violação
da lei da conservação da energia?! Uma análise semelhante levaria a um paradoxo semelhante a
propósito do processo de absorção do fotão, no vértice do lado direito na Figura 10.5.
Apesar de ser impossı́vel a verificação das leis da conservação da energia e do momento linear
em cada um dos processos de emissão e absorção que compõem esta interacção entre os dois
electrões, ao nı́vel mais global não se verifica este problema. É perfeitamente possı́vel satisfazer
aquelas leis considerando as energias e momentos lineares dos electrões, porque as violações que
se verificam nos dois vértices têm sinal contrário: na emissão, a energia final é necessariamente
maior do que a inicial, na absorção é ao contrário. Uma vez que este paradoxo se manifesta
apenas quando se considera o estado intermédio (aquele que existe entre os instantes de emissão
e absorção do fotão trocado), a sua gravidade (a sua efectividade, até) depende de forma fulcral
da precisão com que conseguimos medir a energia deste estado intermédio. Ora, de acordo com
um importante teorema da Mecânica Quântica, a energia de um estado quântico é tanto melhor
definida quanto maior for o seu tempo de vida, de acordo com(h)
∆E τ ≥ h̄,
onde ∆E é a incerteza do valor da energia de um estado, τ o seu tempo médio de vida e h̄
é a constante de Plank reduzida. Então, se o fotão trocado entre os dois electrões tiver uma
duração suficientemente breve, não se pode propriamente falar em violação da lei da conservação
da energia, porque a precisão com que determinamos a sua energia não é suficiente para tal. Se
este fotão fosse detectado (isto é, se fosse aborvido por um detector), em vez de ser absorvido
pelo outro electrão, a sua energia deste fotão poderia ser determinada com precisão se se utilizasse
um detector apropriado. Nesta situação, o paradoxo seria inevitável. Constatarı́amos que não se
verificava a lei da conservação da energia! Como nunca se observou uma tal violação, como não
acreditamos que esta possibilidade se possa verificar, devemos aceitar que não é possı́vel detectar
estes fotões. Por esta razão, os fotões intermediários nas interacções electromagnéticas chamam-se
fotões virtuais.
A distância que um destes fotões virtuais, com um tempo de vida τ , pode percorrer antes
de ser absorvido por uma partı́cula carregada é, evidentemente, d = cτ . Ora, de acordo com a
desigualdade acima, τ ≥ h̄/∆E. Tomando o limite inferior para estimar uma ordem de grandeza,
obtemos
ch̄
d'
.
∆E
Mas, para salvaguardar o princı́pio da conservação da energia, a incerteza na energia do estado
intermédio tem que ser da ordem de grandeza da energia do fotão trocado, e essa pode tomar
valores arbitrariamente baixos, porque os fotões têm massa em repouso nula. Logo, os fotões
virtuais podem alcançar distâncias arbitráriamente grandes. Assim, este processo de troca de
fotões virtuais pode, de facto, descrever a interacção electromagnética que tem, como se sabe, um
alcance infinito.
Força nuclear e mesões π
Em 1935, um fı́sico japonês chamado Hideki Yukawa propôs uma descrição da força nuclear em
termos semelhantes aos que acabámos de estudar a propósito das interacções electromagnéticas.
(h) Costuma dar-se a esta desigualdade o nome de relação de incerteza tempo-energia, apesar desta designação
não ser muito apropriada.
154
n
p
π0
n
n
π0
p
p
π+
p
πn
Figura 10.6: Vértices fundamentais da força nuclear, nos termos da descrição de Yukawa. Compare
com o vértice fundamental da electrodinâmica, representado na Figura 10.5.
Yukawa considerou que a interacção nuclear se dava por troca de partı́culas a que chamou mesões π
ou piões, que desempenhariam, relativamente à força nuclear, o mesmo papel que os fotões desempenham na electrodinâmica. Como o alcance da força nuclear está limitado a cerca de 1 fm,
Yukawa supôs que estas partı́culas teriam, ao contrário dos fotões, massa em repouso não nula.
Considerando que a energia mı́nima de um pião é a sua energia de repouso, mπ c2 , e substituindo
na igualdade aproximada acima, Yukawa concluiu que a massa desta partı́cula deveria ser cerca
de
h
mπ '
' 200 MeV.
cd
A partı́cula intermediária na electrodinâmica, o fotão, não tem carga eléctrica, logo, nos vértices
fundamentais desta teoria não pode haver mudança da carga da partı́cula que emite ou absorve
um quanta de campo. Mas esta suposição não pode fazer-se, à priori, para a força forte. Devemos
pois considerar a possibilidade de um nucleão emitir um pião, transformando-se num nucleão
diferente, por exemplo, um neutrão transformar-se num protão quando emite um pião(i) . Quando
isto acontece, o pião emitido tem, necessariamente, carga eléctrica. Yukawa foi assim levado a
propôr a existência, não de uma partı́cula, mas sim de três, com cargas +e, 0 e −e, que seriam
as intermediárias da força nuclear. As massas dos três piões seriam forçosamente muito parecidas
porque, como vimos, a força nuclear é independente da carga: as interacções entre dois protões,
dois neutrões ou um protão e um neutrão são todas iguais, desde que se possa “desligar” a força
electromagnética.
Os vértices fundamentais das interacções nucleares estão ilustrados na Figura 10.6. Como deve
ser evidente, os piões devem ter spin 0 ou spin 1, de maneira a que nestes vértices possa ser
satisfeita a lei da conservação do momento angular.
No final dos anos trinta, a análise da radiação cósmica revelou a presença de partı́culas com
uma massa de cerca de 100 MeV. A proximidade deste valor com a estimativa feita por Yukawa
sugeria que estas novas partı́culas fossem os seus mesões π. No entanto, estas partı́culas tinham
uma elevada capacidade de penetração na matéria sólida, facto inesperado para partı́culas sujeitas
às interações fortes. Estudos posteriores vieram, até, a revelar que os muões eram totalmente
insensı́veis a estas forças. Por outro lado, veio a revelar-se que estas novas partı́culas são fermiões,
com spin-1/2, o que é completamente incompatı́vel com a hipótese de Yukawa. Durante alguns
anos, continuaram a ser conhecidas como mesões, mas hoje em dia têm o nome de muões e são
representados pelo sı́mbolo µ− . São partı́culas em tudo semelhantes aos electrões, à parte o valor
da massa.
A descoberta dos muões foi, como acabámos de ver, completamente inesperada. Se as restantes
partı́culas “novas” de que falámos até aqui desempenhavam algum papel no quadro geral que
ia emergindo da actividade cientı́fica nos anos trinta e quarenta, não se vislumbrava nenhuma
justificação teórica para estes electrões pesados. O laureado com o prémio Nobel Isaac Rabi
chegou, a este propósito, a perguntar, irritado, “Who ordered that?! ”(j)
Os mesões π de Yukawa acabaram por ser descobertos, mas só em 1947, por uma equipa da
Universidade de Bristol liderada por C. F. Powell. Esta descoberta foi feita também por análise de
raios cósmicos, mas detectados em altitude, numa estação meteorológica situada seis mil metros
(i) Note-se
(j) “Quem
que este processo nada tem que ver com o decaimento β do neutrão.
é que encomendou isso?! ”, em inglês.
10.2. AS QUATRO INTERACÇÕES FUNDAMENTAIS
Leptões
155
Hadrões
Bariões
SIM
0, 1, 2, . . . 1/2, 3/2, . . .
π0 , π±
p+ , n
Mesões
Sensibilidade à força forte
spin
exemplos
NÃO
1/2
e− , νe , µ− , νµ
Tabela 10.1: Classificação das partı́culas elementares nas famı́lias dos leptões, dos mesões e dos
hadrões.
acima do nı́vel do mar, na Bolı́via. Powell notou que os piões tinham uma massa de perto 140 MeV
e que decaı́am rapidamente para muões.
Mais tarde, em 1962, usando já um acelerador de partı́culas, L. Lederman, M. Schwartz e
J. Steinberger descobriram um tipo diferente de neutrinos, produzidos em processos que envolviam
muões. A estes neutrinos chamou-se neutrinos muónicos, e constumam ser representados pelo
sı́mbolo νµ .
10.1.4
Ordem no caos
A partir dos anos cinquenta, a construcção de aceleradores de partı́culas cada vez mais poderosos
permitiu o estudo de processos subatómicos de cada vez mais energia, tendo-se multiplicado a
descoberta de novas partı́culas. Actualmente, são conhecidas e observadas várias centenas de
partı́culas elementares, a maior parte das quais tem um tempo de vida muito curto. Põe-se, então,
a questão de como organizar este conhecimento, como classificar todas estas partı́culas, como
transformar esta selva num jardim zoológico.
Qualquer classificação é feita agrupando partı́culas com propriedades semelhantes. Numa primeira tentativa, separaram-se as partı́culas de acordo com a sua massa, tendo-se definido três
famı́lias principais: os bariões, os mesões e os leptões. A primeira era constituı́da pelas partı́culas
mais pesadas, ou seja, os protões e neutrões; a última, pelas de massa mais reduzida, ou seja,
os electrões e neutrinos; por fim, à segunda famı́lia, a dos mesões, pertenciam as partı́culas com
massa intermédia, ou seja, os piões e os muões(k) . Esta classificação permitia evidenciar outras
regularidades, pelo menos de forma aproximada. Por exemplo, todos os leptões e bariões são
fermiões (spin semi-inteiro) mas, se é verdade que os piões são bosões (spin 0), já os muões têm
spin 1/2 e, portanto, são fermiões. Vemos assim, que os muões são então a excepção numa regra (leptões e bariões são fermiões, mesões são bosões) que permitia reforçar a classificação das
partı́culas baseada no valor da massa.
Os leptões (isto é, por enquanto, os electrões e os neutrinos) apresentavam outra propriedade
caracterı́stica: a sua insensibilidade à força nuclear forte. Com efeito, a interacção entre os electrões
e os núcleos atómicos é puramente electromagnética. Em contrapartida, todos os bariões e os piões
sentem a interacção forte. Poderı́amos ser levados agora a escrever uma nova regra: os leptões
não sentem a força forte, os mesões e os bariões sentem esta força, mas, mais uma vez, os muões
constituem uma excepção, porque são, também, insensı́veis à interacção forte.
Para normalizar os muões, optou-se então por uma classificação das partı́culas baseada na sensibilidade à interacção forte. Assim, são leptões todas as partı́culas que não sujeitas a interacções
fortes e hadrões as que estão. Esta última famı́lia é ainda subdividida em mesões, que têm spin
inteiro e, por isso, são bosões, e bariões, que são fermiões, com spin semi-inteiro. Esta classificação
encontra-se esquematizada na Tabela 10.1.
10.2
As quatro interacções fundamentais
Ao longo deste semestre, considerámos frequentemente o efeito de dois tipos de interacções entre
partı́culas, a saber, a força electromagnética e a força nuclear forte. Temos também, de estudos
(k) Os
muões foram mais tarde reclassificados como leptões, já veremos porquê.
156
anteriores, alguma familiaridade com uma terceira força, a gravı́tica.
Destes três tipos de interacção, as forças fortes são (como o seu nome pretende indicar) as mais
intensas. Apesar de só terem efeitos quando as partı́culas em interacção estão muito próximas (a
cerca de 10−15 m, como já vimos), a força forte mostra-se capaz de vencer a tremenda repulsão
electrostática entre os protões que constituem os núcleos atómicos. A interacção electromagnética
vem a seguir em intensidade. É a responsável pela estabilidade atómica (assim como a força forte
assegura a estabilidade nuclear) e molecular. As interações electromagnéticas regem as reacções
quı́micas, ou seja, determinam grande parte das propriedades macroscópicas da matéria, bem
como a maior parte dos processos relevantes para nós, incluindo a própria vida. A terceira das
interacções referida é a menos intensa de todas mas, apesar disso, é a responsável pela estabilidade
das maiores estruturas conhecidas (planetas, estrelas, galáxias) e pelas propriedades de larga escala
do universo. Isto deve-se ao facto de a interacção gravı́tica ter um alcance infinito e ser sempre
atractiva, o que não acontece com as interacções fortes (que têm alcance finito e podem ser também
repulsivas) ou com as electromagnéticas (têm alcance infinito, mas podem ser repulsivas). Por ter
uma intensidade tão reduzida, a interacção gravı́tica não desempenha, em condições normais(l) ,
qualquer papel nas reacções subatómicas.
10.2.1
Interacção fraca
A estas três forças, devemos agora juntar uma quarta, mais intensa que a gravidade mas menos
intensa que o electromagnetismo, a chamada força fraca. A questão é que ocorrem na natureza
processos que não são compreensı́veis considerando apenas as três forças já referidas. Um aspectos
muito caracterı́stico da força fraca é a sua baixa intensidade, ou seja, a longa duração temporal
dos processos que são regidos por ela. Este aspecto pode ser evidenciado comparando os tempos
de vida de algumas partı́culas. Considerando os bariões, temos o protão (estável), o multipleto
∆, formado pelas partı́culas ∆++ , ∆+ , ∆0 e ∆− , com tempos de vida de cerca de 5 × 10−24 s;
os N(1440) e N(1520)(m) têm tempos de vida semelhantes. Estas partı́culas instáveis decaem
para nucleão, com emissão de piões e/ou fotões. Muitos outros exemplos poderiam ainda ser
apresentados de bariões com tempos de vida semelhante. Mas há também o neutrão, que tem um
tempo médio de vida de cerca de 15 min! Isto é, o neutrão, sendo uma partı́cula instável, tem um
tempo de vida 26 ordens de grandeza superior ao de outras partı́culas relativamente próximas, em
termos de massa e de spin! Além deste tempo de vida tão dilatado, no decaimento do neutrão dáse a emissão de neutrinos, outro facto caracterı́stico. Algo de similar ocorre no sector dos mesões.
Assim, temos os piões neutros, que decaem (quase sempre) emitindo fotões, de acordo com
π 0 → 2γ,
em cerca de 8 × 10−17 s, e temos os piões carregados, que apresentam muito maior longevidade
(3 × 10−8 s) e que decaem através do processo
π + → µ+ + νµ ,
onde se constata, também aqui, a presença de neutrinos. Por fim, considerando a famı́lia dos
leptões, notamos que o electrão é estável, mas que o muão não é. Este tem um tempo de vida
de 2,6 × 10−6 s, pouco caracterı́stico de um decaimento regido pelas forças forte (que, de qualquer
forma, já foi afastada do conjunto das forças capazes de afectar os muões) ou electromagnética. O
decaimento do muão procede de acordo com
µ− → e− + νµ + ν̄e ,
verificando-se a emissão de um neutrino muónico e um antineutrino electrónico. Estes dois sinais
(longa duração e presença de neutrinos) são sinais caraterı́sticos de processos que não são geridos
pela interacção forte ou electromagnética, sendo portanto necessária a introdução desta nova força.
(l) Isto
é, longe de fontes de campo gravı́tico muito intenso, como buracos negros.
letra “N” indica que se trata de partı́culas semelhantes ao nucleão, o número entre parêntesis indica a massa
em MeV.
(m) A
10.3. E AGORA, ALGO VERDADEIRAMENTE ESTRANHO!
157
Mas o sinal mais claro da existência de uma nova força, com propriedades diferentes das
três que já estudámos, é a violação da conservação da paridade. A paridade é uma propriedade
da função de onda de sistemas quânticos que apresentam simetria sob operações de inversão de
coordenadas. Por exemplo, uma partı́cula encerrada num poço de potencial rectangular (como os
electrões livres que estudámos no Capı́tulo 5), descrita usando coordenadas espaciais com origem
no centro do poço de potencial, tem uma função de onda cujo módulo fica inalterado em cada
ponto, se trocarmos o sinal das coordenadas, isto é,
|ψ(~r)| = |ψ(−~r)|,
de onde se conclui que
ψ(~r) = ±ψ(−~r).
A paridade de um sistema quântico é o sinal que modifica a sua função de onda numa destas
operações de inversão de coordenadas (ou reflexão espacial.) Em quase todos os processos conhecidos, a paridade de um sistema mantém-se constante, ou seja, por exemplo, um sistema com
função de onda inicial par evolui até um estado final em que a sua função de onda é, igualmente,
par. Os únicos processos em que esta lei de conservação pode não se verificar são aqueles que
envolvem emissão ou absorção de neutrinos, isto é, são os processos regidos pelas interacções fracas. Esta é mais uma assinatura identificadora da intervenção das interacções fracas num processo
subatómico. A violação desta lei de conservação foi descrita teoricamente em 1957 por T. D. Lee,
C. N. Yang e a sua observação experimental ocorreu no mesmo ano, por C.-S. Wu.
10.3
E agora, algo verdadeiramente estranho!
10.3.1
Isospin
Como vimos no capı́tulo anterior, a interacção forte actua da mesma maneira em protões e neutrões.
Por outro lado, as massas dos hadrões encontram-se distribuı́das de forma muito pouco homogénia.
Pelo contrário, os hadrões podem agrupar-se claramente em conjuntos de partı́culas com massas
muito semelhantes semelhantes. Assim, temos os três piões, com massas de 139,6 MeV (π ± ) e
135,0 Mev (π 0 ); a seguir no espectro, vem o η, com 547,8 Mev, o σ com 600 Mev (este valor
é muito incerto...), três ρ (ρ± e ρ0 ), com 775,8 MeV... No sector bariónico, temos os protão e o
neutrão (respectivamente com massas de 938,3 MeV e 939,6 MeV); os quatro delta, com 1232 MeV;
dois N(1440) com 1440 MeV... As massas de algumas destas partı́culas estão representadas na
Figura 10.7 Este agrupamento tão nı́tido justifica que se considerem as diferentes partı́culas de cada
grupo como diferentes estados de uma mesma partı́cula, estados que se distinguem entre si pelo
valor de uma nova variável quântica. As pequenas diferenças entre as massas das partı́culas de cada
grupo devem-se às interacções fraca e electromagnética, assim como as diferenças entre as energias
dos estados atómicos com iguais valores dos números quânticos principais e dos números quânticos
de momento angular (a chamada estrutura fina do espectro atómico) se devem à interação entre
os momentos magnéticos orbital e intrı́nseco de cada electrão.
A nova variável, cujo valor distingue os vários estados de uma destas super-partı́culas, chama-se isospin(n) ou spin isotópico. Assim como um electrão com spin 1/2 pode apresentar dois valores
para a componente Sz do seu momento angular, usualmente designados “spin up” (Sz = +h̄/2)
e “spin down”(Sz = −h̄/2), o nucleão é uma partı́cula com isospin 1/2, sendo possı́veis dois
valores para a projecção Tz do isospin, usualmente chamados “protão” (Tz = +1/2) e “neutrão”
(Tz = −1/2). Os piões π ± e π 0 , por seu turno, são os três estados possı́veis de uma partı́cula com
isospin 1 e que, portanto, pode apresentar três estados, caracterizados pelos diferentes valores da
projecção z do isospin, Tz = ±1 (para os piões carregados π ± , respectivamente) e Tz = 0 (para o
pião neutro). Também aqui se nota uma semelhança com o momento angular, relativamente ao
qual se verifica, por exemplo, que um electrão atómico numa orbital p (ou seja, com l = 1) tem
à sua disposição três estados, caracterizados pelos valores do número quântico de projecção de
momento angular ml = ±1 e ml = 0.
(n) Isto
é, “semelhante ao spin.”
158
1000
1400
-
_ρ
Massa (MeV)
800
0
_ρ
+
_ρ
1200
_σ
_η
600
_∆_
-
Σ
_∆0
_0
Σ
_∆+
_+
_∆++
Σ
_
Λ
400
1000
_
200
0
-
_π
-2
0
_π
n
+
_π
-1
0
1
Carga (em unidades de e)
2
800
-2
_
p
-1
0
1
Carga (em unidades de e)
2
Figura 10.7: Porção inferior do espectro hadrónico. À esquerda apresenta-se o sector mesónico, à
direita o bariónico.
10.3.2
Estranheza
Nos anos cinquenta, processos como
p + π−
p + π−
→
→
Λ0 + K 0
Σ− + K +
intrigavam os fı́sicos de partı́culas. Estes processos são geridos pela interacção forte, como se pode
deduzir da frequência com que ocorrem, mas as partı́culas produzidas, os mesões K ± e os bariões
Λ0 e Σ− , decaem lentamente, nos processos fracos
Λ0
Σ−
K0
K+
→
→
→
→
→
p + π−
n + π−
π+ + π−
2π + + π −
2π 0 + π + .
O problema era por que razão estas partı́culas, produzidas por processos fortes, não decaı́am
igualmente por processos fortes? Por exemplo, os bariões ∆ sofrem um decaimento semelhante
(quanto às partı́culas produzidas) ao dos bariões Σ e Λ, mas o seu tempo de vida médio é cerca de
10− 23 s (ou seja, sofrem decaimento forte). Só para efeitos de comparação, os tempos médios de
vida destas partı́culas estranhas (como vieram a ser chamadas) são 2,6×10−10 s (Λ0 ), 1,5×10− 10 s
(Σ) e 1,2 × 10−8 s (K + ). (O mesão K 0 é uma partı́cula mais complicada, que pode ser vista como
uma sobreposição quântica de duas partı́culas com tempos de vida muito diferentes, 0,9 × 10−10 s
e 5,2 × 10− 8 s.) Porque razão o ∆0 mais pode sofrer um decaimento forte e o Λ0 não pode?
A resposta a esta pergunta começou a ser dada pelo fı́sico americano Abraham Pais em 1952,
quando notou que estas partı́culas estranhas eram sempre produzidas aos pares. A interacção forte
parecia ser incapaz de produzir uma partı́cula estranha isoladamente. Aceitando esta incapacidade,
era natural que também não fosse possı́vel a aniquilação destas partı́culas isoladamente, através
10.4. A VIA ÓCTUPLA, QUARKS E GLUÕES
159
de processos fortes, pelo que o seu decaimento só poderia ocorrer através de processos de outra
natureza, muito mais lentos.
Pouco depois, Gell-Mann (1953) e Nishijima (1955) sugeriram uma explicação para este mistério, que explicava ao mesmo tempo a produção aos pares de Pais. Segundo esta explicação,
as partı́culas subatómicas seriam caracterizadas por uma nova variável, a que deram o nome de
estranheza, que seria sempre conservada nas interacções fortes, mas que podia não se conservar nas
interacções fracas. Somente as partı́culas estranhas (Σ, Λ0 , K,...) teriam valores não nulos desta
nova carga de estranheza; os nucleões, deltas, piões, etc., seriam todos partı́culas com estranheza
nula. Assim, a interacção forte podia produzir duas partı́culas estranhas, desde que tivessem estranhezas opostas, mas era incapaz de mediar um processo de decaimento de uma destas partı́culas.
O processo
p + π − → Λ0 + K 0
pode ocorrer pela interacção forte porque a estranheza do Λ0 é −1, ao passo que a do K 0 é +1.
Assim a estranheza total antes da interacção (S = 0) é igual à estranheza total depois da interacção
(S = +1 − 1 = 0). Em contrapartida, no decaimento
Λ0 → p + π − ,
ocorre uma variação da estranheza (-1 antes, 0 depois), logo, não pode ocorrer pela interacção
forte, tem que ser mediado pela interacção fraca.
10.4
A via óctupla, quarks e gluões
A Tabela 10.2 apresenta os valores da massa, da carga, do isospin total (T ), da componente-z de
isospin (Tz ) e da estranheza de alguns hadrões.
Partı́cula
π+
π0
π−
η
massa (MeV)
140
135
140
549
carga (/e)
1
0
-1
0
T
1
1
1
0
Tz
1
0
-1
0
S
0
0
0
0
Tabela 10.2: Propriedades fı́sica de alguns hadrões.
10.4.1
Quarks com cor e sabor
10.4.2
Descrição microscópica dos processos de decaimento
10.5
Leis de conservação
10.6
Aceleradores e detectores
PROBLEMAS
10.1 Qual é a menor energia do fotão incidente no processo de produção de um par electrão-positrão?
e de um par protão-antiprotão?
10.2 Um fotão com energia ² = 2, 09 GeV cria um par pp̄ (protão-antiprotão). O protão assim produzido
tem uma energia de 95 MeV. Qual é a energia do antiprotão?
10.3 Na reacção µ+ e− → 2ν, que espécie(s) de neutrinos (e/ou antineutrinos) são produzidos?
160
10.4 Qual a energia, comprimento de onda e frequência dos dois fotões emitidos no decaimento do pião
neutro π 0 → 2γ?
10.5 Recorrendo aos diagramas mais fundamentais de cada tipo de interacção quântica, tente construir
um processo em que se verifique violação do número total de quarks. Que pode concluir?
10.6 Qual pode ser a partı́cula X no processo Xp → nµ+ ?
10.7 Nenhum dos seguintes processos ocorre. Porquê?
(a)
(c)
(e)
(g)
pp̄ → µ+ e−
Σ − → K 0 µ−
γp → nπ 0
pp → ppn
(b)
(d)
(f)
(h)
π − → e− γ
π − p → pπ +
pp → pπ +
Λ → K −p
10.8 O decaimento β de protões não se observa em protões isolados, mas ocorre no interior de alguns
núcleos radioactivos, sendo o processo de decaimento principal dos isótopos mais leves de elementos com massa intermédia, como o oxigénio. Porque razão não se observa este processo entre
protões isolados?
10.9 Os processos de decaimento dos piões são, maioritariamente, os seguintes:
π+
→
µ+ νµ
π−
→
µ− ν̄µ
0
→
2γ.
π
(a) Descreva microscopicamente, através de diagramas, estes processos.
(b) O tempo médio de vida dos piões carregados é 2,6×10−8 s, ao passo que o dos piões neutros
é 8,4×−17 s. Porquê?
10.10 Descreva microscopicamente os seguintes processos e identifique os tipos de interacções que
participam em cada um
(a) n → p+ e− ν̄e
(b) Σ+ → pπ 0
(c) Σ0 → Λγ
10.11 Os piões carregados π ± têm um tempo médio de vida de cerca de 2,6 × 108 s, ao passo que o do
pião neutro π 0 é, apenas 8,4 × 10−17 s. A que se deve tão grande diferença?
Apêndice A
Momento angular, spin e simetria
de troca
A.1
Momento angular e spin
Classicamente, o momento angular de um sistema está associado ao seu movimento. É uma
propriedade fı́sica vectorial dada pelo produto externo do vector posição e do vector momento
linear, isto é,
~ = ~r × p~.
L
As componentes cartesianas do momento angular são, explicitamente, as seguintes:
Lx
Ly
Lz
=
=
=
ypz − zpy
zpx − xpz
xpy − ypx .
Os operadores que, em Mecânica Quântica, associamos a estas quantidades, obtêm-se substituindo
as componentes do vector posição e as do momento linear pelas dos operadores quânticos corres~ resultando
pondentes ~r → ~r e p~ → −ih̄∇,
Lx
Ly
Lz
=
=
=
−ih̄ (y∂z − z∂y )
−ih̄ (z∂x − x∂z )
−ih̄ (x∂y − y∂x ) ,
(A.1)
onde se usaram as abreviaturas ∂x = ∂/∂x, etc. Estes operadores não comutam uns com os outros,
antes se tendo
[Lx , Ly ]
[Ly , Lz ]
=
=
ih̄Lz
ih̄Lx
[Lz , Lx ]
=
ih̄Ly .
Uma vez que as três componentes do momento angular não comutam entre si, não são possı́veis
estados em que duas quaisquer componentes do momento angular apresentem valores bem determinados. Apenas uma das componentes do momento angular de um sistema quântico pode
apresentar valores precisos. Por convenção, escolhe-se a componente z. Apesar de não comutarem
umas com as outras, as componentes do momento angular comutam com o quadrado do módulo
do momento angular, L2 = L2x + L2y + L2z . Então, os valores da componente z do momento angular
e do quadrado do módulo do momento angular podem ser simultaneamente determinados com
precisão ilimitada (ou melhor, sem limitações de natureza teórica).
161
162
APÊNDICE A. MOMENTO ANGULAR, SPIN E SIMETRIA DE TROCA
l=1
dB/dz
l=0
l=-1
Figura A.1: Montagem para a experiência de Stern-Gerlach.
Pretende-se agora dar resposta à seguinte questão: Que valores podemos obter de uma medição
de L2 e de Lz ? Como sabemos, estes valores são os dos valores próprios destes operadores. Para
responder a esta questão devemos pois resolver as equações de valores próprios
L2 ψ(~r) =
L2z ψ(~r) =
Λ2 ψ(~r)
M ψ(~r),
onde representámos por Λ2 os valores próprios de L2 , por M os de Lz e ψ(~r) representa as funções
próprias destes dois operadores. Estas duas equações são equações às derivadas parciais para ψ,
cujas soluções formam o conjunto de funções próprias de L2 e Lz . O aspecto mais interessante
para a presente discussão é que estas equações só têm solução se os valores próprios tiverem valores
muito bem determinados, que são os que satisfazem as condições
Λ2
M
=
=
l(l + 1)h̄2 ,
mh̄,
onde l é um número inteiro não negativo arbitrário e m é um inteiro que toma valores compreendidos entre −l e l. Assim, para cada valor de l (relacionado com o módulo do momento angular)
há 2l + 1 estados, cada um com um valor diferente da componente z do momento angular. Esta
situação é familiar a todos, pelo menos no contexto da Fı́sica Atómica, em que se caracterizam os
estados electrónicos através dos valores dos chamados número quântico de momento angular (l) e
número quântico de projecção (no eixo dos z) do momento angular (m).
Nos átomos, o momento angular está intimamente ligado ao momento magnético. É fácil
entender porquê: o momento angular é o reflexo do movimento dos electrões que, por outro lado,
está na origem de um campo magnético, que se descreve através do momento magnético atómico.
Esta ligação entre o momento angular e o momento magnético traduz-se numa proporcionalidade
entre as componentes-z dos dois observáveis,
Mz = gLz ,
onde g, a constante de proporcionalidade, se chama razão giromagnética. Esta relação entre as
duas quantidades pode ser usada para distinguir estados atómicos que diferem apenas pelo vaalor
da componente-z do momento angular. Fazendo um feixe de átomos idênticos atravessar uma
região onde está definido um campo magnético não homogéneo e orientado segundo o eixo dos zz,
átomos com diferentes valores de Lz são desviados em direcções diferentes porque a componente
do momento magnético segundo a direcção do campo tem valores diferentes (ver a Figura A.1).
Experiências deste tipo chamam-se experiências de Stern-Gerlach, em homenagem aos dois fı́sicos
que, pela primeira vez em 1922, as realizaram. Se não se tem nenhum cuidado especial na preparação do feixe incidente (à parte os de garantir que todos pertencem à mesma espécie quı́mica
e têm a mesma energia) os átomos que o constituem apresentam valores diferentes de Lz e, portanto, sofrem desvios diferentes. O feixe incidente desdobra-se então em vários subfeixes, cada
qual incluindo átomos com um determinado valor da componente-z do momento angular. Assim,
se realizamos uma experiência de Stern-Gerlach com átomos com momento angular l, esperamos
ver o feixe incidente desdobrar-se em 2l + 1 subfeixes.
O momento angular total de um sistema quântico é, do ponto de vista clássico, uma função
dos estados de movimento dos constituintes desse sistema. Assim, o momento angular dos átomos
A.2. SIMETRIA DE TROCA DE PARTÍCULAS IDÊNTICAS
163
é a soma dos momentos angulares dos electrões que os constituem, cada um dos quais é descrito
em Mecânica Quântica por um operador do tipo dos apresentados na eq. (A.1), cada um dos quais
pode apresentar, como vimos, um valor
L2 = l(l + 1)h̄2 ,
com l inteiro não negativo. Assim, esperamos que o resultado de uma experiência de SternGerlach seja o desdobramento do feixe incidente num número ı́mpar (2l + 1) de subfeixes. Ora,
o resultado mais interessante deste tipo de experiências é que, para alguns átomos (aqueles que
têm número atómico ı́mpar), verifica-se o desdobramento do feixe incidente num número par de
subfeixes, indicando que o momento angular dos átomos usados é um número semi-inteiro. Este
facto indica claramente que há, ao nı́vel microscópico, contribuições para o momento angular de
um sistema quântico que não têm relação com o movimento dos seus constituintes, ou seja, que
não têm qualquer correspondência com a noção clássica de momento angular.
A estas parcelas do momento angular dá-se o nome de momento angular intrı́nseco ou simplesmente, spin. O spin é uma caracterı́stica de cada partı́cula. Os electrões têm spin 1/2, os fotões
têm spin 1, os piões, spin 0. O momento angular de um átomo é a soma dos momentos angulares
dos seus electrões e dos spins desses electrões. Nos casos em que o número atómico ı́mpar, essa
soma não pode resultar num número quântico de momento angular total inteiro.
A.2
Simetria de troca de partı́culas idênticas
A identidade de duas partı́culas tem um significado muito mais forte em Mecânica Quântica
do que na Fı́sica Clássica. Duas partı́culas idênticas do ponto de vista clássico podem ainda ser
distinguidas, fazendo numa delas uma marca de tinta, ou acompanhando, instante a instante, o seu
movimento, de forma a que se possa dizer “a partı́cula que, há pouco, estava ali, está agora aqui;
aquela outra, moveu-se de acolá para a direita...”Assim, as duas partı́culas são idênticas porque as
suas caracterı́sticas intrı́nsecas (massa, carga, forma, etc.) são as mesmas, mas é sempre possı́vel
distinguir as duas e dizer qual é qual. Do ponto de vista quântico, isto é impossı́vel. Tomemos
um exemplo para o ilustrar. Imaginemos que fazemos uma experiência em que bombardeamos
hidrogénio atómico(a) com um feixe de electrões. O resultado da colisão de um electrão com um
átomo de hidrogénio é um dos seguintes:
(a) o electrão incidente é capturado pelo átomo de hidrogénio, formando-se um ião H− ;
(b) após a interacção, o átomo de hidrogénio e o electrão seguem os seus caminhos;
(c) o electrão incidente ioniza o átomo de hidrogénio, resultando então um ião H+ e dois
electrões, todos livres uns dos outros.
Nos casos em que se verifica a hipótese (b) não há procedimento experimental que nos permita
saber se o electrão livre no final é o incidente ou se este foi capturado tendo o electrão atómico sido
expulso do átomo. Isto, porque não é possı́vel acompanhar as trajectórias do electrão incidente e
do electrão atómico como acompanhamos o movimento de duas bolas de bilhar numa colisão num
jogo de snooker. A função de onda do electrão incidente tem uma certa extensão, assim como a
do electrão atómico. Enquanto se dá a colisão, as duas funções de onda sobrepõem-se e, assim
sendo, não fazemos a menor ideia, no final, de qual electrão se “materializou” no átomo e qual foi
deixado livre.
A indistinguibilidade de partı́culas quânticas idênticas tem uma importante consequência: é
que duas descrições de um sistema quântico que difiram entre si apenas pela troca das variáveis
dinâmicas de duas partı́culas idênticas têm que ser equivalentes, isto é, devem produzir os mesmos
valores no cálculo de propriedades observáveis do sistema. Vejamos que consequências podemos
retirar daqui. Seja
ψA,B (~r1 , ~r2 ) = ψA (~r1 )ψB (~r2 )
(a) O
argumento não é alterado se o alvo for hidrogénio molecular.
164
APÊNDICE A. MOMENTO ANGULAR, SPIN E SIMETRIA DE TROCA
a função de onda de um sistema de duas partı́culas idênticas e indistinguı́veis independentes, que
ocupam os estados ψA e ψB e sejam ~r1 e ~r2 as suas coordenadas. Se trocarmos, na função de onda,
as posições das duas partı́culas, as diversas propriedades observáveis do sistema devem, como se
disse, permanecer inalteradas. Este resultado deve verificar-se, em particular, para a densidade
de presença das partı́culas quânticas. Assim, deve verificar-se
2
2
|ψA,B (~r1 , ~r2 )| = |ψA,B (~r2 , ~r1 )| ,
ou seja, ao nı́vel da função de onda,
ψA,B (~r1 , ~r2 ) = eiδ ψA,B (~r2 , ~r1 ),
onde δ é um número real arbitrário. Se voltarmos a trocar as coordenadas das duas partı́culas,
obtemos
ψA,B (~r1 , ~r2 ) = eiδ ψA,B (~r2 , ~r1 ) = e2iδ ψA,B (~r1 , ~r2 ),
o que nos leva a escrever que exp(2iδ) = 1, ou seja que exp(iδ) = ±1. O efeito da troca dos dois
conjuntos de coordenadas na função de onda do sistema é pois o de multiplicar a função de onda
do sistema por um ou por menos um. Qual das possibilidades se verifica depende da natureza das
duas partı́culas idênticas. Há partı́culas cuja função de onda é antissimétrica (troca o sinal) sob
operações de troca, e outras cuja função de onda é simétrica, isto é, que se mantém inalterada sob
a referida troca. As primeiras chamam-se fermiões e incluem os electrões, os protões e neutrões,
entre outras partı́culas; as segundas chamam-se bosões e incluem os fotões, os piões, e muitas
outras também.
Devido à antissemetria da função de um sistema de fermiões, verifica-se uma grande limitação à
possibilidade de dois fermiões idênticos ocuparem o mesmo estado de partı́cula única. Com efeito,
se dois fermiões ocupam o mesmo estado ψ1 , então efectuando uma troca das duas partı́culas
resulta
ψ1,1 (~r1 , ~r2 ) = −ψ1,1 (~r1 , ~r2 ),
que só pode ser satisfeita se a função de onda se anular. Demonstrámos assim o importante
princı́pio de exclusão de Pauli: dois fermiões idênticos não podem ocupar simultaneamente o
mesmo estado individual. Esta regra tem importantes consequências, como já vimos no estudo
da condução em metais. Outro exemplo da importância do princı́pio de exclusão de Pauli é o
facto de diferentes elementos terem diferentes propriedades quı́micas. Com efeito, se este princı́pio
não se verificasse, ou se os electrões fossem bosões, no estado fundamental de cada átomo todos
os electrões ocupariam o nı́vel de mais baixa energia, o estado 1s, pelo que não se verificaria a
diversidade de comportamenetos quı́micos.
A simetria de troca da função de onda de um sistema de partı́culas idênticas está relacionada,
de uma forma complexa, com o momento angular intrı́nseco (spin) dessas partı́culas. Todas as
partı́culas com spin inteiro (como os fotões) são bosões; todas as partı́culas com spin semi-inteiro
(como os electrões) são fermiões.

Apontamentos de Física Moderna 2

Transcrição

Documentos relacionados

Novo Release (Portugues)

Nota de Alta

Lisboa, 09 de janeiro de 2013

SHELLAC 78`

rider técnico café concerto ccvf

Teorema de Ptolomeu

Determinaç˜ao da Carga Elementar: Experiência de Millikan

Apresentação do PowerPoint

Reitores na Moncloa - Duvi

Lista de exercícios 03