F´ısica do Estado Sólido - Departamento de Física da UBI

Сomentários

Transcrição

F´ısica do Estado Sólido - Departamento de Física da UBI
Apontamentos de
Fı́sica do Estado Sólido
José Amoreira e Miguel de Jesus
Departamento de Fı́sica
Edição de 2001/2002
UNIVERSIDADE DA BEIRA INTERIOR
Copyleft
Os autores deste texto são Luı́s José Maia Amoreira ([email protected])
e Miguel Eduardo Pita de Jesus ([email protected]), do Departamento de
Fı́sica da Universidade da Beira Interior. Não se garante que seja apropriado para
qualquer fim especı́fico. Não se garante a sua correcção. Use-o por sua conta e risco.
Este texto pode ser obtido no URL
http://www.dfisica.ubi.pt/~amoreira/lectnotes/fesnts.pdf
Este texto pode ser copiado, alugado, vendido, emprestado ou oferecido, desde que
este “Copyleft” permaneça inalterado. O texto pode ser adaptado, acrescentado ou
diminuı́do, desde que sejam satisfeitas as seguintes condições:
• no produto final, deve ser incluı́da uma indicação bem visı́vel de que se trata
de uma adaptação deste trabalho
• devem ser referidos os nomes dos autores deste trabalho
• deve ser apresentado o URL deste documento (ver acima)
Os autores agradecem ser informados da redacção de trabalhos baseados neste texto.
Em resumo, os autores autorizam qualquer utilização desta obra que respeite as
regras básicas da honestidade, do bom-senso e da boa-educação.
Composto em LATEX.
Índice
1 Introdução
1.1 A estrutura dos sólidos . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Breve resumo da Tabela Periódica . . . . . . . . . . . . . . . . . . .
1.3 Resumo dos capı́tulos seguintes . . . . . . . . . . . . . . . . . . . . .
2 Elementos de Cristalografia
2.1 Cristais ideais e cristais reais . . .
2.2 A estrutura cristalina . . . . . . .
2.3 Tipos de redes cristalinas . . . . .
2.4 Exemplos de estruturas cristalinas
2.5 Direcções e planos cristalinos . . .
2.6 Distância interplanar . . . . . . . .
2.7 Coordenadas fraccionárias . . . . .
2.8 Defeitos . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . .
1
1
2
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
9
11
15
17
19
20
21
3 Difracção elástica em cristais
3.1 Generalidades . . . . . . . . . . . . . . . . . . .
3.2 A condição de Bragg . . . . . . . . . . . . . . .
3.3 Métodos experimentais . . . . . . . . . . . . . .
3.4 Condição de Laue. Rede recı́proca . . . . . . .
3.4.1 A construcção de Ewald . . . . . . . . .
3.5 Equivalência das condições de Bragg e de Laue
3.6 Amplitude da difracção. Factor de estrutura . .
Problemas . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
26
27
28
31
31
33
38
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
42
47
49
49
53
55
57
60
60
62
66
70
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Vibrações em cristais
4.1 A aproximação harmónica . . . . . . . . . . . . . . . .
4.2 Ondas mecânicas em meios contı́nuos . . . . . . . . . .
4.2.1 Vibrações de um meio contı́nuo tridimensional
4.3 Vibrações de um meio cristalino . . . . . . . . . . . . .
4.3.1 Vibrações de uma cadeia monoatómica linear .
4.3.2 Vibrações de uma cadeia biatómica linear . . .
4.3.3 Vibrações de um cristal tridimensional . . . . .
4.4 A densidade de modos de vibração . . . . . . . . . . .
4.5 O problema do calor especı́fico . . . . . . . . . . . . .
4.5.1 Modelo Clássico . . . . . . . . . . . . . . . . .
4.5.2 Modelo de Einstein . . . . . . . . . . . . . . . .
4.5.3 Modelo de Debye . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ii
ÍNDICE
5 Metais I: modelos de electrões livres
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 O modelo de Drude-Lorentz . . . . . . . . . . . . . . . . . . . .
5.2.1 O calor especı́fico dos metais . . . . . . . . . . . . . . .
5.2.2 A lei de Ohm . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 O efeito de Hall . . . . . . . . . . . . . . . . . . . . . . .
5.2.4 Efeitos termoeléctricos . . . . . . . . . . . . . . . . . . .
5.3 Balanço do modelo de Drude . . . . . . . . . . . . . . . . . . .
5.4 O modelo de Sommerfeld . . . . . . . . . . . . . . . . . . . . .
5.4.1 Estados electrónicos . . . . . . . . . . . . . . . . . . . .
5.4.2 A densidade de estados electrónicos . . . . . . . . . . .
5.4.3 O estado fundamental de um gás de fermiões . . . . . .
5.4.4 O gás de electrões de condução à temperatura ambiente
5.4.5 A distribuição de Fermi-Dirac . . . . . . . . . . . . . . .
5.4.6 Energia de um gás de fermiões para T > 0 K . . . . . .
5.4.7 Calor especı́fico . . . . . . . . . . . . . . . . . . . . . . .
5.4.8 A condutividade eléctrica . . . . . . . . . . . . . . . . .
5.5 Crı́tica dos modelos de electrões livres . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
74
74
75
78
78
80
80
81
83
83
85
86
90
91
92
94
94
6 Metais II: Teoria de bandas
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . .
6.2 O teorema de Bloch . . . . . . . . . . . . . . . . . .
6.3 Propriedades dos estados de Bloch . . . . . . . . . .
6.3.1 Periodicidade no espaço recı́proco . . . . . .
6.3.2 Nı́veis de energia dos estados de Bloch . . . .
6.3.3 Momento linear . . . . . . . . . . . . . . . . .
6.3.4 Velocidade média e momento linear cristalino
6.3.5 Massa efectiva dos electrões de Bloch . . . . .
6.3.6 O livre caminho médio . . . . . . . . . . . . .
6.4 Modelo de Krönig-Penney . . . . . . . . . . . . . . .
6.5 Número de estados por banda . . . . . . . . . . . . .
6.6 O estado fundamental da nuvem electrónica . . . . .
6.7 A condução eléctrica . . . . . . . . . . . . . . . . . .
6.8 O gás de Bloch à temperatura ambiente. . . . . . . .
6.9 Lacunas . . . . . . . . . . . . . . . . . . . . . . . . .
6.10 Contaminação de semi-condutores . . . . . . . . . .
6.11 O diodo semicondutor . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
97
97
100
102
102
103
104
105
107
108
109
114
115
117
118
119
121
123
125
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Capı́tulo 1
Introdução
É sabido que a matéria existe no universo em estados e formas muito variados.
É usual a classificação destes estados em fases, sendo as mais vulgares à escala
macroscópica as introduzidas no ensino básico, a saber: a fase gasosa, a lı́quida e
a sólida. A Fı́sica do Estado Sólido (ou Fı́sica da Matéria Condensada) estuda as
propriedades da matéria sob esta última forma.
As caracterı́sticas dos sólidos variam grandemente (à parte, é claro, aquelas que
os definem como tal), seja qual for o aspecto particular que se analise. Assim, há
sólidos com alta e baixa densidade de massa, sólidos que se polarizam electricamente
com maior ou menor facilidade, há sólidos que são bons condutores de calor e de
electricidade e outros que não o são, há sólidos ferro-magnéticos, dia-magnéticos
e para-magnéticos, sólidos opacos e sólidos transparentes, etc, etc, etc. A Fı́sica
do Estado Sólido tem pois a difı́cil tarefa de explicar, recorrendo às leis básicas da
Fı́sica, toda uma série de comportamentos dı́spares dos diferentes materiais.
De acordo com o modelo atómico, hoje em dia incontestavelmente aceite, a
matéria é constituı́da por moléculas e estas por átomos que, por sua vez, são formados por electrões, protões e neutrões. Todos estes diferentes tipos de partı́culas
apresentam comportamentos que são, com precisão, descritos pela teoria fundamental do mundo microscópico — A Mecânica Quântica. Por esta razão, tentaremos
descrever as diferentes propriedades dos diferentes sólidos à luz desta teoria. No
entanto, veremos que não há praticamente nenhum domı́nio da Fı́sica que não seja
chamado a desempenhar algum papel nesta tarefa.
1.1
A estrutura dos sólidos
O estado fı́sico da matéria é o resultado do equilı́brio entre dois factores: as forças
inter-atómicas e/ou inter-moleculares que tendem a establecer a coesão, e as vibração atómicas e moleculares que tendem a establecer a desordem molecular.
Quando as forças inter-atómicas/moleculares prevalecem sobre as vibrações, a matéria encontra-se no estado sólido. Fundamentalmente, aquilo que distingue o estado
sólido das restantes fases clássicas (gasosa e lı́quida) é o facto de, nos sólidos, os
átomos oscilarem em torno de posições de equilı́brio fixas. A distribuição espacial destas posições de equilı́brio confere aos sólidos uma estrutura fixa e serve
de critério para a sua classificação em três categorias principais: os cristalinos, os
amorfos e os poli-cristalinos. Num sólido cristalino, as posições de equilı́brio dos
átomos dispõem-se regularmente ao longo de todo o volume do sólido, repetindo um
padrão básico, à laia de um “papel de parede tridimensional”. Nos sólidos amorfos, não se manifesta qualquer regularidade nas posições de equilı́brio dos átomos.
Finalmente, os sólidos poli-cristalinos são constituı́dos por um grande número de
1
2
CAPÍTULO 1. INTRODUÇÃO
pequenos cristais, com orientações e dimensões arbitrárias. Qualquer que seja a sua
composição quı́mica, é possı́vel preparar uma amostra de sólido em qualquer destes
três estados. Por exemplo, a fase sólida da água é representada por cristais de neve
(forma cristalina), gelo (do que usamos para refrescar as bebidas) (forma amorfa)
ou neve comprimida (forma poli-cristalina).
Os electrões dos átomos que constituem os sólidos contribuem de forma determinante para um um grande número das suas propriedades. Sendo partı́culas de
spin semi-inteiro, satisfazem a estatı́stica de Fermi-Dirac e, portanto, o Princı́pio
de Exclusão de Pauli: cada estado quântico não pode ser ocupado por mais que
um electrão. No estado fundamental, um átomo com N electrões tem os N estados
quânticos de menor energia todos ocupados (com um electrão cada) e os restantes
todos desocupados. Os electrões que ocupam estados de menor energia estão, em
média, mais próximos do núcleo do átomo a que pertencem do que os que ocupam estados de maior energia. Assim, aqueles “sentem” com menor intensidade a
presença de outros átomos na vizinhança, e por isso praticamente não participam
nas ligações quı́micas responsáveis pelo agrupamento de átomos em moléculas. Ao
conjunto do núcleo e destes electrões vamos dar o nome de cerne iónico. As ligações
interatómicas envolvem então os electrões mais exteriores de cada átomo, os chamados electrões de valência, e o tipo particular de ligação quı́mica estabelecida entre
dois átomos depende basicamente das propriedades dos estados quânticos ocupados
por estes electrões.
As ligações quı́micas que garantem a coesão dos sólidos são, fundamentalmente,
de quatro tipos diferentes: iónico, covalente, de van der Waals (ou forças de dispersão de London) e metálico. Nas três primeiras categorias, os electrões responsáveis pela ligação permanecem localizados em regiões limitadas do espaço, normalmente na vizinhança do átomo a que originalmente pertenciam. Pelo contrário,
na ligação metálica os electrões de valência ficam muito fracamente ligados a cada
átomo, sendo relativamente fácil o movimento de átomo para átomo, após o estabelecimento da ligação. As funções de onda destes electrões deixam de estar
localizadas em torno de cada átomo, estendendo-se por todo o volume do metal.
A estas funções dá-se o nome de orbitais metálicas. Esta deslocalização das orbitais metálicas é responsável pelas elevadas condutividades térmica e eléctrica dos
metais, e por muitas outras das suas propriedades.
A disposição regular dos átomos nos sólidos cristalinos simplifica muito a sua
análise e por isso a Fı́sica do Estado Sólido avançou muito mais no estudo destes
sólidos que no dos sólidos amorfos ou poli-cristalinos. Neste curso, por esta razão,
abordaremos principalmente os sólidos cristalinos.
1.2
Breve resumo da Tabela Periódica
Antes de de iniciarmos o nosso estudo dos sólidos, justifica-se uma breve digressão
pelas propriedades das várias espécies quı́micas puras, e das ligações que entre elas
se estabelecem.
Os 106 elementos conhecidos estão ordenados na Tablea Periódica da esquerda
para a direita em número atómico crescente. Elementos na mesma coluna têm
propriedades fı́sicas e quı́micas semelhantes e os seus sólidos, em geral, são também
similares.
(a) Gases inertes
Os elementos da coluna VIII, designados por gases inertes, têm as suas orbitais de
valência completamente preenchidas. A sua inatividade quı́mica é atribuida facto do
hiato energético existente entre a energia das orbitais de valência e o nı́vel de energia
imediatamente superior ser relativamente grande. Assim, a configuração electrónica
destes átomos é particularmente estável, sendo por isso difı́cil o estabelecimento de
1.2. BREVE RESUMO DA TABELA PERIÓDICA
3
ligações quı́micas. Este facto pode ser ilustrado comparando os valores do raio
atómico de elementos de uma mesma linha da Tabela Periódica; com a excepção
da linha Hidrogénio-Hélio, os elementos que em cada linha apresentam os menores
valores do raio atómico são os da coluna VIII.
Os gases inertes assumem o estado sólido a temperaturas inferiores a ∼200 K. A
ligação quı́mica é efectuada, fundamentalmente, por meio de interacções de van der
Waals. Pequenas deformações da função de onda electrónica com momento dipolar
não nulo induzem dipolos eléctricos nos átomos vizinhos; os dipolos eléctricos assim
gerados atraem-se fracamente, aproximando os átomos até onde as interacções repulsivas cerne-cerne o permitirem, formando cristais compactos em que cada átomo
tem doze átomos vizinhos. Por exemplo, enquanto que o hélio solidifica a 0,95 K, o
rádon necessita apenas de uma temperatura de 202 K para atingir o estado sólido, o
que é compreensı́vel, já que este último dispõe de uma nuvem electrónica significamente maior, favorecendo o aparecimento de dipólos induzidos e forças de dispersão
de London mais intensas.
m
4p
15
ligações
covalentes
Figura 1.1: Diamante — Cada átomo de carbono estabelece quatro ligações covalentes
com átomos vizinhos, formando um tetraedro regular.
(b) Metais alcalinos
O estado fundamental dos átomos das outras colunas da tabela consiste na configuração electrónica de um gás inerte (que, juntamente com o núcleo, contitui o
cerne atómico), “adicionado”de um ou mais electrões em nı́veis de energia superiores. A configuração electrónica do cerne dos átomos numa linha da tabela consiste
na configuração do gás inerte da linha anterior.
Os metais alcalinos encontram-se nas colunas IA e IIA. Estes elementos têm um
ou dois electrões na orbital exterior s, fracamente ligados ao resto do átomo. Os
metais alcalinos solidificam a temperaturas que variam entre os 300 K e os 1 600 K.
Ao solidificarem, a função de onda dos electrões de valência estende-se a todo o
sólido e portanto estes podem mover-se livremente através do material. A mobilidade destes electrões de valência confere a estes sólidos excelentes propriedades
de condução térmica e eléctrica. À excepção do hidrogénio os elementos da coluna
IA são designados por metais alcalinos e os da coluna IIA são os metais alcalinos
terrosos.
(c) Colunas IIIB, IVB, VB, VIB e VIIB
Os átomos dos elementos destas colunas têm, na camada de valência, a orbital s
completamente preenchida e a p parcialmente preenchida. Ambas as orbitais não
sofrem influência significativa do cerne iónico.
4
CAPÍTULO 1. INTRODUÇÃO
Estes elementos têm propriedades fı́sicas variadas. O azoto, oxigénio, flúor e
cloro são gases à temperatura ambiente e solidificam a temperaturas inferiores a
100 K. Tanto o oxigénio como o azoto formam moléculas via ligações covalentes. Ao
solidificarem as restantes ligações são asseguradas por ligações de van der Waals
entre essas as moléculas. Todos os outros elementos à excepção do Bromo, que é
lı́quido à temperatura ambiente, são sólidos.
O alumı́nio, estanho e chumbo são metais. O arsénio, antimónio e bismuto têm
caracterı́sticas de metais mas não são metais tı́picos. Algumas formas alotrópicas
do carbono e telúrio são razoáveis condutores de calor e electricidade. O silı́cio
e germânio são semicondutores, ou seja, são isoladores a baixas temperaturas e
condutores a altas temperaturas. Todos os restantes elementos são isoladores.
À excepção dos metais, os elementos nestas colunas solidificam através de ligações covalentes. Na ligação covalente os electrões de ligação ocupam a região ao
longo da linha que junta os dois átomos, passando a ser partilhados pelos dois cernes iónicos. Estas ligações são bastante fortes e os electrões participantes ficam
confinados à zona cerne-cerne contribuindo para a baixa prestação de condução
eléctrica e térmica apresentadas por estas substâncias. Um átomo pode estabelecer ligações covalentes com um máximo de quatro átomos vizinhos. Neste caso as
ligações formam um tetraedro regular. A estrutura cristalina é menos densa que
a resultante de ligações de van der Waals. A forma alotrópica do carbono em diamante é um exemplo de um sólido com ligações covalentes tetraédrica, porém, a
cristalização do carbono em forma de grafite consiste em planos de ligações covalentes que envolvem três átomos (formando um hexágono), sendo a ligação interplanar
assegurada por meio de ligações de van der Waals (ver Figuras 1.1 e 1.2). Como
sabemos, estas duas formas de carbono têm propriedades bem diferentes.
ligações
covalentes
142 pm
350 pm
ligações de
van der Waals
Figura 1.2: Grafite — Os átomos de carbono formam planos hexagonais de ligações
covalentes entre três átomos vizinhos. As ligações entre planos são de van der Waals.
(d) Elementos de transição
A parte central da tabela que compreende as colunas IIIA, IVA, VA, VIA, VIIA
e VIIIA, contém os chamados elementos de transição. As orbitais de valência d
e f destes átomos são preenchidas por ordem crescente de energia. Verifica-se
que, não obstante as orbitais d terem energias comparáveis às orbitais s, o seu
pico de densidade de probabilidade está bastante mais perto do cerne iónico que
o pico de densidade de probabilidade das orbitais s. Assim, à semelhança dos
elementos da coluna IA e IIA, os electrões na orbital s tornam-se livres e conferem a
estes elementos propriedades que os caracterizam como os metais. Adicionalmente,
1.3. RESUMO DOS CAPÍTULOS SEGUINTES
5
electrões na orbital d formam ligações com átomos vizinhos, extremamente fortes
e de tipo covalente (e.g. de todos os metais de transição o volfrâmio é o mais
fortemente ligado). Os electrões nas orbitais f e d, apesar de não contribuirem
para propriedades metálicas destes elementos, dado estarem sobre forte influência
do cerne, tomam um papel importante quando parcialmente preenchidas, sendo
“responsáveis”pelas propriedades magnéticas de alguns destes elementos.
(e) Os metais nobres
Os metais nobres, nas colunas IB e IIB, são em muitos aspectos semelhantes aos
metais alcalinos. Têm a orbital d completamente preenchida e a orbital s com um
ou dois electrões.
1.3
Resumo dos capı́tulos seguintes
O próximo capı́tulo lança as bases para o estudo dos cristais, introduzindo os conceitos de rede cristalina e base, e define a notação matemática usada neste domı́nio.
O Capı́tulo 3 trata a difracção de radiação por redes cristalinas, sendo superficialmente abordada a difracção por cristais. O Capı́tulo 4 expande o modelo cristalino
por forma a incluir as vibrações atómicas e algumas consequências destas vibrações
são estudadas, usando os formalismos clássico e quântico. No Capı́tulo 5, estudamse as propriedades dos metais supondo os electrões de valência livres. Finalmente,
o Capı́tulo 6 trata os electrões de valência nos condutores, introduzindo a Teoria de
Bandas.
Capı́tulo 2
Elementos de Cristalografia
Neste capı́tulo, vamos introduzir a linguagem e os conceitos básicos utilizados no
estudo dos cristais. Os tópicos aqui abordados serão usados ao longo de todo o
curso e é, por isso, importante que sejam bem apreendidos.
2.1
Cristais ideais e cristais reais
Como foi dito no capı́tulo anterior, os átomos dos sólidos cristalinos ocupam posições
dispostas regularmente, formando padrões que se repetem espacialmente em todas
as direcções. A esta estrutura dá-se o nome de cristal.
Em rigor, os cristais reais não podem satisfazer esta definição, porque uma
periodicidade absoluta é impossı́vel. Com efeito, as impurezas quı́micas, os defeitos
fı́sicos no padrão de repetição, as oscilações térmicas, e até mesmo as fronteiras dos
cristais reais destroem essa periodicidade. Reservamos então aquela definição para
os cristais ideais, que serão então corpos infinitos, absolutamente puros do ponto
de vista quı́mico, com átomos “congelados” nas suas posições de equilı́brio, etc,
considerando os cristais reais aproximações mais ou menos razoáveis daqueles.
2.2
A estrutura cristalina
Matematicamente, um cristal ideal pode ser descrito como um conjunto de átomos
dispostos numa rede definida por três vectores linearmente independentes a, b,
c, chamados vectores fundamentais de translação, tais que o arranjo atómico é,
em todos os aspectos, semelhante quando observado de dois pontos com vectores
posição r e r 0 , relacionados através de
r 0 = r + ha + kb + lc,
(2.1)
com h, k e l inteiros arbitrários. Com r fixo, ao conjunto de pontos que se obtem
variando h, k, e l na equação (2.1) dá-se o nome de rede cristalina, ou de Bravais.
De acordo com as definições apresentadas, não podemos confundir os conceitos
de cristal e de rede cristalina. Esta é uma abstracção matemática que consiste num
conjunto de pontos idênticos, dispostos regular e periodicamente no espaço, ao passo
que o cristal é formado por um conjunto de átomos, que podem nem ser todos da
mesma espécie quı́mica, como é o caso do cloreto de sódio. A estrutura do cristal
pode ser gerada sobrepondo a cada ponto da rede cristalina uma base (ou motivo)
de átomos, idêntica para todos os pontos da rede. Assim, a relação entre cristal,
rede cristalina e motivo pode ser simbolizada como
rede + motivo = cristal.
7
8
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
Vejamos o seguinte exemplo para nos ajudar a sedimentar este novo conceito. Na
Figura 2.1 está representado um cristal composto por três átomos diferentes. Este
cristal pode ser recriado colocando uma réplica do motivo de três átomos junto a
cada um dos pontos da rede.
motivo
ponto
da rede
cristal=rede+motivo
(a)
(b)
Figura 2.1: (a) base de três átomos; (b) cristal. Em cada ponto da rede é colocado
a base de átomos de modo a formar o cristal.
Uma outra abordagem, ilustrada com o seguinte exemplo bi-dimensional, consiste em determinar a rede a partir do cristal: a Figura 2.2 representa uma estru-
b’
b
a’
y
x
(a)
a
(b)
Figura 2.2: Exemplo de um cristal bi-dimensional.
tura cristalina bi-dimensional, formada por átomos de duas espécies, “•” e “◦”. De
acordo com a definição apresentada, os vectores fundamentais são tais que qualquer combinação linear com coeficientes inteiros destes vectores é igual à diferença
entre as posições de dois pontos equivalentes no cristal. Logo, os vectores x e y
representados na figura não são vectores fundamentais, porque unem pontos não
equivalentes (a posição de um átomo “•” e de um outro “◦”). A figura da direita
representa duas possibilidades de escolha de vectores fundamentais (a, b e a0 , b0 ),
a rede cristalina por eles gerada e os motivos correspondentes.
Chamam-se vectores da rede cristalina aos vectores que unem dois quaisquer
pontos da rede. No exemplo que acabámos de apresentar, a, b, a0 , b0 são vectores
da rede, mas o mesmo não acontece com x ou com y. Se qualquer vector da rede
2.3. TIPOS DE REDES CRISTALINAS
9
puder ser escrito como combinação linear, com coeficientes inteiros, dos vectores
fundamentais, então estes dizem-se vectores fundamentais primitivos. No exemplo
apresentado, a0 e b0 são vectores fundamentais primitivos, ao passo que a e b não
o são. Para verificar esta última preposição basta ver que, por exemplo, o vector b0
é uma combinação linear de a e b, mas com coeficientes fraccionários:
b0 =
1
1
a + b.
2
2
(2.2)
Ao paralelogramo formado pelos vectores fundamentais dá-se o nome de célula
unitária. Se os vectores fundamentais forem, além disso, primitivos, a célula unitária
por eles formada chama-se célula unitária primitiva. Em rigor, esta definição dá-nos
apenas um exemplo de célula unitária primitiva. Uma definição formal é a seguinte:
Célula unitária primitiva é uma porção de espaço que, copiada através
de translações geradas por todos os vectores da rede, preenche todo o
volume da rede cristalina, sem sobreposições ou espaços vazios.
Desta definição deduz-se facilmente que uma célula unitária primitiva contém um,
e apenas um, ponto de rede. Se n for a densidade espacial destes pontos (isto é, o
número de pontos por unidade de volume) e v for o volume de uma célula unitária
primitiva, então temos que nv = 1 e logo v = 1/n. Como este resultado é válido
qualquer que seja a célula unitária primitiva (isto é, quaisquer que sejam os vectores
fundamentais primitivos usados para a construir), concluı́mos que todas as células
unitárias primitivas têm o mesmo volume.
Acabámos de ver que podemos construir uma célula unitária primitiva com o
paralelogramo definido por um conjunto de vectores fundamentais primitivos. Uma
outra possibilidade é a seguinte: unimos com segmentos de recta um dado ponto de
rede a todos os seus vizinhos mais próximos; a região do espaço limitada pelos planos
bissectores destes segmentos é uma célula unitária primitiva. As células construı́das
desta forma chamam-se células unitárias primitivas de Wigner-Seitz. Note-se que,
para a definição da células de Wigner-Seitz, não é necessário escolher um conjunto
de vectores fundamentais primitivos; assim, a sua forma depende apenas do tipo de
rede, ao contrário do que acontece com as células unitárias mais usuais definidas
a partir do paralelogramo formado pelos vectores cristalográficos. A Figura 2.3
representa o processo de construção de uma destas células.
Figura 2.3: Célula unitária primitiva de Wigner-Seitz.
2.3
Tipos de redes cristalinas
A classificação das redes cristalinas faz-se em termos das operações de simetria que
cada uma aceita. Assim, e por exemplo, as redes cúbicas são aquelas que ficam
10
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
inalteradas sob rotações de π2 em torno de certas direcções. Não faremos aqui
este tipo de estudo por não ter uma importância fundamental no que se segue,
neste curso de nı́vel introdutório. Faremos apenas uma descrição geométrica dos
diferentes tipos de rede. Designamos por a, b e c os vectores fundamentais da rede,
c
α
b γ
β
a
Figura 2.4: Vectores e ângulos fundamentais.
por a, b e c os seus módulos e por α, β e γ os ângulos entre eles, definidos de acordo
com o esquema da Figura 2.4. Às quantidades a, b, c, α, β e γ dá-se o nome de
parâmetros da rede cristalina.
(a) Redes cúbicas
De todos os tipos de redes cristalinas, o mais simples de visualizar é o cúbico,
caracterizado em geral por
a=b=c
α = β= γ =
(2.3)
π
.
2
(2.4)
b
β
γ α
a
c
Há três subespécies da rede cúbica: a rede cúbica simples, cujos pontos estão
dispostos como os vértices de cubos iguais, arrumados contiguamente; a rede cúbica
de corpo centrado, que, além dos pontos que constituem a rede cúbica simples,
contém ainda um ponto no centro do corpo de um dos cubos que referimos; e a rede
cúbica de faces centradas, que é formada pelos pontos que formam a rede cúbica
simples, e contém ainda um ponto no centro das faces daqueles cubos.
(b) Redes tetragonais
Se comprimirmos ou alongarmos uma rede cúbica numa das suas direcções fundamentais, obtemos uma rede do tipo chamado rede tetragonal. Nesta, os pontos
dispõem-se nos vértices de prismas rectos de base quadrada (variante simples) e nos
centros dos corpos destes prismas (variante de corpo centrado). As redes tetragonais são então caracterizadas por
a = b 6= c
(2.5)
π
α = β= γ = .
2
(2.6)
b
a
c
Note-se que as redes tetragonais não apresentam a variante de faces centradas.
(c) Redes ortorrômbicas
As chamadas redes ortorrômbicas são as que se obtêm deformando a rede cúbica
segundo duas das suas direcções fundamentais. Os ângulos fundamentais são ainda
todos iguais a π2 , mas os módulos dos vectores fundamentais são diferentes entre si,
ou seja,
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
a 6= b 6= c
(2.7)
π
α = β= γ = .
2
(2.8)
b
β
γ α
a
11
c
Este tipo de rede cristalina apresenta as três variantes simples, de corpo centrado
e de faces centradas, e ainda uma quarta, chamada rede de bases centradas, que é
formada por pontos nos vértices de paralelipı́pedos iguais dispostos contiguamente
e dois pontos, nos centros de duas faces opostas.As deformações que aplicámos até
agora à rede cúbica, para obtermos as redes tetragonais e ortorrômbicas, têm a
propriedade de manter os ângulos α, β e γ iguais a π2 . Vamos agora apresentar
outras possibilidades.
(d) Redes monoclı́nicas
Deformemos uma rede ortorrômbica, por forma a alterar o valor de γ, deixando
os outros parâmetros inalterados. Obtemos assim uma rede do tipo chamado rede
monoclı́nica, que apresenta apenas as variantes simples e de bases centradas. As
relações entre os parâmetros, neste tipo de rede, são:
a 6= b 6= c
π
α = β= 6= γ.
2
(2.9)
α
γ β
b
(2.10)
a
c
(e) Redes triclı́nicas
Finalmente, consideremos agora a rede cristalina mais geral, no sentido em que
menos constrangimentos impomos aos parâmetros de rede. A rede triclı́nica fica
definida por
a 6= b 6= c
α 6= β6= γ 6=
β
(2.11)
π
.
2
b
(2.12)
γ
α
a
c
Há ainda que considerar dois tipos particulares de rede, que são casos particularmente importantes dos que já mencionámos.
(f) Redes trigonais
A rede trigonal pode obter-se por deformação da rede cúbica na direcção de uma
das diagonais principais. É caracterizada por
a=b=c
(2.13)
2
α = β= γ < π.
3
(2.14)
(g) Redes hexagonais
São casos particulares da rede monoclı́nica, em que γ = 32 π. Assim, verificam
a =
α
2.4
=
b 6= c
π
β= ,
2
(2.15)
γ=
2
π.
3
(2.16)
Exemplos de estruturas cristalinas
Nesta secção apresentaremos exemplos das estruturas cristalinas apresentadas por
algumas substâncias quı́micas.
12
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
(a) Redes cúbicas simples
Este tipo de estrutura não é energeticamente favorável para substâncias simples, e
por isso poucos elementos a adoptam. O único exemplo é o polónio, na forma α. Em
contrapartida, há vários compostos que apresentam redes cristalinas do tipo cúbico
simples, como, por exemplo, o cloreto de césio, CsCl. Nos cristais de cloreto de césio,
os átomos de uma espécie ocupam as posições definidas pela rede cúbica simples,
enquanto que os da outra ocupam os centros dos corpos da célula unitária. Note-se
que isto não define a rede como sendo cúbica de corpo centrado, porque os átomos de
cloro e de césio são diferentes. Assim, não podem ocupar, ambos, posições da rede
cristalina, que, por definição, é um conjunto de pontos equivalentes. A Tabela 2.1
apresenta alguns compostos que cristalizam numa estrutura cúbica simples.
Substância
CsCl
CsBr
CsI
TlCl
TlBr
TlI
a (Å)
4,11
4,29
4,56
3,84
3,97
3,74
Substância
NH4 Cl
CuZn
AgMg
LiHg
AlNi
BeCu
a (Å)
3,87
2,94
3,28
3,29
2,88
2,70
Tabela 2.1: Alguns compostos que cristalizam em redes cúbicas simples. Também é
apresentado o valor do parâmetro de rede a.
(b) Redes cúbicas de faces centradas
A rede cúbica de faces centradas é uma das redes que apresenta empacotamento
máximo (ver adiante nesta secção) e por isso muitos elementos apresentam estruturas cristalinas deste tipo. Na Tabela 2.2 apresentam-se algumas substâncias (tanto
elementos como compostos) que cristalizam em redes cúbicas simples. O silı́cio e o
Elemento
Cu
Ag
Au
Al
a (Å)
3,61
4,08
4,07
4,04
Composto
NaCl
LiF
KCl
LiBr
a (Å)
5,63
4,02
6,28
5,49
Tabela 2.2: Substâncias que cristalizam em redes cfc.
germânio (muito importantes na industria de semi-condutores) cristalizam também
na rede cúbica de faces centradas, com valores para o parâmetro de rede a de 5,43 Å
e 5,45 Å, respectivamente. Um outro exemplo importante é o carbono, na forma
de diamante. A estrutura cristalina do diamante pode ser gerada associando a
cada ponto de uma rede cúbica de faces centrada um motivo constituı́do por dois
átomos de carbono com coordenadas fraccionárias(a) (0,0,0) e ( 14 , 14 , 14 ). O valor do
parâmetro de rede do diamante é a = 3, 56 Å.
(c) Redes cúbicas de corpo centrado
Os metais alcalinos cristalizam todos em redes cúbicas de corpo centrado. Na
Tabela 2.3 resumem-se as propriedades da rede cristalina de alguns elementos que
apresentam esta estrutura.
(a) Mais
adiante serão introduzidas estas coordenadas. Para os presentes efeitos, é suficiente
saber que um ponto cujas coordenadas fraccionárias são (q, r, s) ocupa uma posição definida por
q a + rb + sc relativamente a uma origem convenientemente escolhida.
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
Elemento
Li
Na
K
Rb
Cs
Ba
a (Å)
3,50
4,28
5,25
5,69
6,08
5,01
Elemento
V
Nb
Ta
Cr
Mo
W
13
a (Å)
3,03
3,29
3,29
2,88
3,14
3,16
Tabela 2.3: Alguns elementos que cristalizam em redes do tipo ccc.
(d) Redes de empacotamento máximo
Em muitos metais e nos sólidos inertes, a ligação quı́mica é tal que favorece uma
grande proximidade entre os átomos envolvidos. Nestes casos, as posições ocupadas
pelos átomos podem ser visualizadas imaginando-os como esferas rı́gidas, encostadas
umas às outras por forma a minimizar o volume intersticial. Nestas condições diz-se
que a rede cristalina é de empacotamento máximo. Há dois tipos de redes de empacotamento máximo: a rede cúbica de faces centradas e a chamada rede hexagonal
compacta. Para compreendermos a razão de existirem apenas estas duas espécies,
analisemos a Figura 2.5. Nela, está representado um plano de esferas iguais, dispos-
B
C
B
B
A
A
C
C
B
A
C
A
A
C
B
B
A
A
ABA
ABC
Figura 2.5: As duas possibilidades para o empacotamento máximo.
tas contiguamente, formando uma rede bi-dimensional hexagonal. Para formarmos
um cristal tri-dimensional, devemos colocar, sobre o plano representado à esquerda,
outros planos semelhantes. Para maximizar o volume ocupado, os centros das esferas do “segundo andar” deverão ficar nas verticais dos pontos B ou, em alternativa,
dos pontos C. Suponhamos que se verifica a primeira possibilidade. Analisemos
agora as possibilidades de colocação de um terceiro andar. Os centros das esferas
desta nova camada devem ocupar posições nas verticais dos espaços intersticiais do
segundo andar, ou seja, as verticais dos pontos A (dizendo-se então que se trata
de um empacotamento do tipo ABABA . . .) ou, alternativamente, as verticais dos
pontos B (empacotamento do tipo ABCABC . . .). As duas possibilidades estão
representadas à direita na Figura 2.5. As redes com empacotamento do tipo ABC
são, de facto, redes cúbicas de faces centradas, em que o plano apresentado na Figura 2.5 à esquerda é um plano perpendicular a uma direcção diagonal principal; as
redes com empacotamento do tipo ABA são redes hexagonais compactas (ver a Figura 2.6). A rede hexagonal compacta não é, no sentido estrito, uma rede cristalina,
pois os pontos que a formam não são todos equivalentes, como está patente na Figura 2.6: os pontos do plano central não são equivalentes aos das bases. No entanto,
é uma estrutura apresentada por um número relativamente grande de substâncias
quı́micas, e por essa razão a incluı́mos nesta discussão. Para que uma “rede” hexagonal compacta seja uma estrutura de empacotamento máximo, a relação entre os
14
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
c
b
a
Figura 2.6: A rede hexagonal compacta.
módulos dos vectores fundamentais a, b e c é
a = b
c = 1, 63a.
(2.17)
(2.18)
Dados relativos a alguns elementos que cristalizam na rede hexagonal compacta
estão apresentados na Tabela 2.4
Elemento
Be
Ce
He (2K)
Mg
Ti
Zn
a (Å)
2,29
3,65
3,57
3,21
2,95
2,66
c (Å)
3,58
5,96
5,83
5,21
4,69
4,95
c/a
1,56
1,63
1,63
1,62
1,59
1,86
Tabela 2.4: Elementos com rede hexagonal compacta.
(e) Outras estruturas — Exemplos com elementos
Na Tabela 2.5 resumimos propriedades da rede cristalina de elementos que cristalizam em redes trigonais, ortorrômbicas e tetragonais.
Elemento
Hg (5K)
Bi
In
Sn (branco)
Ga
Cl (113K)
Tipo de rede
Trigonal
Trigonal
Tetragonal
Tetragonal
Ortorrômbica
Ortorrômbica
a
2,99
4,75
4,59
5,82
4,51
6,24
b
—
—
—
—
4,52
8,26
c
—
—
4,94
3,17
7,64
4,48
θ
70◦ 450
57◦ 140
—
—
—
—
Tabela 2.5: Alguns elementos com redes trigonais, tetragonais e ortorrômbicas. Os
módulos dos vectores fundamentais são indicados em Å. Os valores redundantes não
estão explicitados.
2.5. DIRECÇÕES E PLANOS CRISTALINOS
2.5
15
Direcções e planos cristalinos
Como já foi dito, qualquer vector da rede, R, pode ser escrito como uma combinação
linear inteira(b) dos vectores a, b, c de um conjunto fundamental primitivo, isto é,
R = ha + kb + lc,
h, k, l ∈ Z,
(2.19)
onde Z designa o conjunto dos números inteiros. Como é evidente, se o conjunto
de vectores a, b, c for um conjunto fundamental não primitivo, esta equação só
pode manter-se, qualquer que seja o vector de rede R, se permitirmos que h, k e
l possam tomar valores racionais não inteiros. Em qualquer caso, os vectores de
um conjunto fundamental formam uma base natural para a descrição geométrica e
analı́tica do cristal. Devemos, no entanto, ter em atenção que, por norma, esta base
não é ortonormada e que, portanto, muitas igualdades elementares da geometria
analı́tica de uso comum não são aqui aplicáveis.
Os cristalógrafos desenvolveram uma notação, baseada na utilização de bases
formadas com vectores fundamentais, que permite especificar facilmente posições,
direcções e planos num cristal, que vamos passar a descrever.
Chamam-se direcções cristalinas a direcções definidas por dois pontos da rede
cristalina. Consideremos um vector de rede R que une dois pontos contı́guos numa
dada direcção (ver a Figura 2.7). De acordo com a equação (2.19), existem três
números inteiros (ou, quando muito, racionais) h, k, l, tais que
b
a
Figura 2.7: Exemplo de direcção cristalina.
R = ha + kb + lc.
(2.20)
Eliminando factores racionais comuns, obtemos três números inteiros r, s e t, que
identificam a direcção (cristalina) do vector R, como sendo a do vector ra + sb + tc.
Estes três números, na notação cristalográfica que iremos adoptar, apresentam-se
entre parêntesis rectos e sem quaisquer separadores (vı́rgulas, espaços, etc.) entre
eles, como em [rst]. Se algum destes inteiros for negativo, o sinal deve ser colocado
sobre, e não atrás, do ı́ndice respectivo, como em [121]. Por exemplo, a direcção da
diagonal principal numa rede cúbica (isto é, aquela que passa no centro do corpo
da célula unitária, partindo da sua origem) fica identificada por [111].
Tal como as direcções cristalinas são as definidas por dois pontos da rede, planos
cristalinos são os definidos por três pontos da rede cristalina. Devido à regularidade da rede, um dado plano cristalino contém, para além dos três pontos de rede
que o definem, um número infinito de outros pontos de rede, que formam, nesse
plano, uma rede cristalina bidimensional. Também por causa desta regularidade, é
possı́vel, dado um qualquer plano cristalino, definir uma infinidade de outros planos
(b) Daqui em diante, usaremos esta expressão referindo-nos a uma combinação linear com coeficientes inteiros.
16
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
cristalinos, paralelos ao primeiro. Os ı́ndices de Miller são uma forma prática de
especificar a orientação de uma destas famı́lias de planos cristalinos paralelos. Para
uma dada famı́lia definem-se da seguinte forma:
c
c/l
a/h
a
b/k
b
Figura 2.8: Plano cristalino com ı́ndices (hkl).
(a) tomando, na famı́lia considerada, o plano que mais se aproxima da origem da
célula unitária, determinam-se as distâncias que a separam dos pontos em que
o plano escolhido intersecta as direcções dos vectores fundamentais a, b e c,
e exprimem-se estas distâncias em unidades de a, b e c, respectivamente;
(b) tomam-se os inversos dos resultados obtidos no primeiro ponto e reduzem-se
a três inteiros nas mesmas proporções relativas, tendo o cuidado de eliminar eventuais(c) factores comuns. O resultado é apresentado entre parêntesis
curvos, sem separadores.
Para o plano apresentado na Figura 2.8, os ı́ndices de Miller são (hkl), se os inteiros
h, k e l não tiverem divisores comuns. Também para os ı́ndices de Miller se segue
a convenção de colocar os sinais “-” sobre os ı́ndices negativos. Assim, se para uma
dada famı́lia de planos resultarem os valores 2, -3, 1 para os ı́ndices de Miller, o
resultado deve ser apresentado como (231). Se um dado plano é paralelo a um dos
eixos fundamentais, então não o intersecta, obviamente; o valor do ı́ndice de Miller
correspondente é, por definição, 0 (zero).
Por exemplo, a famı́lia de planos paralela ao plano definido pelos vectores fundamentais a e b tem ı́ndices de Miller (001); os ı́ndices de Miller da famı́lia de planos
paralela ao que contém as extremidades dos vectores a, b e c são (111); um plano
que contenha os pontos cujos vectores posição a, b/2(d) , 2c (ver figura 2.9) pertence
a uma famı́lia com os ı́ndices de Miller (241). Analisemos este caso em detalhe. O
plano em questão cruza os eixos fundamentais em pontos que estão a distâncias a,
b/2 e 2c da origem. Passa assim, em particular, num ponto de rede cujo vector
posição é 2c. Mas existem, nesta famı́lia de planos, elementos mais próximos da
origem. Com efeito, existe um plano cristalino, paralelo ao que estamos a considerar, que passa no ponto cujo vector posição é c, e é este plano que, pela sua maior
proximidade à origem, deve ser usado na construção da definição dos ı́ndices de
Miller. Este plano cruza os eixos cristalográficos em pontos que estão a distâncias
a/2, b/4 e c da origem. Usando como unidades para estas distâncias os módulos
(c) Pode demonstrar-se que, se se usar na construcção dos ı́ndices de Miller o plano que mais se
aproxima da origem, os ı́ndices obtidos não têm divisores comuns.
(d) Note-se que o ponto cujo vector posição é b/2 não é um ponto de rede. No entanto, o plano
em questão é de facto um plano de rede, pois contém os pontos da rede cujos vectores posição são
a, 2c, b − 2c.
2.6. DISTÂNCIA INTERPLANAR
17
c
a
b
Figura 2.9: Dois planos da famı́lia (241). O triângulo maior representa o plano que
corta os eixos cristalográficos nos pontos a, b/2, 2c; o triângulo menor representa o
plano que deve ser usado na determinação dos ı́ndices de Miller.
dos vectores vectores fundamentais correspondentes, obtemos os números racionais
1/2, 1/4 e 1; os inversos destes números são 2, 4 e 1, e portanto esta famı́lia de
planos tem os ı́ndices de Miller (241), como se afirmou.
2.6
Distância interplanar
No próximo capı́tulo veremos que a distância entre dois planos consecutivos de
uma famı́lia de planos paralelos é um parâmetro muito importante no estudo da
difracção de radiação pelos cristais. Vamos por esta razão determiná-la de seguida.
Na Figura 2.10 estão representados os vectores fundamentais de uma rede cristalina
e dois planos de uma famı́lia cujos ı́ndices são (hkl). Pretendemos determinar a
distância interplanar dhkl . Atendendo à figura da esquerda (desenhada segundo
c
c
dhkl
P3
P3
G’
θ
O
H
P1
P2
a
a
P1
F
b
Figura 2.10: Distância interplanar dos planos (hkl).
a direcção do vector b para a manter compreensı́vel), notamos que a distância
requerida é igual ao comprimento da projecção do segmento OP1 segundo a direcção
do vector G0 , que é escolhido perpendicular à famı́lia de planos (hkl). De acordo
com a definição dos ı́ndices de Miller, o segmento OP1 tem comprimento a/h, e,
portanto, dhkl = a/h cos θ. Podemos dar a esta igualdade uma forma mais prática
usando o produto interno entre os vectores a e G0 :
dhkl =
a G0
·
,
h |G0 |
(2.21)
onde G0 pode ser qualquer vector perpendicular ao plano (hkl). Uma forma simples
de construir G0 é formando o produto vectorial de dois vectores não colineares deste
plano, por exemplo os vectores H e F representados na Figura 2.10 à direita. Estes
18
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
dois vectores, escritos como combinações lineares dos vectores fundamentais, são
b a
−
k
h
c b
=
− ,
l
k
F
= P2 − P1 =
(2.22)
H
= P3 − P2
(2.23)
onde representámos por Pk os vectores posição dos pontos Pk (k = 1, 2, 3). Fazendo
o produto externo destes dois vectores resulta
G0 = F × H =
1
1
1
a×b +
b×c +
c × a,
hk
kl
lh
(2.24)
e, substituindo em (2.21), obtemos
dhkl =
a · (b × c)
.
hkl|G0 |
(2.25)
Finalmente, notamos que o produto misto no numerador da fracção em (2.25) é
igual ao volume da célula unitária definida pelos vectores fundamentais a, b e c,
que representaremos por τ . Introduzindo o vector Ghkl , dado por
Ghkl = hkl
2π 0
2π
2π
2π
G = l
a×b + h
b×c + k
c × a,
τ
τ
τ
τ
(2.26)
obtém-se para a distância interplanar, por fim,
dhkl =
2π
.
|Ghkl |
(2.27)
Esta expressão será usada no próximo capı́tulo, no estudo da difracção de radiação
por cristais, onde também será discutida a importância dos vectores com a forma
de Ghkl (eq. 2.26), chamados vectores da rede recı́proca.
Uma vez determinada distância entre famı́lia de planos vamos agora analisar a
densidade de pontos contidos em cada plano, i.e. o número de pontos por unidade
de área da famı́lia de planos (hkl).
Considere uma célula unitária formada por três vectores da rede. Dois destes
vectores, u e v estão contidos num plano da famı́lia (hkl) (ver a Figura 2.11); o
terceiro vector, w, está ligado a um plano adjacente da mesma famı́lia. Note-se que
a célula unitária assim construida contém apenas um ponto de rede e portanto é,
de facto, primitiva. O volume da célula formada por este três vectores é, como já
foi demonstrado, igual a τ . Este volume também é igual ao volume formado pelos
vectores u e v e um terceiro (que em geral não é vector da rede) de módulo igual à
distância interplanar, dhkl , perpendicular aos planos (hkl), e que une os dois planos
adjacentes. Deste modo, temos que
τ = A dhkl ,
e sendo o número de pontos da rede por unidade de área dado por
1
,
A
em que A é a área formada pelos vectores a e b, obtemos que a densidade de pontos
num plano (hkl) vem dada por
1
dhkl
=
.
A
τ
2.7. COORDENADAS FRACCIONÁRIAS
19
(hkl)
w
d hkl
v
A
u
(hkl)
Figura 2.11: Construcção para o cálculo da densidade de pontos de rede nos planos
de uma famı́lia (hkl).
2.7
Coordenadas fraccionárias
Estudámos até agora vários conceitos úteis no estudo das redes cristalinas, mas
pouco foi dito sobre os motivos, ou bases, que associados a estas redes, formam os
cristais reais.
Tal como as redes cristalinas, os motivos podem ser classificados em categorias
gerais, segundo as transformações geométricas que aceitam como transformações de
simetria. No entanto, este assunto é não será abordado neste curso, por não ser
absolutamente indispensável para o estudo que se segue. O que sim é necessário é
introduzir uma notação que permita a especificação das posições dos átomos que
formam o motivo. Esta questão surge porque porque os átomos que formam o motivo ocupam, em geral, posições não coincidentes com as dos pontos que formam a
rede cristalina; o seu vector posição não é pois, necessariamente, um vector da rede,
ou seja, uma combinação linear inteira dos vectores fundamentais. Independentemente deste facto, usamos a base dos vectores fundamentais da rede cristalina para
representar os vectores posição destes átomos, que, assim, podem apresentar coordenadas não inteiras, ou fraccionárias. Note-se que o mesmo acontece para alguns
pontos da rede cristalina, sempre que os vectores fundamentais escolhidos para a
representar forem não primitivos.
Por exemplo, usando vectores os fundamentais convencionais para a rede cúbica
de corpo centrado, as coordenadas do ponto central são ( 12 , 12 , 21 ). A rede cristalina
do diamante é cúbica de faces centradas. Os pontos de rede de uma célula unitária
convencional têm pois coordenadas (0, 0, 0), ( 12 , 12 , 0), ( 12 , 0, 21 ), (0, 12 , 12 ).
Quando se usam para especificar a posição de pontos de rede numa célula
unitária (não primitiva), as coordenadas fraccionárias têm origem num vértice da
célula unitária; mas, quando se usam para indicar as posições dos átomos que formam o motivo, têm origem em cada ponto ponto da rede cristalina. Assim, por
exemplo para o diamante, o motivo é formado por dois átomos, com coordenadas
(0, 0, 0) e ( 41 , 41 , 14 ); para se obter um cristal de diamante, devemos sobrepor, em cada
um dos quatro pontos de rede que referimos no parágrafo anterior, dois átomos de
carbono, com estas coordenadas, relativamente a uma origem escolhida sobre cada
um daqueles pontos.
20
2.8
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
Defeitos
A descrição dos sólidos que foi apresentada neste capı́tulo é apenas uma idealização.
Os cristais reais apresentam as regularidades mencionadas apenas de forma aproximada, apresentando sempre um número apreciável de imperfeições ou defeitos, isto
é, de desvios à regularidade cristalina.
Há vários tipos de defeitos cristalinos. Por exemplo, um átomo de espécie
quı́mica diferente da dos que formam o cristal (como é o caso, muito útil, dos
semicondutores “dopados”, do tipo “p” ou “n”),uma posição de rede desocupada,
ou um átomo numa posição não definida pela rede. As próprias fronteiras do cristal
são defeitos cristalinos, na medida em que quebram a periodicidade do cristal.
Vamos agora estudar um pouco mais detalhadamente os principais tipos de
defeitos cristalinos.
(1) Vibrações dos átomos do cristal
Os átomos que formam os cristais encontram-se permanentemente animados de
um movimento de oscilação em torno de posições de equilı́brio, que correspondem
às posições definidas pela estrutura cristalina. A este movimento dá-se o nome
de agitação térmica. A amplitude destas oscilações diminui quando se baixa a
temperatura, mas não se anula nunca, mantendo-se mesmo no zero absoluto da
temperatura, como consequência do princı́pio de incerteza de Heisenberg.
(2) Imperfeições pontuais
Imperfeições pontuais são irregularidades que se verificam em pontos isolados, e há
três espécies principais. As lacunas, as imperfeições intersticiais e as impurezas.
Uma lacuna é uma posição da estrutura cristalina que se encontra desocupada. Uma
imperfeição intersticial corresponde a um átomo que ocupa uma posição não prevista
na estrutura cristalina. Um átomo de um cristal pode, sob certas circunstâncias(e) ,
abandonar a sua posição na estrutura cristalina (fazendo assim surgir uma lacuna)
e fixar-se numa posição intersticial. A estes pares lacuna-interstı́cio dá-se o nome
de pares de Frenkel.
Nos cristais iónicos, as lacunas devem sempre aparecer aos pares, por forma a
manter a neutralidade eléctrica do cristal. Estes pares de lacunas têm o nome de
pares de Shottky. (f)
As impurezas são átomos de espécie quı́mica diferente da dos que formam o
cristal. Os átomos contaminantes podem ocupar posições da estrutura cristalina,
substituindo assim os átomos originais, tomando o nome de impurezas substitucionais, ou ocupar posições que não estão definidas na estrutura, sendo então conhecidas como impurezas intersticiais. Por exemplo, o aço é uma solução de carbono
em ferro, constituindo os átomos de carbono impurezas intersticiais na estrutura
cristalina definida pelos átomos de ferro. Em contrapartida, o latão é uma liga de
cobre e de zinco, onde os átomos de zinco substituem os de cobre nalgumas posições,
constituindo assim impurezas substitucionais de um cristal de cobre.
O funcionamento dos dispositivos semicondutores comuns, como os transı́stores
ou os diodos, baseia-se na presença de impurezas substitucionais. Estes dispositivos
consistem num cristal, normalmente de silı́cio ou de germânio, dividido em duas
(no caso dos diodos) ou três (no caso dos transı́stores) regiões com impurezas substitucionais de tipo “n” (que consistem em átomos com um electrão de valência a
mais do que os os átomos vizinhos) ou de tipo “p” (cujos átomos têm um electrão
de valência a menos).
(e) Por
exemplo, mediante um aquecimento excessivo.
cristais do tipo NaCl, evidentemente; nos casos de cristais do tipo AB2 , como o cloreto
de cálcio (CaCL2 ), a neutralidade eléctrica só pode ser assegurada através de “ternos” de lacunas
— uma de A por cada duas de B.
(f) Para
2. Problemas
21
(3) Imperfeições lineares
Nas imperfeições lineares, os átomos que quebram a simetria cristalina dispõem-se
ao longo de uma linha. Os exemplos mais importantes são as chamadas deslocações.
Estas imperfeições podem ser o resultado de deformações do cristal, e verificam-se
quando um plano cristalino se desloca sobre outro. Na Figura 2.12 está representada uma deslocação e o modo como as deformações do cristal podem fazer surgir
deslocações. Há ainda outros tipos de deslocações mas não os estudaremos aqui.
F
Deslocaçao
Figura 2.12: Deslocações cristalinas.
(4) Imperfeições superficiais
As imperfeições superficiais são superficı́cies de separação entre regiões distintas
dos cristais. Por exemplo, nos cristais de ferro é energeticamente favorável o alinhamento dos momentos magnéticos dos átomos. No entanto, a agitação térmica
contraria esta tendência de alinhamento. Assim, à temperatura ambiente, os cristais
de ferro encontram-se usualmente divididos em regiões, chamadas domı́nios ferromagnéticos, onde os momentos magnéticos dos átomos têm a mesma orientação,
sendo diferente de domı́nio para domı́nio. As superfı́cies(g) que separam estes
domı́nios constituem imperfeições superficiais.
As próprias fronteiras dos cristais constituem, como já foi dito, defeitos, que
podem ser classificados também como imperfeições superficiais.
PROBLEMAS
2.1 Considere um cristal bidimensional semelhante a um tabuleiro de xadrez.
(a) Determine dois conjuntos de vectores fundamentais não primitivos.
(b) Determine dois conjuntos de vectores fundamentais primitivos.
(c) Represente graficamente as células unitárias e os motivos associados aos
conjuntos de vectores fundamentais determinados em (a) e em (b).
2.2 Considere a estrutura atómica plana ilustrada na figura, composta por átomos do
tipo A, B e C:
(a) Determine um conjunto de vectores fundamentais primitivos.
(b) Indique quantos átomos de cada tipo existem na célula unitária primitiva.
(c) Desenhe a célula unitária de Wigner-Seitz.
(g) Podem ser consideradas superfı́cies à escala macroscópica apenas, já que podem ter várias
dezenas de milhar de átomos de espessura...
22
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
’
Atomo
tipo A
’
Atomo
tipo B
’
Atomo
tipo C
2.3 O Cloreto de Césio (CsCl) tem uma estrutura cúbica
de parâmetro a = 4, 11 Å, com os átomos dispostos
de acordo com a figura. Determine:
(a) o tipo de estrutura cúbica de CsCl;
(b) um conjunto de vectores fundamentais primitivos, e indique qual o volume da célula
unitária primitiva;
(c) a densidade do CsCl.
2.4 A estrutura do composto SrTiO3 é a seguinte: os átomos de estrôncio dispõem-se
nos vértices de cubos idênticos dispostos regular e contiguamente; os de titânio,
nos centros destes cubos; os de oxigénio, finalmente, nos centros das suas faces.
(a) Qual o tipo de rede cristalina apresentada por este composto?
(b) Indique um conjunto de vectores fundamentais primitivos.
(c) Verifique que há um átomo de estrôncio, um de titânio e três de oxigénio
numa célula unitária definida pelos três vectores escolhidos em (b).
(d) Usando coordenadas fraccionárias, descreva o motivo que, associado à rede
cristalina determinada em (a), gera o cristal de SrTiO3 .
2.5 As posições dos pontos de duas redes cristalinas são dadas por:
(a)
(b)
rn1 ,n2 ,n3 =
rn1 ,n2 ,n3 =
e
e
e
10n1 +9n2 +19n3
3
a x + 6 n2 +n
a y+
10
5
√
2n1 +n2
3n2
a x + 2 a y + 2n3 a z .
2
e
e
2n3 aez ;
onde a é um número real fixo e n1 , n2 e n3 são inteiros arbitrários. Escolha,
para os dois casos, um conjunto primitivo de vectores fundamentais e identifique
o tipo de rede.
2.6 Para cada um dos seguintes conjuntos de vectores fundamentais primitivos, identifique o tipo de rede indicando as dimensões da célula convencional em termos
dos parametros a, b e c:
(a)
(b)
(c)
(d)
e + 12 aey , aey , √12 aez ;
1
aex + 12 aey , aey , aez ;
2
aex + 2bey , bey , cez ;
1
aex + 12 bey , bey , cez .
2
1
a x
2
2.7 Calcule o valor dos seguintes parâmetros para cada uma das três redes cúbicas
(simples, de corpo centrado e de faces centradas):
(a) volume da célula convencional;
2. Problemas
23
(b) volume da célula primitiva;
(c) número de pontos de rede na célula convencional;
(d) número de pontos na célula primitiva;
(e) distância entre vizinhos mais próximos;
(f) fracção de empacotamento(h) .
2.8 Prove que numa rede cúbica simples a direcção [hkl] é perpendicular aos planos
da famı́lia (hkl). Verifique com exemplos que o mesmo não se passa, necessariamente, para outros tipos de rede.
2.9 À temperatura de 1190 K, o ferro apresenta uma rede cristalina de faces centradas
com aresta a = 3, 647 Å, ao passo que, a 1670 K, a rede cristalina é de corpo
centrado, com aresta a = 2, 932Å. Determine a sua densidade, para cada uma
das temperaturas referidas.
2.10 O sulfeto de zinco Zn S cristaliza em duas estruturas distintas: a estrutura zinc
blende (impregnação de zinco) e estrutura wurtzite (wurtzita), ilustradas na figura
seguinte.
1/2
0
zinc blende
3/4
1/4
1/4
3/4
1/2
1/2
1/2
(a)
(b)
wurtzite
0
5/8
1/8
1/2
Nas Figuras (a) estão representadas células convencionais, As Figuras (b) representam
projecções das respectivas células onde estão indicadas as posições verticais dos átomos
em relação à altura da célula em questão.
A estrutura zinc blende é constituida por a uma rede cúbica de face centrada
associada a cada tipo de átomo e separadas ao longo da diagonal do cubo da
célula convencional cúbica em ( 41 , 14 , 14 ). A estrutura wurtzite tem associada a
cada tipo de átomo uma estrutura hexagonal compacta separadas em 58 da altura
da célula hexagonal. Sabendo que os parâmetros das células são de a = 5, 41 Å
para célula cúbica, e a = 3, 81 Å e c = 6, 23 Å para a célula hexagonal calcule a
densidade de ambas as formas do sulfeto de zinco.
(h) A fracção de empacotamento é a fracção de volume da rede ocupado, supondo os pontos da
rede como esferas rı́gidas suficientemente grandes para se tocarem
24
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
2.11 O Arsenito de Gálio cristaliza na forma de estrutura zinc blend. A ligação Ga−As
tem 2, 45 Å de comprimento.
(a) Determine a aresta da célula convencional cúbica.
(b) Qual a separação Ga − Ga mais curta.
(c) Qual a densidade do Ga As.
2.12 Considere um cristal com estrutura tipo wurtzite. Determine três vectores fundamentais primitivos assim como a respectiva base indicando a sua posição relativa.
2.13 Determine o quociente c/a para uma estrutura wurtzite.
2.14 Considere um conjunto seguinte de vectores fundamentais primitivos de uma rede
tetragonal de corpo centrado:
a=
1
1
1
1
1
1
a(ex + ey ) − cez , b = a(−ex + ey ) + cez , c = a(ex − ey ) + cez
2
2
2
2
2
2
onde a representa o lado da base quadrada da célula convencional e c a altura da
mesma. Considere que inicialmente temos c > a, e seguidamente imagine que a
célula é comprimida na direcção do eixo z.
(a) Para que valor de c a rede toma a forma de cúbica de corpo centrado?
(b) Para que valor de c a rede toma a forma de cúbica de face centrada?
Dê os seus resultados em termos do parametro a.
2.15 Se uma célula unitária de uma dada rede cristalina contém N pontos de rede,
então o seu volume é V = N Vp onde Vp é o volume das células unitárias primitivas
da mesma rede. Demonstre esta preposição.
2.16 Determine a separação entre os pontos de uma rede cristalina ao longo das direcções seguintes: (a) [110]; (b) [111]; (c) [320]; (d) [321].
2.17 Determine os ı́ndices de Miller de um plano que, numa rede cúbica simples, contém
a aresta de uma célula unitária primitiva e intersecta duas outras arestas da mesma
célula nos seus centros.
2.18 Compare a distância interplanar para os planos (210) numa rede cúbica simples,
cúbica de corpo centrado e cúbica de faces centradas.
2.19 Demonstre que a fracção de empacotamento máximo para um cristal de estrutura
tetragonal de corpo centrado (com uma base composta por um único átmo) é
dada por:
√
(a) π3 ac se c > 2a;
√
2 3
π a
(b) 24
(2 + ac 2 ) 2 se c < 2a.
c
2.20 Determine a densidade de pontos nos planos (111) de uma rede cúbica de face
centrada. Compare com a densidade de pontos nos planos (110).
Capı́tulo 3
Difracção elástica em cristais
Uma das ferramentas mais usadas na determinação da estrutura dos sólidos é a
análise da difracção de radiação neles incidente. De facto, quase se pode marcar o
nascimento da fı́sica do estado sólido com ramo autónomo da fı́sica em 1912, ano
em que foi publicado o primeiro artigo(a) sobre difracção de raios-X em cristais.
Neste capı́tulo, vamos estudar os processos de difracção de radiação por cristais
e a sua utilização na determinação das estruturas cristalinas. Vamo-nos restringir
à difracção elástica, em que a radiação difractada tem o mesmo comprimento de
onda que a incidente.
3.1
Generalidades
A análise da difracção elástica de radiação por cristais é um método poderoso no
estudo da sua estrutura. A informação que se obtém das experiências de difracção
resulta fundamentalmente de processos de interferência das várias porções do cristal;
assim, usa-se nestas experiências radiação com comprimento de onda próximo das
distâncias interatómicas tı́picas nos cristais, ou seja, alguns Angstrongs.
As experiências de difracção são realizadas com as seguintes três espécies de
feixes:
Raios-X Por ser muito simples a produção, detecção e manipulação (focagem, deflexão,
etc.) de feixes de radiação electromagnética, este tipo de radiação é o mais
frequentemente escolhido para experiências de difracção. A radiação interage
principalmente com as nuvens electrónicas dos sólidos, e portanto a sua utilização permite a determinação da distribuição electrónica e, a partir daı́, da
estrutura cristalográfica e de outras propriedades relevantes dos sólidos. Nas
experiências de difracção com cristais, usa-se radiação electromagnética na
região do espectro dos raios-X, por ser a que apresenta os comprimentos de
onda na gama apropriada.
Electrões Podem também usar-se feixes corpusculares, já que, à luz da Mecânica Quântica, estes evidenciam também comportamentos ondulatórios. Os electrões, por
serem partı́culas carregadas e extremamente leves, sofrem muito fortemente
a interacção com a matéria; assim, os feixes de electrões não têm um grande
poder de penetração nos sólidos e, por esta razão, são usados apenas no estudo
das suas superfı́cies. Os electrões devem estar animados com uma energia
cinética de cerca de 150 eV(b) para que o comprimento de onda da sua função
(a) Por
W. Friedrich, P. Knipping e M. Laue
eV é a energia cinética adquirida por um electrão acelerado por uma diferença de potencial
de 1V, ou seja 1eV≈ 1.6 × 10−19 J.
(b) 1
25
26
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
de onda quântica seja comparável com as distâncias interatómicas vulgares
nos cristais.
Neutrões Estas partı́culas, ao contrário dos electrões, têm um grande poder de penetração nos sólidos, por serem mais pesadas e também por serem electricamente
neutras. Apesar da sua neutralidade eléctrica, os neutrões apresentam momento magnético não nulo e por isso sofrem interacções electromagnéticas,
principalmente com os electrões responsáveis pelas propriedades magnéticas
do meio em que se encontram. Estas interacções não são “mascaradas” pelas
forças coulombianas, que seriam dominantes se se usassem feixes de partı́culas
carregadas, como protões. Por esta razão, os feixes de neutrões são particularmente indicados no estudo da distribuição do momento magnético no interior
dos sólidos. A energia do feixe com que as experiências devem ser conduzidas
é de cerca de 0,1 eV.
A grandeza fı́sica que envolvida nos processos de composição e de interferência
é, no caso dos raios-X, o campo electromagnético, ao passo que, no dos feixes
corpusculares, é a função de onda das partı́culas que os constituem. No entanto,
a intensidade medida pelos detectores é proporcional ao quadrado do módulo do
campo electromagnético (no caso dos raios-X), ou da função de onda (no caso dos
feixes de electrões ou de neutrões).
3.2
A condição de Bragg
Em 1913, quando estudavam a difracção de radiação por matéria, W. H. Bragg e
W. L. Bragg notaram que as substâncias cristalinas produzem padrões de difracção
de raios-X muito nı́tidos, ao contrário do que acontece com lı́quidos ou sólidos
não cristalinos. Mais concretamente, observaram que, iluminando um cristal com
raios-X de comprimento de onda bem determinado, a radiação é re-emitida apenas
segundo certas direcções bem determinadas, ao passo que repetindo esta experiência
com substâncias não cristalinas, a radiação é difundida em todas as direcções. Para
explicarem este facto, os Bragg supuseram que esta re-emissão da radiação se faz
por reflexão geométrica nos planos cristalinos, e que as reflexões em planos paralelos consecutivos devem interferir construtivamente para que se possam observar.
A Figura 3.1 representa o trajecto óptico de dois raios-X paralelos que sofrem uma
θ
θ
θθ
θ
l
l
d
θ
Figura 3.1: Reflexão de Bragg.
reflexão em dois planos consecutivos de uma dada famı́lia de planos cristalinos, que
fazem com a direcção dos feixes um ângulo de θ. A diferença entre os caminhos
percorridos pelos dois raios é 2l, ou seja, 2d sin θ, onde d é a distância interplanar.
Para que haja interferência construtiva, esta diferença deve conter um número inteiro, n, de comprimentos de onda, λ, da radiação envolvida no processo. Assim, a
condição para a existência de reflexão é
2d sin θ = nλ,
(3.1)
3.3. MÉTODOS EXPERIMENTAIS
27
que é a famosa lei de Bragg. Quando radiação de comprimento de onda bem definido
incide num cristal, somente as famı́lias de planos que apresentam uma distância
interplanar e uma orientação relativamente à radiação incidente que satisfazem a
lei de Bragg participam na reflexão de radiação. Pode mesmo não haver reflexão (é
até o caso mais frequente, para uma orientação fixa do cristal e da fonte da radiação)
se não houver nenhuma famı́lia de planos nestas condições. Neste caso, a radiação
incidente é totalmente absorvida pelo cristal.
3.3
Métodos experimentais
O formalismo de Bragg para a descrição da difracção de raios-X não é muito satisfatório porque se supõe que a difracção resulta de reflexões geométricas nos planos
cristalinos. Esta suposição não deveria ser aceite sem um estudo que a justifique.
Mais tarde analisaremos um formalismo mais convincente (o de Laue), mas para
já, fazemos uma pausa para discutir as questões práticas do estudo da difracção,
aceitando a lei de Bragg como base para a discussão.
Há basicamente três métodos para o estudo experimental da difracção: o de
Laue, o do cristal rotativo, e o do pó. No método de Laue, faz-se incidir raios-X
com uma gama contı́nua de comprimentos de onda sobre um cristal imóvel (ver a
Figura 3.2). O cristal difracta as componentes da radiação incidente com compri-
Cristal
Fonte de
raios-X
Écran
Figura 3.2: Método de Laue.
mentos de onda para os quais existem no cristal famı́lias de planos com distância
interplanar capaz de satisfazer a lei de Bragg. Estas componentes irão, após a
difracção, incidir num ecrã, usualmente uma placa fotográfica, ou um detector
eletrónico de raios-X, permitindo assim a análise. Os padrões de difracção consistem numa série de pontos, dispostos de forma simétrica relativamente ao ponto
onde a direcção da radiação incidente intersecta o plano do écran.
Como já foi dito, ao se iluminar um cristal imóvel com radiação monocromática
poderá não se verificar qualquer difracção, por não haver no cristal nenhuma famı́lia
de planos orientada de forma a permitir a satisfação da lei de Bragg. Mas se se
rodar o cristal durante a exposição à radiação, verificar-se-ão várias difracções,
cujo ângulo se altera bruscamente com a rotação do cristal. Cada famı́lia de planos
“espera pacientemente” o instante em que a sua orientação relativamente à radiação
incidente permita, nos termos da lei de Bragg, a sua participação na difracção. Este
é o processo usado no chamado método do cristal rotativo. O cristal roda no interior
de um cilindro (ver a Figura 3.3) cujas paredes interiores estão revestidas com uma
pelı́cula fotográfica. Um orifı́cio na superfı́cie lateral do cilindro permite a entrada
do feixe incidente.
No método do cristal rotativo, em cada instante, apenas algumas famı́lias de
planos participa no processo de difracção, que são aquelas que estão correctamente
alinhadas, e que apresentam uma distância interplanar capaz de satisfazer a lei
de Bragg. Se, em vez de um único cristal, dispusessemos de um grande número
cristais na região de incidência do feixe, e cada cristal estivesse orientado de maneira
arbitrária, então, mesmo com a amostra fixa, qualquer famı́lia de planos teria,
28
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
Écran
Cristal
Fonte monocromática
de raios-X
ω
Figura 3.3: Método do cristal rotativo.
nalgum cristal, a orientação correcta para satisfazer a lei de Bragg, podendo assim
participar da difracção. É nesta ideia que se baseia o chamado método do pó ou
de Debye. Neste método, em vez de se usar um cristal inteiro na amostra, usa-se
um cristal fragmentado em pequenos grãos, cada um dos quais funciona como um
pequeno cristal(c) com as suas direcções privilegiadas de difracção (ver a Figura 3.4).
película
fotográfica
ti
ma
cro
s
co
no
sX
aio
mo
amostra
R
-180°
-90°
0°
90°
180°
Figura 3.4: Esquema da montagem usada no método do pó e aspecto da pelı́cula
após revelação.
3.4
Condição de Laue. Rede recı́proca
Na dedução da lei de Bragg faz-se a suposição de que a difracção de radiação pelos
cristais se faz por reflexão em planos cristalinos. A validade desta suposição não é
nada óbvia, já que os processos de reflexão geométrica ocorrem em superfı́cies de
separação de dois meios com ı́ndices de refracção diferentes, e não em planos cristalinos abstractos, sem qualquer materialidade. Para além disto, a óptica geométrica
não é aplicável neste domı́nio, porque os comprimentos de onda das radiações envolvidas nestes processos são da ordem de grandeza das dimensões dos objectos em
que incidem.
(c) É trivial verificar que um grão de areia com cerca de 0,01 mm de diâmetro contém cerca de
1018 átomos, podendo pois ser ainda considerado um cristal macroscópico.
3.4. CONDIÇÃO DE LAUE. REDE RECÍPROCA
29
Em 1912, M. Laue tinha já proposto um tratamento mais natural do processo de
difracção, que vamos agora estudar. Um cristal, conforme já foi muitas vezes dito,
consiste num conjunto de objectos microscópicos idênticos (são as ocorrências do
motivo do cristal) colocados, regularmente, nos pontos de uma rede de Bravais, que,
quando neles incide radiação, a reemitem em todas as direcções. São então observadas fortes intensidades de difracção nas direcções em que a radiação reemitida por
todos estes objectos interfere construtivamente. Consideremos dois destes centros
n
δ1
n’
R
δ2
Figura 3.5: Dispersão elástica de radiação por duas células unitárias de um cristal.
dispersores, separados por um vector de rede R. Neles incide radiação com comprimento de onda λ, segundo a direcção definida pelo versor n̂ (ver a Figura 3.5). Para
que numa direcção definida pelo versor n̂0 se verifique interferência construtiva, é
necessário que a diferença entre os comprimentos dos caminhos ópticos seguidos
pelos raios que incidem em cada um dos dois centros dispersores considerados seja
igual a um múltiplo inteiro do comprimento de onda da radiação. A distância que
corresponde a esta diferença está realçada na Figura 3.5, sendo dada por δ1 + δ2 .
Mas
δ1
δ2
= R · n̂
= −R · n̂0 ,
(3.2)
(3.3)
de forma que a condição para a interferência construtiva é
¢
¡
R · n̂ − n̂0 = mλ,
(3.4)
onde m é um número inteiro qualquer. Multiplicando a Eq. (3.4) por 2π/λ e notando
que k = 2πn/λ é o vector de onda da radiação incidente(d) , resulta
R · (k − k0 ) = 2πm.
(3.5)
Esta é a condição para que a radiação reemitida pelas duas células unitárias representadas na Figura 3.5 interfira construtivamente na direcção do vector k0 . Claro
que, se considerarmos agora todo o cristal e não somente duas células unitárias,
obtemos uma condição semelhante a (3.5), mas que tem que se verificar para todos
os vectores da rede cristalina R:
R · (k − k0 ) = 2πm,
m ∈ N, ∀R ∈ rede cristalina.
(3.6)
Esta é a condição de Laue para a difracção. O conjunto dos vectores G = (k − k0 )
que satisfazem a Eq. 3.6 é muito reduzido. Vamos provar que estes vectores formam
também uma rede, que não é a rede formada pelos vectores R. Começamos por
(d) Define-se
da mesma maneira o vector de onda da radiação difractada
k0 = 2πn0 /λ.
30
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
definir os vectores(e)
b×c
a · (b × c)
c×a
B = 2π
a · (b × c)
a×b
C = 2π
,
a · (b × c)
A = 2π
(3.7)
(3.70 )
(3.700 )
onde a, b e c são os vectores fundamentais do cristal em estudo (ou seja, da rede
definida pelos vectores R). É possı́vel provar que, se a, b, c não forem co-planares,
então A, B, C também não o são (o leitor é aconselhado a tentar fazer esta demonstração), e portanto servem como base do espaço. Assim, podemos concerteza
escrever
G = xA + yB + zC,
(3.8)
onde x, y, z são três quantidades adimensionais, não necessariamente inteiras, que
são as componentes de G nesta base. Por outro lado, como R é um vector da rede
cristalina, pode escrever-se como uma combinação linear inteira dos vectores a, b,
c:
R = ha + kb + lc,
(3.9)
com h, k, l inteiros. Vejamos quais os valores que x, y, z podem tomar para que se
verifique R · G = 2mπ, de acordo com (3.6). Note-se que, como o produto externo
de dois vectores é perpendicular a qualquer deles, a · B = a · C = 0, etc., logo,
R·G =
=
(ha + kb + lc) · (xA + yB + zC)
2π (xh + yk + zl) .
(3.10)
Para que se verifique a condição de Laue, é necessário que a soma dentro dos
parêntesis na Eq. (3.10) seja um número inteiro, quaisquer que sejam os inteiros
h, k, l. Isto só é possı́vel (quaisquer que sejam h, k, l) se x, y e z forem também
inteiros. O conjunto de vectores G = (k − k0 ) que satisfaz a condição de Laue é
pois da forma
G = pA + qB + rC,
(3.11)
com p, q, r inteiros e A, B, C dados pelas equações (3.7). Ao variarmos os valores
de p, q, r em (3.11) geramos uma rede, diferente da gerada pelos vectores a, b, c,
chamada a rede recı́proca da rede gerada pelos vectores a, b, c. Esta última chama-se, para mais fácil distinção, rede directa. Os vectores A, B, C são os vectores
fundamentais da rede recı́proca.
A rede recı́proca é um conceito recorrente em Fı́sica do Estado Sólido. Foi
introduzido neste capı́tulo, mas surge também naturalmente no estudo de outros
tópicos, relativamente independentes da difracção de radiação.
Voltando agora à condição de Laue, podemos agora enunciá-la da seguinte forma:
Pode ocorrer interferência construtiva (e portanto difracção) se a variação no vector de onda da radiação G = k0 − k, for um vector da rede
recı́proca.
Note-se que a condição de Laue (ou a de Bragg que, veremos, lhe é equivalente)
é uma condição apenas necessária, não suficiente, para a difracção. Se o motivo
cristalino não for trivial (isto é, se contiver mais do que um átomo), verificam-se
processos de interferência no interior de cada célula unitária primitiva, que podem
impedir a difracção numa dada direcção, mesmo que a condição de Laue (que diz
respeito à interferência entre diferentes células unitárias primitivas) a permita. Mais
à frente abordaremos este assunto.
(e) Note-se que, usando estas definições, a eq. (2.26) na Secção 2.6 pode reescrever-se como G
hkl =
hA + kB + lC .
3.5. EQUIVALÊNCIA DAS CONDIÇÕES DE BRAGG E DE LAUE
3.4.1
31
A construcção de Ewald
A condição de difracção de Laue pode ser representada geometricamente através
da chamada construcção de Ewald (ver a Figura 3.6): desenha-se no espaço-k (f) o
vector de onda k do feixe incidente, com origem num ponto da rede recı́proca; de
seguida, desenha-se uma esfera de raio k = |k| com centro na extremidade daquele
vector. De acordo com a lei de Laue, são possı́veis difracções com vectores de onda
k0 se houver (além do ponto de origem do primeiro vector desenhado) pontos da
rede recı́proca na superfı́cie da esfera, caso em que podem verificar-se “reflexões” de
Bragg nos planos cristalinos (da rede directa) que são perpendiculares aos vectores
posição desses pontos da rede recı́proca.
k
G
-k’
Figura 3.6: A construcção de Ewald.
3.5
Equivalência das condições de Bragg e de Laue
Vamos agora demonstrar a equivalência das duas condições de difracção estudadas.
Antes, porém, demonstra-se uma propriedade muito útil da rede recı́proca.
Uma das caracterı́sticas mais relevantes da rede recı́proca é o facto de os seus
vectores, dados por (3.11), serem perpendiculares a planos da rede directa, e de as
suas componentes inteiras (h, k, l) estarem relacionadas de forma simples com os
ı́ndices de Miller (h0 k 0 l0 ) desses planos. Demonstremos esta afirmação. Seja
Ghkl = hA + kB + lC,
(3.12)
com A, B e C dados pelas eqs. (3.7) e h, k e l inteiros arbitrários, um vector
qualquer da rede recı́proca. Definam-se três novos números inteiros h0 , k 0 e l0 em
proporções relativas iguais às apresentadas por h, k e l, mas sem divisores comuns,
como
h0 = h/n
0
k = k/n
l0 = l/n,
(3.13)
(3.130 )
(3.1300 )
onde n é o maior divisor comum a h, k e l. Uma vez que h0 , k 0 e l0 não têm,
por construcção, divisores comuns, o conjunto (hkl) pode ser encarado como os
ı́ndices de Miller de alguma famı́lia de planos da rede directa. De acordo com a
definição de ı́ndices de Miller, o plano dessa famı́lia que mais se aproxima da origem
(f) Designam-se
assim, em geral, espaços recı́procos do espaço usual, como o espaço das variáveis
das transformadas de Fourier, o espaço ocupado pela rede recı́proca, etc. Estes espaço têm comprimentos com dimensões inversas do comprimento usual.
32
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
de uma base cristalográfica previamente escolhida contém os pontos P 1 = a/h0 ,
P 2 = b/k 0 , P 3 = c/l0 (ver a Figura 3.7). Dois vectores não colineares deste plano
são os vectores P 2 − P 1 e P 3 − P 2 . Então o vector
u = (P 2 − P 1 ) × (P 3 − P 2 )
(3.14)
é perpendicular à famı́lia de planos considerada. Com um pouco de aritmética
c
P3
P3 - P2
P2
a
P1
P2 - P1
b
Figura 3.7: O plano da famı́lia (h0 k0 l0 ) que passa nos pontos
P 1, P 2, P 3.
obtemos
u =
=
=
1
(h0 b × c + k 0 c × a + l0 a × b)
µ
¶
1 a · (b × c)
b×c
c×a
a×b
0
0
0
h
2π
+
k
2π
+
l
2π
h0 k 0 l 0
2π
a · (b × c)
a · (b × c)
a · (b × c)
1
τ
(h0 A + k 0 B + l0 C) ,
(3.15)
h0 k 0 l0 2π
h0 k 0 l 0
onde foram usadas as equações (3.7) e se introduziu o volume da célula unitária da
rede directa τ = a · (b × c). Finalmente, comparando este resultado com a definição
na Eq. (3.12) obtemos
2nπ
Ghkl = h0 k 0 l0
u.
(3.16)
τ
Os dois vectores Ghkl e u são, como está patente nesta expressão, colineares; uma
vez que u é, por construção, perpendicular aos planos da famı́lia (h0 k 0 l0 ), também
Ghkl o é.
Posto isto, analisemos geometricamente a condição de Laue. Consideremos uma
onda plana incidente no cristal com vector de onda k, sendo difractada na direcção
do vector k0 (ver a Figura 3.8). Note-se que se a difracção é elástica, as radiações
incidente e difractada têm o mesmo comprimento de onda, ou seja, |k| = |k0 | =
G
k
θ
α
α’
θ’
k’
Figura 3.8: Esquema da difracção de radiação por um cristal ilustrando a condição
de Laue (G deve pertencer à rede recı́proca) e a de Bragg (a difracção faz-se por
reflexão geométrica em planos cristalinos).
2π/λ. Na Figura 3.8 estão representados os vectores k, k0 e a sua diferença G =
3.6. AMPLITUDE DA DIFRACÇÃO. FACTOR DE ESTRUTURA
33
k0 − k (de acordo com a condição de Laue, deve ser um vector da rede recı́proca) e
um plano que é perpendicular a G, que, como acabámos de ver, deve pertencer a
uma famı́lia de planos da rede directa. Uma vez que |k| = |k0 |, o triângulo formado
por k0 , G e k (na figura, o lado correspondente a k aparece a tracejado) é um
triângulo isósceles. Logo os ângulos α e α0 são iguais e portanto também θ = θ0
Mas θ e θ0 são os ângulos que as radiações as radiações incidente e difractada fazem
com a famı́lia de planos perpendicular a G. Fica assim justificada a suposição
de reflexão geométrica usada no tratamento de Bragg. Falta ainda verificar que a
distância interplanar destes planos é exactamente a requerida pela lei de Bragg.
Vimos há pouco que o vector da rede recı́proca Ghkl = hA + kB + lC é perpendicular à famı́lia de planos da rede directa (h0 k 0 l0 )(g) . Por outro lado, no capı́tulo
anterior (eq. 2.27) vimos que a distância entre os planos desta famı́lia é
d ≡ dh0 k0 l0 =
2π
|Gh0 k0 l0 |
2nπ
=
.
|Ghkl |
(3.17)
(3.18)
Ora, da Figura 3.8, deve ser evidente que que
|Ghkl | = 2|k| sin θ =
4π
sin θ.
λ
(3.19)
Substituindo este resultado na eq. (3.18) obtemos, finalmente, a lei de Bragg
2 d sin θ = nλ,
(3.20)
ficando assim demonstrada a equivalência entre os tratamentos de Bragg e de Laue.
3.6
Amplitude da difracção. Factor de estrutura
A condição de Laue impõe, como vimos, que a radiação difractada por pontos
equivalentes do cristal (isto é, pontos separados por vectores da rede cristalina)
interfira constructivamente. Assim sendo, não se consideram na descrição de Laue
fenómenos de interferência entre centros dispersores a distâncias inferiores às que
separam os pontos da rede cristalina e, em particular, não se descreve a interferência
entre átomos diferentes no interior de cada instância do motivo cristalino. Pode pois
dizer-se com propriedade que a análise de Laue é uma aproximação, na qual o motivo
cristalino é encarado como um centro dispersor pontual. Desta maneira afastam-se da teoria os processos de interferência internos ao motivo, processos esses que
podem eventualmente proibir a difracção segundo algumas das direcções permitidas
pela lei de Laue. É esta a razão que nos levou a afirmar que a condição de Laue é
apenas uma condição necessária, mas não suficiente, para a difracção de radiação.
Vamos agora fazer uma análise fı́sica mais detalhada do processo de difracção
elástica de radiação por cristais, que considere estes processos de interferência internos ao motivo cristalino. A Figura 3.9 representa esquematicamente uma experiência tı́pica de difracção de raios-X(h) por um cristal. Um feixe colimado de
raios-X é dirigido a uma amostra do sólido em estudo e um detector mede a intensidade da radiação resultante em função do ângulo, 2θ, entre a direcção de incidência
e a de detecção. Por simplicidade, consideremos que a radiação incidente é monocromática, e que a fonte se encontra suficientemente afastada da amostra para que
(g) Recorde-se
que os ı́ndices acentuados h0 , k0 e l0 são os definidos nas equações (3.13).
tornarmos a discussão mais concreta, vamos nesta secção considerar, a tı́tulo de exemplo,
a difracção de raios-X. O tratamento de outro tipos de radiações é em tudo análogo, com algumas
modificações evidentes.
(h) Para
34
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
amostra
2θ
k
fonte
k’
r
detector
r’
O
Figura 3.9: Esquema da difracção de radiação por um sólido.
possa ser tratada como uma onda plana. Para os efeitos que nos interessam nesta
discussão, esta onda plana pode ser caracterizada indicando apenas o seu vector de
onda, k, e sua frequência angular ω. O vector de onda tem módulo 2π/λ e a direcção da propagação da onda. Assim, usando notação complexa, podemos escrever
a onda plana incidente, φi , como(i)
φi (r, t) = Ai eı(k·r−ωt)
(3.21)
√
onde ı = −1 e Ai é a amplitude da onda incidente. De acordo com o princı́pio de
Huygens, cada ponto do sólido exposto à radiação incidente é fonte secundária de
radiação, com o mesmo comprimento de onda e a mesma frequência angular, mas
com a forma de ondas esféricas, dadas em geral por
φd (r 0 , t) = A0
0
0
eı(k |r −r|−ωt)
,
|r 0 − r|
(3.22)
onde r e r 0 são os vectores posição do centro dispersor considerado e do detector,
respectivamente (ver a Figura 3.9), e k 0 = k é o módulo do vector de onda da
radiação difractada. A amplitude A0 é, em cada ponto do sólido, proporcional
ao campo electromagnético (nos casos em que o feixe é de raios-X) incidente e à
capacidade dispersora(j) , ρ(r), de forma que podemos escrever
φd (r 0 , t) = A ρ(r) eık·r
0
0
eı(k |r −r|−ωt)
,
|r 0 − r|
(3.23)
com A constante. A radiação detectada é a resultante da composição de contribuições como a desta equação, provenientes de cada ponto do sólido exposto ao
feixe incidente. Isto é, o campo da radiação detectado no detector é dado por
Z
0
3
φd (r , t) = A
d r ρ(r)e
V
(i) Esta
ık·r
0
0
eı(k |r −r|−ωt)
,
|r 0 − r|
(3.24)
descrição não inclui a polarização do campo electromagnético, ou a orientação do momento magnético das partı́culas que constituem os feixes corpusculares, sendo assim aplicável
apenas aos casos em que estes graus de liberdade não desempenham um papel activo.
(j) Por capacidade dispersora não se entenda nenhum conceito bem definido quantitavamente,
mas antes uma medida vaga da capacidade da matéria numa dada região do espaço produzir
desvios na direcção do feixe incidente. Na difracção de radiação electromagnética e de electrões,
por capacidade dispersora deve entender-se densidade de carga; na difracção de feixes de neutrões,
magnetização.
3.6. AMPLITUDE DA DIFRACÇÃO. FACTOR DE ESTRUTURA
35
onde o integral é estendido ao volume V da região do sólido exposto ao feixe incidente e as variáveis de integração são as três componentes do vector r, como
se pretende indicar com a notação d3 r. Normalmente, as dimensões lineares da
amostra são muito menores do que a distância que a separa do detector, e portanto podemos considerar que o denominador da função integranda nesta igualdade, |r 0 − r|, é aproximadamente constante, podendo ser posto em evidência, fora
do sinal de integração. Note-se que não se podem fazer as mesmas considerações
quanto ao termo idêntico que aparece no argumento da exponencial, porque as pequenas variações nesta quantidade correspondem a variações na fase das funções
trigonométricas e essas variações, por pequenas que sejam, são importantes nos
processos de interferência. Por outro lado, também porque o detector se encontra
afastado da amostra, o vector r 0 − r é praticamente paralelo ao vector k0 e portanto
o produto dos módulos destes dois vectores é practicamente igual ao seu produto interno, k 0 |r 0 − r| ≈ k0 · (r 0 − r). Assim, podemos escrever o campo electromagnético
que atinge o detector como
Z
0
0
0
A
φd (r 0 , t) = 0
d3 r ρ(r) eık ·r eı[k ·(r −r)−ωt]
|r − r| V
Z
0 0
A
(3.25)
= 0
eı[k ·r −ωt]
d3 r ρ(r) e−ı∆k·r ,
|r − r|
V
com ∆k = k0 − k. A parte relevante para o estudo da interferência da radiação
emitida por cada porção de sólido é o integral sobre todo o volume do sólido V, que
representaremos por H(∆k); os factores no exterior são factores globais, que descrevem fenómenos triviais como o da diminuição da intensidade do feixe difractado
com o aumento da distância que separa a amostra do detector, sem grande interesse
nesta discussão. Restringindo a discussão aos casos, que mais nos interessam, em o sólido difractor
r’
é cristalino, o cálculo do integral pode ser simpliR hkl
ficado fazendo uma partição do volume de integração e considerando separadamente os volumes
r
de cada célula unitária primitiva do cristal. Assim,
O
temos
Z
H(∆k) ≡
d3 r ρ(r) e−ı∆k·r
V
XZ
0
(3.26)
=
d3 r 0 ρ (r 0 + Rhkl ) e−ı∆k·(r +Rhkl ) ,
Vcup
hkl
onde os integrais são agora extendidos apenas ao volume de cada célula unitária
Vcup , e Rhkl é um vector da rede, com componentes cristalográficas hkl. Mas a
densidade electrónica deve ser uma função com a periodicidade do cristal, de forma
que ρ (r 0 + Rhkl ) = ρ(r 0 ), e assim
Z
X
0
d3 r 0 ρ (r 0 ) e−ı∆k·r .
H(∆k) =
e−ı∆k·Rhkl
(3.27)
Vcup
hkl
O valor do integral, que é uma função da variação do vector de onda da radiação,
depende fortemente da distribuição de cargas no interior do motivo cristalino. A
esta função, que representamos por F (∆k), dá-se o nome de factor de estrutura.
Explicitando o desenvolvimento de Rijk como combinação linear inteira dos vectores
fundamentais da rede cristalina, obtemos
X
X
X
H(∆k) = F (∆k)
e−ıh∆k·a
e−ık∆k·b
e−ıl∆k·c .
h
k
l
36
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
Estes somatórios são progressões aritméticas, facilmente calculáveis. Considerando
que a amostra contém N células unitárias primitivas ao longo dos três eixos cristalográficos, temos
H(∆k) = F (∆k)
N
−1
X
−1
−1
£ −ı∆k·a ¤h NX
£ −ı∆k·b ¤k NX
£ −ı∆k·c ¤l
e
e
e
,
h=0
k=0
l=0
mas cada um dos somatórios é dado por
N
−1
X
e−ın∆k·v
e−ıN ∆k·v − 1
e−ı∆k·v − 1
"
#
N
N
N
e−ı 2 ∆k·v e−ı 2 ∆k·v − eı 2 ∆k·v
=
n=0
=
1
e−ı 2 ∆k·v
N
e−ı 2 ∆k·v
=
1
e−ı 2 ∆k·v
1
"
1
e−ı 2 ∆k·v − eı 2 ∆k·v
#
sin( N2 ∆k · v)
,
sin( 21 ∆k · v)
onde v é um dos vectores fundamentais a, b ou c, de forma que se obtém
#
"
N
e−ı 2 ∆k·a sin( N2 ∆k · a)
H(∆k) = F (∆k) −ı 1 ∆k·a
sin( 12 ∆k · a)
e 2
#
#
"
"
N
N
e−ı 2 ∆k·b sin( N2 ∆k · b) e−ı 2 ∆k·c sin( N2 ∆k · c)
.
1
1
e−ı 2 ∆k·b sin( 12 ∆k · b) e−ı 2 ∆k·c sin( 12 ∆k · c)
(3.28)
(3.29)
Como já se disse, a informação recolhida pelo detector é a intensidade do feixe
difractado, que é igual ao quadrado do módulo do campo electromagnético. Assim,
estamos de facto interessados no quadrado do módulo de H(∆k), que é dado por
2
2
|H(∆k)| = |F (∆k)| sN (∆k · a) sN (∆k · b) sN (∆k · c),
(3.30)
com
sN (x) =
sin2 ( 12 N x)
.
sin2 ( 12 x)
(3.31)
Na Figura 3.10 apresentam-se gráficos da função sN (x) para N = 10 e N = 100.
Como se pode verificar, para além da intensidade dos picos aumentar com N , as
suas larguras diminuem e a função sN (x) aproxima-se a uma função delta de Dirac
para valores de x = 2nπ. Uma amostra tı́pica tem aproximadamente 108 células
unitárias, logo é de esperar que existam picos de difracção intensos quando se satisfaçam simultaneamente as seguintes condições
∆k · a =
2πh
∆k · b = 2πk
∆k · c = 2πl,
(3.32)
onde h, k e l são números inteiros quaisquer. Mas estas condições não são mais que
as condições de Laue para a difracção! Quando isolámos as contribuições do motivo
cristalino no factor de estrutura, os termos que não foram aı́ integrados tinham
que estar relacionados com a condição de Laue, que, ao fim ao cabo, considera
o processo de difracção fazendo simplificações apenas ao nı́vel dos processos que
ocorrem dentro do motivo cristalino.
3.6. AMPLITUDE DA DIFRACÇÃO. FACTOR DE ESTRUTURA
37
100
80
N=10
60
s(x)
40
20
0
−π
0
π
x=
0
π
x=
1
2
∆ k·r
10000
N=100
8000
6000
s(x)
4000
2000
0
−π
1
2
∆ k·r
Figura 3.10: A intensidade dos picos secundários diminui quando N aumenta.
Analisemos agora o factor de estrutura, dado por
Z
F (k) =
d3 r ρ (r) e−ık·r .
(3.33)
Vcup
Podemos simplificar o integral fazendo uma partição do volume da célula unitária
primitiva nas zonas que estão na proximidade de cada átomo do motivo cristalino;
obtemos então
XZ
0
F (k) =
d3 r 0 ρ(r 0 + Rm ) e−ık·(r +Rm )
m
=
X
Vm
Z
0
d3 r 0 ρ(r 0 + Rm ) e−ık·r ,
e−ık·Rm
(3.34)
Vm
m
onde os vectores Rm é o vector posição do núcleo atómico do m-ésimo átomo e r 0 é
o vector representado na Figura 3.11, cujas componentes são as novas variáveis de
integração. Usando o centro de cada átomo como origem do sistema de coordenadas
nas integrações, resulta por fim
Z
X
0
d3 r 0 ρ(r 0 ) e−ık·r .
(3.35)
e−ık·Rm
F (k) =
m
Ao integral
Vm
38
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
r’
Ri
r
O
Figura 3.11: Volume de uma célula unitária primitiva com três átomos, dividida nas
regiões próximas de cada átomo.
Z
d3 r ρ(r) e−ık·r ,
=m (k) =
(3.36)
Vm
que é essencialmente a transformada de Fourier da densidade de carga, dá-se o nome
de factor de forma atómico. Podemos voltar agora à Eq. (3.27) e escrever que a
difracção é possı́vel nas direcções permitidas pela condição de Laue (a soma em hkl
na eq. (3.27) garante-o) e a sua intensidade é proporcional ao quadrado do módulo
do factor de estrutura, que é dado por
X
F (∆k) =
=m (∆k)e−ı∆k·Rm
(3.37)
m
PROBLEMAS
3.1 Prove que os volumes das células unitárias de uma dada rede (τ ) e da sua rede
recı́proca (τ ∗ ) se relacionam através de
τ∗ =
(2π)3
τ
3.2 Prove que a recı́proca da rede recı́proca de uma dada rede é esta rede.
3.3 Mostre que a rede recı́proca de uma rede cúbica de faces centradas é uma rede
cúbica de corpo centrado.
3.4 Qual é então a recı́proca de uma rede cúbica de corpo centrado?
3.5 Determine e classifique a rede recı́proca de cada uma das seguintes redes
(a) hexagonal;
(b) ortorrômbica;
(c) tetragonal.
3.6 Considere uma rede trigonal. Seja θ o ângulo entre os seus vectores fundamentais
primitivos. Prove que a rede recı́proca também é trigonal e que o ângulo θ∗ entre
os seus vectores fundamentais primitivos é dado por
cos θ∗ = −
cos θ
.
1 + cos θ
3.7 Determine os ângulos que a radiação difractada pode fazer com a incidente,
numa experiência de difracção de raios-X com comprimento de onda λ = 1, 04 Å,
incidindo numa rede rede cúbica simples, com parâmetro a = 4, 0 Å.
3. Problemas
39
3.8 Numa experiência de difracção, onde raios-X com comprimento de onda λ =
1, 0 Å incidem sobre um cristal monoatómico com rede cúbica simples, o primeiro
máximo de difracção faz com a direcção da radiação incidente um ângulo θ =
16, 4◦ . Determine o valor do parâmetro a da rede cristalina.
3.9 Prove que o factor de forma atómico de um átomo que contém n electrões com
uma densidade de probabilidade constante numa esfera de raio R é dado pela
expressão
3n
=(∆k) = 3 3 [sin(∆kR) − R∆k cos(∆kR)]
R ∆k
(a) Determine o factor de forma para valores do ângulo de difracção 2θ = 5◦ ,
60◦ , 90◦ e 180◦ . Considere que o raio R = 2, 5 Å , λ = 2, 0 Å e que a esfera
contém 10 electrões.
(b) Mostre que a Figura representa graficamente a função |=|2 . O que pode
concluir relativamente à intensidade de difracção em função das condições
experimentais e do “raio atómico”.
1
0.8
0.6
|ℑ|
2
0.4
0.2
0
0
2
4
6
8
∆k R
3.10 A função de onda de um electrão no estado fundamental de um átomo de hidrogénio é dada por (orbital radial s),
ψ(r) = πao 3
− 12
− ar
e
o
,
onde ao é o raio atómico de Bohr. Determine o factor de forma atómico.
3.11 Determine o factor de estrutura de uma rede cúbica de corpo centrado e de uma
rede cúbica de faces centradas, associando a cada ponto de rede numa célula
unitária convencional um factor de forma “atómico”.
3.12 Construa uma tabela onde apresente os ângulos de difração de radiação por uma
rede cúbica simples, ordenados de forma crescente. Indique na tabela quais os
máximos que não são observados em experiências de difracção com redes cúbicas
de corpo centrado e de faces centradas.
3.13 Suponha que dois átomos da base de uma estrutura “zinc blende”têm factores de
forma atómico =a e =b , respectivamente.
(a) Obtenha uma expressão para o factor de estrutura em função dos ı́ndices
(hkl) duma rede cúbica simples.
(b) Mostre que o factor de estrutura, F , é
0
se h, k e l não forem simultaneamente números pares
ou ı́mpares,
4(=a + =b )
se h + k + l = 4n,
4(=a − ı=b ) se h + k + l = 4n + 1,
4(=a − =b )
se h + k + l = 4n + 2,
4(=a + ı=b ) se h + k + l = 4n + 3,
40
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
onde n é um número inteiro qualquer.
3.14 Determine a expressão para o factor de estrutura F associado a uma estrutura
hexagonal compacta ideal, usando os ı́ndices da estrutura primitiva. Suponha que
os dois átomos da base têm o mesmo factor de forma atómico, =, independente
de ∆k e classifique por ordem crescente de intensidade os picos de difracção
associados aos planos: (100), (110), (111), (1̄11), (210) e (211).
3.15 Um cristal tetragonal é preparado para uma experiência de difracção usando o
método de Debye com um comprimento de onda de raios-X de λ = 1, 54 Å. A
célula convencional tem uma base quadrada de a = 3, 20 Å e altura c = 4, 63 Å.
(a) Determine os três primeiros ângulos de difracção.
(b) Se a base consiste num átomo de um tipo no centro da célula e um outro
diferente num dos vértices, classifique por ordem de intensidades os picos
de difracção relativos ao ângulos da alı́nea anterior. Assuma que ambos
factores de forma atómicos são reais e têm o mesmo sinal.
3.16 Partindo da condição de Laue para a difracção, prove que:
k · G = − 1 |G|2 .
2
Capı́tulo 4
Vibrações em cristais
Nos capı́tulos anteriores foi apresentado um modelo dos sólidos cristalinos segundo
o qual os átomos que os formam encontram-se em repouso nas posições determinadas pela rede e motivo cristalinos. No entanto, esta suposição da imobilidade é
uma simplificação grosseira da realidade que apresenta, entre outros, os seguintes
inconvenientes:
• A temperatura de um objecto pode ser encarada como uma medida da energia
cinética associada ao movimento microscópio dos átomos que o constituem.
Supondo os átomos em repouso esta associação é impossı́vel.
• O som consiste em ondas mecânicas, isto é, variações infinitesimais na posição
dos átomos que se transmitem aos átomos vizinhos, propagando-se desta forma
nos meios materiais. Aceitando a hipótese da imobilidade dos átomos nos
sólidos cristalinos, estes deveriam ser isoladores sonoros, o que claramente,
não se verifica.
• O argumento que acabamos de desenvolver aplica-se também à condução de
calor.
Muitos outros argumentos desta natureza poderiam ainda ser apresentados (ver,
por exemplo, o Cap. 21 do Ashcroft & Mermin). Independentemente destas razões,
devemos compreender que o modelo estático dos cristais é uma impossibilidade
teórica do ponto de vista quântico, por violar o princı́pio de incerteza de Heisenberg.
Com efeito, quanto maior for a precisão com que definimos as posições dos átomos
no cristal, menor é a precisão com que podemos conhecer as suas quantidades de
movimento, e portanto menos razoável é supô-los em repouso (p = 0).
Neste capı́tulo, vamos melhorar este modelo dos sólidos, abandonando a hipótese
da imobilidade atómica. Na nova descrição dos sólidos, considera-se que as posições
definidas pela sua estrutura microscópica são as posições de equilı́brio dos átomos
que lhes correspondem, mas supõe-se que são possı́veis pequenos deslocamentos
dessas posições, que são contrariados pelas forças interatómicas responsáveis pela
coesão do sólido.
4.1
A aproximação harmónica
A interacção de cada átomo com os restantes átomos num sólido manifesta-se na
forma de uma energia potencial φ(r), que apresenta um valor mı́nimo quando esse
átomo se encontra na sua posição de equilı́brio (ver a Figura 4.1). Considerando
pequenos deslocamentos δr = r − R desta posição, podemos aproximar a energia
41
42
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
φ
X
x
Figura 4.1: A energia potencial de um átomo de um sólido é mı́nima na sua posição
de equilı́brio.
potencial pelo seu desenvolvimento de Taylor de segunda ordem
i
1 h
2
φ(r) ' φ(R) + δr · [∇φ(r)]R +
(δr · ∇) φ(r) .
2!
R
(4.1)
O primeiro termo, de ordem zero em δr, é uma constante, e como tal não desempenha qualquer papel na dinâmica do sólido; representa a contribuição do átomo
considerado para a energia de ligação do sólido. O termo de primeira ordem é nulo,
uma vez que é proporcional ao gradiente da energia potencial do átomo, calculado
na sua posição de equilı́brio, onde a energia potencial apresenta um valor mı́nimo.
Finalmente, o termo de segunda ordem pode ser escrito como
(2)
φ
· 2 ¸
3
1 X
∂ φ
(r) =
δxi
δxj
2! i,j=1
∂xi ∂xj R
=
3
1 X
δxi Kij δxj ,
2 i,j=1
(4.2)
com
·
Kij =
∂2φ
∂xi ∂xj
¸
R
A Eq. (4.2) é a expressão mais geral para a energia potencial num oscilador harmónico tri-dimensional(a) . Assim, se limitarmos o nosso estudo às vibrações de pequena
amplitude, podemos tratar as interacções entre os átomos como interacções elásticas,
o que permite, como veremos, grandes simplificações.
Antes de iniciarmos o estudo das vibrações em cristais, vamos abordar o problema, mais simples, das vibrações em meios sólidos contı́nuos.
4.2
Ondas mecânicas em meios contı́nuos
Vamos iniciar o estudo das vibrações nos sólidos através da análise de um problema
unidimensional. Consideremos uma barra cilı́ndrica com comprimento L e secção
(a) Note-se que como K
ij é uma matriz simétrica, é possı́vel escolher um sistema de coordenadas
x0 y 0 z 0 no qual a matriz K é diagonal. Usando esse sistema de coordenadas, o termo de segunda
ordem na energia potencial fica φ(2) (r ) = Kxx (δx0 )2 /2 + Kyy (δy 0 )2 /2 + Kzz (δz 0 )2 /2, que representa a energia total de um sistema de três osciladores harmónicos independentes, com constantes
elásticas Kxx , Kyy e Kzz .
4.2. ONDAS MECÂNICAS EM MEIOS CONTÍNUOS
43
x
x
u
Figura 4.2: Barra longitudinal sob tensão.
F(x)
F(x+δx)
x
x
δx
Figura 4.3: Forças sobre uma porção de barra com comprimento δx.
transversal com área S, constituı́da por um meio contı́nuo, homogénio e isotrópico
com densidade ρ, sujeita a uma tensão σ(x, t), que se manifesta no aparecimento de
forças longitudinais F (x, t). Sob a acção destas forças, a barra deforma-se longitudinalmente, isto é, cada secção transversal da barra sofre um deslocamento u(x, t),
relativamente à sua posição de equilı́brio na ausência de tensões, na direcção do
comprimento da barra (ver a Figura 4.2). A deformação da barra está relacionada
com a função dos deslocamentos u(x, t), mas não directamente. Com efeito, uma
situação em que u(x, t) tem o mensmo valor em todos os pontos da barra não corresponde a uma deformação, mas sim a um deslocamento rı́gido longitudinal da
barra. Para medir as deformações, introduz-se então a seguinte função de extensão:
²(x, t) =
∂u
.
∂x
(4.3)
Quando os deslocamentos são suficientemente pequenos é válida a aproximação
elástica, em que se verifica uma proporcionalidade simples entre a tensão σ(x, t) e
a extensão ²(x, t), em cada ponto da barra e em cada instante,
σ(x, t) = −Y ²(x, t),
(4.4)
onde o coeficiente de proporcionalidade, Y , tem o nome de módulo de Young. Esta
igualdade tem o nome de Lei de Hooke e a partir dela é possı́vel (por integração no
volume da barra) deduzir a conhecida expressão da força como função da elongação
numa mola elástica.
Quando a barra está deformada, verifica-se a existência de forças entre porções
contı́guas da barra, forças essas que contrariam a deformação. A tensão em cada
ponto define-se como a força por unidade de área. Assim, duas porções contı́guas
da barra separadas por uma secção transversal com abcissa x exercem, uma sobre
a outra, uma força cujo módulo é, no instante t,
F (x, t) = Sσ(x, t),
onde S é, recorde-se, a área da secção transversal da barra.
Consideremos agora uma porção de barra limitada por duas secções transversais
infinitamente próximas, com abcissas x e x + δx (ver a Figura 4.3). Esta porção de
44
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
barra está sujeita a duas forças de tensão, cujas componentes segundo a direcção
longitudinal são dadas por
F (x, t)
F (x + δx, t)
= Sσ(x, t)
= −Sσ(x + δx, t) ≈ −S[σ(x, t) +
∂σ
δx]
∂x
A resultante destas duas forças é
∂σ
δx
∂x
∂2u
= SY
δx,
∂x2
δF (x, t) = −S
(4.5)
onde se usou já a lei de Hooke da Eq. (4.4). De acordo com a Lei Fundamental da
Dinâmica, esta força deve ser igual ao produto da massa da porção de barra em
estudo pela sua aceleração. A massa da porção considerada é facilmente calculada
a partir da densidade, ρ, como
dM = ρdV = ρSδx,
ao passo que a sua aceleração é, por definição, a dupla derivada temporal do deslocamento, ou seja,
· 2 ¸
∂ u
a(x, t) =
.
∂t2 (x,t)
Temos então, usando estas duas igualdades e a expressão da força [Eq. (4.5)], que
∂2u
∂2u
=ρ 2.
2
∂x
∂t
(4.6)
∂ 2u
1 ∂ 2u
=
,
∂x2
vf2 ∂t2
(4.7)
Y
ou, finalmente,
com vf2 = Y /ρ, que é a conhecida equação de onda a uma dimensão(b) , que descreve uma onda que se propaga com velocidade vf . Podemos pois concluir que a
deformação se propaga longitudinalmente ao longo da barra, com uma velocidade
s
Y
vf =
.
(4.8)
ρ
Existem vários métodos para a resolução das equações diferenciais do tipo da
Eq. (4.7). Vamos aqui fazer um estudo das suas soluções recorrendo à análise
de Fourier, que nos permite exprimir qualquer movimento periódico como uma
sobreposição de movimentos harmónicos simples. Esta abordagem tem a vantagem
de pôr em evidência, de forma simples, as propriedades fı́sicas das soluções.
A função u(x, t) está definida apenas no interior do sólido, que tem comprimento
L. Escolhendo a origem das coordenadas numa extremidade do sólido, podemos
dizer que u está definida no intervalo x ∈ [0, L]. O desenvolvimento em séries de
Fourier é possı́vel apenas para funções periódicas, e nada nos garante que u(x, t) seja,
no intervalo [0, L], periódica. Mas é fácil construir uma função U (x, t), definida para
todos os valores de x, periódica com perı́odo L, e que tenha, nos pontos do intervalo
[0, L] o mesmo valor que u(x, t). Basta “copiar” u(x, t), do intervalo [0, L], para
os intervalos [−2L, −L], [−L, 0], [0, L], [L, 2L], etc, como mostra a Figura 4.4. As
(b) Ver qulaquer texto de fı́sica elementar, como o Nussensweig (Vol. 2), o Hallyday & Resnick
(Vol. 2), o Alonzo & Finn, etc.
4.2. ONDAS MECÂNICAS EM MEIOS CONTÍNUOS
45
U(x,t)
u(x,t)
x
0
L
x
-2L
0
-L
L
2L
3L
Figura 4.4: Continuação analı́tica de uma função definida no intervalo [0, L] a toda
a recta real.
duas funções u e U são matematicamente diferentes, mas fisicamente indistinguı́veis,
sendo pois aceitável, deste ponto de vista, fazer o desenvolvimento da função U , e
considera-lo o da função u.
O carácter periódico de U traduz-se matematicamente por
U (x + L, t) = U (x, t).
(4.9)
Particularizando para x = 0, vem
U (L, t) = U (0, t),
(4.10)
u(L, t) = u(0, t).
(4.11)
ou, porque nestes pontos U = u,
Assim, por forma a que a análise de Fourier das soluções seja simplificada, iremos
procurar soluções da Eq. (4.7), que satisfaçam, na fronteira do sólido, a condição (4.11). Condições fronteira do tipo da expressa em (4.11) chamam-se condições
fronteira periódicas. Com esta continuação analı́tica a toda a recta real, construimos
uma função periódica de perı́odo L, que pode, portanto, ser desenvolvida em série
de funções trigonométricas, através de(c)
X
u(x, t) =
ak (t)eikx .
(4.12)
k
Os coeficientes ak (t) deste desenvolvimento são funções do tempo que dependem,
obviamente, da função a desenvolver u(x, t). Apenas para ilustrar com um exemplo,
é fácil provar (faça-o) que, uma vez que o deslocamento u(x, t) é uma função real,
então os coeficientes devem satisfazer a condição ak (t) = a∗−k (t) , onde o asterisco
representa a operação de conjugação complexa. Estudaremos mais à frente alguns
detalhes adicionais da determinação dos coeficientes de Fourier.
Como se disse, o ı́ndice k no somatório da Eq. (4.12) não é um ı́ndice inteiro.
Sendo assim, não sabemos ainda como calcular a soma da série. Substituindo na
Eq. (4.9) a forma geral da solução da Eq. (4.12), obtemos
X
£
¤
ck (t)eikx eikL − 1 = 0.
k
Para que esta igualdade se verifique para todos os valores de x no intervalo de [0, L],
é necessário garantir que para todos os valores de k, se tenha exp(ikL) = 1, ou seja,
k=
(c) Note-se
2π
n,
L
n = 0, ±1, ±2, ... .
(4.13)
que nesta expressão k não é um ı́ndice inteiro, mas sim o número de onda da vibração
particular ak (t)eikx ; o lado direito desta expressão deve ler-se “soma para todos os valores possı́veis
do número de onda k, de ak (t)eikx ”.
46
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
Assim, notamos que a imposição de condições fronteira às soluções da equação de
onda, restringe fortemente os valores que o número de onda pode tomar.
Agora que conhecemos os valores possı́veis para o número de onda das componentes monocromáticas das vibrações de um meio unidimensional com comprimento
L, voltemos a atenção de novo para o cálculo dos coeficientes ck (t). Usando o desenvolvimento da Eq. (4.12) é imediato verificar que
X d2 ck (t)
∂ 2 u(x, t)
∂t2
=
∂ 2 u(x, t)
∂x2
= −
dt2
k
X
eikx
k 2 ck (t) eikx
k
Substituindo agora estes resultados na equação de onda [Eq. (4.7)], resulta
¸
X·
d2 ck (t) ikx
2 2
vf k ck (t) +
e
= 0,
dt2
k
tendo-se se usado a velocidade de propagação, definida na Eq. (4.8). Também aqui
se aplica o argumento de que a única maneira de garantir que esta soma se anule
para todos os valores de x, consiste em impor
vf2 k 2 ck (t) +
d2 ck (t)
= 0.
dt2
Esta equação diferencial admite soluções do tipo
ck (t) = ak e−iωk t ,
desde se verifique a igualdade
ωk = vf k.
(4.14)
A quantidade ωk que acabámos de introduzir é a frequência a angular da componente
monocromática com número de onda k. A relações entre a frequência angular e
o número de onda como a da Eq. (4.14) dá-se o nome de relações de dispersão.
Podemos então escrever o desenvolvimento em série de Fourier das soluções da
equação de onda como
X
u(x, t) =
ak ei(kx−ωk t) .
(4.15)
k
Conhecida a fução de deslocamento u(x, t), os coeficientes ak podem ser determinados como (verifique)
1
ak =
L
Z
L
dxu(x, t)e−i(kx−ωk t) .
0
A dedução da equação de onda [Eq. (4.7)] não é, de forma alguma, geral. Se
tivéssemos considerado deformações transversais, terı́amos obtido a equação de
onda para ondas transversais, que envolve outros coeficientes elásticos, diferentes
do módulo de Young Y . Assim, a velocidade de fase vf das ondas transversais pode
ser diferente da das ondas longitudinais.
Neste estudo, considerámos pequena a distância, δx, entre as duas secções que
limitam a porção de meio considerado, por forma a permitir a aproximação
∂F
F (x) − F (x + δx)
=
,
δx
∂x
(4.16)
4.2. ONDAS MECÂNICAS EM MEIOS CONTÍNUOS
47
que só é verdade se δx for pequeno quando comparado com as distâncias envolvidas em variações apreciáveis de F . Uma medida destas distâncias é, para ondas
monocromáticas, o comprimento de onda. Assim, a nossa dedução é válida se
δx ¿ λ.
(4.17)
Supor a distância δx pequena não é, por si só, uma aproximação, uma vez que se
trata de um parâmetro arbitrário numa construcção abstracta. No entanto, neste
cálculo desprezou-se a estrutura atómica do sólido (uma vez que o tratámos como
um meio contı́nuo), e isto só é razoável se apenas se considerarem distâncias muito
superiores àquelas em que essa estrutura microscópica se torna evidente, ou seja,
distâncias muito superiores às distâncias interatómicas tı́picas. Assim, devemos
satisfazer
δx À a,
(4.18)
onde a é o parâmetro da rede cristalina. Conjugando (4.17) e (4.18) concluimos que
o tratamento realizado só é válido para comprimentos de onda muito maiores que
as distâncias interatómicas tı́picas.
4.2.1
Vibrações de um meio contı́nuo tridimensional
Vamos agora generalizar o estudo precedente para o caso mais geral das vibrações
de um sólido tridimensional. Consideremos um sólido com a forma de um paralelipı́pedo com lados Lx , Ly e Lz , que consideraremos homogénio e isotrópico. Sujeito
a tensões, este sólido deforma-se, isto é, cada ponto do sólido sofre um deslocamento
u(r, t) relativamente à posição que ocupava antes da acção das tensões deformadoras. No regime das deformações elásticas (quando os deslocamentos são pequenos),
a deformação em cada ponto é proporcional à tensão nesse ponto e assim, se se
repetir o formalismo desenvolvido no caso unidimensional, obtêm-se as equações
de onda destas vibrações tridimensionais, em tudo semelhantes à da Eq. (4.7). No
entanto, apesar destas semelhanças, há um pormenor importante que complica ligeiramente o problema no caso tridimensional. É que num meio tridimensional
isotrópico podem-se considerar dois tipos diferentes de tensões, que produzem dois
tipos diferentes de deformações: há as tensões de compressão, que levam uma porção
do meio a “empurrar” as porções contı́guas, e há as de corte que levam uma porção
do meio a deslizar sobre as demais. As tensões de compressão são as responsáveis
pela propagação de vibrações longitudinais, ao passo que as de corte estão envolvidas na propagação das vibrações transversais. Em ambos os casos, as deformações
são proporcionais às tensões correspondentes, mas as constantes de proporcionalidade (chamam-se módulos elásticos na linguagem da fı́sica dos meios contı́nuos) são
diferentes, o que se traduz em diferentes velocidades de propagação para as ondas
logitudinais e transversais. Assim, em vez de apenas uma, devemos considerar duas
equações de onda, cada uma para cada tipo de vibração(d)
(d) Se
∇2 ul (r, t) −
1 ∂ 2 ul (r, t)
=0
vl2
∂t2
(4.19)
∇2 ut (r, t) −
1 ∂ 2 ut (r, t)
= 0.
vt2
∂t2
(4.20)
o meio não for isotrópico, o problema complica-se ainda mais, uma vez que então há três
tipos fisicamente distintos de polarização das vibrações, e a própria velocidade de propagação de
cada tipo de vibração pode ainda depender da direcção de propagação.
48
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
Estas equações de onda admitem soluções com a forma de sobreposições de ondas
planas monocromáticas
ul (r, t) =
X
A(k)ei(r·k−ωt)
(4.21)
B(k)ei(r·k−ωt) ,
(4.22)
k
ut (r, t) =
X
k
mas os dois tipos de polarização (longitudinal e transversal) devem satisfazer relações de dispersão diferentes, por serem diferentes as suas velocidades. Nestas expressões, A(k) e B(k) são dois vectores, o primeiro paralelo e o segundo perpendicular a k, mas que, aparte esta condição são arbitrários. São os transformados de
Fourier dos vectores de deslocamento ul e ut , respectivamente.
Tal como no caso unidimensional, também aqui as decomposições da deformação
como séries de Fourier discretas, apresentadas nas equações (4.21) e (4.22), são
possı́veis apenas para funções periódicas. Para garantir a periodicidade da deformação, introduzimos de novo condições fronteira periódicas, que se devem agora
verificar segundo as três direcções ortogonais. Isto é, devemos garantir que
u(x, y, z, t) = u(x + Lx , y, z, t)
= u(x, y + Ly , z, t)
= u(x, y, z + Lz , t),
(4.23)
(4.24)
(4.25)
o que resulta, ao nı́vel das ondas planas monocromáticas, numa discretização dos
vectores de onda, apenas se aceitando aqueles que verificam
2nπ
,
Lx
2mπ
ky =
,
Lx
2lπ
kz =
,
Lx
kx =
n = 0, ±1, . . .
(4.26)
m = 0, ±1, . . .
(4.27)
l = 0, ±1, . . . .
(4.28)
Os vectores de onda dos modos de vibração possı́veis num sólido contı́nuo com
forma paralelipipédica dispõem-se assim numa rede cristalina ortorrômbica com
vectores fundamentais que, escolhendo uma base convenientemente orientada, se
podem escrever como
2π
ex
Lx
2π
ey
B=
Ly
2π
ez .
C=
Lz
A=
(4.29)
(4.30)
(4.31)
Recordemo-nos mais uma vez que por cada um destes vectores de onda permitidos há três modos de vibração, que correspondem cada um a cada uma das três
polarizações possı́veis para uma vibração num sólido tridimensional.
Como no caso unidimensional, a aproximação de sólidos contı́nuos só é razoável
se se considerarem apenas distâncias muito superiores às distâncias interatómicas
tı́picas. Assim, este estudo só é válido no limite de grandes comprimentos de onda.
Vamos agora tentar descrever oscilações com comprimentos de onda da ordem de
grandeza das distâncias interatómicas.
4.3. VIBRAÇÕES DE UM MEIO CRISTALINO
4.3
49
Vibrações de um meio cristalino
As propriedades vibracionais de um cristal tridimensional são qualitativamente semelhantes às de um cristal unidimensional. Assim, uma abordagem unidimensional
é bastante instrutiva, na medida em que permite obter com facilidade resultados que
constituem versões simplificadas dos de um estudo mais geral mas que, apesar disso,
ilustram igualmente os principais efeitos fı́sicos das vibrações de um meio corpuscular. Por esta razão limitamos, nestes apontamentos, o estudo analı́tico detalhado
das vibrações em cristais a problemas unidimensionais. O leitor interessado pode (e
deve) complementar a leitura destes apontamentos com a dos textos recomendados.
4.3.1
Vibrações de uma cadeia monoatómica linear
Um cristal monoatómico unidimensional consiste num conjunto de átomos idênticos,
com movimentos de oscilação (consideramos apenas oscilações longitudinais, isto é,
com a direcção do próprio cristal) em torno de posições de de equilı́brio que se
dispõem alinhadas numa recta, igualmente espaçadas entre si. Identificando com
a coordenada x a posição nesta recta, e numerando vários átomos com ı́ndices
0, ±1, ±2, ... ± n, ..., podemos escrever a coordenada Xn da posição de equlı́brio do
n-ésimo átomo na forma
Xn = na,
(4.32)
onde a é a distância interatómica (é o parâmetro desta rede cristalina unidimensional) e a origem x = 0 foi escolhida por forma a coincidir com a posição do
0-ésimo átomo (ver a Figura 4.5). Os átomo oscilam em torno das suas posições de
-3a
-2a
-a
0
a
2a
3a
Figura 4.5: Modelo harmónico de rede cristalina de um cristal unidimensional.
equilı́brio, e assim, em geral, as posições que ocupam não são coincidentes com as
suas posições de equilı́brio. É conveniente introduzir as variáveis un (t), que medem,
como função do tempo, as distâncias que separam os átomos das suas posições de
equilı́brio. A posição do n-ésimo átomo num instante arbitrário t é então dada por
xn (t) = Xn + un (t).
(4.33)
No quadro da aproximação harmónica, as interacções entre os átomos que formam
o cristal são consideradas interacções elásticas, ou seja, os cristais monoatómicos
unidimensionais são descritos como um conjunto de átomos iguais dispostos numa
linha recta, unidos entre si por molas microscópicas com constantes elásticas iguais
k = ∂ 2 φ/∂x2 e iguais comprimentos naturais a (ver Figura 4.6). Consideremos, num
n-2
n-1
n
n+1
n+2
Figura 4.6: Os cristais monoatómicos unidimensionais na aproximação harmónica.
cristal monoatómico unidimensional harmónico assim descrito, um átomo qualquer
n, e calculemos, num instante arbitrário t, a força que os seus vizinhos mais próximos
exercem sobre ele. O átomo n − 1 exerce sobre o átomo n uma força que, de acordo
50
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
com a aproximação harmónica(e) , é dada por
Fn−1,n (t) = −α [un (t) − un−1 (t)] ;
(4.34)
da mesma maneira, a força que o átomo n + 1 exerce sobre o mesmo átomo é
Fn+1,n (t) = −α [un (t) − un+1 (t)] .
(4.35)
Desprezando as forças que os restantes átomos exercem sobre o átomo n, a resultante
das forças que sobre ele actuam é
Fn (t) = α [un−1 (t) − 2un (t) + un+1 (t)] .
(4.36)
De acordo com a segunda lei de Newton, estas força é igual à massa, m, do átomo
em estudo, a multiplicar pela sua aceleração que, tendo em conta a Eq. (4.33), é
dada por an (t) = d2 un /dt2 . Obtemos então, finalmente, a equação de onda para
meios cristalinos
d2 un
α
[un−1 (t) − 2un (t) + un+1 (t)] .
=
dt2
m
(4.37)
Mais uma vez, tentamos obter soluções com a forma de sobreposições de ondas
monocromáticas
un (t) = ei(kXn −ωt) .
(4.38)
Substituindo esta funções em (4.37), obtemos
i
α h i(kXn−1 −ωt)
− ω 2 ei(kXn −ωt) =
e
− 2ei(kXn −ωt) + ei(kXn+1 −ωt)
m
¤
α i(kXn −ωt) £ −ika
=
e
e
− 2 + eika ,
(4.39)
m
onde se usou (4.33). Recorrendo agora à fórmula de Euler,
eiθ = cos θ + i sin θ,
(4.40)
é fácil provar que eiθ + e−iθ = 2 cos θ. A Eq. (4.39) pode pois escrever-se como
ω2 = 2
α
(1 − cos ka).
m
(4.41)
Notemos agora que
cos ka = cos2
ka
ka
ka
− sin2
= 1 − 2 sin2
,
2
2
2
de forma que, substituindo em 4.41, obtemos finalmente
r ¯
¯
α ¯¯
ka ¯¯
ω=2
sin
.
m¯
2 ¯
(4.42)
Esta é a relação de dispersão para os cristais unidimensionais. O gráfico da função
de dispersão (4.42) está representada na Figura 4.7. No limite de grandes comprimentos de onda, k aproxima-se de zero e a relação de dispersão fica praticamente
linear, à semelhança das relações de dispersão para as vibrações de meios contı́nuos:
r ¯ ¯
r
α ¯¯ ka ¯¯
α
|k|.
(4.43)
ω(k)k→0 −→ 2
=
a
m¯ 2 ¯
m
(e) É
trivial verificar que a força, F , deriva do potencial, F = − ∂φ
.
∂x
4.3. VIBRAÇÕES DE UM MEIO CRISTALINO
51
f
w=v
|
k|
w
w
m
k
−2π /a
−π /a
0
π /a
2π /a
Figura 4.7: Relação de dispersão para as vibrações num cristal monoatómico unidimensional e limite para grandes comprimentos de onda.
Este facto não nos deve espantar, pois chegamos, no estudo das vibrações dos meios
contı́nuos, à conclusão que a análise só era válida para grandes comprimentos de
onda.
A frequência máxima permitida para as vibrações longitudinais numa cadeia
monoatómica linear é
r
α
ωm = 2
.
(4.44)
m
De forma semelhante, poderı́amos concluir que para as vibrações transversais há
também uma frequência máxima, se bem que com valor diferente (normalmente inferior) do apresentado acima, caracterı́stico das longitudinais. Então, verificamos que
não é possı́vel a propagação de ondas vibracionais numa cadeia monoatómica unidimensional com frequência acima de um certo valor limite. A cadeia monoatómica
linear comporta-se assim como um filtro passa-baixo, que corta as frequências superiores ao valor máximo ωm .
Uma das principais caracterı́sticas das relações de dispersão em meios cristalinos
unidimensionais [Eq. (4.41)] é o facto de ω ser uma função periódica de k, de perı́odo
2π/a, ou seja,
µ
¶
2π
ω k+
= ω(k).
(4.45)
a
Assim, basta-nos conhecer a função ω(k) num intervalo de amplitude 2π/a, por
exemplo,
i π πi
,
(4.46)
k∈ − ,
a a
para determinar a função ω(k) para todos os valores de k. Analisando mais detalhadamente esta questão, o próprio significado fı́sico de números de onda k superiores a
π/a deve ser posto em causa. Com efeito, ondas planas com valores de k superiores
a π/a, k > π/a produzem deslocamentos idênticos aos produzidos por ondas planas
com valores de k no intervalo (4.46), que se obtêm do primeiro somando-lhe ou
subtraindo-lhe um múltiplo inteiro de 2π/a. Por exemplo, na Figura 4.8 representamos duas ondas planas monocromáticas num cristal monoatómico unidimensional
de parâmetro a, com diferentes números de onda k e k 0 , mas que produzem os mesmos deslocamentos atómicos unidimensionais, sendo pois, do ponto de vista fı́sico,
indistinguı́veis. A primeira tem comprimento de onda λ = 4a, e portanto k = π/2a;
a segunda tem k 0 = k + 2π/a = 5π/2a, e portanto λ0 = 4a/5. Os deslocamentos
52
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
a
k= π /2a
λ = 4a
k´=5 π /2a
λ ´= 4a/5
Figura 4.8: Deslocamentos atómicos idênticos, produzidos por duas ondas planas com
diferentes valores do número de onda. Valores de k superiores π/a não têm significado
fı́sico.
atómicos são, como podemos verificar, os mesmos; assim as duas ondas são indistinguı́veis e portanto nunca é necessário considerar o valor k 0 = 5π/2a, por este ser
equivalente a k = k 0 − 2π/a = π/2a.
Note-se que a rede recı́proca de uma rede unidimensional de parâmetro a é uma
rede unidimensional de parâmetro A = 2π/a. Uma célula unitária de Wigner-Seitz
(veja a Secção 2.2) da rede recı́proca deste cristal é uma porção de espaço-k compreendida entre −A/2 e A/2, ou seja, −π/a e π/a. Dá-se o nome de primeira zona de
Brillouin à célula unitária de Wigner-Seitz da rede recı́proca. O que acabámos de
ver foi que podemos restringir a relação de dispersão à primeira zona de Brillouin,
pois os valores de k no seu exterior produzem efeitos equivalentes, dada a periodicidade da relação de dispersão. Esta periodicidade pode ser expressa na forma
ω(k) = ω(k + G),
(4.47)
onde G é um “vector”(f) da rede recı́proca.
Valores de k na fronteira da primeira zona de Brillouin estão associados a ondas
estacionárias. De facto, quando k = ±π/a o deslocamento toma a forma
un (t)
= ei(kna−ωt)
= ei(±nπ−ωt)
= cos(nπ)e−iωt ,
(4.48)
que não é mais que a equação de uma onda estacionária onde átomos consecutivos
movem-se em oposição de fase, porque cos(nπ) = ±1 consoante o número inteiro
n é par ou impar. Como podemos verificar, não se distinguem os deslocamentos
produzidos por ondas com vector de onda k = −π/a e k = π/a, ficando assim
(f) “vector”aparece
entre aspas porque temos estado a lidar com situações unidimensionais.
4.3. VIBRAÇÕES DE UM MEIO CRISTALINO
53
a
a/2
A
B
A
B
Figura 4.9: Cadeia biatómica unidimensonal.
justificada a necessidade da utilização de um conjunto aberto em (4.46) para indicarmos os números de onda possı́veis na cadeia unidimensional. Podemos também
constatar o aparecimento de ondas estacionárias para k = ±π/a, através do cálculo
da velocidade de grupo,
vg
dω
dk
µ ¶
ka
a
= ω0 cos
,
2
2
=
(4.49)
que se anula quando k = ±nπ/a, sendo n um inteiro qualquer.
4.3.2
Vibrações de uma cadeia biatómica linear
Vamos agora abordar um problema um pouco mais geral que o que acabámos de
estudar, considerando agora as vibrações das cadeias biatómicas. O estudo que
vamos fazer é muito semelhante ao anterior; apesar disso, o comportamento das
cadeias biatómicas distingue-se do das cadeisas monoatómicas em alguns aspectos
bastante interessantes. Consideremos então um cristal unidimensional composto
por átomos de duas espécies A e B, e suponhamos, para simplificar, que o motivo
cristalino consiste em um átomo da espécie B situado no centro da célula unitária
definida pelas posições dos átomos da espécie A (ver a Figura 4.9). Admitimos que
os átomos podem oscilar em torno das posições de equilı́brio definidas no motivo
cristalino, mas vamos apenas considerar deslocamentos longitudinais. Para simplificar a linguagem, identicamos as as diversas instâncias do motivo cristalino através
de um número inteiro n que toma valores desde n = 0 até n = N − 1, onde N é o
número total de átomos de cada espécie. As posições de equilı́brio dos dois átomos
que constituem a n-ésima célula unitária são
Xn(A)
Xn(B)
= na
= (n + 1/2)a,
designando por a o comprimento das células unitárias e escolhendo a origem do
sistema de coordenadas coincidente com a posição de equilı́brio do átomo A da zeroésima célula unitária. Designemos os deslocamentos dos átomos A e B da n-ésima
B
célula unitária respectivamente por uA
n (t) e un (t) (ver a Figura4.10). Aceitemos a
uB
n
uA
n
uB
n-1
a/2
a/2
uA
n+1
a/2
Figura 4.10: Deslocamentos atómicos numa cadeia biatómica unidimensional.
aproximação elástica e suponhamos (para simplificar) que os parâmetros do limite
54
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
elástico (distância de equilı́brio, a/2, e constante elástica, α) são idênticos para
as ligações A–B e B–A(g) . Analisemos o movimento dos átomos de cada espécie
quı́mica. Considerando apenas as interacções entre vizinhos mais próximos, a força
que actua no átomo A da n-ésima célula unitária é
FnA = mA
¡
¢
d2 uA
n
A
B
= α uB
n−1 − 2un + un ,
2
dt
(4.50)
ao passo que a que actua no átomo de espécie B é
FnB = mB
¡
¢
d2 uB
n
B
A
= α uA
n − 2un + un+1 .
2
dt
(4.51)
Estas são duas equações de um sistema de 2N equações diferenciais acopladas cuja
resolução não é, na prática, viável, devido ao número muito grande de equações
que formam o sistema (tipicamente, N ≈ 1023 ). Em vez desta resolução explı́cita,
procuramos soluções com a forma de sobreposições de ondas monocromáticas
X
A
i(kXn
−ωk t)
uA
cA
(4.52)
n (t) =
ke
k
uB
n (t)
=
X
B
i(kXn −ωk t)
cB
,
ke
(4.53)
k
onde os coeficientes de amplitude dos movimentos dos átomos de espécie A, cA
k não
são, necessariamente, iguais aos dos átomos de espécie B, cB
.
Note-se
também
que,
k
como no caso monoatómico, o indı́ce k não representa um indı́ce inteiro, antes se
devendo interpretar estes dois desenvolvimentos como a “soma para todos os valores
possı́veis do número de onda k”, sendo o conjunto dos valores possı́veis por enquanto
não definido. Substituindo estes desenvolvimentos nas eqs. (4.50)e (4.51), obtemos
·
µ
¸¶
ika/2
X
+ e−ika/2
Be
A
−
c
+
2α
c
ei(kna−ωk t) −mA ωk2 cA
= 0
k
k
k
2
k
µ
·
¸¶
ika/2
X
+ e−ika/2
B
Ae
ei(kna−ωk t) −mB ωk2 cB
+
2α
c
−
c
= 0.
k
k
k
2
k
Dada a independência linear das funções exponenciais exp[i(kna − ωk t)], a única
maneira de garantir a validade destas duas igualdades em qualquer instante t é
impor que sejam nulos os coeficientes que multiplicam as exponenciais:
µ
¶
ika/2
+ e−ika/2
A
Be
−
c
−mA ωk2 cA
+
2α
c
= 0
k
k
k
2
µ
¶
ika/2
+ e−ika/2
B
Ae
−mB ωk2 cB
+
2α
c
−
c
= 0.
k
k
k
2
Usando a bem conhecida igualdade
eika/2 + e−ika/2
= cos
2
µ
ka
2
¶
,
podemos ainda reescrever estas equações como
ka B
c
2 k
= 0
(4.54)
ka A
c (2α − mB ωk ) cA
k
2 k
= 0.
(4.55)
(2α − mA ωk ) cA
k − 2α cos
−2α cos
(g) Esta suposição não é necessária para a presente discussão, mas simplifica ligeiramente o formalismo. Ver o problema 3.
55
-1
ω (s )
4.3. VIBRAÇÕES DE UM MEIO CRISTALINO
-π/a
-π/2a
π/2a
0
π/a
-1
k (m )
Figura 4.11: As relações de dispersão para os dois modos vibracionais (ambos longitudinais) de uma cadeia biatómica linear. A curva que tem um máximo para k = 0
respeita ao modo óptico; a outra é a do modo acústico.
Substituimos desta maneira o sistema de 2N equações diferenciais acopladas das
eqs. (4.50) e (4.51) por um conjunto de sistemas de 2 equações algébricas homogénias, como o representado acima para o modo vibracional com número de onda
k. Como se sabe das aulas de Álgebra Linear, os sistemas de equações algébricas
homogénias só tem soluções não triviais (ou seja, tais que cA,B
6= 0) se se anular o
k
determinante da matriz formada pelos coeficientes, isto é, se
¯
¯
¯ 2α − mA ω 2
¯
−2α cos ka
k
2
¯
¯
¯ −2α cos ka −2α − mB ω 2 ¯ = 0,
k
2
ou seja, se
¶
µ
ka
= 0,
mA mB ωk4 − 2α(mA + mB )ωk2 + 4α2 1 − cos2
2
ou ainda, recorrendo à igualdade fundamental da trigonometria,
mA mB ωk4 − 2α(mA + mB )ωk2 + 4α2 sin2
ka
= 0.
2
Esta equação de segundo grau (em ωk2 ) admite as seguintes duas soluções:
sµ
¶2
m
+
m
mA + mB
4
ka
A
b
2
ωk = α
±α
−
sin2
.
mA mB
mA mB
mA mB
2
(4.56)
(4.57)
Vemos assim que para cada valor de k há em geral duas frequências possı́veis , cujas
representações gráficas estão esboçadas na Figura 4.11. Uma das soluções (a que se
anula para k = 0) tem o nome de ramo acústico; a outra (que apresenta um máximo
para k = 0) designa-se por ramo óptico. A existência de dois comportamentos
vibracionais distintos, com relações de dispersão diferentes, é uma caracterı́stica
dos cristais biatómicos reais.
4.3.3
Vibrações de um cristal tridimensional
Vamos agora fazer um estudo, menos detalhado que o anterior, das vibrações num
cristal tridimensional.
As ondas planas monocromáticas em três dimensões num meio cristalino escrevem-se como
un,k (t) = A ei(k·Rn −ωt) ,
(4.58)
56
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
onde Rn é o vector que indica a posição de equilı́brio do átomo-n. Note-se que a
função onda é naturalmente uma grandeza vectorial cujas componentes, calculadas
no ponto correspondente à posição de equilı́brio de um dado átomo, são iguais às
componentes do deslocamento desse átomo relativamente à sua posição de equilı́brio.
Consideremos um sólido com dimensões Na a×Nb b×Nc c em que a, b e c representam
os módulos dos vectores da rede directa e Na , Nb e Nc é o número de células
unitárias em cada uma das três direcções fundamentais. Deste modo, o sólido
contém um número total de Na Nb Nc células unitárias e igual número de átomos (no
caso monoatómico que mais nos interessa aqui). As condições fronteira periódicas
para este sólido são
A ei(k·Rn −ωt)
A ei(k·Rn −ωt)
A ei(k·Rn −ωt)
= A ei(k·[Rn +Na a]−ωt) ,
= A ei(k·[Rn +Nb b]−ωt) ,
= A ei(k·[Rn +Nc c]−ωt) ,
(4.59)
de onde resultam as seguintes relações de quantização
l
Na
m
k · b = 2π
Nb
n
k · c = 2π
Nc
k · a = 2π
que são satisfeitas se
k=
l = 0, ±1, ±2, . . .
m = 0, ±1, ±2, . . .
n = 0, ±1, ±2, . . . ,
l
m
n
A+
B+
C,
Na
Nb
Nc
(4.60)
(4.61)
onde A, B e C são os vectores fundamentais da rede recı́proca do cristal em estudo,
definidos na Eq. (3.7). Os vectores de onda permitidos num cristal monoatómico
são assim vectores de uma rede relacionada com a rede recı́proca desse cristal, mas
em que os vectores fundamentais são A/Na , B/Nb e C/Nc .
Note-se que duas ondas planas com vectores de onda k e k0 cuja diferença é
um vector da rede recı́proca são equivalentes, no sentido em que os deslocamentos
atómicos associados são os mesmos. Senão vejamos; consideremos um modo de
vibração com um vector de propagação k0 = k + G em que G é um vector da rede
recı́proca. A expressão do deslocamento do n-ésimo átomo é
un,k0 (t) = A ei(k·Rn +G·Rn −ωt) = A ei(k·Rn −ωt) = un,k (t),
(4.62)
porque G · Rn é sempre um múltiplo de 2π (recordemos que Rn = n1 a + n2 b +
n3 c com n1 , n2 e n3 inteiros). Assim, verifica-se que à infinidade de vectores
de onda k dados pela Eq. (4.61) não corresponde uma infinidade de modos de
vibração fisicamente distintos. Por exemplo, apesar de serem diferentes soluções da
Eq. (4.61), os vectores de onda
k
=
k0
=
A
Na
(Na + 1)
A + B,
Na
correspondem a modos de vibração idênticos. Quando escrevemos os deslocamentos atómicos como conbinação linear de ondas planas monocromáticas, devemos ter
em atenção este facto e evitar, nos desenvolvimentos, este tipo de sobreposições.
Basta, para tal, considerar apenas vectores de onda, k, no interior de uma única
célula unitária primitiva da rede recı́proca, sendo a escolha mais usual a da célula
4.4. A DENSIDADE DE MODOS DE VIBRAÇÃO
57
de Wigner-Seitz (veja a Secção 2.2), ou seja, a primeira zona de Brillouin. Esta
restricção à primeira zona de Brillouin fica assegurada se considerarmos, na combinação linear da Eq. (4.61), inteiros n, m e l limitados aos intervalos
¸
¸
1
1
n ∈ − Na , Na
2
2
¸
¸
1
1
m ∈ − Nb , Nb
2
2
¸
¸
1
1
l ∈ − Nc , Nc .
2
2
Os números inteiros n, m, e l podem então tomar um número total de valores de
Na , Nb , Nc , respectivamente, o que implica existir um total de Na Nb Nc vectores de
propagação possı́veis, exactamente igual ao número total de átomos no sólido. Uma
vez que existem três modos de vibração para cada vector de onda (um longitudinal
e dois transversais), o número total de modos de vibração é igual ao número de
graus de liberdade no sólido, 3Na Nb Nc .
Note-se que as ondas planas monocromáticas apresentadas na Eq. (4.58) são
solução das equações de onda se satisfizerem relações de dispersão que não foram deduzidas, mas que consistem em relações mais ou menos complexas entre
a frequência ω e o vector de onda k. Na aproximação de grandes comprimentos de
onda, um cristal pode ser tratado como um meio contı́nuo, homogénio e isotrópico,
de forma que nessa aproximação, se obtêm relações de dispersão semelhantes às
já apresentadas. Mas, se quisermos melhorar a análise e considerar vibrações com
comprimentos de onda comparáveis com as distâncias interatómicas, teremos que
ver o cristal como um meio altamente anisotrópico e não homogénio. Assim, a velocidade de propagação de uma onda plana depende não só do módulo do vector de
onda como no caso unidimensional, mas também da sua polarização (e neste caso,
as situações relevantes não se reduzem às das vibrações longitudinais e transversais),
e ainda da direcção do vector de onda! A dedução geral da forma das relações de
dispersão num cristal tridimensional é assim um problema muito complexo, e que
não tem, em geral, solução analı́tica.
4.4
A densidade de modos de vibração
Como acabámos de ver, a imposição de condições fronteira restringe fortemente o
vector de onda das soluçoes das equações de onda. No caso unidimensional, de
todos os valores reais que k pode tomar, apenas se podem aceitar aqueles que
satisfazem (4.13), que aqui reescrevemos
k=
2π
n,
L
n = 0, ±1, ±2, ... .
(4.63)
Estas condições fronteira foram pela primeira vez introduzidas por Born e Von
Kármán. Podemos mais facilmente interpretá-las se imaginarmos que a cadeia linear
de átomos e molas forma uma circunferência fechada em que o primeiro átomo da
cadeia coincide com o último.
Suponhamos que estamos interessados em determinar quantos valores de k,
aceitáveis nos termos que acabámos de referir, existem num intervalo dk do “espaçok”. De acordo com (4.63), a separação entre modos de vibração contı́guos (ou seja,
entre k 0 s vizinhos) é de δ = 2π/L. O número de modos no intervalo dk é pois,
dn =
L
dk
=
dk.
δ
2π
(4.64)
58
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
Assim, usando a relação de dispersão (4.14) (por simplicidade, vamos para já restringir o estudo a grandes valores do comprimento de onda), este resultado pode
ser expresso em termos da frequência ω, já que
dk =
dk
1
1
dω =
dω =
dω.
dω
dω/dk
vf
(4.65)
Obtemos então dn = L/(2πvf )dω, mas este resultado ainda tem que ser multiplicado
por 2, já que a cada valor de ω correspondem dois valores de k, dados por k =
±ω/vf . Resumindo, obtemos,
L
dω.
πvf
dn =
(4.66)
Esta equação permite-nos calcular o número de modos de vibração, dn, existentes
no intervalo de frequência dω. Dá-se o nome de densidade de modos de vibração à
derivada dn/dω. Neste caso, a densidade de modos de vibração é
g(ω) =
L
.
πvf
(4.67)
Vejamos agora o caso tridimensional, aceitando ainda o limite de grandes comprimentos de onda, em que o comportamento dos cristais é semelhante ao dos
meios contı́nuos. Consideremos um sólido com forma paralelipipédica como o da
Secção 4.2.1, com dimensões Lx , Ly e Lz . As condições fronteira periódicas para
este sólido resultam nas condições de quantização apresentadas nas equações (4.26)–
(4.28), segundo as quais os vectores de onda k permitidos formam um rede cristalina definida pelos vectores apresentados em (4.29)–(4.31). Esta rede cristalina tem
células unitárias primitivas com volume (2π)3 /V , onde V = Lx Ly Lz é o volume do
sólido considerado. Assim, cada ponto desta rede (ou seja, cada vector de onda k)
tem disponı́vel o “volume” de espaço-k
δ3 =
(2π)3
.
V
(4.68)
Numa esfera de raio k, cujo volume é 4πk 3 /3, existem
n=
4
3
3 πk
3
(2π)
V
=
V
4π 3
k ,
(2π) 3
3
(4.69)
vectores de propagação permitidos. Se diferenciarmos esta equação, obtemos o
número de vectores de onda com módulo compreendido entre k e k + dk, correspondendo à zona sombreada na Figura 4.12. Obtemos assim
dn =
V 2
k dk,
2π 2
e usando a relação de dispersão de um meio contı́nuo (4.14);
dn =
V ω 2 dω
,
2π 2 vf vf
de onde resulta a seguinte expressão para a densidade de modos de vibração:
g(ω) =
V ω2
.
2π 2 vf 3
(4.70)
Note-se que nesta expressão apenas estamos a considerar que a cada valor do vector
de onda k corresponde apenas um modo de vibração. Em geral isto não é verdade,
4.4. A DENSIDADE DE MODOS DE VIBRAÇÃO
59
ky
kx
Figura 4.12: Na região a sombreado o vector de onda
entre k e k + dk.
k
tem módulo comprendido
pois devemos recordar que os deslocamentos atómicos são grandezas vectoriais, e
portanto a função de onda un,k (R, t) também o é. As componentes deste vector,
calculadas no ponto correspondente à posição de equilı́brio de um dado átomo n, são
iguais às componentes do deslocamento desse átomo relativamente à sua posição de
equilı́brio. À orientação da oscilação numa onda vibracional dá-se o nome de polarização dessa onda. Para cada vector de onda k há então três modos independentes
de oscilação, correspondendo às três direcções ortogonais do espaço. É frequente
a escolha destas direcções em função da direcção do vector k. À componente de
u na direcção de k chama-se a polarização longitudinal; às outras duas dá-se o
nome de polarização transversal (ver Figura 4.13). Tendo em linha de conta as três
u1
u
u2
uL
k
Figura 4.13: As três componentes da polarização de uma onda plana monocromática.
Dado o deslocamento u, apresentam-se a polarização logitudinal uL e as duas polarizações transversais u1 e u2 .
polarizações independentes, a Eq. (4.70) complica-se um pouco. Demonstra-se (ver
problemas) que se as três polarizações têm a mesma velocidade de fase, a densidade
de modos é tripla da dada por (4.70), isto é
g(ω) =
3V ω 2
.
2π 2 vf 3
(4.71)
Note-se que, para obtermos a densidade de modos de vibração da Eq. (4.70),
usámos a relação de dispersão da Eq. (4.14), que é válida apenas para grandes comprimentos de onda e supondo que o meio é isotrópico, de tal forma que a frequência
angular da radiação depende apenas do seu comprimento de onda, mas não da direcção de propagação. Como sabemos, os cristais não apresentam esta priopriedade,
mas, mesmo assim, a Eq. (4.70) é uma aproximação muito razoável para a densidade de modos de vibração de uma dada polarização, desde que não se considerem
comprimentos de onda comparáveis com a distância interatómica.
Por outro lado, e como já foi dito antes, as ondas transversais e longitudinais têm,
em princı́pio, e mesmo em meios homogéneos, velocidades de propagação diferentes.
60
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
Logo, devemos concluir que (4.71) não é, em geral, rigorosamente válida (ver o
problema 4 no fim deste capı́tulo).
Para obtemos a densidade dos meios cristalinos, devemos usar a relação de
dispersão válida em cristais, ou seja, algo que esteja mais próximo de (4.42) do que
de (4.14). Mas adaptar simplesmente a relação de dispersão (4.42) é um método
“perigoso”, pois todo este formalismo supõe o meio isotrópico. Ora um sólido só se
pode considerar isotrópico caso se despreze a sua estrutura cristalina, como deve,
nesta altura, ser claro.
4.5
O problema do calor especı́fico
O calor especı́fico molar de uma substância é o calor necessário para elevar a temperatura de uma mole dessa substância em 1◦ C. Se o processo de aquecimento for
feito a volume constante, o trabalho realizado é nulo, e portanto o calor fornecido
ao sistema é igual à sua variação de energia dE. Assim, o calor especı́fico a volume
constante é definido como
¶
µ
∂E
,
(4.72)
Cv =
∂T V
O calor especı́fico dos sólidos apresenta uma dependência da temperatura caracterı́stica, representada na Figura 4.14. CV anula-se no zero absoluto de temperatura (0◦ K≈ −273◦ C) apresentando, para valores baixos de temperatura uma
CV
3R
α T3
0
T
Figura 4.14: Calor especı́fico dos sólidos como função da temperatura.
dependência, CV ∝ T 3 ; para valores altos de T , o calor especı́fico é praticamente
constante e igual a 3R(h) , para todos os sólidos. A esta constância do calor especı́fico a altas temperaturas dá-se o nome de Lei de Dulong e Petit. Vamos de
seguida tentar explicar este comportamento do calor especı́fico, por aproximações
sucessivas.
4.5.1
Modelo Clássico
De acordo com o modelo que temos vindo a desenvolver, um sólido consiste num
conjunto de átomos que podem oscilar em torno de posições de equilı́brio fixas nas
posições que definem a sua estrutura cristalina. Aceitando que estes deslocamentos
são pequenos, vimos já que podemos considerar cada átomo sujeito a forças elásticas.
(h) R é a constante dos gases ideais, com o valor R = 8, 3144 J/K mol. R satisfaz a seguinte
relação com a constante de Boltzman kB , e o número de Avogrado, NA ; R = kNA
4.5. O PROBLEMA DO CALOR ESPECÍFICO
61
Note-se que, para além de átomos “presos” às suas posições de equilı́brio, os
sólidos podem também conter electrões práticamente livres no seu interior, de acordo
com o modelo clássico dos metais. Esta possibilidade introduz um termo adicional
na análise que vamos agora desenvolver, que não será tomada em linha de conta.
Assim, o que se segue é válido apenas para sólidos isoladores, e o problema do calor
especı́fico dos condutores será abordado mais adiante, no próximo capı́tulo destes
apontamentos.
Consideremos, então, cada átomo como um oscilador harmónico tridimensional.
É bem sabido que um oscilador harmónico tridimensional se pode descrever como
a reunião de três osciladores unidimensionais independentes. Podemos então, em
resumo, tratar um sólido com N átomos como um conjunto de 3N osciladores
harmónicos unidimensionais. Considerando o sólido em equilı́brio termodinâmico,
todos estes osciladores devem ter a mesma energia média hεi. A energia total do
sólido é então
E = 3N hεi.
(4.73)
A energia de cada oscilador, ε, pode ser calculada recorrendo à fı́sica estatı́stica.
A probabilidade de que um oscilador harmónico unidimensional, em equilı́brio termodinâmico com um ambiente à temperatura T , esteja num estado com energia
compreendida entre os valores ε e ε + dε é dada pela lei de Boltzman:
dP (ε) = f (ε)dε = Ae
− k εT
B
dε,
(4.74)
onde kB é a constante de Boltzman(i) e A é uma constante de normalização, que
deve ser ajustada por forma a que a soma das probabilidades seja unitária:
Z ∞
dP (ε) = 1.
(4.75)
0
Daqui resulta
A=
1
.
kB T
(4.76)
Podemos identificar a energia de cada oscilador no sólido com o calor expectável da
energia, ou seja
Z
Z ∞
1
− ε
(4.77)
hεi = f (ε)εdε =
dε εe kB T .
kB T 0
Este integral é facilmente resolvido por partes, obtendo-se
hεi = kB T .
(4.78)
Substituindo este valor em (4.73), obtemos o valor total da energia do sólido:
E = 3N kB T .
(4.79)
Refira-se que este resultado poderia ter sido obtido de forma equivalente usando o
Teorema da Equipartição da Energia, de acordo com o qual cada termo quadrático
na expressão da energia de um sistema de muitas partı́culas idênticas contribui com
kB T /2 para a energia média do sistema em equilı́brio termodinâmico à temperatura
T ; neste caso em que cada partı́cula do sistema é um oscilador harmónico, temos,
por cada uma, seis termos quadráticos na energia, três para a energia potencial
[k(x2 + y 2 + z 2 )/2] e outros três para a energia cinética [m(vx2 + vy2 + vz2 )/2], ou seja,
uma contribuição de 6 × kB T /2 = 3kB T para a energia média do sistema. Uma
(i) k
B
= 1, 381 × 10−23 J/K
62
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
vez que o número total de partı́culas é N , obtemos por multiplicação o resultado
apresentado.
Derivando agora a energia em ordem à temperatura obtemos o calor especı́fico,
de acordo com a sua definição (4.72). Se considerarmos uma mole de átomos obtemos finalmente
CV = 3NA kB T = 3R.
(4.80)
que está de acordo com a lei de Dulong e Petit mas não reproduz os resultados experimentais a baixas temperaturas. Este facto foi, durante algum tempo, argumento
de peso contra a hipótese atómica da matéria, até que em 1907 Einstein propôs um
tratamento diferente, em que as oscilações da rede cristalina são “quantizadas”, de
forma semelhante à quantização do campo electromagnético efectuada por Plank
no estudo da radiação do corpo negro. Em analogia com o termo “fotão”que se
refere aos quanta do campo electromagnético, designam-se por “fonões”os quanta
das oscilações mecânicas nos sólidos. Vamos de seguida seguir este formalismo.
4.5.2
Modelo de Einstein
Em 1900, Plank verificou que o espectro de radiação térmica emitida pelos chamados
corpos negros (corpos que absorvem toda a radiação electromagnética que neles
incide) pode ser descrito com exactidão supondo que, na interacção entre a matéria
e o campo electromagnético, só pode haver transferência de energia em quantidades
múltiplas da unidade básica hν, onde h é a constante de Plank(j) e ν é a frequência
envolvida no processo.
Esta suposição era, na altura, completamente injustificável e foi considerada
como um mero truque de “engenharia algébrica”por toda a comunidade cientı́fica,
incluindo o próprio Plank, porque parecia indicar que a radiação electromagnética
seria constituida por partı́culas. O debate sobre a natureza da luz (ondas ou
partı́culas) vinha desde os tempos de Newton (partidário da Natureza corpuscular) e Huyghens (que apoiava a descrição ondulatória) e tinha, aparentemente, sido
resolvido, experimentalmente, já no século XVIII, pelos trabalhos de Young e de
Fresnel, a favor da hipótese ondulatória. O “truque”de Plank viria assim, caso fosse
aceite como descrição de algo real, a baralhar (de novo) as cartas. Por esta razão,
os fı́sicos acreditavam que, mais tarde ou mais cedo, um tratamento clássico do
corpo negro seria elaborado, no qual a hipótese de Plank não fosse necessária, ou
surgisse devidamente justificada no contexto da teoria ondulatória da radiação. Um
dos poucos fı́sicos que não partilhavam esta opinião era Albert Einstein.
Segundo Einstein, a radiação electromagnética é de facto constituida por partı́culas chamadas fotões com uma massa em repouso nula e com energia dada por
hν, de acordo com a hipótese de Plank. No entanto, o carácter ondulatório da
luz não é eliminado, até porque na própria expressão de energia, E = hν, está
presente a frequência, ν, que é uma quantidade tipicamente ondulatória. Einstein
compatibilizou estes aspectos aparentemente contraditórios interpretando estatisticamente o campo (ou função de onda) da radiação. Concretamente, Einstein propôs
que a intensidade (caracterı́stica ondulatória) da radiação numa região do espaço é
proporcional ao número de fotões nela presente.
Com esta descrição da radiação, Einstein explicou quantitativamente os resultados das experiências sobre o efeito fotoeléctrico em 1905. Apesar deste sucesso,
continuou relativamente isolado na defesa do carácter realista da hipótese de Plank,
até ao ano 1922 em que Comptom expôs os seus trabalhos sobre a dispersão de
electrões pela radiação, “encerrando”a questão a favor de Einstein. Para dar mais
consistência à hipótese de Plank, Einstein tentou aplicá-la noutros domı́nios, nome(j) h
= 6, 626 × 10−34 Js
4.5. O PROBLEMA DO CALOR ESPECÍFICO
63
adamente naquele que aqui mais nos interessa, o problema do calor especı́fico dos
sólidos.
Suponhamos que, tal como o campo electromagnético, também o campo dos
deslocamentos dos constituintes de um sólido está quantizado, no sentido em que as
trocas de energia mecânicas entre estes constituintes só são possı́veis em quantidades
múltiplas de hν, onde ν é a frequência das oscilações com que estão animados. Esta
suposição parece indicar a existência de uma partı́cula à qual se dá o nome de fonão
que tem uma energia hν, e que é trocado entre os átomos do sólido, aumentando ou
diminuindo a energia das suas oscilações. De acordo com esta hipótese, a energia
mecânica de cada átomo já não pode ser considerada uma variável continua, antes
tomando valores de um conjunto discreto, distanciados entre si de ~ω (k) (ver a
Figura 4.15). O valor mı́nimo da energia, representado na Figura 4.15 por ε0 ,
E
ε o+nhw
ε o+3hw
ε o+2hw
ε o+ hw
ε o= 1 hw
2
Figura 4.15: Nı́veis de energia de um oscilador quântico com frequência ω.
obtém-se facilmente através de uma resolução quântica do oscilados harmónico (que
continua a ser a nossa aproximação para os deslocamentos atómicos no cristal) e é
dado por ε0 = 21 ~ω..
De que forma esta hipótese altera a descrição clássica do sólido? Vamos repetir
o processo que seguimos para o modelo clássico. Consideremos 3N osciladores
independentes, em equilı́brio termodinâmico à temperatura T . Supondo que todos
estes osciladores têm a mesma frequência ω e a mesma energia, que identificamos
com o valor expectável da energia de um oscilador quântico. A energia total do
sólido é então, tal como em (4.73),
E = 3N hεi.
(4.81)
A diferença principal entre o tratamento clássico consiste no cálculo da energia
média hεi. Como a variável ε é, nesta abordagem, discreta, este cálculo não pode
ser levado a cabo usando a Eq. (4.77). Continuando a aceitar a distribuição de
probabilidade de Maxwell-Boltzmann, temos, neste caso, que a probabilidade de
um oscilador estar no nı́vel de energia εn ,
1
εn = (n + )~ω
2
é
P (εn ) = Be−βεn .
(4.82)
onde se introduzir a notação, usual em fı́sica estatı́stica, β = 1/kB T , e B é uma
constante de normalização escolhida de maneira a garantir que a soma de todas as
probabilidades seja 1. A constante B é então determinada impondo
∞
X
n=0
(k)
~ω = hν
P (εn ) = 1,
(4.83)
64
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
ou seja,
∞
X
Be−βεn = 1,
(4.84)
n=0
e portanto
1
.
−βεn
n=0 e
B = P∞
(4.85)
O valor numérico desta constante não é um resultado particularmente interessante,
mas pode facimente ser determinado. Usando a expressão da energia, o somatório
no denominador em (4.85) pode ser escrito como
∞
X
1
e−βεn = e− 2 β~ω
n=0
∞
X
(e−β~ω )n ,
(4.86)
n=0
e o somatório no lado direito desta igualdade é uma série geométrica de razão
x = e−β~ω < 1 .
A série é pois convergente, e o seu valor é
∞
X
1
−βεn
e
n=0
e− 2 β~ω
=
.
1 − e−β~ω
Substituindo este resultado em (4.85), obtemos
"
#−1
1
e− 2 β~ω
B=
.
1 − e−β~ω
(4.87)
(4.88)
A probabilidade de se encontrar um oscilador quântico no n-ésimo nı́vel de energia εn é
e−βεn
P (εn ) = P∞ −βε .
(4.89)
n
n=0 e
e o valor médio da energia é calculado usando a definição de valor expectável de
uma variável aleatória
X
hεi =
P (εn )εn
(4.90)
n
[compare com (4.77)]. Substituindo aqui (4.89) obtemos
P∞ −βεn
εn
n=0 e
hεi = P
,
∞
−βε
n
n=0 e
(4.91)
onde o denominador em (4.89) foi posto em evidência na soma em (4.90). Note-se
que o lado direito da Eq (4.91) é o simétrico da derivada em ordem a β, de
X
ln
e−βεn
e portanto escrevemos
∞
hεi = −
X
∂
ln
e−βεn ,
∂β n=0
(4.92)
e o somatório que serve de argumento ao logaritmo foi calculado em (4.87). Resulta
então
Ã
!
1
e− 2 β~ω
∂
ln
hεi = −
∂β
1 − e−β~ω
¸
·
¢
¡
∂
1
−β~ω
= −
.
(4.93)
− β~ω − ln 1 − e
∂β
2
4.5. O PROBLEMA DO CALOR ESPECÍFICO
65
Efectuando a derivada em ordem a β, obtemos
1
~ωe−β~ω
~ω +
2
1 − e−β~ω
~ω
1
~ω + β~ω
.
2
e
−1
hεi =
=
(4.94)
A energia total do sólido é então segundo (4.81)
µ
¶
~ω
1
E = 3N
~ω + β~ω
2
e
−1
(4.95)
e o calor especı́fico obtém-se derivando esta igualdade em ordem à temperatura,
eliminando-se assim a constante 3N ~ω/2,
µ
¶
∂E
CV =
∂T V
µ
¶
∂β ∂E
=
∂T ∂β V
3N
eβ~ω
2
(~ω)
2.
kB T 2
(eβ~ω − 1)
=
(4.96)
É usual a introdução da chamada temperatura de Einstein, que é o factor constante
definido por
~ω
θE =
,
(4.97)
kB
em termos da qual o calor especı́fico resulta
θE
µ ¶2
θE
eT
CV = 3R
(4.98)
´2 ,
³ θ
E
T
e T −1
assumindo que o número de átomos N é igual ao número de Avogrado NA . A
Figura 4.16 apresenta o gráfico do calor especı́fico, dividido por 3R. É evidente que
o comportamento desta função a altas temperaturas é o esperado
µ
¶
CV
−→ 1 ⇐⇒ (CV )T →∞ −→ 3R
3R T →∞
e que o limite para baixas temperaturas é também o correcto
CV T →0 −→ 0.
Podemos verificar estes resultados analiticamente. Quando T → ∞, θE /T → 0.
O argumento das exponenciais é então pequeno e podemos por isso substitui-las
pelos seus desenvolvimentos em série de Taylor, mantendo apenas os termos mais
significativos. Isto é, podemos em (4.98) fazer a substituição
e
θE
T
para T elevado. Obtemos então
µ
CV ' 3R
θE
T
¶2 "µ
' 3R + 3R
' 3R,
θE
,
T
'1+
µ
θE
T
T
θE
¶
¶2
T
+
θE
#
66
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
CV (T) /3R
1
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
2
2.5
T/θE
Figura 4.16: O calor especı́fico dos sólidos no modelo de Einstein.
no limite quando T → ∞, de acordo com a lei de Dulong e Petit. No limite oposto,
em que T → 0, o argumento das exponenciais θE /T é muito grande, e também as
exponenciais o são. Podemos então desprezar, no denominador de (4.98), a unidade.
Resulta então
µ ¶2
θE
θE
(4.99)
CV ' 3R
e− T .
T
À medida que T se aproxima de zero, θE /T cresce, e a exponencial tende para zero.
A diminuição do valor da exponencial “vence”o crescimento do termo (θE /T )2 e o
limite do produto é zero, de acordo com o gráfico na Figura 4.16.
Estes resultados estão em melhor acordo com os dados experimentais, apoiando assim as ideias quânticas de Einstein. No entanto, o comportamento do calor
especı́fico para baixas temperaturas [expresso em (4.99)] não verifica a proporcionalidade, verificada experimentalmente, com o cubo da temperatura.
A origem desta discrepância reside na suposição que os 3N osciladores têm a
mesma frequência ω, ou seja, que são independentes. Se incluirmos a possibilidade
de correlação nos movimentos dos osciladores, isto é, considerando modos colectivos
de movimento, esta discrepância é resolvida. Este é o ponto de partida para o
modelo de Debye, que vamos passar a estudar.
4.5.3
Modelo de Debye
No modelo de Einstein, supõe-se que cada átomo oscila independentemente dos
restantes. Cada um destes átomos encontra-se em equilı́brio térmico com o ambiente
à temperatura T = (kB β)−1 e portanto é natural que todos tenham o mesmo tipo de
movimento, e logo a mesma frequência. No entanto, já sabemos que os movimentos
dos átomos num cristal não são independentes: o movimento dum átomo afecta o
dos seus vizinhos, que, por sua vez, afectam o de outros átomos, até que por fim
todos os átomos são influenciados. O modelo de Einstein é assim uma aproximação,
justificável (ou não) conforme o problema em estudo, e rigor pretendido.
Vamos agora abordar o problema com maior generalidade, considerando os “movimentos colectivos”do cristal. Um exemplo de movimentos colectivos é o dos deslocamentos relacionados com a propagação do som nos cristais, que já foram estudados
4.5. O PROBLEMA DO CALOR ESPECÍFICO
67
nas secções 4.2 e 4.2.1. Os formalismos aı́ apresentados podem ser aplicados aqui,
considerando (mais uma vez) desenvolvimentos em série de Fourier dos deslocamentos sofridos por cada átomo.
Consideramos os movimentos atómicos como uma sobreposição de ondas monocromáticas, de frequência ω e vector de onda k que, seguindo o trabalho de Debye,
satisfazem a relação de dispersão das ondas de som em meios contı́nuos isotrópicos,
ω = vf |k| .
(4.100)
A energia total de um cristal não é, neste caso, dada por E = 3N ε̄(ω) como no
modelo de Einstein, porque estão presentes várias frequências. Devemos antes calcular a energia do cristal somando a energia de cada um dos modos de vibração
presentes no desenvolvimento em série de Fourier dos deslocamentos atómicos. Mas
cada modo de vibração, com uma dada frequência, tem a energia média igual à
do oscilador harmónico quântico unidimensional que “oscile”com essa frequência,
energia essa dada por (4.94). A energia total do sólido pode então ser calculada
como
X
E=
ni ε̄(ωi ),
(4.101)
ωi
onde ni é o número de onda planas monocromáticas com frequência ωi presentes
no desenvolvimento em série de Fourier dos deslocamentos atómicos, e ε̄(ω) é a sua
energia. As frequências permitidas formam um conjunto discreto (e daı́ o somatório
em (4.101), de acordo com o estudo na secção anterior). Para cristais tı́picos, no
entanto, as frequências permitidas estão tão próximas umas das outras que podemos,
para simplificar os cálculos, aproximar o somatório em (4.101) a um integral. O
número de frequências ω pode ser calculado recorrendo à função de densidade de
modos de vibração, g(ω). Obtemos então a seguinte expressão para a energia, E,
de um cristal à temperatura T :
Z
ωD
E=
dω g(ω)ε̄(ω).
(4.102)
0
O limite superior de integração ωD deve ser finito, pois substituindo g(ω) e ε̄(ω) pelas suas expressões obtemos em (4.102) um integral que, com ωD → ∞, é divergente.
Antes de prosseguirmos, vamos determinar o valor de ωD .
Um cristal com N átomos é um sistema com 3N graus de liberdade, que são as
3N componentes das posições de todos os átomos que o formam. Podemos, numa
abordagem microscópica, indicar o deslocamento de cada um dos átomos, através
do valor das 3N quantidades
ux1 (t)
ux2 (t)
·
·
·
uxN (t)
uy1 (t)
uy2 (t)
·
·
·
uyN (t)
uz1 (t)
uz2 (t)
·
·
·
uzN (t)
Por exemplo, uyk representa a componente y do deslocamento do k−ésimo átomo relativamente à sua posição de equilı́brio, (Xk , Yk , Zk ), no instante t.
Ao fazermos um desenvolvimento em série de Fourier dos deslocamentos, defi-
68
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
nimos três funções ux (r, t), uy (r, t) e uz (r, t), da forma
X
ux (r, t) =
Ax (k)ei(k·r−ωt)
k
uy (r, t)
=
X
Ay (k)ei(k·r−ωt)
k
uz (r, t)
=
X
Az (k)ei(k·r−ωt) .
(4.103)
k
onde Ax , Ay e Az são os coeficientes do desenvolvimento em ondas planas. As
componentes do deslocamento de cada um dos átomos são, nesta descrição, os
valores que estas funções tomam, quando calculadas na sua posição de equilı́brio,
por exemplo
ux1 (t) = ux (R1 , t).
Nesta descrição por ondas planas monocromáticas, os graus de liberdade são os
coeficientes Ax (k), Ay (k) e Az (k) dos desenvolvimentos em (4.103). Evidentemente,
não podem ser necessárias, nesta abordagem, mais graus de liberdade que os usados
na descrição macroscópica que usa as 3N funções do tempo ukα (t) (com α = x, y, z).
Ora seja, o número de modos de vibração usados numa descrição o mais detalhada
possı́vel dos deslocamentos atómicos deve ser igual a 3N , o que matematicamente
é expresso através de
X
ni = 3N,
(4.104)
ωi
onde n1 tem o significado que lhe foi atribuı́do em (4.101). A frequência de Debye,
ωD , que aparece em (4.102) é determinada de forma a assegurar que o número de
graus de liberdade macroscópicos (número de ondas planas permitidas) é igual ao
número de graus de liberdade microscópicos (3 vezes o número de átomos), como
acabou de ser discutido. Substituindo o somatório em (4.104) por um integral [como
na passagem de (4.101) para (4.102)] obtemos
Z ωD
dωg(ω) = 3N.
(4.105)
0
Substituindo aqui a densidade de modos de vibração deduzida na Secção 4.4, obtemos
N
3
ωD
= 6π 2 vf 3 .
(4.106)
V
Podemos agora retomar o cálculo da energia do cristal. Substituindo em (4.102)
a densidade de estados g(ω) e a energia média em função de ω resulta
µ
¶
Z ωD
1
~ω
3V 1
dω
~ω
+
ω2 .
(4.107)
E=
2π 2 vf 3 0
2
eβ~ω − 1
O calor especı́fico é a derivada desta expressão em ordem à temperatura. O
primeiro termo no integral, ~ω 3 /2, é uma constante e logo não contribui para esta
derivada. Temos então
¶
µ
¶
µ
1
∂E
∂E
=− 2
CV =
∂T V
kT
∂β V
Z ωD
3V 1 1 ∂
~ω 3
= − 2 3
dω
2π vf kT 2 ∂β 0
eβ~ω − 1
Z
ωD
3V 1 ~2
ω 4 eβ~ω
=
dω
(4.108)
2.
3
2
2
2π vf kT 0
(eβ~ω − 1)
4.5. O PROBLEMA DO CALOR ESPECÍFICO
69
Fazendo a mudança de variável x = β~ω, usando (4.106) e introduzindo a chamada
temperatura de Debye
~ωD
θD =
,
kB
resulta
µ
CV = 9kN
T
θD
¶3 Z
θD
T
dx
0
x4 ex
(ex − 1)
2.
(4.109)
Finalmente, usando a relação entre as constantes de Boltzman k, dos gases perfeitos
R e a de Avogrado NA , obtemos
µ
CV = 9R
T
θD
¶3 Z
θD
T
dx
0
x4 ex
2.
(ex − 1)
(4.110)
Esta expressão ajusta-se bem aos resultados experimentais. Em particular, o seu
comportamento assimptótico, nos limites T → ∞ e T → 0, é o esperado. Com
efeito, no limite T → ∞, o limite superior do integral em (4.109) é muito pequeno.
Logo o argumento das exponenciais, x < θD /T também é pequeno e podemos por
isso usar o desenvolvimento ex ' 1 + x. Obtemos então
µ
CV
'
9R
µ
'
9R
T
θD
T
θD
¶3 Z
θD
T
dx x2 (1 + x)
0
¶3 Z
θD
T
dx x2 ,
(4.111)
0
que é válido no limite θD /T ' 0. Resolvendo este integral, obtemos
CV = 3R,
(4.112)
como esperado. Por outro lado, no limite oposto, em que T → 0, o limite superior
do integral em (4.110) tende para infinito. Podemos então escrever
µ
CV ' 9R
T
θD
¶3 Z
∞
dx
0
x4 ex
(ex − 1)
2
(4.113)
O integral em x é agora uma constante(l) , de forma que o calor especı́fico apresenta, para baixas temperaturas, o comportamento observado experimentalmente
de proporcionalidade com T 3 .
A figura apresenta valores do calor especı́fico em função da temperatura adimensional, isto é, θE /T para o modelo de Einstein e θD /T para o modelo de Debye.
Apesar de mais convincente, o modelo de Debye é ainda apenas uma aproximação. Com efeito, a relação de dispersão usada não é válida nos cristais, pelo
menos para pequenos comprimentos de onda. Um estudo mais correcto (mas bastante complicado) usaria uma densidade de modos de vibração baseada na relação
de dispersão das ondas mecânicas em cristais. A análise do caso unidimensional é
proposta como o problema; aparte esta situação, um tratamento mais rigoroso do
modelo de Debye ultrapassa o nı́vel destas notas.
(l)
desta informação não ser particularmente relevante para esta discussão, o seu valor é
R ∞ Apesar
4 x x
−2 dx = 4π 4 /15.
0 x e (e − 1)
70
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
25
Debye
-1
CV (T)/JK mol
-1
20
Einstein
15
10
5
0
0.25
0.5
0.75
1
1.25
1.5
1.75
2
T/θ
Figura 4.17: Calor especı́fico dos sólidos segundo o tratamento de Einstein e o de
Debye.
PROBLEMAS
4.1
(a) Deduza a densidade de modos de vibração para um meio contı́nuo isotrópico
tridimensional em que a velocidade de polarização longitudinal é diferente
da transversal, e indique (em função destes) qual seria a frequência máxima
de oscilação associada aos osciladores harmónicos no modelo de Debye.
(b) Determine a temperatura de Debye para o alumı́nio, sabendo que as velocidades de polarização longitudinal e transversal das ondas acústicas no
meio são vL = 6374 m/s e vT = 3111 m/s respectivamente. Considere a
densidade do alumı́nio de 6, 02 × 1028 átomos por metro cúbico.
(c) Usando a tabela abaixo, determine a temperatura de Einstein e de Debye do
alumı́nio a partir do valor experimental de Cv = 13, 0 J K−1 mol−1 obtido à
temperatura de 100 K. Os valores apresentados estão expressos em unidades
T
SI, como função da temperatura adimensional Θ
segundo o modelo de
Einstein e de Debye.
25
T /Θ
∞
1,000
0,500
0,333
0,250
0,200
0,167
0,143
0,125
0,111
0,100
0,067
0,050
0,040
0,020
0,010
20
Debye
Einstein
Cv
15
10
5
0
0.2
0.4
0.6
0.8
(E)
Cv
24,94
23,75
20,59
16,53
12,55
9,20
6,63
4,76
3,45
2,53
1,89
0,58
0,24
0,12
0,00
0,00
(D)
Cv
24,94
22,96
18,06
12,38
7,58
4,26
2,24
1,12
0,54
0,25
0,11
0,00
0,00
0,00
0,00
0,00
1
Temperatura adimensional
4.2 Como pode justificar o baixo valor do calor especı́fico do diamante à temperatura
ambiente?
4. Problemas
71
4.3 É possı́vel fazer um modelo das vibrações longitudinais de uma cadeia de polietileno,
−CH = CH − CH = CH − CH =,
considerando uma cadeia de massas idênticas, m, ligadas por molas de constantes
alternadas α1 e α2 , conforme ilustrado na figura seguinte.
d
a
α1
α2
α1
α2
Demonstre que a relação de dispersão desta cadeia é dada por
2
α1 + α2 4
ω2 =
1±
m
s
4α1 α2 sin2 ka
2
1−
(α1 + α2 )2
3
5 ,
onde a é comprimento do padrão molas/átomos que se repete na cadeia.
Sugestão: Assuma soluções do tipo
un = Aei(kXn −ωt)
para átomos entre molas de constante α1 e α2 e
u0n = A0 ei(kXn −ωt)
para átomos entre molas de constante α2 e α1 respectivamente.
4.4 Considere uma cadeia linear monoatómica de separação interatómica a e de N
átomos. Considerando apenas interacções com os átomos vizinhos mais próximos,
demonstre que a densidade de modos de vibração é dada por:
g(ω) =
2N
√
,
π ωm 2 − ω 2
onde ωm representa a frequência máxima de vibração permitida.
4.5 Obtenha a expressão para o calor especı́fico molar de uma cadeia de N átomos
idênticos e comprimento L, que só pode oscilar longitudinalmente, segundo o
modelo de Debye.
(a) Determine uma expressão para o calor especı́fico para baixas temperaturas.
(b) Esboce um gráfico para o calor especı́fico deduzido na alı́nea anterior indicando como chegou aos valores limites respectivos.
(c) Determine uma expressão para o calor especı́fico usando a relação de dispersão deduzida no problema anterior. Verifique o limite para o calor especı́fico apenas para altas temperaturas.
Capı́tulo 5
Metais I: modelos de
electrões livres
No universo dos sólidos os metais têm uma importância prática especial. As suas
propriedades tornaram-nos particularmente úteis num grande número de aplicações,
ao longo de parte importante da história da humanidade. O estudo dos metais tem
pois um grande interesse, na área mais geral da fı́sica dos sólidos.
Entre as muitas propriedades interessantes dos metais, podemos referir: baixos
pontos de fusão; grandes condutividades eléctricas e térmicas; altas densidades de
massa; grande resistência estrutural; boa reflectividade óptica.
Vamos agora passar à descrição de algumas destas propriedades a partir dos
princı́pios da fı́sica. O facto de os metais conduzirem bem calor e electricidade
leva-nos a pensar que alguns dos electrões dos átomos que os constituem se podem
deslocar grandes distâncias no seu interior, quando comparadas com as distâncias interatómicas tı́picas. Neste capı́tulo, vamos estudar estes electrões como sendo livres,
isto é, supondo que as interacções que sofrem (com outros electrões de condução e
com os iões que formam a rede cristalina) são tais, e de tal forma distribuı́das, que,
em média, se cancelam.
5.1
Introdução
As ligações quı́micas entre dois (ou mais) átomos são estabelecidas por deformação
das nuvens electrónicas desses átomos. Evidentemente, esta deformação é mais
pronunciada nos estados electrónicos mais fracamente ligados a cada um dos átomos,
de tal forma que podemos dizer (cometendo um erro que, na esmagadora maioria
das aplicações, é desprezável) que apenas estes estados participam na ligação. Aos
electrões que ocupam estes estados dá-se o nome de electrões de valência.
Nos metais, a ligação quı́mica envolve normalmente um grande número de
átomos (1020 , ou mais) e esta deformação das camadas exteriores da nuvem electrónica de cada átomo é particularmente pronunciada, ficando distribuı́das por toda a
extensão do metal. Os electrões que ocupam estas camadas podem assim mover-se
ao longo de distâncias com ordem de grandeza macroscópica.
Um cristal metálico consiste pois num arranjo periódico de iões positivos, imerso
num “gás” de electrões. Naturalmente, os electrões interagem uns com os outros e
com os iões da rede, mas podemos supor que as forças que sentem, estando mais
ou menos distribuı́das em todas as direcções, se cancelam globalmente, sendo nula
a sua resultante. Esta aproximação, apesar de claramente grosseira, permite, como
veremos, obter alguns resultados em bom acordo com os factos experimentais, pelo
menos a nı́vel qualitativo.
73
74
5.2
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
O modelo de Drude-Lorentz
O modelo de Drude-Lorentz consiste na descrição clássica do gás de electrões livres.
Usando a fı́sica clássica, este gás assemelha-se bastante a um gás perfeito. As
diferenças principais residem na alta densidade (num metal há, tipicamente 1022
electrões por cm3 ) e no facto de os electrões se moverem num cristal, podendo
sofrer colisões com os iões que formam o cristal.
No modelo de Drude-Lorentz (de facto são dois modelos, mas a única diferença
entre eles consiste apenas num pormenor técnico do tratamento estatı́stico) tratam-se então os electrões deslocalizados como um gás de electrões livres, em equilı́brio
termodinâmico com o ambiente. Sendo os electrões livres, a sua energia é totalmente
cinética. Usando métodos estatı́sticos, podemos calcular a energia total do gás de
electrões e a partir daı́ várias propriedades mensuráveis experimentalmente dos
metais, como o calor especı́fico, o módulo de compressibilidade, etc. O confronto
dos resultados que obtivermos com os valores experimentais servirá para a avaliação
das qualidades do modelo.
5.2.1
O calor especı́fico dos metais
No quadro desta descrição dos electrões de condução, a energia de um sólido condutor é
E = Ecr + Ee ,
(5.1)
onde Ecr é a energia do cristal de iões, que pode ser avaliada com os métodos
estudados no capı́tulo anterior, e Ee é a energia do gás de electrões de condução.
A energia tem esta expressão simples porque consideramos os electrões livres e
portanto sua energia de interacção com o cristal é uma constante (que pode não ser
considerada), cujo único efeito observável é o de manter o gás de electrões confinado
no interior do metal.
A energia dos electrões de condução é puramente cinética uma vez que se consideram livres. De acordo com o teorema da equipartição da energia, a energia média
de um conjunto de Q electrões de condução é pois Q × 3 × kB T /2 = 3QkB T /2.
Consideremos um sólido com N átomos e seja u o número de electrões que cada
átomo fornece para a ligação quı́mica. Temos então Q = N u a energia média da
nuvem electrónica fica então
Ee =
3
uN kB T.
2
(5.2)
A energia total da amostra considerada é
3
E = Ecr + uN kB T,
2
(5.3)
e o calor especı́fico do metal vem
3
CV = CVcr + uN kB .
2
(5.4)
Para altas temperaturas, CVcr = 3R, como vimos no capı́tulo anterior. Relembrando
que R = NA kB , resulta
u
(5.5)
CV = 3(1 + )R.
2
Concluimos então que, de acordo com este modelo, os metais apresentam um calor especı́fico cujo valor é igual a 9/2R para os metais monovalentes, 6R para os
bivalentes, etc.
Este resultado, o primeiro que obtivemos com este modelo, está em desacordo
flagrante com os resultados experimentais. De facto, o calor especı́fico dos metais
5.2. O MODELO DE DRUDE-LORENTZ
75
tem, a altas temperaturas, o valor definido pela lei de Dulong e Petit, ou seja 3R.
Veremos mais adiante que esta deficiência do modelo pode ser resolvida analisando
quanticamente as propriedades do gás de electrões.
5.2.2
A lei de Ohm
A diferença de potencial entre as extremidades de um condutor é proporcional
à corrente que o atravessa. Este é o enunciado da bem col
nhecida lei de Ohm. Consideremos um condutor filiforme
com comprimento l e secção transversal de área S, percori
S
rido por uma corrente i (ver a figura). A lei de Ohm pode
então escrever-se como
∆V = Ri,
(5.6)
onde ∆V é a diferença de potencial entre as extremidades do condutor e R, a
chamada resistência do condutor, é a constante da proporcionalidade referida acima.
Multiplicando ambos os membros de (5.6) por 1/(lS) e notando, por um lado, que
o campo eléctrico no interior do condutor, E, tem um módulo dado por E = ∆V /l,
e por outro que a densidade de corrente j é, por definição de corrente, j = i/S,
obtemos
l
E.
(5.7)
j=
SR
À constante σ = l/(SR) dá-se o nome de condutividade (a) . Deduzimos desta maneira a forma local da lei de Ohm,
j = σE.
(5.8)
A lei de Ohm tem um aspecto que, à primeira vista, pode parecer perturbador. É
que a força exercida pelo campo eléctrico sobre os electrões vale −eE, onde e é o
módulo da carga do electrão; assim, o lado direito da equação (5.8) é proporcional
à força que actua sobre os electrões. Por outro lado, a densidade de corrente j é
dada por
j = ρl ṽ
(5.9)
onde ρl é a densidade de carga livre e ṽ é a velocidade média das cargas, neste
caso, dos electrões; o lado esquerdo de (5.8) é então proporcional à velocidade
dos electrões. Mas então a equação (5.8) traduz uma proporcionalidade entre a
velocidade dos electrões e a força que neles actua, em contradição aparente com o
previsto pela segunda lei de Newton(b) (força proporcional à aceleração).
De facto, esta situação não constitui um paradoxo, e é até relativamente frequente na natureza. Por exemplo, o movimento de queda de um paraquedista é,
segundos após o pára-quedas se abrir, uniforme (e não uniformemente acelerado) e
o valor da velocidade é tanto maior quanto maior for o peso do paraquedista, ou
seja, quanto maior for a força que o impele para o solo. Neste exemplo (e noutros que poderiam ser citados) está presente, para além da força mais directamente
responsável pelo movimento (a força gravı́tica), uma resistência ao movimento por
parte do meio onde ele se realiza. No caso dos electrões nos condutores esse meio é
(a) A
condutividade é o inverso da resistividade, e ambos os parâmetros são uma medida da
qualidade intrı́nseca (isto é, independente de factores geométricos) dos materiais como suportes da
condução eléctrica — Um material (como o cobre, por exemplo) com uma elevada condutividade,
ou baixa resistividade, é um bom condutor de electricidade, mesmo que uma amostra concreta
desse material (por exemplo, um fio muito longo e/ou muito fino) apresente um grande valor da
resistência eléctrica.
(b) Note-se que, num tratamento clássico como o presente, as leis da mecânica de Newton devem
ser consideradas válidas.
76
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
o cristal. No seu movimento no cristal, os electrões podem por vezes sofrer colisões
com com os iões que o formam, comunicando-lhes parte da energia cinética que
obtiveram sob acção do campo.
Tentemos descrever quantitativamente este processo. Consideremos o movimento dos electrões que formam o gás em equilı́brio termodinâmico na ausência,
para já, de campos eléctricos aplicados. A uma temperatura T 6= 0, a energia
cinética média dos electrões, correspondente ao movimento caótico de agitação
térmica, dada pelo teorema de equipartição da energia de Boltzmann, tem o valor de ε = 3kB T /2. A média dos módulos das velocidades, ṽ0 , dos electrões que
compõem a nuvem condutora nos metais é pois
r
3kB T
ṽ0 =
,
(5.10)
me
onde me é a massa electrónica; à temperatura ambiente T ≈ 300 K, ṽ ≈ 1, 2 ×
105 m/s. O movimento correspondente à agitação térmica é pois muito rápido. No
entanto, o sentido do movimento de cada electrão é totalmente aleatório e, por isso,
a média vectorial das velocidades dos electrões é nula. Assim, este movimento de
agitação térmica não se traduz na presença de uma corrente eléctrica mensurável.
Vejamos agora o que acontece quando se estabelece um campo eléctrico no interior do condutor. Cada electrão passa a sentir uma força F e = −eE, na mesma direcção mas de sentido oposto ao campo eléctrico, e portanto adquire um movimento
uniformemente acelerado (com a = −eE/me ), mas apenas entre duas colisões sucessivas. Seja τ o intervalo de tempo médio que separa duas colisões de um dado
electrão(c) . Em equilı́brio, esta situação é equivalente aos electrões de condução
possuirem uma velocidade de condução comum (ver a Figura 5.1). A velocidade
E=0
E
deslocamento electrónico
(b)
(a)
Figura 5.1: Esquema do precurso de um electrão. (a) Os electrões apresentam movimentos aleatórios com velocidade vectorial média nula; (b) sob a acção de um campo
eléctrico, os electrões ficam animados de um movimento uniformemente acelerado entre duas colisões sucessivas, que tendem a restaurar a aleatoriedade na direcção do
vector velocidade. Esta situação é equivalente a um movimento colectivo com uma
velocidade de condução correspondente ao deslocamento electrónico representado.
média dos electrões é então
ṽ = ṽ 0 +
−eE
τ,
me
(5.11)
onde ṽ 0 é a velocidade inicial (imediatamente após uma colisão) média. Ora, a
velocidade dos electrões após uma colisão está distribuı́da uniformemente em todos
(c) São frequentes as designações de “tempo de relaxação”, “tempo de colisão”, “tempo médio de
vida livre”, entre outras, para o parâmetro τ .
5.2. O MODELO DE DRUDE-LORENTZ
Metal
Li
Na
Cu
Au
n (m−3 )
4,7×1028
2,7×1028
8,5×1028
5,9×1028
σ(Ω−1 m−1 )
1,1×107
2,1×107
5,8×107
4,5×107
77
τ (s)
8,3×10−15
2,8×10−14
2,4×10−14
2,7×10−14
Tabela 5.1: Densidades electrónicas n (em m−3 ) e condutividades eléctricas (em
Ω−1 m−1 ) a 295 K (de Kittel, “Introduction to Solid State Physics”) e tempo de relaxação para o lı́tio, o sódio, o cobre e o ouro.
os sentidos, de forma que a sua média vectorial, ṽ 0 , é nula. A velocidade média dos
electrões sob a acção do campo eléctrico é pois
ṽ =
−eE
τ.
me
(5.12)
Multiplicando a velocidade média que acabámos de obter pela densidade de carga
de condução,
ρl = −ne,
(5.13)
onde n é a densidade de electrões de condução, obtemos a densidade de corrente
eléctrica,
ne2 τ
j=
E.
(5.14)
me
Mas esta equação tem a forma da lei de Ohm (5.8), com a condutividade eléctrica
dada por
ne2 τ
σ=
.
(5.15)
me
Podemos estimar o tempo de relaxação de um metal usando valores tabelados da
condutividade eléctrica e da densidade electrónica. A Tabela 5.1 apresenta alguns
valores.
O tempo de vida livre dos electrões nos metais é, como podemos verificar a partir
da Tabela 5.1, extremamente curto. Durante um intervalo de tempo tão pequeno,
a variação no módulo da velocidade dos electrões provocada pela acção de campos
eléctricos tı́picos (de alguns volts por metro) é, certamente pequena. Podemos
pois considerar que o valor do módulo da velocidade dos electrões é, em média, o
calculado a partir do princı́pio de equipartição da energia, ṽ ≈ 105 m/s. Durante
um intervalo de tempo τ ≈ 10−14 s, os electrões percorrem uma distância(d) de cerca
de 10−9 m= 10 Å, que é da ordem de grandeza das distâncias interatómicas. Este
resultado apoia a suposição de Drude de que os electrões sofrem colisões com os
iões.
De acordo com o princı́pio de equipartição da energia, o valor médio do módulo
da velocidade de agitação térmica, ṽ, diminui com a temperatura. Supondo que
o caminho médio livre, λ̃, não depende fortemente da temperatura, o tempo de
relaxação, τ = λ̃/ṽ, deve crescer com a diminuição da temperatura. Assim, concluimos que a condutividade dos metais depende da temperatura de acordo com
ne2 λ̃
.
(5.16)
3me kT
Ou seja, a condutividade dos metais é maior a baixas temperaturas, o que de facto
se verifica experimentalmente, com a excepção de uma classe importante (em vista
das aplicações industriais) de materiais — os semi-condutores.
σ=√
(d) Esta
distância tem a designação habitual de “caminho médio livre”.
78
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
Devemos reconhecer agora que este acordo com resultados experimentais é, apenas, qualitativo, já que, para a maioria dos metais, a condutividade depende da
temperatura de forma mais pronunciada do que a patente na Eq. (5.16).
5.2.3
O efeito de Hall
O efeito de Hall consiste no aparecimento de um campo eléctrico transversal num
condutor percorrido por corrente numa região onde está definido um campo magnético. É frequentemente usado para medir a intensidade de campos magnéticos
estáticos. Na Figura 5.2 representa-se um circuito formado com uma placa metálica
i
-
FM
v
EH
B
+
+
+
+
+
+
Figura 5.2: Esquema da montagem usada para demonstrar o efeito de Hall.
(à direita na figura), numa região onde está definido um campo magnético B,
perpendicular ao plano da placa condutora. A velocidade dos electrões (oposta ao
sentido da corrente) está representada na figura como v. Ao moverem-se numa
região onde está definido um campo magnético, os electrões sentem uma força F M ,
dada por
F M = −ev × B,
(5.17)
e como tal, sofrem uma aceleração para a esquerda (na figura), acumulando-se assim
carga de sinal negativo deste lado da placa. Em contrapartida, no lado direito
sente-se um defeito de carga de sinal negativo, ou seja, o lado direito fica carregado
positivamente. Em resultado desta assimetria na distribuição de carga, no interior
da placa metálica estabelece-se um campo eléctrico E H , chamado campo de Hall.
Atinge-se uma situação estacionária quando a força eléctrica, F H = −eE H , for
igual (e, claro, oposta) à força magnética, ou seja quando
−eEH = −evB.
(5.18)
Usando (5.13), obtemos a condição de estacionaridade
EH = −
1
jB.
ne
(5.19)
A constante −1/(ne) tem o nome de constante de Hall. O seu valor negativo reflecte
o facto de os transportadores de carga nos metais serem electrões, com carga de sinal
negativo. É relativamente simples medir experimentalmente o valor da constante
de Hall, e esperaria-se, à luz deste modelo, obter sempre valores negativos. Ora,
estranhamente, alguns metais apresentam valores positivos para a constante de Hall.
Alguns exemplos são os estabelecidos pelo cádmio, o zinco, o berı́lio e o magnésio.
5.2.4
Efeitos termoeléctricos
Consideremos um metal no qual se estabelece um gradiente de temperatura. Para
concretizar a discussão, imaginemos que aquecemos com uma chama a extremidade
de uma barra de cobre, e mergulhamos a outra num banho gelado (ver a Figura 5.3).
Uma vez que os electrões de condução da extremidade quente têm maior energia
5.2. O MODELO DE DRUDE-LORENTZ
T1
79
T2
T1
T2
v
+
+
+
T1 > T2
ET
-
Figura 5.3: Esquema da montagem para o estabelecimento de um gradiente de temperatura num metal (esquerda) e o campo eléctrico,
E T , resultante desse gradiente.
cinética do que os da extremidade fria, deve verificar-se, durante alguns instantes,
um fluxo lı́quido de electrões daquela extremidade para esta. Evidentemente, o
acumular de electrões na extremidade fria, com a consequente carga positiva resultante na extremidade quente, define, no interior do metal, um campo eléctrico que
contraria a continuação indefinida deste processo. Atinge-se, então, um estado de
equı́librio dinâmico, em que no interior do metal está definido um campo eléctrico
que se manifesta como uma diferença de potencial entre as duas extremidades, sendo
a mais quente a de potencial mais elevado. Este fenómeno tem o nome de efeito de
Seebeck.
Outro efeito termoeléctrico interessante manifesta-se nos pontos de contacto
de dois metais com densidades de electrões de condução diferentes. Numa junção
de dois metais diferentes, verifica-se, naturalmente, um processo de difusão dos
electrões de condução do metal com maior concentração electrónica para o outro.
Mas, assim, aquele metal fica com deficiêcia de electrões, ou seja, carregado positivamente. Inversamente, o metal que recebe o fluxo electrónico deste processo de
difusão fica carregado positivamente (ver a Figura 5.4). Mais uma vez, o campo
A
nA
Vc
++ − −
+ + − −e
nA > nB
V
nB
Vc
A
B
Figura 5.4: Potencial de contacto na junção de dois metais com diferentes concentrações electrónicas nA e nB e gráfico (à direita) do potencial electrostático na zona
da junção.
eléctrico criado por esta redistribuição de cargas contraria a sua contiuação indefinida, estabelecendo-se um estado de equilı́brio dinâmico em que o gradiente
da concentração electrónica (que favorece a continuação do processo de difusão)
é compensado pelo campo eléctrico resultante. Chama-se potencial de contacto à
diferença de potencial associada a este campo eléctrico. A grandeza do potencial de
contacto depende das concentrações de carga resultantes deste processo de migração
electrónica. Ou seja, o potencial de contacto é tanto maior quantos mais electrões
tiverem sido difundidos do metal com maior concentração electrónica para o outro.
Ora, quanto maior a temperatura, maior a energia cinética média dos electrões de
condução, logo, maior o número de electrões com energia suficiente para ultrapassarem a barreira de potencial na junção. Ou seja, quanto maior a temperatura, maior
o potencial de contacto na junção dos dois metais.
Este efeito é aproveitado para a construcção de termómetros, chamados termómetros de termopar. Um esquema simplificado da construcção destes termómetros
encontra-se representado na Figura 5.5. Basicamente, estes termómetros consistem
num circuito constituido por dois ramos de metais diferentes. Nas duas junções (A e
80
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
VA
B
A
C
V
D
VB
Figura 5.5: Termómetro de termopar. A tensão indicada pelo voltı́metro depende da
diferença de temperatura das duas juções A e B.
B, no esquema da figura) estabelecem-se potenciais de contacto diferentes se as suas
temperaturas forem diferentes. Uma das junções deve ficar a uma temperatura conhecida, por exemplo, mergulhada em água gelada, ao passo que a outra é utilizada
como sensor. Fica então definida uma força electromotriz no circuito, igual à diferença entre os dois potenciais de contacto, que é uma função crescente da diferença
entre as temperaturas das duas junções. Esta força electromotriz é medida usando
um voltı́metro, que interrompe um dos condutores, sendo necessário ter o cuidado,
na utilização do termómetro, de assegurar que as duas junções para a ligação do
voltı́metro (indicadas pelas letras C e D na figura) estão à mesma temperatura,
para que se cancelem os seus potenciais de contacto.
A existência do potencial de contacto na junção de dois metais diferentes tem
ainda outro efeito interessante. Quando uma corrente atravessa a junção, as cargas
que a compõem sofrem uma variação de energia, igual ao produto da sua carga
pelo valor do potencial de contacto. Essa variação de energia, que numa junção é
um aumento, na outra uma diminuição de energia, é fornecida ou absorvida pelo
meio ambiente. Este fenómeno tem o nome de efeito de Peltier. Assim, um circuito
constituido por dois metais diferentes no qual se estabelece uma corrente, funciona
efectivamente como uma máquina térmica, absorvendo calor numa das junções e
libertando-o na outra.
5.3
Balanço do modelo de Drude
Estudámos algumas propriedades dos metais à luz de uma teoria clássica de electrões
livres. Muitas outras caracterı́sticas poderiam ter sido estudadas, por exemplo, a
condutividade térmica. Não o fizemos porque estamos já em condições de avaliar o
modelo.
O modelo permite explicar qualitativamente a lei de Ohm e a dependência da
condutividade com a temperatura, bem como alguns efeitos termoeléctricos, nomeadamente o de Seebeck e o de Peltier, mas falha redondamente no que concerne ao
calor especı́fico da nuvem electrónica. Não consegue descrever o comportamento dos
semi-condutores, cuja condutividade aumenta com a temperatura, em geral. Não
consegue, também, dar conta dos valores positivos para o coeficiente de Hall apresentados por alguns metais, nem justificar fisicamente os valores do livre caminho
médio dos electrões de condução, notoriamente elevados a baixas temperaturas.
Vamos de seguida verificar se é possı́vel resolver estas deficiências do modelo de
electrões livres através de um tratamento quântico dos electrões.
5.4
O modelo de Sommerfeld
O modelo de Drude é uma teoria clássica de electrões livres, isto é, os electrões
são tratados como pequenas esferas rı́gidas idênticas. No entanto, apresentando os
electrões um comportamento eminentemente quântico, este tratamento não se pode
considerar correcto. Vamos agora estudar o gás de electrões livres usando o formalismo da Mecânica Quântica. Veremos que as principais diferenças relativamente ao
5.4. O MODELO DE SOMMERFELD
81
modelo clássico têm origem nas particularidades estatı́sticas dos objectos quânticos,
e, mais em particular, dos fermiões, classe de partı́culas que engloba os electrões.
A classe dos fermiões é constituı́da pelas partı́culas com momento angular intrı́nseco (ou spin) semi-inteiro (isto é, 1/2, 3/2, etc.) e que satisfazem o Princı́pio
de Exclusão de Pauli, segundo o qual dois fermiões idênticos não podem ocupar
simultaneamente o mesmo estado quântico(e) . O Princı́pio de Exclusão de Pauli é
incompatı́vel com a distribuição de Maxwell-Boltzmann, verificando-se antes que os
fermiões satisfazem uma distribuição diferente (sendo a diferença particularmente
notória a baixas temperaturas), com o nome de distribuição de Fermi-Dirac.
5.4.1
Estados electrónicos
Os estados quânticos dos electrões são obtidos resolvendo a equação de Schrödinger
independente do tempo:
−
~2 2
∇ φ (r) + V (r)φ (r) = εφ (r) ,
2m
(5.20)
onde φ (r) é a parte da função de onda que depende da posição dos electrões, v (r)
é a sua função de energia potencial, ε é a energia do estado definido pela função de
onda φ e ∇ é o operador gradiente, que, como é bem sabido, é dado por
∂
∂
∂
+ ey
+ ez ,
∂x
∂y
∂z
2
2
2
∂
∂
∂
∇2 =
+ 2 + 2,
∂x2
∂y
∂z
∇ = ex
usando coordenadas cartesianas. Uma vez que neste tratamento os electrões são
considerados livres, a sua energia potencial deve ser constante(f) , e podemos escolhê-la igual a zero. Assim a equação (5.20) reduz-se a
~2 2
∇ φ (r) + εφ (r) = 0.
2m
(5.21)
As soluções desta equação são da forma
φk (r) = Aeik·r ,
(5.22)
onde A é uma constante que é fixada impondo a normalização da função de onda,
Z
Z
2
∗
dV φ (r) φ (r) = |A|
dV e−ik·r eik·r
V
V
=
2
|A| V = 1,
de onde resulta, escolhendo A real
1
A= √ .
V
(5.23)
Substituindo (5.22) em (5.21), obtemos a relação entre a energia dos electrões e o
seu vector de onda k:
~2 k 2
εk =
.
(5.24)
2m
(e) Note-se que se trata aqui de estados quânticos e não de nı́veis de energia. Se dois estados
estados quânticos diferentes apresentam um mesmo valor de energia electrónica, então esse nı́vel
pode estar ocupado por dois electrões.
(f) Ao nı́vel quântico, as forças são sempre conservativas, isto é, podem ser obtidas como gradiente
da energia potencial. Se a força é nula, a energia potencial é constante
82
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
Comparando esta expressão com a correspondente clássica, ε = p2 /2m, concluı́mos
que o momento de um electrão num estado φk é
p = ~k.
(5.25)
A dependência espacial(g) da função de onda dos electrões é então
1
φp = √ eip·r/~ .
V
(5.26)
Resolvemos a equação de Schrödinger supondo que os electrões são livres. No entanto, esta suposição só é válida no interior do metal. Na sua superfı́cie, os electrões
sentem uma força, de natureza electrostática, que os impede de sair. Impomos esta
restrição na função de onda dos electrões através de condições fronteira que esta
função deve satisfazer sobre a superfı́cie do metal. As condições que impomos são,
de novo, as condições fronteira periódicas, por razões semelhantes às que justificaram esta escolha no capı́tulo anterior. Assim, impomos as seguintes condições às
soluções da equação de Schrödinger(h) (ver Figura 5.6).
1
φk (r) = √ eik·r
V
1
√ eik·[(x+L)ex +yey +zez ]
V
1 ik·[xex +(y+L)ey +zez ]
√ e
V
1 ik·[xex +yey +(z+L)ez ]
√ e
,
V
=
=
=
de onde resultam as equações de quantização para o vector de onda, k,
kx
=
ky
=
kz
=
2π
n
L
2π
m
L
2π
l,
L
(5.27)
com n, m, l inteiros arbitrários. Só os vectores de onda k cujas componentes
satisfazem (5.27) são permitidos para os electrões de condução no metal. Estes
vectores definem uma rede cúbica simples, de parâmetro 2π/L.
z
Lx
U=∞
Lz
U=0
y
x
Ly
Figura 5.6: Poço de potencial tridimensional. A energia é nula dentro da caixa de
dimensões Lx Ly Lz e infinito fora desta.
(g) A
~
dependência temporal é, apenas, ξ(t) = exp (−iεt/ ).
simplificar, consideramos o metal com forma cúbica, de aresta L.
(h) Para
5.4. O MODELO DE SOMMERFELD
83
Os estados quânticos dos electrões são identificados pelos valores das componentes do vector de onda k, e pela orientação do seu spin, que, neste caso(i) , só pode
tomar dois valores, com os nomes “para cima” (ou up, do inglês) e “para baixo” (ou
down). O princı́pio de exclusão de Pauli proı́be que dois fermiões idênticos ocupem
o mesmo estado quântico, de forma que pode haver, no máximo, dois electrões com
o mesmo vector de onda k: um com spin up, o outro com spin down.
5.4.2
A densidade de estados electrónicos
Tal como fizemos no capı́tulo anterior para a densidade electrónica de modos de vibração (ou, equivalentemente, a densidade de estados de fonões), pretendemos agora
determinar a densidade de estados electrónicos. Isto é, pretendemos determinar a
função g(ε) tal que o número de estados electrónicos com energia compreendida entre ε e ε + dε seja g(ε)dε. Esta determinação será decalcada da seguida no capı́tulo
anterior para a densidade de modos de vibração: notamos que a “relação de dispersão”, ε = ε(k), é isotrópica, isto é, só depende do módulo do vector de onda;
então o número de estados com energia compreendida entre ε e ε + dε é igual ao
existente na camada esférica oca com raios k e k + dk correspondentes àqueles valores de energia; é agora fácil contar o número destes estados usando as equações
de quantização (5.27). Vejamos, então. O volume da camada esférica oca de raios
k e k + dk é 4πk 2 dk; o número de vectores de onda permitidos presentes nesta
porção de espaço-k é aproximadamente igual à razão entre o seu volume e o volume ocupado por cada modo quântico, que, de acordo com (5.27), é (2π)3 /V , onde
V é o volume do cristal; finalmente, para cada vector de onda k há dois estados
possı́veis, correspondentes às duas orientações do spin electrónico. O número de
estados electrónicos com energia compreendida entre ε e ε + dε é então
dn = 2 ×
=
V
4πk 2 dk
(2π)3 /V
k2
dk.
π2
(5.28)
A relação de dispersão (ou seja, a relação entre a energia e o vector de onda) é a
expressa em (5.24), de onde obtemos por diferenciação
dε =
~2
k dk.
m
(5.29)
Substituindo em (5.28) resulta
dn =
=
V m
k dε
π 2 ~2
V √ 3
2m ε dε,
π 2 ~3
(5.30)
onde se usou (5.24) para substituir k. A função densidade de estados é então
g(ε) =
5.4.3
V √
π 2 ~3
2m3 ε.
(5.31)
O estado fundamental de um gás de fermiões
Vamos agora considerar o gás de fermiões no estado fundamental, isto é, no estado
de menor energia. Antes de começar, é importante desfazer eventuais confusões de
nomenclatura. Cada electrão no gás de fermiões ocupa um dado estado individual,
(i) Recorde-se
que os electrões têm spin 1/2.
84
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
caracterizado por um dado vector de onda k e uma dada orientação de spin, estado
esse a que corresponde uma certa energia, ε, do electrão que o ocupa. O conjunto
dos electrões de valência num metal define o gás de fermiões de condução, gás esse
que também é caracterizado por estados, mas que são agora estados colectivos, no
sentido em que as suas propriedades se podem determinar a partir das dos estados
individuais ocupados por cada um dos electrões que formam o gás.
O estado fundamental do gás de electrões é aquele que, de entre todos os estados possı́veis, apresenta o menor valor para a energia. Logo, neste estado, todos
os electrões que formam a nuvem de condução devem ocupar estados individuais
com uma energia o menor possı́vel. Do ponto de vista clássico, estes estados são
aqueles em que os electrões se encontram imóveis, e portanto apresentam o valor
mı́nimo para a sua energia cinética, ou seja, zero. No entanto, quanticamente esta
situação é impossı́vel. Com efeito, estando todos os electrões imóveis, todos apresentam vector de onda k = 0. Ora, já notámos que o princı́pio de exclusão de Pauli
não permite mais do que dois electrões com o mesmo vector de onda, cada um com
sua orientação de spin. O quadro clássico para o estado fundamental de um gás de
electrões é pois, à luz da mecânica quântica, uma impossibilidade. Sendo assim, o
estado fundamental de um gás de fermiões deve ser construido ocupando, com os
electrões de condução, estados quânticos individuais de energias progressivamente
mais elevadas, começando pelos de menor energia, até que todos os electrões de
condução estejam desta forma “estacionados”. Uma vez que a energia dos estados
electrónicos depende apenas do módulo do vector de onda, devemos, nesta construção, preencher primeiro estados caracterizados por vectores de onda de módulo
menor.
O conjunto dos estados electrónicos ocupados no estado fundamental de um gás
de electrões define, no espaço-k, uma região com a forma de uma esfera: todos
os estados electrónicos com módulo do vector de onda, k, menor que um certo
limiar kF estão ocupados; os restantes, com k ≥ kF , apresentam-se desocupados.
A esta esfera, que representa o estado fundamental de um gás de fermiões (neste
caso, electrões de condução num metal) dá-se o nome de esfera de Fermi ; ao raio
desta esfera, dá-se o nome de raio de Fermi ; chama-se energia de Fermi ao valor
da energia dos electrões que ocupam estados na superfı́cie da esfera de Fermi, e,
evidentemente, relaciona-se com o raio de Fermi através de
εF =
~2 2
k ;
2m F
(5.32)
define-se ainda a temperatura de Fermi, através de TF = εF /kB , onde kB é a
constante de Boltzmann, como sendo o valor da temperatura necessário para que
um número apreciável de fermiões adquiram uma energia cinética comparável com
a energia de Fermi.
Os valores destas grandezas, que caracterizam o estado fundamental de um gás
de electrões, podem ser todos calculados a partir do valor da densidade electrónica
de condução, que, por seu turno, é facilmente estimável em situações concretas. O
cálculo destas quantidades parte do facto de que o número de estados electrónicos
no interior da esfera de Fermi é, por construção, igual ao número total de electrões
de condução, N , presentes no metal. Usando a função densidade de estados, obtida
na subsecção anterior, esta igualdade traduz-se por
Z
N=
εF
dε g(ε),
(5.33)
0
já que no lado esquerdo temos o número total de electrões e, à direita, o número
total de estados electrónicos ocupados. Substituindo em (5.33) o resultado (5.31),
5.4. O MODELO DE SOMMERFELD
Elemento
Li
Na
Cu
Au
n(m−3 )
4,68×1028
2,64×1028
8,40×1028
5,90×1028
εF (eV)
4,74
3,24
7,00
5,53
85
TF (K)
5,51×104
3,77×104
8,16×104
6,42×104
kF (m−1 )
1,12×1010
0,92×1010
1,36×1010
1,21×1010
vF (m/s)
1,29×106
1,07×106
1,57×106
1,40×106
Tabela 5.2: Valores das grandezas “de Fermi” para alguns elementos.
obtemos
n≡
N
V
√
=
=
Z
√
2m3 εF
dε ε
2
3
π ~
0
p
2 2m3 ε3F
,
3 π 2 ~3
(5.34)
onde se representou por n a densidade electrónica. De (5.34), podemos determinar
o valor da energia de Fermi (supondo conhecido valor da densidade electrónica),
a partir do qual se calcula facilmente o valor de kF , TF , etc. Para a maioria dos
metais, a energia de Fermi apresenta valores de cerca de alguns eV(j) .
O estado fundamental do gás de electrões de condução só pode ser produzido
experimentalmente a uma temperatura de zero Kelvin (ou muito próxima deste
limite) uma vez que, a temperaturas mais elevadas o número de fonões no metal
é elevado, e estes podem comunicar energia à nuvem electrónica, excitando alguns
electrões para fora da esfera de Fermi.
5.4.4
O gás de electrões de condução à temperatura ambiente
De acordo com o que se acabou de discutir, a uma temperatura T diferente do zero
absoluto, alguns átomos encontram-se em nı́veis de vibração excitados e podem,
decaindo para estados vibracionais de menor energia, excitar electrões, aumentando
assim a energia do gás de electrões. Este processo pode entender-se como a troca de
um fonão entre o átomo (que o emite) e o electrão (que o absorve). A variação de
energia sofrida pelo átomo e pelo electrão é igual à energia transportada pelo fonão.
Supondo que neste processo o átomo decai para o nı́vel energético fundamental, a
energia do fonão emitido é exactamente igual à energia de excitação do estado inicial.
Nesta hipótese, então, a energia dos fonões é igual à energia de excitação dos átomos
que os emitiram, e portanto a energia média dos fonões é igual à energia média de
vibração dos átomos. Mas não há, à priori, qualquer razão para acreditarmos que
todas as des-excitações atómicas se fazem para o estado fundamental, de forma
que poderemos apenas afirmar que, a uma dada temperatura, a energia média dos
fonões é da ordem de grandeza da energia média de vibração dos átomos, ou seja,
kB θE /(exp(θE /T ) − 1), usando o modelo de Einstein, para simplificar a discussão.
Mas a temperatura de Einstein de muitas substâncias é da ordem de grandeza da
temperatura ambiente, de forma que exp(θE /T ) − 1 ≈ exp 1 − 1 ≈ 1. A energia
média dos fonões à temperatura ambiente é então cerca de kB T ≈ 0, 03 eV, ou
seja, cerca de uma centésima parte da energia de Fermi. Os cálculos que acabámos
de efectuar são apenas uma estimativa grosseira, mas mostram claramente que as
energias disponı́veis para excitar os electrões são, à temperatura ambiente, uma
fracção muito reduzida da energia de Fermi. Sendo assim, apenas aqueles electrões
que ocupam estados muito próximos da superfı́cie de Fermi (aqueles cuja energia
difere de εF por menos do que kB T ) podem ser excitados, já que os restantes
(j) 1 eV (lê-se electrão-Volt) é a energia adquirida por um electrão acelerado por uma diferença
de potencial de 1V, ou seja, 1 eV' 1, 6 × 10−19 J.
86
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
(profundamente “enterrados” na esfera de Fermi) iriam, após a excitação, ocupar
estados já ocupados, o que é impossı́vel nos termos do princı́pio de exclusão de Pauli.
À temperatura ambiente, a configuração da nuvem electrónica no espaço-k consiste
ainda numa esfera (como a 0 K), mas que apresenta um ligeiro “esboroamento” da
sua superfı́cie, sendo possı́vel encontrar estados desocupados no seu interior e, em
igual número, estados ocupados no exterior.
Este facto marca a principal diferença relativamente ao tratamento clássico da
nuvem electrónica, e iremos mais adiante abordar as suas consequências.
5.4.5
A distribuição de Fermi-Dirac
À temperatura de zero Kelvin, todos os estados electrónicos com energia inferior
ou igual à energia de Fermi estão ocupados. A densidade de probabilidade para
que um estado de energia ε esteja ocupado é então, para T = 0 K e à parte uma
constante de normalização,
½
fT =0 K (ε) =
1,
0,
se ε ≤ εF
se ε > εF .
(5.35)
À temperatura ambiente, em contrapartida, da discussão precedente concluimos
que quase todos os estados quânticos com energia pequena (quando comparada
com a do nı́vel de Fermi) estão ocupados; a fracção de estados ocupados só decresce
sensivelmente em nı́veis com energia muito próxima de εF , numa região com largura
aproximadamente igual a kB T . Pode mostrar-se (mas não o faremos aqui) que a
função que descreve esta situação é a chamada função de distribuição de FermiDirac,
1
fT (ε) = (ε−µ)/k T
,
(5.36)
B
e
+1
onde µ é o potencial quı́mico do sistema. O limite da distribuição de Fermi-Dirac
quando T → 0 deve ser a expressão (5.35), e podemos então concluir que
lim µ = εF .
T →0
(5.37)
Quando a temperatura sobe, o valor do potencial quı́mico decresce ligeiramente;
mas, mesmo à temperatura ambiente, o seu valor mantém-se muito aproximadamente igual ao da energia de Fermi. Por esta razão, não é, frequentemente, feita
qualquer distinção entre os dois.
Na Figura 5.7 está representada a forma da função de distribuição de FermiDirac para T = 0 K e para temperaturas não nulas.
O facto de apenas alguns electrões serem excitados quando, partindo do estado
fundamental, se aquece o gás de electrões de condução até à temperatura ambiente,
tem, como deve ser evidente, um efeito determinante sobre o calor especı́fico da
nuvem electrónica. Com efeito, a energia total (da nuvem electrónica) não deve,
neste aquecimento, aumentar tanto quanto o previsto usando o tratamento clássico,
baseado na função de distribuição de Maxwell-Boltzmann. O número de electrões
que ocupam estados excitados à temperatura ambiente representa uma fracção tão
pequena do total, que a energia do gás de electrões de condução difere muito pouco
da do estado fundamental do gás. A contribuição principal para o calor especı́fico
dos metais a temperaturas não excessivamente altas é então a fornecida pela rede
de iões e portanto verifica-se, mesmo para metais, a lei de Dulong e Petit (ver o
capı́tulo anterior).
5.4. O MODELO DE SOMMERFELD
87
1
6000
3000
600
0
K
K
K
K
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
Figura 5.7: Gráfico da função de distribuição de Fermi-Dirac, para T = 600 K (a
tracejado), T = 3000 K (a pontilhado) e T = 6000 K (a cheio). O valor da energia de
Fermi usado neste exemplo foi de εF = 5 eV.
(†)Variação do potencial quı́mico com a temperatura: Aproximação de
Sommerfeld
Como acabamos de constatar, para temperaturas superiores ao zero absoluto, T >
0◦ K, os estados de energia imediatamente superiores à energia de Fermi são ocupados e o nı́vel de Fermi passa a ser designado pelo nı́vel de energia com 50%
de probabilidade de ocupação. Este facto, vai implicar que o nı́vel de Fermi baixe
ligeiramente com o aumento de temperatura. Podemos justificar esta variação constatando que, a função de distribuição de Fermi-Dirac, f (ε), é assimétrica em εF para
todas as temperaturas, porém a função densidade de estados g(²) aumenta com a
energia e à medida que a temperatura aumenta existe uma porção crescente da
população total dos fermiões que ocupa estados de maior energia. Como o número
total de electrões tem de se manter constante; isto é, as áreas da Figura 5.8 têm de
ser iguais, e o nı́vel εF (T ) para o qual f (εF (T )) = 1/2 (k) tem de ser deslocado sucessivamente para valores mais baixos com o aumento de temperatura. Assim, para
determinarmos a variação do nı́vel de Fermi podemos partir do cálculo do número
total de electrões de condução que deve permanecer constante independentemente
da temperatura, e que podemos escrever do seguinte modo,
·Z
εF
N=
¸
dε g(ε)
0
·Z
∞
=
T =0
¸
dε f (ε) g(ε)
0
.
(5.38)
T >0
O cálculo do primeiro termo de (5.38) já foi efectuado atrás em (5.34). O segundo
termo pode ser calculado usando a aproximação de Sommerfeld. Nesta aproximação
começamos por calcular o integral
Z
N=
∞
dε f (ε) g(ε),
(5.39)
0
(k) ε (T ), corresponde ao nı́vel de fermi para T > 0 K, que por definição é o nivél energético com
F
50% de probabilidade de ocupação.
88
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
f(ε) g(ε )
1
T=0K
área = área
0.8
0.6
0.4
T>0K
0.2
ε
0
ε
F
Figura 5.8: Representação gráfica, normalizada, de f (ε) g(ε), para T = 0◦ K e T >
0◦ K.
por partes, do seguinte modo
Z ∞
Z
∞
dε f (ε) g(ε) = [f (ε) G(ε)]0 −
0
=
∞
dε f 0 (ε) G(ε)
Z
limε→∞ f (ε) G(ε) − f (0) G(0) −
0
∞
dε f 0 (ε) G(ε),
0
em que
Z
G(ε)
=
dε g(ε)
ε
3
V
(2mε) 2
3~3 π 2
=
(5.40)
é a primitiva da função densidade de estados. Atendendo às propriedades da função
de distribuição de Fermi-Dirac, temos que quando a energia ε → ∞ a função
f (ε) → 0, e quando a energia ε = 0 a a função f (ε) = 1 e G(ε) = 0. Deste
modo (5.39) reduz-se a
Z
∞
N =−
dε G(ε) f 0 (ε).
(5.41)
0
A derivada da função de Fermi-Dirac, f 0 (ε), vai ter um papel importante neste
cálculo, pois vai-nos permitir fazer um aproximação bastante razoável. Vejamos,
derivando (5.36) obtemos
0
f (ε) = −
e
kB T (e
(ε−εF )
kB T
(ε−εF )
kB T
.
(5.42)
+ 1)2
A função (5.42) tem a forma de função delta-Dirac, δ(εF ), quando T → 0 K (derivada da função degrau) e é aproximadamente uma função delta-Dirac de largura
finita quando T > 0 K (ver Figura 5.9). Tendo em conta que o nı́vel de Fermi é
ordens de grandeza superior que às energias disponı́veis para os fermiões poderem
mudar de estado, a função (5.42) só tem valor expressivo na vizinhança da energia
de Fermi. Assim, será válido fazer uma aproximação em série de Taylor da função
G(ε) em torno da energia de Fermi, εF , que desenvolvida até à segunda ordem pode
ser escrita do seguinte modo,
1
G(ε) = G(εF ) + (ε − εF )G0 (εF ) + (ε − εF )2 G00 (εF ) + O(ε − εF )3 ,
2
(5.43)
5.4. O MODELO DE SOMMERFELD
f( ε )
89
-f´( ε)
1
T=0 K
T>0 K
1/2
εF
ε
εF
(a)
ε
(b)
Figura 5.9: (a) Função de distribuição de Fermi-Dirac; (b) Simétrico da derivada da
função de Fermi-Dirac, −f 0 (ε). Esta função aproxima-se de uma função delta-Dirac
quando T → 0
onde O(ε−εF )3 representa os termos de ordem superior que vamos nesta abordagem
desprezar. Aplicando (5.43) em (5.41) resulta,
Z ∞
Z ∞
0
0
N = −G(εF )
dεf (ε) − G (εF )
dεf 0 (ε)(ε − εF )
0
0
Z ∞
1
− G00 (εF )
(5.44)
dεf 0 (ε)(ε − εF )2 .
2
0
O primeiro integral em (5.44) pode ser resolvido usando a mudança de variável,
x=
e fica simplesmente
Z
∞
ε
dx
− K FT
B
(ε − εF )
,
kB T
ex
≈
x
(e + 1)2
Z
(5.45)
∞
dx
−∞
(ex
ex
= 1,
+ 1)2
(5.46)
porque εF >> kB T .
O segundo integral em (5.44), após a mudança de variável (5.45) pode ser escrito
da seguinte forma,
Z ∞
ex x
kB T
dx x
=0
(5.47)
(e + 1)2
−∞
o que é esperado já que a função de Fermi-Dirac é assimétrica em relação ao nı́vel
de Fermi, εF , e consequentemente o resultado da integração da sua derivada, f 0 (ε)
com qualquer função impar, como é o caso da função integranda e em (5.47) e de
todos os termos de ordem impar da expansão de Taylor (5.43), é nulo.
Finalmente para o terceiro integral em (5.44) obtemos, após a mudança de
variável (5.45), um valor que é função da temperatura,
Z ∞
2
ex x2
2π
2
dx x
=
(k
T
)
(5.48)
(kB T )
B
2(e + 1)2
6
−∞
Conjugando os resultados de (5.46), (5.47) e (5.48), o número total, N , de
electrões de condução é,
N = G(εF ) + G00 (εF )(kB T )2
π2
.
6
(5.49)
Como sabemos o nı́vel de Fermi diminui ligeiramente o seu valor comparado com
o nı́vel de Fermi a 0◦ K, εF (0). Podemos deste modo e sem cometer um grande
90
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
erro aproximar o valor da função G(ε) em ε = εF , integrando até εF (0) (nı́vel de
Fermi no zero absoluto) e subtraindo uma coluna de de largura εF (0) − εF , e altura
g(εF (0)), do seguinte modo
Z εF
G(εF ) =
dε g(ε)
Z
0
εF (0)
=
dε g(ε) − [εF (0) − εF ] g(εF (0)).
(5.50)
0
Assim (5.49) toma seguinte forma
Z
N=
εF (0)
dε g(ε) + [εF − εF (0)] g(εF (0)) + (kB T )2
0
usando,
π2 0
g (εF (0)).
6
(5.51)
G00 (ε) = g 0 (ε).
Mas como já sabemos de (5.34),
Z
εF (0)
N=
dε g(ε),
0
logo o número total de electrões, N , em (5.51) anula-se e ficamos com uma expressão
que relaciona, o nı́vel de Fermi no zero absoluto, com o nı́vel de Fermi a uma
temperatura diferente de zero,
[εF − εF (0)] g(εF (0)) + (kB T )2
π2 0
g (εF (0)) = 0.
6
(5.52)
Para efectuarmos o cálculo (5.52) é conveniente redefinir a expressão densidade de
estados em função do nı́vel de Fermi no zero absoluto, εF (0), usando (5.31) e (5.34),
da seguinte forma,
3
ε1/2
g(ε) = N
.
(5.53)
2 (εF (0))3/2
Assim, substituindo
g(εF (0)) =
g 0 (εF (0)) =
3
N (εF (0))−1
2
3
N (εF (0))−2
4
em (5.52) obtemos, finalmente, a variação do nı́vel de Fermi com a temperatura:
"
µ
¶2 #
π 2 kB T
.
(5.54)
εF = εF (0) 1 −
12 εF (0)
5.4.6
Energia de um gás de fermiões para T > 0 K
A energia de um gás de fermiões a temperaturas diferentes do zero absoluto é
calculada usando a relação de energia,
Z ∞
E(T ) =
dε g(ε) f (ε)ε.
(5.55)
0
Podemos usar de novo a aproximação de Sommerfeld. Para esse efeito vamos definir
a função, h(ε), tal que,
h(ε) = ε g(ε).
5.4. O MODELO DE SOMMERFELD
91
A expressão para a energia (5.55) é agora
Z
E
∞
=
dε h(ε) f (ε)
0
= H(εF ) +
π 2 00
H (εF )(kB T )2 .
6
(5.56)
onde a função H(ε) é a primitiva de h(ε),
Z
H(ε) = dε0 ε0 g(ε0 ).
ε
Usando a mesma aproximação usada em (5.50) para o cálculo da variação do nı́vel
de Fermi, a função H(εF ) pode ser expressa como,
Z
εF (0)
H(εF ) =
dε ε g(ε) + [εF − εF (0)] εF (0) g(εF (0)),
(5.57)
0
e a segunda derivada de H(εF ) no ponto εF pode ser aproximada a
H 00 (εF ) ≈ εF (0) g 0 (εF (0)) + g(εF (0)).
(5.58)
Assim a contribuição energética dos electrões, calcula-se substituindo (5.57)
e (5.58) em (5.56), obtendo,
µ
¶
π2
dε ε g(ε) + εF (0) [εF − εF (0)] g(εF (0)) + (kB T )2 g 0 (εF (0)) +
6
0
2
π
+g(εF (0))(kB T )2 .
(5.59)
6
Z
E
=
εF (0)
onde, se tivermos em atenção (5.52), o segundo termo desta expressão (5.59) é nulo,
pelo que se obtem a expressão simplificada seguinte,
Z
εF (0)
E=
dε ε g(ε) + g(εF (0))(kB T )2
0
π2
,
6
(5.60)
que pode após subistituição do valor da energia do gás de fermiões no zero absoluto,
obtemos finalmente
"
µ
¶2 #
5 2 kB T
3
.
(5.61)
E = N εF (0) 1 + π
5
12
εF (0)
5.4.7
Calor especı́fico
Estamos agora em condições de poder calcular a contribuição dos fermiões para o
calor especı́fico de um sólido através da definição usual,
µ
¶
∂E
CV =
.
∂T V
Usamos a expressão da energia (5.61), obtemos,
cV =
2
T
π 2 kB
N
.
2 εF (0)
(5.62)
92
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
Substituindo a densidade electrónica em (5.62) por o número de Avogardo, NA ,
obtemos o calor especı́fico molar,
CV
=
=
kB 2 T
π2
NA
2
εF (0)
π2 T
R .
2 TF
(5.63)
onde TF representa a temperatura de Fermi dada por, TF = εF /kB .
O quociente entre temperatura ambiente e a temperatura de Fermi para os
metais tem valores tı́picos entre 1/300 a 1/50 o que, como já se esperava, torna
a contribuição para valor do calor especı́fico dos electrões bastante pequena, em
conformidade com a lei de Dulong e Petit, e contraria o valor previsto pelo modelo
clássico de Drude-Lorentz.
A baixas temperaturas (< 4◦ K) esta contribuição calor especı́fico torna-se dominante em relação à contribuição das oscilações dos iões da rede cristalina. Será
assim pertinente apresentar uma relação “refinada”, para baixas temperaturas, que
contenha ambas contribuições para o calor especı́fico molar de um metal:
µ ¶3
1 2 T
12 4
T
CV = π R
+ π R
,
(5.64)
2
TF
5
θD
onde θD , é a temperatura de Debye do metal.
5.4.8
A condutividade eléctrica
Como acabámos de discutir, os electrões mais profundamente “enterrados” na esfera
de Fermi estão congelados, no sentido em que não podem, à temperatura ambiente,
sofrer excitações de origem térmica. Vimos que, por esta razão, a nuvem electrónica
contribui muito pouco para o calor especı́fico dos metais.
Poder-se-ia pensar que este “congelamento” impede também a nuvem electrónica
de contribuir para a condutividade eléctrica, já que, também aqui, é necessário que
pelo menos alguns electrões sejam excitados. Com efeito, na ausência de campos eléctricos externos e no estado fundamental, a distribuição das velocidades
electrónicas tem simetria esférica, ou seja, dado um qualquer electrão com velocidade v (vector de onda k), existe outro com velocidade −v (vector de onda −k)
cuja contribuição para a corrente eléctrica anula a do primeiro. Como, no estado
fundamental, todos os electrões estão desta forma “emparelhados”, a corrente total
é nula(l) . Para que se verifique condução eléctrica é pois necessário que (pelo menos) alguns electrões sofram uma transição para um estado “desemparelhado”, no
exterior da esfera de Fermi. Como o número de electrões em estados com energia
acima da do nı́vel de Fermi aumenta com a temperatura, poderı́amos pensar que
também a condutividade eléctrica dos metais seria maior a temperaturas maiores,
tomando valores muito baixos para temperaturas próximas do zero absoluto. Ora,
esta conjectura contraria flagrantemente os dados experimentais. A condutividade
dos metais é, regra geral, uma função decrescente da temperatura.
Na discussão acima, cometemos o erro de supor que a população electrónica dos
estados exteriores à esfera de Fermi tem apenas origem térmica, isto é, que apenas
por absorção de energia vibracional da rede cristalina se podem promover transições
electrónicas. Isto é evidentemente errado! São possı́veis trocas de energia com um
campo eléctrico externo, que contribuem determinantemente para a população de
electrões em estados “desemparelhados”. Um campo eléctrico externo muda o estado de todos os electrões na nuvem de condução, comunicando-lhes uma aceleração
(l) Note-se que este resultado não é nada de estranhar, já que, desde o inı́cio, estamos a supôr
que o campo eléctrico aplicado é nulo...
5.4. O MODELO DE SOMMERFELD
93
oposta à direcção do campo (recordemos que a carga dos electrões é negativa). Este
efeito, conjugado com a possibilidade de colisões com a rede cristalina, com defeitos,
com fonões, tem como resultado que cada electrão atinge uma velocidade limite, e
a diferença (vectorial) entre este limite e a velocidade inicial é a mesma para todos
os electrões. Dada a relação entre as velocidades v e os vectores de onda k dos
electrões, tudo se passa como se a esfera de Fermi, inicialmente centrada na origem
do espaço-k, sofresse um deslocamento δ na direcção oposta à do campo aplicado
(ver a Figura 5.10).
ky
ky
kx
kx
E
Figura 5.10: À esquerda, a esfera de Fermi na ausência de campo eléctrico. Os estados
ocupados (zona sombreada) apresentam, no espaço-k simetria esférica e portanto a
velocidade média, tomada para todos os electrões, é nula. À direita, a esfera de Fermi
quando se aplica um campo eléctrico. O conjunto dos estados presentes na zona
cinzento-claro apresenta um valor médio da velocidade nulo; os estados na região
indicada a cinzento-escuro, que também estão ocupados, contribuem todos para a
corrente eléctrica.
Se designarmos por τ o tempo médio de colisão, cada electrão vai sofrer uma
modificação na sua velocidade de cerca de −eτ E/m(m) , uma variação de momento
(p = mv) de −eEτ e uma variação de vector de onda (k = p/~) de −eEτ /~, que
deve agora ser o valor médio do vector de onda. Uma vez que todos os electrões vão
sofrer esta transição de estado, o princı́pio de exclusão de Pauli não se aplica.
A média das velocidades dos electrões deve agora ser < v >= ~/m < k >=
−eτ /mE. A densidade de corrente, j = ρ < v >= −ne < v >, vem então
j=
ne2 τ
E,
m
onde n é o número de electrões de condução por unidade de volume. Comparando
esta expressão com a da lei de Ohm (j = σE), obtemos a forma da condutividade
eléctrica:
ne2 τ
σ=
.
m
Este foi o resultado obtido no estudo clássico (ver a Secção 5.2.2). Apesar das
diferenças importantes entre as duas abordagens ao problema da condução eléctrica,
a expressão da condutividade como função das caracterı́sticas do material em que
se processa, apresenta a mesma forma nas descrições clássica e quântica.
O livre caminho médio dos electrões de condução pode ser obtido multiplicando
o módulo da sua velocidade pelo tempo médio de colisão. Nesta descrição quântica
que temos vindo desenvolver, os electrões apresentam valores muito dı́spares de velocidade. Com efeito, os electrões que estão próximos da superfı́cie de Fermi ocupam
(m) Esta
expressão é simplesmente a que resulta do estudo do movimento uniformemente acelerado
de uma partı́cula de massa m, sob a acção de uma força constante −eE , durante um intervalo de
tempo τ .
94
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
estados com vectores de onda cujos módulos são muito superiores aos daqueles em
estados mais profundamente enterrados na esfera de Fermi. Sendo assim, haverá
electrões com diferentes valores para o livre caminho médio. Por exemplo, para o cobre, σ = 5, 8×107 Ω− 1 m− 1 e n = 8, 4×102 8 m− 3, de onde resulta τ = 2, 5×10−14 s.
A velocidade dos electrões que ocupam estados no nı́vel de Fermi pode ser calculada a partir da densidade electrónica, n, obtendo-se vF = 1, 6 × 106 m/s. O livre
caminho médio para um electrão no nı́vel de Fermi de um cristal de cobre é então
λ ≈ 390 Å, ou seja, cerca de 100 vezes as distâncias interatómicas tı́picas!
Vemos assim que o problema do livre caminho médio de que enfermava o modelo
clássico de electrões livres não é eliminado nesta descrição quântica. De facto, este
problema não é eliminado senão quando se consideram as interacções dos electrões
de condução com a rede cristalina.
5.5
Crı́tica dos modelos de electrões livres
Tanto o modelo clássico de Drude como o modelo quântico de Sommerfeld apresentam graves deficiências. À parte a questão do calor especı́fico dos metais (e algumas
outras propriedades que não abordámos), os dois modelos apresentam inconvenientes semelhantes, alguns dos quais são:
(a) Não fornecem explicação para a existência de metais com coeficientes de Hall
positivos;
(b) não descrevem correctamente a dependência da condutividade com a temperatura. Em particular, o caso de certos materiais cuja condutividade aumenta
com a temperatura, em certos intervalos de temperatura;
(c) nalguns condutores, a condutividade depende da orientação do campo eléctrico, facto incompreensı́vel numa teoria de electrões livres;
(d) Os modelos de electrões livres não respondem à pergunta mais imediata: Porque é que alguns sólidos são condutores e outros não?
Para responder a este e outros problemas, teremos que considerar as interacções
entre os electrões de condução e a rede cristalina. De facto, os electrões nos sólidos
não são livres e esperar que um modelo que os trate como tal seja capaz de descrever
com exactidão todas as propriedades electromagnéticas dos sólido é certamente
optimismo em demasia.
PROBLEMAS
5.1 Relacione a probabilidade de colisão por unidade de tempo, γ, com o tempo médio
de colisão τ .
5.2 Prove, a partir da definição de densidade de corrente, j = ρl v , que a corrente
total que passa através de uma superfı́cie S é igual ao fluxo de j através de S,
Z
i=
S
j · n̂dS,
onde n̂ é um vector unitário que, em cada ponto da superfı́cie S, lhe é perpendicular.
5.3 Relacione kF com ²F com pF .
5.4 Calcule a energia do estado fundamental de fermiões.
5.5 Escreva a expressão da energia de um gás de fermiões num estado arbitrário.
5. Problemas
5.6 A resposta ao Problema 4 é E = 3/5 N ²F onde N é o número total de fermiões
no gás e ²F é energia de Fermi. Obtenha a expressão da pressão do gás de
fermiões (p = ∂E/∂V ) e do módulo de compressibilidade (B = −V ∂p/∂V ) de
um gás de fermiões no estado fundamental.
5.7 O lı́tio tem condutividade eléctrica de σ =1,05×107 Ω−1 m−1 e uma densidade
atómica de 4,80×1028 átomos por metro cúbico.
(a) Determine a velocidade de condução média dos electrões no metal quando
se aplica um campo eléctrico de 100 V/m, e compare o valor obtido com a
velocidade dos electrões no nı́vel de Fermi.
(b) Determine a velocidade dos electrões cuja energia é igual à energia média
dos electrões no cristal, segundo o modelo de Sommerfeld.
(c) Determine a velocidade média dos electrões à temperatura de 300 K, segundo o modelo de Drude-Lorentz.
5.8 O sódio tem densidade de ρ =0,97×103 kg/m3 , uma massa atómica relativa de
23 e condutividade eléctrica de 2, 1 × 107 Ω−1 m−1 . Determine a mobilidade dos
electrões no sódio.
5.9 A densidade do bário é de 3, 5 × 103 kg/m3 e a massa atómica relativa é 137.
Sabendo que este elemento tem dois electrões de valência, determine o raio da
esfera de Fermi e o valor da energia de Fermi correspondente.
5.10 Determine o valor do nı́vel de Fermi para o Cobre no zero absoluto e mostre que a
variação do nı́vel de Fermi com a temperatura no intervalo [0 K-300 K] não excede
aproximadamente 0,001%. O cobre tem uma densidade de 8, 93 × 103 kg/m3 e
massa relativa de 63, 5.
5.11 Determine a energia dos electrões no nı́vel de Fermi, e o coeficiente de proporcionalidade α relativo à contribuição da energia dos electrões para o calor especı́fico
dos sólidos, partindo do valor a = 4, 225 Å referente ao parâmetro da célula
convencional cúbica da rede associada a este elemento.
5.12 Partindo da aproximação de Debye e do modelo de electrões livres, compare as
contribuições da energia fonões e dos electrões para o calor especı́fico do potássio
à temperatura de 0,1, 1 e 10 K. A temperatura de Debye para o potássio é de
89 K, e parâmetro da célula convencional cúbica da rede associada a este elemento
é a = 5, 225 Å.
5.13 A grafite é um cristal laminar em que os átomos de carbono estão distribuı́dos
(para uma determinada camada) nos vértices de hexágonos regulares de lado
d = 1, 42 Å, que se encaixam entre si. Os electrões de valência da grafite, à
razão de um electrão por átomo, podem mover-se basicamente no dito espaço
bidimensional. Suponha que estes electrões são livres. Usando o modelo de
Sommerfeld para estas camadas bidimensionais, determine:
(a) a densidade electrónica;
(b) a densidade de estados, g(ε);
(c) a energia de Fermi;
(d) a energia espectável dos electrões à temperatura de zero Kelvin.
5.14 Considere um estado electrónico que tem probabilidade de ocupação de 95% a
um certa temperatura T . Derive uma expressão para, ε − εF , a sua energia
relativamente ao potencial quı́mico.
(a) Determine o valor de ε − εF para T = 100, 300 e 1200 K.
(b) Repita os cálculos para uma probabilidade de 5%.
(c) Comente os resultados obtidos.
Nota: Considere que o nı́vel de Fermi, εF , não varia com a temperatura.
5.15 O estrôncio tem uma estrutura cúbica de faces centradas de aresta a = 6, 08 Å.
95
96
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
(a) Usando o modelo de electrões livres de Sommerfeld determine o raio da
esfera de Fermi no zero absoluto.
(b) Determine a velocidade de um electrão com energia Fermi à temperatura
de 0◦ , 30◦ e 300◦ Kelvin. Comente os resultados.
(c) Determine a velocidade média de condução dos electrões quando sujeitos a
um campo eléctrico de 2,5 V/cm, sabendo que a condutividade eléctrica do
estrôncio a 20◦ C é de 1, 66 × 105 Ω−1 m−1 .
Capı́tulo 6
Metais II: Teoria de bandas
Deve ser evidente que alguns inconvenientes (de entre os que foram apresentados no
final do capı́tulo anterior) das teorias de electrões livres têm origem exactamente no
facto de se considerarem os electrões “desligados” de quaisquer interacções com o
meio onde se deslocam; o facto de a condutividade da grafite, por exemplo, depender
da direcção da corrente mostra bem que deve existir alguma interacção entre os
electrões e o cristal, que torna mais fácil o movimento em certas direcções que
noutras. É também evidente que uma teoria de electrões livres só se pode aplicar a
condutores, sendo portanto incapaz de explicar a razão de alguns sólidos o serem e
outros não.
Estas considerações são evidentes e poderiam ter sido feitas ainda antes de termos desenvolvido a teoria de electrões livres. Parece assim natural que um modelo
tenha em linha de conta a influência do meio cristalino sobre os electrões possa
resolver estas dificuldades. A teoria que vamos passar a descrever, não só classifica
estas questões, como explica as restantes, discutidas no Capı́tulo anterior, como os
elevados valores do livre caminho médio a baixa temperatura ou as colocadas pela
existência de sólidos cuja condutividade aumenta com a temperatura, que apresentam coeficientes de Hall positivos, etc.
6.1
Introdução
Nesta nova abordagem continuaremos a desprezar as interacções electrão-electrão.
A razão principal para esta aproximação é a complexidade da teoria completa, que
torna impraticável a sua resolução sem recorrer aos métodos, aproximados, da teoria quântica de muitos corpos. Com efeito, o problema é o seguinte: queremos
determinar a função de onda dos electrões, resolvendo a equação de Schrödinger.
Mas antes temos que determinar o potencial a que estão sujeitos. Ora, considerando
interacções electrão-electrão, só podemos conhecer o potencial depois de conhecida
a função de onda. Considerando, além disso, que a função de onda deve depender
das 3N coordenadas de posição dos N electrões, sendo N da ordem de 1020 , fica-se
com uma ideia da complexidade do problema. Felizmente, o modelo que iremos
desenvolver é notavelmente preciso, demonstrando-se assim, a postriori, que as interacções electrão-electrão são, de facto, pouco significativas na maior parte das
aplicações(a) .
Não considerando as interacções electrão-electrão, apenas as interacções com a
rede cristalina contribuem para a energia potencial dos electrões. Cada electrão
move-se numa região onde está definida uma função de potencial independente dos
(a) Uma
excepção importante desta afirmação é o caso da supercondutividade.
97
98
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
restantes electrões. A este tipo de aproximação para sistemas de muitos corpos
dá-se o nome de aproximação de partı́cula única, ou de partı́culas independentes.
Uma vez que a rede cristalina é (em primeira aproximação - ver Capı́tulo 4) um
arranjo periódico tridimensional de átomos, o potencial electrónico por ela estabelecido também deve ser periódico, com a mesma periodicidade da rede. Uma vez
que a força entre cargas de sinal contrário (os electrões e os iões que formam a rede)
é atractiva, o potencial electrónico deve apresentar mı́nimos nas posições ocupadas
pelos iões, como se mostra na Figura 6.1, numa representação unidimensional.
V(x)
x
a
a
a
Figura 6.1: Exemplo de potencial periódico unidimensional.
A resolução da equação de Schrödinger com um potencial periódico fica substancialmente simplificada pelo teorema de Bloch, que demonstramos na secção seguinte. Antes de o fazermos, podemos estudar de forma qualitativa a deformação
das orbitais atómicas quando aproximamos vários átomos uns dos outros. Quando
os átomos estão afastados uns dos outros, os electrões atómicos praticamente não
sentem interacções senão com o átomo a que pertencem, e portanto as orbitais são
essencialmente as previstas pela fı́sica atómica: um conjunto de nı́veis energéticos
designados pelos sı́mbolos 1s, 2s, 2p, etc(b) . Um esquema destes nı́veis está representado na Figura 6.2. Se aproximarmos deste átomo um outro, idêntico, cada um
E
V(x)
2p
2s
1s
Figura 6.2: Nı́veis de energia atómicos.
destes nı́veis subdivide-se em dois, sendo a separação tanto maior quanto maior for
a energia do nı́vel original (ver Figura 6.3). Se aproximarmos 3 átomos cada nı́vel
subdivide-se em 3 e assim sucessivamente. Se considerarmos agora um cristal, que
consiste num número elevado de átomos na vizinhança uns dos outros, cada nı́vel
atómico subdivide-se em tantos subnı́veis quantos forem os átomos que formam o
cristal. Estes subnı́veis estão tão próximos (em termos energéticos) uns dos outros
(b) Usou-se a notação espectroscópica (a mais habitual) para indicar os estados electrónicos. O
número inteiro representa o número quântico principal; a letra que o segue representa o momento
angular, de acordo com s → l = 0; p → l = 1; d → l = 2; etc. Assim, o estado 2p é o estado com
número quântico principal n = 2 e número quântico de momento angular l = 1.
6.1. INTRODUÇÃO
99
E
V(x)
2p
2s
1s
Figura 6.3: Nı́veis de energia numa molécula biatómica.
que não é possı́vel detectar a sua separação. Cada nı́vel subdivide-se então um
número enorme de vezes, criando assim uma banda de energias permitidas, como
mostra a Figura 6.4. Este desdobramento dos nı́veis atómicos pode ser ilustrado
E
V(x)
2p
2s
1s
Figura 6.4: Bandas de energia num cristal.
usando a teoria da perturbações. Outra alternativa é a resolução da equação de
Schrödinger numericamente (usando métodos que estão descritos em qualquer livro
de análise numérica) para uma partı́cula com uma energia potencial com uma série
de mı́nimos dispostos contiguamente.
É importante notar que neste desdobramento das orbitais atómicas não varia
o número total de estados electrónicos. Com efeito, quando se aproximam dois
átomos da mesma espécie quı́mica, cada orbital atómica divide-se em duas orbitais
moleculares, mas inicialmente temos dois átomos, cada qual com o seu conjunto de
orbitais atómicas, e no fim temos apenas uma molécula. As duas orbitais moleculares correspondentes a cada nı́vel atómico podem ver-se como combinações lineares
das duas orbitais atómicas (uma de cada átomo) que as originam.
Na Figura 6.4, os electrões que ocupam as bandas 1s e 2s estão localizados na
proximidade dos átomos a que pertencem, porque as suas energias não são suficientes
para ultrapassar as barreiras de potencial entre os átomos (estamos a desprezar a
possibilidade de efeito de túnel). Os electrões da banda 2p podem mover-se ao
longo do cristal, mas não se deve pensar por isso que estão livres de forças; uma
partı́cula livre pode ter qualquer energia(c) , ao passo que estes electrões têm uma
energia que deve estar compreendida entre os limites da banda a que pertencem.
Um análogo clássico do movimento destes electrões consiste numa esfera movendo-se
num terreno ondulado, com energia suficiente para vencer a altura das ondulações
do terreno.
(c) Descontando o efeito de quantizações resultantes da imposição de condições fronteira que, de
resto, é insignificante, neste contexto.
100
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
No estado fundamental (à temperatura de 0 K), somente as bandas de menor
energia estão ocupadas pelos electrões; destas, a de maior energia tem particular
importância para o estudo das propriedades dos sólidos, e designa-se por banda de
valência do sólido. Esta designação é herdada do nome da orbital atómica (também
designada por orbital de valência) que lhe dá origem.
Vamos agora estudar as propriedades das funções de onda de electrões que se
movem num potencial periódico.
6.2
O teorema de Bloch
Já referimos que a função energia potencial dos electrões, sendo resultante da sua
interacção com o meio cristalino, deve ser uma função periódica do espaço, com
o mesmo perı́odo do cristal. A equação de Schrödinger independente do tempo é
então
~2 2
−
∇ ψ(r) + V (r)ψ(r) = εψ(r),
(6.1)
2m
onde V (r) é uma função periódica com a periodicidade da rede cristalina. O teorema
de Bloch afirma que as soluções da Eq. (6.1) têm a forma(d)
ψk (r) = eik·r uk (r),
(6.2)
onde uk (r) é uma função periódica do cristal, isto é, que verifica
uk (r + R) = uk (r),
(6.3)
qualquer que seja o vector da rede cristalina R. Um enunciado equivalente do teorema de Bloch é o seguinte: as soluções da equação de Schrödinger para potenciais
cristalinos verificam a condição
ψk (r + R) = eik·R ψk (r),
(6.4)
qualquer que seja o vector da rede cristalina R. É evidente que funções com a forma
definida na Eq. (6.2) gozam desta propriedade. Com efeito,
ψk (r + R) =
=
=
eik·r eik·R uk (r + R)
eik·r eik·R uk (r)
eik·R ψk (r).
A implicação inversa também é facilmente demostrável. De facto, é sempre possı́vel
escrever qualquer função (e, portanto, também as soluções da equação de Schrödinger) na forma
ψk (r) = eik·r f (r),
desde que se escolha convenientemente a função f (r). Mas, para que uma função
com esta forma satisfaça a propriedade da Eq. (6.4), é necessário que f (r + R) =
f (r), qualquer que seja o vector da rede cristalina r, ou seja, que f apresente a
periodicidade da rede cristalina exigida na Eq. (6.3).
Agora que demosntrámos a equivalência dos dois enunciados do Teorema de
Bloch, vamos passar à sua demonstração. Dada a periodicidade do arranjo atómico
nos cristais (ideais), todas as funções da posição fisicamente observáveis devem
apresentar a mesma periodicidade. A função de onda dos electrões não é uma função
fisicamente observável, e por isso não é, necessariamente, uma função periódica.
k é um parâmetro vectorial que identifica o estado electrónico. Ao contrário do parâmetro k
que identifica os estados de electrões livres que temos estudado até agora, este não é proporcional
ao momento linear dos electrões de Bloch.
(d)
6.2. O TEOREMA DE BLOCH
101
Assim, sendo R um vector da rede cristalina, não podemos garantir a igualdade
ψ(r + R) = ψ(r); podemos é, sem qualquer perda de generalidade, escrever
ψ(r + R) = s(R)ψ(r),
(6.5)
escolhendo cuidadosamente a função s(R). Em contrapartida, o quadrado do
módulo da função de onda é, de acordo com a interpretação de Max Born, igual à
densidade de probabilidade de presença do electrão, ou seja, é uma função fisicamente observável. Logo, de acordo com o que se disse acima, deve ser uma função
periódica da posição com a periodicidade da rede, isto é, deve verificar(e)
ψ ∗ (r + R)ψ(r + R) = ψ ∗ (r)ψ(r).
(6.6)
Substituindo aqui a Eq. (6.5), resulta que o quadrado do módulo da função s é
unitário, qualquer que seja o vector de rede R. Logo, esta função tem necessariamente a forma
s(R) = eiχ(R) .
Tomando então o caso particular R = a, onde a é um dos vectors fundamentais da
rede cristalina, temos
ψ(r + a) = eik·a ψ(r).
Da mesma maneira,
ψ(r + 2a) =
=
=
ψ(r + a + a)
eiχ(a) ψ(r + a)
e2iχ(a) ψ(r)
ou seja ainda, com n inteiro arbitrário,
ψ(r + na) = einχ(a) ψ(r).
Considerando agora deslocamentos nas direcções dos outros vectores fundamentais
(b e c), e repetindo os mesmos argumentos que se aplicaram até agora, podemos
concluir que a relação entre os valores da função de onda em pontos equivalentes
do cristal é
ψ(r + R) = ei[hχ(a)+kχ(b)+lχ(c)] ψ(r),
(6.7)
onde os inteiros h, k, l são as componentes cristalográficas do vector de rede R, isto
é, se tem
R = ha + kb + lc.
Demonstrámos até agora que as soluções da equação de Schrödinger numa região
onde está definido um potencial cristalino se transformam, sob translacções segundo
vectores de rede de acordo com a Eq. (6.7). Os valores das três quantidades χ(a),
χ(b), χ(c) distinguem as diferentes soluções entre si. Estas três quantidades podem
podem ser usadas para definir as componentes de um vector k, através de
k·a =
χ(a)
k·b =
k·c =
χ(b)
χ(c).
Assim, a soma hχ(a) + kχ(b) + lχ(c) pode escrever-se simplesmente como k · R, e
a Eq. (6.7) fica
ψ(r + R) = eik·R ψ(r),
(6.8)
(e) O
asterisco em ψ ∗ representa o complexo conjugado de ψ.
102
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
uk(x)
-2a
-a
a
2a
a
2a
0
ψk(x)
-2a
-a
0
Figura 6.5: Exemplo de função de Bloch. No gráfico de cima está representada a
função moduladora uk (x), com perı́odo a; no de baixo representa-se a função de onda
propriamente dita, ψk (x), (a cheio), bem como a onda plana modulada exp(ikx) (a
tracejado).
em conformidade com o segundo enunciado do teorema de Bloch, concluindo-se
assim a sua demonstração.
A forma das funções de onda de electrões que se movem num cristal, apresentada
na Eq. (6.2), é a de ondas planas monocromáticas eik·r , moduladas por funções com
a periodicidade cristalina uk (r). Na Figura 6.5 apresenta-se um exemplo das funções
uk (x) e ψk (x), numa situação unidimensional.
6.3
6.3.1
Propriedades dos estados de Bloch
Periodicidade no espaço recı́proco
Como já se disse, as diferentes soluções da equação de Schrödinger para os electrões
num cristal distinguem-se pela forma como se transformam sob translacções segundo
vectores da rede cristalina. Mais concretamente, distinguem-se pelas componentes
do vector k, de acordo com a Eq. (6.4). Consideremos duas soluções particulares
caracterizadas pelos vectores k e k0 = k + G, onde G é um vector da rede recı́proca
do cristal qualquer. Segundo o teorema de Bloch, estas duas funções de onda
transformam-se sob translacções segundo o vector da rede R como
ψk (r + R)
= eik·R ψk (r)
ψk0 (r + R)
= eik ·R ψk0 (r).
0
Explicitemos o vector k0 nesta última equação. Resulta então
ψk+G (r + R) = ei(k+G)·R ψk+G (r).
Recordemos agora que, por definição de vector da rede recı́proca, se tem que
eiG·R = 1, para todos os vectores, G, da rede recı́proca e para todos os vectores, R,
da rede directa. Então a função de onda ψk+G tem, sob translacções segundo vectores de rede, um comportamento idêntico ao da função ψk ; logo, estas duas funções
são indistinguı́veis, ou seja, representam o mesmo estado electrónico. Para se evitar, no cálculo das propriedades da nuvem electrónica, a contabilização repetida da
contribuição de um dado estado, devemos ter cuidado com este tipo de indistinguibilidade escondida das funções de onda. A forma mais simples de assegurar que
não se cometem erros relacionados com esta questão é considerar apenas vectores k
pertencentes todos a uma mesma célula unitária primitiva da rede recı́proca. Como
se sabe, é sempre possı́vel escolher para qualquer rede uma grande diversidade de
formas para as células unitária primitivas. Neste caso, escolhe-se sempre a célula de
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
103
Wigner-Seitz (ver a Secção 2.2, e a Figura 2.3) da rede recı́proca, mais usualmente
conhecida como primeira zona de Brillouin.
Uma consequência importante da indistinguibilidade de dois estados de Bloch
cujos vectores k diferem entre si por um vector da rede recı́proca é que todas as
propriedades fı́sicas dos estados electrónicos devem ser funções periódicas de k, com
a periodicidade da rede recı́proca. Com efeito, seja X(k) o valor da propriedade X
para um electrão num estado cuja função de onda é ψk ; uma vez que o mesmo estado
pode ser representado por qualquer das funções ψk+G , com G vector arbitrário da
rede recı́proca, o cálculo da propriedade X deve produzir o mesmo valor quando
realizado a partir de qualquer destas funções, isto é,
X(k + G) = X(k),
6.3.2
∀ G vector da rede recı́proca.
Nı́veis de energia dos estados de Bloch
Substituindo na equação de Schrödinger as soluções de Bloch da Eq. (6.2), obtemos
a equação diferencial a satisfazer pelas funções uk (r),
−
~2
2
[∇ + ik] uk (r) + V (r)uk (r) = ε(k)uk (r).
2m
(6.9)
Esta equação, formalmente semelhante à equação de Shrödinger, é uma equação de
valores próprios para o operador
Hk = −
~2
2
[∇ + ik] + V (r),
2m
que depende de um parâmetro vectorial que é o vector k. Para cada valor de k,
este operador deve apresentar um conjunto de funções próprias, u1k (r), u2k (r), . . .,
unk (r), . . ., às quais correspondem os valores próprios (nı́veis de energia) ε1 (k),
ε2 (k), . . ., εn (k), . . ., e tanto aquelas como estes devem ser funções contı́nuas do
parâmetro k. Mais ainda, como vimos na Secção 6.3.1, os diversos nı́veis de energia
εn (k) devem ser funções periódicas de k. Ora, funções contı́nuas e periódicas são
necessariamente funções limitadas, pelo que devemos ter cada nı́vel de energia εn (k)
a tomar valores num intervalo bem limitado de energias. O espectro energético
dos electrões num metal deve pois ter um aspecto que pode, qualitativamente, ser
representado como mostra a Figura 6.6. Chama-se banda ao conjunto de estados
electrónicos unk (r) para cada valor de n. Nesta figura apenas estão representados
os valores de k pertencentes à primeira zona de Brillouin porque, como já vimos,
vectores k fora desta região representam estados que já têm correspondência nalgum
vector k no seu interior e portanto, neste sentido, são redundantes. Na Figura 6.6
as bandas de energia estão separadas por um intervalo de energias proibidas: esta
situação corresponde ao que de facto se passa em muitos sólidos, mas é possı́vel
(se bem que pouco frequente) que duas bandas de energia se sobreponham. Ao
intervalo de energias proibidas entre duas bandas dá-se o nome de hiato energético,
mas é mais usual a utilização da expressão, “aportuguesada” do inglês, “gap de
energia”.
Dentro de cada banda, a energia dos estados electrónicos é uma função periódica
do vector k. Esta função é, em geral, muito mais complicada do que a que caracteriza os estados de electrões livres. A sua forma depende da estrutura cristalina
do sólido em que se movem os electrões, que está representada, na equação que define a energia [Eq. (6.9)], pelo termo correspondente ao potencial electrónico V (r).
Em geral, a energia de um estado depende também da direcção do vector k e não
apenas do seu módulo, como acontece com os estados de electrões livres. Mas esta
dependência não é de todo arbitrária. Vamos de seguida demonstrar que a energia
104
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
ε
ε
n
n
ε
3k
n=3
ε
2k
n=2
ε
1k
n=1
− π /a
(a)
π /a
k
(b)
Figura 6.6: (a) Nı́veis de energia atómicos, resultantes da resolução da equação de
Schrödinger para um potencial atómico; (b) Bandas de energia dos estados electrónicos
de um sólido. As bandas propriamente ditas são os intervalos representados a sombreado, ao longo do eixo da energia. As formas apresentadas para as funções εn (k)
são arbitrárias.
é uma função par de k, isto é, que
εn (k) = εn (−k).
(6.10)
Tomando o complexo conjugado da Eq. (6.9) e fazendo a substituição k → −k
obtemos
−
~2
2
[∇ + ik] u∗n −k (r) + V (r)u∗n −k (r) = εn (−k)u∗n −k (r).
2m
(6.11)
onde u∗ representa o complexo conjugado de u(f) . Mas as eqs. (6.9) e (6.11) são
idênticas e por isso as suas soluções devem ser as mesmas; logo, podemos concluir
que u∗n−k (r) = unk (r) e, mais importante para o que nos interessa,
εn (k) = εn (−k),
como querı́amos demonstrar.
6.3.3
Momento linear
As funções de onda de Bloch, ψk (r), representam os estados estacionários de electrões que se movem numa região (o cristal) onde a sua energia potencial, que traduz
as interacções com o meio, é uma função periódica da posição. A expressão “estados
estacionários” significa que um electrão que ocupe um destes estados permanece
nele enquanto não for perturbado por agentes externos ou por alterações do meio
em que se move (defeitos no cristal, por ecemplo). Estes estados distinguem-se
entre si pelo parâmetro vectorial k, que está relacionado com a forma como se
transformam sob translacções segundo vectores da rede. Isto é, o vector k (de que
não conhecemos ainda o significado fı́sico) é uma constante do movimento de um
electrão de Bloch no estado ψk . Por outro lado, o momento linear de um electrão de
Bloch não deve ser uma constante do movimento, já que um electrão que se move
numa região onde está definido um potencial periódico está sujeito a forças que se
traduzem em acelerações, ou seja, em alterações do seu momento linear. Assim,
(f) As
energias são grandezas reais e por isso V ∗ (r ) = V (r ) e ε∗n (k) = εn (k).
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
105
não podemos identificar ~k com o momento linear dos electrões no estado de Bloch
ψk , como fizemos no estudo dos electrões livres. Esta conclusão é ainda reforçada
pela aplicação do operador quantidade de movimento ao estado ψk . De acordo
com as regras da Mecânica Quântica, os estados caracterizados por valores bem
determidados do momento linear são os estados próprios do operador associado a
este observável, P̂ = −i~∇. Ora, com ψk dado pela Eq. (6.2), temos
P̂ ψk (r) = eik·r (~k − i~∇) uk (r),
expressão que não corresponde a uma equação de valores próprios. Assim, as funções
de Bloch não são funções próprias do operador do momento linear e, portanto,
um electrão num estado de Bloch não apresenta um valor bem determinado deste
observável. No entanto, o vector ~k tem, como veremos já de seguida, um papel
importante na dinâmica dos electrões de condução nos metais, muito semelhante ao
do momento linear de electrões livres. Para realçar esta semelhança formal, dá-se o
nome de momento linear cristalino de um electrão no estado de Bloch ψk ao vector
~k. Usaremos também a expressão “vector de onda cristalino” para nos referirmos
ao vector k.
6.3.4
Velocidade média e momento linear cristalino
A expressão para o cálculo da velocidade de electrões livres, v = ~k/m, não pode
ser adoptada para electrões em estados de Bloch, uma vez que o seu momento
linear não é dado por p = ~k. Como já se disse, electrões em estados de Bloch não
apresentam um momento linear bem determinado e, logo, o mesmo se passa com
a velocidade. Podemos, quando muito, determinar os resultados possı́veis de uma
medição da velocidade e as respectivas probabilidades e, a partir destes valores,
calcular o valor expectável da velocidade.
Um problema relacionado com este é o da determinação da velocidade de propagação de um sinal que não é caracterizado por um comprimento de onda bem
determinado. Uma perturbação puramente sinusoidal (isto é, uma onda com comprimento de onda, λ, e frequência, ν, bem determinados) propaga-se no meio que a
suporta com uma velocidade, chamada velocidade de fase, cujo módulo é
v = λν =
ω
,
k
(6.12)
onde se introduziram os parâmetros ω = 2πν e k = 2π/λ. A dificuldade do cálculo
da velocidade de sinais não puramente sinusoidais é a seguinte. Consideremos um
sinal não sinusoidal arbitrário f (x, t) (esta função pode, por exemplo, representar
o som de um trovão). É possı́vel escrever a função f (x, t) como combinação linear
de funções sinusoidais com diferentes frequências e comprimentos de onda, usando
as técnicas da análise de Fourier. Descrevemos desta maneira o sinal em questão
como a sobreposição de várias funções puramente sinusoidais. Cada uma destas
componentes sinusoidais, caracterizada por valores bem determinados de k e de ω,
tem uma velocidade de fase dada pela Eq. (6.12), mas as velocidades das diferentes
componentes não são, em geral, todas iguais, logo, não podem ser identificadas com
a velocidade da propagação do sinal. Em vez disso, identifica-se esta velocidade de
propagação com a do ponto onde o sinal tem amplitude máxima. Este valor tem
o nome de velocidade de grupo do sinal. Pode demonstrar-se que a velocidade de
grupo é dada por
dω
vG =
.
(6.13)
dk
Note-se que para ondas puramente sinusoidais, a velocidade de fase é igual à de
grupo.
106
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
ky
v
k
k
kx
v
Figura 6.7: A velocidade, v , e o vector de onda cristalino k. A velocidade é, para
cada
estado k, perpendicular à superfı́cie de nı́vel da energia para esse valor de k.
.
Voltemos agora ao problema que motivou esta pequena digressão, o problema da
velocidade dos electrões em cristais. A velocidade média das partı́culas quânticas
é, em geral, identificada com a velocidade de grupo da sua função de onda. Assim,
dizemos que a velocidade média de um electrão num estado de Bloch ψk é
v(k) =
dω(k)
1 d²(k)
=
,
dk
~ dk
onde se usou a bem conhecida igualdade de Plank ² = ~ω. Introduzindo agora o
operador gradiente no espaço recı́proco, dado por
gradk ≡ î
∂
∂
∂
+ ĵ
+ k̂
,
∂kx
∂ky
∂kz
obtemos a generalização tridimensional da definição de velocidade média dos electrões de Bloch:
1
v G = gradk ω(k) = gradk ε(k).
(6.14)
~
Note-se que a velocidade de grupo de um electrão num estado de Bloch não representa a sua velocidade instantânea. De facto, a velocidade de grupo de um electrão é
constante e bem definida, permanece inalterada enquanto o electrão não sofrer uma
transição de estado. Em contrapartida, a velocidade instantânea de um electrão de
Bloch está continuamente a variar, como efeito das acelerações resultantes da sua
interacção com o cristal de iões. A velocidade de grupo, que identificamos com a
velocidade dos electrões, representa o valor expectável do observável velocidade. É,
assim, o valor médio da velocidade dos electrões nos estados de Bloch.
Como é bem sabido, o gradiente de uma função tem a direcção em que é máxima
a variação da função, perpendicular às suas superfı́cies de nı́vel. Logo, a velocidade
de um electrão de Bloch, num estado com vector de onda cristalino k, é perpendicular à superfı́cie de nı́vel da energia nesse ponto k. Em particular, os electrões que
se encontram na superfı́ce de Fermi têm uma velocidade que é perpendicular a essa
superfı́cie (veja a Figura 6.7).
Um electrão num estado de Bloch, sujeito apenas à interacção com um cristal
ideal, tem uma energia bem definida, constante do movimento. Contudo, se se
definir no cristal, para além dos campos que que são intrinsecamente caracterı́sticos,
um campo de forças externas, F , então o electrão adquire desse campo de forças
energia, a uma taxa temporal igual a
dε
= v · F,
dt
(6.15)
sendo v o vector velocidade média do electrão em estudo. Mas a velocidade média
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
107
é uma caracterı́stica do estado, ou seja, é uma função de k. Logo,
dε
∂ε dki
=
.
dt
∂ki dt
Adoptou-se aqui a covenção de soma sobre ı́ndices repetidos de Einstein, isto é,
subentende-se uma soma para todos os valores do ı́ndice i = 1, 2, 3 no lado direito
desta expressão. Esta convenção será adoptada daqui em diante, salvo indicações
explı́citas em contrário. Substituindo esta expressão na Eq. (6.15), obtemos
∂ε dkj
= vj F j .
∂kj dt
Usando agora a fórmula da velocidade [Eq. (6.14)], podemos reescrever a expressão
acima como
dkj
~vj
= vj Fj ,
dt
ou seja,
d
(~kj ) = Fj .
(6.16)
dt
Esta equação é semelhante à que traduz a segunda lei de Newton,
F =
dp
,
dt
com o vector ~k a desempenhar o papel de momento linear dos electrões de Bloch.
No entanto, voltamos a recordar que,para a taxa de variação do momento linear
dos electrões no cristal contribuem as forças exteriores F , mas contribuem também
as forças de interacção com o cristal de iões, forças essas que não são contabilizadas na Eq. (6.16. Assim, podemos considerar o vector ~k como uma espécie de
momento linear efectivo dos electrões num cristal, conceito que permite algumas
simplificações, já que apenas as forças exteriores ao cristal contribuem para a sua
modificação.
6.3.5
Massa efectiva dos electrões de Bloch
Consideremos agora um electrão de Bloch sujeito a uma força externa F . A aceleração que adquire por estar sob a acção desta força pode ser calculada como
ai =
dvi
∂vi dkj
=
.
dt
∂kj dt
Substituindo aqui a expressão da velocidade dos electrões de Bloch e da derivada
do momento linear cristalino [respectivamente, as eqs. (6.14) e (6.16)], obtemos
ai =
1 ∂2ε
Fj .
~2 ∂ki ∂kj
(6.17)
Esta expressão é muito parecida com a da segunda lei de Newton(g) e exprime
a aceleração de um electão que se move num cristal como resultado apenas das
forças que sobre ele actuam exteriores ao cristal, não considerando a influência
das interações com o cristal. Este resultado é, obviamente, extremamente útil e
prático, mas o preço a pagar por esta simplificação é a introdução de um parâmetro
(g) As leis da Fı́sica Clássica, não têm nada que ser satisfeitas por electrões, poderão dizer. Assim
é, de facto. Mas note-se que a aceleração a em (6.17) é a derivada do valor expectável da velocidade
que, de acordo com o teorema de Ehrenfest, satisfaz uma expressão formalmente semelhante à lei
fundamental da dinâmica de Newton.
108
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
matricial variável que substitui a massa dos electrões de Bloch, chamado tensor da
massa efectiva, que se representa por m∗ e é a matriz inversa da matriz
−1
[m∗ ]ij =
1 ∂2ε
.
~2 ∂ki ∂kj
(6.18)
Um electrão move-se num cristal de forma bastante complicada, sujeito como
está às forças exercidas pelos átomos que formam o cristal, mas acabámos de ver que
podemos simplificar bastante o seu estudo, substituindo na lei do movimento a sua
massa pelo tensor da massa efectiva, após o que basta apenas considerar, nas leis do
movimento, as forças exteriores, como campos eléctricos aplicados, etc. Claro que
a matriz da massa efectiva tem que apresentar algumas particularidades que não
esperamos da massa dos objectos comuns. Por exemplo, em geral a aceleração de um
electrão de Bloch não tem a direcção da força que a provoca. Além disso, a matriz
da massa efectiva é variável, as suas componentes têm valores diferentes conforme
a magnitude e a orientação do vector k. Assim, pode acontecer que dois campos
de forças iguais, mas com orientações diferentes, produzam acelerações diferentes.
Desta maneira, podemos explicar porque é que alguns sólidos (a grafite, p. ex.)
apresentam condutividades que variam com a orientação da corrente eléctrica. É
também possı́vel que, para valores particulares de k, algumas componentes (ou
mesmo todas) do tensor da massa efectiva sejam negativas; nestes casos, campos
aplicados numa direcção produzem correntes com direcções opostas...
Já agora, é interessante verificar qual a forma do tensor de massa efectiva para
electrões livres, situação que conhecemos melhor. O movimento de electrões livres
é, de facto, apenas condicionado pelas forças exteriores ao cristal, uma vez que as
forças internas são desprezadas. Então esperamos que a massa efectiva seja neste
caso igual à massa real. De facto, a aplicação da Eq. (6.18) com a função energia
de electrões livres, dada por
~2 k 2
ε(k) =
,
2m
permite obter o resultado
−1
1
[m∗ ]ij = δij ,
m
onde δij é o sı́mbolo delta de Kronecker, cujos elementos são os da matriz identidade,
½
0,
i 6= j
δij =
1,
i = j.
−1
Assim, a matriz [m∗ ] é diagonal e todos os seus elementos são iguais, logo a sua
inversa, que é o tensor da massa efectiva, é, simplesmente,
[m∗ ]ij = mδij ,
como já esperávamos.
6.3.6
O livre caminho médio
Vimos no capı́tulo anterior que é difı́cil entender os valores obtidos no quadro dos
modelos de electrões livres para o livre caminho médio dos electrões, que considerámos demasiado elevado. Com efeito, nos modelos de electrões livres, supõe-se
que os electrões de condução sofrem colisões com os iões que formam o cristal,
mas os valores previstos para o livre caminho médio resultam ser centenas de vezes
superiores à distância interatómica, para temperaturas próximas da temperatura
ambiente.
6.4. MODELO DE KRÖNIG-PENNEY
109
Este problema é clarificado no quadro da teoria de Bloch, mas devemos, antes
de mais, clarificar o significado de colisão. Uma colisão entre dois corpos é uma alteração dos seus estados de movimentos como resultado da interacção mútua. Classicamente, caracterizamos o estado de movimento de uma massa pontual através
do seu momento linear; uma colisão entre dois corpos clássicos pontuais é pois um
processo de influência mútua em que se alteram os seu momentos lineares. Nos
modelos de electrões livres, o estado de um electrão é especificado pelo vector k,
que é proporcional ao momento linear. As colisões destas partı́culas com os iões
da rede provocam alterações no vector k, ou seja, na quantidade de movimento.
Na mesma ordem de idéias, devemos aceitar que, na teoria de Bloch, a colisão de
um electrão com o que quer que seja deve manifestar-se como uma alteração do
seu estado, isto é, como uma alteração do vector k. Mas, já se disse, um electrão
que ocupa, num cristal ideal, um estado de Bloch ψnk (r), permanece nesse estado
se não se verificarem influências externas que o perturbem, porque os estados de
Bloch têm já em linha de conta as interacções com a rede cristalina. Assim, neste
sentido, os electrões de Bloch não sofrem colisões com os iões da rede. Podem,
isso sim, modificar o seu estado, mas apenas por colisões contra as fronteiras do
cristal, contra fonões (vibrações do cristal), contra impurezas, em suma, contra
defeitos no cristal, qualquer que seja a sua natureza. Ora, os defeitos cristalinos
estão muito mais afastados entre si do que os iões da rede, pelo que se percebem
agora os elevados valores que obtivemos para o livre caminho médio dos electrões.
A conclusão é a seguinte: tanto quanto se possa considerar o cristal como perfeito
(isto é, absolutamente periódico), os electrões não sofrem modificação de estado,
ou seja, colisões; estas devem ocorrer nas excepções à periodicidade, isto é, nos
defeitos cristalinos. Os electrões de Bloch não sofrem colisões com os átomos regularmente dispostos no cristal, mas apenas com os defeitos no cristal, que estão
mais afastados entre si que os átomos que o constituem. Por esta razão, o caminho
livre médio dos electrões de condução deve ser muito maior do que as distâncias
interatómicas tı́picas nos sólidos, em conformidade com os resultados obtidos no
quadro dos modelos de electrões livres.
6.4
Modelo de Krönig-Penney
Vamos agora ilustrar o conteúdo das secções precedentes recorrendo a um modelo
simples de cristal unidimensional, o modelo de Krönig-Penney. Este modelo descreve os estados de uma partı́cula quântica que se move numa região onde está
definido um potencial que é uma sucessão de barreiras de potencial rectangular
idênticas, regularmente espaçadas entre si (ver a Figura 6.8). Nós vamos usar uma
versão particularmente simples do deste modelo, em que a largura, l, das barreiras
tende para zero, enquanto a sua altura, V , cresce de maneira a manter constante o
produto lV . No limite, cada barreira fica igual a uma função delta de Dirac(h) . A
função potencial que vamos usar é então
V (x) =
∞
~2 λ X
δ(x − na),
2m a n=−∞
(6.19)
(h) A função delta só é diferente de zero num único ponto, mas o seu integral em qualquer intervalo
que contenha esse ponto é 1. Mais rigorosamente, a função delta define-se através das seguintes
propriedades:
δ(x − a) = 0,
se x 6= a
Z a+²
f (x)δ(x − a) = f (a),
∀² > 0.
a−²
110
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
V(x)
V
x
a
l
V(x)
x
-2a
-a
0
a
2a
Figura 6.8: Potencial do modelo de Krönig-Penney (em cima). Em baixo, o potencial usado neste trabalho: a largura, l, das barreiras diminui até zero, enquanto a
sua altura, V , aumenta indefinidamente, de tal forma que o produto lV permanece
constante.
onde λ é um parâmetro adimensional que pode ser usado para regular a intensidade
do potencial cristalino. Podemos até estudar o limite de electrões livres escolhendo
λ = 0. Este potencial é um caso particular dos potenciais contı́nuos por intervalos
que se constumam estudar nas disciplinas de introdução à Mecânica Quântica. A
resolução da equação de Schrödinger nestes casos é feita separadamente em cada
região de continuidade do potencial, impondo-se em seguida condições de continuidade da função de onda nos pontos em que o potencial é descontı́nuo. Vamos então
dividir a recta real em regiões de continuidade da função potencial, que designaremos por R0 , R±1 , R±2 . . . , sendo Rn o intervalo (n − 1)a < x < na. Em qualquer
destas regiões, a equação de Schrödinger escreve-se como
−
~2 d2
ψ = ²ψ
2m dx2
e, para ² positivo, admite soluções do tipo (tomamos a região Rn para concretizar
a discussão)
ψ (n) (x) = Xn eikx + Yn e−ikx
ou, equivalentemente (basta tomar An = Xn eikna , Bn = Yn e−ikna ),
ψ (n) (x) = An eik(x−na) + Bn e−ik(x−na) .
(6.20)
Nestas expressões, k está relacionado com a energia do estado, ², através de
k2 =
2m²
.
~2
(6.21)
Na região contı́gua Rn+1 , e usando as mesmas convenções, a função de onda escrevese
ψ (n+1) (x) = An+1 eik(x−[n+1]a) + Bn+1 e−ik(x−[n+1]a) .
(6.22)
A solução da equação de Schrödinger é a união das diferentes funções ψ (n) , união
essa que deve ser feita de modo a satisfazer certas comdições de continuidade. Antes,
porém, de estudarmos a continuidade da função de onda, devemos notar que, sendo
o potencial uma função periódica da posição, estamos nas condições do teorema de
Bloch. Logo, as soluções da equação de Schrödinger devem satisfazer a condição
ψq (x + a) = eiqa ψq (x),
6.4. MODELO DE KRÖNIG-PENNEY
111
onde q é um parâmetro real, que caracteriza a função de onda particular ψq tal
como os números n, l, ml , ms caracterizam as funções de onda de electrões atómicos.
Note-se que esta condição envolve o valor da função de onda em diferentes células
unitárias do nosso cristal unidimensional, ou diferentes regiões, de acordo com a
designação que temos usado. Tomando x na região Rn , x + a pertence à região
Rn+1 ; a condição de Bloch pode pois escrever-se como
ψq(n+1) (x + a) = eiqa ψq(n) (x),
ou seja,
h
i
An+1 eik(x−na) + Bn+1 e−ik(x−na) = eiqa An eik(x−na) + Bn e−ik(x−na) .
Agrupando potências com expoentes iguais, obtemos
£
¤
£
¤
eik(x−na) An+1 − eiqa An + e−ik(x−na) Bn+1 − eiqa Bn = 0,
que só pode ser satisfeita para todos os valores de x se se anularem os coeficientes
das exponenciais, isto é, se
An+1
Bn+1
=
=
eiqa An
eiqa Bn
(6.23)
Faremos uso destas relações mais adiante. Vamos agora estudar as condições fronteira a satisfazer pela função de onda. Em primeiro lugar, a função de onda deve
ser uma função contı́nua. Assim, num ponto x = na que é partilhado pelas regiões
Rn e Rn+1 , devemos ter ψ (n) (na) = ψ (n+1) (na), ou seja,
An+1 e−ika + Bn+1 eika = An + Bn .
(6.24)
Quando o potencial não tem descontinuidades infinitas, a derivada da função de
onda é, também, uma função contı́nua, mas esse não é o caso aqui.
Para deduzirmos a forma das condições fronteira a satisfazer pela derivada da
função de onda, integremos a equação de Schrödinger,
−
~2 d2 ψ
+ V (x)ψ(x) = ²ψ(x),
2m dx2
num pequeno intervalo centrado num ponto x0 , com largura 2δ. Temos então
Z x0 +δ 2
Z x0 +δ
Z x0 +δ
~2
d ψ
−
+
V (x)ψ(x)dx = ²
ψ(x)dx.
2m x0 −δ dx2
x0 −δ
x0 −δ
No limite em que δ → 0, o integral no segundo membro desta equação anula-se,
porque a função de onda é contı́nua; o primeiro integral é fácil de calcular, por ser
o integral de uma derivada. Resulta então
"µ ¶
#
µ ¶
Z x0 +δ
dψ
dψ
~2
lim
−
+ lim
V (x)ψ(x)dx = 0,
−
δ→0 x −δ
2m δ→0
dx x0 +δ
dx x0 −δ
0
ou ainda
µ
dψ
dx
¶
µ
−
x0 +
dψ
dx
¶
x0 −
2m
= 2 lim
~ δ→0
Z
x0 +δ
V (x)ψ(x)dx,
(6.25)
x0 −δ
onde (F )x0 ± representa o limite de F quando o seu argumento tende para x0 por
valores superiores a x0 (sinal +) ou por valores inferiores a x0 (sinal -). Esta
condição de continuidade para a derivada da função de onda tem validade geral,
112
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
em problemas unidimensionais. No nosso caso, atendendo à forma particular do
potencial, temos, para x0 = na,
Z na+δ
~2 λ
V (x)ψ(x)dx =
ψ(x = na).
2m a
na−δ
Por outro lado, as duas derivadas obtêm-se facilmente a partir das expressões
[eqs. (6.20) e (6.22)] da função de onda nas duas regiões separadas pelo ponto
de abcissa x = na:
dψ (n)
dx
dψ (n+1)
dx
= ikAn eik(x−na) − ikBn e−ik(x−na)
= ikAn+1 eik(x−[n+1]a) − ikBn+1 e−ik(x−[n+1]a) .
Então, podemos escrever a condição geral da Eq. (6.25) como
µ
¶
µ
¶
iλ
iλ
−ika
ika
An+1 e
− Bn 1 +
.
− Bn+1 e = An 1 −
ka
ka
(6.26)
Usando agora a Eq. (6.23) para eliminar os coeficientes An+1 e Bn+1 das eqs. (6.24)
e (6.26), obtemos o seguinte sistema de duas equações homogéneas:
h
i
h
i
ei(q−k)a − 1 An + ei(q+k)a − 1 Bn = 0
¸
·
¸
·
iλ
iλ
i(q+k)a
i(q−k)a
An − e
−1−
Bn = 0.
e
−1+
ka
ka
Como qualquer sistema homogénio, este admite a solução trivial An = 0 = Bn = 0,
ou seja, ψ = 0, que não nos interessa. Soluções não triviais verificam-se apenas
quando o determinante da matriz formada com os coeficientes do sistema se anular. Após algumas manipulações algébricas, esta condição leva à seguinte equação
transcendental:
λ sin ka
cos qa = cos ka +
.
(6.27)
2 ka
Esta igualdade define uma relação entre o parêmetro q que caracteriza as diferentes
soluções da equação de Schrödinger e o parâmetro k que define a energia dessas
soluções. Dado um valor de q “basta” resolver esta equação em ordem a k para
obter a energia correspondente, usando a relação da Eq. (6.21). Infelizmente, esta
relação entre k e q é transcendental, logo, não pode ser resolvida analiticamente.
Além disso, para certos valores de k não é possı́vel verificá-la. Com efeito, o lado
esquerdo está limitado ao intervalo [−1, 1]; logo, não podem existir soluções para
todos os valores de k em que o lado direito saia deste intervalo. Na Figura 6.9
apresenta-se o gráfico da função no lado direito desta equação, assinalando-se as
regiões em que não existem soluções não triviais. Como a energia de um estado
depende do valor de k [ver a Eq. (6.21)], estes intervalos para os quais não há
soluções da equação de Schrödinger correspondem a hiatos de energia. Não há
estados estacinários de uma partı́cula num potencial de Krönig-Penney com energia
situada nesses intervalos proibidos.
Como se disse, a igualdade da Eq. (6.27) relaciona a energia dos estados permitidos (através da interposta “pessoa” do parâmetro k) com o parâmetro q que os
carateriza. Essa relação não pode ser explicitada analiticamente, porque a Eq. (6.27)
é uma equação transcendental. No entanto, podemos tentar a seguinte abordagem
numérica: dado um valor de q, variamos k (e, portanto, ²) até que a diferença entre os valores dos dois lados da Eq. (6.27) seja menor que um determinado limiar,
caso em que dizemos que a igualdade foi satisfeita. Usando este processo, muito
6.4. MODELO DE KRÖNIG-PENNEY
113
4
3
2
1
x=ka
0
2
4
6
8
10
12
-1
Figura 6.9: Gráfico da função no segundo membro da Eq. (6.27). Para os valores
da abcissa (x = ka) nas regiões sombreadas, não existem soluções da equação de
Schrödinger; correspondem aos gaps de energia.
ε(k)
ε(k)
3a banda
2a banda
q
1a banda
- π/a
0
π/a
q
- π/a
0
π/a
Figura 6.10: Estrutura de bandas do modelo de Krönig-Penney. Notam-se claramente
os hiatos energéticos. Para comparação, apresenta-se à direita a estrutura de “bandas”
no modelo de electrões livres, obtida escolhendo λ = 0 no potencial da Eq. (6.19). A
presença do potencial periódico abre os gaps, deformando ligeiramente a curva ²(q) na
fronteira da zona de Brillouin e “empurrando” para cima os ramos superiores dessa
curva.
114
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
rudimentar, foi possı́vel desenhar o gráfico da Figura 6.10. Escolheu-se para λ o
valor λ = 2π. Note-se que, com λ = 0, o potencial é constante, pelo que o potencial
de Krönig-Penney nesse caso é o de partı́culas livres. Nesse caso, a Eq. (6.27) fica
simplesmente
cos qa = cos ka,
que tem como solução k = q, e a energia fica ² = ~2 q 2 /2m, a expressão caracterı́stica
de partı́culas livres, que também é apresentada na Figura 6.10.
6.5
Número de estados por banda
A resolução de uma equação diferencial (como a de Schrödinger) não fica completa
sem a imposição de condições a satisfazer pela solução particular requerida. Apesar
de não resolvermos completamente a equação de Schrödinger [ou a sua versão de
Bloch (6.9)] é útil a imposição de condições fronteira, que reduzem número de estados de Bloch que é necessário considerar. Pelas razões já apresentadas na Secção 4.2,
escolhemos as condições fronteira periódicas. No entanto, em vez de as aplicarmos
a um volume cúbico de aresta L, é mais conveniente [devido à presença da função
periódica unk (r) na expressão geral dos estados de Bloch (6.2)] considerar um volume com a forma da célula unitária primitiva do cristal em estudo, contendo um
número inteiro, N , destas células unitárias primitivas (ver a Figura 6.11). As di-
Nc c
b
Nb b
Na a
c
a
Figura 6.11: Forma da região considerada na imposição das condições fronteira.
mensões lineares desta região são Na |a|, Nb |b| e Nc |c| onde Na , Nb e Nc são números
inteiros, tais que o número de células unitárias, N , presentes no volume considerado
é dado por
N = Na Nb Nc .
As condições fronteira periódicas podem então ser expressas como
ψnk (r + Na a)
= ψnk (r)
ψnk (r + Nb b) = ψnk (r)
ψnk (r + Nc c) = ψnk (r).
(6.28)
De acordo com o teorema de Bloch, a primeira das equações em (6.28) pode ainda
ser escrita na forma
eiNa k·a ψnk (r) = ψnk (r)
ou ainda
eiNa k·a = 1.
6.6. O ESTADO FUNDAMENTAL DA NUVEM ELECTRÓNICA
115
De igual modo, obtemos para a segunda e terceira das eqs. (6.28)
eiNb k·b
eiNc k·c
= 1
= 1.
Recordando a definição de vector da rede recı́proca, verificamos que estas igualdades
são verificadas se o vector k fôr da forma
ma
mb
mc
k=
A+
B+
C,
(6.29)
Na
Nb
Nc
onde ma , mb e mc são inteiros arbitrários e A, B e C são os vectores fundamentais
primitivos da rede recı́proca. Note-se que Eq. (6.29) não implica que k seja um
vector da rede recı́proca, porque ma /Na , mb /Nb e mc /Nc não são, necessariamente,
números inteiros. Tal como para os electrões livres, verificamos que os estados
electrónicos permitidos formam um conjunto discreto, porque k só pode assumir os
valores definidos pela Eq. (6.29). Os valores permitidos para o vector k formam
uma rede cristalina, com vectores fundamentais primitivos A/Na , B/Nb e C/Nc .
Estamos agora em condições de determinar o número de estados numa banda.
Como se disse, devemos considerar apenas vectores k pertencentes a uma única
célula unitária primitiva da rede recı́proca, que tem um volume
Ω = |A · B × C|.
(6.30)
Por outro lado, o volume de espaço-k ocupado por cada um dos vectores k permitidos é o volume da célula unitária primitiva da rede por eles definida, de acordo
com a Eq. (6.29),
¯
¯
¯A B
C ¯¯
¯
τ = ¯
·
×
Na Nb
Nc ¯
Ω
1
|A · B × C| = .
=
Na Nb Nc
N
O número de vectores k que “cabem” numa célula é então o volume disponı́vel, Ω,
a dividir pelo volume ocupado por cada um, τ , ou seja, N . Considerando ainda
que para cada valor de k existem dois estados electrónicos (spin up ou spin down),
concluimos que o número total de estados numa banda é 2N , onde, recorda-se, N
é o número total de células unitárias primitivas que formam a região considerada
para a imposição das condições fronteira. Este facto também se pode entender
recordando que, no aparecimento das bandas de energia no processo de formação
dos sólidos, não aumenta o número de estados electrónicos. A banda de valência
resulta de combinações lineares de um grande número (seja N esse número) de
orbitais atómicas (uma por cada átomo). Cada orbital atómica pode acomodar
dois electrões (com orientações de spin opostas), logo, o conjunto deve conter 2N
estados electrónicos.
6.6
O estado fundamental da nuvem electrónica
Já vimos como a proximidade dos átomos num cristal leva ao desenvolvimento de
um espectro de bandas, em vez dos nı́veis de energia bem definidos que caracterizam
os átomos isolados. Cada uma destas bandas é populada por electrões provenientes
de cada um dos átomos que formam o cristal. Para simplificar a discussão, iremos
considerar cristais monoatómicos (formados por apenas uma espécie quı́mica), com
um átomo apenas por célula unitária (i) . Considerando um cristal com N átomos,
(i) Os argumentos que se seguem não são aplicáveis ao cloreto de sódio (cristal biatómico) ou ao
diamante (dois átomos por célula unitária primitiva).
116
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
e portanto com N células unitárias primitivas, o número de estados em cada banda
é 2N , como vimos na secção anterior.
O estado fundamental do sistema de electrões de Bloch é, essencialmente, definido do mesmo modo que para os electrões livres: todos os estados de baixa energia
devem estar ocupados por electrões. As bandas correspondentes aos nı́veis atómicos
de mais baixa energia, que no estado fundamental de cada átomo estão totalmente
preenchidas, ficam igualmente totalmente preenchidas. No estado fundamental de
cada átomo, apenas a orbital de valência pode conter estados electrónicos desocupados. A banda que resulta desta orbital pode então estar também apenas parcialmente preenchida (ver a Figura 6.12). A esta banda dá-se o nome de banda
Ε
< 2N electrões
2N electrões
2N electrões
Figura 6.12: Ocupação das diferentes bandas de um metal.
de valência. Tal como fizemos no estudo do modelo de electrões livres, podemos
“construir” o estado fundamental do sistema de electrões de Bloch, ocupando com
os electrões atómicos os nı́veis de Bloch de energia sucessivamente maior. Devemos
pois começar na primeira banda, preenchendo-a totalmente antes de começar a ocupar a segunda, e assim sucessivamente até à banda de valência. Para cada banda,
devemos começar a ocupar estados com k tal que correspondam a baixos valores de
energia. No caso dos electrões livres, a energia era simplesmente ε(k) = ~2 k 2 /2m;
dependendo a energia apenas do módulo do vector k, este processo de “estacionar”
electrões livres em nı́veis de energia sucessivamente maior resultava em superfı́cies
de Fermi com forma esférica. A situação é agora mais complicada, já que, em geral,
as funções εn (k) dependem também da direcção de k. Assim, para os electrões de
Bloch, a forma da superfı́cie de Fermi não é, em geral, esférica, podendo apresentar
configurações extremamente complexas. No entanto, estas formas devem manter as
simetrias da rede recı́proca. Um caso particular destas simetrias é o da paridade da
energia, expresso em (6.10). Uma vez que εn (k) = εn (−k), devemos, após o preenchimento do nı́vel k com dois electrões (um com spin up e outro com spin down)
e antes de preencher outro nı́vel qualquer com energia superior, ocupar estados
com energia igual a εn (k) entre os quais, necessariamente, o estado com momento
cristalino igual a −k. No estado fundamental do sistema, então deve verificar-se
que, se um estado ψnk se encontra preenchido, também o estará o estado ψn−k ; ao
contrário, se o estado ψnk está desocupado, também ψn−k o está. Assim, vemos
que a superfı́cie de Fermi deve apresentar simetria de inversão, isto é, deve ficar
invariante sob a operação k → −k. Na Figura 6.13 representa-se a superfı́cie de
6.7. A CONDUÇÃO ELÉCTRICA
117
ky
1ª zona de Brillouim
kx
Figura 6.13: Forma possı́vel da superfı́cie de Fermi para um cristal quadrado 2D.
Note-se que outras formas são possı́veis, pois a apresentada é apenas um exemplo.
Note-se também que esta superfı́cie de Fermi corresponde a uma banda não totalmente
preenchida, porque há ainda espaço disponı́vel na primeira zona de Brillouin para
“albergar” outros electrões.
Fermi para um cristal quadrado bidimensional.
Como já vimos, a velocidade média de um electrão de Bloch é a sua velocidade
de grupo:
1
v n (k) = gradk εn (k).
(6.31)
~
Sendo εn (k) uma função par de k, o seu gradiente é uma função ı́mpar de k.
Então a velocidade de um electrão cuja função de onda é ψnk deve ser igual, mas
oposta, à de outro com função de onda ψn−k . Mas como já vimos atrás, os estados
ψnk e ψn−k estão ambos ocupados ou ambos desocupados, no estado fundamental
colectivo. Então, no cálculo da velocidade média dos electrões, as contribuições dos
estados ψnk e ψn−k cancelam-se mutuamente. Como o valor de k considerado nesta
discussão é arbitrário, concluimos que a velocidade média dos electrões no estado
fundamental colectivo é zero. Note-se que nos referimos a uma média vectorial, e
que não consideramos a presença de campos de forças (eléctricas, por exemplo) que,
deformando a superfı́cie de Fermi, destruı́riam esta argumentação.
6.7
A condução eléctrica
Consideremos agora o efeito de um campo eléctrico (de grandeza tı́pica) na situação que acabámos de descrever. Tal como no caso dos electrões livres, um
campo eléctrico manifesta-se através de um deslocamento da superfı́cie de Fermi na
direcção contrária ao campo, deixando de ficar centrada no ponto k = 0, se este
deslocamento for possı́vel. Os argumentos apresentados no final da secção anterior
já não se aplicam (porque, por exemplo, ψnk pode estar ocupado sem que ψn−k o
esteja [veja a Figura 6.14]) e, a ser este deslocamento da superfı́cie de Fermi possı́vel,
a velocidade média da nuvem electrónica deixa de ser nula, verificando-se o aparecimento de uma corrente eléctrica. Mas este deslocamento da superfı́cie de Fermi só é
possı́vel se a banda de valência não estiver totalmente preenchida, porque, em caso
contrário, alguns electrões seriam obrigados a ocupar estados na região proibida.
Assim, concluimos que uma banda totalmente preenchida é inerte para efeitos de
condução eléctrica.
Como apenas a banda de valência de um sólido pode, no estado fundamental
(ou, seja à temperatura de 0 K), estar parcialmente preenchida, somente esta é
responsável pelas propriedades eléctricas dos sólidos. A teoria de Bloch permite
118
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
E =0
E
ky
kx
ky
kx
Figura 6.14: Deslocamento da superfı́cie de Fermi sob o efeito de um campo eléctrico.
Se a banda de valência estiver totalmente preenchida, a superfı́cie de Fermi é também
a fronteira da região proı́bida, impossibilitando o deslocamento da superfı́cie de Fermi,
ou seja, a condução eléctrica.
pois explicar porque é que alguns sólidos são condutores e outros isoladores: em
princı́pio, se a banda de valência de um sólido estiver totalmente preenchida, o
sólido é isolador; caso contrário, é condutor. Esta regra tem algumas excepções, já
que nalguns sólidos a banda de condução sobrepoem-se com a banda de valência,
permitindo a condução mesmo estando esta totalmente preenchida.
Considerando apenas sólidos cristalinos monoatómicos com um átomo por célula
unitária primitiva, podemos apresentar este critério a um nı́vel mais fundamental.
Os electrões presentes na banda de valência de um sólido são os que, nos átomos
isolados, ocupam o nı́vel de valência. Se N for o número total de átomos no sólido,
então porque consideramos apenas sólidos com um átomo por célula unitária primitiva, N é também o número de células unitárias no sólido, e o número de estados na
banda de valência é então 2N . Logo, se os N átomos que formam o sólido tiverem
apenas um electrão de valência, dos 2N estados disponı́veis na banda de valência,
apenas N estão ocupados e portanto o sólido é um condutor. Em contrapartida,
se os átomos em questão tiverem dois electrões de valência, a banda de valência do
sólido ficou totalmente preenchida e portanto o sólido é isolador.
6.8
O gás de Bloch à temperatura ambiente.
Nos átomos isolados, a última orbital não é a orbital de valência, existindo outros
estados electrónicos que podem ser ocupados excitando o átomo. De igual modo,
a banda de valência também não é a “última” banda no sentido em que há outras
bandas de energia superior, que, no estado fundamental do sistema de fermiões de
Bloch estão totalmente desocupadas, mas que podem estar parcialmente preenchidas
em estados excitados. À banda de energia imediatamente superior à da banda de
valência dá-se o nome de banda de condução. Mais uma vez, repetimos que à
temperatura ambiente, é possı́vel que alguns electrões sejam excitados (através de
colisões com fonões, por exemplo) para esta banda, e esta possibilidade deve ser
considerada no cálculo do valor de grandezas fı́sicas a temperaturas diferentes do
zero absoluto. Claro que a probabilidade destas excitações é tanto maior quanto
menor for a largura do hiato energético entre as duas bandas. Como vimos no
capı́tulo anterior, a energia média dos fonões à temperatura ambiente, T , é da ordem
de grandeza de kB T , onde kB é a constante de Boltzman, e portanto a população
da banda de condução só é apreciável à temperatura ambiente se o hiato energético
tiver uma largura da mesma ordem de grandeza. Um sólido com esta caracterı́stica
é um isolador(j) a temperaturas próximas do zero absoluto(k) mas pode conduzir
(j) Partindo do princı́pio que tem a banda de valência totalmente preenchida no seu estado fundamental.
(k) Não consideramos aqui o fenómeno de supercondutividade.
6.9. LACUNAS
119
E
(a)
Isolador
(b)
Condutor
T=0
T>0
Semicondutor
Figura 6.15: Isoladores, condutores e semicondutores. Os isoladores (à esquerda no
diagrama) têm a banda de valência totalmente preenchida e a de condução totalmente desocupada; os condutores (ao centro) têm a banda de valência ocupada, mas
não totalmente preenchida, ou então verifica-se uma sobreposição das duas bandas;
finalmente, os semicondutores (à direita) são isoladores à temperatura de zero kelvin,
mas o hiato energético entre a banda de valência e a de condução é pequeno, e à temperatura ambiente muitos electrões estão excitados para esta última, possibilitando a
condução.
electricidade à temperatura ambiente. Um aumento da temperatura produz um
aumento na energia média dos fonões, e por conseguinte um aumento da população
da banda de condução, ou seja, um aumento da condutividade. Para estes sólidos
(com um hiato energético, ²g , de cerca de 1 eV) a dependência da condutividade
é inversa da dos condutores, sendo a condutividade uma função decrescente da
temperatura. Este é outro sucesso da teoria de Bloch, já que este comportamento
(aumento de condutividade com a temperatura) é inexplicável, como vimos, no
quadro de uma teoria de electrões livres.
Os sólidos isoladores que, como os que acabámos de referir, apresentam um
hiato entre as bandas de valência e de condução suficiente pequeno para que, à
temperatura ambiente, a população da banda de condução tenha efeitos apreciáveis,
têm o nome de semicondutores. Na Figura 6.15 apresenta-se a configuração das
bandas de valência e de condução para condutores, isoladores e semicondutores.
6.9
Lacunas
A densidade de corrente eléctrica global de uma banda totalmente preenchida é, de
acordo com o que já se disse, nula. Assim, representando por j k (r) a densidade de
corrente de um electrão no estado ψk (l) e por J B (r) a densidade de corrente total
da banda, podemos escrever
J B (r) =
X
j k (r) = 0,
(6.32)
banda
onde o somatório se extende a todos os estados ψk da banda. Se quisermos calcular a densidade de corrente para uma banda parcialmente preenchida, devemos
fazer um somatório semelhante ao anterior, mas considerando apenas os estados
(l) Classicamente, a densidade de corrente é j (r ) = ρ(r )v (r ), onde ρ é a função densidade de
carga e v velocidade das cargas. Numa descrição quântica, a densidade de corrente associada a
uma partı́cula com carga q é j (r ) = q g (r ), onde g é a densidade de fluxo de probabilidade, dada
por g = (ψ ∗ ψ − ψ ψ ∗ ) /(2im) (ver qualquer livro elementar de Mecânica Quântica, p. ex.
S. Gasiorowocz, ”Quantum Mechanics”.)
~
r
r
120
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
Banda de
condução
f
Banda de
valência
Figura 6.16: Processo de criação de um par electrão de condução-lacuna por absorção
de um fonão.
efectivamente ocupados por electrões, ou seja,
X
j k (r),
J (r) =
(6.33)
e.o.
onde as iniciais “e. o.” significam que para o somatório apenas se tomam os estados
ocupados. De acordo com a Eq. (6.32), devemos ter
X
X
j k (r) +
j k (r) = 0,
e.o.
e.d.
onde as iniciais “e. d.” indicam que a soma respectiva é feita apenas sobre os
estados desocupados. Mas isto significa que os dois somatórios são simétricos, e
portanto podemos escrever a densidade de corrente de uma banda parcialmente
preenchida como
X
J (r) = −
j k (r),
(6.34)
e.d.
sendo este somatório, recordemo-lo, extendido apenas aos estados desocupados da
banda. Dispomos então de duas formas alternativas para o cálculo da contribuição de uma banda parcialmente preenchida para a corrente elétrica, dadas pelas
eqs. (6.33) e (6.34). Podemos interpretar esta segunda possibilidade considerando
os estados electrónicos desocupados, sobre os quais se faz o somatório, como se estivessem ocupados por partı́culas semelhantes aos electrões, mas com carga de sinal
contrário, justificando-se o sinal negativo na Eq. (6.34). A estas partı́culas dá-se
o nome de lacunas. A condução eléctrica pode ser descrita recorrendo aos estados electrónicos [usando a Eq. (6.33)] ou, alternativamente, aos estados de lacunas
[usando a Eq. (6.34)].
Reafirmemos que as lacunas são os estados electrónicos desocupados. Então,
uma banda totalmente preenchida (de electrões) pode ser vista como uma banda
vazia de lacunas. Dada a equivalência das duas descrições para os fenómenos de
condução, podemos dizer que uma banda totalmente preenchida (de electrões) não
pode conduzir porque não contém nenhuma lacuna para o transporte de carga.
Num semicondutor, em que o gap de energia entre as bandas de valência e de
condução é da ordem de grandeza da energia das vibrações atómicas (ou seja, da
energia dos fonões), é relativamente fácil a excitação de um electrão da banda de
valência para a banda de condução. Neste processo, é absorvido um fonão e, simultaneamente, é produzida uma lacuna na banda de valência, correspondente ao
estado deixado vago pelo electrão promovido (ver a Figura 6.16). Inversamente,
pode também dar-se o processo de recombinação, em que um electrão na banda
de condução emite um fonão (ou um fotão) transitando para a banda de valência,
onde irá ocupar um estado previamente vago (ou seja ocupado por uma lacuna).
Deve já ter-se notado a semelhança entre estes processos de criação e aniquilaçao
de pares electrão de condução-lacuna por absorção ou emissão de quanta de energia
com os de criação e aniquilação de pares partı́cula-antipartı́cula estudados na fı́sica
6.10. CONTAMINAÇÃO DE SEMI-CONDUTORES
121
subatómica. Esta semelhança não é um acidente. Confrontado com a existência
de soluções de energia negativa da sua equação de onda relativı́stica para fermiões,
Dirac, o cientista que primeiro propôs a existência de antimatéria, supôs que todos
esses estados estavam ocupados, definindo assim uma densidade de carga uniforme
em todo o espaço, sem efeitos observáveis, a que se passou a chamar o mar de Dirac.
Um electrão com energia positiva não poderia sofrer transições para esses estados
com energia negativa porque eles estavam todos ocupados. No entanto, usando
radição com energia suficiente, seria possı́vel excitar electrões para a “banda” de
energia positiva, criando assim um electrão observável e, simultaneamente, uma lacuna no mar de Dirac, que seria observada como uma partı́cula em tudo semelhante
aos electrões, mas com carga positiva — Um anti-electrão, ou positrão. Inversamente, o processo pelo qual um electrão com energia positiva decaı́sse para um
estado desocupado no mar de Dirac seria observado como uma aniquilação mútua
dos constituintes do par partı́cula-antipartı́cula, acompanhado de emissão de energia. Relacionando o quadro de Dirac com o nosso estudo, a banda de valência
corresponde ao mar de Dirac; a banda de condução aos estados com energia positiva; e ao gap de energia entre as duas bandas corresponde um hiato que surge
também na teoria de Dirac, igual ao dobro da energia em repouso de um electrão,
me c2 .
Num semicondutor à temperatura ambiente, há duas contribuições para a condução eléctrica: a da banda de condução, que está parcialmente populada com electrões
termicamente excitados, e a da banda de valência, parcialmente populada com lacunas que correspondem aos estados deixados vagos pelos electrões promovidos para
a banda de condução. Nos casos em que a segunda é mais importante do que a
primeira, a corrente eléctrica é, sob todos os aspectos, semelhante à que seria conduzida por cargas de sinal positivo, nomeadamente na polarização da tensão de Hall
(ver a secção 5.2.3), justificando-se assim os sinais anómalos do coeficiente de Hall
apresentados por algumas substâncias.
6.10
Contaminação de semi-condutores
Como vimos, à temperatura ambiente alguns electrões da banda de valência de um
semicondutor como o silı́cio ou o germânio(m) ocupam estados excitados na banda
de condução, possibilitando a condução eléctrica por estes materiais. Há, como
se disse, duas contribuições para a condução eléctrica: a dos electrões na banda
de condução e a das lacunas na banda de valência. Num semicondutor puro à
temperatura ambiente, o número de lacunas iguala, evidentemente, o de electrões
de condução. Mas é possı́vel, através da introdução no cristal semicondutor de
impurezas judiciosamente escolhidas, variar independentemente o número dos dois
tipos de transportadores de carga.
Para concretizar a discussão, consideremos um cristal de silı́cio ou de germânio,
no qual alguns átomos são substituı́dos por átomos de arsénio ou de fósforo. Estas
impurezas constituem defeitos no arranjo periódico do cristal de silı́cio. O arsénio e
o fósforo são substâncias pentavalentes, de forma que, quando um átomo de arsénio
substitui num cristal um átomo de silı́cio (substância tetravalente), um dos seus
electrões de valência fica por emparelhar. Este electrão fica fracamente ligado ao
átomo de arsénio, que funciona como um centro de carga positiva (ver a Figura 6.17).
O átomo de arsénio fornece um electrão a mais do que os de silı́cio, que definem a
estrutura cristalina e, por isso, dizemos que o arsénico é um dador de electrões, ou
ainda que se trata de uma contaminação de tipo-n. Estando o electrão desemparelhado muito fracamente ligado ao átomo de arsénio, basta uma pequena quantidade
de energia, Ed , para exitá-lo para a banda de condução. O valor deste mini-gap de
(m) Estes
são os dois semicondutores mais usados em aplicações industriais.
122
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
Orbital de electrão
desemparelhado
Banda de condução
Ed
Eg
Átomos de Silício
+
Nível dador
Banda de
valência
Átomo de Arsénico
Figura 6.17: Cristal de silı́cio com uma impureza substitucional de arsénico (esquerda) e nı́veis de energia resultantes (direita).
energia é de cerca de algumas dezenas de meV (mili-electrão volt), tipicamente. Assim, concluı́mos que num cristal de silı́cio em que alguns átomos são substituidos por
átomos de arsénico a estrutura de bandas usual vê-se modificada, aparecendo um
conjunto de estados na zona proı́bida, imediatamente abaixo da banda de condução,
aos quais se dá o nome de nı́vel dador. Note-se que os estados deste nı́vel são estados
ligados, logo, não contribuem para os fenómenos de transporte.
À temperatura de 0 K, a banda de valência está totalmente preenchida, e o nı́vel
dador tem metade dos estados disponı́veis ocupados (porquê?); o cristal em estudo é,
portanto, isolador. Mas basta elevar ligeiramente a temperatura para se exitarem os
electrões do nı́vel dador para a banda de condução, sem que sejam criadas lacunas
na banda de valência. A temperaturas mais elevadas, começa a fazer-se sentir o
processo já estudado da excitação de electrões da banda de valência, começando
então a fazer-se sentir a contribuição das lacunas para a corrente eléctrica.
Vemos, assim, que contaminando por substituição um cristal de silı́cio ou germânio com arsénico, podemos aumentar, a temperaturas não muito elevadas, o número
de electrões na banda de condução, permanecendo o número de lacunas na banda
de valência baixo.
Banda de condução
+
-
Lacuna resultante da
captura de um electrão
pelo átomo de boro
Eg
Átomos de silício
Ea
Átomo de boro
Nível aceitador
Banda de
valência
Figura 6.18: Cristal de silı́cio com uma impureza substitucional de boro (esquerda)
e nı́veis de energia resultantes (direita).
Também é possı́vel obter o efeito contrário, de estabecer num cristal semicondutor um grande número de lacunas na banda de valência com um reduzido número de
electrões na banda de condução, substituindo alguns átomos num cristal de silı́cio
ou de germânio por átomos de boro, alumı́nio, gálio ou ı́ndio (substâncias trivalentes). Substituindo um átomo de silı́cio num cristal puro por um de boro, fica
uma ligação por estabelecer, já que o boro é trivalente. O átomo de boro fica nesta
situação com uma grande electroafinidade, sendo necessária uma quantidade muito
pequena de energia para que capture um electrão da banda de valência do cristal,
completando assim as quatro ligações com os seus vizinhos. Neste processo, cria-se
uma lacuna na banda de valência, sem popular a banda de condução. As impu-
6.11. O DIODO SEMICONDUTOR
123
Fe
n
e-
p
l+
Ve
Vc0
n
p
Figura 6.19: Junção p-n (acima) em equilı́brio e potencial de contacto na junção.
Está representada o sentido da força sobre os electrões (Fe ) e a sua energia potencial.
rezas deste tipo aceitam os electrões da banda de valência, e por isso chamam-se
impurezas aceitadoras, ou impurezas de tipo-p. Na Figura 6.18 representa-se esquematicamente o papel de uma impureza de tipo-p e o nı́vel intermédio, que agora
aparece imediatamente acima da banda de valência, chamado nı́vel aceitador.
A capacidade para variar independentemente as concentrações de lacunas e de
electrões de condução num cristal semicondutor tem uma enorme aplicação prática,
no fabrico de ı́numeros dispositivos usados na indústria electrónica, como os diodos
e os transistores. É até possı́vel, num único cristal de silı́cio, implantando diferentes
contaminações em diferentes regiões, construir circuitos inteiros, contendo vários
milhões daqueles elementos individuais. Vamos, de seguida, estudar o funcionamento do mais simples destes dispositivos, o um diodo rectificador.
6.11
O diodo semicondutor
Consideremos um cristal semicondutor de silı́cio (ou germânio), com contaminações
de tipo diferente em duas zonas contı́guas, em equilı́brio a uma temperatura T > 0.
Temos então um cristal, no qual está definida uma região de tipo-p, outra de tipo-n,
em contacto uma com a outra (ver a Figura 6.19). À temperatura T , na região-n
há uma grande densidade de electrões de condução, como vimos na secção anterior;
em contrapartida, na região-p é a concentração de lacunas que é elevada. Então,
à semelhança do que se passa na junção de metais diferentes (ver a Secção 5.2.4),
deve verificar-se uma difusão de electrões de condução da região-n (onde apresentam
alta concentração) para a região-p, onde se recombinam com as lacunas, aqui maioritárias. As lacunas, por seu turno, sofrem uma migração inversa e recombinam-se
com os electrões de condução da região-n. Consequentemente, estabelece-se um
campo eléctrico na junção que impede a continuação indefinida deste processo, ou
seja, verifica-se o aparecimento de uma diferença de potencial entre as duas regiões,
que se chama potencial de contacto. Em resultado dos processos de recombinação,
a proximidade da junção fica desprovida de transportadores de carga, efeito que
é ainda agravado pelo aparecimento do campo de contacto, que varre electrostaticamente qualquer par lacuna-electrão de condução (o electrão para a região-n, a
lacuna para a região−p), criado nesta zona por exitação térmica. Esta região, onde
a densidade de transportadores de carga é praticamente nula, chama-se zona de
deplecção.
Na junção das duas regiões ocorrem, então, dois efeitos opostos:
(a) difusão de transportadores, “empurrada” pelos gradientes de concentração.
Alguns electrões (aqueles que à temperatura T têm energia suficiente para
ultrapassarem a barreira estabelecida pelo potencial de contacto) da região-n
difundem-se para a região-p, recombinando-se aı́ com lacunas. Inversamente,
124
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
VB
VB
n
n
Vc0
Vc
V
p
p
VA
VA
Figura 6.20: Quedas de potencial por contacto num curto-circuito da junção p-n (à
esquerda) e polarização de uma junção p-n por uma fonte de tensão V .
algumas lacunas da região-p sofrem uma migração para a região-n. Ao fluxo de
carga associado a estas migrações dá-se o nome de corrente de recombinação,
que tem o sentido p-n;
(b) deriva de trasportadores, “empurrada” pelo campo eléctrico de contacto. Os
pares electrão de condução-lacuna criados por excitação térmica nas duas
regiões são empurrados pelo campo eléctrico, realizando cada transportador
uma migração em sentido inverso ao do ponto anterior. Esta corrente chamase corrente de geração, no sentido n-p.
Na migração de difusão, os transportadores movem-se empurrados pelos gradientes
de concentração, vencendo gradientes de potencial electrostático; na migração de
deriva, o movimento é induzido pelo gradiente do potencial electrostático, e opõe-se
ao gradiente de concentração. Estabelece-se então um equilı́brio dinâmico em que
os fluxos de carga se cancelam mutuamente, isto é, a corrente de recombinação, no
sentido p-n, iguala a de geração, no sentido n-p. Deve dizer-se que o valor destas
correntes é extremamente baixo, rondando os 10−6 A.
Se se montar um circuito fechado incluindo a junção semicondutora p-n, devemos
ter em atenção que, para além do potencial de contacto Vc0 na junção semicondutora, aparecem outros potenciais de contacto nos pontos onde se liga o condutor
que fecha o circuito (ver a Figura 6.20). Evidentemente, a soma de todos estes potenciais é nula, de acordo com a lei de Kirchoff. Usando a notação da Figura 6.20,
temos então
Vc0 + VA + VB = 0,
ou seja,
VA + VB = −Vc0 .
(6.35)
O que acontece agora se polarizarmos a junção, ligando-a a uma fonte de tensão?
Uma vez que a zona de deplecção é desprovida de cargas móveis, tem uma resistência
muito elevada, e por isso podemos considerar que é aı́ que se manifesta o efeito da
fonte de tensão. Aplicando a lei de Kirchoff, temos agora
Vc + Va + VB + V = 0,
e portanto, usando a Eq. (6.35), concluimos que o potencial de contacto se vê
alterado pela acção da tensão polarizadora V de acordo com
Vc = Vc0 − V.
(6.36)
Quando o terminal positivo da fonte de tensão está ligado à região-p a junção diz-se
polarizada no sentido directo; se o terminal positivo da fonte estiver ligado à regiãon, falamos de polarização inversa. Quando a junção está em polarização directa,
V tem sinal idêntico ao de Vc 0, e, portanto, o potencial de contacto fica diminuı́do
6. Problemas
125
VB
VB
n
n
Vc > Vc0
Vc < Vc0
p
VA
p
VA
i
Figura 6.21: Polarização directa (à esquerda) e polarização inversa de uma junção
p-n.
pela polarização (ver a Figura 6.21, à esquerda). Logo, nestas condições, aumenta
bastante a corrente de recombinação porque diminui a grandeaza da barreira de
potencial que impede o fluxo por difusão. Em contrapartida, a corrente de geração
mantém-se essencialmente constante, já que depende da taxa da criação de pares
lacuna-electrão de condução. Então, as duas correntes deixam de se compensar, e
verifica-se, portanto, um fluxo lı́quido de carga através da junção, no sentido p-n.
Em resumo, a junção p-n permite a passagem de corrente quando se encontra em
polarização directa.
Em contrapartida, quando se inverte a polarização, aumenta o valor do potencial
de contacto, diminuindo, consequentemente, o valor da corrente de recombinação.
A corrente de geração permanece essencialmente a mesma, mantendo o seu valor de
cerca de 10−6 A. Assim, para muitos efeitos práticos, podemos dizer que a junção
semicondutora p-n não permite a passagem de corrente em polarização inversa.
Uma vez que a fracção dos transportadores que tem, a uma certa temperatura
T , uma energia superior ao valor do potencial de contacto (e que portanto está em
condições de ultrapassar a barreira de potencial na junção) é dada pelo factor de
Boltzmann e−βeVc , onde β = 1/kB T , a razão entre as correntes de recombinação
em polarização directa e em vazio (sem qualquer fonte externa) é dada por
Jr
e−βeVc
= −βeVc0 = eβeV .
Jr0
e
A corrente total é a soma das correntes de geração e de recombinação, J = Jr + Jg ,
mas a corrente de geração permanece sensivelmente constante, com o seu valor de
vazio Jg0 que, por sua vez, é o simétrico da corrente de recombinação, também em
vazio. Então, a funçao corrente tensão de uma junção p-n é
J = Jg (eβeV − 1),
(6.37)
onde se toma V positivo quando a junção está em polarização directa. O gráfico
desta função apresenta-se na Figura 6.22. A junção semicondutora p-n tem então
a propriedade de só permitir a passagem de corrente num sentido, propriedade
muito importante no desenho de circuitos electrónicos. O nome dado às junções
semicondutoras p-n na gı́ria da engenharia electrotécnica é diodo.
PROBLEMAS
6.1 À luz da teoria das bandas determine, justificando, o número total de estados
electrónicos existentes por banda de energia.
6.2 Justifique qualitativamente a condutividade, térmica e eléctrica, a zero graus
Kelvin, dos sólidos cristalinos. Dê alguns exemplos.
126
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
200
I (A)
150
100
50
0
-2
-1
-1.5
-0.5
V (V)
0
0.5
Figura 6.22: Curva de corrente-tensão caracterı́stica de um diodo semicondutor.
6.3 Comente a seguinte afirmação:
A condutividade dos metais alcalinos terrosos é devida a uma sobreposição da banda de valência com a banda de condução. Se tal não
acontecesse estes elementos seriam isoladores a zero graus Kelvin.
6.4 Determine o valor do parâmetro de massa efectiva de electrões livres.
6.5 A densidade do bário é de 3, 5 × 103 kg/m3 , e a sua massa atómica relativa é 137.
Sabendo que os átomos de bário têm dois electrões de valência, determine o raio
da esfera de Fermi e o valor da energia da nuvem de electrões de condução por
mole (de átomos) à temperatura de 0 K.
6.6 Mostre que a função ψ(r ) = N e−r , onde N é uma constante de normalização e
r = ||r ||, não pode ser a função de onda de um electrão num potencial periódico.
2
Bibliografia
• D. A. Davies, Waves, Atoms and Solids, Longman Scientific & Techical (1978).
Esta é uma boa introdução, tanto à fı́sica dos fenómenos ondulatórios como
à mecânica quântica. Põe mais ênfase nas aplicações do que no formalismo,
principalmente nas aplicações ao estudos dos electrões nos sólidos.
Nı́vel: Elementar.
• S. L. Altmann, Band Theory of Metals — The Elements, Pergamon Press
(1970).
Este é também um livro de introdução, mas aplica-se apenas ao estudo das
propriedades dos electrões nos sólidos.
Nı́vel: Elementar.
• A. Yariv, An Introduction to the Theory and Applications of Quantum mechanics, John wiley & Sons, Inc. (1982).
Este é um livro de Mecânica Quântica, como o nome indica, mas tem muitas
aplicações ao estudo dos estados electrónicos nos sólidos, por exemplo, o modelo de Krönig-Penney.
Nı́vel: Intermédio.
• F. J. Blatt, Modern Physics (capı́tulos 12 e 13), McGraw Hill (1992).
Bom livro de introdução à fı́sica moderna em geral, tem estes dois capı́tulos
sobre sólidos, essencialmente sobre as ligações quı́micas nos sólidos, teoria de
bandas e dispositivos semicondutores.
Nı́vel: Elementar.
• R. A. Serway, R. J. Beichner, J. W. Jewett, Jr.,Physics For Scientists and
Engineers (capı́tulo 43), Saunders College Publishing (2000).
Este é um livro de introdução à fı́sica, com uma parte de fı́sica moderna
onde se inclui o capı́tulo 43 sobre Fı́sica do Estado Sólido. Trata apenas
a matéria relativa ao Capı́tulo 6 dos apontamentos da disciplina, de forma
muito elementar, mas pode ser útil como primeira abordagem a esta parte da
matéria da disciplina.
Nı́vel: Elementar.
• J. R. Christman, Fundamentals of Solid State Physics, John Wiley & Sons,
Inc. (1988).
Muito bom livro, cobre a matéria dada na disciplina, mas não na mesma
ordem.
Nı́vel: Intermédio.
• Ali Omar, Elementary Solid State Physics, Addison-Wesley Publishing Company (1975). Muito exaustivo, mas às vezes pouco rigoroso, por misturar
descrições clássicas, com descrições quânticas, com argumentos qualitativos,
e eu sei lá que mais.
Nı́vel: Intermédio.
127
128
Bibliografia
• C. Kittel, Introduction to Solid State Physics, John Wiley & Sons, Inc. (1996).
É uma das referências clássicas da Fı́sica do Estado Sólido. A edição de
1996 é a sétima! Cobre a matéria dada, noutra ordem. Os capı́tulos sobre
cristalografia e difracção de raios-X devem ser particularmente úteis.
Nı́vel: Avançado.
• N. W. Ashcroft e N. W. Mermin, Solid State Physics, Saunders College Publishing (1976).
Outra das referências clássicas da Fı́sica do Estado Sólido. Tem aqui tudo o
que pode querer saber sobre Fı́sica do Estado Sólido e mais ainda.
Nı́vel: Muito avançado.
• S. V. Vonsovsky e M. I. Katsnelson, Quantum Solid-State Physics, SringerVerlag (1989).
Texto muito avançado sobre a descrição quântica dos solidos.
Nı́vel: Muito avançado.

Documentos relacionados