F´ısica do Estado Sólido - Departamento de Física da UBI

Transcrição

Apontamentos de
Fı́sica do Estado Sólido
José Amoreira e Miguel de Jesus
Departamento de Fı́sica
Edição de 2001/2002
UNIVERSIDADE DA BEIRA INTERIOR
Copyleft
Os autores deste texto são Luı́s José Maia Amoreira ([email protected])
e Miguel Eduardo Pita de Jesus ([email protected]), do Departamento de
Fı́sica da Universidade da Beira Interior. Não se garante que seja apropriado para
qualquer fim especı́fico. Não se garante a sua correcção. Use-o por sua conta e risco.
Este texto pode ser obtido no URL
http://www.dfisica.ubi.pt/~amoreira/lectnotes/fesnts.pdf
Este texto pode ser copiado, alugado, vendido, emprestado ou oferecido, desde que
este “Copyleft” permaneça inalterado. O texto pode ser adaptado, acrescentado ou
diminuı́do, desde que sejam satisfeitas as seguintes condições:
• no produto final, deve ser incluı́da uma indicação bem visı́vel de que se trata
de uma adaptação deste trabalho
• devem ser referidos os nomes dos autores deste trabalho
• deve ser apresentado o URL deste documento (ver acima)
Os autores agradecem ser informados da redacção de trabalhos baseados neste texto.
Em resumo, os autores autorizam qualquer utilização desta obra que respeite as
regras básicas da honestidade, do bom-senso e da boa-educação.
Composto em LATEX.
Índice
1 Introdução
1.1 A estrutura dos sólidos . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Breve resumo da Tabela Periódica . . . . . . . . . . . . . . . . . . .
1.3 Resumo dos capı́tulos seguintes . . . . . . . . . . . . . . . . . . . . .
2 Elementos de Cristalografia
2.1 Cristais ideais e cristais reais . . .
2.2 A estrutura cristalina . . . . . . .
2.3 Tipos de redes cristalinas . . . . .
2.4 Exemplos de estruturas cristalinas
2.5 Direcções e planos cristalinos . . .
2.6 Distância interplanar . . . . . . . .
2.7 Coordenadas fraccionárias . . . . .
2.8 Defeitos . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . .
1
1
2
5
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
9
11
15
17
19
20
21
3 Difracção elástica em cristais
3.1 Generalidades . . . . . . . . . . . . . . . . . . .
3.2 A condição de Bragg . . . . . . . . . . . . . . .
3.3 Métodos experimentais . . . . . . . . . . . . . .
3.4 Condição de Laue. Rede recı́proca . . . . . . .
3.4.1 A construcção de Ewald . . . . . . . . .
3.5 Equivalência das condições de Bragg e de Laue
3.6 Amplitude da difracção. Factor de estrutura . .
Problemas . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
26
27
28
31
31
33
38
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
42
47
49
49
53
55
57
60
60
62
66
70
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Vibrações em cristais
4.1 A aproximação harmónica . . . . . . . . . . . . . . . .
4.2 Ondas mecânicas em meios contı́nuos . . . . . . . . . .
4.2.1 Vibrações de um meio contı́nuo tridimensional
4.3 Vibrações de um meio cristalino . . . . . . . . . . . . .
4.3.1 Vibrações de uma cadeia monoatómica linear .
4.3.2 Vibrações de uma cadeia biatómica linear . . .
4.3.3 Vibrações de um cristal tridimensional . . . . .
4.4 A densidade de modos de vibração . . . . . . . . . . .
4.5 O problema do calor especı́fico . . . . . . . . . . . . .
4.5.1 Modelo Clássico . . . . . . . . . . . . . . . . .
4.5.2 Modelo de Einstein . . . . . . . . . . . . . . . .
4.5.3 Modelo de Debye . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ii
ÍNDICE
5 Metais I: modelos de electrões livres
5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 O modelo de Drude-Lorentz . . . . . . . . . . . . . . . . . . . .
5.2.1 O calor especı́fico dos metais . . . . . . . . . . . . . . .
5.2.2 A lei de Ohm . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 O efeito de Hall . . . . . . . . . . . . . . . . . . . . . . .
5.2.4 Efeitos termoeléctricos . . . . . . . . . . . . . . . . . . .
5.3 Balanço do modelo de Drude . . . . . . . . . . . . . . . . . . .
5.4 O modelo de Sommerfeld . . . . . . . . . . . . . . . . . . . . .
5.4.1 Estados electrónicos . . . . . . . . . . . . . . . . . . . .
5.4.2 A densidade de estados electrónicos . . . . . . . . . . .
5.4.3 O estado fundamental de um gás de fermiões . . . . . .
5.4.4 O gás de electrões de condução à temperatura ambiente
5.4.5 A distribuição de Fermi-Dirac . . . . . . . . . . . . . . .
5.4.6 Energia de um gás de fermiões para T > 0 K . . . . . .
5.4.7 Calor especı́fico . . . . . . . . . . . . . . . . . . . . . . .
5.4.8 A condutividade eléctrica . . . . . . . . . . . . . . . . .
5.5 Crı́tica dos modelos de electrões livres . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
74
74
75
78
78
80
80
81
83
83
85
86
90
91
92
94
94
6 Metais II: Teoria de bandas
6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . .
6.2 O teorema de Bloch . . . . . . . . . . . . . . . . . .
6.3 Propriedades dos estados de Bloch . . . . . . . . . .
6.3.1 Periodicidade no espaço recı́proco . . . . . .
6.3.2 Nı́veis de energia dos estados de Bloch . . . .
6.3.3 Momento linear . . . . . . . . . . . . . . . . .
6.3.4 Velocidade média e momento linear cristalino
6.3.5 Massa efectiva dos electrões de Bloch . . . . .
6.3.6 O livre caminho médio . . . . . . . . . . . . .
6.4 Modelo de Krönig-Penney . . . . . . . . . . . . . . .
6.5 Número de estados por banda . . . . . . . . . . . . .
6.6 O estado fundamental da nuvem electrónica . . . . .
6.7 A condução eléctrica . . . . . . . . . . . . . . . . . .
6.8 O gás de Bloch à temperatura ambiente. . . . . . . .
6.9 Lacunas . . . . . . . . . . . . . . . . . . . . . . . . .
6.10 Contaminação de semi-condutores . . . . . . . . . .
6.11 O diodo semicondutor . . . . . . . . . . . . . . . . .
Problemas . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
97
97
100
102
102
103
104
105
107
108
109
114
115
117
118
119
121
123
125
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Capı́tulo 1
Introdução
É sabido que a matéria existe no universo em estados e formas muito variados.
É usual a classificação destes estados em fases, sendo as mais vulgares à escala
macroscópica as introduzidas no ensino básico, a saber: a fase gasosa, a lı́quida e
a sólida. A Fı́sica do Estado Sólido (ou Fı́sica da Matéria Condensada) estuda as
propriedades da matéria sob esta última forma.
As caracterı́sticas dos sólidos variam grandemente (à parte, é claro, aquelas que
os definem como tal), seja qual for o aspecto particular que se analise. Assim, há
sólidos com alta e baixa densidade de massa, sólidos que se polarizam electricamente
com maior ou menor facilidade, há sólidos que são bons condutores de calor e de
electricidade e outros que não o são, há sólidos ferro-magnéticos, dia-magnéticos
e para-magnéticos, sólidos opacos e sólidos transparentes, etc, etc, etc. A Fı́sica
do Estado Sólido tem pois a difı́cil tarefa de explicar, recorrendo às leis básicas da
Fı́sica, toda uma série de comportamentos dı́spares dos diferentes materiais.
De acordo com o modelo atómico, hoje em dia incontestavelmente aceite, a
matéria é constituı́da por moléculas e estas por átomos que, por sua vez, são formados por electrões, protões e neutrões. Todos estes diferentes tipos de partı́culas
apresentam comportamentos que são, com precisão, descritos pela teoria fundamental do mundo microscópico — A Mecânica Quântica. Por esta razão, tentaremos
descrever as diferentes propriedades dos diferentes sólidos à luz desta teoria. No
entanto, veremos que não há praticamente nenhum domı́nio da Fı́sica que não seja
chamado a desempenhar algum papel nesta tarefa.
1.1
A estrutura dos sólidos
O estado fı́sico da matéria é o resultado do equilı́brio entre dois factores: as forças
inter-atómicas e/ou inter-moleculares que tendem a establecer a coesão, e as vibração atómicas e moleculares que tendem a establecer a desordem molecular.
Quando as forças inter-atómicas/moleculares prevalecem sobre as vibrações, a matéria encontra-se no estado sólido. Fundamentalmente, aquilo que distingue o estado
sólido das restantes fases clássicas (gasosa e lı́quida) é o facto de, nos sólidos, os
átomos oscilarem em torno de posições de equilı́brio fixas. A distribuição espacial destas posições de equilı́brio confere aos sólidos uma estrutura fixa e serve
de critério para a sua classificação em três categorias principais: os cristalinos, os
amorfos e os poli-cristalinos. Num sólido cristalino, as posições de equilı́brio dos
átomos dispõem-se regularmente ao longo de todo o volume do sólido, repetindo um
padrão básico, à laia de um “papel de parede tridimensional”. Nos sólidos amorfos, não se manifesta qualquer regularidade nas posições de equilı́brio dos átomos.
Finalmente, os sólidos poli-cristalinos são constituı́dos por um grande número de
1
2
CAPÍTULO 1. INTRODUÇÃO
pequenos cristais, com orientações e dimensões arbitrárias. Qualquer que seja a sua
composição quı́mica, é possı́vel preparar uma amostra de sólido em qualquer destes
três estados. Por exemplo, a fase sólida da água é representada por cristais de neve
(forma cristalina), gelo (do que usamos para refrescar as bebidas) (forma amorfa)
ou neve comprimida (forma poli-cristalina).
Os electrões dos átomos que constituem os sólidos contribuem de forma determinante para um um grande número das suas propriedades. Sendo partı́culas de
spin semi-inteiro, satisfazem a estatı́stica de Fermi-Dirac e, portanto, o Princı́pio
de Exclusão de Pauli: cada estado quântico não pode ser ocupado por mais que
um electrão. No estado fundamental, um átomo com N electrões tem os N estados
quânticos de menor energia todos ocupados (com um electrão cada) e os restantes
todos desocupados. Os electrões que ocupam estados de menor energia estão, em
média, mais próximos do núcleo do átomo a que pertencem do que os que ocupam estados de maior energia. Assim, aqueles “sentem” com menor intensidade a
presença de outros átomos na vizinhança, e por isso praticamente não participam
nas ligações quı́micas responsáveis pelo agrupamento de átomos em moléculas. Ao
conjunto do núcleo e destes electrões vamos dar o nome de cerne iónico. As ligações
interatómicas envolvem então os electrões mais exteriores de cada átomo, os chamados electrões de valência, e o tipo particular de ligação quı́mica estabelecida entre
dois átomos depende basicamente das propriedades dos estados quânticos ocupados
por estes electrões.
As ligações quı́micas que garantem a coesão dos sólidos são, fundamentalmente,
de quatro tipos diferentes: iónico, covalente, de van der Waals (ou forças de dispersão de London) e metálico. Nas três primeiras categorias, os electrões responsáveis pela ligação permanecem localizados em regiões limitadas do espaço, normalmente na vizinhança do átomo a que originalmente pertenciam. Pelo contrário,
na ligação metálica os electrões de valência ficam muito fracamente ligados a cada
átomo, sendo relativamente fácil o movimento de átomo para átomo, após o estabelecimento da ligação. As funções de onda destes electrões deixam de estar
localizadas em torno de cada átomo, estendendo-se por todo o volume do metal.
A estas funções dá-se o nome de orbitais metálicas. Esta deslocalização das orbitais metálicas é responsável pelas elevadas condutividades térmica e eléctrica dos
metais, e por muitas outras das suas propriedades.
A disposição regular dos átomos nos sólidos cristalinos simplifica muito a sua
análise e por isso a Fı́sica do Estado Sólido avançou muito mais no estudo destes
sólidos que no dos sólidos amorfos ou poli-cristalinos. Neste curso, por esta razão,
abordaremos principalmente os sólidos cristalinos.
1.2
Breve resumo da Tabela Periódica
Antes de de iniciarmos o nosso estudo dos sólidos, justifica-se uma breve digressão
pelas propriedades das várias espécies quı́micas puras, e das ligações que entre elas
se estabelecem.
Os 106 elementos conhecidos estão ordenados na Tablea Periódica da esquerda
para a direita em número atómico crescente. Elementos na mesma coluna têm
propriedades fı́sicas e quı́micas semelhantes e os seus sólidos, em geral, são também
similares.
(a) Gases inertes
Os elementos da coluna VIII, designados por gases inertes, têm as suas orbitais de
valência completamente preenchidas. A sua inatividade quı́mica é atribuida facto do
hiato energético existente entre a energia das orbitais de valência e o nı́vel de energia
imediatamente superior ser relativamente grande. Assim, a configuração electrónica
destes átomos é particularmente estável, sendo por isso difı́cil o estabelecimento de
1.2. BREVE RESUMO DA TABELA PERIÓDICA
3
ligações quı́micas. Este facto pode ser ilustrado comparando os valores do raio
atómico de elementos de uma mesma linha da Tabela Periódica; com a excepção
da linha Hidrogénio-Hélio, os elementos que em cada linha apresentam os menores
valores do raio atómico são os da coluna VIII.
Os gases inertes assumem o estado sólido a temperaturas inferiores a ∼200 K. A
ligação quı́mica é efectuada, fundamentalmente, por meio de interacções de van der
Waals. Pequenas deformações da função de onda electrónica com momento dipolar
não nulo induzem dipolos eléctricos nos átomos vizinhos; os dipolos eléctricos assim
gerados atraem-se fracamente, aproximando os átomos até onde as interacções repulsivas cerne-cerne o permitirem, formando cristais compactos em que cada átomo
tem doze átomos vizinhos. Por exemplo, enquanto que o hélio solidifica a 0,95 K, o
rádon necessita apenas de uma temperatura de 202 K para atingir o estado sólido, o
que é compreensı́vel, já que este último dispõe de uma nuvem electrónica significamente maior, favorecendo o aparecimento de dipólos induzidos e forças de dispersão
de London mais intensas.
m
4p
15
ligações
covalentes
Figura 1.1: Diamante — Cada átomo de carbono estabelece quatro ligações covalentes
com átomos vizinhos, formando um tetraedro regular.
(b) Metais alcalinos
O estado fundamental dos átomos das outras colunas da tabela consiste na configuração electrónica de um gás inerte (que, juntamente com o núcleo, contitui o
cerne atómico), “adicionado”de um ou mais electrões em nı́veis de energia superiores. A configuração electrónica do cerne dos átomos numa linha da tabela consiste
na configuração do gás inerte da linha anterior.
Os metais alcalinos encontram-se nas colunas IA e IIA. Estes elementos têm um
ou dois electrões na orbital exterior s, fracamente ligados ao resto do átomo. Os
metais alcalinos solidificam a temperaturas que variam entre os 300 K e os 1 600 K.
Ao solidificarem, a função de onda dos electrões de valência estende-se a todo o
sólido e portanto estes podem mover-se livremente através do material. A mobilidade destes electrões de valência confere a estes sólidos excelentes propriedades
de condução térmica e eléctrica. À excepção do hidrogénio os elementos da coluna
IA são designados por metais alcalinos e os da coluna IIA são os metais alcalinos
terrosos.
(c) Colunas IIIB, IVB, VB, VIB e VIIB
Os átomos dos elementos destas colunas têm, na camada de valência, a orbital s
completamente preenchida e a p parcialmente preenchida. Ambas as orbitais não
sofrem influência significativa do cerne iónico.
4
CAPÍTULO 1. INTRODUÇÃO
Estes elementos têm propriedades fı́sicas variadas. O azoto, oxigénio, flúor e
cloro são gases à temperatura ambiente e solidificam a temperaturas inferiores a
100 K. Tanto o oxigénio como o azoto formam moléculas via ligações covalentes. Ao
solidificarem as restantes ligações são asseguradas por ligações de van der Waals
entre essas as moléculas. Todos os outros elementos à excepção do Bromo, que é
lı́quido à temperatura ambiente, são sólidos.
O alumı́nio, estanho e chumbo são metais. O arsénio, antimónio e bismuto têm
caracterı́sticas de metais mas não são metais tı́picos. Algumas formas alotrópicas
do carbono e telúrio são razoáveis condutores de calor e electricidade. O silı́cio
e germânio são semicondutores, ou seja, são isoladores a baixas temperaturas e
condutores a altas temperaturas. Todos os restantes elementos são isoladores.
À excepção dos metais, os elementos nestas colunas solidificam através de ligações covalentes. Na ligação covalente os electrões de ligação ocupam a região ao
longo da linha que junta os dois átomos, passando a ser partilhados pelos dois cernes iónicos. Estas ligações são bastante fortes e os electrões participantes ficam
confinados à zona cerne-cerne contribuindo para a baixa prestação de condução
eléctrica e térmica apresentadas por estas substâncias. Um átomo pode estabelecer ligações covalentes com um máximo de quatro átomos vizinhos. Neste caso as
ligações formam um tetraedro regular. A estrutura cristalina é menos densa que
a resultante de ligações de van der Waals. A forma alotrópica do carbono em diamante é um exemplo de um sólido com ligações covalentes tetraédrica, porém, a
cristalização do carbono em forma de grafite consiste em planos de ligações covalentes que envolvem três átomos (formando um hexágono), sendo a ligação interplanar
assegurada por meio de ligações de van der Waals (ver Figuras 1.1 e 1.2). Como
sabemos, estas duas formas de carbono têm propriedades bem diferentes.
ligações
covalentes
142 pm
350 pm
ligações de
van der Waals
Figura 1.2: Grafite — Os átomos de carbono formam planos hexagonais de ligações
covalentes entre três átomos vizinhos. As ligações entre planos são de van der Waals.
(d) Elementos de transição
A parte central da tabela que compreende as colunas IIIA, IVA, VA, VIA, VIIA
e VIIIA, contém os chamados elementos de transição. As orbitais de valência d
e f destes átomos são preenchidas por ordem crescente de energia. Verifica-se
que, não obstante as orbitais d terem energias comparáveis às orbitais s, o seu
pico de densidade de probabilidade está bastante mais perto do cerne iónico que
o pico de densidade de probabilidade das orbitais s. Assim, à semelhança dos
elementos da coluna IA e IIA, os electrões na orbital s tornam-se livres e conferem a
estes elementos propriedades que os caracterizam como os metais. Adicionalmente,
1.3. RESUMO DOS CAPÍTULOS SEGUINTES
5
electrões na orbital d formam ligações com átomos vizinhos, extremamente fortes
e de tipo covalente (e.g. de todos os metais de transição o volfrâmio é o mais
fortemente ligado). Os electrões nas orbitais f e d, apesar de não contribuirem
para propriedades metálicas destes elementos, dado estarem sobre forte influência
do cerne, tomam um papel importante quando parcialmente preenchidas, sendo
“responsáveis”pelas propriedades magnéticas de alguns destes elementos.
(e) Os metais nobres
Os metais nobres, nas colunas IB e IIB, são em muitos aspectos semelhantes aos
metais alcalinos. Têm a orbital d completamente preenchida e a orbital s com um
ou dois electrões.
1.3
Resumo dos capı́tulos seguintes
O próximo capı́tulo lança as bases para o estudo dos cristais, introduzindo os conceitos de rede cristalina e base, e define a notação matemática usada neste domı́nio.
O Capı́tulo 3 trata a difracção de radiação por redes cristalinas, sendo superficialmente abordada a difracção por cristais. O Capı́tulo 4 expande o modelo cristalino
por forma a incluir as vibrações atómicas e algumas consequências destas vibrações
são estudadas, usando os formalismos clássico e quântico. No Capı́tulo 5, estudamse as propriedades dos metais supondo os electrões de valência livres. Finalmente,
o Capı́tulo 6 trata os electrões de valência nos condutores, introduzindo a Teoria de
Bandas.
Capı́tulo 2
Elementos de Cristalografia
Neste capı́tulo, vamos introduzir a linguagem e os conceitos básicos utilizados no
estudo dos cristais. Os tópicos aqui abordados serão usados ao longo de todo o
curso e é, por isso, importante que sejam bem apreendidos.
2.1
Cristais ideais e cristais reais
Como foi dito no capı́tulo anterior, os átomos dos sólidos cristalinos ocupam posições
dispostas regularmente, formando padrões que se repetem espacialmente em todas
as direcções. A esta estrutura dá-se o nome de cristal.
Em rigor, os cristais reais não podem satisfazer esta definição, porque uma
periodicidade absoluta é impossı́vel. Com efeito, as impurezas quı́micas, os defeitos
fı́sicos no padrão de repetição, as oscilações térmicas, e até mesmo as fronteiras dos
cristais reais destroem essa periodicidade. Reservamos então aquela definição para
os cristais ideais, que serão então corpos infinitos, absolutamente puros do ponto
de vista quı́mico, com átomos “congelados” nas suas posições de equilı́brio, etc,
considerando os cristais reais aproximações mais ou menos razoáveis daqueles.
2.2
A estrutura cristalina
Matematicamente, um cristal ideal pode ser descrito como um conjunto de átomos
dispostos numa rede definida por três vectores linearmente independentes a, b,
c, chamados vectores fundamentais de translação, tais que o arranjo atómico é,
em todos os aspectos, semelhante quando observado de dois pontos com vectores
posição r e r 0 , relacionados através de
r 0 = r + ha + kb + lc,
(2.1)
com h, k e l inteiros arbitrários. Com r fixo, ao conjunto de pontos que se obtem
variando h, k, e l na equação (2.1) dá-se o nome de rede cristalina, ou de Bravais.
De acordo com as definições apresentadas, não podemos confundir os conceitos
de cristal e de rede cristalina. Esta é uma abstracção matemática que consiste num
conjunto de pontos idênticos, dispostos regular e periodicamente no espaço, ao passo
que o cristal é formado por um conjunto de átomos, que podem nem ser todos da
mesma espécie quı́mica, como é o caso do cloreto de sódio. A estrutura do cristal
pode ser gerada sobrepondo a cada ponto da rede cristalina uma base (ou motivo)
de átomos, idêntica para todos os pontos da rede. Assim, a relação entre cristal,
rede cristalina e motivo pode ser simbolizada como
rede + motivo = cristal.
7
8
CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA
Vejamos o seguinte exemplo para nos ajudar a sedimentar este novo conceito. Na
Figura 2.1 está representado um cristal composto por três átomos diferentes. Este
cristal pode ser recriado colocando uma réplica do motivo de três átomos junto a
cada um dos pontos da rede.
motivo
ponto
da rede
cristal=rede+motivo
(a)
(b)
Figura 2.1: (a) base de três átomos; (b) cristal. Em cada ponto da rede é colocado
a base de átomos de modo a formar o cristal.
Uma outra abordagem, ilustrada com o seguinte exemplo bi-dimensional, consiste em determinar a rede a partir do cristal: a Figura 2.2 representa uma estru-
b’
b
a’
y
x
(a)
a
(b)
Figura 2.2: Exemplo de um cristal bi-dimensional.
tura cristalina bi-dimensional, formada por átomos de duas espécies, “•” e “◦”. De
acordo com a definição apresentada, os vectores fundamentais são tais que qualquer combinação linear com coeficientes inteiros destes vectores é igual à diferença
entre as posições de dois pontos equivalentes no cristal. Logo, os vectores x e y
representados na figura não são vectores fundamentais, porque unem pontos não
equivalentes (a posição de um átomo “•” e de um outro “◦”). A figura da direita
representa duas possibilidades de escolha de vectores fundamentais (a, b e a0 , b0 ),
a rede cristalina por eles gerada e os motivos correspondentes.
Chamam-se vectores da rede cristalina aos vectores que unem dois quaisquer
pontos da rede. No exemplo que acabámos de apresentar, a, b, a0 , b0 são vectores
da rede, mas o mesmo não acontece com x ou com y. Se qualquer vector da rede
2.3. TIPOS DE REDES CRISTALINAS
9
puder ser escrito como combinação linear, com coeficientes inteiros, dos vectores
fundamentais, então estes dizem-se vectores fundamentais primitivos. No exemplo
apresentado, a0 e b0 são vectores fundamentais primitivos, ao passo que a e b não
o são. Para verificar esta última preposição basta ver que, por exemplo, o vector b0
é uma combinação linear de a e b, mas com coeficientes fraccionários:
b0 =
1
1
a + b.
2
2
(2.2)
Ao paralelogramo formado pelos vectores fundamentais dá-se o nome de célula
unitária. Se os vectores fundamentais forem, além disso, primitivos, a célula unitária
por eles formada chama-se célula unitária primitiva. Em rigor, esta definição dá-nos
apenas um exemplo de célula unitária primitiva. Uma definição formal é a seguinte:
Célula unitária primitiva é uma porção de espaço que, copiada através
de translações geradas por todos os vectores da rede, preenche todo o
volume da rede cristalina, sem sobreposições ou espaços vazios.
Desta definição deduz-se facilmente que uma célula unitária primitiva contém um,
e apenas um, ponto de rede. Se n for a densidade espacial destes pontos (isto é, o
número de pontos por unidade de volume) e v for o volume de uma célula unitária
primitiva, então temos que nv = 1 e logo v = 1/n. Como este resultado é válido
qualquer que seja a célula unitária primitiva (isto é, quaisquer que sejam os vectores
fundamentais primitivos usados para a construir), concluı́mos que todas as células
unitárias primitivas têm o mesmo volume.
Acabámos de ver que podemos construir uma célula unitária primitiva com o
paralelogramo definido por um conjunto de vectores fundamentais primitivos. Uma
outra possibilidade é a seguinte: unimos com segmentos de recta um dado ponto de
rede a todos os seus vizinhos mais próximos; a região do espaço limitada pelos planos
bissectores destes segmentos é uma célula unitária primitiva. As células construı́das
desta forma chamam-se células unitárias primitivas de Wigner-Seitz. Note-se que,
para a definição da células de Wigner-Seitz, não é necessário escolher um conjunto
de vectores fundamentais primitivos; assim, a sua forma depende apenas do tipo de
rede, ao contrário do que acontece com as células unitárias mais usuais definidas
a partir do paralelogramo formado pelos vectores cristalográficos. A Figura 2.3
representa o processo de construção de uma destas células.
Figura 2.3: Célula unitária primitiva de Wigner-Seitz.
2.3
Tipos de redes cristalinas
A classificação das redes cristalinas faz-se em termos das operações de simetria que
cada uma aceita. Assim, e por exemplo, as redes cúbicas são aquelas que ficam
10
inalteradas sob rotações de π2 em torno de certas direcções. Não faremos aqui
este tipo de estudo por não ter uma importância fundamental no que se segue,
neste curso de nı́vel introdutório. Faremos apenas uma descrição geométrica dos
diferentes tipos de rede. Designamos por a, b e c os vectores fundamentais da rede,
c
α
b γ
β
a
Figura 2.4: Vectores e ângulos fundamentais.
por a, b e c os seus módulos e por α, β e γ os ângulos entre eles, definidos de acordo
com o esquema da Figura 2.4. Às quantidades a, b, c, α, β e γ dá-se o nome de
parâmetros da rede cristalina.
(a) Redes cúbicas
De todos os tipos de redes cristalinas, o mais simples de visualizar é o cúbico,
caracterizado em geral por
a=b=c
α = β= γ =
(2.3)
π
.
2
(2.4)
b
β
γ α
a
c
Há três subespécies da rede cúbica: a rede cúbica simples, cujos pontos estão
dispostos como os vértices de cubos iguais, arrumados contiguamente; a rede cúbica
de corpo centrado, que, além dos pontos que constituem a rede cúbica simples,
contém ainda um ponto no centro do corpo de um dos cubos que referimos; e a rede
cúbica de faces centradas, que é formada pelos pontos que formam a rede cúbica
simples, e contém ainda um ponto no centro das faces daqueles cubos.
(b) Redes tetragonais
Se comprimirmos ou alongarmos uma rede cúbica numa das suas direcções fundamentais, obtemos uma rede do tipo chamado rede tetragonal. Nesta, os pontos
dispõem-se nos vértices de prismas rectos de base quadrada (variante simples) e nos
centros dos corpos destes prismas (variante de corpo centrado). As redes tetragonais são então caracterizadas por
a = b 6= c
(2.5)
π
α = β= γ = .
2
(2.6)
b
a
c
Note-se que as redes tetragonais não apresentam a variante de faces centradas.
(c) Redes ortorrômbicas
As chamadas redes ortorrômbicas são as que se obtêm deformando a rede cúbica
segundo duas das suas direcções fundamentais. Os ângulos fundamentais são ainda
todos iguais a π2 , mas os módulos dos vectores fundamentais são diferentes entre si,
ou seja,
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
a 6= b 6= c
(2.7)
π
α = β= γ = .
2
(2.8)
b
β
γ α
a
11
c
Este tipo de rede cristalina apresenta as três variantes simples, de corpo centrado
e de faces centradas, e ainda uma quarta, chamada rede de bases centradas, que é
formada por pontos nos vértices de paralelipı́pedos iguais dispostos contiguamente
e dois pontos, nos centros de duas faces opostas.As deformações que aplicámos até
agora à rede cúbica, para obtermos as redes tetragonais e ortorrômbicas, têm a
propriedade de manter os ângulos α, β e γ iguais a π2 . Vamos agora apresentar
outras possibilidades.
(d) Redes monoclı́nicas
Deformemos uma rede ortorrômbica, por forma a alterar o valor de γ, deixando
os outros parâmetros inalterados. Obtemos assim uma rede do tipo chamado rede
monoclı́nica, que apresenta apenas as variantes simples e de bases centradas. As
relações entre os parâmetros, neste tipo de rede, são:
a 6= b 6= c
π
α = β= 6= γ.
2
(2.9)
α
γ β
b
(2.10)
a
c
(e) Redes triclı́nicas
Finalmente, consideremos agora a rede cristalina mais geral, no sentido em que
menos constrangimentos impomos aos parâmetros de rede. A rede triclı́nica fica
definida por
a 6= b 6= c
α 6= β6= γ 6=
β
(2.11)
π
.
2
b
(2.12)
γ
α
a
c
Há ainda que considerar dois tipos particulares de rede, que são casos particularmente importantes dos que já mencionámos.
(f) Redes trigonais
A rede trigonal pode obter-se por deformação da rede cúbica na direcção de uma
das diagonais principais. É caracterizada por
a=b=c
(2.13)
2
α = β= γ < π.
3
(2.14)
(g) Redes hexagonais
São casos particulares da rede monoclı́nica, em que γ = 32 π. Assim, verificam
a =
α
2.4
=
b 6= c
π
β= ,
2
(2.15)
γ=
2
π.
3
(2.16)
Exemplos de estruturas cristalinas
Nesta secção apresentaremos exemplos das estruturas cristalinas apresentadas por
algumas substâncias quı́micas.
12
(a) Redes cúbicas simples
Este tipo de estrutura não é energeticamente favorável para substâncias simples, e
por isso poucos elementos a adoptam. O único exemplo é o polónio, na forma α. Em
contrapartida, há vários compostos que apresentam redes cristalinas do tipo cúbico
simples, como, por exemplo, o cloreto de césio, CsCl. Nos cristais de cloreto de césio,
os átomos de uma espécie ocupam as posições definidas pela rede cúbica simples,
enquanto que os da outra ocupam os centros dos corpos da célula unitária. Note-se
que isto não define a rede como sendo cúbica de corpo centrado, porque os átomos de
cloro e de césio são diferentes. Assim, não podem ocupar, ambos, posições da rede
cristalina, que, por definição, é um conjunto de pontos equivalentes. A Tabela 2.1
apresenta alguns compostos que cristalizam numa estrutura cúbica simples.
Substância
CsCl
CsBr
CsI
TlCl
TlBr
TlI
a (Å)
4,11
4,29
4,56
3,84
3,97
3,74
Substância
NH4 Cl
CuZn
AgMg
LiHg
AlNi
BeCu
a (Å)
3,87
2,94
3,28
3,29
2,88
2,70
Tabela 2.1: Alguns compostos que cristalizam em redes cúbicas simples. Também é
apresentado o valor do parâmetro de rede a.
(b) Redes cúbicas de faces centradas
A rede cúbica de faces centradas é uma das redes que apresenta empacotamento
máximo (ver adiante nesta secção) e por isso muitos elementos apresentam estruturas cristalinas deste tipo. Na Tabela 2.2 apresentam-se algumas substâncias (tanto
elementos como compostos) que cristalizam em redes cúbicas simples. O silı́cio e o
Elemento
Cu
Ag
Au
Al
a (Å)
3,61
4,08
4,07
4,04
Composto
NaCl
LiF
KCl
LiBr
a (Å)
5,63
4,02
6,28
5,49
Tabela 2.2: Substâncias que cristalizam em redes cfc.
germânio (muito importantes na industria de semi-condutores) cristalizam também
na rede cúbica de faces centradas, com valores para o parâmetro de rede a de 5,43 Å
e 5,45 Å, respectivamente. Um outro exemplo importante é o carbono, na forma
de diamante. A estrutura cristalina do diamante pode ser gerada associando a
cada ponto de uma rede cúbica de faces centrada um motivo constituı́do por dois
átomos de carbono com coordenadas fraccionárias(a) (0,0,0) e ( 14 , 14 , 14 ). O valor do
parâmetro de rede do diamante é a = 3, 56 Å.
(c) Redes cúbicas de corpo centrado
Os metais alcalinos cristalizam todos em redes cúbicas de corpo centrado. Na
Tabela 2.3 resumem-se as propriedades da rede cristalina de alguns elementos que
apresentam esta estrutura.
(a) Mais
adiante serão introduzidas estas coordenadas. Para os presentes efeitos, é suficiente
saber que um ponto cujas coordenadas fraccionárias são (q, r, s) ocupa uma posição definida por
q a + rb + sc relativamente a uma origem convenientemente escolhida.
2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS
Elemento
Li
Na
K
Rb
Cs
Ba
a (Å)
3,50
4,28
5,25
5,69
6,08
5,01
Elemento
V
Nb
Ta
Cr
Mo
W
13
a (Å)
3,03
3,29
3,29
2,88
3,14
3,16
Tabela 2.3: Alguns elementos que cristalizam em redes do tipo ccc.
(d) Redes de empacotamento máximo
Em muitos metais e nos sólidos inertes, a ligação quı́mica é tal que favorece uma
grande proximidade entre os átomos envolvidos. Nestes casos, as posições ocupadas
pelos átomos podem ser visualizadas imaginando-os como esferas rı́gidas, encostadas
umas às outras por forma a minimizar o volume intersticial. Nestas condições diz-se
que a rede cristalina é de empacotamento máximo. Há dois tipos de redes de empacotamento máximo: a rede cúbica de faces centradas e a chamada rede hexagonal
compacta. Para compreendermos a razão de existirem apenas estas duas espécies,
analisemos a Figura 2.5. Nela, está representado um plano de esferas iguais, dispos-
B
C
B
B
A
A
C
C
B
A
C
A
A
C
B
B
A
A
ABA
ABC
Figura 2.5: As duas possibilidades para o empacotamento máximo.
tas contiguamente, formando uma rede bi-dimensional hexagonal. Para formarmos
um cristal tri-dimensional, devemos colocar, sobre o plano representado à esquerda,
outros planos semelhantes. Para maximizar o volume ocupado, os centros das esferas do “segundo andar” deverão ficar nas verticais dos pontos B ou, em alternativa,
dos pontos C. Suponhamos que se verifica a primeira possibilidade. Analisemos
agora as possibilidades de colocação de um terceiro andar. Os centros das esferas
desta nova camada devem ocupar posições nas verticais dos espaços intersticiais do
segundo andar, ou seja, as verticais dos pontos A (dizendo-se então que se trata
de um empacotamento do tipo ABABA . . .) ou, alternativamente, as verticais dos
pontos B (empacotamento do tipo ABCABC . . .). As duas possibilidades estão
representadas à direita na Figura 2.5. As redes com empacotamento do tipo ABC
são, de facto, redes cúbicas de faces centradas, em que o plano apresentado na Figura 2.5 à esquerda é um plano perpendicular a uma direcção diagonal principal; as
redes com empacotamento do tipo ABA são redes hexagonais compactas (ver a Figura 2.6). A rede hexagonal compacta não é, no sentido estrito, uma rede cristalina,
pois os pontos que a formam não são todos equivalentes, como está patente na Figura 2.6: os pontos do plano central não são equivalentes aos das bases. No entanto,
é uma estrutura apresentada por um número relativamente grande de substâncias
quı́micas, e por essa razão a incluı́mos nesta discussão. Para que uma “rede” hexagonal compacta seja uma estrutura de empacotamento máximo, a relação entre os
14
c
b
a
Figura 2.6: A rede hexagonal compacta.
módulos dos vectores fundamentais a, b e c é
a = b
c = 1, 63a.
(2.17)
(2.18)
Dados relativos a alguns elementos que cristalizam na rede hexagonal compacta
estão apresentados na Tabela 2.4
Elemento
Be
Ce
He (2K)
Mg
Ti
Zn
a (Å)
2,29
3,65
3,57
3,21
2,95
2,66
c (Å)
3,58
5,96
5,83
5,21
4,69
4,95
c/a
1,56
1,63
1,63
1,62
1,59
1,86
Tabela 2.4: Elementos com rede hexagonal compacta.
(e) Outras estruturas — Exemplos com elementos
Na Tabela 2.5 resumimos propriedades da rede cristalina de elementos que cristalizam em redes trigonais, ortorrômbicas e tetragonais.
Elemento
Hg (5K)
Bi
In
Sn (branco)
Ga
Cl (113K)
Tipo de rede
Trigonal
Trigonal
Tetragonal
Tetragonal
Ortorrômbica
Ortorrômbica
a
2,99
4,75
4,59
5,82
4,51
6,24
b
—
—
—
—
4,52
8,26
c
—
—
4,94
3,17
7,64
4,48
θ
70◦ 450
57◦ 140
—
—
—
—
Tabela 2.5: Alguns elementos com redes trigonais, tetragonais e ortorrômbicas. Os
módulos dos vectores fundamentais são indicados em Å. Os valores redundantes não
estão explicitados.
2.5. DIRECÇÕES E PLANOS CRISTALINOS
2.5
15
Direcções e planos cristalinos
Como já foi dito, qualquer vector da rede, R, pode ser escrito como uma combinação
linear inteira(b) dos vectores a, b, c de um conjunto fundamental primitivo, isto é,
R = ha + kb + lc,
h, k, l ∈ Z,
(2.19)
onde Z designa o conjunto dos números inteiros. Como é evidente, se o conjunto
de vectores a, b, c for um conjunto fundamental não primitivo, esta equação só
pode manter-se, qualquer que seja o vector de rede R, se permitirmos que h, k e
l possam tomar valores racionais não inteiros. Em qualquer caso, os vectores de
um conjunto fundamental formam uma base natural para a descrição geométrica e
analı́tica do cristal. Devemos, no entanto, ter em atenção que, por norma, esta base
não é ortonormada e que, portanto, muitas igualdades elementares da geometria
analı́tica de uso comum não são aqui aplicáveis.
Os cristalógrafos desenvolveram uma notação, baseada na utilização de bases
formadas com vectores fundamentais, que permite especificar facilmente posições,
direcções e planos num cristal, que vamos passar a descrever.
Chamam-se direcções cristalinas a direcções definidas por dois pontos da rede
cristalina. Consideremos um vector de rede R que une dois pontos contı́guos numa
dada direcção (ver a Figura 2.7). De acordo com a equação (2.19), existem três
números inteiros (ou, quando muito, racionais) h, k, l, tais que
b
a
Figura 2.7: Exemplo de direcção cristalina.
R = ha + kb + lc.
(2.20)
Eliminando factores racionais comuns, obtemos três números inteiros r, s e t, que
identificam a direcção (cristalina) do vector R, como sendo a do vector ra + sb + tc.
Estes três números, na notação cristalográfica que iremos adoptar, apresentam-se
entre parêntesis rectos e sem quaisquer separadores (vı́rgulas, espaços, etc.) entre
eles, como em [rst]. Se algum destes inteiros for negativo, o sinal deve ser colocado
sobre, e não atrás, do ı́ndice respectivo, como em [121]. Por exemplo, a direcção da
diagonal principal numa rede cúbica (isto é, aquela que passa no centro do corpo
da célula unitária, partindo da sua origem) fica identificada por [111].
Tal como as direcções cristalinas são as definidas por dois pontos da rede, planos
cristalinos são os definidos por três pontos da rede cristalina. Devido à regularidade da rede, um dado plano cristalino contém, para além dos três pontos de rede
que o definem, um número infinito de outros pontos de rede, que formam, nesse
plano, uma rede cristalina bidimensional. Também por causa desta regularidade, é
possı́vel, dado um qualquer plano cristalino, definir uma infinidade de outros planos
(b) Daqui em diante, usaremos esta expressão referindo-nos a uma combinação linear com coeficientes inteiros.
16
cristalinos, paralelos ao primeiro. Os ı́ndices de Miller são uma forma prática de
especificar a orientação de uma destas famı́lias de planos cristalinos paralelos. Para
uma dada famı́lia definem-se da seguinte forma:
c
c/l
a/h
a
b/k
b
Figura 2.8: Plano cristalino com ı́ndices (hkl).
(a) tomando, na famı́lia considerada, o plano que mais se aproxima da origem da
célula unitária, determinam-se as distâncias que a separam dos pontos em que
o plano escolhido intersecta as direcções dos vectores fundamentais a, b e c,
e exprimem-se estas distâncias em unidades de a, b e c, respectivamente;
(b) tomam-se os inversos dos resultados obtidos no primeiro ponto e reduzem-se
a três inteiros nas mesmas proporções relativas, tendo o cuidado de eliminar eventuais(c) factores comuns. O resultado é apresentado entre parêntesis
curvos, sem separadores.
Para o plano apresentado na Figura 2.8, os ı́ndices de Miller são (hkl), se os inteiros
h, k e l não tiverem divisores comuns. Também para os ı́ndices de Miller se segue
a convenção de colocar os sinais “-” sobre os ı́ndices negativos. Assim, se para uma
dada famı́lia de planos resultarem os valores 2, -3, 1 para os ı́ndices de Miller, o
resultado deve ser apresentado como (231). Se um dado plano é paralelo a um dos
eixos fundamentais, então não o intersecta, obviamente; o valor do ı́ndice de Miller
correspondente é, por definição, 0 (zero).
Por exemplo, a famı́lia de planos paralela ao plano definido pelos vectores fundamentais a e b tem ı́ndices de Miller (001); os ı́ndices de Miller da famı́lia de planos
paralela ao que contém as extremidades dos vectores a, b e c são (111); um plano
que contenha os pontos cujos vectores posição a, b/2(d) , 2c (ver figura 2.9) pertence
a uma famı́lia com os ı́ndices de Miller (241). Analisemos este caso em detalhe. O
plano em questão cruza os eixos fundamentais em pontos que estão a distâncias a,
b/2 e 2c da origem. Passa assim, em particular, num ponto de rede cujo vector
posição é 2c. Mas existem, nesta famı́lia de planos, elementos mais próximos da
origem. Com efeito, existe um plano cristalino, paralelo ao que estamos a considerar, que passa no ponto cujo vector posição é c, e é este plano que, pela sua maior
proximidade à origem, deve ser usado na construção da definição dos ı́ndices de
Miller. Este plano cruza os eixos cristalográficos em pontos que estão a distâncias
a/2, b/4 e c da origem. Usando como unidades para estas distâncias os módulos
(c) Pode demonstrar-se que, se se usar na construcção dos ı́ndices de Miller o plano que mais se
aproxima da origem, os ı́ndices obtidos não têm divisores comuns.
(d) Note-se que o ponto cujo vector posição é b/2 não é um ponto de rede. No entanto, o plano
em questão é de facto um plano de rede, pois contém os pontos da rede cujos vectores posição são
a, 2c, b − 2c.
2.6. DISTÂNCIA INTERPLANAR
17
c
a
b
Figura 2.9: Dois planos da famı́lia (241). O triângulo maior representa o plano que
corta os eixos cristalográficos nos pontos a, b/2, 2c; o triângulo menor representa o
plano que deve ser usado na determinação dos ı́ndices de Miller.
dos vectores vectores fundamentais correspondentes, obtemos os números racionais
1/2, 1/4 e 1; os inversos destes números são 2, 4 e 1, e portanto esta famı́lia de
planos tem os ı́ndices de Miller (241), como se afirmou.
2.6
Distância interplanar
No próximo capı́tulo veremos que a distância entre dois planos consecutivos de
uma famı́lia de planos paralelos é um parâmetro muito importante no estudo da
difracção de radiação pelos cristais. Vamos por esta razão determiná-la de seguida.
Na Figura 2.10 estão representados os vectores fundamentais de uma rede cristalina
e dois planos de uma famı́lia cujos ı́ndices são (hkl). Pretendemos determinar a
distância interplanar dhkl . Atendendo à figura da esquerda (desenhada segundo
c
c
dhkl
P3
P3
G’
θ
O
H
P1
P2
a
a
P1
F
b
Figura 2.10: Distância interplanar dos planos (hkl).
a direcção do vector b para a manter compreensı́vel), notamos que a distância
requerida é igual ao comprimento da projecção do segmento OP1 segundo a direcção
do vector G0 , que é escolhido perpendicular à famı́lia de planos (hkl). De acordo
com a definição dos ı́ndices de Miller, o segmento OP1 tem comprimento a/h, e,
portanto, dhkl = a/h cos θ. Podemos dar a esta igualdade uma forma mais prática
usando o produto interno entre os vectores a e G0 :
dhkl =
a G0
·
,
h |G0 |
(2.21)
onde G0 pode ser qualquer vector perpendicular ao plano (hkl). Uma forma simples
de construir G0 é formando o produto vectorial de dois vectores não colineares deste
plano, por exemplo os vectores H e F representados na Figura 2.10 à direita. Estes
18
dois vectores, escritos como combinações lineares dos vectores fundamentais, são
b a
−
k
h
c b
=
− ,
l
k
F
= P2 − P1 =
(2.22)
H
= P3 − P2
(2.23)
onde representámos por Pk os vectores posição dos pontos Pk (k = 1, 2, 3). Fazendo
o produto externo destes dois vectores resulta
G0 = F × H =
1
1
1
a×b +
b×c +
c × a,
hk
kl
lh
(2.24)
e, substituindo em (2.21), obtemos
dhkl =
a · (b × c)
.
hkl|G0 |
(2.25)
Finalmente, notamos que o produto misto no numerador da fracção em (2.25) é
igual ao volume da célula unitária definida pelos vectores fundamentais a, b e c,
que representaremos por τ . Introduzindo o vector Ghkl , dado por
Ghkl = hkl
2π 0
2π
2π
2π
G = l
a×b + h
b×c + k
c × a,
τ
τ
τ
τ
(2.26)
obtém-se para a distância interplanar, por fim,
dhkl =
2π
.
|Ghkl |
(2.27)
Esta expressão será usada no próximo capı́tulo, no estudo da difracção de radiação
por cristais, onde também será discutida a importância dos vectores com a forma
de Ghkl (eq. 2.26), chamados vectores da rede recı́proca.
Uma vez determinada distância entre famı́lia de planos vamos agora analisar a
densidade de pontos contidos em cada plano, i.e. o número de pontos por unidade
de área da famı́lia de planos (hkl).
Considere uma célula unitária formada por três vectores da rede. Dois destes
vectores, u e v estão contidos num plano da famı́lia (hkl) (ver a Figura 2.11); o
terceiro vector, w, está ligado a um plano adjacente da mesma famı́lia. Note-se que
a célula unitária assim construida contém apenas um ponto de rede e portanto é,
de facto, primitiva. O volume da célula formada por este três vectores é, como já
foi demonstrado, igual a τ . Este volume também é igual ao volume formado pelos
vectores u e v e um terceiro (que em geral não é vector da rede) de módulo igual à
distância interplanar, dhkl , perpendicular aos planos (hkl), e que une os dois planos
adjacentes. Deste modo, temos que
τ = A dhkl ,
e sendo o número de pontos da rede por unidade de área dado por
1
,
A
em que A é a área formada pelos vectores a e b, obtemos que a densidade de pontos
num plano (hkl) vem dada por
1
dhkl
=
.
A
τ
2.7. COORDENADAS FRACCIONÁRIAS
19
(hkl)
w
d hkl
v
A
u
(hkl)
Figura 2.11: Construcção para o cálculo da densidade de pontos de rede nos planos
de uma famı́lia (hkl).
2.7
Coordenadas fraccionárias
Estudámos até agora vários conceitos úteis no estudo das redes cristalinas, mas
pouco foi dito sobre os motivos, ou bases, que associados a estas redes, formam os
cristais reais.
Tal como as redes cristalinas, os motivos podem ser classificados em categorias
gerais, segundo as transformações geométricas que aceitam como transformações de
simetria. No entanto, este assunto é não será abordado neste curso, por não ser
absolutamente indispensável para o estudo que se segue. O que sim é necessário é
introduzir uma notação que permita a especificação das posições dos átomos que
formam o motivo. Esta questão surge porque porque os átomos que formam o motivo ocupam, em geral, posições não coincidentes com as dos pontos que formam a
rede cristalina; o seu vector posição não é pois, necessariamente, um vector da rede,
ou seja, uma combinação linear inteira dos vectores fundamentais. Independentemente deste facto, usamos a base dos vectores fundamentais da rede cristalina para
representar os vectores posição destes átomos, que, assim, podem apresentar coordenadas não inteiras, ou fraccionárias. Note-se que o mesmo acontece para alguns
pontos da rede cristalina, sempre que os vectores fundamentais escolhidos para a
representar forem não primitivos.
Por exemplo, usando vectores os fundamentais convencionais para a rede cúbica
de corpo centrado, as coordenadas do ponto central são ( 12 , 12 , 21 ). A rede cristalina
do diamante é cúbica de faces centradas. Os pontos de rede de uma célula unitária
convencional têm pois coordenadas (0, 0, 0), ( 12 , 12 , 0), ( 12 , 0, 21 ), (0, 12 , 12 ).
Quando se usam para especificar a posição de pontos de rede numa célula
unitária (não primitiva), as coordenadas fraccionárias têm origem num vértice da
célula unitária; mas, quando se usam para indicar as posições dos átomos que formam o motivo, têm origem em cada ponto ponto da rede cristalina. Assim, por
exemplo para o diamante, o motivo é formado por dois átomos, com coordenadas
(0, 0, 0) e ( 41 , 41 , 14 ); para se obter um cristal de diamante, devemos sobrepor, em cada
um dos quatro pontos de rede que referimos no parágrafo anterior, dois átomos de
carbono, com estas coordenadas, relativamente a uma origem escolhida sobre cada
um daqueles pontos.
20
2.8
Defeitos
A descrição dos sólidos que foi apresentada neste capı́tulo é apenas uma idealização.
Os cristais reais apresentam as regularidades mencionadas apenas de forma aproximada, apresentando sempre um número apreciável de imperfeições ou defeitos, isto
é, de desvios à regularidade cristalina.
Há vários tipos de defeitos cristalinos. Por exemplo, um átomo de espécie
quı́mica diferente da dos que formam o cristal (como é o caso, muito útil, dos
semicondutores “dopados”, do tipo “p” ou “n”),uma posição de rede desocupada,
ou um átomo numa posição não definida pela rede. As próprias fronteiras do cristal
são defeitos cristalinos, na medida em que quebram a periodicidade do cristal.
Vamos agora estudar um pouco mais detalhadamente os principais tipos de
defeitos cristalinos.
(1) Vibrações dos átomos do cristal
Os átomos que formam os cristais encontram-se permanentemente animados de
um movimento de oscilação em torno de posições de equilı́brio, que correspondem
às posições definidas pela estrutura cristalina. A este movimento dá-se o nome
de agitação térmica. A amplitude destas oscilações diminui quando se baixa a
temperatura, mas não se anula nunca, mantendo-se mesmo no zero absoluto da
temperatura, como consequência do princı́pio de incerteza de Heisenberg.
(2) Imperfeições pontuais
Imperfeições pontuais são irregularidades que se verificam em pontos isolados, e há
três espécies principais. As lacunas, as imperfeições intersticiais e as impurezas.
Uma lacuna é uma posição da estrutura cristalina que se encontra desocupada. Uma
imperfeição intersticial corresponde a um átomo que ocupa uma posição não prevista
na estrutura cristalina. Um átomo de um cristal pode, sob certas circunstâncias(e) ,
abandonar a sua posição na estrutura cristalina (fazendo assim surgir uma lacuna)
e fixar-se numa posição intersticial. A estes pares lacuna-interstı́cio dá-se o nome
de pares de Frenkel.
Nos cristais iónicos, as lacunas devem sempre aparecer aos pares, por forma a
manter a neutralidade eléctrica do cristal. Estes pares de lacunas têm o nome de
pares de Shottky. (f)
As impurezas são átomos de espécie quı́mica diferente da dos que formam o
cristal. Os átomos contaminantes podem ocupar posições da estrutura cristalina,
substituindo assim os átomos originais, tomando o nome de impurezas substitucionais, ou ocupar posições que não estão definidas na estrutura, sendo então conhecidas como impurezas intersticiais. Por exemplo, o aço é uma solução de carbono
em ferro, constituindo os átomos de carbono impurezas intersticiais na estrutura
cristalina definida pelos átomos de ferro. Em contrapartida, o latão é uma liga de
cobre e de zinco, onde os átomos de zinco substituem os de cobre nalgumas posições,
constituindo assim impurezas substitucionais de um cristal de cobre.
O funcionamento dos dispositivos semicondutores comuns, como os transı́stores
ou os diodos, baseia-se na presença de impurezas substitucionais. Estes dispositivos
consistem num cristal, normalmente de silı́cio ou de germânio, dividido em duas
(no caso dos diodos) ou três (no caso dos transı́stores) regiões com impurezas substitucionais de tipo “n” (que consistem em átomos com um electrão de valência a
mais do que os os átomos vizinhos) ou de tipo “p” (cujos átomos têm um electrão
de valência a menos).
(e) Por
exemplo, mediante um aquecimento excessivo.
cristais do tipo NaCl, evidentemente; nos casos de cristais do tipo AB2 , como o cloreto
de cálcio (CaCL2 ), a neutralidade eléctrica só pode ser assegurada através de “ternos” de lacunas
— uma de A por cada duas de B.
(f) Para
2. Problemas
21
(3) Imperfeições lineares
Nas imperfeições lineares, os átomos que quebram a simetria cristalina dispõem-se
ao longo de uma linha. Os exemplos mais importantes são as chamadas deslocações.
Estas imperfeições podem ser o resultado de deformações do cristal, e verificam-se
quando um plano cristalino se desloca sobre outro. Na Figura 2.12 está representada uma deslocação e o modo como as deformações do cristal podem fazer surgir
deslocações. Há ainda outros tipos de deslocações mas não os estudaremos aqui.
F
Deslocaçao
Figura 2.12: Deslocações cristalinas.
(4) Imperfeições superficiais
As imperfeições superficiais são superficı́cies de separação entre regiões distintas
dos cristais. Por exemplo, nos cristais de ferro é energeticamente favorável o alinhamento dos momentos magnéticos dos átomos. No entanto, a agitação térmica
contraria esta tendência de alinhamento. Assim, à temperatura ambiente, os cristais
de ferro encontram-se usualmente divididos em regiões, chamadas domı́nios ferromagnéticos, onde os momentos magnéticos dos átomos têm a mesma orientação,
sendo diferente de domı́nio para domı́nio. As superfı́cies(g) que separam estes
domı́nios constituem imperfeições superficiais.
As próprias fronteiras dos cristais constituem, como já foi dito, defeitos, que
podem ser classificados também como imperfeições superficiais.
PROBLEMAS
2.1 Considere um cristal bidimensional semelhante a um tabuleiro de xadrez.
(a) Determine dois conjuntos de vectores fundamentais não primitivos.
(b) Determine dois conjuntos de vectores fundamentais primitivos.
(c) Represente graficamente as células unitárias e os motivos associados aos
conjuntos de vectores fundamentais determinados em (a) e em (b).
2.2 Considere a estrutura atómica plana ilustrada na figura, composta por átomos do
tipo A, B e C:
(a) Determine um conjunto de vectores fundamentais primitivos.
(b) Indique quantos átomos de cada tipo existem na célula unitária primitiva.
(c) Desenhe a célula unitária de Wigner-Seitz.
(g) Podem ser consideradas superfı́cies à escala macroscópica apenas, já que podem ter várias
dezenas de milhar de átomos de espessura...
22
’
Atomo
tipo A
’
Atomo
tipo B
’
Atomo
tipo C
2.3 O Cloreto de Césio (CsCl) tem uma estrutura cúbica
de parâmetro a = 4, 11 Å, com os átomos dispostos
de acordo com a figura. Determine:
(a) o tipo de estrutura cúbica de CsCl;
(b) um conjunto de vectores fundamentais primitivos, e indique qual o volume da célula
unitária primitiva;
(c) a densidade do CsCl.
2.4 A estrutura do composto SrTiO3 é a seguinte: os átomos de estrôncio dispõem-se
nos vértices de cubos idênticos dispostos regular e contiguamente; os de titânio,
nos centros destes cubos; os de oxigénio, finalmente, nos centros das suas faces.
(a) Qual o tipo de rede cristalina apresentada por este composto?
(b) Indique um conjunto de vectores fundamentais primitivos.
(c) Verifique que há um átomo de estrôncio, um de titânio e três de oxigénio
numa célula unitária definida pelos três vectores escolhidos em (b).
(d) Usando coordenadas fraccionárias, descreva o motivo que, associado à rede
cristalina determinada em (a), gera o cristal de SrTiO3 .
2.5 As posições dos pontos de duas redes cristalinas são dadas por:
(a)
(b)
rn1 ,n2 ,n3 =
rn1 ,n2 ,n3 =
e
e
e
10n1 +9n2 +19n3
3
a x + 6 n2 +n
a y+
10
5
√
2n1 +n2
3n2
a x + 2 a y + 2n3 a z .
2
e
e
2n3 aez ;
onde a é um número real fixo e n1 , n2 e n3 são inteiros arbitrários. Escolha,
para os dois casos, um conjunto primitivo de vectores fundamentais e identifique
o tipo de rede.
2.6 Para cada um dos seguintes conjuntos de vectores fundamentais primitivos, identifique o tipo de rede indicando as dimensões da célula convencional em termos
dos parametros a, b e c:
(a)
(b)
(c)
(d)
e + 12 aey , aey , √12 aez ;
1
aex + 12 aey , aey , aez ;
2
aex + 2bey , bey , cez ;
1
aex + 12 bey , bey , cez .
2
1
a x
2
2.7 Calcule o valor dos seguintes parâmetros para cada uma das três redes cúbicas
(simples, de corpo centrado e de faces centradas):
(a) volume da célula convencional;
2. Problemas
23
(b) volume da célula primitiva;
(c) número de pontos de rede na célula convencional;
(d) número de pontos na célula primitiva;
(e) distância entre vizinhos mais próximos;
(f) fracção de empacotamento(h) .
2.8 Prove que numa rede cúbica simples a direcção [hkl] é perpendicular aos planos
da famı́lia (hkl). Verifique com exemplos que o mesmo não se passa, necessariamente, para outros tipos de rede.
2.9 À temperatura de 1190 K, o ferro apresenta uma rede cristalina de faces centradas
com aresta a = 3, 647 Å, ao passo que, a 1670 K, a rede cristalina é de corpo
centrado, com aresta a = 2, 932Å. Determine a sua densidade, para cada uma
das temperaturas referidas.
2.10 O sulfeto de zinco Zn S cristaliza em duas estruturas distintas: a estrutura zinc
blende (impregnação de zinco) e estrutura wurtzite (wurtzita), ilustradas na figura
seguinte.
1/2
0
zinc blende
3/4
1/4
1/4
3/4
1/2
1/2
1/2
(a)
(b)
wurtzite
0
5/8
1/8
1/2
Nas Figuras (a) estão representadas células convencionais, As Figuras (b) representam
projecções das respectivas células onde estão indicadas as posições verticais dos átomos
em relação à altura da célula em questão.
A estrutura zinc blende é constituida por a uma rede cúbica de face centrada
associada a cada tipo de átomo e separadas ao longo da diagonal do cubo da
célula convencional cúbica em ( 41 , 14 , 14 ). A estrutura wurtzite tem associada a
cada tipo de átomo uma estrutura hexagonal compacta separadas em 58 da altura
da célula hexagonal. Sabendo que os parâmetros das células são de a = 5, 41 Å
para célula cúbica, e a = 3, 81 Å e c = 6, 23 Å para a célula hexagonal calcule a
densidade de ambas as formas do sulfeto de zinco.
(h) A fracção de empacotamento é a fracção de volume da rede ocupado, supondo os pontos da
rede como esferas rı́gidas suficientemente grandes para se tocarem
24
2.11 O Arsenito de Gálio cristaliza na forma de estrutura zinc blend. A ligação Ga−As
tem 2, 45 Å de comprimento.
(a) Determine a aresta da célula convencional cúbica.
(b) Qual a separação Ga − Ga mais curta.
(c) Qual a densidade do Ga As.
2.12 Considere um cristal com estrutura tipo wurtzite. Determine três vectores fundamentais primitivos assim como a respectiva base indicando a sua posição relativa.
2.13 Determine o quociente c/a para uma estrutura wurtzite.
2.14 Considere um conjunto seguinte de vectores fundamentais primitivos de uma rede
tetragonal de corpo centrado:
a=
1
1
1
1
1
1
a(ex + ey ) − cez , b = a(−ex + ey ) + cez , c = a(ex − ey ) + cez
2
2
2
2
2
2
onde a representa o lado da base quadrada da célula convencional e c a altura da
mesma. Considere que inicialmente temos c > a, e seguidamente imagine que a
célula é comprimida na direcção do eixo z.
(a) Para que valor de c a rede toma a forma de cúbica de corpo centrado?
(b) Para que valor de c a rede toma a forma de cúbica de face centrada?
Dê os seus resultados em termos do parametro a.
2.15 Se uma célula unitária de uma dada rede cristalina contém N pontos de rede,
então o seu volume é V = N Vp onde Vp é o volume das células unitárias primitivas
da mesma rede. Demonstre esta preposição.
2.16 Determine a separação entre os pontos de uma rede cristalina ao longo das direcções seguintes: (a) [110]; (b) [111]; (c) [320]; (d) [321].
2.17 Determine os ı́ndices de Miller de um plano que, numa rede cúbica simples, contém
a aresta de uma célula unitária primitiva e intersecta duas outras arestas da mesma
célula nos seus centros.
2.18 Compare a distância interplanar para os planos (210) numa rede cúbica simples,
cúbica de corpo centrado e cúbica de faces centradas.
2.19 Demonstre que a fracção de empacotamento máximo para um cristal de estrutura
tetragonal de corpo centrado (com uma base composta por um único átmo) é
dada por:
√
(a) π3 ac se c > 2a;
√
2 3
π a
(b) 24
(2 + ac 2 ) 2 se c < 2a.
c
2.20 Determine a densidade de pontos nos planos (111) de uma rede cúbica de face
centrada. Compare com a densidade de pontos nos planos (110).
Capı́tulo 3
Difracção elástica em cristais
Uma das ferramentas mais usadas na determinação da estrutura dos sólidos é a
análise da difracção de radiação neles incidente. De facto, quase se pode marcar o
nascimento da fı́sica do estado sólido com ramo autónomo da fı́sica em 1912, ano
em que foi publicado o primeiro artigo(a) sobre difracção de raios-X em cristais.
Neste capı́tulo, vamos estudar os processos de difracção de radiação por cristais
e a sua utilização na determinação das estruturas cristalinas. Vamo-nos restringir
à difracção elástica, em que a radiação difractada tem o mesmo comprimento de
onda que a incidente.
3.1
Generalidades
A análise da difracção elástica de radiação por cristais é um método poderoso no
estudo da sua estrutura. A informação que se obtém das experiências de difracção
resulta fundamentalmente de processos de interferência das várias porções do cristal;
assim, usa-se nestas experiências radiação com comprimento de onda próximo das
distâncias interatómicas tı́picas nos cristais, ou seja, alguns Angstrongs.
As experiências de difracção são realizadas com as seguintes três espécies de
feixes:
Raios-X Por ser muito simples a produção, detecção e manipulação (focagem, deflexão,
etc.) de feixes de radiação electromagnética, este tipo de radiação é o mais
frequentemente escolhido para experiências de difracção. A radiação interage
principalmente com as nuvens electrónicas dos sólidos, e portanto a sua utilização permite a determinação da distribuição electrónica e, a partir daı́, da
estrutura cristalográfica e de outras propriedades relevantes dos sólidos. Nas
experiências de difracção com cristais, usa-se radiação electromagnética na
região do espectro dos raios-X, por ser a que apresenta os comprimentos de
onda na gama apropriada.
Electrões Podem também usar-se feixes corpusculares, já que, à luz da Mecânica Quântica, estes evidenciam também comportamentos ondulatórios. Os electrões, por
serem partı́culas carregadas e extremamente leves, sofrem muito fortemente
a interacção com a matéria; assim, os feixes de electrões não têm um grande
poder de penetração nos sólidos e, por esta razão, são usados apenas no estudo
das suas superfı́cies. Os electrões devem estar animados com uma energia
cinética de cerca de 150 eV(b) para que o comprimento de onda da sua função
(a) Por
W. Friedrich, P. Knipping e M. Laue
eV é a energia cinética adquirida por um electrão acelerado por uma diferença de potencial
de 1V, ou seja 1eV≈ 1.6 × 10−19 J.
(b) 1
25
26
CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS
de onda quântica seja comparável com as distâncias interatómicas vulgares
nos cristais.
Neutrões Estas partı́culas, ao contrário dos electrões, têm um grande poder de penetração nos sólidos, por serem mais pesadas e também por serem electricamente
neutras. Apesar da sua neutralidade eléctrica, os neutrões apresentam momento magnético não nulo e por isso sofrem interacções electromagnéticas,
principalmente com os electrões responsáveis pelas propriedades magnéticas
do meio em que se encontram. Estas interacções não são “mascaradas” pelas
forças coulombianas, que seriam dominantes se se usassem feixes de partı́culas
carregadas, como protões. Por esta razão, os feixes de neutrões são particularmente indicados no estudo da distribuição do momento magnético no interior
dos sólidos. A energia do feixe com que as experiências devem ser conduzidas
é de cerca de 0,1 eV.
A grandeza fı́sica que envolvida nos processos de composição e de interferência
é, no caso dos raios-X, o campo electromagnético, ao passo que, no dos feixes
corpusculares, é a função de onda das partı́culas que os constituem. No entanto,
a intensidade medida pelos detectores é proporcional ao quadrado do módulo do
campo electromagnético (no caso dos raios-X), ou da função de onda (no caso dos
feixes de electrões ou de neutrões).
3.2
A condição de Bragg
Em 1913, quando estudavam a difracção de radiação por matéria, W. H. Bragg e
W. L. Bragg notaram que as substâncias cristalinas produzem padrões de difracção
de raios-X muito nı́tidos, ao contrário do que acontece com lı́quidos ou sólidos
não cristalinos. Mais concretamente, observaram que, iluminando um cristal com
raios-X de comprimento de onda bem determinado, a radiação é re-emitida apenas
segundo certas direcções bem determinadas, ao passo que repetindo esta experiência
com substâncias não cristalinas, a radiação é difundida em todas as direcções. Para
explicarem este facto, os Bragg supuseram que esta re-emissão da radiação se faz
por reflexão geométrica nos planos cristalinos, e que as reflexões em planos paralelos consecutivos devem interferir construtivamente para que se possam observar.
A Figura 3.1 representa o trajecto óptico de dois raios-X paralelos que sofrem uma
θ
θ
θθ
θ
l
l
d
θ
Figura 3.1: Reflexão de Bragg.
reflexão em dois planos consecutivos de uma dada famı́lia de planos cristalinos, que
fazem com a direcção dos feixes um ângulo de θ. A diferença entre os caminhos
percorridos pelos dois raios é 2l, ou seja, 2d sin θ, onde d é a distância interplanar.
Para que haja interferência construtiva, esta diferença deve conter um número inteiro, n, de comprimentos de onda, λ, da radiação envolvida no processo. Assim, a
condição para a existência de reflexão é
2d sin θ = nλ,
(3.1)
3.3. MÉTODOS EXPERIMENTAIS
27
que é a famosa lei de Bragg. Quando radiação de comprimento de onda bem definido
incide num cristal, somente as famı́lias de planos que apresentam uma distância
interplanar e uma orientação relativamente à radiação incidente que satisfazem a
lei de Bragg participam na reflexão de radiação. Pode mesmo não haver reflexão (é
até o caso mais frequente, para uma orientação fixa do cristal e da fonte da radiação)
se não houver nenhuma famı́lia de planos nestas condições. Neste caso, a radiação
incidente é totalmente absorvida pelo cristal.
3.3
Métodos experimentais
O formalismo de Bragg para a descrição da difracção de raios-X não é muito satisfatório porque se supõe que a difracção resulta de reflexões geométricas nos planos
cristalinos. Esta suposição não deveria ser aceite sem um estudo que a justifique.
Mais tarde analisaremos um formalismo mais convincente (o de Laue), mas para
já, fazemos uma pausa para discutir as questões práticas do estudo da difracção,
aceitando a lei de Bragg como base para a discussão.
Há basicamente três métodos para o estudo experimental da difracção: o de
Laue, o do cristal rotativo, e o do pó. No método de Laue, faz-se incidir raios-X
com uma gama contı́nua de comprimentos de onda sobre um cristal imóvel (ver a
Figura 3.2). O cristal difracta as componentes da radiação incidente com compri-
Cristal
Fonte de
raios-X
Écran
Figura 3.2: Método de Laue.
mentos de onda para os quais existem no cristal famı́lias de planos com distância
interplanar capaz de satisfazer a lei de Bragg. Estas componentes irão, após a
difracção, incidir num ecrã, usualmente uma placa fotográfica, ou um detector
eletrónico de raios-X, permitindo assim a análise. Os padrões de difracção consistem numa série de pontos, dispostos de forma simétrica relativamente ao ponto
onde a direcção da radiação incidente intersecta o plano do écran.
Como já foi dito, ao se iluminar um cristal imóvel com radiação monocromática
poderá não se verificar qualquer difracção, por não haver no cristal nenhuma famı́lia
de planos orientada de forma a permitir a satisfação da lei de Bragg. Mas se se
rodar o cristal durante a exposição à radiação, verificar-se-ão várias difracções,
cujo ângulo se altera bruscamente com a rotação do cristal. Cada famı́lia de planos
“espera pacientemente” o instante em que a sua orientação relativamente à radiação
incidente permita, nos termos da lei de Bragg, a sua participação na difracção. Este
é o processo usado no chamado método do cristal rotativo. O cristal roda no interior
de um cilindro (ver a Figura 3.3) cujas paredes interiores estão revestidas com uma
pelı́cula fotográfica. Um orifı́cio na superfı́cie lateral do cilindro permite a entrada
do feixe incidente.
No método do cristal rotativo, em cada instante, apenas algumas famı́lias de
planos participa no processo de difracção, que são aquelas que estão correctamente
alinhadas, e que apresentam uma distância interplanar capaz de satisfazer a lei
de Bragg. Se, em vez de um único cristal, dispusessemos de um grande número
cristais na região de incidência do feixe, e cada cristal estivesse orientado de maneira
arbitrária, então, mesmo com a amostra fixa, qualquer famı́lia de planos teria,
28
Écran
Cristal
Fonte monocromática
de raios-X
ω
Figura 3.3: Método do cristal rotativo.
nalgum cristal, a orientação correcta para satisfazer a lei de Bragg, podendo assim
participar da difracção. É nesta ideia que se baseia o chamado método do pó ou
de Debye. Neste método, em vez de se usar um cristal inteiro na amostra, usa-se
um cristal fragmentado em pequenos grãos, cada um dos quais funciona como um
pequeno cristal(c) com as suas direcções privilegiadas de difracção (ver a Figura 3.4).
película
fotográfica
ti
ma
cro
s
co
no
sX
aio
mo
amostra
R
-180°
-90°
0°
90°
180°
Figura 3.4: Esquema da montagem usada no método do pó e aspecto da pelı́cula
após revelação.
3.4
Condição de Laue. Rede recı́proca
Na dedução da lei de Bragg faz-se a suposição de que a difracção de radiação pelos
cristais se faz por reflexão em planos cristalinos. A validade desta suposição não é
nada óbvia, já que os processos de reflexão geométrica ocorrem em superfı́cies de
separação de dois meios com ı́ndices de refracção diferentes, e não em planos cristalinos abstractos, sem qualquer materialidade. Para além disto, a óptica geométrica
não é aplicável neste domı́nio, porque os comprimentos de onda das radiações envolvidas nestes processos são da ordem de grandeza das dimensões dos objectos em
que incidem.
(c) É trivial verificar que um grão de areia com cerca de 0,01 mm de diâmetro contém cerca de
1018 átomos, podendo pois ser ainda considerado um cristal macroscópico.
3.4. CONDIÇÃO DE LAUE. REDE RECÍPROCA
29
Em 1912, M. Laue tinha já proposto um tratamento mais natural do processo de
difracção, que vamos agora estudar. Um cristal, conforme já foi muitas vezes dito,
consiste num conjunto de objectos microscópicos idênticos (são as ocorrências do
motivo do cristal) colocados, regularmente, nos pontos de uma rede de Bravais, que,
quando neles incide radiação, a reemitem em todas as direcções. São então observadas fortes intensidades de difracção nas direcções em que a radiação reemitida por
todos estes objectos interfere construtivamente. Consideremos dois destes centros
n
δ1
n’
R
δ2
Figura 3.5: Dispersão elástica de radiação por duas células unitárias de um cristal.
dispersores, separados por um vector de rede R. Neles incide radiação com comprimento de onda λ, segundo a direcção definida pelo versor n̂ (ver a Figura 3.5). Para
que numa direcção definida pelo versor n̂0 se verifique interferência construtiva, é
necessário que a diferença entre os comprimentos dos caminhos ópticos seguidos
pelos raios que incidem em cada um dos dois centros dispersores considerados seja
igual a um múltiplo inteiro do comprimento de onda da radiação. A distância que
corresponde a esta diferença está realçada na Figura 3.5, sendo dada por δ1 + δ2 .
Mas
δ1
δ2
= R · n̂
= −R · n̂0 ,
(3.2)
(3.3)
de forma que a condição para a interferência construtiva é
¢
¡
R · n̂ − n̂0 = mλ,
(3.4)
onde m é um número inteiro qualquer. Multiplicando a Eq. (3.4) por 2π/λ e notando
que k = 2πn/λ é o vector de onda da radiação incidente(d) , resulta
R · (k − k0 ) = 2πm.
(3.5)
Esta é a condição para que a radiação reemitida pelas duas células unitárias representadas na Figura 3.5 interfira construtivamente na direcção do vector k0 . Claro
que, se considerarmos agora todo o cristal e não somente duas células unitárias,
obtemos uma condição semelhante a (3.5), mas que tem que se verificar para todos
os vectores da rede cristalina R:
R · (k − k0 ) = 2πm,
m ∈ N, ∀R ∈ rede cristalina.
(3.6)
Esta é a condição de Laue para a difracção. O conjunto dos vectores G = (k − k0 )
que satisfazem a Eq. 3.6 é muito reduzido. Vamos provar que estes vectores formam
também uma rede, que não é a rede formada pelos vectores R. Começamos por
(d) Define-se
da mesma maneira o vector de onda da radiação difractada
k0 = 2πn0 /λ.
30
definir os vectores(e)
b×c
a · (b × c)
c×a
B = 2π
a · (b × c)
a×b
C = 2π
,
a · (b × c)
A = 2π
(3.7)
(3.70 )
(3.700 )
onde a, b e c são os vectores fundamentais do cristal em estudo (ou seja, da rede
definida pelos vectores R). É possı́vel provar que, se a, b, c não forem co-planares,
então A, B, C também não o são (o leitor é aconselhado a tentar fazer esta demonstração), e portanto servem como base do espaço. Assim, podemos concerteza
escrever
G = xA + yB + zC,
(3.8)
onde x, y, z são três quantidades adimensionais, não necessariamente inteiras, que
são as componentes de G nesta base. Por outro lado, como R é um vector da rede
cristalina, pode escrever-se como uma combinação linear inteira dos vectores a, b,
c:
R = ha + kb + lc,
(3.9)
com h, k, l inteiros. Vejamos quais os valores que x, y, z podem tomar para que se
verifique R · G = 2mπ, de acordo com (3.6). Note-se que, como o produto externo
de dois vectores é perpendicular a qualquer deles, a · B = a · C = 0, etc., logo,
R·G =
=
(ha + kb + lc) · (xA + yB + zC)
2π (xh + yk + zl) .
(3.10)
Para que se verifique a condição de Laue, é necessário que a soma dentro dos
parêntesis na Eq. (3.10) seja um número inteiro, quaisquer que sejam os inteiros
h, k, l. Isto só é possı́vel (quaisquer que sejam h, k, l) se x, y e z forem também
inteiros. O conjunto de vectores G = (k − k0 ) que satisfaz a condição de Laue é
pois da forma
G = pA + qB + rC,
(3.11)
com p, q, r inteiros e A, B, C dados pelas equações (3.7). Ao variarmos os valores
de p, q, r em (3.11) geramos uma rede, diferente da gerada pelos vectores a, b, c,
chamada a rede recı́proca da rede gerada pelos vectores a, b, c. Esta última chama-se, para mais fácil distinção, rede directa. Os vectores A, B, C são os vectores
fundamentais da rede recı́proca.
A rede recı́proca é um conceito recorrente em Fı́sica do Estado Sólido. Foi
introduzido neste capı́tulo, mas surge também naturalmente no estudo de outros
tópicos, relativamente independentes da difracção de radiação.
Voltando agora à condição de Laue, podemos agora enunciá-la da seguinte forma:
Pode ocorrer interferência construtiva (e portanto difracção) se a variação no vector de onda da radiação G = k0 − k, for um vector da rede
recı́proca.
Note-se que a condição de Laue (ou a de Bragg que, veremos, lhe é equivalente)
é uma condição apenas necessária, não suficiente, para a difracção. Se o motivo
cristalino não for trivial (isto é, se contiver mais do que um átomo), verificam-se
processos de interferência no interior de cada célula unitária primitiva, que podem
impedir a difracção numa dada direcção, mesmo que a condição de Laue (que diz
respeito à interferência entre diferentes células unitárias primitivas) a permita. Mais
à frente abordaremos este assunto.
(e) Note-se que, usando estas definições, a eq. (2.26) na Secção 2.6 pode reescrever-se como G
hkl =
hA + kB + lC .
3.5. EQUIVALÊNCIA DAS CONDIÇÕES DE BRAGG E DE LAUE
3.4.1
31
A construcção de Ewald
A condição de difracção de Laue pode ser representada geometricamente através
da chamada construcção de Ewald (ver a Figura 3.6): desenha-se no espaço-k (f) o
vector de onda k do feixe incidente, com origem num ponto da rede recı́proca; de
seguida, desenha-se uma esfera de raio k = |k| com centro na extremidade daquele
vector. De acordo com a lei de Laue, são possı́veis difracções com vectores de onda
k0 se houver (além do ponto de origem do primeiro vector desenhado) pontos da
rede recı́proca na superfı́cie da esfera, caso em que podem verificar-se “reflexões” de
Bragg nos planos cristalinos (da rede directa) que são perpendiculares aos vectores
posição desses pontos da rede recı́proca.
k
G
-k’
Figura 3.6: A construcção de Ewald.
3.5
Equivalência das condições de Bragg e de Laue
Vamos agora demonstrar a equivalência das duas condições de difracção estudadas.
Antes, porém, demonstra-se uma propriedade muito útil da rede recı́proca.
Uma das caracterı́sticas mais relevantes da rede recı́proca é o facto de os seus
vectores, dados por (3.11), serem perpendiculares a planos da rede directa, e de as
suas componentes inteiras (h, k, l) estarem relacionadas de forma simples com os
ı́ndices de Miller (h0 k 0 l0 ) desses planos. Demonstremos esta afirmação. Seja
Ghkl = hA + kB + lC,
(3.12)
com A, B e C dados pelas eqs. (3.7) e h, k e l inteiros arbitrários, um vector
qualquer da rede recı́proca. Definam-se três novos números inteiros h0 , k 0 e l0 em
proporções relativas iguais às apresentadas por h, k e l, mas sem divisores comuns,
como
h0 = h/n
0
k = k/n
l0 = l/n,
(3.13)
(3.130 )
(3.1300 )
onde n é o maior divisor comum a h, k e l. Uma vez que h0 , k 0 e l0 não têm,
por construcção, divisores comuns, o conjunto (hkl) pode ser encarado como os
ı́ndices de Miller de alguma famı́lia de planos da rede directa. De acordo com a
definição de ı́ndices de Miller, o plano dessa famı́lia que mais se aproxima da origem
(f) Designam-se
assim, em geral, espaços recı́procos do espaço usual, como o espaço das variáveis
das transformadas de Fourier, o espaço ocupado pela rede recı́proca, etc. Estes espaço têm comprimentos com dimensões inversas do comprimento usual.
32
de uma base cristalográfica previamente escolhida contém os pontos P 1 = a/h0 ,
P 2 = b/k 0 , P 3 = c/l0 (ver a Figura 3.7). Dois vectores não colineares deste plano
são os vectores P 2 − P 1 e P 3 − P 2 . Então o vector
u = (P 2 − P 1 ) × (P 3 − P 2 )
(3.14)
é perpendicular à famı́lia de planos considerada. Com um pouco de aritmética
c
P3
P3 - P2
P2
a
P1
P2 - P1
b
Figura 3.7: O plano da famı́lia (h0 k0 l0 ) que passa nos pontos
P 1, P 2, P 3.
obtemos
u =
=
=
1
(h0 b × c + k 0 c × a + l0 a × b)
µ
¶
1 a · (b × c)
b×c
c×a
a×b
0
0
0
h
2π
+
k
2π
+
l
2π
h0 k 0 l 0
2π
a · (b × c)
a · (b × c)
a · (b × c)
1
τ
(h0 A + k 0 B + l0 C) ,
(3.15)
h0 k 0 l0 2π
h0 k 0 l 0
onde foram usadas as equações (3.7) e se introduziu o volume da célula unitária da
rede directa τ = a · (b × c). Finalmente, comparando este resultado com a definição
na Eq. (3.12) obtemos
2nπ
Ghkl = h0 k 0 l0
u.
(3.16)
τ
Os dois vectores Ghkl e u são, como está patente nesta expressão, colineares; uma
vez que u é, por construção, perpendicular aos planos da famı́lia (h0 k 0 l0 ), também
Ghkl o é.
Posto isto, analisemos geometricamente a condição de Laue. Consideremos uma
onda plana incidente no cristal com vector de onda k, sendo difractada na direcção
do vector k0 (ver a Figura 3.8). Note-se que se a difracção é elástica, as radiações
incidente e difractada têm o mesmo comprimento de onda, ou seja, |k| = |k0 | =
G
k
θ
α
α’
θ’
k’
Figura 3.8: Esquema da difracção de radiação por um cristal ilustrando a condição
de Laue (G deve pertencer à rede recı́proca) e a de Bragg (a difracção faz-se por
reflexão geométrica em planos cristalinos).
2π/λ. Na Figura 3.8 estão representados os vectores k, k0 e a sua diferença G =
3.6. AMPLITUDE DA DIFRACÇÃO. FACTOR DE ESTRUTURA
33
k0 − k (de acordo com a condição de Laue, deve ser um vector da rede recı́proca) e
um plano que é perpendicular a G, que, como acabámos de ver, deve pertencer a
uma famı́lia de planos da rede directa. Uma vez que |k| = |k0 |, o triângulo formado
por k0 , G e k (na figura, o lado correspondente a k aparece a tracejado) é um
triângulo isósceles. Logo os ângulos α e α0 são iguais e portanto também θ = θ0
Mas θ e θ0 são os ângulos que as radiações as radiações incidente e difractada fazem
com a famı́lia de planos perpendicular a G. Fica assim justificada a suposição
de reflexão geométrica usada no tratamento de Bragg. Falta ainda verificar que a
distância interplanar destes planos é exactamente a requerida pela lei de Bragg.
Vimos há pouco que o vector da rede recı́proca Ghkl = hA + kB + lC é perpendicular à famı́lia de planos da rede directa (h0 k 0 l0 )(g) . Por outro lado, no capı́tulo
anterior (eq. 2.27) vimos que a distância entre os planos desta famı́lia é
d ≡ dh0 k0 l0 =
2π
|Gh0 k0 l0 |
2nπ
=
.
|Ghkl |
(3.17)
(3.18)
Ora, da Figura 3.8, deve ser evidente que que
|Ghkl | = 2|k| sin θ =
4π
sin θ.
λ
(3.19)
Substituindo este resultado na eq. (3.18) obtemos, finalmente, a lei de Bragg
2 d sin θ = nλ,
(3.20)
ficando assim demonstrada a equivalência entre os tratamentos de Bragg e de Laue.
3.6
Amplitude da difracção. Factor de estrutura
A condição de Laue impõe, como vimos, que a radiação difractada por pontos
equivalentes do cristal (isto é, pontos separados por vectores da rede cristalina)
interfira constructivamente. Assim sendo, não se consideram na descrição de Laue
fenómenos de interferência entre centros dispersores a distâncias inferiores às que
separam os pontos da rede cristalina e, em particular, não se descreve a interferência
entre átomos diferentes no interior de cada instância do motivo cristalino. Pode pois
dizer-se com propriedade que a análise de Laue é uma aproximação, na qual o motivo
cristalino é encarado como um centro dispersor pontual. Desta maneira afastam-se da teoria os processos de interferência internos ao motivo, processos esses que
podem eventualmente proibir a difracção segundo algumas das direcções permitidas
pela lei de Laue. É esta a razão que nos levou a afirmar que a condição de Laue é
apenas uma condição necessária, mas não suficiente, para a difracção de radiação.
Vamos agora fazer uma análise fı́sica mais detalhada do processo de difracção
elástica de radiação por cristais, que considere estes processos de interferência internos ao motivo cristalino. A Figura 3.9 representa esquematicamente uma experiência tı́pica de difracção de raios-X(h) por um cristal. Um feixe colimado de
raios-X é dirigido a uma amostra do sólido em estudo e um detector mede a intensidade da radiação resultante em função do ângulo, 2θ, entre a direcção de incidência
e a de detecção. Por simplicidade, consideremos que a radiação incidente é monocromática, e que a fonte se encontra suficientemente afastada da amostra para que
(g) Recorde-se
que os ı́ndices acentuados h0 , k0 e l0 são os definidos nas equações (3.13).
tornarmos a discussão mais concreta, vamos nesta secção considerar, a tı́tulo de exemplo,
a difracção de raios-X. O tratamento de outro tipos de radiações é em tudo análogo, com algumas
modificações evidentes.
(h) Para
34
amostra
2θ
k
fonte
k’
r
detector
r’
O
Figura 3.9: Esquema da difracção de radiação por um sólido.
possa ser tratada como uma onda plana. Para os efeitos que nos interessam nesta
discussão, esta onda plana pode ser caracterizada indicando apenas o seu vector de
onda, k, e sua frequência angular ω. O vector de onda tem módulo 2π/λ e a direcção da propagação da onda. Assim, usando notação complexa, podemos escrever
a onda plana incidente, φi , como(i)
φi (r, t) = Ai eı(k·r−ωt)
(3.21)
√
onde ı = −1 e Ai é a amplitude da onda incidente. De acordo com o princı́pio de
Huygens, cada ponto do sólido exposto à radiação incidente é fonte secundária de
radiação, com o mesmo comprimento de onda e a mesma frequência angular, mas
com a forma de ondas esféricas, dadas em geral por
φd (r 0 , t) = A0
0
0
eı(k |r −r|−ωt)
,
|r 0 − r|
(3.22)
onde r e r 0 são os vectores posição do centro dispersor considerado e do detector,
respectivamente (ver a Figura 3.9), e k 0 = k é o módulo do vector de onda da
radiação difractada. A amplitude A0 é, em cada ponto do sólido, proporcional
ao campo electromagnético (nos casos em que o feixe é de raios-X) incidente e à
capacidade dispersora(j) , ρ(r), de forma que podemos escrever
φd (r 0 , t) = A ρ(r) eık·r
0
0
,
|r 0 − r|
(3.23)
com A constante. A radiação detectada é a resultante da composição de contribuições como a desta equação, provenientes de cada ponto do sólido exposto ao
feixe incidente. Isto é, o campo da radiação detectado no detector é dado por
Z
0
3
φd (r , t) = A
d r ρ(r)e
V
(i) Esta
ık·r
0
0
,
|r 0 − r|
(3.24)
descrição não inclui a polarização do campo electromagnético, ou a orientação do momento magnético das partı́culas que constituem os feixes corpusculares, sendo assim aplicável
apenas aos casos em que estes graus de liberdade não desempenham um papel activo.
(j) Por capacidade dispersora não se entenda nenhum conceito bem definido quantitavamente,
mas antes uma medida vaga da capacidade da matéria numa dada região do espaço produzir
desvios na direcção do feixe incidente. Na difracção de radiação electromagnética e de electrões,
por capacidade dispersora deve entender-se densidade de carga; na difracção de feixes de neutrões,
magnetização.
35
onde o integral é estendido ao volume V da região do sólido exposto ao feixe incidente e as variáveis de integração são as três componentes do vector r, como
se pretende indicar com a notação d3 r. Normalmente, as dimensões lineares da
amostra são muito menores do que a distância que a separa do detector, e portanto podemos considerar que o denominador da função integranda nesta igualdade, |r 0 − r|, é aproximadamente constante, podendo ser posto em evidência, fora
do sinal de integração. Note-se que não se podem fazer as mesmas considerações
quanto ao termo idêntico que aparece no argumento da exponencial, porque as pequenas variações nesta quantidade correspondem a variações na fase das funções
trigonométricas e essas variações, por pequenas que sejam, são importantes nos
processos de interferência. Por outro lado, também porque o detector se encontra
afastado da amostra, o vector r 0 − r é praticamente paralelo ao vector k0 e portanto
o produto dos módulos destes dois vectores é practicamente igual ao seu produto interno, k 0 |r 0 − r| ≈ k0 · (r 0 − r). Assim, podemos escrever o campo electromagnético
que atinge o detector como
Z
0
0
0
A
φd (r 0 , t) = 0
d3 r ρ(r) eık ·r eı[k ·(r −r)−ωt]
|r − r| V
Z
0 0
A
(3.25)
= 0
eı[k ·r −ωt]
d3 r ρ(r) e−ı∆k·r ,
|r − r|
V
com ∆k = k0 − k. A parte relevante para o estudo da interferência da radiação
emitida por cada porção de sólido é o integral sobre todo o volume do sólido V, que
representaremos por H(∆k); os factores no exterior são factores globais, que descrevem fenómenos triviais como o da diminuição da intensidade do feixe difractado
com o aumento da distância que separa a amostra do detector, sem grande interesse
nesta discussão. Restringindo a discussão aos casos, que mais nos interessam, em o sólido difractor
r’
é cristalino, o cálculo do integral pode ser simpliR hkl
ficado fazendo uma partição do volume de integração e considerando separadamente os volumes
r
de cada célula unitária primitiva do cristal. Assim,
O
temos
Z
H(∆k) ≡
d3 r ρ(r) e−ı∆k·r
V
XZ
0
(3.26)
=
d3 r 0 ρ (r 0 + Rhkl ) e−ı∆k·(r +Rhkl ) ,
Vcup
hkl
onde os integrais são agora extendidos apenas ao volume de cada célula unitária
Vcup , e Rhkl é um vector da rede, com componentes cristalográficas hkl. Mas a
densidade electrónica deve ser uma função com a periodicidade do cristal, de forma
que ρ (r 0 + Rhkl ) = ρ(r 0 ), e assim
Z
X
0
d3 r 0 ρ (r 0 ) e−ı∆k·r .
H(∆k) =
e−ı∆k·Rhkl
(3.27)
Vcup
hkl
O valor do integral, que é uma função da variação do vector de onda da radiação,
depende fortemente da distribuição de cargas no interior do motivo cristalino. A
esta função, que representamos por F (∆k), dá-se o nome de factor de estrutura.
Explicitando o desenvolvimento de Rijk como combinação linear inteira dos vectores
fundamentais da rede cristalina, obtemos
X
X
X
H(∆k) = F (∆k)
e−ıh∆k·a
e−ık∆k·b
e−ıl∆k·c .
h
k
l
36
Estes somatórios são progressões aritméticas, facilmente calculáveis. Considerando
que a amostra contém N células unitárias primitivas ao longo dos três eixos cristalográficos, temos
H(∆k) = F (∆k)
N
−1
X
−1
−1
£ −ı∆k·a ¤h NX
£ −ı∆k·b ¤k NX
£ −ı∆k·c ¤l
e
e
e
,
h=0
k=0
l=0
mas cada um dos somatórios é dado por
N
−1
X
e−ın∆k·v
e−ıN ∆k·v − 1
e−ı∆k·v − 1
"
#
N
N
N
e−ı 2 ∆k·v e−ı 2 ∆k·v − eı 2 ∆k·v
=
n=0
=
1
e−ı 2 ∆k·v
N
e−ı 2 ∆k·v
=
1
e−ı 2 ∆k·v
1
"
1
e−ı 2 ∆k·v − eı 2 ∆k·v
#
sin( N2 ∆k · v)
,
sin( 21 ∆k · v)
onde v é um dos vectores fundamentais a, b ou c, de forma que se obtém
#
"
N
e−ı 2 ∆k·a sin( N2 ∆k · a)
H(∆k) = F (∆k) −ı 1 ∆k·a
sin( 12 ∆k · a)
e 2
#
#
"
"
N
N
e−ı 2 ∆k·b sin( N2 ∆k · b) e−ı 2 ∆k·c sin( N2 ∆k · c)
.
1
1
e−ı 2 ∆k·b sin( 12 ∆k · b) e−ı 2 ∆k·c sin( 12 ∆k · c)
(3.28)
(3.29)
Como já se disse, a informação recolhida pelo detector é a intensidade do feixe
difractado, que é igual ao quadrado do módulo do campo electromagnético. Assim,
estamos de facto interessados no quadrado do módulo de H(∆k), que é dado por
2
2
|H(∆k)| = |F (∆k)| sN (∆k · a) sN (∆k · b) sN (∆k · c),
(3.30)
com
sN (x) =
sin2 ( 12 N x)
.
sin2 ( 12 x)
(3.31)
Na Figura 3.10 apresentam-se gráficos da função sN (x) para N = 10 e N = 100.
Como se pode verificar, para além da intensidade dos picos aumentar com N , as
suas larguras diminuem e a função sN (x) aproxima-se a uma função delta de Dirac
para valores de x = 2nπ. Uma amostra tı́pica tem aproximadamente 108 células
unitárias, logo é de esperar que existam picos de difracção intensos quando se satisfaçam simultaneamente as seguintes condições
∆k · a =
2πh
∆k · b = 2πk
∆k · c = 2πl,
(3.32)
onde h, k e l são números inteiros quaisquer. Mas estas condições não são mais que
as condições de Laue para a difracção! Quando isolámos as contribuições do motivo
cristalino no factor de estrutura, os termos que não foram aı́ integrados tinham
que estar relacionados com a condição de Laue, que, ao fim ao cabo, considera
o processo de difracção fazendo simplificações apenas ao nı́vel dos processos que
ocorrem dentro do motivo cristalino.
37
100
80
N=10
60
s(x)
40
20
0
−π
0
π
x=
0
π
x=
1
2
∆ k·r
10000
N=100
8000
6000
s(x)
4000
2000
0
−π
1
2
∆ k·r
Figura 3.10: A intensidade dos picos secundários diminui quando N aumenta.
Analisemos agora o factor de estrutura, dado por
Z
F (k) =
d3 r ρ (r) e−ık·r .
(3.33)
Vcup
Podemos simplificar o integral fazendo uma partição do volume da célula unitária
primitiva nas zonas que estão na proximidade de cada átomo do motivo cristalino;
obtemos então
XZ
0
F (k) =
d3 r 0 ρ(r 0 + Rm ) e−ık·(r +Rm )
m
=
X
Vm
Z
0
d3 r 0 ρ(r 0 + Rm ) e−ık·r ,
e−ık·Rm
(3.34)
Vm
m
onde os vectores Rm é o vector posição do núcleo atómico do m-ésimo átomo e r 0 é
o vector representado na Figura 3.11, cujas componentes são as novas variáveis de
integração. Usando o centro de cada átomo como origem do sistema de coordenadas
nas integrações, resulta por fim
Z
X
0
d3 r 0 ρ(r 0 ) e−ık·r .
(3.35)
e−ık·Rm
F (k) =
m
Ao integral
Vm
38
r’
Ri
r
O
Figura 3.11: Volume de uma célula unitária primitiva com três átomos, dividida nas
regiões próximas de cada átomo.
Z
d3 r ρ(r) e−ık·r ,
=m (k) =
(3.36)
Vm
que é essencialmente a transformada de Fourier da densidade de carga, dá-se o nome
de factor de forma atómico. Podemos voltar agora à Eq. (3.27) e escrever que a
difracção é possı́vel nas direcções permitidas pela condição de Laue (a soma em hkl
na eq. (3.27) garante-o) e a sua intensidade é proporcional ao quadrado do módulo
do factor de estrutura, que é dado por
X
F (∆k) =
=m (∆k)e−ı∆k·Rm
(3.37)
m
PROBLEMAS
3.1 Prove que os volumes das células unitárias de uma dada rede (τ ) e da sua rede
recı́proca (τ ∗ ) se relacionam através de
τ∗ =
(2π)3
τ
3.2 Prove que a recı́proca da rede recı́proca de uma dada rede é esta rede.
3.3 Mostre que a rede recı́proca de uma rede cúbica de faces centradas é uma rede
cúbica de corpo centrado.
3.4 Qual é então a recı́proca de uma rede cúbica de corpo centrado?
3.5 Determine e classifique a rede recı́proca de cada uma das seguintes redes
(a) hexagonal;
(b) ortorrômbica;
(c) tetragonal.
3.6 Considere uma rede trigonal. Seja θ o ângulo entre os seus vectores fundamentais
primitivos. Prove que a rede recı́proca também é trigonal e que o ângulo θ∗ entre
os seus vectores fundamentais primitivos é dado por
cos θ∗ = −
cos θ
.
1 + cos θ
3.7 Determine os ângulos que a radiação difractada pode fazer com a incidente,
numa experiência de difracção de raios-X com comprimento de onda λ = 1, 04 Å,
incidindo numa rede rede cúbica simples, com parâmetro a = 4, 0 Å.
3. Problemas
39
3.8 Numa experiência de difracção, onde raios-X com comprimento de onda λ =
1, 0 Å incidem sobre um cristal monoatómico com rede cúbica simples, o primeiro
máximo de difracção faz com a direcção da radiação incidente um ângulo θ =
16, 4◦ . Determine o valor do parâmetro a da rede cristalina.
3.9 Prove que o factor de forma atómico de um átomo que contém n electrões com
uma densidade de probabilidade constante numa esfera de raio R é dado pela
expressão
3n
=(∆k) = 3 3 [sin(∆kR) − R∆k cos(∆kR)]
R ∆k
(a) Determine o factor de forma para valores do ângulo de difracção 2θ = 5◦ ,
60◦ , 90◦ e 180◦ . Considere que o raio R = 2, 5 Å , λ = 2, 0 Å e que a esfera
contém 10 electrões.
(b) Mostre que a Figura representa graficamente a função |=|2 . O que pode
concluir relativamente à intensidade de difracção em função das condições
experimentais e do “raio atómico”.
1
0.8
0.6
|ℑ|
2
0.4
0.2
0
0
2
4
6
8
∆k R
3.10 A função de onda de um electrão no estado fundamental de um átomo de hidrogénio é dada por (orbital radial s),
ψ(r) = πao 3
− 12
− ar
e
o
,
onde ao é o raio atómico de Bohr. Determine o factor de forma atómico.
3.11 Determine o factor de estrutura de uma rede cúbica de corpo centrado e de uma
rede cúbica de faces centradas, associando a cada ponto de rede numa célula
unitária convencional um factor de forma “atómico”.
3.12 Construa uma tabela onde apresente os ângulos de difração de radiação por uma
rede cúbica simples, ordenados de forma crescente. Indique na tabela quais os
máximos que não são observados em experiências de difracção com redes cúbicas
de corpo centrado e de faces centradas.
3.13 Suponha que dois átomos da base de uma estrutura “zinc blende”têm factores de
forma atómico =a e =b , respectivamente.
(a) Obtenha uma expressão para o factor de estrutura em função dos ı́ndices
(hkl) duma rede cúbica simples.
(b) Mostre que o factor de estrutura, F , é
0
se h, k e l não forem simultaneamente números pares
ou ı́mpares,
4(=a + =b )
se h + k + l = 4n,
4(=a − ı=b ) se h + k + l = 4n + 1,
4(=a − =b )
se h + k + l = 4n + 2,
4(=a + ı=b ) se h + k + l = 4n + 3,
40
onde n é um número inteiro qualquer.
3.14 Determine a expressão para o factor de estrutura F associado a uma estrutura
hexagonal compacta ideal, usando os ı́ndices da estrutura primitiva. Suponha que
os dois átomos da base têm o mesmo factor de forma atómico, =, independente
de ∆k e classifique por ordem crescente de intensidade os picos de difracção
associados aos planos: (100), (110), (111), (1̄11), (210) e (211).
3.15 Um cristal tetragonal é preparado para uma experiência de difracção usando o
método de Debye com um comprimento de onda de raios-X de λ = 1, 54 Å. A
célula convencional tem uma base quadrada de a = 3, 20 Å e altura c = 4, 63 Å.
(a) Determine os três primeiros ângulos de difracção.
(b) Se a base consiste num átomo de um tipo no centro da célula e um outro
diferente num dos vértices, classifique por ordem de intensidades os picos
de difracção relativos ao ângulos da alı́nea anterior. Assuma que ambos
factores de forma atómicos são reais e têm o mesmo sinal.
3.16 Partindo da condição de Laue para a difracção, prove que:
k · G = − 1 |G|2 .
2
Capı́tulo 4
Vibrações em cristais
Nos capı́tulos anteriores foi apresentado um modelo dos sólidos cristalinos segundo
o qual os átomos que os formam encontram-se em repouso nas posições determinadas pela rede e motivo cristalinos. No entanto, esta suposição da imobilidade é
uma simplificação grosseira da realidade que apresenta, entre outros, os seguintes
inconvenientes:
• A temperatura de um objecto pode ser encarada como uma medida da energia
cinética associada ao movimento microscópio dos átomos que o constituem.
Supondo os átomos em repouso esta associação é impossı́vel.
• O som consiste em ondas mecânicas, isto é, variações infinitesimais na posição
dos átomos que se transmitem aos átomos vizinhos, propagando-se desta forma
nos meios materiais. Aceitando a hipótese da imobilidade dos átomos nos
sólidos cristalinos, estes deveriam ser isoladores sonoros, o que claramente,
não se verifica.
• O argumento que acabamos de desenvolver aplica-se também à condução de
calor.
Muitos outros argumentos desta natureza poderiam ainda ser apresentados (ver,
por exemplo, o Cap. 21 do Ashcroft & Mermin). Independentemente destas razões,
devemos compreender que o modelo estático dos cristais é uma impossibilidade
teórica do ponto de vista quântico, por violar o princı́pio de incerteza de Heisenberg.
Com efeito, quanto maior for a precisão com que definimos as posições dos átomos
no cristal, menor é a precisão com que podemos conhecer as suas quantidades de
movimento, e portanto menos razoável é supô-los em repouso (p = 0).
Neste capı́tulo, vamos melhorar este modelo dos sólidos, abandonando a hipótese
da imobilidade atómica. Na nova descrição dos sólidos, considera-se que as posições
definidas pela sua estrutura microscópica são as posições de equilı́brio dos átomos
que lhes correspondem, mas supõe-se que são possı́veis pequenos deslocamentos
dessas posições, que são contrariados pelas forças interatómicas responsáveis pela
coesão do sólido.
4.1
A aproximação harmónica
A interacção de cada átomo com os restantes átomos num sólido manifesta-se na
forma de uma energia potencial φ(r), que apresenta um valor mı́nimo quando esse
átomo se encontra na sua posição de equilı́brio (ver a Figura 4.1). Considerando
pequenos deslocamentos δr = r − R desta posição, podemos aproximar a energia
41
42
CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS
φ
X
x
Figura 4.1: A energia potencial de um átomo de um sólido é mı́nima na sua posição
de equilı́brio.
potencial pelo seu desenvolvimento de Taylor de segunda ordem
i
1 h
2
φ(r) ' φ(R) + δr · [∇φ(r)]R +
(δr · ∇) φ(r) .
2!
R
(4.1)
O primeiro termo, de ordem zero em δr, é uma constante, e como tal não desempenha qualquer papel na dinâmica do sólido; representa a contribuição do átomo
considerado para a energia de ligação do sólido. O termo de primeira ordem é nulo,
uma vez que é proporcional ao gradiente da energia potencial do átomo, calculado
na sua posição de equilı́brio, onde a energia potencial apresenta um valor mı́nimo.
Finalmente, o termo de segunda ordem pode ser escrito como
(2)
φ
· 2 ¸
3
1 X
∂ φ
(r) =
δxi
δxj
2! i,j=1
∂xi ∂xj R
=
3
1 X
δxi Kij δxj ,
2 i,j=1
(4.2)
com
·
Kij =
∂2φ
∂xi ∂xj
¸
R
A Eq. (4.2) é a expressão mais geral para a energia potencial num oscilador harmónico tri-dimensional(a) . Assim, se limitarmos o nosso estudo às vibrações de pequena
amplitude, podemos tratar as interacções entre os átomos como interacções elásticas,
o que permite, como veremos, grandes simplificações.
Antes de iniciarmos o estudo das vibrações em cristais, vamos abordar o problema, mais simples, das vibrações em meios sólidos contı́nuos.
4.2
Ondas mecânicas em meios contı́nuos
Vamos iniciar o estudo das vibrações nos sólidos através da análise de um problema
unidimensional. Consideremos uma barra cilı́ndrica com comprimento L e secção
(a) Note-se que como K
ij é uma matriz simétrica, é possı́vel escolher um sistema de coordenadas
x0 y 0 z 0 no qual a matriz K é diagonal. Usando esse sistema de coordenadas, o termo de segunda
ordem na energia potencial fica φ(2) (r ) = Kxx (δx0 )2 /2 + Kyy (δy 0 )2 /2 + Kzz (δz 0 )2 /2, que representa a energia total de um sistema de três osciladores harmónicos independentes, com constantes
elásticas Kxx , Kyy e Kzz .
4.2. ONDAS MECÂNICAS EM MEIOS CONTÍNUOS
43
x
x
u
Figura 4.2: Barra longitudinal sob tensão.
F(x)
F(x+δx)
x
x
δx
Figura 4.3: Forças sobre uma porção de barra com comprimento δx.
transversal com área S, constituı́da por um meio contı́nuo, homogénio e isotrópico
com densidade ρ, sujeita a uma tensão σ(x, t), que se manifesta no aparecimento de
forças longitudinais F (x, t). Sob a acção destas forças, a barra deforma-se longitudinalmente, isto é, cada secção transversal da barra sofre um deslocamento u(x, t),
relativamente à sua posição de equilı́brio na ausência de tensões, na direcção do
comprimento da barra (ver a Figura 4.2). A deformação da barra está relacionada
com a função dos deslocamentos u(x, t), mas não directamente. Com efeito, uma
situação em que u(x, t) tem o mensmo valor em todos os pontos da barra não corresponde a uma deformação, mas sim a um deslocamento rı́gido longitudinal da
barra. Para medir as deformações, introduz-se então a seguinte função de extensão:
²(x, t) =
∂u
.
∂x
(4.3)
Quando os deslocamentos são suficientemente pequenos é válida a aproximação
elástica, em que se verifica uma proporcionalidade simples entre a tensão σ(x, t) e
a extensão ²(x, t), em cada ponto da barra e em cada instante,
σ(x, t) = −Y ²(x, t),
(4.4)
onde o coeficiente de proporcionalidade, Y , tem o nome de módulo de Young. Esta
igualdade tem o nome de Lei de Hooke e a partir dela é possı́vel (por integração no
volume da barra) deduzir a conhecida expressão da força como função da elongação
numa mola elástica.
Quando a barra está deformada, verifica-se a existência de forças entre porções
contı́guas da barra, forças essas que contrariam a deformação. A tensão em cada
ponto define-se como a força por unidade de área. Assim, duas porções contı́guas
da barra separadas por uma secção transversal com abcissa x exercem, uma sobre
a outra, uma força cujo módulo é, no instante t,
F (x, t) = Sσ(x, t),
onde S é, recorde-se, a área da secção transversal da barra.
Consideremos agora uma porção de barra limitada por duas secções transversais
infinitamente próximas, com abcissas x e x + δx (ver a Figura 4.3). Esta porção de
44
barra está sujeita a duas forças de tensão, cujas componentes segundo a direcção
longitudinal são dadas por
F (x, t)
F (x + δx, t)
= Sσ(x, t)
= −Sσ(x + δx, t) ≈ −S[σ(x, t) +
∂σ
δx]
∂x
A resultante destas duas forças é
∂σ
δx
∂x
∂2u
= SY
δx,
∂x2
δF (x, t) = −S
(4.5)
onde se usou já a lei de Hooke da Eq. (4.4). De acordo com a Lei Fundamental da
Dinâmica, esta força deve ser igual ao produto da massa da porção de barra em
estudo pela sua aceleração. A massa da porção considerada é facilmente calculada
a partir da densidade, ρ, como
dM = ρdV = ρSδx,
ao passo que a sua aceleração é, por definição, a dupla derivada temporal do deslocamento, ou seja,
· 2 ¸
∂ u
a(x, t) =
.
∂t2 (x,t)
Temos então, usando estas duas igualdades e a expressão da força [Eq. (4.5)], que
∂2u
∂2u
=ρ 2.
2
∂x
∂t
(4.6)
∂ 2u
1 ∂ 2u
=
,
∂x2
vf2 ∂t2
(4.7)
Y
ou, finalmente,
com vf2 = Y /ρ, que é a conhecida equação de onda a uma dimensão(b) , que descreve uma onda que se propaga com velocidade vf . Podemos pois concluir que a
deformação se propaga longitudinalmente ao longo da barra, com uma velocidade
s
Y
vf =
.
(4.8)
ρ
Existem vários métodos para a resolução das equações diferenciais do tipo da
Eq. (4.7). Vamos aqui fazer um estudo das suas soluções recorrendo à análise
de Fourier, que nos permite exprimir qualquer movimento periódico como uma
sobreposição de movimentos harmónicos simples. Esta abordagem tem a vantagem
de pôr em evidência, de forma simples, as propriedades fı́sicas das soluções.
A função u(x, t) está definida apenas no interior do sólido, que tem comprimento
L. Escolhendo a origem das coordenadas numa extremidade do sólido, podemos
dizer que u está definida no intervalo x ∈ [0, L]. O desenvolvimento em séries de
Fourier é possı́vel apenas para funções periódicas, e nada nos garante que u(x, t) seja,
no intervalo [0, L], periódica. Mas é fácil construir uma função U (x, t), definida para
todos os valores de x, periódica com perı́odo L, e que tenha, nos pontos do intervalo
[0, L] o mesmo valor que u(x, t). Basta “copiar” u(x, t), do intervalo [0, L], para
os intervalos [−2L, −L], [−L, 0], [0, L], [L, 2L], etc, como mostra a Figura 4.4. As
(b) Ver qulaquer texto de fı́sica elementar, como o Nussensweig (Vol. 2), o Hallyday & Resnick
(Vol. 2), o Alonzo & Finn, etc.
45
U(x,t)
u(x,t)
x
0
L
x
-2L
0
-L
L
2L
3L
Figura 4.4: Continuação analı́tica de uma função definida no intervalo [0, L] a toda
a recta real.
duas funções u e U são matematicamente diferentes, mas fisicamente indistinguı́veis,
sendo pois aceitável, deste ponto de vista, fazer o desenvolvimento da função U , e
considera-lo o da função u.
O carácter periódico de U traduz-se matematicamente por
U (x + L, t) = U (x, t).
(4.9)
Particularizando para x = 0, vem
U (L, t) = U (0, t),
(4.10)
u(L, t) = u(0, t).
(4.11)
ou, porque nestes pontos U = u,
Assim, por forma a que a análise de Fourier das soluções seja simplificada, iremos
procurar soluções da Eq. (4.7), que satisfaçam, na fronteira do sólido, a condição (4.11). Condições fronteira do tipo da expressa em (4.11) chamam-se condições
fronteira periódicas. Com esta continuação analı́tica a toda a recta real, construimos
uma função periódica de perı́odo L, que pode, portanto, ser desenvolvida em série
de funções trigonométricas, através de(c)
X
u(x, t) =
ak (t)eikx .
(4.12)
k
Os coeficientes ak (t) deste desenvolvimento são funções do tempo que dependem,
obviamente, da função a desenvolver u(x, t). Apenas para ilustrar com um exemplo,
é fácil provar (faça-o) que, uma vez que o deslocamento u(x, t) é uma função real,
então os coeficientes devem satisfazer a condição ak (t) = a∗−k (t) , onde o asterisco
representa a operação de conjugação complexa. Estudaremos mais à frente alguns
detalhes adicionais da determinação dos coeficientes de Fourier.
Como se disse, o ı́ndice k no somatório da Eq. (4.12) não é um ı́ndice inteiro.
Sendo assim, não sabemos ainda como calcular a soma da série. Substituindo na
Eq. (4.9) a forma geral da solução da Eq. (4.12), obtemos
X
£
¤
ck (t)eikx eikL − 1 = 0.
k
Para que esta igualdade se verifique para todos os valores de x no intervalo de [0, L],
é necessário garantir que para todos os valores de k, se tenha exp(ikL) = 1, ou seja,
k=
(c) Note-se
2π
n,
L
n = 0, ±1, ±2, ... .
(4.13)
que nesta expressão k não é um ı́ndice inteiro, mas sim o número de onda da vibração
particular ak (t)eikx ; o lado direito desta expressão deve ler-se “soma para todos os valores possı́veis
do número de onda k, de ak (t)eikx ”.
46
Assim, notamos que a imposição de condições fronteira às soluções da equação de
onda, restringe fortemente os valores que o número de onda pode tomar.
Agora que conhecemos os valores possı́veis para o número de onda das componentes monocromáticas das vibrações de um meio unidimensional com comprimento
L, voltemos a atenção de novo para o cálculo dos coeficientes ck (t). Usando o desenvolvimento da Eq. (4.12) é imediato verificar que
X d2 ck (t)
∂ 2 u(x, t)
∂t2
=
∂ 2 u(x, t)
∂x2
= −
dt2
k
X
eikx
k 2 ck (t) eikx
k
Substituindo agora estes resultados na equação de onda [Eq. (4.7)], resulta
¸
X·
d2 ck (t) ikx
2 2
vf k ck (t) +
e
= 0,
dt2
k
tendo-se se usado a velocidade de propagação, definida na Eq. (4.8). Também aqui
se aplica o argumento de que a única maneira de garantir que esta soma se anule
para todos os valores de x, consiste em impor
vf2 k 2 ck (t) +
d2 ck (t)
= 0.
dt2
Esta equação diferencial admite soluções do tipo
ck (t) = ak e−iωk t ,
desde se verifique a igualdade
ωk = vf k.
(4.14)
A quantidade ωk que acabámos de introduzir é a frequência a angular da componente
monocromática com número de onda k. A relações entre a frequência angular e
o número de onda como a da Eq. (4.14) dá-se o nome de relações de dispersão.
Podemos então escrever o desenvolvimento em série de Fourier das soluções da
equação de onda como
X
u(x, t) =
ak ei(kx−ωk t) .
(4.15)
k
Conhecida a fução de deslocamento u(x, t), os coeficientes ak podem ser determinados como (verifique)
1
ak =
L
Z
L
dxu(x, t)e−i(kx−ωk t) .
0
A dedução da equação de onda [Eq. (4.7)] não é, de forma alguma, geral. Se
tivéssemos considerado deformações transversais, terı́amos obtido a equação de
onda para ondas transversais, que envolve outros coeficientes elásticos, diferentes
do módulo de Young Y . Assim, a velocidade de fase vf das ondas transversais pode
ser diferente da das ondas longitudinais.
Neste estudo, considerámos pequena a distância, δx, entre as duas secções que
limitam a porção de meio considerado, por forma a permitir a aproximação
∂F
F (x) − F (x + δx)
=
,
δx
∂x
(4.16)
47
que só é verdade se δx for pequeno quando comparado com as distâncias envolvidas em variações apreciáveis de F . Uma medida destas distâncias é, para ondas
monocromáticas, o comprimento de onda. Assim, a nossa dedução é válida se
δx ¿ λ.
(4.17)
Supor a distância δx pequena não é, por si só, uma aproximação, uma vez que se
trata de um parâmetro arbitrário numa construcção abstracta. No entanto, neste
cálculo desprezou-se a estrutura atómica do sólido (uma vez que o tratámos como
um meio contı́nuo), e isto só é razoável se apenas se considerarem distâncias muito
superiores àquelas em que essa estrutura microscópica se torna evidente, ou seja,
distâncias muito superiores às distâncias interatómicas tı́picas. Assim, devemos
satisfazer
δx À a,
(4.18)
onde a é o parâmetro da rede cristalina. Conjugando (4.17) e (4.18) concluimos que
o tratamento realizado só é válido para comprimentos de onda muito maiores que
as distâncias interatómicas tı́picas.
4.2.1
Vibrações de um meio contı́nuo tridimensional
Vamos agora generalizar o estudo precedente para o caso mais geral das vibrações
de um sólido tridimensional. Consideremos um sólido com a forma de um paralelipı́pedo com lados Lx , Ly e Lz , que consideraremos homogénio e isotrópico. Sujeito
a tensões, este sólido deforma-se, isto é, cada ponto do sólido sofre um deslocamento
u(r, t) relativamente à posição que ocupava antes da acção das tensões deformadoras. No regime das deformações elásticas (quando os deslocamentos são pequenos),
a deformação em cada ponto é proporcional à tensão nesse ponto e assim, se se
repetir o formalismo desenvolvido no caso unidimensional, obtêm-se as equações
de onda destas vibrações tridimensionais, em tudo semelhantes à da Eq. (4.7). No
entanto, apesar destas semelhanças, há um pormenor importante que complica ligeiramente o problema no caso tridimensional. É que num meio tridimensional
isotrópico podem-se considerar dois tipos diferentes de tensões, que produzem dois
tipos diferentes de deformações: há as tensões de compressão, que levam uma porção
do meio a “empurrar” as porções contı́guas, e há as de corte que levam uma porção
do meio a deslizar sobre as demais. As tensões de compressão são as responsáveis
pela propagação de vibrações longitudinais, ao passo que as de corte estão envolvidas na propagação das vibrações transversais. Em ambos os casos, as deformações
são proporcionais às tensões correspondentes, mas as constantes de proporcionalidade (chamam-se módulos elásticos na linguagem da fı́sica dos meios contı́nuos) são
diferentes, o que se traduz em diferentes velocidades de propagação para as ondas
logitudinais e transversais. Assim, em vez de apenas uma, devemos considerar duas
equações de onda, cada uma para cada tipo de vibração(d)
(d) Se
∇2 ul (r, t) −
1 ∂ 2 ul (r, t)
=0
vl2
∂t2
(4.19)
∇2 ut (r, t) −
1 ∂ 2 ut (r, t)
= 0.
vt2
∂t2
(4.20)
o meio não for isotrópico, o problema complica-se ainda mais, uma vez que então há três
tipos fisicamente distintos de polarização das vibrações, e a própria velocidade de propagação de
cada tipo de vibração pode ainda depender da direcção de propagação.
48
Estas equações de onda admitem soluções com a forma de sobreposições de ondas
planas monocromáticas
ul (r, t) =
X
A(k)ei(r·k−ωt)
(4.21)
B(k)ei(r·k−ωt) ,
(4.22)
k
ut (r, t) =
X
k
mas os dois tipos de polarização (longitudinal e transversal) devem satisfazer relações de dispersão diferentes, por serem diferentes as suas velocidades. Nestas expressões, A(k) e B(k) são dois vectores, o primeiro paralelo e o segundo perpendicular a k, mas que, aparte esta condição são arbitrários. São os transformados de
Fourier dos vectores de deslocamento ul e ut , respectivamente.
Tal como no caso unidimensional, também aqui as decomposições da deformação
como séries de Fourier discretas, apresentadas nas equações (4.21) e (4.22), são
possı́veis apenas para funções periódicas. Para garantir a periodicidade da deformação, introduzimos de novo condições fronteira periódicas, que se devem agora
verificar segundo as três direcções ortogonais. Isto é, devemos garantir que
u(x, y, z, t) = u(x + Lx , y, z, t)
= u(x, y + Ly , z, t)
= u(x, y, z + Lz , t),
(4.23)
(4.24)
(4.25)
o que resulta, ao nı́vel das ondas planas monocromáticas, numa discretização dos
vectores de onda, apenas se aceitando aqueles que verificam
2nπ
,
Lx
2mπ
ky =
,
Lx
2lπ
kz =
,
Lx
kx =
n = 0, ±1, . . .
(4.26)
m = 0, ±1, . . .
(4.27)
l = 0, ±1, . . . .
(4.28)
Os vectores de onda dos modos de vibração possı́veis num sólido contı́nuo com
forma paralelipipédica dispõem-se assim numa rede cristalina ortorrômbica com
vectores fundamentais que, escolhendo uma base convenientemente orientada, se
podem escrever como
2π
ex
Lx
2π
ey
B=
Ly
2π
ez .
C=
Lz
A=
(4.29)
(4.30)
(4.31)
Recordemo-nos mais uma vez que por cada um destes vectores de onda permitidos há três modos de vibração, que correspondem cada um a cada uma das três
polarizações possı́veis para uma vibração num sólido tridimensional.
Como no caso unidimensional, a aproximação de sólidos contı́nuos só é razoável
se se considerarem apenas distâncias muito superiores às distâncias interatómicas
tı́picas. Assim, este estudo só é válido no limite de grandes comprimentos de onda.
Vamos agora tentar descrever oscilações com comprimentos de onda da ordem de
grandeza das distâncias interatómicas.
4.3. VIBRAÇÕES DE UM MEIO CRISTALINO
4.3
49
Vibrações de um meio cristalino
As propriedades vibracionais de um cristal tridimensional são qualitativamente semelhantes às de um cristal unidimensional. Assim, uma abordagem unidimensional
é bastante instrutiva, na medida em que permite obter com facilidade resultados que
constituem versões simplificadas dos de um estudo mais geral mas que, apesar disso,
ilustram igualmente os principais efeitos fı́sicos das vibrações de um meio corpuscular. Por esta razão limitamos, nestes apontamentos, o estudo analı́tico detalhado
das vibrações em cristais a problemas unidimensionais. O leitor interessado pode (e
deve) complementar a leitura destes apontamentos com a dos textos recomendados.
4.3.1
Vibrações de uma cadeia monoatómica linear
Um cristal monoatómico unidimensional consiste num conjunto de átomos idênticos,
com movimentos de oscilação (consideramos apenas oscilações longitudinais, isto é,
com a direcção do próprio cristal) em torno de posições de de equilı́brio que se
dispõem alinhadas numa recta, igualmente espaçadas entre si. Identificando com
a coordenada x a posição nesta recta, e numerando vários átomos com ı́ndices
0, ±1, ±2, ... ± n, ..., podemos escrever a coordenada Xn da posição de equlı́brio do
n-ésimo átomo na forma
Xn = na,
(4.32)
onde a é a distância interatómica (é o parâmetro desta rede cristalina unidimensional) e a origem x = 0 foi escolhida por forma a coincidir com a posição do
0-ésimo átomo (ver a Figura 4.5). Os átomo oscilam em torno das suas posições de
-3a
-2a
-a
0
a
2a
3a
Figura 4.5: Modelo harmónico de rede cristalina de um cristal unidimensional.
equilı́brio, e assim, em geral, as posições que ocupam não são coincidentes com as
suas posições de equilı́brio. É conveniente introduzir as variáveis un (t), que medem,
como função do tempo, as distâncias que separam os átomos das suas posições de
equilı́brio. A posição do n-ésimo átomo num instante arbitrário t é então dada por
xn (t) = Xn + un (t).
(4.33)
No quadro da aproximação harmónica, as interacções entre os átomos que formam
o cristal são consideradas interacções elásticas, ou seja, os cristais monoatómicos
unidimensionais são descritos como um conjunto de átomos iguais dispostos numa
linha recta, unidos entre si por molas microscópicas com constantes elásticas iguais
k = ∂ 2 φ/∂x2 e iguais comprimentos naturais a (ver Figura 4.6). Consideremos, num
n-2
n-1
n
n+1
n+2
Figura 4.6: Os cristais monoatómicos unidimensionais na aproximação harmónica.
cristal monoatómico unidimensional harmónico assim descrito, um átomo qualquer
n, e calculemos, num instante arbitrário t, a força que os seus vizinhos mais próximos
exercem sobre ele. O átomo n − 1 exerce sobre o átomo n uma força que, de acordo
50
com a aproximação harmónica(e) , é dada por
Fn−1,n (t) = −α [un (t) − un−1 (t)] ;
(4.34)
da mesma maneira, a força que o átomo n + 1 exerce sobre o mesmo átomo é
Fn+1,n (t) = −α [un (t) − un+1 (t)] .
(4.35)
Desprezando as forças que os restantes átomos exercem sobre o átomo n, a resultante
das forças que sobre ele actuam é
Fn (t) = α [un−1 (t) − 2un (t) + un+1 (t)] .
(4.36)
De acordo com a segunda lei de Newton, estas força é igual à massa, m, do átomo
em estudo, a multiplicar pela sua aceleração que, tendo em conta a Eq. (4.33), é
dada por an (t) = d2 un /dt2 . Obtemos então, finalmente, a equação de onda para
meios cristalinos
d2 un
α
[un−1 (t) − 2un (t) + un+1 (t)] .
=
dt2
m
(4.37)
Mais uma vez, tentamos obter soluções com a forma de sobreposições de ondas
monocromáticas
un (t) = ei(kXn −ωt) .
(4.38)
Substituindo esta funções em (4.37), obtemos
i
α h i(kXn−1 −ωt)
− ω 2 ei(kXn −ωt) =
e
− 2ei(kXn −ωt) + ei(kXn+1 −ωt)
m
¤
α i(kXn −ωt) £ −ika
=
e
e
− 2 + eika ,
(4.39)
m
onde se usou (4.33). Recorrendo agora à fórmula de Euler,
eiθ = cos θ + i sin θ,
(4.40)
é fácil provar que eiθ + e−iθ = 2 cos θ. A Eq. (4.39) pode pois escrever-se como
ω2 = 2
α
(1 − cos ka).
m
(4.41)
Notemos agora que
cos ka = cos2
ka
ka
ka
− sin2
= 1 − 2 sin2
,
2
2
2
de forma que, substituindo em 4.41, obtemos finalmente
r ¯
¯
α ¯¯
ka ¯¯
ω=2
sin
.
m¯
2 ¯
(4.42)
Esta é a relação de dispersão para os cristais unidimensionais. O gráfico da função
de dispersão (4.42) está representada na Figura 4.7. No limite de grandes comprimentos de onda, k aproxima-se de zero e a relação de dispersão fica praticamente
linear, à semelhança das relações de dispersão para as vibrações de meios contı́nuos:
r ¯ ¯
r
α ¯¯ ka ¯¯
α
|k|.
(4.43)
ω(k)k→0 −→ 2
=
a
m¯ 2 ¯
m
(e) É
trivial verificar que a força, F , deriva do potencial, F = − ∂φ
.
∂x
51
f
w=v
|
k|
w
w
m
k
−2π /a
−π /a
0
π /a
2π /a
Figura 4.7: Relação de dispersão para as vibrações num cristal monoatómico unidimensional e limite para grandes comprimentos de onda.
Este facto não nos deve espantar, pois chegamos, no estudo das vibrações dos meios
contı́nuos, à conclusão que a análise só era válida para grandes comprimentos de
onda.
A frequência máxima permitida para as vibrações longitudinais numa cadeia
monoatómica linear é
r
α
ωm = 2
.
(4.44)
m
De forma semelhante, poderı́amos concluir que para as vibrações transversais há
também uma frequência máxima, se bem que com valor diferente (normalmente inferior) do apresentado acima, caracterı́stico das longitudinais. Então, verificamos que
não é possı́vel a propagação de ondas vibracionais numa cadeia monoatómica unidimensional com frequência acima de um certo valor limite. A cadeia monoatómica
linear comporta-se assim como um filtro passa-baixo, que corta as frequências superiores ao valor máximo ωm .
Uma das principais caracterı́sticas das relações de dispersão em meios cristalinos
unidimensionais [Eq. (4.41)] é o facto de ω ser uma função periódica de k, de perı́odo
2π/a, ou seja,
µ
¶
2π
ω k+
= ω(k).
(4.45)
a
Assim, basta-nos conhecer a função ω(k) num intervalo de amplitude 2π/a, por
exemplo,
i π πi
,
(4.46)
k∈ − ,
a a
para determinar a função ω(k) para todos os valores de k. Analisando mais detalhadamente esta questão, o próprio significado fı́sico de números de onda k superiores a
π/a deve ser posto em causa. Com efeito, ondas planas com valores de k superiores
a π/a, k > π/a produzem deslocamentos idênticos aos produzidos por ondas planas
com valores de k no intervalo (4.46), que se obtêm do primeiro somando-lhe ou
subtraindo-lhe um múltiplo inteiro de 2π/a. Por exemplo, na Figura 4.8 representamos duas ondas planas monocromáticas num cristal monoatómico unidimensional
de parâmetro a, com diferentes números de onda k e k 0 , mas que produzem os mesmos deslocamentos atómicos unidimensionais, sendo pois, do ponto de vista fı́sico,
indistinguı́veis. A primeira tem comprimento de onda λ = 4a, e portanto k = π/2a;
a segunda tem k 0 = k + 2π/a = 5π/2a, e portanto λ0 = 4a/5. Os deslocamentos
52
a
k= π /2a
λ = 4a
k´=5 π /2a
λ ´= 4a/5
Figura 4.8: Deslocamentos atómicos idênticos, produzidos por duas ondas planas com
diferentes valores do número de onda. Valores de k superiores π/a não têm significado
fı́sico.
atómicos são, como podemos verificar, os mesmos; assim as duas ondas são indistinguı́veis e portanto nunca é necessário considerar o valor k 0 = 5π/2a, por este ser
equivalente a k = k 0 − 2π/a = π/2a.
Note-se que a rede recı́proca de uma rede unidimensional de parâmetro a é uma
rede unidimensional de parâmetro A = 2π/a. Uma célula unitária de Wigner-Seitz
(veja a Secção 2.2) da rede recı́proca deste cristal é uma porção de espaço-k compreendida entre −A/2 e A/2, ou seja, −π/a e π/a. Dá-se o nome de primeira zona de
Brillouin à célula unitária de Wigner-Seitz da rede recı́proca. O que acabámos de
ver foi que podemos restringir a relação de dispersão à primeira zona de Brillouin,
pois os valores de k no seu exterior produzem efeitos equivalentes, dada a periodicidade da relação de dispersão. Esta periodicidade pode ser expressa na forma
ω(k) = ω(k + G),
(4.47)
onde G é um “vector”(f) da rede recı́proca.
Valores de k na fronteira da primeira zona de Brillouin estão associados a ondas
estacionárias. De facto, quando k = ±π/a o deslocamento toma a forma
un (t)
= ei(kna−ωt)
= ei(±nπ−ωt)
= cos(nπ)e−iωt ,
(4.48)
que não é mais que a equação de uma onda estacionária onde átomos consecutivos
movem-se em oposição de fase, porque cos(nπ) = ±1 consoante o número inteiro
n é par ou impar. Como podemos verificar, não se distinguem os deslocamentos
produzidos por ondas com vector de onda k = −π/a e k = π/a, ficando assim
(f) “vector”aparece
entre aspas porque temos estado a lidar com situações unidimensionais.
53
a
a/2
A
B
A
B
Figura 4.9: Cadeia biatómica unidimensonal.
justificada a necessidade da utilização de um conjunto aberto em (4.46) para indicarmos os números de onda possı́veis na cadeia unidimensional. Podemos também
constatar o aparecimento de ondas estacionárias para k = ±π/a, através do cálculo
da velocidade de grupo,
vg
dω
dk
µ ¶
ka
a
= ω0 cos
,
2
2
=
(4.49)
que se anula quando k = ±nπ/a, sendo n um inteiro qualquer.
4.3.2
Vibrações de uma cadeia biatómica linear
Vamos agora abordar um problema um pouco mais geral que o que acabámos de
estudar, considerando agora as vibrações das cadeias biatómicas. O estudo que
vamos fazer é muito semelhante ao anterior; apesar disso, o comportamento das
cadeias biatómicas distingue-se do das cadeisas monoatómicas em alguns aspectos
bastante interessantes. Consideremos então um cristal unidimensional composto
por átomos de duas espécies A e B, e suponhamos, para simplificar, que o motivo
cristalino consiste em um átomo da espécie B situado no centro da célula unitária
definida pelas posições dos átomos da espécie A (ver a Figura 4.9). Admitimos que
os átomos podem oscilar em torno das posições de equilı́brio definidas no motivo
cristalino, mas vamos apenas considerar deslocamentos longitudinais. Para simplificar a linguagem, identicamos as as diversas instâncias do motivo cristalino através
de um número inteiro n que toma valores desde n = 0 até n = N − 1, onde N é o
número total de átomos de cada espécie. As posições de equilı́brio dos dois átomos
que constituem a n-ésima célula unitária são
Xn(A)
Xn(B)
= na
= (n + 1/2)a,
designando por a o comprimento das células unitárias e escolhendo a origem do
sistema de coordenadas coincidente com a posição de equilı́brio do átomo A da zeroésima célula unitária. Designemos os deslocamentos dos átomos A e B da n-ésima
B
célula unitária respectivamente por uA
n (t) e un (t) (ver a Figura4.10). Aceitemos a
uB
n
uA
n
uB
n-1
a/2
a/2
uA
n+1
a/2
Figura 4.10: Deslocamentos atómicos numa cadeia biatómica unidimensional.
aproximação elástica e suponhamos (para simplificar) que os parâmetros do limite
54
elástico (distância de equilı́brio, a/2, e constante elástica, α) são idênticos para
as ligações A–B e B–A(g) . Analisemos o movimento dos átomos de cada espécie
quı́mica. Considerando apenas as interacções entre vizinhos mais próximos, a força
que actua no átomo A da n-ésima célula unitária é
FnA = mA
¡
¢
d2 uA
n
A
B
= α uB
n−1 − 2un + un ,
2
dt
(4.50)
ao passo que a que actua no átomo de espécie B é
FnB = mB
¡
¢
d2 uB
n
B
A
= α uA
n − 2un + un+1 .
2
dt
(4.51)
Estas são duas equações de um sistema de 2N equações diferenciais acopladas cuja
resolução não é, na prática, viável, devido ao número muito grande de equações
que formam o sistema (tipicamente, N ≈ 1023 ). Em vez desta resolução explı́cita,
procuramos soluções com a forma de sobreposições de ondas monocromáticas
X
A
i(kXn
−ωk t)
uA
cA
(4.52)
n (t) =
ke
k
uB
n (t)
=
X
B
i(kXn −ωk t)
cB
,
ke
(4.53)
k
onde os coeficientes de amplitude dos movimentos dos átomos de espécie A, cA
k não
são, necessariamente, iguais aos dos átomos de espécie B, cB
.
Note-se
também
que,
k
como no caso monoatómico, o indı́ce k não representa um indı́ce inteiro, antes se
devendo interpretar estes dois desenvolvimentos como a “soma para todos os valores
possı́veis do número de onda k”, sendo o conjunto dos valores possı́veis por enquanto
não definido. Substituindo estes desenvolvimentos nas eqs. (4.50)e (4.51), obtemos
·
µ
¸¶
ika/2
X
+ e−ika/2
Be
A
−
c
+
2α
c
ei(kna−ωk t) −mA ωk2 cA
= 0
k
k
k
2
k
µ
·
¸¶
ika/2
X
+ e−ika/2
B
Ae
ei(kna−ωk t) −mB ωk2 cB
+
2α
c
−
c
= 0.
k
k
k
2
k
Dada a independência linear das funções exponenciais exp[i(kna − ωk t)], a única
maneira de garantir a validade destas duas igualdades em qualquer instante t é
impor que sejam nulos os coeficientes que multiplicam as exponenciais:
µ
¶
ika/2
+ e−ika/2
A
Be
−
c
−mA ωk2 cA
+
2α
c
= 0
k
k
k
2
µ
¶
ika/2
+ e−ika/2
B
Ae
−mB ωk2 cB
+
2α
c
−
c
= 0.
k
k
k
2
Usando a bem conhecida igualdade
eika/2 + e−ika/2
= cos
2
µ
ka
2
¶
,
podemos ainda reescrever estas equações como
ka B
c
2 k
= 0
(4.54)
ka A
c (2α − mB ωk ) cA
k
2 k
= 0.
(4.55)
(2α − mA ωk ) cA
k − 2α cos
−2α cos
(g) Esta suposição não é necessária para a presente discussão, mas simplifica ligeiramente o formalismo. Ver o problema 3.
55
-1
ω (s )
-π/a
-π/2a
π/2a
0
π/a
-1
k (m )
Figura 4.11: As relações de dispersão para os dois modos vibracionais (ambos longitudinais) de uma cadeia biatómica linear. A curva que tem um máximo para k = 0
respeita ao modo óptico; a outra é a do modo acústico.
Substituimos desta maneira o sistema de 2N equações diferenciais acopladas das
eqs. (4.50) e (4.51) por um conjunto de sistemas de 2 equações algébricas homogénias, como o representado acima para o modo vibracional com número de onda
k. Como se sabe das aulas de Álgebra Linear, os sistemas de equações algébricas
homogénias só tem soluções não triviais (ou seja, tais que cA,B
6= 0) se se anular o
k
determinante da matriz formada pelos coeficientes, isto é, se
¯
¯
¯ 2α − mA ω 2
¯
−2α cos ka
k
2
¯
¯
¯ −2α cos ka −2α − mB ω 2 ¯ = 0,
k
2
ou seja, se
¶
µ
ka
= 0,
mA mB ωk4 − 2α(mA + mB )ωk2 + 4α2 1 − cos2
2
ou ainda, recorrendo à igualdade fundamental da trigonometria,
mA mB ωk4 − 2α(mA + mB )ωk2 + 4α2 sin2
ka
= 0.
2
Esta equação de segundo grau (em ωk2 ) admite as seguintes duas soluções:
sµ
¶2
m
+
m
mA + mB
4
ka
A
b
2
ωk = α
±α
−
sin2
.
mA mB
mA mB
mA mB
2
(4.56)
(4.57)
Vemos assim que para cada valor de k há em geral duas frequências possı́veis , cujas
representações gráficas estão esboçadas na Figura 4.11. Uma das soluções (a que se
anula para k = 0) tem o nome de ramo acústico; a outra (que apresenta um máximo
para k = 0) designa-se por ramo óptico. A existência de dois comportamentos
vibracionais distintos, com relações de dispersão diferentes, é uma caracterı́stica
dos cristais biatómicos reais.
4.3.3
Vibrações de um cristal tridimensional
Vamos agora fazer um estudo, menos detalhado que o anterior, das vibrações num
cristal tridimensional.
As ondas planas monocromáticas em três dimensões num meio cristalino escrevem-se como
un,k (t) = A ei(k·Rn −ωt) ,
(4.58)
56
onde Rn é o vector que indica a posição de equilı́brio do átomo-n. Note-se que a
função onda é naturalmente uma grandeza vectorial cujas componentes, calculadas
no ponto correspondente à posição de equilı́brio de um dado átomo, são iguais às
componentes do deslocamento desse átomo relativamente à sua posição de equilı́brio.
Consideremos um sólido com dimensões Na a×Nb b×Nc c em que a, b e c representam
os módulos dos vectores da rede directa e Na , Nb e Nc é o número de células
unitárias em cada uma das três direcções fundamentais. Deste modo, o sólido
contém um número total de Na Nb Nc células unitárias e igual número de átomos (no
caso monoatómico que mais nos interessa aqui). As condições fronteira periódicas
para este sólido são
A ei(k·Rn −ωt)
A ei(k·Rn −ωt)
A ei(k·Rn −ωt)
= A ei(k·[Rn +Na a]−ωt) ,
= A ei(k·[Rn +Nb b]−ωt) ,
= A ei(k·[Rn +Nc c]−ωt) ,
(4.59)
de onde resultam as seguintes relações de quantização
l
Na
m
k · b = 2π
Nb
n
k · c = 2π
Nc
k · a = 2π
que são satisfeitas se
k=
l = 0, ±1, ±2, . . .
m = 0, ±1, ±2, . . .
n = 0, ±1, ±2, . . . ,
l
m
n
A+
B+
C,
Na
Nb
Nc
(4.60)
(4.61)
onde A, B e C são os vectores fundamentais da rede recı́proca do cristal em estudo,
definidos na Eq. (3.7). Os vectores de onda permitidos num cristal monoatómico
são assim vectores de uma rede relacionada com a rede recı́proca desse cristal, mas
em que os vectores fundamentais são A/Na , B/Nb e C/Nc .
Note-se que duas ondas planas com vectores de onda k e k0 cuja diferença é
um vector da rede recı́proca são equivalentes, no sentido em que os deslocamentos
atómicos associados são os mesmos. Senão vejamos; consideremos um modo de
vibração com um vector de propagação k0 = k + G em que G é um vector da rede
recı́proca. A expressão do deslocamento do n-ésimo átomo é
un,k0 (t) = A ei(k·Rn +G·Rn −ωt) = A ei(k·Rn −ωt) = un,k (t),
(4.62)
porque G · Rn é sempre um múltiplo de 2π (recordemos que Rn = n1 a + n2 b +
n3 c com n1 , n2 e n3 inteiros). Assim, verifica-se que à infinidade de vectores
de onda k dados pela Eq. (4.61) não corresponde uma infinidade de modos de
vibração fisicamente distintos. Por exemplo, apesar de serem diferentes soluções da
Eq. (4.61), os vectores de onda
k
=
k0
=
A
Na
(Na + 1)
A + B,
Na
correspondem a modos de vibração idênticos. Quando escrevemos os deslocamentos atómicos como conbinação linear de ondas planas monocromáticas, devemos ter
em atenção este facto e evitar, nos desenvolvimentos, este tipo de sobreposições.
Basta, para tal, considerar apenas vectores de onda, k, no interior de uma única
célula unitária primitiva da rede recı́proca, sendo a escolha mais usual a da célula
4.4. A DENSIDADE DE MODOS DE VIBRAÇÃO
57
de Wigner-Seitz (veja a Secção 2.2), ou seja, a primeira zona de Brillouin. Esta
restricção à primeira zona de Brillouin fica assegurada se considerarmos, na combinação linear da Eq. (4.61), inteiros n, m e l limitados aos intervalos
¸
¸
1
1
n ∈ − Na , Na
2
2
¸
¸
1
1
m ∈ − Nb , Nb
2
2
¸
¸
1
1
l ∈ − Nc , Nc .
2
2
Os números inteiros n, m, e l podem então tomar um número total de valores de
Na , Nb , Nc , respectivamente, o que implica existir um total de Na Nb Nc vectores de
propagação possı́veis, exactamente igual ao número total de átomos no sólido. Uma
vez que existem três modos de vibração para cada vector de onda (um longitudinal
e dois transversais), o número total de modos de vibração é igual ao número de
graus de liberdade no sólido, 3Na Nb Nc .
Note-se que as ondas planas monocromáticas apresentadas na Eq. (4.58) são
solução das equações de onda se satisfizerem relações de dispersão que não foram deduzidas, mas que consistem em relações mais ou menos complexas entre
a frequência ω e o vector de onda k. Na aproximação de grandes comprimentos de
onda, um cristal pode ser tratado como um meio contı́nuo, homogénio e isotrópico,
de forma que nessa aproximação, se obtêm relações de dispersão semelhantes às
já apresentadas. Mas, se quisermos melhorar a análise e considerar vibrações com
comprimentos de onda comparáveis com as distâncias interatómicas, teremos que
ver o cristal como um meio altamente anisotrópico e não homogénio. Assim, a velocidade de propagação de uma onda plana depende não só do módulo do vector de
onda como no caso unidimensional, mas também da sua polarização (e neste caso,
as situações relevantes não se reduzem às das vibrações longitudinais e transversais),
e ainda da direcção do vector de onda! A dedução geral da forma das relações de
dispersão num cristal tridimensional é assim um problema muito complexo, e que
não tem, em geral, solução analı́tica.
4.4
A densidade de modos de vibração
Como acabámos de ver, a imposição de condições fronteira restringe fortemente o
vector de onda das soluçoes das equações de onda. No caso unidimensional, de
todos os valores reais que k pode tomar, apenas se podem aceitar aqueles que
satisfazem (4.13), que aqui reescrevemos
k=
2π
n,
L
n = 0, ±1, ±2, ... .
(4.63)
Estas condições fronteira foram pela primeira vez introduzidas por Born e Von
Kármán. Podemos mais facilmente interpretá-las se imaginarmos que a cadeia linear
de átomos e molas forma uma circunferência fechada em que o primeiro átomo da
cadeia coincide com o último.
Suponhamos que estamos interessados em determinar quantos valores de k,
aceitáveis nos termos que acabámos de referir, existem num intervalo dk do “espaçok”. De acordo com (4.63), a separação entre modos de vibração contı́guos (ou seja,
entre k 0 s vizinhos) é de δ = 2π/L. O número de modos no intervalo dk é pois,
dn =
L
dk
=
dk.
δ
2π
(4.64)
58
Assim, usando a relação de dispersão (4.14) (por simplicidade, vamos para já restringir o estudo a grandes valores do comprimento de onda), este resultado pode
ser expresso em termos da frequência ω, já que
dk =
dk
1
1
dω =
dω =
dω.
dω
dω/dk
vf
(4.65)
Obtemos então dn = L/(2πvf )dω, mas este resultado ainda tem que ser multiplicado
por 2, já que a cada valor de ω correspondem dois valores de k, dados por k =
±ω/vf . Resumindo, obtemos,
L
dω.
πvf
dn =
(4.66)
Esta equação permite-nos calcular o número de modos de vibração, dn, existentes
no intervalo de frequência dω. Dá-se o nome de densidade de modos de vibração à
derivada dn/dω. Neste caso, a densidade de modos de vibração é
g(ω) =
L
.
πvf
(4.67)
Vejamos agora o caso tridimensional, aceitando ainda o limite de grandes comprimentos de onda, em que o comportamento dos cristais é semelhante ao dos
meios contı́nuos. Consideremos um sólido com forma paralelipipédica como o da
Secção 4.2.1, com dimensões Lx , Ly e Lz . As condições fronteira periódicas para
este sólido resultam nas condições de quantização apresentadas nas equações (4.26)–
(4.28), segundo as quais os vectores de onda k permitidos formam um rede cristalina definida pelos vectores apresentados em (4.29)–(4.31). Esta rede cristalina tem
células unitárias primitivas com volume (2π)3 /V , onde V = Lx Ly Lz é o volume do
sólido considerado. Assim, cada ponto desta rede (ou seja, cada vector de onda k)
tem disponı́vel o “volume” de espaço-k
δ3 =
(2π)3
.
V
(4.68)
Numa esfera de raio k, cujo volume é 4πk 3 /3, existem
n=
4
3
3 πk
3
(2π)
V
=
V
4π 3
k ,
(2π) 3
3
(4.69)
vectores de propagação permitidos. Se diferenciarmos esta equação, obtemos o
número de vectores de onda com módulo compreendido entre k e k + dk, correspondendo à zona sombreada na Figura 4.12. Obtemos assim
dn =
V 2
k dk,
2π 2
e usando a relação de dispersão de um meio contı́nuo (4.14);
dn =
V ω 2 dω
,
2π 2 vf vf
de onde resulta a seguinte expressão para a densidade de modos de vibração:
g(ω) =
V ω2
.
2π 2 vf 3
(4.70)
Note-se que nesta expressão apenas estamos a considerar que a cada valor do vector
de onda k corresponde apenas um modo de vibração. Em geral isto não é verdade,
4.4. A DENSIDADE DE MODOS DE VIBRAÇÃO
59
ky
kx
Figura 4.12: Na região a sombreado o vector de onda
entre k e k + dk.
k
tem módulo comprendido
pois devemos recordar que os deslocamentos atómicos são grandezas vectoriais, e
portanto a função de onda un,k (R, t) também o é. As componentes deste vector,
calculadas no ponto correspondente à posição de equilı́brio de um dado átomo n, são
iguais às componentes do deslocamento desse átomo relativamente à sua posição de
equilı́brio. À orientação da oscilação numa onda vibracional dá-se o nome de polarização dessa onda. Para cada vector de onda k há então três modos independentes
de oscilação, correspondendo às três direcções ortogonais do espaço. É frequente
a escolha destas direcções em função da direcção do vector k. À componente de
u na direcção de k chama-se a polarização longitudinal; às outras duas dá-se o
nome de polarização transversal (ver Figura 4.13). Tendo em linha de conta as três
u1
u
u2
uL
k
Figura 4.13: As três componentes da polarização de uma onda plana monocromática.
Dado o deslocamento u, apresentam-se a polarização logitudinal uL e as duas polarizações transversais u1 e u2 .
polarizações independentes, a Eq. (4.70) complica-se um pouco. Demonstra-se (ver
problemas) que se as três polarizações têm a mesma velocidade de fase, a densidade
de modos é tripla da dada por (4.70), isto é
g(ω) =
3V ω 2
.
2π 2 vf 3
(4.71)
Note-se que, para obtermos a densidade de modos de vibração da Eq. (4.70),
usámos a relação de dispersão da Eq. (4.14), que é válida apenas para grandes comprimentos de onda e supondo que o meio é isotrópico, de tal forma que a frequência
angular da radiação depende apenas do seu comprimento de onda, mas não da direcção de propagação. Como sabemos, os cristais não apresentam esta priopriedade,
mas, mesmo assim, a Eq. (4.70) é uma aproximação muito razoável para a densidade de modos de vibração de uma dada polarização, desde que não se considerem
comprimentos de onda comparáveis com a distância interatómica.
Por outro lado, e como já foi dito antes, as ondas transversais e longitudinais têm,
em princı́pio, e mesmo em meios homogéneos, velocidades de propagação diferentes.
60
Logo, devemos concluir que (4.71) não é, em geral, rigorosamente válida (ver o
problema 4 no fim deste capı́tulo).
Para obtemos a densidade dos meios cristalinos, devemos usar a relação de
dispersão válida em cristais, ou seja, algo que esteja mais próximo de (4.42) do que
de (4.14). Mas adaptar simplesmente a relação de dispersão (4.42) é um método
“perigoso”, pois todo este formalismo supõe o meio isotrópico. Ora um sólido só se
pode considerar isotrópico caso se despreze a sua estrutura cristalina, como deve,
nesta altura, ser claro.
4.5
O problema do calor especı́fico
O calor especı́fico molar de uma substância é o calor necessário para elevar a temperatura de uma mole dessa substância em 1◦ C. Se o processo de aquecimento for
feito a volume constante, o trabalho realizado é nulo, e portanto o calor fornecido
ao sistema é igual à sua variação de energia dE. Assim, o calor especı́fico a volume
constante é definido como
¶
µ
∂E
,
(4.72)
Cv =
∂T V
O calor especı́fico dos sólidos apresenta uma dependência da temperatura caracterı́stica, representada na Figura 4.14. CV anula-se no zero absoluto de temperatura (0◦ K≈ −273◦ C) apresentando, para valores baixos de temperatura uma
CV
3R
α T3
0
T
Figura 4.14: Calor especı́fico dos sólidos como função da temperatura.
dependência, CV ∝ T 3 ; para valores altos de T , o calor especı́fico é praticamente
constante e igual a 3R(h) , para todos os sólidos. A esta constância do calor especı́fico a altas temperaturas dá-se o nome de Lei de Dulong e Petit. Vamos de
seguida tentar explicar este comportamento do calor especı́fico, por aproximações
sucessivas.
4.5.1
Modelo Clássico
De acordo com o modelo que temos vindo a desenvolver, um sólido consiste num
conjunto de átomos que podem oscilar em torno de posições de equilı́brio fixas nas
posições que definem a sua estrutura cristalina. Aceitando que estes deslocamentos
são pequenos, vimos já que podemos considerar cada átomo sujeito a forças elásticas.
(h) R é a constante dos gases ideais, com o valor R = 8, 3144 J/K mol. R satisfaz a seguinte
relação com a constante de Boltzman kB , e o número de Avogrado, NA ; R = kNA
4.5. O PROBLEMA DO CALOR ESPECÍFICO
61
Note-se que, para além de átomos “presos” às suas posições de equilı́brio, os
sólidos podem também conter electrões práticamente livres no seu interior, de acordo
com o modelo clássico dos metais. Esta possibilidade introduz um termo adicional
na análise que vamos agora desenvolver, que não será tomada em linha de conta.
Assim, o que se segue é válido apenas para sólidos isoladores, e o problema do calor
especı́fico dos condutores será abordado mais adiante, no próximo capı́tulo destes
apontamentos.
Consideremos, então, cada átomo como um oscilador harmónico tridimensional.
É bem sabido que um oscilador harmónico tridimensional se pode descrever como
a reunião de três osciladores unidimensionais independentes. Podemos então, em
resumo, tratar um sólido com N átomos como um conjunto de 3N osciladores
harmónicos unidimensionais. Considerando o sólido em equilı́brio termodinâmico,
todos estes osciladores devem ter a mesma energia média hεi. A energia total do
sólido é então
E = 3N hεi.
(4.73)
A energia de cada oscilador, ε, pode ser calculada recorrendo à fı́sica estatı́stica.
A probabilidade de que um oscilador harmónico unidimensional, em equilı́brio termodinâmico com um ambiente à temperatura T , esteja num estado com energia
compreendida entre os valores ε e ε + dε é dada pela lei de Boltzman:
dP (ε) = f (ε)dε = Ae
− k εT
B
dε,
(4.74)
onde kB é a constante de Boltzman(i) e A é uma constante de normalização, que
deve ser ajustada por forma a que a soma das probabilidades seja unitária:
Z ∞
dP (ε) = 1.
(4.75)
0
Daqui resulta
A=
1
.
kB T
(4.76)
Podemos identificar a energia de cada oscilador no sólido com o calor expectável da
energia, ou seja
Z
Z ∞
1
− ε
(4.77)
hεi = f (ε)εdε =
dε εe kB T .
kB T 0
Este integral é facilmente resolvido por partes, obtendo-se
hεi = kB T .
(4.78)
Substituindo este valor em (4.73), obtemos o valor total da energia do sólido:
E = 3N kB T .
(4.79)
Refira-se que este resultado poderia ter sido obtido de forma equivalente usando o
Teorema da Equipartição da Energia, de acordo com o qual cada termo quadrático
na expressão da energia de um sistema de muitas partı́culas idênticas contribui com
kB T /2 para a energia média do sistema em equilı́brio termodinâmico à temperatura
T ; neste caso em que cada partı́cula do sistema é um oscilador harmónico, temos,
por cada uma, seis termos quadráticos na energia, três para a energia potencial
[k(x2 + y 2 + z 2 )/2] e outros três para a energia cinética [m(vx2 + vy2 + vz2 )/2], ou seja,
uma contribuição de 6 × kB T /2 = 3kB T para a energia média do sistema. Uma
(i) k
B
= 1, 381 × 10−23 J/K
62
vez que o número total de partı́culas é N , obtemos por multiplicação o resultado
apresentado.
Derivando agora a energia em ordem à temperatura obtemos o calor especı́fico,
de acordo com a sua definição (4.72). Se considerarmos uma mole de átomos obtemos finalmente
CV = 3NA kB T = 3R.
(4.80)
que está de acordo com a lei de Dulong e Petit mas não reproduz os resultados experimentais a baixas temperaturas. Este facto foi, durante algum tempo, argumento
de peso contra a hipótese atómica da matéria, até que em 1907 Einstein propôs um
tratamento diferente, em que as oscilações da rede cristalina são “quantizadas”, de
forma semelhante à quantização do campo electromagnético efectuada por Plank
no estudo da radiação do corpo negro. Em analogia com o termo “fotão”que se
refere aos quanta do campo electromagnético, designam-se por “fonões”os quanta
das oscilações mecânicas nos sólidos. Vamos de seguida seguir este formalismo.
4.5.2
Modelo de Einstein
Em 1900, Plank verificou que o espectro de radiação térmica emitida pelos chamados
corpos negros (corpos que absorvem toda a radiação electromagnética que neles
incide) pode ser descrito com exactidão supondo que, na interacção entre a matéria
e o campo electromagnético, só pode haver transferência de energia em quantidades
múltiplas da unidade básica hν, onde h é a constante de Plank(j) e ν é a frequência
envolvida no processo.
Esta suposição era, na altura, completamente injustificável e foi considerada
como um mero truque de “engenharia algébrica”por toda a comunidade cientı́fica,
incluindo o próprio Plank, porque parecia indicar que a radiação electromagnética
seria constituida por partı́culas. O debate sobre a natureza da luz (ondas ou
partı́culas) vinha desde os tempos de Newton (partidário da Natureza corpuscular) e Huyghens (que apoiava a descrição ondulatória) e tinha, aparentemente, sido
resolvido, experimentalmente, já no século XVIII, pelos trabalhos de Young e de
Fresnel, a favor da hipótese ondulatória. O “truque”de Plank viria assim, caso fosse
aceite como descrição de algo real, a baralhar (de novo) as cartas. Por esta razão,
os fı́sicos acreditavam que, mais tarde ou mais cedo, um tratamento clássico do
corpo negro seria elaborado, no qual a hipótese de Plank não fosse necessária, ou
surgisse devidamente justificada no contexto da teoria ondulatória da radiação. Um
dos poucos fı́sicos que não partilhavam esta opinião era Albert Einstein.
Segundo Einstein, a radiação electromagnética é de facto constituida por partı́culas chamadas fotões com uma massa em repouso nula e com energia dada por
hν, de acordo com a hipótese de Plank. No entanto, o carácter ondulatório da
luz não é eliminado, até porque na própria expressão de energia, E = hν, está
presente a frequência, ν, que é uma quantidade tipicamente ondulatória. Einstein
compatibilizou estes aspectos aparentemente contraditórios interpretando estatisticamente o campo (ou função de onda) da radiação. Concretamente, Einstein propôs
que a intensidade (caracterı́stica ondulatória) da radiação numa região do espaço é
proporcional ao número de fotões nela presente.
Com esta descrição da radiação, Einstein explicou quantitativamente os resultados das experiências sobre o efeito fotoeléctrico em 1905. Apesar deste sucesso,
continuou relativamente isolado na defesa do carácter realista da hipótese de Plank,
até ao ano 1922 em que Comptom expôs os seus trabalhos sobre a dispersão de
electrões pela radiação, “encerrando”a questão a favor de Einstein. Para dar mais
consistência à hipótese de Plank, Einstein tentou aplicá-la noutros domı́nios, nome(j) h
= 6, 626 × 10−34 Js
63
adamente naquele que aqui mais nos interessa, o problema do calor especı́fico dos
sólidos.
Suponhamos que, tal como o campo electromagnético, também o campo dos
deslocamentos dos constituintes de um sólido está quantizado, no sentido em que as
trocas de energia mecânicas entre estes constituintes só são possı́veis em quantidades
múltiplas de hν, onde ν é a frequência das oscilações com que estão animados. Esta
suposição parece indicar a existência de uma partı́cula à qual se dá o nome de fonão
que tem uma energia hν, e que é trocado entre os átomos do sólido, aumentando ou
diminuindo a energia das suas oscilações. De acordo com esta hipótese, a energia
mecânica de cada átomo já não pode ser considerada uma variável continua, antes
tomando valores de um conjunto discreto, distanciados entre si de ~ω (k) (ver a
Figura 4.15). O valor mı́nimo da energia, representado na Figura 4.15 por ε0 ,
E
ε o+nhw
ε o+3hw
ε o+2hw
ε o+ hw
ε o= 1 hw
2
Figura 4.15: Nı́veis de energia de um oscilador quântico com frequência ω.
obtém-se facilmente através de uma resolução quântica do oscilados harmónico (que
continua a ser a nossa aproximação para os deslocamentos atómicos no cristal) e é
dado por ε0 = 21 ~ω..
De que forma esta hipótese altera a descrição clássica do sólido? Vamos repetir
o processo que seguimos para o modelo clássico. Consideremos 3N osciladores
independentes, em equilı́brio termodinâmico à temperatura T . Supondo que todos
estes osciladores têm a mesma frequência ω e a mesma energia, que identificamos
com o valor expectável da energia de um oscilador quântico. A energia total do
sólido é então, tal como em (4.73),
E = 3N hεi.
(4.81)
A diferença principal entre o tratamento clássico consiste no cálculo da energia
média hεi. Como a variável ε é, nesta abordagem, discreta, este cálculo não pode
ser levado a cabo usando a Eq. (4.77). Continuando a aceitar a distribuição de
probabilidade de Maxwell-Boltzmann, temos, neste caso, que a probabilidade de
um oscilador estar no nı́vel de energia εn ,
1
εn = (n + )~ω
2
é
P (εn ) = Be−βεn .
(4.82)
onde se introduzir a notação, usual em fı́sica estatı́stica, β = 1/kB T , e B é uma
constante de normalização escolhida de maneira a garantir que a soma de todas as
probabilidades seja 1. A constante B é então determinada impondo
∞
X
n=0
(k)
~ω = hν
P (εn ) = 1,
(4.83)
64
ou seja,
∞
X
Be−βεn = 1,
(4.84)
n=0
e portanto
1
.
−βεn
n=0 e
B = P∞
(4.85)
O valor numérico desta constante não é um resultado particularmente interessante,
mas pode facimente ser determinado. Usando a expressão da energia, o somatório
no denominador em (4.85) pode ser escrito como
∞
X
1
e−βεn = e− 2 β~ω
n=0
∞
X
(e−β~ω )n ,
(4.86)
n=0
e o somatório no lado direito desta igualdade é uma série geométrica de razão
x = e−β~ω < 1 .
A série é pois convergente, e o seu valor é
∞
X
1
−βεn
e
n=0
e− 2 β~ω
=
.
1 − e−β~ω
Substituindo este resultado em (4.85), obtemos
"
#−1
1
e− 2 β~ω
B=
.
1 − e−β~ω
(4.87)
(4.88)
A probabilidade de se encontrar um oscilador quântico no n-ésimo nı́vel de energia εn é
e−βεn
P (εn ) = P∞ −βε .
(4.89)
n
n=0 e
e o valor médio da energia é calculado usando a definição de valor expectável de
uma variável aleatória
X
hεi =
P (εn )εn
(4.90)
n
[compare com (4.77)]. Substituindo aqui (4.89) obtemos
P∞ −βεn
εn
n=0 e
hεi = P
,
∞
−βε
n
n=0 e
(4.91)
onde o denominador em (4.89) foi posto em evidência na soma em (4.90). Note-se
que o lado direito da Eq (4.91) é o simétrico da derivada em ordem a β, de
X
ln
e−βεn
e portanto escrevemos
∞
hεi = −
X
∂
ln
e−βεn ,
∂β n=0
(4.92)
e o somatório que serve de argumento ao logaritmo foi calculado em (4.87). Resulta
então
Ã
!
1
e− 2 β~ω
∂
ln
hεi = −
∂β
1 − e−β~ω
¸
·
¢
¡
∂
1
−β~ω
= −
.
(4.93)
− β~ω − ln 1 − e
∂β
2
65
Efectuando a derivada em ordem a β, obtemos
1
~ωe−β~ω
~ω +
2
1 − e−β~ω
~ω
1
~ω + β~ω
.
2
e
−1
hεi =
=
(4.94)
A energia total do sólido é então segundo (4.81)
µ
¶
~ω
1
E = 3N
~ω + β~ω
2
e
−1
(4.95)
e o calor especı́fico obtém-se derivando esta igualdade em ordem à temperatura,
eliminando-se assim a constante 3N ~ω/2,
µ
¶
∂E
CV =
∂T V
µ
¶
∂β ∂E
=
∂T ∂β V
3N
eβ~ω
2
(~ω)
2.
kB T 2
(eβ~ω − 1)
=
(4.96)
É usual a introdução da chamada temperatura de Einstein, que é o factor constante
definido por
~ω
θE =
,
(4.97)
kB
em termos da qual o calor especı́fico resulta
θE
µ ¶2
θE
eT
CV = 3R
(4.98)
´2 ,
³ θ
E
T
e T −1
assumindo que o número de átomos N é igual ao número de Avogrado NA . A
Figura 4.16 apresenta o gráfico do calor especı́fico, dividido por 3R. É evidente que
o comportamento desta função a altas temperaturas é o esperado
µ
¶
CV
−→ 1 ⇐⇒ (CV )T →∞ −→ 3R
3R T →∞
e que o limite para baixas temperaturas é também o correcto
CV T →0 −→ 0.
Podemos verificar estes resultados analiticamente. Quando T → ∞, θE /T → 0.
O argumento das exponenciais é então pequeno e podemos por isso substitui-las
pelos seus desenvolvimentos em série de Taylor, mantendo apenas os termos mais
significativos. Isto é, podemos em (4.98) fazer a substituição
e
θE
T
para T elevado. Obtemos então
µ
CV ' 3R
θE
T
¶2 "µ
' 3R + 3R
' 3R,
θE
,
T
'1+
µ
θE
T
T
θE
¶
¶2
T
+
θE
#
66
CV (T) /3R
1
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
2
2.5
T/θE
Figura 4.16: O calor especı́fico dos sólidos no modelo de Einstein.
no limite quando T → ∞, de acordo com a lei de Dulong e Petit. No limite oposto,
em que T → 0, o argumento das exponenciais θE /T é muito grande, e também as
exponenciais o são. Podemos então desprezar, no denominador de (4.98), a unidade.
Resulta então
µ ¶2
θE
θE
(4.99)
CV ' 3R
e− T .
T
À medida que T se aproxima de zero, θE /T cresce, e a exponencial tende para zero.
A diminuição do valor da exponencial “vence”o crescimento do termo (θE /T )2 e o
limite do produto é zero, de acordo com o gráfico na Figura 4.16.
Estes resultados estão em melhor acordo com os dados experimentais, apoiando assim as ideias quânticas de Einstein. No entanto, o comportamento do calor
especı́fico para baixas temperaturas [expresso em (4.99)] não verifica a proporcionalidade, verificada experimentalmente, com o cubo da temperatura.
A origem desta discrepância reside na suposição que os 3N osciladores têm a
mesma frequência ω, ou seja, que são independentes. Se incluirmos a possibilidade
de correlação nos movimentos dos osciladores, isto é, considerando modos colectivos
de movimento, esta discrepância é resolvida. Este é o ponto de partida para o
modelo de Debye, que vamos passar a estudar.
4.5.3
Modelo de Debye
No modelo de Einstein, supõe-se que cada átomo oscila independentemente dos
restantes. Cada um destes átomos encontra-se em equilı́brio térmico com o ambiente
à temperatura T = (kB β)−1 e portanto é natural que todos tenham o mesmo tipo de
movimento, e logo a mesma frequência. No entanto, já sabemos que os movimentos
dos átomos num cristal não são independentes: o movimento dum átomo afecta o
dos seus vizinhos, que, por sua vez, afectam o de outros átomos, até que por fim
todos os átomos são influenciados. O modelo de Einstein é assim uma aproximação,
justificável (ou não) conforme o problema em estudo, e rigor pretendido.
Vamos agora abordar o problema com maior generalidade, considerando os “movimentos colectivos”do cristal. Um exemplo de movimentos colectivos é o dos deslocamentos relacionados com a propagação do som nos cristais, que já foram estudados
67
nas secções 4.2 e 4.2.1. Os formalismos aı́ apresentados podem ser aplicados aqui,
considerando (mais uma vez) desenvolvimentos em série de Fourier dos deslocamentos sofridos por cada átomo.
Consideramos os movimentos atómicos como uma sobreposição de ondas monocromáticas, de frequência ω e vector de onda k que, seguindo o trabalho de Debye,
satisfazem a relação de dispersão das ondas de som em meios contı́nuos isotrópicos,
ω = vf |k| .
(4.100)
A energia total de um cristal não é, neste caso, dada por E = 3N ε̄(ω) como no
modelo de Einstein, porque estão presentes várias frequências. Devemos antes calcular a energia do cristal somando a energia de cada um dos modos de vibração
presentes no desenvolvimento em série de Fourier dos deslocamentos atómicos. Mas
cada modo de vibração, com uma dada frequência, tem a energia média igual à
do oscilador harmónico quântico unidimensional que “oscile”com essa frequência,
energia essa dada por (4.94). A energia total do sólido pode então ser calculada
como
X
E=
ni ε̄(ωi ),
(4.101)
ωi
onde ni é o número de onda planas monocromáticas com frequência ωi presentes
no desenvolvimento em série de Fourier dos deslocamentos atómicos, e ε̄(ω) é a sua
energia. As frequências permitidas formam um conjunto discreto (e daı́ o somatório
em (4.101), de acordo com o estudo na secção anterior). Para cristais tı́picos, no
entanto, as frequências permitidas estão tão próximas umas das outras que podemos,
para simplificar os cálculos, aproximar o somatório em (4.101) a um integral. O
número de frequências ω pode ser calculado recorrendo à função de densidade de
modos de vibração, g(ω). Obtemos então a seguinte expressão para a energia, E,
de um cristal à temperatura T :
Z
ωD
E=
dω g(ω)ε̄(ω).
(4.102)
0
O limite superior de integração ωD deve ser finito, pois substituindo g(ω) e ε̄(ω) pelas suas expressões obtemos em (4.102) um integral que, com ωD → ∞, é divergente.
Antes de prosseguirmos, vamos determinar o valor de ωD .
Um cristal com N átomos é um sistema com 3N graus de liberdade, que são as
3N componentes das posições de todos os átomos que o formam. Podemos, numa
abordagem microscópica, indicar o deslocamento de cada um dos átomos, através
do valor das 3N quantidades
ux1 (t)
ux2 (t)
·
·
·
uxN (t)
uy1 (t)
uy2 (t)
·
·
·
uyN (t)
uz1 (t)
uz2 (t)
·
·
·
uzN (t)
Por exemplo, uyk representa a componente y do deslocamento do k−ésimo átomo relativamente à sua posição de equilı́brio, (Xk , Yk , Zk ), no instante t.
Ao fazermos um desenvolvimento em série de Fourier dos deslocamentos, defi-
68
nimos três funções ux (r, t), uy (r, t) e uz (r, t), da forma
X
ux (r, t) =
Ax (k)ei(k·r−ωt)
k
uy (r, t)
=
X
Ay (k)ei(k·r−ωt)
k
uz (r, t)
=
X
Az (k)ei(k·r−ωt) .
(4.103)
k
onde Ax , Ay e Az são os coeficientes do desenvolvimento em ondas planas. As
componentes do deslocamento de cada um dos átomos são, nesta descrição, os
valores que estas funções tomam, quando calculadas na sua posição de equilı́brio,
por exemplo
ux1 (t) = ux (R1 , t).
Nesta descrição por ondas planas monocromáticas, os graus de liberdade são os
coeficientes Ax (k), Ay (k) e Az (k) dos desenvolvimentos em (4.103). Evidentemente,
não podem ser necessárias, nesta abordagem, mais graus de liberdade que os usados
na descrição macroscópica que usa as 3N funções do tempo ukα (t) (com α = x, y, z).
Ora seja, o número de modos de vibração usados numa descrição o mais detalhada
possı́vel dos deslocamentos atómicos deve ser igual a 3N , o que matematicamente
é expresso através de
X
ni = 3N,
(4.104)
ωi
onde n1 tem o significado que lhe foi atribuı́do em (4.101). A frequência de Debye,
ωD , que aparece em (4.102) é determinada de forma a assegurar que o número de
graus de liberdade macroscópicos (número de ondas planas permitidas) é igual ao
número de graus de liberdade microscópicos (3 vezes o número de átomos), como
acabou de ser discutido. Substituindo o somatório em (4.104) por um integral [como
na passagem de (4.101) para (4.102)] obtemos
Z ωD
dωg(ω) = 3N.
(4.105)
0
Substituindo aqui a densidade de modos de vibração deduzida na Secção 4.4, obtemos
N
3
ωD
= 6π 2 vf 3 .
(4.106)
V
Podemos agora retomar o cálculo da energia do cristal. Substituindo em (4.102)
a densidade de estados g(ω) e a energia média em função de ω resulta
µ
¶
Z ωD
1
~ω
3V 1
dω
~ω
+
ω2 .
(4.107)
E=
2π 2 vf 3 0
2
eβ~ω − 1
O calor especı́fico é a derivada desta expressão em ordem à temperatura. O
primeiro termo no integral, ~ω 3 /2, é uma constante e logo não contribui para esta
derivada. Temos então
¶
µ
¶
µ
1
∂E
∂E
=− 2
CV =
∂T V
kT
∂β V
Z ωD
3V 1 1 ∂
~ω 3
= − 2 3
dω
2π vf kT 2 ∂β 0
eβ~ω − 1
Z
ωD
3V 1 ~2
ω 4 eβ~ω
=
dω
(4.108)
2.
3
2
2
2π vf kT 0
(eβ~ω − 1)
69
Fazendo a mudança de variável x = β~ω, usando (4.106) e introduzindo a chamada
temperatura de Debye
~ωD
θD =
,
kB
resulta
µ
CV = 9kN
T
θD
¶3 Z
θD
T
dx
0
x4 ex
(ex − 1)
2.
(4.109)
Finalmente, usando a relação entre as constantes de Boltzman k, dos gases perfeitos
R e a de Avogrado NA , obtemos
µ
CV = 9R
T
θD
¶3 Z
θD
T
dx
0
x4 ex
2.
(ex − 1)
(4.110)
Esta expressão ajusta-se bem aos resultados experimentais. Em particular, o seu
comportamento assimptótico, nos limites T → ∞ e T → 0, é o esperado. Com
efeito, no limite T → ∞, o limite superior do integral em (4.109) é muito pequeno.
Logo o argumento das exponenciais, x < θD /T também é pequeno e podemos por
isso usar o desenvolvimento ex ' 1 + x. Obtemos então
µ
CV
'
9R
µ
'
9R
T
θD
T
θD
¶3 Z
θD
T
dx x2 (1 + x)
0
¶3 Z
θD
T
dx x2 ,
(4.111)
0
que é válido no limite θD /T ' 0. Resolvendo este integral, obtemos
CV = 3R,
(4.112)
como esperado. Por outro lado, no limite oposto, em que T → 0, o limite superior
do integral em (4.110) tende para infinito. Podemos então escrever
µ
CV ' 9R
T
θD
¶3 Z
∞
dx
0
x4 ex
(ex − 1)
2
(4.113)
O integral em x é agora uma constante(l) , de forma que o calor especı́fico apresenta, para baixas temperaturas, o comportamento observado experimentalmente
de proporcionalidade com T 3 .
A figura apresenta valores do calor especı́fico em função da temperatura adimensional, isto é, θE /T para o modelo de Einstein e θD /T para o modelo de Debye.
Apesar de mais convincente, o modelo de Debye é ainda apenas uma aproximação. Com efeito, a relação de dispersão usada não é válida nos cristais, pelo
menos para pequenos comprimentos de onda. Um estudo mais correcto (mas bastante complicado) usaria uma densidade de modos de vibração baseada na relação
de dispersão das ondas mecânicas em cristais. A análise do caso unidimensional é
proposta como o problema; aparte esta situação, um tratamento mais rigoroso do
modelo de Debye ultrapassa o nı́vel destas notas.
(l)
desta informação não ser particularmente relevante para esta discussão, o seu valor é
R ∞ Apesar
4 x x
−2 dx = 4π 4 /15.
0 x e (e − 1)
70
25
Debye
-1
CV (T)/JK mol
-1
20
Einstein
15
10
5
0
0.25
0.5
0.75
1
1.25
1.5
1.75
2
T/θ
Figura 4.17: Calor especı́fico dos sólidos segundo o tratamento de Einstein e o de
Debye.
PROBLEMAS
4.1
(a) Deduza a densidade de modos de vibração para um meio contı́nuo isotrópico
tridimensional em que a velocidade de polarização longitudinal é diferente
da transversal, e indique (em função destes) qual seria a frequência máxima
de oscilação associada aos osciladores harmónicos no modelo de Debye.
(b) Determine a temperatura de Debye para o alumı́nio, sabendo que as velocidades de polarização longitudinal e transversal das ondas acústicas no
meio são vL = 6374 m/s e vT = 3111 m/s respectivamente. Considere a
densidade do alumı́nio de 6, 02 × 1028 átomos por metro cúbico.
(c) Usando a tabela abaixo, determine a temperatura de Einstein e de Debye do
alumı́nio a partir do valor experimental de Cv = 13, 0 J K−1 mol−1 obtido à
temperatura de 100 K. Os valores apresentados estão expressos em unidades
T
SI, como função da temperatura adimensional Θ
segundo o modelo de
Einstein e de Debye.
25
T /Θ
∞
1,000
0,500
0,333
0,250
0,200
0,167
0,143
0,125
0,111
0,100
0,067
0,050
0,040
0,020
0,010
20
Debye
Einstein
Cv
15
10
5
0
0.2
0.4
0.6
0.8
(E)
Cv
24,94
23,75
20,59
16,53
12,55
9,20
6,63
4,76
3,45
2,53
1,89
0,58
0,24
0,12
0,00
0,00
(D)
Cv
24,94
22,96
18,06
12,38
7,58
4,26
2,24
1,12
0,54
0,25
0,11
0,00
0,00
0,00
0,00
0,00
1
Temperatura adimensional
4.2 Como pode justificar o baixo valor do calor especı́fico do diamante à temperatura
ambiente?
4. Problemas
71
4.3 É possı́vel fazer um modelo das vibrações longitudinais de uma cadeia de polietileno,
−CH = CH − CH = CH − CH =,
considerando uma cadeia de massas idênticas, m, ligadas por molas de constantes
alternadas α1 e α2 , conforme ilustrado na figura seguinte.
d
a
α1
α2
α1
α2
Demonstre que a relação de dispersão desta cadeia é dada por
2
α1 + α2 4
ω2 =
1±
m
s
4α1 α2 sin2 ka
2
1−
(α1 + α2 )2
3
5 ,
onde a é comprimento do padrão molas/átomos que se repete na cadeia.
Sugestão: Assuma soluções do tipo
un = Aei(kXn −ωt)
para átomos entre molas de constante α1 e α2 e
u0n = A0 ei(kXn −ωt)
para átomos entre molas de constante α2 e α1 respectivamente.
4.4 Considere uma cadeia linear monoatómica de separação interatómica a e de N
átomos. Considerando apenas interacções com os átomos vizinhos mais próximos,
demonstre que a densidade de modos de vibração é dada por:
g(ω) =
2N
√
,
π ωm 2 − ω 2
onde ωm representa a frequência máxima de vibração permitida.
4.5 Obtenha a expressão para o calor especı́fico molar de uma cadeia de N átomos
idênticos e comprimento L, que só pode oscilar longitudinalmente, segundo o
modelo de Debye.
(a) Determine uma expressão para o calor especı́fico para baixas temperaturas.
(b) Esboce um gráfico para o calor especı́fico deduzido na alı́nea anterior indicando como chegou aos valores limites respectivos.
(c) Determine uma expressão para o calor especı́fico usando a relação de dispersão deduzida no problema anterior. Verifique o limite para o calor especı́fico apenas para altas temperaturas.
Capı́tulo 5
Metais I: modelos de
electrões livres
No universo dos sólidos os metais têm uma importância prática especial. As suas
propriedades tornaram-nos particularmente úteis num grande número de aplicações,
ao longo de parte importante da história da humanidade. O estudo dos metais tem
pois um grande interesse, na área mais geral da fı́sica dos sólidos.
Entre as muitas propriedades interessantes dos metais, podemos referir: baixos
pontos de fusão; grandes condutividades eléctricas e térmicas; altas densidades de
massa; grande resistência estrutural; boa reflectividade óptica.
Vamos agora passar à descrição de algumas destas propriedades a partir dos
princı́pios da fı́sica. O facto de os metais conduzirem bem calor e electricidade
leva-nos a pensar que alguns dos electrões dos átomos que os constituem se podem
deslocar grandes distâncias no seu interior, quando comparadas com as distâncias interatómicas tı́picas. Neste capı́tulo, vamos estudar estes electrões como sendo livres,
isto é, supondo que as interacções que sofrem (com outros electrões de condução e
com os iões que formam a rede cristalina) são tais, e de tal forma distribuı́das, que,
em média, se cancelam.
5.1
Introdução
As ligações quı́micas entre dois (ou mais) átomos são estabelecidas por deformação
das nuvens electrónicas desses átomos. Evidentemente, esta deformação é mais
pronunciada nos estados electrónicos mais fracamente ligados a cada um dos átomos,
de tal forma que podemos dizer (cometendo um erro que, na esmagadora maioria
das aplicações, é desprezável) que apenas estes estados participam na ligação. Aos
electrões que ocupam estes estados dá-se o nome de electrões de valência.
Nos metais, a ligação quı́mica envolve normalmente um grande número de
átomos (1020 , ou mais) e esta deformação das camadas exteriores da nuvem electrónica de cada átomo é particularmente pronunciada, ficando distribuı́das por toda a
extensão do metal. Os electrões que ocupam estas camadas podem assim mover-se
ao longo de distâncias com ordem de grandeza macroscópica.
Um cristal metálico consiste pois num arranjo periódico de iões positivos, imerso
num “gás” de electrões. Naturalmente, os electrões interagem uns com os outros e
com os iões da rede, mas podemos supor que as forças que sentem, estando mais
ou menos distribuı́das em todas as direcções, se cancelam globalmente, sendo nula
a sua resultante. Esta aproximação, apesar de claramente grosseira, permite, como
veremos, obter alguns resultados em bom acordo com os factos experimentais, pelo
menos a nı́vel qualitativo.
73
74
5.2
CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES
O modelo de Drude-Lorentz
O modelo de Drude-Lorentz consiste na descrição clássica do gás de electrões livres.
Usando a fı́sica clássica, este gás assemelha-se bastante a um gás perfeito. As
diferenças principais residem na alta densidade (num metal há, tipicamente 1022
electrões por cm3 ) e no facto de os electrões se moverem num cristal, podendo
sofrer colisões com os iões que formam o cristal.
No modelo de Drude-Lorentz (de facto são dois modelos, mas a única diferença
entre eles consiste apenas num pormenor técnico do tratamento estatı́stico) tratam-se então os electrões deslocalizados como um gás de electrões livres, em equilı́brio
termodinâmico com o ambiente. Sendo os electrões livres, a sua energia é totalmente
cinética. Usando métodos estatı́sticos, podemos calcular a energia total do gás de
electrões e a partir daı́ várias propriedades mensuráveis experimentalmente dos
metais, como o calor especı́fico, o módulo de compressibilidade, etc. O confronto
dos resultados que obtivermos com os valores experimentais servirá para a avaliação
das qualidades do modelo.
5.2.1
O calor especı́fico dos metais
No quadro desta descrição dos electrões de condução, a energia de um sólido condutor é
E = Ecr + Ee ,
(5.1)
onde Ecr é a energia do cristal de iões, que pode ser avaliada com os métodos
estudados no capı́tulo anterior, e Ee é a energia do gás de electrões de condução.
A energia tem esta expressão simples porque consideramos os electrões livres e
portanto sua energia de interacção com o cristal é uma constante (que pode não ser
considerada), cujo único efeito observável é o de manter o gás de electrões confinado
no interior do metal.
A energia dos electrões de condução é puramente cinética uma vez que se consideram livres. De acordo com o teorema da equipartição da energia, a energia média
de um conjunto de Q electrões de condução é pois Q × 3 × kB T /2 = 3QkB T /2.
Consideremos um sólido com N átomos e seja u o número de electrões que cada
átomo fornece para a ligação quı́mica. Temos então Q = N u a energia média da
nuvem electrónica fica então
Ee =
3
uN kB T.
2
(5.2)
A energia total da amostra considerada é
3
E = Ecr + uN kB T,
2
(5.3)
e o calor especı́fico do metal vem
3
CV = CVcr + uN kB .
2
(5.4)
Para altas temperaturas, CVcr = 3R, como vimos no capı́tulo anterior. Relembrando
que R = NA kB , resulta
u
(5.5)
CV = 3(1 + )R.
2
Concluimos então que, de acordo com este modelo, os metais apresentam um calor especı́fico cujo valor é igual a 9/2R para os metais monovalentes, 6R para os
bivalentes, etc.
Este resultado, o primeiro que obtivemos com este modelo, está em desacordo
flagrante com os resultados experimentais. De facto, o calor especı́fico dos metais
5.2. O MODELO DE DRUDE-LORENTZ
75
tem, a altas temperaturas, o valor definido pela lei de Dulong e Petit, ou seja 3R.
Veremos mais adiante que esta deficiência do modelo pode ser resolvida analisando
quanticamente as propriedades do gás de electrões.
5.2.2
A lei de Ohm
A diferença de potencial entre as extremidades de um condutor é proporcional
à corrente que o atravessa. Este é o enunciado da bem col
nhecida lei de Ohm. Consideremos um condutor filiforme
com comprimento l e secção transversal de área S, percori
S
rido por uma corrente i (ver a figura). A lei de Ohm pode
então escrever-se como
∆V = Ri,
(5.6)
onde ∆V é a diferença de potencial entre as extremidades do condutor e R, a
chamada resistência do condutor, é a constante da proporcionalidade referida acima.
Multiplicando ambos os membros de (5.6) por 1/(lS) e notando, por um lado, que
o campo eléctrico no interior do condutor, E, tem um módulo dado por E = ∆V /l,
e por outro que a densidade de corrente j é, por definição de corrente, j = i/S,
obtemos
l
E.
(5.7)
j=
SR
À constante σ = l/(SR) dá-se o nome de condutividade (a) . Deduzimos desta maneira a forma local da lei de Ohm,
j = σE.
(5.8)
A lei de Ohm tem um aspecto que, à primeira vista, pode parecer perturbador. É
que a força exercida pelo campo eléctrico sobre os electrões vale −eE, onde e é o
módulo da carga do electrão; assim, o lado direito da equação (5.8) é proporcional
à força que actua sobre os electrões. Por outro lado, a densidade de corrente j é
dada por
j = ρl ṽ
(5.9)
onde ρl é a densidade de carga livre e ṽ é a velocidade média das cargas, neste
caso, dos electrões; o lado esquerdo de (5.8) é então proporcional à velocidade
dos electrões. Mas então a equação (5.8) traduz uma proporcionalidade entre a
velocidade dos electrões e a força que neles actua, em contradição aparente com o
previsto pela segunda lei de Newton(b) (força proporcional à aceleração).
De facto, esta situação não constitui um paradoxo, e é até relativamente frequente na natureza. Por exemplo, o movimento de queda de um paraquedista é,
segundos após o pára-quedas se abrir, uniforme (e não uniformemente acelerado) e
o valor da velocidade é tanto maior quanto maior for o peso do paraquedista, ou
seja, quanto maior for a força que o impele para o solo. Neste exemplo (e noutros que poderiam ser citados) está presente, para além da força mais directamente
responsável pelo movimento (a força gravı́tica), uma resistência ao movimento por
parte do meio onde ele se realiza. No caso dos electrões nos condutores esse meio é
(a) A
condutividade é o inverso da resistividade, e ambos os parâmetros são uma medida da
qualidade intrı́nseca (isto é, independente de factores geométricos) dos materiais como suportes da
condução eléctrica — Um material (como o cobre, por exemplo) com uma elevada condutividade,
ou baixa resistividade, é um bom condutor de electricidade, mesmo que uma amostra concreta
desse material (por exemplo, um fio muito longo e/ou muito fino) apresente um grande valor da
resistência eléctrica.
(b) Note-se que, num tratamento clássico como o presente, as leis da mecânica de Newton devem
ser consideradas válidas.
76
o cristal. No seu movimento no cristal, os electrões podem por vezes sofrer colisões
com com os iões que o formam, comunicando-lhes parte da energia cinética que
obtiveram sob acção do campo.
Tentemos descrever quantitativamente este processo. Consideremos o movimento dos electrões que formam o gás em equilı́brio termodinâmico na ausência,
para já, de campos eléctricos aplicados. A uma temperatura T 6= 0, a energia
cinética média dos electrões, correspondente ao movimento caótico de agitação
térmica, dada pelo teorema de equipartição da energia de Boltzmann, tem o valor de ε = 3kB T /2. A média dos módulos das velocidades, ṽ0 , dos electrões que
compõem a nuvem condutora nos metais é pois
r
3kB T
ṽ0 =
,
(5.10)
me
onde me é a massa electrónica; à temperatura ambiente T ≈ 300 K, ṽ ≈ 1, 2 ×
105 m/s. O movimento correspondente à agitação térmica é pois muito rápido. No
entanto, o sentido do movimento de cada electrão é totalmente aleatório e, por isso,
a média vectorial das velocidades dos electrões é nula. Assim, este movimento de
agitação térmica não se traduz na presença de uma corrente eléctrica mensurável.
Vejamos agora o que acontece quando se estabelece um campo eléctrico no interior do condutor. Cada electrão passa a sentir uma força F e = −eE, na mesma direcção mas de sentido oposto ao campo eléctrico, e portanto adquire um movimento
uniformemente acelerado (com a = −eE/me ), mas apenas entre duas colisões sucessivas. Seja τ o intervalo de tempo médio que separa duas colisões de um dado
electrão(c) . Em equilı́brio, esta situação é equivalente aos electrões de condução
possuirem uma velocidade de condução comum (ver a Figura 5.1). A velocidade
E=0
E
deslocamento electrónico
(b)
(a)
Figura 5.1: Esquema do precurso de um electrão. (a) Os electrões apresentam movimentos aleatórios com velocidade vectorial média nula; (b) sob a acção de um campo
eléctrico, os electrões ficam animados de um movimento uniformemente acelerado entre duas colisões sucessivas, que tendem a restaurar a aleatoriedade na direcção do
vector velocidade. Esta situação é equivalente a um movimento colectivo com uma
velocidade de condução correspondente ao deslocamento electrónico representado.
média dos electrões é então
ṽ = ṽ 0 +
−eE
τ,
me
(5.11)
onde ṽ 0 é a velocidade inicial (imediatamente após uma colisão) média. Ora, a
velocidade dos electrões após uma colisão está distribuı́da uniformemente em todos
(c) São frequentes as designações de “tempo de relaxação”, “tempo de colisão”, “tempo médio de
vida livre”, entre outras, para o parâmetro τ .
Metal
Li
Na
Cu
Au
n (m−3 )
4,7×1028
2,7×1028
8,5×1028
5,9×1028
σ(Ω−1 m−1 )
1,1×107
2,1×107
5,8×107
4,5×107
77
τ (s)
8,3×10−15
2,8×10−14
2,4×10−14
2,7×10−14
Tabela 5.1: Densidades electrónicas n (em m−3 ) e condutividades eléctricas (em
Ω−1 m−1 ) a 295 K (de Kittel, “Introduction to Solid State Physics”) e tempo de relaxação para o lı́tio, o sódio, o cobre e o ouro.
os sentidos, de forma que a sua média vectorial, ṽ 0 , é nula. A velocidade média dos
electrões sob a acção do campo eléctrico é pois
ṽ =
−eE
τ.
me
(5.12)
Multiplicando a velocidade média que acabámos de obter pela densidade de carga
de condução,
ρl = −ne,
(5.13)
onde n é a densidade de electrões de condução, obtemos a densidade de corrente
eléctrica,
ne2 τ
j=
E.
(5.14)
me
Mas esta equação tem a forma da lei de Ohm (5.8), com a condutividade eléctrica
dada por
ne2 τ
σ=
.
(5.15)
me
Podemos estimar o tempo de relaxação de um metal usando valores tabelados da
condutividade eléctrica e da densidade electrónica. A Tabela 5.1 apresenta alguns
valores.
O tempo de vida livre dos electrões nos metais é, como podemos verificar a partir
da Tabela 5.1, extremamente curto. Durante um intervalo de tempo tão pequeno,
a variação no módulo da velocidade dos electrões provocada pela acção de campos
eléctricos tı́picos (de alguns volts por metro) é, certamente pequena. Podemos
pois considerar que o valor do módulo da velocidade dos electrões é, em média, o
calculado a partir do princı́pio de equipartição da energia, ṽ ≈ 105 m/s. Durante
um intervalo de tempo τ ≈ 10−14 s, os electrões percorrem uma distância(d) de cerca
de 10−9 m= 10 Å, que é da ordem de grandeza das distâncias interatómicas. Este
resultado apoia a suposição de Drude de que os electrões sofrem colisões com os
iões.
De acordo com o princı́pio de equipartição da energia, o valor médio do módulo
da velocidade de agitação térmica, ṽ, diminui com a temperatura. Supondo que
o caminho médio livre, λ̃, não depende fortemente da temperatura, o tempo de
relaxação, τ = λ̃/ṽ, deve crescer com a diminuição da temperatura. Assim, concluimos que a condutividade dos metais depende da temperatura de acordo com
ne2 λ̃
.
(5.16)
3me kT
Ou seja, a condutividade dos metais é maior a baixas temperaturas, o que de facto
se verifica experimentalmente, com a excepção de uma classe importante (em vista
das aplicações industriais) de materiais — os semi-condutores.
σ=√
(d) Esta
distância tem a designação habitual de “caminho médio livre”.
78
Devemos reconhecer agora que este acordo com resultados experimentais é, apenas, qualitativo, já que, para a maioria dos metais, a condutividade depende da
temperatura de forma mais pronunciada do que a patente na Eq. (5.16).
5.2.3
O efeito de Hall
O efeito de Hall consiste no aparecimento de um campo eléctrico transversal num
condutor percorrido por corrente numa região onde está definido um campo magnético. É frequentemente usado para medir a intensidade de campos magnéticos
estáticos. Na Figura 5.2 representa-se um circuito formado com uma placa metálica
i
-
FM
v
EH
B
+
+
+
+
+
+
Figura 5.2: Esquema da montagem usada para demonstrar o efeito de Hall.
(à direita na figura), numa região onde está definido um campo magnético B,
perpendicular ao plano da placa condutora. A velocidade dos electrões (oposta ao
sentido da corrente) está representada na figura como v. Ao moverem-se numa
região onde está definido um campo magnético, os electrões sentem uma força F M ,
dada por
F M = −ev × B,
(5.17)
e como tal, sofrem uma aceleração para a esquerda (na figura), acumulando-se assim
carga de sinal negativo deste lado da placa. Em contrapartida, no lado direito
sente-se um defeito de carga de sinal negativo, ou seja, o lado direito fica carregado
positivamente. Em resultado desta assimetria na distribuição de carga, no interior
da placa metálica estabelece-se um campo eléctrico E H , chamado campo de Hall.
Atinge-se uma situação estacionária quando a força eléctrica, F H = −eE H , for
igual (e, claro, oposta) à força magnética, ou seja quando
−eEH = −evB.
(5.18)
Usando (5.13), obtemos a condição de estacionaridade
EH = −
1
jB.
ne
(5.19)
A constante −1/(ne) tem o nome de constante de Hall. O seu valor negativo reflecte
o facto de os transportadores de carga nos metais serem electrões, com carga de sinal
negativo. É relativamente simples medir experimentalmente o valor da constante
de Hall, e esperaria-se, à luz deste modelo, obter sempre valores negativos. Ora,
estranhamente, alguns metais apresentam valores positivos para a constante de Hall.
Alguns exemplos são os estabelecidos pelo cádmio, o zinco, o berı́lio e o magnésio.
5.2.4
Efeitos termoeléctricos
Consideremos um metal no qual se estabelece um gradiente de temperatura. Para
concretizar a discussão, imaginemos que aquecemos com uma chama a extremidade
de uma barra de cobre, e mergulhamos a outra num banho gelado (ver a Figura 5.3).
Uma vez que os electrões de condução da extremidade quente têm maior energia
T1
79
T2
T1
T2
v
+
+
+
T1 > T2
ET
-
Figura 5.3: Esquema da montagem para o estabelecimento de um gradiente de temperatura num metal (esquerda) e o campo eléctrico,
E T , resultante desse gradiente.
cinética do que os da extremidade fria, deve verificar-se, durante alguns instantes,
um fluxo lı́quido de electrões daquela extremidade para esta. Evidentemente, o
acumular de electrões na extremidade fria, com a consequente carga positiva resultante na extremidade quente, define, no interior do metal, um campo eléctrico que
contraria a continuação indefinida deste processo. Atinge-se, então, um estado de
equı́librio dinâmico, em que no interior do metal está definido um campo eléctrico
que se manifesta como uma diferença de potencial entre as duas extremidades, sendo
a mais quente a de potencial mais elevado. Este fenómeno tem o nome de efeito de
Seebeck.
Outro efeito termoeléctrico interessante manifesta-se nos pontos de contacto
de dois metais com densidades de electrões de condução diferentes. Numa junção
de dois metais diferentes, verifica-se, naturalmente, um processo de difusão dos
electrões de condução do metal com maior concentração electrónica para o outro.
Mas, assim, aquele metal fica com deficiêcia de electrões, ou seja, carregado positivamente. Inversamente, o metal que recebe o fluxo electrónico deste processo de
difusão fica carregado positivamente (ver a Figura 5.4). Mais uma vez, o campo
A
nA
Vc
++ − −
+ + − −e
nA > nB
V
nB
Vc
A
B
Figura 5.4: Potencial de contacto na junção de dois metais com diferentes concentrações electrónicas nA e nB e gráfico (à direita) do potencial electrostático na zona
da junção.
eléctrico criado por esta redistribuição de cargas contraria a sua contiuação indefinida, estabelecendo-se um estado de equilı́brio dinâmico em que o gradiente
da concentração electrónica (que favorece a continuação do processo de difusão)
é compensado pelo campo eléctrico resultante. Chama-se potencial de contacto à
diferença de potencial associada a este campo eléctrico. A grandeza do potencial de
contacto depende das concentrações de carga resultantes deste processo de migração
electrónica. Ou seja, o potencial de contacto é tanto maior quantos mais electrões
tiverem sido difundidos do metal com maior concentração electrónica para o outro.
Ora, quanto maior a temperatura, maior a energia cinética média dos electrões de
condução, logo, maior o número de electrões com energia suficiente para ultrapassarem a barreira de potencial na junção. Ou seja, quanto maior a temperatura, maior
o potencial de contacto na junção dos dois metais.
Este efeito é aproveitado para a construcção de termómetros, chamados termómetros de termopar. Um esquema simplificado da construcção destes termómetros
encontra-se representado na Figura 5.5. Basicamente, estes termómetros consistem
num circuito constituido por dois ramos de metais diferentes. Nas duas junções (A e
80
VA
B
A
C
V
D
VB
Figura 5.5: Termómetro de termopar. A tensão indicada pelo voltı́metro depende da
diferença de temperatura das duas juções A e B.
B, no esquema da figura) estabelecem-se potenciais de contacto diferentes se as suas
temperaturas forem diferentes. Uma das junções deve ficar a uma temperatura conhecida, por exemplo, mergulhada em água gelada, ao passo que a outra é utilizada
como sensor. Fica então definida uma força electromotriz no circuito, igual à diferença entre os dois potenciais de contacto, que é uma função crescente da diferença
entre as temperaturas das duas junções. Esta força electromotriz é medida usando
um voltı́metro, que interrompe um dos condutores, sendo necessário ter o cuidado,
na utilização do termómetro, de assegurar que as duas junções para a ligação do
voltı́metro (indicadas pelas letras C e D na figura) estão à mesma temperatura,
para que se cancelem os seus potenciais de contacto.
A existência do potencial de contacto na junção de dois metais diferentes tem
ainda outro efeito interessante. Quando uma corrente atravessa a junção, as cargas
que a compõem sofrem uma variação de energia, igual ao produto da sua carga
pelo valor do potencial de contacto. Essa variação de energia, que numa junção é
um aumento, na outra uma diminuição de energia, é fornecida ou absorvida pelo
meio ambiente. Este fenómeno tem o nome de efeito de Peltier. Assim, um circuito
constituido por dois metais diferentes no qual se estabelece uma corrente, funciona
efectivamente como uma máquina térmica, absorvendo calor numa das junções e
libertando-o na outra.
5.3
Balanço do modelo de Drude
Estudámos algumas propriedades dos metais à luz de uma teoria clássica de electrões
livres. Muitas outras caracterı́sticas poderiam ter sido estudadas, por exemplo, a
condutividade térmica. Não o fizemos porque estamos já em condições de avaliar o
modelo.
O modelo permite explicar qualitativamente a lei de Ohm e a dependência da
condutividade com a temperatura, bem como alguns efeitos termoeléctricos, nomeadamente o de Seebeck e o de Peltier, mas falha redondamente no que concerne ao
calor especı́fico da nuvem electrónica. Não consegue descrever o comportamento dos
semi-condutores, cuja condutividade aumenta com a temperatura, em geral. Não
consegue, também, dar conta dos valores positivos para o coeficiente de Hall apresentados por alguns metais, nem justificar fisicamente os valores do livre caminho
médio dos electrões de condução, notoriamente elevados a baixas temperaturas.
Vamos de seguida verificar se é possı́vel resolver estas deficiências do modelo de
electrões livres através de um tratamento quântico dos electrões.
5.4
O modelo de Sommerfeld
O modelo de Drude é uma teoria clássica de electrões livres, isto é, os electrões
são tratados como pequenas esferas rı́gidas idênticas. No entanto, apresentando os
electrões um comportamento eminentemente quântico, este tratamento não se pode
considerar correcto. Vamos agora estudar o gás de electrões livres usando o formalismo da Mecânica Quântica. Veremos que as principais diferenças relativamente ao
5.4. O MODELO DE SOMMERFELD
81
modelo clássico têm origem nas particularidades estatı́sticas dos objectos quânticos,
e, mais em particular, dos fermiões, classe de partı́culas que engloba os electrões.
A classe dos fermiões é constituı́da pelas partı́culas com momento angular intrı́nseco (ou spin) semi-inteiro (isto é, 1/2, 3/2, etc.) e que satisfazem o Princı́pio
de Exclusão de Pauli, segundo o qual dois fermiões idênticos não podem ocupar
simultaneamente o mesmo estado quântico(e) . O Princı́pio de Exclusão de Pauli é
incompatı́vel com a distribuição de Maxwell-Boltzmann, verificando-se antes que os
fermiões satisfazem uma distribuição diferente (sendo a diferença particularmente
notória a baixas temperaturas), com o nome de distribuição de Fermi-Dirac.
5.4.1
Estados electrónicos
Os estados quânticos dos electrões são obtidos resolvendo a equação de Schrödinger
independente do tempo:
−
~2 2
∇ φ (r) + V (r)φ (r) = εφ (r) ,
2m
(5.20)
onde φ (r) é a parte da função de onda que depende da posição dos electrões, v (r)
é a sua função de energia potencial, ε é a energia do estado definido pela função de
onda φ e ∇ é o operador gradiente, que, como é bem sabido, é dado por
∂
∂
∂
+ ey
+ ez ,
∂x
∂y
∂z
2
2
2
∂
∂
∂
∇2 =
+ 2 + 2,
∂x2
∂y
∂z
∇ = ex
usando coordenadas cartesianas. Uma vez que neste tratamento os electrões são
considerados livres, a sua energia potencial deve ser constante(f) , e podemos escolhê-la igual a zero. Assim a equação (5.20) reduz-se a
~2 2
∇ φ (r) + εφ (r) = 0.
2m
(5.21)
As soluções desta equação são da forma
φk (r) = Aeik·r ,
(5.22)
onde A é uma constante que é fixada impondo a normalização da função de onda,
Z
Z
2
∗
dV φ (r) φ (r) = |A|
dV e−ik·r eik·r
V
V
=
2
|A| V = 1,
de onde resulta, escolhendo A real
1
A= √ .
V
(5.23)
Substituindo (5.22) em (5.21), obtemos a relação entre a energia dos electrões e o
seu vector de onda k:
~2 k 2
εk =
.
(5.24)
2m
(e) Note-se que se trata aqui de estados quânticos e não de nı́veis de energia. Se dois estados
estados quânticos diferentes apresentam um mesmo valor de energia electrónica, então esse nı́vel
pode estar ocupado por dois electrões.
(f) Ao nı́vel quântico, as forças são sempre conservativas, isto é, podem ser obtidas como gradiente
da energia potencial. Se a força é nula, a energia potencial é constante
82
Comparando esta expressão com a correspondente clássica, ε = p2 /2m, concluı́mos
que o momento de um electrão num estado φk é
p = ~k.
(5.25)
A dependência espacial(g) da função de onda dos electrões é então
1
φp = √ eip·r/~ .
V
(5.26)
Resolvemos a equação de Schrödinger supondo que os electrões são livres. No entanto, esta suposição só é válida no interior do metal. Na sua superfı́cie, os electrões
sentem uma força, de natureza electrostática, que os impede de sair. Impomos esta
restrição na função de onda dos electrões através de condições fronteira que esta
função deve satisfazer sobre a superfı́cie do metal. As condições que impomos são,
de novo, as condições fronteira periódicas, por razões semelhantes às que justificaram esta escolha no capı́tulo anterior. Assim, impomos as seguintes condições às
soluções da equação de Schrödinger(h) (ver Figura 5.6).
1
φk (r) = √ eik·r
V
1
√ eik·[(x+L)ex +yey +zez ]
V
1 ik·[xex +(y+L)ey +zez ]
√ e
V
1 ik·[xex +yey +(z+L)ez ]
√ e
,
V
=
=
=
de onde resultam as equações de quantização para o vector de onda, k,
kx
=
ky
=
kz
=
2π
n
L
2π
m
L
2π
l,
L
(5.27)
com n, m, l inteiros arbitrários. Só os vectores de onda k cujas componentes
satisfazem (5.27) são permitidos para os electrões de condução no metal. Estes
vectores definem uma rede cúbica simples, de parâmetro 2π/L.
z
Lx
U=∞
Lz
U=0
y
x
Ly
Figura 5.6: Poço de potencial tridimensional. A energia é nula dentro da caixa de
dimensões Lx Ly Lz e infinito fora desta.
(g) A
~
dependência temporal é, apenas, ξ(t) = exp (−iεt/ ).
simplificar, consideramos o metal com forma cúbica, de aresta L.
(h) Para
83
Os estados quânticos dos electrões são identificados pelos valores das componentes do vector de onda k, e pela orientação do seu spin, que, neste caso(i) , só pode
tomar dois valores, com os nomes “para cima” (ou up, do inglês) e “para baixo” (ou
down). O princı́pio de exclusão de Pauli proı́be que dois fermiões idênticos ocupem
o mesmo estado quântico, de forma que pode haver, no máximo, dois electrões com
o mesmo vector de onda k: um com spin up, o outro com spin down.
5.4.2
A densidade de estados electrónicos
Tal como fizemos no capı́tulo anterior para a densidade electrónica de modos de vibração (ou, equivalentemente, a densidade de estados de fonões), pretendemos agora
determinar a densidade de estados electrónicos. Isto é, pretendemos determinar a
função g(ε) tal que o número de estados electrónicos com energia compreendida entre ε e ε + dε seja g(ε)dε. Esta determinação será decalcada da seguida no capı́tulo
anterior para a densidade de modos de vibração: notamos que a “relação de dispersão”, ε = ε(k), é isotrópica, isto é, só depende do módulo do vector de onda;
então o número de estados com energia compreendida entre ε e ε + dε é igual ao
existente na camada esférica oca com raios k e k + dk correspondentes àqueles valores de energia; é agora fácil contar o número destes estados usando as equações
de quantização (5.27). Vejamos, então. O volume da camada esférica oca de raios
k e k + dk é 4πk 2 dk; o número de vectores de onda permitidos presentes nesta
porção de espaço-k é aproximadamente igual à razão entre o seu volume e o volume ocupado por cada modo quântico, que, de acordo com (5.27), é (2π)3 /V , onde
V é o volume do cristal; finalmente, para cada vector de onda k há dois estados
possı́veis, correspondentes às duas orientações do spin electrónico. O número de
estados electrónicos com energia compreendida entre ε e ε + dε é então
dn = 2 ×
=
V
4πk 2 dk
(2π)3 /V
k2
dk.
π2
(5.28)
A relação de dispersão (ou seja, a relação entre a energia e o vector de onda) é a
expressa em (5.24), de onde obtemos por diferenciação
dε =
~2
k dk.
m
(5.29)
Substituindo em (5.28) resulta
dn =
=
V m
k dε
π 2 ~2
V √ 3
2m ε dε,
π 2 ~3
(5.30)
onde se usou (5.24) para substituir k. A função densidade de estados é então
g(ε) =
5.4.3
V √
π 2 ~3
2m3 ε.
(5.31)
O estado fundamental de um gás de fermiões
Vamos agora considerar o gás de fermiões no estado fundamental, isto é, no estado
de menor energia. Antes de começar, é importante desfazer eventuais confusões de
nomenclatura. Cada electrão no gás de fermiões ocupa um dado estado individual,
(i) Recorde-se
que os electrões têm spin 1/2.
84
caracterizado por um dado vector de onda k e uma dada orientação de spin, estado
esse a que corresponde uma certa energia, ε, do electrão que o ocupa. O conjunto
dos electrões de valência num metal define o gás de fermiões de condução, gás esse
que também é caracterizado por estados, mas que são agora estados colectivos, no
sentido em que as suas propriedades se podem determinar a partir das dos estados
individuais ocupados por cada um dos electrões que formam o gás.
O estado fundamental do gás de electrões é aquele que, de entre todos os estados possı́veis, apresenta o menor valor para a energia. Logo, neste estado, todos
os electrões que formam a nuvem de condução devem ocupar estados individuais
com uma energia o menor possı́vel. Do ponto de vista clássico, estes estados são
aqueles em que os electrões se encontram imóveis, e portanto apresentam o valor
mı́nimo para a sua energia cinética, ou seja, zero. No entanto, quanticamente esta
situação é impossı́vel. Com efeito, estando todos os electrões imóveis, todos apresentam vector de onda k = 0. Ora, já notámos que o princı́pio de exclusão de Pauli
não permite mais do que dois electrões com o mesmo vector de onda, cada um com
sua orientação de spin. O quadro clássico para o estado fundamental de um gás de
electrões é pois, à luz da mecânica quântica, uma impossibilidade. Sendo assim, o
estado fundamental de um gás de fermiões deve ser construido ocupando, com os
electrões de condução, estados quânticos individuais de energias progressivamente
mais elevadas, começando pelos de menor energia, até que todos os electrões de
condução estejam desta forma “estacionados”. Uma vez que a energia dos estados
electrónicos depende apenas do módulo do vector de onda, devemos, nesta construção, preencher primeiro estados caracterizados por vectores de onda de módulo
menor.
O conjunto dos estados electrónicos ocupados no estado fundamental de um gás
de electrões define, no espaço-k, uma região com a forma de uma esfera: todos
os estados electrónicos com módulo do vector de onda, k, menor que um certo
limiar kF estão ocupados; os restantes, com k ≥ kF , apresentam-se desocupados.
A esta esfera, que representa o estado fundamental de um gás de fermiões (neste
caso, electrões de condução num metal) dá-se o nome de esfera de Fermi ; ao raio
desta esfera, dá-se o nome de raio de Fermi ; chama-se energia de Fermi ao valor
da energia dos electrões que ocupam estados na superfı́cie da esfera de Fermi, e,
evidentemente, relaciona-se com o raio de Fermi através de
εF =
~2 2
k ;
2m F
(5.32)
define-se ainda a temperatura de Fermi, através de TF = εF /kB , onde kB é a
constante de Boltzmann, como sendo o valor da temperatura necessário para que
um número apreciável de fermiões adquiram uma energia cinética comparável com
a energia de Fermi.
Os valores destas grandezas, que caracterizam o estado fundamental de um gás
de electrões, podem ser todos calculados a partir do valor da densidade electrónica
de condução, que, por seu turno, é facilmente estimável em situações concretas. O
cálculo destas quantidades parte do facto de que o número de estados electrónicos
no interior da esfera de Fermi é, por construção, igual ao número total de electrões
de condução, N , presentes no metal. Usando a função densidade de estados, obtida
na subsecção anterior, esta igualdade traduz-se por
Z
N=
εF
dε g(ε),
(5.33)
0
já que no lado esquerdo temos o número total de electrões e, à direita, o número
total de estados electrónicos ocupados. Substituindo em (5.33) o resultado (5.31),
Elemento
Li
Na
Cu
Au
n(m−3 )
4,68×1028
2,64×1028
8,40×1028
5,90×1028
εF (eV)
4,74
3,24
7,00
5,53
85
TF (K)
5,51×104
3,77×104
8,16×104
6,42×104
kF (m−1 )
1,12×1010
0,92×1010
1,36×1010
1,21×1010
vF (m/s)
1,29×106
1,07×106
1,57×106
1,40×106
Tabela 5.2: Valores das grandezas “de Fermi” para alguns elementos.
obtemos
n≡
N
V
√
=
=
Z
√
2m3 εF
dε ε
2
3
π ~
0
p
2 2m3 ε3F
,
3 π 2 ~3
(5.34)
onde se representou por n a densidade electrónica. De (5.34), podemos determinar
o valor da energia de Fermi (supondo conhecido valor da densidade electrónica),
a partir do qual se calcula facilmente o valor de kF , TF , etc. Para a maioria dos
metais, a energia de Fermi apresenta valores de cerca de alguns eV(j) .
O estado fundamental do gás de electrões de condução só pode ser produzido
experimentalmente a uma temperatura de zero Kelvin (ou muito próxima deste
limite) uma vez que, a temperaturas mais elevadas o número de fonões no metal
é elevado, e estes podem comunicar energia à nuvem electrónica, excitando alguns
electrões para fora da esfera de Fermi.
5.4.4
O gás de electrões de condução à temperatura ambiente
De acordo com o que se acabou de discutir, a uma temperatura T diferente do zero
absoluto, alguns átomos encontram-se em nı́veis de vibração excitados e podem,
decaindo para estados vibracionais de menor energia, excitar electrões, aumentando
assim a energia do gás de electrões. Este processo pode entender-se como a troca de
um fonão entre o átomo (que o emite) e o electrão (que o absorve). A variação de
energia sofrida pelo átomo e pelo electrão é igual à energia transportada pelo fonão.
Supondo que neste processo o átomo decai para o nı́vel energético fundamental, a
energia do fonão emitido é exactamente igual à energia de excitação do estado inicial.
Nesta hipótese, então, a energia dos fonões é igual à energia de excitação dos átomos
que os emitiram, e portanto a energia média dos fonões é igual à energia média de
vibração dos átomos. Mas não há, à priori, qualquer razão para acreditarmos que
todas as des-excitações atómicas se fazem para o estado fundamental, de forma
que poderemos apenas afirmar que, a uma dada temperatura, a energia média dos
fonões é da ordem de grandeza da energia média de vibração dos átomos, ou seja,
kB θE /(exp(θE /T ) − 1), usando o modelo de Einstein, para simplificar a discussão.
Mas a temperatura de Einstein de muitas substâncias é da ordem de grandeza da
temperatura ambiente, de forma que exp(θE /T ) − 1 ≈ exp 1 − 1 ≈ 1. A energia
média dos fonões à temperatura ambiente é então cerca de kB T ≈ 0, 03 eV, ou
seja, cerca de uma centésima parte da energia de Fermi. Os cálculos que acabámos
de efectuar são apenas uma estimativa grosseira, mas mostram claramente que as
energias disponı́veis para excitar os electrões são, à temperatura ambiente, uma
fracção muito reduzida da energia de Fermi. Sendo assim, apenas aqueles electrões
que ocupam estados muito próximos da superfı́cie de Fermi (aqueles cuja energia
difere de εF por menos do que kB T ) podem ser excitados, já que os restantes
(j) 1 eV (lê-se electrão-Volt) é a energia adquirida por um electrão acelerado por uma diferença
de potencial de 1V, ou seja, 1 eV' 1, 6 × 10−19 J.
86
(profundamente “enterrados” na esfera de Fermi) iriam, após a excitação, ocupar
estados já ocupados, o que é impossı́vel nos termos do princı́pio de exclusão de Pauli.
À temperatura ambiente, a configuração da nuvem electrónica no espaço-k consiste
ainda numa esfera (como a 0 K), mas que apresenta um ligeiro “esboroamento” da
sua superfı́cie, sendo possı́vel encontrar estados desocupados no seu interior e, em
igual número, estados ocupados no exterior.
Este facto marca a principal diferença relativamente ao tratamento clássico da
nuvem electrónica, e iremos mais adiante abordar as suas consequências.
5.4.5
A distribuição de Fermi-Dirac
À temperatura de zero Kelvin, todos os estados electrónicos com energia inferior
ou igual à energia de Fermi estão ocupados. A densidade de probabilidade para
que um estado de energia ε esteja ocupado é então, para T = 0 K e à parte uma
constante de normalização,
½
fT =0 K (ε) =
1,
0,
se ε ≤ εF
se ε > εF .
(5.35)
À temperatura ambiente, em contrapartida, da discussão precedente concluimos
que quase todos os estados quânticos com energia pequena (quando comparada
com a do nı́vel de Fermi) estão ocupados; a fracção de estados ocupados só decresce
sensivelmente em nı́veis com energia muito próxima de εF , numa região com largura
aproximadamente igual a kB T . Pode mostrar-se (mas não o faremos aqui) que a
função que descreve esta situação é a chamada função de distribuição de FermiDirac,
1
fT (ε) = (ε−µ)/k T
,
(5.36)
B
e
+1
onde µ é o potencial quı́mico do sistema. O limite da distribuição de Fermi-Dirac
quando T → 0 deve ser a expressão (5.35), e podemos então concluir que
lim µ = εF .
T →0
(5.37)
Quando a temperatura sobe, o valor do potencial quı́mico decresce ligeiramente;
mas, mesmo à temperatura ambiente, o seu valor mantém-se muito aproximadamente igual ao da energia de Fermi. Por esta razão, não é, frequentemente, feita
qualquer distinção entre os dois.
Na Figura 5.7 está representada a forma da função de distribuição de FermiDirac para T = 0 K e para temperaturas não nulas.
O facto de apenas alguns electrões serem excitados quando, partindo do estado
fundamental, se aquece o gás de electrões de condução até à temperatura ambiente,
tem, como deve ser evidente, um efeito determinante sobre o calor especı́fico da
nuvem electrónica. Com efeito, a energia total (da nuvem electrónica) não deve,
neste aquecimento, aumentar tanto quanto o previsto usando o tratamento clássico,
baseado na função de distribuição de Maxwell-Boltzmann. O número de electrões
que ocupam estados excitados à temperatura ambiente representa uma fracção tão
pequena do total, que a energia do gás de electrões de condução difere muito pouco
da do estado fundamental do gás. A contribuição principal para o calor especı́fico
dos metais a temperaturas não excessivamente altas é então a fornecida pela rede
de iões e portanto verifica-se, mesmo para metais, a lei de Dulong e Petit (ver o
capı́tulo anterior).
87
1
6000
3000
600
0
K
K
K
K
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
Figura 5.7: Gráfico da função de distribuição de Fermi-Dirac, para T = 600 K (a
tracejado), T = 3000 K (a pontilhado) e T = 6000 K (a cheio). O valor da energia de
Fermi usado neste exemplo foi de εF = 5 eV.
(†)Variação do potencial quı́mico com a temperatura: Aproximação de
Sommerfeld
Como acabamos de constatar, para temperaturas superiores ao zero absoluto, T >
0◦ K, os estados de energia imediatamente superiores à energia de Fermi são ocupados e o nı́vel de Fermi passa a ser designado pelo nı́vel de energia com 50%
de probabilidade de ocupação. Este facto, vai implicar que o nı́vel de Fermi baixe
ligeiramente com o aumento de temperatura. Podemos justificar esta variação constatando que, a função de distribuição de Fermi-Dirac, f (ε), é assimétrica em εF para
todas as temperaturas, porém a função densidade de estados g(²) aumenta com a
energia e à medida que a temperatura aumenta existe uma porção crescente da
população total dos fermiões que ocupa estados de maior energia. Como o número
total de electrões tem de se manter constante; isto é, as áreas da Figura 5.8 têm de
ser iguais, e o nı́vel εF (T ) para o qual f (εF (T )) = 1/2 (k) tem de ser deslocado sucessivamente para valores mais baixos com o aumento de temperatura. Assim, para
determinarmos a variação do nı́vel de Fermi podemos partir do cálculo do número
total de electrões de condução que deve permanecer constante independentemente
da temperatura, e que podemos escrever do seguinte modo,
·Z
εF
N=
¸
dε g(ε)
0
·Z
∞
=
T =0
¸
dε f (ε) g(ε)
0
.
(5.38)
T >0
O cálculo do primeiro termo de (5.38) já foi efectuado atrás em (5.34). O segundo
termo pode ser calculado usando a aproximação de Sommerfeld. Nesta aproximação
começamos por calcular o integral
Z
N=
∞
dε f (ε) g(ε),
(5.39)
0
(k) ε (T ), corresponde ao nı́vel de fermi para T > 0 K, que por definição é o nivél energético com
F
50% de probabilidade de ocupação.
88
f(ε) g(ε )
1
T=0K
área = área
0.8
0.6
0.4
T>0K
0.2
ε
0
ε
F
Figura 5.8: Representação gráfica, normalizada, de f (ε) g(ε), para T = 0◦ K e T >
0◦ K.
por partes, do seguinte modo
Z ∞
Z
∞
dε f (ε) g(ε) = [f (ε) G(ε)]0 −
0
=
∞
dε f 0 (ε) G(ε)
Z
limε→∞ f (ε) G(ε) − f (0) G(0) −
0
∞
dε f 0 (ε) G(ε),
0
em que
Z
G(ε)
=
dε g(ε)
ε
3
V
(2mε) 2
3~3 π 2
=
(5.40)
é a primitiva da função densidade de estados. Atendendo às propriedades da função
de distribuição de Fermi-Dirac, temos que quando a energia ε → ∞ a função
f (ε) → 0, e quando a energia ε = 0 a a função f (ε) = 1 e G(ε) = 0. Deste
modo (5.39) reduz-se a
Z
∞
N =−
dε G(ε) f 0 (ε).
(5.41)
0
A derivada da função de Fermi-Dirac, f 0 (ε), vai ter um papel importante neste
cálculo, pois vai-nos permitir fazer um aproximação bastante razoável. Vejamos,
derivando (5.36) obtemos
0
f (ε) = −
e
kB T (e
(ε−εF )
kB T
(ε−εF )
kB T
.
(5.42)
+ 1)2
A função (5.42) tem a forma de função delta-Dirac, δ(εF ), quando T → 0 K (derivada da função degrau) e é aproximadamente uma função delta-Dirac de largura
finita quando T > 0 K (ver Figura 5.9). Tendo em conta que o nı́vel de Fermi é
ordens de grandeza superior que às energias disponı́veis para os fermiões poderem
mudar de estado, a função (5.42) só tem valor expressivo na vizinhança da energia
de Fermi. Assim, será válido fazer uma aproximação em série de Taylor da função
G(ε) em torno da energia de Fermi, εF , que desenvolvida até à segunda ordem pode
ser escrita do seguinte modo,
1
G(ε) = G(εF ) + (ε − εF )G0 (εF ) + (ε − εF )2 G00 (εF ) + O(ε − εF )3 ,
2
(5.43)
f( ε )
89
-f´( ε)
1
T=0 K
T>0 K
1/2
εF
ε
εF
(a)
ε
(b)
Figura 5.9: (a) Função de distribuição de Fermi-Dirac; (b) Simétrico da derivada da
função de Fermi-Dirac, −f 0 (ε). Esta função aproxima-se de uma função delta-Dirac
quando T → 0
onde O(ε−εF )3 representa os termos de ordem superior que vamos nesta abordagem
desprezar. Aplicando (5.43) em (5.41) resulta,
Z ∞
Z ∞
0
0
N = −G(εF )
dεf (ε) − G (εF )
dεf 0 (ε)(ε − εF )
0
0
Z ∞
1
− G00 (εF )
(5.44)
dεf 0 (ε)(ε − εF )2 .
2
0
O primeiro integral em (5.44) pode ser resolvido usando a mudança de variável,
x=
e fica simplesmente
Z
∞
ε
dx
− K FT
B
(ε − εF )
,
kB T
ex
≈
x
(e + 1)2
Z
(5.45)
∞
dx
−∞
(ex
ex
= 1,
+ 1)2
(5.46)
porque εF >> kB T .
O segundo integral em (5.44), após a mudança de variável (5.45) pode ser escrito
da seguinte forma,
Z ∞
ex x
kB T
dx x
=0
(5.47)
(e + 1)2
−∞
o que é esperado já que a função de Fermi-Dirac é assimétrica em relação ao nı́vel
de Fermi, εF , e consequentemente o resultado da integração da sua derivada, f 0 (ε)
com qualquer função impar, como é o caso da função integranda e em (5.47) e de
todos os termos de ordem impar da expansão de Taylor (5.43), é nulo.
Finalmente para o terceiro integral em (5.44) obtemos, após a mudança de
variável (5.45), um valor que é função da temperatura,
Z ∞
2
ex x2
2π
2
dx x
=
(k
T
)
(5.48)
(kB T )
B
2(e + 1)2
6
−∞
Conjugando os resultados de (5.46), (5.47) e (5.48), o número total, N , de
electrões de condução é,
N = G(εF ) + G00 (εF )(kB T )2
π2
.
6
(5.49)
Como sabemos o nı́vel de Fermi diminui ligeiramente o seu valor comparado com
o nı́vel de Fermi a 0◦ K, εF (0). Podemos deste modo e sem cometer um grande
90
erro aproximar o valor da função G(ε) em ε = εF , integrando até εF (0) (nı́vel de
Fermi no zero absoluto) e subtraindo uma coluna de de largura εF (0) − εF , e altura
g(εF (0)), do seguinte modo
Z εF
G(εF ) =
dε g(ε)
Z
0
εF (0)
=
dε g(ε) − [εF (0) − εF ] g(εF (0)).
(5.50)
0
Assim (5.49) toma seguinte forma
Z
N=
εF (0)
dε g(ε) + [εF − εF (0)] g(εF (0)) + (kB T )2
0
usando,
π2 0
g (εF (0)).
6
(5.51)
G00 (ε) = g 0 (ε).
Mas como já sabemos de (5.34),
Z
εF (0)
N=
dε g(ε),
0
logo o número total de electrões, N , em (5.51) anula-se e ficamos com uma expressão
que relaciona, o nı́vel de Fermi no zero absoluto, com o nı́vel de Fermi a uma
temperatura diferente de zero,
[εF − εF (0)] g(εF (0)) + (kB T )2
π2 0
g (εF (0)) = 0.
6
(5.52)
Para efectuarmos o cálculo (5.52) é conveniente redefinir a expressão densidade de
estados em função do nı́vel de Fermi no zero absoluto, εF (0), usando (5.31) e (5.34),
da seguinte forma,
3
ε1/2
g(ε) = N
.
(5.53)
2 (εF (0))3/2
Assim, substituindo
g(εF (0)) =
g 0 (εF (0)) =
3
N (εF (0))−1
2
3
N (εF (0))−2
4
em (5.52) obtemos, finalmente, a variação do nı́vel de Fermi com a temperatura:
"
µ
¶2 #
π 2 kB T
.
(5.54)
εF = εF (0) 1 −
12 εF (0)
5.4.6
Energia de um gás de fermiões para T > 0 K
A energia de um gás de fermiões a temperaturas diferentes do zero absoluto é
calculada usando a relação de energia,
Z ∞
E(T ) =
dε g(ε) f (ε)ε.
(5.55)
0
Podemos usar de novo a aproximação de Sommerfeld. Para esse efeito vamos definir
a função, h(ε), tal que,
h(ε) = ε g(ε).
91
A expressão para a energia (5.55) é agora
Z
E
∞
=
dε h(ε) f (ε)
0
= H(εF ) +
π 2 00
H (εF )(kB T )2 .
6
(5.56)
onde a função H(ε) é a primitiva de h(ε),
Z
H(ε) = dε0 ε0 g(ε0 ).
ε
Usando a mesma aproximação usada em (5.50) para o cálculo da variação do nı́vel
de Fermi, a função H(εF ) pode ser expressa como,
Z
εF (0)
H(εF ) =
dε ε g(ε) + [εF − εF (0)] εF (0) g(εF (0)),
(5.57)
0
e a segunda derivada de H(εF ) no ponto εF pode ser aproximada a
H 00 (εF ) ≈ εF (0) g 0 (εF (0)) + g(εF (0)).
(5.58)
Assim a contribuição energética dos electrões, calcula-se substituindo (5.57)
e (5.58) em (5.56), obtendo,
µ
¶
π2
dε ε g(ε) + εF (0) [εF − εF (0)] g(εF (0)) + (kB T )2 g 0 (εF (0)) +
6
0
2
π
+g(εF (0))(kB T )2 .
(5.59)
6
Z
E
=
εF (0)
onde, se tivermos em atenção (5.52), o segundo termo desta expressão (5.59) é nulo,
pelo que se obtem a expressão simplificada seguinte,
Z
εF (0)
E=
dε ε g(ε) + g(εF (0))(kB T )2
0
π2
,
6
(5.60)
que pode após subistituição do valor da energia do gás de fermiões no zero absoluto,
obtemos finalmente
"
µ
¶2 #
5 2 kB T
3
.
(5.61)
E = N εF (0) 1 + π
5
12
εF (0)
5.4.7
Calor especı́fico
Estamos agora em condições de poder calcular a contribuição dos fermiões para o
calor especı́fico de um sólido através da definição usual,
µ
¶
∂E
CV =
.
∂T V
Usamos a expressão da energia (5.61), obtemos,
cV =
2
T
π 2 kB
N
.
2 εF (0)
(5.62)
92
Substituindo a densidade electrónica em (5.62) por o número de Avogardo, NA ,
obtemos o calor especı́fico molar,
CV
=
=
kB 2 T
π2
NA
2
εF (0)
π2 T
R .
2 TF
(5.63)
onde TF representa a temperatura de Fermi dada por, TF = εF /kB .
O quociente entre temperatura ambiente e a temperatura de Fermi para os
metais tem valores tı́picos entre 1/300 a 1/50 o que, como já se esperava, torna
a contribuição para valor do calor especı́fico dos electrões bastante pequena, em
conformidade com a lei de Dulong e Petit, e contraria o valor previsto pelo modelo
clássico de Drude-Lorentz.
A baixas temperaturas (< 4◦ K) esta contribuição calor especı́fico torna-se dominante em relação à contribuição das oscilações dos iões da rede cristalina. Será
assim pertinente apresentar uma relação “refinada”, para baixas temperaturas, que
contenha ambas contribuições para o calor especı́fico molar de um metal:
µ ¶3
1 2 T
12 4
T
CV = π R
+ π R
,
(5.64)
2
TF
5
θD
onde θD , é a temperatura de Debye do metal.
5.4.8
A condutividade eléctrica
Como acabámos de discutir, os electrões mais profundamente “enterrados” na esfera
de Fermi estão congelados, no sentido em que não podem, à temperatura ambiente,
sofrer excitações de origem térmica. Vimos que, por esta razão, a nuvem electrónica
contribui muito pouco para o calor especı́fico dos metais.
Poder-se-ia pensar que este “congelamento” impede também a nuvem electrónica
de contribuir para a condutividade eléctrica, já que, também aqui, é necessário que
pelo menos alguns electrões sejam excitados. Com efeito, na ausência de campos eléctricos externos e no estado fundamental, a distribuição das velocidades
electrónicas tem simetria esférica, ou seja, dado um qualquer electrão com velocidade v (vector de onda k), existe outro com velocidade −v (vector de onda −k)
cuja contribuição para a corrente eléctrica anula a do primeiro. Como, no estado
fundamental, todos os electrões estão desta forma “emparelhados”, a corrente total
é nula(l) . Para que se verifique condução eléctrica é pois necessário que (pelo menos) alguns electrões sofram uma transição para um estado “desemparelhado”, no
exterior da esfera de Fermi. Como o número de electrões em estados com energia
acima da do nı́vel de Fermi aumenta com a temperatura, poderı́amos pensar que
também a condutividade eléctrica dos metais seria maior a temperaturas maiores,
tomando valores muito baixos para temperaturas próximas do zero absoluto. Ora,
esta conjectura contraria flagrantemente os dados experimentais. A condutividade
dos metais é, regra geral, uma função decrescente da temperatura.
Na discussão acima, cometemos o erro de supor que a população electrónica dos
estados exteriores à esfera de Fermi tem apenas origem térmica, isto é, que apenas
por absorção de energia vibracional da rede cristalina se podem promover transições
electrónicas. Isto é evidentemente errado! São possı́veis trocas de energia com um
campo eléctrico externo, que contribuem determinantemente para a população de
electrões em estados “desemparelhados”. Um campo eléctrico externo muda o estado de todos os electrões na nuvem de condução, comunicando-lhes uma aceleração
(l) Note-se que este resultado não é nada de estranhar, já que, desde o inı́cio, estamos a supôr
que o campo eléctrico aplicado é nulo...
93
oposta à direcção do campo (recordemos que a carga dos electrões é negativa). Este
efeito, conjugado com a possibilidade de colisões com a rede cristalina, com defeitos,
com fonões, tem como resultado que cada electrão atinge uma velocidade limite, e
a diferença (vectorial) entre este limite e a velocidade inicial é a mesma para todos
os electrões. Dada a relação entre as velocidades v e os vectores de onda k dos
electrões, tudo se passa como se a esfera de Fermi, inicialmente centrada na origem
do espaço-k, sofresse um deslocamento δ na direcção oposta à do campo aplicado
(ver a Figura 5.10).
ky
ky
kx
kx
E
Figura 5.10: À esquerda, a esfera de Fermi na ausência de campo eléctrico. Os estados
ocupados (zona sombreada) apresentam, no espaço-k simetria esférica e portanto a
velocidade média, tomada para todos os electrões, é nula. À direita, a esfera de Fermi
quando se aplica um campo eléctrico. O conjunto dos estados presentes na zona
cinzento-claro apresenta um valor médio da velocidade nulo; os estados na região
indicada a cinzento-escuro, que também estão ocupados, contribuem todos para a
corrente eléctrica.
Se designarmos por τ o tempo médio de colisão, cada electrão vai sofrer uma
modificação na sua velocidade de cerca de −eτ E/m(m) , uma variação de momento
(p = mv) de −eEτ e uma variação de vector de onda (k = p/~) de −eEτ /~, que
deve agora ser o valor médio do vector de onda. Uma vez que todos os electrões vão
sofrer esta transição de estado, o princı́pio de exclusão de Pauli não se aplica.
A média das velocidades dos electrões deve agora ser < v >= ~/m < k >=
−eτ /mE. A densidade de corrente, j = ρ < v >= −ne < v >, vem então
j=
ne2 τ
E,
m
onde n é o número de electrões de condução por unidade de volume. Comparando
esta expressão com a da lei de Ohm (j = σE), obtemos a forma da condutividade
eléctrica:
ne2 τ
σ=
.
m
Este foi o resultado obtido no estudo clássico (ver a Secção 5.2.2). Apesar das
diferenças importantes entre as duas abordagens ao problema da condução eléctrica,
a expressão da condutividade como função das caracterı́sticas do material em que
se processa, apresenta a mesma forma nas descrições clássica e quântica.
O livre caminho médio dos electrões de condução pode ser obtido multiplicando
o módulo da sua velocidade pelo tempo médio de colisão. Nesta descrição quântica
que temos vindo desenvolver, os electrões apresentam valores muito dı́spares de velocidade. Com efeito, os electrões que estão próximos da superfı́cie de Fermi ocupam
(m) Esta
expressão é simplesmente a que resulta do estudo do movimento uniformemente acelerado
de uma partı́cula de massa m, sob a acção de uma força constante −eE , durante um intervalo de
tempo τ .
94
estados com vectores de onda cujos módulos são muito superiores aos daqueles em
estados mais profundamente enterrados na esfera de Fermi. Sendo assim, haverá
electrões com diferentes valores para o livre caminho médio. Por exemplo, para o cobre, σ = 5, 8×107 Ω− 1 m− 1 e n = 8, 4×102 8 m− 3, de onde resulta τ = 2, 5×10−14 s.
A velocidade dos electrões que ocupam estados no nı́vel de Fermi pode ser calculada a partir da densidade electrónica, n, obtendo-se vF = 1, 6 × 106 m/s. O livre
caminho médio para um electrão no nı́vel de Fermi de um cristal de cobre é então
λ ≈ 390 Å, ou seja, cerca de 100 vezes as distâncias interatómicas tı́picas!
Vemos assim que o problema do livre caminho médio de que enfermava o modelo
clássico de electrões livres não é eliminado nesta descrição quântica. De facto, este
problema não é eliminado senão quando se consideram as interacções dos electrões
de condução com a rede cristalina.
5.5
Crı́tica dos modelos de electrões livres
Tanto o modelo clássico de Drude como o modelo quântico de Sommerfeld apresentam graves deficiências. À parte a questão do calor especı́fico dos metais (e algumas
outras propriedades que não abordámos), os dois modelos apresentam inconvenientes semelhantes, alguns dos quais são:
(a) Não fornecem explicação para a existência de metais com coeficientes de Hall
positivos;
(b) não descrevem correctamente a dependência da condutividade com a temperatura. Em particular, o caso de certos materiais cuja condutividade aumenta
com a temperatura, em certos intervalos de temperatura;
(c) nalguns condutores, a condutividade depende da orientação do campo eléctrico, facto incompreensı́vel numa teoria de electrões livres;
(d) Os modelos de electrões livres não respondem à pergunta mais imediata: Porque é que alguns sólidos são condutores e outros não?
Para responder a este e outros problemas, teremos que considerar as interacções
entre os electrões de condução e a rede cristalina. De facto, os electrões nos sólidos
não são livres e esperar que um modelo que os trate como tal seja capaz de descrever
com exactidão todas as propriedades electromagnéticas dos sólido é certamente
optimismo em demasia.
PROBLEMAS
5.1 Relacione a probabilidade de colisão por unidade de tempo, γ, com o tempo médio
de colisão τ .
5.2 Prove, a partir da definição de densidade de corrente, j = ρl v , que a corrente
total que passa através de uma superfı́cie S é igual ao fluxo de j através de S,
Z
i=
S
j · n̂dS,
onde n̂ é um vector unitário que, em cada ponto da superfı́cie S, lhe é perpendicular.
5.3 Relacione kF com ²F com pF .
5.4 Calcule a energia do estado fundamental de fermiões.
5.5 Escreva a expressão da energia de um gás de fermiões num estado arbitrário.
5. Problemas
5.6 A resposta ao Problema 4 é E = 3/5 N ²F onde N é o número total de fermiões
no gás e ²F é energia de Fermi. Obtenha a expressão da pressão do gás de
fermiões (p = ∂E/∂V ) e do módulo de compressibilidade (B = −V ∂p/∂V ) de
um gás de fermiões no estado fundamental.
5.7 O lı́tio tem condutividade eléctrica de σ =1,05×107 Ω−1 m−1 e uma densidade
atómica de 4,80×1028 átomos por metro cúbico.
(a) Determine a velocidade de condução média dos electrões no metal quando
se aplica um campo eléctrico de 100 V/m, e compare o valor obtido com a
velocidade dos electrões no nı́vel de Fermi.
(b) Determine a velocidade dos electrões cuja energia é igual à energia média
dos electrões no cristal, segundo o modelo de Sommerfeld.
(c) Determine a velocidade média dos electrões à temperatura de 300 K, segundo o modelo de Drude-Lorentz.
5.8 O sódio tem densidade de ρ =0,97×103 kg/m3 , uma massa atómica relativa de
23 e condutividade eléctrica de 2, 1 × 107 Ω−1 m−1 . Determine a mobilidade dos
electrões no sódio.
5.9 A densidade do bário é de 3, 5 × 103 kg/m3 e a massa atómica relativa é 137.
Sabendo que este elemento tem dois electrões de valência, determine o raio da
esfera de Fermi e o valor da energia de Fermi correspondente.
5.10 Determine o valor do nı́vel de Fermi para o Cobre no zero absoluto e mostre que a
variação do nı́vel de Fermi com a temperatura no intervalo [0 K-300 K] não excede
aproximadamente 0,001%. O cobre tem uma densidade de 8, 93 × 103 kg/m3 e
massa relativa de 63, 5.
5.11 Determine a energia dos electrões no nı́vel de Fermi, e o coeficiente de proporcionalidade α relativo à contribuição da energia dos electrões para o calor especı́fico
dos sólidos, partindo do valor a = 4, 225 Å referente ao parâmetro da célula
convencional cúbica da rede associada a este elemento.
5.12 Partindo da aproximação de Debye e do modelo de electrões livres, compare as
contribuições da energia fonões e dos electrões para o calor especı́fico do potássio
à temperatura de 0,1, 1 e 10 K. A temperatura de Debye para o potássio é de
89 K, e parâmetro da célula convencional cúbica da rede associada a este elemento
é a = 5, 225 Å.
5.13 A grafite é um cristal laminar em que os átomos de carbono estão distribuı́dos
(para uma determinada camada) nos vértices de hexágonos regulares de lado
d = 1, 42 Å, que se encaixam entre si. Os electrões de valência da grafite, à
razão de um electrão por átomo, podem mover-se basicamente no dito espaço
bidimensional. Suponha que estes electrões são livres. Usando o modelo de
Sommerfeld para estas camadas bidimensionais, determine:
(a) a densidade electrónica;
(b) a densidade de estados, g(ε);
(c) a energia de Fermi;
(d) a energia espectável dos electrões à temperatura de zero Kelvin.
5.14 Considere um estado electrónico que tem probabilidade de ocupação de 95% a
um certa temperatura T . Derive uma expressão para, ε − εF , a sua energia
relativamente ao potencial quı́mico.
(a) Determine o valor de ε − εF para T = 100, 300 e 1200 K.
(b) Repita os cálculos para uma probabilidade de 5%.
(c) Comente os resultados obtidos.
Nota: Considere que o nı́vel de Fermi, εF , não varia com a temperatura.
5.15 O estrôncio tem uma estrutura cúbica de faces centradas de aresta a = 6, 08 Å.
95
96
(a) Usando o modelo de electrões livres de Sommerfeld determine o raio da
esfera de Fermi no zero absoluto.
(b) Determine a velocidade de um electrão com energia Fermi à temperatura
de 0◦ , 30◦ e 300◦ Kelvin. Comente os resultados.
(c) Determine a velocidade média de condução dos electrões quando sujeitos a
um campo eléctrico de 2,5 V/cm, sabendo que a condutividade eléctrica do
estrôncio a 20◦ C é de 1, 66 × 105 Ω−1 m−1 .
Capı́tulo 6
Metais II: Teoria de bandas
Deve ser evidente que alguns inconvenientes (de entre os que foram apresentados no
final do capı́tulo anterior) das teorias de electrões livres têm origem exactamente no
facto de se considerarem os electrões “desligados” de quaisquer interacções com o
meio onde se deslocam; o facto de a condutividade da grafite, por exemplo, depender
da direcção da corrente mostra bem que deve existir alguma interacção entre os
electrões e o cristal, que torna mais fácil o movimento em certas direcções que
noutras. É também evidente que uma teoria de electrões livres só se pode aplicar a
condutores, sendo portanto incapaz de explicar a razão de alguns sólidos o serem e
outros não.
Estas considerações são evidentes e poderiam ter sido feitas ainda antes de termos desenvolvido a teoria de electrões livres. Parece assim natural que um modelo
tenha em linha de conta a influência do meio cristalino sobre os electrões possa
resolver estas dificuldades. A teoria que vamos passar a descrever, não só classifica
estas questões, como explica as restantes, discutidas no Capı́tulo anterior, como os
elevados valores do livre caminho médio a baixa temperatura ou as colocadas pela
existência de sólidos cuja condutividade aumenta com a temperatura, que apresentam coeficientes de Hall positivos, etc.
6.1
Introdução
Nesta nova abordagem continuaremos a desprezar as interacções electrão-electrão.
A razão principal para esta aproximação é a complexidade da teoria completa, que
torna impraticável a sua resolução sem recorrer aos métodos, aproximados, da teoria quântica de muitos corpos. Com efeito, o problema é o seguinte: queremos
determinar a função de onda dos electrões, resolvendo a equação de Schrödinger.
Mas antes temos que determinar o potencial a que estão sujeitos. Ora, considerando
interacções electrão-electrão, só podemos conhecer o potencial depois de conhecida
a função de onda. Considerando, além disso, que a função de onda deve depender
das 3N coordenadas de posição dos N electrões, sendo N da ordem de 1020 , fica-se
com uma ideia da complexidade do problema. Felizmente, o modelo que iremos
desenvolver é notavelmente preciso, demonstrando-se assim, a postriori, que as interacções electrão-electrão são, de facto, pouco significativas na maior parte das
aplicações(a) .
Não considerando as interacções electrão-electrão, apenas as interacções com a
rede cristalina contribuem para a energia potencial dos electrões. Cada electrão
move-se numa região onde está definida uma função de potencial independente dos
(a) Uma
excepção importante desta afirmação é o caso da supercondutividade.
97
98
CAPÍTULO 6. METAIS II: TEORIA DE BANDAS
restantes electrões. A este tipo de aproximação para sistemas de muitos corpos
dá-se o nome de aproximação de partı́cula única, ou de partı́culas independentes.
Uma vez que a rede cristalina é (em primeira aproximação - ver Capı́tulo 4) um
arranjo periódico tridimensional de átomos, o potencial electrónico por ela estabelecido também deve ser periódico, com a mesma periodicidade da rede. Uma vez
que a força entre cargas de sinal contrário (os electrões e os iões que formam a rede)
é atractiva, o potencial electrónico deve apresentar mı́nimos nas posições ocupadas
pelos iões, como se mostra na Figura 6.1, numa representação unidimensional.
V(x)
x
a
a
a
Figura 6.1: Exemplo de potencial periódico unidimensional.
A resolução da equação de Schrödinger com um potencial periódico fica substancialmente simplificada pelo teorema de Bloch, que demonstramos na secção seguinte. Antes de o fazermos, podemos estudar de forma qualitativa a deformação
das orbitais atómicas quando aproximamos vários átomos uns dos outros. Quando
os átomos estão afastados uns dos outros, os electrões atómicos praticamente não
sentem interacções senão com o átomo a que pertencem, e portanto as orbitais são
essencialmente as previstas pela fı́sica atómica: um conjunto de nı́veis energéticos
designados pelos sı́mbolos 1s, 2s, 2p, etc(b) . Um esquema destes nı́veis está representado na Figura 6.2. Se aproximarmos deste átomo um outro, idêntico, cada um
E
V(x)
2p
2s
1s
Figura 6.2: Nı́veis de energia atómicos.
destes nı́veis subdivide-se em dois, sendo a separação tanto maior quanto maior for
a energia do nı́vel original (ver Figura 6.3). Se aproximarmos 3 átomos cada nı́vel
subdivide-se em 3 e assim sucessivamente. Se considerarmos agora um cristal, que
consiste num número elevado de átomos na vizinhança uns dos outros, cada nı́vel
atómico subdivide-se em tantos subnı́veis quantos forem os átomos que formam o
cristal. Estes subnı́veis estão tão próximos (em termos energéticos) uns dos outros
(b) Usou-se a notação espectroscópica (a mais habitual) para indicar os estados electrónicos. O
número inteiro representa o número quântico principal; a letra que o segue representa o momento
angular, de acordo com s → l = 0; p → l = 1; d → l = 2; etc. Assim, o estado 2p é o estado com
número quântico principal n = 2 e número quântico de momento angular l = 1.
6.1. INTRODUÇÃO
99
E
V(x)
2p
2s
1s
Figura 6.3: Nı́veis de energia numa molécula biatómica.
que não é possı́vel detectar a sua separação. Cada nı́vel subdivide-se então um
número enorme de vezes, criando assim uma banda de energias permitidas, como
mostra a Figura 6.4. Este desdobramento dos nı́veis atómicos pode ser ilustrado
E
V(x)
2p
2s
1s
Figura 6.4: Bandas de energia num cristal.
usando a teoria da perturbações. Outra alternativa é a resolução da equação de
Schrödinger numericamente (usando métodos que estão descritos em qualquer livro
de análise numérica) para uma partı́cula com uma energia potencial com uma série
de mı́nimos dispostos contiguamente.
É importante notar que neste desdobramento das orbitais atómicas não varia
o número total de estados electrónicos. Com efeito, quando se aproximam dois
átomos da mesma espécie quı́mica, cada orbital atómica divide-se em duas orbitais
moleculares, mas inicialmente temos dois átomos, cada qual com o seu conjunto de
orbitais atómicas, e no fim temos apenas uma molécula. As duas orbitais moleculares correspondentes a cada nı́vel atómico podem ver-se como combinações lineares
das duas orbitais atómicas (uma de cada átomo) que as originam.
Na Figura 6.4, os electrões que ocupam as bandas 1s e 2s estão localizados na
proximidade dos átomos a que pertencem, porque as suas energias não são suficientes
para ultrapassar as barreiras de potencial entre os átomos (estamos a desprezar a
possibilidade de efeito de túnel). Os electrões da banda 2p podem mover-se ao
longo do cristal, mas não se deve pensar por isso que estão livres de forças; uma
partı́cula livre pode ter qualquer energia(c) , ao passo que estes electrões têm uma
energia que deve estar compreendida entre os limites da banda a que pertencem.
Um análogo clássico do movimento destes electrões consiste numa esfera movendo-se
num terreno ondulado, com energia suficiente para vencer a altura das ondulações
do terreno.
(c) Descontando o efeito de quantizações resultantes da imposição de condições fronteira que, de
resto, é insignificante, neste contexto.
100
No estado fundamental (à temperatura de 0 K), somente as bandas de menor
energia estão ocupadas pelos electrões; destas, a de maior energia tem particular
importância para o estudo das propriedades dos sólidos, e designa-se por banda de
valência do sólido. Esta designação é herdada do nome da orbital atómica (também
designada por orbital de valência) que lhe dá origem.
Vamos agora estudar as propriedades das funções de onda de electrões que se
movem num potencial periódico.
6.2
O teorema de Bloch
Já referimos que a função energia potencial dos electrões, sendo resultante da sua
interacção com o meio cristalino, deve ser uma função periódica do espaço, com
o mesmo perı́odo do cristal. A equação de Schrödinger independente do tempo é
então
~2 2
−
∇ ψ(r) + V (r)ψ(r) = εψ(r),
(6.1)
2m
onde V (r) é uma função periódica com a periodicidade da rede cristalina. O teorema
de Bloch afirma que as soluções da Eq. (6.1) têm a forma(d)
ψk (r) = eik·r uk (r),
(6.2)
onde uk (r) é uma função periódica do cristal, isto é, que verifica
uk (r + R) = uk (r),
(6.3)
qualquer que seja o vector da rede cristalina R. Um enunciado equivalente do teorema de Bloch é o seguinte: as soluções da equação de Schrödinger para potenciais
cristalinos verificam a condição
ψk (r + R) = eik·R ψk (r),
(6.4)
qualquer que seja o vector da rede cristalina R. É evidente que funções com a forma
definida na Eq. (6.2) gozam desta propriedade. Com efeito,
ψk (r + R) =
=
=
eik·r eik·R uk (r + R)
eik·r eik·R uk (r)
eik·R ψk (r).
A implicação inversa também é facilmente demostrável. De facto, é sempre possı́vel
escrever qualquer função (e, portanto, também as soluções da equação de Schrödinger) na forma
ψk (r) = eik·r f (r),
desde que se escolha convenientemente a função f (r). Mas, para que uma função
com esta forma satisfaça a propriedade da Eq. (6.4), é necessário que f (r + R) =
f (r), qualquer que seja o vector da rede cristalina r, ou seja, que f apresente a
periodicidade da rede cristalina exigida na Eq. (6.3).
Agora que demosntrámos a equivalência dos dois enunciados do Teorema de
Bloch, vamos passar à sua demonstração. Dada a periodicidade do arranjo atómico
nos cristais (ideais), todas as funções da posição fisicamente observáveis devem
apresentar a mesma periodicidade. A função de onda dos electrões não é uma função
fisicamente observável, e por isso não é, necessariamente, uma função periódica.
k é um parâmetro vectorial que identifica o estado electrónico. Ao contrário do parâmetro k
que identifica os estados de electrões livres que temos estudado até agora, este não é proporcional
ao momento linear dos electrões de Bloch.
(d)
6.2. O TEOREMA DE BLOCH
101
Assim, sendo R um vector da rede cristalina, não podemos garantir a igualdade
ψ(r + R) = ψ(r); podemos é, sem qualquer perda de generalidade, escrever
ψ(r + R) = s(R)ψ(r),
(6.5)
escolhendo cuidadosamente a função s(R). Em contrapartida, o quadrado do
módulo da função de onda é, de acordo com a interpretação de Max Born, igual à
densidade de probabilidade de presença do electrão, ou seja, é uma função fisicamente observável. Logo, de acordo com o que se disse acima, deve ser uma função
periódica da posição com a periodicidade da rede, isto é, deve verificar(e)
ψ ∗ (r + R)ψ(r + R) = ψ ∗ (r)ψ(r).
(6.6)
Substituindo aqui a Eq. (6.5), resulta que o quadrado do módulo da função s é
unitário, qualquer que seja o vector de rede R. Logo, esta função tem necessariamente a forma
s(R) = eiχ(R) .
Tomando então o caso particular R = a, onde a é um dos vectors fundamentais da
rede cristalina, temos
ψ(r + a) = eik·a ψ(r).
Da mesma maneira,
ψ(r + 2a) =
=
=
ψ(r + a + a)
eiχ(a) ψ(r + a)
e2iχ(a) ψ(r)
ou seja ainda, com n inteiro arbitrário,
ψ(r + na) = einχ(a) ψ(r).
Considerando agora deslocamentos nas direcções dos outros vectores fundamentais
(b e c), e repetindo os mesmos argumentos que se aplicaram até agora, podemos
concluir que a relação entre os valores da função de onda em pontos equivalentes
do cristal é
ψ(r + R) = ei[hχ(a)+kχ(b)+lχ(c)] ψ(r),
(6.7)
onde os inteiros h, k, l são as componentes cristalográficas do vector de rede R, isto
é, se tem
R = ha + kb + lc.
Demonstrámos até agora que as soluções da equação de Schrödinger numa região
onde está definido um potencial cristalino se transformam, sob translacções segundo
vectores de rede de acordo com a Eq. (6.7). Os valores das três quantidades χ(a),
χ(b), χ(c) distinguem as diferentes soluções entre si. Estas três quantidades podem
podem ser usadas para definir as componentes de um vector k, através de
k·a =
χ(a)
k·b =
k·c =
χ(b)
χ(c).
Assim, a soma hχ(a) + kχ(b) + lχ(c) pode escrever-se simplesmente como k · R, e
a Eq. (6.7) fica
ψ(r + R) = eik·R ψ(r),
(6.8)
(e) O
asterisco em ψ ∗ representa o complexo conjugado de ψ.
102
uk(x)
-2a
-a
a
2a
a
2a
0
ψk(x)
-2a
-a
0
Figura 6.5: Exemplo de função de Bloch. No gráfico de cima está representada a
função moduladora uk (x), com perı́odo a; no de baixo representa-se a função de onda
propriamente dita, ψk (x), (a cheio), bem como a onda plana modulada exp(ikx) (a
tracejado).
em conformidade com o segundo enunciado do teorema de Bloch, concluindo-se
assim a sua demonstração.
A forma das funções de onda de electrões que se movem num cristal, apresentada
na Eq. (6.2), é a de ondas planas monocromáticas eik·r , moduladas por funções com
a periodicidade cristalina uk (r). Na Figura 6.5 apresenta-se um exemplo das funções
uk (x) e ψk (x), numa situação unidimensional.
6.3
6.3.1
Propriedades dos estados de Bloch
Periodicidade no espaço recı́proco
Como já se disse, as diferentes soluções da equação de Schrödinger para os electrões
num cristal distinguem-se pela forma como se transformam sob translacções segundo
vectores da rede cristalina. Mais concretamente, distinguem-se pelas componentes
do vector k, de acordo com a Eq. (6.4). Consideremos duas soluções particulares
caracterizadas pelos vectores k e k0 = k + G, onde G é um vector da rede recı́proca
do cristal qualquer. Segundo o teorema de Bloch, estas duas funções de onda
transformam-se sob translacções segundo o vector da rede R como
ψk (r + R)
= eik·R ψk (r)
ψk0 (r + R)
= eik ·R ψk0 (r).
0
Explicitemos o vector k0 nesta última equação. Resulta então
ψk+G (r + R) = ei(k+G)·R ψk+G (r).
Recordemos agora que, por definição de vector da rede recı́proca, se tem que
eiG·R = 1, para todos os vectores, G, da rede recı́proca e para todos os vectores, R,
da rede directa. Então a função de onda ψk+G tem, sob translacções segundo vectores de rede, um comportamento idêntico ao da função ψk ; logo, estas duas funções
são indistinguı́veis, ou seja, representam o mesmo estado electrónico. Para se evitar, no cálculo das propriedades da nuvem electrónica, a contabilização repetida da
contribuição de um dado estado, devemos ter cuidado com este tipo de indistinguibilidade escondida das funções de onda. A forma mais simples de assegurar que
não se cometem erros relacionados com esta questão é considerar apenas vectores k
pertencentes todos a uma mesma célula unitária primitiva da rede recı́proca. Como
se sabe, é sempre possı́vel escolher para qualquer rede uma grande diversidade de
formas para as células unitária primitivas. Neste caso, escolhe-se sempre a célula de
6.3. PROPRIEDADES DOS ESTADOS DE BLOCH
103
Wigner-Seitz (ver a Secção 2.2, e a Figura 2.3) da rede recı́proca, mais usualmente
conhecida como primeira zona de Brillouin.
Uma consequência importante da indistinguibilidade de dois estados de Bloch
cujos vectores k diferem entre si por um vector da rede recı́proca é que todas as
propriedades fı́sicas dos estados electrónicos devem ser funções periódicas de k, com
a periodicidade da rede recı́proca. Com efeito, seja X(k) o valor da propriedade X
para um electrão num estado cuja função de onda é ψk ; uma vez que o mesmo estado
pode ser representado por qualquer das funções ψk+G , com G vector arbitrário da
rede recı́proca, o cálculo da propriedade X deve produzir o mesmo valor quando
realizado a partir de qualquer destas funções, isto é,
X(k + G) = X(k),
6.3.2
∀ G vector da rede recı́proca.
Nı́veis de energia dos estados de Bloch
Substituindo na equação de Schrödinger as soluções de Bloch da Eq. (6.2), obtemos
a equação diferencial a satisfazer pelas funções uk (r),
−
~2
2
[∇ + ik] uk (r) + V (r)uk (r) = ε(k)uk (r).
2m
(6.9)
Esta equação, formalmente semelhante à equação de Shrödinger, é uma equação de
valores próprios para o operador
Hk = −
~2
2
[∇ + ik] + V (r),
2m
que depende de um parâmetro vectorial que é o vector k. Para cada valor de k,
este operador deve apresentar um conjunto de funções próprias, u1k (r), u2k (r), . . .,
unk (r), . . ., às quais correspondem os valores próprios (nı́veis de energia) ε1 (k),
ε2 (k), . . ., εn (k), . . ., e tanto aquelas como estes devem ser funções contı́nuas do
parâmetro k. Mais ainda, como vimos na Secção 6.3.1, os diversos nı́veis de energia
εn (k) devem ser funções periódicas de k. Ora, funções contı́nuas e periódicas são
necessariamente funções limitadas, pelo que devemos ter cada nı́vel de energia εn (k)
a tomar valores num intervalo bem limitado de energias. O espectro energético
dos electrões num metal deve pois ter um aspecto que pode, qualitativamente, ser
representado como mostra a Figura 6.6. Chama-se banda ao conjunto de estados
electrónicos unk (r) para cada valor de n. Nesta figura apenas estão representados
os valores de k pertencentes à primeira zona de Brillouin porque, como já vimos,
vectores k fora desta região representam estados que já têm correspondência nalgum
vector k no seu interior e portanto, neste sentido, são redundantes. Na Figura 6.6
as bandas de energia estão separadas por um intervalo de energias proibidas: esta
situação corresponde ao que de facto se passa em muitos sólidos, mas é possı́vel
(se bem que pouco frequente) que duas bandas de energia se sobreponham. Ao
intervalo de energias proibidas entre duas bandas dá-se o nome de hiato energético,
mas é mais usual a utilização da expressão, “aportuguesada” do inglês, “gap de
energia”.
Dentro de cada banda, a energia dos estados electrónicos é uma função periódica
do vector k. Esta função é, em geral, muito mais complicada do que a que caracteriza os estados de electrões livres. A sua forma depende da estrutura cristalina
do sólido em que se movem os electrões, que está representada, na equação que define a energia [Eq. (6.9)], pelo termo correspondente ao potencial electrónico V (r).
Em geral, a energia de um estado depende também da direcção do vector k e não
apenas do seu módulo, como acontece com os estados de electrões livres. Mas esta
dependência não é de todo arbitrária. Vamos de seguida demonstrar que a energia
104
ε
ε
n
n
ε
3k
n=3
ε
2k
n=2
ε
1k
n=1
− π /a
(a)
π /a
k
(b)
Figura 6.6: (a) Nı́veis de energia atómicos, resultantes da resolução da equação de
Schrödinger para um potencial atómico; (b) Bandas de energia dos estados electrónicos
de um sólido. As bandas propriamente ditas são os intervalos representados a sombreado, ao longo do eixo da energia. As formas apresentadas para as funções εn (k)
são arbitrárias.
é uma função par de k, isto é, que
εn (k) = εn (−k).
(6.10)
Tomando o complexo conjugado da Eq. (6.9) e fazendo a substituição k → −k
obtemos
−
~2
2
[∇ + ik] u∗n −k (r) + V (r)u∗n −k (r) = εn (−k)u∗n −k (r).
2m
(6.11)
onde u∗ representa o complexo conjugado de u(f) . Mas as eqs. (6.9) e (6.11) são
idênticas e por isso as suas soluções devem ser as mesmas; logo, podemos concluir
que u∗n−k (r) = unk (r) e, mais importante para o que nos interessa,
εn (k) = εn (−k),
como querı́amos demonstrar.
6.3.3
Momento linear
As funções de onda de Bloch, ψk (r), representam os estados estacionários de electrões que se movem numa região (o cristal) onde a sua energia potencial, que traduz
as interacções com o meio, é uma função periódica da posição. A expressão “estados
estacionários” significa que um electrão que ocupe um destes estados permanece
nele enquanto não for perturbado por agentes externos ou por alterações do meio
em que se move (defeitos no cristal, por ecemplo). Estes estados distinguem-se
entre si pelo parâmetro vectorial k, que está relacionado com a forma como se
transformam sob translacções segundo vectores da rede. Isto é, o vector k (de que
não conhecemos ainda o significado fı́sico) é uma constante do movimento de um
electrão de Bloch no estado ψk . Por outro lado, o momento linear de um electrão de
Bloch não deve ser uma constante do movimento, já que um electrão que se move
numa região onde está definido um potencial periódico está sujeito a forças que se
traduzem em acelerações, ou seja, em alterações do seu momento linear. Assim,
(f) As
energias são grandezas reais e por isso V ∗ (r ) = V (r ) e ε∗n (k) = εn (k).
105
não podemos identificar ~k com o momento linear dos electrões no estado de Bloch
ψk , como fizemos no estudo dos electrões livres. Esta conclusão é ainda reforçada
pela aplicação do operador quantidade de movimento ao estado ψk . De acordo
com as regras da Mecânica Quântica, os estados caracterizados por valores bem
determidados do momento linear são os estados próprios do operador associado a
este observável, P̂ = −i~∇. Ora, com ψk dado pela Eq. (6.2), temos
P̂ ψk (r) = eik·r (~k − i~∇) uk (r),
expressão que não corresponde a uma equação de valores próprios. Assim, as funções
de Bloch não são funções próprias do operador do momento linear e, portanto,
um electrão num estado de Bloch não apresenta um valor bem determinado deste
observável. No entanto, o vector ~k tem, como veremos já de seguida, um papel
importante na dinâmica dos electrões de condução nos metais, muito semelhante ao
do momento linear de electrões livres. Para realçar esta semelhança formal, dá-se o
nome de momento linear cristalino de um electrão no estado de Bloch ψk ao vector
~k. Usaremos também a expressão “vector de onda cristalino” para nos referirmos
ao vector k.
6.3.4
Velocidade média e momento linear cristalino
A expressão para o cálculo da velocidade de electrões livres, v = ~k/m, não pode
ser adoptada para electrões em estados de Bloch, uma vez que o seu momento
linear não é dado por p = ~k. Como já se disse, electrões em estados de Bloch não
apresentam um momento linear bem determinado e, logo, o mesmo se passa com
a velocidade. Podemos, quando muito, determinar os resultados possı́veis de uma
medição da velocidade e as respectivas probabilidades e, a partir destes valores,
calcular o valor expectável da velocidade.
Um problema relacionado com este é o da determinação da velocidade de propagação de um sinal que não é caracterizado por um comprimento de onda bem
determinado. Uma perturbação puramente sinusoidal (isto é, uma onda com comprimento de onda, λ, e frequência, ν, bem determinados) propaga-se no meio que a
suporta com uma velocidade, chamada velocidade de fase, cujo módulo é
v = λν =
ω
,
k
(6.12)
onde se introduziram os parâmetros ω = 2πν e k = 2π/λ. A dificuldade do cálculo
da velocidade de sinais não puramente sinusoidais é a seguinte. Consideremos um
sinal não sinusoidal arbitrário f (x, t) (esta função pode, por exemplo, representar
o som de um trovão). É possı́vel escrever a função f (x, t) como combinação linear
de funções sinusoidais com diferentes frequências e comprimentos de onda, usando
as técnicas da análise de Fourier. Descrevemos desta maneira o sinal em questão
como a sobreposição de várias funções puramente sinusoidais. Cada uma destas
componentes sinusoidais, caracterizada por valores bem determinados de k e de ω,
tem uma velocidade de fase dada pela Eq. (6.12), mas as velocidades das diferentes
componentes não são, em geral, todas iguais, logo, não podem ser identificadas com
a velocidade da propagação do sinal. Em vez disso, identifica-se esta velocidade de
propagação com a do ponto onde o sinal tem amplitude máxima. Este valor tem
o nome de velocidade de grupo do sinal. Pode demonstrar-se que a velocidade de
grupo é dada por
dω
vG =
.
(6.13)
dk
Note-se que para ondas puramente sinusoidais, a velocidade de fase é igual à de
grupo.
106
ky
v
k
k
kx
v
Figura 6.7: A velocidade, v , e o vector de onda cristalino k. A velocidade é, para
cada
estado k, perpendicular à superfı́cie de nı́vel da energia para esse valor de k.
.
Voltemos agora ao problema que motivou esta pequena digressão, o problema da
velocidade dos electrões em cristais. A velocidade média das partı́culas quânticas
é, em geral, identificada com a velocidade de grupo da sua função de onda. Assim,
dizemos que a velocidade média de um electrão num estado de Bloch ψk é
v(k) =
dω(k)
1 d²(k)
=
,
dk
~ dk
onde se usou a bem conhecida igualdade de Plank ² = ~ω. Introduzindo agora o
operador gradiente no espaço recı́proco, dado por
gradk ≡ î
∂
∂
∂
+ ĵ
+ k̂
,
∂kx
∂ky
∂kz
obtemos a generalização tridimensional da definição de velocidade média dos electrões de Bloch:
1
v G = gradk ω(k) = gradk ε(k).
(6.14)
~
Note-se que a velocidade de grupo de um electrão num estado de Bloch não representa a sua velocidade instantânea. De facto, a velocidade de grupo de um electrão é
constante e bem definida, permanece inalterada enquanto o electrão não sofrer uma
transição de estado. Em contrapartida, a velocidade instantânea de um electrão de
Bloch está continuamente a variar, como efeito das acelerações resultantes da sua
interacção com o cristal de iões. A velocidade de grupo, que identificamos com a
velocidade dos electrões, representa o valor expectável do observável velocidade. É,
assim, o valor médio da velocidade dos electrões nos estados de Bloch.
Como é bem sabido, o gradiente de uma função tem a direcção em que é máxima
a variação da função, perpendicular às suas superfı́cies de nı́vel. Logo, a velocidade
de um electrão de Bloch, num estado com vector de onda cristalino k, é perpendicular à superfı́cie de nı́vel da energia nesse ponto k. Em particular, os electrões que
se encontram na superfı́ce de Fermi têm uma velocidade que é perpendicular a essa
superfı́cie (veja a Figura 6.7).
Um electrão num estado de Bloch, sujeito apenas à interacção com um cristal
ideal, tem uma energia bem definida, constante do movimento. Contudo, se se
definir no cristal, para além dos campos que que são intrinsecamente caracterı́sticos,
um campo de forças externas, F , então o electrão adquire desse campo de forças
energia, a uma taxa temporal igual a
dε
= v · F,
dt
(6.15)
sendo v o vector velocidade média do electrão em estudo. Mas a velocidade média
107
é uma caracterı́stica do estado, ou seja, é uma função de k. Logo,
dε
∂ε dki
=
.
dt
∂ki dt
Adoptou-se aqui a covenção de soma sobre ı́ndices repetidos de Einstein, isto é,
subentende-se uma soma para todos os valores do ı́ndice i = 1, 2, 3 no lado direito
desta expressão. Esta convenção será adoptada daqui em diante, salvo indicações
explı́citas em contrário. Substituindo esta expressão na Eq. (6.15), obtemos
∂ε dkj
= vj F j .
∂kj dt
Usando agora a fórmula da velocidade [Eq. (6.14)], podemos reescrever a expressão
acima como
dkj
~vj
= vj Fj ,
dt
ou seja,
d
(~kj ) = Fj .
(6.16)
dt
Esta equação é semelhante à que traduz a segunda lei de Newton,
F =
dp
,
dt
com o vector ~k a desempenhar o papel de momento linear dos electrões de Bloch.
No entanto, voltamos a recordar que,para a taxa de variação do momento linear
dos electrões no cristal contribuem as forças exteriores F , mas contribuem também
as forças de interacção com o cristal de iões, forças essas que não são contabilizadas na Eq. (6.16. Assim, podemos considerar o vector ~k como uma espécie de
momento linear efectivo dos electrões num cristal, conceito que permite algumas
simplificações, já que apenas as forças exteriores ao cristal contribuem para a sua
modificação.
6.3.5
Massa efectiva dos electrões de Bloch
Consideremos agora um electrão de Bloch sujeito a uma força externa F . A aceleração que adquire por estar sob a acção desta força pode ser calculada como
ai =
dvi
∂vi dkj
=
.
dt
∂kj dt
Substituindo aqui a expressão da velocidade dos electrões de Bloch e da derivada
do momento linear cristalino [respectivamente, as eqs. (6.14) e (6.16)], obtemos
ai =
1 ∂2ε
Fj .
~2 ∂ki ∂kj
(6.17)
Esta expressão é muito parecida com a da segunda lei de Newton(g) e exprime
a aceleração de um electão que se move num cristal como resultado apenas das
forças que sobre ele actuam exteriores ao cristal, não considerando a influência
das interações com o cristal. Este resultado é, obviamente, extremamente útil e
prático, mas o preço a pagar por esta simplificação é a introdução de um parâmetro
(g) As leis da Fı́sica Clássica, não têm nada que ser satisfeitas por electrões, poderão dizer. Assim
é, de facto. Mas note-se que a aceleração a em (6.17) é a derivada do valor expectável da velocidade
que, de acordo com o teorema de Ehrenfest, satisfaz uma expressão formalmente semelhante à lei
fundamental da dinâmica de Newton.
108
matricial variável que substitui a massa dos electrões de Bloch, chamado tensor da
massa efectiva, que se representa por m∗ e é a matriz inversa da matriz
−1
[m∗ ]ij =
1 ∂2ε
.
~2 ∂ki ∂kj
(6.18)
Um electrão move-se num cristal de forma bastante complicada, sujeito como
está às forças exercidas pelos átomos que formam o cristal, mas acabámos de ver que
podemos simplificar bastante o seu estudo, substituindo na lei do movimento a sua
massa pelo tensor da massa efectiva, após o que basta apenas considerar, nas leis do
movimento, as forças exteriores, como campos eléctricos aplicados, etc. Claro que
a matriz da massa efectiva tem que apresentar algumas particularidades que não
esperamos da massa dos objectos comuns. Por exemplo, em geral a aceleração de um
electrão de Bloch não tem a direcção da força que a provoca. Além disso, a matriz
da massa efectiva é variável, as suas componentes têm valores diferentes conforme
a magnitude e a orientação do vector k. Assim, pode acontecer que dois campos
de forças iguais, mas com orientações diferentes, produzam acelerações diferentes.
Desta maneira, podemos explicar porque é que alguns sólidos (a grafite, p. ex.)
apresentam condutividades que variam com a orientação da corrente eléctrica. É
também possı́vel que, para valores particulares de k, algumas componentes (ou
mesmo todas) do tensor da massa efectiva sejam negativas; nestes casos, campos
aplicados numa direcção produzem correntes com direcções opostas...
Já agora, é interessante verificar qual a forma do tensor de massa efectiva para
electrões livres, situação que conhecemos melhor. O movimento de electrões livres
é, de facto, apenas condicionado pelas forças exteriores ao cristal, uma vez que as
forças internas são desprezadas. Então esperamos que a massa efectiva seja neste
caso igual à massa real. De facto, a aplicação da Eq. (6.18) com a função energia
de electrões livres, dada por
~2 k 2
ε(k) =
,
2m
permite obter o resultado
−1
1
[m∗ ]ij = δij ,
m
onde δij é o sı́mbolo delta de Kronecker, cujos elementos são os da matriz identidade,
½
0,
i 6= j
δij =
1,
i = j.
−1
Assim, a matriz [m∗ ] é diagonal e todos os seus elementos são iguais, logo a sua
inversa, que é o tensor da massa efectiva, é, simplesmente,
[m∗ ]ij = mδij ,
como já esperávamos.
6.3.6
O livre caminho médio
Vimos no capı́tulo anterior que é difı́cil entender os valores obtidos no quadro dos
modelos de electrões livres para o livre caminho médio dos electrões, que considerámos demasiado elevado. Com efeito, nos modelos de electrões livres, supõe-se
que os electrões de condução sofrem colisões com os iões que formam o cristal,
mas os valores previstos para o livre caminho médio resultam ser centenas de vezes
superiores à distância interatómica, para temperaturas próximas da temperatura
ambiente.
6.4. MODELO DE KRÖNIG-PENNEY
109
Este problema é clarificado no quadro da teoria de Bloch, mas devemos, antes
de mais, clarificar o significado de colisão. Uma colisão entre dois corpos é uma alteração dos seus estados de movimentos como resultado da interacção mútua. Classicamente, caracterizamos o estado de movimento de uma massa pontual através
do seu momento linear; uma colisão entre dois corpos clássicos pontuais é pois um
processo de influência mútua em que se alteram os seu momentos lineares. Nos
modelos de electrões livres, o estado de um electrão é especificado pelo vector k,
que é proporcional ao momento linear. As colisões destas partı́culas com os iões
da rede provocam alterações no vector k, ou seja, na quantidade de movimento.
Na mesma ordem de idéias, devemos aceitar que, na teoria de Bloch, a colisão de
um electrão com o que quer que seja deve manifestar-se como uma alteração do
seu estado, isto é, como uma alteração do vector k. Mas, já se disse, um electrão
que ocupa, num cristal ideal, um estado de Bloch ψnk (r), permanece nesse estado
se não se verificarem influências externas que o perturbem, porque os estados de
Bloch têm já em linha de conta as interacções com a rede cristalina. Assim, neste
sentido, os electrões de Bloch não sofrem colisões com os iões da rede. Podem,
isso sim, modificar o seu estado, mas apenas por colisões contra as fronteiras do
cristal, contra fonões (vibrações do cristal), contra impurezas, em suma, contra
defeitos no cristal, qualquer que seja a sua natureza. Ora, os defeitos cristalinos
estão muito mais afastados entre si do que os iões da rede, pelo que se percebem
agora os elevados valores que obtivemos para o livre caminho médio dos electrões.
A conclusão é a seguinte: tanto quanto se possa considerar o cristal como perfeito
(isto é, absolutamente periódico), os electrões não sofrem modificação de estado,
ou seja, colisões; estas devem ocorrer nas excepções à periodicidade, isto é, nos
defeitos cristalinos. Os electrões de Bloch não sofrem colisões com os átomos regularmente dispostos no cristal, mas apenas com os defeitos no cristal, que estão
mais afastados entre si que os átomos que o constituem. Por esta razão, o caminho
livre médio dos electrões de condução deve ser muito maior do que as distâncias
interatómicas tı́picas nos sólidos, em conformidade com os resultados obtidos no
quadro dos modelos de electrões livres.
6.4
Modelo de Krönig-Penney
Vamos agora ilustrar o conteúdo das secções precedentes recorrendo a um modelo
simples de cristal unidimensional, o modelo de Krönig-Penney. Este modelo descreve os estados de uma partı́cula quântica que se move numa região onde está
definido um potencial que é uma sucessão de barreiras de potencial rectangular
idênticas, regularmente espaçadas entre si (ver a Figura 6.8). Nós vamos usar uma
versão particularmente simples do deste modelo, em que a largura, l, das barreiras
tende para zero, enquanto a sua altura, V , cresce de maneira a manter constante o
produto lV . No limite, cada barreira fica igual a uma função delta de Dirac(h) . A
função potencial que vamos usar é então
V (x) =
∞
~2 λ X
δ(x − na),
2m a n=−∞
(6.19)
(h) A função delta só é diferente de zero num único ponto, mas o seu integral em qualquer intervalo
que contenha esse ponto é 1. Mais rigorosamente, a função delta define-se através das seguintes
propriedades:
δ(x − a) = 0,
se x 6= a
Z a+²
f (x)δ(x − a) = f (a),
∀² > 0.
a−²
110
V(x)
V
x
a
l
V(x)
x
-2a
-a
0
a
2a
Figura 6.8: Potencial do modelo de Krönig-Penney (em cima). Em baixo, o potencial usado neste trabalho: a largura, l, das barreiras diminui até zero, enquanto a
sua altura, V , aumenta indefinidamente, de tal forma que o produto lV permanece
constante.
onde λ é um parâmetro adimensional que pode ser usado para regular a intensidade
do potencial cristalino. Podemos até estudar o limite de electrões livres escolhendo
λ = 0. Este potencial é um caso particular dos potenciais contı́nuos por intervalos
que se constumam estudar nas disciplinas de introdução à Mecânica Quântica. A
resolução da equação de Schrödinger nestes casos é feita separadamente em cada
região de continuidade do potencial, impondo-se em seguida condições de continuidade da função de onda nos pontos em que o potencial é descontı́nuo. Vamos então
dividir a recta real em regiões de continuidade da função potencial, que designaremos por R0 , R±1 , R±2 . . . , sendo Rn o intervalo (n − 1)a < x < na. Em qualquer
destas regiões, a equação de Schrödinger escreve-se como
−
~2 d2
ψ = ²ψ
2m dx2
e, para ² positivo, admite soluções do tipo (tomamos a região Rn para concretizar
a discussão)
ψ (n) (x) = Xn eikx + Yn e−ikx
ou, equivalentemente (basta tomar An = Xn eikna , Bn = Yn e−ikna ),
ψ (n) (x) = An eik(x−na) + Bn e−ik(x−na) .
(6.20)
Nestas expressões, k está relacionado com a energia do estado, ², através de
k2 =
2m²
.
~2
(6.21)
Na região contı́gua Rn+1 , e usando as mesmas convenções, a função de onda escrevese
ψ (n+1) (x) = An+1 eik(x−[n+1]a) + Bn+1 e−ik(x−[n+1]a) .
(6.22)
A solução da equação de Schrödinger é a união das diferentes funções ψ (n) , união
essa que deve ser feita de modo a satisfazer certas comdições de continuidade. Antes,
porém, de estudarmos a continuidade da função de onda, devemos notar que, sendo
o potencial uma função periódica da posição, estamos nas condições do teorema de
Bloch. Logo, as soluções da equação de Schrödinger devem satisfazer a condição
ψq (x + a) = eiqa ψq (x),
111
onde q é um parâmetro real, que caracteriza a função de onda particular ψq tal
como os números n, l, ml , ms caracterizam as funções de onda de electrões atómicos.
Note-se que esta condição envolve o valor da função de onda em diferentes células
unitárias do nosso cristal unidimensional, ou diferentes regiões, de acordo com a
designação que temos usado. Tomando x na região Rn , x + a pertence à região
Rn+1 ; a condição de Bloch pode pois escrever-se como
ψq(n+1) (x + a) = eiqa ψq(n) (x),
ou seja,
h
i
An+1 eik(x−na) + Bn+1 e−ik(x−na) = eiqa An eik(x−na) + Bn e−ik(x−na) .
Agrupando potências com expoentes iguais, obtemos
£
¤
£
¤
eik(x−na) An+1 − eiqa An + e−ik(x−na) Bn+1 − eiqa Bn = 0,
que só pode ser satisfeita para todos os valores de x se se anularem os coeficientes
das exponenciais, isto é, se
An+1
Bn+1
=
=
eiqa An
eiqa Bn
(6.23)
Faremos uso destas relações mais adiante. Vamos agora estudar as condições fronteira a satisfazer pela função de onda. Em primeiro lugar, a função de onda deve
ser uma função contı́nua. Assim, num ponto x = na que é partilhado pelas regiões
Rn e Rn+1 , devemos ter ψ (n) (na) = ψ (n+1) (na), ou seja,
An+1 e−ika + Bn+1 eika = An + Bn .
(6.24)
Quando o potencial não tem descontinuidades infinitas, a derivada da função de
onda é, também, uma função contı́nua, mas esse não é o caso aqui.
Para deduzirmos a forma das condições fronteira a satisfazer pela derivada da
função de onda, integremos a equação de Schrödinger,
−
~2 d2 ψ
+ V (x)ψ(x) = ²ψ(x),
2m dx2
num pequeno intervalo centrado num ponto x0 , com largura 2δ. Temos então
Z x0 +δ 2
Z x0 +δ
Z x0 +δ
~2
d ψ
−
+
V (x)ψ(x)dx = ²
ψ(x)dx.
2m x0 −δ dx2
x0 −δ
x0 −δ
No limite em que δ → 0, o integral no segundo membro desta equação anula-se,
porque a função de onda é contı́nua; o primeiro integral é fácil de calcular, por ser
o integral de uma derivada. Resulta então
"µ ¶
#
µ ¶
Z x0 +δ
dψ
dψ
~2
lim
−
+ lim
V (x)ψ(x)dx = 0,
−
δ→0 x −δ
2m δ→0
dx x0 +δ
dx x0 −δ
0
ou ainda
µ
dψ
dx
¶
µ
−
x0 +
dψ
dx
¶
x0 −
2m
= 2 lim
~ δ→0
Z
x0 +δ
V (x)ψ(x)dx,
(6.25)
x0 −δ
onde (F )x0 ± representa o limite de F quando o seu argumento tende para x0 por
valores superiores a x0 (sinal +) ou por valores inferiores a x0 (sinal -). Esta
condição de continuidade para a derivada da função de onda tem validade geral,
112
em problemas unidimensionais. No nosso caso, atendendo à forma particular do
potencial, temos, para x0 = na,
Z na+δ
~2 λ
V (x)ψ(x)dx =
ψ(x = na).
2m a
na−δ
Por outro lado, as duas derivadas obtêm-se facilmente a partir das expressões
[eqs. (6.20) e (6.22)] da função de onda nas duas regiões separadas pelo ponto
de abcissa x = na:
dψ (n)
dx
dψ (n+1)
dx
= ikAn eik(x−na) − ikBn e−ik(x−na)
= ikAn+1 eik(x−[n+1]a) − ikBn+1 e−ik(x−[n+1]a) .
Então, podemos escrever a condição geral da Eq. (6.25) como
µ
¶
µ
¶
iλ
iλ
−ika
ika
An+1 e
− Bn 1 +
.
− Bn+1 e = An 1 −
ka
ka
(6.26)
Usando agora a Eq. (6.23) para eliminar os coeficientes An+1 e Bn+1 das eqs. (6.24)
e (6.26), obtemos o seguinte sistema de duas equações homogéneas:
h
i
h
i
ei(q−k)a − 1 An + ei(q+k)a − 1 Bn = 0
¸
·
¸
·
iλ
iλ
i(q+k)a
i(q−k)a
An − e
−1−
Bn = 0.
e
−1+
ka
ka
Como qualquer sistema homogénio, este admite a solução trivial An = 0 = Bn = 0,
ou seja, ψ = 0, que não nos interessa. Soluções não triviais verificam-se apenas
quando o determinante da matriz formada com os coeficientes do sistema se anular. Após algumas manipulações algébricas, esta condição leva à seguinte equação
transcendental:
λ sin ka
cos qa = cos ka +
.
(6.27)
2 ka
Esta igualdade define uma relação entre o parêmetro q que caracteriza as diferentes
soluções da equação de Schrödinger e o parâmetro k que define a energia dessas
soluções. Dado um valor de q “basta” resolver esta equação em ordem a k para
obter a energia correspondente, usando a relação da Eq. (6.21). Infelizmente, esta
relação entre k e q é transcendental, logo, não pode ser resolvida analiticamente.
Além disso, para certos valores de k não é possı́vel verificá-la. Com efeito, o lado
esquerdo está limitado ao intervalo [−1, 1]; logo, não podem existir soluções para
todos os valores de k em que o lado direito saia deste intervalo. Na Figura 6.9
apresenta-se o gráfico da função no lado direito desta equação, assinalando-se as
regiões em que não existem soluções não triviais. Como a energia de um estado
depende do valor de k [ver a Eq. (6.21)], estes intervalos para os quais não há
soluções da equação de Schrödinger correspondem a hiatos de energia. Não há
estados estacinários de uma partı́cula num potencial de Krönig-Penney com energia
situada nesses intervalos proibidos.
Como se disse, a igualdade da Eq. (6.27) relaciona a energia dos estados permitidos (através da interposta “pessoa” do parâmetro k) com o parâmetro q que os
carateriza. Essa relação não pode ser explicitada analiticamente, porque a Eq. (6.27)
é uma equação transcendental. No entanto, podemos tentar a seguinte abordagem
numérica: dado um valor de q, variamos k (e, portanto, ²) até que a diferença entre os valores dos dois lados da Eq. (6.27) seja menor que um determinado limiar,
caso em que dizemos que a igualdade foi satisfeita. Usando este processo, muito
113
4
3
2
1
x=ka
0
2
4
6
8
10
12
-1
Figura 6.9: Gráfico da função no segundo membro da Eq. (6.27). Para os valores
da abcissa (x = ka) nas regiões sombreadas, não existem soluções da equação de
Schrödinger; correspondem aos gaps de energia.
ε(k)
ε(k)
3a banda
2a banda
q
1a banda
- π/a
0
π/a
q
- π/a
0
π/a
Figura 6.10: Estrutura de bandas do modelo de Krönig-Penney. Notam-se claramente
os hiatos energéticos. Para comparação, apresenta-se à direita a estrutura de “bandas”
no modelo de electrões livres, obtida escolhendo λ = 0 no potencial da Eq. (6.19). A
presença do potencial periódico abre os gaps, deformando ligeiramente a curva ²(q) na
fronteira da zona de Brillouin e “empurrando” para cima os ramos superiores dessa
curva.
114
rudimentar, foi possı́vel desenhar o gráfico da Figura 6.10. Escolheu-se para λ o
valor λ = 2π. Note-se que, com λ = 0, o potencial é constante, pelo que o potencial
de Krönig-Penney nesse caso é o de partı́culas livres. Nesse caso, a Eq. (6.27) fica
simplesmente
cos qa = cos ka,
que tem como solução k = q, e a energia fica ² = ~2 q 2 /2m, a expressão caracterı́stica
de partı́culas livres, que também é apresentada na Figura 6.10.
6.5
Número de estados por banda
A resolução de uma equação diferencial (como a de Schrödinger) não fica completa
sem a imposição de condições a satisfazer pela solução particular requerida. Apesar
de não resolvermos completamente a equação de Schrödinger [ou a sua versão de
Bloch (6.9)] é útil a imposição de condições fronteira, que reduzem número de estados de Bloch que é necessário considerar. Pelas razões já apresentadas na Secção 4.2,
escolhemos as condições fronteira periódicas. No entanto, em vez de as aplicarmos
a um volume cúbico de aresta L, é mais conveniente [devido à presença da função
periódica unk (r) na expressão geral dos estados de Bloch (6.2)] considerar um volume com a forma da célula unitária primitiva do cristal em estudo, contendo um
número inteiro, N , destas células unitárias primitivas (ver a Figura 6.11). As di-
Nc c
b
Nb b
Na a
c
a
Figura 6.11: Forma da região considerada na imposição das condições fronteira.
mensões lineares desta região são Na |a|, Nb |b| e Nc |c| onde Na , Nb e Nc são números
inteiros, tais que o número de células unitárias, N , presentes no volume considerado
é dado por
N = Na Nb Nc .
As condições fronteira periódicas podem então ser expressas como
ψnk (r + Na a)
= ψnk (r)
ψnk (r + Nb b) = ψnk (r)
ψnk (r + Nc c) = ψnk (r).
(6.28)
De acordo com o teorema de Bloch, a primeira das equações em (6.28) pode ainda
ser escrita na forma
eiNa k·a ψnk (r) = ψnk (r)
ou ainda
eiNa k·a = 1.
6.6. O ESTADO FUNDAMENTAL DA NUVEM ELECTRÓNICA
115
De igual modo, obtemos para a segunda e terceira das eqs. (6.28)
eiNb k·b
eiNc k·c
= 1
= 1.
Recordando a definição de vector da rede recı́proca, verificamos que estas igualdades
são verificadas se o vector k fôr da forma
ma
mb
mc
k=
A+
B+
C,
(6.29)
Na
Nb
Nc
onde ma , mb e mc são inteiros arbitrários e A, B e C são os vectores fundamentais
primitivos da rede recı́proca. Note-se que Eq. (6.29) não implica que k seja um
vector da rede recı́proca, porque ma /Na , mb /Nb e mc /Nc não são, necessariamente,
números inteiros. Tal como para os electrões livres, verificamos que os estados
electrónicos permitidos formam um conjunto discreto, porque k só pode assumir os
valores definidos pela Eq. (6.29). Os valores permitidos para o vector k formam
uma rede cristalina, com vectores fundamentais primitivos A/Na , B/Nb e C/Nc .
Estamos agora em condições de determinar o número de estados numa banda.
Como se disse, devemos considerar apenas vectores k pertencentes a uma única
célula unitária primitiva da rede recı́proca, que tem um volume
Ω = |A · B × C|.
(6.30)
Por outro lado, o volume de espaço-k ocupado por cada um dos vectores k permitidos é o volume da célula unitária primitiva da rede por eles definida, de acordo
com a Eq. (6.29),
¯
¯
¯A B
C ¯¯
¯
τ = ¯
·
×
Na Nb
Nc ¯
Ω
1
|A · B × C| = .
=
Na Nb Nc
N
O número de vectores k que “cabem” numa célula é então o volume disponı́vel, Ω,
a dividir pelo volume ocupado por cada um, τ , ou seja, N . Considerando ainda
que para cada valor de k existem dois estados electrónicos (spin up ou spin down),
concluimos que o número total de estados numa banda é 2N , onde, recorda-se, N
é o número total de células unitárias primitivas que formam a região considerada
para a imposição das condições fronteira. Este facto também se pode entender
recordando que, no aparecimento das bandas de energia no processo de formação
dos sólidos, não aumenta o número de estados electrónicos. A banda de valência
resulta de combinações lineares de um grande número (seja N esse número) de
orbitais atómicas (uma por cada átomo). Cada orbital atómica pode acomodar
dois electrões (com orientações de spin opostas), logo, o conjunto deve conter 2N
estados electrónicos.
6.6
O estado fundamental da nuvem electrónica
Já vimos como a proximidade dos átomos num cristal leva ao desenvolvimento de
um espectro de bandas, em vez dos nı́veis de energia bem definidos que caracterizam
os átomos isolados. Cada uma destas bandas é populada por electrões provenientes
de cada um dos átomos que formam o cristal. Para simplificar a discussão, iremos
considerar cristais monoatómicos (formados por apenas uma espécie quı́mica), com
um átomo apenas por célula unitária (i) . Considerando um cristal com N átomos,
(i) Os argumentos que se seguem não são aplicáveis ao cloreto de sódio (cristal biatómico) ou ao
diamante (dois átomos por célula unitária primitiva).
116
e portanto com N células unitárias primitivas, o número de estados em cada banda
é 2N , como vimos na secção anterior.
O estado fundamental do sistema de electrões de Bloch é, essencialmente, definido do mesmo modo que para os electrões livres: todos os estados de baixa energia
devem estar ocupados por electrões. As bandas correspondentes aos nı́veis atómicos
de mais baixa energia, que no estado fundamental de cada átomo estão totalmente
preenchidas, ficam igualmente totalmente preenchidas. No estado fundamental de
cada átomo, apenas a orbital de valência pode conter estados electrónicos desocupados. A banda que resulta desta orbital pode então estar também apenas parcialmente preenchida (ver a Figura 6.12). A esta banda dá-se o nome de banda
Ε
< 2N electrões
2N electrões
2N electrões
Figura 6.12: Ocupação das diferentes bandas de um metal.
de valência. Tal como fizemos no estudo do modelo de electrões livres, podemos
“construir” o estado fundamental do sistema de electrões de Bloch, ocupando com
os electrões atómicos os nı́veis de Bloch de energia sucessivamente maior. Devemos
pois começar na primeira banda, preenchendo-a totalmente antes de começar a ocupar a segunda, e assim sucessivamente até à banda de valência. Para cada banda,
devemos começar a ocupar estados com k tal que correspondam a baixos valores de
energia. No caso dos electrões livres, a energia era simplesmente ε(k) = ~2 k 2 /2m;
dependendo a energia apenas do módulo do vector k, este processo de “estacionar”
electrões livres em nı́veis de energia sucessivamente maior resultava em superfı́cies
de Fermi com forma esférica. A situação é agora mais complicada, já que, em geral,
as funções εn (k) dependem também da direcção de k. Assim, para os electrões de
Bloch, a forma da superfı́cie de Fermi não é, em geral, esférica, podendo apresentar
configurações extremamente complexas. No entanto, estas formas devem manter as
simetrias da rede recı́proca. Um caso particular destas simetrias é o da paridade da
energia, expresso em (6.10). Uma vez que εn (k) = εn (−k), devemos, após o preenchimento do nı́vel k com dois electrões (um com spin up e outro com spin down)
e antes de preencher outro nı́vel qualquer com energia superior, ocupar estados
com energia igual a εn (k) entre os quais, necessariamente, o estado com momento
cristalino igual a −k. No estado fundamental do sistema, então deve verificar-se
que, se um estado ψnk se encontra preenchido, também o estará o estado ψn−k ; ao
contrário, se o estado ψnk está desocupado, também ψn−k o está. Assim, vemos
que a superfı́cie de Fermi deve apresentar simetria de inversão, isto é, deve ficar
invariante sob a operação k → −k. Na Figura 6.13 representa-se a superfı́cie de
6.7. A CONDUÇÃO ELÉCTRICA
117
ky
1ª zona de Brillouim
kx
Figura 6.13: Forma possı́vel da superfı́cie de Fermi para um cristal quadrado 2D.
Note-se que outras formas são possı́veis, pois a apresentada é apenas um exemplo.
Note-se também que esta superfı́cie de Fermi corresponde a uma banda não totalmente
preenchida, porque há ainda espaço disponı́vel na primeira zona de Brillouin para
“albergar” outros electrões.
Fermi para um cristal quadrado bidimensional.
Como já vimos, a velocidade média de um electrão de Bloch é a sua velocidade
de grupo:
1
v n (k) = gradk εn (k).
(6.31)
~
Sendo εn (k) uma função par de k, o seu gradiente é uma função ı́mpar de k.
Então a velocidade de um electrão cuja função de onda é ψnk deve ser igual, mas
oposta, à de outro com função de onda ψn−k . Mas como já vimos atrás, os estados
ψnk e ψn−k estão ambos ocupados ou ambos desocupados, no estado fundamental
colectivo. Então, no cálculo da velocidade média dos electrões, as contribuições dos
estados ψnk e ψn−k cancelam-se mutuamente. Como o valor de k considerado nesta
discussão é arbitrário, concluimos que a velocidade média dos electrões no estado
fundamental colectivo é zero. Note-se que nos referimos a uma média vectorial, e
que não consideramos a presença de campos de forças (eléctricas, por exemplo) que,
deformando a superfı́cie de Fermi, destruı́riam esta argumentação.
6.7
A condução eléctrica
Consideremos agora o efeito de um campo eléctrico (de grandeza tı́pica) na situação que acabámos de descrever. Tal como no caso dos electrões livres, um
campo eléctrico manifesta-se através de um deslocamento da superfı́cie de Fermi na
direcção contrária ao campo, deixando de ficar centrada no ponto k = 0, se este
deslocamento for possı́vel. Os argumentos apresentados no final da secção anterior
já não se aplicam (porque, por exemplo, ψnk pode estar ocupado sem que ψn−k o
esteja [veja a Figura 6.14]) e, a ser este deslocamento da superfı́cie de Fermi possı́vel,
a velocidade média da nuvem electrónica deixa de ser nula, verificando-se o aparecimento de uma corrente eléctrica. Mas este deslocamento da superfı́cie de Fermi só é
possı́vel se a banda de valência não estiver totalmente preenchida, porque, em caso
contrário, alguns electrões seriam obrigados a ocupar estados na região proibida.
Assim, concluimos que uma banda totalmente preenchida é inerte para efeitos de
condução eléctrica.
Como apenas a banda de valência de um sólido pode, no estado fundamental
(ou, seja à temperatura de 0 K), estar parcialmente preenchida, somente esta é
responsável pelas propriedades eléctricas dos sólidos. A teoria de Bloch permite
118
E =0
E
ky
kx
ky
kx
Figura 6.14: Deslocamento da superfı́cie de Fermi sob o efeito de um campo eléctrico.
Se a banda de valência estiver totalmente preenchida, a superfı́cie de Fermi é também
a fronteira da região proı́bida, impossibilitando o deslocamento da superfı́cie de Fermi,
ou seja, a condução eléctrica.
pois explicar porque é que alguns sólidos são condutores e outros isoladores: em
princı́pio, se a banda de valência de um sólido estiver totalmente preenchida, o
sólido é isolador; caso contrário, é condutor. Esta regra tem algumas excepções, já
que nalguns sólidos a banda de condução sobrepoem-se com a banda de valência,
permitindo a condução mesmo estando esta totalmente preenchida.
Considerando apenas sólidos cristalinos monoatómicos com um átomo por célula
unitária primitiva, podemos apresentar este critério a um nı́vel mais fundamental.
Os electrões presentes na banda de valência de um sólido são os que, nos átomos
isolados, ocupam o nı́vel de valência. Se N for o número total de átomos no sólido,
então porque consideramos apenas sólidos com um átomo por célula unitária primitiva, N é também o número de células unitárias no sólido, e o número de estados na
banda de valência é então 2N . Logo, se os N átomos que formam o sólido tiverem
apenas um electrão de valência, dos 2N estados disponı́veis na banda de valência,
apenas N estão ocupados e portanto o sólido é um condutor. Em contrapartida,
se os átomos em questão tiverem dois electrões de valência, a banda de valência do
sólido ficou totalmente preenchida e portanto o sólido é isolador.
6.8
O gás de Bloch à temperatura ambiente.
Nos átomos isolados, a última orbital não é a orbital de valência, existindo outros
estados electrónicos que podem ser ocupados excitando o átomo. De igual modo,
a banda de valência também não é a “última” banda no sentido em que há outras
bandas de energia superior, que, no estado fundamental do sistema de fermiões de
Bloch estão totalmente desocupadas, mas que podem estar parcialmente preenchidas
em estados excitados. À banda de energia imediatamente superior à da banda de
valência dá-se o nome de banda de condução. Mais uma vez, repetimos que à
temperatura ambiente, é possı́vel que alguns electrões sejam excitados (através de
colisões com fonões, por exemplo) para esta banda, e esta possibilidade deve ser
considerada no cálculo do valor de grandezas fı́sicas a temperaturas diferentes do
zero absoluto. Claro que a probabilidade destas excitações é tanto maior quanto
menor for a largura do hiato energético entre as duas bandas. Como vimos no
capı́tulo anterior, a energia média dos fonões à temperatura ambiente, T , é da ordem
de grandeza de kB T , onde kB é a constante de Boltzman, e portanto a população
da banda de condução só é apreciável à temperatura ambiente se o hiato energético
tiver uma largura da mesma ordem de grandeza. Um sólido com esta caracterı́stica
é um isolador(j) a temperaturas próximas do zero absoluto(k) mas pode conduzir
(j) Partindo do princı́pio que tem a banda de valência totalmente preenchida no seu estado fundamental.
(k) Não consideramos aqui o fenómeno de supercondutividade.
6.9. LACUNAS
119
E
(a)
Isolador
(b)
Condutor
T=0
T>0
Semicondutor
Figura 6.15: Isoladores, condutores e semicondutores. Os isoladores (à esquerda no
diagrama) têm a banda de valência totalmente preenchida e a de condução totalmente desocupada; os condutores (ao centro) têm a banda de valência ocupada, mas
não totalmente preenchida, ou então verifica-se uma sobreposição das duas bandas;
finalmente, os semicondutores (à direita) são isoladores à temperatura de zero kelvin,
mas o hiato energético entre a banda de valência e a de condução é pequeno, e à temperatura ambiente muitos electrões estão excitados para esta última, possibilitando a
condução.
electricidade à temperatura ambiente. Um aumento da temperatura produz um
aumento na energia média dos fonões, e por conseguinte um aumento da população
da banda de condução, ou seja, um aumento da condutividade. Para estes sólidos
(com um hiato energético, ²g , de cerca de 1 eV) a dependência da condutividade
é inversa da dos condutores, sendo a condutividade uma função decrescente da
temperatura. Este é outro sucesso da teoria de Bloch, já que este comportamento
(aumento de condutividade com a temperatura) é inexplicável, como vimos, no
quadro de uma teoria de electrões livres.
Os sólidos isoladores que, como os que acabámos de referir, apresentam um
hiato entre as bandas de valência e de condução suficiente pequeno para que, à
temperatura ambiente, a população da banda de condução tenha efeitos apreciáveis,
têm o nome de semicondutores. Na Figura 6.15 apresenta-se a configuração das
bandas de valência e de condução para condutores, isoladores e semicondutores.
6.9
Lacunas
A densidade de corrente eléctrica global de uma banda totalmente preenchida é, de
acordo com o que já se disse, nula. Assim, representando por j k (r) a densidade de
corrente de um electrão no estado ψk (l) e por J B (r) a densidade de corrente total
da banda, podemos escrever
J B (r) =
X
j k (r) = 0,
(6.32)
banda
onde o somatório se extende a todos os estados ψk da banda. Se quisermos calcular a densidade de corrente para uma banda parcialmente preenchida, devemos
fazer um somatório semelhante ao anterior, mas considerando apenas os estados
(l) Classicamente, a densidade de corrente é j (r ) = ρ(r )v (r ), onde ρ é a função densidade de
carga e v velocidade das cargas. Numa descrição quântica, a densidade de corrente associada a
uma partı́cula com carga q é j (r ) = q g (r ), onde g é a densidade de fluxo de probabilidade, dada
por g = (ψ ∗ ψ − ψ ψ ∗ ) /(2im) (ver qualquer livro elementar de Mecânica Quântica, p. ex.
S. Gasiorowocz, ”Quantum Mechanics”.)
~
r
r
120
Banda de
condução
f
Banda de
valência
Figura 6.16: Processo de criação de um par electrão de condução-lacuna por absorção
de um fonão.
efectivamente ocupados por electrões, ou seja,
X
j k (r),
J (r) =
(6.33)
e.o.
onde as iniciais “e. o.” significam que para o somatório apenas se tomam os estados
ocupados. De acordo com a Eq. (6.32), devemos ter
X
X
j k (r) +
j k (r) = 0,
e.o.
e.d.
onde as iniciais “e. d.” indicam que a soma respectiva é feita apenas sobre os
estados desocupados. Mas isto significa que os dois somatórios são simétricos, e
portanto podemos escrever a densidade de corrente de uma banda parcialmente
preenchida como
X
J (r) = −
j k (r),
(6.34)
e.d.
sendo este somatório, recordemo-lo, extendido apenas aos estados desocupados da
banda. Dispomos então de duas formas alternativas para o cálculo da contribuição de uma banda parcialmente preenchida para a corrente elétrica, dadas pelas
eqs. (6.33) e (6.34). Podemos interpretar esta segunda possibilidade considerando
os estados electrónicos desocupados, sobre os quais se faz o somatório, como se estivessem ocupados por partı́culas semelhantes aos electrões, mas com carga de sinal
contrário, justificando-se o sinal negativo na Eq. (6.34). A estas partı́culas dá-se
o nome de lacunas. A condução eléctrica pode ser descrita recorrendo aos estados electrónicos [usando a Eq. (6.33)] ou, alternativamente, aos estados de lacunas
[usando a Eq. (6.34)].
Reafirmemos que as lacunas são os estados electrónicos desocupados. Então,
uma banda totalmente preenchida (de electrões) pode ser vista como uma banda
vazia de lacunas. Dada a equivalência das duas descrições para os fenómenos de
condução, podemos dizer que uma banda totalmente preenchida (de electrões) não
pode conduzir porque não contém nenhuma lacuna para o transporte de carga.
Num semicondutor, em que o gap de energia entre as bandas de valência e de
condução é da ordem de grandeza da energia das vibrações atómicas (ou seja, da
energia dos fonões), é relativamente fácil a excitação de um electrão da banda de
valência para a banda de condução. Neste processo, é absorvido um fonão e, simultaneamente, é produzida uma lacuna na banda de valência, correspondente ao
estado deixado vago pelo electrão promovido (ver a Figura 6.16). Inversamente,
pode também dar-se o processo de recombinação, em que um electrão na banda
de condução emite um fonão (ou um fotão) transitando para a banda de valência,
onde irá ocupar um estado previamente vago (ou seja ocupado por uma lacuna).
Deve já ter-se notado a semelhança entre estes processos de criação e aniquilaçao
de pares electrão de condução-lacuna por absorção ou emissão de quanta de energia
com os de criação e aniquilação de pares partı́cula-antipartı́cula estudados na fı́sica
6.10. CONTAMINAÇÃO DE SEMI-CONDUTORES
121
subatómica. Esta semelhança não é um acidente. Confrontado com a existência
de soluções de energia negativa da sua equação de onda relativı́stica para fermiões,
Dirac, o cientista que primeiro propôs a existência de antimatéria, supôs que todos
esses estados estavam ocupados, definindo assim uma densidade de carga uniforme
em todo o espaço, sem efeitos observáveis, a que se passou a chamar o mar de Dirac.
Um electrão com energia positiva não poderia sofrer transições para esses estados
com energia negativa porque eles estavam todos ocupados. No entanto, usando
radição com energia suficiente, seria possı́vel excitar electrões para a “banda” de
energia positiva, criando assim um electrão observável e, simultaneamente, uma lacuna no mar de Dirac, que seria observada como uma partı́cula em tudo semelhante
aos electrões, mas com carga positiva — Um anti-electrão, ou positrão. Inversamente, o processo pelo qual um electrão com energia positiva decaı́sse para um
estado desocupado no mar de Dirac seria observado como uma aniquilação mútua
dos constituintes do par partı́cula-antipartı́cula, acompanhado de emissão de energia. Relacionando o quadro de Dirac com o nosso estudo, a banda de valência
corresponde ao mar de Dirac; a banda de condução aos estados com energia positiva; e ao gap de energia entre as duas bandas corresponde um hiato que surge
também na teoria de Dirac, igual ao dobro da energia em repouso de um electrão,
me c2 .
Num semicondutor à temperatura ambiente, há duas contribuições para a condução eléctrica: a da banda de condução, que está parcialmente populada com electrões
termicamente excitados, e a da banda de valência, parcialmente populada com lacunas que correspondem aos estados deixados vagos pelos electrões promovidos para
a banda de condução. Nos casos em que a segunda é mais importante do que a
primeira, a corrente eléctrica é, sob todos os aspectos, semelhante à que seria conduzida por cargas de sinal positivo, nomeadamente na polarização da tensão de Hall
(ver a secção 5.2.3), justificando-se assim os sinais anómalos do coeficiente de Hall
apresentados por algumas substâncias.
6.10
Contaminação de semi-condutores
Como vimos, à temperatura ambiente alguns electrões da banda de valência de um
semicondutor como o silı́cio ou o germânio(m) ocupam estados excitados na banda
de condução, possibilitando a condução eléctrica por estes materiais. Há, como
se disse, duas contribuições para a condução eléctrica: a dos electrões na banda
de condução e a das lacunas na banda de valência. Num semicondutor puro à
temperatura ambiente, o número de lacunas iguala, evidentemente, o de electrões
de condução. Mas é possı́vel, através da introdução no cristal semicondutor de
impurezas judiciosamente escolhidas, variar independentemente o número dos dois
tipos de transportadores de carga.
Para concretizar a discussão, consideremos um cristal de silı́cio ou de germânio,
no qual alguns átomos são substituı́dos por átomos de arsénio ou de fósforo. Estas
impurezas constituem defeitos no arranjo periódico do cristal de silı́cio. O arsénio e
o fósforo são substâncias pentavalentes, de forma que, quando um átomo de arsénio
substitui num cristal um átomo de silı́cio (substância tetravalente), um dos seus
electrões de valência fica por emparelhar. Este electrão fica fracamente ligado ao
átomo de arsénio, que funciona como um centro de carga positiva (ver a Figura 6.17).
O átomo de arsénio fornece um electrão a mais do que os de silı́cio, que definem a
estrutura cristalina e, por isso, dizemos que o arsénico é um dador de electrões, ou
ainda que se trata de uma contaminação de tipo-n. Estando o electrão desemparelhado muito fracamente ligado ao átomo de arsénio, basta uma pequena quantidade
de energia, Ed , para exitá-lo para a banda de condução. O valor deste mini-gap de
(m) Estes
são os dois semicondutores mais usados em aplicações industriais.
122
Orbital de electrão
desemparelhado
Banda de condução
Ed
Eg
Átomos de Silício
+
Nível dador
Banda de
valência
Átomo de Arsénico
Figura 6.17: Cristal de silı́cio com uma impureza substitucional de arsénico (esquerda) e nı́veis de energia resultantes (direita).
energia é de cerca de algumas dezenas de meV (mili-electrão volt), tipicamente. Assim, concluı́mos que num cristal de silı́cio em que alguns átomos são substituidos por
átomos de arsénico a estrutura de bandas usual vê-se modificada, aparecendo um
conjunto de estados na zona proı́bida, imediatamente abaixo da banda de condução,
aos quais se dá o nome de nı́vel dador. Note-se que os estados deste nı́vel são estados
ligados, logo, não contribuem para os fenómenos de transporte.
À temperatura de 0 K, a banda de valência está totalmente preenchida, e o nı́vel
dador tem metade dos estados disponı́veis ocupados (porquê?); o cristal em estudo é,
portanto, isolador. Mas basta elevar ligeiramente a temperatura para se exitarem os
electrões do nı́vel dador para a banda de condução, sem que sejam criadas lacunas
na banda de valência. A temperaturas mais elevadas, começa a fazer-se sentir o
processo já estudado da excitação de electrões da banda de valência, começando
então a fazer-se sentir a contribuição das lacunas para a corrente eléctrica.
Vemos, assim, que contaminando por substituição um cristal de silı́cio ou germânio com arsénico, podemos aumentar, a temperaturas não muito elevadas, o número
de electrões na banda de condução, permanecendo o número de lacunas na banda
de valência baixo.
Banda de condução
+
-
Lacuna resultante da
captura de um electrão
pelo átomo de boro
Eg
Átomos de silício
Ea
Átomo de boro
Nível aceitador
Banda de
valência
Figura 6.18: Cristal de silı́cio com uma impureza substitucional de boro (esquerda)
e nı́veis de energia resultantes (direita).
Também é possı́vel obter o efeito contrário, de estabecer num cristal semicondutor um grande número de lacunas na banda de valência com um reduzido número de
electrões na banda de condução, substituindo alguns átomos num cristal de silı́cio
ou de germânio por átomos de boro, alumı́nio, gálio ou ı́ndio (substâncias trivalentes). Substituindo um átomo de silı́cio num cristal puro por um de boro, fica
uma ligação por estabelecer, já que o boro é trivalente. O átomo de boro fica nesta
situação com uma grande electroafinidade, sendo necessária uma quantidade muito
pequena de energia para que capture um electrão da banda de valência do cristal,
completando assim as quatro ligações com os seus vizinhos. Neste processo, cria-se
uma lacuna na banda de valência, sem popular a banda de condução. As impu-
6.11. O DIODO SEMICONDUTOR
123
Fe
n
e-
p
l+
Ve
Vc0
n
p
Figura 6.19: Junção p-n (acima) em equilı́brio e potencial de contacto na junção.
Está representada o sentido da força sobre os electrões (Fe ) e a sua energia potencial.
rezas deste tipo aceitam os electrões da banda de valência, e por isso chamam-se
impurezas aceitadoras, ou impurezas de tipo-p. Na Figura 6.18 representa-se esquematicamente o papel de uma impureza de tipo-p e o nı́vel intermédio, que agora
aparece imediatamente acima da banda de valência, chamado nı́vel aceitador.
A capacidade para variar independentemente as concentrações de lacunas e de
electrões de condução num cristal semicondutor tem uma enorme aplicação prática,
no fabrico de ı́numeros dispositivos usados na indústria electrónica, como os diodos
e os transistores. É até possı́vel, num único cristal de silı́cio, implantando diferentes
contaminações em diferentes regiões, construir circuitos inteiros, contendo vários
milhões daqueles elementos individuais. Vamos, de seguida, estudar o funcionamento do mais simples destes dispositivos, o um diodo rectificador.
6.11
O diodo semicondutor
Consideremos um cristal semicondutor de silı́cio (ou germânio), com contaminações
de tipo diferente em duas zonas contı́guas, em equilı́brio a uma temperatura T > 0.
Temos então um cristal, no qual está definida uma região de tipo-p, outra de tipo-n,
em contacto uma com a outra (ver a Figura 6.19). À temperatura T , na região-n
há uma grande densidade de electrões de condução, como vimos na secção anterior;
em contrapartida, na região-p é a concentração de lacunas que é elevada. Então,
à semelhança do que se passa na junção de metais diferentes (ver a Secção 5.2.4),
deve verificar-se uma difusão de electrões de condução da região-n (onde apresentam
alta concentração) para a região-p, onde se recombinam com as lacunas, aqui maioritárias. As lacunas, por seu turno, sofrem uma migração inversa e recombinam-se
com os electrões de condução da região-n. Consequentemente, estabelece-se um
campo eléctrico na junção que impede a continuação indefinida deste processo, ou
seja, verifica-se o aparecimento de uma diferença de potencial entre as duas regiões,
que se chama potencial de contacto. Em resultado dos processos de recombinação,
a proximidade da junção fica desprovida de transportadores de carga, efeito que
é ainda agravado pelo aparecimento do campo de contacto, que varre electrostaticamente qualquer par lacuna-electrão de condução (o electrão para a região-n, a
lacuna para a região−p), criado nesta zona por exitação térmica. Esta região, onde
a densidade de transportadores de carga é praticamente nula, chama-se zona de
deplecção.
Na junção das duas regiões ocorrem, então, dois efeitos opostos:
(a) difusão de transportadores, “empurrada” pelos gradientes de concentração.
Alguns electrões (aqueles que à temperatura T têm energia suficiente para
ultrapassarem a barreira estabelecida pelo potencial de contacto) da região-n
difundem-se para a região-p, recombinando-se aı́ com lacunas. Inversamente,
124
VB
VB
n
n
Vc0
Vc
V
p
p
VA
VA
Figura 6.20: Quedas de potencial por contacto num curto-circuito da junção p-n (à
esquerda) e polarização de uma junção p-n por uma fonte de tensão V .
algumas lacunas da região-p sofrem uma migração para a região-n. Ao fluxo de
carga associado a estas migrações dá-se o nome de corrente de recombinação,
que tem o sentido p-n;
(b) deriva de trasportadores, “empurrada” pelo campo eléctrico de contacto. Os
pares electrão de condução-lacuna criados por excitação térmica nas duas
regiões são empurrados pelo campo eléctrico, realizando cada transportador
uma migração em sentido inverso ao do ponto anterior. Esta corrente chamase corrente de geração, no sentido n-p.
Na migração de difusão, os transportadores movem-se empurrados pelos gradientes
de concentração, vencendo gradientes de potencial electrostático; na migração de
deriva, o movimento é induzido pelo gradiente do potencial electrostático, e opõe-se
ao gradiente de concentração. Estabelece-se então um equilı́brio dinâmico em que
os fluxos de carga se cancelam mutuamente, isto é, a corrente de recombinação, no
sentido p-n, iguala a de geração, no sentido n-p. Deve dizer-se que o valor destas
correntes é extremamente baixo, rondando os 10−6 A.
Se se montar um circuito fechado incluindo a junção semicondutora p-n, devemos
ter em atenção que, para além do potencial de contacto Vc0 na junção semicondutora, aparecem outros potenciais de contacto nos pontos onde se liga o condutor
que fecha o circuito (ver a Figura 6.20). Evidentemente, a soma de todos estes potenciais é nula, de acordo com a lei de Kirchoff. Usando a notação da Figura 6.20,
temos então
Vc0 + VA + VB = 0,
ou seja,
VA + VB = −Vc0 .
(6.35)
O que acontece agora se polarizarmos a junção, ligando-a a uma fonte de tensão?
Uma vez que a zona de deplecção é desprovida de cargas móveis, tem uma resistência
muito elevada, e por isso podemos considerar que é aı́ que se manifesta o efeito da
fonte de tensão. Aplicando a lei de Kirchoff, temos agora
Vc + Va + VB + V = 0,
e portanto, usando a Eq. (6.35), concluimos que o potencial de contacto se vê
alterado pela acção da tensão polarizadora V de acordo com
Vc = Vc0 − V.
(6.36)
Quando o terminal positivo da fonte de tensão está ligado à região-p a junção diz-se
polarizada no sentido directo; se o terminal positivo da fonte estiver ligado à regiãon, falamos de polarização inversa. Quando a junção está em polarização directa,
V tem sinal idêntico ao de Vc 0, e, portanto, o potencial de contacto fica diminuı́do
6. Problemas
125
VB
VB
n
n
Vc > Vc0
Vc < Vc0
p
VA
p
VA
i
Figura 6.21: Polarização directa (à esquerda) e polarização inversa de uma junção
p-n.
pela polarização (ver a Figura 6.21, à esquerda). Logo, nestas condições, aumenta
bastante a corrente de recombinação porque diminui a grandeaza da barreira de
potencial que impede o fluxo por difusão. Em contrapartida, a corrente de geração
mantém-se essencialmente constante, já que depende da taxa da criação de pares
lacuna-electrão de condução. Então, as duas correntes deixam de se compensar, e
verifica-se, portanto, um fluxo lı́quido de carga através da junção, no sentido p-n.
Em resumo, a junção p-n permite a passagem de corrente quando se encontra em
polarização directa.
Em contrapartida, quando se inverte a polarização, aumenta o valor do potencial
de contacto, diminuindo, consequentemente, o valor da corrente de recombinação.
A corrente de geração permanece essencialmente a mesma, mantendo o seu valor de
cerca de 10−6 A. Assim, para muitos efeitos práticos, podemos dizer que a junção
semicondutora p-n não permite a passagem de corrente em polarização inversa.
Uma vez que a fracção dos transportadores que tem, a uma certa temperatura
T , uma energia superior ao valor do potencial de contacto (e que portanto está em
condições de ultrapassar a barreira de potencial na junção) é dada pelo factor de
Boltzmann e−βeVc , onde β = 1/kB T , a razão entre as correntes de recombinação
em polarização directa e em vazio (sem qualquer fonte externa) é dada por
Jr
e−βeVc
= −βeVc0 = eβeV .
Jr0
e
A corrente total é a soma das correntes de geração e de recombinação, J = Jr + Jg ,
mas a corrente de geração permanece sensivelmente constante, com o seu valor de
vazio Jg0 que, por sua vez, é o simétrico da corrente de recombinação, também em
vazio. Então, a funçao corrente tensão de uma junção p-n é
J = Jg (eβeV − 1),
(6.37)
onde se toma V positivo quando a junção está em polarização directa. O gráfico
desta função apresenta-se na Figura 6.22. A junção semicondutora p-n tem então
a propriedade de só permitir a passagem de corrente num sentido, propriedade
muito importante no desenho de circuitos electrónicos. O nome dado às junções
semicondutoras p-n na gı́ria da engenharia electrotécnica é diodo.
PROBLEMAS
6.1 À luz da teoria das bandas determine, justificando, o número total de estados
electrónicos existentes por banda de energia.
6.2 Justifique qualitativamente a condutividade, térmica e eléctrica, a zero graus
Kelvin, dos sólidos cristalinos. Dê alguns exemplos.
126
200
I (A)
150
100
50
0
-2
-1
-1.5
-0.5
V (V)
0
0.5
Figura 6.22: Curva de corrente-tensão caracterı́stica de um diodo semicondutor.
6.3 Comente a seguinte afirmação:
A condutividade dos metais alcalinos terrosos é devida a uma sobreposição da banda de valência com a banda de condução. Se tal não
acontecesse estes elementos seriam isoladores a zero graus Kelvin.
6.4 Determine o valor do parâmetro de massa efectiva de electrões livres.
6.5 A densidade do bário é de 3, 5 × 103 kg/m3 , e a sua massa atómica relativa é 137.
Sabendo que os átomos de bário têm dois electrões de valência, determine o raio
da esfera de Fermi e o valor da energia da nuvem de electrões de condução por
mole (de átomos) à temperatura de 0 K.
6.6 Mostre que a função ψ(r ) = N e−r , onde N é uma constante de normalização e
r = ||r ||, não pode ser a função de onda de um electrão num potencial periódico.
2
Bibliografia
• D. A. Davies, Waves, Atoms and Solids, Longman Scientific & Techical (1978).
Esta é uma boa introdução, tanto à fı́sica dos fenómenos ondulatórios como
à mecânica quântica. Põe mais ênfase nas aplicações do que no formalismo,
principalmente nas aplicações ao estudos dos electrões nos sólidos.
Nı́vel: Elementar.
• S. L. Altmann, Band Theory of Metals — The Elements, Pergamon Press
(1970).
Este é também um livro de introdução, mas aplica-se apenas ao estudo das
propriedades dos electrões nos sólidos.
• A. Yariv, An Introduction to the Theory and Applications of Quantum mechanics, John wiley & Sons, Inc. (1982).
Este é um livro de Mecânica Quântica, como o nome indica, mas tem muitas
aplicações ao estudo dos estados electrónicos nos sólidos, por exemplo, o modelo de Krönig-Penney.
Nı́vel: Intermédio.
• F. J. Blatt, Modern Physics (capı́tulos 12 e 13), McGraw Hill (1992).
Bom livro de introdução à fı́sica moderna em geral, tem estes dois capı́tulos
sobre sólidos, essencialmente sobre as ligações quı́micas nos sólidos, teoria de
bandas e dispositivos semicondutores.
• R. A. Serway, R. J. Beichner, J. W. Jewett, Jr.,Physics For Scientists and
Engineers (capı́tulo 43), Saunders College Publishing (2000).
Este é um livro de introdução à fı́sica, com uma parte de fı́sica moderna
onde se inclui o capı́tulo 43 sobre Fı́sica do Estado Sólido. Trata apenas
a matéria relativa ao Capı́tulo 6 dos apontamentos da disciplina, de forma
muito elementar, mas pode ser útil como primeira abordagem a esta parte da
matéria da disciplina.
• J. R. Christman, Fundamentals of Solid State Physics, John Wiley & Sons,
Inc. (1988).
Muito bom livro, cobre a matéria dada na disciplina, mas não na mesma
ordem.
• Ali Omar, Elementary Solid State Physics, Addison-Wesley Publishing Company (1975). Muito exaustivo, mas às vezes pouco rigoroso, por misturar
descrições clássicas, com descrições quânticas, com argumentos qualitativos,
e eu sei lá que mais.
127
128
Bibliografia
• C. Kittel, Introduction to Solid State Physics, John Wiley & Sons, Inc. (1996).
É uma das referências clássicas da Fı́sica do Estado Sólido. A edição de
1996 é a sétima! Cobre a matéria dada, noutra ordem. Os capı́tulos sobre
cristalografia e difracção de raios-X devem ser particularmente úteis.
Nı́vel: Avançado.
• N. W. Ashcroft e N. W. Mermin, Solid State Physics, Saunders College Publishing (1976).
Outra das referências clássicas da Fı́sica do Estado Sólido. Tem aqui tudo o
que pode querer saber sobre Fı́sica do Estado Sólido e mais ainda.
Nı́vel: Muito avançado.
• S. V. Vonsovsky e M. I. Katsnelson, Quantum Solid-State Physics, SringerVerlag (1989).
Texto muito avançado sobre a descrição quântica dos solidos.
Nı́vel: Muito avançado.

F´ısica do Estado Sólido - Departamento de Física da UBI

Transcrição

Documentos relacionados

Novo Release (Portugues)

Nota à imprensa

#5 DRIVE ELECTRO REPLENISH - 1LB (454 G) - LIMONADE

Lisboa, 09 de janeiro de 2013

Nota de Alta

rider técnico café concerto ccvf

Electro Portugal

Lista de exercícios 03

0.2 Variedade de n´ıvel

A Semente de Discrepância