F´ısica do Estado Sólido - Departamento de Física da UBI
Transcrição
F´ısica do Estado Sólido - Departamento de Física da UBI
Apontamentos de Fı́sica do Estado Sólido José Amoreira e Miguel de Jesus Departamento de Fı́sica Edição de 2001/2002 UNIVERSIDADE DA BEIRA INTERIOR Copyleft Os autores deste texto são Luı́s José Maia Amoreira ([email protected]) e Miguel Eduardo Pita de Jesus ([email protected]), do Departamento de Fı́sica da Universidade da Beira Interior. Não se garante que seja apropriado para qualquer fim especı́fico. Não se garante a sua correcção. Use-o por sua conta e risco. Este texto pode ser obtido no URL http://www.dfisica.ubi.pt/~amoreira/lectnotes/fesnts.pdf Este texto pode ser copiado, alugado, vendido, emprestado ou oferecido, desde que este “Copyleft” permaneça inalterado. O texto pode ser adaptado, acrescentado ou diminuı́do, desde que sejam satisfeitas as seguintes condições: • no produto final, deve ser incluı́da uma indicação bem visı́vel de que se trata de uma adaptação deste trabalho • devem ser referidos os nomes dos autores deste trabalho • deve ser apresentado o URL deste documento (ver acima) Os autores agradecem ser informados da redacção de trabalhos baseados neste texto. Em resumo, os autores autorizam qualquer utilização desta obra que respeite as regras básicas da honestidade, do bom-senso e da boa-educação. Composto em LATEX. Índice 1 Introdução 1.1 A estrutura dos sólidos . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Breve resumo da Tabela Periódica . . . . . . . . . . . . . . . . . . . 1.3 Resumo dos capı́tulos seguintes . . . . . . . . . . . . . . . . . . . . . 2 Elementos de Cristalografia 2.1 Cristais ideais e cristais reais . . . 2.2 A estrutura cristalina . . . . . . . 2.3 Tipos de redes cristalinas . . . . . 2.4 Exemplos de estruturas cristalinas 2.5 Direcções e planos cristalinos . . . 2.6 Distância interplanar . . . . . . . . 2.7 Coordenadas fraccionárias . . . . . 2.8 Defeitos . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . 1 1 2 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 7 9 11 15 17 19 20 21 3 Difracção elástica em cristais 3.1 Generalidades . . . . . . . . . . . . . . . . . . . 3.2 A condição de Bragg . . . . . . . . . . . . . . . 3.3 Métodos experimentais . . . . . . . . . . . . . . 3.4 Condição de Laue. Rede recı́proca . . . . . . . 3.4.1 A construcção de Ewald . . . . . . . . . 3.5 Equivalência das condições de Bragg e de Laue 3.6 Amplitude da difracção. Factor de estrutura . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 25 26 27 28 31 31 33 38 . . . . . . . . . . . . . 41 41 42 47 49 49 53 55 57 60 60 62 66 70 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Vibrações em cristais 4.1 A aproximação harmónica . . . . . . . . . . . . . . . . 4.2 Ondas mecânicas em meios contı́nuos . . . . . . . . . . 4.2.1 Vibrações de um meio contı́nuo tridimensional 4.3 Vibrações de um meio cristalino . . . . . . . . . . . . . 4.3.1 Vibrações de uma cadeia monoatómica linear . 4.3.2 Vibrações de uma cadeia biatómica linear . . . 4.3.3 Vibrações de um cristal tridimensional . . . . . 4.4 A densidade de modos de vibração . . . . . . . . . . . 4.5 O problema do calor especı́fico . . . . . . . . . . . . . 4.5.1 Modelo Clássico . . . . . . . . . . . . . . . . . 4.5.2 Modelo de Einstein . . . . . . . . . . . . . . . . 4.5.3 Modelo de Debye . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii ÍNDICE 5 Metais I: modelos de electrões livres 5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 O modelo de Drude-Lorentz . . . . . . . . . . . . . . . . . . . . 5.2.1 O calor especı́fico dos metais . . . . . . . . . . . . . . . 5.2.2 A lei de Ohm . . . . . . . . . . . . . . . . . . . . . . . . 5.2.3 O efeito de Hall . . . . . . . . . . . . . . . . . . . . . . . 5.2.4 Efeitos termoeléctricos . . . . . . . . . . . . . . . . . . . 5.3 Balanço do modelo de Drude . . . . . . . . . . . . . . . . . . . 5.4 O modelo de Sommerfeld . . . . . . . . . . . . . . . . . . . . . 5.4.1 Estados electrónicos . . . . . . . . . . . . . . . . . . . . 5.4.2 A densidade de estados electrónicos . . . . . . . . . . . 5.4.3 O estado fundamental de um gás de fermiões . . . . . . 5.4.4 O gás de electrões de condução à temperatura ambiente 5.4.5 A distribuição de Fermi-Dirac . . . . . . . . . . . . . . . 5.4.6 Energia de um gás de fermiões para T > 0 K . . . . . . 5.4.7 Calor especı́fico . . . . . . . . . . . . . . . . . . . . . . . 5.4.8 A condutividade eléctrica . . . . . . . . . . . . . . . . . 5.5 Crı́tica dos modelos de electrões livres . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 73 74 74 75 78 78 80 80 81 83 83 85 86 90 91 92 94 94 6 Metais II: Teoria de bandas 6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . 6.2 O teorema de Bloch . . . . . . . . . . . . . . . . . . 6.3 Propriedades dos estados de Bloch . . . . . . . . . . 6.3.1 Periodicidade no espaço recı́proco . . . . . . 6.3.2 Nı́veis de energia dos estados de Bloch . . . . 6.3.3 Momento linear . . . . . . . . . . . . . . . . . 6.3.4 Velocidade média e momento linear cristalino 6.3.5 Massa efectiva dos electrões de Bloch . . . . . 6.3.6 O livre caminho médio . . . . . . . . . . . . . 6.4 Modelo de Krönig-Penney . . . . . . . . . . . . . . . 6.5 Número de estados por banda . . . . . . . . . . . . . 6.6 O estado fundamental da nuvem electrónica . . . . . 6.7 A condução eléctrica . . . . . . . . . . . . . . . . . . 6.8 O gás de Bloch à temperatura ambiente. . . . . . . . 6.9 Lacunas . . . . . . . . . . . . . . . . . . . . . . . . . 6.10 Contaminação de semi-condutores . . . . . . . . . . 6.11 O diodo semicondutor . . . . . . . . . . . . . . . . . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 97 100 102 102 103 104 105 107 108 109 114 115 117 118 119 121 123 125 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Capı́tulo 1 Introdução É sabido que a matéria existe no universo em estados e formas muito variados. É usual a classificação destes estados em fases, sendo as mais vulgares à escala macroscópica as introduzidas no ensino básico, a saber: a fase gasosa, a lı́quida e a sólida. A Fı́sica do Estado Sólido (ou Fı́sica da Matéria Condensada) estuda as propriedades da matéria sob esta última forma. As caracterı́sticas dos sólidos variam grandemente (à parte, é claro, aquelas que os definem como tal), seja qual for o aspecto particular que se analise. Assim, há sólidos com alta e baixa densidade de massa, sólidos que se polarizam electricamente com maior ou menor facilidade, há sólidos que são bons condutores de calor e de electricidade e outros que não o são, há sólidos ferro-magnéticos, dia-magnéticos e para-magnéticos, sólidos opacos e sólidos transparentes, etc, etc, etc. A Fı́sica do Estado Sólido tem pois a difı́cil tarefa de explicar, recorrendo às leis básicas da Fı́sica, toda uma série de comportamentos dı́spares dos diferentes materiais. De acordo com o modelo atómico, hoje em dia incontestavelmente aceite, a matéria é constituı́da por moléculas e estas por átomos que, por sua vez, são formados por electrões, protões e neutrões. Todos estes diferentes tipos de partı́culas apresentam comportamentos que são, com precisão, descritos pela teoria fundamental do mundo microscópico — A Mecânica Quântica. Por esta razão, tentaremos descrever as diferentes propriedades dos diferentes sólidos à luz desta teoria. No entanto, veremos que não há praticamente nenhum domı́nio da Fı́sica que não seja chamado a desempenhar algum papel nesta tarefa. 1.1 A estrutura dos sólidos O estado fı́sico da matéria é o resultado do equilı́brio entre dois factores: as forças inter-atómicas e/ou inter-moleculares que tendem a establecer a coesão, e as vibração atómicas e moleculares que tendem a establecer a desordem molecular. Quando as forças inter-atómicas/moleculares prevalecem sobre as vibrações, a matéria encontra-se no estado sólido. Fundamentalmente, aquilo que distingue o estado sólido das restantes fases clássicas (gasosa e lı́quida) é o facto de, nos sólidos, os átomos oscilarem em torno de posições de equilı́brio fixas. A distribuição espacial destas posições de equilı́brio confere aos sólidos uma estrutura fixa e serve de critério para a sua classificação em três categorias principais: os cristalinos, os amorfos e os poli-cristalinos. Num sólido cristalino, as posições de equilı́brio dos átomos dispõem-se regularmente ao longo de todo o volume do sólido, repetindo um padrão básico, à laia de um “papel de parede tridimensional”. Nos sólidos amorfos, não se manifesta qualquer regularidade nas posições de equilı́brio dos átomos. Finalmente, os sólidos poli-cristalinos são constituı́dos por um grande número de 1 2 CAPÍTULO 1. INTRODUÇÃO pequenos cristais, com orientações e dimensões arbitrárias. Qualquer que seja a sua composição quı́mica, é possı́vel preparar uma amostra de sólido em qualquer destes três estados. Por exemplo, a fase sólida da água é representada por cristais de neve (forma cristalina), gelo (do que usamos para refrescar as bebidas) (forma amorfa) ou neve comprimida (forma poli-cristalina). Os electrões dos átomos que constituem os sólidos contribuem de forma determinante para um um grande número das suas propriedades. Sendo partı́culas de spin semi-inteiro, satisfazem a estatı́stica de Fermi-Dirac e, portanto, o Princı́pio de Exclusão de Pauli: cada estado quântico não pode ser ocupado por mais que um electrão. No estado fundamental, um átomo com N electrões tem os N estados quânticos de menor energia todos ocupados (com um electrão cada) e os restantes todos desocupados. Os electrões que ocupam estados de menor energia estão, em média, mais próximos do núcleo do átomo a que pertencem do que os que ocupam estados de maior energia. Assim, aqueles “sentem” com menor intensidade a presença de outros átomos na vizinhança, e por isso praticamente não participam nas ligações quı́micas responsáveis pelo agrupamento de átomos em moléculas. Ao conjunto do núcleo e destes electrões vamos dar o nome de cerne iónico. As ligações interatómicas envolvem então os electrões mais exteriores de cada átomo, os chamados electrões de valência, e o tipo particular de ligação quı́mica estabelecida entre dois átomos depende basicamente das propriedades dos estados quânticos ocupados por estes electrões. As ligações quı́micas que garantem a coesão dos sólidos são, fundamentalmente, de quatro tipos diferentes: iónico, covalente, de van der Waals (ou forças de dispersão de London) e metálico. Nas três primeiras categorias, os electrões responsáveis pela ligação permanecem localizados em regiões limitadas do espaço, normalmente na vizinhança do átomo a que originalmente pertenciam. Pelo contrário, na ligação metálica os electrões de valência ficam muito fracamente ligados a cada átomo, sendo relativamente fácil o movimento de átomo para átomo, após o estabelecimento da ligação. As funções de onda destes electrões deixam de estar localizadas em torno de cada átomo, estendendo-se por todo o volume do metal. A estas funções dá-se o nome de orbitais metálicas. Esta deslocalização das orbitais metálicas é responsável pelas elevadas condutividades térmica e eléctrica dos metais, e por muitas outras das suas propriedades. A disposição regular dos átomos nos sólidos cristalinos simplifica muito a sua análise e por isso a Fı́sica do Estado Sólido avançou muito mais no estudo destes sólidos que no dos sólidos amorfos ou poli-cristalinos. Neste curso, por esta razão, abordaremos principalmente os sólidos cristalinos. 1.2 Breve resumo da Tabela Periódica Antes de de iniciarmos o nosso estudo dos sólidos, justifica-se uma breve digressão pelas propriedades das várias espécies quı́micas puras, e das ligações que entre elas se estabelecem. Os 106 elementos conhecidos estão ordenados na Tablea Periódica da esquerda para a direita em número atómico crescente. Elementos na mesma coluna têm propriedades fı́sicas e quı́micas semelhantes e os seus sólidos, em geral, são também similares. (a) Gases inertes Os elementos da coluna VIII, designados por gases inertes, têm as suas orbitais de valência completamente preenchidas. A sua inatividade quı́mica é atribuida facto do hiato energético existente entre a energia das orbitais de valência e o nı́vel de energia imediatamente superior ser relativamente grande. Assim, a configuração electrónica destes átomos é particularmente estável, sendo por isso difı́cil o estabelecimento de 1.2. BREVE RESUMO DA TABELA PERIÓDICA 3 ligações quı́micas. Este facto pode ser ilustrado comparando os valores do raio atómico de elementos de uma mesma linha da Tabela Periódica; com a excepção da linha Hidrogénio-Hélio, os elementos que em cada linha apresentam os menores valores do raio atómico são os da coluna VIII. Os gases inertes assumem o estado sólido a temperaturas inferiores a ∼200 K. A ligação quı́mica é efectuada, fundamentalmente, por meio de interacções de van der Waals. Pequenas deformações da função de onda electrónica com momento dipolar não nulo induzem dipolos eléctricos nos átomos vizinhos; os dipolos eléctricos assim gerados atraem-se fracamente, aproximando os átomos até onde as interacções repulsivas cerne-cerne o permitirem, formando cristais compactos em que cada átomo tem doze átomos vizinhos. Por exemplo, enquanto que o hélio solidifica a 0,95 K, o rádon necessita apenas de uma temperatura de 202 K para atingir o estado sólido, o que é compreensı́vel, já que este último dispõe de uma nuvem electrónica significamente maior, favorecendo o aparecimento de dipólos induzidos e forças de dispersão de London mais intensas. m 4p 15 ligações covalentes Figura 1.1: Diamante — Cada átomo de carbono estabelece quatro ligações covalentes com átomos vizinhos, formando um tetraedro regular. (b) Metais alcalinos O estado fundamental dos átomos das outras colunas da tabela consiste na configuração electrónica de um gás inerte (que, juntamente com o núcleo, contitui o cerne atómico), “adicionado”de um ou mais electrões em nı́veis de energia superiores. A configuração electrónica do cerne dos átomos numa linha da tabela consiste na configuração do gás inerte da linha anterior. Os metais alcalinos encontram-se nas colunas IA e IIA. Estes elementos têm um ou dois electrões na orbital exterior s, fracamente ligados ao resto do átomo. Os metais alcalinos solidificam a temperaturas que variam entre os 300 K e os 1 600 K. Ao solidificarem, a função de onda dos electrões de valência estende-se a todo o sólido e portanto estes podem mover-se livremente através do material. A mobilidade destes electrões de valência confere a estes sólidos excelentes propriedades de condução térmica e eléctrica. À excepção do hidrogénio os elementos da coluna IA são designados por metais alcalinos e os da coluna IIA são os metais alcalinos terrosos. (c) Colunas IIIB, IVB, VB, VIB e VIIB Os átomos dos elementos destas colunas têm, na camada de valência, a orbital s completamente preenchida e a p parcialmente preenchida. Ambas as orbitais não sofrem influência significativa do cerne iónico. 4 CAPÍTULO 1. INTRODUÇÃO Estes elementos têm propriedades fı́sicas variadas. O azoto, oxigénio, flúor e cloro são gases à temperatura ambiente e solidificam a temperaturas inferiores a 100 K. Tanto o oxigénio como o azoto formam moléculas via ligações covalentes. Ao solidificarem as restantes ligações são asseguradas por ligações de van der Waals entre essas as moléculas. Todos os outros elementos à excepção do Bromo, que é lı́quido à temperatura ambiente, são sólidos. O alumı́nio, estanho e chumbo são metais. O arsénio, antimónio e bismuto têm caracterı́sticas de metais mas não são metais tı́picos. Algumas formas alotrópicas do carbono e telúrio são razoáveis condutores de calor e electricidade. O silı́cio e germânio são semicondutores, ou seja, são isoladores a baixas temperaturas e condutores a altas temperaturas. Todos os restantes elementos são isoladores. À excepção dos metais, os elementos nestas colunas solidificam através de ligações covalentes. Na ligação covalente os electrões de ligação ocupam a região ao longo da linha que junta os dois átomos, passando a ser partilhados pelos dois cernes iónicos. Estas ligações são bastante fortes e os electrões participantes ficam confinados à zona cerne-cerne contribuindo para a baixa prestação de condução eléctrica e térmica apresentadas por estas substâncias. Um átomo pode estabelecer ligações covalentes com um máximo de quatro átomos vizinhos. Neste caso as ligações formam um tetraedro regular. A estrutura cristalina é menos densa que a resultante de ligações de van der Waals. A forma alotrópica do carbono em diamante é um exemplo de um sólido com ligações covalentes tetraédrica, porém, a cristalização do carbono em forma de grafite consiste em planos de ligações covalentes que envolvem três átomos (formando um hexágono), sendo a ligação interplanar assegurada por meio de ligações de van der Waals (ver Figuras 1.1 e 1.2). Como sabemos, estas duas formas de carbono têm propriedades bem diferentes. ligações covalentes 142 pm 350 pm ligações de van der Waals Figura 1.2: Grafite — Os átomos de carbono formam planos hexagonais de ligações covalentes entre três átomos vizinhos. As ligações entre planos são de van der Waals. (d) Elementos de transição A parte central da tabela que compreende as colunas IIIA, IVA, VA, VIA, VIIA e VIIIA, contém os chamados elementos de transição. As orbitais de valência d e f destes átomos são preenchidas por ordem crescente de energia. Verifica-se que, não obstante as orbitais d terem energias comparáveis às orbitais s, o seu pico de densidade de probabilidade está bastante mais perto do cerne iónico que o pico de densidade de probabilidade das orbitais s. Assim, à semelhança dos elementos da coluna IA e IIA, os electrões na orbital s tornam-se livres e conferem a estes elementos propriedades que os caracterizam como os metais. Adicionalmente, 1.3. RESUMO DOS CAPÍTULOS SEGUINTES 5 electrões na orbital d formam ligações com átomos vizinhos, extremamente fortes e de tipo covalente (e.g. de todos os metais de transição o volfrâmio é o mais fortemente ligado). Os electrões nas orbitais f e d, apesar de não contribuirem para propriedades metálicas destes elementos, dado estarem sobre forte influência do cerne, tomam um papel importante quando parcialmente preenchidas, sendo “responsáveis”pelas propriedades magnéticas de alguns destes elementos. (e) Os metais nobres Os metais nobres, nas colunas IB e IIB, são em muitos aspectos semelhantes aos metais alcalinos. Têm a orbital d completamente preenchida e a orbital s com um ou dois electrões. 1.3 Resumo dos capı́tulos seguintes O próximo capı́tulo lança as bases para o estudo dos cristais, introduzindo os conceitos de rede cristalina e base, e define a notação matemática usada neste domı́nio. O Capı́tulo 3 trata a difracção de radiação por redes cristalinas, sendo superficialmente abordada a difracção por cristais. O Capı́tulo 4 expande o modelo cristalino por forma a incluir as vibrações atómicas e algumas consequências destas vibrações são estudadas, usando os formalismos clássico e quântico. No Capı́tulo 5, estudamse as propriedades dos metais supondo os electrões de valência livres. Finalmente, o Capı́tulo 6 trata os electrões de valência nos condutores, introduzindo a Teoria de Bandas. Capı́tulo 2 Elementos de Cristalografia Neste capı́tulo, vamos introduzir a linguagem e os conceitos básicos utilizados no estudo dos cristais. Os tópicos aqui abordados serão usados ao longo de todo o curso e é, por isso, importante que sejam bem apreendidos. 2.1 Cristais ideais e cristais reais Como foi dito no capı́tulo anterior, os átomos dos sólidos cristalinos ocupam posições dispostas regularmente, formando padrões que se repetem espacialmente em todas as direcções. A esta estrutura dá-se o nome de cristal. Em rigor, os cristais reais não podem satisfazer esta definição, porque uma periodicidade absoluta é impossı́vel. Com efeito, as impurezas quı́micas, os defeitos fı́sicos no padrão de repetição, as oscilações térmicas, e até mesmo as fronteiras dos cristais reais destroem essa periodicidade. Reservamos então aquela definição para os cristais ideais, que serão então corpos infinitos, absolutamente puros do ponto de vista quı́mico, com átomos “congelados” nas suas posições de equilı́brio, etc, considerando os cristais reais aproximações mais ou menos razoáveis daqueles. 2.2 A estrutura cristalina Matematicamente, um cristal ideal pode ser descrito como um conjunto de átomos dispostos numa rede definida por três vectores linearmente independentes a, b, c, chamados vectores fundamentais de translação, tais que o arranjo atómico é, em todos os aspectos, semelhante quando observado de dois pontos com vectores posição r e r 0 , relacionados através de r 0 = r + ha + kb + lc, (2.1) com h, k e l inteiros arbitrários. Com r fixo, ao conjunto de pontos que se obtem variando h, k, e l na equação (2.1) dá-se o nome de rede cristalina, ou de Bravais. De acordo com as definições apresentadas, não podemos confundir os conceitos de cristal e de rede cristalina. Esta é uma abstracção matemática que consiste num conjunto de pontos idênticos, dispostos regular e periodicamente no espaço, ao passo que o cristal é formado por um conjunto de átomos, que podem nem ser todos da mesma espécie quı́mica, como é o caso do cloreto de sódio. A estrutura do cristal pode ser gerada sobrepondo a cada ponto da rede cristalina uma base (ou motivo) de átomos, idêntica para todos os pontos da rede. Assim, a relação entre cristal, rede cristalina e motivo pode ser simbolizada como rede + motivo = cristal. 7 8 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA Vejamos o seguinte exemplo para nos ajudar a sedimentar este novo conceito. Na Figura 2.1 está representado um cristal composto por três átomos diferentes. Este cristal pode ser recriado colocando uma réplica do motivo de três átomos junto a cada um dos pontos da rede. motivo ponto da rede cristal=rede+motivo (a) (b) Figura 2.1: (a) base de três átomos; (b) cristal. Em cada ponto da rede é colocado a base de átomos de modo a formar o cristal. Uma outra abordagem, ilustrada com o seguinte exemplo bi-dimensional, consiste em determinar a rede a partir do cristal: a Figura 2.2 representa uma estru- b’ b a’ y x (a) a (b) Figura 2.2: Exemplo de um cristal bi-dimensional. tura cristalina bi-dimensional, formada por átomos de duas espécies, “•” e “◦”. De acordo com a definição apresentada, os vectores fundamentais são tais que qualquer combinação linear com coeficientes inteiros destes vectores é igual à diferença entre as posições de dois pontos equivalentes no cristal. Logo, os vectores x e y representados na figura não são vectores fundamentais, porque unem pontos não equivalentes (a posição de um átomo “•” e de um outro “◦”). A figura da direita representa duas possibilidades de escolha de vectores fundamentais (a, b e a0 , b0 ), a rede cristalina por eles gerada e os motivos correspondentes. Chamam-se vectores da rede cristalina aos vectores que unem dois quaisquer pontos da rede. No exemplo que acabámos de apresentar, a, b, a0 , b0 são vectores da rede, mas o mesmo não acontece com x ou com y. Se qualquer vector da rede 2.3. TIPOS DE REDES CRISTALINAS 9 puder ser escrito como combinação linear, com coeficientes inteiros, dos vectores fundamentais, então estes dizem-se vectores fundamentais primitivos. No exemplo apresentado, a0 e b0 são vectores fundamentais primitivos, ao passo que a e b não o são. Para verificar esta última preposição basta ver que, por exemplo, o vector b0 é uma combinação linear de a e b, mas com coeficientes fraccionários: b0 = 1 1 a + b. 2 2 (2.2) Ao paralelogramo formado pelos vectores fundamentais dá-se o nome de célula unitária. Se os vectores fundamentais forem, além disso, primitivos, a célula unitária por eles formada chama-se célula unitária primitiva. Em rigor, esta definição dá-nos apenas um exemplo de célula unitária primitiva. Uma definição formal é a seguinte: Célula unitária primitiva é uma porção de espaço que, copiada através de translações geradas por todos os vectores da rede, preenche todo o volume da rede cristalina, sem sobreposições ou espaços vazios. Desta definição deduz-se facilmente que uma célula unitária primitiva contém um, e apenas um, ponto de rede. Se n for a densidade espacial destes pontos (isto é, o número de pontos por unidade de volume) e v for o volume de uma célula unitária primitiva, então temos que nv = 1 e logo v = 1/n. Como este resultado é válido qualquer que seja a célula unitária primitiva (isto é, quaisquer que sejam os vectores fundamentais primitivos usados para a construir), concluı́mos que todas as células unitárias primitivas têm o mesmo volume. Acabámos de ver que podemos construir uma célula unitária primitiva com o paralelogramo definido por um conjunto de vectores fundamentais primitivos. Uma outra possibilidade é a seguinte: unimos com segmentos de recta um dado ponto de rede a todos os seus vizinhos mais próximos; a região do espaço limitada pelos planos bissectores destes segmentos é uma célula unitária primitiva. As células construı́das desta forma chamam-se células unitárias primitivas de Wigner-Seitz. Note-se que, para a definição da células de Wigner-Seitz, não é necessário escolher um conjunto de vectores fundamentais primitivos; assim, a sua forma depende apenas do tipo de rede, ao contrário do que acontece com as células unitárias mais usuais definidas a partir do paralelogramo formado pelos vectores cristalográficos. A Figura 2.3 representa o processo de construção de uma destas células. Figura 2.3: Célula unitária primitiva de Wigner-Seitz. 2.3 Tipos de redes cristalinas A classificação das redes cristalinas faz-se em termos das operações de simetria que cada uma aceita. Assim, e por exemplo, as redes cúbicas são aquelas que ficam 10 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA inalteradas sob rotações de π2 em torno de certas direcções. Não faremos aqui este tipo de estudo por não ter uma importância fundamental no que se segue, neste curso de nı́vel introdutório. Faremos apenas uma descrição geométrica dos diferentes tipos de rede. Designamos por a, b e c os vectores fundamentais da rede, c α b γ β a Figura 2.4: Vectores e ângulos fundamentais. por a, b e c os seus módulos e por α, β e γ os ângulos entre eles, definidos de acordo com o esquema da Figura 2.4. Às quantidades a, b, c, α, β e γ dá-se o nome de parâmetros da rede cristalina. (a) Redes cúbicas De todos os tipos de redes cristalinas, o mais simples de visualizar é o cúbico, caracterizado em geral por a=b=c α = β= γ = (2.3) π . 2 (2.4) b β γ α a c Há três subespécies da rede cúbica: a rede cúbica simples, cujos pontos estão dispostos como os vértices de cubos iguais, arrumados contiguamente; a rede cúbica de corpo centrado, que, além dos pontos que constituem a rede cúbica simples, contém ainda um ponto no centro do corpo de um dos cubos que referimos; e a rede cúbica de faces centradas, que é formada pelos pontos que formam a rede cúbica simples, e contém ainda um ponto no centro das faces daqueles cubos. (b) Redes tetragonais Se comprimirmos ou alongarmos uma rede cúbica numa das suas direcções fundamentais, obtemos uma rede do tipo chamado rede tetragonal. Nesta, os pontos dispõem-se nos vértices de prismas rectos de base quadrada (variante simples) e nos centros dos corpos destes prismas (variante de corpo centrado). As redes tetragonais são então caracterizadas por a = b 6= c (2.5) π α = β= γ = . 2 (2.6) b a c Note-se que as redes tetragonais não apresentam a variante de faces centradas. (c) Redes ortorrômbicas As chamadas redes ortorrômbicas são as que se obtêm deformando a rede cúbica segundo duas das suas direcções fundamentais. Os ângulos fundamentais são ainda todos iguais a π2 , mas os módulos dos vectores fundamentais são diferentes entre si, ou seja, 2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS a 6= b 6= c (2.7) π α = β= γ = . 2 (2.8) b β γ α a 11 c Este tipo de rede cristalina apresenta as três variantes simples, de corpo centrado e de faces centradas, e ainda uma quarta, chamada rede de bases centradas, que é formada por pontos nos vértices de paralelipı́pedos iguais dispostos contiguamente e dois pontos, nos centros de duas faces opostas.As deformações que aplicámos até agora à rede cúbica, para obtermos as redes tetragonais e ortorrômbicas, têm a propriedade de manter os ângulos α, β e γ iguais a π2 . Vamos agora apresentar outras possibilidades. (d) Redes monoclı́nicas Deformemos uma rede ortorrômbica, por forma a alterar o valor de γ, deixando os outros parâmetros inalterados. Obtemos assim uma rede do tipo chamado rede monoclı́nica, que apresenta apenas as variantes simples e de bases centradas. As relações entre os parâmetros, neste tipo de rede, são: a 6= b 6= c π α = β= 6= γ. 2 (2.9) α γ β b (2.10) a c (e) Redes triclı́nicas Finalmente, consideremos agora a rede cristalina mais geral, no sentido em que menos constrangimentos impomos aos parâmetros de rede. A rede triclı́nica fica definida por a 6= b 6= c α 6= β6= γ 6= β (2.11) π . 2 b (2.12) γ α a c Há ainda que considerar dois tipos particulares de rede, que são casos particularmente importantes dos que já mencionámos. (f) Redes trigonais A rede trigonal pode obter-se por deformação da rede cúbica na direcção de uma das diagonais principais. É caracterizada por a=b=c (2.13) 2 α = β= γ < π. 3 (2.14) (g) Redes hexagonais São casos particulares da rede monoclı́nica, em que γ = 32 π. Assim, verificam a = α 2.4 = b 6= c π β= , 2 (2.15) γ= 2 π. 3 (2.16) Exemplos de estruturas cristalinas Nesta secção apresentaremos exemplos das estruturas cristalinas apresentadas por algumas substâncias quı́micas. 12 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA (a) Redes cúbicas simples Este tipo de estrutura não é energeticamente favorável para substâncias simples, e por isso poucos elementos a adoptam. O único exemplo é o polónio, na forma α. Em contrapartida, há vários compostos que apresentam redes cristalinas do tipo cúbico simples, como, por exemplo, o cloreto de césio, CsCl. Nos cristais de cloreto de césio, os átomos de uma espécie ocupam as posições definidas pela rede cúbica simples, enquanto que os da outra ocupam os centros dos corpos da célula unitária. Note-se que isto não define a rede como sendo cúbica de corpo centrado, porque os átomos de cloro e de césio são diferentes. Assim, não podem ocupar, ambos, posições da rede cristalina, que, por definição, é um conjunto de pontos equivalentes. A Tabela 2.1 apresenta alguns compostos que cristalizam numa estrutura cúbica simples. Substância CsCl CsBr CsI TlCl TlBr TlI a (Å) 4,11 4,29 4,56 3,84 3,97 3,74 Substância NH4 Cl CuZn AgMg LiHg AlNi BeCu a (Å) 3,87 2,94 3,28 3,29 2,88 2,70 Tabela 2.1: Alguns compostos que cristalizam em redes cúbicas simples. Também é apresentado o valor do parâmetro de rede a. (b) Redes cúbicas de faces centradas A rede cúbica de faces centradas é uma das redes que apresenta empacotamento máximo (ver adiante nesta secção) e por isso muitos elementos apresentam estruturas cristalinas deste tipo. Na Tabela 2.2 apresentam-se algumas substâncias (tanto elementos como compostos) que cristalizam em redes cúbicas simples. O silı́cio e o Elemento Cu Ag Au Al a (Å) 3,61 4,08 4,07 4,04 Composto NaCl LiF KCl LiBr a (Å) 5,63 4,02 6,28 5,49 Tabela 2.2: Substâncias que cristalizam em redes cfc. germânio (muito importantes na industria de semi-condutores) cristalizam também na rede cúbica de faces centradas, com valores para o parâmetro de rede a de 5,43 Å e 5,45 Å, respectivamente. Um outro exemplo importante é o carbono, na forma de diamante. A estrutura cristalina do diamante pode ser gerada associando a cada ponto de uma rede cúbica de faces centrada um motivo constituı́do por dois átomos de carbono com coordenadas fraccionárias(a) (0,0,0) e ( 14 , 14 , 14 ). O valor do parâmetro de rede do diamante é a = 3, 56 Å. (c) Redes cúbicas de corpo centrado Os metais alcalinos cristalizam todos em redes cúbicas de corpo centrado. Na Tabela 2.3 resumem-se as propriedades da rede cristalina de alguns elementos que apresentam esta estrutura. (a) Mais adiante serão introduzidas estas coordenadas. Para os presentes efeitos, é suficiente saber que um ponto cujas coordenadas fraccionárias são (q, r, s) ocupa uma posição definida por q a + rb + sc relativamente a uma origem convenientemente escolhida. 2.4. EXEMPLOS DE ESTRUTURAS CRISTALINAS Elemento Li Na K Rb Cs Ba a (Å) 3,50 4,28 5,25 5,69 6,08 5,01 Elemento V Nb Ta Cr Mo W 13 a (Å) 3,03 3,29 3,29 2,88 3,14 3,16 Tabela 2.3: Alguns elementos que cristalizam em redes do tipo ccc. (d) Redes de empacotamento máximo Em muitos metais e nos sólidos inertes, a ligação quı́mica é tal que favorece uma grande proximidade entre os átomos envolvidos. Nestes casos, as posições ocupadas pelos átomos podem ser visualizadas imaginando-os como esferas rı́gidas, encostadas umas às outras por forma a minimizar o volume intersticial. Nestas condições diz-se que a rede cristalina é de empacotamento máximo. Há dois tipos de redes de empacotamento máximo: a rede cúbica de faces centradas e a chamada rede hexagonal compacta. Para compreendermos a razão de existirem apenas estas duas espécies, analisemos a Figura 2.5. Nela, está representado um plano de esferas iguais, dispos- B C B B A A C C B A C A A C B B A A ABA ABC Figura 2.5: As duas possibilidades para o empacotamento máximo. tas contiguamente, formando uma rede bi-dimensional hexagonal. Para formarmos um cristal tri-dimensional, devemos colocar, sobre o plano representado à esquerda, outros planos semelhantes. Para maximizar o volume ocupado, os centros das esferas do “segundo andar” deverão ficar nas verticais dos pontos B ou, em alternativa, dos pontos C. Suponhamos que se verifica a primeira possibilidade. Analisemos agora as possibilidades de colocação de um terceiro andar. Os centros das esferas desta nova camada devem ocupar posições nas verticais dos espaços intersticiais do segundo andar, ou seja, as verticais dos pontos A (dizendo-se então que se trata de um empacotamento do tipo ABABA . . .) ou, alternativamente, as verticais dos pontos B (empacotamento do tipo ABCABC . . .). As duas possibilidades estão representadas à direita na Figura 2.5. As redes com empacotamento do tipo ABC são, de facto, redes cúbicas de faces centradas, em que o plano apresentado na Figura 2.5 à esquerda é um plano perpendicular a uma direcção diagonal principal; as redes com empacotamento do tipo ABA são redes hexagonais compactas (ver a Figura 2.6). A rede hexagonal compacta não é, no sentido estrito, uma rede cristalina, pois os pontos que a formam não são todos equivalentes, como está patente na Figura 2.6: os pontos do plano central não são equivalentes aos das bases. No entanto, é uma estrutura apresentada por um número relativamente grande de substâncias quı́micas, e por essa razão a incluı́mos nesta discussão. Para que uma “rede” hexagonal compacta seja uma estrutura de empacotamento máximo, a relação entre os 14 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA c b a Figura 2.6: A rede hexagonal compacta. módulos dos vectores fundamentais a, b e c é a = b c = 1, 63a. (2.17) (2.18) Dados relativos a alguns elementos que cristalizam na rede hexagonal compacta estão apresentados na Tabela 2.4 Elemento Be Ce He (2K) Mg Ti Zn a (Å) 2,29 3,65 3,57 3,21 2,95 2,66 c (Å) 3,58 5,96 5,83 5,21 4,69 4,95 c/a 1,56 1,63 1,63 1,62 1,59 1,86 Tabela 2.4: Elementos com rede hexagonal compacta. (e) Outras estruturas — Exemplos com elementos Na Tabela 2.5 resumimos propriedades da rede cristalina de elementos que cristalizam em redes trigonais, ortorrômbicas e tetragonais. Elemento Hg (5K) Bi In Sn (branco) Ga Cl (113K) Tipo de rede Trigonal Trigonal Tetragonal Tetragonal Ortorrômbica Ortorrômbica a 2,99 4,75 4,59 5,82 4,51 6,24 b — — — — 4,52 8,26 c — — 4,94 3,17 7,64 4,48 θ 70◦ 450 57◦ 140 — — — — Tabela 2.5: Alguns elementos com redes trigonais, tetragonais e ortorrômbicas. Os módulos dos vectores fundamentais são indicados em Å. Os valores redundantes não estão explicitados. 2.5. DIRECÇÕES E PLANOS CRISTALINOS 2.5 15 Direcções e planos cristalinos Como já foi dito, qualquer vector da rede, R, pode ser escrito como uma combinação linear inteira(b) dos vectores a, b, c de um conjunto fundamental primitivo, isto é, R = ha + kb + lc, h, k, l ∈ Z, (2.19) onde Z designa o conjunto dos números inteiros. Como é evidente, se o conjunto de vectores a, b, c for um conjunto fundamental não primitivo, esta equação só pode manter-se, qualquer que seja o vector de rede R, se permitirmos que h, k e l possam tomar valores racionais não inteiros. Em qualquer caso, os vectores de um conjunto fundamental formam uma base natural para a descrição geométrica e analı́tica do cristal. Devemos, no entanto, ter em atenção que, por norma, esta base não é ortonormada e que, portanto, muitas igualdades elementares da geometria analı́tica de uso comum não são aqui aplicáveis. Os cristalógrafos desenvolveram uma notação, baseada na utilização de bases formadas com vectores fundamentais, que permite especificar facilmente posições, direcções e planos num cristal, que vamos passar a descrever. Chamam-se direcções cristalinas a direcções definidas por dois pontos da rede cristalina. Consideremos um vector de rede R que une dois pontos contı́guos numa dada direcção (ver a Figura 2.7). De acordo com a equação (2.19), existem três números inteiros (ou, quando muito, racionais) h, k, l, tais que b a Figura 2.7: Exemplo de direcção cristalina. R = ha + kb + lc. (2.20) Eliminando factores racionais comuns, obtemos três números inteiros r, s e t, que identificam a direcção (cristalina) do vector R, como sendo a do vector ra + sb + tc. Estes três números, na notação cristalográfica que iremos adoptar, apresentam-se entre parêntesis rectos e sem quaisquer separadores (vı́rgulas, espaços, etc.) entre eles, como em [rst]. Se algum destes inteiros for negativo, o sinal deve ser colocado sobre, e não atrás, do ı́ndice respectivo, como em [121]. Por exemplo, a direcção da diagonal principal numa rede cúbica (isto é, aquela que passa no centro do corpo da célula unitária, partindo da sua origem) fica identificada por [111]. Tal como as direcções cristalinas são as definidas por dois pontos da rede, planos cristalinos são os definidos por três pontos da rede cristalina. Devido à regularidade da rede, um dado plano cristalino contém, para além dos três pontos de rede que o definem, um número infinito de outros pontos de rede, que formam, nesse plano, uma rede cristalina bidimensional. Também por causa desta regularidade, é possı́vel, dado um qualquer plano cristalino, definir uma infinidade de outros planos (b) Daqui em diante, usaremos esta expressão referindo-nos a uma combinação linear com coeficientes inteiros. 16 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA cristalinos, paralelos ao primeiro. Os ı́ndices de Miller são uma forma prática de especificar a orientação de uma destas famı́lias de planos cristalinos paralelos. Para uma dada famı́lia definem-se da seguinte forma: c c/l a/h a b/k b Figura 2.8: Plano cristalino com ı́ndices (hkl). (a) tomando, na famı́lia considerada, o plano que mais se aproxima da origem da célula unitária, determinam-se as distâncias que a separam dos pontos em que o plano escolhido intersecta as direcções dos vectores fundamentais a, b e c, e exprimem-se estas distâncias em unidades de a, b e c, respectivamente; (b) tomam-se os inversos dos resultados obtidos no primeiro ponto e reduzem-se a três inteiros nas mesmas proporções relativas, tendo o cuidado de eliminar eventuais(c) factores comuns. O resultado é apresentado entre parêntesis curvos, sem separadores. Para o plano apresentado na Figura 2.8, os ı́ndices de Miller são (hkl), se os inteiros h, k e l não tiverem divisores comuns. Também para os ı́ndices de Miller se segue a convenção de colocar os sinais “-” sobre os ı́ndices negativos. Assim, se para uma dada famı́lia de planos resultarem os valores 2, -3, 1 para os ı́ndices de Miller, o resultado deve ser apresentado como (231). Se um dado plano é paralelo a um dos eixos fundamentais, então não o intersecta, obviamente; o valor do ı́ndice de Miller correspondente é, por definição, 0 (zero). Por exemplo, a famı́lia de planos paralela ao plano definido pelos vectores fundamentais a e b tem ı́ndices de Miller (001); os ı́ndices de Miller da famı́lia de planos paralela ao que contém as extremidades dos vectores a, b e c são (111); um plano que contenha os pontos cujos vectores posição a, b/2(d) , 2c (ver figura 2.9) pertence a uma famı́lia com os ı́ndices de Miller (241). Analisemos este caso em detalhe. O plano em questão cruza os eixos fundamentais em pontos que estão a distâncias a, b/2 e 2c da origem. Passa assim, em particular, num ponto de rede cujo vector posição é 2c. Mas existem, nesta famı́lia de planos, elementos mais próximos da origem. Com efeito, existe um plano cristalino, paralelo ao que estamos a considerar, que passa no ponto cujo vector posição é c, e é este plano que, pela sua maior proximidade à origem, deve ser usado na construção da definição dos ı́ndices de Miller. Este plano cruza os eixos cristalográficos em pontos que estão a distâncias a/2, b/4 e c da origem. Usando como unidades para estas distâncias os módulos (c) Pode demonstrar-se que, se se usar na construcção dos ı́ndices de Miller o plano que mais se aproxima da origem, os ı́ndices obtidos não têm divisores comuns. (d) Note-se que o ponto cujo vector posição é b/2 não é um ponto de rede. No entanto, o plano em questão é de facto um plano de rede, pois contém os pontos da rede cujos vectores posição são a, 2c, b − 2c. 2.6. DISTÂNCIA INTERPLANAR 17 c a b Figura 2.9: Dois planos da famı́lia (241). O triângulo maior representa o plano que corta os eixos cristalográficos nos pontos a, b/2, 2c; o triângulo menor representa o plano que deve ser usado na determinação dos ı́ndices de Miller. dos vectores vectores fundamentais correspondentes, obtemos os números racionais 1/2, 1/4 e 1; os inversos destes números são 2, 4 e 1, e portanto esta famı́lia de planos tem os ı́ndices de Miller (241), como se afirmou. 2.6 Distância interplanar No próximo capı́tulo veremos que a distância entre dois planos consecutivos de uma famı́lia de planos paralelos é um parâmetro muito importante no estudo da difracção de radiação pelos cristais. Vamos por esta razão determiná-la de seguida. Na Figura 2.10 estão representados os vectores fundamentais de uma rede cristalina e dois planos de uma famı́lia cujos ı́ndices são (hkl). Pretendemos determinar a distância interplanar dhkl . Atendendo à figura da esquerda (desenhada segundo c c dhkl P3 P3 G’ θ O H P1 P2 a a P1 F b Figura 2.10: Distância interplanar dos planos (hkl). a direcção do vector b para a manter compreensı́vel), notamos que a distância requerida é igual ao comprimento da projecção do segmento OP1 segundo a direcção do vector G0 , que é escolhido perpendicular à famı́lia de planos (hkl). De acordo com a definição dos ı́ndices de Miller, o segmento OP1 tem comprimento a/h, e, portanto, dhkl = a/h cos θ. Podemos dar a esta igualdade uma forma mais prática usando o produto interno entre os vectores a e G0 : dhkl = a G0 · , h |G0 | (2.21) onde G0 pode ser qualquer vector perpendicular ao plano (hkl). Uma forma simples de construir G0 é formando o produto vectorial de dois vectores não colineares deste plano, por exemplo os vectores H e F representados na Figura 2.10 à direita. Estes 18 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA dois vectores, escritos como combinações lineares dos vectores fundamentais, são b a − k h c b = − , l k F = P2 − P1 = (2.22) H = P3 − P2 (2.23) onde representámos por Pk os vectores posição dos pontos Pk (k = 1, 2, 3). Fazendo o produto externo destes dois vectores resulta G0 = F × H = 1 1 1 a×b + b×c + c × a, hk kl lh (2.24) e, substituindo em (2.21), obtemos dhkl = a · (b × c) . hkl|G0 | (2.25) Finalmente, notamos que o produto misto no numerador da fracção em (2.25) é igual ao volume da célula unitária definida pelos vectores fundamentais a, b e c, que representaremos por τ . Introduzindo o vector Ghkl , dado por Ghkl = hkl 2π 0 2π 2π 2π G = l a×b + h b×c + k c × a, τ τ τ τ (2.26) obtém-se para a distância interplanar, por fim, dhkl = 2π . |Ghkl | (2.27) Esta expressão será usada no próximo capı́tulo, no estudo da difracção de radiação por cristais, onde também será discutida a importância dos vectores com a forma de Ghkl (eq. 2.26), chamados vectores da rede recı́proca. Uma vez determinada distância entre famı́lia de planos vamos agora analisar a densidade de pontos contidos em cada plano, i.e. o número de pontos por unidade de área da famı́lia de planos (hkl). Considere uma célula unitária formada por três vectores da rede. Dois destes vectores, u e v estão contidos num plano da famı́lia (hkl) (ver a Figura 2.11); o terceiro vector, w, está ligado a um plano adjacente da mesma famı́lia. Note-se que a célula unitária assim construida contém apenas um ponto de rede e portanto é, de facto, primitiva. O volume da célula formada por este três vectores é, como já foi demonstrado, igual a τ . Este volume também é igual ao volume formado pelos vectores u e v e um terceiro (que em geral não é vector da rede) de módulo igual à distância interplanar, dhkl , perpendicular aos planos (hkl), e que une os dois planos adjacentes. Deste modo, temos que τ = A dhkl , e sendo o número de pontos da rede por unidade de área dado por 1 , A em que A é a área formada pelos vectores a e b, obtemos que a densidade de pontos num plano (hkl) vem dada por 1 dhkl = . A τ 2.7. COORDENADAS FRACCIONÁRIAS 19 (hkl) w d hkl v A u (hkl) Figura 2.11: Construcção para o cálculo da densidade de pontos de rede nos planos de uma famı́lia (hkl). 2.7 Coordenadas fraccionárias Estudámos até agora vários conceitos úteis no estudo das redes cristalinas, mas pouco foi dito sobre os motivos, ou bases, que associados a estas redes, formam os cristais reais. Tal como as redes cristalinas, os motivos podem ser classificados em categorias gerais, segundo as transformações geométricas que aceitam como transformações de simetria. No entanto, este assunto é não será abordado neste curso, por não ser absolutamente indispensável para o estudo que se segue. O que sim é necessário é introduzir uma notação que permita a especificação das posições dos átomos que formam o motivo. Esta questão surge porque porque os átomos que formam o motivo ocupam, em geral, posições não coincidentes com as dos pontos que formam a rede cristalina; o seu vector posição não é pois, necessariamente, um vector da rede, ou seja, uma combinação linear inteira dos vectores fundamentais. Independentemente deste facto, usamos a base dos vectores fundamentais da rede cristalina para representar os vectores posição destes átomos, que, assim, podem apresentar coordenadas não inteiras, ou fraccionárias. Note-se que o mesmo acontece para alguns pontos da rede cristalina, sempre que os vectores fundamentais escolhidos para a representar forem não primitivos. Por exemplo, usando vectores os fundamentais convencionais para a rede cúbica de corpo centrado, as coordenadas do ponto central são ( 12 , 12 , 21 ). A rede cristalina do diamante é cúbica de faces centradas. Os pontos de rede de uma célula unitária convencional têm pois coordenadas (0, 0, 0), ( 12 , 12 , 0), ( 12 , 0, 21 ), (0, 12 , 12 ). Quando se usam para especificar a posição de pontos de rede numa célula unitária (não primitiva), as coordenadas fraccionárias têm origem num vértice da célula unitária; mas, quando se usam para indicar as posições dos átomos que formam o motivo, têm origem em cada ponto ponto da rede cristalina. Assim, por exemplo para o diamante, o motivo é formado por dois átomos, com coordenadas (0, 0, 0) e ( 41 , 41 , 14 ); para se obter um cristal de diamante, devemos sobrepor, em cada um dos quatro pontos de rede que referimos no parágrafo anterior, dois átomos de carbono, com estas coordenadas, relativamente a uma origem escolhida sobre cada um daqueles pontos. 20 2.8 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA Defeitos A descrição dos sólidos que foi apresentada neste capı́tulo é apenas uma idealização. Os cristais reais apresentam as regularidades mencionadas apenas de forma aproximada, apresentando sempre um número apreciável de imperfeições ou defeitos, isto é, de desvios à regularidade cristalina. Há vários tipos de defeitos cristalinos. Por exemplo, um átomo de espécie quı́mica diferente da dos que formam o cristal (como é o caso, muito útil, dos semicondutores “dopados”, do tipo “p” ou “n”),uma posição de rede desocupada, ou um átomo numa posição não definida pela rede. As próprias fronteiras do cristal são defeitos cristalinos, na medida em que quebram a periodicidade do cristal. Vamos agora estudar um pouco mais detalhadamente os principais tipos de defeitos cristalinos. (1) Vibrações dos átomos do cristal Os átomos que formam os cristais encontram-se permanentemente animados de um movimento de oscilação em torno de posições de equilı́brio, que correspondem às posições definidas pela estrutura cristalina. A este movimento dá-se o nome de agitação térmica. A amplitude destas oscilações diminui quando se baixa a temperatura, mas não se anula nunca, mantendo-se mesmo no zero absoluto da temperatura, como consequência do princı́pio de incerteza de Heisenberg. (2) Imperfeições pontuais Imperfeições pontuais são irregularidades que se verificam em pontos isolados, e há três espécies principais. As lacunas, as imperfeições intersticiais e as impurezas. Uma lacuna é uma posição da estrutura cristalina que se encontra desocupada. Uma imperfeição intersticial corresponde a um átomo que ocupa uma posição não prevista na estrutura cristalina. Um átomo de um cristal pode, sob certas circunstâncias(e) , abandonar a sua posição na estrutura cristalina (fazendo assim surgir uma lacuna) e fixar-se numa posição intersticial. A estes pares lacuna-interstı́cio dá-se o nome de pares de Frenkel. Nos cristais iónicos, as lacunas devem sempre aparecer aos pares, por forma a manter a neutralidade eléctrica do cristal. Estes pares de lacunas têm o nome de pares de Shottky. (f) As impurezas são átomos de espécie quı́mica diferente da dos que formam o cristal. Os átomos contaminantes podem ocupar posições da estrutura cristalina, substituindo assim os átomos originais, tomando o nome de impurezas substitucionais, ou ocupar posições que não estão definidas na estrutura, sendo então conhecidas como impurezas intersticiais. Por exemplo, o aço é uma solução de carbono em ferro, constituindo os átomos de carbono impurezas intersticiais na estrutura cristalina definida pelos átomos de ferro. Em contrapartida, o latão é uma liga de cobre e de zinco, onde os átomos de zinco substituem os de cobre nalgumas posições, constituindo assim impurezas substitucionais de um cristal de cobre. O funcionamento dos dispositivos semicondutores comuns, como os transı́stores ou os diodos, baseia-se na presença de impurezas substitucionais. Estes dispositivos consistem num cristal, normalmente de silı́cio ou de germânio, dividido em duas (no caso dos diodos) ou três (no caso dos transı́stores) regiões com impurezas substitucionais de tipo “n” (que consistem em átomos com um electrão de valência a mais do que os os átomos vizinhos) ou de tipo “p” (cujos átomos têm um electrão de valência a menos). (e) Por exemplo, mediante um aquecimento excessivo. cristais do tipo NaCl, evidentemente; nos casos de cristais do tipo AB2 , como o cloreto de cálcio (CaCL2 ), a neutralidade eléctrica só pode ser assegurada através de “ternos” de lacunas — uma de A por cada duas de B. (f) Para 2. Problemas 21 (3) Imperfeições lineares Nas imperfeições lineares, os átomos que quebram a simetria cristalina dispõem-se ao longo de uma linha. Os exemplos mais importantes são as chamadas deslocações. Estas imperfeições podem ser o resultado de deformações do cristal, e verificam-se quando um plano cristalino se desloca sobre outro. Na Figura 2.12 está representada uma deslocação e o modo como as deformações do cristal podem fazer surgir deslocações. Há ainda outros tipos de deslocações mas não os estudaremos aqui. F Deslocaçao Figura 2.12: Deslocações cristalinas. (4) Imperfeições superficiais As imperfeições superficiais são superficı́cies de separação entre regiões distintas dos cristais. Por exemplo, nos cristais de ferro é energeticamente favorável o alinhamento dos momentos magnéticos dos átomos. No entanto, a agitação térmica contraria esta tendência de alinhamento. Assim, à temperatura ambiente, os cristais de ferro encontram-se usualmente divididos em regiões, chamadas domı́nios ferromagnéticos, onde os momentos magnéticos dos átomos têm a mesma orientação, sendo diferente de domı́nio para domı́nio. As superfı́cies(g) que separam estes domı́nios constituem imperfeições superficiais. As próprias fronteiras dos cristais constituem, como já foi dito, defeitos, que podem ser classificados também como imperfeições superficiais. PROBLEMAS 2.1 Considere um cristal bidimensional semelhante a um tabuleiro de xadrez. (a) Determine dois conjuntos de vectores fundamentais não primitivos. (b) Determine dois conjuntos de vectores fundamentais primitivos. (c) Represente graficamente as células unitárias e os motivos associados aos conjuntos de vectores fundamentais determinados em (a) e em (b). 2.2 Considere a estrutura atómica plana ilustrada na figura, composta por átomos do tipo A, B e C: (a) Determine um conjunto de vectores fundamentais primitivos. (b) Indique quantos átomos de cada tipo existem na célula unitária primitiva. (c) Desenhe a célula unitária de Wigner-Seitz. (g) Podem ser consideradas superfı́cies à escala macroscópica apenas, já que podem ter várias dezenas de milhar de átomos de espessura... 22 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA ’ Atomo tipo A ’ Atomo tipo B ’ Atomo tipo C 2.3 O Cloreto de Césio (CsCl) tem uma estrutura cúbica de parâmetro a = 4, 11 Å, com os átomos dispostos de acordo com a figura. Determine: (a) o tipo de estrutura cúbica de CsCl; (b) um conjunto de vectores fundamentais primitivos, e indique qual o volume da célula unitária primitiva; (c) a densidade do CsCl. 2.4 A estrutura do composto SrTiO3 é a seguinte: os átomos de estrôncio dispõem-se nos vértices de cubos idênticos dispostos regular e contiguamente; os de titânio, nos centros destes cubos; os de oxigénio, finalmente, nos centros das suas faces. (a) Qual o tipo de rede cristalina apresentada por este composto? (b) Indique um conjunto de vectores fundamentais primitivos. (c) Verifique que há um átomo de estrôncio, um de titânio e três de oxigénio numa célula unitária definida pelos três vectores escolhidos em (b). (d) Usando coordenadas fraccionárias, descreva o motivo que, associado à rede cristalina determinada em (a), gera o cristal de SrTiO3 . 2.5 As posições dos pontos de duas redes cristalinas são dadas por: (a) (b) rn1 ,n2 ,n3 = rn1 ,n2 ,n3 = e e e 10n1 +9n2 +19n3 3 a x + 6 n2 +n a y+ 10 5 √ 2n1 +n2 3n2 a x + 2 a y + 2n3 a z . 2 e e 2n3 aez ; onde a é um número real fixo e n1 , n2 e n3 são inteiros arbitrários. Escolha, para os dois casos, um conjunto primitivo de vectores fundamentais e identifique o tipo de rede. 2.6 Para cada um dos seguintes conjuntos de vectores fundamentais primitivos, identifique o tipo de rede indicando as dimensões da célula convencional em termos dos parametros a, b e c: (a) (b) (c) (d) e + 12 aey , aey , √12 aez ; 1 aex + 12 aey , aey , aez ; 2 aex + 2bey , bey , cez ; 1 aex + 12 bey , bey , cez . 2 1 a x 2 2.7 Calcule o valor dos seguintes parâmetros para cada uma das três redes cúbicas (simples, de corpo centrado e de faces centradas): (a) volume da célula convencional; 2. Problemas 23 (b) volume da célula primitiva; (c) número de pontos de rede na célula convencional; (d) número de pontos na célula primitiva; (e) distância entre vizinhos mais próximos; (f) fracção de empacotamento(h) . 2.8 Prove que numa rede cúbica simples a direcção [hkl] é perpendicular aos planos da famı́lia (hkl). Verifique com exemplos que o mesmo não se passa, necessariamente, para outros tipos de rede. 2.9 À temperatura de 1190 K, o ferro apresenta uma rede cristalina de faces centradas com aresta a = 3, 647 Å, ao passo que, a 1670 K, a rede cristalina é de corpo centrado, com aresta a = 2, 932Å. Determine a sua densidade, para cada uma das temperaturas referidas. 2.10 O sulfeto de zinco Zn S cristaliza em duas estruturas distintas: a estrutura zinc blende (impregnação de zinco) e estrutura wurtzite (wurtzita), ilustradas na figura seguinte. 1/2 0 zinc blende 3/4 1/4 1/4 3/4 1/2 1/2 1/2 (a) (b) wurtzite 0 5/8 1/8 1/2 Nas Figuras (a) estão representadas células convencionais, As Figuras (b) representam projecções das respectivas células onde estão indicadas as posições verticais dos átomos em relação à altura da célula em questão. A estrutura zinc blende é constituida por a uma rede cúbica de face centrada associada a cada tipo de átomo e separadas ao longo da diagonal do cubo da célula convencional cúbica em ( 41 , 14 , 14 ). A estrutura wurtzite tem associada a cada tipo de átomo uma estrutura hexagonal compacta separadas em 58 da altura da célula hexagonal. Sabendo que os parâmetros das células são de a = 5, 41 Å para célula cúbica, e a = 3, 81 Å e c = 6, 23 Å para a célula hexagonal calcule a densidade de ambas as formas do sulfeto de zinco. (h) A fracção de empacotamento é a fracção de volume da rede ocupado, supondo os pontos da rede como esferas rı́gidas suficientemente grandes para se tocarem 24 CAPÍTULO 2. ELEMENTOS DE CRISTALOGRAFIA 2.11 O Arsenito de Gálio cristaliza na forma de estrutura zinc blend. A ligação Ga−As tem 2, 45 Å de comprimento. (a) Determine a aresta da célula convencional cúbica. (b) Qual a separação Ga − Ga mais curta. (c) Qual a densidade do Ga As. 2.12 Considere um cristal com estrutura tipo wurtzite. Determine três vectores fundamentais primitivos assim como a respectiva base indicando a sua posição relativa. 2.13 Determine o quociente c/a para uma estrutura wurtzite. 2.14 Considere um conjunto seguinte de vectores fundamentais primitivos de uma rede tetragonal de corpo centrado: a= 1 1 1 1 1 1 a(ex + ey ) − cez , b = a(−ex + ey ) + cez , c = a(ex − ey ) + cez 2 2 2 2 2 2 onde a representa o lado da base quadrada da célula convencional e c a altura da mesma. Considere que inicialmente temos c > a, e seguidamente imagine que a célula é comprimida na direcção do eixo z. (a) Para que valor de c a rede toma a forma de cúbica de corpo centrado? (b) Para que valor de c a rede toma a forma de cúbica de face centrada? Dê os seus resultados em termos do parametro a. 2.15 Se uma célula unitária de uma dada rede cristalina contém N pontos de rede, então o seu volume é V = N Vp onde Vp é o volume das células unitárias primitivas da mesma rede. Demonstre esta preposição. 2.16 Determine a separação entre os pontos de uma rede cristalina ao longo das direcções seguintes: (a) [110]; (b) [111]; (c) [320]; (d) [321]. 2.17 Determine os ı́ndices de Miller de um plano que, numa rede cúbica simples, contém a aresta de uma célula unitária primitiva e intersecta duas outras arestas da mesma célula nos seus centros. 2.18 Compare a distância interplanar para os planos (210) numa rede cúbica simples, cúbica de corpo centrado e cúbica de faces centradas. 2.19 Demonstre que a fracção de empacotamento máximo para um cristal de estrutura tetragonal de corpo centrado (com uma base composta por um único átmo) é dada por: √ (a) π3 ac se c > 2a; √ 2 3 π a (b) 24 (2 + ac 2 ) 2 se c < 2a. c 2.20 Determine a densidade de pontos nos planos (111) de uma rede cúbica de face centrada. Compare com a densidade de pontos nos planos (110). Capı́tulo 3 Difracção elástica em cristais Uma das ferramentas mais usadas na determinação da estrutura dos sólidos é a análise da difracção de radiação neles incidente. De facto, quase se pode marcar o nascimento da fı́sica do estado sólido com ramo autónomo da fı́sica em 1912, ano em que foi publicado o primeiro artigo(a) sobre difracção de raios-X em cristais. Neste capı́tulo, vamos estudar os processos de difracção de radiação por cristais e a sua utilização na determinação das estruturas cristalinas. Vamo-nos restringir à difracção elástica, em que a radiação difractada tem o mesmo comprimento de onda que a incidente. 3.1 Generalidades A análise da difracção elástica de radiação por cristais é um método poderoso no estudo da sua estrutura. A informação que se obtém das experiências de difracção resulta fundamentalmente de processos de interferência das várias porções do cristal; assim, usa-se nestas experiências radiação com comprimento de onda próximo das distâncias interatómicas tı́picas nos cristais, ou seja, alguns Angstrongs. As experiências de difracção são realizadas com as seguintes três espécies de feixes: Raios-X Por ser muito simples a produção, detecção e manipulação (focagem, deflexão, etc.) de feixes de radiação electromagnética, este tipo de radiação é o mais frequentemente escolhido para experiências de difracção. A radiação interage principalmente com as nuvens electrónicas dos sólidos, e portanto a sua utilização permite a determinação da distribuição electrónica e, a partir daı́, da estrutura cristalográfica e de outras propriedades relevantes dos sólidos. Nas experiências de difracção com cristais, usa-se radiação electromagnética na região do espectro dos raios-X, por ser a que apresenta os comprimentos de onda na gama apropriada. Electrões Podem também usar-se feixes corpusculares, já que, à luz da Mecânica Quântica, estes evidenciam também comportamentos ondulatórios. Os electrões, por serem partı́culas carregadas e extremamente leves, sofrem muito fortemente a interacção com a matéria; assim, os feixes de electrões não têm um grande poder de penetração nos sólidos e, por esta razão, são usados apenas no estudo das suas superfı́cies. Os electrões devem estar animados com uma energia cinética de cerca de 150 eV(b) para que o comprimento de onda da sua função (a) Por W. Friedrich, P. Knipping e M. Laue eV é a energia cinética adquirida por um electrão acelerado por uma diferença de potencial de 1V, ou seja 1eV≈ 1.6 × 10−19 J. (b) 1 25 26 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS de onda quântica seja comparável com as distâncias interatómicas vulgares nos cristais. Neutrões Estas partı́culas, ao contrário dos electrões, têm um grande poder de penetração nos sólidos, por serem mais pesadas e também por serem electricamente neutras. Apesar da sua neutralidade eléctrica, os neutrões apresentam momento magnético não nulo e por isso sofrem interacções electromagnéticas, principalmente com os electrões responsáveis pelas propriedades magnéticas do meio em que se encontram. Estas interacções não são “mascaradas” pelas forças coulombianas, que seriam dominantes se se usassem feixes de partı́culas carregadas, como protões. Por esta razão, os feixes de neutrões são particularmente indicados no estudo da distribuição do momento magnético no interior dos sólidos. A energia do feixe com que as experiências devem ser conduzidas é de cerca de 0,1 eV. A grandeza fı́sica que envolvida nos processos de composição e de interferência é, no caso dos raios-X, o campo electromagnético, ao passo que, no dos feixes corpusculares, é a função de onda das partı́culas que os constituem. No entanto, a intensidade medida pelos detectores é proporcional ao quadrado do módulo do campo electromagnético (no caso dos raios-X), ou da função de onda (no caso dos feixes de electrões ou de neutrões). 3.2 A condição de Bragg Em 1913, quando estudavam a difracção de radiação por matéria, W. H. Bragg e W. L. Bragg notaram que as substâncias cristalinas produzem padrões de difracção de raios-X muito nı́tidos, ao contrário do que acontece com lı́quidos ou sólidos não cristalinos. Mais concretamente, observaram que, iluminando um cristal com raios-X de comprimento de onda bem determinado, a radiação é re-emitida apenas segundo certas direcções bem determinadas, ao passo que repetindo esta experiência com substâncias não cristalinas, a radiação é difundida em todas as direcções. Para explicarem este facto, os Bragg supuseram que esta re-emissão da radiação se faz por reflexão geométrica nos planos cristalinos, e que as reflexões em planos paralelos consecutivos devem interferir construtivamente para que se possam observar. A Figura 3.1 representa o trajecto óptico de dois raios-X paralelos que sofrem uma θ θ θθ θ l l d θ Figura 3.1: Reflexão de Bragg. reflexão em dois planos consecutivos de uma dada famı́lia de planos cristalinos, que fazem com a direcção dos feixes um ângulo de θ. A diferença entre os caminhos percorridos pelos dois raios é 2l, ou seja, 2d sin θ, onde d é a distância interplanar. Para que haja interferência construtiva, esta diferença deve conter um número inteiro, n, de comprimentos de onda, λ, da radiação envolvida no processo. Assim, a condição para a existência de reflexão é 2d sin θ = nλ, (3.1) 3.3. MÉTODOS EXPERIMENTAIS 27 que é a famosa lei de Bragg. Quando radiação de comprimento de onda bem definido incide num cristal, somente as famı́lias de planos que apresentam uma distância interplanar e uma orientação relativamente à radiação incidente que satisfazem a lei de Bragg participam na reflexão de radiação. Pode mesmo não haver reflexão (é até o caso mais frequente, para uma orientação fixa do cristal e da fonte da radiação) se não houver nenhuma famı́lia de planos nestas condições. Neste caso, a radiação incidente é totalmente absorvida pelo cristal. 3.3 Métodos experimentais O formalismo de Bragg para a descrição da difracção de raios-X não é muito satisfatório porque se supõe que a difracção resulta de reflexões geométricas nos planos cristalinos. Esta suposição não deveria ser aceite sem um estudo que a justifique. Mais tarde analisaremos um formalismo mais convincente (o de Laue), mas para já, fazemos uma pausa para discutir as questões práticas do estudo da difracção, aceitando a lei de Bragg como base para a discussão. Há basicamente três métodos para o estudo experimental da difracção: o de Laue, o do cristal rotativo, e o do pó. No método de Laue, faz-se incidir raios-X com uma gama contı́nua de comprimentos de onda sobre um cristal imóvel (ver a Figura 3.2). O cristal difracta as componentes da radiação incidente com compri- Cristal Fonte de raios-X Écran Figura 3.2: Método de Laue. mentos de onda para os quais existem no cristal famı́lias de planos com distância interplanar capaz de satisfazer a lei de Bragg. Estas componentes irão, após a difracção, incidir num ecrã, usualmente uma placa fotográfica, ou um detector eletrónico de raios-X, permitindo assim a análise. Os padrões de difracção consistem numa série de pontos, dispostos de forma simétrica relativamente ao ponto onde a direcção da radiação incidente intersecta o plano do écran. Como já foi dito, ao se iluminar um cristal imóvel com radiação monocromática poderá não se verificar qualquer difracção, por não haver no cristal nenhuma famı́lia de planos orientada de forma a permitir a satisfação da lei de Bragg. Mas se se rodar o cristal durante a exposição à radiação, verificar-se-ão várias difracções, cujo ângulo se altera bruscamente com a rotação do cristal. Cada famı́lia de planos “espera pacientemente” o instante em que a sua orientação relativamente à radiação incidente permita, nos termos da lei de Bragg, a sua participação na difracção. Este é o processo usado no chamado método do cristal rotativo. O cristal roda no interior de um cilindro (ver a Figura 3.3) cujas paredes interiores estão revestidas com uma pelı́cula fotográfica. Um orifı́cio na superfı́cie lateral do cilindro permite a entrada do feixe incidente. No método do cristal rotativo, em cada instante, apenas algumas famı́lias de planos participa no processo de difracção, que são aquelas que estão correctamente alinhadas, e que apresentam uma distância interplanar capaz de satisfazer a lei de Bragg. Se, em vez de um único cristal, dispusessemos de um grande número cristais na região de incidência do feixe, e cada cristal estivesse orientado de maneira arbitrária, então, mesmo com a amostra fixa, qualquer famı́lia de planos teria, 28 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS Écran Cristal Fonte monocromática de raios-X ω Figura 3.3: Método do cristal rotativo. nalgum cristal, a orientação correcta para satisfazer a lei de Bragg, podendo assim participar da difracção. É nesta ideia que se baseia o chamado método do pó ou de Debye. Neste método, em vez de se usar um cristal inteiro na amostra, usa-se um cristal fragmentado em pequenos grãos, cada um dos quais funciona como um pequeno cristal(c) com as suas direcções privilegiadas de difracção (ver a Figura 3.4). película fotográfica ti ma cro s co no sX aio mo amostra R -180° -90° 0° 90° 180° Figura 3.4: Esquema da montagem usada no método do pó e aspecto da pelı́cula após revelação. 3.4 Condição de Laue. Rede recı́proca Na dedução da lei de Bragg faz-se a suposição de que a difracção de radiação pelos cristais se faz por reflexão em planos cristalinos. A validade desta suposição não é nada óbvia, já que os processos de reflexão geométrica ocorrem em superfı́cies de separação de dois meios com ı́ndices de refracção diferentes, e não em planos cristalinos abstractos, sem qualquer materialidade. Para além disto, a óptica geométrica não é aplicável neste domı́nio, porque os comprimentos de onda das radiações envolvidas nestes processos são da ordem de grandeza das dimensões dos objectos em que incidem. (c) É trivial verificar que um grão de areia com cerca de 0,01 mm de diâmetro contém cerca de 1018 átomos, podendo pois ser ainda considerado um cristal macroscópico. 3.4. CONDIÇÃO DE LAUE. REDE RECÍPROCA 29 Em 1912, M. Laue tinha já proposto um tratamento mais natural do processo de difracção, que vamos agora estudar. Um cristal, conforme já foi muitas vezes dito, consiste num conjunto de objectos microscópicos idênticos (são as ocorrências do motivo do cristal) colocados, regularmente, nos pontos de uma rede de Bravais, que, quando neles incide radiação, a reemitem em todas as direcções. São então observadas fortes intensidades de difracção nas direcções em que a radiação reemitida por todos estes objectos interfere construtivamente. Consideremos dois destes centros n δ1 n’ R δ2 Figura 3.5: Dispersão elástica de radiação por duas células unitárias de um cristal. dispersores, separados por um vector de rede R. Neles incide radiação com comprimento de onda λ, segundo a direcção definida pelo versor n̂ (ver a Figura 3.5). Para que numa direcção definida pelo versor n̂0 se verifique interferência construtiva, é necessário que a diferença entre os comprimentos dos caminhos ópticos seguidos pelos raios que incidem em cada um dos dois centros dispersores considerados seja igual a um múltiplo inteiro do comprimento de onda da radiação. A distância que corresponde a esta diferença está realçada na Figura 3.5, sendo dada por δ1 + δ2 . Mas δ1 δ2 = R · n̂ = −R · n̂0 , (3.2) (3.3) de forma que a condição para a interferência construtiva é ¢ ¡ R · n̂ − n̂0 = mλ, (3.4) onde m é um número inteiro qualquer. Multiplicando a Eq. (3.4) por 2π/λ e notando que k = 2πn/λ é o vector de onda da radiação incidente(d) , resulta R · (k − k0 ) = 2πm. (3.5) Esta é a condição para que a radiação reemitida pelas duas células unitárias representadas na Figura 3.5 interfira construtivamente na direcção do vector k0 . Claro que, se considerarmos agora todo o cristal e não somente duas células unitárias, obtemos uma condição semelhante a (3.5), mas que tem que se verificar para todos os vectores da rede cristalina R: R · (k − k0 ) = 2πm, m ∈ N, ∀R ∈ rede cristalina. (3.6) Esta é a condição de Laue para a difracção. O conjunto dos vectores G = (k − k0 ) que satisfazem a Eq. 3.6 é muito reduzido. Vamos provar que estes vectores formam também uma rede, que não é a rede formada pelos vectores R. Começamos por (d) Define-se da mesma maneira o vector de onda da radiação difractada k0 = 2πn0 /λ. 30 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS definir os vectores(e) b×c a · (b × c) c×a B = 2π a · (b × c) a×b C = 2π , a · (b × c) A = 2π (3.7) (3.70 ) (3.700 ) onde a, b e c são os vectores fundamentais do cristal em estudo (ou seja, da rede definida pelos vectores R). É possı́vel provar que, se a, b, c não forem co-planares, então A, B, C também não o são (o leitor é aconselhado a tentar fazer esta demonstração), e portanto servem como base do espaço. Assim, podemos concerteza escrever G = xA + yB + zC, (3.8) onde x, y, z são três quantidades adimensionais, não necessariamente inteiras, que são as componentes de G nesta base. Por outro lado, como R é um vector da rede cristalina, pode escrever-se como uma combinação linear inteira dos vectores a, b, c: R = ha + kb + lc, (3.9) com h, k, l inteiros. Vejamos quais os valores que x, y, z podem tomar para que se verifique R · G = 2mπ, de acordo com (3.6). Note-se que, como o produto externo de dois vectores é perpendicular a qualquer deles, a · B = a · C = 0, etc., logo, R·G = = (ha + kb + lc) · (xA + yB + zC) 2π (xh + yk + zl) . (3.10) Para que se verifique a condição de Laue, é necessário que a soma dentro dos parêntesis na Eq. (3.10) seja um número inteiro, quaisquer que sejam os inteiros h, k, l. Isto só é possı́vel (quaisquer que sejam h, k, l) se x, y e z forem também inteiros. O conjunto de vectores G = (k − k0 ) que satisfaz a condição de Laue é pois da forma G = pA + qB + rC, (3.11) com p, q, r inteiros e A, B, C dados pelas equações (3.7). Ao variarmos os valores de p, q, r em (3.11) geramos uma rede, diferente da gerada pelos vectores a, b, c, chamada a rede recı́proca da rede gerada pelos vectores a, b, c. Esta última chama-se, para mais fácil distinção, rede directa. Os vectores A, B, C são os vectores fundamentais da rede recı́proca. A rede recı́proca é um conceito recorrente em Fı́sica do Estado Sólido. Foi introduzido neste capı́tulo, mas surge também naturalmente no estudo de outros tópicos, relativamente independentes da difracção de radiação. Voltando agora à condição de Laue, podemos agora enunciá-la da seguinte forma: Pode ocorrer interferência construtiva (e portanto difracção) se a variação no vector de onda da radiação G = k0 − k, for um vector da rede recı́proca. Note-se que a condição de Laue (ou a de Bragg que, veremos, lhe é equivalente) é uma condição apenas necessária, não suficiente, para a difracção. Se o motivo cristalino não for trivial (isto é, se contiver mais do que um átomo), verificam-se processos de interferência no interior de cada célula unitária primitiva, que podem impedir a difracção numa dada direcção, mesmo que a condição de Laue (que diz respeito à interferência entre diferentes células unitárias primitivas) a permita. Mais à frente abordaremos este assunto. (e) Note-se que, usando estas definições, a eq. (2.26) na Secção 2.6 pode reescrever-se como G hkl = hA + kB + lC . 3.5. EQUIVALÊNCIA DAS CONDIÇÕES DE BRAGG E DE LAUE 3.4.1 31 A construcção de Ewald A condição de difracção de Laue pode ser representada geometricamente através da chamada construcção de Ewald (ver a Figura 3.6): desenha-se no espaço-k (f) o vector de onda k do feixe incidente, com origem num ponto da rede recı́proca; de seguida, desenha-se uma esfera de raio k = |k| com centro na extremidade daquele vector. De acordo com a lei de Laue, são possı́veis difracções com vectores de onda k0 se houver (além do ponto de origem do primeiro vector desenhado) pontos da rede recı́proca na superfı́cie da esfera, caso em que podem verificar-se “reflexões” de Bragg nos planos cristalinos (da rede directa) que são perpendiculares aos vectores posição desses pontos da rede recı́proca. k G -k’ Figura 3.6: A construcção de Ewald. 3.5 Equivalência das condições de Bragg e de Laue Vamos agora demonstrar a equivalência das duas condições de difracção estudadas. Antes, porém, demonstra-se uma propriedade muito útil da rede recı́proca. Uma das caracterı́sticas mais relevantes da rede recı́proca é o facto de os seus vectores, dados por (3.11), serem perpendiculares a planos da rede directa, e de as suas componentes inteiras (h, k, l) estarem relacionadas de forma simples com os ı́ndices de Miller (h0 k 0 l0 ) desses planos. Demonstremos esta afirmação. Seja Ghkl = hA + kB + lC, (3.12) com A, B e C dados pelas eqs. (3.7) e h, k e l inteiros arbitrários, um vector qualquer da rede recı́proca. Definam-se três novos números inteiros h0 , k 0 e l0 em proporções relativas iguais às apresentadas por h, k e l, mas sem divisores comuns, como h0 = h/n 0 k = k/n l0 = l/n, (3.13) (3.130 ) (3.1300 ) onde n é o maior divisor comum a h, k e l. Uma vez que h0 , k 0 e l0 não têm, por construcção, divisores comuns, o conjunto (hkl) pode ser encarado como os ı́ndices de Miller de alguma famı́lia de planos da rede directa. De acordo com a definição de ı́ndices de Miller, o plano dessa famı́lia que mais se aproxima da origem (f) Designam-se assim, em geral, espaços recı́procos do espaço usual, como o espaço das variáveis das transformadas de Fourier, o espaço ocupado pela rede recı́proca, etc. Estes espaço têm comprimentos com dimensões inversas do comprimento usual. 32 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS de uma base cristalográfica previamente escolhida contém os pontos P 1 = a/h0 , P 2 = b/k 0 , P 3 = c/l0 (ver a Figura 3.7). Dois vectores não colineares deste plano são os vectores P 2 − P 1 e P 3 − P 2 . Então o vector u = (P 2 − P 1 ) × (P 3 − P 2 ) (3.14) é perpendicular à famı́lia de planos considerada. Com um pouco de aritmética c P3 P3 - P2 P2 a P1 P2 - P1 b Figura 3.7: O plano da famı́lia (h0 k0 l0 ) que passa nos pontos P 1, P 2, P 3. obtemos u = = = 1 (h0 b × c + k 0 c × a + l0 a × b) µ ¶ 1 a · (b × c) b×c c×a a×b 0 0 0 h 2π + k 2π + l 2π h0 k 0 l 0 2π a · (b × c) a · (b × c) a · (b × c) 1 τ (h0 A + k 0 B + l0 C) , (3.15) h0 k 0 l0 2π h0 k 0 l 0 onde foram usadas as equações (3.7) e se introduziu o volume da célula unitária da rede directa τ = a · (b × c). Finalmente, comparando este resultado com a definição na Eq. (3.12) obtemos 2nπ Ghkl = h0 k 0 l0 u. (3.16) τ Os dois vectores Ghkl e u são, como está patente nesta expressão, colineares; uma vez que u é, por construção, perpendicular aos planos da famı́lia (h0 k 0 l0 ), também Ghkl o é. Posto isto, analisemos geometricamente a condição de Laue. Consideremos uma onda plana incidente no cristal com vector de onda k, sendo difractada na direcção do vector k0 (ver a Figura 3.8). Note-se que se a difracção é elástica, as radiações incidente e difractada têm o mesmo comprimento de onda, ou seja, |k| = |k0 | = G k θ α α’ θ’ k’ Figura 3.8: Esquema da difracção de radiação por um cristal ilustrando a condição de Laue (G deve pertencer à rede recı́proca) e a de Bragg (a difracção faz-se por reflexão geométrica em planos cristalinos). 2π/λ. Na Figura 3.8 estão representados os vectores k, k0 e a sua diferença G = 3.6. AMPLITUDE DA DIFRACÇÃO. FACTOR DE ESTRUTURA 33 k0 − k (de acordo com a condição de Laue, deve ser um vector da rede recı́proca) e um plano que é perpendicular a G, que, como acabámos de ver, deve pertencer a uma famı́lia de planos da rede directa. Uma vez que |k| = |k0 |, o triângulo formado por k0 , G e k (na figura, o lado correspondente a k aparece a tracejado) é um triângulo isósceles. Logo os ângulos α e α0 são iguais e portanto também θ = θ0 Mas θ e θ0 são os ângulos que as radiações as radiações incidente e difractada fazem com a famı́lia de planos perpendicular a G. Fica assim justificada a suposição de reflexão geométrica usada no tratamento de Bragg. Falta ainda verificar que a distância interplanar destes planos é exactamente a requerida pela lei de Bragg. Vimos há pouco que o vector da rede recı́proca Ghkl = hA + kB + lC é perpendicular à famı́lia de planos da rede directa (h0 k 0 l0 )(g) . Por outro lado, no capı́tulo anterior (eq. 2.27) vimos que a distância entre os planos desta famı́lia é d ≡ dh0 k0 l0 = 2π |Gh0 k0 l0 | 2nπ = . |Ghkl | (3.17) (3.18) Ora, da Figura 3.8, deve ser evidente que que |Ghkl | = 2|k| sin θ = 4π sin θ. λ (3.19) Substituindo este resultado na eq. (3.18) obtemos, finalmente, a lei de Bragg 2 d sin θ = nλ, (3.20) ficando assim demonstrada a equivalência entre os tratamentos de Bragg e de Laue. 3.6 Amplitude da difracção. Factor de estrutura A condição de Laue impõe, como vimos, que a radiação difractada por pontos equivalentes do cristal (isto é, pontos separados por vectores da rede cristalina) interfira constructivamente. Assim sendo, não se consideram na descrição de Laue fenómenos de interferência entre centros dispersores a distâncias inferiores às que separam os pontos da rede cristalina e, em particular, não se descreve a interferência entre átomos diferentes no interior de cada instância do motivo cristalino. Pode pois dizer-se com propriedade que a análise de Laue é uma aproximação, na qual o motivo cristalino é encarado como um centro dispersor pontual. Desta maneira afastam-se da teoria os processos de interferência internos ao motivo, processos esses que podem eventualmente proibir a difracção segundo algumas das direcções permitidas pela lei de Laue. É esta a razão que nos levou a afirmar que a condição de Laue é apenas uma condição necessária, mas não suficiente, para a difracção de radiação. Vamos agora fazer uma análise fı́sica mais detalhada do processo de difracção elástica de radiação por cristais, que considere estes processos de interferência internos ao motivo cristalino. A Figura 3.9 representa esquematicamente uma experiência tı́pica de difracção de raios-X(h) por um cristal. Um feixe colimado de raios-X é dirigido a uma amostra do sólido em estudo e um detector mede a intensidade da radiação resultante em função do ângulo, 2θ, entre a direcção de incidência e a de detecção. Por simplicidade, consideremos que a radiação incidente é monocromática, e que a fonte se encontra suficientemente afastada da amostra para que (g) Recorde-se que os ı́ndices acentuados h0 , k0 e l0 são os definidos nas equações (3.13). tornarmos a discussão mais concreta, vamos nesta secção considerar, a tı́tulo de exemplo, a difracção de raios-X. O tratamento de outro tipos de radiações é em tudo análogo, com algumas modificações evidentes. (h) Para 34 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS amostra 2θ k fonte k’ r detector r’ O Figura 3.9: Esquema da difracção de radiação por um sólido. possa ser tratada como uma onda plana. Para os efeitos que nos interessam nesta discussão, esta onda plana pode ser caracterizada indicando apenas o seu vector de onda, k, e sua frequência angular ω. O vector de onda tem módulo 2π/λ e a direcção da propagação da onda. Assim, usando notação complexa, podemos escrever a onda plana incidente, φi , como(i) φi (r, t) = Ai eı(k·r−ωt) (3.21) √ onde ı = −1 e Ai é a amplitude da onda incidente. De acordo com o princı́pio de Huygens, cada ponto do sólido exposto à radiação incidente é fonte secundária de radiação, com o mesmo comprimento de onda e a mesma frequência angular, mas com a forma de ondas esféricas, dadas em geral por φd (r 0 , t) = A0 0 0 eı(k |r −r|−ωt) , |r 0 − r| (3.22) onde r e r 0 são os vectores posição do centro dispersor considerado e do detector, respectivamente (ver a Figura 3.9), e k 0 = k é o módulo do vector de onda da radiação difractada. A amplitude A0 é, em cada ponto do sólido, proporcional ao campo electromagnético (nos casos em que o feixe é de raios-X) incidente e à capacidade dispersora(j) , ρ(r), de forma que podemos escrever φd (r 0 , t) = A ρ(r) eık·r 0 0 eı(k |r −r|−ωt) , |r 0 − r| (3.23) com A constante. A radiação detectada é a resultante da composição de contribuições como a desta equação, provenientes de cada ponto do sólido exposto ao feixe incidente. Isto é, o campo da radiação detectado no detector é dado por Z 0 3 φd (r , t) = A d r ρ(r)e V (i) Esta ık·r 0 0 eı(k |r −r|−ωt) , |r 0 − r| (3.24) descrição não inclui a polarização do campo electromagnético, ou a orientação do momento magnético das partı́culas que constituem os feixes corpusculares, sendo assim aplicável apenas aos casos em que estes graus de liberdade não desempenham um papel activo. (j) Por capacidade dispersora não se entenda nenhum conceito bem definido quantitavamente, mas antes uma medida vaga da capacidade da matéria numa dada região do espaço produzir desvios na direcção do feixe incidente. Na difracção de radiação electromagnética e de electrões, por capacidade dispersora deve entender-se densidade de carga; na difracção de feixes de neutrões, magnetização. 3.6. AMPLITUDE DA DIFRACÇÃO. FACTOR DE ESTRUTURA 35 onde o integral é estendido ao volume V da região do sólido exposto ao feixe incidente e as variáveis de integração são as três componentes do vector r, como se pretende indicar com a notação d3 r. Normalmente, as dimensões lineares da amostra são muito menores do que a distância que a separa do detector, e portanto podemos considerar que o denominador da função integranda nesta igualdade, |r 0 − r|, é aproximadamente constante, podendo ser posto em evidência, fora do sinal de integração. Note-se que não se podem fazer as mesmas considerações quanto ao termo idêntico que aparece no argumento da exponencial, porque as pequenas variações nesta quantidade correspondem a variações na fase das funções trigonométricas e essas variações, por pequenas que sejam, são importantes nos processos de interferência. Por outro lado, também porque o detector se encontra afastado da amostra, o vector r 0 − r é praticamente paralelo ao vector k0 e portanto o produto dos módulos destes dois vectores é practicamente igual ao seu produto interno, k 0 |r 0 − r| ≈ k0 · (r 0 − r). Assim, podemos escrever o campo electromagnético que atinge o detector como Z 0 0 0 A φd (r 0 , t) = 0 d3 r ρ(r) eık ·r eı[k ·(r −r)−ωt] |r − r| V Z 0 0 A (3.25) = 0 eı[k ·r −ωt] d3 r ρ(r) e−ı∆k·r , |r − r| V com ∆k = k0 − k. A parte relevante para o estudo da interferência da radiação emitida por cada porção de sólido é o integral sobre todo o volume do sólido V, que representaremos por H(∆k); os factores no exterior são factores globais, que descrevem fenómenos triviais como o da diminuição da intensidade do feixe difractado com o aumento da distância que separa a amostra do detector, sem grande interesse nesta discussão. Restringindo a discussão aos casos, que mais nos interessam, em o sólido difractor r’ é cristalino, o cálculo do integral pode ser simpliR hkl ficado fazendo uma partição do volume de integração e considerando separadamente os volumes r de cada célula unitária primitiva do cristal. Assim, O temos Z H(∆k) ≡ d3 r ρ(r) e−ı∆k·r V XZ 0 (3.26) = d3 r 0 ρ (r 0 + Rhkl ) e−ı∆k·(r +Rhkl ) , Vcup hkl onde os integrais são agora extendidos apenas ao volume de cada célula unitária Vcup , e Rhkl é um vector da rede, com componentes cristalográficas hkl. Mas a densidade electrónica deve ser uma função com a periodicidade do cristal, de forma que ρ (r 0 + Rhkl ) = ρ(r 0 ), e assim Z X 0 d3 r 0 ρ (r 0 ) e−ı∆k·r . H(∆k) = e−ı∆k·Rhkl (3.27) Vcup hkl O valor do integral, que é uma função da variação do vector de onda da radiação, depende fortemente da distribuição de cargas no interior do motivo cristalino. A esta função, que representamos por F (∆k), dá-se o nome de factor de estrutura. Explicitando o desenvolvimento de Rijk como combinação linear inteira dos vectores fundamentais da rede cristalina, obtemos X X X H(∆k) = F (∆k) e−ıh∆k·a e−ık∆k·b e−ıl∆k·c . h k l 36 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS Estes somatórios são progressões aritméticas, facilmente calculáveis. Considerando que a amostra contém N células unitárias primitivas ao longo dos três eixos cristalográficos, temos H(∆k) = F (∆k) N −1 X −1 −1 £ −ı∆k·a ¤h NX £ −ı∆k·b ¤k NX £ −ı∆k·c ¤l e e e , h=0 k=0 l=0 mas cada um dos somatórios é dado por N −1 X e−ın∆k·v e−ıN ∆k·v − 1 e−ı∆k·v − 1 " # N N N e−ı 2 ∆k·v e−ı 2 ∆k·v − eı 2 ∆k·v = n=0 = 1 e−ı 2 ∆k·v N e−ı 2 ∆k·v = 1 e−ı 2 ∆k·v 1 " 1 e−ı 2 ∆k·v − eı 2 ∆k·v # sin( N2 ∆k · v) , sin( 21 ∆k · v) onde v é um dos vectores fundamentais a, b ou c, de forma que se obtém # " N e−ı 2 ∆k·a sin( N2 ∆k · a) H(∆k) = F (∆k) −ı 1 ∆k·a sin( 12 ∆k · a) e 2 # # " " N N e−ı 2 ∆k·b sin( N2 ∆k · b) e−ı 2 ∆k·c sin( N2 ∆k · c) . 1 1 e−ı 2 ∆k·b sin( 12 ∆k · b) e−ı 2 ∆k·c sin( 12 ∆k · c) (3.28) (3.29) Como já se disse, a informação recolhida pelo detector é a intensidade do feixe difractado, que é igual ao quadrado do módulo do campo electromagnético. Assim, estamos de facto interessados no quadrado do módulo de H(∆k), que é dado por 2 2 |H(∆k)| = |F (∆k)| sN (∆k · a) sN (∆k · b) sN (∆k · c), (3.30) com sN (x) = sin2 ( 12 N x) . sin2 ( 12 x) (3.31) Na Figura 3.10 apresentam-se gráficos da função sN (x) para N = 10 e N = 100. Como se pode verificar, para além da intensidade dos picos aumentar com N , as suas larguras diminuem e a função sN (x) aproxima-se a uma função delta de Dirac para valores de x = 2nπ. Uma amostra tı́pica tem aproximadamente 108 células unitárias, logo é de esperar que existam picos de difracção intensos quando se satisfaçam simultaneamente as seguintes condições ∆k · a = 2πh ∆k · b = 2πk ∆k · c = 2πl, (3.32) onde h, k e l são números inteiros quaisquer. Mas estas condições não são mais que as condições de Laue para a difracção! Quando isolámos as contribuições do motivo cristalino no factor de estrutura, os termos que não foram aı́ integrados tinham que estar relacionados com a condição de Laue, que, ao fim ao cabo, considera o processo de difracção fazendo simplificações apenas ao nı́vel dos processos que ocorrem dentro do motivo cristalino. 3.6. AMPLITUDE DA DIFRACÇÃO. FACTOR DE ESTRUTURA 37 100 80 N=10 60 s(x) 40 20 0 −π 0 π x= 0 π x= 1 2 ∆ k·r 10000 N=100 8000 6000 s(x) 4000 2000 0 −π 1 2 ∆ k·r Figura 3.10: A intensidade dos picos secundários diminui quando N aumenta. Analisemos agora o factor de estrutura, dado por Z F (k) = d3 r ρ (r) e−ık·r . (3.33) Vcup Podemos simplificar o integral fazendo uma partição do volume da célula unitária primitiva nas zonas que estão na proximidade de cada átomo do motivo cristalino; obtemos então XZ 0 F (k) = d3 r 0 ρ(r 0 + Rm ) e−ık·(r +Rm ) m = X Vm Z 0 d3 r 0 ρ(r 0 + Rm ) e−ık·r , e−ık·Rm (3.34) Vm m onde os vectores Rm é o vector posição do núcleo atómico do m-ésimo átomo e r 0 é o vector representado na Figura 3.11, cujas componentes são as novas variáveis de integração. Usando o centro de cada átomo como origem do sistema de coordenadas nas integrações, resulta por fim Z X 0 d3 r 0 ρ(r 0 ) e−ık·r . (3.35) e−ık·Rm F (k) = m Ao integral Vm 38 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS r’ Ri r O Figura 3.11: Volume de uma célula unitária primitiva com três átomos, dividida nas regiões próximas de cada átomo. Z d3 r ρ(r) e−ık·r , =m (k) = (3.36) Vm que é essencialmente a transformada de Fourier da densidade de carga, dá-se o nome de factor de forma atómico. Podemos voltar agora à Eq. (3.27) e escrever que a difracção é possı́vel nas direcções permitidas pela condição de Laue (a soma em hkl na eq. (3.27) garante-o) e a sua intensidade é proporcional ao quadrado do módulo do factor de estrutura, que é dado por X F (∆k) = =m (∆k)e−ı∆k·Rm (3.37) m PROBLEMAS 3.1 Prove que os volumes das células unitárias de uma dada rede (τ ) e da sua rede recı́proca (τ ∗ ) se relacionam através de τ∗ = (2π)3 τ 3.2 Prove que a recı́proca da rede recı́proca de uma dada rede é esta rede. 3.3 Mostre que a rede recı́proca de uma rede cúbica de faces centradas é uma rede cúbica de corpo centrado. 3.4 Qual é então a recı́proca de uma rede cúbica de corpo centrado? 3.5 Determine e classifique a rede recı́proca de cada uma das seguintes redes (a) hexagonal; (b) ortorrômbica; (c) tetragonal. 3.6 Considere uma rede trigonal. Seja θ o ângulo entre os seus vectores fundamentais primitivos. Prove que a rede recı́proca também é trigonal e que o ângulo θ∗ entre os seus vectores fundamentais primitivos é dado por cos θ∗ = − cos θ . 1 + cos θ 3.7 Determine os ângulos que a radiação difractada pode fazer com a incidente, numa experiência de difracção de raios-X com comprimento de onda λ = 1, 04 Å, incidindo numa rede rede cúbica simples, com parâmetro a = 4, 0 Å. 3. Problemas 39 3.8 Numa experiência de difracção, onde raios-X com comprimento de onda λ = 1, 0 Å incidem sobre um cristal monoatómico com rede cúbica simples, o primeiro máximo de difracção faz com a direcção da radiação incidente um ângulo θ = 16, 4◦ . Determine o valor do parâmetro a da rede cristalina. 3.9 Prove que o factor de forma atómico de um átomo que contém n electrões com uma densidade de probabilidade constante numa esfera de raio R é dado pela expressão 3n =(∆k) = 3 3 [sin(∆kR) − R∆k cos(∆kR)] R ∆k (a) Determine o factor de forma para valores do ângulo de difracção 2θ = 5◦ , 60◦ , 90◦ e 180◦ . Considere que o raio R = 2, 5 Å , λ = 2, 0 Å e que a esfera contém 10 electrões. (b) Mostre que a Figura representa graficamente a função |=|2 . O que pode concluir relativamente à intensidade de difracção em função das condições experimentais e do “raio atómico”. 1 0.8 0.6 |ℑ| 2 0.4 0.2 0 0 2 4 6 8 ∆k R 3.10 A função de onda de um electrão no estado fundamental de um átomo de hidrogénio é dada por (orbital radial s), ψ(r) = πao 3 − 12 − ar e o , onde ao é o raio atómico de Bohr. Determine o factor de forma atómico. 3.11 Determine o factor de estrutura de uma rede cúbica de corpo centrado e de uma rede cúbica de faces centradas, associando a cada ponto de rede numa célula unitária convencional um factor de forma “atómico”. 3.12 Construa uma tabela onde apresente os ângulos de difração de radiação por uma rede cúbica simples, ordenados de forma crescente. Indique na tabela quais os máximos que não são observados em experiências de difracção com redes cúbicas de corpo centrado e de faces centradas. 3.13 Suponha que dois átomos da base de uma estrutura “zinc blende”têm factores de forma atómico =a e =b , respectivamente. (a) Obtenha uma expressão para o factor de estrutura em função dos ı́ndices (hkl) duma rede cúbica simples. (b) Mostre que o factor de estrutura, F , é 0 se h, k e l não forem simultaneamente números pares ou ı́mpares, 4(=a + =b ) se h + k + l = 4n, 4(=a − ı=b ) se h + k + l = 4n + 1, 4(=a − =b ) se h + k + l = 4n + 2, 4(=a + ı=b ) se h + k + l = 4n + 3, 40 CAPÍTULO 3. DIFRACÇÃO ELÁSTICA EM CRISTAIS onde n é um número inteiro qualquer. 3.14 Determine a expressão para o factor de estrutura F associado a uma estrutura hexagonal compacta ideal, usando os ı́ndices da estrutura primitiva. Suponha que os dois átomos da base têm o mesmo factor de forma atómico, =, independente de ∆k e classifique por ordem crescente de intensidade os picos de difracção associados aos planos: (100), (110), (111), (1̄11), (210) e (211). 3.15 Um cristal tetragonal é preparado para uma experiência de difracção usando o método de Debye com um comprimento de onda de raios-X de λ = 1, 54 Å. A célula convencional tem uma base quadrada de a = 3, 20 Å e altura c = 4, 63 Å. (a) Determine os três primeiros ângulos de difracção. (b) Se a base consiste num átomo de um tipo no centro da célula e um outro diferente num dos vértices, classifique por ordem de intensidades os picos de difracção relativos ao ângulos da alı́nea anterior. Assuma que ambos factores de forma atómicos são reais e têm o mesmo sinal. 3.16 Partindo da condição de Laue para a difracção, prove que: k · G = − 1 |G|2 . 2 Capı́tulo 4 Vibrações em cristais Nos capı́tulos anteriores foi apresentado um modelo dos sólidos cristalinos segundo o qual os átomos que os formam encontram-se em repouso nas posições determinadas pela rede e motivo cristalinos. No entanto, esta suposição da imobilidade é uma simplificação grosseira da realidade que apresenta, entre outros, os seguintes inconvenientes: • A temperatura de um objecto pode ser encarada como uma medida da energia cinética associada ao movimento microscópio dos átomos que o constituem. Supondo os átomos em repouso esta associação é impossı́vel. • O som consiste em ondas mecânicas, isto é, variações infinitesimais na posição dos átomos que se transmitem aos átomos vizinhos, propagando-se desta forma nos meios materiais. Aceitando a hipótese da imobilidade dos átomos nos sólidos cristalinos, estes deveriam ser isoladores sonoros, o que claramente, não se verifica. • O argumento que acabamos de desenvolver aplica-se também à condução de calor. Muitos outros argumentos desta natureza poderiam ainda ser apresentados (ver, por exemplo, o Cap. 21 do Ashcroft & Mermin). Independentemente destas razões, devemos compreender que o modelo estático dos cristais é uma impossibilidade teórica do ponto de vista quântico, por violar o princı́pio de incerteza de Heisenberg. Com efeito, quanto maior for a precisão com que definimos as posições dos átomos no cristal, menor é a precisão com que podemos conhecer as suas quantidades de movimento, e portanto menos razoável é supô-los em repouso (p = 0). Neste capı́tulo, vamos melhorar este modelo dos sólidos, abandonando a hipótese da imobilidade atómica. Na nova descrição dos sólidos, considera-se que as posições definidas pela sua estrutura microscópica são as posições de equilı́brio dos átomos que lhes correspondem, mas supõe-se que são possı́veis pequenos deslocamentos dessas posições, que são contrariados pelas forças interatómicas responsáveis pela coesão do sólido. 4.1 A aproximação harmónica A interacção de cada átomo com os restantes átomos num sólido manifesta-se na forma de uma energia potencial φ(r), que apresenta um valor mı́nimo quando esse átomo se encontra na sua posição de equilı́brio (ver a Figura 4.1). Considerando pequenos deslocamentos δr = r − R desta posição, podemos aproximar a energia 41 42 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS φ X x Figura 4.1: A energia potencial de um átomo de um sólido é mı́nima na sua posição de equilı́brio. potencial pelo seu desenvolvimento de Taylor de segunda ordem i 1 h 2 φ(r) ' φ(R) + δr · [∇φ(r)]R + (δr · ∇) φ(r) . 2! R (4.1) O primeiro termo, de ordem zero em δr, é uma constante, e como tal não desempenha qualquer papel na dinâmica do sólido; representa a contribuição do átomo considerado para a energia de ligação do sólido. O termo de primeira ordem é nulo, uma vez que é proporcional ao gradiente da energia potencial do átomo, calculado na sua posição de equilı́brio, onde a energia potencial apresenta um valor mı́nimo. Finalmente, o termo de segunda ordem pode ser escrito como (2) φ · 2 ¸ 3 1 X ∂ φ (r) = δxi δxj 2! i,j=1 ∂xi ∂xj R = 3 1 X δxi Kij δxj , 2 i,j=1 (4.2) com · Kij = ∂2φ ∂xi ∂xj ¸ R A Eq. (4.2) é a expressão mais geral para a energia potencial num oscilador harmónico tri-dimensional(a) . Assim, se limitarmos o nosso estudo às vibrações de pequena amplitude, podemos tratar as interacções entre os átomos como interacções elásticas, o que permite, como veremos, grandes simplificações. Antes de iniciarmos o estudo das vibrações em cristais, vamos abordar o problema, mais simples, das vibrações em meios sólidos contı́nuos. 4.2 Ondas mecânicas em meios contı́nuos Vamos iniciar o estudo das vibrações nos sólidos através da análise de um problema unidimensional. Consideremos uma barra cilı́ndrica com comprimento L e secção (a) Note-se que como K ij é uma matriz simétrica, é possı́vel escolher um sistema de coordenadas x0 y 0 z 0 no qual a matriz K é diagonal. Usando esse sistema de coordenadas, o termo de segunda ordem na energia potencial fica φ(2) (r ) = Kxx (δx0 )2 /2 + Kyy (δy 0 )2 /2 + Kzz (δz 0 )2 /2, que representa a energia total de um sistema de três osciladores harmónicos independentes, com constantes elásticas Kxx , Kyy e Kzz . 4.2. ONDAS MECÂNICAS EM MEIOS CONTÍNUOS 43 x x u Figura 4.2: Barra longitudinal sob tensão. F(x) F(x+δx) x x δx Figura 4.3: Forças sobre uma porção de barra com comprimento δx. transversal com área S, constituı́da por um meio contı́nuo, homogénio e isotrópico com densidade ρ, sujeita a uma tensão σ(x, t), que se manifesta no aparecimento de forças longitudinais F (x, t). Sob a acção destas forças, a barra deforma-se longitudinalmente, isto é, cada secção transversal da barra sofre um deslocamento u(x, t), relativamente à sua posição de equilı́brio na ausência de tensões, na direcção do comprimento da barra (ver a Figura 4.2). A deformação da barra está relacionada com a função dos deslocamentos u(x, t), mas não directamente. Com efeito, uma situação em que u(x, t) tem o mensmo valor em todos os pontos da barra não corresponde a uma deformação, mas sim a um deslocamento rı́gido longitudinal da barra. Para medir as deformações, introduz-se então a seguinte função de extensão: ²(x, t) = ∂u . ∂x (4.3) Quando os deslocamentos são suficientemente pequenos é válida a aproximação elástica, em que se verifica uma proporcionalidade simples entre a tensão σ(x, t) e a extensão ²(x, t), em cada ponto da barra e em cada instante, σ(x, t) = −Y ²(x, t), (4.4) onde o coeficiente de proporcionalidade, Y , tem o nome de módulo de Young. Esta igualdade tem o nome de Lei de Hooke e a partir dela é possı́vel (por integração no volume da barra) deduzir a conhecida expressão da força como função da elongação numa mola elástica. Quando a barra está deformada, verifica-se a existência de forças entre porções contı́guas da barra, forças essas que contrariam a deformação. A tensão em cada ponto define-se como a força por unidade de área. Assim, duas porções contı́guas da barra separadas por uma secção transversal com abcissa x exercem, uma sobre a outra, uma força cujo módulo é, no instante t, F (x, t) = Sσ(x, t), onde S é, recorde-se, a área da secção transversal da barra. Consideremos agora uma porção de barra limitada por duas secções transversais infinitamente próximas, com abcissas x e x + δx (ver a Figura 4.3). Esta porção de 44 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS barra está sujeita a duas forças de tensão, cujas componentes segundo a direcção longitudinal são dadas por F (x, t) F (x + δx, t) = Sσ(x, t) = −Sσ(x + δx, t) ≈ −S[σ(x, t) + ∂σ δx] ∂x A resultante destas duas forças é ∂σ δx ∂x ∂2u = SY δx, ∂x2 δF (x, t) = −S (4.5) onde se usou já a lei de Hooke da Eq. (4.4). De acordo com a Lei Fundamental da Dinâmica, esta força deve ser igual ao produto da massa da porção de barra em estudo pela sua aceleração. A massa da porção considerada é facilmente calculada a partir da densidade, ρ, como dM = ρdV = ρSδx, ao passo que a sua aceleração é, por definição, a dupla derivada temporal do deslocamento, ou seja, · 2 ¸ ∂ u a(x, t) = . ∂t2 (x,t) Temos então, usando estas duas igualdades e a expressão da força [Eq. (4.5)], que ∂2u ∂2u =ρ 2. 2 ∂x ∂t (4.6) ∂ 2u 1 ∂ 2u = , ∂x2 vf2 ∂t2 (4.7) Y ou, finalmente, com vf2 = Y /ρ, que é a conhecida equação de onda a uma dimensão(b) , que descreve uma onda que se propaga com velocidade vf . Podemos pois concluir que a deformação se propaga longitudinalmente ao longo da barra, com uma velocidade s Y vf = . (4.8) ρ Existem vários métodos para a resolução das equações diferenciais do tipo da Eq. (4.7). Vamos aqui fazer um estudo das suas soluções recorrendo à análise de Fourier, que nos permite exprimir qualquer movimento periódico como uma sobreposição de movimentos harmónicos simples. Esta abordagem tem a vantagem de pôr em evidência, de forma simples, as propriedades fı́sicas das soluções. A função u(x, t) está definida apenas no interior do sólido, que tem comprimento L. Escolhendo a origem das coordenadas numa extremidade do sólido, podemos dizer que u está definida no intervalo x ∈ [0, L]. O desenvolvimento em séries de Fourier é possı́vel apenas para funções periódicas, e nada nos garante que u(x, t) seja, no intervalo [0, L], periódica. Mas é fácil construir uma função U (x, t), definida para todos os valores de x, periódica com perı́odo L, e que tenha, nos pontos do intervalo [0, L] o mesmo valor que u(x, t). Basta “copiar” u(x, t), do intervalo [0, L], para os intervalos [−2L, −L], [−L, 0], [0, L], [L, 2L], etc, como mostra a Figura 4.4. As (b) Ver qulaquer texto de fı́sica elementar, como o Nussensweig (Vol. 2), o Hallyday & Resnick (Vol. 2), o Alonzo & Finn, etc. 4.2. ONDAS MECÂNICAS EM MEIOS CONTÍNUOS 45 U(x,t) u(x,t) x 0 L x -2L 0 -L L 2L 3L Figura 4.4: Continuação analı́tica de uma função definida no intervalo [0, L] a toda a recta real. duas funções u e U são matematicamente diferentes, mas fisicamente indistinguı́veis, sendo pois aceitável, deste ponto de vista, fazer o desenvolvimento da função U , e considera-lo o da função u. O carácter periódico de U traduz-se matematicamente por U (x + L, t) = U (x, t). (4.9) Particularizando para x = 0, vem U (L, t) = U (0, t), (4.10) u(L, t) = u(0, t). (4.11) ou, porque nestes pontos U = u, Assim, por forma a que a análise de Fourier das soluções seja simplificada, iremos procurar soluções da Eq. (4.7), que satisfaçam, na fronteira do sólido, a condição (4.11). Condições fronteira do tipo da expressa em (4.11) chamam-se condições fronteira periódicas. Com esta continuação analı́tica a toda a recta real, construimos uma função periódica de perı́odo L, que pode, portanto, ser desenvolvida em série de funções trigonométricas, através de(c) X u(x, t) = ak (t)eikx . (4.12) k Os coeficientes ak (t) deste desenvolvimento são funções do tempo que dependem, obviamente, da função a desenvolver u(x, t). Apenas para ilustrar com um exemplo, é fácil provar (faça-o) que, uma vez que o deslocamento u(x, t) é uma função real, então os coeficientes devem satisfazer a condição ak (t) = a∗−k (t) , onde o asterisco representa a operação de conjugação complexa. Estudaremos mais à frente alguns detalhes adicionais da determinação dos coeficientes de Fourier. Como se disse, o ı́ndice k no somatório da Eq. (4.12) não é um ı́ndice inteiro. Sendo assim, não sabemos ainda como calcular a soma da série. Substituindo na Eq. (4.9) a forma geral da solução da Eq. (4.12), obtemos X £ ¤ ck (t)eikx eikL − 1 = 0. k Para que esta igualdade se verifique para todos os valores de x no intervalo de [0, L], é necessário garantir que para todos os valores de k, se tenha exp(ikL) = 1, ou seja, k= (c) Note-se 2π n, L n = 0, ±1, ±2, ... . (4.13) que nesta expressão k não é um ı́ndice inteiro, mas sim o número de onda da vibração particular ak (t)eikx ; o lado direito desta expressão deve ler-se “soma para todos os valores possı́veis do número de onda k, de ak (t)eikx ”. 46 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS Assim, notamos que a imposição de condições fronteira às soluções da equação de onda, restringe fortemente os valores que o número de onda pode tomar. Agora que conhecemos os valores possı́veis para o número de onda das componentes monocromáticas das vibrações de um meio unidimensional com comprimento L, voltemos a atenção de novo para o cálculo dos coeficientes ck (t). Usando o desenvolvimento da Eq. (4.12) é imediato verificar que X d2 ck (t) ∂ 2 u(x, t) ∂t2 = ∂ 2 u(x, t) ∂x2 = − dt2 k X eikx k 2 ck (t) eikx k Substituindo agora estes resultados na equação de onda [Eq. (4.7)], resulta ¸ X· d2 ck (t) ikx 2 2 vf k ck (t) + e = 0, dt2 k tendo-se se usado a velocidade de propagação, definida na Eq. (4.8). Também aqui se aplica o argumento de que a única maneira de garantir que esta soma se anule para todos os valores de x, consiste em impor vf2 k 2 ck (t) + d2 ck (t) = 0. dt2 Esta equação diferencial admite soluções do tipo ck (t) = ak e−iωk t , desde se verifique a igualdade ωk = vf k. (4.14) A quantidade ωk que acabámos de introduzir é a frequência a angular da componente monocromática com número de onda k. A relações entre a frequência angular e o número de onda como a da Eq. (4.14) dá-se o nome de relações de dispersão. Podemos então escrever o desenvolvimento em série de Fourier das soluções da equação de onda como X u(x, t) = ak ei(kx−ωk t) . (4.15) k Conhecida a fução de deslocamento u(x, t), os coeficientes ak podem ser determinados como (verifique) 1 ak = L Z L dxu(x, t)e−i(kx−ωk t) . 0 A dedução da equação de onda [Eq. (4.7)] não é, de forma alguma, geral. Se tivéssemos considerado deformações transversais, terı́amos obtido a equação de onda para ondas transversais, que envolve outros coeficientes elásticos, diferentes do módulo de Young Y . Assim, a velocidade de fase vf das ondas transversais pode ser diferente da das ondas longitudinais. Neste estudo, considerámos pequena a distância, δx, entre as duas secções que limitam a porção de meio considerado, por forma a permitir a aproximação ∂F F (x) − F (x + δx) = , δx ∂x (4.16) 4.2. ONDAS MECÂNICAS EM MEIOS CONTÍNUOS 47 que só é verdade se δx for pequeno quando comparado com as distâncias envolvidas em variações apreciáveis de F . Uma medida destas distâncias é, para ondas monocromáticas, o comprimento de onda. Assim, a nossa dedução é válida se δx ¿ λ. (4.17) Supor a distância δx pequena não é, por si só, uma aproximação, uma vez que se trata de um parâmetro arbitrário numa construcção abstracta. No entanto, neste cálculo desprezou-se a estrutura atómica do sólido (uma vez que o tratámos como um meio contı́nuo), e isto só é razoável se apenas se considerarem distâncias muito superiores àquelas em que essa estrutura microscópica se torna evidente, ou seja, distâncias muito superiores às distâncias interatómicas tı́picas. Assim, devemos satisfazer δx À a, (4.18) onde a é o parâmetro da rede cristalina. Conjugando (4.17) e (4.18) concluimos que o tratamento realizado só é válido para comprimentos de onda muito maiores que as distâncias interatómicas tı́picas. 4.2.1 Vibrações de um meio contı́nuo tridimensional Vamos agora generalizar o estudo precedente para o caso mais geral das vibrações de um sólido tridimensional. Consideremos um sólido com a forma de um paralelipı́pedo com lados Lx , Ly e Lz , que consideraremos homogénio e isotrópico. Sujeito a tensões, este sólido deforma-se, isto é, cada ponto do sólido sofre um deslocamento u(r, t) relativamente à posição que ocupava antes da acção das tensões deformadoras. No regime das deformações elásticas (quando os deslocamentos são pequenos), a deformação em cada ponto é proporcional à tensão nesse ponto e assim, se se repetir o formalismo desenvolvido no caso unidimensional, obtêm-se as equações de onda destas vibrações tridimensionais, em tudo semelhantes à da Eq. (4.7). No entanto, apesar destas semelhanças, há um pormenor importante que complica ligeiramente o problema no caso tridimensional. É que num meio tridimensional isotrópico podem-se considerar dois tipos diferentes de tensões, que produzem dois tipos diferentes de deformações: há as tensões de compressão, que levam uma porção do meio a “empurrar” as porções contı́guas, e há as de corte que levam uma porção do meio a deslizar sobre as demais. As tensões de compressão são as responsáveis pela propagação de vibrações longitudinais, ao passo que as de corte estão envolvidas na propagação das vibrações transversais. Em ambos os casos, as deformações são proporcionais às tensões correspondentes, mas as constantes de proporcionalidade (chamam-se módulos elásticos na linguagem da fı́sica dos meios contı́nuos) são diferentes, o que se traduz em diferentes velocidades de propagação para as ondas logitudinais e transversais. Assim, em vez de apenas uma, devemos considerar duas equações de onda, cada uma para cada tipo de vibração(d) (d) Se ∇2 ul (r, t) − 1 ∂ 2 ul (r, t) =0 vl2 ∂t2 (4.19) ∇2 ut (r, t) − 1 ∂ 2 ut (r, t) = 0. vt2 ∂t2 (4.20) o meio não for isotrópico, o problema complica-se ainda mais, uma vez que então há três tipos fisicamente distintos de polarização das vibrações, e a própria velocidade de propagação de cada tipo de vibração pode ainda depender da direcção de propagação. 48 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS Estas equações de onda admitem soluções com a forma de sobreposições de ondas planas monocromáticas ul (r, t) = X A(k)ei(r·k−ωt) (4.21) B(k)ei(r·k−ωt) , (4.22) k ut (r, t) = X k mas os dois tipos de polarização (longitudinal e transversal) devem satisfazer relações de dispersão diferentes, por serem diferentes as suas velocidades. Nestas expressões, A(k) e B(k) são dois vectores, o primeiro paralelo e o segundo perpendicular a k, mas que, aparte esta condição são arbitrários. São os transformados de Fourier dos vectores de deslocamento ul e ut , respectivamente. Tal como no caso unidimensional, também aqui as decomposições da deformação como séries de Fourier discretas, apresentadas nas equações (4.21) e (4.22), são possı́veis apenas para funções periódicas. Para garantir a periodicidade da deformação, introduzimos de novo condições fronteira periódicas, que se devem agora verificar segundo as três direcções ortogonais. Isto é, devemos garantir que u(x, y, z, t) = u(x + Lx , y, z, t) = u(x, y + Ly , z, t) = u(x, y, z + Lz , t), (4.23) (4.24) (4.25) o que resulta, ao nı́vel das ondas planas monocromáticas, numa discretização dos vectores de onda, apenas se aceitando aqueles que verificam 2nπ , Lx 2mπ ky = , Lx 2lπ kz = , Lx kx = n = 0, ±1, . . . (4.26) m = 0, ±1, . . . (4.27) l = 0, ±1, . . . . (4.28) Os vectores de onda dos modos de vibração possı́veis num sólido contı́nuo com forma paralelipipédica dispõem-se assim numa rede cristalina ortorrômbica com vectores fundamentais que, escolhendo uma base convenientemente orientada, se podem escrever como 2π ex Lx 2π ey B= Ly 2π ez . C= Lz A= (4.29) (4.30) (4.31) Recordemo-nos mais uma vez que por cada um destes vectores de onda permitidos há três modos de vibração, que correspondem cada um a cada uma das três polarizações possı́veis para uma vibração num sólido tridimensional. Como no caso unidimensional, a aproximação de sólidos contı́nuos só é razoável se se considerarem apenas distâncias muito superiores às distâncias interatómicas tı́picas. Assim, este estudo só é válido no limite de grandes comprimentos de onda. Vamos agora tentar descrever oscilações com comprimentos de onda da ordem de grandeza das distâncias interatómicas. 4.3. VIBRAÇÕES DE UM MEIO CRISTALINO 4.3 49 Vibrações de um meio cristalino As propriedades vibracionais de um cristal tridimensional são qualitativamente semelhantes às de um cristal unidimensional. Assim, uma abordagem unidimensional é bastante instrutiva, na medida em que permite obter com facilidade resultados que constituem versões simplificadas dos de um estudo mais geral mas que, apesar disso, ilustram igualmente os principais efeitos fı́sicos das vibrações de um meio corpuscular. Por esta razão limitamos, nestes apontamentos, o estudo analı́tico detalhado das vibrações em cristais a problemas unidimensionais. O leitor interessado pode (e deve) complementar a leitura destes apontamentos com a dos textos recomendados. 4.3.1 Vibrações de uma cadeia monoatómica linear Um cristal monoatómico unidimensional consiste num conjunto de átomos idênticos, com movimentos de oscilação (consideramos apenas oscilações longitudinais, isto é, com a direcção do próprio cristal) em torno de posições de de equilı́brio que se dispõem alinhadas numa recta, igualmente espaçadas entre si. Identificando com a coordenada x a posição nesta recta, e numerando vários átomos com ı́ndices 0, ±1, ±2, ... ± n, ..., podemos escrever a coordenada Xn da posição de equlı́brio do n-ésimo átomo na forma Xn = na, (4.32) onde a é a distância interatómica (é o parâmetro desta rede cristalina unidimensional) e a origem x = 0 foi escolhida por forma a coincidir com a posição do 0-ésimo átomo (ver a Figura 4.5). Os átomo oscilam em torno das suas posições de -3a -2a -a 0 a 2a 3a Figura 4.5: Modelo harmónico de rede cristalina de um cristal unidimensional. equilı́brio, e assim, em geral, as posições que ocupam não são coincidentes com as suas posições de equilı́brio. É conveniente introduzir as variáveis un (t), que medem, como função do tempo, as distâncias que separam os átomos das suas posições de equilı́brio. A posição do n-ésimo átomo num instante arbitrário t é então dada por xn (t) = Xn + un (t). (4.33) No quadro da aproximação harmónica, as interacções entre os átomos que formam o cristal são consideradas interacções elásticas, ou seja, os cristais monoatómicos unidimensionais são descritos como um conjunto de átomos iguais dispostos numa linha recta, unidos entre si por molas microscópicas com constantes elásticas iguais k = ∂ 2 φ/∂x2 e iguais comprimentos naturais a (ver Figura 4.6). Consideremos, num n-2 n-1 n n+1 n+2 Figura 4.6: Os cristais monoatómicos unidimensionais na aproximação harmónica. cristal monoatómico unidimensional harmónico assim descrito, um átomo qualquer n, e calculemos, num instante arbitrário t, a força que os seus vizinhos mais próximos exercem sobre ele. O átomo n − 1 exerce sobre o átomo n uma força que, de acordo 50 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS com a aproximação harmónica(e) , é dada por Fn−1,n (t) = −α [un (t) − un−1 (t)] ; (4.34) da mesma maneira, a força que o átomo n + 1 exerce sobre o mesmo átomo é Fn+1,n (t) = −α [un (t) − un+1 (t)] . (4.35) Desprezando as forças que os restantes átomos exercem sobre o átomo n, a resultante das forças que sobre ele actuam é Fn (t) = α [un−1 (t) − 2un (t) + un+1 (t)] . (4.36) De acordo com a segunda lei de Newton, estas força é igual à massa, m, do átomo em estudo, a multiplicar pela sua aceleração que, tendo em conta a Eq. (4.33), é dada por an (t) = d2 un /dt2 . Obtemos então, finalmente, a equação de onda para meios cristalinos d2 un α [un−1 (t) − 2un (t) + un+1 (t)] . = dt2 m (4.37) Mais uma vez, tentamos obter soluções com a forma de sobreposições de ondas monocromáticas un (t) = ei(kXn −ωt) . (4.38) Substituindo esta funções em (4.37), obtemos i α h i(kXn−1 −ωt) − ω 2 ei(kXn −ωt) = e − 2ei(kXn −ωt) + ei(kXn+1 −ωt) m ¤ α i(kXn −ωt) £ −ika = e e − 2 + eika , (4.39) m onde se usou (4.33). Recorrendo agora à fórmula de Euler, eiθ = cos θ + i sin θ, (4.40) é fácil provar que eiθ + e−iθ = 2 cos θ. A Eq. (4.39) pode pois escrever-se como ω2 = 2 α (1 − cos ka). m (4.41) Notemos agora que cos ka = cos2 ka ka ka − sin2 = 1 − 2 sin2 , 2 2 2 de forma que, substituindo em 4.41, obtemos finalmente r ¯ ¯ α ¯¯ ka ¯¯ ω=2 sin . m¯ 2 ¯ (4.42) Esta é a relação de dispersão para os cristais unidimensionais. O gráfico da função de dispersão (4.42) está representada na Figura 4.7. No limite de grandes comprimentos de onda, k aproxima-se de zero e a relação de dispersão fica praticamente linear, à semelhança das relações de dispersão para as vibrações de meios contı́nuos: r ¯ ¯ r α ¯¯ ka ¯¯ α |k|. (4.43) ω(k)k→0 −→ 2 = a m¯ 2 ¯ m (e) É trivial verificar que a força, F , deriva do potencial, F = − ∂φ . ∂x 4.3. VIBRAÇÕES DE UM MEIO CRISTALINO 51 f w=v | k| w w m k −2π /a −π /a 0 π /a 2π /a Figura 4.7: Relação de dispersão para as vibrações num cristal monoatómico unidimensional e limite para grandes comprimentos de onda. Este facto não nos deve espantar, pois chegamos, no estudo das vibrações dos meios contı́nuos, à conclusão que a análise só era válida para grandes comprimentos de onda. A frequência máxima permitida para as vibrações longitudinais numa cadeia monoatómica linear é r α ωm = 2 . (4.44) m De forma semelhante, poderı́amos concluir que para as vibrações transversais há também uma frequência máxima, se bem que com valor diferente (normalmente inferior) do apresentado acima, caracterı́stico das longitudinais. Então, verificamos que não é possı́vel a propagação de ondas vibracionais numa cadeia monoatómica unidimensional com frequência acima de um certo valor limite. A cadeia monoatómica linear comporta-se assim como um filtro passa-baixo, que corta as frequências superiores ao valor máximo ωm . Uma das principais caracterı́sticas das relações de dispersão em meios cristalinos unidimensionais [Eq. (4.41)] é o facto de ω ser uma função periódica de k, de perı́odo 2π/a, ou seja, µ ¶ 2π ω k+ = ω(k). (4.45) a Assim, basta-nos conhecer a função ω(k) num intervalo de amplitude 2π/a, por exemplo, i π πi , (4.46) k∈ − , a a para determinar a função ω(k) para todos os valores de k. Analisando mais detalhadamente esta questão, o próprio significado fı́sico de números de onda k superiores a π/a deve ser posto em causa. Com efeito, ondas planas com valores de k superiores a π/a, k > π/a produzem deslocamentos idênticos aos produzidos por ondas planas com valores de k no intervalo (4.46), que se obtêm do primeiro somando-lhe ou subtraindo-lhe um múltiplo inteiro de 2π/a. Por exemplo, na Figura 4.8 representamos duas ondas planas monocromáticas num cristal monoatómico unidimensional de parâmetro a, com diferentes números de onda k e k 0 , mas que produzem os mesmos deslocamentos atómicos unidimensionais, sendo pois, do ponto de vista fı́sico, indistinguı́veis. A primeira tem comprimento de onda λ = 4a, e portanto k = π/2a; a segunda tem k 0 = k + 2π/a = 5π/2a, e portanto λ0 = 4a/5. Os deslocamentos 52 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS a k= π /2a λ = 4a k´=5 π /2a λ ´= 4a/5 Figura 4.8: Deslocamentos atómicos idênticos, produzidos por duas ondas planas com diferentes valores do número de onda. Valores de k superiores π/a não têm significado fı́sico. atómicos são, como podemos verificar, os mesmos; assim as duas ondas são indistinguı́veis e portanto nunca é necessário considerar o valor k 0 = 5π/2a, por este ser equivalente a k = k 0 − 2π/a = π/2a. Note-se que a rede recı́proca de uma rede unidimensional de parâmetro a é uma rede unidimensional de parâmetro A = 2π/a. Uma célula unitária de Wigner-Seitz (veja a Secção 2.2) da rede recı́proca deste cristal é uma porção de espaço-k compreendida entre −A/2 e A/2, ou seja, −π/a e π/a. Dá-se o nome de primeira zona de Brillouin à célula unitária de Wigner-Seitz da rede recı́proca. O que acabámos de ver foi que podemos restringir a relação de dispersão à primeira zona de Brillouin, pois os valores de k no seu exterior produzem efeitos equivalentes, dada a periodicidade da relação de dispersão. Esta periodicidade pode ser expressa na forma ω(k) = ω(k + G), (4.47) onde G é um “vector”(f) da rede recı́proca. Valores de k na fronteira da primeira zona de Brillouin estão associados a ondas estacionárias. De facto, quando k = ±π/a o deslocamento toma a forma un (t) = ei(kna−ωt) = ei(±nπ−ωt) = cos(nπ)e−iωt , (4.48) que não é mais que a equação de uma onda estacionária onde átomos consecutivos movem-se em oposição de fase, porque cos(nπ) = ±1 consoante o número inteiro n é par ou impar. Como podemos verificar, não se distinguem os deslocamentos produzidos por ondas com vector de onda k = −π/a e k = π/a, ficando assim (f) “vector”aparece entre aspas porque temos estado a lidar com situações unidimensionais. 4.3. VIBRAÇÕES DE UM MEIO CRISTALINO 53 a a/2 A B A B Figura 4.9: Cadeia biatómica unidimensonal. justificada a necessidade da utilização de um conjunto aberto em (4.46) para indicarmos os números de onda possı́veis na cadeia unidimensional. Podemos também constatar o aparecimento de ondas estacionárias para k = ±π/a, através do cálculo da velocidade de grupo, vg dω dk µ ¶ ka a = ω0 cos , 2 2 = (4.49) que se anula quando k = ±nπ/a, sendo n um inteiro qualquer. 4.3.2 Vibrações de uma cadeia biatómica linear Vamos agora abordar um problema um pouco mais geral que o que acabámos de estudar, considerando agora as vibrações das cadeias biatómicas. O estudo que vamos fazer é muito semelhante ao anterior; apesar disso, o comportamento das cadeias biatómicas distingue-se do das cadeisas monoatómicas em alguns aspectos bastante interessantes. Consideremos então um cristal unidimensional composto por átomos de duas espécies A e B, e suponhamos, para simplificar, que o motivo cristalino consiste em um átomo da espécie B situado no centro da célula unitária definida pelas posições dos átomos da espécie A (ver a Figura 4.9). Admitimos que os átomos podem oscilar em torno das posições de equilı́brio definidas no motivo cristalino, mas vamos apenas considerar deslocamentos longitudinais. Para simplificar a linguagem, identicamos as as diversas instâncias do motivo cristalino através de um número inteiro n que toma valores desde n = 0 até n = N − 1, onde N é o número total de átomos de cada espécie. As posições de equilı́brio dos dois átomos que constituem a n-ésima célula unitária são Xn(A) Xn(B) = na = (n + 1/2)a, designando por a o comprimento das células unitárias e escolhendo a origem do sistema de coordenadas coincidente com a posição de equilı́brio do átomo A da zeroésima célula unitária. Designemos os deslocamentos dos átomos A e B da n-ésima B célula unitária respectivamente por uA n (t) e un (t) (ver a Figura4.10). Aceitemos a uB n uA n uB n-1 a/2 a/2 uA n+1 a/2 Figura 4.10: Deslocamentos atómicos numa cadeia biatómica unidimensional. aproximação elástica e suponhamos (para simplificar) que os parâmetros do limite 54 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS elástico (distância de equilı́brio, a/2, e constante elástica, α) são idênticos para as ligações A–B e B–A(g) . Analisemos o movimento dos átomos de cada espécie quı́mica. Considerando apenas as interacções entre vizinhos mais próximos, a força que actua no átomo A da n-ésima célula unitária é FnA = mA ¡ ¢ d2 uA n A B = α uB n−1 − 2un + un , 2 dt (4.50) ao passo que a que actua no átomo de espécie B é FnB = mB ¡ ¢ d2 uB n B A = α uA n − 2un + un+1 . 2 dt (4.51) Estas são duas equações de um sistema de 2N equações diferenciais acopladas cuja resolução não é, na prática, viável, devido ao número muito grande de equações que formam o sistema (tipicamente, N ≈ 1023 ). Em vez desta resolução explı́cita, procuramos soluções com a forma de sobreposições de ondas monocromáticas X A i(kXn −ωk t) uA cA (4.52) n (t) = ke k uB n (t) = X B i(kXn −ωk t) cB , ke (4.53) k onde os coeficientes de amplitude dos movimentos dos átomos de espécie A, cA k não são, necessariamente, iguais aos dos átomos de espécie B, cB . Note-se também que, k como no caso monoatómico, o indı́ce k não representa um indı́ce inteiro, antes se devendo interpretar estes dois desenvolvimentos como a “soma para todos os valores possı́veis do número de onda k”, sendo o conjunto dos valores possı́veis por enquanto não definido. Substituindo estes desenvolvimentos nas eqs. (4.50)e (4.51), obtemos · µ ¸¶ ika/2 X + e−ika/2 Be A − c + 2α c ei(kna−ωk t) −mA ωk2 cA = 0 k k k 2 k µ · ¸¶ ika/2 X + e−ika/2 B Ae ei(kna−ωk t) −mB ωk2 cB + 2α c − c = 0. k k k 2 k Dada a independência linear das funções exponenciais exp[i(kna − ωk t)], a única maneira de garantir a validade destas duas igualdades em qualquer instante t é impor que sejam nulos os coeficientes que multiplicam as exponenciais: µ ¶ ika/2 + e−ika/2 A Be − c −mA ωk2 cA + 2α c = 0 k k k 2 µ ¶ ika/2 + e−ika/2 B Ae −mB ωk2 cB + 2α c − c = 0. k k k 2 Usando a bem conhecida igualdade eika/2 + e−ika/2 = cos 2 µ ka 2 ¶ , podemos ainda reescrever estas equações como ka B c 2 k = 0 (4.54) ka A c (2α − mB ωk ) cA k 2 k = 0. (4.55) (2α − mA ωk ) cA k − 2α cos −2α cos (g) Esta suposição não é necessária para a presente discussão, mas simplifica ligeiramente o formalismo. Ver o problema 3. 55 -1 ω (s ) 4.3. VIBRAÇÕES DE UM MEIO CRISTALINO -π/a -π/2a π/2a 0 π/a -1 k (m ) Figura 4.11: As relações de dispersão para os dois modos vibracionais (ambos longitudinais) de uma cadeia biatómica linear. A curva que tem um máximo para k = 0 respeita ao modo óptico; a outra é a do modo acústico. Substituimos desta maneira o sistema de 2N equações diferenciais acopladas das eqs. (4.50) e (4.51) por um conjunto de sistemas de 2 equações algébricas homogénias, como o representado acima para o modo vibracional com número de onda k. Como se sabe das aulas de Álgebra Linear, os sistemas de equações algébricas homogénias só tem soluções não triviais (ou seja, tais que cA,B 6= 0) se se anular o k determinante da matriz formada pelos coeficientes, isto é, se ¯ ¯ ¯ 2α − mA ω 2 ¯ −2α cos ka k 2 ¯ ¯ ¯ −2α cos ka −2α − mB ω 2 ¯ = 0, k 2 ou seja, se ¶ µ ka = 0, mA mB ωk4 − 2α(mA + mB )ωk2 + 4α2 1 − cos2 2 ou ainda, recorrendo à igualdade fundamental da trigonometria, mA mB ωk4 − 2α(mA + mB )ωk2 + 4α2 sin2 ka = 0. 2 Esta equação de segundo grau (em ωk2 ) admite as seguintes duas soluções: sµ ¶2 m + m mA + mB 4 ka A b 2 ωk = α ±α − sin2 . mA mB mA mB mA mB 2 (4.56) (4.57) Vemos assim que para cada valor de k há em geral duas frequências possı́veis , cujas representações gráficas estão esboçadas na Figura 4.11. Uma das soluções (a que se anula para k = 0) tem o nome de ramo acústico; a outra (que apresenta um máximo para k = 0) designa-se por ramo óptico. A existência de dois comportamentos vibracionais distintos, com relações de dispersão diferentes, é uma caracterı́stica dos cristais biatómicos reais. 4.3.3 Vibrações de um cristal tridimensional Vamos agora fazer um estudo, menos detalhado que o anterior, das vibrações num cristal tridimensional. As ondas planas monocromáticas em três dimensões num meio cristalino escrevem-se como un,k (t) = A ei(k·Rn −ωt) , (4.58) 56 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS onde Rn é o vector que indica a posição de equilı́brio do átomo-n. Note-se que a função onda é naturalmente uma grandeza vectorial cujas componentes, calculadas no ponto correspondente à posição de equilı́brio de um dado átomo, são iguais às componentes do deslocamento desse átomo relativamente à sua posição de equilı́brio. Consideremos um sólido com dimensões Na a×Nb b×Nc c em que a, b e c representam os módulos dos vectores da rede directa e Na , Nb e Nc é o número de células unitárias em cada uma das três direcções fundamentais. Deste modo, o sólido contém um número total de Na Nb Nc células unitárias e igual número de átomos (no caso monoatómico que mais nos interessa aqui). As condições fronteira periódicas para este sólido são A ei(k·Rn −ωt) A ei(k·Rn −ωt) A ei(k·Rn −ωt) = A ei(k·[Rn +Na a]−ωt) , = A ei(k·[Rn +Nb b]−ωt) , = A ei(k·[Rn +Nc c]−ωt) , (4.59) de onde resultam as seguintes relações de quantização l Na m k · b = 2π Nb n k · c = 2π Nc k · a = 2π que são satisfeitas se k= l = 0, ±1, ±2, . . . m = 0, ±1, ±2, . . . n = 0, ±1, ±2, . . . , l m n A+ B+ C, Na Nb Nc (4.60) (4.61) onde A, B e C são os vectores fundamentais da rede recı́proca do cristal em estudo, definidos na Eq. (3.7). Os vectores de onda permitidos num cristal monoatómico são assim vectores de uma rede relacionada com a rede recı́proca desse cristal, mas em que os vectores fundamentais são A/Na , B/Nb e C/Nc . Note-se que duas ondas planas com vectores de onda k e k0 cuja diferença é um vector da rede recı́proca são equivalentes, no sentido em que os deslocamentos atómicos associados são os mesmos. Senão vejamos; consideremos um modo de vibração com um vector de propagação k0 = k + G em que G é um vector da rede recı́proca. A expressão do deslocamento do n-ésimo átomo é un,k0 (t) = A ei(k·Rn +G·Rn −ωt) = A ei(k·Rn −ωt) = un,k (t), (4.62) porque G · Rn é sempre um múltiplo de 2π (recordemos que Rn = n1 a + n2 b + n3 c com n1 , n2 e n3 inteiros). Assim, verifica-se que à infinidade de vectores de onda k dados pela Eq. (4.61) não corresponde uma infinidade de modos de vibração fisicamente distintos. Por exemplo, apesar de serem diferentes soluções da Eq. (4.61), os vectores de onda k = k0 = A Na (Na + 1) A + B, Na correspondem a modos de vibração idênticos. Quando escrevemos os deslocamentos atómicos como conbinação linear de ondas planas monocromáticas, devemos ter em atenção este facto e evitar, nos desenvolvimentos, este tipo de sobreposições. Basta, para tal, considerar apenas vectores de onda, k, no interior de uma única célula unitária primitiva da rede recı́proca, sendo a escolha mais usual a da célula 4.4. A DENSIDADE DE MODOS DE VIBRAÇÃO 57 de Wigner-Seitz (veja a Secção 2.2), ou seja, a primeira zona de Brillouin. Esta restricção à primeira zona de Brillouin fica assegurada se considerarmos, na combinação linear da Eq. (4.61), inteiros n, m e l limitados aos intervalos ¸ ¸ 1 1 n ∈ − Na , Na 2 2 ¸ ¸ 1 1 m ∈ − Nb , Nb 2 2 ¸ ¸ 1 1 l ∈ − Nc , Nc . 2 2 Os números inteiros n, m, e l podem então tomar um número total de valores de Na , Nb , Nc , respectivamente, o que implica existir um total de Na Nb Nc vectores de propagação possı́veis, exactamente igual ao número total de átomos no sólido. Uma vez que existem três modos de vibração para cada vector de onda (um longitudinal e dois transversais), o número total de modos de vibração é igual ao número de graus de liberdade no sólido, 3Na Nb Nc . Note-se que as ondas planas monocromáticas apresentadas na Eq. (4.58) são solução das equações de onda se satisfizerem relações de dispersão que não foram deduzidas, mas que consistem em relações mais ou menos complexas entre a frequência ω e o vector de onda k. Na aproximação de grandes comprimentos de onda, um cristal pode ser tratado como um meio contı́nuo, homogénio e isotrópico, de forma que nessa aproximação, se obtêm relações de dispersão semelhantes às já apresentadas. Mas, se quisermos melhorar a análise e considerar vibrações com comprimentos de onda comparáveis com as distâncias interatómicas, teremos que ver o cristal como um meio altamente anisotrópico e não homogénio. Assim, a velocidade de propagação de uma onda plana depende não só do módulo do vector de onda como no caso unidimensional, mas também da sua polarização (e neste caso, as situações relevantes não se reduzem às das vibrações longitudinais e transversais), e ainda da direcção do vector de onda! A dedução geral da forma das relações de dispersão num cristal tridimensional é assim um problema muito complexo, e que não tem, em geral, solução analı́tica. 4.4 A densidade de modos de vibração Como acabámos de ver, a imposição de condições fronteira restringe fortemente o vector de onda das soluçoes das equações de onda. No caso unidimensional, de todos os valores reais que k pode tomar, apenas se podem aceitar aqueles que satisfazem (4.13), que aqui reescrevemos k= 2π n, L n = 0, ±1, ±2, ... . (4.63) Estas condições fronteira foram pela primeira vez introduzidas por Born e Von Kármán. Podemos mais facilmente interpretá-las se imaginarmos que a cadeia linear de átomos e molas forma uma circunferência fechada em que o primeiro átomo da cadeia coincide com o último. Suponhamos que estamos interessados em determinar quantos valores de k, aceitáveis nos termos que acabámos de referir, existem num intervalo dk do “espaçok”. De acordo com (4.63), a separação entre modos de vibração contı́guos (ou seja, entre k 0 s vizinhos) é de δ = 2π/L. O número de modos no intervalo dk é pois, dn = L dk = dk. δ 2π (4.64) 58 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS Assim, usando a relação de dispersão (4.14) (por simplicidade, vamos para já restringir o estudo a grandes valores do comprimento de onda), este resultado pode ser expresso em termos da frequência ω, já que dk = dk 1 1 dω = dω = dω. dω dω/dk vf (4.65) Obtemos então dn = L/(2πvf )dω, mas este resultado ainda tem que ser multiplicado por 2, já que a cada valor de ω correspondem dois valores de k, dados por k = ±ω/vf . Resumindo, obtemos, L dω. πvf dn = (4.66) Esta equação permite-nos calcular o número de modos de vibração, dn, existentes no intervalo de frequência dω. Dá-se o nome de densidade de modos de vibração à derivada dn/dω. Neste caso, a densidade de modos de vibração é g(ω) = L . πvf (4.67) Vejamos agora o caso tridimensional, aceitando ainda o limite de grandes comprimentos de onda, em que o comportamento dos cristais é semelhante ao dos meios contı́nuos. Consideremos um sólido com forma paralelipipédica como o da Secção 4.2.1, com dimensões Lx , Ly e Lz . As condições fronteira periódicas para este sólido resultam nas condições de quantização apresentadas nas equações (4.26)– (4.28), segundo as quais os vectores de onda k permitidos formam um rede cristalina definida pelos vectores apresentados em (4.29)–(4.31). Esta rede cristalina tem células unitárias primitivas com volume (2π)3 /V , onde V = Lx Ly Lz é o volume do sólido considerado. Assim, cada ponto desta rede (ou seja, cada vector de onda k) tem disponı́vel o “volume” de espaço-k δ3 = (2π)3 . V (4.68) Numa esfera de raio k, cujo volume é 4πk 3 /3, existem n= 4 3 3 πk 3 (2π) V = V 4π 3 k , (2π) 3 3 (4.69) vectores de propagação permitidos. Se diferenciarmos esta equação, obtemos o número de vectores de onda com módulo compreendido entre k e k + dk, correspondendo à zona sombreada na Figura 4.12. Obtemos assim dn = V 2 k dk, 2π 2 e usando a relação de dispersão de um meio contı́nuo (4.14); dn = V ω 2 dω , 2π 2 vf vf de onde resulta a seguinte expressão para a densidade de modos de vibração: g(ω) = V ω2 . 2π 2 vf 3 (4.70) Note-se que nesta expressão apenas estamos a considerar que a cada valor do vector de onda k corresponde apenas um modo de vibração. Em geral isto não é verdade, 4.4. A DENSIDADE DE MODOS DE VIBRAÇÃO 59 ky kx Figura 4.12: Na região a sombreado o vector de onda entre k e k + dk. k tem módulo comprendido pois devemos recordar que os deslocamentos atómicos são grandezas vectoriais, e portanto a função de onda un,k (R, t) também o é. As componentes deste vector, calculadas no ponto correspondente à posição de equilı́brio de um dado átomo n, são iguais às componentes do deslocamento desse átomo relativamente à sua posição de equilı́brio. À orientação da oscilação numa onda vibracional dá-se o nome de polarização dessa onda. Para cada vector de onda k há então três modos independentes de oscilação, correspondendo às três direcções ortogonais do espaço. É frequente a escolha destas direcções em função da direcção do vector k. À componente de u na direcção de k chama-se a polarização longitudinal; às outras duas dá-se o nome de polarização transversal (ver Figura 4.13). Tendo em linha de conta as três u1 u u2 uL k Figura 4.13: As três componentes da polarização de uma onda plana monocromática. Dado o deslocamento u, apresentam-se a polarização logitudinal uL e as duas polarizações transversais u1 e u2 . polarizações independentes, a Eq. (4.70) complica-se um pouco. Demonstra-se (ver problemas) que se as três polarizações têm a mesma velocidade de fase, a densidade de modos é tripla da dada por (4.70), isto é g(ω) = 3V ω 2 . 2π 2 vf 3 (4.71) Note-se que, para obtermos a densidade de modos de vibração da Eq. (4.70), usámos a relação de dispersão da Eq. (4.14), que é válida apenas para grandes comprimentos de onda e supondo que o meio é isotrópico, de tal forma que a frequência angular da radiação depende apenas do seu comprimento de onda, mas não da direcção de propagação. Como sabemos, os cristais não apresentam esta priopriedade, mas, mesmo assim, a Eq. (4.70) é uma aproximação muito razoável para a densidade de modos de vibração de uma dada polarização, desde que não se considerem comprimentos de onda comparáveis com a distância interatómica. Por outro lado, e como já foi dito antes, as ondas transversais e longitudinais têm, em princı́pio, e mesmo em meios homogéneos, velocidades de propagação diferentes. 60 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS Logo, devemos concluir que (4.71) não é, em geral, rigorosamente válida (ver o problema 4 no fim deste capı́tulo). Para obtemos a densidade dos meios cristalinos, devemos usar a relação de dispersão válida em cristais, ou seja, algo que esteja mais próximo de (4.42) do que de (4.14). Mas adaptar simplesmente a relação de dispersão (4.42) é um método “perigoso”, pois todo este formalismo supõe o meio isotrópico. Ora um sólido só se pode considerar isotrópico caso se despreze a sua estrutura cristalina, como deve, nesta altura, ser claro. 4.5 O problema do calor especı́fico O calor especı́fico molar de uma substância é o calor necessário para elevar a temperatura de uma mole dessa substância em 1◦ C. Se o processo de aquecimento for feito a volume constante, o trabalho realizado é nulo, e portanto o calor fornecido ao sistema é igual à sua variação de energia dE. Assim, o calor especı́fico a volume constante é definido como ¶ µ ∂E , (4.72) Cv = ∂T V O calor especı́fico dos sólidos apresenta uma dependência da temperatura caracterı́stica, representada na Figura 4.14. CV anula-se no zero absoluto de temperatura (0◦ K≈ −273◦ C) apresentando, para valores baixos de temperatura uma CV 3R α T3 0 T Figura 4.14: Calor especı́fico dos sólidos como função da temperatura. dependência, CV ∝ T 3 ; para valores altos de T , o calor especı́fico é praticamente constante e igual a 3R(h) , para todos os sólidos. A esta constância do calor especı́fico a altas temperaturas dá-se o nome de Lei de Dulong e Petit. Vamos de seguida tentar explicar este comportamento do calor especı́fico, por aproximações sucessivas. 4.5.1 Modelo Clássico De acordo com o modelo que temos vindo a desenvolver, um sólido consiste num conjunto de átomos que podem oscilar em torno de posições de equilı́brio fixas nas posições que definem a sua estrutura cristalina. Aceitando que estes deslocamentos são pequenos, vimos já que podemos considerar cada átomo sujeito a forças elásticas. (h) R é a constante dos gases ideais, com o valor R = 8, 3144 J/K mol. R satisfaz a seguinte relação com a constante de Boltzman kB , e o número de Avogrado, NA ; R = kNA 4.5. O PROBLEMA DO CALOR ESPECÍFICO 61 Note-se que, para além de átomos “presos” às suas posições de equilı́brio, os sólidos podem também conter electrões práticamente livres no seu interior, de acordo com o modelo clássico dos metais. Esta possibilidade introduz um termo adicional na análise que vamos agora desenvolver, que não será tomada em linha de conta. Assim, o que se segue é válido apenas para sólidos isoladores, e o problema do calor especı́fico dos condutores será abordado mais adiante, no próximo capı́tulo destes apontamentos. Consideremos, então, cada átomo como um oscilador harmónico tridimensional. É bem sabido que um oscilador harmónico tridimensional se pode descrever como a reunião de três osciladores unidimensionais independentes. Podemos então, em resumo, tratar um sólido com N átomos como um conjunto de 3N osciladores harmónicos unidimensionais. Considerando o sólido em equilı́brio termodinâmico, todos estes osciladores devem ter a mesma energia média hεi. A energia total do sólido é então E = 3N hεi. (4.73) A energia de cada oscilador, ε, pode ser calculada recorrendo à fı́sica estatı́stica. A probabilidade de que um oscilador harmónico unidimensional, em equilı́brio termodinâmico com um ambiente à temperatura T , esteja num estado com energia compreendida entre os valores ε e ε + dε é dada pela lei de Boltzman: dP (ε) = f (ε)dε = Ae − k εT B dε, (4.74) onde kB é a constante de Boltzman(i) e A é uma constante de normalização, que deve ser ajustada por forma a que a soma das probabilidades seja unitária: Z ∞ dP (ε) = 1. (4.75) 0 Daqui resulta A= 1 . kB T (4.76) Podemos identificar a energia de cada oscilador no sólido com o calor expectável da energia, ou seja Z Z ∞ 1 − ε (4.77) hεi = f (ε)εdε = dε εe kB T . kB T 0 Este integral é facilmente resolvido por partes, obtendo-se hεi = kB T . (4.78) Substituindo este valor em (4.73), obtemos o valor total da energia do sólido: E = 3N kB T . (4.79) Refira-se que este resultado poderia ter sido obtido de forma equivalente usando o Teorema da Equipartição da Energia, de acordo com o qual cada termo quadrático na expressão da energia de um sistema de muitas partı́culas idênticas contribui com kB T /2 para a energia média do sistema em equilı́brio termodinâmico à temperatura T ; neste caso em que cada partı́cula do sistema é um oscilador harmónico, temos, por cada uma, seis termos quadráticos na energia, três para a energia potencial [k(x2 + y 2 + z 2 )/2] e outros três para a energia cinética [m(vx2 + vy2 + vz2 )/2], ou seja, uma contribuição de 6 × kB T /2 = 3kB T para a energia média do sistema. Uma (i) k B = 1, 381 × 10−23 J/K 62 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS vez que o número total de partı́culas é N , obtemos por multiplicação o resultado apresentado. Derivando agora a energia em ordem à temperatura obtemos o calor especı́fico, de acordo com a sua definição (4.72). Se considerarmos uma mole de átomos obtemos finalmente CV = 3NA kB T = 3R. (4.80) que está de acordo com a lei de Dulong e Petit mas não reproduz os resultados experimentais a baixas temperaturas. Este facto foi, durante algum tempo, argumento de peso contra a hipótese atómica da matéria, até que em 1907 Einstein propôs um tratamento diferente, em que as oscilações da rede cristalina são “quantizadas”, de forma semelhante à quantização do campo electromagnético efectuada por Plank no estudo da radiação do corpo negro. Em analogia com o termo “fotão”que se refere aos quanta do campo electromagnético, designam-se por “fonões”os quanta das oscilações mecânicas nos sólidos. Vamos de seguida seguir este formalismo. 4.5.2 Modelo de Einstein Em 1900, Plank verificou que o espectro de radiação térmica emitida pelos chamados corpos negros (corpos que absorvem toda a radiação electromagnética que neles incide) pode ser descrito com exactidão supondo que, na interacção entre a matéria e o campo electromagnético, só pode haver transferência de energia em quantidades múltiplas da unidade básica hν, onde h é a constante de Plank(j) e ν é a frequência envolvida no processo. Esta suposição era, na altura, completamente injustificável e foi considerada como um mero truque de “engenharia algébrica”por toda a comunidade cientı́fica, incluindo o próprio Plank, porque parecia indicar que a radiação electromagnética seria constituida por partı́culas. O debate sobre a natureza da luz (ondas ou partı́culas) vinha desde os tempos de Newton (partidário da Natureza corpuscular) e Huyghens (que apoiava a descrição ondulatória) e tinha, aparentemente, sido resolvido, experimentalmente, já no século XVIII, pelos trabalhos de Young e de Fresnel, a favor da hipótese ondulatória. O “truque”de Plank viria assim, caso fosse aceite como descrição de algo real, a baralhar (de novo) as cartas. Por esta razão, os fı́sicos acreditavam que, mais tarde ou mais cedo, um tratamento clássico do corpo negro seria elaborado, no qual a hipótese de Plank não fosse necessária, ou surgisse devidamente justificada no contexto da teoria ondulatória da radiação. Um dos poucos fı́sicos que não partilhavam esta opinião era Albert Einstein. Segundo Einstein, a radiação electromagnética é de facto constituida por partı́culas chamadas fotões com uma massa em repouso nula e com energia dada por hν, de acordo com a hipótese de Plank. No entanto, o carácter ondulatório da luz não é eliminado, até porque na própria expressão de energia, E = hν, está presente a frequência, ν, que é uma quantidade tipicamente ondulatória. Einstein compatibilizou estes aspectos aparentemente contraditórios interpretando estatisticamente o campo (ou função de onda) da radiação. Concretamente, Einstein propôs que a intensidade (caracterı́stica ondulatória) da radiação numa região do espaço é proporcional ao número de fotões nela presente. Com esta descrição da radiação, Einstein explicou quantitativamente os resultados das experiências sobre o efeito fotoeléctrico em 1905. Apesar deste sucesso, continuou relativamente isolado na defesa do carácter realista da hipótese de Plank, até ao ano 1922 em que Comptom expôs os seus trabalhos sobre a dispersão de electrões pela radiação, “encerrando”a questão a favor de Einstein. Para dar mais consistência à hipótese de Plank, Einstein tentou aplicá-la noutros domı́nios, nome(j) h = 6, 626 × 10−34 Js 4.5. O PROBLEMA DO CALOR ESPECÍFICO 63 adamente naquele que aqui mais nos interessa, o problema do calor especı́fico dos sólidos. Suponhamos que, tal como o campo electromagnético, também o campo dos deslocamentos dos constituintes de um sólido está quantizado, no sentido em que as trocas de energia mecânicas entre estes constituintes só são possı́veis em quantidades múltiplas de hν, onde ν é a frequência das oscilações com que estão animados. Esta suposição parece indicar a existência de uma partı́cula à qual se dá o nome de fonão que tem uma energia hν, e que é trocado entre os átomos do sólido, aumentando ou diminuindo a energia das suas oscilações. De acordo com esta hipótese, a energia mecânica de cada átomo já não pode ser considerada uma variável continua, antes tomando valores de um conjunto discreto, distanciados entre si de ~ω (k) (ver a Figura 4.15). O valor mı́nimo da energia, representado na Figura 4.15 por ε0 , E ε o+nhw ε o+3hw ε o+2hw ε o+ hw ε o= 1 hw 2 Figura 4.15: Nı́veis de energia de um oscilador quântico com frequência ω. obtém-se facilmente através de uma resolução quântica do oscilados harmónico (que continua a ser a nossa aproximação para os deslocamentos atómicos no cristal) e é dado por ε0 = 21 ~ω.. De que forma esta hipótese altera a descrição clássica do sólido? Vamos repetir o processo que seguimos para o modelo clássico. Consideremos 3N osciladores independentes, em equilı́brio termodinâmico à temperatura T . Supondo que todos estes osciladores têm a mesma frequência ω e a mesma energia, que identificamos com o valor expectável da energia de um oscilador quântico. A energia total do sólido é então, tal como em (4.73), E = 3N hεi. (4.81) A diferença principal entre o tratamento clássico consiste no cálculo da energia média hεi. Como a variável ε é, nesta abordagem, discreta, este cálculo não pode ser levado a cabo usando a Eq. (4.77). Continuando a aceitar a distribuição de probabilidade de Maxwell-Boltzmann, temos, neste caso, que a probabilidade de um oscilador estar no nı́vel de energia εn , 1 εn = (n + )~ω 2 é P (εn ) = Be−βεn . (4.82) onde se introduzir a notação, usual em fı́sica estatı́stica, β = 1/kB T , e B é uma constante de normalização escolhida de maneira a garantir que a soma de todas as probabilidades seja 1. A constante B é então determinada impondo ∞ X n=0 (k) ~ω = hν P (εn ) = 1, (4.83) 64 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS ou seja, ∞ X Be−βεn = 1, (4.84) n=0 e portanto 1 . −βεn n=0 e B = P∞ (4.85) O valor numérico desta constante não é um resultado particularmente interessante, mas pode facimente ser determinado. Usando a expressão da energia, o somatório no denominador em (4.85) pode ser escrito como ∞ X 1 e−βεn = e− 2 β~ω n=0 ∞ X (e−β~ω )n , (4.86) n=0 e o somatório no lado direito desta igualdade é uma série geométrica de razão x = e−β~ω < 1 . A série é pois convergente, e o seu valor é ∞ X 1 −βεn e n=0 e− 2 β~ω = . 1 − e−β~ω Substituindo este resultado em (4.85), obtemos " #−1 1 e− 2 β~ω B= . 1 − e−β~ω (4.87) (4.88) A probabilidade de se encontrar um oscilador quântico no n-ésimo nı́vel de energia εn é e−βεn P (εn ) = P∞ −βε . (4.89) n n=0 e e o valor médio da energia é calculado usando a definição de valor expectável de uma variável aleatória X hεi = P (εn )εn (4.90) n [compare com (4.77)]. Substituindo aqui (4.89) obtemos P∞ −βεn εn n=0 e hεi = P , ∞ −βε n n=0 e (4.91) onde o denominador em (4.89) foi posto em evidência na soma em (4.90). Note-se que o lado direito da Eq (4.91) é o simétrico da derivada em ordem a β, de X ln e−βεn e portanto escrevemos ∞ hεi = − X ∂ ln e−βεn , ∂β n=0 (4.92) e o somatório que serve de argumento ao logaritmo foi calculado em (4.87). Resulta então à ! 1 e− 2 β~ω ∂ ln hεi = − ∂β 1 − e−β~ω ¸ · ¢ ¡ ∂ 1 −β~ω = − . (4.93) − β~ω − ln 1 − e ∂β 2 4.5. O PROBLEMA DO CALOR ESPECÍFICO 65 Efectuando a derivada em ordem a β, obtemos 1 ~ωe−β~ω ~ω + 2 1 − e−β~ω ~ω 1 ~ω + β~ω . 2 e −1 hεi = = (4.94) A energia total do sólido é então segundo (4.81) µ ¶ ~ω 1 E = 3N ~ω + β~ω 2 e −1 (4.95) e o calor especı́fico obtém-se derivando esta igualdade em ordem à temperatura, eliminando-se assim a constante 3N ~ω/2, µ ¶ ∂E CV = ∂T V µ ¶ ∂β ∂E = ∂T ∂β V 3N eβ~ω 2 (~ω) 2. kB T 2 (eβ~ω − 1) = (4.96) É usual a introdução da chamada temperatura de Einstein, que é o factor constante definido por ~ω θE = , (4.97) kB em termos da qual o calor especı́fico resulta θE µ ¶2 θE eT CV = 3R (4.98) ´2 , ³ θ E T e T −1 assumindo que o número de átomos N é igual ao número de Avogrado NA . A Figura 4.16 apresenta o gráfico do calor especı́fico, dividido por 3R. É evidente que o comportamento desta função a altas temperaturas é o esperado µ ¶ CV −→ 1 ⇐⇒ (CV )T →∞ −→ 3R 3R T →∞ e que o limite para baixas temperaturas é também o correcto CV T →0 −→ 0. Podemos verificar estes resultados analiticamente. Quando T → ∞, θE /T → 0. O argumento das exponenciais é então pequeno e podemos por isso substitui-las pelos seus desenvolvimentos em série de Taylor, mantendo apenas os termos mais significativos. Isto é, podemos em (4.98) fazer a substituição e θE T para T elevado. Obtemos então µ CV ' 3R θE T ¶2 "µ ' 3R + 3R ' 3R, θE , T '1+ µ θE T T θE ¶ ¶2 T + θE # 66 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS CV (T) /3R 1 0.8 0.6 0.4 0.2 0 0 0.5 1 1.5 2 2.5 T/θE Figura 4.16: O calor especı́fico dos sólidos no modelo de Einstein. no limite quando T → ∞, de acordo com a lei de Dulong e Petit. No limite oposto, em que T → 0, o argumento das exponenciais θE /T é muito grande, e também as exponenciais o são. Podemos então desprezar, no denominador de (4.98), a unidade. Resulta então µ ¶2 θE θE (4.99) CV ' 3R e− T . T À medida que T se aproxima de zero, θE /T cresce, e a exponencial tende para zero. A diminuição do valor da exponencial “vence”o crescimento do termo (θE /T )2 e o limite do produto é zero, de acordo com o gráfico na Figura 4.16. Estes resultados estão em melhor acordo com os dados experimentais, apoiando assim as ideias quânticas de Einstein. No entanto, o comportamento do calor especı́fico para baixas temperaturas [expresso em (4.99)] não verifica a proporcionalidade, verificada experimentalmente, com o cubo da temperatura. A origem desta discrepância reside na suposição que os 3N osciladores têm a mesma frequência ω, ou seja, que são independentes. Se incluirmos a possibilidade de correlação nos movimentos dos osciladores, isto é, considerando modos colectivos de movimento, esta discrepância é resolvida. Este é o ponto de partida para o modelo de Debye, que vamos passar a estudar. 4.5.3 Modelo de Debye No modelo de Einstein, supõe-se que cada átomo oscila independentemente dos restantes. Cada um destes átomos encontra-se em equilı́brio térmico com o ambiente à temperatura T = (kB β)−1 e portanto é natural que todos tenham o mesmo tipo de movimento, e logo a mesma frequência. No entanto, já sabemos que os movimentos dos átomos num cristal não são independentes: o movimento dum átomo afecta o dos seus vizinhos, que, por sua vez, afectam o de outros átomos, até que por fim todos os átomos são influenciados. O modelo de Einstein é assim uma aproximação, justificável (ou não) conforme o problema em estudo, e rigor pretendido. Vamos agora abordar o problema com maior generalidade, considerando os “movimentos colectivos”do cristal. Um exemplo de movimentos colectivos é o dos deslocamentos relacionados com a propagação do som nos cristais, que já foram estudados 4.5. O PROBLEMA DO CALOR ESPECÍFICO 67 nas secções 4.2 e 4.2.1. Os formalismos aı́ apresentados podem ser aplicados aqui, considerando (mais uma vez) desenvolvimentos em série de Fourier dos deslocamentos sofridos por cada átomo. Consideramos os movimentos atómicos como uma sobreposição de ondas monocromáticas, de frequência ω e vector de onda k que, seguindo o trabalho de Debye, satisfazem a relação de dispersão das ondas de som em meios contı́nuos isotrópicos, ω = vf |k| . (4.100) A energia total de um cristal não é, neste caso, dada por E = 3N ε̄(ω) como no modelo de Einstein, porque estão presentes várias frequências. Devemos antes calcular a energia do cristal somando a energia de cada um dos modos de vibração presentes no desenvolvimento em série de Fourier dos deslocamentos atómicos. Mas cada modo de vibração, com uma dada frequência, tem a energia média igual à do oscilador harmónico quântico unidimensional que “oscile”com essa frequência, energia essa dada por (4.94). A energia total do sólido pode então ser calculada como X E= ni ε̄(ωi ), (4.101) ωi onde ni é o número de onda planas monocromáticas com frequência ωi presentes no desenvolvimento em série de Fourier dos deslocamentos atómicos, e ε̄(ω) é a sua energia. As frequências permitidas formam um conjunto discreto (e daı́ o somatório em (4.101), de acordo com o estudo na secção anterior). Para cristais tı́picos, no entanto, as frequências permitidas estão tão próximas umas das outras que podemos, para simplificar os cálculos, aproximar o somatório em (4.101) a um integral. O número de frequências ω pode ser calculado recorrendo à função de densidade de modos de vibração, g(ω). Obtemos então a seguinte expressão para a energia, E, de um cristal à temperatura T : Z ωD E= dω g(ω)ε̄(ω). (4.102) 0 O limite superior de integração ωD deve ser finito, pois substituindo g(ω) e ε̄(ω) pelas suas expressões obtemos em (4.102) um integral que, com ωD → ∞, é divergente. Antes de prosseguirmos, vamos determinar o valor de ωD . Um cristal com N átomos é um sistema com 3N graus de liberdade, que são as 3N componentes das posições de todos os átomos que o formam. Podemos, numa abordagem microscópica, indicar o deslocamento de cada um dos átomos, através do valor das 3N quantidades ux1 (t) ux2 (t) · · · uxN (t) uy1 (t) uy2 (t) · · · uyN (t) uz1 (t) uz2 (t) · · · uzN (t) Por exemplo, uyk representa a componente y do deslocamento do k−ésimo átomo relativamente à sua posição de equilı́brio, (Xk , Yk , Zk ), no instante t. Ao fazermos um desenvolvimento em série de Fourier dos deslocamentos, defi- 68 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS nimos três funções ux (r, t), uy (r, t) e uz (r, t), da forma X ux (r, t) = Ax (k)ei(k·r−ωt) k uy (r, t) = X Ay (k)ei(k·r−ωt) k uz (r, t) = X Az (k)ei(k·r−ωt) . (4.103) k onde Ax , Ay e Az são os coeficientes do desenvolvimento em ondas planas. As componentes do deslocamento de cada um dos átomos são, nesta descrição, os valores que estas funções tomam, quando calculadas na sua posição de equilı́brio, por exemplo ux1 (t) = ux (R1 , t). Nesta descrição por ondas planas monocromáticas, os graus de liberdade são os coeficientes Ax (k), Ay (k) e Az (k) dos desenvolvimentos em (4.103). Evidentemente, não podem ser necessárias, nesta abordagem, mais graus de liberdade que os usados na descrição macroscópica que usa as 3N funções do tempo ukα (t) (com α = x, y, z). Ora seja, o número de modos de vibração usados numa descrição o mais detalhada possı́vel dos deslocamentos atómicos deve ser igual a 3N , o que matematicamente é expresso através de X ni = 3N, (4.104) ωi onde n1 tem o significado que lhe foi atribuı́do em (4.101). A frequência de Debye, ωD , que aparece em (4.102) é determinada de forma a assegurar que o número de graus de liberdade macroscópicos (número de ondas planas permitidas) é igual ao número de graus de liberdade microscópicos (3 vezes o número de átomos), como acabou de ser discutido. Substituindo o somatório em (4.104) por um integral [como na passagem de (4.101) para (4.102)] obtemos Z ωD dωg(ω) = 3N. (4.105) 0 Substituindo aqui a densidade de modos de vibração deduzida na Secção 4.4, obtemos N 3 ωD = 6π 2 vf 3 . (4.106) V Podemos agora retomar o cálculo da energia do cristal. Substituindo em (4.102) a densidade de estados g(ω) e a energia média em função de ω resulta µ ¶ Z ωD 1 ~ω 3V 1 dω ~ω + ω2 . (4.107) E= 2π 2 vf 3 0 2 eβ~ω − 1 O calor especı́fico é a derivada desta expressão em ordem à temperatura. O primeiro termo no integral, ~ω 3 /2, é uma constante e logo não contribui para esta derivada. Temos então ¶ µ ¶ µ 1 ∂E ∂E =− 2 CV = ∂T V kT ∂β V Z ωD 3V 1 1 ∂ ~ω 3 = − 2 3 dω 2π vf kT 2 ∂β 0 eβ~ω − 1 Z ωD 3V 1 ~2 ω 4 eβ~ω = dω (4.108) 2. 3 2 2 2π vf kT 0 (eβ~ω − 1) 4.5. O PROBLEMA DO CALOR ESPECÍFICO 69 Fazendo a mudança de variável x = β~ω, usando (4.106) e introduzindo a chamada temperatura de Debye ~ωD θD = , kB resulta µ CV = 9kN T θD ¶3 Z θD T dx 0 x4 ex (ex − 1) 2. (4.109) Finalmente, usando a relação entre as constantes de Boltzman k, dos gases perfeitos R e a de Avogrado NA , obtemos µ CV = 9R T θD ¶3 Z θD T dx 0 x4 ex 2. (ex − 1) (4.110) Esta expressão ajusta-se bem aos resultados experimentais. Em particular, o seu comportamento assimptótico, nos limites T → ∞ e T → 0, é o esperado. Com efeito, no limite T → ∞, o limite superior do integral em (4.109) é muito pequeno. Logo o argumento das exponenciais, x < θD /T também é pequeno e podemos por isso usar o desenvolvimento ex ' 1 + x. Obtemos então µ CV ' 9R µ ' 9R T θD T θD ¶3 Z θD T dx x2 (1 + x) 0 ¶3 Z θD T dx x2 , (4.111) 0 que é válido no limite θD /T ' 0. Resolvendo este integral, obtemos CV = 3R, (4.112) como esperado. Por outro lado, no limite oposto, em que T → 0, o limite superior do integral em (4.110) tende para infinito. Podemos então escrever µ CV ' 9R T θD ¶3 Z ∞ dx 0 x4 ex (ex − 1) 2 (4.113) O integral em x é agora uma constante(l) , de forma que o calor especı́fico apresenta, para baixas temperaturas, o comportamento observado experimentalmente de proporcionalidade com T 3 . A figura apresenta valores do calor especı́fico em função da temperatura adimensional, isto é, θE /T para o modelo de Einstein e θD /T para o modelo de Debye. Apesar de mais convincente, o modelo de Debye é ainda apenas uma aproximação. Com efeito, a relação de dispersão usada não é válida nos cristais, pelo menos para pequenos comprimentos de onda. Um estudo mais correcto (mas bastante complicado) usaria uma densidade de modos de vibração baseada na relação de dispersão das ondas mecânicas em cristais. A análise do caso unidimensional é proposta como o problema; aparte esta situação, um tratamento mais rigoroso do modelo de Debye ultrapassa o nı́vel destas notas. (l) desta informação não ser particularmente relevante para esta discussão, o seu valor é R ∞ Apesar 4 x x −2 dx = 4π 4 /15. 0 x e (e − 1) 70 CAPÍTULO 4. VIBRAÇÕES EM CRISTAIS 25 Debye -1 CV (T)/JK mol -1 20 Einstein 15 10 5 0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 T/θ Figura 4.17: Calor especı́fico dos sólidos segundo o tratamento de Einstein e o de Debye. PROBLEMAS 4.1 (a) Deduza a densidade de modos de vibração para um meio contı́nuo isotrópico tridimensional em que a velocidade de polarização longitudinal é diferente da transversal, e indique (em função destes) qual seria a frequência máxima de oscilação associada aos osciladores harmónicos no modelo de Debye. (b) Determine a temperatura de Debye para o alumı́nio, sabendo que as velocidades de polarização longitudinal e transversal das ondas acústicas no meio são vL = 6374 m/s e vT = 3111 m/s respectivamente. Considere a densidade do alumı́nio de 6, 02 × 1028 átomos por metro cúbico. (c) Usando a tabela abaixo, determine a temperatura de Einstein e de Debye do alumı́nio a partir do valor experimental de Cv = 13, 0 J K−1 mol−1 obtido à temperatura de 100 K. Os valores apresentados estão expressos em unidades T SI, como função da temperatura adimensional Θ segundo o modelo de Einstein e de Debye. 25 T /Θ ∞ 1,000 0,500 0,333 0,250 0,200 0,167 0,143 0,125 0,111 0,100 0,067 0,050 0,040 0,020 0,010 20 Debye Einstein Cv 15 10 5 0 0.2 0.4 0.6 0.8 (E) Cv 24,94 23,75 20,59 16,53 12,55 9,20 6,63 4,76 3,45 2,53 1,89 0,58 0,24 0,12 0,00 0,00 (D) Cv 24,94 22,96 18,06 12,38 7,58 4,26 2,24 1,12 0,54 0,25 0,11 0,00 0,00 0,00 0,00 0,00 1 Temperatura adimensional 4.2 Como pode justificar o baixo valor do calor especı́fico do diamante à temperatura ambiente? 4. Problemas 71 4.3 É possı́vel fazer um modelo das vibrações longitudinais de uma cadeia de polietileno, −CH = CH − CH = CH − CH =, considerando uma cadeia de massas idênticas, m, ligadas por molas de constantes alternadas α1 e α2 , conforme ilustrado na figura seguinte. d a α1 α2 α1 α2 Demonstre que a relação de dispersão desta cadeia é dada por 2 α1 + α2 4 ω2 = 1± m s 4α1 α2 sin2 ka 2 1− (α1 + α2 )2 3 5 , onde a é comprimento do padrão molas/átomos que se repete na cadeia. Sugestão: Assuma soluções do tipo un = Aei(kXn −ωt) para átomos entre molas de constante α1 e α2 e u0n = A0 ei(kXn −ωt) para átomos entre molas de constante α2 e α1 respectivamente. 4.4 Considere uma cadeia linear monoatómica de separação interatómica a e de N átomos. Considerando apenas interacções com os átomos vizinhos mais próximos, demonstre que a densidade de modos de vibração é dada por: g(ω) = 2N √ , π ωm 2 − ω 2 onde ωm representa a frequência máxima de vibração permitida. 4.5 Obtenha a expressão para o calor especı́fico molar de uma cadeia de N átomos idênticos e comprimento L, que só pode oscilar longitudinalmente, segundo o modelo de Debye. (a) Determine uma expressão para o calor especı́fico para baixas temperaturas. (b) Esboce um gráfico para o calor especı́fico deduzido na alı́nea anterior indicando como chegou aos valores limites respectivos. (c) Determine uma expressão para o calor especı́fico usando a relação de dispersão deduzida no problema anterior. Verifique o limite para o calor especı́fico apenas para altas temperaturas. Capı́tulo 5 Metais I: modelos de electrões livres No universo dos sólidos os metais têm uma importância prática especial. As suas propriedades tornaram-nos particularmente úteis num grande número de aplicações, ao longo de parte importante da história da humanidade. O estudo dos metais tem pois um grande interesse, na área mais geral da fı́sica dos sólidos. Entre as muitas propriedades interessantes dos metais, podemos referir: baixos pontos de fusão; grandes condutividades eléctricas e térmicas; altas densidades de massa; grande resistência estrutural; boa reflectividade óptica. Vamos agora passar à descrição de algumas destas propriedades a partir dos princı́pios da fı́sica. O facto de os metais conduzirem bem calor e electricidade leva-nos a pensar que alguns dos electrões dos átomos que os constituem se podem deslocar grandes distâncias no seu interior, quando comparadas com as distâncias interatómicas tı́picas. Neste capı́tulo, vamos estudar estes electrões como sendo livres, isto é, supondo que as interacções que sofrem (com outros electrões de condução e com os iões que formam a rede cristalina) são tais, e de tal forma distribuı́das, que, em média, se cancelam. 5.1 Introdução As ligações quı́micas entre dois (ou mais) átomos são estabelecidas por deformação das nuvens electrónicas desses átomos. Evidentemente, esta deformação é mais pronunciada nos estados electrónicos mais fracamente ligados a cada um dos átomos, de tal forma que podemos dizer (cometendo um erro que, na esmagadora maioria das aplicações, é desprezável) que apenas estes estados participam na ligação. Aos electrões que ocupam estes estados dá-se o nome de electrões de valência. Nos metais, a ligação quı́mica envolve normalmente um grande número de átomos (1020 , ou mais) e esta deformação das camadas exteriores da nuvem electrónica de cada átomo é particularmente pronunciada, ficando distribuı́das por toda a extensão do metal. Os electrões que ocupam estas camadas podem assim mover-se ao longo de distâncias com ordem de grandeza macroscópica. Um cristal metálico consiste pois num arranjo periódico de iões positivos, imerso num “gás” de electrões. Naturalmente, os electrões interagem uns com os outros e com os iões da rede, mas podemos supor que as forças que sentem, estando mais ou menos distribuı́das em todas as direcções, se cancelam globalmente, sendo nula a sua resultante. Esta aproximação, apesar de claramente grosseira, permite, como veremos, obter alguns resultados em bom acordo com os factos experimentais, pelo menos a nı́vel qualitativo. 73 74 5.2 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES O modelo de Drude-Lorentz O modelo de Drude-Lorentz consiste na descrição clássica do gás de electrões livres. Usando a fı́sica clássica, este gás assemelha-se bastante a um gás perfeito. As diferenças principais residem na alta densidade (num metal há, tipicamente 1022 electrões por cm3 ) e no facto de os electrões se moverem num cristal, podendo sofrer colisões com os iões que formam o cristal. No modelo de Drude-Lorentz (de facto são dois modelos, mas a única diferença entre eles consiste apenas num pormenor técnico do tratamento estatı́stico) tratam-se então os electrões deslocalizados como um gás de electrões livres, em equilı́brio termodinâmico com o ambiente. Sendo os electrões livres, a sua energia é totalmente cinética. Usando métodos estatı́sticos, podemos calcular a energia total do gás de electrões e a partir daı́ várias propriedades mensuráveis experimentalmente dos metais, como o calor especı́fico, o módulo de compressibilidade, etc. O confronto dos resultados que obtivermos com os valores experimentais servirá para a avaliação das qualidades do modelo. 5.2.1 O calor especı́fico dos metais No quadro desta descrição dos electrões de condução, a energia de um sólido condutor é E = Ecr + Ee , (5.1) onde Ecr é a energia do cristal de iões, que pode ser avaliada com os métodos estudados no capı́tulo anterior, e Ee é a energia do gás de electrões de condução. A energia tem esta expressão simples porque consideramos os electrões livres e portanto sua energia de interacção com o cristal é uma constante (que pode não ser considerada), cujo único efeito observável é o de manter o gás de electrões confinado no interior do metal. A energia dos electrões de condução é puramente cinética uma vez que se consideram livres. De acordo com o teorema da equipartição da energia, a energia média de um conjunto de Q electrões de condução é pois Q × 3 × kB T /2 = 3QkB T /2. Consideremos um sólido com N átomos e seja u o número de electrões que cada átomo fornece para a ligação quı́mica. Temos então Q = N u a energia média da nuvem electrónica fica então Ee = 3 uN kB T. 2 (5.2) A energia total da amostra considerada é 3 E = Ecr + uN kB T, 2 (5.3) e o calor especı́fico do metal vem 3 CV = CVcr + uN kB . 2 (5.4) Para altas temperaturas, CVcr = 3R, como vimos no capı́tulo anterior. Relembrando que R = NA kB , resulta u (5.5) CV = 3(1 + )R. 2 Concluimos então que, de acordo com este modelo, os metais apresentam um calor especı́fico cujo valor é igual a 9/2R para os metais monovalentes, 6R para os bivalentes, etc. Este resultado, o primeiro que obtivemos com este modelo, está em desacordo flagrante com os resultados experimentais. De facto, o calor especı́fico dos metais 5.2. O MODELO DE DRUDE-LORENTZ 75 tem, a altas temperaturas, o valor definido pela lei de Dulong e Petit, ou seja 3R. Veremos mais adiante que esta deficiência do modelo pode ser resolvida analisando quanticamente as propriedades do gás de electrões. 5.2.2 A lei de Ohm A diferença de potencial entre as extremidades de um condutor é proporcional à corrente que o atravessa. Este é o enunciado da bem col nhecida lei de Ohm. Consideremos um condutor filiforme com comprimento l e secção transversal de área S, percori S rido por uma corrente i (ver a figura). A lei de Ohm pode então escrever-se como ∆V = Ri, (5.6) onde ∆V é a diferença de potencial entre as extremidades do condutor e R, a chamada resistência do condutor, é a constante da proporcionalidade referida acima. Multiplicando ambos os membros de (5.6) por 1/(lS) e notando, por um lado, que o campo eléctrico no interior do condutor, E, tem um módulo dado por E = ∆V /l, e por outro que a densidade de corrente j é, por definição de corrente, j = i/S, obtemos l E. (5.7) j= SR À constante σ = l/(SR) dá-se o nome de condutividade (a) . Deduzimos desta maneira a forma local da lei de Ohm, j = σE. (5.8) A lei de Ohm tem um aspecto que, à primeira vista, pode parecer perturbador. É que a força exercida pelo campo eléctrico sobre os electrões vale −eE, onde e é o módulo da carga do electrão; assim, o lado direito da equação (5.8) é proporcional à força que actua sobre os electrões. Por outro lado, a densidade de corrente j é dada por j = ρl ṽ (5.9) onde ρl é a densidade de carga livre e ṽ é a velocidade média das cargas, neste caso, dos electrões; o lado esquerdo de (5.8) é então proporcional à velocidade dos electrões. Mas então a equação (5.8) traduz uma proporcionalidade entre a velocidade dos electrões e a força que neles actua, em contradição aparente com o previsto pela segunda lei de Newton(b) (força proporcional à aceleração). De facto, esta situação não constitui um paradoxo, e é até relativamente frequente na natureza. Por exemplo, o movimento de queda de um paraquedista é, segundos após o pára-quedas se abrir, uniforme (e não uniformemente acelerado) e o valor da velocidade é tanto maior quanto maior for o peso do paraquedista, ou seja, quanto maior for a força que o impele para o solo. Neste exemplo (e noutros que poderiam ser citados) está presente, para além da força mais directamente responsável pelo movimento (a força gravı́tica), uma resistência ao movimento por parte do meio onde ele se realiza. No caso dos electrões nos condutores esse meio é (a) A condutividade é o inverso da resistividade, e ambos os parâmetros são uma medida da qualidade intrı́nseca (isto é, independente de factores geométricos) dos materiais como suportes da condução eléctrica — Um material (como o cobre, por exemplo) com uma elevada condutividade, ou baixa resistividade, é um bom condutor de electricidade, mesmo que uma amostra concreta desse material (por exemplo, um fio muito longo e/ou muito fino) apresente um grande valor da resistência eléctrica. (b) Note-se que, num tratamento clássico como o presente, as leis da mecânica de Newton devem ser consideradas válidas. 76 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES o cristal. No seu movimento no cristal, os electrões podem por vezes sofrer colisões com com os iões que o formam, comunicando-lhes parte da energia cinética que obtiveram sob acção do campo. Tentemos descrever quantitativamente este processo. Consideremos o movimento dos electrões que formam o gás em equilı́brio termodinâmico na ausência, para já, de campos eléctricos aplicados. A uma temperatura T 6= 0, a energia cinética média dos electrões, correspondente ao movimento caótico de agitação térmica, dada pelo teorema de equipartição da energia de Boltzmann, tem o valor de ε = 3kB T /2. A média dos módulos das velocidades, ṽ0 , dos electrões que compõem a nuvem condutora nos metais é pois r 3kB T ṽ0 = , (5.10) me onde me é a massa electrónica; à temperatura ambiente T ≈ 300 K, ṽ ≈ 1, 2 × 105 m/s. O movimento correspondente à agitação térmica é pois muito rápido. No entanto, o sentido do movimento de cada electrão é totalmente aleatório e, por isso, a média vectorial das velocidades dos electrões é nula. Assim, este movimento de agitação térmica não se traduz na presença de uma corrente eléctrica mensurável. Vejamos agora o que acontece quando se estabelece um campo eléctrico no interior do condutor. Cada electrão passa a sentir uma força F e = −eE, na mesma direcção mas de sentido oposto ao campo eléctrico, e portanto adquire um movimento uniformemente acelerado (com a = −eE/me ), mas apenas entre duas colisões sucessivas. Seja τ o intervalo de tempo médio que separa duas colisões de um dado electrão(c) . Em equilı́brio, esta situação é equivalente aos electrões de condução possuirem uma velocidade de condução comum (ver a Figura 5.1). A velocidade E=0 E deslocamento electrónico (b) (a) Figura 5.1: Esquema do precurso de um electrão. (a) Os electrões apresentam movimentos aleatórios com velocidade vectorial média nula; (b) sob a acção de um campo eléctrico, os electrões ficam animados de um movimento uniformemente acelerado entre duas colisões sucessivas, que tendem a restaurar a aleatoriedade na direcção do vector velocidade. Esta situação é equivalente a um movimento colectivo com uma velocidade de condução correspondente ao deslocamento electrónico representado. média dos electrões é então ṽ = ṽ 0 + −eE τ, me (5.11) onde ṽ 0 é a velocidade inicial (imediatamente após uma colisão) média. Ora, a velocidade dos electrões após uma colisão está distribuı́da uniformemente em todos (c) São frequentes as designações de “tempo de relaxação”, “tempo de colisão”, “tempo médio de vida livre”, entre outras, para o parâmetro τ . 5.2. O MODELO DE DRUDE-LORENTZ Metal Li Na Cu Au n (m−3 ) 4,7×1028 2,7×1028 8,5×1028 5,9×1028 σ(Ω−1 m−1 ) 1,1×107 2,1×107 5,8×107 4,5×107 77 τ (s) 8,3×10−15 2,8×10−14 2,4×10−14 2,7×10−14 Tabela 5.1: Densidades electrónicas n (em m−3 ) e condutividades eléctricas (em Ω−1 m−1 ) a 295 K (de Kittel, “Introduction to Solid State Physics”) e tempo de relaxação para o lı́tio, o sódio, o cobre e o ouro. os sentidos, de forma que a sua média vectorial, ṽ 0 , é nula. A velocidade média dos electrões sob a acção do campo eléctrico é pois ṽ = −eE τ. me (5.12) Multiplicando a velocidade média que acabámos de obter pela densidade de carga de condução, ρl = −ne, (5.13) onde n é a densidade de electrões de condução, obtemos a densidade de corrente eléctrica, ne2 τ j= E. (5.14) me Mas esta equação tem a forma da lei de Ohm (5.8), com a condutividade eléctrica dada por ne2 τ σ= . (5.15) me Podemos estimar o tempo de relaxação de um metal usando valores tabelados da condutividade eléctrica e da densidade electrónica. A Tabela 5.1 apresenta alguns valores. O tempo de vida livre dos electrões nos metais é, como podemos verificar a partir da Tabela 5.1, extremamente curto. Durante um intervalo de tempo tão pequeno, a variação no módulo da velocidade dos electrões provocada pela acção de campos eléctricos tı́picos (de alguns volts por metro) é, certamente pequena. Podemos pois considerar que o valor do módulo da velocidade dos electrões é, em média, o calculado a partir do princı́pio de equipartição da energia, ṽ ≈ 105 m/s. Durante um intervalo de tempo τ ≈ 10−14 s, os electrões percorrem uma distância(d) de cerca de 10−9 m= 10 Å, que é da ordem de grandeza das distâncias interatómicas. Este resultado apoia a suposição de Drude de que os electrões sofrem colisões com os iões. De acordo com o princı́pio de equipartição da energia, o valor médio do módulo da velocidade de agitação térmica, ṽ, diminui com a temperatura. Supondo que o caminho médio livre, λ̃, não depende fortemente da temperatura, o tempo de relaxação, τ = λ̃/ṽ, deve crescer com a diminuição da temperatura. Assim, concluimos que a condutividade dos metais depende da temperatura de acordo com ne2 λ̃ . (5.16) 3me kT Ou seja, a condutividade dos metais é maior a baixas temperaturas, o que de facto se verifica experimentalmente, com a excepção de uma classe importante (em vista das aplicações industriais) de materiais — os semi-condutores. σ=√ (d) Esta distância tem a designação habitual de “caminho médio livre”. 78 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES Devemos reconhecer agora que este acordo com resultados experimentais é, apenas, qualitativo, já que, para a maioria dos metais, a condutividade depende da temperatura de forma mais pronunciada do que a patente na Eq. (5.16). 5.2.3 O efeito de Hall O efeito de Hall consiste no aparecimento de um campo eléctrico transversal num condutor percorrido por corrente numa região onde está definido um campo magnético. É frequentemente usado para medir a intensidade de campos magnéticos estáticos. Na Figura 5.2 representa-se um circuito formado com uma placa metálica i - FM v EH B + + + + + + Figura 5.2: Esquema da montagem usada para demonstrar o efeito de Hall. (à direita na figura), numa região onde está definido um campo magnético B, perpendicular ao plano da placa condutora. A velocidade dos electrões (oposta ao sentido da corrente) está representada na figura como v. Ao moverem-se numa região onde está definido um campo magnético, os electrões sentem uma força F M , dada por F M = −ev × B, (5.17) e como tal, sofrem uma aceleração para a esquerda (na figura), acumulando-se assim carga de sinal negativo deste lado da placa. Em contrapartida, no lado direito sente-se um defeito de carga de sinal negativo, ou seja, o lado direito fica carregado positivamente. Em resultado desta assimetria na distribuição de carga, no interior da placa metálica estabelece-se um campo eléctrico E H , chamado campo de Hall. Atinge-se uma situação estacionária quando a força eléctrica, F H = −eE H , for igual (e, claro, oposta) à força magnética, ou seja quando −eEH = −evB. (5.18) Usando (5.13), obtemos a condição de estacionaridade EH = − 1 jB. ne (5.19) A constante −1/(ne) tem o nome de constante de Hall. O seu valor negativo reflecte o facto de os transportadores de carga nos metais serem electrões, com carga de sinal negativo. É relativamente simples medir experimentalmente o valor da constante de Hall, e esperaria-se, à luz deste modelo, obter sempre valores negativos. Ora, estranhamente, alguns metais apresentam valores positivos para a constante de Hall. Alguns exemplos são os estabelecidos pelo cádmio, o zinco, o berı́lio e o magnésio. 5.2.4 Efeitos termoeléctricos Consideremos um metal no qual se estabelece um gradiente de temperatura. Para concretizar a discussão, imaginemos que aquecemos com uma chama a extremidade de uma barra de cobre, e mergulhamos a outra num banho gelado (ver a Figura 5.3). Uma vez que os electrões de condução da extremidade quente têm maior energia 5.2. O MODELO DE DRUDE-LORENTZ T1 79 T2 T1 T2 v + + + T1 > T2 ET - Figura 5.3: Esquema da montagem para o estabelecimento de um gradiente de temperatura num metal (esquerda) e o campo eléctrico, E T , resultante desse gradiente. cinética do que os da extremidade fria, deve verificar-se, durante alguns instantes, um fluxo lı́quido de electrões daquela extremidade para esta. Evidentemente, o acumular de electrões na extremidade fria, com a consequente carga positiva resultante na extremidade quente, define, no interior do metal, um campo eléctrico que contraria a continuação indefinida deste processo. Atinge-se, então, um estado de equı́librio dinâmico, em que no interior do metal está definido um campo eléctrico que se manifesta como uma diferença de potencial entre as duas extremidades, sendo a mais quente a de potencial mais elevado. Este fenómeno tem o nome de efeito de Seebeck. Outro efeito termoeléctrico interessante manifesta-se nos pontos de contacto de dois metais com densidades de electrões de condução diferentes. Numa junção de dois metais diferentes, verifica-se, naturalmente, um processo de difusão dos electrões de condução do metal com maior concentração electrónica para o outro. Mas, assim, aquele metal fica com deficiêcia de electrões, ou seja, carregado positivamente. Inversamente, o metal que recebe o fluxo electrónico deste processo de difusão fica carregado positivamente (ver a Figura 5.4). Mais uma vez, o campo A nA Vc ++ − − + + − −e nA > nB V nB Vc A B Figura 5.4: Potencial de contacto na junção de dois metais com diferentes concentrações electrónicas nA e nB e gráfico (à direita) do potencial electrostático na zona da junção. eléctrico criado por esta redistribuição de cargas contraria a sua contiuação indefinida, estabelecendo-se um estado de equilı́brio dinâmico em que o gradiente da concentração electrónica (que favorece a continuação do processo de difusão) é compensado pelo campo eléctrico resultante. Chama-se potencial de contacto à diferença de potencial associada a este campo eléctrico. A grandeza do potencial de contacto depende das concentrações de carga resultantes deste processo de migração electrónica. Ou seja, o potencial de contacto é tanto maior quantos mais electrões tiverem sido difundidos do metal com maior concentração electrónica para o outro. Ora, quanto maior a temperatura, maior a energia cinética média dos electrões de condução, logo, maior o número de electrões com energia suficiente para ultrapassarem a barreira de potencial na junção. Ou seja, quanto maior a temperatura, maior o potencial de contacto na junção dos dois metais. Este efeito é aproveitado para a construcção de termómetros, chamados termómetros de termopar. Um esquema simplificado da construcção destes termómetros encontra-se representado na Figura 5.5. Basicamente, estes termómetros consistem num circuito constituido por dois ramos de metais diferentes. Nas duas junções (A e 80 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES VA B A C V D VB Figura 5.5: Termómetro de termopar. A tensão indicada pelo voltı́metro depende da diferença de temperatura das duas juções A e B. B, no esquema da figura) estabelecem-se potenciais de contacto diferentes se as suas temperaturas forem diferentes. Uma das junções deve ficar a uma temperatura conhecida, por exemplo, mergulhada em água gelada, ao passo que a outra é utilizada como sensor. Fica então definida uma força electromotriz no circuito, igual à diferença entre os dois potenciais de contacto, que é uma função crescente da diferença entre as temperaturas das duas junções. Esta força electromotriz é medida usando um voltı́metro, que interrompe um dos condutores, sendo necessário ter o cuidado, na utilização do termómetro, de assegurar que as duas junções para a ligação do voltı́metro (indicadas pelas letras C e D na figura) estão à mesma temperatura, para que se cancelem os seus potenciais de contacto. A existência do potencial de contacto na junção de dois metais diferentes tem ainda outro efeito interessante. Quando uma corrente atravessa a junção, as cargas que a compõem sofrem uma variação de energia, igual ao produto da sua carga pelo valor do potencial de contacto. Essa variação de energia, que numa junção é um aumento, na outra uma diminuição de energia, é fornecida ou absorvida pelo meio ambiente. Este fenómeno tem o nome de efeito de Peltier. Assim, um circuito constituido por dois metais diferentes no qual se estabelece uma corrente, funciona efectivamente como uma máquina térmica, absorvendo calor numa das junções e libertando-o na outra. 5.3 Balanço do modelo de Drude Estudámos algumas propriedades dos metais à luz de uma teoria clássica de electrões livres. Muitas outras caracterı́sticas poderiam ter sido estudadas, por exemplo, a condutividade térmica. Não o fizemos porque estamos já em condições de avaliar o modelo. O modelo permite explicar qualitativamente a lei de Ohm e a dependência da condutividade com a temperatura, bem como alguns efeitos termoeléctricos, nomeadamente o de Seebeck e o de Peltier, mas falha redondamente no que concerne ao calor especı́fico da nuvem electrónica. Não consegue descrever o comportamento dos semi-condutores, cuja condutividade aumenta com a temperatura, em geral. Não consegue, também, dar conta dos valores positivos para o coeficiente de Hall apresentados por alguns metais, nem justificar fisicamente os valores do livre caminho médio dos electrões de condução, notoriamente elevados a baixas temperaturas. Vamos de seguida verificar se é possı́vel resolver estas deficiências do modelo de electrões livres através de um tratamento quântico dos electrões. 5.4 O modelo de Sommerfeld O modelo de Drude é uma teoria clássica de electrões livres, isto é, os electrões são tratados como pequenas esferas rı́gidas idênticas. No entanto, apresentando os electrões um comportamento eminentemente quântico, este tratamento não se pode considerar correcto. Vamos agora estudar o gás de electrões livres usando o formalismo da Mecânica Quântica. Veremos que as principais diferenças relativamente ao 5.4. O MODELO DE SOMMERFELD 81 modelo clássico têm origem nas particularidades estatı́sticas dos objectos quânticos, e, mais em particular, dos fermiões, classe de partı́culas que engloba os electrões. A classe dos fermiões é constituı́da pelas partı́culas com momento angular intrı́nseco (ou spin) semi-inteiro (isto é, 1/2, 3/2, etc.) e que satisfazem o Princı́pio de Exclusão de Pauli, segundo o qual dois fermiões idênticos não podem ocupar simultaneamente o mesmo estado quântico(e) . O Princı́pio de Exclusão de Pauli é incompatı́vel com a distribuição de Maxwell-Boltzmann, verificando-se antes que os fermiões satisfazem uma distribuição diferente (sendo a diferença particularmente notória a baixas temperaturas), com o nome de distribuição de Fermi-Dirac. 5.4.1 Estados electrónicos Os estados quânticos dos electrões são obtidos resolvendo a equação de Schrödinger independente do tempo: − ~2 2 ∇ φ (r) + V (r)φ (r) = εφ (r) , 2m (5.20) onde φ (r) é a parte da função de onda que depende da posição dos electrões, v (r) é a sua função de energia potencial, ε é a energia do estado definido pela função de onda φ e ∇ é o operador gradiente, que, como é bem sabido, é dado por ∂ ∂ ∂ + ey + ez , ∂x ∂y ∂z 2 2 2 ∂ ∂ ∂ ∇2 = + 2 + 2, ∂x2 ∂y ∂z ∇ = ex usando coordenadas cartesianas. Uma vez que neste tratamento os electrões são considerados livres, a sua energia potencial deve ser constante(f) , e podemos escolhê-la igual a zero. Assim a equação (5.20) reduz-se a ~2 2 ∇ φ (r) + εφ (r) = 0. 2m (5.21) As soluções desta equação são da forma φk (r) = Aeik·r , (5.22) onde A é uma constante que é fixada impondo a normalização da função de onda, Z Z 2 ∗ dV φ (r) φ (r) = |A| dV e−ik·r eik·r V V = 2 |A| V = 1, de onde resulta, escolhendo A real 1 A= √ . V (5.23) Substituindo (5.22) em (5.21), obtemos a relação entre a energia dos electrões e o seu vector de onda k: ~2 k 2 εk = . (5.24) 2m (e) Note-se que se trata aqui de estados quânticos e não de nı́veis de energia. Se dois estados estados quânticos diferentes apresentam um mesmo valor de energia electrónica, então esse nı́vel pode estar ocupado por dois electrões. (f) Ao nı́vel quântico, as forças são sempre conservativas, isto é, podem ser obtidas como gradiente da energia potencial. Se a força é nula, a energia potencial é constante 82 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES Comparando esta expressão com a correspondente clássica, ε = p2 /2m, concluı́mos que o momento de um electrão num estado φk é p = ~k. (5.25) A dependência espacial(g) da função de onda dos electrões é então 1 φp = √ eip·r/~ . V (5.26) Resolvemos a equação de Schrödinger supondo que os electrões são livres. No entanto, esta suposição só é válida no interior do metal. Na sua superfı́cie, os electrões sentem uma força, de natureza electrostática, que os impede de sair. Impomos esta restrição na função de onda dos electrões através de condições fronteira que esta função deve satisfazer sobre a superfı́cie do metal. As condições que impomos são, de novo, as condições fronteira periódicas, por razões semelhantes às que justificaram esta escolha no capı́tulo anterior. Assim, impomos as seguintes condições às soluções da equação de Schrödinger(h) (ver Figura 5.6). 1 φk (r) = √ eik·r V 1 √ eik·[(x+L)ex +yey +zez ] V 1 ik·[xex +(y+L)ey +zez ] √ e V 1 ik·[xex +yey +(z+L)ez ] √ e , V = = = de onde resultam as equações de quantização para o vector de onda, k, kx = ky = kz = 2π n L 2π m L 2π l, L (5.27) com n, m, l inteiros arbitrários. Só os vectores de onda k cujas componentes satisfazem (5.27) são permitidos para os electrões de condução no metal. Estes vectores definem uma rede cúbica simples, de parâmetro 2π/L. z Lx U=∞ Lz U=0 y x Ly Figura 5.6: Poço de potencial tridimensional. A energia é nula dentro da caixa de dimensões Lx Ly Lz e infinito fora desta. (g) A ~ dependência temporal é, apenas, ξ(t) = exp (−iεt/ ). simplificar, consideramos o metal com forma cúbica, de aresta L. (h) Para 5.4. O MODELO DE SOMMERFELD 83 Os estados quânticos dos electrões são identificados pelos valores das componentes do vector de onda k, e pela orientação do seu spin, que, neste caso(i) , só pode tomar dois valores, com os nomes “para cima” (ou up, do inglês) e “para baixo” (ou down). O princı́pio de exclusão de Pauli proı́be que dois fermiões idênticos ocupem o mesmo estado quântico, de forma que pode haver, no máximo, dois electrões com o mesmo vector de onda k: um com spin up, o outro com spin down. 5.4.2 A densidade de estados electrónicos Tal como fizemos no capı́tulo anterior para a densidade electrónica de modos de vibração (ou, equivalentemente, a densidade de estados de fonões), pretendemos agora determinar a densidade de estados electrónicos. Isto é, pretendemos determinar a função g(ε) tal que o número de estados electrónicos com energia compreendida entre ε e ε + dε seja g(ε)dε. Esta determinação será decalcada da seguida no capı́tulo anterior para a densidade de modos de vibração: notamos que a “relação de dispersão”, ε = ε(k), é isotrópica, isto é, só depende do módulo do vector de onda; então o número de estados com energia compreendida entre ε e ε + dε é igual ao existente na camada esférica oca com raios k e k + dk correspondentes àqueles valores de energia; é agora fácil contar o número destes estados usando as equações de quantização (5.27). Vejamos, então. O volume da camada esférica oca de raios k e k + dk é 4πk 2 dk; o número de vectores de onda permitidos presentes nesta porção de espaço-k é aproximadamente igual à razão entre o seu volume e o volume ocupado por cada modo quântico, que, de acordo com (5.27), é (2π)3 /V , onde V é o volume do cristal; finalmente, para cada vector de onda k há dois estados possı́veis, correspondentes às duas orientações do spin electrónico. O número de estados electrónicos com energia compreendida entre ε e ε + dε é então dn = 2 × = V 4πk 2 dk (2π)3 /V k2 dk. π2 (5.28) A relação de dispersão (ou seja, a relação entre a energia e o vector de onda) é a expressa em (5.24), de onde obtemos por diferenciação dε = ~2 k dk. m (5.29) Substituindo em (5.28) resulta dn = = V m k dε π 2 ~2 V √ 3 2m ε dε, π 2 ~3 (5.30) onde se usou (5.24) para substituir k. A função densidade de estados é então g(ε) = 5.4.3 V √ π 2 ~3 2m3 ε. (5.31) O estado fundamental de um gás de fermiões Vamos agora considerar o gás de fermiões no estado fundamental, isto é, no estado de menor energia. Antes de começar, é importante desfazer eventuais confusões de nomenclatura. Cada electrão no gás de fermiões ocupa um dado estado individual, (i) Recorde-se que os electrões têm spin 1/2. 84 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES caracterizado por um dado vector de onda k e uma dada orientação de spin, estado esse a que corresponde uma certa energia, ε, do electrão que o ocupa. O conjunto dos electrões de valência num metal define o gás de fermiões de condução, gás esse que também é caracterizado por estados, mas que são agora estados colectivos, no sentido em que as suas propriedades se podem determinar a partir das dos estados individuais ocupados por cada um dos electrões que formam o gás. O estado fundamental do gás de electrões é aquele que, de entre todos os estados possı́veis, apresenta o menor valor para a energia. Logo, neste estado, todos os electrões que formam a nuvem de condução devem ocupar estados individuais com uma energia o menor possı́vel. Do ponto de vista clássico, estes estados são aqueles em que os electrões se encontram imóveis, e portanto apresentam o valor mı́nimo para a sua energia cinética, ou seja, zero. No entanto, quanticamente esta situação é impossı́vel. Com efeito, estando todos os electrões imóveis, todos apresentam vector de onda k = 0. Ora, já notámos que o princı́pio de exclusão de Pauli não permite mais do que dois electrões com o mesmo vector de onda, cada um com sua orientação de spin. O quadro clássico para o estado fundamental de um gás de electrões é pois, à luz da mecânica quântica, uma impossibilidade. Sendo assim, o estado fundamental de um gás de fermiões deve ser construido ocupando, com os electrões de condução, estados quânticos individuais de energias progressivamente mais elevadas, começando pelos de menor energia, até que todos os electrões de condução estejam desta forma “estacionados”. Uma vez que a energia dos estados electrónicos depende apenas do módulo do vector de onda, devemos, nesta construção, preencher primeiro estados caracterizados por vectores de onda de módulo menor. O conjunto dos estados electrónicos ocupados no estado fundamental de um gás de electrões define, no espaço-k, uma região com a forma de uma esfera: todos os estados electrónicos com módulo do vector de onda, k, menor que um certo limiar kF estão ocupados; os restantes, com k ≥ kF , apresentam-se desocupados. A esta esfera, que representa o estado fundamental de um gás de fermiões (neste caso, electrões de condução num metal) dá-se o nome de esfera de Fermi ; ao raio desta esfera, dá-se o nome de raio de Fermi ; chama-se energia de Fermi ao valor da energia dos electrões que ocupam estados na superfı́cie da esfera de Fermi, e, evidentemente, relaciona-se com o raio de Fermi através de εF = ~2 2 k ; 2m F (5.32) define-se ainda a temperatura de Fermi, através de TF = εF /kB , onde kB é a constante de Boltzmann, como sendo o valor da temperatura necessário para que um número apreciável de fermiões adquiram uma energia cinética comparável com a energia de Fermi. Os valores destas grandezas, que caracterizam o estado fundamental de um gás de electrões, podem ser todos calculados a partir do valor da densidade electrónica de condução, que, por seu turno, é facilmente estimável em situações concretas. O cálculo destas quantidades parte do facto de que o número de estados electrónicos no interior da esfera de Fermi é, por construção, igual ao número total de electrões de condução, N , presentes no metal. Usando a função densidade de estados, obtida na subsecção anterior, esta igualdade traduz-se por Z N= εF dε g(ε), (5.33) 0 já que no lado esquerdo temos o número total de electrões e, à direita, o número total de estados electrónicos ocupados. Substituindo em (5.33) o resultado (5.31), 5.4. O MODELO DE SOMMERFELD Elemento Li Na Cu Au n(m−3 ) 4,68×1028 2,64×1028 8,40×1028 5,90×1028 εF (eV) 4,74 3,24 7,00 5,53 85 TF (K) 5,51×104 3,77×104 8,16×104 6,42×104 kF (m−1 ) 1,12×1010 0,92×1010 1,36×1010 1,21×1010 vF (m/s) 1,29×106 1,07×106 1,57×106 1,40×106 Tabela 5.2: Valores das grandezas “de Fermi” para alguns elementos. obtemos n≡ N V √ = = Z √ 2m3 εF dε ε 2 3 π ~ 0 p 2 2m3 ε3F , 3 π 2 ~3 (5.34) onde se representou por n a densidade electrónica. De (5.34), podemos determinar o valor da energia de Fermi (supondo conhecido valor da densidade electrónica), a partir do qual se calcula facilmente o valor de kF , TF , etc. Para a maioria dos metais, a energia de Fermi apresenta valores de cerca de alguns eV(j) . O estado fundamental do gás de electrões de condução só pode ser produzido experimentalmente a uma temperatura de zero Kelvin (ou muito próxima deste limite) uma vez que, a temperaturas mais elevadas o número de fonões no metal é elevado, e estes podem comunicar energia à nuvem electrónica, excitando alguns electrões para fora da esfera de Fermi. 5.4.4 O gás de electrões de condução à temperatura ambiente De acordo com o que se acabou de discutir, a uma temperatura T diferente do zero absoluto, alguns átomos encontram-se em nı́veis de vibração excitados e podem, decaindo para estados vibracionais de menor energia, excitar electrões, aumentando assim a energia do gás de electrões. Este processo pode entender-se como a troca de um fonão entre o átomo (que o emite) e o electrão (que o absorve). A variação de energia sofrida pelo átomo e pelo electrão é igual à energia transportada pelo fonão. Supondo que neste processo o átomo decai para o nı́vel energético fundamental, a energia do fonão emitido é exactamente igual à energia de excitação do estado inicial. Nesta hipótese, então, a energia dos fonões é igual à energia de excitação dos átomos que os emitiram, e portanto a energia média dos fonões é igual à energia média de vibração dos átomos. Mas não há, à priori, qualquer razão para acreditarmos que todas as des-excitações atómicas se fazem para o estado fundamental, de forma que poderemos apenas afirmar que, a uma dada temperatura, a energia média dos fonões é da ordem de grandeza da energia média de vibração dos átomos, ou seja, kB θE /(exp(θE /T ) − 1), usando o modelo de Einstein, para simplificar a discussão. Mas a temperatura de Einstein de muitas substâncias é da ordem de grandeza da temperatura ambiente, de forma que exp(θE /T ) − 1 ≈ exp 1 − 1 ≈ 1. A energia média dos fonões à temperatura ambiente é então cerca de kB T ≈ 0, 03 eV, ou seja, cerca de uma centésima parte da energia de Fermi. Os cálculos que acabámos de efectuar são apenas uma estimativa grosseira, mas mostram claramente que as energias disponı́veis para excitar os electrões são, à temperatura ambiente, uma fracção muito reduzida da energia de Fermi. Sendo assim, apenas aqueles electrões que ocupam estados muito próximos da superfı́cie de Fermi (aqueles cuja energia difere de εF por menos do que kB T ) podem ser excitados, já que os restantes (j) 1 eV (lê-se electrão-Volt) é a energia adquirida por um electrão acelerado por uma diferença de potencial de 1V, ou seja, 1 eV' 1, 6 × 10−19 J. 86 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES (profundamente “enterrados” na esfera de Fermi) iriam, após a excitação, ocupar estados já ocupados, o que é impossı́vel nos termos do princı́pio de exclusão de Pauli. À temperatura ambiente, a configuração da nuvem electrónica no espaço-k consiste ainda numa esfera (como a 0 K), mas que apresenta um ligeiro “esboroamento” da sua superfı́cie, sendo possı́vel encontrar estados desocupados no seu interior e, em igual número, estados ocupados no exterior. Este facto marca a principal diferença relativamente ao tratamento clássico da nuvem electrónica, e iremos mais adiante abordar as suas consequências. 5.4.5 A distribuição de Fermi-Dirac À temperatura de zero Kelvin, todos os estados electrónicos com energia inferior ou igual à energia de Fermi estão ocupados. A densidade de probabilidade para que um estado de energia ε esteja ocupado é então, para T = 0 K e à parte uma constante de normalização, ½ fT =0 K (ε) = 1, 0, se ε ≤ εF se ε > εF . (5.35) À temperatura ambiente, em contrapartida, da discussão precedente concluimos que quase todos os estados quânticos com energia pequena (quando comparada com a do nı́vel de Fermi) estão ocupados; a fracção de estados ocupados só decresce sensivelmente em nı́veis com energia muito próxima de εF , numa região com largura aproximadamente igual a kB T . Pode mostrar-se (mas não o faremos aqui) que a função que descreve esta situação é a chamada função de distribuição de FermiDirac, 1 fT (ε) = (ε−µ)/k T , (5.36) B e +1 onde µ é o potencial quı́mico do sistema. O limite da distribuição de Fermi-Dirac quando T → 0 deve ser a expressão (5.35), e podemos então concluir que lim µ = εF . T →0 (5.37) Quando a temperatura sobe, o valor do potencial quı́mico decresce ligeiramente; mas, mesmo à temperatura ambiente, o seu valor mantém-se muito aproximadamente igual ao da energia de Fermi. Por esta razão, não é, frequentemente, feita qualquer distinção entre os dois. Na Figura 5.7 está representada a forma da função de distribuição de FermiDirac para T = 0 K e para temperaturas não nulas. O facto de apenas alguns electrões serem excitados quando, partindo do estado fundamental, se aquece o gás de electrões de condução até à temperatura ambiente, tem, como deve ser evidente, um efeito determinante sobre o calor especı́fico da nuvem electrónica. Com efeito, a energia total (da nuvem electrónica) não deve, neste aquecimento, aumentar tanto quanto o previsto usando o tratamento clássico, baseado na função de distribuição de Maxwell-Boltzmann. O número de electrões que ocupam estados excitados à temperatura ambiente representa uma fracção tão pequena do total, que a energia do gás de electrões de condução difere muito pouco da do estado fundamental do gás. A contribuição principal para o calor especı́fico dos metais a temperaturas não excessivamente altas é então a fornecida pela rede de iões e portanto verifica-se, mesmo para metais, a lei de Dulong e Petit (ver o capı́tulo anterior). 5.4. O MODELO DE SOMMERFELD 87 1 6000 3000 600 0 K K K K 0.8 0.6 0.4 0.2 0 0 2 4 6 8 10 Figura 5.7: Gráfico da função de distribuição de Fermi-Dirac, para T = 600 K (a tracejado), T = 3000 K (a pontilhado) e T = 6000 K (a cheio). O valor da energia de Fermi usado neste exemplo foi de εF = 5 eV. (†)Variação do potencial quı́mico com a temperatura: Aproximação de Sommerfeld Como acabamos de constatar, para temperaturas superiores ao zero absoluto, T > 0◦ K, os estados de energia imediatamente superiores à energia de Fermi são ocupados e o nı́vel de Fermi passa a ser designado pelo nı́vel de energia com 50% de probabilidade de ocupação. Este facto, vai implicar que o nı́vel de Fermi baixe ligeiramente com o aumento de temperatura. Podemos justificar esta variação constatando que, a função de distribuição de Fermi-Dirac, f (ε), é assimétrica em εF para todas as temperaturas, porém a função densidade de estados g(²) aumenta com a energia e à medida que a temperatura aumenta existe uma porção crescente da população total dos fermiões que ocupa estados de maior energia. Como o número total de electrões tem de se manter constante; isto é, as áreas da Figura 5.8 têm de ser iguais, e o nı́vel εF (T ) para o qual f (εF (T )) = 1/2 (k) tem de ser deslocado sucessivamente para valores mais baixos com o aumento de temperatura. Assim, para determinarmos a variação do nı́vel de Fermi podemos partir do cálculo do número total de electrões de condução que deve permanecer constante independentemente da temperatura, e que podemos escrever do seguinte modo, ·Z εF N= ¸ dε g(ε) 0 ·Z ∞ = T =0 ¸ dε f (ε) g(ε) 0 . (5.38) T >0 O cálculo do primeiro termo de (5.38) já foi efectuado atrás em (5.34). O segundo termo pode ser calculado usando a aproximação de Sommerfeld. Nesta aproximação começamos por calcular o integral Z N= ∞ dε f (ε) g(ε), (5.39) 0 (k) ε (T ), corresponde ao nı́vel de fermi para T > 0 K, que por definição é o nivél energético com F 50% de probabilidade de ocupação. 88 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES f(ε) g(ε ) 1 T=0K área = área 0.8 0.6 0.4 T>0K 0.2 ε 0 ε F Figura 5.8: Representação gráfica, normalizada, de f (ε) g(ε), para T = 0◦ K e T > 0◦ K. por partes, do seguinte modo Z ∞ Z ∞ dε f (ε) g(ε) = [f (ε) G(ε)]0 − 0 = ∞ dε f 0 (ε) G(ε) Z limε→∞ f (ε) G(ε) − f (0) G(0) − 0 ∞ dε f 0 (ε) G(ε), 0 em que Z G(ε) = dε g(ε) ε 3 V (2mε) 2 3~3 π 2 = (5.40) é a primitiva da função densidade de estados. Atendendo às propriedades da função de distribuição de Fermi-Dirac, temos que quando a energia ε → ∞ a função f (ε) → 0, e quando a energia ε = 0 a a função f (ε) = 1 e G(ε) = 0. Deste modo (5.39) reduz-se a Z ∞ N =− dε G(ε) f 0 (ε). (5.41) 0 A derivada da função de Fermi-Dirac, f 0 (ε), vai ter um papel importante neste cálculo, pois vai-nos permitir fazer um aproximação bastante razoável. Vejamos, derivando (5.36) obtemos 0 f (ε) = − e kB T (e (ε−εF ) kB T (ε−εF ) kB T . (5.42) + 1)2 A função (5.42) tem a forma de função delta-Dirac, δ(εF ), quando T → 0 K (derivada da função degrau) e é aproximadamente uma função delta-Dirac de largura finita quando T > 0 K (ver Figura 5.9). Tendo em conta que o nı́vel de Fermi é ordens de grandeza superior que às energias disponı́veis para os fermiões poderem mudar de estado, a função (5.42) só tem valor expressivo na vizinhança da energia de Fermi. Assim, será válido fazer uma aproximação em série de Taylor da função G(ε) em torno da energia de Fermi, εF , que desenvolvida até à segunda ordem pode ser escrita do seguinte modo, 1 G(ε) = G(εF ) + (ε − εF )G0 (εF ) + (ε − εF )2 G00 (εF ) + O(ε − εF )3 , 2 (5.43) 5.4. O MODELO DE SOMMERFELD f( ε ) 89 -f´( ε) 1 T=0 K T>0 K 1/2 εF ε εF (a) ε (b) Figura 5.9: (a) Função de distribuição de Fermi-Dirac; (b) Simétrico da derivada da função de Fermi-Dirac, −f 0 (ε). Esta função aproxima-se de uma função delta-Dirac quando T → 0 onde O(ε−εF )3 representa os termos de ordem superior que vamos nesta abordagem desprezar. Aplicando (5.43) em (5.41) resulta, Z ∞ Z ∞ 0 0 N = −G(εF ) dεf (ε) − G (εF ) dεf 0 (ε)(ε − εF ) 0 0 Z ∞ 1 − G00 (εF ) (5.44) dεf 0 (ε)(ε − εF )2 . 2 0 O primeiro integral em (5.44) pode ser resolvido usando a mudança de variável, x= e fica simplesmente Z ∞ ε dx − K FT B (ε − εF ) , kB T ex ≈ x (e + 1)2 Z (5.45) ∞ dx −∞ (ex ex = 1, + 1)2 (5.46) porque εF >> kB T . O segundo integral em (5.44), após a mudança de variável (5.45) pode ser escrito da seguinte forma, Z ∞ ex x kB T dx x =0 (5.47) (e + 1)2 −∞ o que é esperado já que a função de Fermi-Dirac é assimétrica em relação ao nı́vel de Fermi, εF , e consequentemente o resultado da integração da sua derivada, f 0 (ε) com qualquer função impar, como é o caso da função integranda e em (5.47) e de todos os termos de ordem impar da expansão de Taylor (5.43), é nulo. Finalmente para o terceiro integral em (5.44) obtemos, após a mudança de variável (5.45), um valor que é função da temperatura, Z ∞ 2 ex x2 2π 2 dx x = (k T ) (5.48) (kB T ) B 2(e + 1)2 6 −∞ Conjugando os resultados de (5.46), (5.47) e (5.48), o número total, N , de electrões de condução é, N = G(εF ) + G00 (εF )(kB T )2 π2 . 6 (5.49) Como sabemos o nı́vel de Fermi diminui ligeiramente o seu valor comparado com o nı́vel de Fermi a 0◦ K, εF (0). Podemos deste modo e sem cometer um grande 90 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES erro aproximar o valor da função G(ε) em ε = εF , integrando até εF (0) (nı́vel de Fermi no zero absoluto) e subtraindo uma coluna de de largura εF (0) − εF , e altura g(εF (0)), do seguinte modo Z εF G(εF ) = dε g(ε) Z 0 εF (0) = dε g(ε) − [εF (0) − εF ] g(εF (0)). (5.50) 0 Assim (5.49) toma seguinte forma Z N= εF (0) dε g(ε) + [εF − εF (0)] g(εF (0)) + (kB T )2 0 usando, π2 0 g (εF (0)). 6 (5.51) G00 (ε) = g 0 (ε). Mas como já sabemos de (5.34), Z εF (0) N= dε g(ε), 0 logo o número total de electrões, N , em (5.51) anula-se e ficamos com uma expressão que relaciona, o nı́vel de Fermi no zero absoluto, com o nı́vel de Fermi a uma temperatura diferente de zero, [εF − εF (0)] g(εF (0)) + (kB T )2 π2 0 g (εF (0)) = 0. 6 (5.52) Para efectuarmos o cálculo (5.52) é conveniente redefinir a expressão densidade de estados em função do nı́vel de Fermi no zero absoluto, εF (0), usando (5.31) e (5.34), da seguinte forma, 3 ε1/2 g(ε) = N . (5.53) 2 (εF (0))3/2 Assim, substituindo g(εF (0)) = g 0 (εF (0)) = 3 N (εF (0))−1 2 3 N (εF (0))−2 4 em (5.52) obtemos, finalmente, a variação do nı́vel de Fermi com a temperatura: " µ ¶2 # π 2 kB T . (5.54) εF = εF (0) 1 − 12 εF (0) 5.4.6 Energia de um gás de fermiões para T > 0 K A energia de um gás de fermiões a temperaturas diferentes do zero absoluto é calculada usando a relação de energia, Z ∞ E(T ) = dε g(ε) f (ε)ε. (5.55) 0 Podemos usar de novo a aproximação de Sommerfeld. Para esse efeito vamos definir a função, h(ε), tal que, h(ε) = ε g(ε). 5.4. O MODELO DE SOMMERFELD 91 A expressão para a energia (5.55) é agora Z E ∞ = dε h(ε) f (ε) 0 = H(εF ) + π 2 00 H (εF )(kB T )2 . 6 (5.56) onde a função H(ε) é a primitiva de h(ε), Z H(ε) = dε0 ε0 g(ε0 ). ε Usando a mesma aproximação usada em (5.50) para o cálculo da variação do nı́vel de Fermi, a função H(εF ) pode ser expressa como, Z εF (0) H(εF ) = dε ε g(ε) + [εF − εF (0)] εF (0) g(εF (0)), (5.57) 0 e a segunda derivada de H(εF ) no ponto εF pode ser aproximada a H 00 (εF ) ≈ εF (0) g 0 (εF (0)) + g(εF (0)). (5.58) Assim a contribuição energética dos electrões, calcula-se substituindo (5.57) e (5.58) em (5.56), obtendo, µ ¶ π2 dε ε g(ε) + εF (0) [εF − εF (0)] g(εF (0)) + (kB T )2 g 0 (εF (0)) + 6 0 2 π +g(εF (0))(kB T )2 . (5.59) 6 Z E = εF (0) onde, se tivermos em atenção (5.52), o segundo termo desta expressão (5.59) é nulo, pelo que se obtem a expressão simplificada seguinte, Z εF (0) E= dε ε g(ε) + g(εF (0))(kB T )2 0 π2 , 6 (5.60) que pode após subistituição do valor da energia do gás de fermiões no zero absoluto, obtemos finalmente " µ ¶2 # 5 2 kB T 3 . (5.61) E = N εF (0) 1 + π 5 12 εF (0) 5.4.7 Calor especı́fico Estamos agora em condições de poder calcular a contribuição dos fermiões para o calor especı́fico de um sólido através da definição usual, µ ¶ ∂E CV = . ∂T V Usamos a expressão da energia (5.61), obtemos, cV = 2 T π 2 kB N . 2 εF (0) (5.62) 92 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES Substituindo a densidade electrónica em (5.62) por o número de Avogardo, NA , obtemos o calor especı́fico molar, CV = = kB 2 T π2 NA 2 εF (0) π2 T R . 2 TF (5.63) onde TF representa a temperatura de Fermi dada por, TF = εF /kB . O quociente entre temperatura ambiente e a temperatura de Fermi para os metais tem valores tı́picos entre 1/300 a 1/50 o que, como já se esperava, torna a contribuição para valor do calor especı́fico dos electrões bastante pequena, em conformidade com a lei de Dulong e Petit, e contraria o valor previsto pelo modelo clássico de Drude-Lorentz. A baixas temperaturas (< 4◦ K) esta contribuição calor especı́fico torna-se dominante em relação à contribuição das oscilações dos iões da rede cristalina. Será assim pertinente apresentar uma relação “refinada”, para baixas temperaturas, que contenha ambas contribuições para o calor especı́fico molar de um metal: µ ¶3 1 2 T 12 4 T CV = π R + π R , (5.64) 2 TF 5 θD onde θD , é a temperatura de Debye do metal. 5.4.8 A condutividade eléctrica Como acabámos de discutir, os electrões mais profundamente “enterrados” na esfera de Fermi estão congelados, no sentido em que não podem, à temperatura ambiente, sofrer excitações de origem térmica. Vimos que, por esta razão, a nuvem electrónica contribui muito pouco para o calor especı́fico dos metais. Poder-se-ia pensar que este “congelamento” impede também a nuvem electrónica de contribuir para a condutividade eléctrica, já que, também aqui, é necessário que pelo menos alguns electrões sejam excitados. Com efeito, na ausência de campos eléctricos externos e no estado fundamental, a distribuição das velocidades electrónicas tem simetria esférica, ou seja, dado um qualquer electrão com velocidade v (vector de onda k), existe outro com velocidade −v (vector de onda −k) cuja contribuição para a corrente eléctrica anula a do primeiro. Como, no estado fundamental, todos os electrões estão desta forma “emparelhados”, a corrente total é nula(l) . Para que se verifique condução eléctrica é pois necessário que (pelo menos) alguns electrões sofram uma transição para um estado “desemparelhado”, no exterior da esfera de Fermi. Como o número de electrões em estados com energia acima da do nı́vel de Fermi aumenta com a temperatura, poderı́amos pensar que também a condutividade eléctrica dos metais seria maior a temperaturas maiores, tomando valores muito baixos para temperaturas próximas do zero absoluto. Ora, esta conjectura contraria flagrantemente os dados experimentais. A condutividade dos metais é, regra geral, uma função decrescente da temperatura. Na discussão acima, cometemos o erro de supor que a população electrónica dos estados exteriores à esfera de Fermi tem apenas origem térmica, isto é, que apenas por absorção de energia vibracional da rede cristalina se podem promover transições electrónicas. Isto é evidentemente errado! São possı́veis trocas de energia com um campo eléctrico externo, que contribuem determinantemente para a população de electrões em estados “desemparelhados”. Um campo eléctrico externo muda o estado de todos os electrões na nuvem de condução, comunicando-lhes uma aceleração (l) Note-se que este resultado não é nada de estranhar, já que, desde o inı́cio, estamos a supôr que o campo eléctrico aplicado é nulo... 5.4. O MODELO DE SOMMERFELD 93 oposta à direcção do campo (recordemos que a carga dos electrões é negativa). Este efeito, conjugado com a possibilidade de colisões com a rede cristalina, com defeitos, com fonões, tem como resultado que cada electrão atinge uma velocidade limite, e a diferença (vectorial) entre este limite e a velocidade inicial é a mesma para todos os electrões. Dada a relação entre as velocidades v e os vectores de onda k dos electrões, tudo se passa como se a esfera de Fermi, inicialmente centrada na origem do espaço-k, sofresse um deslocamento δ na direcção oposta à do campo aplicado (ver a Figura 5.10). ky ky kx kx E Figura 5.10: À esquerda, a esfera de Fermi na ausência de campo eléctrico. Os estados ocupados (zona sombreada) apresentam, no espaço-k simetria esférica e portanto a velocidade média, tomada para todos os electrões, é nula. À direita, a esfera de Fermi quando se aplica um campo eléctrico. O conjunto dos estados presentes na zona cinzento-claro apresenta um valor médio da velocidade nulo; os estados na região indicada a cinzento-escuro, que também estão ocupados, contribuem todos para a corrente eléctrica. Se designarmos por τ o tempo médio de colisão, cada electrão vai sofrer uma modificação na sua velocidade de cerca de −eτ E/m(m) , uma variação de momento (p = mv) de −eEτ e uma variação de vector de onda (k = p/~) de −eEτ /~, que deve agora ser o valor médio do vector de onda. Uma vez que todos os electrões vão sofrer esta transição de estado, o princı́pio de exclusão de Pauli não se aplica. A média das velocidades dos electrões deve agora ser < v >= ~/m < k >= −eτ /mE. A densidade de corrente, j = ρ < v >= −ne < v >, vem então j= ne2 τ E, m onde n é o número de electrões de condução por unidade de volume. Comparando esta expressão com a da lei de Ohm (j = σE), obtemos a forma da condutividade eléctrica: ne2 τ σ= . m Este foi o resultado obtido no estudo clássico (ver a Secção 5.2.2). Apesar das diferenças importantes entre as duas abordagens ao problema da condução eléctrica, a expressão da condutividade como função das caracterı́sticas do material em que se processa, apresenta a mesma forma nas descrições clássica e quântica. O livre caminho médio dos electrões de condução pode ser obtido multiplicando o módulo da sua velocidade pelo tempo médio de colisão. Nesta descrição quântica que temos vindo desenvolver, os electrões apresentam valores muito dı́spares de velocidade. Com efeito, os electrões que estão próximos da superfı́cie de Fermi ocupam (m) Esta expressão é simplesmente a que resulta do estudo do movimento uniformemente acelerado de uma partı́cula de massa m, sob a acção de uma força constante −eE , durante um intervalo de tempo τ . 94 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES estados com vectores de onda cujos módulos são muito superiores aos daqueles em estados mais profundamente enterrados na esfera de Fermi. Sendo assim, haverá electrões com diferentes valores para o livre caminho médio. Por exemplo, para o cobre, σ = 5, 8×107 Ω− 1 m− 1 e n = 8, 4×102 8 m− 3, de onde resulta τ = 2, 5×10−14 s. A velocidade dos electrões que ocupam estados no nı́vel de Fermi pode ser calculada a partir da densidade electrónica, n, obtendo-se vF = 1, 6 × 106 m/s. O livre caminho médio para um electrão no nı́vel de Fermi de um cristal de cobre é então λ ≈ 390 Å, ou seja, cerca de 100 vezes as distâncias interatómicas tı́picas! Vemos assim que o problema do livre caminho médio de que enfermava o modelo clássico de electrões livres não é eliminado nesta descrição quântica. De facto, este problema não é eliminado senão quando se consideram as interacções dos electrões de condução com a rede cristalina. 5.5 Crı́tica dos modelos de electrões livres Tanto o modelo clássico de Drude como o modelo quântico de Sommerfeld apresentam graves deficiências. À parte a questão do calor especı́fico dos metais (e algumas outras propriedades que não abordámos), os dois modelos apresentam inconvenientes semelhantes, alguns dos quais são: (a) Não fornecem explicação para a existência de metais com coeficientes de Hall positivos; (b) não descrevem correctamente a dependência da condutividade com a temperatura. Em particular, o caso de certos materiais cuja condutividade aumenta com a temperatura, em certos intervalos de temperatura; (c) nalguns condutores, a condutividade depende da orientação do campo eléctrico, facto incompreensı́vel numa teoria de electrões livres; (d) Os modelos de electrões livres não respondem à pergunta mais imediata: Porque é que alguns sólidos são condutores e outros não? Para responder a este e outros problemas, teremos que considerar as interacções entre os electrões de condução e a rede cristalina. De facto, os electrões nos sólidos não são livres e esperar que um modelo que os trate como tal seja capaz de descrever com exactidão todas as propriedades electromagnéticas dos sólido é certamente optimismo em demasia. PROBLEMAS 5.1 Relacione a probabilidade de colisão por unidade de tempo, γ, com o tempo médio de colisão τ . 5.2 Prove, a partir da definição de densidade de corrente, j = ρl v , que a corrente total que passa através de uma superfı́cie S é igual ao fluxo de j através de S, Z i= S j · n̂dS, onde n̂ é um vector unitário que, em cada ponto da superfı́cie S, lhe é perpendicular. 5.3 Relacione kF com ²F com pF . 5.4 Calcule a energia do estado fundamental de fermiões. 5.5 Escreva a expressão da energia de um gás de fermiões num estado arbitrário. 5. Problemas 5.6 A resposta ao Problema 4 é E = 3/5 N ²F onde N é o número total de fermiões no gás e ²F é energia de Fermi. Obtenha a expressão da pressão do gás de fermiões (p = ∂E/∂V ) e do módulo de compressibilidade (B = −V ∂p/∂V ) de um gás de fermiões no estado fundamental. 5.7 O lı́tio tem condutividade eléctrica de σ =1,05×107 Ω−1 m−1 e uma densidade atómica de 4,80×1028 átomos por metro cúbico. (a) Determine a velocidade de condução média dos electrões no metal quando se aplica um campo eléctrico de 100 V/m, e compare o valor obtido com a velocidade dos electrões no nı́vel de Fermi. (b) Determine a velocidade dos electrões cuja energia é igual à energia média dos electrões no cristal, segundo o modelo de Sommerfeld. (c) Determine a velocidade média dos electrões à temperatura de 300 K, segundo o modelo de Drude-Lorentz. 5.8 O sódio tem densidade de ρ =0,97×103 kg/m3 , uma massa atómica relativa de 23 e condutividade eléctrica de 2, 1 × 107 Ω−1 m−1 . Determine a mobilidade dos electrões no sódio. 5.9 A densidade do bário é de 3, 5 × 103 kg/m3 e a massa atómica relativa é 137. Sabendo que este elemento tem dois electrões de valência, determine o raio da esfera de Fermi e o valor da energia de Fermi correspondente. 5.10 Determine o valor do nı́vel de Fermi para o Cobre no zero absoluto e mostre que a variação do nı́vel de Fermi com a temperatura no intervalo [0 K-300 K] não excede aproximadamente 0,001%. O cobre tem uma densidade de 8, 93 × 103 kg/m3 e massa relativa de 63, 5. 5.11 Determine a energia dos electrões no nı́vel de Fermi, e o coeficiente de proporcionalidade α relativo à contribuição da energia dos electrões para o calor especı́fico dos sólidos, partindo do valor a = 4, 225 Å referente ao parâmetro da célula convencional cúbica da rede associada a este elemento. 5.12 Partindo da aproximação de Debye e do modelo de electrões livres, compare as contribuições da energia fonões e dos electrões para o calor especı́fico do potássio à temperatura de 0,1, 1 e 10 K. A temperatura de Debye para o potássio é de 89 K, e parâmetro da célula convencional cúbica da rede associada a este elemento é a = 5, 225 Å. 5.13 A grafite é um cristal laminar em que os átomos de carbono estão distribuı́dos (para uma determinada camada) nos vértices de hexágonos regulares de lado d = 1, 42 Å, que se encaixam entre si. Os electrões de valência da grafite, à razão de um electrão por átomo, podem mover-se basicamente no dito espaço bidimensional. Suponha que estes electrões são livres. Usando o modelo de Sommerfeld para estas camadas bidimensionais, determine: (a) a densidade electrónica; (b) a densidade de estados, g(ε); (c) a energia de Fermi; (d) a energia espectável dos electrões à temperatura de zero Kelvin. 5.14 Considere um estado electrónico que tem probabilidade de ocupação de 95% a um certa temperatura T . Derive uma expressão para, ε − εF , a sua energia relativamente ao potencial quı́mico. (a) Determine o valor de ε − εF para T = 100, 300 e 1200 K. (b) Repita os cálculos para uma probabilidade de 5%. (c) Comente os resultados obtidos. Nota: Considere que o nı́vel de Fermi, εF , não varia com a temperatura. 5.15 O estrôncio tem uma estrutura cúbica de faces centradas de aresta a = 6, 08 Å. 95 96 CAPÍTULO 5. METAIS I: MODELOS DE ELECTRÕES LIVRES (a) Usando o modelo de electrões livres de Sommerfeld determine o raio da esfera de Fermi no zero absoluto. (b) Determine a velocidade de um electrão com energia Fermi à temperatura de 0◦ , 30◦ e 300◦ Kelvin. Comente os resultados. (c) Determine a velocidade média de condução dos electrões quando sujeitos a um campo eléctrico de 2,5 V/cm, sabendo que a condutividade eléctrica do estrôncio a 20◦ C é de 1, 66 × 105 Ω−1 m−1 . Capı́tulo 6 Metais II: Teoria de bandas Deve ser evidente que alguns inconvenientes (de entre os que foram apresentados no final do capı́tulo anterior) das teorias de electrões livres têm origem exactamente no facto de se considerarem os electrões “desligados” de quaisquer interacções com o meio onde se deslocam; o facto de a condutividade da grafite, por exemplo, depender da direcção da corrente mostra bem que deve existir alguma interacção entre os electrões e o cristal, que torna mais fácil o movimento em certas direcções que noutras. É também evidente que uma teoria de electrões livres só se pode aplicar a condutores, sendo portanto incapaz de explicar a razão de alguns sólidos o serem e outros não. Estas considerações são evidentes e poderiam ter sido feitas ainda antes de termos desenvolvido a teoria de electrões livres. Parece assim natural que um modelo tenha em linha de conta a influência do meio cristalino sobre os electrões possa resolver estas dificuldades. A teoria que vamos passar a descrever, não só classifica estas questões, como explica as restantes, discutidas no Capı́tulo anterior, como os elevados valores do livre caminho médio a baixa temperatura ou as colocadas pela existência de sólidos cuja condutividade aumenta com a temperatura, que apresentam coeficientes de Hall positivos, etc. 6.1 Introdução Nesta nova abordagem continuaremos a desprezar as interacções electrão-electrão. A razão principal para esta aproximação é a complexidade da teoria completa, que torna impraticável a sua resolução sem recorrer aos métodos, aproximados, da teoria quântica de muitos corpos. Com efeito, o problema é o seguinte: queremos determinar a função de onda dos electrões, resolvendo a equação de Schrödinger. Mas antes temos que determinar o potencial a que estão sujeitos. Ora, considerando interacções electrão-electrão, só podemos conhecer o potencial depois de conhecida a função de onda. Considerando, além disso, que a função de onda deve depender das 3N coordenadas de posição dos N electrões, sendo N da ordem de 1020 , fica-se com uma ideia da complexidade do problema. Felizmente, o modelo que iremos desenvolver é notavelmente preciso, demonstrando-se assim, a postriori, que as interacções electrão-electrão são, de facto, pouco significativas na maior parte das aplicações(a) . Não considerando as interacções electrão-electrão, apenas as interacções com a rede cristalina contribuem para a energia potencial dos electrões. Cada electrão move-se numa região onde está definida uma função de potencial independente dos (a) Uma excepção importante desta afirmação é o caso da supercondutividade. 97 98 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS restantes electrões. A este tipo de aproximação para sistemas de muitos corpos dá-se o nome de aproximação de partı́cula única, ou de partı́culas independentes. Uma vez que a rede cristalina é (em primeira aproximação - ver Capı́tulo 4) um arranjo periódico tridimensional de átomos, o potencial electrónico por ela estabelecido também deve ser periódico, com a mesma periodicidade da rede. Uma vez que a força entre cargas de sinal contrário (os electrões e os iões que formam a rede) é atractiva, o potencial electrónico deve apresentar mı́nimos nas posições ocupadas pelos iões, como se mostra na Figura 6.1, numa representação unidimensional. V(x) x a a a Figura 6.1: Exemplo de potencial periódico unidimensional. A resolução da equação de Schrödinger com um potencial periódico fica substancialmente simplificada pelo teorema de Bloch, que demonstramos na secção seguinte. Antes de o fazermos, podemos estudar de forma qualitativa a deformação das orbitais atómicas quando aproximamos vários átomos uns dos outros. Quando os átomos estão afastados uns dos outros, os electrões atómicos praticamente não sentem interacções senão com o átomo a que pertencem, e portanto as orbitais são essencialmente as previstas pela fı́sica atómica: um conjunto de nı́veis energéticos designados pelos sı́mbolos 1s, 2s, 2p, etc(b) . Um esquema destes nı́veis está representado na Figura 6.2. Se aproximarmos deste átomo um outro, idêntico, cada um E V(x) 2p 2s 1s Figura 6.2: Nı́veis de energia atómicos. destes nı́veis subdivide-se em dois, sendo a separação tanto maior quanto maior for a energia do nı́vel original (ver Figura 6.3). Se aproximarmos 3 átomos cada nı́vel subdivide-se em 3 e assim sucessivamente. Se considerarmos agora um cristal, que consiste num número elevado de átomos na vizinhança uns dos outros, cada nı́vel atómico subdivide-se em tantos subnı́veis quantos forem os átomos que formam o cristal. Estes subnı́veis estão tão próximos (em termos energéticos) uns dos outros (b) Usou-se a notação espectroscópica (a mais habitual) para indicar os estados electrónicos. O número inteiro representa o número quântico principal; a letra que o segue representa o momento angular, de acordo com s → l = 0; p → l = 1; d → l = 2; etc. Assim, o estado 2p é o estado com número quântico principal n = 2 e número quântico de momento angular l = 1. 6.1. INTRODUÇÃO 99 E V(x) 2p 2s 1s Figura 6.3: Nı́veis de energia numa molécula biatómica. que não é possı́vel detectar a sua separação. Cada nı́vel subdivide-se então um número enorme de vezes, criando assim uma banda de energias permitidas, como mostra a Figura 6.4. Este desdobramento dos nı́veis atómicos pode ser ilustrado E V(x) 2p 2s 1s Figura 6.4: Bandas de energia num cristal. usando a teoria da perturbações. Outra alternativa é a resolução da equação de Schrödinger numericamente (usando métodos que estão descritos em qualquer livro de análise numérica) para uma partı́cula com uma energia potencial com uma série de mı́nimos dispostos contiguamente. É importante notar que neste desdobramento das orbitais atómicas não varia o número total de estados electrónicos. Com efeito, quando se aproximam dois átomos da mesma espécie quı́mica, cada orbital atómica divide-se em duas orbitais moleculares, mas inicialmente temos dois átomos, cada qual com o seu conjunto de orbitais atómicas, e no fim temos apenas uma molécula. As duas orbitais moleculares correspondentes a cada nı́vel atómico podem ver-se como combinações lineares das duas orbitais atómicas (uma de cada átomo) que as originam. Na Figura 6.4, os electrões que ocupam as bandas 1s e 2s estão localizados na proximidade dos átomos a que pertencem, porque as suas energias não são suficientes para ultrapassar as barreiras de potencial entre os átomos (estamos a desprezar a possibilidade de efeito de túnel). Os electrões da banda 2p podem mover-se ao longo do cristal, mas não se deve pensar por isso que estão livres de forças; uma partı́cula livre pode ter qualquer energia(c) , ao passo que estes electrões têm uma energia que deve estar compreendida entre os limites da banda a que pertencem. Um análogo clássico do movimento destes electrões consiste numa esfera movendo-se num terreno ondulado, com energia suficiente para vencer a altura das ondulações do terreno. (c) Descontando o efeito de quantizações resultantes da imposição de condições fronteira que, de resto, é insignificante, neste contexto. 100 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS No estado fundamental (à temperatura de 0 K), somente as bandas de menor energia estão ocupadas pelos electrões; destas, a de maior energia tem particular importância para o estudo das propriedades dos sólidos, e designa-se por banda de valência do sólido. Esta designação é herdada do nome da orbital atómica (também designada por orbital de valência) que lhe dá origem. Vamos agora estudar as propriedades das funções de onda de electrões que se movem num potencial periódico. 6.2 O teorema de Bloch Já referimos que a função energia potencial dos electrões, sendo resultante da sua interacção com o meio cristalino, deve ser uma função periódica do espaço, com o mesmo perı́odo do cristal. A equação de Schrödinger independente do tempo é então ~2 2 − ∇ ψ(r) + V (r)ψ(r) = εψ(r), (6.1) 2m onde V (r) é uma função periódica com a periodicidade da rede cristalina. O teorema de Bloch afirma que as soluções da Eq. (6.1) têm a forma(d) ψk (r) = eik·r uk (r), (6.2) onde uk (r) é uma função periódica do cristal, isto é, que verifica uk (r + R) = uk (r), (6.3) qualquer que seja o vector da rede cristalina R. Um enunciado equivalente do teorema de Bloch é o seguinte: as soluções da equação de Schrödinger para potenciais cristalinos verificam a condição ψk (r + R) = eik·R ψk (r), (6.4) qualquer que seja o vector da rede cristalina R. É evidente que funções com a forma definida na Eq. (6.2) gozam desta propriedade. Com efeito, ψk (r + R) = = = eik·r eik·R uk (r + R) eik·r eik·R uk (r) eik·R ψk (r). A implicação inversa também é facilmente demostrável. De facto, é sempre possı́vel escrever qualquer função (e, portanto, também as soluções da equação de Schrödinger) na forma ψk (r) = eik·r f (r), desde que se escolha convenientemente a função f (r). Mas, para que uma função com esta forma satisfaça a propriedade da Eq. (6.4), é necessário que f (r + R) = f (r), qualquer que seja o vector da rede cristalina r, ou seja, que f apresente a periodicidade da rede cristalina exigida na Eq. (6.3). Agora que demosntrámos a equivalência dos dois enunciados do Teorema de Bloch, vamos passar à sua demonstração. Dada a periodicidade do arranjo atómico nos cristais (ideais), todas as funções da posição fisicamente observáveis devem apresentar a mesma periodicidade. A função de onda dos electrões não é uma função fisicamente observável, e por isso não é, necessariamente, uma função periódica. k é um parâmetro vectorial que identifica o estado electrónico. Ao contrário do parâmetro k que identifica os estados de electrões livres que temos estudado até agora, este não é proporcional ao momento linear dos electrões de Bloch. (d) 6.2. O TEOREMA DE BLOCH 101 Assim, sendo R um vector da rede cristalina, não podemos garantir a igualdade ψ(r + R) = ψ(r); podemos é, sem qualquer perda de generalidade, escrever ψ(r + R) = s(R)ψ(r), (6.5) escolhendo cuidadosamente a função s(R). Em contrapartida, o quadrado do módulo da função de onda é, de acordo com a interpretação de Max Born, igual à densidade de probabilidade de presença do electrão, ou seja, é uma função fisicamente observável. Logo, de acordo com o que se disse acima, deve ser uma função periódica da posição com a periodicidade da rede, isto é, deve verificar(e) ψ ∗ (r + R)ψ(r + R) = ψ ∗ (r)ψ(r). (6.6) Substituindo aqui a Eq. (6.5), resulta que o quadrado do módulo da função s é unitário, qualquer que seja o vector de rede R. Logo, esta função tem necessariamente a forma s(R) = eiχ(R) . Tomando então o caso particular R = a, onde a é um dos vectors fundamentais da rede cristalina, temos ψ(r + a) = eik·a ψ(r). Da mesma maneira, ψ(r + 2a) = = = ψ(r + a + a) eiχ(a) ψ(r + a) e2iχ(a) ψ(r) ou seja ainda, com n inteiro arbitrário, ψ(r + na) = einχ(a) ψ(r). Considerando agora deslocamentos nas direcções dos outros vectores fundamentais (b e c), e repetindo os mesmos argumentos que se aplicaram até agora, podemos concluir que a relação entre os valores da função de onda em pontos equivalentes do cristal é ψ(r + R) = ei[hχ(a)+kχ(b)+lχ(c)] ψ(r), (6.7) onde os inteiros h, k, l são as componentes cristalográficas do vector de rede R, isto é, se tem R = ha + kb + lc. Demonstrámos até agora que as soluções da equação de Schrödinger numa região onde está definido um potencial cristalino se transformam, sob translacções segundo vectores de rede de acordo com a Eq. (6.7). Os valores das três quantidades χ(a), χ(b), χ(c) distinguem as diferentes soluções entre si. Estas três quantidades podem podem ser usadas para definir as componentes de um vector k, através de k·a = χ(a) k·b = k·c = χ(b) χ(c). Assim, a soma hχ(a) + kχ(b) + lχ(c) pode escrever-se simplesmente como k · R, e a Eq. (6.7) fica ψ(r + R) = eik·R ψ(r), (6.8) (e) O asterisco em ψ ∗ representa o complexo conjugado de ψ. 102 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS uk(x) -2a -a a 2a a 2a 0 ψk(x) -2a -a 0 Figura 6.5: Exemplo de função de Bloch. No gráfico de cima está representada a função moduladora uk (x), com perı́odo a; no de baixo representa-se a função de onda propriamente dita, ψk (x), (a cheio), bem como a onda plana modulada exp(ikx) (a tracejado). em conformidade com o segundo enunciado do teorema de Bloch, concluindo-se assim a sua demonstração. A forma das funções de onda de electrões que se movem num cristal, apresentada na Eq. (6.2), é a de ondas planas monocromáticas eik·r , moduladas por funções com a periodicidade cristalina uk (r). Na Figura 6.5 apresenta-se um exemplo das funções uk (x) e ψk (x), numa situação unidimensional. 6.3 6.3.1 Propriedades dos estados de Bloch Periodicidade no espaço recı́proco Como já se disse, as diferentes soluções da equação de Schrödinger para os electrões num cristal distinguem-se pela forma como se transformam sob translacções segundo vectores da rede cristalina. Mais concretamente, distinguem-se pelas componentes do vector k, de acordo com a Eq. (6.4). Consideremos duas soluções particulares caracterizadas pelos vectores k e k0 = k + G, onde G é um vector da rede recı́proca do cristal qualquer. Segundo o teorema de Bloch, estas duas funções de onda transformam-se sob translacções segundo o vector da rede R como ψk (r + R) = eik·R ψk (r) ψk0 (r + R) = eik ·R ψk0 (r). 0 Explicitemos o vector k0 nesta última equação. Resulta então ψk+G (r + R) = ei(k+G)·R ψk+G (r). Recordemos agora que, por definição de vector da rede recı́proca, se tem que eiG·R = 1, para todos os vectores, G, da rede recı́proca e para todos os vectores, R, da rede directa. Então a função de onda ψk+G tem, sob translacções segundo vectores de rede, um comportamento idêntico ao da função ψk ; logo, estas duas funções são indistinguı́veis, ou seja, representam o mesmo estado electrónico. Para se evitar, no cálculo das propriedades da nuvem electrónica, a contabilização repetida da contribuição de um dado estado, devemos ter cuidado com este tipo de indistinguibilidade escondida das funções de onda. A forma mais simples de assegurar que não se cometem erros relacionados com esta questão é considerar apenas vectores k pertencentes todos a uma mesma célula unitária primitiva da rede recı́proca. Como se sabe, é sempre possı́vel escolher para qualquer rede uma grande diversidade de formas para as células unitária primitivas. Neste caso, escolhe-se sempre a célula de 6.3. PROPRIEDADES DOS ESTADOS DE BLOCH 103 Wigner-Seitz (ver a Secção 2.2, e a Figura 2.3) da rede recı́proca, mais usualmente conhecida como primeira zona de Brillouin. Uma consequência importante da indistinguibilidade de dois estados de Bloch cujos vectores k diferem entre si por um vector da rede recı́proca é que todas as propriedades fı́sicas dos estados electrónicos devem ser funções periódicas de k, com a periodicidade da rede recı́proca. Com efeito, seja X(k) o valor da propriedade X para um electrão num estado cuja função de onda é ψk ; uma vez que o mesmo estado pode ser representado por qualquer das funções ψk+G , com G vector arbitrário da rede recı́proca, o cálculo da propriedade X deve produzir o mesmo valor quando realizado a partir de qualquer destas funções, isto é, X(k + G) = X(k), 6.3.2 ∀ G vector da rede recı́proca. Nı́veis de energia dos estados de Bloch Substituindo na equação de Schrödinger as soluções de Bloch da Eq. (6.2), obtemos a equação diferencial a satisfazer pelas funções uk (r), − ~2 2 [∇ + ik] uk (r) + V (r)uk (r) = ε(k)uk (r). 2m (6.9) Esta equação, formalmente semelhante à equação de Shrödinger, é uma equação de valores próprios para o operador Hk = − ~2 2 [∇ + ik] + V (r), 2m que depende de um parâmetro vectorial que é o vector k. Para cada valor de k, este operador deve apresentar um conjunto de funções próprias, u1k (r), u2k (r), . . ., unk (r), . . ., às quais correspondem os valores próprios (nı́veis de energia) ε1 (k), ε2 (k), . . ., εn (k), . . ., e tanto aquelas como estes devem ser funções contı́nuas do parâmetro k. Mais ainda, como vimos na Secção 6.3.1, os diversos nı́veis de energia εn (k) devem ser funções periódicas de k. Ora, funções contı́nuas e periódicas são necessariamente funções limitadas, pelo que devemos ter cada nı́vel de energia εn (k) a tomar valores num intervalo bem limitado de energias. O espectro energético dos electrões num metal deve pois ter um aspecto que pode, qualitativamente, ser representado como mostra a Figura 6.6. Chama-se banda ao conjunto de estados electrónicos unk (r) para cada valor de n. Nesta figura apenas estão representados os valores de k pertencentes à primeira zona de Brillouin porque, como já vimos, vectores k fora desta região representam estados que já têm correspondência nalgum vector k no seu interior e portanto, neste sentido, são redundantes. Na Figura 6.6 as bandas de energia estão separadas por um intervalo de energias proibidas: esta situação corresponde ao que de facto se passa em muitos sólidos, mas é possı́vel (se bem que pouco frequente) que duas bandas de energia se sobreponham. Ao intervalo de energias proibidas entre duas bandas dá-se o nome de hiato energético, mas é mais usual a utilização da expressão, “aportuguesada” do inglês, “gap de energia”. Dentro de cada banda, a energia dos estados electrónicos é uma função periódica do vector k. Esta função é, em geral, muito mais complicada do que a que caracteriza os estados de electrões livres. A sua forma depende da estrutura cristalina do sólido em que se movem os electrões, que está representada, na equação que define a energia [Eq. (6.9)], pelo termo correspondente ao potencial electrónico V (r). Em geral, a energia de um estado depende também da direcção do vector k e não apenas do seu módulo, como acontece com os estados de electrões livres. Mas esta dependência não é de todo arbitrária. Vamos de seguida demonstrar que a energia 104 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS ε ε n n ε 3k n=3 ε 2k n=2 ε 1k n=1 − π /a (a) π /a k (b) Figura 6.6: (a) Nı́veis de energia atómicos, resultantes da resolução da equação de Schrödinger para um potencial atómico; (b) Bandas de energia dos estados electrónicos de um sólido. As bandas propriamente ditas são os intervalos representados a sombreado, ao longo do eixo da energia. As formas apresentadas para as funções εn (k) são arbitrárias. é uma função par de k, isto é, que εn (k) = εn (−k). (6.10) Tomando o complexo conjugado da Eq. (6.9) e fazendo a substituição k → −k obtemos − ~2 2 [∇ + ik] u∗n −k (r) + V (r)u∗n −k (r) = εn (−k)u∗n −k (r). 2m (6.11) onde u∗ representa o complexo conjugado de u(f) . Mas as eqs. (6.9) e (6.11) são idênticas e por isso as suas soluções devem ser as mesmas; logo, podemos concluir que u∗n−k (r) = unk (r) e, mais importante para o que nos interessa, εn (k) = εn (−k), como querı́amos demonstrar. 6.3.3 Momento linear As funções de onda de Bloch, ψk (r), representam os estados estacionários de electrões que se movem numa região (o cristal) onde a sua energia potencial, que traduz as interacções com o meio, é uma função periódica da posição. A expressão “estados estacionários” significa que um electrão que ocupe um destes estados permanece nele enquanto não for perturbado por agentes externos ou por alterações do meio em que se move (defeitos no cristal, por ecemplo). Estes estados distinguem-se entre si pelo parâmetro vectorial k, que está relacionado com a forma como se transformam sob translacções segundo vectores da rede. Isto é, o vector k (de que não conhecemos ainda o significado fı́sico) é uma constante do movimento de um electrão de Bloch no estado ψk . Por outro lado, o momento linear de um electrão de Bloch não deve ser uma constante do movimento, já que um electrão que se move numa região onde está definido um potencial periódico está sujeito a forças que se traduzem em acelerações, ou seja, em alterações do seu momento linear. Assim, (f) As energias são grandezas reais e por isso V ∗ (r ) = V (r ) e ε∗n (k) = εn (k). 6.3. PROPRIEDADES DOS ESTADOS DE BLOCH 105 não podemos identificar ~k com o momento linear dos electrões no estado de Bloch ψk , como fizemos no estudo dos electrões livres. Esta conclusão é ainda reforçada pela aplicação do operador quantidade de movimento ao estado ψk . De acordo com as regras da Mecânica Quântica, os estados caracterizados por valores bem determidados do momento linear são os estados próprios do operador associado a este observável, P̂ = −i~∇. Ora, com ψk dado pela Eq. (6.2), temos P̂ ψk (r) = eik·r (~k − i~∇) uk (r), expressão que não corresponde a uma equação de valores próprios. Assim, as funções de Bloch não são funções próprias do operador do momento linear e, portanto, um electrão num estado de Bloch não apresenta um valor bem determinado deste observável. No entanto, o vector ~k tem, como veremos já de seguida, um papel importante na dinâmica dos electrões de condução nos metais, muito semelhante ao do momento linear de electrões livres. Para realçar esta semelhança formal, dá-se o nome de momento linear cristalino de um electrão no estado de Bloch ψk ao vector ~k. Usaremos também a expressão “vector de onda cristalino” para nos referirmos ao vector k. 6.3.4 Velocidade média e momento linear cristalino A expressão para o cálculo da velocidade de electrões livres, v = ~k/m, não pode ser adoptada para electrões em estados de Bloch, uma vez que o seu momento linear não é dado por p = ~k. Como já se disse, electrões em estados de Bloch não apresentam um momento linear bem determinado e, logo, o mesmo se passa com a velocidade. Podemos, quando muito, determinar os resultados possı́veis de uma medição da velocidade e as respectivas probabilidades e, a partir destes valores, calcular o valor expectável da velocidade. Um problema relacionado com este é o da determinação da velocidade de propagação de um sinal que não é caracterizado por um comprimento de onda bem determinado. Uma perturbação puramente sinusoidal (isto é, uma onda com comprimento de onda, λ, e frequência, ν, bem determinados) propaga-se no meio que a suporta com uma velocidade, chamada velocidade de fase, cujo módulo é v = λν = ω , k (6.12) onde se introduziram os parâmetros ω = 2πν e k = 2π/λ. A dificuldade do cálculo da velocidade de sinais não puramente sinusoidais é a seguinte. Consideremos um sinal não sinusoidal arbitrário f (x, t) (esta função pode, por exemplo, representar o som de um trovão). É possı́vel escrever a função f (x, t) como combinação linear de funções sinusoidais com diferentes frequências e comprimentos de onda, usando as técnicas da análise de Fourier. Descrevemos desta maneira o sinal em questão como a sobreposição de várias funções puramente sinusoidais. Cada uma destas componentes sinusoidais, caracterizada por valores bem determinados de k e de ω, tem uma velocidade de fase dada pela Eq. (6.12), mas as velocidades das diferentes componentes não são, em geral, todas iguais, logo, não podem ser identificadas com a velocidade da propagação do sinal. Em vez disso, identifica-se esta velocidade de propagação com a do ponto onde o sinal tem amplitude máxima. Este valor tem o nome de velocidade de grupo do sinal. Pode demonstrar-se que a velocidade de grupo é dada por dω vG = . (6.13) dk Note-se que para ondas puramente sinusoidais, a velocidade de fase é igual à de grupo. 106 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS ky v k k kx v Figura 6.7: A velocidade, v , e o vector de onda cristalino k. A velocidade é, para cada estado k, perpendicular à superfı́cie de nı́vel da energia para esse valor de k. . Voltemos agora ao problema que motivou esta pequena digressão, o problema da velocidade dos electrões em cristais. A velocidade média das partı́culas quânticas é, em geral, identificada com a velocidade de grupo da sua função de onda. Assim, dizemos que a velocidade média de um electrão num estado de Bloch ψk é v(k) = dω(k) 1 d²(k) = , dk ~ dk onde se usou a bem conhecida igualdade de Plank ² = ~ω. Introduzindo agora o operador gradiente no espaço recı́proco, dado por gradk ≡ î ∂ ∂ ∂ + ĵ + k̂ , ∂kx ∂ky ∂kz obtemos a generalização tridimensional da definição de velocidade média dos electrões de Bloch: 1 v G = gradk ω(k) = gradk ε(k). (6.14) ~ Note-se que a velocidade de grupo de um electrão num estado de Bloch não representa a sua velocidade instantânea. De facto, a velocidade de grupo de um electrão é constante e bem definida, permanece inalterada enquanto o electrão não sofrer uma transição de estado. Em contrapartida, a velocidade instantânea de um electrão de Bloch está continuamente a variar, como efeito das acelerações resultantes da sua interacção com o cristal de iões. A velocidade de grupo, que identificamos com a velocidade dos electrões, representa o valor expectável do observável velocidade. É, assim, o valor médio da velocidade dos electrões nos estados de Bloch. Como é bem sabido, o gradiente de uma função tem a direcção em que é máxima a variação da função, perpendicular às suas superfı́cies de nı́vel. Logo, a velocidade de um electrão de Bloch, num estado com vector de onda cristalino k, é perpendicular à superfı́cie de nı́vel da energia nesse ponto k. Em particular, os electrões que se encontram na superfı́ce de Fermi têm uma velocidade que é perpendicular a essa superfı́cie (veja a Figura 6.7). Um electrão num estado de Bloch, sujeito apenas à interacção com um cristal ideal, tem uma energia bem definida, constante do movimento. Contudo, se se definir no cristal, para além dos campos que que são intrinsecamente caracterı́sticos, um campo de forças externas, F , então o electrão adquire desse campo de forças energia, a uma taxa temporal igual a dε = v · F, dt (6.15) sendo v o vector velocidade média do electrão em estudo. Mas a velocidade média 6.3. PROPRIEDADES DOS ESTADOS DE BLOCH 107 é uma caracterı́stica do estado, ou seja, é uma função de k. Logo, dε ∂ε dki = . dt ∂ki dt Adoptou-se aqui a covenção de soma sobre ı́ndices repetidos de Einstein, isto é, subentende-se uma soma para todos os valores do ı́ndice i = 1, 2, 3 no lado direito desta expressão. Esta convenção será adoptada daqui em diante, salvo indicações explı́citas em contrário. Substituindo esta expressão na Eq. (6.15), obtemos ∂ε dkj = vj F j . ∂kj dt Usando agora a fórmula da velocidade [Eq. (6.14)], podemos reescrever a expressão acima como dkj ~vj = vj Fj , dt ou seja, d (~kj ) = Fj . (6.16) dt Esta equação é semelhante à que traduz a segunda lei de Newton, F = dp , dt com o vector ~k a desempenhar o papel de momento linear dos electrões de Bloch. No entanto, voltamos a recordar que,para a taxa de variação do momento linear dos electrões no cristal contribuem as forças exteriores F , mas contribuem também as forças de interacção com o cristal de iões, forças essas que não são contabilizadas na Eq. (6.16. Assim, podemos considerar o vector ~k como uma espécie de momento linear efectivo dos electrões num cristal, conceito que permite algumas simplificações, já que apenas as forças exteriores ao cristal contribuem para a sua modificação. 6.3.5 Massa efectiva dos electrões de Bloch Consideremos agora um electrão de Bloch sujeito a uma força externa F . A aceleração que adquire por estar sob a acção desta força pode ser calculada como ai = dvi ∂vi dkj = . dt ∂kj dt Substituindo aqui a expressão da velocidade dos electrões de Bloch e da derivada do momento linear cristalino [respectivamente, as eqs. (6.14) e (6.16)], obtemos ai = 1 ∂2ε Fj . ~2 ∂ki ∂kj (6.17) Esta expressão é muito parecida com a da segunda lei de Newton(g) e exprime a aceleração de um electão que se move num cristal como resultado apenas das forças que sobre ele actuam exteriores ao cristal, não considerando a influência das interações com o cristal. Este resultado é, obviamente, extremamente útil e prático, mas o preço a pagar por esta simplificação é a introdução de um parâmetro (g) As leis da Fı́sica Clássica, não têm nada que ser satisfeitas por electrões, poderão dizer. Assim é, de facto. Mas note-se que a aceleração a em (6.17) é a derivada do valor expectável da velocidade que, de acordo com o teorema de Ehrenfest, satisfaz uma expressão formalmente semelhante à lei fundamental da dinâmica de Newton. 108 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS matricial variável que substitui a massa dos electrões de Bloch, chamado tensor da massa efectiva, que se representa por m∗ e é a matriz inversa da matriz −1 [m∗ ]ij = 1 ∂2ε . ~2 ∂ki ∂kj (6.18) Um electrão move-se num cristal de forma bastante complicada, sujeito como está às forças exercidas pelos átomos que formam o cristal, mas acabámos de ver que podemos simplificar bastante o seu estudo, substituindo na lei do movimento a sua massa pelo tensor da massa efectiva, após o que basta apenas considerar, nas leis do movimento, as forças exteriores, como campos eléctricos aplicados, etc. Claro que a matriz da massa efectiva tem que apresentar algumas particularidades que não esperamos da massa dos objectos comuns. Por exemplo, em geral a aceleração de um electrão de Bloch não tem a direcção da força que a provoca. Além disso, a matriz da massa efectiva é variável, as suas componentes têm valores diferentes conforme a magnitude e a orientação do vector k. Assim, pode acontecer que dois campos de forças iguais, mas com orientações diferentes, produzam acelerações diferentes. Desta maneira, podemos explicar porque é que alguns sólidos (a grafite, p. ex.) apresentam condutividades que variam com a orientação da corrente eléctrica. É também possı́vel que, para valores particulares de k, algumas componentes (ou mesmo todas) do tensor da massa efectiva sejam negativas; nestes casos, campos aplicados numa direcção produzem correntes com direcções opostas... Já agora, é interessante verificar qual a forma do tensor de massa efectiva para electrões livres, situação que conhecemos melhor. O movimento de electrões livres é, de facto, apenas condicionado pelas forças exteriores ao cristal, uma vez que as forças internas são desprezadas. Então esperamos que a massa efectiva seja neste caso igual à massa real. De facto, a aplicação da Eq. (6.18) com a função energia de electrões livres, dada por ~2 k 2 ε(k) = , 2m permite obter o resultado −1 1 [m∗ ]ij = δij , m onde δij é o sı́mbolo delta de Kronecker, cujos elementos são os da matriz identidade, ½ 0, i 6= j δij = 1, i = j. −1 Assim, a matriz [m∗ ] é diagonal e todos os seus elementos são iguais, logo a sua inversa, que é o tensor da massa efectiva, é, simplesmente, [m∗ ]ij = mδij , como já esperávamos. 6.3.6 O livre caminho médio Vimos no capı́tulo anterior que é difı́cil entender os valores obtidos no quadro dos modelos de electrões livres para o livre caminho médio dos electrões, que considerámos demasiado elevado. Com efeito, nos modelos de electrões livres, supõe-se que os electrões de condução sofrem colisões com os iões que formam o cristal, mas os valores previstos para o livre caminho médio resultam ser centenas de vezes superiores à distância interatómica, para temperaturas próximas da temperatura ambiente. 6.4. MODELO DE KRÖNIG-PENNEY 109 Este problema é clarificado no quadro da teoria de Bloch, mas devemos, antes de mais, clarificar o significado de colisão. Uma colisão entre dois corpos é uma alteração dos seus estados de movimentos como resultado da interacção mútua. Classicamente, caracterizamos o estado de movimento de uma massa pontual através do seu momento linear; uma colisão entre dois corpos clássicos pontuais é pois um processo de influência mútua em que se alteram os seu momentos lineares. Nos modelos de electrões livres, o estado de um electrão é especificado pelo vector k, que é proporcional ao momento linear. As colisões destas partı́culas com os iões da rede provocam alterações no vector k, ou seja, na quantidade de movimento. Na mesma ordem de idéias, devemos aceitar que, na teoria de Bloch, a colisão de um electrão com o que quer que seja deve manifestar-se como uma alteração do seu estado, isto é, como uma alteração do vector k. Mas, já se disse, um electrão que ocupa, num cristal ideal, um estado de Bloch ψnk (r), permanece nesse estado se não se verificarem influências externas que o perturbem, porque os estados de Bloch têm já em linha de conta as interacções com a rede cristalina. Assim, neste sentido, os electrões de Bloch não sofrem colisões com os iões da rede. Podem, isso sim, modificar o seu estado, mas apenas por colisões contra as fronteiras do cristal, contra fonões (vibrações do cristal), contra impurezas, em suma, contra defeitos no cristal, qualquer que seja a sua natureza. Ora, os defeitos cristalinos estão muito mais afastados entre si do que os iões da rede, pelo que se percebem agora os elevados valores que obtivemos para o livre caminho médio dos electrões. A conclusão é a seguinte: tanto quanto se possa considerar o cristal como perfeito (isto é, absolutamente periódico), os electrões não sofrem modificação de estado, ou seja, colisões; estas devem ocorrer nas excepções à periodicidade, isto é, nos defeitos cristalinos. Os electrões de Bloch não sofrem colisões com os átomos regularmente dispostos no cristal, mas apenas com os defeitos no cristal, que estão mais afastados entre si que os átomos que o constituem. Por esta razão, o caminho livre médio dos electrões de condução deve ser muito maior do que as distâncias interatómicas tı́picas nos sólidos, em conformidade com os resultados obtidos no quadro dos modelos de electrões livres. 6.4 Modelo de Krönig-Penney Vamos agora ilustrar o conteúdo das secções precedentes recorrendo a um modelo simples de cristal unidimensional, o modelo de Krönig-Penney. Este modelo descreve os estados de uma partı́cula quântica que se move numa região onde está definido um potencial que é uma sucessão de barreiras de potencial rectangular idênticas, regularmente espaçadas entre si (ver a Figura 6.8). Nós vamos usar uma versão particularmente simples do deste modelo, em que a largura, l, das barreiras tende para zero, enquanto a sua altura, V , cresce de maneira a manter constante o produto lV . No limite, cada barreira fica igual a uma função delta de Dirac(h) . A função potencial que vamos usar é então V (x) = ∞ ~2 λ X δ(x − na), 2m a n=−∞ (6.19) (h) A função delta só é diferente de zero num único ponto, mas o seu integral em qualquer intervalo que contenha esse ponto é 1. Mais rigorosamente, a função delta define-se através das seguintes propriedades: δ(x − a) = 0, se x 6= a Z a+² f (x)δ(x − a) = f (a), ∀² > 0. a−² 110 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS V(x) V x a l V(x) x -2a -a 0 a 2a Figura 6.8: Potencial do modelo de Krönig-Penney (em cima). Em baixo, o potencial usado neste trabalho: a largura, l, das barreiras diminui até zero, enquanto a sua altura, V , aumenta indefinidamente, de tal forma que o produto lV permanece constante. onde λ é um parâmetro adimensional que pode ser usado para regular a intensidade do potencial cristalino. Podemos até estudar o limite de electrões livres escolhendo λ = 0. Este potencial é um caso particular dos potenciais contı́nuos por intervalos que se constumam estudar nas disciplinas de introdução à Mecânica Quântica. A resolução da equação de Schrödinger nestes casos é feita separadamente em cada região de continuidade do potencial, impondo-se em seguida condições de continuidade da função de onda nos pontos em que o potencial é descontı́nuo. Vamos então dividir a recta real em regiões de continuidade da função potencial, que designaremos por R0 , R±1 , R±2 . . . , sendo Rn o intervalo (n − 1)a < x < na. Em qualquer destas regiões, a equação de Schrödinger escreve-se como − ~2 d2 ψ = ²ψ 2m dx2 e, para ² positivo, admite soluções do tipo (tomamos a região Rn para concretizar a discussão) ψ (n) (x) = Xn eikx + Yn e−ikx ou, equivalentemente (basta tomar An = Xn eikna , Bn = Yn e−ikna ), ψ (n) (x) = An eik(x−na) + Bn e−ik(x−na) . (6.20) Nestas expressões, k está relacionado com a energia do estado, ², através de k2 = 2m² . ~2 (6.21) Na região contı́gua Rn+1 , e usando as mesmas convenções, a função de onda escrevese ψ (n+1) (x) = An+1 eik(x−[n+1]a) + Bn+1 e−ik(x−[n+1]a) . (6.22) A solução da equação de Schrödinger é a união das diferentes funções ψ (n) , união essa que deve ser feita de modo a satisfazer certas comdições de continuidade. Antes, porém, de estudarmos a continuidade da função de onda, devemos notar que, sendo o potencial uma função periódica da posição, estamos nas condições do teorema de Bloch. Logo, as soluções da equação de Schrödinger devem satisfazer a condição ψq (x + a) = eiqa ψq (x), 6.4. MODELO DE KRÖNIG-PENNEY 111 onde q é um parâmetro real, que caracteriza a função de onda particular ψq tal como os números n, l, ml , ms caracterizam as funções de onda de electrões atómicos. Note-se que esta condição envolve o valor da função de onda em diferentes células unitárias do nosso cristal unidimensional, ou diferentes regiões, de acordo com a designação que temos usado. Tomando x na região Rn , x + a pertence à região Rn+1 ; a condição de Bloch pode pois escrever-se como ψq(n+1) (x + a) = eiqa ψq(n) (x), ou seja, h i An+1 eik(x−na) + Bn+1 e−ik(x−na) = eiqa An eik(x−na) + Bn e−ik(x−na) . Agrupando potências com expoentes iguais, obtemos £ ¤ £ ¤ eik(x−na) An+1 − eiqa An + e−ik(x−na) Bn+1 − eiqa Bn = 0, que só pode ser satisfeita para todos os valores de x se se anularem os coeficientes das exponenciais, isto é, se An+1 Bn+1 = = eiqa An eiqa Bn (6.23) Faremos uso destas relações mais adiante. Vamos agora estudar as condições fronteira a satisfazer pela função de onda. Em primeiro lugar, a função de onda deve ser uma função contı́nua. Assim, num ponto x = na que é partilhado pelas regiões Rn e Rn+1 , devemos ter ψ (n) (na) = ψ (n+1) (na), ou seja, An+1 e−ika + Bn+1 eika = An + Bn . (6.24) Quando o potencial não tem descontinuidades infinitas, a derivada da função de onda é, também, uma função contı́nua, mas esse não é o caso aqui. Para deduzirmos a forma das condições fronteira a satisfazer pela derivada da função de onda, integremos a equação de Schrödinger, − ~2 d2 ψ + V (x)ψ(x) = ²ψ(x), 2m dx2 num pequeno intervalo centrado num ponto x0 , com largura 2δ. Temos então Z x0 +δ 2 Z x0 +δ Z x0 +δ ~2 d ψ − + V (x)ψ(x)dx = ² ψ(x)dx. 2m x0 −δ dx2 x0 −δ x0 −δ No limite em que δ → 0, o integral no segundo membro desta equação anula-se, porque a função de onda é contı́nua; o primeiro integral é fácil de calcular, por ser o integral de uma derivada. Resulta então "µ ¶ # µ ¶ Z x0 +δ dψ dψ ~2 lim − + lim V (x)ψ(x)dx = 0, − δ→0 x −δ 2m δ→0 dx x0 +δ dx x0 −δ 0 ou ainda µ dψ dx ¶ µ − x0 + dψ dx ¶ x0 − 2m = 2 lim ~ δ→0 Z x0 +δ V (x)ψ(x)dx, (6.25) x0 −δ onde (F )x0 ± representa o limite de F quando o seu argumento tende para x0 por valores superiores a x0 (sinal +) ou por valores inferiores a x0 (sinal -). Esta condição de continuidade para a derivada da função de onda tem validade geral, 112 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS em problemas unidimensionais. No nosso caso, atendendo à forma particular do potencial, temos, para x0 = na, Z na+δ ~2 λ V (x)ψ(x)dx = ψ(x = na). 2m a na−δ Por outro lado, as duas derivadas obtêm-se facilmente a partir das expressões [eqs. (6.20) e (6.22)] da função de onda nas duas regiões separadas pelo ponto de abcissa x = na: dψ (n) dx dψ (n+1) dx = ikAn eik(x−na) − ikBn e−ik(x−na) = ikAn+1 eik(x−[n+1]a) − ikBn+1 e−ik(x−[n+1]a) . Então, podemos escrever a condição geral da Eq. (6.25) como µ ¶ µ ¶ iλ iλ −ika ika An+1 e − Bn 1 + . − Bn+1 e = An 1 − ka ka (6.26) Usando agora a Eq. (6.23) para eliminar os coeficientes An+1 e Bn+1 das eqs. (6.24) e (6.26), obtemos o seguinte sistema de duas equações homogéneas: h i h i ei(q−k)a − 1 An + ei(q+k)a − 1 Bn = 0 ¸ · ¸ · iλ iλ i(q+k)a i(q−k)a An − e −1− Bn = 0. e −1+ ka ka Como qualquer sistema homogénio, este admite a solução trivial An = 0 = Bn = 0, ou seja, ψ = 0, que não nos interessa. Soluções não triviais verificam-se apenas quando o determinante da matriz formada com os coeficientes do sistema se anular. Após algumas manipulações algébricas, esta condição leva à seguinte equação transcendental: λ sin ka cos qa = cos ka + . (6.27) 2 ka Esta igualdade define uma relação entre o parêmetro q que caracteriza as diferentes soluções da equação de Schrödinger e o parâmetro k que define a energia dessas soluções. Dado um valor de q “basta” resolver esta equação em ordem a k para obter a energia correspondente, usando a relação da Eq. (6.21). Infelizmente, esta relação entre k e q é transcendental, logo, não pode ser resolvida analiticamente. Além disso, para certos valores de k não é possı́vel verificá-la. Com efeito, o lado esquerdo está limitado ao intervalo [−1, 1]; logo, não podem existir soluções para todos os valores de k em que o lado direito saia deste intervalo. Na Figura 6.9 apresenta-se o gráfico da função no lado direito desta equação, assinalando-se as regiões em que não existem soluções não triviais. Como a energia de um estado depende do valor de k [ver a Eq. (6.21)], estes intervalos para os quais não há soluções da equação de Schrödinger correspondem a hiatos de energia. Não há estados estacinários de uma partı́cula num potencial de Krönig-Penney com energia situada nesses intervalos proibidos. Como se disse, a igualdade da Eq. (6.27) relaciona a energia dos estados permitidos (através da interposta “pessoa” do parâmetro k) com o parâmetro q que os carateriza. Essa relação não pode ser explicitada analiticamente, porque a Eq. (6.27) é uma equação transcendental. No entanto, podemos tentar a seguinte abordagem numérica: dado um valor de q, variamos k (e, portanto, ²) até que a diferença entre os valores dos dois lados da Eq. (6.27) seja menor que um determinado limiar, caso em que dizemos que a igualdade foi satisfeita. Usando este processo, muito 6.4. MODELO DE KRÖNIG-PENNEY 113 4 3 2 1 x=ka 0 2 4 6 8 10 12 -1 Figura 6.9: Gráfico da função no segundo membro da Eq. (6.27). Para os valores da abcissa (x = ka) nas regiões sombreadas, não existem soluções da equação de Schrödinger; correspondem aos gaps de energia. ε(k) ε(k) 3a banda 2a banda q 1a banda - π/a 0 π/a q - π/a 0 π/a Figura 6.10: Estrutura de bandas do modelo de Krönig-Penney. Notam-se claramente os hiatos energéticos. Para comparação, apresenta-se à direita a estrutura de “bandas” no modelo de electrões livres, obtida escolhendo λ = 0 no potencial da Eq. (6.19). A presença do potencial periódico abre os gaps, deformando ligeiramente a curva ²(q) na fronteira da zona de Brillouin e “empurrando” para cima os ramos superiores dessa curva. 114 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS rudimentar, foi possı́vel desenhar o gráfico da Figura 6.10. Escolheu-se para λ o valor λ = 2π. Note-se que, com λ = 0, o potencial é constante, pelo que o potencial de Krönig-Penney nesse caso é o de partı́culas livres. Nesse caso, a Eq. (6.27) fica simplesmente cos qa = cos ka, que tem como solução k = q, e a energia fica ² = ~2 q 2 /2m, a expressão caracterı́stica de partı́culas livres, que também é apresentada na Figura 6.10. 6.5 Número de estados por banda A resolução de uma equação diferencial (como a de Schrödinger) não fica completa sem a imposição de condições a satisfazer pela solução particular requerida. Apesar de não resolvermos completamente a equação de Schrödinger [ou a sua versão de Bloch (6.9)] é útil a imposição de condições fronteira, que reduzem número de estados de Bloch que é necessário considerar. Pelas razões já apresentadas na Secção 4.2, escolhemos as condições fronteira periódicas. No entanto, em vez de as aplicarmos a um volume cúbico de aresta L, é mais conveniente [devido à presença da função periódica unk (r) na expressão geral dos estados de Bloch (6.2)] considerar um volume com a forma da célula unitária primitiva do cristal em estudo, contendo um número inteiro, N , destas células unitárias primitivas (ver a Figura 6.11). As di- Nc c b Nb b Na a c a Figura 6.11: Forma da região considerada na imposição das condições fronteira. mensões lineares desta região são Na |a|, Nb |b| e Nc |c| onde Na , Nb e Nc são números inteiros, tais que o número de células unitárias, N , presentes no volume considerado é dado por N = Na Nb Nc . As condições fronteira periódicas podem então ser expressas como ψnk (r + Na a) = ψnk (r) ψnk (r + Nb b) = ψnk (r) ψnk (r + Nc c) = ψnk (r). (6.28) De acordo com o teorema de Bloch, a primeira das equações em (6.28) pode ainda ser escrita na forma eiNa k·a ψnk (r) = ψnk (r) ou ainda eiNa k·a = 1. 6.6. O ESTADO FUNDAMENTAL DA NUVEM ELECTRÓNICA 115 De igual modo, obtemos para a segunda e terceira das eqs. (6.28) eiNb k·b eiNc k·c = 1 = 1. Recordando a definição de vector da rede recı́proca, verificamos que estas igualdades são verificadas se o vector k fôr da forma ma mb mc k= A+ B+ C, (6.29) Na Nb Nc onde ma , mb e mc são inteiros arbitrários e A, B e C são os vectores fundamentais primitivos da rede recı́proca. Note-se que Eq. (6.29) não implica que k seja um vector da rede recı́proca, porque ma /Na , mb /Nb e mc /Nc não são, necessariamente, números inteiros. Tal como para os electrões livres, verificamos que os estados electrónicos permitidos formam um conjunto discreto, porque k só pode assumir os valores definidos pela Eq. (6.29). Os valores permitidos para o vector k formam uma rede cristalina, com vectores fundamentais primitivos A/Na , B/Nb e C/Nc . Estamos agora em condições de determinar o número de estados numa banda. Como se disse, devemos considerar apenas vectores k pertencentes a uma única célula unitária primitiva da rede recı́proca, que tem um volume Ω = |A · B × C|. (6.30) Por outro lado, o volume de espaço-k ocupado por cada um dos vectores k permitidos é o volume da célula unitária primitiva da rede por eles definida, de acordo com a Eq. (6.29), ¯ ¯ ¯A B C ¯¯ ¯ τ = ¯ · × Na Nb Nc ¯ Ω 1 |A · B × C| = . = Na Nb Nc N O número de vectores k que “cabem” numa célula é então o volume disponı́vel, Ω, a dividir pelo volume ocupado por cada um, τ , ou seja, N . Considerando ainda que para cada valor de k existem dois estados electrónicos (spin up ou spin down), concluimos que o número total de estados numa banda é 2N , onde, recorda-se, N é o número total de células unitárias primitivas que formam a região considerada para a imposição das condições fronteira. Este facto também se pode entender recordando que, no aparecimento das bandas de energia no processo de formação dos sólidos, não aumenta o número de estados electrónicos. A banda de valência resulta de combinações lineares de um grande número (seja N esse número) de orbitais atómicas (uma por cada átomo). Cada orbital atómica pode acomodar dois electrões (com orientações de spin opostas), logo, o conjunto deve conter 2N estados electrónicos. 6.6 O estado fundamental da nuvem electrónica Já vimos como a proximidade dos átomos num cristal leva ao desenvolvimento de um espectro de bandas, em vez dos nı́veis de energia bem definidos que caracterizam os átomos isolados. Cada uma destas bandas é populada por electrões provenientes de cada um dos átomos que formam o cristal. Para simplificar a discussão, iremos considerar cristais monoatómicos (formados por apenas uma espécie quı́mica), com um átomo apenas por célula unitária (i) . Considerando um cristal com N átomos, (i) Os argumentos que se seguem não são aplicáveis ao cloreto de sódio (cristal biatómico) ou ao diamante (dois átomos por célula unitária primitiva). 116 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS e portanto com N células unitárias primitivas, o número de estados em cada banda é 2N , como vimos na secção anterior. O estado fundamental do sistema de electrões de Bloch é, essencialmente, definido do mesmo modo que para os electrões livres: todos os estados de baixa energia devem estar ocupados por electrões. As bandas correspondentes aos nı́veis atómicos de mais baixa energia, que no estado fundamental de cada átomo estão totalmente preenchidas, ficam igualmente totalmente preenchidas. No estado fundamental de cada átomo, apenas a orbital de valência pode conter estados electrónicos desocupados. A banda que resulta desta orbital pode então estar também apenas parcialmente preenchida (ver a Figura 6.12). A esta banda dá-se o nome de banda Ε < 2N electrões 2N electrões 2N electrões Figura 6.12: Ocupação das diferentes bandas de um metal. de valência. Tal como fizemos no estudo do modelo de electrões livres, podemos “construir” o estado fundamental do sistema de electrões de Bloch, ocupando com os electrões atómicos os nı́veis de Bloch de energia sucessivamente maior. Devemos pois começar na primeira banda, preenchendo-a totalmente antes de começar a ocupar a segunda, e assim sucessivamente até à banda de valência. Para cada banda, devemos começar a ocupar estados com k tal que correspondam a baixos valores de energia. No caso dos electrões livres, a energia era simplesmente ε(k) = ~2 k 2 /2m; dependendo a energia apenas do módulo do vector k, este processo de “estacionar” electrões livres em nı́veis de energia sucessivamente maior resultava em superfı́cies de Fermi com forma esférica. A situação é agora mais complicada, já que, em geral, as funções εn (k) dependem também da direcção de k. Assim, para os electrões de Bloch, a forma da superfı́cie de Fermi não é, em geral, esférica, podendo apresentar configurações extremamente complexas. No entanto, estas formas devem manter as simetrias da rede recı́proca. Um caso particular destas simetrias é o da paridade da energia, expresso em (6.10). Uma vez que εn (k) = εn (−k), devemos, após o preenchimento do nı́vel k com dois electrões (um com spin up e outro com spin down) e antes de preencher outro nı́vel qualquer com energia superior, ocupar estados com energia igual a εn (k) entre os quais, necessariamente, o estado com momento cristalino igual a −k. No estado fundamental do sistema, então deve verificar-se que, se um estado ψnk se encontra preenchido, também o estará o estado ψn−k ; ao contrário, se o estado ψnk está desocupado, também ψn−k o está. Assim, vemos que a superfı́cie de Fermi deve apresentar simetria de inversão, isto é, deve ficar invariante sob a operação k → −k. Na Figura 6.13 representa-se a superfı́cie de 6.7. A CONDUÇÃO ELÉCTRICA 117 ky 1ª zona de Brillouim kx Figura 6.13: Forma possı́vel da superfı́cie de Fermi para um cristal quadrado 2D. Note-se que outras formas são possı́veis, pois a apresentada é apenas um exemplo. Note-se também que esta superfı́cie de Fermi corresponde a uma banda não totalmente preenchida, porque há ainda espaço disponı́vel na primeira zona de Brillouin para “albergar” outros electrões. Fermi para um cristal quadrado bidimensional. Como já vimos, a velocidade média de um electrão de Bloch é a sua velocidade de grupo: 1 v n (k) = gradk εn (k). (6.31) ~ Sendo εn (k) uma função par de k, o seu gradiente é uma função ı́mpar de k. Então a velocidade de um electrão cuja função de onda é ψnk deve ser igual, mas oposta, à de outro com função de onda ψn−k . Mas como já vimos atrás, os estados ψnk e ψn−k estão ambos ocupados ou ambos desocupados, no estado fundamental colectivo. Então, no cálculo da velocidade média dos electrões, as contribuições dos estados ψnk e ψn−k cancelam-se mutuamente. Como o valor de k considerado nesta discussão é arbitrário, concluimos que a velocidade média dos electrões no estado fundamental colectivo é zero. Note-se que nos referimos a uma média vectorial, e que não consideramos a presença de campos de forças (eléctricas, por exemplo) que, deformando a superfı́cie de Fermi, destruı́riam esta argumentação. 6.7 A condução eléctrica Consideremos agora o efeito de um campo eléctrico (de grandeza tı́pica) na situação que acabámos de descrever. Tal como no caso dos electrões livres, um campo eléctrico manifesta-se através de um deslocamento da superfı́cie de Fermi na direcção contrária ao campo, deixando de ficar centrada no ponto k = 0, se este deslocamento for possı́vel. Os argumentos apresentados no final da secção anterior já não se aplicam (porque, por exemplo, ψnk pode estar ocupado sem que ψn−k o esteja [veja a Figura 6.14]) e, a ser este deslocamento da superfı́cie de Fermi possı́vel, a velocidade média da nuvem electrónica deixa de ser nula, verificando-se o aparecimento de uma corrente eléctrica. Mas este deslocamento da superfı́cie de Fermi só é possı́vel se a banda de valência não estiver totalmente preenchida, porque, em caso contrário, alguns electrões seriam obrigados a ocupar estados na região proibida. Assim, concluimos que uma banda totalmente preenchida é inerte para efeitos de condução eléctrica. Como apenas a banda de valência de um sólido pode, no estado fundamental (ou, seja à temperatura de 0 K), estar parcialmente preenchida, somente esta é responsável pelas propriedades eléctricas dos sólidos. A teoria de Bloch permite 118 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS E =0 E ky kx ky kx Figura 6.14: Deslocamento da superfı́cie de Fermi sob o efeito de um campo eléctrico. Se a banda de valência estiver totalmente preenchida, a superfı́cie de Fermi é também a fronteira da região proı́bida, impossibilitando o deslocamento da superfı́cie de Fermi, ou seja, a condução eléctrica. pois explicar porque é que alguns sólidos são condutores e outros isoladores: em princı́pio, se a banda de valência de um sólido estiver totalmente preenchida, o sólido é isolador; caso contrário, é condutor. Esta regra tem algumas excepções, já que nalguns sólidos a banda de condução sobrepoem-se com a banda de valência, permitindo a condução mesmo estando esta totalmente preenchida. Considerando apenas sólidos cristalinos monoatómicos com um átomo por célula unitária primitiva, podemos apresentar este critério a um nı́vel mais fundamental. Os electrões presentes na banda de valência de um sólido são os que, nos átomos isolados, ocupam o nı́vel de valência. Se N for o número total de átomos no sólido, então porque consideramos apenas sólidos com um átomo por célula unitária primitiva, N é também o número de células unitárias no sólido, e o número de estados na banda de valência é então 2N . Logo, se os N átomos que formam o sólido tiverem apenas um electrão de valência, dos 2N estados disponı́veis na banda de valência, apenas N estão ocupados e portanto o sólido é um condutor. Em contrapartida, se os átomos em questão tiverem dois electrões de valência, a banda de valência do sólido ficou totalmente preenchida e portanto o sólido é isolador. 6.8 O gás de Bloch à temperatura ambiente. Nos átomos isolados, a última orbital não é a orbital de valência, existindo outros estados electrónicos que podem ser ocupados excitando o átomo. De igual modo, a banda de valência também não é a “última” banda no sentido em que há outras bandas de energia superior, que, no estado fundamental do sistema de fermiões de Bloch estão totalmente desocupadas, mas que podem estar parcialmente preenchidas em estados excitados. À banda de energia imediatamente superior à da banda de valência dá-se o nome de banda de condução. Mais uma vez, repetimos que à temperatura ambiente, é possı́vel que alguns electrões sejam excitados (através de colisões com fonões, por exemplo) para esta banda, e esta possibilidade deve ser considerada no cálculo do valor de grandezas fı́sicas a temperaturas diferentes do zero absoluto. Claro que a probabilidade destas excitações é tanto maior quanto menor for a largura do hiato energético entre as duas bandas. Como vimos no capı́tulo anterior, a energia média dos fonões à temperatura ambiente, T , é da ordem de grandeza de kB T , onde kB é a constante de Boltzman, e portanto a população da banda de condução só é apreciável à temperatura ambiente se o hiato energético tiver uma largura da mesma ordem de grandeza. Um sólido com esta caracterı́stica é um isolador(j) a temperaturas próximas do zero absoluto(k) mas pode conduzir (j) Partindo do princı́pio que tem a banda de valência totalmente preenchida no seu estado fundamental. (k) Não consideramos aqui o fenómeno de supercondutividade. 6.9. LACUNAS 119 E (a) Isolador (b) Condutor T=0 T>0 Semicondutor Figura 6.15: Isoladores, condutores e semicondutores. Os isoladores (à esquerda no diagrama) têm a banda de valência totalmente preenchida e a de condução totalmente desocupada; os condutores (ao centro) têm a banda de valência ocupada, mas não totalmente preenchida, ou então verifica-se uma sobreposição das duas bandas; finalmente, os semicondutores (à direita) são isoladores à temperatura de zero kelvin, mas o hiato energético entre a banda de valência e a de condução é pequeno, e à temperatura ambiente muitos electrões estão excitados para esta última, possibilitando a condução. electricidade à temperatura ambiente. Um aumento da temperatura produz um aumento na energia média dos fonões, e por conseguinte um aumento da população da banda de condução, ou seja, um aumento da condutividade. Para estes sólidos (com um hiato energético, ²g , de cerca de 1 eV) a dependência da condutividade é inversa da dos condutores, sendo a condutividade uma função decrescente da temperatura. Este é outro sucesso da teoria de Bloch, já que este comportamento (aumento de condutividade com a temperatura) é inexplicável, como vimos, no quadro de uma teoria de electrões livres. Os sólidos isoladores que, como os que acabámos de referir, apresentam um hiato entre as bandas de valência e de condução suficiente pequeno para que, à temperatura ambiente, a população da banda de condução tenha efeitos apreciáveis, têm o nome de semicondutores. Na Figura 6.15 apresenta-se a configuração das bandas de valência e de condução para condutores, isoladores e semicondutores. 6.9 Lacunas A densidade de corrente eléctrica global de uma banda totalmente preenchida é, de acordo com o que já se disse, nula. Assim, representando por j k (r) a densidade de corrente de um electrão no estado ψk (l) e por J B (r) a densidade de corrente total da banda, podemos escrever J B (r) = X j k (r) = 0, (6.32) banda onde o somatório se extende a todos os estados ψk da banda. Se quisermos calcular a densidade de corrente para uma banda parcialmente preenchida, devemos fazer um somatório semelhante ao anterior, mas considerando apenas os estados (l) Classicamente, a densidade de corrente é j (r ) = ρ(r )v (r ), onde ρ é a função densidade de carga e v velocidade das cargas. Numa descrição quântica, a densidade de corrente associada a uma partı́cula com carga q é j (r ) = q g (r ), onde g é a densidade de fluxo de probabilidade, dada por g = (ψ ∗ ψ − ψ ψ ∗ ) /(2im) (ver qualquer livro elementar de Mecânica Quântica, p. ex. S. Gasiorowocz, ”Quantum Mechanics”.) ~ r r 120 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS Banda de condução f Banda de valência Figura 6.16: Processo de criação de um par electrão de condução-lacuna por absorção de um fonão. efectivamente ocupados por electrões, ou seja, X j k (r), J (r) = (6.33) e.o. onde as iniciais “e. o.” significam que para o somatório apenas se tomam os estados ocupados. De acordo com a Eq. (6.32), devemos ter X X j k (r) + j k (r) = 0, e.o. e.d. onde as iniciais “e. d.” indicam que a soma respectiva é feita apenas sobre os estados desocupados. Mas isto significa que os dois somatórios são simétricos, e portanto podemos escrever a densidade de corrente de uma banda parcialmente preenchida como X J (r) = − j k (r), (6.34) e.d. sendo este somatório, recordemo-lo, extendido apenas aos estados desocupados da banda. Dispomos então de duas formas alternativas para o cálculo da contribuição de uma banda parcialmente preenchida para a corrente elétrica, dadas pelas eqs. (6.33) e (6.34). Podemos interpretar esta segunda possibilidade considerando os estados electrónicos desocupados, sobre os quais se faz o somatório, como se estivessem ocupados por partı́culas semelhantes aos electrões, mas com carga de sinal contrário, justificando-se o sinal negativo na Eq. (6.34). A estas partı́culas dá-se o nome de lacunas. A condução eléctrica pode ser descrita recorrendo aos estados electrónicos [usando a Eq. (6.33)] ou, alternativamente, aos estados de lacunas [usando a Eq. (6.34)]. Reafirmemos que as lacunas são os estados electrónicos desocupados. Então, uma banda totalmente preenchida (de electrões) pode ser vista como uma banda vazia de lacunas. Dada a equivalência das duas descrições para os fenómenos de condução, podemos dizer que uma banda totalmente preenchida (de electrões) não pode conduzir porque não contém nenhuma lacuna para o transporte de carga. Num semicondutor, em que o gap de energia entre as bandas de valência e de condução é da ordem de grandeza da energia das vibrações atómicas (ou seja, da energia dos fonões), é relativamente fácil a excitação de um electrão da banda de valência para a banda de condução. Neste processo, é absorvido um fonão e, simultaneamente, é produzida uma lacuna na banda de valência, correspondente ao estado deixado vago pelo electrão promovido (ver a Figura 6.16). Inversamente, pode também dar-se o processo de recombinação, em que um electrão na banda de condução emite um fonão (ou um fotão) transitando para a banda de valência, onde irá ocupar um estado previamente vago (ou seja ocupado por uma lacuna). Deve já ter-se notado a semelhança entre estes processos de criação e aniquilaçao de pares electrão de condução-lacuna por absorção ou emissão de quanta de energia com os de criação e aniquilação de pares partı́cula-antipartı́cula estudados na fı́sica 6.10. CONTAMINAÇÃO DE SEMI-CONDUTORES 121 subatómica. Esta semelhança não é um acidente. Confrontado com a existência de soluções de energia negativa da sua equação de onda relativı́stica para fermiões, Dirac, o cientista que primeiro propôs a existência de antimatéria, supôs que todos esses estados estavam ocupados, definindo assim uma densidade de carga uniforme em todo o espaço, sem efeitos observáveis, a que se passou a chamar o mar de Dirac. Um electrão com energia positiva não poderia sofrer transições para esses estados com energia negativa porque eles estavam todos ocupados. No entanto, usando radição com energia suficiente, seria possı́vel excitar electrões para a “banda” de energia positiva, criando assim um electrão observável e, simultaneamente, uma lacuna no mar de Dirac, que seria observada como uma partı́cula em tudo semelhante aos electrões, mas com carga positiva — Um anti-electrão, ou positrão. Inversamente, o processo pelo qual um electrão com energia positiva decaı́sse para um estado desocupado no mar de Dirac seria observado como uma aniquilação mútua dos constituintes do par partı́cula-antipartı́cula, acompanhado de emissão de energia. Relacionando o quadro de Dirac com o nosso estudo, a banda de valência corresponde ao mar de Dirac; a banda de condução aos estados com energia positiva; e ao gap de energia entre as duas bandas corresponde um hiato que surge também na teoria de Dirac, igual ao dobro da energia em repouso de um electrão, me c2 . Num semicondutor à temperatura ambiente, há duas contribuições para a condução eléctrica: a da banda de condução, que está parcialmente populada com electrões termicamente excitados, e a da banda de valência, parcialmente populada com lacunas que correspondem aos estados deixados vagos pelos electrões promovidos para a banda de condução. Nos casos em que a segunda é mais importante do que a primeira, a corrente eléctrica é, sob todos os aspectos, semelhante à que seria conduzida por cargas de sinal positivo, nomeadamente na polarização da tensão de Hall (ver a secção 5.2.3), justificando-se assim os sinais anómalos do coeficiente de Hall apresentados por algumas substâncias. 6.10 Contaminação de semi-condutores Como vimos, à temperatura ambiente alguns electrões da banda de valência de um semicondutor como o silı́cio ou o germânio(m) ocupam estados excitados na banda de condução, possibilitando a condução eléctrica por estes materiais. Há, como se disse, duas contribuições para a condução eléctrica: a dos electrões na banda de condução e a das lacunas na banda de valência. Num semicondutor puro à temperatura ambiente, o número de lacunas iguala, evidentemente, o de electrões de condução. Mas é possı́vel, através da introdução no cristal semicondutor de impurezas judiciosamente escolhidas, variar independentemente o número dos dois tipos de transportadores de carga. Para concretizar a discussão, consideremos um cristal de silı́cio ou de germânio, no qual alguns átomos são substituı́dos por átomos de arsénio ou de fósforo. Estas impurezas constituem defeitos no arranjo periódico do cristal de silı́cio. O arsénio e o fósforo são substâncias pentavalentes, de forma que, quando um átomo de arsénio substitui num cristal um átomo de silı́cio (substância tetravalente), um dos seus electrões de valência fica por emparelhar. Este electrão fica fracamente ligado ao átomo de arsénio, que funciona como um centro de carga positiva (ver a Figura 6.17). O átomo de arsénio fornece um electrão a mais do que os de silı́cio, que definem a estrutura cristalina e, por isso, dizemos que o arsénico é um dador de electrões, ou ainda que se trata de uma contaminação de tipo-n. Estando o electrão desemparelhado muito fracamente ligado ao átomo de arsénio, basta uma pequena quantidade de energia, Ed , para exitá-lo para a banda de condução. O valor deste mini-gap de (m) Estes são os dois semicondutores mais usados em aplicações industriais. 122 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS Orbital de electrão desemparelhado Banda de condução Ed Eg Átomos de Silício + Nível dador Banda de valência Átomo de Arsénico Figura 6.17: Cristal de silı́cio com uma impureza substitucional de arsénico (esquerda) e nı́veis de energia resultantes (direita). energia é de cerca de algumas dezenas de meV (mili-electrão volt), tipicamente. Assim, concluı́mos que num cristal de silı́cio em que alguns átomos são substituidos por átomos de arsénico a estrutura de bandas usual vê-se modificada, aparecendo um conjunto de estados na zona proı́bida, imediatamente abaixo da banda de condução, aos quais se dá o nome de nı́vel dador. Note-se que os estados deste nı́vel são estados ligados, logo, não contribuem para os fenómenos de transporte. À temperatura de 0 K, a banda de valência está totalmente preenchida, e o nı́vel dador tem metade dos estados disponı́veis ocupados (porquê?); o cristal em estudo é, portanto, isolador. Mas basta elevar ligeiramente a temperatura para se exitarem os electrões do nı́vel dador para a banda de condução, sem que sejam criadas lacunas na banda de valência. A temperaturas mais elevadas, começa a fazer-se sentir o processo já estudado da excitação de electrões da banda de valência, começando então a fazer-se sentir a contribuição das lacunas para a corrente eléctrica. Vemos, assim, que contaminando por substituição um cristal de silı́cio ou germânio com arsénico, podemos aumentar, a temperaturas não muito elevadas, o número de electrões na banda de condução, permanecendo o número de lacunas na banda de valência baixo. Banda de condução + - Lacuna resultante da captura de um electrão pelo átomo de boro Eg Átomos de silício Ea Átomo de boro Nível aceitador Banda de valência Figura 6.18: Cristal de silı́cio com uma impureza substitucional de boro (esquerda) e nı́veis de energia resultantes (direita). Também é possı́vel obter o efeito contrário, de estabecer num cristal semicondutor um grande número de lacunas na banda de valência com um reduzido número de electrões na banda de condução, substituindo alguns átomos num cristal de silı́cio ou de germânio por átomos de boro, alumı́nio, gálio ou ı́ndio (substâncias trivalentes). Substituindo um átomo de silı́cio num cristal puro por um de boro, fica uma ligação por estabelecer, já que o boro é trivalente. O átomo de boro fica nesta situação com uma grande electroafinidade, sendo necessária uma quantidade muito pequena de energia para que capture um electrão da banda de valência do cristal, completando assim as quatro ligações com os seus vizinhos. Neste processo, cria-se uma lacuna na banda de valência, sem popular a banda de condução. As impu- 6.11. O DIODO SEMICONDUTOR 123 Fe n e- p l+ Ve Vc0 n p Figura 6.19: Junção p-n (acima) em equilı́brio e potencial de contacto na junção. Está representada o sentido da força sobre os electrões (Fe ) e a sua energia potencial. rezas deste tipo aceitam os electrões da banda de valência, e por isso chamam-se impurezas aceitadoras, ou impurezas de tipo-p. Na Figura 6.18 representa-se esquematicamente o papel de uma impureza de tipo-p e o nı́vel intermédio, que agora aparece imediatamente acima da banda de valência, chamado nı́vel aceitador. A capacidade para variar independentemente as concentrações de lacunas e de electrões de condução num cristal semicondutor tem uma enorme aplicação prática, no fabrico de ı́numeros dispositivos usados na indústria electrónica, como os diodos e os transistores. É até possı́vel, num único cristal de silı́cio, implantando diferentes contaminações em diferentes regiões, construir circuitos inteiros, contendo vários milhões daqueles elementos individuais. Vamos, de seguida, estudar o funcionamento do mais simples destes dispositivos, o um diodo rectificador. 6.11 O diodo semicondutor Consideremos um cristal semicondutor de silı́cio (ou germânio), com contaminações de tipo diferente em duas zonas contı́guas, em equilı́brio a uma temperatura T > 0. Temos então um cristal, no qual está definida uma região de tipo-p, outra de tipo-n, em contacto uma com a outra (ver a Figura 6.19). À temperatura T , na região-n há uma grande densidade de electrões de condução, como vimos na secção anterior; em contrapartida, na região-p é a concentração de lacunas que é elevada. Então, à semelhança do que se passa na junção de metais diferentes (ver a Secção 5.2.4), deve verificar-se uma difusão de electrões de condução da região-n (onde apresentam alta concentração) para a região-p, onde se recombinam com as lacunas, aqui maioritárias. As lacunas, por seu turno, sofrem uma migração inversa e recombinam-se com os electrões de condução da região-n. Consequentemente, estabelece-se um campo eléctrico na junção que impede a continuação indefinida deste processo, ou seja, verifica-se o aparecimento de uma diferença de potencial entre as duas regiões, que se chama potencial de contacto. Em resultado dos processos de recombinação, a proximidade da junção fica desprovida de transportadores de carga, efeito que é ainda agravado pelo aparecimento do campo de contacto, que varre electrostaticamente qualquer par lacuna-electrão de condução (o electrão para a região-n, a lacuna para a região−p), criado nesta zona por exitação térmica. Esta região, onde a densidade de transportadores de carga é praticamente nula, chama-se zona de deplecção. Na junção das duas regiões ocorrem, então, dois efeitos opostos: (a) difusão de transportadores, “empurrada” pelos gradientes de concentração. Alguns electrões (aqueles que à temperatura T têm energia suficiente para ultrapassarem a barreira estabelecida pelo potencial de contacto) da região-n difundem-se para a região-p, recombinando-se aı́ com lacunas. Inversamente, 124 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS VB VB n n Vc0 Vc V p p VA VA Figura 6.20: Quedas de potencial por contacto num curto-circuito da junção p-n (à esquerda) e polarização de uma junção p-n por uma fonte de tensão V . algumas lacunas da região-p sofrem uma migração para a região-n. Ao fluxo de carga associado a estas migrações dá-se o nome de corrente de recombinação, que tem o sentido p-n; (b) deriva de trasportadores, “empurrada” pelo campo eléctrico de contacto. Os pares electrão de condução-lacuna criados por excitação térmica nas duas regiões são empurrados pelo campo eléctrico, realizando cada transportador uma migração em sentido inverso ao do ponto anterior. Esta corrente chamase corrente de geração, no sentido n-p. Na migração de difusão, os transportadores movem-se empurrados pelos gradientes de concentração, vencendo gradientes de potencial electrostático; na migração de deriva, o movimento é induzido pelo gradiente do potencial electrostático, e opõe-se ao gradiente de concentração. Estabelece-se então um equilı́brio dinâmico em que os fluxos de carga se cancelam mutuamente, isto é, a corrente de recombinação, no sentido p-n, iguala a de geração, no sentido n-p. Deve dizer-se que o valor destas correntes é extremamente baixo, rondando os 10−6 A. Se se montar um circuito fechado incluindo a junção semicondutora p-n, devemos ter em atenção que, para além do potencial de contacto Vc0 na junção semicondutora, aparecem outros potenciais de contacto nos pontos onde se liga o condutor que fecha o circuito (ver a Figura 6.20). Evidentemente, a soma de todos estes potenciais é nula, de acordo com a lei de Kirchoff. Usando a notação da Figura 6.20, temos então Vc0 + VA + VB = 0, ou seja, VA + VB = −Vc0 . (6.35) O que acontece agora se polarizarmos a junção, ligando-a a uma fonte de tensão? Uma vez que a zona de deplecção é desprovida de cargas móveis, tem uma resistência muito elevada, e por isso podemos considerar que é aı́ que se manifesta o efeito da fonte de tensão. Aplicando a lei de Kirchoff, temos agora Vc + Va + VB + V = 0, e portanto, usando a Eq. (6.35), concluimos que o potencial de contacto se vê alterado pela acção da tensão polarizadora V de acordo com Vc = Vc0 − V. (6.36) Quando o terminal positivo da fonte de tensão está ligado à região-p a junção diz-se polarizada no sentido directo; se o terminal positivo da fonte estiver ligado à regiãon, falamos de polarização inversa. Quando a junção está em polarização directa, V tem sinal idêntico ao de Vc 0, e, portanto, o potencial de contacto fica diminuı́do 6. Problemas 125 VB VB n n Vc > Vc0 Vc < Vc0 p VA p VA i Figura 6.21: Polarização directa (à esquerda) e polarização inversa de uma junção p-n. pela polarização (ver a Figura 6.21, à esquerda). Logo, nestas condições, aumenta bastante a corrente de recombinação porque diminui a grandeaza da barreira de potencial que impede o fluxo por difusão. Em contrapartida, a corrente de geração mantém-se essencialmente constante, já que depende da taxa da criação de pares lacuna-electrão de condução. Então, as duas correntes deixam de se compensar, e verifica-se, portanto, um fluxo lı́quido de carga através da junção, no sentido p-n. Em resumo, a junção p-n permite a passagem de corrente quando se encontra em polarização directa. Em contrapartida, quando se inverte a polarização, aumenta o valor do potencial de contacto, diminuindo, consequentemente, o valor da corrente de recombinação. A corrente de geração permanece essencialmente a mesma, mantendo o seu valor de cerca de 10−6 A. Assim, para muitos efeitos práticos, podemos dizer que a junção semicondutora p-n não permite a passagem de corrente em polarização inversa. Uma vez que a fracção dos transportadores que tem, a uma certa temperatura T , uma energia superior ao valor do potencial de contacto (e que portanto está em condições de ultrapassar a barreira de potencial na junção) é dada pelo factor de Boltzmann e−βeVc , onde β = 1/kB T , a razão entre as correntes de recombinação em polarização directa e em vazio (sem qualquer fonte externa) é dada por Jr e−βeVc = −βeVc0 = eβeV . Jr0 e A corrente total é a soma das correntes de geração e de recombinação, J = Jr + Jg , mas a corrente de geração permanece sensivelmente constante, com o seu valor de vazio Jg0 que, por sua vez, é o simétrico da corrente de recombinação, também em vazio. Então, a funçao corrente tensão de uma junção p-n é J = Jg (eβeV − 1), (6.37) onde se toma V positivo quando a junção está em polarização directa. O gráfico desta função apresenta-se na Figura 6.22. A junção semicondutora p-n tem então a propriedade de só permitir a passagem de corrente num sentido, propriedade muito importante no desenho de circuitos electrónicos. O nome dado às junções semicondutoras p-n na gı́ria da engenharia electrotécnica é diodo. PROBLEMAS 6.1 À luz da teoria das bandas determine, justificando, o número total de estados electrónicos existentes por banda de energia. 6.2 Justifique qualitativamente a condutividade, térmica e eléctrica, a zero graus Kelvin, dos sólidos cristalinos. Dê alguns exemplos. 126 CAPÍTULO 6. METAIS II: TEORIA DE BANDAS 200 I (A) 150 100 50 0 -2 -1 -1.5 -0.5 V (V) 0 0.5 Figura 6.22: Curva de corrente-tensão caracterı́stica de um diodo semicondutor. 6.3 Comente a seguinte afirmação: A condutividade dos metais alcalinos terrosos é devida a uma sobreposição da banda de valência com a banda de condução. Se tal não acontecesse estes elementos seriam isoladores a zero graus Kelvin. 6.4 Determine o valor do parâmetro de massa efectiva de electrões livres. 6.5 A densidade do bário é de 3, 5 × 103 kg/m3 , e a sua massa atómica relativa é 137. Sabendo que os átomos de bário têm dois electrões de valência, determine o raio da esfera de Fermi e o valor da energia da nuvem de electrões de condução por mole (de átomos) à temperatura de 0 K. 6.6 Mostre que a função ψ(r ) = N e−r , onde N é uma constante de normalização e r = ||r ||, não pode ser a função de onda de um electrão num potencial periódico. 2 Bibliografia • D. A. Davies, Waves, Atoms and Solids, Longman Scientific & Techical (1978). Esta é uma boa introdução, tanto à fı́sica dos fenómenos ondulatórios como à mecânica quântica. Põe mais ênfase nas aplicações do que no formalismo, principalmente nas aplicações ao estudos dos electrões nos sólidos. Nı́vel: Elementar. • S. L. Altmann, Band Theory of Metals — The Elements, Pergamon Press (1970). Este é também um livro de introdução, mas aplica-se apenas ao estudo das propriedades dos electrões nos sólidos. Nı́vel: Elementar. • A. Yariv, An Introduction to the Theory and Applications of Quantum mechanics, John wiley & Sons, Inc. (1982). Este é um livro de Mecânica Quântica, como o nome indica, mas tem muitas aplicações ao estudo dos estados electrónicos nos sólidos, por exemplo, o modelo de Krönig-Penney. Nı́vel: Intermédio. • F. J. Blatt, Modern Physics (capı́tulos 12 e 13), McGraw Hill (1992). Bom livro de introdução à fı́sica moderna em geral, tem estes dois capı́tulos sobre sólidos, essencialmente sobre as ligações quı́micas nos sólidos, teoria de bandas e dispositivos semicondutores. Nı́vel: Elementar. • R. A. Serway, R. J. Beichner, J. W. Jewett, Jr.,Physics For Scientists and Engineers (capı́tulo 43), Saunders College Publishing (2000). Este é um livro de introdução à fı́sica, com uma parte de fı́sica moderna onde se inclui o capı́tulo 43 sobre Fı́sica do Estado Sólido. Trata apenas a matéria relativa ao Capı́tulo 6 dos apontamentos da disciplina, de forma muito elementar, mas pode ser útil como primeira abordagem a esta parte da matéria da disciplina. Nı́vel: Elementar. • J. R. Christman, Fundamentals of Solid State Physics, John Wiley & Sons, Inc. (1988). Muito bom livro, cobre a matéria dada na disciplina, mas não na mesma ordem. Nı́vel: Intermédio. • Ali Omar, Elementary Solid State Physics, Addison-Wesley Publishing Company (1975). Muito exaustivo, mas às vezes pouco rigoroso, por misturar descrições clássicas, com descrições quânticas, com argumentos qualitativos, e eu sei lá que mais. Nı́vel: Intermédio. 127 128 Bibliografia • C. Kittel, Introduction to Solid State Physics, John Wiley & Sons, Inc. (1996). É uma das referências clássicas da Fı́sica do Estado Sólido. A edição de 1996 é a sétima! Cobre a matéria dada, noutra ordem. Os capı́tulos sobre cristalografia e difracção de raios-X devem ser particularmente úteis. Nı́vel: Avançado. • N. W. Ashcroft e N. W. Mermin, Solid State Physics, Saunders College Publishing (1976). Outra das referências clássicas da Fı́sica do Estado Sólido. Tem aqui tudo o que pode querer saber sobre Fı́sica do Estado Sólido e mais ainda. Nı́vel: Muito avançado. • S. V. Vonsovsky e M. I. Katsnelson, Quantum Solid-State Physics, SringerVerlag (1989). Texto muito avançado sobre a descrição quântica dos solidos. Nı́vel: Muito avançado.