sérgio luiz pereira filogenia e evolução molecular em cracidae

Transcrição

sérgio luiz pereira filogenia e evolução molecular em cracidae
SÉRGIO LUIZ PEREIRA
FILOGENIA E EVOLUÇÃO MOLECULAR
EM CRACIDAE (AVES)
Chamaepetes
Penelopina
Penelope
Ortalis
Aburria
Oreophasis
Pipile
Mitu
Megapodius
Nothocrax
Gallus
Aythya
Crax
Rhea
Pauxi
INSTITUTO DE BIOCIÊNCIAS
UNIVERSIDADE DE SÃO PAULO
São Paulo - Brasil
2000
SERGIO LUIZ PEREIRA
FILOGENIA E EVOLUÇÃO MOLECULAR
EM CRACIDAE (AVES)
Tese apresentada ao Departamento de
Biologia do Instituto de Biociências da
Universidade de São Paulo, para
obtenção do título de DOUTOR EM
CIÊNCIAS, Área de Biologia/Genética.
Orientadora: Profa. Dra. Anita Wajntal
Instituto de Biociências
Universidade de São Paulo
São Paulo – Brasil
2000
Pereira, Sérgio Luiz
Filogenia Molecular e Evolução em
Cracidae (Aves)
184 páginas
Tese (Doutorado) - Instituto de
Biociências da Universidade de São Paulo.
Departamento de Biologia.
1. Cracidae 2. Filogenia molecular 3.
Evolução I. Universidade de São Paulo.
Instituto de Biociências. Departamento de
Biologia.
___________________________
Profa. Dra. Lucile F. Winter
___________________________
Prof. Dr. Sérgio N. dos Reis
___________________________
Prof. Dr. Carlos F. M. Menck
___________________________
Prof. Dr. Antonio Salatino
___________________________
Profa. Dra. Anita Wajntal
Aos meus pais José Vicente e Cida,
por todo amor e com todo amor.
-"No worries!"
Este trabalho foi financiado por
FAPESP, CNPq, CAPES (Brasil) e
NSERC (Canada).
AGRADECIMENTOS
À Dra. Anita Wajntal pela orientação, incentivo em minha carreira acadêmica e amizade.
Ao Dr. Allan J. Baker pela orientação durante meu estágio em seu laboratório no Canadá
e por muitas sugestões e discussões científicas que resultaram neste trabalho.
À Dra. Célia P. Koiffmann, chefe da Unidade de Aconselhamento Genético do IBUSP,
onde grande parte deste trabalho foi realizado.
Às pessoas e instituições que gentilmente cederam amostras de sangue de suas coleções:
Centre for Biodiversity and Conservation Biology (Royal Ontario Museum, Canadá),
Carlos Keller e Vitor Fasano (Criadouro Tropicus, Pirassununga, Brasil), Fernando
Gonzales-Garcia (Instituto de Ecología e Fundácion Ara, México), Maurício dos
Santos (Criadouro Chaparral, Recife, Brasil), Companhia Energética de São Paulo
CESP-Paraibuna, (Paraibuna, Brasil), Moacyr de Carvalho Dias (Criadouro Poços de
Caldas, Poços de Caldas, Brasil), Roberto Azeredo (Fundação CRAX, Belo Horizonte,
Brasil).
Aos meus amigos e colegas Cintia Fridman, Janice Hughes, Laila A. Nahum, Leandro R.
Latorre, Luís Fábio Silveira, Maryann Burbidge, Melina M. Baumgarten, Monica
Castro Varela, Nicola Wade, Oliver Haddrath, Silvia Geurgas, Tara Patton pelo
incentivo, discussão e sugestões em muitas partes desta tese, correção de erros de
português e de digitação e conferência das referências bibliográficas.
À Dra. Mayana Zatz, Dra. Maria Rita de P. Bueno e ao Dr. Sérgio R. Matioli pela
permissão do uso de seus laboratórios e equipamentos, e a seus técnicos e pósgraduandos.
À Dra. Mariana Cabral, Dra. Mari-Anne Van Sluys e Regina Yuri Hashimoto Miura do
Depto de Botânica do IBUSP pela utilização do seqüenciador automático.
Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pela bolsa
de doutorado concedida no primeiro ano deste trabalho (Processo 142295/96-5).
À Fundação de Amparo à Pesquisa no Estado de São Paulo pela concessão da bolsa de
doutorado nos três últimos anos deste trabalho (Processo 97/02232-1) e pelo
financiamento do estágio no Royal Ontario Museum, Toronto, Canadá.
À Lynx Edicions, Barcelona, Espanha, pela permissão do uso dos desenhos das aves em
alguns capítulos desta tese.
Aos meus amigos Alan Greenspan, Ana Paula Protti, Ana Regina Chinelato, Andrea
Ramirez, Claudia Frigeri, Cristiane Nucci, Eliete Pardono, Jusceley F. Palamim, Laura
Domenchini, Marcelo S. Santos, Maria Cristina C. Braga, Ralf Paiva, Renato Caparroz
e ao meu irmão Silvio J. Pereira pelo incentivo de sempre.
Aos colegas e professores da pós-graduação do IBUSP e aos colegas da Unidade de
Aconselhamento Genético do IBUSP, em especial à Luceleni da Silva e Dona Lurdes.
À Roseli Marques Zanelato por todo o carinho e força espiritual.
SUMÁRIO
ABREVIAÇÕES E SÍMBOLOS _______________________________
RESUMO _______________________________________________
ABSTRACT _____________________________________________
i
iii
vi
Capítulo 1 - INTRODUÇÃO _____________________________
A FAMÍLIA CRACIDAE __________________________________
Origem da Família Cracidae _______________________
FILOGENIA MOLECULAR _________________________________
A Reconstrução Filogenética ______________________
Homologia de Caracteres __________________________
Alinhamento de Seqüências Moleculares ____________
Monofilia _________________________________________
Mutação ___________________________________________
Substituição de Nucleotídeos ______________________
Modelos de Evolução Molecular _____________________
Modelo de equilavência de substituição (JC69) ___
Modelo de dois parâmetros (K80) _________________
Modelo proporcional (F81) _______________________
Modelo HKY85 e F84 ______________________________
Modelo TN93 _____________________________________
Modelo Geral de Reversão ao Longo do Tempo (GTR)_
Métodos de Reconstrução Filogenética ______________
Método de Parcimônia ____________________________
Método de Distância _____________________________
Método de Verossimilhança _______________________
Relógio Molecular _________________________________
Heterogeneidade de Taxas de Substituição
entre os Sítios _________________________________
Algoritmos de Reconstrução de Árvores Filogenéticas
Algoritmos exatos _______________________________
Busca exaustiva _______________________________
"Branch-and-bound" _____________________________
Algoritmos heurísticos __________________________
Decomposição de estrela ________________________
"Stepwise addition" ____________________________
"Branch-swapping" ______________________________
"UPGMA" e "Neighbor-Joining" ______________________
Eficiência dos Métodos ____________________________
REGISTRO FÓSSIL E BIOGEOGRAFIA _______________________
OBJETIVOS ____________________________________________
1
2
7
10
11
12
13
15
17
18
19
20
20
20
21
21
22
22
22
25
28
31
35
37
38
38
38
39
39
39
40
40
41
43
45
Capítulo 2 - MATERIAL E MÉTODOS _____________________
TAXONS USADOS ________________________________________
OBTENÇÃO DE SEQÜÊNCIAS DE GENES MITOCONDRIAIS ________
Coleta de Sangue das Aves _________________________
Protocolo 1 - Extração de DNA _____________________
Protocolo 2 - Gel de agarose ______________________
Protocolo 3 - Avaliação da qualidade
e da concentração de DNA _______________________
Protocolo 4 - Amplificação e purificação
de fragmentos de DNA mitocondrial ______________
Protocolo 5.1 - Recuperação de fragmentos do CR-I_
Protocolo 5.2 - Recuperação dos demais genes ______
Protocolo 6.1 - Purificação do CR-I _______________
Protocolo 6.2 -Purificação dos demais genes _______
Protocolo 7 - Seqüenciamento de produtos de PCR __
Protocolo 8 - Limpeza e montagem das
placas de vidro _______________________________
Protocolo 9 - Preparação do gel de poliacrilamida _
Protocolo 10 - Eletroforese de Seqüenciamento _____
Análises das Seqüências ___________________________
Correção de ambiguidades das seqüências ___________
Alinhamento _______________________________________
ANÁLISES EVOLUTIVAS E FILOGENÉTICAS __________________
Análises de saturação de substituição _____________
Mapeamento de verossimilhança _____________________
Máxima verossimilhança ____________________________
Máxima parcimônia _________________________________
Neighbor Joining __________________________________
Índices de suporte ________________________________
Bootstrap _______________________________________
Índices de Bremer _______________________________
Resolução de Quartetos _________________________
Datação de tempo de divergência ___________________
46
47
47
48
50
52
RESULTADOS ___________________________________________
72
Capítulo 3 - POSIÇÃO FILOGENÉTICA DE CRACIDAE E
MEGAPODIIDAE EM RELAÇÃO AOS GALLIFORMES
E ANSERIFORMES __________________________
Abstract _____________________________________________
Resumo _______________________________________________
Introdução ___________________________________________
Material e Métodos ___________________________________
Análise filogenética _______________________________
Testando árvores alternativas ______________________
Resultados ___________________________________________
Discussão ____________________________________________
Referências __________________________________________
74
75
75
76
77
78
79
79
82
84
52
55
56
57
58
58
59
62
63
64
65
65
67
67
67
67
68
69
70
70
70
70
70
71
Capítulo 4 - FILOGENIA MOLECULAR DE CRACIDAE (AVES) __
Abstract _____________________________________________
Resumo _______________________________________________
Introdução ___________________________________________
Material e Métodos ___________________________________
Táxons amostrados __________________________________
Extração, amplificação e seqüenciamento de DNA _____
Análises filogenéticas _____________________________
Resultados ___________________________________________
Discussão ____________________________________________
Reconstrução filogenética entre os Cracidae ________
Tempo de divergência entre os gêneros de Cracidae __
Origem da família Cracidae _________________________
Referências __________________________________________
87
88
88
89
90
90
90
92
93
96
96
97
101
101
Capítulo 5 - DOMÍNIO I DA REGIÃO CONTROLADORA DO DNA
MITOCONDRIAL E A INFERÊNCIA FILOGENÉTICA
ENTRE OS GÊNEROS DE CRACIDAE (AVES) ________
Abstract _____________________________________________
Resumo _______________________________________________
Introdução ___________________________________________
Material e métodos ___________________________________
Resultados ___________________________________________
Discussão ____________________________________________
Referências __________________________________________
104
105
105
106
107
112
116
118
Capítulo 6 - EVOLUÇÃO MOLECULAR DA SUBUNIDADE II DA
CITOCROMO C OXIDASE EM CRACIDAE (AVES) __
Abstract _____________________________________________
Resumo _______________________________________________
Introdução ___________________________________________
Material e métodos ___________________________________
Resultados ___________________________________________
Alinhamento das seqüências de COII ________________
Composição de bases e padrões de substitutição
de nucleotídeos ____________________________________
Uso preferencial de códons _________________________
Inferência das seqüências de aminoácidos ___________
Discussão ____________________________________________
Padrão de substituição de nucleotídeos _____________
Padrão de substituição de aminoácidos e
uso de códons ______________________________________
Referências __________________________________________
120
121
121
121
123
124
124
129
132
133
136
136
137
140
Capítulo 7 - CONSIDERAÇÕES FINAIS _______________________
144
Capítulo 8 - REFERÊNCIAS BIBLIOGRÁFICAS _________________
150
SÚMULA CURRICULAR _______________________________________
164
ABREVIAÇÕES E SÍMBOLOS
α - taxa de transição; parâmetro de forma da distribuição gama
αR - taxa de transição entre purinas
αY - taxa de transição entre pirimidinas
β - taxa de transversão
Γ - distribuição gama
χ2 - distribuição de qui-quadrado
πI - frequência da base i
12S rDNA - subunidade 12S do DNA ribossômico
16S rDNA - subunidade 16S do DNA ribossômico
A - adenina
bp - "base pairs"
C - citosina
COI - subunidade I da citocromo oxidase
COII - subunidade II da citocromo oxidase
COIII - subunidade III da citocromo oxidase
CR-I - domínio I da região controladora do mtDNA
cyt b - citocromo b
D-loop - "Displacement loop" ou região controladora do mtDNA
DNA - ácido desoxirribonucléico
dt - intervalo de tempo
EDTA - ácido etilenodiaminotetracético
EtOH - álcool etílico
F81 - Modelo de substituição de DNA de Felsenstein, 1981
F84 - Modelo de substituição de DNA de Felsenstein, 1984
FADH2 - flavina-adenina dinucleotídeo desidrogenase
G - guanina
GTR - Modelo de substituição de DNA de reversão geral no tempo, do inglês "general time
reversible"
HKY85 - Modelo de substituição de DNA de Hasegawa, Kishino e Yano, 1985
I - parâmetro de proporção de sítios invariáveis
JC69 - Modelo de substituição de DNA de Jukes e Cantor, 1969
K - número de substituições
K80 - Modelo de substituição de DNA de Kimura, 1980
LRT - Teste de Razão de Verossimilhança, do inglês "likelihood ratio test"
Ma - Milhões de anos
ML - Máxima Verossimilhança
MP - Máxima Parcimônia
mtDNA - DNA mitocondrial
My - "Million Years"
Mya - "Million Years Ago"
NaAc - acetato de sódio
NADH - nicotinamida-adenina dinucleotídeo desidrogenase
NJ - "Neighbor-Joining"
OTU - unidade taxonômica operacional, do inglês "Operational Taxonomic Unit"
pb - pares de bases
PCR - reação em cadeia da DNA polimerasa, do inglês "Polymerase Chain Reaction"
PEG - polietilenoglicol
Pij - probabilidade de substituição do nucleotídeo i para j
primers- oligonucleotídeos iniciadores
RSCU - uso relativo de códons sinônimos, do inglês "Relative Synonymous Codon Usage"
T - timina
TA - Tris, ácido acético
TBE - Tris, ácido bórico e EDTA
TEMED - N,N,N',N'- tetrametiletilenodiamino
TN93 - modelo de substituição de DNA de Tamura-Nei, 1993
TS - transição
TSR - "template suppresion reagent"
TS:TV ou TS/TV - razão entre transições e transversões
TV - transversão
u - taxa de substituição instântanea
UPGMA - método de agrupamento de pares sem pesos com média aritmética, do inglês
"unweighted pair-group method with arithmetic mean"
Resumo
Abstract
RESUMO
FILOGENIA E EVOLUÇÃO MOLECULAR EM CRACIDAE (AVES)
A família Cracidae é um dos grupos de aves mais ameaçados do continente
americano e as relações filogenéticas de seus gêneros não são totalmente compreendidas.
Inúmeros problemas taxonômicos existem na definição de espécies e subespécies. Para
resolver parte destes problemas, estabelecemos as relações filogenéticas entre os onze
gêneros (Aburria, Chamaepetes, Crax, Mitu, Nothocrax, Oreophasis, Ortalis, Pauxi,
Penelope, Penelopina, Pipile) que compreendem a família Cracidae baseadas em 4.519
pares de bases de seis genes mitocondriais (12S e 16S rDNA, COI, COII, COIII e cyt b).
Nossas análises demostraram que os cracídeos se separam em dois grupos
correspondente às subfamília Cracinae e Penelopinae. Entre os membros da subfamília
Cracinae, as relações foram (((Crax, Nothocrax), Pauxi), Mitu) e entre os Penelopinae,
((((((Aburria,Pipile), Penelope), Chamaepetes), Penelopina), Ortalis), Oreophasis). Uma
vez que as seqüências estudadas mostraram taxa de evolução constante entre as espécies
analisadas, pudemos estimar os tempos de divergências entre os gêneros. A origem da
família foi datada em cerca de 75,5 milhões de anos atrás e os gêneros se diversificaram
nos últimos 33 milhões de anos. Dados sobre eventos da história da Terra são
relacionados com a diversificação da Família. Nossos resultados também mostraram que
a família Megapodiidae, atualmente encontrada apenas na região australiana, é grupoirmão dos cracídeos, e a exclusão destas duas famílias dos Galliformes como sugerido por
outros dados moleculares não foi apoiada.
Averiguamos ainda se o domínio I da região controladora do DNA mitocondrial
(CR-I) de Cracidae seria útil para estabelecer as relações filogenéticas intergenéricas. A
região CR-I é amplamente usada em análises de relações entre níveis taxonômicos
inferiores como espécies e populações e raramente em níveis taxonômicos acima de
espécie. Nossos resultados mostraram que a região CR-I apresentou taxa de evolução
semelhante aos genes cyt b e COI, considerados anteriormente como apresentando taxas
mais lentas de evolução do que esta região. As análises realizadas com as seqüências do
CR-I permitiram obter uma árvore com topologia muito semelhante à obtida com os seis
genes mitocondriais analisados anteriormente para os gêneros de Cracidae quando um
modelo evolutivo mais apropriado foi empregado nas reconstruções filogenéticas.
Seqüenciamos totalmente o gene da COII, um gene bastante conservado entre os
metazoários devido ao fato de exercer uma função importante na cadeia respiratória. A
análise dessas seqüências mostrou que o COII de cracídeos apresenta características
similares às sequências de COII de outros metazoários. Alguns dos aminoácidos
conservados entre diversos organismos já estudados até hoje também se mostraram
conservados entre os cracídeos, porém alguns resíduos considerados conservados entre os
metazoários se mostraram modificados em cracídeos, o que leva a sugerir que diferentes
táxons possam atribuir a diferentes resíduos de aminoácidos as funções de centro ativo de
ligação ao citocromo c e ao íon de cobre.
ABSTRACT
MOLECULAR PHYLOGENY AND EVOLUTION OF CRACIDAE (AVES)
The family Cracidae is one of the most threatened bird groups in the Americas,
and its phylogeny at the generic level has not been established. Morever, other taxonomic
problems are related to species and subespecies definition. To answer some of these
taxonomic questions we estimated the phylogenetic relationships of the eleven Cracidae
genera (Aburria, Chamaepetes, Crax, Mitu, Nothocrax, Oreophasis, Ortalis, Pauxi,
Penelope, Penelopina, and Pipile) based on phylogenetic analysis of 4,519 base pairs of
six mitochondrial genes (12S and16S rDNA, COI, COII, COIII and cyt b).
Our results showed the separation of the two Cracidae subfamilies (Cracinae and
Penelopinae). The relationships among the Cracinae were (((Crax, Nothocrax), Pauxi),
Mitu) and among the Penelopinae, ((((((Aburria,Pipile), Penelope), Chamaepetes),
Penelopina), Ortalis), Oreophasis). Our sequences seems to have evolved at a constant
rate; thus we estimated the time of Cracidae origin as around 75.5 million years ago and
genera diversification occurred in the last 33 million years. We also related Earth history
events to cracid diversification. We could also establish that the family Megapodiidae,
found in the Australian region nowadays, is the sister clade to Cracidae. The exclusion of
the Cracidae and Megapodiidae from the Galliformes, as suggested by other molecular
studies, was not supported by our sequences analysis.
We also studied the first domain of the mitochondrial control region (CR-I) to
verify its utility in genera phylogenetic inference. The CR-I is widely used to establish
relationships of lower taxonomic levels such as species and populations, but rarely above
the species level. Our results showed that the Cracidae CR-I sequences evolved at similar
rates as cyt b and COI sequences, considered to have lower evolutionary rate than the CRI. Cracid genera phylogeny obtained through analysis of CR-I was similar to that obtained
by the analyses of other mitochondrial genes cited above, when a more realistic model of
DNA evolution was used in tree reconstruction.
We sequenced the complete Cracidae COII, a highly conserved gene among
metazoans due to its function in the respiratory chain. Our results show that cracid COII
is similar to other metazoan COII in relation to base composition, codon usage and
patterns of nucleotide and aminoacid substitution. Some conserved aminoacid residues
among the metazoan were also found in Cracidae but some residues considered being
conserved in animals, presented aminoacid substitutions in Cracidae COII, leading us to
suggest that diferent taxa could choose different aminoacid residues to function as a cleft
for cytochrome c binding and copper-ligand residues.
Capítulo 1
Introdução
Introdução
INTRODUÇÃO
A FAMÍLIA CRACIDAE
Relacionada aos demais galiformes, a família Cracidae compreende aves nãopasseriformes distribuídas em 11 gêneros (Fig. 1), 50 espécies e cerca de 60 subespécies
(del Hoyo et al., 1994; Nardelli, 1993). Revisões taxonômicas (Vuilleumier, 1965;
Vaurie, 1968) tentaram elucidar a relação e distribuição dos cracídeos. Cada espécie
dentro do grupo tem sua distribuição bem delineada por barreiras geográficas naturais
como rios, montanhas e vales. Espécies de gêneros diferentes e, em alguns casos, espécies
de um mesmo gênero, podem ocorrer em um mesmo local (simpatria), ocupando, porém,
micronichos distintos. Aparentemente, espécies de um mesmo gênero apresentam
distribuição alopátrica, excluindo ou ocupando o nicho de outros membros (Sick, 1993).
Aburria Chamaepetes Oreophasis Ortalis
Penelope
Crax
Penelopina
Mitu
Nothocrax
Pipile
Pauxi
Figura 1. Os onze gêneros da Família Cracidae, subdivididos nas
subfamílias Penelopinae (duas primeiras linhas) e Cracinae (última
linha). Os desenhos não estão em escala e foram modificados de del
Hoyo et al. (1994), com permissão da Lynx Edicions, Barcelona.
De hábito arborícola, alimentam-se basicamente de folhas e frutos e,
eventualmente, pequenos animais. Podem ser encontrados desde o sul do Texas nos
Estados Unidos, ao norte da Argentina e Uruguai. Ocupam florestas tropicais ou florestas
2
Introdução
em áreas montanhosas e úmidas, tendo um papel fundamental em manter o ecossitema
que habitam por meio da dispersão e predação de sementes das plantas das quais se
alimentam (Caziani e Protomastro 1994; Érard et al. 1991; Érard e Théry 1991; Théry et
al. 1992; Santamaria e Franco 1994; Peres e van Roosmalen 1996; Guix e Ruiz 1997;
Sedaghatkish et al. 1999).
Na presente tese iremos assumir que os cracídeos podem ser distinguidos em três
tipos morfológicos a saber: mutuns (Crax, Mitu, Nothocrax e Pauxi) da subfamília
Cracinae, e jacus e jacutingas (Aburria, Chamaepetes, Oreophasis, Penelope e
Penelopina, e Pipile) e aracuãs (Ortalis) da subfamília Penelopinae (Fig. 1)(Sick, 1993).
Os mutuns são representados pelos maiores indivíduos da família Cracidae (80-90
cm, exceto Nothocrax, com 58 cm). Apresentam hábitos mais terrestres que os demais
cracídeos. A pélvis é mais alongada e estreita que a dos jacus mais arborícolas. Muitas
espécies possuem intumescências na cera (ceroma) localizada na base do bico, as quais
podem apresentar coloração azul, vermelha ou amarela, e cristas bem desenvolvidas. Os
mutuns vêm ao solo mais freqüentemente do que os jacus, jacutingas e aracuãs. Os
membros do gênero Pauxi apresentam ainda uma projeção óssea dorsal na maxila
superior recoberta por uma camada córnea de coloração azul empalidescido (Delacour e
Amadon, 1973).
Já os jacus e jacutingas são animais de tamanho médio (50 a 70 cm) e raramente
vêm ao chão. Muitas espécies de jacus e jacutingas apresentam a garganta nua e uma
barbela desenvolvida. A barbela tem coloração púrpura ou azul nas espécies de
jacutingas, muitas espécies apresentando ainda a parte inferior da barbela avermelhada.
Por sua vez os jacus apresentam barbela vermelha. As espécies do gênero Chamaepetes,
típicas de regiões montanhosas, úmidas e frias não apresentam a garganta nua e barbela.
A crista é pouco desenvolvida entre os jacus e jacutingas. O gênero monoespecífico
Oreophasis apresentam ainda uma projeção óssea na cabeça recoberta por um camada
córnea de coloração vermelha (Delacour e Amadon, 1973).
Os aracuãs são os menores indivíduos do grupo (40 a 50 cm). Apresentam
plumagem de coloração parda. Não apresentam intumescências no bico ou barbela na
3
Introdução
garganta, mas a garganta é nua e colorida. Habitam matas arbustivas, e geralmente
invadem áreas onde houve desmatamento ou queimadas (Delacour e Amadon, 1973).
Os cracídeos são muito sensíveis a perturbações ambientais causadas pelo
homem. Desta maneira podem ser usados como indicadores biológicos da qualidade do
habitat, auxiliando programas de manejo e conservação de áreas tropicais ainda intactas e
áreas de proteção ambiental (Strahl e Grajal 1991). Economicamente, estas aves poderiam
ser usadas em culturas de subsistência bem programadas. Populações humanas indígenas
e rurais de toda a América Latina utilizam espécies de cracídeos como uma fonte
principal de proteína animal em sua alimentação (Delacour e Amadon 1973; Silva e
Strahl 1991). O envolvimento dessas comunidades na exploração de subsistência poderia
auxiliar a manter estas espécies vivas na natureza. O potencial ecoturístico dos cracídeos
também é grande. Por exemplo, Groom et al. (1991) estimou que mais de 1,2 milhões de
dólares americanos foram gerados em 1987 por turistas estrangeiros visitando a região de
Madre de Dios para observar a vida silvestre na Amazônia peruana. Em uma das
pousadas na região de Madre de Dios, Munn (1992) estimou que 150 pessoas foram
beneficiadas pelo ecoturismo em 1987, e 270 pessoas em 1989.
Além disso, o
ecoturismo poderia encorajar as pessoas das comunidades locais latinoamericanas a se
tornarem guias turísticos e se integrarem em projetos educacionais e de conservação das
espécies em riscos.
Muitas das espécies e subespécies de Cracidae são ameaçadas de extinção (Tabela
1; Collar et al., 1992). As causas de extinção são basicamente a destruição de habitat e
caça excessiva. As falhas no conhecimento da biologia de muitas das espécies impedem
sua proteção, uma vez que impossibilitam a elaboração de planos de ação para a
conservação das espécies e a designação de reservas biológicas.
O status de conservação de algumas espécies de cracídeos é crítico, especialmente
as de distribuição mais restrita como Oreophasis derbianus, Mitu mitu, Pipile pipile,
Penelope perspicax, Penelope albipennis, Crax alberti, Crax blumenbachii e Pauxi
pauxi.
Penelope perspicax e Crax alberti, por exemplo, estão quase extintos na
Colômbia (Velasco, 1997). Penelope albipennis foi considerada extinta no Peru até ser
4
Introdução
recentemente redescoberta (Macedo-Ruiz, 1979), sendo agora estudada em campo e em
cativeiro (Ortíz e Diaz, 1997; Ortíz e O'Neill, 1997; Diaz e del Solar, 1997).
Aparentemente há menos do que 200 indivíduos de Penelope albipennis na natureza
(Diaz e del Solar 1997).
Tabela 1. Lista de espécies de Cracidae, grau de ameaça de acordo com a classificação da
Birdlife International e do Grupo Especialista de Cracideos (CSG) da União Internacional de
Conservação da Natureza (IUCN) e sua distribuição geográfica. Lista compilada por S. Strahl e
D. Brooks para o Plano de Ação de Conservação do CSG da IUCN a ser proposto para 20002004.
Espécie
BirdLife/IUCN
CSG
Distribuição
Ortalis leucogastra
LC
IN
México - Nicarágua
O. erythroptera
VU
VH
Equador S - Peru N
O. superciliaris
EN
IN
Brasil NE
Penelope purpurascens
LC
IN
México C - Equador
P. perspicax
EN
IM
Colômbia O
P. albipennis
CR
IM
Peru NO
P. ortoni
VU
HI
Colômbia O - Equador
P. ochrogaster
VU
HI
Brasil C,E
P. pileata
VU
HI
Brasil C,E
P. dabbenei
NT
HI
Bolívia S - Argentina N
P. jacucaca
NT
HI
Brasil E
P. superciliaris
NT
LO
Brasil - Argentina
P. obscura
LC
IN
Paraguai - Uruguai
P. argyrotris
NT
IN
Venezuela - Colômbia
P. barbata
EN
VH
Equador S - Peru NO
P. montagnii
NT
IN
Venezuela - Colômbia
Pipile pipile
CR
IM
Trinidad
P. cujubi
LC
IN
Brasil O,C - Bolívia NE
P. jacutinga
VU
VH
Brasil SE - Argentina NE
Aburria aburri
NT
HI
Venezuela O - Peru C
Chamaepetes goudotii
LC
IN
Colômbia - Bolívia
C. unicolor
EN
VH
Costa Rica - Panama N
Penelopina nigra
VU
HI
México S - Nicaragua N
Oreophasis derbianus
EN
IM
México S - Guatemala N
Mitu mitu
EW
IM
Brasil CE
M. tuberosa
LC
IN
Colômbia SE - Bolívia N
M. salvini
LC
IN
Colômbia SE - Peru NE
Pauxi pauxi
EN
IM
Venezuela N - Colômbia E
P. unicornis
EN
VH
Peru SE - Bolívia C
Crax rubra
NT
HI
México C - Equador O
C. alberti
CR
IM
Colômbia N
C. daubentoni
NT
HI
Colômbia NE – Venezuela
C. fasciolata
LC
HI
Brasil NC - Argentina NE
C. globulosa
VU
HI
Colômbia SE - Brasil O
C. blumenbachii
CR
IM
Brasil SE
Distribuição: C = Central, E = leste, N = norte, S = sul, O = oeste. Status do BirdLife: EW =
extinto na natureza, CR = criticamente em perigo, EN = em perigo, VU = vulnerável, NT = quase
ameaçado, LC = pouca preocupação. Prioridades de conservação do CSG: IM = imediata, VH
= muito alta, HI = alta, IN = intermediária, LO = menor do que intermediária.
5
Introdução
O mutum-de-Alagoas (Mitu mitu), endêmico do estado de Alagoas no Brasil, pode
estar extinto na natureza, sendo representado por poucas aves em cativeiro (Nardelli,
1993). A ameaça principal desta espécie é a perda de habitat devido ao aumento do
cultivo de cana-de-açucar no estado (D'Angieri, 1997).
Um programa de reprodução em cativeiro para C. blumenbachii tem sido
realizado a algum tempo em Belo Horizonte, Brasil, e cerca de 60 casais foram
reintroduzidos em parte de sua distribuição original por meio de esforços da Fundação
Crax e com apoio da Stichting Crax, Europa (Azeredo 1996, Simpson e Azeredo 1997).
A reintrodução dessas aves tem alcançado sucesso, e a segunda geração das aves
reintroduzidas já foi documentada (Azeredo 1996, Scheres 1997). Contudo, estudos
recentes demonstraram que os indivíduos não aparentados usados na reintrodução
apresentam variabilidade genética esperada para indivíduos com parentesco de primeiro
grau (Pereira e Wajntal, no prelo), evidenciando a necessidade de aumentar a
variabilidade genética do estoque cativo de onde estas aves provenieram.
Quanto às relações filogenéticas do grupo a literatura científica a respeito é
extremamente escassa. Segundo dados obtidos em experimentos de hibridação de DNADNA, Sibley et al. (1988) propõem a separação do grupo em uma ordem diferente dos
Galliformes, a ordem Craciformes, composta de duas subordens, que incluiria os
cracídeos (Craci) e os megapodídeos (Megapodii). Em 1976, Prager e Wilson já haviam
sugerido a separação dos Cracidae dos demais galiformes baseando-se em estudos de
proteínas. Segundo este estudo, a separação entre os cracídeos dos demais galiformes
teria ocorrido na mesma época que a separação Galliformes-Anseriformes.
Delacour e Amadon (1973) esquematizaram a possível relação entre os cracídeos,
baseados no conhecimento da biologia desta família. Para eles, os mutuns (Crax e
Nothocrax) seriam grupo-irmão dos demais gêneros. Chamaepetes, Aburria, Penelopina
e Penelope são próximos entre si e apresentam ancestral comum com Ortalis que por sua
vez teria se divergido a partir de uma linhagem que levou aos modernos Oreophasis.
Desde essa proposta das relações filogenéticas dessa família, a classificação dos Cracidae
sofreu modificações. O gênero Crax foi subdividido em Crax, Mitu e Pauxi. As espécies
6
Introdução
do gênero Aburria foram subdivididas nos gêneros Aburria e Pipile. Sibley e Ahlquist
(1990) usaram cinco dos onze gêneros reconhecidos atualmente para a família Cracidae
em seus estudos de relações filogenéticas de aves baseados nas técnicas de hibridação
DNA-DNA. Seus estudos sugerem que Crax e Ortalis são mais relacionados entre si do
que aos demais jacus. Entre os jacus, Chamaepetes é mais relacionado ao grupo
(Penelope, Pipile).
Recentemente
Nardelli
(1993)
sugeriu
a
necessidade
de
padronizar
sistematicamente este grupo devido a problemas taxonômicos em relação a o que
considerar como uma espécie ou uma raça (Delacour e Amadon, 1973; del Hoyo et al.,
1994). Por exemplo, no gênero Ortalis há a necessidade da definição do status de espécie
das subespécies Ortalis guttata columbiana e Ortalis ruficauda lamprophonia. No gênero
Penelope deve haver uma ampla revisão das espécies e quais as relações entre elas,
especialmente entre Penelope argyrotis/Penelope barbata. Ainda Penelope montagnii
pode ser composta de duas subespécies distintas uma vez que há diferenças de
vocalização entre as duas populações conhecidas. Os mutuns também apresentam
problemas taxônomicos específicos. A delimitação de Mitu mitu como uma espécie a
parte de Mitu tuberosa é questionada por alguns cracidologistas. Crax rubra pode
representar um complexo de subespécies e raças ainda não bem definidas.
Origem da Família Cracidae
Em relação à origem da Família Cracidae, duas hipóteses foram propostas. Uma
delas proposta por Darlington (1957) é baseada em dados de distribuição das espécies de
cracídeos. Para Darlington, os cracídeos estavam presentes na América do Sul antes que a
América Central surgisse, ligando as Américas do Sul e do Norte há 3,5 milhões de anos.
O autor se baseou ainda no fato de que áreas com o maior número de espécies são o
centro de origem e dispersão.
A hipótese concorrente admite uma origem Norte ou Centro-americana, e foi
formulada por Delacour e Amadon (1973) baseado nos mesmos dados de distribuição
usados por Darlington. Delacour e Amadon sugeriram que a diversificação deles se deu
7
Introdução
em decorrência de sua entrada na América do Sul, uma ampla área com diferentes nichos
para serem preenchidos.
Com base na primeira hipótese, os cracídeos teriam passado por um processo de
dispersão e diferenciação múltiplas. Os gêneros Penelopina e Oreophasis são encontrados
apenas na América Central, enquanto em toda a América do Sul apenas Nothocrax é
endêmico. Os mutuns bem como os jacus do gênero Penelope são mais diversificados na
América do Sul do que na América do Norte.
A hipótese levantada por Darlington apresenta alguns pontos favoráveis. Os
Galliformes, assim como outros grupos de aves como as ratitas, os anseriformes, os
psitaciformes, pombos, passeriformes, mergulhões e pinguins, se originaram na
Gondwana (Cooper e Penny, 1997; Cracraft, 1974) e levaram Cracraft (1974) a propor
que as aves galináceas deveriam ter se dispersado da América do Sul para a América do
Norte, e posteriormente alcançado a Ásia e Europa.
A família Megapodiidae é considerada o grupo-irmão dos Cracidae (Cracraft,
1974; Sibley et al., 1988; del Hoyo et al., 1994). Seus representantes são encontrados em
áreas arbustivas secas e florestas tropicais na região australiana. Este padrão de
ditribuição disjunta entre táxons irmãos pode ser explicado pela teoria da tectônica de
placa, especialmente a quebra da Gondwana. Um caso clássico de distribuição disjunta é
o caso das aves ratitas (e.g., van Tuinen et al., 1998).
Os Cracidae e os Megapodiidae são considerados os mais primitivos Galliformes
(Cracraft, 1974; del Hoyo et al., 1994). Durante a divergência destas duas famílias, o
clima do continente Antártico parecia ser favorável para a sobrevivência de plantas e
animais, e então poderia servir como uma rota de dispersão entre organismos
sulamericanos e australianos (Briggs, 1987, e referências citadas; Huber, 1998). Seus
ancestrais poderiam ter se tornado extintos com o esfriamento do clima do continente e
formação das calotas de gelo conforme a Antártica foi migrando cada vez mais ao sul.
De fato, Alvarenga (1995) evidencia um outro ponto favorável à origem
sulamericana dos cracídeos: a descrição do primeiro registro fóssil de um Megapodiidae
do Oligo/Mioceno do Brasil. Se o ancestral dos Cracidae e Megapodiidae esteve presente
na América do Sul, os Megapodiidae poderiam ter alcançado a Austrália através da
8
Introdução
Antártica, como já sugerido para outros grupos como anuros, lagartos, tartarugas,
artrópodos e especialmente, marsupiais (Briggs, 1987, Springer et al., 1998).
Não há registro fóssil de Cracidae na América do Sul. Na América do Norte seis
fósseis foram atribuídos aos Cracidae: 1) Procax brevipes (Tordoff e Macdonald, 1957)
do Oligoceno, Palaenossax senectus (Wetmore, 1956) do Oligoceno e Ortalis pollicaris
(Miller 1944) do Mioceno na Dakota do Sul; 2) Boreortalis laesslei (Brodkorb, 1954) do
Mioceno na Florida; e 3) Ortalis phengites (Wetmore, 1923) do Plioceno e Ortalis
tantala (Wetmore, 1933) do Miocene em Nebraska. Contudo, Crowe e Short (1992)
argumentaram que a maioria dos caracteres atribuídos a estes fósseis norteamericanos são
na realidade primitivos aos Galliformes e não os definem necessariamente como
Cracidae.
A presença de um pequeno galiforme em depósitos do Eoceno em Quercy, França
(Mourer-Chauviré, 1992) tidos como relacionados aos megapodídeos modernos e
classificado como uma família a parte, os Quercymegapodiidae, é uma evidência contra a
origem sulamericana dos Cracidae. Se os Galliformes tivessem se originado no
Hemisfério Norte, a explicação para a distribuição disjunta dos Cracidae e Megapodiidae
requer que estas aves ou seus ancestrais tenham se tornado extintos em toda a América do
Norte e Ásia. Contudo, parece haver evidências contra a proximidade do fóssil francês
com os Megapodiidae modernos (cf. del Hoyo et al., 1994), tornando novamente a
hipótese sulamericana da origem dos cracídeos mais plausível e facilmente explicada por
dispersão pela Antártica e pela tectônica de placas.
Para auxiliar a elucidar as relações filogenéticas e a evolução da família Cracidae,
são necessários revisões taxonômicas, estudos comportamentais e estudos moleculares.
Do ponto de vista molecular, o estudo do DNA mitocondrial (mtDNA) tem auxiliado
sobremaneira os estudos ornitológicos que visam estimar a diversidade genética
(Gutierrez, 1994), distinguir populações de uma mesma espécie (Ball et al., 1988; Freitag
e Robinson, 1993), e estabelecer relações filogenéticas (Cooper et al., 1992; Krajewski e
Fetzner, 1994; Myaki et al., 1998, Nahum et al., submetido). As técnicas de
seqüenciamento de genes mitocondriais e a teoria de reconstrução filogenética molecular
podem auxiliar a resolver parte dos problemas evolutivos da família Cracidae.
9
Introdução
FILOGENIA MOLECULAR
Desde tempos remotos na história da humanidade, já existia uma preocupação de
descrever e classificar a diversidade biológica. Contudo, somente na segunda metade
desse nosso século foi proposto um sistema de classificação biológica, baseado na
premissa de que os organismos constituem sistemas contínuos e modificados. Willi
Hennig, um entomólogo alemão, fundava uma nova corrente de classificação dos seres
vivos, a Cladística ou Sistemática Filogenética (Hennig, 1950). Esta escola foi pouco
difundida no mundo científico em sua primeira década de existência até a obra original de
Hennig publicada em 1950 ser traduzida do alemão para o inglês em 1966.
Nos anos que se seguiram observou-se grandes avanços conceituais e
metodológicos em filogenia, e sua aplicação não apenas em questões relacionadas à
classificação da biodiversidade mas também nos mais diversos ramos das Ciências
Biológicas, visando auxiliar a compreender a diversidade biológica, a evolução dos
táxons e a modificação dos caracteres morfológicos, comportamentais, fisiológicos e
moleculares.
Ao mesmo tempo que a teoria filogenética passava a ser mais amplamente
empregada, o surgimento de técnicas de análise de DNA como a análise de produção de
fragmentos gerados por enzimas de restrição, a clonagem gênica, a reação em cadeia da
polimerase, e o seqüenciamento de DNA, permitiu se compreender melhor a estrutura
molecular dos genes e genomas.
Estas técnicas de estudo do DNA permitiram ampliar os estudos de evolução
molecular em duas áreas principais que se interrelacionam intimamente: (1) o estudo dos
mecanismos e padrão de evolução de ácidos nucléicos e de proteínas, fundamental para
idealizar modelos para a inferência das relações entre os organismos e (2) a reconstrução
da história evolutiva dos organismos, também conhecida como filogenia molecular, e
aliada a outras disciplinas como biogeografia, geologia e paleontologia, permite traçar
hipóteses de origem, datação e evolução dos organismos e possibilita determinar e
compreender a ordem das mudanças dos caracteres.
10
Introdução
A Reconstrução Filogenética
A reconstrução filogenética consiste em estimar as relações de ancestralidade para
um determinado grupo de táxons. Por sua vez, os táxons podem ser famílias, gêneros,
espécies, populações ou qualquer nível taxonômico cuja história evolutiva se quer
determinar. Comumente são chamados de unidades taxônomicas operacionais ou
simplesmente OTUs, do inglês "operational taxonomic unit". Árvores filogenéticas são
representações gráficas destas relações taxonômicas, e contém ramos, nós internos e
terminais. Os nós terminais representam as OTUs estudadas, as quais são unidas por
ramos cujo nó interno representam o ancestral destes táxons (Fig. 2-a). Em outras
palavras, podemos definir uma árvore como a topologia entre as OTUs e comprimento
dos seus ramos, que por sua vez são uma representação quantitativa do número de
mudanças evolutivas ocorridas ao longo daquela linhagem.
A
Aves
1
A
2
5
B
Mamíferos
Crocodilos
C
D
Anfíbios
7
6
E
F
9
11
8
B
Serpentes
3
4
Tartarugas
G
D
Lagartos
C
10
Tartarugas
Aves
B
Cobras
Serpentes
A
12
Mamíferos
Lagartos
Anfíbios
Crocodilos
Figura 2. Representação de uma árvore dicotômica enraizada (a) e não enraizada (b). Anfíbios, Mamíferos,
Tartarugas, Lagartos, Serpentes, Crocodilos e Aves são as OTUs representadas nos nós terminais. Estas
OTUs são unidas aos seus ancestrais (representados pelos nós internos A, B, C, D, E, F e G) através de
ramos (1-12). Note que na árvore não enraizada, os ancestrais E e F são unidos em G.
Uma árvore como a mostrada graficamente na figura 2 indica que as Aves e os
Crocodilos são grupos-irmãos pois apresentam um ancestral comum mais próximo entre
si do que com os outros clados, assim como o são Serpentes e Lagartos. Por sua vez o
clado (Aves, Crocodilos) é grupo-irmão de (Serpentes, Lagartos), e assim por diante. Ela
11
Introdução
pode ser representada linearmente da seguinte maneira: (Anfíbios, (Mamíferos,
(Tartarugas, ((Serpentes, Lagartos), (Aves, Crocodilos))))). Em outras palavras, cada nó
interno é representado por um par de parenteses que inclue todas as OTUs descendentes
deste nó.
Homologia de Caracteres
Assim como a Sistemática Filogenética, a Sistemática Molecular baseia-se no
conceito de homologia de caracteres para traçar a história evolutiva dos táxons em
questão. Diz-se que estruturas ou orgãos são homólogos se eles apresentam uma origem
embrionária comum, não necessariamente apresentando a mesma função. Por exemplo, as
patas dianteiras do jacaré, as asas dos morcegos, os braços humanos e as asas das aves
exercem funções diferentes mas apresentam um mesma origem embrionária. Estruturas
que não apresentam uma origem embrionária comum, embora possuam semelhanças
morfológicas e funcionais, são chamadas análogas, como as asas dos insetos e as asas dos
morcegos. O fenômeno resultante do conjunto de processos (convergência, paralelismo e
reversão) que leva à formação de duas estruturas análogas é denominado homoplasia.
Embora estes termos tenham sido definidos inicialmente para caracteres
morfológicos, eles também se aplicam a genes. E quando estamos tratando de genes, o
conceito de homologia torna-se um pouco mais complexo. Dizemos que dois genes são
ortólogos caso eles tenham homologia dada através de especiação, e portanto apresentam
um ancestral comum. Os genes mitocondriais, por exemplo, são considerados ortólogos,
pois acredita-se que a origem da mitocôndria nos seres vivos tenha ocorrido em um
estágio inicial da história da vida, antes da divergência entre os seres vivos atuais.
Se a homologia entre dois genes deve-se a duplicação de um gene ancestral em
uma mesma espécie então eles são ditos parálogos. Em alguns casos poucas
modificações nucleotídicas são suficientes para conferir ao gene uma função diferente. A
utilização de genes pertencentes a famílias gênicas (paralogia) dificulta a obtenção de
seqüências de uma mesma região do genoma, uma vez que as cópias podem possuir
diferentes pressões de seleção, ter diferentes histórias evolutivas e até mesmo ocupar
cromossomos diferentes. Por exemplo, em Chaetognatha, um grupo de invertebrados
marinhos vermiformes, há duas classes de genes ribossomais 28S. Ambas as cópias
12
Introdução
parecem ser funcionais e possuem taxas evolutivas diferentes, o que causou problemas de
interpretação da história evolutiva deste grupo (Telford e Holland, 1997).
Um outro caso de homologia de genes, a xenologia, ocorre quando um gene de
uma espécie é introduzida em outra espécie, fenômeno conhecido como transferência
horizontal. Isto pode ocorrer por exemplo através de retrovírus, ou através da formação
de híbridos férteis que cruzam com indivíduos de uma das espécies parentais. Um quarto
conceito de homologia gênica, a plerologia, ocorre por meio da interação entre exons e
introns de um mesmo gene, como por exemplo, através de embaralhamento de exons
(“exon shuffling”) ou de evolução em concerto (“concerted evolution”). Genes parálogos
e plerólogos podem ser úteis para mostrar eventos de surgimento de novos genes ou
famílias gênicas, mas não refletem a história evolutiva entre unidades taxonômicas.
Alinhamento de Seqüências Moleculares
A inferência da árvore evolutiva de um grupo de táxons a partir da comparação
entre as seqüências de genes homólogos requer que estas seqüencias estejam alinhadas. O
alinhamento nada mais é do que uma hipótese de homologia e como tal, consiste em
trabalhar com seqüências homólogas e definir posições homólogas ao longo destas
seqüências. Assim sendo, um outro conceito de homologia se faz necessário: a homologia
posicional. Uma vez que para uma dada seqüência cada posição ou sítio é tratado como
um caracter, pressupôe-se que essas posições sejam homólogas. Freqüentemente o
conceito de homologia é confundido com o conceito de similaridade. Se dois genes são
sabidamente homólogos e as posições homólogas foram definidas, podemos estabelecer a
quantidade de sítios iguais entre as seqüências destes dois genes. Assim se as seqüências
deles apresentam 100 sítios, dos quais 92 são idênticos e 8 deles são variáveis, eles ainda
continuam sendo homólogos e apresentam 92% de similaridade entre si, e não 92% de
homologia.
A homologia posicional em seqüências ortólogas permite reconhecer substituições
e eventos de inserção e deleção (“indels”) de bases em uma ou mais seqüências. O termo
"indel" é útil neste caso porque nem sempre é possível determinar a priori em um
13
Introdução
alinhamento se houve um evento de inserção de nucleotídeos em um grupo de seqüências
ou se ocorreu a perda de alguns nucleotídeos no outro grupo.
Indels que ocorrem durante o processo evolutivo podem ser mantidos,
especialmente se não afetarem o valor adaptativo do portador. É importante saber se eles
representam realmente eventos de inserção/deleção que ocorreram ao longo da evolução,
ou se eles simplesmente representam lacunas que se originaram durante o alinhamento
das seqüências, pela ocupação de uma mesma região por bases diferentes. As regiões
onde os indels ocorrem apresentam lacunas de alinhamento. Os métodos de inferência
filogenética podem lidar com as lacunas como um quinto estado do caracter ou então
ignorar na análise os sítios que as apresentam. O problema de desconsiderar essas regiões
com lacunas é que podemos perder informação evolutiva se elas representarem
verdadeiros eventos indels (Morrison e Ellis, 1997).
O alinhamento dos genes que codificam proteínas é relativamente fácil, devido ao
fase de leitura, que permite reconhecer modificações mais freqüentemente na terceira
posição do códon. Genes ribossomais podem ser facilmente alinhados se a estrutura
secundária da molécula for levada em consideração e/ou se os táxons em estudo são
próximos entre si. Domínios funcionais podem ser facilmente reconhecidos. Seqüências
não codificantes para proteínas, como as regiões 5’ e 3’ não transcritas, e 5’e 3’não
traduzidas, introns de genes nucleares e a região controladora do DNA mitocondrial, são
de difícil alinhamento. Diferenças nas taxas de substituições ou a saturação de
substituições em seqüências podem introduzir homoplasias ao longo do tempo,
dificultando o alinhamento e interferindo na estimativa da filogenia.
O alinhamento pode ser feito manualmente, quando pouca variação existe entre as
seqüências, ou através de algoritmos computadorizados. Esses algoritmos buscam sempre
alinhar o máximo de nucleotídeos em todas as posições e dão pesos diferentes à presença
e à extensão das lacunas durante o alinhamento. Contudo, após o alinhamento ser feito
pelo computador, uma averiguação visual sempre é recomendada para que se decida se o
alinhamento realizado é satisfatório ou se há necessidade de correções.
14
Introdução
Monofilia
Outro ponto importante da reconstrução filogenética é o conceito de monofilia.
Quando se deseja inferir a relação de um dado grupo taxonômico, partimos do
pressuposto de que nosso grupo de análise é monofilético, isto é, as OTUs que analisamos
apresentam um ancestral comum. Grupos monofiléticos por definição incluem aqueles
táxons que apresentam sinapomorfias, isto é caracteres derivados de um mesmo ancestral
comum. Por exemplo, a partir de nossa figura 2, podemos definir um grupo monofilético
denominado Amniota composto pelos clados dos Mamíferos, Tartarugas, Lagartos,
Serpentes, Crododilos e Aves, cujo ancestral mais recente está representado pelo nó
interno E. Já o tradicional grupo Reptilia (Tartarugas, Lagartos, Serpentes e Crocodilos)
não constitui um grupo monofilético uma vez que um de seus representantes (as Aves) é
considerado um grupo a parte. Contudo, o clado formado pelos Crocodilos e Aves pode
ser considerado monofilético por apresentar um ancestral representado pelo nó interno A.
Este grupo é denominado de Archosauria.
Grupos não monofiléticos podem ser denominados parafiléticos ou polifiléticos
(Hennig, 1966). Parafilia ocorre quando o grupo de OTUs possui caracteres diagnósticos
que são na verdade simplesiomorfias, isto é, são um conjunto de caracteres primitivos, e
nem todos os descendentes do ancestral comum deste grupo estão incluídos no grupo
interno, como no caso Aves-Répteis. Polifilia inclui grupos onde os caracteres
diagnósticos são homoplásicos e os táxons não são descendentes de um mesmo ancestral
comum, como por exemplo agrupar Aves e Mamíferos simplesmente por apresentarem
homotermia. Segundo Bernardi (1981), grupos não monofiléticos deveriam ser chamados
de merofiléticos (mero, do grego, parte ou porção), uma vez que este termo não provoca a
confusão dos conceitos de parafilia e polifilia.
Uma maneira de se testar a monofilia de um grupo de OTUs é através da inclusão
de um grupo externo (Maddison et al., 1984), isto é, um táxon sabidamente próximo,
porém não pertencente ao grupo de análise, o grupo interno. Por exemplo, em nossa
figura 2, Anfíbios e Mamíferos podem ser considerados grupo externo dos clados cujo
ancestral comum é D (clado este denominado Sauropsida).
15
Introdução
O uso do grupo externo surgiu na escola cladística, diferenciando-a da escola
fenética. Esta por sua vez, agrupa os táxons simplesmente por semelhanças
compartilhadas. Para a escola cladista, a escolha do grupo externo está baseada em usar
um ou mais táxons que apresentem caracteres primitivos (plesiomórficos) em relação aos
táxons do grupo interno. O grupo externo será responsável pela polarização das
modificações das características morfológicas. Na escola molecular, o uso de um táxon
não pertencente ao grupo interno pode ser usado para enraizar a árvore filogenética, sem
uma hipótese a priori de polarização de mudança de nucleotídeos. Isto é relevante neste
caso porque a reversão de um nucleotídeo para o seu estado ancestral pode ocorrer, e a
mudança de um nucleotídeo para outro não pode ser polarizada. Afinal uma mudança de
um nucleotídeo A para G, por exemplo, não requer a passagem pelo outros estados (C ou
T).
Se vários táxons são usados como grupos externos, a monofilia do grupo interno
pode ser constatada se nenhum dos nossos táxons internos forem separados dos demais
por um ou mais táxons do grupo externo. Um procedimento que dispensa o uso de grupos
externos é a construção de árvores não enraizadas (fig. 2-b), o que consiste em
demonstrar apenas as relações entre as OTUs sem no entanto fazer relações temporais de
divergência e sem definir relações de ancestrais e descendentes. Desta maneira, também
não ocorre a polarização dos caracteres a priori.
De um modo geral, a análise e reconhecimento de grupos monofiléticos em
árvores não enraizadas é mais difícil do que em árvores enraizadas. Em uma árvore não
enraizada, o grupo Anfíbios, considerado grupo-externo dos demais tetrápodas na árvore
enraizada da figura 2-a, poderia ser considerado aparentemente mais próximo aos
Mamíferos, indicando que um certo cuidado deve ser tomado na interpretação destas
árvores.
O número de árvores dicotômicas enraizadas (R) e não enraizadas (U) possíveis
são dados, respectivamente, pelas fórmulas:
R = [(2n-3)!] / [2n-2(n-2)!] e U = [(2n-5)!] / [2n-3)(n-3)!] ,
16
Introdução
onde n corresponde ao número de táxons (Felsenstein, 1978). Quanto maior o número de
OTUs, maior o número de possíveis árvores dicotômicas (Tab. 2) e maior o tempo
computacional para se chegar à estimativa das relações entre elas.
Tabela 2. Número total de possíveis árvores dicotômicas enraizadas e
não enraizadas para n OTUs.
Número de OTUs Árvores Enraizadas Árvores não enraizadas
2
1
1
3
3
1
4
15
3
5
105
15
6
945
105
7
10.395
945
8
135.135
10.395
9
2.027.025
135.135
10
34.459.425
2.027.025
Mutação
No presente contexto, mutação é definida como qualquer mudança em uma
seqüência de DNA. A maioria delas pode ocorrer durante a replicação do DNA, e
portanto, a taxa de mutação dependerá do número de replicações (Miyata et al., 1987;
Ellegren e Fridolfsson, 1997). As mutações podem ocorrer em células somáticas e em
células germinativas. Somente as mutações ocorridas nestas últimas são transmitidas às
próximas gerações no caso de organismos com reprodução cruzada e portanto, podem ser
úteis em reconstrução filogenética.
As mutações podem ser classificadas como (1) substituições simples (ou mutação
de ponto) quando ocorre a troca de um nucleotídeo por outro (sítios 2, 5, 10, 12 e 14 da
figura 3), (2) deleções, quando um ou mais nucleotídeos são removidos da seqüências
(sítios 7, 15 e 16 da figura 3), (3) inserções, quando ocorre adição de um ou mais
nucleotídeos na seqüência (sítio 18 da quarta e quinta sequências da figura 3), e (4)
inversões, quando alguns pares de base em uma seqüência de DNA dupla fita sofrem uma
rotação de 180o (sítios 8 a 14 da última seqüência da figura 3 em relação às demais).
17
Introdução
1111111111
1234567890123456789
ACGTATACATGGGCGTAAC
ACGTTTACACGGGCGTAAC
AGGTTT-CACGAGCGTAAC
AGGTTT-CATGAGA--AAAC
AGGTTT-CACGAGA--AAAC
AGGTTT-AGAGCAC--AAC
Figura 3. Alinhamento de seqüências hipotéticas. Cada número na parte
superior da figura identifica a posição dos nucleotídeos homólogos
dispostos em cada coluna. Cada linha representa uma seqüência. A
última seqüência foi separada das demais por apresentar uma inversão.
Substituição de Nucleotídeos
As substituções de nucleotídeos podem ser classificadas ainda em transições e
transversões. Transições são substituições entre pirimidinas (T e C) ou entre purinas (A e
G). Transversões são quaisquer substituições entre uma purina e uma pirimidina, como
por exemplo, de A para C, de A para T, de C para G, e assim por diante. Considerando-se
todas as possíveis substituições entre A, C, G e T, temos 4 tipos de transições e 8 tipos de
transversões (Fig. 4).
A
G
Transição
Transversão
C
T
Figura 4. Esquema representando as possíveis transições e transversões
entre as quatro bases nitrogenadas da cadeia de DNA.
No caso de genes que codificam para uma proteína, podemos classificar as
substituições ocorridas em uma seqüência de DNA de acordo com seu efeito na cadeia de
aminoácidos. Assim, se a substituição nucleotídica produzir uma modificação que leve a
uma substituição de um aminoácido por outro na seqüência da proteína, a denominamos
de substitutição não sinônima. Se não houver substituição de aminoácidos, a
denominamos substituição sinônima. Além disso, as mutações de ponto do tipo inserção
ou deleção podem levam a uma modificação no quadro de leitura de genes codificantes,
18
Introdução
modificando toda a seqüência de aminoácidos a partir do códon onde a mutação ocorreu.
Outra conseqüência de indels é a formação de códons de parada em uma posição aquém
ou além da posição original, o que leva a produtos proteícos menor ou maior,
respectivamente. No caso de regiões não codificantes como os genes ribossomais e
introns, por exemplo, a presença de indels podem não produzir efeitos tão drásticos.
Modelos de Evolução Molecular
O processo de substituições nucleotídicas nas populações poderá ser observado no
decorrer do tempo, através das gerações que herdam estas substituições. Uma vez que a
taxa de substituições nucleotídicas e a história evolutiva são inferidas a partir deste
processo, modelá-lo permite compreender melhor como ocorrem as substituições ao
longo do tempo.
Diversos modelos de substituição de nucleotídeos e de aminoácidos foram
propostos e certamente novos modelos serão postulados com o crescente aumento do
conhecimento sobre evolução molecular. Aqui são apresentados, os princípios básicos de
alguns destes modelos e outros que levaram à elaboração de modelos mais complexos,
alguns dos quais são utilizados ao longo desta tese. Uma característica comum desses
modelos é que eles podem ser representados em uma matriz onde a probabilidade de
substituição permance constante ao longo do tempo e a frequência das bases encontra-se
em equilíbrio. Esta matriz é dada por:
 pAA
 pCA
Pt = 
 pGA

 pTA
pAC
pCC
pGC
pTC
pAG
pCG
pGG
pTG
pAT 
pCT 
,
pGT 

pTT 
onde pAC é a probabilidade de que o nucleotído A seja substituído pelo nucleotído C ao
final do intervalo de tempo t, e assim por diante. Os elementos da diagonal pAA, pCC,
pGG e pTT representam a probabilidade de não ser observada uma substituição de
nucleotídeo ao final do tempo t.
19
Introdução
Modelo de equivalência de substituição (JC69)
Jukes e Cantor (1969) propuseram um modelo bastante simples onde os
nucleotídeos A, C, G e T em uma seqüência de DNA ocorrem em frequências iguais, e a
probabilidade de substituição de um nucletídeo i para um nucleotídeo j depende
simplesmente da taxa de substituição instântanea u, estimada a partir dos dados.
Matematicamente, podemos representar este modelo de maneira simplificada
como:
Pij (dt ) = udt ,
onde dt representa o tempo decorrido. Assim, todos os elementos de nossa matriz Pt de
substituição dada acima seriam calculados como u.
Modelo de dois parâmetros (K80)
A observância de que transições ocorrem mais freqüentemente do que
transversões, permitiu Kimura (1980) desenvolver um modelo onde a taxa u de
substituição é convertida nas taxas de transição α e taxa de transversão β. Desta maneira,
.
β
αdt para transição
Pij (dt ) = 
e sua matriz Pt = 
α
para
t
ransversão
dt
β


β
β
.
β
α
α
β
.
β
β
α 
.
β

.
Modelo proporcional (F81)
A frequência de nucleotídeos contudo, não é similar entre as quatro bases. O
genoma mitocondrial de vertebrados por exemplo, apresenta uma redução na proporção
de G em relação às demais bases. Assim, Felsenstein (1981) elaborou o seguinte modelo:
uπC uπG uπT 
 .
uπA
.
uπG uπT 

Pij (dt ) = uπjdt e sua respectiva matriz Pt =
uπA uπC
.
uπT 


. 
uπA uπC uπG
onde πj representa a frequência do nucleotídeo j.
20
Introdução
Modelo HKY85 e F84
Os modelos K80 e F81 foram combinados concomitantemente por Hasegawa et
al. (1984, 1985) e por Felsentein (1984) em outros dois modelos, denominados HKY85 e
F84, respectivamente. Tornou-se possível combinar diferenças nas taxas de transição e
transversão e frequência desigual de bases em uma única estatística que permitisse o
estudo de um modelo de evolução mais realístico para seqüências de DNA.
Matematicamente, o modelo HKY85 é representado por:
βπC απG βπT 
 .

βπA
.
βπG απT 
απjdt para transição
Pij (dt ) = 
, com a matriz Pt = 
.
απA βπC
.
βπT 
 βπjdt para transversão


. 
 βπA απC βπG
A diferença entre este modelo e o F84, é o emprego do parâmetro κ que determina
a razão transição/transversão, e do parâmetro Πj representado pela frequência de
pirimidinas (πC+πT) se j for C ou T e purinas (πA+πG) se j for A ou G, respectivamente. A
formulação desse modelo passou a ser representada por:
 κ

 + 1uπjdt para transição
Pij (dt ) =  Πj 
.
uπjdt
para transversão

Modelo de TN93
A diferença na composição de bases reflete em diferenças na taxa de transições
entre pirimidinas e na taxa de transições entre purinas. Para adequar esta diferença a
modelos de evolução de seqüências, Tamura e Nei (1993) elaboraram o seguinte modelo:
αRπjdt para transição entre purinas

Pij (dt ) = αYπjdt para transição entre pirimidinas ,
 βπjdt para transversão

onde αR e αY representam, respectivamente, a taxa de transição entre purinas e
pirimidinas. A matriz Pt pode ser facilmente deduzida.
21
Introdução
Modelo Geral de Reversão ao Longo do Tempo (GTR, do inglês “General Time
Reversible”)
Um modelo geral de substituição foi desenvolvido (Rodriguez et al., 1990),
permitindo-se que taxas diferentes de substituição de um nucleotídeo por cada um dos
demais pudessem ser admitidas, considerando-se a frequência deles e a taxa de
substituição.
Neste caso a probabilidade passa a ser calculada como:
Pij (dt ) = vπjdt ,
onde v representa cada uma das possíveis mudanças de nucleotídeos. Nos casos onde a
probabilidade de uma modificação A→C, por exemplo, é a mesma que C→A, nossa
matriz Pt de substituições é dita simétrica, e quando A→C ≠ C→A, isto é cada
substituição apresenta sua própria probabilidade, temos uma matriz assimétrica.
Métodos de Reconstrução Filogenética
Os métodos filogenéticos que usam dados moleculares são numerosos e podem
ser divididos em três grupos principais: parcimônia, distância e máxima verossimilhança.
O primeiro destes grupos parte da premissa que hipóteses mais simples explicam melhor
a evolução biológica do que hipóteses mais complexas e que não há hipóteses ad hoc, isto
é, não existem hipóteses particulares para um dado ramo da árvore. Os métodos de
distância baseiam-se na transformação das seqüências de DNA ou proteínas em uma
matriz de distância estimada com base em um modelo evolutivo. A partir dessa matriz
uma árvore será reconstruída de modo a refletir a evolução das seqüências minimizando a
soma dos comprimentos dos ramos. O método de verossimilhança irá por sua vez usar
modelos evolutivos para estimar a probabilidade de uma árvore se adequar melhor aos
dados obtidos do que outras árvores concorrentes.
Métodos de Parcimônia
O método de parcimônia fundamenta-se no pressuposto de que a evolução pode
ser explicada por hipóteses mais simples. Em outras palavras a ocorrência de uma única
mutação seria mais provável que a ocorrência de duas mutações. Por exemplo,
22
Introdução
consideremos que para um determinado grupo de seqüências 1, 2, 3, 4 e 5 as três
primeiras OTUs apresentem o nucleotídeo A e as outras duas apresentem T. Agora
considere duas reconstruções hipotéticas entre elas apresentadas na figura 5. A árvore 1
indica a relação ((((1, 2), 3), 4), 5) onde ocorreu uma única modificação do nucleotídeo T
para o nucleotídeo A no ramo ancestral que levou aos táxons 1, 2 e 3. A árvore 2 indica a
relação ((((1, 2), 4), 3), 5) onde ocorreu uma substituição no ancestral de 1, 2, 3 e 4 e uma
segunda substituição na linhagem levando a 4. Pelo princípio da parcimônia, a árvore 1 é
escolhida por apresentar uma única substituição ao invés da árvore 2 que apresenta duas
substituições.
Árvore 1
5
T
4
T
3
A
2
A
Árvore 2
1
A
5
T
3
A
4
T
2
A
1
A
Tipo de substituição
T→
→A
A→
→T
Figura 5. Duas reconstruções hipotéticas para as OTUs 1, 2, 3, 4 e 5. As
barras horizontais cortando os ramos indicam substituições de nucleotídeos.
Assim, um conjunto de transformações destas seqüências pode ser representado
em várias árvores. A árvore que apresentar o menor número de passos (ou menor número
de substituições) é a árvore mais parcimoniosa. Obviamente uma topologia que é
minimizada ao menor número de passos também minimiza o números de homoplasias
que poderiam surgir (Swofford et al., 1996).
A parcimônia foi amplamente usada na Sistemática Filogenética uma vez que por
esse método não são necessárias hipóteses a priori sobre o processo evolutivo. Quando
surgem conflitos que não são resolvidos a não ser por hipóteses ad hoc, consideramos que
23
Introdução
eventos homoplásticos agiram nas seqüências analisadas. Também não é necessário o uso
de seqüências ancestrais para se inferir a topologia, a não ser que a obtenção de uma
árvore enraizada seja uma condição desejada pelo pesquisador. Neste caso, a inclusão de
um ou mais grupos externos auxilia a polarização das substituições.
Posteriormente surgiram variações do método de parcimônia. A Parcimônia de
Fitch, a qual se aplicam os dados de seqüência de DNA, admite que as mudanças são
livremente reversíveis e uma árvore pode ser enraizada em qualquer ponto sem ocorrer a
modificação de seu comprimento e os caracteres são do tipo multiestados não-ordenados,
portanto os estados de caracter são independentes entre si e não há restrições evolutivas
às mudanças de bases. Esse método se aplica ainda ao estudo de seqüências de
aminoácidos. Neste caso, cada um dos vinte aminoácidos é um estado de caracter, e não é
considerado que a substituição deles pode requerer de um a três passos, isto é, a
modificação de um aminoácido requer a substituição de um a três nucleotídeos.
Cabe ressaltar aqui, que quanto maior o tempo de divergência entre duas OTUs,
maior a probabilidade da variação entre elas se tornar estocástica, devido a uma saturação
no grau de mutações ocorridas. De fato, parece haver uma correlação linear entre o
número de diferenças de transição e transversão e a idade de divergência (Cracraft e
Helm-Bychowski, 1991; Helm-Bychowski e Cracraft, 1993).
Assim uma variante da parcimônia foi desenvolvida baseando-se na observação
de que o número de transições podem ocorrer mais freqüentemente que o número de
transversões em seqüências de DNA, portanto alcançando um nível de saturação de
substituições. Por esse modelo, denominado Parcimônia de Transversão, as transições
são ignoradas, nomeando-se as mudanças entre pirimidinas como um único estado de
caracter e as mudanças entre purinas como um outro estado. Uma desvantagem desse
método é que ocorre perda de informação evolutiva para táxons proximamente
relacionados quando usamos apenas dois possíveis estados de caracteres (no caso, purinas
e pirimidinas). Contudo, isto pode ser contornado dando pesos maiores às tranversões do
que às transições (Swofford et al., 1996) e considerar ambas na análise. Isto pode ser
facilmente realizado através de uma matriz de substituições onde os programas de
24
Introdução
reconstrução filogenética reconhecem se a substituição é uma transição ou uma
transversão e atribuem o peso determinado a esta modificação.
Os métodos de parcimônia podem ser generalizados em um método que considera
custos para as transformações de cada estado de caracter para outros. Esse método é
denominado por Swofford et al. (1996) de Parcimônia Generalizada e apresenta os
custos em uma matriz, onde cada elemento dela corresponde ao custo de transformação
de um estado a outro. Embora a Parcimônia Generalizada permita o uso de uma matriz
não simétrica, a análise é computacionalmente mais demorada em alguns casos e talvez
um dos maiores problemas é a determinação dos pesos das mudanças evolutivas.
A atribuição de pesos é bastante arbitrária e pouco estudada. Uma estratégia muito
utilizada de dar pesos às mudanças é basear-se na razão de transição:transversão (TS:TV)
estimada para as seqüências estudadas. Por este método, as transversões são pesadas
inversamente à TS:TV, isto é, para um grupo de seqüências onde esta taxa é 5:1, damos
peso 1 as transições e 5 as transversões. No caso de seqüências referentes a diferentes
genes ou regiões gênicas sendo consideradas com uma única seqüência (análise
combinada), podemos ainda partilhar os dados e atribuir pesos diferentes baseados na
TS:TV para cada um dos genes ou regiões gênicas analisadas.
Métodos de Distância
Os Métodos de Distância acomodam uma árvore a uma matriz de distâncias
calculadas para cada par possível de táxons analisados. Para seqüências de nucleotídeos, a
matriz pode ser calculada, por exemplo, baseando-se no número de sítios alterados
divididos pelo total de sítios analisados (distância-p), ou então usar um modelo evolutivo
como os apresentados anteriormente para obter as distâncias entre os pares de OTUs. O
próximo passo consiste em construir uma árvore onde cada comprimento do ramo reflete
a distância calculada. A melhor árvore é a que minimiza as discrepâncias entre as
distâncias quando estas são extrapoladas para os ramos.
O uso de matriz de distância é raro em estudos morfológicos e comum em estudos
bioquímicos (Farris, 1981) e dados moleculares, especialmente se esses dados forem
imunológicos ou de hibridação DNA-DNA. As distâncias podem ser corrigidas para
25
Introdução
mudanças sobrepostas, refletindo o número real de modificações ocorridas desde a
divergência entre duas seqüências a partir de seu ancestral comum.
Algumas condições devem ser satisfeitas por uma distância: (1) ela não pode ser
negativa; (2) ela deve ser simétrica, isto é d(a,b) = d(b,a); (3) a dissimilaridade entre duas
seqüências quaisquer não pode exceder as dissimilaridades de cada uma delas com um
terceira, isto é, as distâncias entre três seqüências podem ser representadas em um
triangulo; e (4) se d(a,b) = 0, então a = b.
Se as distâncias calculadas para dois pares de seqüências refletem a quantidade
real de substituição ocorrida no tempo evolutivo, então estas distâncias têm uma
propriedade de aditividade: a distância evolutiva entre cada par de OTU deve ser igual à
soma dos comprimentos de cada ramo no caminho que une estas duas OTUs. Distâncias
aditivas satisfazem a condição de quatro pontos: d(a,b) + d(c,d) ≤ max [d(a,c) + d(b,d),
d(a,d) + d(b,c)], onde a, b, c e d são quatro táxons quaisquer. Em outras palavras, esta
condição indica que uma de três distâncias deve ser menor ou igual às outras duas e estas
devem ser iguais.
Alguns métodos de distância aditivas são apresentados a seguir. De um modo
geral eles irão definir um erro de acomodação dos dados de distância se adequarem a uma
árvore. Neste cálculo, o valor absoluto da diferença entre a distância entre duas OTUs e o
comprimento dos ramos entre elas é considerado. Esse procedimento de cálculo de erro
de diferenças absolutas mínimas deve ser usado quando não sabemos a priori qual
estimativa de distância está mais sujeita a erro. Desta forma, reduzimos a perturbação
global gerada por valores de dados espúrios.
Por outro lado, se os erros das estimativas de distância são regularmente
distribuídos ao longo dos dados, o uso dos quadrados mínimos da diferença entre a
distância e o comprimento dos ramos é mais adequado. Se conhecermos qual estimativa é
mais suscetível a erro, podemos dar pesos diferentes à elas. O peso nesse caso vai se
referir à discrepância entre as distâncias menores e maiores.
O cálculo dos erros através dos quadrados mínimos e o das diferenças absolutas
mínimas assumem implicitamente que a distância entre cada par é uma medida
independente das demais. Isto no entanto não é verdadeiro para moléculas. Se as amostras
26
Introdução
fossem realmente independentes então as árvores seriam mais claras em suas topologias.
Outra conseqüência é que qualquer erro sistemático pode ser multiplicado por
amostragem, então os métodos de distâncias seriam mais influenciáveis pela ocorrência
de homoplasias (Swofford et al., 1996).
Um outro método usando o critério dos quadrados mínimos sem dar pesos às
estimativas de distância foi desenvolvido, porém utilizando-se um critério diferente de
avaliar e comparar as árvores. Denominado Método de Evolução Mínima, a otimização é
feita simplesmente por meio da soma dos valores dos comprimentos dos ramos que
minimizam a soma dos desvios quadrados entre as distâncias observadas e as estimadas
pelo comprimento do caminho entre dois táxons analisados. Uma vantagem desse método
é que o desvio devido a diferenças grandes entre seqüências pequenas se torna
desprezível com o aumento do tamanho das seqüências.
Os métodos citados acima podem se basear em distâncias ultramétricas para
reconstruir a árvore. Distâncias ultramétricas são mais restritas evolutivamente que as
aditivas. Por definição matemática distâncias ultramétricas satisfazem uma condição de
três pontos: duas das três distâncias entre três táxons é igual ou superior à terceira
distância. Matematicamente isto pode ser representado por d(a,b) ≤ max [d(a,c), d(bc)].
Implicitamente às distâncias ultramétricas está incorporado a constância de taxa de
evolução entre as OTUs. Contudo não há garantia de que a quantidade de divergência seja
linear no tempo e que os táxons evoluam a uma mesma taxa.
A presença de lacunas, quer sejam introduzidas pelo alinhamento devido à grande
número de substituições em uma dada região da seqüência, quer representem verdadeiros
eventos indels, interferem no cálculo das distâncias. A solução mais prática neste caso é
omitir sítios em que as lacunas ocorrem, mesmo que muita informação seja perdida,
diminuindo assim a similaridade favorecida pelas lacunas. Em outras palavras, se duas
seqüências apresentarem um grande número de lacunas necessárias para aumentar a
similaridade entre elas, a distância entre elas pode parecer menor do que realmente é.
Outra questão que deve ser considerada é que as seqüências que estão sendo comparadas
podem ter tamanhos diferentes (Larson, 1991), levando ao aumento de número de lacunas
durante o alinhamento.
27
Introdução
A similaridade entre duas seqüências não pode ser diminuída se mudanças
subsequentes ocorrem na mesma posição. Contudo, as seqüências podem apresentar um
aumento da similaridade devido a paralelismo e reversão. Nestes casos, a distância-p
passa a ser uma alternativa bastante simplista que não considera os eventos sobrepostos.
Outras distâncias podem ser estimadas baseadas nos modelos evolutivos vistos
anteriormente, corrigindo eventos sobrepostos que ocorreram, especialmente em
seqüências que tenham divergido a muito tempo.
Swofford et al. (1996) discutem alguns pontos fracos do uso de distâncias na
inferência da filogenia. Quando transformamos dados de caracteres descontínuos em
dados de distâncias, estamos perdendo informação evolutiva. Uma vez obtida uma
distância é impossível se retornar aos dados de caracter descontínuos que a originou.
Diferentes tipos de dados não podem ser usados na mesma análise. Se nossas distâncias
foram estimadas para seqüências de DNA não podemos comparar estas distâncias com as
calculadas para distâncias imunológicas, por exemplo. Outro aspecto negativo do uso de
distâncias é que elas não fornecem informação de qual caracter contém ou não
informação filogenética, como fazem os dados de caracteres descontínuos.
Contudo em casos onde a parcimônia e a verossimilhança são impraticáveis sob o
ponto de vista de tempo gasto com cálculos em computador devido a um grande número
de dados, os métodos de distâncias podem ser a única alternativa para obter a topologia
em um período razoável de tempo.
Método de Verossimilhança
O princípio básico do método de verossimilhança é estimar a probabilidade
relativa dos dados obtidos se adequarem a uma árvore e perante um modelo que descreve
a evolução do processo em estudo. Em termos de evolução de seqüências de DNA, o
método irá calcular a probabilidade de que aquelas seqüências em estudo tenham sido
geradas, seguindo as premissas do modelo evolutivo escolhido. Neste caso, a topologia e
o comprimento dos ramos de uma árvore são os parâmetros a serem estimados, dadas as
seqüências finais nos topos dos ramos.
28
Introdução
A probabilidade deve ser calculada para todas as topologias possíveis variando o
tamanho dos ramos para um grupo de unidades taxonômicas operacionais. A árvore (isto
é, a topologia mais o comprimento dos ramos) que apresentar a maior verossimilhança
(probabilidade relativa) é considerada a melhor estimativa da filogenia.
Calcular a probabilidade de uma árvore envolve calcular as probabilidades de
ocorrências de todos os possíveis estados ancestrais de caracteres nos nós internos da
árvore, isto é, calcular a possível ocorrência de cada um dos nucleotídeos ter estado
presente em um nó interno. A maioria dos modelos evolutivos para seqüências de DNA
admite reversão de caracteres ao longo do tempo, visto que a mudança de nucleotídeos,
digamos de A para C, é independente da mutação reversa de C para A. Este tipo de
mudança de um estado para outro sem a passagem por estados intermediários é conhecido
como não ordenada. Devido a esta propriedade de reversão, a probabilidade de uma
árvore independe do posicionamento de sua raiz.
Estimar a probabilidade de uma árvore ter produzido as seqüências obtidas é uma
tarefa árdua e computacionalmente demorada. Ao contrário dos métodos de parcimônia e
de distância onde uma árvore é inferida, aqui nós iremos trabalhar com uma árvore
qualquer e calcular a probabilidade de quão boa ela é para explicar os dados observados.
Obviamente isto deve ser calculado para todas as árvores possíveis para encontrar aquela
que melhor explique a evolução das seqüências. Sem dúvida o tempo computacional para
isso é demasiadamente longo.
Considere a árvore da figura 6, onde Aves, Crocodilos, Lagartos e Tartarugas são
as OTUs e x, y e z são os nós internos. Imagine que A, C, G e T são os nucleotídeos
observados em um determinado sítio para as Aves, Crocodilos, Largartos e Tartarugas,
respectivamente.
Calcular a probabilidade deste sítio envolve calcular a probabilidade do
nucleotídeo observados nas Tartarugas ser T, considerando que ele poderia ter sido
qualquer um dos quatros possíveis nucleotídeos no nó x, isto é, somar as probabilidades
do nucleotídeo em x ter sido A e mudado para T, ter sido G e mudado para T, ter sido C e
mudado para T e não ter mudado (era T em x). Isto é matematicamente representado
como: Σ PxT (t1+t2+t3), onde t1, t2 e t3 são os tempos decorridos desde a separação de
29
Introdução
Tartarugas dos demais ramos e Pxt é a probabilidade associada com a mudança de um
nucleotídeo qualquer para T. Agora devemos calcular a probabilidade de G ser observado
em Lagartos: Σ Pxy(t1) PyG(t2+t3), onde Pxy é a probabilidade associada à mudança de
nucleotídeo entre os ramos que ligam os ancestrais nos nós x e y, e PyG(t2+t3) é a
probabilidade associadas aos eventos de substitutição entre o nó interno y e os Lagartos.
Finalmente, a probabilidade associada à observação de A nas Aves e C nos Crocodilos é
dada por: Σ Pyz(t2) PzA(t3) PzC(t3).
Aves Crocodilos Lagartos Tartarugas
A
C
G
T
t3
z
t2
y
t1
x
Figura 6. Relações filogenéticas entre Aves, Crocodilos, Lagartos e
Tartarugas. x, y e z são os nós internos, e t1-t3 representam os tempos de
separação entre as linhagens.
Então a probabilidade final desta nossa árvore exemplo da figura 6 é:
Prob(árvore) = Σ πx PxT (t1+t2+t3) Σ Pxy(t1) PyG(t2+t3) Σ Pyz(t2) PzA(t3) PzC(t3).
Já que na prática não sabemos qual é a probabilidade associada ao nucleotído
ancestral no nó interno x, que representa nesta caso a raiz desta árvore, devemos
adicionar o parâmetro πx representando a frequência dos nucleotídeos.
Este nosso exemplo assume que as taxas evolutivas entre os táxons é constante,
isto é, estas seqüências evoluem de acordo com um relógio molecular. No caso das
seqüências não seguirem um relógio os parâmetros t1, t2 e t3 passam a ser considerados
comprimentos aditivos dos ramos, refletindo então a quantidade de modificações
obervadas em cada ramo.
30
Introdução
Apenas um único sítio foi considerado no cálculo da probabilidade visto acima. A
estimativa do cálculo da probabilidade de uma árvore explicar um conjunto de seqüências
é realizado de maneira similar, isto é para cada sítio calcula-se a probabilidade de maneira
semelhante à realizada acima, e posteriormente multiplica-se as probabilidades
encontradas para cada sítio da seqüência. Em resumo a probabilidade final de uma árvore
é o produto das probabilidades de cada sítio. Como o valor da probabilidade é muito
pequeno, usa-se representá-lo na forma logarítimica.
O exemplo acima considerou ainda que conhecemos a priori o comprimento dos
ramos. Contudo, o método de verossimilhança estima o comprimento dos ramos de modo
a maximizar a probabilidade da árvore explicar a evolução das seqüências obervadas. A
probabilidade final da árvore 6 dada acima é válida somente para esta árvore e árvores
que apresentem topologias diferentes terão suas probabilidades calculadas de maneiras
diferentes.
Relógio Molecular
Desde a proposição da hipótese do relógio molecular por Zuckerkandl e Pauling
(1962, 1965) muito se debateu sobre a existência ou não de um relógio molecular geral
para os organismos vivos. A hipótese do relógio molecular prevê que as mutações que
ocorrem em macromoléculas ocorreriam a uma taxa constante durante o decorrer do
tempo. Assim através da quantidade de mutações acumuladas entre duas seqüências
ancestrais, poderia-se inferir quando ocorreu a divergência entre elas.
Embora bastante elegante para o desenvolvimento de modelos computacionais de
evolução de seqüências, o relógio molecular não consiste uma regra geral da Evolução
Molecular. Muitos estudos procurando estabelecer a existência de relógios moleculares
nos levam a crer que realmente existe uma heterogeneidade de modificações tanto em
genomas organelares (DeSalle e Templeton, 1988; Avise et al., 1992) quanto nucleares
(Li, 1993a,b; Avise, 1994). A base para a heterogeneidade de taxas evolutivas do genoma
está na diferença existente entre as taxas metabólicas, mecanismos de reparo do DNA,
tempo de exposição a mutágenos, número de replicações das células germinativas, tempo
de geração dos organismos, composição de bases, uso de códons, código genético,
31
Introdução
estruturas secundária e terciária, função gênica ou proteica, tamanho populacional, tipo de
seleção atuando sobre as seqüências (Mindell e Thacker, 1991). O acúmulo de diferenças
apresenta uma relação linear com o tempo de divergência de duas OTUs (Brown et al.,
1982; Irwin et al., 1991). Porém, a ocorrência de um acúmulo de substituições múltiplas
após um determinado período de tempo leva à perda desta relação (Mindell e Thacker,
1996).
A frequência com que as mutações modificam uma seqüência ou outra varia
grandemente. Se considerarmos um único gene, podemos perceber que determinadas
regiões dele são mais variáveis que outras. Genes interrompidos, isto é, que apresentam
regiões transcritas (exons) e não transcritas (introns), apresentam maior taxa de
substituição em introns do que em exons. Regiões gênicas que codificam domínios
funcionais de proteínas podem estar mais sujeitas a pressão de seleção do que regiões não
tão importantes do ponto de vista funcional.
Pseudogenes, regiões flanqueadoras a 3’, intons e sítios tetradegenerados
apresentam taxa de evolução maior do que sítios não degenerados. Regiões flaqueadoras
e regiões não traduzidas a 5’, sítios bidegenerados e regiões não traduzidas a 3’
apresentam taxas intermediárias de fixação de substituição (Li e Graur, 1991). Regiões do
genoma que codificam uma proteína ou uma região controladora da expressão gênica, por
exemplo, estão mais sujeitas à ação de seleção do que regiões espaçadoras. Estas últimas
podem sofrer substituições a uma taxa maior e não interferir de modo algum na
sobrevivência do indivíduo. O mesmo é válido para uma dada posição do códon. A
terceira base de uma trinca de nucleotídeos que identifica um aminoácido é mais variável
que as outras duas. Uma modificação de bases nessa posição nem sempre resulta na
substituição de um aminoácido na cadeia genômica em que ela se encontra. A variação na
taxa de substituição entre sítios parece ser na verdade um fenômeno real na evolução de
seqüências gênicas.
Além disso, as taxas de mutação entre espécies diferentes variam de forma
desigual. Algumas espécies estão mais sujeitas a mutação do que outras. Diversas
hipóteses foram levantadas para explicar essa diferença. Uma delas, a hipótese do tempo
de geração (Li et al., 1987) postula que a taxa de mutação é baseada no tempo de geração
32
Introdução
e não no tempo real. Dessa forma, organismos com tempo de geração menor, e
consequentemente que passam por uma série maior de replicações do DNA, irão
apresentar taxas maiores de evolução. Para a hipótese da taxa metabólica (Martin e
Palumbi, 1993), organismos com maior taxa metabólica apresentam taxas maiores de
síntese de DNA e, consequentemente, têm taxas maiores de mutação quando comparados
com organismos com taxas metabólicas menores. Ainda uma terceira hipótese, conhecida
como hipótese de reparo do DNA, diz que a eficiência com que ocorrem reparos nas
seqüências de DNA influi na taxa de mutação (Filipski, 1988).
Assim sendo, os estudos passaram a se concentrar na existência de um relógio
molecular para grupos específicos de táxons próximos. Desta maneira, se a hipótese do
relógio molecular não for refutada, é possível fazer considerações temporais sobre a
evolução dos organismos em estudos e sobre a taxa de evolução das seqüências
estudadas. Os comprimentos dos ramos na árvore refletem o número de substituição de
cada linhagem, permitindo, com base nesse relógio molecular, estimar o tempo de
divergência entre qualquer nó interno, se pelo menos uma data de divergência de uma
determinada ramificação tiver sido estimada por meio do registro fóssil e/ou algum
evento biogeográfico.
Então como testar a hipótese de relogio molecular em nosso conjunto de dados?
Isto pode ser realizado através do teste de taxas relativas ("relative-rate test"; Sarich e
Wilson, 1973, Takezaki et al., 1995).
Suponha que queremos saber se em nossa árvore da Figura 6 as Aves e os
Lagartos evoluem a uma mesma taxa. Se isto for verdadeiro, então o número de
substituições ocorridas no ramo das Aves e no dos Lagartos desde sua separação de seu
ancestral C não deve ser estatisticamente diferente. Para avaliar isto, é necessário incluir
uma linhagem que tenha divergido anteriormente à separação das Aves e Lagartos, como
por exemplo, as Tartarugas.
O número de substituições (K) de cada linhagem pode ser obtido diretamente das
seqüências e então temos que:
KAves/Tartarugas = KAves/Ancestral C + KTartarugas/Ancestral C
33
Introdução
KLagartos/Tartarugas = KLagartos/Ancestral C + KTartarugas/Ancestral C
KAves/Lagartos = KAves/Ancestral C + KLagartos/Ancestral C
Resolvendo estas três equações temos que:
KAves/Ancestral C = (KAves/Tartarugas + KAves/Lagartos - KLagartos/Tartarugas)/2
Klagartos/Ancestral C = (KLagartos/Tartarugas + KAves/Lagartos - KAves/Tartarugas)/2
KTartarugas/Ancestral C = (KAves/Tartarugas + KLagartos/Tartarugas - KAves/Lagartos)/2
Então de acordo com o relógio molecular, a diferença entre KAves/Ancestral
C
e
Klagartos/Ancestral C não deve ser estatisticamente diferente de zero. Se o valor absoluto da
diferença for maior do que dois erros padrão, então a hipótese do relógio molecular é
rejeitada a 5% de significância.
Alguns programas foram desenvolvidos para a realização deste teste de taxas
relativas. O PHYLTEST (Kumar, 1996) por exemplo, permite que o usuário defina dois
grupos cujas taxas devem ser testadas e qual grupo é externo, e indica se a hipótese do
relógio molecular é rejeitada ou não. Já o programa LINTREE (Takezaki, 1995) permite
ainda saber qual OTU apresenta uma taxa maior ou menor do que as demais OTUs. Desta
maneira é possível retirar as OTUs cujas taxas são significativamente diferentes das
demais e repetir a análise até que sejam detectadas os taxons cujas taxas de evolução
sejam semelhante.
Uma outra maneira de testar a hipótese do relógio molecular é por meio da
comparação entre uma árvore estimada sem a hipótese do relógio molecular e forçar os
comprimentos dos ramos dessa mesma árvore a apresentar taxa constante de
substituições. A significância pode ser avaliada por meio da distribuição de χ2 e neste
caso o número de graus de liberdade é igual ao número de OTUs menos 2 (Felsenstein,
1988). Uma maneira rápida de realizar este teste é por meio da utilização de programas
como o PUZZLE (Strimmer e von Haeseler, 1996, 1999) e o PAUP (Swofford, 1999).
34
Introdução
Heterogeneidade de Taxas de Substituição entre Sítios
Se os sítios em uma seqüência de DNA apresentam a mesma probabilidade de
sofrer uma substituição, dizemos que esta seqüência apresenta taxa homogênea de
substituição entre os sítios. Ao contrário, se alguns sítios em um seqüência de DNA
apresentam maior taxa de substituição do que outros sítios, dizemos haver
heterogeneidade de taxa de substituição entre sítios nessa seqüência.
A incorporação de um parâmetro de variação de taxa de substituição entre os
sítios está sendo muito utilizada recentemente em estudos filogenéticos (Yang, 1996;
Miyaki et al., 1998; Nahum et al., submetido). Muitas vezes, assumir homogeneidade
entre os sítios pode levar a uma estimativa da filogenia que não reflete a verdadeira
história evolutiva entre as unidades taxonômicas operacionais (Takezaki e Gojobori,
1999). Dessa maneira, subestimamos a taxa de substituição de sítios onde a variação é
alta, e superestimamos a taxa de substituição para sítios onde a variação é baixa ou
inexistente. Os modelos de heterogeneidade de substitituição entre os sítios mais
amplamente empregados são o modelo de distribuição gama (Yang, 1993; Steel et al.,
1993), representada pela letra grega Γ e o modelo de invariáveis (Hasegawa et al., 1985;
Reeves, 1992; Sidow et al., 1992).
A figura 7 ilustra a distribuição gama, onde dois parâmetros são necessários. Um
deles, denominado alfa (α) que irá representar a forma da curva de distribuição gama, e
outro, denominado beta (β) irá representar a escala. Quanto menor o valor de α, maior a
heterogeneidade de substituição entre os sítios (se α=∅, cada sítio possui uma taxa
exclusiva de substituição, se α=∝, todos os sítios têm a mesma taxa de substituição).
De fato, as taxas de substitituição ao longo de uma seqüência não são iguais em
muitos casos. A terceira posição do códon têm taxas maiores de substituição do que a
primeira e a segunda posição, alças e hastes de seqüências de rRNAs apresentam taxas
diferentes de substituição, e determinados aminoácidos em uma seqüência de proteínas
apresentam maior pressão seletiva devido a algum papel importante no correto
funcionamento da proteína (Li, 1997).
35
Introdução
Figura 7. Distribuição gama de acordo com diferentes valores de α.
Também ao longo de seqüências de ácidos nucléicos, determinadas regiões
apresentam maior ou menor taxa de substituição. Os valores da heterogeneidade podem
ser estimados diretamente dos dados. A tabela 3 traz vários exemplos de α calculados
para diferentes tipos de dados em diferentes grupos de organismos. Note a variação de
0,16 para seqüências do gene mitocondrial 12S rDNA em roedores (heterogeneidade forte
de substituição) até 0,95 para alguns genes mitocondriais codificantes de vertebrados
(heterogeneidade mediana de substituição).
Tabela 3. Valores do parâmetro alfa da distribuição gama estimado para diversos conjuntos de dados de
seqüências de DNA.
Seqüências
1a e 2a posição do codon dos genes de
α- e β-globina
Lisozimas
Genoma do vírus da Hepatite B
12S rRNA
Domínios I e II da região
controladora do DNA mitocondrial
1a+2a posição do codon dos 13 genes
mitocondriais codificantes
Citocromo b
Táxons
5 mamíferos
Alfa
0,36
Fonte
Yang et al. (1994)
24 primatas
13 variantes
9 roedores
25 humanos
0,66
0,26
0,16
0,17
Yang (1998)
Yang et al. (1995)
Sullivan et al. (1995)
Yang and Kumar (1996)
11 vertebrados
0,13-0,95
Kumar (1996)
10 aves
0,42
Miyaki et al. (1998)
Assumir a distribuição gama contínua no entanto pode levar ao aumento do tempo
computacional para se estimar uma árvore. Uma maneira de agilizar o processo
assumindo heterogeneidade de taxas é distribuir os sítios em classes com distintas taxas
de substituição. Por exemplo, quatro (ou mais) classes de taxa de substituição poderiam
36
Introdução
ser definidas, onde teríamos um grupo onde a taxa de substituição é nula ou quase nula,
uma classe onde a taxa de substituição é alta, e duas (ou mais) classes intermediárias
entre estas. Obviamente quanto maior o número de classes, maior o tempo necessário
para estimar o valor de α. Porém apenas α é incorporado aos modelos evolutivos, então o
número de classes determinadas para a distribuição gama não interefere no tempo total do
cálculo da probabilidade da árvore uma vez conhecido o valor de α.
Outra maneira de incorporar heterogeneidade de substituição entre os sítios é dada
pelo modelo de sítios invariáveis. Em um conjunto de seqüências alinhadas, algumas
posições são invariáveis, isto é, não são observadas substituições, ao passo que os demais
sítios, os variáveis, apresentam substituições e a estes é dada a mesma probabilidade de
sofrer uma substituição. Este modelo é mais simples do que o modelo de distribuição
gama no sentido de que apenas um parâmetro está envolvido: a proporção de sítios
invariáveis.
Uma alternativa mais refinada de acomodação desta variação de substituições
entre os sítios pode ser realizada por meio de um modelo misto entre o de invariáveis e o
gama. Assim, há uma proporção de sítios invariáveis e os sítios variáveis apresentem
heterogeneidade de taxa de acordo com a distribuição gama.
Algoritmos de Reconstrução de Árvores Filogenéticas
Uma vez escolhido o método de reconstrução filogenética iremos usar,
precisamos agora decidir qual algoritmo de reconstrução será utilizado para a obtenção
da árvore. Os algoritmos disponíveis podem ser exatos, isto é, perante o método escolhido
eles irão encontrar a melhor árvore que satisfaça as condições do método. Contudo para
um número grande de táxons o tempo computacional para se chegar a essa estimativa
pode ser impraticável devido ao número de árvores possíveis (Tab. 2). Um alternativa é
usar algoritmos heurísticos que levam um tempo menor de estimativa de uma árvore,
porém em detrimento de satisfazer a condição de otimização do método.
37
Introdução
Algoritmos Exatos
Busca Exaustiva
A busca exaustiva consiste em enumerar todas as possíveis árvores estritamente
bifurcadas existentes para um grupo de OTUs. Um algoritmo para se realizar isso consite
em fazer uma árvore não enraizada para três OTUs de nossa amostra. Para 3 OTUs, há
apenas uma árvore não enraizada. A seguir uma quarta OTU deve ser adicionada em
todas as posições possíveis nesta árvore de três OTUs. Neste caso há 15 possíveis árvores
não enraizadas demostrando as relações estritamente bifurcadas entre estes táxons.
Repete-se este procedimento até que todas as OTUs tenham sido incoporadas as árvores e
dessa maneira todas as possíveis árvores para este grupo de OTUs tenham sido
construídas. A seguir avalia-se perante nosso método de reconstrução filogenética, qual
delas melhor representa a melhor otimização de nosso modelo evolutivo.
Uma dificuldade desse algoritmo é o número astronômico de árvores não
enraizadas que podem ser possíveis para poucos táxons, aumentando imensamente o
tempo computacional para obter nossa estimativa das relações entre os táxons.
"Branch-and-bound"
Uma maneira de se resolver este problema foi dado pelo desenvolvimento de um
algoritmo também exato denominado "branch-and-bound". Em princípio este algoritmo é
semelhante à busca exaustiva uma vez que todas as possíveis árvores estritamente
bifurcadas são construídas. No entanto a diferença está em eliminar partes da árvore que
representam soluções subótimas. No caso da parcimônia isto seria eliminar árvores com
um número maior de passos e no caso dos métodos de distâncias aditivas, eliminar as
árvores que aumentam a soma dos quadrados dos desvios, por exemplo.
A eliminação de árvores subótimas é realizada da seguinte maneira. Inicialmente
uma árvore aleatória é gerada e seu escore é estimado. A seguir inicia-se o processo de
incorporação de táxons em uma árvore inicial com três OTUs. Assim para cada passo
onde um táxon é incorporado à árvore, o escore de todas as árvores resultantes é estimado
(número de passos, por exemplo) e aquelas que apresentam escore que não otimize nosso
critério são rejeitadas e não serão usadas nos passos posteriores. A vantagem desse
38
Introdução
algoritmo é que ele permite ao pesquisador reduzir o tempo gasto para encontrar a árvore
que melhor se ajuste ao seu critério de otimização, reduzindo o número de árvores que
podem ser analisadas. Um problema decorrente deste método é que seqüências onde há
muito ruído filogenético aumentam o tempo computacional para se chegar a uma
estimativa, muitas vezes se igualando à busca exaustiva.
Algoritmos heurísticos
Decomposição de estrela
O algoritmo de decomposição de estrela, muito usado em verossimilhança,
consiste em unir inicialmente todos os táxons em um único nó interno, formando uma
árvore em estrela (politômica). O passo seguinte consiste em avaliar todas as árvores
possíveis onde dois táxons são unidos em um novo grupo. A árvore que apresentar a
união entre dois táxons que maximizem sua probabilidade será escolhida como a árvore
inicial no próximo passo. Neste momento, reduzimos em um o número de táxons que
estavam conectados ao nó interno central. No passo seguinte, a árvore eleita a melhor no
passo anterior é usada nesse processo de busca de formação de um novo grupo que
otimize a probabilidade da árvore. Estes procedimentos se repetirão até que todos os
táxons tenham se conectados e nossa árvore final é binária.
"Stepwise addition"
O algoritmo de "stepwise addition" é bastante simples. Inicialmente três táxons
são escolhidos para compor uma árvore inicial. A seguir um quarto táxon é unido a eles
em todas as posições possíveis e aquela árvore que representar a árvore ótima é
considerada no passo seguinte. A seguir uma quinta OTU é adicionada à esta árvore
otimizada no passo anterior e o escore de todas as possíveis árvores bifurcadas são
avaliados e a melhor delas e escolhida para o passo seguinte. Isso se procede até que
todas as OTUs tenham sido inseridas e uma árvore tenha sido escolhida entre as possíveis
árvores finais. Uma desvantagem desse algoritmo é que a escolha de qual árvore seguir
será baseada nas três primeiras OTUs escolhidas para iniciar o procedimento de
inferência. Em outras palavras, o trio de táxons escolhidos para iniciar o processo pode
39
Introdução
levar a uma estimativa que na realidade representa uma árvore subótima que não seria
escolhida se outros trios tivessem iniciado o processo. Uma maneira de se contornar esse
problema é realizar a busca diversas vezes escolhendo diferentes trios iniciais de OTUs a
cada vez.
Uma analogia comumente feita a esse problema é que há uma região montanhosa
onde um piloto míope caiu de paraquedas. Ele sabe que há um posto de segurança no pico
da montanha mais alta que poderá salvá-lo. Ele então sobe a montanha que ele acredita
ser a mais alta. Chegando lá ele não encontra o posto. Há duas possibilidades: ou ele
chegou ao pico da montanha mais alta e portanto ele estava errado sobre a existência do
posto de segurança ou ele não chegou na montanha mais alta, onde deve haver um posto
de segurança.
"Branch-swapping"
Este algoritmo foi desenvolvido para casos onde havia um grande número de
táxons e o sinal filogenético das seqüências era baixo, o que levavam a encontrar árvores
subótimas por meio dos algortimos de decomposição de estrela e de "stepwise addition".
Basicamente este algoritmo promove rearranjos em uma dada árvore. Há duas maneiras
de se realizar estes rearranjos. Uma delas denominada "poda e enxerto de subárvores" irá
selecionar uma parte da árvore, cortá-la formando a subárvore e então irá inserí-la em
todas as possíveis posições da árvore restante. O procedimento se repete até que não há
uma melhor otimização nas árvores resultantes.
A segunda maneira denominada bisecção de árvore consiste em quebrar a árvore
em duas subárvores disjuntas e uní-las por meio de um par de ramos diferentes daqueles
que foi originada. O procedimento é repetido até que todos os pares possíveis de ramos
destas duas subárvores sejam unidos e a melhor árvore seja definida.
UPGMA e Neighbor-Joining
Além dos algoritimos vistos acima, existe duas outras maneiras de obter uma
árvore: o "Neighbor-joining" e o "UPGMA", do inglês unweighted pair group method
using arithmetic averages. Estes algoritmos ao contrário dos demais, não se adequam a
40
Introdução
um critério de otimização de busca por que eles chegam a uma única estimativa,
independente de um critério de otimização.
O NJ é um modo especial da decomposição de estrela. Inicialmente uma árvore
em estrela é construída e uma matriz de distância é calculada. Aquele par de táxons que
apresentar a menor soma dos comprimentos dos ramos é escolhido para representar um
nó interno da árvore e a distância deles a este nó interno é calculada. A seguir outra
matriz é calculada considerando este par de táxon como uma única OTU. Novamente
aquele par que minimizar a soma dos ramos é escolhido e será considerado uma única
OTU no passo seguinte. Este procedimento se repete até que a árvore em estrela tenha
sido resolvida de maneira a minimizar a soma dos comprimentos dos ramos.
O UPGMA é similar ao NJ porém impõe que as distâncias sejam ultraméticas, e
portanto os táxons evoluem a uma taxa semelhante, e não recalcula as distâncias a cada
vez que um táxon é adicionado à árvore.
Eficiência dos Métodos
Dizer qual método é mais adequado na inferência filogenética é uma questão
árdua e não resolvida na Sistemática Molecular. Contudo isso pode ser medido através de
simulações computacionais uma vez que os mecanismos de evolução do DNA são bem
compreendidos (Nei, 1991). Além disso, o efeito dos diferentes tipos de alinhamento na
topologia final é um assunto pouco pesquisado. Pouco se conhece se a variabilidade de
cladogramas devido as alternativas de alinhamento é da mesma ordem que os métodos de
inferência.
Um dos poucos trabalhos publicados na literatura científica lidando com esta
questão é o de Morrison e Ellis (1997). Os autores alinharam 72 seqüências completas do
gene 18S rDNA correspondentes a 43 táxons de protozoários parasitas pertencentes aos
filos Apicomplexa e Dinozoa. O alinhamento foi realizado manualmente e através de
cinco diferentes programas de alinhamento e as topologias estimadas através de métodos
de distância, de parcimônia e de verossimilhança. Os resultados obtidos por estes autores
revelaram diferenças no tamanho total das seqüências alinhadas pelos diferentes
algoritmos (entre 2509 e 3549 posições), assim como também uma variação de 38 a 55%
41
Introdução
no número de sítios invariáveis entre todos os táxons. Ainda neste trabalho, os autores
variaram as penalidades dadas às lacunas em um dos programas de alinhamento. De
maneira geral estes autores obtiveram um mesmo padrão básico entre os Apicomplexa
(Dinozoa foi usado com grupo externo). Isto indica que determinadas regiões são
filogeneticamente informativas e robustas a variações no procedimentos de alinhamento.
No entanto, a posição de alguns táxons específicos variou grandemente. Um dos
problemas dos programas de alinhamento é que eles tentam sempre maximizar a
similaridade entre as seqüências. Essa similaridade pode ser devida não apenas à
ancestralidade mas reversão, convergência e paralelismo.
Usando dados de seqüências de genes ribossomais mitocondriais (12S rDNA e
16S rDNA), Mindell (1991) testou o efeito do alinhamento na obtenção das três possíveis
árvores filogenéticas para Homo, Bos e Mus, usando Gallus como grupo externo. Sua
estratégia consistiu em alinhar a seqüência de dois integrantes do grupo interno e inferir
uma seqüência consenso. Depois esta seqüência consenso foi alinhada com o terceiro
integrante do grupo interno, e deste alinhamento foi retirado uma segunda seqüência
consenso, a qual foi alinhada a Gallus. A estimativa das árvores foi realizada pelo método
de parcimônia. Os resultados mostraram que a seqüência do 16S rDNA foi mais sensível
aos diferentes alinhamentos. Atribuindo o mesmo peso a todas as posições, duas árvores
mais parcimoniosas foram detectadas. Usando maior peso às transversões, a ordem dos
ramos na árvores correspondeu à ordem de entrada dos dados no alinhamento. Já para as
seqüências do 12S rDNA, a mesma topologia foi sempre encontrada independentemente
da ordem de entrada dos táxons no alinhamento. Porém, usando pesos iguais ou
atribuindo maior peso as tranversões levou à obtenção dos grupos-irmãos (Bos e Mus) e
(Homo e Bos), respectivamente. Na análise de Mindell (1991) a decisão foi favorável a
esta última opção devido a dois motivos. Primeiro, o acúmulo de transições leva ao
aumento de substituições múltiplas e perda da informação filogenética. Segundo, há um
aumento significativo no comprimento da árvores se considerarmos a opção (Bos e Mus).
Em relação a qual seria o tamanho útil de seqüências de DNA para a inferência
filogenética, Zardoya e Meyer (1996) tem posto em dúvida que seqüências mitocondriais
relativamente curtas forneceriam uma boa estimativa da filogenia e que posições
42
Introdução
aleatórias, especialmente segmentos mitocondriais não adjacentes, devem ser usados
nesse processo, totalizando o máximo possível de pares de bases sendo analisadas. Hillis
(1991) desenvolveu a estatística g1 para avaliar a distribuição de comprimentos de todas
as possíveis árvores para um grupo de táxons. Ele determinou que menos do que 100
sítios variáveis diminuem a faixa crítica de g1, onde a distribuição dos comprimentos da
árvore não é a prevista para seqüências aleatórias. Em outras palavras, para menos do que
100 sítios variáveis, é mais provável que a variação na seqüências seja aleatória e a
filogenia não reflita uma história evolutiva verdadeira.
REGISTRO FÓSSIL E BIOGEOGRAFIA
Em estudos evolutivos usando seqüências de DNA, informações complementares
podem ser obtidas a partir de dados fósseis e biogeográficos, permitindo levantar
hipóteses para a evolução de um grupo de organismos. Contudo, dados paleontológicos
são difíceis de serem obtidos. Nem sempre o grupo que se deseja estudar apresenta
registro fóssil confiável. O processo de fossilização vai depender de características
biológicas e sedimentares. Animais invertebrados que possuem estruturas corporais moles
têm fossilização mais difícil do que de vertebrados, por exemplo. Entre os vertebrados,
estruturas como ossos e dentes são mais facilmente fossilizadas do que tecidos
musculares por exemplo. Além disso, o tipo de solo e sua forma de sedimentação e as
condições climáticas também irão influenciar o processo de fossilização.
Quando o registro fóssil está presente, a evidência mais antiga é usado para se
estabelecer uma data mínima de aparecimento de determinados táxons e a taxa de
substituições das bases nucleotídicas podem ser estabelecidas a partir desta data (Hedges
et al., 1996; Friesen e Anderson, 1997). A melhor estimativa do surgimento de um grupo
seria dada pela presença de fósseis anteriores e posteriores ao evento de especiação,
permitindo dessa maneira uma melhor calibração do relógio molecular. Provavelmente os
fósseis disponíveis não são os ancestrais diretos, mas correspondem a outros ramos
extintos (e não representados) na árvore (Marshall, 1990).
A Biogeografia, ciência que trata das distribuições geográficas atuais e passadas
dos organismos, também tem sido amplamente empregada na datação da divergência
43
Introdução
entre as OTUs. A distribuição e evolução dos seres vivos é influenciada por fatores
geográficos, climáticos e ecológicos. Desta forma, pode-se traçar a história de um dado
grupo através de dados paleoclimáticos e paleogeográficos, por exemplo. Dados de
paleopólen, isto é, o registro fossilífero de grãos de pólen, permitem inferir a composição
vegetacional de uma dada época e a partir daí, inferir condições climáticas e ecológicas
daquela época.
A aceitação da teoria da deriva continental, permitiu que a distribuição
descontínua de determinados grupos de organismos relacionados pudesse ser explicada.
Por exemplo, as aves ratitas são encontradas apenas nos continentes do Hemisfério Sul
(América do Sul, África e Austrália). Contudo estes continentes estiveram ligados no
passado e sua separação se iniciou 200 milhões de anos atrás, e levou cerca de 100
milhões de anos para que os atuais continentes estivessem totalmente separados (Storey,
1995). Provavelmente, os ancestrais de cada linhagem que levou aos ratitas atuais já
haviam divergido e ocupavam as áreas que hoje correspondem a estes continentes. Outros
exemplos de distribuição disjuntas (besouro Nothophagus, árvores e arbustos do gêneros
Acacia, sapos da família Pipiedae, e outros) também são bem documentados (Brown e
Lomolino, 1998).
44
Introdução
OBJETIVOS
Os métodos de reconstrução filogenética aplicados a seqüências de ácidos
nucléicos têm influenciado muitos estudos de evolução e filogenia de diversos
organismos. Nesta tese, utilizamos destes métodos para:
-
Estabelecer as relações filogenéticas entre os onze gêneros da família Cracidae
baseadas em seqüências de seis genes mitocondriais;
-
Estimar a data de divergência da família Cracidae e de seus onze gêneros,
correlacionando com eventos geomorfológicos e biológicos que possam ter
influenciado a divergência intergenérica, caso a hipótese do relógio molecular não
seja rejeitada para as seqüências obtidas;
-
Identificar a posição filogenética de Cracidae e Megapodiidae em relacão a outros
Galliformes e Anseriformes e averiguar se a exclusão destas duas famílias dos
Galliformes é apoiada por dados de seqüências mitocondriais como já sugerido por
outros tipos de dados moleculares;
-
Avaliar a utilidade de seqüências do domínio I da região controladora do DNA
mitocondrial em recuperar a filogenia dos gêneros de Cracidae, uma vez que este gene
é considerado de evolução mais rápida, e portanto útil em estudos populacionais e de
espécies próximas, e raramente utilizado em inferências das relações entre táxons
acima de espécie;
-
Estabelecer aspectos moleculares da evolução da subunidade II da citocromo c
oxidase (COII) em cracídeos e fazer uma análise comparativa com a evolução da
COII em outros animais.
45
Capítulo 2
Material e Métodos
46
Material e Métodos
MATERIAL E MÉTODOS
TÁXONS USADOS
Os táxons dos quais foram obtidas as seqüências de genes mitocondriais e os
táxons cujas seqüências foram retiradas do GenBank e usadas em reconstruções
filogenéticas nesta tese estão listados na tabela 1. Há ainda a procedência das aves cujo
DNA foi seqüenciado neste trabalho.
Tabela 1. Espécies utilizadas em análises filogenéticas no presente trabalho.
Família
Espécie
Cracidae
Aburria aburri
Chamaepetes goudotti
Oreophasis derbianus
Ortalis cannicolis
Megapodiidae
Phasianidae
Anatidae
Rheidae
Penelope obscura
Penelopina nigra
Pipile jacutinga
Crax blumenbachii
Mitu tuberosa
Nothocrax urumutum
Pauxi pauxi
Megapodius reinwardt
Gallus gallus
Aythia americana
Rhea americana
Procedência da amostra de DNA ou referência do
trabalho original onde as seqüências foram apresentadas
Criadouro Tropicus, Pirassununga, SP
Fundación Ara, México
Fundación Ara, México
Criadouro Poços de Caldas, Poços de Caldas, MG
Fundação Crax, Belo Horizonte, MG
CESP, Paraibuna, SP
Fundación Ara, México
Criadouro Tropicus, Pirassununga,SP
Criadouro Chaparral, Recife, PE
Fundação Crax, Belo Horizonte, MG
Criadouro Tropicus, Pirassununga
Fundação Crax, Belo Horizonte,MG
Royal Ontario Museum, Canadá
Desjardins e Moraes, 1990
Mindell et al., 1999
Harlid et al., 1998
OBTENÇÃO DE SEQÜÊNCIAS DE GENES MITOCONDRIAIS A PARTIR DE
PRODUTOS AMPLIFICADOS POR PCR
A seguir são apresentados os protocolos usados para a obtenção das seqüências de
genes mitocondriais (Fig. 1). Os protocolos 1-4 são gerais para a extração de DNA a
partir de sangue periférico e avaliação da quantidade e qualidade do DNA extraído, e
amplificação de fragmentos específicos (Sambrook et al., 1989). Os demais protocolos
foram usados segundo uma ordem específica para a obtenção das seqüências de DNA, de
acordo com o modelo de seqüenciador utilizado. As seqüências do domínio I da região
controladora (CR-I) do mtDNA foram obtidas no Departamento de Biologia do IBUSP
em um seqüenciador ABI PRISM 310 da Perkin-Elmer. Os demais genes (12S e 16S
47
Material e Métodos
rDNA, COI, COII, COIII e cyt b) foram obtidos no Canadá, no laboratório do Dr. Allan J.
Baker sediado no Royal Ontario Museum, usando um seqüenciador da Li-Cor, modelo
LongReadir 4200. Para o seqüenciador ABI PRISM 310, os protocolos utilizados foram
5.1, 6.1, 7.1 ou 7.2 dependendo do fabricante do kit de seqüenciamento. Para o
seqüenciador LongReadir 4200 foram usados os protocolos 5.2, 6.2, 7.3, 8, 9, e 10.
Sangue
periférico
Amplificação de sequencias -alvo
por PCR (Protocolo 4)
Separação e recuperação de
sequências amplificadas por
eletroforese (Protocolo 5)
Extração de DNA,
avaliação da quantidade e
qualidade do DNA
(Protocolo 1-3)
Purificação de
sequencias alvo
(Protocolo 6)
Reconstrução de
árvores filogenéticas
Sequenciamento automático
e edição final das sequências
(Procotolo 8-10)
“Cycle Sequencing”
(Protocolo 7)
Figura 1. Esquema indicando uma visão geral dos procedimentos de obtenção de DNA total a partir de
sangue periférico das aves, amplificação e seqüenciamento de segmentos específicos de DNA, e análises
filogenéticas. Os protocolos 1-10 são descritos detalhadamente no texto.
As formulações das soluções químicas usadas nos protocolos descritos a seguir
foram realizadas conforme descrito em Sambrook et al. (1989).
Coleta de Sangue das Aves
A coleta de sangue periférico das aves para a obtenção de DNA foi realizada por
meio de punção venosa, descrita a seguir. O sangue estocado em SSC/EDTA deve ser
congelado imediatamente. Alternativamente, o SSC/EDTA pode ser substituído por
etanol absoluto e a amostra pode ser mantida em temperatura ambiente. Este
procedimento em muitos casos é mais vantajoso uma vez que dispensa o congelamento
48
Material e Métodos
das amostras, facilitando as coletas em campo. O eppendorf deve ser vedado com filme
de PVC para minimizar a evaporação do álcool.
São necessárias três pessoas trabalhando em conjunto durante a coleta de sangue
para evitar possíveis danos à saúde das aves.
Equipamentos
Seringas descartáveis de 1 ml
Algodão embebido em álcool
Filme de PVC
Eppendorfs novos
Algodão seco
Isopor para gelo
Substâncias e Soluções
Gelo
EDTA
2xSSC
Etanol absoluto
1 - Preparar eppendorfs com 500 ul de 2xSSC, 10mM EDTA pH 7,4.
2 - Manter os tubos congelados até a hora da coleta.
3 - Levar os tubos com a solução em gelo até o local da coleta.
4 - Uma pessoa deve segurar o animal pelo pescoço com uma das mãos e os pés, cauda e
uma das asas com a outra mão.
5 - Uma segunda pessoa deve segurar a outra asa esticada, da qual se irá extrair o sangue,
apoiando-a firmemente em uma mesa para evitar fraturas ósseas.
6 - Esta mesma pessoa deve fazer o garrote com a outra mão (colocando um dedo sobre a
veia).
7 - Uma terceira pessoa deve esterilizar o local utilizando o algodão embebido em álcool
e retirar o excesso de penas do local.
8 - Soltar o garrote e coletar 0,1 ml de sangue com auxílio da seringa.
9 - Estancar completamente o sangue com algodão seco.
10 - Liberar o animal.
11 - Depositar o sangue nos eppendorfs, tampá-los bem e inverter o eppendorf algumas
vezes.
12 - Manter o eppendorf com sangue em gelo.
13 - Congelar as amostras colhidas.
A extração de DNA foi realizada em tubos de 15 ml ou em eppendorfs de 1,5 ml
conforme descrito a seguir. O NaCl usado no passo 5 do protocolo 1 foi substituído por
fenol na extração em eppendorfs. As pipetas Pasteur devem ser substituídas, neste caso,
por micropipetas comum, cujas ponteiras devem ter as pontas cortadas para evitar
degradar o DNA.
49
Material e Métodos
O sangue estocado em etanol absoluto forma um precipitado do qual cerca de 50%
do grumo deve ser colocado para a extração ao invés de amostar 100 ul do sangue
estocado em SSC/EDTA.
Protocolo 1 - Extração de DNA
Equipamentos
Eppendorfs 1,5 ml
Micropipeta de 1000 ul, 200 ul e 20 ul e suas respectivas
ponteiras
2 pipetas Pasteur para cada amostra de sangue
Copo plástico para descartar sobrenadante
Seringa de 10 ml
Adaptadores para centrifuga
Centrífuga/microcentrífuga
Substâncias e Soluções
Amostras de sangue
1xTNE
25% SDS
Proteinase K 25 ng/ml (estocada a -20oC)
Etanol Absoluto
TE
Fenol/NaCl
Etanol 70%
Extração em tubos de 15 ml
1 - Colocar em tubo plástico de 15 ml, 3 ml de 1xTNE, 300 ul de Tris-HCl 1 M pH 7,5,
80 ul de 25% SDS e 20 ul de proteinase K.
2 - Acrescentar 100 ul de sangue periférico do indivíduo cujo DNA será isolado,
cortando-se a ponta da ponteira para não degradar o DNA.
3 - Agitar levemente o tubo várias vezes por 15 segundos.
4 - Incubar a 37oC "overnight" ou a 55oC por 4 horas.
5 - Adicionar 1 ml de NaCl 6 M e misturar vigorosamente o tubo por cerca de 30
segundos.
6 - Centrifugar a 12 krpm por 10 minutos.
7 - Passar o sobrenadante para outro tubo com auxílio de uma pipeta pasteur de ponta não
fina (para evitar degradar o DNA). (Se o sobrenadante estiver limpo, ir para o passo
10).
8 - Adicionar um volume de fenol. Centrifugar a 12 krpm por 10 minutos.
9 - Repetir passo 7.
10 - Adicionar 2 volumes de etanol absoluto com auxílio de uma seringa.
11 - Agitar o tubo levemente até precipitar o DNA.
12 - Centrifugar a 12 krpm por 5 minutos.
13 - Descartar o sobrenadante cuidadosamente.
50
Material e Métodos
14 - Acrecentar 1 ml de etanol 70% ao pellet e dar uma leve agitada para desprendê-lo.
15 - Centrifugar a 12 krpm por 5 minutos.
16 - Descartar o etanol 70% cuidadosamente.
17 - Secar o "pellet" de DNA "overnight" a temperatura ambiente ou por duas horas em
bomba de vácuo.
18 - Diluir o DNA em 300-500 ul de TE, conforme a quantidade de DNA obtido, por uma
ou duas semanas a 4oC.
19 - Passar DNA diluído para eppendorf com auxílio de pipeta Pasteur.
Extração em eppendorfs
A extração pode ser feita em tubos eppendorfs. Para cada amostra deve-se utilizar:
- 300 ul de TNE
- 30 ul de Tris 1M ph 7,5
- 8 ul de SDS 25%
- 20 ul proteinase K (25 ng/ml)
Uma vez isolado, a qualidade e a concentração do DNA pode ser verificada em
gel de agarose 0,8% (Check Gel) ou em espectrofotômetro.
Para a quantificação em gel de agarose, a concentração é estimada a partir de
comparação de cada amostra com as amostras de DNA de fago lambda de concentração
conhecida. Mistura-se o corante azul de bromofenol/xileno cianol, denominado aqui LB
("loading buffer")(Sambrook et al., 1989) ao DNA facilitando a visualização da amostra
sendo aplicada no gel. Após a corrida eletroforética, o gel é corado com brometo de
etítido para visualisar o DNA.
O brometo de etídio é cancerígeno e por isso deve se usar luvas plásticas
descartáveis para manuseá-lo e manusear o gel depois de corado. O gel deve ser
descartado em lixo próprio (hospitalar). Todo material descartável que entrar em contato
com o brometo de etídio também deve ser descartado nesse mesmo lixo.
Protocolo 2 - Gel de Agarose 0,8%
51
Material e Métodos
Equipamentos
Becker de 50 ml
Filme de PVC
Pipeta graduada de 20 ml
Cuba de eletroforese
Forno microondas
Suporte para moldar o gel
Soluções Químicas
Agarose
1xTBE pH 8,8
1 - Pesar 0,12 gramas de agarose.
2 - Passar agarose para becker com 15 ml de 1xTBE pH 8,8.
3 - Fechar becker com filme de PVC e perfurá-lo algumas vezes.
4 - Aquecer em forno microondas até toda agarose estar dissolvida.
5 - Despejar o gel ainda líquido no suporte da cuba de eletroforese.
6 - Após solidificação introduzir apenas o suporte do gel na fonte de eletroforese.
7 - Cobrir o gel com 1xTBE pH 8,8 (o mesmo utilizado para se fazer o gel).
Concentrações diferentes deste gel pode ser obtida através de regra de três
simples. As medidas dadas são para um gel de 6,0 x 8,5 centímetros.
Protocolo 3 - Avaliação da qualidade e da concentração de DNA
Equipamentos
Cuba para eletroforese
Luvas plásticas descartáveis
Transiluminador UV
Máquina polaróide
Cuba plástica para corar e lavar o gel
Gel de agarose 0,8%
Espectrofotômetro
Eppendorfs
Filme de PVC para aliquotar LB
Suporte para eppendorf
Shaker
Substâncias e Soluções
Amostras de DNA
Loading Buffer (LB)
Solução NaOH 5 N/NaCl 6 M
H2O milli q+
H2O destilada
Brometo de etídio
DNA de fago λ
52
Material e Métodos
Agarose 0,8% (Check Gel)
1 - Prepare o gel de agarose conforme protocolo 2.
2 - Aliquotar gotas de LB em um pedaço de filme de PVC.
3 - Misturar cada amostra de DNA de lambda e de DNA a ser analisado com cada uma
das gotas de LB no filme de PVC.
4 - Carregar 1 ul DNA de lambda com 1 ul de LB (225 ng/ul) em um dos poços e em
outro com 2ul de DNA de lambda (555 ng/ul) e 1 ul de LB.
5 - Carregar 1 ul de LB com 1 ul das amostras de DNA a serem verificadas.
6 - Executar a corrida eletroforética inicialmente a 100 V para as amostras penetrarem no
gel (cerca de 2-3 minutos) e depois abaixar para cerca de 40 - 50 V, por cerca de 30-60
minutos.
7 - Terminada a corrida, corar o gel com brometo de etídio em solução aquosa por 10
minutos em shaker, numa cuba plástica.
8 - Retirar esta solução em trompa de vácuo.
9 - Lavar o gel em água destilada por 5 minutos.
10 - Repitir passo 7.
11 - Verificar o resultado em transiluminador UV e fotografar em filme de revelação
instantânea ("Polaroid") para posterior análise da concentração.
A quantificação de DNA realizada em GeneQuant (Pharmacia) pode ser feita por
meio de capilares de 3 ul ou cubetas de 5-10 ul, conforme especificado a seguir:
GeneQuant (capilar 3 ul)
1 - Preparar 3 ul de H2O milli q+ em eppendorf para zerar o espectro.
2 - Colocar 1 ul de DNA em 2 ul de H2O milli q+.
3 - Recolher a amostra final em capilar.
4 - Proceder a leitura no espectro.
GeneQuant (cubeta 5-10 ul)
1 - Preparar 6 ul de água milli q+ em um eppendorf para cada amostra.
53
Material e Métodos
2 - Acrescentar 1 ul de DNA de cada amostra.
3 - Misturar bem e introduzir a amostra de DNA digerido diluída na cubeta.
4 - Efetuar a medida conforme normas do espectrofotômetro.
Após a quantificação das amostras de DNA genômico, preparou-se diluições de
modo a termos de 5 a 20 ng de DNA por microlitro de amostra para posterior utilização
nas amplificações. A preparação da reação de PCR e a diluição os primers devem ser
realizadas no interior de uma sala estéril. Esta sala deve ser de uso exclusivo para esta
finalidade. Amostras uma vez amplificadas não devem retornar à sala para se evitar
eventual contaminação do micropipetas e outros utensílios. Sempre que a sala não estiver
em uso, uma luz ultravioleta deve permanecer acesa para esterilizar a sala, degradando
eventuais contaminações da bancada ou outros utensílios (como micropipetas por
exemplo) por DNA. Todo material da sala deve ser manuseado com luvas que
posteriomente serão descartados. Quando não houver uma sala disponível para a
preparação da PCR, usar micropipetas que sejam exclusivas para uso pré e pós-PCR.
A amplificação dos fragmentos mitocondriais foi realizada em termociclador TC1
da Perkin-Elmer. A reação deu-se em 25 ciclos onde as condições de desnaturação, de
hibridação e de extensão foi de 1 minuto a 95oC, 30 segundos a 50oC e 40 segundos a
72oC, respectivamente. Estes ciclos foram precedidos de um passo inicial de desnaturação
de 5 minutos a 95oC e sucedidos por uma extensão final de 5 minutos a 72oC. Para o
domínio I da região controladora (CR-I) a temperatura de hibridação dos ciclos foi de
54oC.
Os oligonucleotídeos iniciadores ("primers") utilizados para a amplificação dos
sete gene mitocondriais seqüenciados no presente trabalho são mostrados na tabela 2.
Com exceção dos "primers" para a região controladora do DNA mitocondrial (Dloop), os demais possuíam uma seqüência do M13 em sua extremidade 3'. Esta
seqüências permitiram usar seqüências do M13 complementares como "primers" para a
reação de seqüenciamento. As seqüências de M13 usados como "cauda" ("M13-tailed
primers") dos primers de amplificação eram 5'-CAC GAC GTT CAC ACA GG-3' para a
fita L e 5'-GGA TAA CAA TTT CAC ACA GG-3' para a fita H. Esta diferença entre os
54
Material e Métodos
procedimentos realizados para o D-loop e para os demais genes deve-se aos modelos de
seqüenciador usados em ambos os casos, e não há uma característica intrínseca dos genes.
Tabela 2. Seqüências 5'→3' dos oligonucleotídeos iniciadores para os sete genes mitocondriais
utilizados neste trabalho. Os números correspondem à posição dos "primers" no genoma
mitocondrial de Gallus gallus (GenBank X52392, Desjardins & Moraes, 1990). Os "primers"
foram desenhados por G. Rowe da Leicester University ("D-loop") e por O. Haddrath do Royal
Ontario Museum (demais primers).
Gene
"Primer"
Posição
Seqüência 5'→
→3'
D-loop
D-loop L
16756-16775
TTG TTC TCA ACT ACG GGA AC
D-loop H
422-443
GTG AGG TGG ACG ATC AAT AAA T
12SrRNA
L1537
1534-1555
AAT CTT GTG CCA GCC ACC GCG G
H12SEND
2241-2263
GTG CAC CTT CCG GTA CAC TTA CC
16SrRNA
16SAR L
2699-2726
AAGCCWANCGAGCYGGGTGATAGCTGG
16SBR H
3811-3831
CAT AGA TAG AAA CCG ACC TGG
COI
COIAL
6675-6695
AAC YAA CCA CAA AGA CAT TGG
H8205
8184-8205
GGG GTT CGA TTC CTT CCT TTC TTG
COII
L8184
8184-8205
CAA GAA AGG AAG GAA TCG AAC C
LYSH
9041-9058
TCT CTA GCT TAA AAG GCT
COIII
A5REVTF
9914-9936
AAA YAT YTA ATG GCA CAC CAA GC
GLYHTR
10707-10729
GTA ATN ANT ATA CTA GAA GAG C
Cyt b
B1L
14965-14990
CCA TCC AAC ATC TCA GGA TGA TGA AA
B6H
16065-16089
GTC TTC AGT TTT GGT TTA CAA GAC
Protocolo 4 - Amplificação de fragmentos de DNA mitocondrial
Equipamentos
Termociclador
Cuba de isopor p/ gelo
Sala estéril
Luvas descartáveis
Papel absorvente
Micropipetas P2, P20 e P200
Ponteira para P20 e P200, e para P2
Eppendorfs de 1,5 ml, de 0,5 ml e de 0,2 ml
Papel alumínio
Fita isolante
Luz ultravioleta
Substâncias e Soluções
Álcool
Gelo
Tampão da reação de PCR
Primers diluídos na concentração necessária (10uM)
Amostras de DNA (5-20 ng/ul)
Água MilliQ autoclavada, ou destilada autoclavada
Taq polimerase
Óleo mineral
1 - Calcular previamente as quantidades necessárias de reagente para cada tubo.
2 - Verificar o programa de ciclos de tempo e temperatura no termociclador.
3 - Retirar do freezer, as amostras de DNA, primers, Taq polimerase e manter em gelo.
4 - Geralmente as quantidades a serem acrescentadas aos tubos são 8,0 ul de reagente prémix fornecido com o kit de seqüenciamento, 1,0 a 3,0 ul de DNA total (até cerca de 20
ng) e água para completar 20 ul.
5 - Limpar bancada da sala exclusiva de PCR com álcool.
55
Material e Métodos
6 - Preparar a solução mãe sem as amostras de DNA em um tubo adequado ao volume
total da solução-mãe.
7 - Separar os tubos adequados ao modelo de termociclador a ser usado.
8 - Marcar os tubos de modo a identificar as amostras a serem aliquotadas.
9 - Adicionar o volume de solução-mãe desejado nos tubos eppendorfs.
10 - Acrescentar o DNA (5-20 ng/ul).
11 - Se necessário, de acordo com o modelo de termociclador a ser utilizado, acrescentar
uma gota de óleo mineral aos tubos.
12 - Dar um pulso nos tubos em microcentrifuga.
13 - Colocar as amostras no termociclador.
Os fragmentos gerados por PCR foram aplicados em gel de agarose 1% para
determinar se o tamanho dos fragmentos obtidos correspondia ao tamanho esperado,
comparando-se as bandas produzidas com marcador de peso molecular (100bp ladder,
Pharmacia) e com um controle positivo (Gallus gallus). Uma vez obtido os fragmentos de
tamanho esperado, eles foram recuperados do gel de agarose de duas maneiras. Os
fragmentos do CR-I foram recuperados de acordo com o protocolo descrito por Zhen e
Swank (1993). Já os demais genes foram recuperados de uma maneira mais simplificada
de acordo com o descrito nesta tese.
Protocolo 5 - Recuperação de fragmentos do CR-I
Equipamentos
Becker de 50 ml
Filme de PVC
Pipeta ou proveta graduada de 20 ml
Cuba de eletroforese
Forno microondas
Suporte para moldar o gel
Estilete de ponta fina
Eppendorfs
Micropipetas P100 e P20
Ponteira para micropipetas
Substâncias e Soluções
Agarose
1xTBE pH 8,8
Loading buffer
Brometo de etídio
Fragmento a ser recuperado
Solução PEG 15% / TBE 1x
5.1 Recuperação dos fragmentos de CR-I
1 - Pesar 0,20 gramas de agarose.
2 - Passar agarose para becker com 20 ml de 1xTBE pH 8,8.
3 - Fechar becker com filme de PVC e perfurá-lo algumas vezes.
4 - Aquecer em forno microondas até toda agarose estar dissolvida.
5 - Colocar uma ou duas gotas de brometo de etídio no gel.
56
Material e Métodos
6 - Despejar o gel ainda líquido no suporte da cuba de eletroforese.
7 - Após solidificação introduzir apenas o suporte do gel na fonte de eletroforese.
8 - Cobrir o gel com 1xTBE pH 8,8 (o mesmo utilizado para se fazer o gel).
9 - Após a solidificação do gel, carregar as amostras de DNA a ser recuperado com 2 ul
de LB.
10 - Cobrir o gel com papel alumínio, para evitar degradação do DNA provocada pelo
brometo de etídio na presença de luz.
11 - Correr a 40-50 V por cerca de 1 hora.
12 - Corar o gel com brometo de etídio.
13 - Sobre luz ultravioleta, marcar com o estilete os limites da banda logo abaixo desta.
14 - Fazer uma fenda de 1,5 cm x 1,5 cm logo a frente da banda.
15 - Voltar o gel ao aparelho de eletroforese.
16 - Retirar o excesso de tampão TBE de modo que ele não ultrapasse por cima do gel,
mas que fique em seus limites superiores.
17 - Acrescentar PEG 15%/ TBE 1x até preencher a fenda.
18 - Restabelecer a corrente elétrica.
19 - Aguardar até que o DNA caia na fenda preenchida por PEG/TBE, observando a
evolução da banda de DNA por meio de um aparelho portátil de luz ultravioleta.
20 - Recuperar a solução de PEG/TBE com o DNA.
21 - Manter o DNA congelado nessa solução até sua posterior purificação segundo o
protocolo 6.1.
5.2 Recuperação dos demais genes
1. Preparar um gel de agarose 1%.
2. Separar em eletroforese os fragmentos por cerca de 20 minutos a 120V.
3. Averiguar a separação dos fragmentos em luz ultravioleta.
4. Se a separação dos fragmentos ocorreu, cortar a banda e manuseá-la de acordo com o
especificado no protocolo 6.2.
Os fragmentos recuperados foram imediatamente purificados como descrito a seguir.
A purificação dos fragmentos obtidos no laboratório canadense se deu de maneira mais
simplificada porque o modelo de seqüenciador usado não exigia procedimentos
elaborados de purificação como realizado no Brasil para os fragmentos do CR-I.
57
Material e Métodos
Protocolo 6 - Purificação de DNA recuperado em gel de agarose
Equipamentos
Eppendorfs
Micropipetas
Ponteira para micropipetas
Microcentrifuga
Cuba de isopor para gelo seco
Suporte de isopor para eppendorf
Vortex
Substâncias e Soluções
DNA em PEG/TBE
NaOAc 3 M, pH 5.2
Etanol absoluto
Etanol 70%
Fenol:Tris (1:1)
Clorofórmio:isoamílico (24:1)
Gelo seco
Acetona (opcional)
6.1 Purificação do CR-I
1 - Adicionar 1 volume de fenol:tris.
2 - Agitar em vortex e centrifugar por 10 minutos por 14 krpm.
3 - Passar sobrenandante para outro eppenforf.
4 - Acrescentar 1 volume de clorofórmio:álcool isoamílico (24:1).
5 - repetir passo 2.
6 - Passar sobrenadante para novo tubo eppendorf.
7 - Acrescentar 1/10 de volume de NaOAc e 2 volumes de EtOH.
8 - Manter em gelo seco + álcool (ou acetona) por 15 minutos (ou alternativamente, 15
minutos a -70oC, ou ainda 1 ou 2 horas a -20oC).
9 - Centrifugar 20 minutos a 14 krpm.
10 - Descartar o sobrenadante.
11 - Acrescentar 100 ul de etanol 70%.
12 - Repetir passo 2.
13 - Repetir passo 10.
14 - Secar a vácuo por 10 minutos.
15 - Ressuspender em H20 MilliQ.
16 - Medir a concentração de DNA.
6.2 Purificação dos demais genes
1. Introduzir uma ponteira com filtro de algodão no interior de um tubo epperndorf. Se
necessário corte a ponteira para que ela caiba no tubo de maneira que ele possa ser
fechado.
2. Marcar a tampa dos tubos correpondente à amplificação a ser purificada.
3. Introduzir a banda excisada no protocolo 5 sobre o filtro de algodão da ponteira
inserida no tubo.
58
Material e Métodos
4. Fechar os tubos.
5. Centrifugar por 7 minutos a 800xg.
6. Retirar a ponteira contendo a agarose retida no filtro de algodão.
7. Estocar a 8oC o DNA em solução no fundo do tubo. Este DNA está dissolvido em TA
proveniente da banda excisada do gel.
Protocolo 7 - Seqüenciamento de produtos de PCR
O seqüenciamento foi realizado diretamente a partir dos fragmentos amplificados
pela técnica de PCR. Para os fragmentos de CR-I o seqüenciamento deu-se como descrito
a seguir. Inicialmente procedeu-se a reação de "cycle sequencing" em termociclador
modelo TC2400 (Perkin-Elmer) e a purificação da reação de acordo com as
especificações dos fabricantes do "kit" de seqüenciamento ("Dye terminator cycle
sequencing DNA sequencing kit" da Perkin-Elmer (protocolo 7.1) ou "Thermo Sequenase
dye terminator cycle sequencing pre-mix kit" da Amersham (protocolo 7.2)). Feito isso,
as amostras foram entregues a um técnico especializado responsável pelo manuseio do
seqüenciador ABI PRISM 310 "Genetic Analyzer" (Perkin-Elmer) pertencente ao
departamento de Biologia do IBUSP.
Para o seqüenciamento dos demais genes, os fragmentos foram submetidos à
reação de "cycle sequencing" em termociclador modelo Genius, da Techne, segundo
especificações do fabricante do "kit" de seqüenciamento ("DYEnamic direct cycle
sequencing kit Thermosequenase e 7-deaza-dGTP"; Amersham), descritas no protocolo
7.3.
59
Material e Métodos
7.1 "Cycle sequencing" (Perkin Elmer)
Equipamentos
Sala exclusiva para PCR
Micropipetas
Cuba para gelo
Seqüenciador automático
Microcentrifuga
Ponteira para micropipetas
Termociclador
Vórtex
Substâncias e Soluções
DNA
Primers 3uM
Gelo
Terminator ready mix
H2O
NaAc 3M
Etanol absoluto
Etanol 70% gelado
TSR
Procedimentos
1 - Checar o programa de "cycle sequencing" no termociclador.
2 - Manter primer e DNA descongelados em gelo.
3 - Retirar terminator ready mix do freezer e descongelá-lo rapida e manualmente.
4 - Em sala de PCR, preparar a reação do "cycle sequencing", adicionando 8 ul de
terminator ready mix, primer e água aos tubos eppendorfs.
5 - Devolver o terminator ready mix imediatamente ao freezer, uma vez que ocorre sua
degradação na presença de luz.
6 - Fora da sala de PCR, aliquotar o DNA necessário para a reação.
7 - Dar um pulso nas amostras em microcentrifuga.
8 - Iniciar a reação no termociclador (25 ciclos de 96oC 10 seg, 50oC 5 seg, 60oC 4 mim;
4oC "hold").
9 - Após a reação, adicionar 2 ul de NaAC e 50 ul de EtOH absoluto.
10 - Agitar as amostras em vórtex.
11 - Manter em gelo por 10 minutos.
12 - Centrifugar por 15-30 minutos por 14 krpm.
13 - Retirar EtOH cuidadosamente com micropipeta.
14 - Adicionar 100 ul de EtOH 70%.
15 - Centrifugar por 10 minutos a 14 krpm.
16 - Retirar EtOH 70% com auxílio de micropipeta cuidadosamente.
17 - Secar a vácuo por 5 minutos ou a 95oC em banho seco por 2 miutos.
18 - Ressuspender em 25 ul de TSR, dos quais 6 ul serão amostrados no seqüenciador e o
restante armazenado a -20oC, para uma eventual segunda corrida, caso a primeira
apresente problemas.
19 - Agitar em vórtex e manter sempre em gelo.
20 - Aquecer a amostra por 2 minutos a 95oC.
21 - Manter a amostra em gelo.
60
Material e Métodos
22 - As amostras foram entregues nas mãos do técnico especializado em manusear o
seqüenciador automático.
7.2 "Cycle sequencing" (Amersham)
Equipamentos
Sala de PCR
Micropipetas
Cuba para gelo
Seqüenciador automático
Microcentrifuga
Ponteira para micropipetas
Termociclador
Vórtex
Substâncias e Soluções
DNA
Primers 5-20uM
Gelo
Terminator ready pre-mix
H2O
NaAc ou NH4Ac
Etanol absoluto
Etanol 70% gelado
Loading dye
Procedimentos
1 - Checar o programa de "cycle sequencing" no termociclador.
2 - Manter primer e DNA descongelados em gelo.
3 - Retirar "terminator ready pre-mix" do freezer e descongelá-lo rapida e manualmente.
4 - Em sala de PCR, preparar a reação do "cycle sequencing", adicionando 8 ul de
"terminator ready pre-mix", "primer" e água aos tubos eppendorfs.
5 - Devolver o "terminator ready pre-mix" imediatamente ao freezer.
6 - Fora da sala de PCR, aliquotar o DNA necessário para a reação.
7 - Dar um pulso nas amostras em microcentrífuga.
8 - Iniciar a reação no termociclador.
9 - Após a reação, adicionar 2 ul de NaAC e 50 ul de EtOH absoluto. O acetato de sódio
pode ser substituído por 7 ul de acetato de amônia 7,5M. Se isto ocorrer, adicionar 70
ul de etanol absoluto, agitar em vórtex e deixar de 15 a 20 minutos no gelo (passos 10
e 11).
10 - Agitar as amostras em vórtex.
11 - Manter em gelo por 10 minutos.
12 - Centrifugar por 15-30 minutos por 14 krpm.
13 - Retirar EtOH cuidadosamente com micropipeta.
14 - Adicionar 100 ul de EtOH 70%.
15 - Centrifugar por 10 minutos a 14 krpm.
16 - Retirar EtOH 70% com auxílio de micropipeta cuidadosamente.
17 - Secar a vácuo por 5 minutos.
18 - Ressuspender em 10-25 ul de Loading dye.
19 - Agitar as amostras em vórtex e manter sempre em gelo.
61
Material e Métodos
20 - Aquecer a amostra por 2 minutos a 95oC.
21 - Manter a amostra em gelo.
22 - Levar para laboratório de Seqüenciamento Automático e deixar a amostra nas mãos
do técnico especializado.
7.3 "Cycle sequencing" (Amersham)
1 - Preparar 4 tubos eppendorfs para cada amostra a ser seqüenciada.
2 - Marcar cada tubo de cada amostras com as letras A, C, G e T correspondente a cada
um dos nucleotídeos.
3 - Preparar solução primer-DNA, com cerca de 250 fmol de DNA, 1,0 ul de primer
(1pmol/ul), e água para completar 15,0 ul.
4 - Acrescentar 2,0 ul do reagente "pre-mix" do kit de seqüenciamento ao tubo
correspondente, isto é, o "pre-mix A" ao tubo marcado com a letra A, e assim
sucessivamente.
5 - Acrescentar 3,5 ul da solução primer-DNA.
6 - Iniciar a reação do "cycle sequencing" (30 ciclos de 30 segundos a 95oC, 30 segundos
a 55oC, e 30 segundos a 72oC. Estes ciclos foram precedidos por um passo inicial de
desnaturação por 2 minutos a 95oC, e sucedido por um passo final de extensão por 5
minutos a 72oC).
7 - Adicionar a cada tubo 3,0 ul de solução de interrupção de reação da LI-COR.
8 - Desnaturar os tubos a 95oC por 5 minutos.
9 - Aplicar 1,5 ul de cada tubo no gel de poliacrilamida já previamente preparado
(protocolo 9).
Os procedimentos para a limpeza e montagem das placas de gel (protocolo 8),
preparação do gel de acrilamida (protocolo 9) e aplicação, corrida de eletroforese do gel
vertical de seqüenciamento e desmontagem das placas de gel (protocolo 10) são descritos
a seguir.
Protocolo 8 - Limpeza e Montagem das placas de vidro
Equipamentos
Par de placas de vidro 25cm x 60 cm
Papel absorvente
Pente
Par de espaçadores 0,25 mm
Grampos laterais LI-COR
Luvas cirúrgicas
Substâncias e Soluções
Álcool
H20 Milli Q
Detergente Micro-90
62
Material e Métodos
Procedimentos
1 - Usar luvas para manusear as placas.
2 - Limpar o par de placas com água e detergente Micro-90 (International Products
Corporation) várias vezes, principalmente lado interno.
3 - Limpar os espaçadores e os pentes com água e detergente.
4 - Jogar isopropanol 100% sobre as placas, espaçadores e pentes para secá-los mais
rapidamente.
5 - Ajustar ambas as placas de vidro e os espaçadores laterais entre as placas.
6 - Colocar os 2 grampos LI-COR nas laterais das placas.
Protocolo 9 - Preparação do gel de acrilamida
Equipamentos
Placas montadas
Proveta
Becker
Suporte de 5 cm de altura para as placas de vidro
Papel absorvente
Luvas cirúrgicas
Grampos e Seringa
Substâncias e Soluções
Solução de gel LongRange
TBE 5x
Ureia
TEMED
Persulfato de Amônio
H2O milliQ
Procedimentos
1 - Preparar o gel com 4,8 ml de solução LongRange da LI-COR, 25,2 g de uréia, 14,4 ml
de TBE 5X. A solução LongRange contém acrilamida e deve ser manuseada com luvas
cirúrgicas.
2 - Completar a solução para 60 ml com água milliQ.
3 - Adicionar 40,0 ul de TEMED e 400,0 ul de persulfato de amônio 10% à solução.
Recomenda-se que esta solução não tenha mais do que 10 dias de idade.
4 - Misturar bem.
5 - Segurar as placas de vidro levemente inclinadas com uma das mãos e injetar a solução
de gel com auxílio de uma seringa.
6 - Evitar a formação de bolhas de ar. Caso isto aconteça, erguer a placa de vidro para que
a solução desça até as bolhas e estas se desfaçam, ou dar leves batidas sobre as placas
para fazer as bolhas virem até a superfície.
7 - Colocar o pente no gel.
8 - Prender a região superior das placas com grampos, tomando-se o devido cuidado para
não deslocar o pente.
9 - Deixar o gel polimerizando, apoiando-se as placas sobre um suporte de 5 cm de altura
em cada lado.
63
Material e Métodos
10 - Verificar a completa polimerização do gel através do restante da solução na proveta
ou no becker.
Durante a aplicação das amostras de seqüenciamento, se houver vazamento moderado
de amostra de reação de seqüenciamento entre as fendas, aplicar quarteto de amostras e
restabelecer a corrente até que as amostras entrem no gel. Repetir o processo até que
todos os quartetos das amostras tenham sido aplicados. Além disso é recomendado que a
corrida de eletroforese seja acompanhada de tempos em tempos para certificar-se que de
não está havendo vazamento do tampão do compartimento superior.
Protocolo 10 Eletroforese de Seqüenciamento
Equipamentos
Papel absorvente
Seqüenciador LI-COR
Micropipeta P20
Ponteiras para P20
Substâncias e Soluções
H20 Milli Q
Detergente
TBE 1x
Amostras de DNA do "cycle sequencing"
Água
Isopropanol
Procedimentos
1 - Limpar resíduos do gel que polimerizou sobre as placas com papel molhado em água
MilliQ.
2 - Descartar papel contaminado em lixo hospitalar.
3 - Retirar o pente das placas.
4 - Retirar o excesso de uréia e gel que permanece na fenda do pente.
5 - Secar bem as placas com papel absorvente.
6 - Limpar bem o pente.
7 - Inserir o pente corretamente, formando as fendas onde serão aplicadas as amostras.
8 - Colocar as placas de gel na cuba vertical de eletroferese.
9 - Acoplar as placas ao seqüenciador automático, encaixando os grampos nos devidos
suportes.
10 - Colocar o tanque de tampão superior no parte superior do suporte das placas do
seqüenciador.
11 - Preencher os tanque superior e inferior com tampão TBE 1x.
12 - Fechar a porta do suporte das placas.
13 - Iniciar o programa de controle da corrida de eletroforese, especificando uma
temperatura de 45oC e voltagem de 2000V.
64
Material e Métodos
14 - Deixar a pré-corrida ocorrer por cerca de 45 minutos até que a placa de gel tenha
atingido 45oC.
15 - Interromper a corrida após ter sido atingida a temperatura de 45oC.
16 - Abrir a porta do suporte dos gel.
17 - Aplicar as amostras no gel com auxílio de micropipeta P20, considerando que cada
amostra ocupa 4 fendas (A,C,G,T) consecutivas.
18 - Fechar a porta do suporte do gel.
19 - Restabelecer a voltagem elétrica
20 - Interromper a voltagem ao término da corrida.
21 - Abrir a tampa do suporte do gel.
22 - Esvaziar o tampão do tanque.
23 - Retirar o tanque superior.
24 - Cuidadosamente retirar a placa de gel do seqüenciador automático.
25 - Descartar o tampão do "container" inferior.
26 - Lavar os tanque.
27 - Retirar os grampos laterais e o pente do gel e lavá-los com água e detergente.
28 - Com o auxílio de uma espátula, deslocar cuidadosamente as duas placas de vidro de
modo que elas se soltem e o gel permaneça grudado em apenas uma delas.
29 - Lavar cuidadosamente a placa de vidro que ficou sem o gel, com água e detergente.
30 - Retirar o gel da outra placa com o auxílio de papel absorvente.
31 - Descartar o papel com o gel em lixo hospitalar.
32 - Limpar essa segunda placa de vidro da mesma maneira que a primeira.
ANÁLISES DAS SEQÜÊNCIAS
Correção de ambiguidades das seqüências
Uma vez terminada a leitura das reações de sequencimento, o seqüenciador
automático gera arquivos contendo as seqüências e seus respectivos eletroferogramas.
Isto possibilita comparar cada uma das fitas obtidas e corrigir os sítios onde a
determinação da base não foi claramente estabelecida em uma das reações. As correções
das seqüências foram realizadas de acordo com o modelo do seqüenciador automático
usado em sua obtenção.
-
Seqüenciador ABI PRISM 310 Genetic Analyzer da Perkin-Elmer (seqüências
do domínio I da região controladora).
65
Material e Métodos
Para cada gênero, as seqüências da fita leve L e da fita pesada H obtidas foram
carregadas no editor Sequence Navigator, versão 1.0.1 (Perkin-Elmer). Esse programa
permite visualizar as seqüências obtidas, bem como analisar os eletroferogramas
produzidos. Os eletroferogramas correspondem a uma representação gráfica do sinal
cromatográfico produzido por cada nucleotídeo durante a passagem pelo detector
cromatográfico do seqüenciador automático. As fitas H foram revertidas e
complementadas para ficarem iguais as fitas L. Para resolver os casos onde havia dúvida
de qual nucleotídeo ocupava uma determinada posição, as fitas L e H foram comparadas
entre si e com a mesma região gênica já seqüenciada para Gallus gallus (Desjardins &
Morais, 1990). Neste procedimento, usou-se ainda os eletroferogramas produzidos pelo
seqüenciador automático para corrigir as falhas entre as seqüências L e H.
-
Seqüenciador LongReadir 4200 da LI-COR (seqüências de 12S e 16S rDNA,
COI, COII, COII e cyt b).
O seqüenciador automático LongReadir 4200 da LI-COR reconhece a
luminêscencia de cada primer diferentemente, o que permite o seqüenciamento
simultâneo de até 1100 bases de cada uma das fitas do DNA. Após a conclusão do
seqüenciamento automático, as seqüências foram lidas usando o software Base ImagIR,
versão 4.0 fornecido pelo fabricante LI-COR. Este software permite visualizar
concomitantemente, o gel e a base atribuída a cada banda, semelhante a uma
autorradiografia de um seqüenciamento manual. Nos casos duvidosos, a banda pode ser
corrigida manualmente através da inspeção do gel e/ou do eletroferograma
correspondente. Feito isso, as seqüencias L e H de cada táxon foram salvas em arquivos
formatos texto.
Após corrigidas, as seqüências foram preparadas para o alinhamento, através da
construção de uma matriz no formato PIR.
66
Material e Métodos
Alinhamento
O alinhamento das seqüências de DNA foi realizado para cada gene
invidualmente, usando-se o programa de alinhamento ClustalW (Cabot et al., 1989).
Neste caso, a matriz no formato PIR foi carregada no ClustalW. Posteriormente, o
alinhamento foi exportado como uma matriz salva como arquivo texto e importada no
programa ESEE (Thompson et al., 1994). Neste programa, o alinhamento foi conferido
para correção de eventuais "erros" de alinhamento. No caso de haver estes erros, a
correção foi realizada manualmente. No casos de haver lacunas de alinhamento, elas
foram removidas e uma nova matriz sem lacunas foi exportada nos formatos PHYLIP e
NEXUS.
ANÁLISES EVOLUTIVAS E FILOGENÉTICAS
Análises de saturação de substituição
Para verificar se o número de transições e de transversões atingiu o nível de
saturação, isto é, se ocorreu mais do que uma substituição em determinados sítios, foi
construído um gráfico onde a coordernada representa os valores das distâncias de cada
par de táxons usados e a absissa o número de transição (TS) ou de transversão (TV)
presentes em cada par de táxons. No caso de não haver saturação, a relação entre estes
parâmetros é linear, isto é, com o aumento da distância, há o aumento do número de TS
ou TV. Se houver substituições múltiplas, o gráfico atinge um platô no qual aumentandose a distância, não há o aumento no número de TS ou TV.
Mapeamento de verossimilhança
O método de mapeamento de verossimilhança proposto recentemente ("likelihood
mapping"; Strimmer, 1997, Strimmer & von Haeseler, 1997) permite visualisar
graficamente o conteúdo filogenético de um conjunto de seqüências de DNA e é realizado
no programa PUZZLE 4.0.2. O procedimento envolve estabelecer as relações
filogenéticas para todos os possíveis grupos de quatro táxons existentes no estudo. Para
cada quatro táxons A, B, C e D, há três possibilidades de resolução: ((A,B)(C,D)),
((A,C)(B,D)), ((A,D)(B,C)). Estas tolopogias irão ser representadas como os vértices de
67
Material e Métodos
um triângulo equilátero. O programa calcula a verossimilhança de cada uma destas
topologias e insere um ponto próximo a um dos vértices do triângulo, referente à
topologia que apresentar a melhor probabilidade. Se duas destas topologias forem
similarmente prováveis, o ponto cairá proximo à aresta do triangulo ligando os dois
vértices correspondentes a elas. Ainda no caso de nenhuma das três topologias apresentar
melhor probabilidade do que as demais, o ponto será colocado no centro do triângulo. O
sinal filogenético será medido pela proporção de quartetos cujos pontos ocuparam as
regiões próximas aos vértices.
Máxima verossimilhança
As análises de verossimilhança foram realizadas no programa BASEML do
pacote PAML. Em todas as análises a árvore foi encontrada utilizando-se o algoritmo de
decomposição de estrela, onde todos os táxons são unidos em um único nó interno e
gradativamente são realizados novos rearranjos para a obtenção da árvore mais
verossímil.
O modelo evolutivo escolhido foi aquele resultante de testes de razão de
verossimilhança (LRT, do ingles, “likelihood ratio test”; Goldman, 1993a,b; Huelsenbeck
& Crandall, 1997; Huelsenbeck & Rannala, 1997), realizados previamente à reconstrução
filogenética por meio do critério da verossimilhança.
Os testes de verossimilhança foram realizados de duas maneiras. Uma delas
consistia em escolher os modelos evolutivos e obter a árvore mais verossímil perante
cada modelo. Posteriormente, a probabilidade destes modelos foram testadas por meio da
estatística:
δ=2(LnHo - LnH1)
onde LnHo e LnH1 são, respectivamente, as probabilidades do modelo mais simples e do
modelo mais complexo. Esta estatística pode ser usada quando os modelos evolutivos
representam um caso especial do modelo alternativo. Por exemplo, se não há diferenças
nas taxas de transição entre purinas e transição entre pirimidinas, o modelo de TN93 se
reduz ao modelo de KHY85. A significância das diferenças é avaliada por meio da
distribuição de χ2. Os graus de liberdade equivalem à diferença entre o número de
68
Material e Métodos
parâmetros entre os modelos testados. Se a diferença for significativa, a adição de mais
parâmetros melhora a probabilidade da árvore, isto é, o modelo com mais parâmetros
reflete de maneira mais apropriada a evolução das seqüências usadas, aumentando a
probabilidade da árvore ter gerado aquele conjunto particular de seqüências.
No caso de comparação onde os modelos não representam um caso especial um
do outro, Felsenstein (1988) sugere apenas 1 grau de liberdade entre eles e compará-los
em uma tabela de χ2. Este é o caso de comparação de árvores onde a hipótese nula
postula que as seqüências evoluem segundo um relógio molecular e a hipótese alternativa
postula que as seqüências não possuem taxas constante de substituição entre as linhagens.
Neste caso, ambas as hipóteses estão considerando o mesmo modelo evolutivo.
A segunda maneira de realizar um LRT é por meio de um software denominado
MODELTEST. Este programa é executado em conjunto com o PAUP 4.0. Inicialmente a
matriz contendo nossos dados é carregada no PAUP. A seguir, roda-se uma segunda
matriz denominada MODELBLOCK, contendo os parâmetros para o cálculo das
verossimilhanças de uma árvore construída pelo algoritmo de "Neighbor-Joining". O
cálculo da verossimilhança é feito para 40 modelos evolutivos e salvo em um arquivo
denominado MODELSCORES. Este arquivo, por sua vez, é carregado no MODELTEST
e então temos os resultados e níveis de significância para frequência igual de bases, taxas
iguais de transição e transversão, taxas iguais entre os tipos de transição, taxas iguais
entre os tipos de transversão e heterogeneidade de taxa de substituição entre os sítios, e
qual modelo melhor se adequa aos nossos dados.
Máxima parcimônia
A árvore mais parcimoniosa foi estimada pelo programa PAUP 4.0. A busca
exaustiva foi realizada em casos onde era computacionalmente possível encontrar a
árvore desta maneira, isto é, estimar o número de passos entre todas as possíveis árvores.
Nos casos onde o número de árvores possíveis limitava a busca exaustiva, a procura foi
realizada por meio de busca heurística. Este procedimento utiliza menos tempo para
encontrar uma árvore, porém a árvore encontrada pode não ser a mais parcimoniosa.
69
Material e Métodos
Neighbor-joining
A análise filogenética por meio do método de distância foi realizada no programa
PAUP 4.0. O algoritmo selecionado foi o de "neighbor-joining", que permite que as
seqüências tenham taxas diferentes de divergência.
Índices de suporte.
Diversos índices de suporte foram utilizados de acordo com a análise utilizada.
Valores de "bootstrap" (Felsenstein, 1985) e índices de Bremer (índice de decaimento,
Bremer, 1994) foram usados na análise de máxima parcimônia. Valores de resolução de
quartetos foram utilizados em análises de máxima verossimilhança.
"Bootstrap"
Valores de "bootstrap" foram obtidos por meio de reamostragem dos dados
usando-se o programa PAUP 4.0. Associações que tiveram valores de "bootstrap"
menores do que 50% não foram mostradas nas árvores, e os ramos que levaram aos
táxons envolvidos nestes casos foram representados por politomias.
Índices de Bremer
Os índices de Bremer, ou ainda índices de decaimento, indicam o número de
passos a mais necessários para que uma determinada associação de táxons sejam perdida
em uma árvore. Estes valores foram obtidos usando o programa AUTODECAY 4.0.1
(Eriksson, 1998) em conjunto com o PAUP 4.0.
Resolução de quartetos
O método de resolução de quartetos ("quartet puzzling") baseia-se em resolver a
topologia para todos os possíveis grupos de quatro táxons. Posteriormente, uma árvore
consenso é estimada de acordo com a resolução destes quartetos. Os valores da resolução
de quartetos foram obtidos no programa PUZZLE 4.0.2 (Strimmer, 1997, Strimmer &
von Haeseler, 1996).
70
Material e Métodos
Datação de tempo de divergência
Para datar o tempo de divergência entre os táxons, utilizou-se uma datação
molecular conhecida entre dois táxons incluídos na reconstrução filogenética. Esta data
foi usada como calibração para estimar o número de substituição por milhão de ano, e
partir desta estimativa, converte-se os comprimentos dos ramos da árvore de máxima
verossimilhança em estimativas das datas de divergências para todos os nós internos e
externos.
71
Resultados
72
RESULTADOS
Os resultados do presente trabalho foram organizados em forma de manuscritos para
publicação e são apresentados a seguir:
•
Posição filogenética de Cracidae e Megapodiidae em relação aos Galliformes e Anseriformes
(Capítulo 3)
•
Filogenia molecular de Cracidae (Aves) (Capítulo 4)
•
Domínio I da região controladora do DNA mitocondrial e a inferência filogenética entre os
gêneros de Cracidae (Aves) (Capítulo 5)
•
Evolução molecular da subunidade II da citocromo c oxidase em Cracidae (Aves) (Capítulo
6)
73
Capítulo 3
Posição Filogenética de
Cracidae e Megapodiidae
em relação aos Galliformes
e Anseriformes
74
Cracidae e Megapodiidae são grupos-irmãos
POSIÇÃO FILOGENÉTICA DE CRACIDAE E MEGAPODIIDAE EM RELAÇÃO AOS
GALLIFORMES E ANSERIFORMES
Abstract
Phylogenetic relationships of major clades of birds thought to be basal in the avian
tree have long been controversial, and one of the questions not clearly answered is the
relationship between the Galliformes and Anseriformes. Previous molecular studies based
on immunological distances and DNA-DNA hybridization data suggested the separation
of the Cracidae and Megapodiidae from the Galliformes, as they are as genetically distant
from them as from the Anseriformes. We used sequences from five mitochondrial genes
(3119 bp) of Anseriformes and Galliformes to investigate their relationships and the
position of the families Cracidae and Megapodiidae in the Galloanserae evolutionary
scenario. Our results suggest that caution is advisable when drawing conclusions based on
analysis of sequences from a single gene and when using methods of substitution that do
not contain realistic assumptions about the evolutionary process of the sequences under
study. Using longer sequences from multiple genes and the best-fitting GTR + Γ model of
substitution we show that the Anseriformes and Galliformes are sister groups, and the
Cracidae and Megapodiidae are not excluded from the Galliformes. The Megapodiidae is
the sister group to the Cracidae in our analysis. We dated the time of divergence of
Cracidae + Megapodiidae from other Galliformes at approximately 86 million years ago
(Mya), and between the Cracidae and Megapodiidae at about 75 Mya.
Resumo
As relações filogenéticas entre os principais clados basais de Aves têm sido
controversas, e uma das questões não resolvidas é a relação entre os Galliformes e
Anseriformes. Estudos moleculares baseados em distâncias imunológicas e hibridação
DNA-DNA sugeriram a separação de Cracidae e Megapodiidae dos Galliformes, porque
estes dois táxons seriam tão distantes dos Galliformes quanto dos Anseriformes. No
presente trabalho, usamos seqüências de cinco gene mitocondriais (3119 pares de bases)
de representantes de Anseriformes e Galliformes para investigar a posição filogenética
das famílias Cracidae e Megapodiidae no cenário evolutivo dos Galloanserae. Nossos
75
Cracidae e Megapodiidae são grupos-irmãos
resultados baseados em seqüências de diferentes genes combinados em um único
conjunto de dados e no uso do modelo de substituição GTR + Γ sugerem que os
Anseriformes e Galliformes são grupos-irmãos, e que Cracidae e Megapodiidae não
devem ser excluídos dos Galliformes. Megapodiidae é um grupo-irmão de Cracidae de
acordo com nossos resultados. Datamos o tempo de divergência de Cracidae +
Megapodiidae dos demais Galliformes em aproximadamente 86 Ma (milhões de anos
atrás), e entre Cracidae e Megapodiidae em 75 Ma. Além disso, foi possível destacar que
conclusões baseadas em um único gene devem ser aceitas com restrições e que o método
de substituição de nucleotídeos que não contém premissas realísticas sobre o processo
evolutivo das seqüências em estudo pode levar a conclusões errôneas.
Introdução
As relações filogenéticas entre os táxons na base da árvore das Aves têm sido
amplamente debatida, e esquemas tradicionais de posicionamento taxonômico têm sido
questionados com estudos recentes de DNA, os quais têm mostrado um grande acúmulo
de caracteres para reconstrução de árvores filogenéticas (Sibley e Ahlquist, 1990; Harlid
et al., 1998; Harlid e Arnason, 1999; Mindell et al., 1999). As principais questões
envolvem
as relações filogenéticas de grupos neoganatos como os Galliformes, os
Anseriformes, e os Passeriformes, assim como também das aves paleognatas como as
aves ratitas e os Tinamiformes.
Para exemplificar algumas questões, seriam os
Galliformes e os Anseriformes linhagens monofiléticas? Seriam eles mais relacionados as
aves ratitas do que as outras aves neognatas? Teriam os Passeriformes divergido mais
precocemente do que previamente se acreditava? Qual o posicionamento filogenético dos
Tinamiformes?
As relações entre os Anseriformes e os Galliformes têm sido particularmente
problemáticas devido ao fato de diferentes conjuntos de dados forneceram diferentes
conclusões (e.g. morfologia une Galliformes e Anseriformes (Cracraft e Mindell, 1989)
enquanto o registro fóssil sugere proximidade entre os Anseriformes e os Charadriiformes
(Olson e Feduccia, 1980)). Estudos moleculares também apresentaram resultados
conflitantes. Hibridação DNA-DNA (Sibley e Ahlquist, 1990), distâncias imunológicas
76
Cracidae e Megapodiidae são grupos-irmãos
de transferrina (Prager e Wilson, 1976), seqüências dos genes 12S e 16SrRNA (Hedges et
al., 1995), αA- and αB-cristalino (Caspers et al., 1997), e do RAG-1 (Groth e
Barrowclough, 1999) indicaram que os Anseriformes e Galliformes são grupos-irmãos.
Outros estudos, como os realizados com fragmentos de restrição de DNA (Mindell e
Honeycutt, 1989), seqüências de aminoácidos de ovomucóide (Laskowski e Fitch, 1989),
seqüências de nucleotídeos de α- e β-hemoglobina (Czelusniak et al 1990), e de αAcrystallin (Stapel et al., 1984) sugeriram que os Anseriformes ou os Galliformes são mais
relacionados com outras ordens de Aves do que entre si.
Para auxiliar a resolver esta controvérsia, estimamos as relações filogenéticas dos
Anseriformes e Galliformes, incluindo cracídeos e um megapodídeo, usando seqüências
de cinco genes mitocondriais (12S e 16SrDNA, subunidades I, II e III da citocromo
oxidase, e citocromo b).
Nosso objetivo principal era determinar se Cracidae e
Megapodiidae deveriam ser classificados como uma unidade taxonômica a parte dos
outros Galliformes, como sugerido por Prager e Wilson (1976) a partir de distâncias
imunológicas de proteínas, e por Sibley et al. (1988) de dados de hibridação DNA-DNA.
Secundariamente, queríamos determinar o grupo externo mais apropriado para determinar
as relações filognéticas entre os gêneros de Cracidae.
Material e Métodos
Seqüenciamos ambas as fitas dos genes ribossomais 12S e 16S rDNA,
subunidades I (COI), II (COII) e III (COIII) da citocromo oxidase e citocromo b (cyt b) de
Crax blumenbachii, Ortalis canicollis, Penelope obscura (Cracidae) e Megapodius
reinwardt (Megapodiidae). Resumidamente, produtos de PCR dupla fita foram
seqüenciados diretamente com kit de seqüenciamento Thermosequenase DYEnamic
(Amersham) e marcados fluorescentemente com iniciadores universais do M13 (LICOR). As seqüências foram carregadas em gel de acordo com as especificações do
fabricante (LI-COR) e a separação dos fragmentos se deu em seqüenciador automático bidirecional da LI-COR 4200. Adicionalmente, usamos seqüências
disponíveis no
GenBank de Gallus gallus e Aythya americana, representando os Galliformes e os
77
Cracidae e Megapodiidae são grupos-irmãos
Anseriformes, respectivamente (Tab. 1). Seqüências de Rhea americana foram usadas
para enraizar a árvore.
Tabela 1. Seqüências usadas
GenBank.
Táxon
12S rDNA
Rhea
Y16884
Aythya
AF090337
Crax
AF165444
Ortalis
AF165448
Penelope
AF165450
Megapodius
AF165441
Gallus
X52392
neste trabalho e número de acesso correspondente no
16S rDNA
Y16884
AF090337
AF165456
AF165460
AF165462
AF165453
X52392
COI
Y16884
AF090337
AF165489
AF165496
AF165498
AF165489
X52392
COII
Y16884
AF090337
AF165501
AF165504
AF165510
AF165501
X52392
Cyt b
Y16884
AF090337
AF165465
AF165468
AF165474
AF165465
X52392
O alinhamento das seqüências foi realizado em programa ClustalW (Thompson et
al., 1994), e visualmente refinado no programa ESEE (Cabot e Beckenbach, 1989) para
excluir lacunas de alinhamento e corrigir áreas de alinhamento duvidoso. O alinhamento
final consistiu de 633 pares de bases (pb) do 12S rDNA, 917 pb do 16S rDNA, 219 pb do
COI, 684 pb do COII, e 999 pb do cyt b, totalizando 3452 pb.
Análises filogenéticas
As terceiras posições dos códons do cyt b se encontram saturadas de substituições
entre estes grupos e foram excluídas da análise. Desta forma, a matriz analisada nas
reconstruções filogenéticas continha 3119 pares de bases. A reconstrução da árvore de
máxima parcimonia foi realizada usando busca exautiva no PAUP* 4.0 (Swofford., 1999)
para cada gene separadamente e combinados em um único conjunto de dados.
Transversões (TV) receberam peso de 5 para o 12S rDNA, 3 para o 16S rDNA, COI e cyt
b, e 6 para o COII, baseado nas razões de transição/transversão (TS/TV) correspondentes
estimadas para cada um destes genes. Análise de máxima verossimilhança também foi
utilizada para o conjunto de dados combinados. As árvores foram obtidas por meio do
algorítmo de decomposição de estrela ("star decomposition") no programa BASEML
implementado no pacote PAML 2.0 (Yang, 1999). Os modelos evolutivos de JC69, F81,
HKY85, TN93, e GTR de evolução de DNA foram utilizados, admitindo haver
heterogeneidade de taxa de substituição entre os sítios. O parâmetro α da distribuição
gama foi estimado no programa PUZZLE 4.0.2 (Strimmer e von Haeseler, 1999) (α=0.20
78
Cracidae e Megapodiidae são grupos-irmãos
para todos os genes combinados). Testes de razão de verossimilhança (LRT) foram
realizados para escolher o modelo evolutivo que melhor se adeque as seqüências em
estudo. Cada gene foi analisado separadamente sob o critério de máxima verossimilhança
de acordo com o melhor modelo evolutivo escolhido por meio dos LRT.
Testando árvores alternativas
Todas as possíveis quinze árvores enraizadas para Aythya (A), Gallus (G),
Megapodius(M) , o grupo restrito ((Crax,Ortalis),Penelope)(C) usando Rhea(R) como
grupo externo (Fig. 1) foram carregadas no PAUP 4.0, para testar as diferenças das
árvores sob o critério de máxima parcimônia e máxima verossimilhança pelo teste de
Kishino-Hasegawa. Também testamos se nossas seqüências evoluem de maneira
constante (relógio molecular) usando a estatística 2ln(L1 – L2), onde L1 é a probabilidade
da árvore com relógio molecular e L2 é a probabilidade da árvore sem o relógio.
Resultados
Distâncias médias não corrigidas entre Rhea e os outros táxons são 0,173; entre
Aythya e os Galliformes, 0,172; entre Gallus e os outros Galliformes, 0,153; entre
Megapodius e Cracidae 0, 149; e 0,085 entre os Cracidae.
A busca exaustiva da árvore mais parcimoniosa usando pesos baseados na razão
de transição/transversão do conjunto de dados combinado de 3119 pb (excluindo as
terceiras posições dos códons do cyt b) resultou na árvore 3 (Fig. 1). Esta árvore tem
Aythya como grupo-irmão de Galliformes, e Gallus como grupo-irmão de Megapodius e
dos cracideos. Uma árvore similar foi obtida para o gene 12rDNA. Analisados
separadamente por meio de busca exaustiva, os genes 16S, COI, COII e cyt b resultaram
em árvores diferentes, cada uma sugerindo diferentes relações entre estes táxons: árvore 4
para cyt b, árvore 8 para COI, árvores 10 e 13 para COII, e árvore 12 para 16S rDNA. Sob
o critério de parcimônia, apenas a árvore 12 obtida para o 16S rDNA é significativamente
diferente da árvore mais parcimôniosa (árvore 3) obtida com o conjunto de dados
combinados e com o 12S rDNA (Tab. 2).
79
Cracidae e Megapodiidae são grupos-irmãos
#1
R
#5
#3
R
#4
R
C
A
G
C
M
G
A
G
G
M
M
A
A
C
C
#6
R
#7
R
#8
R
C
G
M
G
G
C
G
M
M
M
C
C
A
A
A
A
R
#13
R
M
R
#9
#2
#10
R
#11
R
#12
R
C
A
M
A
A
C
A
M
M
G
G
G
G
M
C
C
R
#14
R
#15
R
A
C
A
G
G
C
M
M
M
C
A
G
Figura 1. Todas as possíveis árvores bifurcadas para Cracidae (C), Megapodiidae (M),
outros Galliformes (G) e Anseriformes (A), tendo Rhea (R) como grupo externo.
80
Cracidae e Megapodiidae são grupos-irmãos
Tabela 2. Resultados do teste de Kishino-Hasegawa para todas as possíveis árvores da figura 1 sob o
critério de máxima parcimônia.
Árvore
Passos.
dif
d.p.(dif)
t
P
IC
IR
CR
1 - (R(M(C(GA))))
4281
97
38,89046
2,4942
0,0127*
0,765
0,384
0,294
2 - (R(C(M(GA))))
4267
83
40,46376
2,0512
0,0403*
0,768
0,393
0,301
3 - (R(A(G(MC))))
4184
MP
0,783
0,443
0,347
4 - (R(G(A(MC))))
4190
6
31,18173
0,1924
0,8474
0,782
0,440
0,344
5 - (R(C(G(MA))))
4253
69
43,75028
1,5771
0,1149
0,770
0,401
0,309
6 - (R(G(C(MA))))
4190
6
31,18173
0,1924
0,8474
0,782
0,440
0,344
7 - (R(M(G(CA))))
4283
99
40,94380
2,4179
0,0157*
0,765
0,383
0,293
8 - (R(G(M(CA))))
4229
45
28,11769
1,6004
0,1096
0,774
0,416
0,322
9 - (R(C(A(GM))))
4258
74
41,31333
1,7912
0,0734
0,769
0,398
0,306
10 - (R(A(C(GM))))
4252
68
39,81238
1,7080
0,0877
0,770
0,402
0,309
11 - (R(M(A(GC))))
4346
162
35,29852
4,5894
<0,0001*
0,754
0,344
0,259
12 - (R(A(M(GC))))
4346
162
35,29852
4,5894
<0,0001*
0,754
0,344
0,259
13 - (R((AG)(CM))
4229
45
28,11769
1,6004
0,1096
0,774
0,416
0,322
14 - (R((GC)(AM))
4258
74
41,31333
1,7912
0,0734
0,769
0,398
0,306
15 - (R((AC)(GM))
4252
68
39,81238
1,7080
0,0877
0,770
0,402
0,309
Letras indicam: R - Rhea, A - Aythya, G - Gallus, M - Megapodius, e C - o grupo restrito Cracidae.
Passos.- número de passos MP - árvore mais parcimoniosa; dif –diferença com a árvore mais parcimoniosa;
d.p. (dif) - desvio padrão da diferença; t - resultados do teste t ; P - probabilidade de obter um valor de t
mais extremo sob a hipótese de igualdade entre as duas árvores a 5%; IC – índice de consistência; IR –
índice de retenção: CR – índice de consistência reescalonado.
Conforme esperado, os LRT mostraram que modelos de substituição de DNA com
mais parâmetros resultaram em uma melhora da probabilidade da árvore quando
comparados com modelos mais simples. O modelo geral de reversão-no-tempo (GRT, do
inglês "general-time-reversible") foi o melhor modelo para o conjunto de dados
combinados (Tab. 3), e foi utilizado posteriormente para cada gene separadamente. Pelo
critério de máxima verossimilhança, genes individuais também resultaram em árvores
diferentes. As seqüências do 16S rDNA e do COI resultaram na árvore 3, COII resultou
em uma das duas árvores obtidas por máxima parcimônia (árvore 10); e cyt b resultou na
árvore 12. O conjunto de dados combinado e o 12S rDNA resultaram na árvore 3.
Tabela 3. Teste de Razão de Verossimilhança para modelos de evolução de DNA,
admitindo heterogeneidade de taxa de substituição entre os sítios.
Modelos (Lo x L1)
-ln L0
-ln L1
g.l.
-2log∆
JC69 x F81
13691.966464
13515.320999
353.29093*
3
F81 x HKY85
13515.320999
13020.252849
990.1363*
1
HKY85 x TN93
13020.252849
13001.84553
36.814638*
1
TN x GTR
13001.84553
12943.558024
116.575012*
3
L0 – modelo mais simples; L1 –modelo mais complexo; -ln – logarítimo da
probabilidade da árvore; -2log∆ - diferença da probabilidade da árvore sob os
modelos analisados; g.l. – graus de liberdade; * - significante a 5%.
81
Cracidae e Megapodiidae são grupos-irmãos
As seqüências aqui utilizadas apresentaram taxa constante de substituição de
nucleotídeos (P = 0.86), e o relógio molecular foi incorporado nas análises de
verossimilhança. Desta forma, todas as árvores da figura 1 foram significativamente
diferentes da árvore 3 ao nível de 5% (tab. 4).
Tabela 4. Resultados do teste de Kishino-Hasegawa para todas as possíveis 15 árvores da
figura 1, sob o critério de máxima verossimilhança com relógio molecular.
Ärvore
-ln L
dif
d.p.(dif)
T
P
1 - (R(M(C(GA))))
10760.08264
32.48852
9.16802
3.5437
0.0004*
2 - (R(C(M(GA))))
10760.08264
32.48852
9.16803
3.5437
0.0004*
3 - (R(A(G(MC))))
10727.59412
ML
4 - (R(G(A(MC))))
10745.73892
18.14480
7.29957
2.4857
0.0130*
5 - (R(C(G(MA))))
10760.53000
32.93588
9.07861
3.6279
0.0003*
6 - (R(G(C(MA))))
10745.73892
18.14480
7.29957
2.4857
0.0130*
7 - (R(M(G(CA))))
10758.99785
31.40373
9.69611
3.2388
0.0012*
8 - (R(G(M(CA))))
10746.28353
18.68941
6.90338
2.7073
0.0068*
9 - (R(C(A(GM))))
10750.89306
23.29894
9.73239
2.3940
0.0167*
10 - (R(A(C(GM))))
10755.43182
27.83770
9.89845
2.8123
0.0049*
11- (R(M(A(GC))))
10760.08264
32.48852
9.16800
3.5437
0.0004*
12 - (R(A(M(GC))))
10760.08264
32.48852
9.16800
3.5437
0.0004*
13 - (R((AG)(CM))
10746.28353
18.68941
6.90338
2.7073
0.0068*
14 - (R((GC)(AM))
10750.89306
23.29894
9.73239
2.3940
0.0167*
15 - (R((AC)(GM))
10755.43182
27.83770
9.89845
2.8123
0.0049*
Letras indicam: R - Rhea, A - Aythya, G - Gallus, M - Megapodius, e C - o grupo restrito
Cracidae. ML - árvore mais verossímil; -ln L – logarítimo da probabilidade da árvore; dif–
diferença com a árvore mais provável; d.p. (dif) - desvio padrão da diferença; T resultados do teste t; P(*) - probabilidade de obter um valor de t mais extremo sob a
hipótese de igualdade entre as duas árvores a 5%.
Discussão
Nossas análises adicionam ao crescente corpo de evidências que filogenias de
ramos mais profundos são difíceis de serem resolvidas sem a utilização de seqüências de
um grande número de genes e sem a devida correção para variação de taxa entre os sítios
(Takezaki e Gojobori, 1999). Tanto as análises de parcimônia como de verossimilhança
mostraram que os cinco genes mitocondriais usados neste estudo resultaram em
topologias diferentes para os Anseriformes e os Galliformes quando analisados
separadamente. Se seqüências de um grande número de genes não estão disponíveis, as
conclusões sobre as relações filogenéticas entre os táxons podem ser errôneas. Por
exemplo, todos os genes analisados separadamente, exceto o 12S rDNA resultaram em
topologias ótimas onde os Galliformes não são um grupo monofilético.
82
Cracidae e Megapodiidae são grupos-irmãos
Nós concluímos que a árvore 3
(R(A(G(M,C)))) é a melhor estimativa das
relações filogenéticas entre estes táxons (Fig. 2) baseados em duas linhas de evidências.
Primeiro, combinar os genes aqui seqüenciados em um único conjunto de dados (Kluge,
1989; Hillis, 1987) é apropriado porque a molécula mitocondrial é herdada como um
alelo único, sem recombinação significante. Conjuntos de dados maiores geralmente
recuperam filogenias "conhecidas" melhor do que conjuntos menores (e.g. Cao et al.,
1994; Cummings et al., 1995; Russo et al., 1996), embora o nosso conjunto combinado e
o 12S rDNA resultaram na mesma topologia. Segundo, ambas as análises de máxima
parcimônia e de máxima verossimilhança com correção apropriada para variação de taxa
de substituição entre os sítios resultaram nessa mesma árvore ótima. As análises sugerem
fortemente que os Anseriformes são grupo-irmão dos Galliformes, o qual inclui os
megapodídeos e os cracídeos.
Se os Galliformes deveriam ser divididos em duas
unidades taxonômicas diferentes não está claro em nossas análises. Seqüências de outros
Galliformes representando diferentes famílias deveriam ser incluídas em outras análises
para testar se os Galliformes se dividem em duas linhagens, uma levando aos Cracidae e
Megapodiidae (os Craciformes de Sibley e Ahlquist, 1990), e outra levando aos demais
galliformes.
Outra vantagem de empregar o modelo GTR com heterogeneidade de substituição
de taxa entre os sítios é que os genes mitocondriais sob este modelo acumulam
substituições de maneira constante na árvore ótima, e os nós internos podem ser datados.
Admitindo que a divergência entre os Anseriformes e os Galliformes ocorreu há 112 Ma
(Kumar e Hedges, 1998), podemos estimar o tempo de divergência dos táxons de
Galliformes incluídos em nossa análise. A separação entre Gallus e (Cracidae,
Megapodiidae) foi datada em 86,7±3,2 Ma atrás. Megapodidae e Cracidae divergiram há
cerca de 75,5±3,2 Ma. A diversificação entre os gêneros de Cracidae iniciou ao redor de
30,9±1,6 Ma atrás. Estes resultados serão usados nos estudos filogenéticos das relações
entre os gêneros de Cracidae (Capítulo 4) uma vez que indicam Megapodius e Gallus
como grupos externos à Cracidae.
83
Cracidae e Megapodiidae são grupos-irmãos
Crax
Ortalis
Penelope
Megapodius
Gallus
Aythya
0.1
Rhea
Figura 2. Árvore mais verossímil (Árvore número 3 da fig. 1) admitindo que as seqüências
apresentam uma taxa constante de substituição e heterogeneidade de taxa de substituição
entre os sítios obtida com o modelo GTR. Os desenhos não estão em escala, e foram
modificados de del Hoyo et al., 1992, 1994, com permissão da Lynx Edicions, Barcelona.
Barra corresponde à proporção esperada de substituição nucleotídica
Referências
Cabot EL, Beckenbach AT (1989). Simultaneous editing of multiple nucleic acid and protein
sequences with ESEE. Comput. Appli. Biosci. 5: 233-234
Cao Y, Adachi J, Janke A, Pääbo S, Hasegawa M (1994). Phylogenetic relationships among
Eutherian orders estimated from inferred sequences of mitochondrial proteins: instability of
a tree based on a single gene. J. Mol. Evol. 39: 519-527.
84
Cracidae e Megapodiidae são grupos-irmãos
Caspers G-J, Weerd DU, Wattel J, de Jong WW (1997). α-crystallin sequences support a
Galliform/Anseriform clade. Mol. Phylogenet. Evol. 7: 185-188.
Cracraft J, Mindell DP (1989). The early history of modern birds: a comparison of molecular and
morphological evidence. In: "The Hierarchy of Life", B Fernholm, H Jornvall H (Eds).
Elsevier, Amsterdam. pp 389-403.
Cummings MP, Otto SP, Wakeley J (1995). Sampling properties of DNA sequence data in
phylogenetic analysis. Mol. Biol. Evol. 12: 814-822
Czelusniak J, Goodman M, Moncrief ND, Kehoe SM (1990). Maximum parsimony approach to
construction of evolutionary trees from aligned homologous sequences. Methods in
Enzimology 183: 601-615.
del Hoyo J, Elliott A, Sargatal J (Eds)(1992). "Handbook of the Birds of the World". Volume 1.
Ostrich to Ducks. Lynx Edicions, Barcelona.
del Hoyo J, Elliott A, Sargatal J (Eds)(1994). "Handbook of the Birds of the World". Volume 2.
New World Vultures to Guineafowl. Lynx Edicions, Barcelona.
Groth JG, Barrowclough GF (1999). Basal divergences in birds and the phylogenetic utility of
the nuclear RAG-1 gene. Mol. Phylogenet. Evol. 12: 115-123.
Harlid A, Arnason U (1999). Analyses of mitochondrial DNA nest ratite birds within the
Neognathae: supporting a neotenous origin of ratite morphological characters. Proc. R. Soc.
Lond. B266: 305-309.
Harlid A, Janke A, Arnason U (1998). The complete mitochondrial genome of Rhea americana
and early Avian divergences. J. Mol. Evol. 46: 669-679.
Hedges SB, Simmons MD, van Dijk Mam, Caspers G-J, de Jong WW, Sibley CG (1995).
Phylogenetic relationships of the hoatzin, an enigmatic South American bird. Proc. Natl.
Acad, Sci USA 92: 11662-11665.
Hillis DM (1987). Molecular versus morphological approaches to systematics. Ann. Rev. Ecol.
Syst. 18: 23-42.
Kluge AG (1989). A concern for evidence and a phylogenetic hypothesis of relationships among
Epicrates (Boidae, Seprentes). Syst. Zool. 38: 7-25.
Kumar S, Hedges B (1998). A molecular timescale for vertebrate evolution. Nature 392: 917920.
Laskowski M Jr, Fitch WM (1989). Evolution of avian ovomucoid in birds. In: "The Hierarchy
of Life", B Fernholm, H Jornvall H (Eds.). Elsevier, Amsterdam. pp 371-387.
85
Cracidae e Megapodiidae são grupos-irmãos
Mindell DP, Honeycutt RL (1989). Variability in transcribed regions of ribosomal DNA and
early divergence in birds. Auk 106: 539-548.
Mindell,D.P., Sorenson,M.S., Dimcheff DE, Hasegawa M, Ast JC, Yuri T (1999). Interordinal
relationships of birds and other reptiles based on whole mitochondrial genomes. Syst. Biol.
48: 138-152.
Olson SL, Feduccia A (1980). Presbyornis and the origin of the Anseriformes (Aves:
Charadriomorphae). Smithsonian Contrib. Zool. 323: 1-24
Prager EM, Wilson AC (1976). Congruency of phylogenies derived from different proteins. A
molecular analysis of the phylogenetic position of cracid birds. J. Mol. Evol. 9: 45-57.
Russo CAM, Takezaki N, Nei M (1996). Efficiencies of different genes and different treebuilding methods in recovering a known vertebrate phylogeny. Mol. Biol. Evol. 13: 525-536.
Sibley CG, Ahlquist JE, Monroe BL (1988). A classification of the living birds of the world
based on DNA-DNA hybridization studies. Auk 105: 409-423.
Sibley CG, Ahlquist JE (1990). "Phylogeny and Classification of Birds. A study in molecular
evolution". Yale University Press. New Haven.
Stapel SO, Leunissen JAM, Versteeg M, Wattel J, de Jong WW (1984). Ratite as oldest offshot
of avian stem – evidence from α-crystallin sequences. Nature 311: 257-259.
Strimmer K, von Haeseler A (1999). PUZZLE. Version 4.0.2. Ludwig-Maximilians-Universität.
München. Program distributed by the authors.
Swofford DL (1999). PAUP*, Phylogenetic Analysis using Parsimony (*and other Methods).
Version 4.0. Sinauer Associates. Sunderland, Massachusetts.
Takezaki N, Gojobori T (1999). Correct and incorrect vertebrate phylogenies obtained by the
entire mitochondrial DNA sequences. Mol. Biol. Evol. 16: 590-601.
Thompson JD, Higgins DG, Gibson TJ (1994). CLUSTALW: improving the sensitivity of
progressive alignment through sequence weighting, position-specific gap penalties and
weight matrix choice. Nucleic Acid. Res. 22: 4673-4680.
Yang Z (1999). Phylogenetic analysis by Maximum Likelihood (PAML). Version 2.0. University
of College London. Program distributed by the author.
86
Capítulo 4
Filogenia Molecular de
Cracidae (Aves)
87
Filogenia molecular de Cracidae
FILOGENIA MOLECULAR DE CRACIDAE (AVES)
Abstract
The Cracidae are one of the most endangered bird families in the Neotropics, yet
the higher relationships among taxa remain uncertain. Here the molecular phylogeny of
its eleven genera is inferred using 4,519 base pairs of mitochondrial genes (12S rRNA,
16S rRNA, COI, COII, COIII, and cyt b). Maximum parsimony and maximum likelihood
reconstructions yielded similar results. Our estimates show the separation of two groups:
one consisting of the guans and chachalacas (subfamily Penelopinae), and the other, the
curassow genera (Cracinae). Rate constancy of DNA substitution among taxa was not
rejected, and we dated the divergence time among the Cracidae genera, using as reference
the separation between the outgroup Megapodius and Cracidae as 75.5 Mya (million
years ago). Divergence time among the ancestors of the modern genera occurred in the
last 33 Mya. Geomorphological changes that occurred in South America, changes in the
sea level during the Miocene, glaciation in the Andes during the Pliocene, and the
diversification of angiosperm families in the last 15 Mya seems to be related to genera
divergence.
Resumo
A família Cracidae é uma das mais ameaçadas entre as aves da região Neotropical,
cujas relações taxonômicas ainda são incertas. Aqui, a filogenia molecular de seus onze
gêneros é inferida usando 4.519 pares de bases de genes mitocondriais (12S rRNA, 16S
rRNA, COI, COII, COIII, e cyt b). Reconstruções sob os critérios de máxima parcimônia
e máxima verossimilhança produziram resultados similares. Nossas estimativas mostram
a separação de dois grupos: um contendo os jacus e aracuãs (subfamília Penelopinae), e o
outro, os gêneros de mutuns (Cracinae). A hipótese de constância de taxa de substituição
de DNA não foi rejeitada e datamos o tempo de divergência entre os gêneros de Cracidae,
usando como referência a separação entre Megapodius e Cracidae há 75,5 milhões de
anos atrás. O início da diversificação entre os gêneros ocorreu nos últimos 33 milhões de
anos. Mudanças geomorfológicas que ocorreram na América do Sul, mudanças no nível
88
Filogenia molecular de Cracidae
do mar durante o Mioceno, glaciação nos Andes durante o Plioceno e a diversificação de
famílias de angiospermas nos últimos 15 milhões de anos podem estar relacionados com a
divergência dos gêneros de Cracidae.
Introdução
A família Cracidae é composta de aves não migratórias e arbóreas que se
alimentam basicamente de folhas e frutas e ocasionalmente de moluscos e insetos. A atual
distribuição desta família inclui as florestas tropicais e áreas de florestas secas do sul do
Texas ao norte da Argentina e Uruguai. Estas aves ocupam terras de elevada e baixa
altitude. Espécies congenéricas geralmente apresentam distribuição alopátrica, excluíndo
ou ocupando o nicho de outros congenéricos. Contudo, quando as espécies de cracídeos
ocorrem em simpatria, eles ocupam microhabitats diferentes dentro de uma área
geográfica maior (Sick, 1993).
Cerca de 50 espécies e mais do que 60 subespécies são atualmente designadas
entre os onze gêneros da família (del Hoyo et al., 1994; Nardelli, 1993). Os gêneros
podem ser divididos em três subgrupos morfológicos: jacus (Aburria, Chamaepetes,
Oreophasis, Penelope, Penelopina, e Pipile), aracuãs (Ortalis) e mutuns (Crax, Mitu,
Nothocrax, e Pauxi). Um grande número de espécies de cracídeos estão listados no Livro
Vermelho de Espécies Ameaçadas (Collar et al., 1992), fazendo com que esta família seja
uma das mais ameaçadas da região Neotropical. As relações entre estes táxons e o status
de várias espécies e subespécies questionáveis nunca foram estabelecidos com análises
filogenéticas rigorosas, embora Delacour e Amadon (1973) sugerem que os mutuns
tenham divergido dos demais cracídeos, e que os aracuãs eram mais proximamente
relacionados aos jacus. Logo após, novos gêneros foram propostos para os mutuns (Crax
foi subdividido em Crax, Mitu, e Pauxi) e os jacus (Aburria dividido em Aburria e
Pipile). Sibley e Ahlquist (1990) examinaram cinco dos onze gêneros de Cracidae em
seus estudos de filogenia baseados em dados de hibridação DNA-DNA, e sugeriram que
Crax e Ortalis eram grupo-irmão dos jacus, e Chamaepetes era grupo-irmão do clado
contendo Penelope e Pipile.
89
Filogenia molecular de Cracidae
Incertezas similares ocorrem também na biogeografia dos cracídeos. Baseados na
atual distribuição das espécies, Darlington (1957) propôs que eles já estavam presentes na
América do Sul antes da formação da América Central ligando-a à América do Norte, e
que eles sofreram eventos múltiplos de dispersão e diferenciação. Alternativamente,
Delacour e Amadon (1973) sugeriram que eles se originaram na Amércia do Norte ou
Central, e sua diversificação aumentou quando eles invadiram a América do Sul.
Para esclarecer a sistemática dos cracídeos e testar hipóteses biogeográficas
alternativas, reconstruímos a filogenia molecular dos 11 gêneros de Cracidae baseados em
seqüências de DNA mitocondrial. Também utilizamos um relógio molecular para estimar
a data aproximada de divergência entre os gêneros, e procuramos correlacionar a
diversificação dos cracídeos com eventos da história da terra que poderiam ter
fragmentado a distribuição das espécies ou promovido a diversificação de nicho (veja por
exemplo, Arnaiz-Villena et al., 1999; Knowlton & Weigt, 1998; van Tuinen et al., 1998).
Material e Métodos
Táxons amostrados
Um representante de cada um dos 11 gêneros da família Cracidae foi utilizado
para as análises filogenéticas. Resultados de estudos anteriores usando diferentes
combinações de um a quatro grupos externos (Anas, Cairina, Gallus, Megapodius, Rhea
e Sthruthio) mostraram que independentemente da combinação de grupos externos as
relações intergenéricas dos Cracidae se mantiveram as mesmas. Portanto, neste estudo
apenas o megapodídeos Megapodius reinwardt foi usado como um grupo externo para
enraizar a árvore baseado em sua maior proximidade aos cracídeos (Capítulo 3). Uma
lista dos táxons estudados e a atual distribuição dos gêneros é apresentada na tabela 1.
Extração, amplificação e seqüenciamento de DNA
DNA genômico foi extraído de amostras de sangue de acordo o método descrito
em detalhes por Bruford et al. (1992). As seqüências de cada um dos seis genes
mitocondriais foram amplificados por PCR em 25,0 ul de reação de acordo com
Hagelberg (1994), usando 30 ciclos de 95oC por 30 segundos, 47oC por 30 segundos e
90
Filogenia molecular de Cracidae
72oC por 30 segundos. Os oligonucleotídeos iniciadores ("primers") usados na
amplificação possuem uma cauda do M13 de modo que os produtos podem ser
seqüenciados com os dois primers universais do M13 (Tab. 2). Os produtos de PCR
foram separados em gel de agarose 1% em tampão TA 1x.
Tabela 1. Espécies usadas neste trabalho e a atual distribuição dos gêneros de Cracidae que elas representam.
Grupo
Espécie
Distribuição do gênero*
Jacus
Aburria aburri
Andes colombianos, Equador, Peru ,Venezuela
Chamaepetes goudotti Florestas de montanhas da América Central, Colômbia, Peru
Oreophasis derbianus Florestas de montanhas do México e da Guatemala
Penelope obscura
Florestas de montanhas e baixa altitude das Américas Central e
do Sul, México
Penelopina nigra
Florestas úmidas de montanhas da América Central, México
Pipile jacutinga
Florestas de baixa altitude da América do Sul
Aracuãs
Ortalis cannicolis
Áreas secas das Américas do Sul, Central e do Norte
Mutuns
Crax blumenbachii
Florestas de montanhas das Américas do Sul e Central, savanas
sulamericanas
Mitu tuberosa
Floresta tropical no norte da América do Sul
Nothocrax urumutum
Alto e Médio Rio Amazonas
Pauxi pauxi
Florestas de altitude elevada da Bolívia, Colômbia, Peru,
Venezuela
Megapodiidae Megapodius reinwardt Áreas arbustivas e florestas tropicais da Austrália
Número de acesso no GenBank: 12SrDNA: AF165441-AF165452; 16SrDNA: AF165453-AF165464; COI:
AF165489-AF165500; COII: AF165501-AF165512; COIII: AF165477-AF165488; cyt b: AF165465AF165476. * - Distribuição do gêneros baseada em Delacour e Amadon, 1973 e Nardelli 1993.
As reações de seqüenciamento foram realizadas usando o "kit" de seqüenciamento
"Thermosequenase DYEnamic direct cycle sequencing" (Amersham), e marcadas
fluorescentemente com os primers universais M13 (LI-COR). As seqüências foram
carregadas no seqüenciador automático bidirecional LI-COR 4200 usando o protocolo
sugerido pelo fabricante. As seqüências foram montadas no programa ESEE (Cabot &
Beckenbach, 1989). Os alinhamentos foram realizados no ClustalW (Thompson et al.,
1994), e verificados visualmente para correção de eventual alinhamento espúrio usando o
ESEE. A autenticidade das seqüências foram averiguadas pelo algoritmo BLAST do
GenBank. As seqüências gênicas obtidas foram do 12S rDNA (649 nucleotídeos (nt)),
16S rDNA (946 nt), subunidades I, II, e III da citocromo c oxidase, COI (1088 nt), COII
(684 nt), COIII (484 nt), e citocromo b (1002 nt). As terceiras posições dos codons para o
cyt b foram excluídas da análise por se encontrarem saturadas entre os Cracídeos e o
91
Filogenia molecular de Cracidae
grupo externo, resultando em 668 nt analisados para este gene. Todas as seqüências
produzidas neste trabalho foram depositadas no GenBank (Tab. 1).
Tabela 2. Primers usados para a amplificação (5’ → 3’). A posição se refere ao genoma mitocondrial
de Gallus gallus (número de acesso no GenBank X52392, Desjardins e Moraes, 1990). Os primers
foram desenhados por O. Haddrath, do Royal Ontario Museum, Canadá.
Gene
Primer
Posição
Seqüência
12SrRNA
L1537
1534-1555
AAT CTT GTG CCA GCC ACC GCG G
12SEND
2241-2263
GTG CAC CTT CCG GTA CAC TTA CC
16SrRNA
16SAR
2699-2726
AAG CCW ANC GAG CYG GGT GAT AGC TGG
16SBR
3811-3831
CAT AGA TAG AAA CCG ACC TGG
COI
COIA
6675-6695
AAC YAA CCA CAA AGA CAT TGG
H8205
8184-8205
GGG GTT CGA TTC CTT CCT TTC TTG
COII
L8184
8184-8205
CAA GAA AGG AAG GAA TCG AAC C
LYSH
9041-9058
TCT CTA GCT TAA AAG GCT
COIII
A5REVTF
9914-9936
AAA YAT YTA ATG GCA CAC CAA GC
GLYHTR
10707-10729
GTA ATN ANT ATA CTA GAA GAG C
Cyt b
B1
14965-14990
CCA TCC AAC ATC TCA GGA TGA TGA AA
B6
16065-16089
GTC TTC AGT TTT GGT TTA CAA GAC
Análises filogenéticas
Análises de máxima parcimônia foram realizadas no PAUP* 4.0 (Swofford,
1999). Realizamos uma busca exaustiva assumindo pesos para as transversões de acordo
com razão de transição/transversão estimada para cada gene. Índices de decaimento
(Bremer, 1988) foram obtidos usando AutoDecay 4.0 (Eriksson, 1998) para estimar o
número de passos extras necessários para perder uma associação específica de táxons.
Para assegurar que o modelo mais apropriado de evolução de DNA foi usado na
análise de máxima verossimilhança, usamos o programa MODELTEST 2.0 (Posada e
Crandall, 1998) para obter a verossimilhança perante 40 modelos de evolução,
incorporando parâmetros como frequência de bases, taxas de transição entre purinas e
entre pirimidinas, taxas de transversão, proporção de sítios invariáveis, e variação de taxa
de substituição entre sítios. A variação de taxas de substituição entre os sítios foi
considerada de três maneiras diferentes: (1) uma proporção de sítios foi considerado
invariáveis, I, e assumiu-se que os sítios variáveis evoluem a uma mesma taxa; (2) todos
os sítios evoluem de acordo com uma distribuição gama discreta, Γ; e (3) o mesmo que
em (1) mas os sítios variáveis evoluem de acordo com Γ. A análise de máxima
verossimilhança foi realizada no PAUP* usando o melhor modelo escolhido pelo teste de
92
Filogenia molecular de Cracidae
razão de verossimilhança (LRTs), que penaliza modelos com parâmetros extras
desnecessários (Posada & Crandall, 1998).
As diferenças entre as árvores mais parcimoniosa e mais verossímil foram
avaliadas de acordo com os testes de Kishino-Hasegawa (K-H)(Kishino e Hasegawa,
1989) implementado no PAUP*.
A hipótese do relógio molecular entre os cracídeos não foi rejeitada ao nível de
sugnificância de 5% (Z=0,38) de acordo com os resultados obtidos no PHYLTEST 2.0
(Kumar, 1996). Um estudo prévio mostrou taxa constante de substituição entre os
cracídeos, e o tempo de divergência entre Megapodius e Cracidae foi datado há 75,5 Ma
(milhões de anos)(Capítulo 3). Usamos esta estimativa como calibração para o relógio
molecular (Zuckerkandl & Pauling, 1962, 1965) entre os gêneros de Cracidae e o grupo
externo. Os tempos de divergência foram estimados de acordo com:
t=
la × T
lMegapodius − Cracidae
,
onde t é o tempo de divergência a ser estimado, la é o comprimento dos ramos levando
aos táxons terminais ou a um nó interno, T é o tempo de calibração, e lMegapodius-Cracidae é o
comprimento dos ramos entre Megapodius e Cracidae.
Resultados
Um total de 4.519 nucleotídeos foram seqüenciados para seis genes e usados para
a reconstrução filogenética, representando 28,9% do genoma mitocondrial de aves
(baseado em Gallus gallus). Destes sítios, 24,5% eram variáveis e 11,6% eram
parcimoniosamente informativos. A razão transição/transversão estimada a partir dos
dados combinados de todos os genes foi de 8,9. A composição de bases é estacionária
entre os táxons, e a frequência de bases para A, C, G e T estimada dos dados foi de
28,4%, 29,9%, 17,3%, 24,4% respectivamente, similar à de outras espécies de
vertebrados. A divergência média não corrigida das seqüências foi de 11,1% entre os
Cracidae e 31,3% entre Cracidae-Megapodius.
A árvore obtida sob busca exaustiva (Fig. 1) apresentou 6.159 passos. Oreophasis
é basal na árvore e parece ser grupo-irmão dos outros jacus e dos mutuns, indicando que
93
Filogenia molecular de Cracidae
os jacus são parafiléticos. Os mutuns e os demais cinco gêneros de jacus são grupos
monofiléticos. Estes clados têm alto suporte como indicam os índices de Bremer. Os
aracuãs representados aqui por Ortalis parecem ser basais aos mutuns, mas esta relação
apresentou índice de decaimento relativamente baixo (12). Entre os jacus, Aburria e
Pipile são mais relacionados entre si e têm Penelope como grupo-irmão, seguido por
Chamaepetes e Penelopina. Entre os mutuns, Pauxi é grupo-irmão de (Crax, Nothocrax)
e Mitu é o mais basal deles. Os índices de decaimento obtidos para as divergências entre
os mutuns são relativamente baixos.
Aburria
100/100
95
100/97
Pipile
52
60/64
Penelope
10
100/100
Chamaepetes
111
Penelopina
Crax
0/61
19
100/100
74/67
Nothocrax
23
9
100/100
Pauxi
142
100/100
0/0
12
Mitu
Ortalis
Oreophasis
Megapodius
Figura 1. Reconstrução filogenética da família Cracidae estimada por máxima parcimônia
usando busca exaustiva. Números acima dos ramos são valores de bootstrap sem e com pesos
para TS eTV; números abaixo dos ramos são índices de decaimento. As aves não estão em
escala, e foram modificadas do original de Hoyo et al., 1994, com permissão da Lynx Edicions,
Barcelona.
94
Filogenia molecular de Cracidae
Aburria
Pipile
Penelope
Chamaepetes
Penelopina
Ortalis
Oreophasis
Crax
Nothocrax
Pauxi
Mitu
0.1
Megapodius
Figura 2. Reconstrução filogenética dos gêneros de Cracidae, usando seis genes
mitocondriais. A Árvore de máxima verossimilhança foi obtida no PAUP* usando o
modelo GTR+Ι+Γ. Grupo externo: Megapodius. A barra corresponde a unidades de
comprimento de ramo. As aves não estão em escala, e foram modificadas do original
de Hoyo et al., 1994, com permissão da Lynx Edicions, Barcelona.
Testes de razão de verossimilhança (LRT) mostraram que o melhor modelo para
nossas seqüências foi o modelo de reversão geral ao longo do tempo (GTR), assumindo
uma proporção de sítios invariáveis (I) e heterogeneidade de taxa de substituição entre os
sítios variáveis (Γ) (P<0.000001). A figura 2 mostra as relações entre os Cracidae de
acordo com o obtido nas análises de máxima verossimilhança sob o modelo GTR+I+Γ,
assumindo que as seqüências acumulam substituições de acordo com um relógio
evolutivo. Como na árvore de máxima parcimônia, os mutuns formam um grupo
95
Filogenia molecular de Cracidae
monofilético distinto, mas na árvore de máxima verossimilhança eles são grupo-irmão
dos jacus e dos aracuãs (Ortalis). Os jacus parecem ser novamente parafiléticos. Uma
grande diferença entre estas duas árvores envolve a posição de Oreophasis. As relações
entre os gêneros de mutuns e entre os gêneros de jacus (excluindo Oreophasis) são as
mesmas em ambas as árvores.
Baseados em calibrações prévias que dataram a divergência Megapodius-Cracidae
em aproximadamente 75 Ma atrás, a diversificação dos gêneros de mutuns dos demais
táxons deve ter ocorrido há 33Ma. Jacus e aracuãs se diversificaram entre 21 e 3 Ma atrás,
e os gêneros de mutuns ao redor de 8 a 6 Ma atrás.
Discussão
Reconstrução filogenética de Cracidae
Os genes usados no presente estudo correspondem a diferentes porções da
molécula de DNA mitocondrial, representando uma boa amostragem deste genoma.
Conjuntos de dados maiores tendem a fornecer estimativas mais fiéis quando comparados
com conjuntos de dados menores como por exemplo a obtida por um único gene (Cao et
al., 1994; Cummings et al., 1995; Russo et al., 1996).
Os resultados do teste de K-H mostraram que a árvore mais curta obtida pela
busca exaustiva é a melhor, embora não seja significativamente diferente da árvore de
máxima
verossimilhança
(Tab.
3).
Contudo,
consideramos
nossa
árvore
de
verossimilhança a melhor estimativa das relações entre os Cracidae por diversas razões:
(1) o método de verossimilhança é menos susceptível do que a parcimônia as
conseqüências das violações das premissas do modelo evolutivo; (2) os índices de
decaimento para a linhagem levando a Ortalis é baixo na análise de parcimônia; (3) a
análise de verossimilhança mostrou que a divisão inicial entre os Cracidae separa os
mutuns em um clado e os jacus e aracuãs em outros. Isto está de acordo com Delacour &
Amadon (1973)(Fig. 3), que distinguiram estes dois grupos como as subfamílias Cracinae
e Penelopinae. O primeiro clado é formado pelos cracídeos maiores e mais pesados; o
último, pelos pequenos e esguios aracuãs e pelos jacus de tamanhos médio a grandes
(Delacour & Amadon, 1973); (4) Oreophasis pertence à subfamília Penelopinae, é esta
96
Filogenia molecular de Cracidae
proximamente relacionado aos jacus em morfologia corporal, e vivem em florestas de
elevada altitude, como os outros jacus. Esta subfamília não se comporta como um grupo
monofilético na análise de parcimônia; (5) e as seqüências parecem evoluir de maneira a
aceitar um relógio molecular, então os comprimentos dos ramos podem ser usados para
estimar o tempo de divergência entre os táxons analisados.
Tabela 3. Resultados dos testes de Kishino-Hasegawa para comparação entre as árvores
de máxima parcimônia (MP) e máxima verossimilhança (ML) de nossas estimativas das
relações filogenéticas entre os Cracidae.
MP
ML
Comprimento
6159
6210
Diferença do comprimento
(melhor)
51
s.d.
t
P
37.639
1.35
0.17
-ln L
Diferença –ln L
s.d.
T
P*
34387.49346
(melhor)
34391.42058
3.92712
5.14556
0.7632
0.4454
-ln L: logaritmo da árvore; s.d. desvio padrão; t - resultados do teste t ; P - probabilidade
de obter um valor de t mais extremo sob a hipótese de igualdade entre as duas árvores a
5%
MP
ML
Nossas estimativas das relações entre os jacus e aracuãs obtidas por
verossimilhança são similares as de Delacour e Amadon (1973)(Fig. 3), exceto que
Penelope se comportou como clado-irmão a Aburria e Pipile em nossas análises, ao invés
de Penelopina como grupo-irmão de (Aburria, Chamaepetes). Embora Sibley & Ahlquist
(1990) usaram apenas cinco dos 11 gêneros de Cracidae, nossas estimativas são muito
semelhantes as deles: Crax e Ortalis são grupo-irmão do clado (Chamaepetes, (Penelope,
Pipile)).
Tempo de divergência entre os gêneros de Cracidae
Os resultados do presente estudo são compatíveis com a diversificação dos
gêneros modernos de Cracidae ocorrendo nos últimos 33 Ma (Tab. 4), com a separação
das subfamílias Cracinae e Penelopinae, 42 milhões de anos após a família ter aparecido
no cenário evolutivo das Aves. Um padrão semelhante de longa lacuna evolutiva entre a
origem de uma linhagem e a divergência de seus gêneros modernos também foi observada
em psitacídeos Neotropical (Miyaki et al., 1998) e beija-flores (Bleiweiss, 1998a, 1998b),
mas não em tucanos e aves relacionadas (Nahum et al., submetido). A maioria dos
97
Filogenia molecular de Cracidae
gêneros de cracídeos vivem em florestas montanhosas e de alta altitude (Delacour &
Amadon, 1973). A formação da Cordilheira dos Andes na América do Sul durante o
Terciário (Clapperton, 1993, Salgado-Labouriau, 1994) pode ter influenciado a
diversificação dos gêneros de Cracidae.
Aburria
Chamaepetes
Penelopina
Penelope
Ortalis
Oreophasis
Nothocrax
Crax
Figura 3. Relações entre Cracidae, como descrito por Delacour e Amadon
(1973). Note que para estes autores, Aburria incluia Aburria e Pipile, e
Crax incluia Crax, Mitu e Pauxi.
A primeira divergência entre os Cracidae levou ao gênero moderno Oreophasis,
uma ave que vive em altas altitudes, foi datada há cerca de 21,5 Ma. O clado levando a
98
Filogenia molecular de Cracidae
Ortalis, o único gênero de cracídeos ocorrendo em áreas mais secas, foi o próximo a
divergir, 20,7 Ma atrás. Regressões e transgressões marinhas durante o Oligocene, junto
com o levantamento dos Andes mudaram as bacias dos rios e o clima do continente (Petri
e Fúlfaro, 1988; Salgado-Labouriau, 1994), provavelmente resultando na formação das
florestas de altitude e florestas de áreas secas. A diversificação daqueles clados pode ter
sido influenciado por estes eventos.
No Mioceno Médio, há cerca de 13 Ma, o ancestral do gênero Penelopina se
separou da linhagem dos demais jacus e atualmente é encontrada na Cordilheira dos
Andes. No limite entre o Mioceno Médio e Superior, o clado levando a Chamaepetes
surgiu há 11,6 Ma. Estas datas são coincidentes com o soerguimento de cadeias
montanhosas ao longo da costas oeste das Américas do Norte e do Sul, assim como o
aparecimento das ilhas que levariam à formação da América Central, e o surgimento de
novas famílias de angiospermas (Brown e Lomolino, 1998; Salgado-Labouriau, 1994). Os
Cracidae se alimentam basicamente de frutas e folhas, e a diversificação das
angiospermas poderia ter sido relevante para a diversificação destas aves.
Novos indícios de diversificação de famílias de angiospermas existem para
Mioceno Superior. A floresta Atlântica ao longo da costa leste da América do Sul tornouse isolada da Floresta Amazônica com a aridificação da região central da América do
Sul, resultando na formação da savana (cerrado) brasileira (Petri e Fúlfaro, 1988). Este
cenário parece ser plausível para a diversificação dos gêneros de mutuns: Mitu há 8,3 Ma,
Pauxi há 7,1 Ma, e Crax e Nothocrax há 6,6 Ma, aproximadamente. Estes gêneros
poderiam ter se tornado isolados em diferentes ecossistemas durante este período.
Regressões marinhas também são bem caracterizadas em sedimentos do Mioceno
Superior no norte e sul do Brasil (Petri e Fúlfaro, 1988) e podem ter sido responsáveis por
mudanças de habitat e de clima, influenciando assim a diversificação dos mutuns.
Datamos as divergências mais recentes entre os Cracidae para os ancestrais de
Aburria, um gênero monoespecífico dos Andes, e Pipile, um gênero de baixa altitude, há
cerca de 3,0 Ma, no Plioceno. Intensas atividades vulcânicas e glaciações que ocorreram
nos Andes no final do Pliocene e no Pleistocene (Clapperton, 1993) poderiam ter
influenciado os ancestrais de Pipile a abandonar as terras de altitude elevada hoje
99
Filogenia molecular de Cracidae
ocupadas por Aburria e colonizar as terras de baixa altitude na América do Sul em busca
de hábitats mais favoráveis.
Tabela 4. Estimativas do tempo de divergência em milhões de anos (±desvio padrão) de cada linhagem
levando aos modernos gêneros de Cracidae.
Clado levando ao gênero moderno
Tempo Geológico Eventos supostamente relacionados à
Data±s,d,
diversificação
Mutuns x jacus
Oligoceno
Elevação dos Andes e mudanças nas
33,65±3,63
Inferior
bacias dos rios e no clima;
transgressão marinha
Oreophasis x Ortalis e outros jacus 21,55±2,95
Mioceno Inferior
Elevação dos Andes e mudanças nas
bacias dos rios e no clima;
transgressão marinha
Ortalis x (Penelopina,
Mioceno Inferior
Elevação dos Andes e mudanças nas
20,74±2,42
(Chamaepetes, (Penelope,
bacias dos rios e no clima;
(Aburria, Pipile))))
transgressão marinha
Mioceno Médio
Novas famílias de angiospermas;
Penelopina x (Chamaepetes,
13,09±1,84
soerguimento do oeste das Américas
(Penelope, (Aburria, Pipile)))
do Norte e do Sul, início da formação
da Amércia Central
Mioceno
Novas famílias de angiospermas;
Chamaepetes x (Penelope,
11,67±1,32
Médio/Superior
soerguimento do oeste das Américas
(Aburria, Pipile))
do Norte e do Sul, início da formação
da Amércia Central
Mitu x outros mutuns
Mioceno Superior Diversificação de novas famílias de
8,38±0,97
angiospermas; isolamento da floresta
Atlântica e aridificação da região
central da América do Sul;
transgressões marinhas
Penelope x (Aburria, Pipile)
Mioceno Superior Diversificação de novas famílias de
7,58±0,82
angiospermas; isolamento da floresta
Atlântica e aridificação da região
central da América do Sul;
transgressões marinhas
Pauxi x (Crax, Nothocrax)
Mioceno Superior Diversificação de novas famílias de
7,10±0,53
angiospermas; isolamento da floresta
Atlântica e aridificação da região
central da América do Sul;
transgressões marinhas
Crax x Nothocrax
Mioceno Superior Diversificação de novas famílias de
6,60±0,27
angiospermas; isolamento da floresta
Atlântica e aridificação da região
central da América do Sul;
transgressões marinhas
Aburria x Pipile
Plioceno
Intensas atividades vulcânicas e
3,04±0,34
glaciação nos Andes
100
Filogenia molecular de Cracidae
Origem da família Cracidae
Nossos dados são compatíveis com ambas as propostas teóricas de origem dos
Cracidae, formulada por Darlington (1957) e por Delacour & Amadon (1973), Para
compreender a origem da família Cracidae, um estudo biogeográfico-filogenético
incluindo outros Galliformes atuais deve ser feito, Mais estudos filogenéticos de mutuns e
aracuãs podem auxiliar a compreender a origem e evolução dos Cracinae e dos
Penelopinae,
Referências
Arnaiz-Villena A, Álvarez-Tejado M, Ruíz-del-Valle V, García-de-la-Torre C, Varela P, Recio
MJ, Ferre S, Martinez-Laso J (1999), Rapid radiation of Canaries (genus Serinus), Mol,
Biol, Evol, 16: 2-11,
Bleiweiss R (1998a), Origin of hummingbird faunas, Biological Journal of the Linnean Society
65: 77-97,
Bleiweiss R (1998b), Tempo and mode of hummingbird evolution, Biological Journal of the
Linnean Society 65: 63-76,
Bremer K (1988), The limits of aminoacid sequence data in angiosperm phylogenetic
reconstruction, Evolution 42: 795-803,
Brown JH, Lomolino MV (1998), “Biogeography,” 2nd Edition, Sinauer Associates,
Massachusetts,
Bruford MW, Hanotte O, Brookfield JFY, Burke T (1992), Single-locus and multilocus DNA
fingerprinting, In: “Molecular Genetic Analysis Of Populations - A Practical Approach,”
AR Hoelzel (Ed,), Oxford University Press, New York, pp, 225-269,
Cabot EL, Beckenbach AT (1989), Simultaneous editing of multiple nucleic acid and protein
sequences with ESEE, Comput, Appli, Biosci, 5: 233-234
Cao Y, Adachi J, Janke A, Pääbo S, Hasegawa M (1994), Phylogenetic relationships among
eutherian orders estimated from inferred sequences of mitochondrial proteins: instability of
a tree based on a single gene, J, Mol, Evol, 39: 519-527,
Clapperton C, (1993), “Quaternary Geology and Geomorphology of South America”, Elsevier,
Amsterdam,
101
Filogenia molecular de Cracidae
Collar NJ, Gonzaga LP, Krabbe N, Madroño Nieto A, Naranjo LG, Parker III TA, Wege DC
(1992), “Threatened birds of the Americas, The ICBP/IUCN Red Data Book,” Third Edition,
part 2, Smithsonian Institution Press, Washington,
Cummings MP, Otto SP, Wakeley J (1995), Sampling properties of DNA sequence data in
phylogenetic analysis, Mol, Biol, Evol, 12: 814-822,
Darlington PJ, Jr (1957) “Zoogeography: The Geographical Distribution of Animals,” John
Wiley & Sons, Inc, New York,
Delacour J, Amadon D (1973), “Curassows and Related Birds,” The American Museum of
Natural History, New York, NY,
del Hoyo J, Elliott A, Sargatal J (eds)(1994), “Handbook of the Birds of the World,” Volume 2,
New World Vultures to Guineafowl, Lynx Edicions, Barcelona,
Desjardins P, Morais R (1990), Sequence and gene organization of the chicken mitochondrial
genome, A novel gene order in higher vertebrates, J, Mol, Biol, 212: 599-634,
Eriksson T (1998) AutoDecay, Version 4,0, (Program distributed by the author) Department of
Botany, Stockolm University, Stockolm, Sweeden,
Hagelberg E (1994), Mitochondrial DNA from ancient bones, In: “Ancient DNA,” B Herrmann, S
Hummel (Eds), Springer-Verlag, pp, 195-204,
Kishino H, Hasegawa M (1989), Evaluation of the maximum likelihood estimate of the
evolutionary tree topologies from DNA sequence data, and the branching order in
Hominoidea, J, Mol, Evol, 29: 170-179,
Knowlton N, Weigt LA (1998), New dates and new rates for divergence across the Isthmus of
Panama, Proc, R, Soc, Lond B265: 2257-2263,
Kumar S (1996), “PHYLTEST: a program for testing phylogenetic hypothesis,” Version 2,0,
Institute of Molecular Evolutionary Genetics and Department of Biology, The Pennsylvania
State University, University Park, Pennsylvania, USA,
Miyaki CY, Matioli SR, Burke T, Wajntal A (1998), Parrot evolution and paleogeographical
events: mitochondrial DNA evidence, Mol, Biol, Evol, 15: 544-551,
Nahum LA, Pereira SL, Fernandes-Matioli FMC, Matioli SR, Wajntal A (submitted), Molecular
phylogeny and evolution of the Ramphastidae (aves) based on cytochrome b mitochondrial
sequences,
Nardelli PM (1993), “A preservação do mutum de alagoas,” Semana Ilustrada Editorial Ltda,
Queimados, Rio de Janeiro,
102
Filogenia molecular de Cracidae
Petri S, Fúlvaro VJ (1983), “Geologia do Brasil,” Editora da Universidade de São Paulo, São
Paulo,
Posada D, Crandall KA (1998), MODELTEST: testing the model of DNA substitution,
Bioinformatics 14: 817-818,
Russo CAM, Takezaki N, Nei M (1996), Efficiencies of different genes and different treebuilding methods in recovering a known vertebrate phylogeny, Mol, Biol, Evol, 13: 525-536,
Salgado-Labouriau, M, L, (1994), “Historia ecológica da Terra,” Editora Edgard Blücher Ltda,
Sao Paulo,
Sibley CG, Ahlquist JE (1990), “Phylogeny and classification of birds, A study in molecular
evolution,” Yale University Press,
Sick H (1993), “Birds in Brazil, A natural hystory,” Princeton University Press, New Jersey
Swofford DL (1999), “PAUP*, Phylogenetic Analysis Using Parsimony (* and Other Methods),”
Version 4,0, Sinauer Associates, Massachusetts,
Thompson JD, Higgins DG, Gibson TJ (1994), CLUSTALW: improving the sensitivity of
progressive alignment through sequence weighting, position-specific gap penalties and
weight matrix choice, Nucleic Acids Res, 22: 4673-4680,
van Tuinen M, Sibley CG, Hedges SB (1998), Phylogeny and biogeography of ratite birds
inferred from DNA sequences of the mitochondrial ribossomal genes, Mol, Biol, Evol, 15:
370-376,
Zuckerkandl E, Pauling L (1962), Molecular diseases, evolution and genic heterogeneity, In:
“Horizons in Biochemistry,” M Kasha, B Pullman (Eds), Academic Press, New York, pp
189-255,
Zuckerkandl E, Pauling L (1965), Evolutionary divergence and convergence in proteins, In:
“Evolving genes and proteins,” V Bryson, HJ Vogel (Eds), Academic Press, New York, pp,
97-166,
103
Capítulo 5
Domínio I da Região
Controladora do DNA mitocondrial e a
Inferência Filogenética entre os
Gêneros de Cracidae (Aves)
104
Utilização da CR-I em filogenia de Cracidae
O DOMÍNIO I DA REGIÃO CONTROLADORA DO DNA MITOCONDRIAL E A
INFERÊNCIA FILOGENÉTICA ENTRE OS GÊNEROS DE CRACIDAE (AVES)
Abstract
The mitochondrial control region (D-loop) is thought to be one of the fastest
evolving regions of the mitochondrial genome; thus, it is suitable for population and
species studies. The region is conventionally not used for phylogenetic inference above
the species level due to phylogenetic noise mediated by multiple substitutions at single
sites. However, recent evidence suggests that the conserved regions of the control region
are phylogenetically informative above the species level (Kimbal et al., 1999; Zink et al.,
1998). Therefore, we sequenced the first domain of the mitochondrial control region (CRI) from individuals representing the eleven genera that comprise the family Cracidae
(Aves). Our results demonstrate that the CR-I sequences evolve at a rate of 2.3×10-9
substitutions per site per year, which is similar to that of cracid COI and cyt b sequences,
and they are not saturated with multiple DNA substitutions and that they have sufficient
phylogenetic signal to infer relationships among cracid genera when an appropriate model
of DNA evolution is applied to the analyses. The tree obtained with the CR-I sequences is
similar to that estimated by other six mitochondrial genes. CR-I sequences should be
examined in other vertebrate phylogenetic studies to evaluate the usefulness of the region
for tree reconstruction, especially for tree estimates based on combined mitochondrial
genes.
Resumo
Acredita-se que a região controladora do DNA mitocondrial (D-loop) seja uma
das regiões com maior taxa de substituição de nucleotídeos, e por este motivo ela é
amplamente utilizada em estudos de populações. Contudo seu uso em inferências
filogenéticas acima da categoria de espécies é restrito devido ao ruído filogenético
produzido por substituições múltiplas. Neste trabalho, seqüenciamos o primeiro domínio
da região controladora de um representante de cada um dos onze gêneros que compõem a
família Cracidae (Aves). Nossos resultados mostraram que as sequências da CR-I
105
Utilização da CR-I em filogenia de Cracidae
apresentam taxa de evolução de 2,3×10-9 substitutições por sítio por ano, similar ao
encontrado para as sequências do COI e cyt b de cracídeos. Estas sequências de DNA não
se apresentam saturadas de substituições e têm sinal filogenético suficiente para inferir as
relações entre os gêneros de cracídeos quando um modelo apropriado de evolução de
DNA é empregado na análise. A inferência filogenética obtida a partir das sequências de
CR-I é similar à obtida com outros seis genes mitocondriais analisados conjuntamente. As
sequências do CR-I deveriam ser examinadas em outros estudos com vertebrados para
avaliar a utilidade desta região em reconstrução filogenética, especialmente no caso de
reconstruções baseadas em combinação de dados de sequências mitocondriais.
Introdução
Sequências do DNA mitocondrial (mtDNA) têm sido amplamente empregadas em
reconstrução filogenética (e.g., Kocher et al., 1989; Zink et al., 1998) e filogeografia
populacional (e.g., Avise et al., 1987; Baker e Marshall, 1997, Eizirik et al., 1998;
Lucchini e Randi, 1998). A escolha do(s) gene(s) a ser(em) usado(s) baseia-se em sua(s)
taxa(s) de evolução. Sabe-se que diferentes genes mitocondriais evoluem com taxas
próprias. Genes de evolução lenta são úteis para estudos envolvendo níveis taxônomicos
superiores, ao passo que genes de evolução mais rápida são amplamente empregados em
níveis taxonômicos inferiores, como populações e espécies proximamente relacionadas.
A região controladora do DNA mitocondrial, também conhecida como D-loop
("displacement loop"), apresenta uma das taxas de evolução mais rápidas entre as
sequências do DNA mitocondrial, e por isso é amplamente usado em estudos de evolução
e diferenciação populacional. Contudo, seu uso em reconstrução filogenética acima da
categoria de espécies não é amplamente empregado devido à crença de que o sinal
filogenético para níveis taxonômicos acima de espécies esteja suprimido pelo ruído
causado por substituições múltiplas.
O D-loop apresenta um domínio central flanqueado por dois domínios
hipervariáveis.
Estes
domínios
hipervariáveis
apresentam
heterogeneidade
de
comprimento devido principalmente à variação no número de repetições em tandem, e
heterogeneidade de composição de bases (Baker e Marshall, 1997; Fumagalli et al., 1996,
106
Utilização da CR-I em filogenia de Cracidae
e referências citadas; Saccone et al., 1991; Wilkinson et al., 1997), dificultando o
alinhamento das sequências e a análise filogenética.
Recentemente, Kimball et al. (1999) relataram as relações filogenéticas entre
vários gêneros de faisões e perdizes usando sequências do citocromo b (cyt b) e do
domínio I da região controladora. Os resultados deles mostraram que a inferência obtida
usando as sequências do domínio I são altamente congruentes com as do cyt b, mostrando
a utilidade do domínio I da região controladora para relações taxonômicas acima de
espécies. Zink et al. (1998) também sugeriram que os domínios I e III da região
controladora são úteis para estudos filogenéticos dentro e entre gêneros de aves.
Neste trabalho, seqüenciamos o domínio I da região controladora de um
representante de cada um dos onze gêneros de Cracidae para responder as seguintes
questões: (1) Em Cracídeos, o domínio I evolui mais rapidamente que outras sequências
mitocondriais? (2) Essa região seria útil para estimar as relações filogenéticas entre os
gêneros de cracídeos? (3) Como se compara a inferência filogenética por meio de
sequências da região controladora com aquela obtida para gêneros de Cracidae usando
outros genes mitocondriais em conjunto (citocrome b, citocrome oxidase I, II e III, 12S
rDNA, e 16SrDNA)(Capítulo 4)?
Material e métodos
DNA total foi extraído de amostras de sangue de Cracidae de acordo com o
método descrito por Bruford et al. (1992). O domínio I da região controladora (CR-I) foi
amplificado a partir de DNA total em um termociclador modelo TC1 (Perkin-Elmer)
usando um passo inicial de desnaturação do DNA por 5 minutos a 95oC, seguido de 25
ciclos de 1 minuto a 95°C, 30 segundos a 50°C e 40 segundos a 72°C. Finalmente seguiuse um passo de extensão a 72oC por 5 minutos. Os produtos da PCR foram separados em
gel de agarose 1% e recuperados em solução PEG8000 15% de acordo com Zhen e
Swank (1993). Os oligonucleotídeos iniciadores ("primers") utilizados foram desenhados
por G. Rowe (Leicester University, Leicester, Inglaterra) para Anseriformes: D-loop L
(TTG TTC TCA ACT ACG GGA AC) e D-loop H (GTG AGG TGG ACG ATC AAT
107
Utilização da CR-I em filogenia de Cracidae
AAA T), correspondendo as posições 16756 e 422 do genoma mitocondrial de Gallus
gallus (Desjardins e Moraes, 1990, número de acesso GenBank X52392).
As reações de seqüenciamento foram preparadas usando o "kit" de
seqüenciamento Dye Terminator Cycle Sequencing (PE Applied Biosystems) ou o Termo
Sequenase Dye Terminator Cycle Sequencing (Amersham Life Science) de acordo com as
instruções do fabricante. Ambas as fitas do CR-I foram seqüenciadas para um espécimem
representando cada um dos diferentes gêneros das subfamílias Penelopinae (Aburria
aburri, Chamaepetes goudotti, Penelope obscura, Penelopina nigra, Pipile jacutinga,
Oreophasis derbianus e Ortalis canicollis) e Cracinae (Crax blumenbachii, Mitu
tuberosa, Nothocrax urumutum e Pauxi pauxi).
As sequências foram carregadas em seqüenciador automático ABI PRISM 310
(Perkin-Elmer). Os eletroferogramas de ambas as fitas foram comparados e as
ambiguidades foram corrigidas usando o programa Sequence Navigator, versão 1.0.1
(Perkin-Elmer). As sequências foram depositadas no GenBank sob números de acesso
AF165430-AF165440. O alinhamento foi realizado no Clustal W (Thompson et al., 1994)
e checado visualmente para correção de eventuais erros de alinhamento (Fig. 1).
Distâncias de Tamura-Nei (Tamura e Nei, 1993) foram plotadas contra o número
de transições e o de transversões para todas os pares de cracídeos para checar se as
substituições atingiram a saturação. A taxa média de substituição por sítio por ano foi
estimada por:
ˆ
r=k
2T
,
onde T é o tempo de divergência estimado anteriormente em um estudo de relações
filogenéticas entre os gêneros de Cracidae e k̂ é a taxa média esperada de substituição de
nucleotídeo dada por:
ˆ

− 3 ln1 − 4d  ,
4 
3 

sendo d̂ a distância TN93 média observada entre as sequências.
108
Utilização da CR-I em filogenia de Cracidae
1
1234567890
Aburria
AATAC-GGGA
Pipile
..CC.C---Penelope
..........
Penelopina .....G....
Chamaepetes ....-G....
Oreophasis ....-G....
Ortalis
...GGG....
Mitu
...TAG....
Crax
..........
Pauxi
....GG....
Nothocrax
...T-G....
1111111112
1234567890
AAAATT-AAT
......TT-.
.C........
C.....A.T.
..........
..........
......C.-.
.C....C...
......C...
..........
.......G-.
2222222223
1234567890
TTTTAACCTA
.CC..----.
..........
.....T..A.
.....-.-..
......-ACC
.....----.
......TT..
.......T..
......AT..
..........
3333333334
1234567890
ACCCTCCTAC
..T.......
.T........
C...C....TT.T.....A
TT..C....A
.G..C....A
....C....A
....C........C........C....-
4444444445
1234567890
TAA--GCACA
...GG.....
..........
-.TAA.....
AT.GGAA.TT
AT..A...A.
.GTTG.-.A.
CC.GA.....
CC.GA.....
CC-GG...A.
CC.GG...A.
5555555556
1234567890
TCTCTCTCTA
..........
..........
C..T.T.T.T
..........
..........
.T..C..T.T
..........
..........
.T.T.T.TC.
.T.T.T.T.T
6666666667
1234567890
GC-AAGGG-C
--..G...C.
....G.....
....G.....
.-..G..-..
.GG.G-.-..
.GG.G-.-C.
.AG.G-.-A.
.AG.G-.-A.
.GGGG..-..
TGGGG..-A.
7777777778
1234567890
CCCCCCCC-........CC
..........
........C.
........CC
........CC
........CC
..........
.......-..
........C.
........CC
8888888889
1234567890
Aburria
-TT---CCCC
Pipile
C..AAC....
Penelope
..-A......
Penelopina ..-A......
Chamaepetes ..-AA.....
Oreophasis ..-..C....
Ortalis
..-A......
Mitu
..........
Crax
..........
Pauxi
..-..C....
Nothocrax
..-.......
1
9999999990
1234567890
CCCCGGGGGG
..........
..........
....A.A-..
....C.A...
....C.AA..
....C.A...
....A.A...
....A.A...
....A.A.A.
....C.A...
1111111111
0000000001
1234567890
GGTATGCTAT
..........
...G......
..........
...G......
...G......
...G......
...G......
...G......
...G......
...G......
1111111111
1111111112
1234567890
GTATAATCGT
..........
..........
..........
..........
......C...
......C...
..........
..........
..........
..........
1111111111
2222222223
1234567890
GCATATTTTT
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
1111111111
3333333334
1234567890
ATGTGCCCCA
..........
..........
G.........
G.........
G.........
G.........
..........
..........
..........
..........
1111111111
4444444445
1234567890
TACATTATGG
..........
..........
..........
..........
..........
..........
..........
..........
..........
G.........
1111111111
5555555556
1234567890
TCCAGTAATA
..........
..........
.T........
..........
.......C..
..........
..........
.T........
.T........
..........
Figura 1. Alinhamento das sequências do primeiro domínio da região controladora em 11 espécies de Cracidae. Os números acima das seqüências
reprentam a posição do sítio.
109
Utilização da CR-I em filogenia de Cracidae
1111111111
6666666667
1234567890
Aburria
CATTCTATAT
Pipile
..........
Penelope
....T.....
Penelopina ..........
Chamaepetes ...A......
Oreophasis ...A......
Ortalis
..........
Mitu
..........
Crax
..........
Pauxi
..........
Nothocrax
..........
1111111111
7777777778
1234567890
ATGTACTATA
..........
..........
..........
..........
..........
..........
.C........
..........
..........
..T.......
1111111111
8888888889
1234567890
CCCAT-TATA
..........
..........
..........
..........
..........
..........
.....A....
.....A....
.....A....
..A..A..G.
1111111112
9999999990
1234567890
TGTAAACGGA
....G.....
..........
....G.....
....G.T...
..........
..........
....G.....
....G.....
....G.....
..........
2222222222
0000000001
1234567890
CATGCGTCTT
.......T.C
.....T....
....-....C
..........
..........
....GC...C
......C..C
....T.....
....T....C
.........C
2222222222
1111111112
1234567890
TCTAGCCACA
..........
..........
..........
.T........
..........
CTC.......
..C.......
..........
..C.......
..C....C..
2222222222
2222222223
1234567890
TTTCTCCCAA
..........
..........
...A......
.........G
..........
..........
...A.....G
.........G
.........G
...T.....G
2222222222
3333333334
1234567890
TGCACATTAA
..........
..........
C.........
C.........
..........
..........
C.........
C.........
C.........
..........
2222222222
4444444445
1234567890
Aburria
CATGTATGCT
Pipile
..........
Penelope
..........
Penelopina ..........
Chamaepetes ..........
Oreophasis ..........
Ortalis
..........
Mitu
....C.....
Crax
....C.....
Pauxi
..........
Nothocrax
.....T....
2222222222
5555555556
1234567890
TTAGGAC-AA
.C........
..........
.......T..
C.........
C......T..
.......T..
C......C.G
C......C.G
C......C.G
C......C.G
2222222222
6666666667
1234567890
CCAGAGATAC
.T........
.T...A....
.T...A...T
.T...A....
.T...A...T
.T...AG...
.....A...T
.....A...T
.....A...T
........TT
2222222222
7777777778
1234567890
ACTACTTATT
.....C..C.
.......G..
C--..C....
G....C.GC.
C--.....C.
C--..C....
C--.......
C--..C....
C--.......
G--..C....
2222222222
8888888889
1234567890
C-ACGATCTA
..........
........C.
..........
T.......C.
........C.
.......TC.
........C.
.C......C.
........C.
........C.
2222222223
9999999990
1234567890
GCACATTCAA
..........
..........
..........
..........
..........
..........
..........
..........
..........
....G.....
3333333333
0000000001
1234567890
GTCACCTAAC
.C........
..........
.A........
..........
.G........
.A........
..........
..........
..........
..........
3333333333
1111111112
1234567890
CAGTGAATGG
..........
..........
..A......A
.........A
.........A
..........
.........A
.........A
.........A
.......G.A
Figura 1. Continuação.
110
Utilização da CR-I em filogenia de Cracidae
3333333333
2222222223
1234567890
Aburria
TTTCAGGGAC
Pipile
...AC-..G.
Penelope
...AC-....
Penelopina .C.AT-....
Chamaepete .C.AC-....
Oreophasis .C.AC-....
Ortalis
.C.AC-....
Mitu
.C.AC-....
Crax
.C.AC.....
Pauxi
.C.AC-....
Nothocrax .G.AC-....
3333333333
3333333334
1234567890
ATAATATTAA
...G......
........T.
..........
...G......
....AC....
....AC....
....AC....
....AC....
....AC....
....AC....
3333333333
4444444445
1234567890
TAATACAGCC
.....T....
..T.......
..C..T....
..TC...T..
..T..T....
..TA...T..
..T.GT..T.
..CC.T..T.
..T....T..
..T....T..
3333333333
5555555556
1234567890
TTATCCACAT
..G...G...
.....-....
.AT.......
..-.......
C.-...T...
C.-...C...
..-...T...
..--.TT...
..--..T...
..--..C...
3333333333
6666666667
1234567890
TTGGGTTATG
....-.....
..........
....-.....
....-.....
....-.....
....-.G-..
....-.....
....-.....
....-.....
....-.....
3333333333
7777777778
1234567890
CTCGACGTAT
........G.
..A...T............
..........
..........
..........
..........
..........
..........
.......-..
33333
88888
12345
CAG-G
.TA..
--.C.
...A.
...T.
..-.A..T.
...T.
..-....T.
...T.
Figura 1. Continuação.
111
Utilização da CR-I em filogenia de Cracidae
As análises filogenéticas foram realizadas no PAUP* (versão 4.0; Swofford, 1999)
sob os critérios de máxima parcimônia, máxima verossimilhança e distância. Todas as
reconstruções não foram enraizadas.
Testes de razão de verossimilhança ("Likelihood ratio test - LRT") foram realizados
no MODELTEST (versão 2.0, Posada e Crandall, 1998) para escolher o modelo evolutivo
que mais se adequa ao CR-I de cracídeos. O modelo escolhido para estimar a filogenia sob
o critério da máxima verossimilhança por meio do algoritmo de "decomposição de estrela"
foi o HKY85 (Hasegawa et al., 1985) admitindo que os sítios apresentam taxa de
subsitutição com distribuição gama.
Análises de distância foram realizadas através do algoritmo de Neighbor-joining
usando o modelo HKY (Hasegawa et al., 1985), assumindo que os sítios apresentam
heterogeneidade de taxas de substituição. "Bootstrap" foi realizado com 100 réplicas.
A análise de parcimônia foi feita por meio de busca exaustiva atribuindo peso igual
para transições (TS) e transversões (TV) (1:1) em uma das análises, e atribuindo mais peso
para as transversões (TS:TV = 1:2) em outra. "Bootstrap" foi realizado com 100 réplicas
assumindo mesma probabilidade de um sítio ser reamostrado, mas aplicando os pesos
dados às transversões (TS:TV = 1:2).
Resultados
O alinhamento final do CR-I possui 385 pares de bases (Fig. 1). Sítios com lacunas
(cerca de 13% da sequência total) não se extendiam por mais do que 4 bases, e foram
excluídos da análise, resultando em uma matriz de 333 pares de bases. Destes sítios, 47
eram não informativos para parcimônia, 51 informativos e 235 eram constantes (61.0%).
Transições (TS) e transversões (TV) não estão saturados entre os gêneros de Cracidae (Fig
2). O número de TS variou de 8 a 33 e o de TV de 2 a 23 (Tabela 1). A razão TS/TV foi de
1.98. A composição de bases é homogênea entre os táxons usados (χ2=12,20, P=0,998),
com decréscimo do conteúdo de G (14.6%) em relação as demais bases (A=28.5%,
C=26.2%, T=30.7%) (tabela 2). Os resultados de avaliação do sinal filogenético contido
nestas sequências foi de –0.61, obtidos por meio da utilização da estatística g1 (Hillis,
1991).
112
Utilização da CR-I em filogenia de Cracidae
Número de TS e TV
40
TS
TV
30
20
10
0
0
0,05
0,1
0,15
0,2
Distâncias de TN93
Figura 2. Número de transições e de transversões plotadas contra as distâncias de Tamura-Nei
(TN93) para todas as comparações par-a-par entre os Cracidae estudados.
Tabela 1. Número de transições (acima da diagonal) e transversões (abaixo da diagonal) observados no
domínio I da região controladora para todas as comparações par-a-par entre os gêneros de Cracidae.
Abu
Cha
Cra
Mit
Not
Ore
Ort
Pau
Pen
Pnl
Pip
Aburria
Abu
26
21
23
22
17
23
25
8
21
18
Chamaepetes 9
Cha
21
26
29
17
24
27
20
28
32
Crax
8
9
Cra
9
20
17
27
15
22
17
30
Mitu
11
12
3
Mit
18
18
26
14
23
22
33
Nothocrax
21
18
15
16
Not
23
21
11
24
21
33
Oreophasis
15
10
7
10
18
Ore
18
22
13
21
25
Ortalis
16
15
10
13
17
11
Ort
25
21
25
30
Pauxi
10
9
2
5
13
7
8
Pau
25
18
36
Penelope
8
11
10
11
23
17
16
12
Pen
25
22
Penelopina
10
11
10
11
23
13
14
12
12
Pnl
27
Pipile
4
9
8
9
19
15
16
10
8
10
Pip
A análise da distribuição distribuição dos sítios variáveis ao longo do domínio I da
região controladora de cracídeos mostrou que 48 (38.71%) dos sítios variáveis se
encontram nos primeiros 100 pares de bases. Os próximos 100 pares de bases foram mais
conservados com apenas 14 sítios variáveis (11.29%). O terceiro e o quarto grupo de 100
pares de bases apresentaram cada um 31 sítios variáveis (25%).
A taxa média de substituição de nucleotídeos por ano e a porcentagem por milhão
de anos para sete diferentes genes de cracídeos são mostrados na tabela 3. Nossos
resultados mostram que em cracídeos estes setes genes evoluem a taxas entre 1,25-2,29 ×
113
Utilização da CR-I em filogenia de Cracidae
10-9 (Tab. 3) e que as taxas de evolução do COI e do cyt b são similares à taxa do CR-I
(2,29 × 10-9 substituições por ano).
Tabela 2. Composição de bases para representantes de 11 gêneros de Cracidae.
A
C
G
T
Aburria
0.300
0.249
0.141
0.309
Chamaepetes 0.279
0.252
0.147
0.321
Crax
0.285
0.273
0.144
0.297
Mitu
0.279
0.279
0.147
0.294
Nothocrax
0.264
0.258
0.162
0.315
Oreophasis
0.285
0.270
0.141
0.303
Ortalis
0.285
0.273
0.150
0.291
Pauxi
0.288
0.261
0.141
0.309
Penelope
0.288
0.243
0.141
0.327
Penelopina
0.300
0.252
0.135
0.312
Pipile
0.276
0.264
0.159
0.300
Média
0.285
0.262
0.146
0.307
Tabela 3. Taxa (r) de substituição de DNA por sítio por ano e porcentagem de divergência de sequência por
milhão de ano (%/Ma) para sete genes mitocondriais de Cracidae.
r (×10-9 por ano)
%/My
D-loop
2,29
0,4580
12S rDNA
1,37
0,2745
16S rDNA
1,25
0,2499
COI
2,32
0,4600
COII
1,79
0,3584
COIII
1,94
0,3875
Cyt b
2,29
0,4570
As relações filogenéticas entre os cracídeos estimadas por máxima verossimilhança
e distância produziram resultados similares (Fig. 3-C e D). Estas análises mostraram a
separação das subfamílias Penelopinae (jacus e aracuãs) e Cracinae (mutuns), e as relações
entre os gêneros foram similares as estimativas obtidas usando seis genes mitocondriais em
conjunto (Capítulo 4). Todas as reconstruções foram completamente resolvidas. As análises
de máxima parcimônia sem ou com atribuição de pesos resultaram em árvores onde a
separação das subfamílias não ocorre e os valores de "bootstrap" foram maiores do que
50% para poucas associações (Fig. 3-A e B).
114
Utilização da CR-I em filogenia de Cracidae
B
A
Pipile
Penelopina
81
Crax
Penelope
58
Oreophasis
59
Penelope
84
52 Aburria
Crax
Mitu
Pauxi
Aburria
60
Mitu
Pipile
Penelopina
51
Pauxi
Nothocrax
Chamaepetes
Oreophasis
Chamaepetes
Ortalis
Ortalis
Nothocrax
10
10
C
D
Penelopina
Chamaepetes
Penelopina
Ortalis
Ortalis
Penelope
Penelope
Pipile
Pipile
Oreophasis
Aburria
Aburria
Oreophasis
Mitu
Crax
Pauxi
Mitu
Chamaepetes
Crax
Pauxi
Nothocrax
Nothocrax
0.1
0.1
Figura 3. Reconstruções filogenéticas usando o primeiro domínio da região controladora, sob os critérios de
máxima parcimônia sem (A) e com atribuição de pesos (B), de máxima verossimilhança usando o modelo de
evolução de DNA HKY85+Γ (C), de distâncias (Neighbor-joining) usando o modelo HKY+Γ (D). Somente
as filogenias C e D são congruentes com a obtida usando outros seis genes mitocondriais. Barras
correspondem ao número de substituições. Táxons sublinhados são membros da subfamília Cracinae e
aqueles não sublinhados são membros de Penelopinae.
115
Utilização da CR-I em filogenia de Cracidae
Discussão
No presente trabalho, seqüenciamos o domínio I da região controladora (CR-I) dos
11 gêneros de cracídeos. Sabe-se que alguns genes mitocondriais, incluindo o CR-I,
apresentam cópias nucleares em algumas espécies de aves (Quinn, 1997). Contudo
acreditamos que nossas sequências sejam de origem mitocondrial porque (1) obtivemos
uma única banda como produto da PCR e as sequências destes produtos foram "limpas",
isto é, não indicaram a presença de outras sequências de fundo; (2) elas apresentaram alta
similaridade com outras sequências do CR-I de aves depositadas no GenBank; e (3) a
predição de sua estrutura secundária (não mostrado) apresentou aspectos similares a outros
CR-I de aves (e.g. Randi e Lucchini, 1998).
Apesar de ser considerado um gene com alta taxa de evolução, o CR-I em Cracidae
apresentou 61% de sítios constantes. As sequências do COI e cyt b parecem evoluir a uma
taxa similar ao CR-I em cracídeos. Nossos resultados são concordantes com Randi e
Lucchini (1998) e Zink et al. (1998): outros genes mitocondriais podem evoluir tão ou mais
rapidamente do que a região controladora. Randi e Lucchini (1998) relataram que
sequências completas do D-loop em diversas espécies de Alectoris (Galliformes)
apresentaram taxa de evolução menor do que a do cyt b. Zink et al. (1998) mostraram que o
número observado de sítios variáveis no CR-I é similar aquele dos genes cyt b e ND2 em
diversas espécies de Pipilo (Passeriformes).
A estatística g1 (Hillis, 1991) aplicada as sequências de CR-I dos diferentes gêneros
de Cracidae é similar à estimada para sequências não aleatórias que retem sinal
filogenético, indicando que ela pode ser útil em análises de reconstruções filogenéticas
acima da categoria de espécie, como já sugerido anteriormente por Kimball et al. (1999) e
Zink et al. (1998).
Nossa análise de parcimônia falhou em mostrar a monofilia de ambas as subfamílias
de Cracidae. As incongruências se referem aquelas divergências com ramos longos, tais
como Nothocrax (Cracinae), e os membros de Penelopinae Chamaepetes, Ortalis,
Oreophasis, e Penelopina. Provavelmente estes táxons acumularam mais modificações que
podem ser atribuídas às homoplasias e não à ancestralidade comum. A proximidade
116
Utilização da CR-I em filogenia de Cracidae
filogenética aparente destes táxons pode ser devida então ao efeito de atração de ramos
longos (Felsentein, 1978).
Os métodos de parcimônia também podem resultar em estimativas infiéis porque
modelos mais complexos de mudança evolutiva não podem ser incorporados à análise. O
CR-I de Cracidae parece evoluir de uma maneira complexa. Nossos resultados mostraram
que há forte heterogeneidade de taxas de substituição entre os sítios, e que ocorrem o dobro
de transições em relação às transversões.
Acomodar estes parâmetros em uma reconstrução filogenética pode resultar em
estimativas mais fiéis da evolução de um grupo de sequências, ou os táxons que eles
representam (Gaut and Lewin, 1995).
De fato, nossas estimativas da evolução dos gêneros de Cracidae usando os critérios
de máxima verossimilhança ou distância e admitindo haver heterogeneidade de substituição
entre os sítios mostraram que as sequências do CR-I forneceram resultados similares as
sequências de outros seis genes mitocondriais (Capítulo 4): a separação das subfamílias
Cracinae (incluindo os cracídeos maiores e mais pesados) e Penelopinae (representado
pelos pequenos e delgados aracuãs, jacus médios a grandes)(Delacour e Amadon, 1973).
As relações filogenéticas obtidas entre os jacus usando as sequências do CR-I é
muito similar à obtida para os seis genes mitocondriais em conjunto. Contudo, as relações
entre os mutuns difere entre estes dois estudos com a associação entre Crax e Mitu em um
clado, e Nothocrax e Pauxi no outro usando sequências do CR-I. De fato todos estes táxons
parecem ter evoluído em um período de tempo relativamente curto (cerca de 2-3 milhões de
anos), e o CR-I, ou qualquer outro gene analisado separadamente, poderia não ter sofrido
substituições o suficiente para resolver a relação entre eles.
Em resumo, nossos resultados mostraram que a região controladora do DNA
mitocondrial pode ser apropriada para reconstruções filogenéticas entre gêneros e não deve
ser ignoradas em outros estudos sistemáticos e filogenéticos. Nossa sugestão é que este
gene seja avaliado não apenas em aves, mas também em outros grupos. A região
controladora do DNA mitocondrial deveria ser incorporada em estudos onde diversos genes
são considerados juntos na análise, a análise combinada de Kluge (1989). A razão para isto
é que os genes mitocondriais são ligados e então apresentariam uma história evolutiva em
117
Utilização da CR-I em filogenia de Cracidae
comum. O melhoramento e a confiabilidade da inferência irão depender do modelo de
substituição de DNA: quanto mais realista o modelo, melhor a inferência obtida.
Referências
Avise JC, Arnold J, Ball RM, Bermingham E, Lamb T, Niegel JE, Reeb CA, Saunders NC (1987).
Intraespecific phylogeography: the mitochondrial bridge between population genetics and
systematics. Ann. Rev. Ecol. Syst. 18: 489-522.
Baker AJ, Marshal HD (1997). Mitochondrial control region sequences as tools for understanding
evolution. In: "Avian Molecular Systematics", DP Mindell (Ed.). Academic Press. USA. pp 5182.
Bruford MW, Hanotte O, Brookfield JFY, Burke T (1992). Single-locus and multilocus DNA
fingerprinting. In “Molecular Genetic Analysis Of Populations - A Practical Approach,” AR
Hoelzel (Ed.). Oxford University Press, New York. pp. 225-269.
Delacour J, Amadon D (1973). “Curassows and Related Birds,” The American Museum of Natural
History. New York, NY.
Desjardins P, Morais R (1990). Sequence and gene organization of the chicken mitochondrial
genome. A novel gene order in higher vertebrates. J. Mol. Biol. 212: 599-634.
Eizirik E, Bonatto SL, Johnson WE, Crawshaw PG, Vié JC, Brousset DM, O’Brien SJ, Salzano FM
(1998). Phylogeographic patterns and evolution of the mitochondrial DNA control region in two
Neotropical cats (Mammalia, Felidae). J. Mol. Evol. 47: 613-624.
Felsenstein J (1978). Cases in which parsimony and compatibility methods will be positively
misleading. Syst. Zool. 27: 401-410.
Fumagalli L, Taberlet P, Favre L, Hausser J (1996). Origin and evolution of homologous repeated
sequences in the mitochondrial DNA control region of shrews. Mol. Biol. Evol. 13: 31-46.
Gaut, BS, Lewis PO (1995). Success of maximum likelihood in the four-taxon case. Mol. Biol.
Evol. 12: 152-162.
Hasegawa M, Kishino K, Yano T (1985). Dating the human-ape splitting by a molecular clock of
mitochondrial DNA. J. Mol. Evol. 22: 160-174.
Hillis, DM (1991). Discriminating between phylogenetic signal and random noise in DNA
sequences. In: "Phylogenetic Analysis of DNA sequences", M Miyamoto, J Cracraft (Eds).
Oxford University Press, New York. pp 278-294.
118
Utilização da CR-I em filogenia de Cracidae
Kimball RT, Braun EL, Zwartjes PW, Crowe TM, Ligon JD (1999). A molecular phylogeny of the
pheasants and partridges suggests that these lineages are not monophyletic. Mol. Phylogenet.
Evol. 11: 38-54.
Kluge AG (1989). A concern for evidence and a phylogenetic hypothesis of relationships among
Epicrates (Boidae, Seprentes). Syst. Zool. 38: 7-25.
Kocher TD, Thomas WK, Meyer A, Edwards SV, Pääbo S, Villablanca FX, Wilson AC (1989).
Dynamics of mitochondrial DNA evolution in animals: amplification and sequencing with
conserved primers. Proc. Natl. Acad. Sci. USA 86: 6196-6200.
Lucchini V, Randi E (1998). Mitochondrial DNA sequence variation and phylogeographical
structure of rock partridge (Alectoris graeca) populations. Heredity 81: 528-536.
Posada D, Crandall KA (1998). Modeltest: testing the model of DNA substitution. Bioinformatics
14: 817-818.
Quinn TW (1997). Molecular evolution of the mitochondrial genome. In: "Avian Molecular
Systematics", DP Mindell (Ed). Academic Press. USA pp 3-28.
Randi E, Lucchini V (1998). Organization and evolution of the mitochondrial DNA control region
in the avian genus Alectoris. J. Mol. Evol. 47: 449-462.
Saccone C, Pesole G, Sbisà E (1991). The main regulatory region of mammalian mitochondrial
DNA: structure-function model and evolutionary pattern. J. Mol. Evol. 33: 83-91.
Swofford DL (1999). PAUP*. Phylogenetic Analysis Using Parsimony (*and related methods).
Version 4.0. Sinauer Associates, Sunderland, Massachusetts.
Tamura K, Nei M (1993). Estimation of the number of nucleotide substitutions in the control
region of mitochondrial DNA in humans and chimpanzees. Mol. Biol. Evol. 10: 512-526.
Thompson JD, Higgins DG, Gibson TJ (1994). CLUSTALW: improving the sensitivity of
progressive alignment through sequence weighting, position-specific gap penalties and weight
matrix choice. Nucleic Acids Res. 22: 4673-4680.
Wilkinson GS, Mayer F, Kerth G, Petri B (1997). Evolution of repeated sequence arrays in the Dloop region of bat mitochondrial DNA. Genetics 146: 1035-1048.
Zhen L, Swank RT (1993). A simple and high yield method for recovering DNA from agarose gels.
Bio Techniques 14: 894-896.
Zink RM, Weller SJ, Blackwell RC (1998). Molecular phylogenetics of the avian genus Pipilo and
a biogeographic argument for taxonomic uncertainty. Mol. Phylogenet. Evol. 10: 191-201.
119
Capítulo 6
Evolução Molecular da
Subunidade II da Citocromo c
Oxidase em Cracidae (Aves)
120
Evolução de COII em Cracidae
EVOLUÇÃO MOLECULAR DA SUBUNIDADE II DA CITOCROMO C
OXIDASE EM CRACIDAE (AVES)
Abstract
Cytochrome c oxidase subunit II (COII) is a conserved enzyme among living
organisms, from prokaryotes to eukaryotes. The pattern of nucleotide and amino acid
substitutions is analysed here for the COII gene of the eleven genera of Cracidae (Aves).
Amino acid positions considered to be conserved among several metazoan species were
also identified in Cracidae COII sequences futher enhancing the functional importance of
these positions, while others showed considerable variation suggesting that conserved
positions in certain metazoan groups might not be conserved in others.
Resumo
O gene da subunidade II da citocromo c oxidase (COII) tem se mostrado
conservado entre eucariotos e procariotos. Os padrões de substituição de nucleotídeos e
de aminoácidos são analisados aqui para seqüências de COII de onze gêneros da família
Cracidae (Aves). Posições de amino ácidos consideradas conservadas entre diversas
espécies de metazoários também foram identificadas nas seqüências de COII de cracídeos
neste estudo, reforçando a importância funcional destas posições, enquanto outras
posições se mostram variáveis, sugerindo que aminoácidos conservados em determinados
metazoários podem não ser em outros grupos.
Introdução
A cadeia respiratória, ou fosforilação oxidativa, é um de três estágios no
metabolismo celular, onde os elétrons são transferidos da NADH ou da FADH2 para o O2,
formando H2O e ATP, e protegendo as células do acúmulo de H+. Três grandes
complexos protéicos estão envolvidos neste processo: NADH-Q redutase, citocromo
redutase, e citocromo c oxidase. Estes complexos se situam na membrana interior da
mitocôndria de eucariotos, e na membrana plasmática de procariotos.
121
Evolução de COII em Cracidae
A citocromo c oxidase é um complexo protéico, composto de várias subunidades.
Em eucariotos, as subunidades I, II, e III são codificadas pelo genoma mitocondrial e as
demais no genoma nuclear. Foram também identificadas até o momento quatro
subunidades (IV, Va, Vb, and VIc) codificadas pelo genoma nuclear em mamíferos,
fungos e levedura (revisado em Capaldi, 1990). Somente algumas destas subunidades têm
função conhecida, embora o processo catalítico atribuído a citocromo c oxidase seja bem
caracterizado (Capaldi, 1990; Capaldi et al., 1983; Iwata et al., 1995; Millet et al 1983).
De acordo com o modelo estrutural da subunidade II da citocromo c oxidase
(COII), podemos identificar três segmentos: uma alça N-terminal, dos resíduos 1 ao 26,
duas alfa hélices transmembrânicas (resíduos 27-48 e 63-82) conectadas por 13 resíduos,
dos resíduos 49 ao 62, e um domínio globular C-terminal, entre os resíduos 106-227
(Capaldi et al., 1983; Iwata et al., 1995; Millett et al., 1983).
A maioria dos aminoácidos das regiões em alfa hélice são hidrofóbicos, como
esperado para domínios transmembrânicos que interagem com domínios de outras
subunidade do complexo citocromo c oxidase e com a membrana da mitocôndria
(Capaldi et al., 1983).
Alguns dos resíduos do domínio C-terminal parecem formar um centro ativo de
ligação para o citocromo c, como os resíduos Asp-112, Glu-114, e Asp 158 de bovinos
(Capaldi, 1990; Millett et al., 1993). Outros quatro resíduos parecem estar envolvidos
com a ligação do íon de cobre (His-161, Cys-196, Cys-200, e His-204) e parecem ser
conservados em mamíferos (Adkins e Honeycutt, 1994, e referências citadas; Capaldi et
al. 1990; Millett et al., 1983), artrópodos (Frati et al., 1997, e referências citadas), um
molusco (Lecanidou et al., 1994), e bactéria (Iwata et al., 1995), mas não em
Theropithecus, uma espécie de primata (Adkins e Honeycutt, 1994).
Uma região rica em triptofano e tirosina foi observada entre os resíduos de
aminoácidos 104 a 110 no gene da COII em vários organismos. Foi sugerido que esta
região esteja envolvida com a formação de um ambiente para a transferência de elétrons
(Adkins e Honeycutt,1994).
O gene da COII, assim com outros genes mitocondriais, tem sido amplamente
usado para estimar as relações filogenéticas para diversas categorias taxonômicas.
122
Evolução de COII em Cracidae
Zardoya e Meyer (1996) o classificaram como tendo um poder mediano de resolver as
relações filogenéticas dos vertebrados em comparação com os demais genes
mitocondriais codificantes. De fato, parece que as seqüências de COII são úteis em casos
abrangendo questões filogenéticas entre categorias taxonômicas mais próximas como
espécies e gêneros (Emerson e Wallis, 1995; Frati et al., 1997; Honeycutt et al., 1995).
Este trabalho trata da evolução comparada do gene da COII em Cracidae e outros
grupos de metazoários. A família Cracidae é uma dos grupos de aves Neotropicais mais
ameaçados de extinção (Collar et al., 1992).
Material e métodos
As seqüências de COII de Cracidae foram obtidas previamente (Capítulos 3 e
4)(Fig. 1), e estão depositadas no GenBank (números de acesso AF165502-AF165512).
As espécies de cracídeos usadas aqui representando todos os gêneros da família foram:
Aburria aburri, Chamaepetes goudotti, Crax blumenbachii, Mitu tuberosa, Nothocrax
urumutum, Oreophasis derbianus, Ortalis cannicolis, Pauxi pauxi, Penelope obscura,
Penelopina nigra, e Pipile jacutinga. O megapodídeo Megapodius reinwardt foi usado
para o teste de taxas relativas de evolução (veja abaixo).
A frequência de bases, uso preferencial de códons, número de transições e
transversões, número de sítios parcimoniosos, número de sítios bi e tetradegenerados, e
sinônimos, número de sítios invariáveis, e número absoluto de transições e transversões
para cada comparação par-a-par foram obtidos nos programas MEGA 1.01 (Kumar et al.,
1993) e MOLPHY 2.2 (Adachi e Hasegawa, 1994). O enviesamento composicional para
cada posição do códon foi calculada como:
EC = 2
4
c − 0.25 ,
3∑
i
i =1
onde ci é a frequência da iésima base (Irwin et al., 1991). Também avaliamos se a
composição de bases se encontra estacionária entre os táxons para averiguar se as
substituições do COII podem representar substituições múltiplas.
A hipótese de constância de taxa de substituição entre os gêneros analisados foi
testada no PHYLTEST (Kumar, 1996), usando a seqüência de COII do megapodídeo
123
Evolução de COII em Cracidae
como grupo externo. A taxa de substituição de nucleotídeos (r) é definida como o número
de substituições por sítio (K) por ano, e pode ser calculada como:
r = K (2T ) ,
onde T é o tempo de divergência entre duas seqüências (Li, 1997). Os tempos de
divergência usado para calibrar as taxas de evolução foram aqueles estimados para a
separação entre os gêneros obtidos no capítulo 4.
A partir da seqüência de nucleotídeos do gene COII de cracídeos, estimamos as
seqüências de aminoácidos e as comparamos com as seqüências de outras aves (Corvus
frugilegus, Harlid e Arnason (1999); Aythya americana, Falco peregrinus, Smithornis
sharpei, Vidua chalybeata, Mindell et al. (1998); Gallus gallus Desjardins e Morais
(1990); Rhea americana Harlid et al. (1998); e Struthio camelus Harlid et al., (1997)) e
outros metazoários, incluindo primatas (Adkins e Honeycutt, 1994), um crocodilo
(Alligator mississipiensis, Janke e Arnason, 1997, Mindell et al., 1999), uma tartaruga
(Chrysemys picta; Mindell et al., 1999) e insetos (Frati et al., 1997). O objetivo desta
comparação foi avaliar se estes grupos distintos apresentam aminoácidos conservados em
posições consideradas fundamentais em outros organismos.
Resultados
Alinhamento das seqüências de COII
As seqüências de COII de Cracidae puderam ser alinhadas sem nenhum evento de
deleção/inserção presente. As seqüências alinhadas são mostradas na figura 1. O gene
apresenta 684 nucleotídeos que codificam para 227 aminoácidos e um codon de parada. A
proporção de sítios invariáveis (151 sítios no total) para primeira, segunda e terceira
posição do códon das seqüências de COII de cracidae foi de 90,4; 99,1 e 44,3%,
respectivamente. Entre os cracídeos, 86 sítios são parcimoniosos, 123 bidegenerados e
104 tetradegenerados.
124
TTC
..T
...
...
...
...
...
...
..T
..T
...
ATA
...
...
...
...
...
...
...
...
...
...
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
CTT
...
..A
..G
..A
..A
..A
..A
...
...
...
CAC
...
...
...
...
...
..T
...
...
...
...
GCC
...
...
...
...
...
...
...
...
...
...
ATA
...
...
...
...
...
...
...
...
...
...
GAC
...
...
...
...
...
...
...
...
...
...
AAC
...
...
..T
...
...
...
...
...
...
...
GAA
...
...
...
...
...
...
...
...
...
...
CAC
...
...
...
...
...
..T
...
...
...
...
CAC
...
...
...
...
...
...
...
...
...
...
AAA
...
...
...
...
..G
...
...
...
...
...
GCC
...
...
...
...
...
...
...
...
...
...
TCC
...
..A
..A
..A
..A
...
..A
...
...
...
CTA
...
...
...
...
..G
..G
...
...
...
...
CTA
..G
...
...
...
...
...
...
...
T.G
...
CAA
...
...
...
...
...
...
...
...
...
...
TCA
...
...
...
...
...
...
...
...
...
...
ATA
...
...
...
...
...
...
...
...
...
...
TTA
C..
C..
C..
C..
C..
C..
C..
...
C..
C..
TCA
...
...
...
...
...
...
...
..G
..G
...
GTA
...
...
...
...
...
...
...
...
...
...
GGA
...
...
...
...
...
...
...
...
...
...
AAT
..C
..C
..C
..C
..C
..C
..C
...
..C
...
GCT
..C
..A
..A
..A
..C
..A
..A
...
..C
...
TTC
...
...
...
...
...
...
...
...
...
...
ACT
..C
...
...
...
...
...
...
...
..C
...
CTA
...
...
...
...
..C
...
...
...
...
...
CAA
..G
..G
..G
..G
..G
...
..G
...
...
...
GTT
...
..C
..C
..C
...
..C
..C
...
...
...
GCC
...
...
...
...
..T
...
...
...
..T
...
GAC
...
...
...
...
...
...
...
...
..T
...
GAC
...
...
...
...
...
..T
...
...
...
...
ATC
...
...
...
...
...
...
...
...
...
...
GCC
...
...
...
...
...
...
...
...
...
...
GCC
...
...
..T
...
..T
...
...
...
..T
...
TGC
...
...
..T
...
...
...
...
...
...
...
TCC
...
...
...
...
...
...
...
...
...
...
CAA
...
...
...
..G
...
...
..G
...
...
...
AGC
...
...
...
...
...
...
..T
...
...
...
TCC
...
...
...
...
...
...
...
...
...
...
GAA
...
...
...
...
...
...
...
...
...
...
CTC
...
...
...
...
...
..T
...
..T
..T
...
CCA
...
...
...
...
...
...
...
...
...
...
GTC
...
..T
..T
..T
..T
..T
..T
...
...
...
GTA
...
...
..G
..G
..G
...
..G
...
...
...
ATC
...
...
...
...
...
...
...
...
..T
...
GAA
...
...
...
...
...
...
...
...
...
...
CTC
...
...
...
...
...
...
...
...
...
...
ATA
...
...
...
...
...
...
...
...
...
...
CTA
...
...
...
...
...
...
...
T..
...
T..
TAC
...
...
...
...
...
...
...
..T
...
...
GAA
...
...
...
A..
..G
...
...
...
...
...
ATT
..C
..C
..C
..C
...
..C
..C
...
...
...
CTA
...
..C
..C
..C
..C
..C
..C
...
...
...
GAA
..G
...
...
...
..G
...
...
...
...
...
TGA
...
...
...
...
...
...
...
...
...
...
CTA
...
T..
T..
T..
...
...
T..
...
...
...
CTA
...
T..
...
...
...
...
...
...
..G
...
Figura 1. Alinhamento das seqüências de COII em representantes de onze gêneros de Cracidae.
Números correspondem ao último sítio na linha.
ATG
...
...
...
...
...
...
...
...
...
...
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
ACC
...
..T
...
..T
...
..T
..T
...
...
...
ACC
...
..T
..T
..T
..T
...
..T
...
...
...
GTC
...
...
...
...
...
...
...
...
...
...
66
GAA
...
...
...
...
...
...
...
...
...
...
132
CTT
..C
...
..C
...
..C
...
..C
...
..C
...
198
ATC
...
...
...
...
...
...
...
...
...
...
Evolução de COII em Cracidae
125
ATT
..C
...
...
...
...
..C
...
..C
..C
...
GAC
..T
...
...
...
...
...
...
..T
...
..T
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
TTC
...
...
...
...
...
...
...
...
...
...
GAC
...
..T
..T
..T
...
..T
..T
..T
...
...
CCA
...
...
...
...
...
..G
...
...
...
...
AAA
...
...
...
...
...
...
...
...
...
...
GAG
...
...
...
..A
...
...
...
...
...
...
GCC
...
...
...
...
...
...
..T
...
...
...
Figura 1. Continuação.
CTG
..A
..A
..A
..A
T.A
...
..A
..A
..A
...
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
GAC
...
...
...
...
...
...
...
...
...
...
CCA
...
...
...
...
...
...
...
...
...
...
ATC
..T
...
...
...
...
...
..T
...
..T
...
CTA
...
...
...
...
...
...
...
...
...
...
GAC
...
...
...
...
...
...
...
...
...
...
GTA
...
...
...
...
...
...
...
...
...
...
TCA
...
...
...
...
...
...
...
...
...
...
CTT
...
..C
..C
..C
..C
..C
..C
...
...
...
CTA
..G
...
T..
...
...
...
T..
...
T..
...
TTT
...
..C
..C
..C
...
..C
..C
...
...
...
ACC
...
...
...
...
...
...
...
...
...
...
ATT
...
...
..C
...
...
...
...
...
..C
...
GAC
...
...
...
...
...
...
...
...
..T
...
TTA
...
...
...
...
...
C..
...
...
...
...
CTT
...
...
...
...
...
..C
...
...
...
...
TCA
...
...
...
...
...
...
...
...
...
...
AAG
...
..A
..A
..A
..A
..A
..A
...
...
...
CTT
..C
...
...
...
..A
...
...
...
...
...
TAC
...
..T
...
...
...
...
...
...
...
...
GCA
...
...
...
...
...
...
...
...
...
...
GCC
...
...
...
...
...
..T
...
...
...
...
ATA
...
...
...
...
...
...
...
...
...
...
ATC
...
...
...
...
...
...
...
...
...
...
CTC
...
..T
..T
...
...
...
...
...
...
...
ATC
..T
...
...
...
...
...
...
...
...
...
GGT
..C
..C
..C
..C
..C
..C
..C
..C
..C
..C
CCC
...
...
...
...
...
...
...
...
...
...
CCA
...
...
...
...
...
...
...
...
..C
...
CAC
..T
..T
..T
..T
..T
..T
..T
...
...
...
TCC
...
...
...
...
...
..T
...
...
...
...
ACC
...
...
...
...
...
..T
...
..T
...
...
CAA
...
...
...
...
...
...
...
...
...
...
CTA
...
...
...
T..
T.G
...
...
...
...
...
ACA
...
...
...
...
...
...
...
G..
...
..G
TGA
...
...
..G
...
...
...
...
...
...
...
CAA
...
...
...
...
...
...
...
...
...
...
GAC
...
...
...
...
...
...
...
...
...
...
TAC
...
..T
..T
..T
...
..T
..T
...
...
...
ATC
...
...
...
...
...
...
...
...
...
...
CTA
...
...
...
...
...
...
...
...
T..
...
TGA
...
...
...
...
...
...
...
...
...
...
CTC
...
...
...
...
...
...
...
..T
...
...
CCC
...
...
T..
...
...
...
...
...
...
...
ACC
...
...
...
...
...
...
...
...
...
...
TAT
..C
..C
..C
..C
..C
..C
..C
..C
..C
...
CAA
...
...
...
...
...
..G
...
...
...
...
TAC
...
...
...
...
...
...
...
...
...
...
ATA
...
...
...
...
...
...
...
..G
...
..G
GGA
...
...
...
...
...
..C
...
...
...
...
GAA
...
...
...
...
...
...
...
...
...
...
ATA
...
...
...
...
...
..G
...
..G
...
...
CAC
...
...
...
...
...
...
...
...
...
...
TAC
...
...
...
...
...
..T
...
...
..T
...
GAC
...
...
...
...
...
..T
...
...
...
...
264
GAA
...
...
...
...
...
...
...
...
..G
...
330
ACA
...
...
...
...
...
...
...
...
...
...
396
TTC
...
..T
...
...
...
...
...
...
...
...
Evolução de COII em Cracidae
126
GCT
..C
..C
..C
..C
...
...
..C
...
...
...
CGA
...
...
...
...
...
...
...
...
...
...
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
CTT
...
...
...
...
..C
..C
...
..C
...
...
GAT
...
..C
..C
..C
...
...
..C
...
..C
...
TTA
...
C..
C..
C..
C..
C.G
C..
C..
C..
...
AAC
...
...
...
...
...
...
...
...
...
...
GAC
...
...
...
...
..T
...
...
...
...
...
TTA
...
C..
C..
C..
C..
C..
C..
...
C..
...
Figura 1. Continuação.
CGA
...
...
...
...
...
...
...
...
...
...
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
CAA
...
...
...
...
...
...
...
...
...
...
GTA
..G
...
...
...
...
...
...
...
...
...
GAA
...
...
...
...
...
...
...
...
...
...
ACC
...
..T
..T
..T
...
..T
..T
...
...
...
CTT
...
..C
..C
..C
..C
..C
..C
...
...
...
GTA
...
..T
..T
..T
...
..T
..T
...
...
...
TCC
...
...
...
...
...
...
...
...
...
...
CAC
...
...
...
...
...
...
...
...
...
...
GAC
...
..T
..T
..T
..T
..T
..T
...
..T
...
TTC
...
...
...
...
..T
...
...
...
...
...
TCC
...
..T
..T
..T
..T
...
..T
...
...
...
CAC
...
..T
..T
...
...
...
..T
...
...
...
GTT
A..
A..
A..
A..
A..
A..
A.C
A..
A..
A..
TGA
...
...
...
...
...
...
...
...
...
...
CGC
...
...
...
...
...
...
...
...
...
...
ACC
...
..T
...
...
...
...
...
...
...
...
GCT
...
..A
..C
..C
...
...
...
...
...
...
ATC
...
..T
..T
..T
...
...
..T
...
..T
...
ACT
...
...
...
...
...
...
...
...
...
...
GTA
...
..G
...
...
...
...
..G
...
...
...
GTA
...
...
...
...
...
...
...
...
...
...
CGA
...
..G
..G
..G
...
...
..G
...
..G
...
CCT
..C
..C
..C
...
...
...
..C
...
..C
...
ATC
G..
G..
G..
G..
G.T
G..
G..
G..
...
G..
CCT
...
...
...
...
...
...
...
...
...
...
ACC
...
...
..T
..T
..T
...
..T
...
..T
...
CCC
..T
..T
...
..T
..T
...
...
...
..T
..T
GGG
...
...
...
...
...
...
...
...
...
...
CTC
...
...
...
...
...
...
...
...
...
...
ATA
...
...
...
...
..G
...
...
...
...
...
ATT
...
...
...
...
...
...
...
...
...
...
GGA
...
...
...
...
...
...
...
...
...
...
GAA
...
...
..G
...
...
...
...
...
...
...
TTT
...
...
...
...
...
...
...
...
...
...
GTC
...
A.T
A.T
A.T
..T
..T
A.T
...
...
...
TCC
...
...
...
...
...
...
...
...
...
...
TAC
...
...
...
...
...
...
...
...
...
...
AAA
...
...
...
...
...
...
...
...
...
...
CCC
...
...
...
...
...
...
...
...
...
..T
GGA
...
...
...
...
..G
...
...
...
...
...
ACA
...
...
...
...
...
...
...
...
...
...
ATC
...
...
...
...
...
...
...
...
...
...
CAG
...
...
...
...
...
..A
...
...
...
...
GAC
...
...
...
...
...
...
...
...
...
...
CGA
...
...
...
...
...
...
...
...
...
...
TGC
...
...
...
...
...
...
...
...
...
...
GCA
...
...
...
...
...
...
...
...
...
...
GTT
...
...
...
...
...
...
..A
...
...
...
TCG
..A
..A
..A
..A
..A
..A
..A
...
..A
..A
ATC
...
...
...
...
...
...
...
...
...
...
ATC
..T
...
...
...
...
...
...
...
...
...
GAA
...
...
...
...
...
...
...
...
...
...
CCA
...
...
...
...
...
...
...
...
...
...
ATT
...
G.C
G.C
..C
..C
..C
..C
..C
G..
..C
462
ACA
...
..T
..C
..T
..T
..C
..C
...
...
...
528
GGC
...
...
...
...
...
...
...
...
...
...
594
ATC
...
...
...
...
...
...
...
...
...
...
Evolução de COII em Cracidae
127
TGA
...
...
...
...
...
...
...
...
...
...
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
TCT
..C
..C
...
..C
...
...
..C
...
...
...
GGA
...
..G
..G
..G
..G
...
..G
..G
...
...
ACA
...
..C
..C
..T
...
...
..C
...
...
...
GCC
...
..T
..T
..T
...
..T
..T
...
...
...
Figura 1. Continuação.
TGT
..C
...
..C
..C
..C
...
..C
...
..C
...
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
CTG
...
...
...
...
...
...
...
...
...
...
AAT
...
..C
..C
..C
..C
..C
..C
...
..C
...
CTA
...
...
T..
T..
...
...
...
...
...
T..
CAC
...
...
...
...
...
...
...
...
...
...
TCA
...
...
...
...
...
...
...
...
...
...
AGC
...
...
...
...
...
...
...
...
...
...
TCC
..T
..T
C.T
..T
...
..T
..T
...
..T
...
TAC
...
...
...
...
...
...
...
...
..T
...
684
TAA
...
...
...
...
...
...
...
...
...
...
ATG
...
...
...
...
..A
...
...
..A
..A
...
CCC
...
..T
..T
..T
...
..T
..T
..A
..T
...
ATC
...
...
...
...
...
...
...
...
...
...
GTA
...
...
...
...
...
..G
...
...
...
...
GTA
...
...
...
...
...
...
...
...
...
...
GAA
...
...
...
...
...
...
...
...
...
...
TCT
..C
..C
..C
..C
..C
...
..C
...
...
...
ACT
..C
G..
...
...
..C
G.C
...
...
...
...
CCC
...
...
...
...
...
..T
...
...
..T
...
CTC
.C.
...
...
...
...
...
...
..T
...
...
AAG
...
...
...
..A
...
...
...
..A
...
...
CAC
..T
...
...
...
...
...
...
...
...
...
TTC
.C.
..T
..T
..T
..T
..T
..T
...
...
...
GAA
...
...
...
...
...
...
...
...
...
...
660
GCC
...
...
...
...
...
...
...
...
...
...
Evolução de COII em Cracidae
128
Evolução de COII em Cracidae
Composição de bases e padrões de substitutição de nucleotídeos
A composição de bases para toda a sequência de COII de cracídeo e para cada
uma das posições do códon é apresentada na tabela 1. Estas seqüências se mostraram
homogêneas quanto à composição de bases (χ2=2,23, g.l..=30, P=1,00). A hipótese de
composição de bases estacionária não foi rejeitada (P=0,72) ao nível de significância de
0,05 (P=0,94, 1,0, e 0,53, respectivamente para a primeira, segunda e terceira posições do
códon).
Tabela 1. Composição de bases (%) para representantes de onze gêneros de Cracidae.
Gênero
Todas as posições
1a posição do códon
A
T
C
G
A
T
C
G
Aburria
30.3
23.5
31.9
14.3
24.6
19.7
27.2
28.5
Chamaepetes
29.8
22.2
33.2
14.8
24.6
19.3
27.6
28.5
Crax
30.0
24.1
31.3
14.6
24.1
19.3
27.6
28.9
Mitu
29.5
23.7
31.9
14.9
24.6
19.7
27.2
28.5
Nothocrax
30.4
23.8
31.7
14.0
25.4
19.7
27.2
27.6
Oreophasis
29.4
23.4
32.0
15.2
24.6
19.3
27.6
28.5
Ortalis
29.4
24.0
31.7
14.9
24.1
18.0
28.9
28.9
Pauxi
30.0
23.4
32.0
14.6
25.0
19.3
27.6
28.1
Penelope
30.1
24.0
31.3
14.6
24.1
19.7
27.2
28.9
Penelopina
29.8
24.3
31.3
14.6
24.6
19.7
27.2
28.5
Pipile
30.1
23.8
31.6
14.5
24.6
20.2
26.8
28.5
Média
29.9
23.7
31.8
14.6
24.6
19.5
27.5
28.5
Gênero
2a posição do códon
3a posição do códon
A
T
C
G
A
T
C
G
Aburria
27.6
36.4
25.9
10.1
38.6
14.5
42.5
4.4
Chamaepetes
27.6
35.5
26.8
10.1
37.3
11.8
45.2
5.7
Crax
27.6
36.4
25.9
10.1
38.2
16.7
40.4
4.8
Mitu
27.6
36.4
25.9
10.1
36.4
14.9
42.5
6.1
Nothocrax
27.6
36.4
25.9
10.1
38.2
15.4
42.1
4.4
Oreophasis
27.6
36.4
25.9
10.1
36.0
14.5
42.5
7.0
Ortalis
27.6
36.4
25.9
10.1
36.4
17.5
40.4
5.7
Pauxi
27.6
36.4
25.9
10.1
37.3
14.5
42.5
5.7
Penelope
27.6
36.4
25.9
10.1
38.6
15.8
40.8
4.8
Penelopina
27.6
36.4
25.9
10.1
37.3
16.7
40.8
5.3
Pipile
27.6
36.4
25.9
10.1
38.2
14.9
42.1
4.8
Média
27.6
36.3
26.0
10.1
37.5
15.2
42.0
5.3
O gene da COII de Cracidae possui composição de bases enviesada. O índice de
enviesamento composicional foi de 0.069 considerando todas as posições do códon
(tabela 2). A primeira posição do códon apresentou uma leve diferença na composição de
bases, com aumento do conteúdo de G e redução de T (EC=0,079). A segunda posição
129
Evolução de COII em Cracidae
possui alto conteúdo de T e baixo de G (EC=0,198). As maiores diferenças são
observadas na terceira posição (EC=0,393).
O gene da COII de Cracidae apresentou heterogeneidade de taxa de substituição
entre os sítios (α=0,16 para todas as posições do códon; α= 0,07; 97,03 e 2,41 para a
primeira, segunda e terceira posição do códon, respectivamente).
Tabela 2. Índices de enviesamento composicional estimados para cada posição do códon do
gene da COII de Cracidae e de outros grupos de metazoários.
Grupo
1a
2a
3a
Referência
Cracidae (11 espécies)
0.079
0.198
0.393
Este estudo
Primatas (25 espécies)
0.065
0.185
0.292
Adkins e Honeycutt, 1994
Insetos Pterigotos (13 espécies)
0.175
0.233
0.490
Liu e Beckenbach, 1992
Collembola (15 espécies)
0.092
0.185
0.285
Frati et al., 1997
As transições TC superaram as transições AG, e as transversões entre CG foram
raras e TG não foram observadas (tab. 3). A segunda posição do códon é altamente
conservada. De fato, apenas duas substituições de nucleotídeos ocorreram (Chamaepetes
apresentou um T ao invés de um C nas posições 664 e 653). A primeira e a terceira
posição do códon tem taxas intermediárias e altas de substituição de nucleotídeos, como
observado para outros genes mitocondriais.
A figura 2 apresenta graficamente o número de transições e transversões para cada
comparação par-a-par entre as 11 espécies de Cracidae estudadas aqui. Claramente, o
nível de saturação das substituições no gene da COII não foi alcançado. Nenhuma
transversão foi observada na primeira e na segunda posição do códon. A terceira posição
apresentou 278 transversões. O número de transições observados para a primeira, segunda
e terceira posições do códon foram 370, 20, e 2201, respectivamente.
A razão de transição/transversão (TS/TV) para o COII de cracídeos foi de 18,03.
As comparações par-a-par para táxons mais proximamente relacionados tiveram razões
TS/TV maiores do que para táxons mais distantemente relacionados, como por exemplo,
25,0 para Aburria-Penelope (gêneros próximos) e 8,4 para Aburria-Mitu (gêneros
distantes)(Tab. 3).
130
Evolução de COII em Cracidae
Tabela 3. Razão de transição/transversão (TS/TV), número de transições (AG, TC) e transversões (AT, AC, TG, CG) observadas para cada comparação par-apar em onze gêneros de Cracidae. * - nenhuma transversão foi encontrada nestes casos, e a razão TS/TV não foi calculada.
Comparação
TS/TV
AG TC
AT
AC
TG
CG
Comparação
TS/TV
AG TC
AT
AC
TG
CG
Aburria-Chamaepetes
*
9
27
0
0
0
0
Mitu-Nothocrax
*
8
17
0
0
0
0
Aburria-Crax
6.625
12
41
5
3
0
0
Mitu-Oreophasis
9.600
14
34
2
3
0
0
Aburria-Mitu
8.429
13
46
2
4
1
0
Mitu-Ortalis
18.667
18
38
0
3
0
0
Aburria-Nothocrax
7.571
14
39
5
2
0
0
Mitu-Pauxi
21.000
6
15
1
0
0
0
Aburria-Oreophasis
8.000
16
32
3
3
0
0
Mitu-Penelope
8.125
15
50
3
4
1
0
Aburria-Ortalis
8.667
12
40
3
3
0
0
Mitu-Penelopina
6.875
13
42
1
6
1
0
Aburria-Pauxi
6.875
12
43
4
4
0
0
Mitu-Pipile
8.286
12
46
2
4
1
0
Aburria-Penelope
25.000
10
15
0
1
0
0
Nothocrax-Oreophasis
8.000
14
26
3
2
0
0
Aburria-Penelopina
45.000
10
35
0
1
0
0
Nothocrax-Ortalis
16.000
18
30
1
2
0
0
Aburria-Pipile
*
5
8
0
0
0
0
Nothocrax-Pauxi
18.000
4
14
1
0
0
0
Chamaepetes-Crax
6.750
11
43
4
4
0
0
Nothocrax-Penelope
7.125
14
43
6
2
0
0
Chamaepetes-Mitu
8.571
12
48
1
5
1
0
Nothocrax-Penelopina
7.375
16
43
4
4
0
0
Chamaepetes-Nothocrax
7.714
13
41
4
3
0
0
Nothocrax-Pipile
7.143
13
37
5
2
0
0
Chamaepetes-Oreophasis 8.167
13
36
2
4
0
0
Oreophasis-Ortalis
9.333
18
38
2
4
0
0
Chamaepetes-Ortalis
10.500
15
48
2
4
0
0
Oreophasis-Pauxi
7.500
12
33
3
3
0
0
Chamaepetes-Pauxi
6.500
11
41
3
5
0
0
Oreophasis-Penelope
7.571
16
37
3
4
0
0
Chamaepetes-Penelope
45.000
13
32
0
1
0
0
Oreophasis-Penelopina 7.857
18
37
3
4
0
0
Chamaepetes-Penelopina 45.000
11
34
0
1
0
0
Oreophasis-Pipile
7.833
15
32
3
3
0
0
Chamaepetes-Pipile
*
8
27
0
0
0
0
Ortalis-Pauxi
12.250
16
33
1
3
0
0
Crax-Mitu
25.000
6
19
0
1
0
0
Ortalis-Penelope
7.429
16
36
4
3
0
0
Crax-Nothocrax
20.000
8
12
0
1
0
0
Ortalis-Penelopina
9.143
18
46
2
5
0
0
Crax-Oreophasis
8.000
14
34
3
3
0
0
Ortalis-Pipile
8.833
11
42
3
3
0
0
Crax-Ortalis
11.500
14
32
1
3
0
0
Pauxi-Penelope
6.778
14
47
5
4
0
0
Crax-Pauxi
9.500
4
15
2
0
0
0
Pauxi-Penelopina
6.111
14
41
3
6
0
0
Crax-Penelope
6.556
14
45
6
3
0
0
Pauxi-Pipile
7.000
11
45
4
4
0
0
Crax-Penelopina
6.556
12
47
4
5
0
0
Penelope-Penelopina
24.500
12
37
1
1
0
0
Crax-Pipile
6.500
11
41
5
3
0
0
Penelope-Pipile
24.000
9
15
0
1
0
0
Penelopina-Pipile
48.000
11
37
0
1
0
0
131
Evolução de COII em Cracidae
70
60
Transição
50
40
30
20
10
0
0
2
4
6
8
10
Transversão
Figura 2. Relação entre transição e transversão para todas as comparações par-a-par entre os
gêneros de Cracidae.
A hipótese de constância de taxa de substituição entre os gêneros de Cracidae não
foi rejeitada ao nível de 5% (Z = 0,630923). Então, a taxa evolutiva para as seqüências de
COII de cracídeos foi estimada em 0,68% substituições por sítio por milhão de anos.
Uso preferencial de códons
A tabela 4 mostra a frequência média dos códons e o uso relativo de códons
sinônimos (RSCU) para o gene COII de Cracidae. Podemos observar que os códons para
a leucina terminados em G foram raramente usados. O mesmo é verdadeiro para a
alanina. Este aminoácidos representam casos de códons bi e tetradegenerados.
Todas as seqüências de COII dos gêneros de Cracidae iniciam com ATG (um dos
dois códons para a metionina). Dos quatros códons de parada do genoma mitocondrial de
mamíferos, apenas TAA é usado para terminar a transcrição de COII nos representantes
dos onze gêneros de Cracidae estudados aqui.
132
Evolução de COII em Cracidae
Tabela 4. Frequencia média dos códons (f) e uso relativo de códons
sinônimos ("average codon frequencies and relative synonymous codon
usage"-RSCU) para a COII de Cracidae. Os aminoácidos (aa) estão
representados de acordo com o código de três letras. Stop representa os
códons de parada.
aa
codon
f (RSCU)
aa
codon
f (RSCU)
Phe
TTT
2.5 (0.64)
Ser
TCT
2.2 (0.72)
TTC
5.4 (1.36)
TCC
7.5 (2.47)
Leu
TTA
3.2 (0.62)
TCA
6.1 (2.02)
TTG
0.2 (0.04)
TCG
0.4 (0.12)
CTT
5.0 (0.97)
Pro
CCT
3.0 (0.92)
CTC
7.9 (1.54)
CCC
5.1 (1.56)
CTA
12.7 (2.47)
CCA
4.9 (1.50)
CTG
1.9 ( 0.37)
CCG
0.0 (0.03)
Ile
ATT
5.3 (0.55)
Thr
ACT
4.8 (1.23)
ATC
13.9 (1.45)
ACC
6.9 (1.76)
Met
ATA
7.8 (1.56)
ACA
3.9 (0.99)
ATG
2.2 (0.44)
ACG
0.0 (0.02)
Val
GTT
2.9 (0.79)
Ala
GCT
2.7 (0.76)
GTC
3.3 (0.88)
GCC
8.9 (2.50)
GTA
7.9 (2.13)
GCA
2.6 (0.74)
GTG
0.7 (0.20)
GCG
0.0 (0.00)
Tyr
TAT
1.1 (0.27)
Cys
TGT
0.5 (0.36)
TAC
6.9 (1.73)
TGC
2.5 (1.64)
Stop
TAA
1.0 (4.00)
Trp
TGA
4.9 (1.96)
Stop
TAG
0.0 (0.00)
TGG
0.0 (0.04)
His
CAT
1.2 (0.26)
Arg
CGT
0.0 (0.00)
CAC
7.8 (1.74)
CGC
1.0 (0.80)
Gln
CAA
6.3 (1.57)
CGA
3.5 (2.84)
CAG
1.7 (0.43)
CGG
0.5 (0.36)
Asn
AAT
0.7 (0.36)
Ser
AGT
0.0 (0.03)
AAC
3.3 (1.64)
AGC
1.9 (0.63)
Lys
AAA
3.7 (1.46)
Stop
AGA
0.0 (0.00)
AAG
1.4 (0.54)
Stop
AGG
0.0 (0.00)
Asp
GAT
2.5 (0.35)
Gly
GGT
0.0 (0.05)
GAC
11.5 (1.65)
GGC
2.0 (1.00)
Glu
GAA
12.5 (1.80)
GGA
4.3 (2.14)
GAG
1.4 (0.20)
GGG
1.6 (0.82)
Inferência das seqüências de aminoácidos
A seqüência de aminoácido da subunidade II da citocromo c oxidase (fig. 3) foi
inferida a partir das seqüências de nucletídeos. A seqüência de aminoácidos é altamente
conservada entre os onze gêneros de Cracidae. Apenas 11 resíduos são váriáveis e destes
apenas 4 são parcimoniosamente informativos. A maioria das substituições de
aminoácidos foi observada na extremidade 3’ da seqüência.
Comparadas às seqüências de COII das espécies de primatas e insetos, as
seqüências de aminoácidos de COII de Cracidae, de outras aves, do crocodilo e da
133
Evolução de COII em Cracidae
tartaruga apresentam uma deleção de um aminoácido na posição 30, e uma inserção de
um aminoácido na extremidade 3’. A posição real desta inserção não pode ser
precisamente inferida, uma vez que a região entre os aminoácidos 225 e 227 apresentam
uma alta variação de nucleotídeos, dificultando a determinação precisa de homologia
posicional entre os nucleotídeos.
Este evento de inserção/deleção na posição 30 da seqüência de aminoácido faria
com que as posições conservadas como limites dos domínios transmembrânicos, posições
dos aminoácidos ligados ao cobre, e outras posições de aminoácidos tivessem a
numeração deslocada em um número a menos nos cracídeos e nas outras aves do que em
relação à numeração descrita no modelo estrutural esquemático proposto por Millet et al.
(1983). Para evitar conflitos, a numeração dada pelo modelo de Millet e colaboradores foi
mantida, apesar dos aminoácidos nas posições entre 30 e 227 na seqüência do COII de
Cracidae estarem na realidade uma posição aquém da correspondente no modelo
estrutural; este procedimento possibilitou a comparação dos dados apresentados com os
existentes na literatura.
Nossos resultados mostraram que a alça N-terminal é altamente conservada entre
os Cracidae. Apenas Nothocrax possui uma substituição no resíduo 18, devido a uma
mudança de um nucleotídeo G para A na posição 52, correspondente à primeira posição
de um códon (Fig. 1). Isto provoca uma modificação de um resíduo ácido Glu presente na
maioria das espécies para um resíduo básico Lis.
Todos os 15 e 18 sítios de nucleotídeos que são variávies no domínios
transmembrânicos I e II, e 10 nucleotídeos do segmento entre estes dois domínios
levaram a substituições sinônimas de aminoácidos. O domínio globular C-terminal possui
10 substituições de aminoácidos, todas envolvendo mudanças de e para resíduos neutros.
134
QILYMMDEID
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
SWAVPTLGVK
..........
........I.
........I.
........I.
..........
..........
........I.
..........
..........
..........
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
TDAIPGRLNQ
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
EPDLTLKAIG
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
DASSPIMEEL
..........
..........
..........
.......K..
..........
..........
..........
..........
..........
..........
TSFVTTRPGI
...I......
...I......
...I......
...I......
...I......
...I......
...I......
...I......
...I......
...I......
HQWYWTYEYT
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
VEFHDHALMV
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
FYGQCSEICG
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
DFKDLSFDSY
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
ALAICSLVLY
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
ANHSYMPIVV
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
MIPTTDLPQG
..........
..........
.......S..
..........
..........
..........
..........
....A.....
..........
..........
LLTLMLMEKL
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
ESTPLKHFEA
....P..S..
..A.......
..........
..........
..........
..A.......
..........
..........
..........
..........
HFRLLEVDHR
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
SSNTVDAQEV
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
WSTLLSS*
........
........
......P.
........
........
........
........
........
........
........
IVIPMESPIR
..V.......
..V.......
..V.......
..V.......
..V.......
..V.......
..V.......
..V.......
..........
..V.......
ELIWTILPAI
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
VIITADDVLH
..........
..V.......
..V.......
..........
..........
..........
..........
..........
..V.......
..........
VLILLALPSL
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
Figura 3. Seqüência de aminoácidos para a subunidade II da citocromo c oxidase inferidos a partir das seqüências de nucleotídeos da figura 1.
MANHSQLGFQ
..........
..........
..........
..........
..........
..........
..........
..........
..........
..........
Aburria
Chamaepetes
Crax
Mitu
Nothocrax
Oreophasis
Ortalis
Pauxi
Penelope
Penelopina
Pipile
Evolução de COII em Cracidae
135
Evolução de COII em Cracidae
Discussão
As seqüências do gene da subunidade II da citocromo c oxidase para os onze
representantes da família Cracidae e um representante de Megapodiidae apresentaram um
comprimento total de 648 nucleotídeos. Variações neste tamanho foram observadas nas
aves ratitas Rhea americana (Harlid et al., 1998) e Struthio camelus (Harlid et al., 1997)
onde havia três nucleotídeos extras na extremidade 3'. Diversas seqüências completas de
COII de primatas também apresentaram o mesmo tamanho que as de cracídeos, embora
as seqüências de Alouatta e Lagothrix apresentaram 12 nucleotídeos a mais, também na
extremidade 3' (Adkins e Honeycutt, 1994).
A extremidade 3’ da COII em diversas espécies de insetos Collembola também
apresentaram inserção de nucleotídeos, variando o tamanho do gene entre 669 e 684
nucleotídeos (Frati et al., 1997). Além disso, Frati et al. (1997) relataram que entre as
posições correspondentes aos aminoácidos 120-133 há eventos de inserção e deleção de
nucleotídeos. Parece que estas regiões do gene da COII em metazoários não estão sujeita
a forte seleção e portanto estão mais sujeitas à variação.
Contudo, de maneira geral, o gene da citocromo c oxidase II é bastante
conservado, como seria esperado para um gene codificante de uma proteína altamente
conservada da cadeia respiratória de plantas, animais, e protistas (Stryer, 1995).
Padrão de substituição de nucleotídeos
O padrão de substituição de bases da subunidade II do gene da citocromo c
oxidase em cracídeos é similar ao padrão observado em outros metazoários (Adkins e
Honeycutt, 1994; Liu e Beckenbach, 1992; Frati et al., 1997; Brown, 1985; Janecek et al.,
1996): a composição de bases é enviesada, especialmente na terceira posição do códon,
estacionária, e considerável heterogeneidade de taxas de substituição entre os sítios foi
detectada. O nível de saturação de substituições entre as espécies de cracídeos aqui
analisadas não foi atingido, o que reflete em uma alta razão de TS/TV o que é esperado
para táxons filogeneticamente próximos. Estes dados aumentam o corpo de evidências de
que o DNA mitocondrial evolui de uma maneira complexa.
136
Evolução de COII em Cracidae
A taxa de evolução estimada para as sequências de COII em Cracidae
(0,68%/sítio/Ma) é similar a taxa estimada para algumas espécies de bovinos (variação de
0,76 a 2,64%; Janecek et al., 1996), Contudo, salientamos que a estimativa de taxas de
evolução é um assunto bastante controverso e que ainda não foi criteriosamente
explorado. Por exemplo, diferentes autores empregam diferentes calibrações para as
substituições de nucleotídeos: Klicka e Zink (1997) estimaram que o DNA mitocondrial
apresenta uma taxa de substituição de 2% por milhão de anos para táxons com
divergência até 10 milhões de anos, baseado em dados de fragmentos de restrição; Irwin
et al. (1991) estimaram que seqüências do cit b que apresentam saturação de transições,
evoluem a uma taxa de cerca de 0,5% de transversões na terceira posição do códon por
milhão de anos; Janecek et al. (1996) se basearam em dados paleontológicos bem
estabelecidos (Savage e Russel, 1983) para calibrar a taxa de evolução de COII em
bovinos.
Salientamos que as estimativas de taxas de substituição nucleotídicas realizadas
em diferentes estudos é de difícil comparação, e que, até que este assunto seja
devidamente explorado, as estimativas deveriam somente ser realizadas entre diferentes
genes de um mesmo grupo de organismos com a finalidade de avaliar a taxa de evolução
relativa entre estes genes, como realizado no capítulo 5 desta tese.
Embora a seqüência do COII de Megapodius apresente aspectos similares aos
descritos no parágrafo anterior, o primeiro codon em sua seqüência é GTG (Valina),
também encontrado em COII das aves ratitas (Harlid et al., 1997,1998; Mindell et al.,
1999). Nos demais organismos comparados neste estudo, o códon inicial é ATG
(Metionina). Padrões similares de iniciação da transcrição usando códons não-ATG já
foram relatados para outros genes mitocondriais em diferentes organismos (Zardoya e
Meyer, 1997; Desjardins e Moraes, 1990; Janke et al., 1994; e referências citadas nestes
trabalhos).
Padrão de substituição de aminoácidos e uso de códons
A maioria das mudanças de nucleotídeos ocorridas no COII de Cracidae levou a
substituições sinônimas, especialmente na porção 3'. As poucas mudanças de
137
Evolução de COII em Cracidae
aminoácidos ocorridas é caracterizada por trocas entre aminoácidos fisicoquimicamente
semelhantes, exceto no resíduo 18 de Nothocrax que apresenta uma lisina, um
aminoácido básico, ao invés de uma glutamina, um resíduo ácido. Outros metazoários
analisados não apresentaram modificação de aminoácido nesta posição (Adkinks e
Honeycutt, 1994; Desjardins e Morais, 1990; Frati et. al., 1997; Emerson e Wallis, 1995;
Harlid e Arnason, 1999; Janecek et al., 1996; Mindell et al., 1998; Harlid et al., 1997,
1998).
A deleção de um resíduo na posição 30 da seqüência de aminoácidos parece não
interferir no funcionamento da citocromo oxidase, uma vez que todas as aves analisadas,
o crocodilo, e a tartaruga não apresentam este aminoácido quando comparado com os
primatas (Alanina, Isoleucina, e Treonina) e insetos (Isoleucina).
Todas as substituições de nucleotídeos ocorridas nas duas alfa-hélices
correspondentes ao modelo estrutural de Capaldi et al (1973) mostraram substituições
sinônimas em cracídeos. O mesmo foi encontrado em insetos Collembola (Frati et al.,
1997) e em mamíferos membros da subfamília Bovinae (Janecek et al., 1996), mas não
em comparações entre diferentes famílias de primatas (Adkins e Honeycutt, 1984),
embora a hidrofobicidade seja mantida neste domínio transmembrânico.
A região rica em triptofano entre os resíduos 104-110 também foi identificada em
Cracídeos no presente estudo, assim como nos demais metazoários.
Dos resíduos considerados conservados no domínio globular C-terminal, apenas
Glu-114 não está presente no COII de cracídeos. De fato, outros aminoácidos foram
propostos serem substitutos. Um deles, o resíduo Glu-109 é conservado em insetos,
mamíferos e nos cracídeos. Outro resíduo, Glu-117, é conservado em Collembola, mas
não em outros insetos (serina, ácido aspártico), mamíferos (diversos aminoácidos) e nas
aves (alanina, serina, treonina). Um terceiro candidato, Asp-119, é conservado apenas em
Collembola (Frati et al., 1997), Cracidae e outras aves (Harlid e Arnason, 1999; Mindell
et al., 1998; Desjardins e Morais, 1990; Harlid et al., 1997, 1998), e em alguns mamíferos
(Janecek et al., 1996). Possivelmente diferentes grupos animais "elegeram" diferentes
resíduos para serem substitutos do resíduo Glu-114. Uma outra possibilidade é que
138
Evolução de COII em Cracidae
apenas os resíduos Asp-112 e Asp-158 sejam críticos para o funcionamento do centro
ativo.
Dos resíduos propostos de estarem envolvidos na ligação com o íon de cobre no
modelo estrutural do COII, todos se mostraram conservados em Cracidae (presente
estudo), em outras aves e répteis (Harlid e Arnason, 1999; Mindell et al., 1998;
Desjardins e Morais, 1990; Harlid et al., 1998; Harlid et al., 1997; Janke e Arnason,
1997, Mindell et al., 1999), mamíferos (Adkins e Honeycutt, 1994; Capaldi et al., 1990;
Janecek et al., 1996; Millet 1983), artrópodos (Frati et al., 1997; Duering et al., 1999),
em um molusco (Lecanidou et al., 1994), e bacterias (Iwata et al., 1995). O primata
Theropithecus (Adkins e Honeycutt, 1994) e bovinos (Janecek et al., 1996) são uma
exceção, pois apresentam uma substituição de His-200 por Glu.
A estimativa do uso relativo de códons sinônimos mostrou que há a preferência
pelo uso de certos códons no COII de Cracidae, como os terminados em G para a leucina
e o códon GCG para a alanina. A preferência do uso destes códons bi ou tetradegenerados
foi detectada também em outros organismos. De fato, eucariotos e procariotos mostram
este padrão preferencial (e.g., Brown, 1985 Li, 1997; Grahtham et al., 1980; Janecek et
al., 1996).
Quanto aos códons de iniciação de tradução, todos as sequências de cracídeos
obtidas mostraram que o COII é iniciado pelo códon ATG, similar ao usado por muitos
outros grupos vertebrados (por exemplo, Adkins e Honeycutt, 1994; Delarbre et al., 1998;
Desjardins e Morais, 1990; Duering et al., 1999; Janecek et al., 1996; Kumazawa et al.,
1998; Mindell et al., 1999; Zardoya e Meyer, 1998; Zardoya e Meyer, 1997). Contudo,
outras aves como o megapodídeo Megapodius reinwardt usado neste trabalho e as ratitas
(Harlid et al., 1997, 1998), e o hemicordata Balanoglossus carnosus (Castrenata et al.,
1998) apresentam GTG e os crocodilos ATA (Janke e Arnason, 1997; Mindell et al.,
1999) como primeiro códon da sequência. Entre os insetos (Collembola) também há
variação de códons iniciais para este gene (ATC, ATT, ATA), não sendo relatado o uso
de ATG ou GTG (Frati et al., 1997). Em genes nucleares de mamíferos, outros códons
além do ATG parecem ser os iniciais da transcrição (Hann et al., 1988; Peabody, 1989).
139
Evolução de COII em Cracidae
Igualmente às outras aves (Mindell et al., 1998; Desjardins e Morais, 1990; Harlid
et al., 1997, 1998), mamíferos placentários (Janecek et al., 1996) e muitos insetos
artrópodos (Frati et al., 1997), o códon de terminação presente nas sequências de
cracídeos foi TAA, constrastando com o códons T ou TA incompletos para este gene
encontrado em peixes ósseos e cartiloginosos (por exemplo, Zardoya e Meyer, 1997;
Delarbre et al., 1998), répteis (Kumazawa et al., 1998; Zardoya e Meyer, 1998) e
mamíferos marsupiais (por exemplo, Janke et al., 1994, 1997), que se acredita ocorrer
poliadenilação para transformá-lo em um códon completo de terminação (Ojala et al.,
1981).
Nossos resultados mostraram que as sequências da subunidade II da citocromo c
oxidase de cracídeos são similares às de outros grupos de Aves, e que a variação entre as
Aves parece ser menor do que a relatada para outros grupos animais.
Referências
Adachi J, Hasegawa M (1994). MOLPHY, Molecular Phylogenetics. Version 2.2
Adkins RM, Honeycutt RL (1994). Evolution of the primate cytochrome c oxidase subunit II
gene. J. Mol. Evol. 38: 215-231.
Brown WM (1985). The mitochondrial genome of animals. In: "Molecular Evolutionary
Genetics", RJ MacIntyre. Plenum Press, New York. pp 95-130.
Capaldi RA (1990). Structure and function of cytochrome c oxidase. Annu. Rev. Biochem. 59:
569-596.
Capaldi RA, Malatesta F, Darley-Usmar VM (1983). Structure of cytochrome c oxidase.
Biochimica et Biophysica Acta 726: 135-148.
Castresana J, Feldmaier-Fuchs G, Yokobori S, Satoh N, Pääbo S (1998). The mitochondrial
genome of the hemichordate Balanoglossus carnosus and the evolution of deuterostome
mitochondria. Genetics 150: 1115-1123.
Collar NJ, Gonzaga LP, Krabbe N, Madroño Nieto A, Naranjo LG, Parker III TA, Wege DC
(1992). "Threatened birds of the Americas. The ICBP/IUCN Red Data Book". 3rd Edition,
part 2. Smithsonian Institution Press.
Delarbre C, Spruyt N, Delmarre C, Gallut C, Barriel V, Janvier P, Laudet V, Gachelin G (1998).
The complete nucleotide sequence of the mitochondrial DNA of the dogfish, Scyliorhynus
canicula. Genetics 150: 331-344.
140
Evolução de COII em Cracidae
Desjardins P, Morais R (1990). Sequence and gene organization of the chicken mitochondrial
genome. A novel gene order in higher vertebrates. J. Mol. Biol. 212: 599-634.
Duering A, Brueckner M, Mossakowski D (1999). Differences between gene tree and organismal
tree? Mitochondrial genes and the phylogenetic relationships of the Chrysocarabus species.
Mitt. Dtsch. Ges. Allg. Entomol. in press.
Emerson BC, Wallis GP (1995). Phylogenetic relationships of the Prodontia (Coleptera:
Scarabaeidae; Subfamily Melolonthinae), derived from sequence variation in the
mitochondrial cytochrome oxidase II gene. Mol. Phylogenet. Evol. 4: 433-447.
Frati F, Simon C, Sullivan J, Swofford DL (1997). Evolution of the mitochondrial oxidase II
gene in Collembola. J. Mol. Evol. 44: 145-158.
Grantham R,Gautier C, Gouy M, Mercier R, Pave A (1980). Codon catalog usage and the
genome hypothesis. Nucleic Acids Res. 8: r49-r62.
Hann SR, King MW, Bentley DL, Anderson CW, Eisenman RN (1988). A non-AUG
translational initiation in c-myc exon 1 generates a N-terminally distinct protein whose
synthesis is disrupted in Burkitt's lymphomas. Cell 52: 185-195.
Harlid A, Arnason U (1999). Analyses of mitochondrial DNA nest ratite birds within the
Neognathae-supporting a neotenous origin of ratite morphological characters. Proc. R. Soc.
Lond. B266: 305-309.
Harlid A, Janke A, Arnason U (1998). The complete mitochondrial genome of Rhea americana
and early avian divergences. J. Mol. Evol. 46: 669-679.
Harlid A, Janke A, Arnason U (1997). The mtDNA sequence of the ostrich and the divergence
between paleognathous and neognathous birds. Mol. Biol. Evol. 14: 754-761.
Honeycutt RL, Nedbal MA, Adkins RM, Janecek LL (1995). Mammalian mitochondrial DNA
evolution: a comparison of the cytochrome c oxidase II genes. J. Mol. Evol. 40: 260-272.
Irwin DM, Kocher TD, Wilson AC (1991). Evolution of the cytochrome b gene of mammals. J.
Mol. Evol. 32:128-144.
Iwata S, Ostermeier C, Ludwig B, Michel H (1995). Structure at 2.8Å resolution of cytochrome c
oxidase from Paracoccus denitrificans. Nature 376: 660-669.
Janecek LL, Honeycutt RL, Adkins RM, Davis SK (1996). Mitochondrial gene sequences and the
molecular systematics of the artiodactyl subfamily Bovinae. Mol. Phylog. Evol. 6: 107-119.
Janke A, Arnason U (1997). The complete mitochondrial genome of Alligator mississippiensis
and the separation between recent archosauria (birds and crocodiles). Mol. Biol. Evol. 14:
1266-1272.
141
Evolução de COII em Cracidae
Janke A, Feldmaier-Fuchs G, Thomas WK, von Haeseler A, Pääbo S (1994). The marsupial
mitochondrial genome and the evolution of placental mammals. Genetics 137: 243-256.
Janke A, Xu X, Arnason U (1997). The complete mitochondrial genome of the wallaroo
(Macropus robustus) and the phylogenetic relationship among Monotremata, Marsupialia,
and Eutheria. Proc. Natl. Acad. Sci. USA 94: 1276-1281.
Klicka J, Zink RM (1997). The importance of recent ice ages in speciation: a failed paradigm.
Science 277: 1666-1669.
Kumar S (1996). PHYLTEST, a program for phylogenetic hypothesis testing. Version 2.0.
Kumar S, Tamura K, Nei M (1993). MEGA, Molecular evolutionary genetics analysis. Version
1.01. The Pennsylvannia State University.
Kumasawa Y, Ota H, Nishida M, Ozawa T (1998). The complete nucleotide sequence of a snake
(Dinodon semicarinatus) mitochondrial genome with two identical control regions. Genetics
150: 313-329.
Lecanidou R Douris V, Rodakis GC (1994). Novel features of metazoan mtDNA revealed from
sequence analysis of three mitochondrial DNA segments of the land snail Albinaria turrita
(Gastropoda: Clausiliidae). J. Mol. Evol. 38: 369-382.
Li W-H (1997). "Molecular Evolution". Sinauer Associates. Sunderland, MA.
Liu H, Beckenback AT (1992). Evolution of the mitochondrial cytochrome oxidase II gene
among 10 orders of insects. Mol. Phylogenet. Evol. 1: 41-52.
Millett F, de Jong C, Paulson L, Capaldi RA (1983). Identification of specific carboxylate groups
on cytochrome c oxidase that are involved in binding cytochrome c. Biochemistry 22: 546552.
Mindell DP, Sorenson MD, Dimcheff DE (1998). Multiple independent origins of mitochondrial
gene order in birds. Proc. Natl. Acad. Sci. USA 95: 10693-10697.
Mindell DP, Sorenson MD, Dimcheff DE, Hasegawa M, Ast JC, Yuri T (1999). Interordinal
relationships of birds and other reptiles based on whole mitochondrial genomes. Syst. Biol.
48: 138-152.
Ojala D, Montoya J, Attardi G (1981) tRNA punctuation model of RNA processing in human
mitochondria. Nature 290: 470-474.
Peabody DS (1989). Translational initiation at non-AUG triplets in mammalian cells. J. Biol.
Chem. 264: 5031-5035.
Savage D, Russell DE (1983). "Mammalian Paleofaunas of the World", Addison-Wesley,
Reading, MA, USA.
142
Evolução de COII em Cracidae
Stryer L (1995). "Biochemistry". WH Freeman e Company. New York, NY.
Zardoya R, Meyer A (1996). Phylogenetic performance of mitochondrial protein-coding genes in
resolving relationships among vertebrates. Mol. Biol. Evol. 13: 933-942.
Zardoya R, Meyer A (1998). Complete mitochondrial genome suggests diapsid affinities of
turtles. Proc. Natl. Acad. Sci. USA 95: 14226-14231.
Zardoya R, Meyer A (1997). The complete DNA sequences of the mitochondrial genome of a
"living fossil", the coelacanth (Latimeria chalumnae). Genetics 146: 995-1010.
143
Capítulo 7
Considerações Finais
144
Considerações finais
CONSIDERAÇÕES FINAIS
Nas últimas décadas o uso do DNA mitocondrial (mtDNA) tornou-se comum em
estudos evolutivos. Inicialmente buscou-se avaliar o grau de polimorfismo genético
encontrado em grupos específicos de organismos por meio de diversas enzimas de
restrição (Tarr e Fleischer, 1989; Zink, 1993; Zink e Dittmann, 1993). Posteriormente
com o aprimoramento das técnicas de seqüenciamento e da automatização, o
desenvolvimento da técnica de reação em cadeia da polimerase (PCR), a obtenção de
seqüências de ácidos nucléicos passou a ser um trabalho rotineiro em muitos laboratórios.
Desta maneira, genes mitocondriais específicos passaram a ser alvo dos estudos
ornitológicos que visam distinguir populações de uma mesma espécie e a suas histórias
evolutivas (Ball et al., 1988; Baker e Marshall, 1997; Freitag e Robinson, 1993), relações
filogenéticas (Cooper et al., 1992; Miyaki et al., 1998, Nahum et al., submetido),
definição de espécies (García-Moreno e Fjeldsa, 1999) e estimativa da diversidade
genética (Gutierrez, 1994), além da própria evolução dos genes mitocondriais (Arctander,
1995; Griffiths, 1997, 1998; Randi e Lucchini, 1998).
O sucesso do mtDNA como marcador em estudos evolutivos e filogenéticos se
deve a várias características: a) compactação dos genes, com poucos nucleotídeos não
codificantes entre os genes e até mesmo sobreposição de genes que possuem sentido de
leitura em cadeias de DNA opostas (Cantatore e Saccone, 1987; e outros genomas
completamente seqüenciados por diversos autores); b) ausência de recombinação, com
pouquíssimas exceções documentadas (Clayton 1982, 1992; Hayashi et al., 1985); c)
herança materna, com poucas exceções (Gyllestein et al., 1991; Kondo et al., 1990); d)
taxa de evolução mais rápida se comparada com o genoma nuclear, possivelmente devido
à ineficiência do sistema de reparo da mitocôndria em relação ao núcleo celular (Brown et
al., 1979); e e) presença de muitas cópias do mtDNA em uma mesma célula (Robin e
Wong 1988; Michaels et al., 1982).
No presente trabalho foram seqüenciados sete genes mitocondriais (domínio I da
região controladora, 12S rDNA, 16S rDNA, COI, COII, COIII e cyt b) de onze
representantes da família Cracidae perfazendo um total de 5265 pares de bases para cada
145
Considerações finais
táxon, e os mesmos seis genes mitocondriais (excluindo-se o domínio I da região
controladora) referentes a um representante da família Megapodiidae, totalizando 4853
pares de bases para este táxon. Esses números refletem a tendência atual dos trabalhos
científicos realizados nos grandes centros científicos internacionais de obter um grande
número de dados de seqüências mitocondriais. Além disso, combinar e considerar estas
seqüências como uma única seqüência representativa do genoma mitocondrial e a partir
daí inferir as relações filogenéticas do grupo em estudo é totalmente justificável (Cao et
al., 1994; Cummings et al., 1995; Hillis, 1987; Kluge, 1989; Russo et al., 1996), uma vez
que este genoma é herdado como se fosse um único alelo de um loco hemizigoto.
Nossos produtos de PCR sempre foram correspondentes a uma única banda de
tamanho esperado para o par de primers que utilizamos na amplificação destes produtos,
bem como as seqüências resultantes se mostraram limpas e sem a indicação de outras
seqüências contaminantes. A homologia de cada uma das seqüências aqui obtidas foi
testada usando-se o algoritmo BLAST do GenBank, o que permite averigurar neste banco
de dados quais seqüências lá depositadas são homólogas as nossas. Todas as nossas
buscas de homologia indicaram termos seqüenciado os genes mitocondriais corretos. Não
foram detectados pseudogenes para nenhuma das seqüências estudadas.
Baseados nestas indicações de correta obtenção de seqüências mitocondriais de
cracídeos, realizamos diversas análises filogenéticas visando elucidar diferentes questões.
Basicamente estas análises usaram de modelos evolutivos mais realistas que consideram
frequência desigual de bases, heterogeneidade de taxa de substituição entre os sítios e
diferentes taxas de transição e transversão.
Inicialmente averiguamos a sugestão feita por Prager e Wilson (1976) a partir de
distâncias imunológicas de proteínas e por Sibley et al. (1988) a partir de dados de
hibridação DNA-DNA que os Cracidae e os Megapodiidae seriam tão distantes dos
demais Galliformes quanto dos Anseriformes. De acordo com nossas análises as famílias
Cracidae e Megapodiidae se agrupam com os Galliformes, que por sua vez se comportou
como grupo-irmão dos Anseriformes. No entanto, não foi possível averiguar se entre os
Galliformes temos a clara distinção de duas linhagens, uma levando aos modernos
representantes das famílias Cracidae e Megapodiidae, e outra levando as demais famílias
146
Considerações finais
de Galliformes, o que justificaria a sugestão de um nível taxonômico a parte para estas
duas famílias. Tal fato deve ser melhor estudado com a obtenção de seqüências
mitocondriais para outros representantes das demais famílias de Galliformes que não
foram incluídas no presente trabalho.
Este mesmo estudo permitiu definir que os megapodídeos da região australiana
são o grupo mais próximo aos cracídeos. Desta maneira foi possível realizar outras
análises filogenéticas para estabeler as relações entre os onze gêneros de cracídeos usando
Megapodius como grupo externo. Nossas estimativas das relações entre os cracídeos
mostrou a separação clara das subfamílias Penelopinae e Cracinae. As relações entre os
jacus e aracuãs, membros da subfamília Penelopinae, foram bem estabelecidas. Entre os
Cracinae, representados pelos mutuns, parece ter havido um período curto de
diversificação dos atuais quatro gêneros, que é refletido por histórias evolutivas
conflitantes quando os genes são analisados separadamente, e pelo curto comprimento
dos ramos destas linhagens obtidos por análises de verossimilhancas admitindo a hipótese
do relógio molecular.
Estes dois primeiros estudos sugerem que os cracídeos surgiram há cerca de 75,5
milhões de anos. Esta data é anterior ao limite entre os períodos Cretáceo e Terciário (65
milhões de anos atrás), indicando que este grupo já havia se diversificado antes do final
do Cretáceo e que sobreviveu ao evento de extinção em massa que delimita os períodos
geológicos Cretáceo e Terciário. Dados moleculares recentes levam à conclusão de que
este é o caso para muitos outros grupos de aves e mamíferos (Cooper e Penny, 1997). O
soerguimento dos Andes, os períodos glaciais e a formação da América Central podem ter
ocasionado a formação de novos habitats e o isolamento de outros, levando também a
alterações climáticas e no nível do mar, o que poderia ter influenciado a diversificação
dos atuais gêneros de Cracidae nos últimos 30 milhões de anos. Além destes fatores, a
diversificação das Angiospermas também podem ter exercido influência sobre a
diversificação deste grupo, uma vez que os cracídeos se alimentam pricipalmente de suas
folhas e frutos.
Acreditamos que nossas estimativas de datação das divergências genéricas seja
confiável devido ao fato de que a calibração adotada neste estudo (separação dos
147
Considerações finais
anseriformes e galiformes há 112 milhões de anos) foi baseada em um estudo extensivo
feito por Kumar e Hedges (1998) baseado em um registro fóssil bem conhecido e em um
número grande de genes mitocondriais e nucleares de diversos representantes de
vertebrados.
Infelizmente nossos dados não nos permitiram levantar conclusões sobre a origem
dos Cracidae nas Américas. Nossos dados são perfeitamente congruentes com ambas as
hipóteses de origem dos Cracidae, a hipótese norte ou centroamericana proposta por
Delacour e Amadon (1973) e a sulamericana proposta por Darlington (1957). Para
resolver esta questão é necessário um estudo abrangendo pelo menos dois representantes
de cada uma das famílias de Galliformes ou até mesmo de Anseriformes bem como um
registro fóssil mais completo e confiável.
Estudos recentes feitos por Kimball et al. (1999) e por Zink et al. (1998)
mostraram que a região controladora do DNA mitocondrial poderia ser útil em
reconstruções filogenéticas acima da categoria de espécie. Baseados nestas informações
obtivemos seqüências do primeiro domínio da região controladora (CR-I) dos onze
representantes genéricos dos Cracidae e estimamos suas relações através deste gene. Os
resultados obtidos com as seqüências do CR-I foram muito congruentes com nossos
resultados usando os outros seis genes mitocondriais em conjunto. Além disso, a taxa de
evolução estimada para esta região foi similar à estimada para os genes COI e cyt b. Esses
resultados indicam que a região CR-I pode ser útil em análises acima do nível de espécie
e que ela pode ser incluida em estudos multigênicos onde cada gene é combinado em uma
única matriz de dados.
O estudo da evolução das seqüências completas do gene COII mostrou que este
gene parece evoluir de maneira semelhante as seqüências de outros organismos. Muitas
das posições de aminoácidos consideradas conservadas em uma ampla gama de
organismos também se mostraram conservadas em cracídeos. A maioria das substituições
ocorridas estão presentes na terceira posição do códon, com raros casos de substituição de
aminoácidos. A deleção de uma aminoácido nas seqüências de cracídeos em relação às
seqüências de primatas e insetos também é encontrada em outras aves e em répteis.
148
Considerações finais
Este é o primeiro estudo evolutivo-filogenético entre os gêneros da família
Cracidae. A sobrevivência de muitas das espécies de cracídeos encontra-se ameaçada de
alguma forma, e o conhecimento das relações filogenéticas entre elas pode auxiliar na
designação de programas de manejo e conservação da família como um todo. No presente
trabalho foi possível estabelecer as bases para o esclarecimento de diversos problemas
taxonômicos e isto irá auxiliar a resolução de outros que ainda existem para determinados
complexos de gêneros e de espécies ou subespécies de Cracidae.
149
Capítulo 8
Referências Bibliográficas
150
Referências
REFERÊNCIAS BIBLIOGRÁFICAS
A referências citadas em cada um dos capítulos desta tese são identificadas de acordo com os símbolos
especificados a seguir:
l - Capítulo 1 - Introdução
4- Capítulo 2 - Material e Métodos
n - Capítulo 3 - Posicionamento Filogenético de Cracidae e Megapodiidae
W - Capítulo 4 - Filogenia de Cracidae
t - Capítulo 5 - Domínio I da Região Controladora
s - Capítulo 6 - Citocromo Oxidase II
6 - Capítulo 7 - Considerações Finais
Adachi J, Hasegawa M (1994). MOLPHY, Molecular Phylogenetics. Version 2.2. s
Adkins RM, Honeycutt RL (1994). Evolution of the primate cytochrome c oxidase subunit II gene. J.
Mol. Evol. 38: 215-231. s
Alvarenga HMF (1995). Um primitivo membro da ordem Galliformes (Aves) do Terciário Médio da
Bacia do Taubaté, estado de São Paulo. Anais da Academia Brasileira de Ciências 67: 33-44. l
Arctander P (1995). Comparison of a mitochondrial gene and a corresponding nuclear pseudogene.
Proc. R. Soc. Lond. B262: 13-19. 6
Arnaiz-Villena A, Álvarez-Tejado M, Ruíz-del-Valle V, García-de-la-Torre C, Varela P, Recio MJ,
Ferre S, Martinez-Laso J (1999). Rapid radiation of Canaries (genus Serinus). Mol. Biol. Evol. 16:
2-11. W
Avise JC (1994). Molecular Markers, Natural Hystory and Evolution, Chapman and Hall, New York,
USA. l
Avise JC, Arnold J, Ball RM, Bermingham E, Lamb T, Niegel JE, Reeb CA, Saunders NC (1987).
Intraespecific phylogeography: the mitochondrial bridge between population genetics and
systematics. Ann. Rev. Ecol. Syst. 18: 489-522. t
Avise JC, Bowen BW, Lamb T, Meylan AB, Bermingham E (1992). Mitochondrial DNA evolution at a
turtle’s pace: evidence for low genetic variability and reduced microevolutionary rate in the
Testudines. Mol. Biol. Evol. 9: 457-473. l
Azeredo R (1996). Reintrodução de Crax blumembachii na natureza. In: "Anais V Congresso
Brasileiro de Ornitologia", Campinas, Brasil. p. 82. l
Baker AJ, Marshal HD (1997). Mitochondrial control region sequences as tools for understanding
evolution. In: "Avian Molecular Evolution and Systematics", DP Mindell (Ed.) Academic Press.
pp 51-82. t6
Ball RM, JR, Freeman S, James FC, Bermingham E, Avise JC (1988). Phylogeographic population
structure of red-winged blackbirds assessed by mitochondrial DNA. Proc. Natl. Acad. Sci. USA
85: 1558-1562. l6
151
Referências
Bernardi N (1981). Phylogenetic relationships, monophyletic group and related concepts. Rev. Bras.
Entomol. 25: 323-326. l
Bleiweiss R (1998a). Origin of hummingbird faunas. Biological Journal of the Linnean Society 65: 7797. W
Bleiweiss R (1998b). Tempo and mode of hummingbird evolution. Biological Journal of the Linnean
Society 65: 63-76. W
Bremer K (1988). The limits of aminoacid sequence data in angiosperm phylogenetic reconstruction.
Evolution 42: 795-803. W
Bremer K (1994). Branch support and tree stability. Cladistics 10: 295-304. 4
Briggs JC (1987). Biogeography and plate tectonics. Developments in Paleontology and Stratigraphy,
10. Elsevier, Amsterdam. l
Brodkorb P (1954). A chachalaca from the Miocene of Florida. Wilson Bull. 66: 180-183. l
Brown JH, Lomolino MV (1998). “Biogeography,” Second Edition. Sinauer Associates. Massachusetts.
lW
Brown WM (1985). The mitochondrial genome of animals. In: "Molecular Evolutionary Genetics", RJ
MacIntyre. Plenum Press, New York. pp 95-130. s
Brown WM, George M Jr, Wilson AC (1979). Rapid evolution of animal mitochondrial DNA. Proc.
Natl. Acad. Sci. USA 76: 1967-1971. 6
Brown WM, Prager EM, Wang A, Wilson AC (1982). Mitochondrial DNA sequences of primates:
tempo and mode of evolution. J. Mol. Evol. 18: 225-239. l
Bruford MW, Hanotte O, Brookfield JFY, Burke T (1992). Single-locus and multilocus DNA
fingerprinting. In: “Molecular Genetic Analysis Of Populations - A Practical Approach,” AR
Hoelzel (Ed.). Oxford University Press, New York. pp. 225-269. Wt
Cabot EL, Beckenbach
AT (1989). Simultaneous editing of multiple nucleic acid and protein
sequences with ESEE. Comput. Appli. Biosci. 5: 233-234. 4nW
Cantatore P, Saccone C (1987). Organization, structure, and evolution of mammalian mitochondrial
genes. Int. Rev. Cytol. 108: 149-208. 6
Cao Y, Adachi J, Janke A, Pääbo S, Hasegawa M (1994). Phylogenetic relationships among eutherian
orders estimated from inferred sequences of mitochondrial proteins: instability of a tree based on a
single gene. J. Mol. Evol. 39: 519-527. nW6
Capaldi RA (1990). Structure and function of cytochrome c oxidase. Annu. Rev. Biochem. 59: 569-596.
Capaldi RA, Malatesta F, Darley-Usmar VM (1983). Structure of cytochrome c oxidase. Biochimica et
Biophysica Acta 726: 135-148. s
Caspers G-J, Weerd DU, Wattel J, de Jong WW (1997). α-crystallin sequences support a
Galliform/Anseriform clade. Mol. Phylogenet. Evol. 7: 185-188. n
Castresana J, Feldmaier-Fuchs G, Yokobori S, Satoh N, Pääbo S (1998). The mitochondrial
genome of the hemichordate Balanoglossus carnosus and the evolution of deuterostome
mitochondria. Genetics 150: 1115-1123. s
Caziani SM, Protomastro JJ (1994). Diet of the Chaco Chachalaca. Wils. Bull. 106:640-648. l
152
Referências
Clapperton C. (1993). “Quaternary Geology and Geomorphology of South America”, Elsevier,
Amsterdam. W
Clayton DA (1982). Replication of animal mitochondrial DNA. Cell 28: 693-705. 6
Clayton DA (1992). Structure and function of the mitochondrial genome. J. Inherit. Metab Dis. 15:
439-447. 6
Collar NJ, Gonzaga LP, Krabbe N, Madroño Nieto A, Naranjo LG, Parker III TA, Wege DC (1992).
"Threatened birds of the Americas. The ICBP/IUCN Red Data Book". 3rd Edition, part 2.
Smithsonian Institution Press, Washington. lWs
Cooper A, Mourer-Chauviré C, Chambers GK, von Haeseler A, Wilson AC, Pääbo S (1992).
Independent origins of New Zealand moas and kiwis. Proc. Natl. Acad. Sci USA 89: 8741-8744.
l6
Cooper A, Penny D (1997). Mass survival of birds across the Cretaceous-Tertiary boundary: molecular
evidence. Science 275: 1109-1113. l6
Cracraft J & Helm-Bychowski K (1991). Parsimony and phylogenetic inference using DNA sequence:
some methodological estrategies. In: "Phylogenetic Analyses of DNA Sequences". MM Miyamoto,
J Cracraft (Eds) Oxford University Press. USA. pp 184-220. l
Cracraft J (1974). Continental drift and vertebrate distribution. Ann. Rev. Ecol. Syst. 5: 213-261. l
Cracraft J, Mindell DP (1989). The early history of modern birds: a comparison of molecular and
morphological evidence. In: "The Hierarchy of Life". B Fernholm, H Jornvall (Eds.). Elsevier,
Amsterdam. pp 389-403. n
Crowe TM, Short LL (1992). A new gallinaceous bird from the Oligocene of Nebraska, with comments
on the phylogenetic position of the Gallunuloidae. In: “Papers in Avian Paleontology”, KE
Campbell Jr (Ed.). Natural Hystory Museum of Los Angeles County, Science Series 36: 179-185.
l
Cummings MP, Otto SP, Wakeley J (1995). Sampling properties of DNA sequence data in phylogenetic
analysis. Mol. Biol. Evol. 12: 814-822. nW6
Czelusniak J, Goodman M, Moncrief ND, Kehoe SM (1990). Maximum parsimony approach to
construction of evolutionary trees from aligned homologous sequences. Methods in Enzimology
183: 601-615. n
D’Angieri A (1997). Cracidae rearing and conservation in Brasil: a general view on their status in the
wild and in captivity. In: "The Cracidae: their Biology and Conservation" SD Strahl, S Beaujon,
DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 154159. l
Darlington PJ, Jr (1957) “Zoogeography: The Geographical Distribution of Animals,” John Wiley &
Sons, Inc. New York. lW6
del Hoyo J, Elliott A, Sargatal J (Eds)(1992). "Handbook of the Birds of the World". Volume 1. Ostrich
to Ducks. Lynx Edicions, Barcelona. n
del Hoyo J, Elliott A, Sargatal J (eds)(1994). “Handbook of the Birds of the World,” Volume 2. New
World Vultures to Guineafowl. Lynx Edicions, Barcelona. ln
153
Referências
Delacour J, Amadon D (1973). “Curassows and Related Birds,” The American Museum of Natural
History. New York, NY. lWt6
Delarbre C, Spruyt N, Delmarre C, Gallut C, Barriel V, Janvier P, Laudet V, Gachelin G
(1998). The complete nucleotide sequence of the mitochondrial DNA of the dogfish,
Scyliorhynus canicula. Genetics 150: 331-344. s
DeSalle R, Templeton A (1988). Founders effects accelerate the rate of mitochondrial DNA evolution
in Hawaiian Drosophila. Evolution 42: 1076-1084. l
Desjardins P, Morais R (1990). Sequence and gene organization of the chicken mitochondrial genome.
A novel gene order in higher vertebrates. J. Mol. Biol. 212: 599-634. Wts
Diaz-M VR, del Solar-R G (1997). Resultados parciales del plan integral para salvar a la Pava
Aliblanca (Penelope albipennis). In: "The Cracidae: their Biology and Conservation" SD Strahl,
S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA.
pp. 467-471. l
Duering A, Brueckner M, Mossakowski D (1999). Differences between gene tree and
organismal tree? Mitochondrial genes and the phylogenetic relationships of the
Chrysocarabus species. Mitt. Dtsch. Ges. Allg. Entomol. in press. s
Eizirik E, Bonatto SL, Johnson WE, Crawshaw PG, Vié JC, Brousset DM, O’Brien SJ, Salzano FM
(1998). Phylogeographic patterns and evolution of the mitochondrial DNA control region in two
Neotropical cats (Mammalia, Felidae). J. Mol. Evol. 47: 613-624. t
Ellegren H, Fridolfsson A-K (1997). Male-driven evolution of DNA sequences in birds. Nature
Genetics 17: 182-184. l
Emerson BC, Wallis GP (1995). Phylogenetic relationships of the Prodontia (Coleptera: Scarabaeidae;
Subfamily Melolonthinae), derived from sequence variation in the mitochondrial cytochrome
oxidase II gene. Mol. Phylogenet. Evol. 4: 433-447. s
Érard C, Théry M (1994). Frugivorie et ornithocorie en fôret Guianaise: l’exemple des grans oiseaux
terrestres et de la Penelope marail. Alauda 62: 27-31. l
Érard C, Théry M, Sabatier D (1991). Régime alimentaire de Tinamus major, (Tinamidae), Crax
alector (Cracidae) et Psophia crepitans (Psophiidae) en forêt Guianaise. Gibier Faune Sauvage 8:
183-210. l
Eriksson T (1998) AutoDecay. Version 4.0. (Program distributed by the author). Department of Botany.
Stockolm University. Stockolm, Sweeden. 4W
Felsenstein J (1978). Cases in which parsimony and compatibility methods will be positively
misleading. Syst. Zool. 27: 401-410. t
Felsenstein J (1978). The number of evolutionary trees. Syst. Zool. 27: 27-33. l
Felsenstein J (1981). Evolutionary trees from DNA sequences: A maximum likelihood approach. J.
Mol. Evol. 17: 368-376. l
Felsenstein J (1985). Confidence limits on phylogenies: an approach using the bootstrap. Evolution 39:
783-791. 4
154
Referências
Felsenstein J (1988). Phylogenies from molecular sequences: inference and reliability. Ann. Rev. Genet.
22: 521-565. l4
Filipski J (1988). Why the rate of silent coding substitution is variable within a vertebrate's genome. J.
Theor. Biol. 134: 159-164. l
Frati F, Simon C, Sullivan J, Swofford DL (1997). Evolution of the mitochondrial oxidase II gene in
Collembola. J. Mol. Evol. 44: 145-158. s
Freitag S, Robinson TJ (1993). Phylogeographic patterns in mitochondrial DNA of the ostrich (Struthio
camelus). Auk 110: 614-622. l6
Friesen VL, Anderson DJ (1997). Phylogenetic and evolution of the Sulidae (Aves: Pelecaniformes): a
test of alternative modes of speciation. Molecular Phylogenetics and Evolution 7: 252-260. l
Fumagalli L, Taberlet P, Favre L, Hausser J (1996). Origin and evolution of homologous repeated
sequences in the mitochondrial DNA control region of shrews. Mol. Biol. Evol. 13: 31-46. t
García-Moreno J, Fjeldsa J (1999). Re-evaluation of species limits in the genus Atlapetes based on
mtDNA sequence data. Ibis 141: 199-207. 6
Gaut, BS, Lewis PO (1995). Success of maximum likelihood in the four-taxon case. Mol. Biol. Evol.
12: 152-162. t
Goldman N (1993a) Simple diagnostic statistical test of models of DNA substitution. J. Mol. Evol. 37,
650-661. 4
Goldman N (1993b) Statistical tests of models of DNA substitution. J. Mol. Evol. 36, 182-198. 4
Grantham R,Gautier C, Gouy M, Mercier R, Pave A (1980). Codon catalog usage and the genome
hypothesis. Nucleic Acids Res. 8: r49-r62. s
Griffiths CS (1997). Correlation of funcitional domains and rates of nucleotide substitution in
cytochrome b. Mol. Phylogenet. Evol. 7: 352-365. 6
Griffiths CS (1998). The correlation of protein structure and evolution of a protein-coding gene:
phylogenetic inference using cytochrome oxidase III. Mol. Biol. Evol. 15: 1337-1345. 6
Groom MJ, Podolsky RD, Munn CA (1991). Tourism as a sustained use of wildlife: a case study of
Madre de Dios, southeastern Peru. In: "Neotropical Wildlife Use and Conservation", JG
Robinson, KH Redford (Eds.). Univ. Chicago Press. pp. 393-414. l
Groth JG, Barrowclough GF (1999). Basal divergences in birds and the phylogenetic utility of the
nuclear RAG-1 gene. Mol. Phylogenet. Evol. 12: 115-123. n
Guix JC, Ruiz X (1997). Weevil larvae dispersal by guan in SE Brasil. Biotrop. 29:522-525. l
Gutierrez PC (1994). Mitochondrial-DNA polymorphism in the oilbird (Steatornis caripensis,
Steathornithidae) in Venezuela. Auk 111: 573-578. 6
Gyllestein U, Wharton D, Josefsson A, Wilson AC (1991). Paternal inheritance of mitochondrial DNA
in mice. Nature 352: 255-257. 6
Hagelberg E (1994). Mitochondrial DNA from ancient bones. In: “Ancient DNA,” B Herrmann, S
Hummel (Eds). Springer-Verlag. pp. 195-204. W
155
Referências
Hann SR, King MW, Bentley DL, Anderson CW, Eisenman RN (1988). A non-AUG
translational initiation in c-myc exon 1 generates a N-terminally distinct protein whose
synthesis is disrupted in Burkitt's lymphomas. Cell 52: 185-195.s
Harlid A, Arnason U (1999). Analyses of mitochondrial DNA nest ratite birds within the Neognathae:
supporting a neotenous origin of ratite morphological characters. Proc. R. Soc. Lond. B266: 305309. ns
Harlid A, Janke A, Arnason U (1997). The mtDNA sequence of the ostrich and the divergence between
paleognathous and neognathous birds. Mol. Biol. Evol. 14: 754-761. s
Harlid A, Janke A, Arnason U (1998). The complete mitochondrial genome of Rhea americana and
early Avian divergences. J. Mol. Evol. 46: 669-679. 4ns
Hasegawa M, Kishino H Yano T (1985).Dating of the human-ape splitting by a molecular clock of
mitochondrial DNA. J. Mol. Evol. 22: 160-174. lt
Hasegawa M, Yano T, Kishino H (1984). A new molecular clock of mitochondrial DNA and the
evolution of hominoids. Proc. Japan. Acad. B60: 95-98. l
Hayashi JI, Tagashira Y, Yoshida MC (1985). Absence of extensive recombination between
interspecies and intraspecies mitochodrial DNA in mammalian cells. Exp. Cell. Res. 160: 387-395.
6
Hedges SB, Parker PH, Sibley CG, Kumar S (1996). Continental breakup and the ordinal
diversification of birds and mammals. Nature 381: 226-229. l
Hedges SB, Simmons MD, van Dijk Mam, Caspers G-J, de Jong WW, Sibley CG (1995). Phylogenetic
relationships of the hoatzin, an enigmatic South American bird. Proc. Natl. Acad. Sci USA 92:
11662-11665. n
Helm-Bychowski K, Cracraft J (1993). Recovering phylogenetic signal from DNA sequences:
relationships within the corvine assemblage (Class Aves) as inferred from complete sequences of
the mitochondrial DNA cytochrome-b gene. Mol. Biol. Evol. 10: 1196-1214. l
Hennig W (1950). "Grundzuge einer Theorie der phylogenetischen Systematik". Deuscher
Zentralverlag, Berlin. l
Hennig W (1966). "Phylogenetic Systematics". Urbana, Ill. University of Illinois Press. USA. l
Hillis DM (1987). Molecular versus morphological approaches to systematics. Ann. Rev. Ecol. Syst. 18:
23-42. n6
Hillis DM, (1991) Discriminating between phylogenetic signal and random noise in DNA sequences.
In: "Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford
University Press, New York. lt
Honeycutt RL, Nedbal MA, Adkins RM, Janecek LL (1995). Mammalian mitochondrial DNA
evolution: a comparison of the cytochrome c oxidase II genes. J. Mol. Evol. 40: 260-272. s
Huber BT (1998). Tropical paradise at the Cretaceous Poles? Science 282: 2199-2200. l
Huelsenbeck JP, Crandall KA (1997) Phylogeny estimation and hypothesis testing using maximum
likelihood. Ann. Rev. Ecol. Syst. 28, 437-466. 4
156
Referências
Huelsenbeck JP, Rannala B (1997) Phylogenetic methods come of age: testing hypothesis in an
evolutionary context. Science 276: 227-2324
Irwin DM, Kocher TD, Wilson AC (1991). Evolution of the cytochrome b gene of mammals. J. Mol.
Evol. 32:128-144. ls
IUCN (1996). 1996 IUCN Red List of Threatened Animals. IUCN - The World Conservation Union,
Gland, Switzerland. http://www.wcmc.org.uk/species/animals/animal_redlist.html. l
Iwata S, Ostermeier C, Ludwig B, Michel H (1995). Structure at 2.8Å resolution of cytochrome c
oxidase from Paracoccus denitrificans. Nature 376: 660-669. s
Janecek LL, Honeycutt RL, Adkins RM, Davis SK (1996). Mitochondrial gene sequences
and the molecular systematics of the artiodactyl subfamily Bovinae. Mol. Phylog. Evol.
6: 107-119. s
Janke A, Arnason U (1997). The complete mitochondrial genome of Alligator mississippiensis and the
separation between recent archosauria (birds and crocodiles). Mol. Biol. Evol. 14: 1266-1272. s
Janke A, Feldmaier-Fuchs G, Thomas WK, von Haeseler A, Pääbo S (1994). The marsupial
mitochondrial genome and the evolution of placental mammals. Genetics 137: 243-256. s
Janke A, Xu X, Arnason U (1997). The complete mitochondrial genome of the wallaroo
(Macropus robustus) and the phylogenetic relationship among Monotremata,
Marsupialia, and Eutheria. Proc. Natl. Acad. Sci. USA 94: 1276-1281. s
Jukes TH, Cantor CR (1969). Evolution of protein molecules. In: "Mammalian Protein Metabolism",
HM Munro (ed). Academic Press, New York. pp 21-132. l
Kimball RT, Braun EL, Zwartjes PW, Crowe TM, Ligon JD (1999). A molecular phylogeny of the
pheasants and partridges suggests that these lineages are not monophyletic. Mol. Phylogenet. Evol.
11: 38-54. t6
Kimura M (1980). A simple method for estimating evolutionary rate of base substitutions through
comparative studies of nucletide sequences. J. Mol. Evol. 16: 111-120. l
Kishino H, Hasegawa M (1989). Evaluation of the maximum likelihood estimate of the evolutionary
tree topologies from DNA sequence data, and the branching order in Hominoidea. J. Mol. Evol.
29: 170-179. W
Klicka J, Zink RM (1997). The importance of recent ice ages in speciation: a failed paradigm.
Science 277: 1666-1669. s
Kluge AG (1989). A concern for evidence and a phylogenetic hypothesis of relationships among
Epicrates (Boidae, Seprentes). Syst. Zool. 38: 7-25. nt
Knowlton N, Weigt LA (1998). New dates and new rates for divergence across the Isthmus of Panama.
Proc. R. Soc. Lond B265: 2257-2263. W
Kocher TD, Thomas WK, Meyer A, Edwards SV, Pääbo S, Villablanca FX, Wilson AC (1989).
Dynamics of mitochondrial DNA evolution in animals: amplification and sequencing with
conserved primers. Proc. Natl. Acad. Sci. USA 86: 6196-6200. t
Kondo R, Satta Y, Matsuura ET, Ishiwa H, Takahata N, Chigusa SI (1990). Incomplete maternal
transmission of mitochondrial DNA in Drosophila. Genetics 126: 657-663. 6
157
Referências
Kumar S (1996). “PHYLTEST: a program for testing phylogenetic hypothesis,” Version 2.0. Institute of
Molecular Evolutionary Genetics and Department of Biology. The Pennsylvania State University,
University Park, Pennsylvania, USA. Ws
Kumar S, Hedges B (1998). A molecular timescale for vertebrate evolution. Nature 392: 917-920. n6
Kumar S, Tamura K, Nei M (1993). MEGA, Molecular evolutionary genetics analysis. Version 1.01.
The Pennsylvannia State University. s
Kumasawa Y, Ota H, Nishida M, Ozawa T (1998). The complete nucleotide sequence of a
snake (Dinodon semicarinatus) mitochondrial genome with two identical control
regions. Genetics 150: 313-329. s
Larson A (1991). Evolutionary analysis of length-variable sequences: divergent domains of ribosomal
RNA. In: "Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford
University Press, USA, pp 221-248. l
Laskowski M Jr, Fitch WM (1989). Evolution of avian ovomucoid in birds. In: "The Hierarchy of Life".
B Fernholm, H Jornvall (Eds.). Elsevier, Amsterdam. pp 371-387. n
Lecanidou R Douris V, Rodakis GC (1994). Novel features of metazoan mtDNA revealed from
sequence analysis of three mitochondrial DNA segments of the land snail Albinaria turrita
(Gastropoda: Clausiliidae). J. Mol. Evol. 38: 369-382. s
Li W-H (1993a). So, what about the molecular clock hypothesis? Curr. Opin. Genet. Dev. 3: 896-901.
l
Li W-H (1993b). Unbiased estimation of the rates os synonymous and nonsynonymous substitution. J.
Mol. Evol. 36: 96-99. l
Li W-H (1997). "Molecular Evolution". Sinauer Associates, Inc. Sunderland, MA, USA. ls
Li W-H, Graur D (1991). "Fundamentals of Molecular Evolution", Sinauer Associates, Sunderland,
MA, USA. l
Li W-H, Tanimura M, Sharp PM (1987). An evaluation of the molecular clock hypothesis using
mammalian DNA sequences. J. Mol. Evol. 25: 330-342. l
Liu H, Beckenback AT (1992). Evolution of the mitochondrial cytochrome oxidase II gene among 10
orders of insects. Mol. Phylogenet. Evol. 1: 41-52. s
Lucchini V, Randi E (1998). Mitochondrial DNA sequence variation and phylogeographical structure
of rock partridge (Alectoris graeca) populations. Heredity 81: 528-536. t
Macedo-Ruiz H (1979). 'Extinct' bird found in Peru. Oryx 15:33-37. l
Maddison WP, Donoghue MJ, Maddison DR (1984). Outgroup analysis and parsimony. Syst. Zool. 33:
83-103. l
Martin AP, Palumbi SR (1993). Body size, metabolic rate, generation time, and the molecular clock.
Proc. Natl. Acad. Sci. USA 90: 4087-4091. l
Michaels GS, Hauswirth WW, Laipis PJ (1982). Mitochondrial DNA copy number in bovine oocytes
and somatic cells. Dev. Biol. 94: 246-251. 6
Miller AH (1944). An avifauna from the lower Miocene of South Dakota. Univ. Calif. Publ., Bull.
Dept. Geol. Sci. 27: 85-100. l
158
Referências
Millett F, de Jong C, Paulson L, Capaldi RA (1983). Identification of specific carboxylate groups on
cytochrome c oxidase that are involved in binding cytochrome c. Biochemistry 22: 546-552. s
Mindell DP (1991). Aligning DNA sequences: homology and phylogenetic weighting. In:
"Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford University
Press, USA, pp 73-89. l
Mindell DP, Honeycutt RL (1989). Variability in transcribed regions of ribosomal DNA and early
divergence in birds. Auk 106: 539-548. n
Mindell DP, Sorenson MD, Dimcheff DE (1998). Multiple independent origins of mitochondrial gene
order in birds. Proc. Natl. Acad. Sci. USA 95: 10693-10697. s
Mindell DP, Sorenson MD, Dimcheff DE, Hasegawa M, Ast JC, Yuri T (1999). Interordinal
relationships of birds and other reptiles based on whole mitochondrial genomes. Syst. Biol. 48:
138-152. 4ns
Mindell DP, Thacker CE (1996). Rates of molecular evolution: phylogenetic issues and applications.
Ann. Rev. Ecol. Syst. 27: 279-303. l
Miyaki CY, Matioli SR, Burke T, Wajntal A (1998). Parrot evolution and paleogeographical events:
mitochondrial DNA evidence. Mol. Biol. Evol. 15: 544-551. lW6
Miyata T, Hayashida H, Kuma K, Mitsuyasu K, Yasunaga T (1987). Male-driven molecular evolution:
a model and nucleotide sequence analysis. Cold Spring Harbor Symp. Quant. Biol. 52: 863-867.
l
Morrison DA, Ellis JT (1997). Effects of nucleotide sequence alignment on phylogenetic estimation: a
case study of 18S rDNA of Apicomplexa. Mol. Biol. Evol. 14: 428-441. l
Mourer-Chauviré C (1992). The Galliformes (Aves) from the Phosphorites du Quercy (France).
Géobios 14: 169-177. l
Munn CA (1992). Macaw biology and ecotourism, or “when a bird in the bush is worth two in the
hand”. In: "New World Parrots in Crisis: Solutions from Conservation Biology", SR Beissinger,
NFR Snyder (Eds.). Smithsonian Institution Press, Washington, D.C., USA. pp. 47-72. l
Nahum LA, Pereira SL, Fernandes-Matioli FMC, Matioli SR, Wajntal A (Submitted). Molecular
phylogeny and evolution of the Ramphastidae (Aves) based on cytochrome b mitochondrial
sequences. lW6
Nardelli PM (1993). “A Preservação do Mutum-de-Alagoas,” Semana Ilustrada Editorial Ltda.
Queimados, Rio de Janeiro. lW
Nei M (1991). Relative efficiences of different tree-making methods for molecular data. In
"Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford University
Press, USA, pp 90-128. l
Ojala D, Montoya J, Attardi G (1981) tRNA punctuation model of RNA processing in human
mitochondria. Nature 290: 470-474. s
Olson SL, Feduccia A (1980). Presbyornis and the origin of the Anseriformes (Aves:
Charadriomorphae). Smithsonian Contrib. Zool. 323: 1-24. n
159
Referências
Ortíz EG, O'Neill JP (1997). Situación actual de la Familia Cracidae en Perú. In: "The Cracidae: their
Biology and Conservation", SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F
Olmos (Eds.). Hancock House Publ., WA. pp. 361-374. l
Ortíz-T E, Díaz-M VR (1997). Estudio de campo y reevaluación de la población de pava aliblanca
(Penelope albipennis). In: "The Cracidae: their Biology and Conservation" SD Strahl, S Beaujon,
DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 218232. l
Peabody DS (1989). Translational initiation at non-AUG triplets in mammalian cells. J. Biol.
Chem. 264: 5031-5035. s
Pereira SL, Wajntal AJ. Studies of Captive Stocks of the Endangered Red-billed Curassow (Crax
blumenbachii) Suggest that this Species is not Depleted of Genetic Variability. (no prelo) In
"Biology and Conservation of Galliformes in the New Millenium", J. Clinton, D. Brooks (Eds). l
Peres CA, van Roosmalen MGM (1996). Avian dispersal of “mimetic seeds” of Ormosia lignivalvis by
terrestrial granivores: deception or mutualism? Oikos 75: 249-258. l
Petri S, Fúlvaro VJ (1983). “Geologia do Brasil,” Editora da Universidade de São Paulo, São Paulo.
Posada D, Crandall KA (1998). MODELTEST: testing the model of DNA substitution.. Bioinformatics
14: 817-818. Wt
Prager EM, Wilson AC (1976). Congruency of phylogenies derived from different proteins. A
molecular analysis of the phylogenetic position of cracid birds. J. Mol. Evol. 9: 45-57. ln6
Prager EM, Wilson AC (1988). Ancient origin of lactalbumin from lysozyme: analysis of DNA and
amino acid sequences. J. Mol. Evol. 27: 326-335. l
Quinn TW (1997). Molecular evolution of the mitochondrial genome. In: "Avian Molecular
Systematics", DP Mindell (Ed.). Academic Press. USA. pp 3-28. t
Randi E, Lucchini V (1998). Organization and evolution of the mitochondrial DNA control region in
the avian genus Alectoris. J. Mol. Evol. 47: 449-462. t6
Reeves JH (1992). Heterogeneity in the substitution process of amino acid sites of proteins coded for by
mitochondrial DNA. J. Mol. Evol. 35: 17-31. l
Robin ED, Wong R (1988). Mitochondrial DNA molecules and virtual number of mitochondrial per
cell in mammalian cells. J. Cell. Physiol. 136: 507-513. 6
Rodríguez F, Oliver JL, Marín A, Medina R (1990). The general stochastic model of nucleotide
substitution. J. Theor. Biol. 142: 485-501. l
Russo CAM, Takezaki N, Nei M (1996). Efficiencies of different genes and different tree-building
methods in recovering a known vertebrate phylogeny. Mol. Biol. Evol. 13: 525-536. nW6
Saccone C, Pesole G, Sbisà E (1991). The main regulatory region of mammalian mitochondrial DNA:
structure-function model and evolutionary pattern. J. Mol. Evol. 33: 83-91. t
Salgado-Labouriau, M. L. (1994). “Historia ecológica da Terra,” Editora Edgard Blücher Ltda, Sao
Paulo. W
Sambrook J, Fritsch F, Maniatis T (1989). "Molecular Cloning: a laboratory manual". Cold Spring
Laboratory Press, 2nd Edition, New York. 4
160
Referências
Santamaría-G M, Franco AM (1994). "Historia natural del paujil (Mitu salvini) y densidades
poblacionales de cracidos en un bosque de la Amazonia Colombiana". Informe, final, WCS. l
Sarich VM, Wilson AC (1967). Immunological time scale for hominid evolution. Science 158: 12001203. l
Savage D, Russell DE (1983). "Mammalian Paleofaunas of the World", Addison-Wesley,
Reading, MA, USA. s
Scheres, G (1997). EEP Cracid TAG Annual Report. In: "EEP Yearbook 1996/1997" F Rietkerk, K
Brouwer, S Smits, M Damen (Eds.). EAZA, Amsterdam. pp. 394-395. l
Sedaghatkish G, Galetti M, Denny C (1999). The importance of Pipile as a seed disperser of
economically important plants. In: "Biology and Conservation of the Piping Guans (Pipile)", DM
Brooks, AJ Begazo, F Olmos (Eds.).. Spec. Publ. CSG 1, Houston. pp. 4-12. l
Sibley CG, Ahlquist JE (1990). "Phylogeny and Classification of Birds of the World. A Study in
Molecular Evolution". Yale University Press. New Haven. lnW
Sibley CG, Ahlquist JE, Monroe BL (1988). A classification of the living birds of the world based on
DNA-DNA hybridization studies. Auk 105: 409-423. ln6
Sick H (1993). “Birds in Brazil. A natural hystory,” Princeton University Press. New JerseylW
Sidow A, Nguyen T, Speed TP (1992). Estimating the fraction of invariable codons with a capturerecapture method. J. Mol. Evol. 35: 253-260. l
Silva JL, Strahl SD (1991). Human impact on populations of chachalacas, guans and curassows
(Galliformes: Cracidae) in Venezuela. In: "Neotropical Wildlife Use and Conservation", JG
Robinson, KH Redford (Eds.). Univ. Chicago Press. pp. 37-52. l
Simpson J, Azeredo R (1997). The Red-billed Curassow project in Brasil. Pp. 472-473 In: "The
Cracidae: their Biology and Conservation", SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G
Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. l
Springer MS, Westerman M, Kavanagh JR, Burk A, Woodburne MO, Kao DJ, Krajewski C (1998).
The origin of the Australasian marsupial fauna and the phylogenetic affinities of the enigmatic
monito del monte and marsupial mole. Proc. R. Soc. Lond. B265: 2381-2386. l
Stapel SO, Leunissen JAM, Versteeg M, Wattel J, de Jong WW (1984). Ratite as oldest offshot of
avian stem – evidence from α-crystallin sequences. Nature 311: 257-259. n
Steel MA, Székely L, Erdös PL, Waddell PJ (1993). A complete family of phylogenetic invariants for
any number of taxa under Kimura's 3ST model. New Zealand J. Bot. 31: 289-296. l
Strahl SD, Grajal A (1991). Conservation of large avian frugivores and the management of Neotropical
protected areas. Oryx 25:50-55. l
Strimmer K, von Haeseler A (1996). Quartet puzzling: a quartet maximum-likelihood method for
reconstructing tree topologies. Mol. Biol. Evol.13: 964-969. l4
Strimmer K, von Haeseler A (1997). Likelihood-mapping: a simple method to visualize phylogenetic
content of a sequence alignment. Proc. Natl. Acad. Sci. USA 94: 6815-6819. 4
Strimmer K, von Haeseler A (1999). PUZZLE. Version 4.0.2. Ludwig-Maximilians-Universität.
München. Program distributed by the authors. ln
161
Referências
Strimmer KS (1997). Maximum Likelihood Methods In Molecular Phylogenetics. Dissertation der
Fakultät für Biologie der Ludwig-Maximilians-Universität München. 4
Stryer L (1995). "Biochemistry". WH Freeman e Company. New York, NY. s
Swofford DL (1999). PAUP*, Phylogenetic Analysis using Parsimony (*and related methods). Version
4.0. Sinauer Associates, Sunderland, Massachusetts, USA. lnWt
Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). Phylogenetic inference. In: “Molecular
Systematics”, DM Hillis, C Moritz, BK Mable (Eds.). 2nd edition, Sinauer Assoc., Sunderland,
MA, pp 407-514. l
Takezaki N, 1995, LINTREE - Phylogenetic tests of the molecular clock and linearized tree, programa
distribuído pelo autor. l
Takezaki N, Gojobori T (1999). Correct and incorrect vertebrate phylogenies obtained by the entire
mitochondrial DNA sequences. Mol. Biol. Evol. 16: 590-601. ln
Takezaki N, Razhetsky A, Nei M (1995). Phylogenetic test of the molecular clock and linearized trees.
Mol. Biol. Evol. 12: 823-833. l
Tamura K, Nei M (1993). Estimation of the number of base nucleotide substitution in the control region
of mitochondrial DNA in humans and chinpanzees. Mol. Biol. Evol. 10: 512-526. lt
Tarr CL, Fleischer RC (1993). Mitochondrial DNA variation and evolutionary relationships in the
Amakihi complex. Auk 110: 825-831. 6
Telford MJ, Holland PWH (1997). Evolution of 28S ribosoaml DNA in Chaetognaths: duplicate genes
and molecular phylogeny. J. Mol. Evol. 44: 135-144. l
Théry M, Érard C, Sabatier D (1992). Les fruits dans le régime alimentaire de Penelope marail (Aves
and Cracidae) en forêt Guianaise: frugivorie stricte et selective? Rev. Ecol. 47:383-401. l
Thompson JD, Higgins DG, Gibson TJ (1994). CLUSTALW: improving the sensitivity of progressive
alignment through sequence weighting, position-specific gap penalties and weight matrix choice.
Nucleic Acids Res. 22: 4673-4680. 4nWt
Tordoff HB, Macdonald JR (1957). A new bird (Family Cracidae) from the early Oligocene of South
Dakota. Auk 74: 174-184. l
van Tuinen M, Sibley CG, Hedges SB (1998). Phylogeny and biogeography of ratite birds inferred
from DNA sequences of the mitochondrial ribossomal genes. Mol. Biol. Evol. 15: 370-376. lW
Vaurie C (1968). Taxonomy of the Cracidae. Bull. Amer. Mus. Nat. Hist. 138: 135-243. l
Velasco-A E (1997). Status, distribución y poblaciones de Cracidae en el Valle del Cauca, Colômbia.
In: "The Cracidae: their Biology and Conservation" SD Strahl, S Beaujon, DM Brooks, AJ
Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 283-288. l
Vuilleumier F (1965). Relationships within the Cracidae. Bull. Mus. Comp. Zool. 134: 1-27. l
Wetmore A (1923). Avian fossils from the Miocence and Pliocene of Nebraska. Bull. Amer. Mus. Nat.
Hist. 48: 483-507. l
Wetmore A (1933). A fossil gallinaceous bird from the lower Miocene of Nebraska. Condor 35: 64-65.
l
Wetmore A (1956). A fossil guan from the Oligocene of South Dakota.Condor 58: 234-235. l
162
Referências
Wilkinson GS, Mayer F, Kerth G, Petri B (1997). Evolution of repeated sequence arrays in the D-loop
region of bat mitochondrial DNA. Genetics 146: 1035-1048. t
Yang Z (1993). Maximum likelihood estimation of phylogeny from DNA sequences when substitution
rates differ over sites. Mol. Biol. Evol. 10: 1396-1401. l
Yang Z (1994). Estimating the pattern of nucleotide substitution. J. Mol. Evol. 39: 105-111. l
Yang Z (1996). Among-site variation and its impact on phylognetic analyses. TREE 11: 367-371. l
Yang Z (1997). PAML: a program package for phylogenetic analysis by maximum likelihood. CABIOS
13: 555-556. l
Yang Z (1999). Phylogenetic analysis by Maximum Likelihood (PAML). Version 2.0. University of
College London. Program distributed by the author. n
Zardoya R, Meyer A (1996) Phylogenetic performance of mitochondrial protein-coding genes in
resolving relationships among vertebrates. Mol. Biol. Evol. 13: 933-942. ls
Zardoya R, Meyer A (1997). The complete DNA sequences of the mitochondrial genome of a "living
fossil", the coelacanth (Latimeria chalumnae). Genetics 146: 995-1010. s
Zardoya R, Meyer A (1998). Complete mitochondrial genome suggests diapsid affinities of
turtles. Proc. Natl. Acad. Sci. USA 95: 14226-14231. s
Zhen L, Swank RT (1993). A simple and high yield method for recovering DNA from agarose gels. Bio
Techniques 14: 894-896. 4t
Zink RM (1993). The geography of mitochondrial DNA variation, population structure, hybridization,
and species limits in the fox sparrow (Passarella iliaca). Evolution 48: 96-111. 6
Zink RM, Dittmann DL (1993). Gene flow, refugia, and evolution of geographic variation in the song
sparrow (Melospiza melodia). Evolution 47: 717-729. 6
Zink RM, Weller SJ, Blackwell RC (1998). Molecular phylogenetics of the avian genus Pipilo and a
biogeographic argument for taxonomic uncertainty. Mol. Phylogenet. Evol. 10: 191-201. t6
Zuckerkandl E, Pauling L (1962). Molecular diseases, evolution and genic heterogeneity. In “Horizons
in Biochemistry”, M Kasha, B Pullman (Eds). Academic Press. New York. pp 189-255. lW
Zuckerkandl E, Pauling L (1965). Evolutionary divergence and convergence in proteins. In “Evolving
genes and proteins”, V Bryson, HJ Vogel (Eds). Academic Press. New York. pp. 97-166. lW
163
Súmula Curricular
SÚMULA CURRICULAR
Sérgio Luiz Pereira
Nascido em 15 de Setembro de 1971, em Palestina, SP.
Filiação: José Vicente Pereira e Aparecida Farine Pereira
Formação Acadêmica
Doutorado (11/08/2000): "Filogenia e Evolução Molecular em Cracidae (Aves)". Departamento
de Biologia, Instituto de Biociências, Universidade de São Paulo. São Paulo, SP. Área de
Concentração: Biologia/Genética. Orientadora: Profa. Dra. Anita Wajntal
Mestrado (15/08/1996): "Variabilidade Genética em Cracídeos e Monitoramento de Populações
em Áreas reflorestadas". Departamento de Biologia, Instituto de Biociências, Universidade
de São Paulo. São Paulo, SP. Área de Concentração: Biologia/Genética. Orientadora: Profa.
Dra. Anita Wajntal
Graduação (07/01/1994): Bacharelado em Ciências Biológicas. Instituto de Biociências, Letras e
Ciências Exatas (IBILCE), Universidade Estadual Paulista Júlio de Mesquita Filho, Campus
de São José do Rio Preto, SP.
Publicações
Pereira SL, Wajntal A (1999). Reintroduction of guans of the genus Penelope (Cracidae, Aves)
in reforested areas: assessment by DNA Fingerprinting. Biological Conservation 87: 31-38.
Miyaki CY, Griffiths R, Orr K, Nahum L, Pereira SL, Wajntal A (1998). Sex identification of
parrots, toucans, and curassows by PCR: perspectives for wild and captive population
studies. Zoo Biology 17: 415-423.
Miyaki CY, Pereira SL, Biasia I, Wajntal A (1997). DNA fingerprinting applied to captive
breeding programs of parrots. Ararajuba, Brazilian Journal of Ornitology 5: 127-133.
Pereira SL, Miyaki CY, Wajntal A (1996). DNA fingerprinting in the rare black-fronted piping
guan Pipile jacutinga (Cracidae, Aves). Rev. Brasil. Biol. 56: 783-791.
Strahl SD, Brooks DM (compiladores). Mutuns, Jacus e Aracuãs: Plano de Ação de Status e
Conservação (2000 - 2004). Traduções de F Gonzalez-Garcia (espanhol) e SL Pereira
(português). World Pheasant Association/Birdlife International/ Grupo Especialista de
Cracídeos (CSG) da IUCN.
165
Artigos no prelo
Pereira SL, Wajntal A. Studies of captive stocks of the endangered Red-Billed Curassow (Crax
blumenbachii) suggest that this species is not depleted of genetic variability. "Biology and
Conservation of Galliformes in the New Millenium". (Ed. Eitinier JC, Brooks D)
Pereira SL. Mitochondrial genome organization and vertebrate phylogenetics. Genetics and
Molecular Biology.
Artigos submetidos
LA Nahum, SL Pereira, FMC Fernandes-Matioli, SR Matioli, A Wajntal. Divergence time
estimates of toucans and aracaris (Aves: Piciformes: Ramphastidae: Ramphastinae)
based on mitochondrial DNA sequences.
Artigos em redação
Pereira SL. A teoria da reconstrução de árvores filogenéticas moleculares. (Parte do capítulo 1
da presente tese).
Pereira SL, Wajntal A. The mitochondrial control region and phylogenetic inference among
genera of the Cracidae (Aves). (Capítulo 5 da presente tese).
Pereira SL, Baker AJ, Wajntal A. Star radiation within the diversification of curassows, guans
and chachalacas (Aves, Cracidae). (Parte do capítulo 4 da presente tese).
Pereira SL, Miyaki CY, Russo CAM. Inferência de filogenias moleculares. Métodos
probabilísticos. Capítulo 11 do livro Evolução, Filogenias, e Polimorfismos Moleculares,
sob coordenação de Matioli SR.
Russo CAM, Miyaki CY, Pereira SL. Inferência de filogenias moleculares. Métodos
geométricos. Capítulo 9 do livro Evolução, Filogenias, e Polimorfismos Moleculares, sob
coordenação de Matioli SR.
Miyaki CY, Russo CAM, Pereira SL. Inferência de filogenias moleculares. Métodos de
minimização de eventos. Capítulo 10 do livro Evolução, Filogenias, e Polimorfismos
Moleculares, sob coordenação de Matioli SR.
Sérgio Luiz Pereira
25 de Setembro de 2000
166

Documentos relacionados