sérgio luiz pereira filogenia e evolução molecular em cracidae
Transcrição
sérgio luiz pereira filogenia e evolução molecular em cracidae
SÉRGIO LUIZ PEREIRA FILOGENIA E EVOLUÇÃO MOLECULAR EM CRACIDAE (AVES) Chamaepetes Penelopina Penelope Ortalis Aburria Oreophasis Pipile Mitu Megapodius Nothocrax Gallus Aythya Crax Rhea Pauxi INSTITUTO DE BIOCIÊNCIAS UNIVERSIDADE DE SÃO PAULO São Paulo - Brasil 2000 SERGIO LUIZ PEREIRA FILOGENIA E EVOLUÇÃO MOLECULAR EM CRACIDAE (AVES) Tese apresentada ao Departamento de Biologia do Instituto de Biociências da Universidade de São Paulo, para obtenção do título de DOUTOR EM CIÊNCIAS, Área de Biologia/Genética. Orientadora: Profa. Dra. Anita Wajntal Instituto de Biociências Universidade de São Paulo São Paulo – Brasil 2000 Pereira, Sérgio Luiz Filogenia Molecular e Evolução em Cracidae (Aves) 184 páginas Tese (Doutorado) - Instituto de Biociências da Universidade de São Paulo. Departamento de Biologia. 1. Cracidae 2. Filogenia molecular 3. Evolução I. Universidade de São Paulo. Instituto de Biociências. Departamento de Biologia. ___________________________ Profa. Dra. Lucile F. Winter ___________________________ Prof. Dr. Sérgio N. dos Reis ___________________________ Prof. Dr. Carlos F. M. Menck ___________________________ Prof. Dr. Antonio Salatino ___________________________ Profa. Dra. Anita Wajntal Aos meus pais José Vicente e Cida, por todo amor e com todo amor. -"No worries!" Este trabalho foi financiado por FAPESP, CNPq, CAPES (Brasil) e NSERC (Canada). AGRADECIMENTOS À Dra. Anita Wajntal pela orientação, incentivo em minha carreira acadêmica e amizade. Ao Dr. Allan J. Baker pela orientação durante meu estágio em seu laboratório no Canadá e por muitas sugestões e discussões científicas que resultaram neste trabalho. À Dra. Célia P. Koiffmann, chefe da Unidade de Aconselhamento Genético do IBUSP, onde grande parte deste trabalho foi realizado. Às pessoas e instituições que gentilmente cederam amostras de sangue de suas coleções: Centre for Biodiversity and Conservation Biology (Royal Ontario Museum, Canadá), Carlos Keller e Vitor Fasano (Criadouro Tropicus, Pirassununga, Brasil), Fernando Gonzales-Garcia (Instituto de Ecología e Fundácion Ara, México), Maurício dos Santos (Criadouro Chaparral, Recife, Brasil), Companhia Energética de São Paulo CESP-Paraibuna, (Paraibuna, Brasil), Moacyr de Carvalho Dias (Criadouro Poços de Caldas, Poços de Caldas, Brasil), Roberto Azeredo (Fundação CRAX, Belo Horizonte, Brasil). Aos meus amigos e colegas Cintia Fridman, Janice Hughes, Laila A. Nahum, Leandro R. Latorre, Luís Fábio Silveira, Maryann Burbidge, Melina M. Baumgarten, Monica Castro Varela, Nicola Wade, Oliver Haddrath, Silvia Geurgas, Tara Patton pelo incentivo, discussão e sugestões em muitas partes desta tese, correção de erros de português e de digitação e conferência das referências bibliográficas. À Dra. Mayana Zatz, Dra. Maria Rita de P. Bueno e ao Dr. Sérgio R. Matioli pela permissão do uso de seus laboratórios e equipamentos, e a seus técnicos e pósgraduandos. À Dra. Mariana Cabral, Dra. Mari-Anne Van Sluys e Regina Yuri Hashimoto Miura do Depto de Botânica do IBUSP pela utilização do seqüenciador automático. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) pela bolsa de doutorado concedida no primeiro ano deste trabalho (Processo 142295/96-5). À Fundação de Amparo à Pesquisa no Estado de São Paulo pela concessão da bolsa de doutorado nos três últimos anos deste trabalho (Processo 97/02232-1) e pelo financiamento do estágio no Royal Ontario Museum, Toronto, Canadá. À Lynx Edicions, Barcelona, Espanha, pela permissão do uso dos desenhos das aves em alguns capítulos desta tese. Aos meus amigos Alan Greenspan, Ana Paula Protti, Ana Regina Chinelato, Andrea Ramirez, Claudia Frigeri, Cristiane Nucci, Eliete Pardono, Jusceley F. Palamim, Laura Domenchini, Marcelo S. Santos, Maria Cristina C. Braga, Ralf Paiva, Renato Caparroz e ao meu irmão Silvio J. Pereira pelo incentivo de sempre. Aos colegas e professores da pós-graduação do IBUSP e aos colegas da Unidade de Aconselhamento Genético do IBUSP, em especial à Luceleni da Silva e Dona Lurdes. À Roseli Marques Zanelato por todo o carinho e força espiritual. SUMÁRIO ABREVIAÇÕES E SÍMBOLOS _______________________________ RESUMO _______________________________________________ ABSTRACT _____________________________________________ i iii vi Capítulo 1 - INTRODUÇÃO _____________________________ A FAMÍLIA CRACIDAE __________________________________ Origem da Família Cracidae _______________________ FILOGENIA MOLECULAR _________________________________ A Reconstrução Filogenética ______________________ Homologia de Caracteres __________________________ Alinhamento de Seqüências Moleculares ____________ Monofilia _________________________________________ Mutação ___________________________________________ Substituição de Nucleotídeos ______________________ Modelos de Evolução Molecular _____________________ Modelo de equilavência de substituição (JC69) ___ Modelo de dois parâmetros (K80) _________________ Modelo proporcional (F81) _______________________ Modelo HKY85 e F84 ______________________________ Modelo TN93 _____________________________________ Modelo Geral de Reversão ao Longo do Tempo (GTR)_ Métodos de Reconstrução Filogenética ______________ Método de Parcimônia ____________________________ Método de Distância _____________________________ Método de Verossimilhança _______________________ Relógio Molecular _________________________________ Heterogeneidade de Taxas de Substituição entre os Sítios _________________________________ Algoritmos de Reconstrução de Árvores Filogenéticas Algoritmos exatos _______________________________ Busca exaustiva _______________________________ "Branch-and-bound" _____________________________ Algoritmos heurísticos __________________________ Decomposição de estrela ________________________ "Stepwise addition" ____________________________ "Branch-swapping" ______________________________ "UPGMA" e "Neighbor-Joining" ______________________ Eficiência dos Métodos ____________________________ REGISTRO FÓSSIL E BIOGEOGRAFIA _______________________ OBJETIVOS ____________________________________________ 1 2 7 10 11 12 13 15 17 18 19 20 20 20 21 21 22 22 22 25 28 31 35 37 38 38 38 39 39 39 40 40 41 43 45 Capítulo 2 - MATERIAL E MÉTODOS _____________________ TAXONS USADOS ________________________________________ OBTENÇÃO DE SEQÜÊNCIAS DE GENES MITOCONDRIAIS ________ Coleta de Sangue das Aves _________________________ Protocolo 1 - Extração de DNA _____________________ Protocolo 2 - Gel de agarose ______________________ Protocolo 3 - Avaliação da qualidade e da concentração de DNA _______________________ Protocolo 4 - Amplificação e purificação de fragmentos de DNA mitocondrial ______________ Protocolo 5.1 - Recuperação de fragmentos do CR-I_ Protocolo 5.2 - Recuperação dos demais genes ______ Protocolo 6.1 - Purificação do CR-I _______________ Protocolo 6.2 -Purificação dos demais genes _______ Protocolo 7 - Seqüenciamento de produtos de PCR __ Protocolo 8 - Limpeza e montagem das placas de vidro _______________________________ Protocolo 9 - Preparação do gel de poliacrilamida _ Protocolo 10 - Eletroforese de Seqüenciamento _____ Análises das Seqüências ___________________________ Correção de ambiguidades das seqüências ___________ Alinhamento _______________________________________ ANÁLISES EVOLUTIVAS E FILOGENÉTICAS __________________ Análises de saturação de substituição _____________ Mapeamento de verossimilhança _____________________ Máxima verossimilhança ____________________________ Máxima parcimônia _________________________________ Neighbor Joining __________________________________ Índices de suporte ________________________________ Bootstrap _______________________________________ Índices de Bremer _______________________________ Resolução de Quartetos _________________________ Datação de tempo de divergência ___________________ 46 47 47 48 50 52 RESULTADOS ___________________________________________ 72 Capítulo 3 - POSIÇÃO FILOGENÉTICA DE CRACIDAE E MEGAPODIIDAE EM RELAÇÃO AOS GALLIFORMES E ANSERIFORMES __________________________ Abstract _____________________________________________ Resumo _______________________________________________ Introdução ___________________________________________ Material e Métodos ___________________________________ Análise filogenética _______________________________ Testando árvores alternativas ______________________ Resultados ___________________________________________ Discussão ____________________________________________ Referências __________________________________________ 74 75 75 76 77 78 79 79 82 84 52 55 56 57 58 58 59 62 63 64 65 65 67 67 67 67 68 69 70 70 70 70 70 71 Capítulo 4 - FILOGENIA MOLECULAR DE CRACIDAE (AVES) __ Abstract _____________________________________________ Resumo _______________________________________________ Introdução ___________________________________________ Material e Métodos ___________________________________ Táxons amostrados __________________________________ Extração, amplificação e seqüenciamento de DNA _____ Análises filogenéticas _____________________________ Resultados ___________________________________________ Discussão ____________________________________________ Reconstrução filogenética entre os Cracidae ________ Tempo de divergência entre os gêneros de Cracidae __ Origem da família Cracidae _________________________ Referências __________________________________________ 87 88 88 89 90 90 90 92 93 96 96 97 101 101 Capítulo 5 - DOMÍNIO I DA REGIÃO CONTROLADORA DO DNA MITOCONDRIAL E A INFERÊNCIA FILOGENÉTICA ENTRE OS GÊNEROS DE CRACIDAE (AVES) ________ Abstract _____________________________________________ Resumo _______________________________________________ Introdução ___________________________________________ Material e métodos ___________________________________ Resultados ___________________________________________ Discussão ____________________________________________ Referências __________________________________________ 104 105 105 106 107 112 116 118 Capítulo 6 - EVOLUÇÃO MOLECULAR DA SUBUNIDADE II DA CITOCROMO C OXIDASE EM CRACIDAE (AVES) __ Abstract _____________________________________________ Resumo _______________________________________________ Introdução ___________________________________________ Material e métodos ___________________________________ Resultados ___________________________________________ Alinhamento das seqüências de COII ________________ Composição de bases e padrões de substitutição de nucleotídeos ____________________________________ Uso preferencial de códons _________________________ Inferência das seqüências de aminoácidos ___________ Discussão ____________________________________________ Padrão de substituição de nucleotídeos _____________ Padrão de substituição de aminoácidos e uso de códons ______________________________________ Referências __________________________________________ 120 121 121 121 123 124 124 129 132 133 136 136 137 140 Capítulo 7 - CONSIDERAÇÕES FINAIS _______________________ 144 Capítulo 8 - REFERÊNCIAS BIBLIOGRÁFICAS _________________ 150 SÚMULA CURRICULAR _______________________________________ 164 ABREVIAÇÕES E SÍMBOLOS α - taxa de transição; parâmetro de forma da distribuição gama αR - taxa de transição entre purinas αY - taxa de transição entre pirimidinas β - taxa de transversão Γ - distribuição gama χ2 - distribuição de qui-quadrado πI - frequência da base i 12S rDNA - subunidade 12S do DNA ribossômico 16S rDNA - subunidade 16S do DNA ribossômico A - adenina bp - "base pairs" C - citosina COI - subunidade I da citocromo oxidase COII - subunidade II da citocromo oxidase COIII - subunidade III da citocromo oxidase CR-I - domínio I da região controladora do mtDNA cyt b - citocromo b D-loop - "Displacement loop" ou região controladora do mtDNA DNA - ácido desoxirribonucléico dt - intervalo de tempo EDTA - ácido etilenodiaminotetracético EtOH - álcool etílico F81 - Modelo de substituição de DNA de Felsenstein, 1981 F84 - Modelo de substituição de DNA de Felsenstein, 1984 FADH2 - flavina-adenina dinucleotídeo desidrogenase G - guanina GTR - Modelo de substituição de DNA de reversão geral no tempo, do inglês "general time reversible" HKY85 - Modelo de substituição de DNA de Hasegawa, Kishino e Yano, 1985 I - parâmetro de proporção de sítios invariáveis JC69 - Modelo de substituição de DNA de Jukes e Cantor, 1969 K - número de substituições K80 - Modelo de substituição de DNA de Kimura, 1980 LRT - Teste de Razão de Verossimilhança, do inglês "likelihood ratio test" Ma - Milhões de anos ML - Máxima Verossimilhança MP - Máxima Parcimônia mtDNA - DNA mitocondrial My - "Million Years" Mya - "Million Years Ago" NaAc - acetato de sódio NADH - nicotinamida-adenina dinucleotídeo desidrogenase NJ - "Neighbor-Joining" OTU - unidade taxonômica operacional, do inglês "Operational Taxonomic Unit" pb - pares de bases PCR - reação em cadeia da DNA polimerasa, do inglês "Polymerase Chain Reaction" PEG - polietilenoglicol Pij - probabilidade de substituição do nucleotídeo i para j primers- oligonucleotídeos iniciadores RSCU - uso relativo de códons sinônimos, do inglês "Relative Synonymous Codon Usage" T - timina TA - Tris, ácido acético TBE - Tris, ácido bórico e EDTA TEMED - N,N,N',N'- tetrametiletilenodiamino TN93 - modelo de substituição de DNA de Tamura-Nei, 1993 TS - transição TSR - "template suppresion reagent" TS:TV ou TS/TV - razão entre transições e transversões TV - transversão u - taxa de substituição instântanea UPGMA - método de agrupamento de pares sem pesos com média aritmética, do inglês "unweighted pair-group method with arithmetic mean" Resumo Abstract RESUMO FILOGENIA E EVOLUÇÃO MOLECULAR EM CRACIDAE (AVES) A família Cracidae é um dos grupos de aves mais ameaçados do continente americano e as relações filogenéticas de seus gêneros não são totalmente compreendidas. Inúmeros problemas taxonômicos existem na definição de espécies e subespécies. Para resolver parte destes problemas, estabelecemos as relações filogenéticas entre os onze gêneros (Aburria, Chamaepetes, Crax, Mitu, Nothocrax, Oreophasis, Ortalis, Pauxi, Penelope, Penelopina, Pipile) que compreendem a família Cracidae baseadas em 4.519 pares de bases de seis genes mitocondriais (12S e 16S rDNA, COI, COII, COIII e cyt b). Nossas análises demostraram que os cracídeos se separam em dois grupos correspondente às subfamília Cracinae e Penelopinae. Entre os membros da subfamília Cracinae, as relações foram (((Crax, Nothocrax), Pauxi), Mitu) e entre os Penelopinae, ((((((Aburria,Pipile), Penelope), Chamaepetes), Penelopina), Ortalis), Oreophasis). Uma vez que as seqüências estudadas mostraram taxa de evolução constante entre as espécies analisadas, pudemos estimar os tempos de divergências entre os gêneros. A origem da família foi datada em cerca de 75,5 milhões de anos atrás e os gêneros se diversificaram nos últimos 33 milhões de anos. Dados sobre eventos da história da Terra são relacionados com a diversificação da Família. Nossos resultados também mostraram que a família Megapodiidae, atualmente encontrada apenas na região australiana, é grupoirmão dos cracídeos, e a exclusão destas duas famílias dos Galliformes como sugerido por outros dados moleculares não foi apoiada. Averiguamos ainda se o domínio I da região controladora do DNA mitocondrial (CR-I) de Cracidae seria útil para estabelecer as relações filogenéticas intergenéricas. A região CR-I é amplamente usada em análises de relações entre níveis taxonômicos inferiores como espécies e populações e raramente em níveis taxonômicos acima de espécie. Nossos resultados mostraram que a região CR-I apresentou taxa de evolução semelhante aos genes cyt b e COI, considerados anteriormente como apresentando taxas mais lentas de evolução do que esta região. As análises realizadas com as seqüências do CR-I permitiram obter uma árvore com topologia muito semelhante à obtida com os seis genes mitocondriais analisados anteriormente para os gêneros de Cracidae quando um modelo evolutivo mais apropriado foi empregado nas reconstruções filogenéticas. Seqüenciamos totalmente o gene da COII, um gene bastante conservado entre os metazoários devido ao fato de exercer uma função importante na cadeia respiratória. A análise dessas seqüências mostrou que o COII de cracídeos apresenta características similares às sequências de COII de outros metazoários. Alguns dos aminoácidos conservados entre diversos organismos já estudados até hoje também se mostraram conservados entre os cracídeos, porém alguns resíduos considerados conservados entre os metazoários se mostraram modificados em cracídeos, o que leva a sugerir que diferentes táxons possam atribuir a diferentes resíduos de aminoácidos as funções de centro ativo de ligação ao citocromo c e ao íon de cobre. ABSTRACT MOLECULAR PHYLOGENY AND EVOLUTION OF CRACIDAE (AVES) The family Cracidae is one of the most threatened bird groups in the Americas, and its phylogeny at the generic level has not been established. Morever, other taxonomic problems are related to species and subespecies definition. To answer some of these taxonomic questions we estimated the phylogenetic relationships of the eleven Cracidae genera (Aburria, Chamaepetes, Crax, Mitu, Nothocrax, Oreophasis, Ortalis, Pauxi, Penelope, Penelopina, and Pipile) based on phylogenetic analysis of 4,519 base pairs of six mitochondrial genes (12S and16S rDNA, COI, COII, COIII and cyt b). Our results showed the separation of the two Cracidae subfamilies (Cracinae and Penelopinae). The relationships among the Cracinae were (((Crax, Nothocrax), Pauxi), Mitu) and among the Penelopinae, ((((((Aburria,Pipile), Penelope), Chamaepetes), Penelopina), Ortalis), Oreophasis). Our sequences seems to have evolved at a constant rate; thus we estimated the time of Cracidae origin as around 75.5 million years ago and genera diversification occurred in the last 33 million years. We also related Earth history events to cracid diversification. We could also establish that the family Megapodiidae, found in the Australian region nowadays, is the sister clade to Cracidae. The exclusion of the Cracidae and Megapodiidae from the Galliformes, as suggested by other molecular studies, was not supported by our sequences analysis. We also studied the first domain of the mitochondrial control region (CR-I) to verify its utility in genera phylogenetic inference. The CR-I is widely used to establish relationships of lower taxonomic levels such as species and populations, but rarely above the species level. Our results showed that the Cracidae CR-I sequences evolved at similar rates as cyt b and COI sequences, considered to have lower evolutionary rate than the CRI. Cracid genera phylogeny obtained through analysis of CR-I was similar to that obtained by the analyses of other mitochondrial genes cited above, when a more realistic model of DNA evolution was used in tree reconstruction. We sequenced the complete Cracidae COII, a highly conserved gene among metazoans due to its function in the respiratory chain. Our results show that cracid COII is similar to other metazoan COII in relation to base composition, codon usage and patterns of nucleotide and aminoacid substitution. Some conserved aminoacid residues among the metazoan were also found in Cracidae but some residues considered being conserved in animals, presented aminoacid substitutions in Cracidae COII, leading us to suggest that diferent taxa could choose different aminoacid residues to function as a cleft for cytochrome c binding and copper-ligand residues. Capítulo 1 Introdução Introdução INTRODUÇÃO A FAMÍLIA CRACIDAE Relacionada aos demais galiformes, a família Cracidae compreende aves nãopasseriformes distribuídas em 11 gêneros (Fig. 1), 50 espécies e cerca de 60 subespécies (del Hoyo et al., 1994; Nardelli, 1993). Revisões taxonômicas (Vuilleumier, 1965; Vaurie, 1968) tentaram elucidar a relação e distribuição dos cracídeos. Cada espécie dentro do grupo tem sua distribuição bem delineada por barreiras geográficas naturais como rios, montanhas e vales. Espécies de gêneros diferentes e, em alguns casos, espécies de um mesmo gênero, podem ocorrer em um mesmo local (simpatria), ocupando, porém, micronichos distintos. Aparentemente, espécies de um mesmo gênero apresentam distribuição alopátrica, excluindo ou ocupando o nicho de outros membros (Sick, 1993). Aburria Chamaepetes Oreophasis Ortalis Penelope Crax Penelopina Mitu Nothocrax Pipile Pauxi Figura 1. Os onze gêneros da Família Cracidae, subdivididos nas subfamílias Penelopinae (duas primeiras linhas) e Cracinae (última linha). Os desenhos não estão em escala e foram modificados de del Hoyo et al. (1994), com permissão da Lynx Edicions, Barcelona. De hábito arborícola, alimentam-se basicamente de folhas e frutos e, eventualmente, pequenos animais. Podem ser encontrados desde o sul do Texas nos Estados Unidos, ao norte da Argentina e Uruguai. Ocupam florestas tropicais ou florestas 2 Introdução em áreas montanhosas e úmidas, tendo um papel fundamental em manter o ecossitema que habitam por meio da dispersão e predação de sementes das plantas das quais se alimentam (Caziani e Protomastro 1994; Érard et al. 1991; Érard e Théry 1991; Théry et al. 1992; Santamaria e Franco 1994; Peres e van Roosmalen 1996; Guix e Ruiz 1997; Sedaghatkish et al. 1999). Na presente tese iremos assumir que os cracídeos podem ser distinguidos em três tipos morfológicos a saber: mutuns (Crax, Mitu, Nothocrax e Pauxi) da subfamília Cracinae, e jacus e jacutingas (Aburria, Chamaepetes, Oreophasis, Penelope e Penelopina, e Pipile) e aracuãs (Ortalis) da subfamília Penelopinae (Fig. 1)(Sick, 1993). Os mutuns são representados pelos maiores indivíduos da família Cracidae (80-90 cm, exceto Nothocrax, com 58 cm). Apresentam hábitos mais terrestres que os demais cracídeos. A pélvis é mais alongada e estreita que a dos jacus mais arborícolas. Muitas espécies possuem intumescências na cera (ceroma) localizada na base do bico, as quais podem apresentar coloração azul, vermelha ou amarela, e cristas bem desenvolvidas. Os mutuns vêm ao solo mais freqüentemente do que os jacus, jacutingas e aracuãs. Os membros do gênero Pauxi apresentam ainda uma projeção óssea dorsal na maxila superior recoberta por uma camada córnea de coloração azul empalidescido (Delacour e Amadon, 1973). Já os jacus e jacutingas são animais de tamanho médio (50 a 70 cm) e raramente vêm ao chão. Muitas espécies de jacus e jacutingas apresentam a garganta nua e uma barbela desenvolvida. A barbela tem coloração púrpura ou azul nas espécies de jacutingas, muitas espécies apresentando ainda a parte inferior da barbela avermelhada. Por sua vez os jacus apresentam barbela vermelha. As espécies do gênero Chamaepetes, típicas de regiões montanhosas, úmidas e frias não apresentam a garganta nua e barbela. A crista é pouco desenvolvida entre os jacus e jacutingas. O gênero monoespecífico Oreophasis apresentam ainda uma projeção óssea na cabeça recoberta por um camada córnea de coloração vermelha (Delacour e Amadon, 1973). Os aracuãs são os menores indivíduos do grupo (40 a 50 cm). Apresentam plumagem de coloração parda. Não apresentam intumescências no bico ou barbela na 3 Introdução garganta, mas a garganta é nua e colorida. Habitam matas arbustivas, e geralmente invadem áreas onde houve desmatamento ou queimadas (Delacour e Amadon, 1973). Os cracídeos são muito sensíveis a perturbações ambientais causadas pelo homem. Desta maneira podem ser usados como indicadores biológicos da qualidade do habitat, auxiliando programas de manejo e conservação de áreas tropicais ainda intactas e áreas de proteção ambiental (Strahl e Grajal 1991). Economicamente, estas aves poderiam ser usadas em culturas de subsistência bem programadas. Populações humanas indígenas e rurais de toda a América Latina utilizam espécies de cracídeos como uma fonte principal de proteína animal em sua alimentação (Delacour e Amadon 1973; Silva e Strahl 1991). O envolvimento dessas comunidades na exploração de subsistência poderia auxiliar a manter estas espécies vivas na natureza. O potencial ecoturístico dos cracídeos também é grande. Por exemplo, Groom et al. (1991) estimou que mais de 1,2 milhões de dólares americanos foram gerados em 1987 por turistas estrangeiros visitando a região de Madre de Dios para observar a vida silvestre na Amazônia peruana. Em uma das pousadas na região de Madre de Dios, Munn (1992) estimou que 150 pessoas foram beneficiadas pelo ecoturismo em 1987, e 270 pessoas em 1989. Além disso, o ecoturismo poderia encorajar as pessoas das comunidades locais latinoamericanas a se tornarem guias turísticos e se integrarem em projetos educacionais e de conservação das espécies em riscos. Muitas das espécies e subespécies de Cracidae são ameaçadas de extinção (Tabela 1; Collar et al., 1992). As causas de extinção são basicamente a destruição de habitat e caça excessiva. As falhas no conhecimento da biologia de muitas das espécies impedem sua proteção, uma vez que impossibilitam a elaboração de planos de ação para a conservação das espécies e a designação de reservas biológicas. O status de conservação de algumas espécies de cracídeos é crítico, especialmente as de distribuição mais restrita como Oreophasis derbianus, Mitu mitu, Pipile pipile, Penelope perspicax, Penelope albipennis, Crax alberti, Crax blumenbachii e Pauxi pauxi. Penelope perspicax e Crax alberti, por exemplo, estão quase extintos na Colômbia (Velasco, 1997). Penelope albipennis foi considerada extinta no Peru até ser 4 Introdução recentemente redescoberta (Macedo-Ruiz, 1979), sendo agora estudada em campo e em cativeiro (Ortíz e Diaz, 1997; Ortíz e O'Neill, 1997; Diaz e del Solar, 1997). Aparentemente há menos do que 200 indivíduos de Penelope albipennis na natureza (Diaz e del Solar 1997). Tabela 1. Lista de espécies de Cracidae, grau de ameaça de acordo com a classificação da Birdlife International e do Grupo Especialista de Cracideos (CSG) da União Internacional de Conservação da Natureza (IUCN) e sua distribuição geográfica. Lista compilada por S. Strahl e D. Brooks para o Plano de Ação de Conservação do CSG da IUCN a ser proposto para 20002004. Espécie BirdLife/IUCN CSG Distribuição Ortalis leucogastra LC IN México - Nicarágua O. erythroptera VU VH Equador S - Peru N O. superciliaris EN IN Brasil NE Penelope purpurascens LC IN México C - Equador P. perspicax EN IM Colômbia O P. albipennis CR IM Peru NO P. ortoni VU HI Colômbia O - Equador P. ochrogaster VU HI Brasil C,E P. pileata VU HI Brasil C,E P. dabbenei NT HI Bolívia S - Argentina N P. jacucaca NT HI Brasil E P. superciliaris NT LO Brasil - Argentina P. obscura LC IN Paraguai - Uruguai P. argyrotris NT IN Venezuela - Colômbia P. barbata EN VH Equador S - Peru NO P. montagnii NT IN Venezuela - Colômbia Pipile pipile CR IM Trinidad P. cujubi LC IN Brasil O,C - Bolívia NE P. jacutinga VU VH Brasil SE - Argentina NE Aburria aburri NT HI Venezuela O - Peru C Chamaepetes goudotii LC IN Colômbia - Bolívia C. unicolor EN VH Costa Rica - Panama N Penelopina nigra VU HI México S - Nicaragua N Oreophasis derbianus EN IM México S - Guatemala N Mitu mitu EW IM Brasil CE M. tuberosa LC IN Colômbia SE - Bolívia N M. salvini LC IN Colômbia SE - Peru NE Pauxi pauxi EN IM Venezuela N - Colômbia E P. unicornis EN VH Peru SE - Bolívia C Crax rubra NT HI México C - Equador O C. alberti CR IM Colômbia N C. daubentoni NT HI Colômbia NE – Venezuela C. fasciolata LC HI Brasil NC - Argentina NE C. globulosa VU HI Colômbia SE - Brasil O C. blumenbachii CR IM Brasil SE Distribuição: C = Central, E = leste, N = norte, S = sul, O = oeste. Status do BirdLife: EW = extinto na natureza, CR = criticamente em perigo, EN = em perigo, VU = vulnerável, NT = quase ameaçado, LC = pouca preocupação. Prioridades de conservação do CSG: IM = imediata, VH = muito alta, HI = alta, IN = intermediária, LO = menor do que intermediária. 5 Introdução O mutum-de-Alagoas (Mitu mitu), endêmico do estado de Alagoas no Brasil, pode estar extinto na natureza, sendo representado por poucas aves em cativeiro (Nardelli, 1993). A ameaça principal desta espécie é a perda de habitat devido ao aumento do cultivo de cana-de-açucar no estado (D'Angieri, 1997). Um programa de reprodução em cativeiro para C. blumenbachii tem sido realizado a algum tempo em Belo Horizonte, Brasil, e cerca de 60 casais foram reintroduzidos em parte de sua distribuição original por meio de esforços da Fundação Crax e com apoio da Stichting Crax, Europa (Azeredo 1996, Simpson e Azeredo 1997). A reintrodução dessas aves tem alcançado sucesso, e a segunda geração das aves reintroduzidas já foi documentada (Azeredo 1996, Scheres 1997). Contudo, estudos recentes demonstraram que os indivíduos não aparentados usados na reintrodução apresentam variabilidade genética esperada para indivíduos com parentesco de primeiro grau (Pereira e Wajntal, no prelo), evidenciando a necessidade de aumentar a variabilidade genética do estoque cativo de onde estas aves provenieram. Quanto às relações filogenéticas do grupo a literatura científica a respeito é extremamente escassa. Segundo dados obtidos em experimentos de hibridação de DNADNA, Sibley et al. (1988) propõem a separação do grupo em uma ordem diferente dos Galliformes, a ordem Craciformes, composta de duas subordens, que incluiria os cracídeos (Craci) e os megapodídeos (Megapodii). Em 1976, Prager e Wilson já haviam sugerido a separação dos Cracidae dos demais galiformes baseando-se em estudos de proteínas. Segundo este estudo, a separação entre os cracídeos dos demais galiformes teria ocorrido na mesma época que a separação Galliformes-Anseriformes. Delacour e Amadon (1973) esquematizaram a possível relação entre os cracídeos, baseados no conhecimento da biologia desta família. Para eles, os mutuns (Crax e Nothocrax) seriam grupo-irmão dos demais gêneros. Chamaepetes, Aburria, Penelopina e Penelope são próximos entre si e apresentam ancestral comum com Ortalis que por sua vez teria se divergido a partir de uma linhagem que levou aos modernos Oreophasis. Desde essa proposta das relações filogenéticas dessa família, a classificação dos Cracidae sofreu modificações. O gênero Crax foi subdividido em Crax, Mitu e Pauxi. As espécies 6 Introdução do gênero Aburria foram subdivididas nos gêneros Aburria e Pipile. Sibley e Ahlquist (1990) usaram cinco dos onze gêneros reconhecidos atualmente para a família Cracidae em seus estudos de relações filogenéticas de aves baseados nas técnicas de hibridação DNA-DNA. Seus estudos sugerem que Crax e Ortalis são mais relacionados entre si do que aos demais jacus. Entre os jacus, Chamaepetes é mais relacionado ao grupo (Penelope, Pipile). Recentemente Nardelli (1993) sugeriu a necessidade de padronizar sistematicamente este grupo devido a problemas taxonômicos em relação a o que considerar como uma espécie ou uma raça (Delacour e Amadon, 1973; del Hoyo et al., 1994). Por exemplo, no gênero Ortalis há a necessidade da definição do status de espécie das subespécies Ortalis guttata columbiana e Ortalis ruficauda lamprophonia. No gênero Penelope deve haver uma ampla revisão das espécies e quais as relações entre elas, especialmente entre Penelope argyrotis/Penelope barbata. Ainda Penelope montagnii pode ser composta de duas subespécies distintas uma vez que há diferenças de vocalização entre as duas populações conhecidas. Os mutuns também apresentam problemas taxônomicos específicos. A delimitação de Mitu mitu como uma espécie a parte de Mitu tuberosa é questionada por alguns cracidologistas. Crax rubra pode representar um complexo de subespécies e raças ainda não bem definidas. Origem da Família Cracidae Em relação à origem da Família Cracidae, duas hipóteses foram propostas. Uma delas proposta por Darlington (1957) é baseada em dados de distribuição das espécies de cracídeos. Para Darlington, os cracídeos estavam presentes na América do Sul antes que a América Central surgisse, ligando as Américas do Sul e do Norte há 3,5 milhões de anos. O autor se baseou ainda no fato de que áreas com o maior número de espécies são o centro de origem e dispersão. A hipótese concorrente admite uma origem Norte ou Centro-americana, e foi formulada por Delacour e Amadon (1973) baseado nos mesmos dados de distribuição usados por Darlington. Delacour e Amadon sugeriram que a diversificação deles se deu 7 Introdução em decorrência de sua entrada na América do Sul, uma ampla área com diferentes nichos para serem preenchidos. Com base na primeira hipótese, os cracídeos teriam passado por um processo de dispersão e diferenciação múltiplas. Os gêneros Penelopina e Oreophasis são encontrados apenas na América Central, enquanto em toda a América do Sul apenas Nothocrax é endêmico. Os mutuns bem como os jacus do gênero Penelope são mais diversificados na América do Sul do que na América do Norte. A hipótese levantada por Darlington apresenta alguns pontos favoráveis. Os Galliformes, assim como outros grupos de aves como as ratitas, os anseriformes, os psitaciformes, pombos, passeriformes, mergulhões e pinguins, se originaram na Gondwana (Cooper e Penny, 1997; Cracraft, 1974) e levaram Cracraft (1974) a propor que as aves galináceas deveriam ter se dispersado da América do Sul para a América do Norte, e posteriormente alcançado a Ásia e Europa. A família Megapodiidae é considerada o grupo-irmão dos Cracidae (Cracraft, 1974; Sibley et al., 1988; del Hoyo et al., 1994). Seus representantes são encontrados em áreas arbustivas secas e florestas tropicais na região australiana. Este padrão de ditribuição disjunta entre táxons irmãos pode ser explicado pela teoria da tectônica de placa, especialmente a quebra da Gondwana. Um caso clássico de distribuição disjunta é o caso das aves ratitas (e.g., van Tuinen et al., 1998). Os Cracidae e os Megapodiidae são considerados os mais primitivos Galliformes (Cracraft, 1974; del Hoyo et al., 1994). Durante a divergência destas duas famílias, o clima do continente Antártico parecia ser favorável para a sobrevivência de plantas e animais, e então poderia servir como uma rota de dispersão entre organismos sulamericanos e australianos (Briggs, 1987, e referências citadas; Huber, 1998). Seus ancestrais poderiam ter se tornado extintos com o esfriamento do clima do continente e formação das calotas de gelo conforme a Antártica foi migrando cada vez mais ao sul. De fato, Alvarenga (1995) evidencia um outro ponto favorável à origem sulamericana dos cracídeos: a descrição do primeiro registro fóssil de um Megapodiidae do Oligo/Mioceno do Brasil. Se o ancestral dos Cracidae e Megapodiidae esteve presente na América do Sul, os Megapodiidae poderiam ter alcançado a Austrália através da 8 Introdução Antártica, como já sugerido para outros grupos como anuros, lagartos, tartarugas, artrópodos e especialmente, marsupiais (Briggs, 1987, Springer et al., 1998). Não há registro fóssil de Cracidae na América do Sul. Na América do Norte seis fósseis foram atribuídos aos Cracidae: 1) Procax brevipes (Tordoff e Macdonald, 1957) do Oligoceno, Palaenossax senectus (Wetmore, 1956) do Oligoceno e Ortalis pollicaris (Miller 1944) do Mioceno na Dakota do Sul; 2) Boreortalis laesslei (Brodkorb, 1954) do Mioceno na Florida; e 3) Ortalis phengites (Wetmore, 1923) do Plioceno e Ortalis tantala (Wetmore, 1933) do Miocene em Nebraska. Contudo, Crowe e Short (1992) argumentaram que a maioria dos caracteres atribuídos a estes fósseis norteamericanos são na realidade primitivos aos Galliformes e não os definem necessariamente como Cracidae. A presença de um pequeno galiforme em depósitos do Eoceno em Quercy, França (Mourer-Chauviré, 1992) tidos como relacionados aos megapodídeos modernos e classificado como uma família a parte, os Quercymegapodiidae, é uma evidência contra a origem sulamericana dos Cracidae. Se os Galliformes tivessem se originado no Hemisfério Norte, a explicação para a distribuição disjunta dos Cracidae e Megapodiidae requer que estas aves ou seus ancestrais tenham se tornado extintos em toda a América do Norte e Ásia. Contudo, parece haver evidências contra a proximidade do fóssil francês com os Megapodiidae modernos (cf. del Hoyo et al., 1994), tornando novamente a hipótese sulamericana da origem dos cracídeos mais plausível e facilmente explicada por dispersão pela Antártica e pela tectônica de placas. Para auxiliar a elucidar as relações filogenéticas e a evolução da família Cracidae, são necessários revisões taxonômicas, estudos comportamentais e estudos moleculares. Do ponto de vista molecular, o estudo do DNA mitocondrial (mtDNA) tem auxiliado sobremaneira os estudos ornitológicos que visam estimar a diversidade genética (Gutierrez, 1994), distinguir populações de uma mesma espécie (Ball et al., 1988; Freitag e Robinson, 1993), e estabelecer relações filogenéticas (Cooper et al., 1992; Krajewski e Fetzner, 1994; Myaki et al., 1998, Nahum et al., submetido). As técnicas de seqüenciamento de genes mitocondriais e a teoria de reconstrução filogenética molecular podem auxiliar a resolver parte dos problemas evolutivos da família Cracidae. 9 Introdução FILOGENIA MOLECULAR Desde tempos remotos na história da humanidade, já existia uma preocupação de descrever e classificar a diversidade biológica. Contudo, somente na segunda metade desse nosso século foi proposto um sistema de classificação biológica, baseado na premissa de que os organismos constituem sistemas contínuos e modificados. Willi Hennig, um entomólogo alemão, fundava uma nova corrente de classificação dos seres vivos, a Cladística ou Sistemática Filogenética (Hennig, 1950). Esta escola foi pouco difundida no mundo científico em sua primeira década de existência até a obra original de Hennig publicada em 1950 ser traduzida do alemão para o inglês em 1966. Nos anos que se seguiram observou-se grandes avanços conceituais e metodológicos em filogenia, e sua aplicação não apenas em questões relacionadas à classificação da biodiversidade mas também nos mais diversos ramos das Ciências Biológicas, visando auxiliar a compreender a diversidade biológica, a evolução dos táxons e a modificação dos caracteres morfológicos, comportamentais, fisiológicos e moleculares. Ao mesmo tempo que a teoria filogenética passava a ser mais amplamente empregada, o surgimento de técnicas de análise de DNA como a análise de produção de fragmentos gerados por enzimas de restrição, a clonagem gênica, a reação em cadeia da polimerase, e o seqüenciamento de DNA, permitiu se compreender melhor a estrutura molecular dos genes e genomas. Estas técnicas de estudo do DNA permitiram ampliar os estudos de evolução molecular em duas áreas principais que se interrelacionam intimamente: (1) o estudo dos mecanismos e padrão de evolução de ácidos nucléicos e de proteínas, fundamental para idealizar modelos para a inferência das relações entre os organismos e (2) a reconstrução da história evolutiva dos organismos, também conhecida como filogenia molecular, e aliada a outras disciplinas como biogeografia, geologia e paleontologia, permite traçar hipóteses de origem, datação e evolução dos organismos e possibilita determinar e compreender a ordem das mudanças dos caracteres. 10 Introdução A Reconstrução Filogenética A reconstrução filogenética consiste em estimar as relações de ancestralidade para um determinado grupo de táxons. Por sua vez, os táxons podem ser famílias, gêneros, espécies, populações ou qualquer nível taxonômico cuja história evolutiva se quer determinar. Comumente são chamados de unidades taxônomicas operacionais ou simplesmente OTUs, do inglês "operational taxonomic unit". Árvores filogenéticas são representações gráficas destas relações taxonômicas, e contém ramos, nós internos e terminais. Os nós terminais representam as OTUs estudadas, as quais são unidas por ramos cujo nó interno representam o ancestral destes táxons (Fig. 2-a). Em outras palavras, podemos definir uma árvore como a topologia entre as OTUs e comprimento dos seus ramos, que por sua vez são uma representação quantitativa do número de mudanças evolutivas ocorridas ao longo daquela linhagem. A Aves 1 A 2 5 B Mamíferos Crocodilos C D Anfíbios 7 6 E F 9 11 8 B Serpentes 3 4 Tartarugas G D Lagartos C 10 Tartarugas Aves B Cobras Serpentes A 12 Mamíferos Lagartos Anfíbios Crocodilos Figura 2. Representação de uma árvore dicotômica enraizada (a) e não enraizada (b). Anfíbios, Mamíferos, Tartarugas, Lagartos, Serpentes, Crocodilos e Aves são as OTUs representadas nos nós terminais. Estas OTUs são unidas aos seus ancestrais (representados pelos nós internos A, B, C, D, E, F e G) através de ramos (1-12). Note que na árvore não enraizada, os ancestrais E e F são unidos em G. Uma árvore como a mostrada graficamente na figura 2 indica que as Aves e os Crocodilos são grupos-irmãos pois apresentam um ancestral comum mais próximo entre si do que com os outros clados, assim como o são Serpentes e Lagartos. Por sua vez o clado (Aves, Crocodilos) é grupo-irmão de (Serpentes, Lagartos), e assim por diante. Ela 11 Introdução pode ser representada linearmente da seguinte maneira: (Anfíbios, (Mamíferos, (Tartarugas, ((Serpentes, Lagartos), (Aves, Crocodilos))))). Em outras palavras, cada nó interno é representado por um par de parenteses que inclue todas as OTUs descendentes deste nó. Homologia de Caracteres Assim como a Sistemática Filogenética, a Sistemática Molecular baseia-se no conceito de homologia de caracteres para traçar a história evolutiva dos táxons em questão. Diz-se que estruturas ou orgãos são homólogos se eles apresentam uma origem embrionária comum, não necessariamente apresentando a mesma função. Por exemplo, as patas dianteiras do jacaré, as asas dos morcegos, os braços humanos e as asas das aves exercem funções diferentes mas apresentam um mesma origem embrionária. Estruturas que não apresentam uma origem embrionária comum, embora possuam semelhanças morfológicas e funcionais, são chamadas análogas, como as asas dos insetos e as asas dos morcegos. O fenômeno resultante do conjunto de processos (convergência, paralelismo e reversão) que leva à formação de duas estruturas análogas é denominado homoplasia. Embora estes termos tenham sido definidos inicialmente para caracteres morfológicos, eles também se aplicam a genes. E quando estamos tratando de genes, o conceito de homologia torna-se um pouco mais complexo. Dizemos que dois genes são ortólogos caso eles tenham homologia dada através de especiação, e portanto apresentam um ancestral comum. Os genes mitocondriais, por exemplo, são considerados ortólogos, pois acredita-se que a origem da mitocôndria nos seres vivos tenha ocorrido em um estágio inicial da história da vida, antes da divergência entre os seres vivos atuais. Se a homologia entre dois genes deve-se a duplicação de um gene ancestral em uma mesma espécie então eles são ditos parálogos. Em alguns casos poucas modificações nucleotídicas são suficientes para conferir ao gene uma função diferente. A utilização de genes pertencentes a famílias gênicas (paralogia) dificulta a obtenção de seqüências de uma mesma região do genoma, uma vez que as cópias podem possuir diferentes pressões de seleção, ter diferentes histórias evolutivas e até mesmo ocupar cromossomos diferentes. Por exemplo, em Chaetognatha, um grupo de invertebrados marinhos vermiformes, há duas classes de genes ribossomais 28S. Ambas as cópias 12 Introdução parecem ser funcionais e possuem taxas evolutivas diferentes, o que causou problemas de interpretação da história evolutiva deste grupo (Telford e Holland, 1997). Um outro caso de homologia de genes, a xenologia, ocorre quando um gene de uma espécie é introduzida em outra espécie, fenômeno conhecido como transferência horizontal. Isto pode ocorrer por exemplo através de retrovírus, ou através da formação de híbridos férteis que cruzam com indivíduos de uma das espécies parentais. Um quarto conceito de homologia gênica, a plerologia, ocorre por meio da interação entre exons e introns de um mesmo gene, como por exemplo, através de embaralhamento de exons (“exon shuffling”) ou de evolução em concerto (“concerted evolution”). Genes parálogos e plerólogos podem ser úteis para mostrar eventos de surgimento de novos genes ou famílias gênicas, mas não refletem a história evolutiva entre unidades taxonômicas. Alinhamento de Seqüências Moleculares A inferência da árvore evolutiva de um grupo de táxons a partir da comparação entre as seqüências de genes homólogos requer que estas seqüencias estejam alinhadas. O alinhamento nada mais é do que uma hipótese de homologia e como tal, consiste em trabalhar com seqüências homólogas e definir posições homólogas ao longo destas seqüências. Assim sendo, um outro conceito de homologia se faz necessário: a homologia posicional. Uma vez que para uma dada seqüência cada posição ou sítio é tratado como um caracter, pressupôe-se que essas posições sejam homólogas. Freqüentemente o conceito de homologia é confundido com o conceito de similaridade. Se dois genes são sabidamente homólogos e as posições homólogas foram definidas, podemos estabelecer a quantidade de sítios iguais entre as seqüências destes dois genes. Assim se as seqüências deles apresentam 100 sítios, dos quais 92 são idênticos e 8 deles são variáveis, eles ainda continuam sendo homólogos e apresentam 92% de similaridade entre si, e não 92% de homologia. A homologia posicional em seqüências ortólogas permite reconhecer substituições e eventos de inserção e deleção (“indels”) de bases em uma ou mais seqüências. O termo "indel" é útil neste caso porque nem sempre é possível determinar a priori em um 13 Introdução alinhamento se houve um evento de inserção de nucleotídeos em um grupo de seqüências ou se ocorreu a perda de alguns nucleotídeos no outro grupo. Indels que ocorrem durante o processo evolutivo podem ser mantidos, especialmente se não afetarem o valor adaptativo do portador. É importante saber se eles representam realmente eventos de inserção/deleção que ocorreram ao longo da evolução, ou se eles simplesmente representam lacunas que se originaram durante o alinhamento das seqüências, pela ocupação de uma mesma região por bases diferentes. As regiões onde os indels ocorrem apresentam lacunas de alinhamento. Os métodos de inferência filogenética podem lidar com as lacunas como um quinto estado do caracter ou então ignorar na análise os sítios que as apresentam. O problema de desconsiderar essas regiões com lacunas é que podemos perder informação evolutiva se elas representarem verdadeiros eventos indels (Morrison e Ellis, 1997). O alinhamento dos genes que codificam proteínas é relativamente fácil, devido ao fase de leitura, que permite reconhecer modificações mais freqüentemente na terceira posição do códon. Genes ribossomais podem ser facilmente alinhados se a estrutura secundária da molécula for levada em consideração e/ou se os táxons em estudo são próximos entre si. Domínios funcionais podem ser facilmente reconhecidos. Seqüências não codificantes para proteínas, como as regiões 5’ e 3’ não transcritas, e 5’e 3’não traduzidas, introns de genes nucleares e a região controladora do DNA mitocondrial, são de difícil alinhamento. Diferenças nas taxas de substituições ou a saturação de substituições em seqüências podem introduzir homoplasias ao longo do tempo, dificultando o alinhamento e interferindo na estimativa da filogenia. O alinhamento pode ser feito manualmente, quando pouca variação existe entre as seqüências, ou através de algoritmos computadorizados. Esses algoritmos buscam sempre alinhar o máximo de nucleotídeos em todas as posições e dão pesos diferentes à presença e à extensão das lacunas durante o alinhamento. Contudo, após o alinhamento ser feito pelo computador, uma averiguação visual sempre é recomendada para que se decida se o alinhamento realizado é satisfatório ou se há necessidade de correções. 14 Introdução Monofilia Outro ponto importante da reconstrução filogenética é o conceito de monofilia. Quando se deseja inferir a relação de um dado grupo taxonômico, partimos do pressuposto de que nosso grupo de análise é monofilético, isto é, as OTUs que analisamos apresentam um ancestral comum. Grupos monofiléticos por definição incluem aqueles táxons que apresentam sinapomorfias, isto é caracteres derivados de um mesmo ancestral comum. Por exemplo, a partir de nossa figura 2, podemos definir um grupo monofilético denominado Amniota composto pelos clados dos Mamíferos, Tartarugas, Lagartos, Serpentes, Crododilos e Aves, cujo ancestral mais recente está representado pelo nó interno E. Já o tradicional grupo Reptilia (Tartarugas, Lagartos, Serpentes e Crocodilos) não constitui um grupo monofilético uma vez que um de seus representantes (as Aves) é considerado um grupo a parte. Contudo, o clado formado pelos Crocodilos e Aves pode ser considerado monofilético por apresentar um ancestral representado pelo nó interno A. Este grupo é denominado de Archosauria. Grupos não monofiléticos podem ser denominados parafiléticos ou polifiléticos (Hennig, 1966). Parafilia ocorre quando o grupo de OTUs possui caracteres diagnósticos que são na verdade simplesiomorfias, isto é, são um conjunto de caracteres primitivos, e nem todos os descendentes do ancestral comum deste grupo estão incluídos no grupo interno, como no caso Aves-Répteis. Polifilia inclui grupos onde os caracteres diagnósticos são homoplásicos e os táxons não são descendentes de um mesmo ancestral comum, como por exemplo agrupar Aves e Mamíferos simplesmente por apresentarem homotermia. Segundo Bernardi (1981), grupos não monofiléticos deveriam ser chamados de merofiléticos (mero, do grego, parte ou porção), uma vez que este termo não provoca a confusão dos conceitos de parafilia e polifilia. Uma maneira de se testar a monofilia de um grupo de OTUs é através da inclusão de um grupo externo (Maddison et al., 1984), isto é, um táxon sabidamente próximo, porém não pertencente ao grupo de análise, o grupo interno. Por exemplo, em nossa figura 2, Anfíbios e Mamíferos podem ser considerados grupo externo dos clados cujo ancestral comum é D (clado este denominado Sauropsida). 15 Introdução O uso do grupo externo surgiu na escola cladística, diferenciando-a da escola fenética. Esta por sua vez, agrupa os táxons simplesmente por semelhanças compartilhadas. Para a escola cladista, a escolha do grupo externo está baseada em usar um ou mais táxons que apresentem caracteres primitivos (plesiomórficos) em relação aos táxons do grupo interno. O grupo externo será responsável pela polarização das modificações das características morfológicas. Na escola molecular, o uso de um táxon não pertencente ao grupo interno pode ser usado para enraizar a árvore filogenética, sem uma hipótese a priori de polarização de mudança de nucleotídeos. Isto é relevante neste caso porque a reversão de um nucleotídeo para o seu estado ancestral pode ocorrer, e a mudança de um nucleotídeo para outro não pode ser polarizada. Afinal uma mudança de um nucleotídeo A para G, por exemplo, não requer a passagem pelo outros estados (C ou T). Se vários táxons são usados como grupos externos, a monofilia do grupo interno pode ser constatada se nenhum dos nossos táxons internos forem separados dos demais por um ou mais táxons do grupo externo. Um procedimento que dispensa o uso de grupos externos é a construção de árvores não enraizadas (fig. 2-b), o que consiste em demonstrar apenas as relações entre as OTUs sem no entanto fazer relações temporais de divergência e sem definir relações de ancestrais e descendentes. Desta maneira, também não ocorre a polarização dos caracteres a priori. De um modo geral, a análise e reconhecimento de grupos monofiléticos em árvores não enraizadas é mais difícil do que em árvores enraizadas. Em uma árvore não enraizada, o grupo Anfíbios, considerado grupo-externo dos demais tetrápodas na árvore enraizada da figura 2-a, poderia ser considerado aparentemente mais próximo aos Mamíferos, indicando que um certo cuidado deve ser tomado na interpretação destas árvores. O número de árvores dicotômicas enraizadas (R) e não enraizadas (U) possíveis são dados, respectivamente, pelas fórmulas: R = [(2n-3)!] / [2n-2(n-2)!] e U = [(2n-5)!] / [2n-3)(n-3)!] , 16 Introdução onde n corresponde ao número de táxons (Felsenstein, 1978). Quanto maior o número de OTUs, maior o número de possíveis árvores dicotômicas (Tab. 2) e maior o tempo computacional para se chegar à estimativa das relações entre elas. Tabela 2. Número total de possíveis árvores dicotômicas enraizadas e não enraizadas para n OTUs. Número de OTUs Árvores Enraizadas Árvores não enraizadas 2 1 1 3 3 1 4 15 3 5 105 15 6 945 105 7 10.395 945 8 135.135 10.395 9 2.027.025 135.135 10 34.459.425 2.027.025 Mutação No presente contexto, mutação é definida como qualquer mudança em uma seqüência de DNA. A maioria delas pode ocorrer durante a replicação do DNA, e portanto, a taxa de mutação dependerá do número de replicações (Miyata et al., 1987; Ellegren e Fridolfsson, 1997). As mutações podem ocorrer em células somáticas e em células germinativas. Somente as mutações ocorridas nestas últimas são transmitidas às próximas gerações no caso de organismos com reprodução cruzada e portanto, podem ser úteis em reconstrução filogenética. As mutações podem ser classificadas como (1) substituições simples (ou mutação de ponto) quando ocorre a troca de um nucleotídeo por outro (sítios 2, 5, 10, 12 e 14 da figura 3), (2) deleções, quando um ou mais nucleotídeos são removidos da seqüências (sítios 7, 15 e 16 da figura 3), (3) inserções, quando ocorre adição de um ou mais nucleotídeos na seqüência (sítio 18 da quarta e quinta sequências da figura 3), e (4) inversões, quando alguns pares de base em uma seqüência de DNA dupla fita sofrem uma rotação de 180o (sítios 8 a 14 da última seqüência da figura 3 em relação às demais). 17 Introdução 1111111111 1234567890123456789 ACGTATACATGGGCGTAAC ACGTTTACACGGGCGTAAC AGGTTT-CACGAGCGTAAC AGGTTT-CATGAGA--AAAC AGGTTT-CACGAGA--AAAC AGGTTT-AGAGCAC--AAC Figura 3. Alinhamento de seqüências hipotéticas. Cada número na parte superior da figura identifica a posição dos nucleotídeos homólogos dispostos em cada coluna. Cada linha representa uma seqüência. A última seqüência foi separada das demais por apresentar uma inversão. Substituição de Nucleotídeos As substituções de nucleotídeos podem ser classificadas ainda em transições e transversões. Transições são substituições entre pirimidinas (T e C) ou entre purinas (A e G). Transversões são quaisquer substituições entre uma purina e uma pirimidina, como por exemplo, de A para C, de A para T, de C para G, e assim por diante. Considerando-se todas as possíveis substituições entre A, C, G e T, temos 4 tipos de transições e 8 tipos de transversões (Fig. 4). A G Transição Transversão C T Figura 4. Esquema representando as possíveis transições e transversões entre as quatro bases nitrogenadas da cadeia de DNA. No caso de genes que codificam para uma proteína, podemos classificar as substituições ocorridas em uma seqüência de DNA de acordo com seu efeito na cadeia de aminoácidos. Assim, se a substituição nucleotídica produzir uma modificação que leve a uma substituição de um aminoácido por outro na seqüência da proteína, a denominamos de substitutição não sinônima. Se não houver substituição de aminoácidos, a denominamos substituição sinônima. Além disso, as mutações de ponto do tipo inserção ou deleção podem levam a uma modificação no quadro de leitura de genes codificantes, 18 Introdução modificando toda a seqüência de aminoácidos a partir do códon onde a mutação ocorreu. Outra conseqüência de indels é a formação de códons de parada em uma posição aquém ou além da posição original, o que leva a produtos proteícos menor ou maior, respectivamente. No caso de regiões não codificantes como os genes ribossomais e introns, por exemplo, a presença de indels podem não produzir efeitos tão drásticos. Modelos de Evolução Molecular O processo de substituições nucleotídicas nas populações poderá ser observado no decorrer do tempo, através das gerações que herdam estas substituições. Uma vez que a taxa de substituições nucleotídicas e a história evolutiva são inferidas a partir deste processo, modelá-lo permite compreender melhor como ocorrem as substituições ao longo do tempo. Diversos modelos de substituição de nucleotídeos e de aminoácidos foram propostos e certamente novos modelos serão postulados com o crescente aumento do conhecimento sobre evolução molecular. Aqui são apresentados, os princípios básicos de alguns destes modelos e outros que levaram à elaboração de modelos mais complexos, alguns dos quais são utilizados ao longo desta tese. Uma característica comum desses modelos é que eles podem ser representados em uma matriz onde a probabilidade de substituição permance constante ao longo do tempo e a frequência das bases encontra-se em equilíbrio. Esta matriz é dada por: pAA pCA Pt = pGA pTA pAC pCC pGC pTC pAG pCG pGG pTG pAT pCT , pGT pTT onde pAC é a probabilidade de que o nucleotído A seja substituído pelo nucleotído C ao final do intervalo de tempo t, e assim por diante. Os elementos da diagonal pAA, pCC, pGG e pTT representam a probabilidade de não ser observada uma substituição de nucleotídeo ao final do tempo t. 19 Introdução Modelo de equivalência de substituição (JC69) Jukes e Cantor (1969) propuseram um modelo bastante simples onde os nucleotídeos A, C, G e T em uma seqüência de DNA ocorrem em frequências iguais, e a probabilidade de substituição de um nucletídeo i para um nucleotídeo j depende simplesmente da taxa de substituição instântanea u, estimada a partir dos dados. Matematicamente, podemos representar este modelo de maneira simplificada como: Pij (dt ) = udt , onde dt representa o tempo decorrido. Assim, todos os elementos de nossa matriz Pt de substituição dada acima seriam calculados como u. Modelo de dois parâmetros (K80) A observância de que transições ocorrem mais freqüentemente do que transversões, permitiu Kimura (1980) desenvolver um modelo onde a taxa u de substituição é convertida nas taxas de transição α e taxa de transversão β. Desta maneira, . β αdt para transição Pij (dt ) = e sua matriz Pt = α para t ransversão dt β β β . β α α β . β β α . β . Modelo proporcional (F81) A frequência de nucleotídeos contudo, não é similar entre as quatro bases. O genoma mitocondrial de vertebrados por exemplo, apresenta uma redução na proporção de G em relação às demais bases. Assim, Felsenstein (1981) elaborou o seguinte modelo: uπC uπG uπT . uπA . uπG uπT Pij (dt ) = uπjdt e sua respectiva matriz Pt = uπA uπC . uπT . uπA uπC uπG onde πj representa a frequência do nucleotídeo j. 20 Introdução Modelo HKY85 e F84 Os modelos K80 e F81 foram combinados concomitantemente por Hasegawa et al. (1984, 1985) e por Felsentein (1984) em outros dois modelos, denominados HKY85 e F84, respectivamente. Tornou-se possível combinar diferenças nas taxas de transição e transversão e frequência desigual de bases em uma única estatística que permitisse o estudo de um modelo de evolução mais realístico para seqüências de DNA. Matematicamente, o modelo HKY85 é representado por: βπC απG βπT . βπA . βπG απT απjdt para transição Pij (dt ) = , com a matriz Pt = . απA βπC . βπT βπjdt para transversão . βπA απC βπG A diferença entre este modelo e o F84, é o emprego do parâmetro κ que determina a razão transição/transversão, e do parâmetro Πj representado pela frequência de pirimidinas (πC+πT) se j for C ou T e purinas (πA+πG) se j for A ou G, respectivamente. A formulação desse modelo passou a ser representada por: κ + 1uπjdt para transição Pij (dt ) = Πj . uπjdt para transversão Modelo de TN93 A diferença na composição de bases reflete em diferenças na taxa de transições entre pirimidinas e na taxa de transições entre purinas. Para adequar esta diferença a modelos de evolução de seqüências, Tamura e Nei (1993) elaboraram o seguinte modelo: αRπjdt para transição entre purinas Pij (dt ) = αYπjdt para transição entre pirimidinas , βπjdt para transversão onde αR e αY representam, respectivamente, a taxa de transição entre purinas e pirimidinas. A matriz Pt pode ser facilmente deduzida. 21 Introdução Modelo Geral de Reversão ao Longo do Tempo (GTR, do inglês “General Time Reversible”) Um modelo geral de substituição foi desenvolvido (Rodriguez et al., 1990), permitindo-se que taxas diferentes de substituição de um nucleotídeo por cada um dos demais pudessem ser admitidas, considerando-se a frequência deles e a taxa de substituição. Neste caso a probabilidade passa a ser calculada como: Pij (dt ) = vπjdt , onde v representa cada uma das possíveis mudanças de nucleotídeos. Nos casos onde a probabilidade de uma modificação A→C, por exemplo, é a mesma que C→A, nossa matriz Pt de substituições é dita simétrica, e quando A→C ≠ C→A, isto é cada substituição apresenta sua própria probabilidade, temos uma matriz assimétrica. Métodos de Reconstrução Filogenética Os métodos filogenéticos que usam dados moleculares são numerosos e podem ser divididos em três grupos principais: parcimônia, distância e máxima verossimilhança. O primeiro destes grupos parte da premissa que hipóteses mais simples explicam melhor a evolução biológica do que hipóteses mais complexas e que não há hipóteses ad hoc, isto é, não existem hipóteses particulares para um dado ramo da árvore. Os métodos de distância baseiam-se na transformação das seqüências de DNA ou proteínas em uma matriz de distância estimada com base em um modelo evolutivo. A partir dessa matriz uma árvore será reconstruída de modo a refletir a evolução das seqüências minimizando a soma dos comprimentos dos ramos. O método de verossimilhança irá por sua vez usar modelos evolutivos para estimar a probabilidade de uma árvore se adequar melhor aos dados obtidos do que outras árvores concorrentes. Métodos de Parcimônia O método de parcimônia fundamenta-se no pressuposto de que a evolução pode ser explicada por hipóteses mais simples. Em outras palavras a ocorrência de uma única mutação seria mais provável que a ocorrência de duas mutações. Por exemplo, 22 Introdução consideremos que para um determinado grupo de seqüências 1, 2, 3, 4 e 5 as três primeiras OTUs apresentem o nucleotídeo A e as outras duas apresentem T. Agora considere duas reconstruções hipotéticas entre elas apresentadas na figura 5. A árvore 1 indica a relação ((((1, 2), 3), 4), 5) onde ocorreu uma única modificação do nucleotídeo T para o nucleotídeo A no ramo ancestral que levou aos táxons 1, 2 e 3. A árvore 2 indica a relação ((((1, 2), 4), 3), 5) onde ocorreu uma substituição no ancestral de 1, 2, 3 e 4 e uma segunda substituição na linhagem levando a 4. Pelo princípio da parcimônia, a árvore 1 é escolhida por apresentar uma única substituição ao invés da árvore 2 que apresenta duas substituições. Árvore 1 5 T 4 T 3 A 2 A Árvore 2 1 A 5 T 3 A 4 T 2 A 1 A Tipo de substituição T→ →A A→ →T Figura 5. Duas reconstruções hipotéticas para as OTUs 1, 2, 3, 4 e 5. As barras horizontais cortando os ramos indicam substituições de nucleotídeos. Assim, um conjunto de transformações destas seqüências pode ser representado em várias árvores. A árvore que apresentar o menor número de passos (ou menor número de substituições) é a árvore mais parcimoniosa. Obviamente uma topologia que é minimizada ao menor número de passos também minimiza o números de homoplasias que poderiam surgir (Swofford et al., 1996). A parcimônia foi amplamente usada na Sistemática Filogenética uma vez que por esse método não são necessárias hipóteses a priori sobre o processo evolutivo. Quando surgem conflitos que não são resolvidos a não ser por hipóteses ad hoc, consideramos que 23 Introdução eventos homoplásticos agiram nas seqüências analisadas. Também não é necessário o uso de seqüências ancestrais para se inferir a topologia, a não ser que a obtenção de uma árvore enraizada seja uma condição desejada pelo pesquisador. Neste caso, a inclusão de um ou mais grupos externos auxilia a polarização das substituições. Posteriormente surgiram variações do método de parcimônia. A Parcimônia de Fitch, a qual se aplicam os dados de seqüência de DNA, admite que as mudanças são livremente reversíveis e uma árvore pode ser enraizada em qualquer ponto sem ocorrer a modificação de seu comprimento e os caracteres são do tipo multiestados não-ordenados, portanto os estados de caracter são independentes entre si e não há restrições evolutivas às mudanças de bases. Esse método se aplica ainda ao estudo de seqüências de aminoácidos. Neste caso, cada um dos vinte aminoácidos é um estado de caracter, e não é considerado que a substituição deles pode requerer de um a três passos, isto é, a modificação de um aminoácido requer a substituição de um a três nucleotídeos. Cabe ressaltar aqui, que quanto maior o tempo de divergência entre duas OTUs, maior a probabilidade da variação entre elas se tornar estocástica, devido a uma saturação no grau de mutações ocorridas. De fato, parece haver uma correlação linear entre o número de diferenças de transição e transversão e a idade de divergência (Cracraft e Helm-Bychowski, 1991; Helm-Bychowski e Cracraft, 1993). Assim uma variante da parcimônia foi desenvolvida baseando-se na observação de que o número de transições podem ocorrer mais freqüentemente que o número de transversões em seqüências de DNA, portanto alcançando um nível de saturação de substituições. Por esse modelo, denominado Parcimônia de Transversão, as transições são ignoradas, nomeando-se as mudanças entre pirimidinas como um único estado de caracter e as mudanças entre purinas como um outro estado. Uma desvantagem desse método é que ocorre perda de informação evolutiva para táxons proximamente relacionados quando usamos apenas dois possíveis estados de caracteres (no caso, purinas e pirimidinas). Contudo, isto pode ser contornado dando pesos maiores às tranversões do que às transições (Swofford et al., 1996) e considerar ambas na análise. Isto pode ser facilmente realizado através de uma matriz de substituições onde os programas de 24 Introdução reconstrução filogenética reconhecem se a substituição é uma transição ou uma transversão e atribuem o peso determinado a esta modificação. Os métodos de parcimônia podem ser generalizados em um método que considera custos para as transformações de cada estado de caracter para outros. Esse método é denominado por Swofford et al. (1996) de Parcimônia Generalizada e apresenta os custos em uma matriz, onde cada elemento dela corresponde ao custo de transformação de um estado a outro. Embora a Parcimônia Generalizada permita o uso de uma matriz não simétrica, a análise é computacionalmente mais demorada em alguns casos e talvez um dos maiores problemas é a determinação dos pesos das mudanças evolutivas. A atribuição de pesos é bastante arbitrária e pouco estudada. Uma estratégia muito utilizada de dar pesos às mudanças é basear-se na razão de transição:transversão (TS:TV) estimada para as seqüências estudadas. Por este método, as transversões são pesadas inversamente à TS:TV, isto é, para um grupo de seqüências onde esta taxa é 5:1, damos peso 1 as transições e 5 as transversões. No caso de seqüências referentes a diferentes genes ou regiões gênicas sendo consideradas com uma única seqüência (análise combinada), podemos ainda partilhar os dados e atribuir pesos diferentes baseados na TS:TV para cada um dos genes ou regiões gênicas analisadas. Métodos de Distância Os Métodos de Distância acomodam uma árvore a uma matriz de distâncias calculadas para cada par possível de táxons analisados. Para seqüências de nucleotídeos, a matriz pode ser calculada, por exemplo, baseando-se no número de sítios alterados divididos pelo total de sítios analisados (distância-p), ou então usar um modelo evolutivo como os apresentados anteriormente para obter as distâncias entre os pares de OTUs. O próximo passo consiste em construir uma árvore onde cada comprimento do ramo reflete a distância calculada. A melhor árvore é a que minimiza as discrepâncias entre as distâncias quando estas são extrapoladas para os ramos. O uso de matriz de distância é raro em estudos morfológicos e comum em estudos bioquímicos (Farris, 1981) e dados moleculares, especialmente se esses dados forem imunológicos ou de hibridação DNA-DNA. As distâncias podem ser corrigidas para 25 Introdução mudanças sobrepostas, refletindo o número real de modificações ocorridas desde a divergência entre duas seqüências a partir de seu ancestral comum. Algumas condições devem ser satisfeitas por uma distância: (1) ela não pode ser negativa; (2) ela deve ser simétrica, isto é d(a,b) = d(b,a); (3) a dissimilaridade entre duas seqüências quaisquer não pode exceder as dissimilaridades de cada uma delas com um terceira, isto é, as distâncias entre três seqüências podem ser representadas em um triangulo; e (4) se d(a,b) = 0, então a = b. Se as distâncias calculadas para dois pares de seqüências refletem a quantidade real de substituição ocorrida no tempo evolutivo, então estas distâncias têm uma propriedade de aditividade: a distância evolutiva entre cada par de OTU deve ser igual à soma dos comprimentos de cada ramo no caminho que une estas duas OTUs. Distâncias aditivas satisfazem a condição de quatro pontos: d(a,b) + d(c,d) ≤ max [d(a,c) + d(b,d), d(a,d) + d(b,c)], onde a, b, c e d são quatro táxons quaisquer. Em outras palavras, esta condição indica que uma de três distâncias deve ser menor ou igual às outras duas e estas devem ser iguais. Alguns métodos de distância aditivas são apresentados a seguir. De um modo geral eles irão definir um erro de acomodação dos dados de distância se adequarem a uma árvore. Neste cálculo, o valor absoluto da diferença entre a distância entre duas OTUs e o comprimento dos ramos entre elas é considerado. Esse procedimento de cálculo de erro de diferenças absolutas mínimas deve ser usado quando não sabemos a priori qual estimativa de distância está mais sujeita a erro. Desta forma, reduzimos a perturbação global gerada por valores de dados espúrios. Por outro lado, se os erros das estimativas de distância são regularmente distribuídos ao longo dos dados, o uso dos quadrados mínimos da diferença entre a distância e o comprimento dos ramos é mais adequado. Se conhecermos qual estimativa é mais suscetível a erro, podemos dar pesos diferentes à elas. O peso nesse caso vai se referir à discrepância entre as distâncias menores e maiores. O cálculo dos erros através dos quadrados mínimos e o das diferenças absolutas mínimas assumem implicitamente que a distância entre cada par é uma medida independente das demais. Isto no entanto não é verdadeiro para moléculas. Se as amostras 26 Introdução fossem realmente independentes então as árvores seriam mais claras em suas topologias. Outra conseqüência é que qualquer erro sistemático pode ser multiplicado por amostragem, então os métodos de distâncias seriam mais influenciáveis pela ocorrência de homoplasias (Swofford et al., 1996). Um outro método usando o critério dos quadrados mínimos sem dar pesos às estimativas de distância foi desenvolvido, porém utilizando-se um critério diferente de avaliar e comparar as árvores. Denominado Método de Evolução Mínima, a otimização é feita simplesmente por meio da soma dos valores dos comprimentos dos ramos que minimizam a soma dos desvios quadrados entre as distâncias observadas e as estimadas pelo comprimento do caminho entre dois táxons analisados. Uma vantagem desse método é que o desvio devido a diferenças grandes entre seqüências pequenas se torna desprezível com o aumento do tamanho das seqüências. Os métodos citados acima podem se basear em distâncias ultramétricas para reconstruir a árvore. Distâncias ultramétricas são mais restritas evolutivamente que as aditivas. Por definição matemática distâncias ultramétricas satisfazem uma condição de três pontos: duas das três distâncias entre três táxons é igual ou superior à terceira distância. Matematicamente isto pode ser representado por d(a,b) ≤ max [d(a,c), d(bc)]. Implicitamente às distâncias ultramétricas está incorporado a constância de taxa de evolução entre as OTUs. Contudo não há garantia de que a quantidade de divergência seja linear no tempo e que os táxons evoluam a uma mesma taxa. A presença de lacunas, quer sejam introduzidas pelo alinhamento devido à grande número de substituições em uma dada região da seqüência, quer representem verdadeiros eventos indels, interferem no cálculo das distâncias. A solução mais prática neste caso é omitir sítios em que as lacunas ocorrem, mesmo que muita informação seja perdida, diminuindo assim a similaridade favorecida pelas lacunas. Em outras palavras, se duas seqüências apresentarem um grande número de lacunas necessárias para aumentar a similaridade entre elas, a distância entre elas pode parecer menor do que realmente é. Outra questão que deve ser considerada é que as seqüências que estão sendo comparadas podem ter tamanhos diferentes (Larson, 1991), levando ao aumento de número de lacunas durante o alinhamento. 27 Introdução A similaridade entre duas seqüências não pode ser diminuída se mudanças subsequentes ocorrem na mesma posição. Contudo, as seqüências podem apresentar um aumento da similaridade devido a paralelismo e reversão. Nestes casos, a distância-p passa a ser uma alternativa bastante simplista que não considera os eventos sobrepostos. Outras distâncias podem ser estimadas baseadas nos modelos evolutivos vistos anteriormente, corrigindo eventos sobrepostos que ocorreram, especialmente em seqüências que tenham divergido a muito tempo. Swofford et al. (1996) discutem alguns pontos fracos do uso de distâncias na inferência da filogenia. Quando transformamos dados de caracteres descontínuos em dados de distâncias, estamos perdendo informação evolutiva. Uma vez obtida uma distância é impossível se retornar aos dados de caracter descontínuos que a originou. Diferentes tipos de dados não podem ser usados na mesma análise. Se nossas distâncias foram estimadas para seqüências de DNA não podemos comparar estas distâncias com as calculadas para distâncias imunológicas, por exemplo. Outro aspecto negativo do uso de distâncias é que elas não fornecem informação de qual caracter contém ou não informação filogenética, como fazem os dados de caracteres descontínuos. Contudo em casos onde a parcimônia e a verossimilhança são impraticáveis sob o ponto de vista de tempo gasto com cálculos em computador devido a um grande número de dados, os métodos de distâncias podem ser a única alternativa para obter a topologia em um período razoável de tempo. Método de Verossimilhança O princípio básico do método de verossimilhança é estimar a probabilidade relativa dos dados obtidos se adequarem a uma árvore e perante um modelo que descreve a evolução do processo em estudo. Em termos de evolução de seqüências de DNA, o método irá calcular a probabilidade de que aquelas seqüências em estudo tenham sido geradas, seguindo as premissas do modelo evolutivo escolhido. Neste caso, a topologia e o comprimento dos ramos de uma árvore são os parâmetros a serem estimados, dadas as seqüências finais nos topos dos ramos. 28 Introdução A probabilidade deve ser calculada para todas as topologias possíveis variando o tamanho dos ramos para um grupo de unidades taxonômicas operacionais. A árvore (isto é, a topologia mais o comprimento dos ramos) que apresentar a maior verossimilhança (probabilidade relativa) é considerada a melhor estimativa da filogenia. Calcular a probabilidade de uma árvore envolve calcular as probabilidades de ocorrências de todos os possíveis estados ancestrais de caracteres nos nós internos da árvore, isto é, calcular a possível ocorrência de cada um dos nucleotídeos ter estado presente em um nó interno. A maioria dos modelos evolutivos para seqüências de DNA admite reversão de caracteres ao longo do tempo, visto que a mudança de nucleotídeos, digamos de A para C, é independente da mutação reversa de C para A. Este tipo de mudança de um estado para outro sem a passagem por estados intermediários é conhecido como não ordenada. Devido a esta propriedade de reversão, a probabilidade de uma árvore independe do posicionamento de sua raiz. Estimar a probabilidade de uma árvore ter produzido as seqüências obtidas é uma tarefa árdua e computacionalmente demorada. Ao contrário dos métodos de parcimônia e de distância onde uma árvore é inferida, aqui nós iremos trabalhar com uma árvore qualquer e calcular a probabilidade de quão boa ela é para explicar os dados observados. Obviamente isto deve ser calculado para todas as árvores possíveis para encontrar aquela que melhor explique a evolução das seqüências. Sem dúvida o tempo computacional para isso é demasiadamente longo. Considere a árvore da figura 6, onde Aves, Crocodilos, Lagartos e Tartarugas são as OTUs e x, y e z são os nós internos. Imagine que A, C, G e T são os nucleotídeos observados em um determinado sítio para as Aves, Crocodilos, Largartos e Tartarugas, respectivamente. Calcular a probabilidade deste sítio envolve calcular a probabilidade do nucleotídeo observados nas Tartarugas ser T, considerando que ele poderia ter sido qualquer um dos quatros possíveis nucleotídeos no nó x, isto é, somar as probabilidades do nucleotídeo em x ter sido A e mudado para T, ter sido G e mudado para T, ter sido C e mudado para T e não ter mudado (era T em x). Isto é matematicamente representado como: Σ PxT (t1+t2+t3), onde t1, t2 e t3 são os tempos decorridos desde a separação de 29 Introdução Tartarugas dos demais ramos e Pxt é a probabilidade associada com a mudança de um nucleotídeo qualquer para T. Agora devemos calcular a probabilidade de G ser observado em Lagartos: Σ Pxy(t1) PyG(t2+t3), onde Pxy é a probabilidade associada à mudança de nucleotídeo entre os ramos que ligam os ancestrais nos nós x e y, e PyG(t2+t3) é a probabilidade associadas aos eventos de substitutição entre o nó interno y e os Lagartos. Finalmente, a probabilidade associada à observação de A nas Aves e C nos Crocodilos é dada por: Σ Pyz(t2) PzA(t3) PzC(t3). Aves Crocodilos Lagartos Tartarugas A C G T t3 z t2 y t1 x Figura 6. Relações filogenéticas entre Aves, Crocodilos, Lagartos e Tartarugas. x, y e z são os nós internos, e t1-t3 representam os tempos de separação entre as linhagens. Então a probabilidade final desta nossa árvore exemplo da figura 6 é: Prob(árvore) = Σ πx PxT (t1+t2+t3) Σ Pxy(t1) PyG(t2+t3) Σ Pyz(t2) PzA(t3) PzC(t3). Já que na prática não sabemos qual é a probabilidade associada ao nucleotído ancestral no nó interno x, que representa nesta caso a raiz desta árvore, devemos adicionar o parâmetro πx representando a frequência dos nucleotídeos. Este nosso exemplo assume que as taxas evolutivas entre os táxons é constante, isto é, estas seqüências evoluem de acordo com um relógio molecular. No caso das seqüências não seguirem um relógio os parâmetros t1, t2 e t3 passam a ser considerados comprimentos aditivos dos ramos, refletindo então a quantidade de modificações obervadas em cada ramo. 30 Introdução Apenas um único sítio foi considerado no cálculo da probabilidade visto acima. A estimativa do cálculo da probabilidade de uma árvore explicar um conjunto de seqüências é realizado de maneira similar, isto é para cada sítio calcula-se a probabilidade de maneira semelhante à realizada acima, e posteriormente multiplica-se as probabilidades encontradas para cada sítio da seqüência. Em resumo a probabilidade final de uma árvore é o produto das probabilidades de cada sítio. Como o valor da probabilidade é muito pequeno, usa-se representá-lo na forma logarítimica. O exemplo acima considerou ainda que conhecemos a priori o comprimento dos ramos. Contudo, o método de verossimilhança estima o comprimento dos ramos de modo a maximizar a probabilidade da árvore explicar a evolução das seqüências obervadas. A probabilidade final da árvore 6 dada acima é válida somente para esta árvore e árvores que apresentem topologias diferentes terão suas probabilidades calculadas de maneiras diferentes. Relógio Molecular Desde a proposição da hipótese do relógio molecular por Zuckerkandl e Pauling (1962, 1965) muito se debateu sobre a existência ou não de um relógio molecular geral para os organismos vivos. A hipótese do relógio molecular prevê que as mutações que ocorrem em macromoléculas ocorreriam a uma taxa constante durante o decorrer do tempo. Assim através da quantidade de mutações acumuladas entre duas seqüências ancestrais, poderia-se inferir quando ocorreu a divergência entre elas. Embora bastante elegante para o desenvolvimento de modelos computacionais de evolução de seqüências, o relógio molecular não consiste uma regra geral da Evolução Molecular. Muitos estudos procurando estabelecer a existência de relógios moleculares nos levam a crer que realmente existe uma heterogeneidade de modificações tanto em genomas organelares (DeSalle e Templeton, 1988; Avise et al., 1992) quanto nucleares (Li, 1993a,b; Avise, 1994). A base para a heterogeneidade de taxas evolutivas do genoma está na diferença existente entre as taxas metabólicas, mecanismos de reparo do DNA, tempo de exposição a mutágenos, número de replicações das células germinativas, tempo de geração dos organismos, composição de bases, uso de códons, código genético, 31 Introdução estruturas secundária e terciária, função gênica ou proteica, tamanho populacional, tipo de seleção atuando sobre as seqüências (Mindell e Thacker, 1991). O acúmulo de diferenças apresenta uma relação linear com o tempo de divergência de duas OTUs (Brown et al., 1982; Irwin et al., 1991). Porém, a ocorrência de um acúmulo de substituições múltiplas após um determinado período de tempo leva à perda desta relação (Mindell e Thacker, 1996). A frequência com que as mutações modificam uma seqüência ou outra varia grandemente. Se considerarmos um único gene, podemos perceber que determinadas regiões dele são mais variáveis que outras. Genes interrompidos, isto é, que apresentam regiões transcritas (exons) e não transcritas (introns), apresentam maior taxa de substituição em introns do que em exons. Regiões gênicas que codificam domínios funcionais de proteínas podem estar mais sujeitas a pressão de seleção do que regiões não tão importantes do ponto de vista funcional. Pseudogenes, regiões flanqueadoras a 3’, intons e sítios tetradegenerados apresentam taxa de evolução maior do que sítios não degenerados. Regiões flaqueadoras e regiões não traduzidas a 5’, sítios bidegenerados e regiões não traduzidas a 3’ apresentam taxas intermediárias de fixação de substituição (Li e Graur, 1991). Regiões do genoma que codificam uma proteína ou uma região controladora da expressão gênica, por exemplo, estão mais sujeitas à ação de seleção do que regiões espaçadoras. Estas últimas podem sofrer substituições a uma taxa maior e não interferir de modo algum na sobrevivência do indivíduo. O mesmo é válido para uma dada posição do códon. A terceira base de uma trinca de nucleotídeos que identifica um aminoácido é mais variável que as outras duas. Uma modificação de bases nessa posição nem sempre resulta na substituição de um aminoácido na cadeia genômica em que ela se encontra. A variação na taxa de substituição entre sítios parece ser na verdade um fenômeno real na evolução de seqüências gênicas. Além disso, as taxas de mutação entre espécies diferentes variam de forma desigual. Algumas espécies estão mais sujeitas a mutação do que outras. Diversas hipóteses foram levantadas para explicar essa diferença. Uma delas, a hipótese do tempo de geração (Li et al., 1987) postula que a taxa de mutação é baseada no tempo de geração 32 Introdução e não no tempo real. Dessa forma, organismos com tempo de geração menor, e consequentemente que passam por uma série maior de replicações do DNA, irão apresentar taxas maiores de evolução. Para a hipótese da taxa metabólica (Martin e Palumbi, 1993), organismos com maior taxa metabólica apresentam taxas maiores de síntese de DNA e, consequentemente, têm taxas maiores de mutação quando comparados com organismos com taxas metabólicas menores. Ainda uma terceira hipótese, conhecida como hipótese de reparo do DNA, diz que a eficiência com que ocorrem reparos nas seqüências de DNA influi na taxa de mutação (Filipski, 1988). Assim sendo, os estudos passaram a se concentrar na existência de um relógio molecular para grupos específicos de táxons próximos. Desta maneira, se a hipótese do relógio molecular não for refutada, é possível fazer considerações temporais sobre a evolução dos organismos em estudos e sobre a taxa de evolução das seqüências estudadas. Os comprimentos dos ramos na árvore refletem o número de substituição de cada linhagem, permitindo, com base nesse relógio molecular, estimar o tempo de divergência entre qualquer nó interno, se pelo menos uma data de divergência de uma determinada ramificação tiver sido estimada por meio do registro fóssil e/ou algum evento biogeográfico. Então como testar a hipótese de relogio molecular em nosso conjunto de dados? Isto pode ser realizado através do teste de taxas relativas ("relative-rate test"; Sarich e Wilson, 1973, Takezaki et al., 1995). Suponha que queremos saber se em nossa árvore da Figura 6 as Aves e os Lagartos evoluem a uma mesma taxa. Se isto for verdadeiro, então o número de substituições ocorridas no ramo das Aves e no dos Lagartos desde sua separação de seu ancestral C não deve ser estatisticamente diferente. Para avaliar isto, é necessário incluir uma linhagem que tenha divergido anteriormente à separação das Aves e Lagartos, como por exemplo, as Tartarugas. O número de substituições (K) de cada linhagem pode ser obtido diretamente das seqüências e então temos que: KAves/Tartarugas = KAves/Ancestral C + KTartarugas/Ancestral C 33 Introdução KLagartos/Tartarugas = KLagartos/Ancestral C + KTartarugas/Ancestral C KAves/Lagartos = KAves/Ancestral C + KLagartos/Ancestral C Resolvendo estas três equações temos que: KAves/Ancestral C = (KAves/Tartarugas + KAves/Lagartos - KLagartos/Tartarugas)/2 Klagartos/Ancestral C = (KLagartos/Tartarugas + KAves/Lagartos - KAves/Tartarugas)/2 KTartarugas/Ancestral C = (KAves/Tartarugas + KLagartos/Tartarugas - KAves/Lagartos)/2 Então de acordo com o relógio molecular, a diferença entre KAves/Ancestral C e Klagartos/Ancestral C não deve ser estatisticamente diferente de zero. Se o valor absoluto da diferença for maior do que dois erros padrão, então a hipótese do relógio molecular é rejeitada a 5% de significância. Alguns programas foram desenvolvidos para a realização deste teste de taxas relativas. O PHYLTEST (Kumar, 1996) por exemplo, permite que o usuário defina dois grupos cujas taxas devem ser testadas e qual grupo é externo, e indica se a hipótese do relógio molecular é rejeitada ou não. Já o programa LINTREE (Takezaki, 1995) permite ainda saber qual OTU apresenta uma taxa maior ou menor do que as demais OTUs. Desta maneira é possível retirar as OTUs cujas taxas são significativamente diferentes das demais e repetir a análise até que sejam detectadas os taxons cujas taxas de evolução sejam semelhante. Uma outra maneira de testar a hipótese do relógio molecular é por meio da comparação entre uma árvore estimada sem a hipótese do relógio molecular e forçar os comprimentos dos ramos dessa mesma árvore a apresentar taxa constante de substituições. A significância pode ser avaliada por meio da distribuição de χ2 e neste caso o número de graus de liberdade é igual ao número de OTUs menos 2 (Felsenstein, 1988). Uma maneira rápida de realizar este teste é por meio da utilização de programas como o PUZZLE (Strimmer e von Haeseler, 1996, 1999) e o PAUP (Swofford, 1999). 34 Introdução Heterogeneidade de Taxas de Substituição entre Sítios Se os sítios em uma seqüência de DNA apresentam a mesma probabilidade de sofrer uma substituição, dizemos que esta seqüência apresenta taxa homogênea de substituição entre os sítios. Ao contrário, se alguns sítios em um seqüência de DNA apresentam maior taxa de substituição do que outros sítios, dizemos haver heterogeneidade de taxa de substituição entre sítios nessa seqüência. A incorporação de um parâmetro de variação de taxa de substituição entre os sítios está sendo muito utilizada recentemente em estudos filogenéticos (Yang, 1996; Miyaki et al., 1998; Nahum et al., submetido). Muitas vezes, assumir homogeneidade entre os sítios pode levar a uma estimativa da filogenia que não reflete a verdadeira história evolutiva entre as unidades taxonômicas operacionais (Takezaki e Gojobori, 1999). Dessa maneira, subestimamos a taxa de substituição de sítios onde a variação é alta, e superestimamos a taxa de substituição para sítios onde a variação é baixa ou inexistente. Os modelos de heterogeneidade de substitituição entre os sítios mais amplamente empregados são o modelo de distribuição gama (Yang, 1993; Steel et al., 1993), representada pela letra grega Γ e o modelo de invariáveis (Hasegawa et al., 1985; Reeves, 1992; Sidow et al., 1992). A figura 7 ilustra a distribuição gama, onde dois parâmetros são necessários. Um deles, denominado alfa (α) que irá representar a forma da curva de distribuição gama, e outro, denominado beta (β) irá representar a escala. Quanto menor o valor de α, maior a heterogeneidade de substituição entre os sítios (se α=∅, cada sítio possui uma taxa exclusiva de substituição, se α=∝, todos os sítios têm a mesma taxa de substituição). De fato, as taxas de substitituição ao longo de uma seqüência não são iguais em muitos casos. A terceira posição do códon têm taxas maiores de substituição do que a primeira e a segunda posição, alças e hastes de seqüências de rRNAs apresentam taxas diferentes de substituição, e determinados aminoácidos em uma seqüência de proteínas apresentam maior pressão seletiva devido a algum papel importante no correto funcionamento da proteína (Li, 1997). 35 Introdução Figura 7. Distribuição gama de acordo com diferentes valores de α. Também ao longo de seqüências de ácidos nucléicos, determinadas regiões apresentam maior ou menor taxa de substituição. Os valores da heterogeneidade podem ser estimados diretamente dos dados. A tabela 3 traz vários exemplos de α calculados para diferentes tipos de dados em diferentes grupos de organismos. Note a variação de 0,16 para seqüências do gene mitocondrial 12S rDNA em roedores (heterogeneidade forte de substituição) até 0,95 para alguns genes mitocondriais codificantes de vertebrados (heterogeneidade mediana de substituição). Tabela 3. Valores do parâmetro alfa da distribuição gama estimado para diversos conjuntos de dados de seqüências de DNA. Seqüências 1a e 2a posição do codon dos genes de α- e β-globina Lisozimas Genoma do vírus da Hepatite B 12S rRNA Domínios I e II da região controladora do DNA mitocondrial 1a+2a posição do codon dos 13 genes mitocondriais codificantes Citocromo b Táxons 5 mamíferos Alfa 0,36 Fonte Yang et al. (1994) 24 primatas 13 variantes 9 roedores 25 humanos 0,66 0,26 0,16 0,17 Yang (1998) Yang et al. (1995) Sullivan et al. (1995) Yang and Kumar (1996) 11 vertebrados 0,13-0,95 Kumar (1996) 10 aves 0,42 Miyaki et al. (1998) Assumir a distribuição gama contínua no entanto pode levar ao aumento do tempo computacional para se estimar uma árvore. Uma maneira de agilizar o processo assumindo heterogeneidade de taxas é distribuir os sítios em classes com distintas taxas de substituição. Por exemplo, quatro (ou mais) classes de taxa de substituição poderiam 36 Introdução ser definidas, onde teríamos um grupo onde a taxa de substituição é nula ou quase nula, uma classe onde a taxa de substituição é alta, e duas (ou mais) classes intermediárias entre estas. Obviamente quanto maior o número de classes, maior o tempo necessário para estimar o valor de α. Porém apenas α é incorporado aos modelos evolutivos, então o número de classes determinadas para a distribuição gama não interefere no tempo total do cálculo da probabilidade da árvore uma vez conhecido o valor de α. Outra maneira de incorporar heterogeneidade de substituição entre os sítios é dada pelo modelo de sítios invariáveis. Em um conjunto de seqüências alinhadas, algumas posições são invariáveis, isto é, não são observadas substituições, ao passo que os demais sítios, os variáveis, apresentam substituições e a estes é dada a mesma probabilidade de sofrer uma substituição. Este modelo é mais simples do que o modelo de distribuição gama no sentido de que apenas um parâmetro está envolvido: a proporção de sítios invariáveis. Uma alternativa mais refinada de acomodação desta variação de substituições entre os sítios pode ser realizada por meio de um modelo misto entre o de invariáveis e o gama. Assim, há uma proporção de sítios invariáveis e os sítios variáveis apresentem heterogeneidade de taxa de acordo com a distribuição gama. Algoritmos de Reconstrução de Árvores Filogenéticas Uma vez escolhido o método de reconstrução filogenética iremos usar, precisamos agora decidir qual algoritmo de reconstrução será utilizado para a obtenção da árvore. Os algoritmos disponíveis podem ser exatos, isto é, perante o método escolhido eles irão encontrar a melhor árvore que satisfaça as condições do método. Contudo para um número grande de táxons o tempo computacional para se chegar a essa estimativa pode ser impraticável devido ao número de árvores possíveis (Tab. 2). Um alternativa é usar algoritmos heurísticos que levam um tempo menor de estimativa de uma árvore, porém em detrimento de satisfazer a condição de otimização do método. 37 Introdução Algoritmos Exatos Busca Exaustiva A busca exaustiva consiste em enumerar todas as possíveis árvores estritamente bifurcadas existentes para um grupo de OTUs. Um algoritmo para se realizar isso consite em fazer uma árvore não enraizada para três OTUs de nossa amostra. Para 3 OTUs, há apenas uma árvore não enraizada. A seguir uma quarta OTU deve ser adicionada em todas as posições possíveis nesta árvore de três OTUs. Neste caso há 15 possíveis árvores não enraizadas demostrando as relações estritamente bifurcadas entre estes táxons. Repete-se este procedimento até que todas as OTUs tenham sido incoporadas as árvores e dessa maneira todas as possíveis árvores para este grupo de OTUs tenham sido construídas. A seguir avalia-se perante nosso método de reconstrução filogenética, qual delas melhor representa a melhor otimização de nosso modelo evolutivo. Uma dificuldade desse algoritmo é o número astronômico de árvores não enraizadas que podem ser possíveis para poucos táxons, aumentando imensamente o tempo computacional para obter nossa estimativa das relações entre os táxons. "Branch-and-bound" Uma maneira de se resolver este problema foi dado pelo desenvolvimento de um algoritmo também exato denominado "branch-and-bound". Em princípio este algoritmo é semelhante à busca exaustiva uma vez que todas as possíveis árvores estritamente bifurcadas são construídas. No entanto a diferença está em eliminar partes da árvore que representam soluções subótimas. No caso da parcimônia isto seria eliminar árvores com um número maior de passos e no caso dos métodos de distâncias aditivas, eliminar as árvores que aumentam a soma dos quadrados dos desvios, por exemplo. A eliminação de árvores subótimas é realizada da seguinte maneira. Inicialmente uma árvore aleatória é gerada e seu escore é estimado. A seguir inicia-se o processo de incorporação de táxons em uma árvore inicial com três OTUs. Assim para cada passo onde um táxon é incorporado à árvore, o escore de todas as árvores resultantes é estimado (número de passos, por exemplo) e aquelas que apresentam escore que não otimize nosso critério são rejeitadas e não serão usadas nos passos posteriores. A vantagem desse 38 Introdução algoritmo é que ele permite ao pesquisador reduzir o tempo gasto para encontrar a árvore que melhor se ajuste ao seu critério de otimização, reduzindo o número de árvores que podem ser analisadas. Um problema decorrente deste método é que seqüências onde há muito ruído filogenético aumentam o tempo computacional para se chegar a uma estimativa, muitas vezes se igualando à busca exaustiva. Algoritmos heurísticos Decomposição de estrela O algoritmo de decomposição de estrela, muito usado em verossimilhança, consiste em unir inicialmente todos os táxons em um único nó interno, formando uma árvore em estrela (politômica). O passo seguinte consiste em avaliar todas as árvores possíveis onde dois táxons são unidos em um novo grupo. A árvore que apresentar a união entre dois táxons que maximizem sua probabilidade será escolhida como a árvore inicial no próximo passo. Neste momento, reduzimos em um o número de táxons que estavam conectados ao nó interno central. No passo seguinte, a árvore eleita a melhor no passo anterior é usada nesse processo de busca de formação de um novo grupo que otimize a probabilidade da árvore. Estes procedimentos se repetirão até que todos os táxons tenham se conectados e nossa árvore final é binária. "Stepwise addition" O algoritmo de "stepwise addition" é bastante simples. Inicialmente três táxons são escolhidos para compor uma árvore inicial. A seguir um quarto táxon é unido a eles em todas as posições possíveis e aquela árvore que representar a árvore ótima é considerada no passo seguinte. A seguir uma quinta OTU é adicionada à esta árvore otimizada no passo anterior e o escore de todas as possíveis árvores bifurcadas são avaliados e a melhor delas e escolhida para o passo seguinte. Isso se procede até que todas as OTUs tenham sido inseridas e uma árvore tenha sido escolhida entre as possíveis árvores finais. Uma desvantagem desse algoritmo é que a escolha de qual árvore seguir será baseada nas três primeiras OTUs escolhidas para iniciar o procedimento de inferência. Em outras palavras, o trio de táxons escolhidos para iniciar o processo pode 39 Introdução levar a uma estimativa que na realidade representa uma árvore subótima que não seria escolhida se outros trios tivessem iniciado o processo. Uma maneira de se contornar esse problema é realizar a busca diversas vezes escolhendo diferentes trios iniciais de OTUs a cada vez. Uma analogia comumente feita a esse problema é que há uma região montanhosa onde um piloto míope caiu de paraquedas. Ele sabe que há um posto de segurança no pico da montanha mais alta que poderá salvá-lo. Ele então sobe a montanha que ele acredita ser a mais alta. Chegando lá ele não encontra o posto. Há duas possibilidades: ou ele chegou ao pico da montanha mais alta e portanto ele estava errado sobre a existência do posto de segurança ou ele não chegou na montanha mais alta, onde deve haver um posto de segurança. "Branch-swapping" Este algoritmo foi desenvolvido para casos onde havia um grande número de táxons e o sinal filogenético das seqüências era baixo, o que levavam a encontrar árvores subótimas por meio dos algortimos de decomposição de estrela e de "stepwise addition". Basicamente este algoritmo promove rearranjos em uma dada árvore. Há duas maneiras de se realizar estes rearranjos. Uma delas denominada "poda e enxerto de subárvores" irá selecionar uma parte da árvore, cortá-la formando a subárvore e então irá inserí-la em todas as possíveis posições da árvore restante. O procedimento se repete até que não há uma melhor otimização nas árvores resultantes. A segunda maneira denominada bisecção de árvore consiste em quebrar a árvore em duas subárvores disjuntas e uní-las por meio de um par de ramos diferentes daqueles que foi originada. O procedimento é repetido até que todos os pares possíveis de ramos destas duas subárvores sejam unidos e a melhor árvore seja definida. UPGMA e Neighbor-Joining Além dos algoritimos vistos acima, existe duas outras maneiras de obter uma árvore: o "Neighbor-joining" e o "UPGMA", do inglês unweighted pair group method using arithmetic averages. Estes algoritmos ao contrário dos demais, não se adequam a 40 Introdução um critério de otimização de busca por que eles chegam a uma única estimativa, independente de um critério de otimização. O NJ é um modo especial da decomposição de estrela. Inicialmente uma árvore em estrela é construída e uma matriz de distância é calculada. Aquele par de táxons que apresentar a menor soma dos comprimentos dos ramos é escolhido para representar um nó interno da árvore e a distância deles a este nó interno é calculada. A seguir outra matriz é calculada considerando este par de táxon como uma única OTU. Novamente aquele par que minimizar a soma dos ramos é escolhido e será considerado uma única OTU no passo seguinte. Este procedimento se repete até que a árvore em estrela tenha sido resolvida de maneira a minimizar a soma dos comprimentos dos ramos. O UPGMA é similar ao NJ porém impõe que as distâncias sejam ultraméticas, e portanto os táxons evoluem a uma taxa semelhante, e não recalcula as distâncias a cada vez que um táxon é adicionado à árvore. Eficiência dos Métodos Dizer qual método é mais adequado na inferência filogenética é uma questão árdua e não resolvida na Sistemática Molecular. Contudo isso pode ser medido através de simulações computacionais uma vez que os mecanismos de evolução do DNA são bem compreendidos (Nei, 1991). Além disso, o efeito dos diferentes tipos de alinhamento na topologia final é um assunto pouco pesquisado. Pouco se conhece se a variabilidade de cladogramas devido as alternativas de alinhamento é da mesma ordem que os métodos de inferência. Um dos poucos trabalhos publicados na literatura científica lidando com esta questão é o de Morrison e Ellis (1997). Os autores alinharam 72 seqüências completas do gene 18S rDNA correspondentes a 43 táxons de protozoários parasitas pertencentes aos filos Apicomplexa e Dinozoa. O alinhamento foi realizado manualmente e através de cinco diferentes programas de alinhamento e as topologias estimadas através de métodos de distância, de parcimônia e de verossimilhança. Os resultados obtidos por estes autores revelaram diferenças no tamanho total das seqüências alinhadas pelos diferentes algoritmos (entre 2509 e 3549 posições), assim como também uma variação de 38 a 55% 41 Introdução no número de sítios invariáveis entre todos os táxons. Ainda neste trabalho, os autores variaram as penalidades dadas às lacunas em um dos programas de alinhamento. De maneira geral estes autores obtiveram um mesmo padrão básico entre os Apicomplexa (Dinozoa foi usado com grupo externo). Isto indica que determinadas regiões são filogeneticamente informativas e robustas a variações no procedimentos de alinhamento. No entanto, a posição de alguns táxons específicos variou grandemente. Um dos problemas dos programas de alinhamento é que eles tentam sempre maximizar a similaridade entre as seqüências. Essa similaridade pode ser devida não apenas à ancestralidade mas reversão, convergência e paralelismo. Usando dados de seqüências de genes ribossomais mitocondriais (12S rDNA e 16S rDNA), Mindell (1991) testou o efeito do alinhamento na obtenção das três possíveis árvores filogenéticas para Homo, Bos e Mus, usando Gallus como grupo externo. Sua estratégia consistiu em alinhar a seqüência de dois integrantes do grupo interno e inferir uma seqüência consenso. Depois esta seqüência consenso foi alinhada com o terceiro integrante do grupo interno, e deste alinhamento foi retirado uma segunda seqüência consenso, a qual foi alinhada a Gallus. A estimativa das árvores foi realizada pelo método de parcimônia. Os resultados mostraram que a seqüência do 16S rDNA foi mais sensível aos diferentes alinhamentos. Atribuindo o mesmo peso a todas as posições, duas árvores mais parcimoniosas foram detectadas. Usando maior peso às transversões, a ordem dos ramos na árvores correspondeu à ordem de entrada dos dados no alinhamento. Já para as seqüências do 12S rDNA, a mesma topologia foi sempre encontrada independentemente da ordem de entrada dos táxons no alinhamento. Porém, usando pesos iguais ou atribuindo maior peso as tranversões levou à obtenção dos grupos-irmãos (Bos e Mus) e (Homo e Bos), respectivamente. Na análise de Mindell (1991) a decisão foi favorável a esta última opção devido a dois motivos. Primeiro, o acúmulo de transições leva ao aumento de substituições múltiplas e perda da informação filogenética. Segundo, há um aumento significativo no comprimento da árvores se considerarmos a opção (Bos e Mus). Em relação a qual seria o tamanho útil de seqüências de DNA para a inferência filogenética, Zardoya e Meyer (1996) tem posto em dúvida que seqüências mitocondriais relativamente curtas forneceriam uma boa estimativa da filogenia e que posições 42 Introdução aleatórias, especialmente segmentos mitocondriais não adjacentes, devem ser usados nesse processo, totalizando o máximo possível de pares de bases sendo analisadas. Hillis (1991) desenvolveu a estatística g1 para avaliar a distribuição de comprimentos de todas as possíveis árvores para um grupo de táxons. Ele determinou que menos do que 100 sítios variáveis diminuem a faixa crítica de g1, onde a distribuição dos comprimentos da árvore não é a prevista para seqüências aleatórias. Em outras palavras, para menos do que 100 sítios variáveis, é mais provável que a variação na seqüências seja aleatória e a filogenia não reflita uma história evolutiva verdadeira. REGISTRO FÓSSIL E BIOGEOGRAFIA Em estudos evolutivos usando seqüências de DNA, informações complementares podem ser obtidas a partir de dados fósseis e biogeográficos, permitindo levantar hipóteses para a evolução de um grupo de organismos. Contudo, dados paleontológicos são difíceis de serem obtidos. Nem sempre o grupo que se deseja estudar apresenta registro fóssil confiável. O processo de fossilização vai depender de características biológicas e sedimentares. Animais invertebrados que possuem estruturas corporais moles têm fossilização mais difícil do que de vertebrados, por exemplo. Entre os vertebrados, estruturas como ossos e dentes são mais facilmente fossilizadas do que tecidos musculares por exemplo. Além disso, o tipo de solo e sua forma de sedimentação e as condições climáticas também irão influenciar o processo de fossilização. Quando o registro fóssil está presente, a evidência mais antiga é usado para se estabelecer uma data mínima de aparecimento de determinados táxons e a taxa de substituições das bases nucleotídicas podem ser estabelecidas a partir desta data (Hedges et al., 1996; Friesen e Anderson, 1997). A melhor estimativa do surgimento de um grupo seria dada pela presença de fósseis anteriores e posteriores ao evento de especiação, permitindo dessa maneira uma melhor calibração do relógio molecular. Provavelmente os fósseis disponíveis não são os ancestrais diretos, mas correspondem a outros ramos extintos (e não representados) na árvore (Marshall, 1990). A Biogeografia, ciência que trata das distribuições geográficas atuais e passadas dos organismos, também tem sido amplamente empregada na datação da divergência 43 Introdução entre as OTUs. A distribuição e evolução dos seres vivos é influenciada por fatores geográficos, climáticos e ecológicos. Desta forma, pode-se traçar a história de um dado grupo através de dados paleoclimáticos e paleogeográficos, por exemplo. Dados de paleopólen, isto é, o registro fossilífero de grãos de pólen, permitem inferir a composição vegetacional de uma dada época e a partir daí, inferir condições climáticas e ecológicas daquela época. A aceitação da teoria da deriva continental, permitiu que a distribuição descontínua de determinados grupos de organismos relacionados pudesse ser explicada. Por exemplo, as aves ratitas são encontradas apenas nos continentes do Hemisfério Sul (América do Sul, África e Austrália). Contudo estes continentes estiveram ligados no passado e sua separação se iniciou 200 milhões de anos atrás, e levou cerca de 100 milhões de anos para que os atuais continentes estivessem totalmente separados (Storey, 1995). Provavelmente, os ancestrais de cada linhagem que levou aos ratitas atuais já haviam divergido e ocupavam as áreas que hoje correspondem a estes continentes. Outros exemplos de distribuição disjuntas (besouro Nothophagus, árvores e arbustos do gêneros Acacia, sapos da família Pipiedae, e outros) também são bem documentados (Brown e Lomolino, 1998). 44 Introdução OBJETIVOS Os métodos de reconstrução filogenética aplicados a seqüências de ácidos nucléicos têm influenciado muitos estudos de evolução e filogenia de diversos organismos. Nesta tese, utilizamos destes métodos para: - Estabelecer as relações filogenéticas entre os onze gêneros da família Cracidae baseadas em seqüências de seis genes mitocondriais; - Estimar a data de divergência da família Cracidae e de seus onze gêneros, correlacionando com eventos geomorfológicos e biológicos que possam ter influenciado a divergência intergenérica, caso a hipótese do relógio molecular não seja rejeitada para as seqüências obtidas; - Identificar a posição filogenética de Cracidae e Megapodiidae em relacão a outros Galliformes e Anseriformes e averiguar se a exclusão destas duas famílias dos Galliformes é apoiada por dados de seqüências mitocondriais como já sugerido por outros tipos de dados moleculares; - Avaliar a utilidade de seqüências do domínio I da região controladora do DNA mitocondrial em recuperar a filogenia dos gêneros de Cracidae, uma vez que este gene é considerado de evolução mais rápida, e portanto útil em estudos populacionais e de espécies próximas, e raramente utilizado em inferências das relações entre táxons acima de espécie; - Estabelecer aspectos moleculares da evolução da subunidade II da citocromo c oxidase (COII) em cracídeos e fazer uma análise comparativa com a evolução da COII em outros animais. 45 Capítulo 2 Material e Métodos 46 Material e Métodos MATERIAL E MÉTODOS TÁXONS USADOS Os táxons dos quais foram obtidas as seqüências de genes mitocondriais e os táxons cujas seqüências foram retiradas do GenBank e usadas em reconstruções filogenéticas nesta tese estão listados na tabela 1. Há ainda a procedência das aves cujo DNA foi seqüenciado neste trabalho. Tabela 1. Espécies utilizadas em análises filogenéticas no presente trabalho. Família Espécie Cracidae Aburria aburri Chamaepetes goudotti Oreophasis derbianus Ortalis cannicolis Megapodiidae Phasianidae Anatidae Rheidae Penelope obscura Penelopina nigra Pipile jacutinga Crax blumenbachii Mitu tuberosa Nothocrax urumutum Pauxi pauxi Megapodius reinwardt Gallus gallus Aythia americana Rhea americana Procedência da amostra de DNA ou referência do trabalho original onde as seqüências foram apresentadas Criadouro Tropicus, Pirassununga, SP Fundación Ara, México Fundación Ara, México Criadouro Poços de Caldas, Poços de Caldas, MG Fundação Crax, Belo Horizonte, MG CESP, Paraibuna, SP Fundación Ara, México Criadouro Tropicus, Pirassununga,SP Criadouro Chaparral, Recife, PE Fundação Crax, Belo Horizonte, MG Criadouro Tropicus, Pirassununga Fundação Crax, Belo Horizonte,MG Royal Ontario Museum, Canadá Desjardins e Moraes, 1990 Mindell et al., 1999 Harlid et al., 1998 OBTENÇÃO DE SEQÜÊNCIAS DE GENES MITOCONDRIAIS A PARTIR DE PRODUTOS AMPLIFICADOS POR PCR A seguir são apresentados os protocolos usados para a obtenção das seqüências de genes mitocondriais (Fig. 1). Os protocolos 1-4 são gerais para a extração de DNA a partir de sangue periférico e avaliação da quantidade e qualidade do DNA extraído, e amplificação de fragmentos específicos (Sambrook et al., 1989). Os demais protocolos foram usados segundo uma ordem específica para a obtenção das seqüências de DNA, de acordo com o modelo de seqüenciador utilizado. As seqüências do domínio I da região controladora (CR-I) do mtDNA foram obtidas no Departamento de Biologia do IBUSP em um seqüenciador ABI PRISM 310 da Perkin-Elmer. Os demais genes (12S e 16S 47 Material e Métodos rDNA, COI, COII, COIII e cyt b) foram obtidos no Canadá, no laboratório do Dr. Allan J. Baker sediado no Royal Ontario Museum, usando um seqüenciador da Li-Cor, modelo LongReadir 4200. Para o seqüenciador ABI PRISM 310, os protocolos utilizados foram 5.1, 6.1, 7.1 ou 7.2 dependendo do fabricante do kit de seqüenciamento. Para o seqüenciador LongReadir 4200 foram usados os protocolos 5.2, 6.2, 7.3, 8, 9, e 10. Sangue periférico Amplificação de sequencias -alvo por PCR (Protocolo 4) Separação e recuperação de sequências amplificadas por eletroforese (Protocolo 5) Extração de DNA, avaliação da quantidade e qualidade do DNA (Protocolo 1-3) Purificação de sequencias alvo (Protocolo 6) Reconstrução de árvores filogenéticas Sequenciamento automático e edição final das sequências (Procotolo 8-10) “Cycle Sequencing” (Protocolo 7) Figura 1. Esquema indicando uma visão geral dos procedimentos de obtenção de DNA total a partir de sangue periférico das aves, amplificação e seqüenciamento de segmentos específicos de DNA, e análises filogenéticas. Os protocolos 1-10 são descritos detalhadamente no texto. As formulações das soluções químicas usadas nos protocolos descritos a seguir foram realizadas conforme descrito em Sambrook et al. (1989). Coleta de Sangue das Aves A coleta de sangue periférico das aves para a obtenção de DNA foi realizada por meio de punção venosa, descrita a seguir. O sangue estocado em SSC/EDTA deve ser congelado imediatamente. Alternativamente, o SSC/EDTA pode ser substituído por etanol absoluto e a amostra pode ser mantida em temperatura ambiente. Este procedimento em muitos casos é mais vantajoso uma vez que dispensa o congelamento 48 Material e Métodos das amostras, facilitando as coletas em campo. O eppendorf deve ser vedado com filme de PVC para minimizar a evaporação do álcool. São necessárias três pessoas trabalhando em conjunto durante a coleta de sangue para evitar possíveis danos à saúde das aves. Equipamentos Seringas descartáveis de 1 ml Algodão embebido em álcool Filme de PVC Eppendorfs novos Algodão seco Isopor para gelo Substâncias e Soluções Gelo EDTA 2xSSC Etanol absoluto 1 - Preparar eppendorfs com 500 ul de 2xSSC, 10mM EDTA pH 7,4. 2 - Manter os tubos congelados até a hora da coleta. 3 - Levar os tubos com a solução em gelo até o local da coleta. 4 - Uma pessoa deve segurar o animal pelo pescoço com uma das mãos e os pés, cauda e uma das asas com a outra mão. 5 - Uma segunda pessoa deve segurar a outra asa esticada, da qual se irá extrair o sangue, apoiando-a firmemente em uma mesa para evitar fraturas ósseas. 6 - Esta mesma pessoa deve fazer o garrote com a outra mão (colocando um dedo sobre a veia). 7 - Uma terceira pessoa deve esterilizar o local utilizando o algodão embebido em álcool e retirar o excesso de penas do local. 8 - Soltar o garrote e coletar 0,1 ml de sangue com auxílio da seringa. 9 - Estancar completamente o sangue com algodão seco. 10 - Liberar o animal. 11 - Depositar o sangue nos eppendorfs, tampá-los bem e inverter o eppendorf algumas vezes. 12 - Manter o eppendorf com sangue em gelo. 13 - Congelar as amostras colhidas. A extração de DNA foi realizada em tubos de 15 ml ou em eppendorfs de 1,5 ml conforme descrito a seguir. O NaCl usado no passo 5 do protocolo 1 foi substituído por fenol na extração em eppendorfs. As pipetas Pasteur devem ser substituídas, neste caso, por micropipetas comum, cujas ponteiras devem ter as pontas cortadas para evitar degradar o DNA. 49 Material e Métodos O sangue estocado em etanol absoluto forma um precipitado do qual cerca de 50% do grumo deve ser colocado para a extração ao invés de amostar 100 ul do sangue estocado em SSC/EDTA. Protocolo 1 - Extração de DNA Equipamentos Eppendorfs 1,5 ml Micropipeta de 1000 ul, 200 ul e 20 ul e suas respectivas ponteiras 2 pipetas Pasteur para cada amostra de sangue Copo plástico para descartar sobrenadante Seringa de 10 ml Adaptadores para centrifuga Centrífuga/microcentrífuga Substâncias e Soluções Amostras de sangue 1xTNE 25% SDS Proteinase K 25 ng/ml (estocada a -20oC) Etanol Absoluto TE Fenol/NaCl Etanol 70% Extração em tubos de 15 ml 1 - Colocar em tubo plástico de 15 ml, 3 ml de 1xTNE, 300 ul de Tris-HCl 1 M pH 7,5, 80 ul de 25% SDS e 20 ul de proteinase K. 2 - Acrescentar 100 ul de sangue periférico do indivíduo cujo DNA será isolado, cortando-se a ponta da ponteira para não degradar o DNA. 3 - Agitar levemente o tubo várias vezes por 15 segundos. 4 - Incubar a 37oC "overnight" ou a 55oC por 4 horas. 5 - Adicionar 1 ml de NaCl 6 M e misturar vigorosamente o tubo por cerca de 30 segundos. 6 - Centrifugar a 12 krpm por 10 minutos. 7 - Passar o sobrenadante para outro tubo com auxílio de uma pipeta pasteur de ponta não fina (para evitar degradar o DNA). (Se o sobrenadante estiver limpo, ir para o passo 10). 8 - Adicionar um volume de fenol. Centrifugar a 12 krpm por 10 minutos. 9 - Repetir passo 7. 10 - Adicionar 2 volumes de etanol absoluto com auxílio de uma seringa. 11 - Agitar o tubo levemente até precipitar o DNA. 12 - Centrifugar a 12 krpm por 5 minutos. 13 - Descartar o sobrenadante cuidadosamente. 50 Material e Métodos 14 - Acrecentar 1 ml de etanol 70% ao pellet e dar uma leve agitada para desprendê-lo. 15 - Centrifugar a 12 krpm por 5 minutos. 16 - Descartar o etanol 70% cuidadosamente. 17 - Secar o "pellet" de DNA "overnight" a temperatura ambiente ou por duas horas em bomba de vácuo. 18 - Diluir o DNA em 300-500 ul de TE, conforme a quantidade de DNA obtido, por uma ou duas semanas a 4oC. 19 - Passar DNA diluído para eppendorf com auxílio de pipeta Pasteur. Extração em eppendorfs A extração pode ser feita em tubos eppendorfs. Para cada amostra deve-se utilizar: - 300 ul de TNE - 30 ul de Tris 1M ph 7,5 - 8 ul de SDS 25% - 20 ul proteinase K (25 ng/ml) Uma vez isolado, a qualidade e a concentração do DNA pode ser verificada em gel de agarose 0,8% (Check Gel) ou em espectrofotômetro. Para a quantificação em gel de agarose, a concentração é estimada a partir de comparação de cada amostra com as amostras de DNA de fago lambda de concentração conhecida. Mistura-se o corante azul de bromofenol/xileno cianol, denominado aqui LB ("loading buffer")(Sambrook et al., 1989) ao DNA facilitando a visualização da amostra sendo aplicada no gel. Após a corrida eletroforética, o gel é corado com brometo de etítido para visualisar o DNA. O brometo de etídio é cancerígeno e por isso deve se usar luvas plásticas descartáveis para manuseá-lo e manusear o gel depois de corado. O gel deve ser descartado em lixo próprio (hospitalar). Todo material descartável que entrar em contato com o brometo de etídio também deve ser descartado nesse mesmo lixo. Protocolo 2 - Gel de Agarose 0,8% 51 Material e Métodos Equipamentos Becker de 50 ml Filme de PVC Pipeta graduada de 20 ml Cuba de eletroforese Forno microondas Suporte para moldar o gel Soluções Químicas Agarose 1xTBE pH 8,8 1 - Pesar 0,12 gramas de agarose. 2 - Passar agarose para becker com 15 ml de 1xTBE pH 8,8. 3 - Fechar becker com filme de PVC e perfurá-lo algumas vezes. 4 - Aquecer em forno microondas até toda agarose estar dissolvida. 5 - Despejar o gel ainda líquido no suporte da cuba de eletroforese. 6 - Após solidificação introduzir apenas o suporte do gel na fonte de eletroforese. 7 - Cobrir o gel com 1xTBE pH 8,8 (o mesmo utilizado para se fazer o gel). Concentrações diferentes deste gel pode ser obtida através de regra de três simples. As medidas dadas são para um gel de 6,0 x 8,5 centímetros. Protocolo 3 - Avaliação da qualidade e da concentração de DNA Equipamentos Cuba para eletroforese Luvas plásticas descartáveis Transiluminador UV Máquina polaróide Cuba plástica para corar e lavar o gel Gel de agarose 0,8% Espectrofotômetro Eppendorfs Filme de PVC para aliquotar LB Suporte para eppendorf Shaker Substâncias e Soluções Amostras de DNA Loading Buffer (LB) Solução NaOH 5 N/NaCl 6 M H2O milli q+ H2O destilada Brometo de etídio DNA de fago λ 52 Material e Métodos Agarose 0,8% (Check Gel) 1 - Prepare o gel de agarose conforme protocolo 2. 2 - Aliquotar gotas de LB em um pedaço de filme de PVC. 3 - Misturar cada amostra de DNA de lambda e de DNA a ser analisado com cada uma das gotas de LB no filme de PVC. 4 - Carregar 1 ul DNA de lambda com 1 ul de LB (225 ng/ul) em um dos poços e em outro com 2ul de DNA de lambda (555 ng/ul) e 1 ul de LB. 5 - Carregar 1 ul de LB com 1 ul das amostras de DNA a serem verificadas. 6 - Executar a corrida eletroforética inicialmente a 100 V para as amostras penetrarem no gel (cerca de 2-3 minutos) e depois abaixar para cerca de 40 - 50 V, por cerca de 30-60 minutos. 7 - Terminada a corrida, corar o gel com brometo de etídio em solução aquosa por 10 minutos em shaker, numa cuba plástica. 8 - Retirar esta solução em trompa de vácuo. 9 - Lavar o gel em água destilada por 5 minutos. 10 - Repitir passo 7. 11 - Verificar o resultado em transiluminador UV e fotografar em filme de revelação instantânea ("Polaroid") para posterior análise da concentração. A quantificação de DNA realizada em GeneQuant (Pharmacia) pode ser feita por meio de capilares de 3 ul ou cubetas de 5-10 ul, conforme especificado a seguir: GeneQuant (capilar 3 ul) 1 - Preparar 3 ul de H2O milli q+ em eppendorf para zerar o espectro. 2 - Colocar 1 ul de DNA em 2 ul de H2O milli q+. 3 - Recolher a amostra final em capilar. 4 - Proceder a leitura no espectro. GeneQuant (cubeta 5-10 ul) 1 - Preparar 6 ul de água milli q+ em um eppendorf para cada amostra. 53 Material e Métodos 2 - Acrescentar 1 ul de DNA de cada amostra. 3 - Misturar bem e introduzir a amostra de DNA digerido diluída na cubeta. 4 - Efetuar a medida conforme normas do espectrofotômetro. Após a quantificação das amostras de DNA genômico, preparou-se diluições de modo a termos de 5 a 20 ng de DNA por microlitro de amostra para posterior utilização nas amplificações. A preparação da reação de PCR e a diluição os primers devem ser realizadas no interior de uma sala estéril. Esta sala deve ser de uso exclusivo para esta finalidade. Amostras uma vez amplificadas não devem retornar à sala para se evitar eventual contaminação do micropipetas e outros utensílios. Sempre que a sala não estiver em uso, uma luz ultravioleta deve permanecer acesa para esterilizar a sala, degradando eventuais contaminações da bancada ou outros utensílios (como micropipetas por exemplo) por DNA. Todo material da sala deve ser manuseado com luvas que posteriomente serão descartados. Quando não houver uma sala disponível para a preparação da PCR, usar micropipetas que sejam exclusivas para uso pré e pós-PCR. A amplificação dos fragmentos mitocondriais foi realizada em termociclador TC1 da Perkin-Elmer. A reação deu-se em 25 ciclos onde as condições de desnaturação, de hibridação e de extensão foi de 1 minuto a 95oC, 30 segundos a 50oC e 40 segundos a 72oC, respectivamente. Estes ciclos foram precedidos de um passo inicial de desnaturação de 5 minutos a 95oC e sucedidos por uma extensão final de 5 minutos a 72oC. Para o domínio I da região controladora (CR-I) a temperatura de hibridação dos ciclos foi de 54oC. Os oligonucleotídeos iniciadores ("primers") utilizados para a amplificação dos sete gene mitocondriais seqüenciados no presente trabalho são mostrados na tabela 2. Com exceção dos "primers" para a região controladora do DNA mitocondrial (Dloop), os demais possuíam uma seqüência do M13 em sua extremidade 3'. Esta seqüências permitiram usar seqüências do M13 complementares como "primers" para a reação de seqüenciamento. As seqüências de M13 usados como "cauda" ("M13-tailed primers") dos primers de amplificação eram 5'-CAC GAC GTT CAC ACA GG-3' para a fita L e 5'-GGA TAA CAA TTT CAC ACA GG-3' para a fita H. Esta diferença entre os 54 Material e Métodos procedimentos realizados para o D-loop e para os demais genes deve-se aos modelos de seqüenciador usados em ambos os casos, e não há uma característica intrínseca dos genes. Tabela 2. Seqüências 5'→3' dos oligonucleotídeos iniciadores para os sete genes mitocondriais utilizados neste trabalho. Os números correspondem à posição dos "primers" no genoma mitocondrial de Gallus gallus (GenBank X52392, Desjardins & Moraes, 1990). Os "primers" foram desenhados por G. Rowe da Leicester University ("D-loop") e por O. Haddrath do Royal Ontario Museum (demais primers). Gene "Primer" Posição Seqüência 5'→ →3' D-loop D-loop L 16756-16775 TTG TTC TCA ACT ACG GGA AC D-loop H 422-443 GTG AGG TGG ACG ATC AAT AAA T 12SrRNA L1537 1534-1555 AAT CTT GTG CCA GCC ACC GCG G H12SEND 2241-2263 GTG CAC CTT CCG GTA CAC TTA CC 16SrRNA 16SAR L 2699-2726 AAGCCWANCGAGCYGGGTGATAGCTGG 16SBR H 3811-3831 CAT AGA TAG AAA CCG ACC TGG COI COIAL 6675-6695 AAC YAA CCA CAA AGA CAT TGG H8205 8184-8205 GGG GTT CGA TTC CTT CCT TTC TTG COII L8184 8184-8205 CAA GAA AGG AAG GAA TCG AAC C LYSH 9041-9058 TCT CTA GCT TAA AAG GCT COIII A5REVTF 9914-9936 AAA YAT YTA ATG GCA CAC CAA GC GLYHTR 10707-10729 GTA ATN ANT ATA CTA GAA GAG C Cyt b B1L 14965-14990 CCA TCC AAC ATC TCA GGA TGA TGA AA B6H 16065-16089 GTC TTC AGT TTT GGT TTA CAA GAC Protocolo 4 - Amplificação de fragmentos de DNA mitocondrial Equipamentos Termociclador Cuba de isopor p/ gelo Sala estéril Luvas descartáveis Papel absorvente Micropipetas P2, P20 e P200 Ponteira para P20 e P200, e para P2 Eppendorfs de 1,5 ml, de 0,5 ml e de 0,2 ml Papel alumínio Fita isolante Luz ultravioleta Substâncias e Soluções Álcool Gelo Tampão da reação de PCR Primers diluídos na concentração necessária (10uM) Amostras de DNA (5-20 ng/ul) Água MilliQ autoclavada, ou destilada autoclavada Taq polimerase Óleo mineral 1 - Calcular previamente as quantidades necessárias de reagente para cada tubo. 2 - Verificar o programa de ciclos de tempo e temperatura no termociclador. 3 - Retirar do freezer, as amostras de DNA, primers, Taq polimerase e manter em gelo. 4 - Geralmente as quantidades a serem acrescentadas aos tubos são 8,0 ul de reagente prémix fornecido com o kit de seqüenciamento, 1,0 a 3,0 ul de DNA total (até cerca de 20 ng) e água para completar 20 ul. 5 - Limpar bancada da sala exclusiva de PCR com álcool. 55 Material e Métodos 6 - Preparar a solução mãe sem as amostras de DNA em um tubo adequado ao volume total da solução-mãe. 7 - Separar os tubos adequados ao modelo de termociclador a ser usado. 8 - Marcar os tubos de modo a identificar as amostras a serem aliquotadas. 9 - Adicionar o volume de solução-mãe desejado nos tubos eppendorfs. 10 - Acrescentar o DNA (5-20 ng/ul). 11 - Se necessário, de acordo com o modelo de termociclador a ser utilizado, acrescentar uma gota de óleo mineral aos tubos. 12 - Dar um pulso nos tubos em microcentrifuga. 13 - Colocar as amostras no termociclador. Os fragmentos gerados por PCR foram aplicados em gel de agarose 1% para determinar se o tamanho dos fragmentos obtidos correspondia ao tamanho esperado, comparando-se as bandas produzidas com marcador de peso molecular (100bp ladder, Pharmacia) e com um controle positivo (Gallus gallus). Uma vez obtido os fragmentos de tamanho esperado, eles foram recuperados do gel de agarose de duas maneiras. Os fragmentos do CR-I foram recuperados de acordo com o protocolo descrito por Zhen e Swank (1993). Já os demais genes foram recuperados de uma maneira mais simplificada de acordo com o descrito nesta tese. Protocolo 5 - Recuperação de fragmentos do CR-I Equipamentos Becker de 50 ml Filme de PVC Pipeta ou proveta graduada de 20 ml Cuba de eletroforese Forno microondas Suporte para moldar o gel Estilete de ponta fina Eppendorfs Micropipetas P100 e P20 Ponteira para micropipetas Substâncias e Soluções Agarose 1xTBE pH 8,8 Loading buffer Brometo de etídio Fragmento a ser recuperado Solução PEG 15% / TBE 1x 5.1 Recuperação dos fragmentos de CR-I 1 - Pesar 0,20 gramas de agarose. 2 - Passar agarose para becker com 20 ml de 1xTBE pH 8,8. 3 - Fechar becker com filme de PVC e perfurá-lo algumas vezes. 4 - Aquecer em forno microondas até toda agarose estar dissolvida. 5 - Colocar uma ou duas gotas de brometo de etídio no gel. 56 Material e Métodos 6 - Despejar o gel ainda líquido no suporte da cuba de eletroforese. 7 - Após solidificação introduzir apenas o suporte do gel na fonte de eletroforese. 8 - Cobrir o gel com 1xTBE pH 8,8 (o mesmo utilizado para se fazer o gel). 9 - Após a solidificação do gel, carregar as amostras de DNA a ser recuperado com 2 ul de LB. 10 - Cobrir o gel com papel alumínio, para evitar degradação do DNA provocada pelo brometo de etídio na presença de luz. 11 - Correr a 40-50 V por cerca de 1 hora. 12 - Corar o gel com brometo de etídio. 13 - Sobre luz ultravioleta, marcar com o estilete os limites da banda logo abaixo desta. 14 - Fazer uma fenda de 1,5 cm x 1,5 cm logo a frente da banda. 15 - Voltar o gel ao aparelho de eletroforese. 16 - Retirar o excesso de tampão TBE de modo que ele não ultrapasse por cima do gel, mas que fique em seus limites superiores. 17 - Acrescentar PEG 15%/ TBE 1x até preencher a fenda. 18 - Restabelecer a corrente elétrica. 19 - Aguardar até que o DNA caia na fenda preenchida por PEG/TBE, observando a evolução da banda de DNA por meio de um aparelho portátil de luz ultravioleta. 20 - Recuperar a solução de PEG/TBE com o DNA. 21 - Manter o DNA congelado nessa solução até sua posterior purificação segundo o protocolo 6.1. 5.2 Recuperação dos demais genes 1. Preparar um gel de agarose 1%. 2. Separar em eletroforese os fragmentos por cerca de 20 minutos a 120V. 3. Averiguar a separação dos fragmentos em luz ultravioleta. 4. Se a separação dos fragmentos ocorreu, cortar a banda e manuseá-la de acordo com o especificado no protocolo 6.2. Os fragmentos recuperados foram imediatamente purificados como descrito a seguir. A purificação dos fragmentos obtidos no laboratório canadense se deu de maneira mais simplificada porque o modelo de seqüenciador usado não exigia procedimentos elaborados de purificação como realizado no Brasil para os fragmentos do CR-I. 57 Material e Métodos Protocolo 6 - Purificação de DNA recuperado em gel de agarose Equipamentos Eppendorfs Micropipetas Ponteira para micropipetas Microcentrifuga Cuba de isopor para gelo seco Suporte de isopor para eppendorf Vortex Substâncias e Soluções DNA em PEG/TBE NaOAc 3 M, pH 5.2 Etanol absoluto Etanol 70% Fenol:Tris (1:1) Clorofórmio:isoamílico (24:1) Gelo seco Acetona (opcional) 6.1 Purificação do CR-I 1 - Adicionar 1 volume de fenol:tris. 2 - Agitar em vortex e centrifugar por 10 minutos por 14 krpm. 3 - Passar sobrenandante para outro eppenforf. 4 - Acrescentar 1 volume de clorofórmio:álcool isoamílico (24:1). 5 - repetir passo 2. 6 - Passar sobrenadante para novo tubo eppendorf. 7 - Acrescentar 1/10 de volume de NaOAc e 2 volumes de EtOH. 8 - Manter em gelo seco + álcool (ou acetona) por 15 minutos (ou alternativamente, 15 minutos a -70oC, ou ainda 1 ou 2 horas a -20oC). 9 - Centrifugar 20 minutos a 14 krpm. 10 - Descartar o sobrenadante. 11 - Acrescentar 100 ul de etanol 70%. 12 - Repetir passo 2. 13 - Repetir passo 10. 14 - Secar a vácuo por 10 minutos. 15 - Ressuspender em H20 MilliQ. 16 - Medir a concentração de DNA. 6.2 Purificação dos demais genes 1. Introduzir uma ponteira com filtro de algodão no interior de um tubo epperndorf. Se necessário corte a ponteira para que ela caiba no tubo de maneira que ele possa ser fechado. 2. Marcar a tampa dos tubos correpondente à amplificação a ser purificada. 3. Introduzir a banda excisada no protocolo 5 sobre o filtro de algodão da ponteira inserida no tubo. 58 Material e Métodos 4. Fechar os tubos. 5. Centrifugar por 7 minutos a 800xg. 6. Retirar a ponteira contendo a agarose retida no filtro de algodão. 7. Estocar a 8oC o DNA em solução no fundo do tubo. Este DNA está dissolvido em TA proveniente da banda excisada do gel. Protocolo 7 - Seqüenciamento de produtos de PCR O seqüenciamento foi realizado diretamente a partir dos fragmentos amplificados pela técnica de PCR. Para os fragmentos de CR-I o seqüenciamento deu-se como descrito a seguir. Inicialmente procedeu-se a reação de "cycle sequencing" em termociclador modelo TC2400 (Perkin-Elmer) e a purificação da reação de acordo com as especificações dos fabricantes do "kit" de seqüenciamento ("Dye terminator cycle sequencing DNA sequencing kit" da Perkin-Elmer (protocolo 7.1) ou "Thermo Sequenase dye terminator cycle sequencing pre-mix kit" da Amersham (protocolo 7.2)). Feito isso, as amostras foram entregues a um técnico especializado responsável pelo manuseio do seqüenciador ABI PRISM 310 "Genetic Analyzer" (Perkin-Elmer) pertencente ao departamento de Biologia do IBUSP. Para o seqüenciamento dos demais genes, os fragmentos foram submetidos à reação de "cycle sequencing" em termociclador modelo Genius, da Techne, segundo especificações do fabricante do "kit" de seqüenciamento ("DYEnamic direct cycle sequencing kit Thermosequenase e 7-deaza-dGTP"; Amersham), descritas no protocolo 7.3. 59 Material e Métodos 7.1 "Cycle sequencing" (Perkin Elmer) Equipamentos Sala exclusiva para PCR Micropipetas Cuba para gelo Seqüenciador automático Microcentrifuga Ponteira para micropipetas Termociclador Vórtex Substâncias e Soluções DNA Primers 3uM Gelo Terminator ready mix H2O NaAc 3M Etanol absoluto Etanol 70% gelado TSR Procedimentos 1 - Checar o programa de "cycle sequencing" no termociclador. 2 - Manter primer e DNA descongelados em gelo. 3 - Retirar terminator ready mix do freezer e descongelá-lo rapida e manualmente. 4 - Em sala de PCR, preparar a reação do "cycle sequencing", adicionando 8 ul de terminator ready mix, primer e água aos tubos eppendorfs. 5 - Devolver o terminator ready mix imediatamente ao freezer, uma vez que ocorre sua degradação na presença de luz. 6 - Fora da sala de PCR, aliquotar o DNA necessário para a reação. 7 - Dar um pulso nas amostras em microcentrifuga. 8 - Iniciar a reação no termociclador (25 ciclos de 96oC 10 seg, 50oC 5 seg, 60oC 4 mim; 4oC "hold"). 9 - Após a reação, adicionar 2 ul de NaAC e 50 ul de EtOH absoluto. 10 - Agitar as amostras em vórtex. 11 - Manter em gelo por 10 minutos. 12 - Centrifugar por 15-30 minutos por 14 krpm. 13 - Retirar EtOH cuidadosamente com micropipeta. 14 - Adicionar 100 ul de EtOH 70%. 15 - Centrifugar por 10 minutos a 14 krpm. 16 - Retirar EtOH 70% com auxílio de micropipeta cuidadosamente. 17 - Secar a vácuo por 5 minutos ou a 95oC em banho seco por 2 miutos. 18 - Ressuspender em 25 ul de TSR, dos quais 6 ul serão amostrados no seqüenciador e o restante armazenado a -20oC, para uma eventual segunda corrida, caso a primeira apresente problemas. 19 - Agitar em vórtex e manter sempre em gelo. 20 - Aquecer a amostra por 2 minutos a 95oC. 21 - Manter a amostra em gelo. 60 Material e Métodos 22 - As amostras foram entregues nas mãos do técnico especializado em manusear o seqüenciador automático. 7.2 "Cycle sequencing" (Amersham) Equipamentos Sala de PCR Micropipetas Cuba para gelo Seqüenciador automático Microcentrifuga Ponteira para micropipetas Termociclador Vórtex Substâncias e Soluções DNA Primers 5-20uM Gelo Terminator ready pre-mix H2O NaAc ou NH4Ac Etanol absoluto Etanol 70% gelado Loading dye Procedimentos 1 - Checar o programa de "cycle sequencing" no termociclador. 2 - Manter primer e DNA descongelados em gelo. 3 - Retirar "terminator ready pre-mix" do freezer e descongelá-lo rapida e manualmente. 4 - Em sala de PCR, preparar a reação do "cycle sequencing", adicionando 8 ul de "terminator ready pre-mix", "primer" e água aos tubos eppendorfs. 5 - Devolver o "terminator ready pre-mix" imediatamente ao freezer. 6 - Fora da sala de PCR, aliquotar o DNA necessário para a reação. 7 - Dar um pulso nas amostras em microcentrífuga. 8 - Iniciar a reação no termociclador. 9 - Após a reação, adicionar 2 ul de NaAC e 50 ul de EtOH absoluto. O acetato de sódio pode ser substituído por 7 ul de acetato de amônia 7,5M. Se isto ocorrer, adicionar 70 ul de etanol absoluto, agitar em vórtex e deixar de 15 a 20 minutos no gelo (passos 10 e 11). 10 - Agitar as amostras em vórtex. 11 - Manter em gelo por 10 minutos. 12 - Centrifugar por 15-30 minutos por 14 krpm. 13 - Retirar EtOH cuidadosamente com micropipeta. 14 - Adicionar 100 ul de EtOH 70%. 15 - Centrifugar por 10 minutos a 14 krpm. 16 - Retirar EtOH 70% com auxílio de micropipeta cuidadosamente. 17 - Secar a vácuo por 5 minutos. 18 - Ressuspender em 10-25 ul de Loading dye. 19 - Agitar as amostras em vórtex e manter sempre em gelo. 61 Material e Métodos 20 - Aquecer a amostra por 2 minutos a 95oC. 21 - Manter a amostra em gelo. 22 - Levar para laboratório de Seqüenciamento Automático e deixar a amostra nas mãos do técnico especializado. 7.3 "Cycle sequencing" (Amersham) 1 - Preparar 4 tubos eppendorfs para cada amostra a ser seqüenciada. 2 - Marcar cada tubo de cada amostras com as letras A, C, G e T correspondente a cada um dos nucleotídeos. 3 - Preparar solução primer-DNA, com cerca de 250 fmol de DNA, 1,0 ul de primer (1pmol/ul), e água para completar 15,0 ul. 4 - Acrescentar 2,0 ul do reagente "pre-mix" do kit de seqüenciamento ao tubo correspondente, isto é, o "pre-mix A" ao tubo marcado com a letra A, e assim sucessivamente. 5 - Acrescentar 3,5 ul da solução primer-DNA. 6 - Iniciar a reação do "cycle sequencing" (30 ciclos de 30 segundos a 95oC, 30 segundos a 55oC, e 30 segundos a 72oC. Estes ciclos foram precedidos por um passo inicial de desnaturação por 2 minutos a 95oC, e sucedido por um passo final de extensão por 5 minutos a 72oC). 7 - Adicionar a cada tubo 3,0 ul de solução de interrupção de reação da LI-COR. 8 - Desnaturar os tubos a 95oC por 5 minutos. 9 - Aplicar 1,5 ul de cada tubo no gel de poliacrilamida já previamente preparado (protocolo 9). Os procedimentos para a limpeza e montagem das placas de gel (protocolo 8), preparação do gel de acrilamida (protocolo 9) e aplicação, corrida de eletroforese do gel vertical de seqüenciamento e desmontagem das placas de gel (protocolo 10) são descritos a seguir. Protocolo 8 - Limpeza e Montagem das placas de vidro Equipamentos Par de placas de vidro 25cm x 60 cm Papel absorvente Pente Par de espaçadores 0,25 mm Grampos laterais LI-COR Luvas cirúrgicas Substâncias e Soluções Álcool H20 Milli Q Detergente Micro-90 62 Material e Métodos Procedimentos 1 - Usar luvas para manusear as placas. 2 - Limpar o par de placas com água e detergente Micro-90 (International Products Corporation) várias vezes, principalmente lado interno. 3 - Limpar os espaçadores e os pentes com água e detergente. 4 - Jogar isopropanol 100% sobre as placas, espaçadores e pentes para secá-los mais rapidamente. 5 - Ajustar ambas as placas de vidro e os espaçadores laterais entre as placas. 6 - Colocar os 2 grampos LI-COR nas laterais das placas. Protocolo 9 - Preparação do gel de acrilamida Equipamentos Placas montadas Proveta Becker Suporte de 5 cm de altura para as placas de vidro Papel absorvente Luvas cirúrgicas Grampos e Seringa Substâncias e Soluções Solução de gel LongRange TBE 5x Ureia TEMED Persulfato de Amônio H2O milliQ Procedimentos 1 - Preparar o gel com 4,8 ml de solução LongRange da LI-COR, 25,2 g de uréia, 14,4 ml de TBE 5X. A solução LongRange contém acrilamida e deve ser manuseada com luvas cirúrgicas. 2 - Completar a solução para 60 ml com água milliQ. 3 - Adicionar 40,0 ul de TEMED e 400,0 ul de persulfato de amônio 10% à solução. Recomenda-se que esta solução não tenha mais do que 10 dias de idade. 4 - Misturar bem. 5 - Segurar as placas de vidro levemente inclinadas com uma das mãos e injetar a solução de gel com auxílio de uma seringa. 6 - Evitar a formação de bolhas de ar. Caso isto aconteça, erguer a placa de vidro para que a solução desça até as bolhas e estas se desfaçam, ou dar leves batidas sobre as placas para fazer as bolhas virem até a superfície. 7 - Colocar o pente no gel. 8 - Prender a região superior das placas com grampos, tomando-se o devido cuidado para não deslocar o pente. 9 - Deixar o gel polimerizando, apoiando-se as placas sobre um suporte de 5 cm de altura em cada lado. 63 Material e Métodos 10 - Verificar a completa polimerização do gel através do restante da solução na proveta ou no becker. Durante a aplicação das amostras de seqüenciamento, se houver vazamento moderado de amostra de reação de seqüenciamento entre as fendas, aplicar quarteto de amostras e restabelecer a corrente até que as amostras entrem no gel. Repetir o processo até que todos os quartetos das amostras tenham sido aplicados. Além disso é recomendado que a corrida de eletroforese seja acompanhada de tempos em tempos para certificar-se que de não está havendo vazamento do tampão do compartimento superior. Protocolo 10 Eletroforese de Seqüenciamento Equipamentos Papel absorvente Seqüenciador LI-COR Micropipeta P20 Ponteiras para P20 Substâncias e Soluções H20 Milli Q Detergente TBE 1x Amostras de DNA do "cycle sequencing" Água Isopropanol Procedimentos 1 - Limpar resíduos do gel que polimerizou sobre as placas com papel molhado em água MilliQ. 2 - Descartar papel contaminado em lixo hospitalar. 3 - Retirar o pente das placas. 4 - Retirar o excesso de uréia e gel que permanece na fenda do pente. 5 - Secar bem as placas com papel absorvente. 6 - Limpar bem o pente. 7 - Inserir o pente corretamente, formando as fendas onde serão aplicadas as amostras. 8 - Colocar as placas de gel na cuba vertical de eletroferese. 9 - Acoplar as placas ao seqüenciador automático, encaixando os grampos nos devidos suportes. 10 - Colocar o tanque de tampão superior no parte superior do suporte das placas do seqüenciador. 11 - Preencher os tanque superior e inferior com tampão TBE 1x. 12 - Fechar a porta do suporte das placas. 13 - Iniciar o programa de controle da corrida de eletroforese, especificando uma temperatura de 45oC e voltagem de 2000V. 64 Material e Métodos 14 - Deixar a pré-corrida ocorrer por cerca de 45 minutos até que a placa de gel tenha atingido 45oC. 15 - Interromper a corrida após ter sido atingida a temperatura de 45oC. 16 - Abrir a porta do suporte dos gel. 17 - Aplicar as amostras no gel com auxílio de micropipeta P20, considerando que cada amostra ocupa 4 fendas (A,C,G,T) consecutivas. 18 - Fechar a porta do suporte do gel. 19 - Restabelecer a voltagem elétrica 20 - Interromper a voltagem ao término da corrida. 21 - Abrir a tampa do suporte do gel. 22 - Esvaziar o tampão do tanque. 23 - Retirar o tanque superior. 24 - Cuidadosamente retirar a placa de gel do seqüenciador automático. 25 - Descartar o tampão do "container" inferior. 26 - Lavar os tanque. 27 - Retirar os grampos laterais e o pente do gel e lavá-los com água e detergente. 28 - Com o auxílio de uma espátula, deslocar cuidadosamente as duas placas de vidro de modo que elas se soltem e o gel permaneça grudado em apenas uma delas. 29 - Lavar cuidadosamente a placa de vidro que ficou sem o gel, com água e detergente. 30 - Retirar o gel da outra placa com o auxílio de papel absorvente. 31 - Descartar o papel com o gel em lixo hospitalar. 32 - Limpar essa segunda placa de vidro da mesma maneira que a primeira. ANÁLISES DAS SEQÜÊNCIAS Correção de ambiguidades das seqüências Uma vez terminada a leitura das reações de sequencimento, o seqüenciador automático gera arquivos contendo as seqüências e seus respectivos eletroferogramas. Isto possibilita comparar cada uma das fitas obtidas e corrigir os sítios onde a determinação da base não foi claramente estabelecida em uma das reações. As correções das seqüências foram realizadas de acordo com o modelo do seqüenciador automático usado em sua obtenção. - Seqüenciador ABI PRISM 310 Genetic Analyzer da Perkin-Elmer (seqüências do domínio I da região controladora). 65 Material e Métodos Para cada gênero, as seqüências da fita leve L e da fita pesada H obtidas foram carregadas no editor Sequence Navigator, versão 1.0.1 (Perkin-Elmer). Esse programa permite visualizar as seqüências obtidas, bem como analisar os eletroferogramas produzidos. Os eletroferogramas correspondem a uma representação gráfica do sinal cromatográfico produzido por cada nucleotídeo durante a passagem pelo detector cromatográfico do seqüenciador automático. As fitas H foram revertidas e complementadas para ficarem iguais as fitas L. Para resolver os casos onde havia dúvida de qual nucleotídeo ocupava uma determinada posição, as fitas L e H foram comparadas entre si e com a mesma região gênica já seqüenciada para Gallus gallus (Desjardins & Morais, 1990). Neste procedimento, usou-se ainda os eletroferogramas produzidos pelo seqüenciador automático para corrigir as falhas entre as seqüências L e H. - Seqüenciador LongReadir 4200 da LI-COR (seqüências de 12S e 16S rDNA, COI, COII, COII e cyt b). O seqüenciador automático LongReadir 4200 da LI-COR reconhece a luminêscencia de cada primer diferentemente, o que permite o seqüenciamento simultâneo de até 1100 bases de cada uma das fitas do DNA. Após a conclusão do seqüenciamento automático, as seqüências foram lidas usando o software Base ImagIR, versão 4.0 fornecido pelo fabricante LI-COR. Este software permite visualizar concomitantemente, o gel e a base atribuída a cada banda, semelhante a uma autorradiografia de um seqüenciamento manual. Nos casos duvidosos, a banda pode ser corrigida manualmente através da inspeção do gel e/ou do eletroferograma correspondente. Feito isso, as seqüencias L e H de cada táxon foram salvas em arquivos formatos texto. Após corrigidas, as seqüências foram preparadas para o alinhamento, através da construção de uma matriz no formato PIR. 66 Material e Métodos Alinhamento O alinhamento das seqüências de DNA foi realizado para cada gene invidualmente, usando-se o programa de alinhamento ClustalW (Cabot et al., 1989). Neste caso, a matriz no formato PIR foi carregada no ClustalW. Posteriormente, o alinhamento foi exportado como uma matriz salva como arquivo texto e importada no programa ESEE (Thompson et al., 1994). Neste programa, o alinhamento foi conferido para correção de eventuais "erros" de alinhamento. No caso de haver estes erros, a correção foi realizada manualmente. No casos de haver lacunas de alinhamento, elas foram removidas e uma nova matriz sem lacunas foi exportada nos formatos PHYLIP e NEXUS. ANÁLISES EVOLUTIVAS E FILOGENÉTICAS Análises de saturação de substituição Para verificar se o número de transições e de transversões atingiu o nível de saturação, isto é, se ocorreu mais do que uma substituição em determinados sítios, foi construído um gráfico onde a coordernada representa os valores das distâncias de cada par de táxons usados e a absissa o número de transição (TS) ou de transversão (TV) presentes em cada par de táxons. No caso de não haver saturação, a relação entre estes parâmetros é linear, isto é, com o aumento da distância, há o aumento do número de TS ou TV. Se houver substituições múltiplas, o gráfico atinge um platô no qual aumentandose a distância, não há o aumento no número de TS ou TV. Mapeamento de verossimilhança O método de mapeamento de verossimilhança proposto recentemente ("likelihood mapping"; Strimmer, 1997, Strimmer & von Haeseler, 1997) permite visualisar graficamente o conteúdo filogenético de um conjunto de seqüências de DNA e é realizado no programa PUZZLE 4.0.2. O procedimento envolve estabelecer as relações filogenéticas para todos os possíveis grupos de quatro táxons existentes no estudo. Para cada quatro táxons A, B, C e D, há três possibilidades de resolução: ((A,B)(C,D)), ((A,C)(B,D)), ((A,D)(B,C)). Estas tolopogias irão ser representadas como os vértices de 67 Material e Métodos um triângulo equilátero. O programa calcula a verossimilhança de cada uma destas topologias e insere um ponto próximo a um dos vértices do triângulo, referente à topologia que apresentar a melhor probabilidade. Se duas destas topologias forem similarmente prováveis, o ponto cairá proximo à aresta do triangulo ligando os dois vértices correspondentes a elas. Ainda no caso de nenhuma das três topologias apresentar melhor probabilidade do que as demais, o ponto será colocado no centro do triângulo. O sinal filogenético será medido pela proporção de quartetos cujos pontos ocuparam as regiões próximas aos vértices. Máxima verossimilhança As análises de verossimilhança foram realizadas no programa BASEML do pacote PAML. Em todas as análises a árvore foi encontrada utilizando-se o algoritmo de decomposição de estrela, onde todos os táxons são unidos em um único nó interno e gradativamente são realizados novos rearranjos para a obtenção da árvore mais verossímil. O modelo evolutivo escolhido foi aquele resultante de testes de razão de verossimilhança (LRT, do ingles, “likelihood ratio test”; Goldman, 1993a,b; Huelsenbeck & Crandall, 1997; Huelsenbeck & Rannala, 1997), realizados previamente à reconstrução filogenética por meio do critério da verossimilhança. Os testes de verossimilhança foram realizados de duas maneiras. Uma delas consistia em escolher os modelos evolutivos e obter a árvore mais verossímil perante cada modelo. Posteriormente, a probabilidade destes modelos foram testadas por meio da estatística: δ=2(LnHo - LnH1) onde LnHo e LnH1 são, respectivamente, as probabilidades do modelo mais simples e do modelo mais complexo. Esta estatística pode ser usada quando os modelos evolutivos representam um caso especial do modelo alternativo. Por exemplo, se não há diferenças nas taxas de transição entre purinas e transição entre pirimidinas, o modelo de TN93 se reduz ao modelo de KHY85. A significância das diferenças é avaliada por meio da distribuição de χ2. Os graus de liberdade equivalem à diferença entre o número de 68 Material e Métodos parâmetros entre os modelos testados. Se a diferença for significativa, a adição de mais parâmetros melhora a probabilidade da árvore, isto é, o modelo com mais parâmetros reflete de maneira mais apropriada a evolução das seqüências usadas, aumentando a probabilidade da árvore ter gerado aquele conjunto particular de seqüências. No caso de comparação onde os modelos não representam um caso especial um do outro, Felsenstein (1988) sugere apenas 1 grau de liberdade entre eles e compará-los em uma tabela de χ2. Este é o caso de comparação de árvores onde a hipótese nula postula que as seqüências evoluem segundo um relógio molecular e a hipótese alternativa postula que as seqüências não possuem taxas constante de substituição entre as linhagens. Neste caso, ambas as hipóteses estão considerando o mesmo modelo evolutivo. A segunda maneira de realizar um LRT é por meio de um software denominado MODELTEST. Este programa é executado em conjunto com o PAUP 4.0. Inicialmente a matriz contendo nossos dados é carregada no PAUP. A seguir, roda-se uma segunda matriz denominada MODELBLOCK, contendo os parâmetros para o cálculo das verossimilhanças de uma árvore construída pelo algoritmo de "Neighbor-Joining". O cálculo da verossimilhança é feito para 40 modelos evolutivos e salvo em um arquivo denominado MODELSCORES. Este arquivo, por sua vez, é carregado no MODELTEST e então temos os resultados e níveis de significância para frequência igual de bases, taxas iguais de transição e transversão, taxas iguais entre os tipos de transição, taxas iguais entre os tipos de transversão e heterogeneidade de taxa de substituição entre os sítios, e qual modelo melhor se adequa aos nossos dados. Máxima parcimônia A árvore mais parcimoniosa foi estimada pelo programa PAUP 4.0. A busca exaustiva foi realizada em casos onde era computacionalmente possível encontrar a árvore desta maneira, isto é, estimar o número de passos entre todas as possíveis árvores. Nos casos onde o número de árvores possíveis limitava a busca exaustiva, a procura foi realizada por meio de busca heurística. Este procedimento utiliza menos tempo para encontrar uma árvore, porém a árvore encontrada pode não ser a mais parcimoniosa. 69 Material e Métodos Neighbor-joining A análise filogenética por meio do método de distância foi realizada no programa PAUP 4.0. O algoritmo selecionado foi o de "neighbor-joining", que permite que as seqüências tenham taxas diferentes de divergência. Índices de suporte. Diversos índices de suporte foram utilizados de acordo com a análise utilizada. Valores de "bootstrap" (Felsenstein, 1985) e índices de Bremer (índice de decaimento, Bremer, 1994) foram usados na análise de máxima parcimônia. Valores de resolução de quartetos foram utilizados em análises de máxima verossimilhança. "Bootstrap" Valores de "bootstrap" foram obtidos por meio de reamostragem dos dados usando-se o programa PAUP 4.0. Associações que tiveram valores de "bootstrap" menores do que 50% não foram mostradas nas árvores, e os ramos que levaram aos táxons envolvidos nestes casos foram representados por politomias. Índices de Bremer Os índices de Bremer, ou ainda índices de decaimento, indicam o número de passos a mais necessários para que uma determinada associação de táxons sejam perdida em uma árvore. Estes valores foram obtidos usando o programa AUTODECAY 4.0.1 (Eriksson, 1998) em conjunto com o PAUP 4.0. Resolução de quartetos O método de resolução de quartetos ("quartet puzzling") baseia-se em resolver a topologia para todos os possíveis grupos de quatro táxons. Posteriormente, uma árvore consenso é estimada de acordo com a resolução destes quartetos. Os valores da resolução de quartetos foram obtidos no programa PUZZLE 4.0.2 (Strimmer, 1997, Strimmer & von Haeseler, 1996). 70 Material e Métodos Datação de tempo de divergência Para datar o tempo de divergência entre os táxons, utilizou-se uma datação molecular conhecida entre dois táxons incluídos na reconstrução filogenética. Esta data foi usada como calibração para estimar o número de substituição por milhão de ano, e partir desta estimativa, converte-se os comprimentos dos ramos da árvore de máxima verossimilhança em estimativas das datas de divergências para todos os nós internos e externos. 71 Resultados 72 RESULTADOS Os resultados do presente trabalho foram organizados em forma de manuscritos para publicação e são apresentados a seguir: • Posição filogenética de Cracidae e Megapodiidae em relação aos Galliformes e Anseriformes (Capítulo 3) • Filogenia molecular de Cracidae (Aves) (Capítulo 4) • Domínio I da região controladora do DNA mitocondrial e a inferência filogenética entre os gêneros de Cracidae (Aves) (Capítulo 5) • Evolução molecular da subunidade II da citocromo c oxidase em Cracidae (Aves) (Capítulo 6) 73 Capítulo 3 Posição Filogenética de Cracidae e Megapodiidae em relação aos Galliformes e Anseriformes 74 Cracidae e Megapodiidae são grupos-irmãos POSIÇÃO FILOGENÉTICA DE CRACIDAE E MEGAPODIIDAE EM RELAÇÃO AOS GALLIFORMES E ANSERIFORMES Abstract Phylogenetic relationships of major clades of birds thought to be basal in the avian tree have long been controversial, and one of the questions not clearly answered is the relationship between the Galliformes and Anseriformes. Previous molecular studies based on immunological distances and DNA-DNA hybridization data suggested the separation of the Cracidae and Megapodiidae from the Galliformes, as they are as genetically distant from them as from the Anseriformes. We used sequences from five mitochondrial genes (3119 bp) of Anseriformes and Galliformes to investigate their relationships and the position of the families Cracidae and Megapodiidae in the Galloanserae evolutionary scenario. Our results suggest that caution is advisable when drawing conclusions based on analysis of sequences from a single gene and when using methods of substitution that do not contain realistic assumptions about the evolutionary process of the sequences under study. Using longer sequences from multiple genes and the best-fitting GTR + Γ model of substitution we show that the Anseriformes and Galliformes are sister groups, and the Cracidae and Megapodiidae are not excluded from the Galliformes. The Megapodiidae is the sister group to the Cracidae in our analysis. We dated the time of divergence of Cracidae + Megapodiidae from other Galliformes at approximately 86 million years ago (Mya), and between the Cracidae and Megapodiidae at about 75 Mya. Resumo As relações filogenéticas entre os principais clados basais de Aves têm sido controversas, e uma das questões não resolvidas é a relação entre os Galliformes e Anseriformes. Estudos moleculares baseados em distâncias imunológicas e hibridação DNA-DNA sugeriram a separação de Cracidae e Megapodiidae dos Galliformes, porque estes dois táxons seriam tão distantes dos Galliformes quanto dos Anseriformes. No presente trabalho, usamos seqüências de cinco gene mitocondriais (3119 pares de bases) de representantes de Anseriformes e Galliformes para investigar a posição filogenética das famílias Cracidae e Megapodiidae no cenário evolutivo dos Galloanserae. Nossos 75 Cracidae e Megapodiidae são grupos-irmãos resultados baseados em seqüências de diferentes genes combinados em um único conjunto de dados e no uso do modelo de substituição GTR + Γ sugerem que os Anseriformes e Galliformes são grupos-irmãos, e que Cracidae e Megapodiidae não devem ser excluídos dos Galliformes. Megapodiidae é um grupo-irmão de Cracidae de acordo com nossos resultados. Datamos o tempo de divergência de Cracidae + Megapodiidae dos demais Galliformes em aproximadamente 86 Ma (milhões de anos atrás), e entre Cracidae e Megapodiidae em 75 Ma. Além disso, foi possível destacar que conclusões baseadas em um único gene devem ser aceitas com restrições e que o método de substituição de nucleotídeos que não contém premissas realísticas sobre o processo evolutivo das seqüências em estudo pode levar a conclusões errôneas. Introdução As relações filogenéticas entre os táxons na base da árvore das Aves têm sido amplamente debatida, e esquemas tradicionais de posicionamento taxonômico têm sido questionados com estudos recentes de DNA, os quais têm mostrado um grande acúmulo de caracteres para reconstrução de árvores filogenéticas (Sibley e Ahlquist, 1990; Harlid et al., 1998; Harlid e Arnason, 1999; Mindell et al., 1999). As principais questões envolvem as relações filogenéticas de grupos neoganatos como os Galliformes, os Anseriformes, e os Passeriformes, assim como também das aves paleognatas como as aves ratitas e os Tinamiformes. Para exemplificar algumas questões, seriam os Galliformes e os Anseriformes linhagens monofiléticas? Seriam eles mais relacionados as aves ratitas do que as outras aves neognatas? Teriam os Passeriformes divergido mais precocemente do que previamente se acreditava? Qual o posicionamento filogenético dos Tinamiformes? As relações entre os Anseriformes e os Galliformes têm sido particularmente problemáticas devido ao fato de diferentes conjuntos de dados forneceram diferentes conclusões (e.g. morfologia une Galliformes e Anseriformes (Cracraft e Mindell, 1989) enquanto o registro fóssil sugere proximidade entre os Anseriformes e os Charadriiformes (Olson e Feduccia, 1980)). Estudos moleculares também apresentaram resultados conflitantes. Hibridação DNA-DNA (Sibley e Ahlquist, 1990), distâncias imunológicas 76 Cracidae e Megapodiidae são grupos-irmãos de transferrina (Prager e Wilson, 1976), seqüências dos genes 12S e 16SrRNA (Hedges et al., 1995), αA- and αB-cristalino (Caspers et al., 1997), e do RAG-1 (Groth e Barrowclough, 1999) indicaram que os Anseriformes e Galliformes são grupos-irmãos. Outros estudos, como os realizados com fragmentos de restrição de DNA (Mindell e Honeycutt, 1989), seqüências de aminoácidos de ovomucóide (Laskowski e Fitch, 1989), seqüências de nucleotídeos de α- e β-hemoglobina (Czelusniak et al 1990), e de αAcrystallin (Stapel et al., 1984) sugeriram que os Anseriformes ou os Galliformes são mais relacionados com outras ordens de Aves do que entre si. Para auxiliar a resolver esta controvérsia, estimamos as relações filogenéticas dos Anseriformes e Galliformes, incluindo cracídeos e um megapodídeo, usando seqüências de cinco genes mitocondriais (12S e 16SrDNA, subunidades I, II e III da citocromo oxidase, e citocromo b). Nosso objetivo principal era determinar se Cracidae e Megapodiidae deveriam ser classificados como uma unidade taxonômica a parte dos outros Galliformes, como sugerido por Prager e Wilson (1976) a partir de distâncias imunológicas de proteínas, e por Sibley et al. (1988) de dados de hibridação DNA-DNA. Secundariamente, queríamos determinar o grupo externo mais apropriado para determinar as relações filognéticas entre os gêneros de Cracidae. Material e Métodos Seqüenciamos ambas as fitas dos genes ribossomais 12S e 16S rDNA, subunidades I (COI), II (COII) e III (COIII) da citocromo oxidase e citocromo b (cyt b) de Crax blumenbachii, Ortalis canicollis, Penelope obscura (Cracidae) e Megapodius reinwardt (Megapodiidae). Resumidamente, produtos de PCR dupla fita foram seqüenciados diretamente com kit de seqüenciamento Thermosequenase DYEnamic (Amersham) e marcados fluorescentemente com iniciadores universais do M13 (LICOR). As seqüências foram carregadas em gel de acordo com as especificações do fabricante (LI-COR) e a separação dos fragmentos se deu em seqüenciador automático bidirecional da LI-COR 4200. Adicionalmente, usamos seqüências disponíveis no GenBank de Gallus gallus e Aythya americana, representando os Galliformes e os 77 Cracidae e Megapodiidae são grupos-irmãos Anseriformes, respectivamente (Tab. 1). Seqüências de Rhea americana foram usadas para enraizar a árvore. Tabela 1. Seqüências usadas GenBank. Táxon 12S rDNA Rhea Y16884 Aythya AF090337 Crax AF165444 Ortalis AF165448 Penelope AF165450 Megapodius AF165441 Gallus X52392 neste trabalho e número de acesso correspondente no 16S rDNA Y16884 AF090337 AF165456 AF165460 AF165462 AF165453 X52392 COI Y16884 AF090337 AF165489 AF165496 AF165498 AF165489 X52392 COII Y16884 AF090337 AF165501 AF165504 AF165510 AF165501 X52392 Cyt b Y16884 AF090337 AF165465 AF165468 AF165474 AF165465 X52392 O alinhamento das seqüências foi realizado em programa ClustalW (Thompson et al., 1994), e visualmente refinado no programa ESEE (Cabot e Beckenbach, 1989) para excluir lacunas de alinhamento e corrigir áreas de alinhamento duvidoso. O alinhamento final consistiu de 633 pares de bases (pb) do 12S rDNA, 917 pb do 16S rDNA, 219 pb do COI, 684 pb do COII, e 999 pb do cyt b, totalizando 3452 pb. Análises filogenéticas As terceiras posições dos códons do cyt b se encontram saturadas de substituições entre estes grupos e foram excluídas da análise. Desta forma, a matriz analisada nas reconstruções filogenéticas continha 3119 pares de bases. A reconstrução da árvore de máxima parcimonia foi realizada usando busca exautiva no PAUP* 4.0 (Swofford., 1999) para cada gene separadamente e combinados em um único conjunto de dados. Transversões (TV) receberam peso de 5 para o 12S rDNA, 3 para o 16S rDNA, COI e cyt b, e 6 para o COII, baseado nas razões de transição/transversão (TS/TV) correspondentes estimadas para cada um destes genes. Análise de máxima verossimilhança também foi utilizada para o conjunto de dados combinados. As árvores foram obtidas por meio do algorítmo de decomposição de estrela ("star decomposition") no programa BASEML implementado no pacote PAML 2.0 (Yang, 1999). Os modelos evolutivos de JC69, F81, HKY85, TN93, e GTR de evolução de DNA foram utilizados, admitindo haver heterogeneidade de taxa de substituição entre os sítios. O parâmetro α da distribuição gama foi estimado no programa PUZZLE 4.0.2 (Strimmer e von Haeseler, 1999) (α=0.20 78 Cracidae e Megapodiidae são grupos-irmãos para todos os genes combinados). Testes de razão de verossimilhança (LRT) foram realizados para escolher o modelo evolutivo que melhor se adeque as seqüências em estudo. Cada gene foi analisado separadamente sob o critério de máxima verossimilhança de acordo com o melhor modelo evolutivo escolhido por meio dos LRT. Testando árvores alternativas Todas as possíveis quinze árvores enraizadas para Aythya (A), Gallus (G), Megapodius(M) , o grupo restrito ((Crax,Ortalis),Penelope)(C) usando Rhea(R) como grupo externo (Fig. 1) foram carregadas no PAUP 4.0, para testar as diferenças das árvores sob o critério de máxima parcimônia e máxima verossimilhança pelo teste de Kishino-Hasegawa. Também testamos se nossas seqüências evoluem de maneira constante (relógio molecular) usando a estatística 2ln(L1 – L2), onde L1 é a probabilidade da árvore com relógio molecular e L2 é a probabilidade da árvore sem o relógio. Resultados Distâncias médias não corrigidas entre Rhea e os outros táxons são 0,173; entre Aythya e os Galliformes, 0,172; entre Gallus e os outros Galliformes, 0,153; entre Megapodius e Cracidae 0, 149; e 0,085 entre os Cracidae. A busca exaustiva da árvore mais parcimoniosa usando pesos baseados na razão de transição/transversão do conjunto de dados combinado de 3119 pb (excluindo as terceiras posições dos códons do cyt b) resultou na árvore 3 (Fig. 1). Esta árvore tem Aythya como grupo-irmão de Galliformes, e Gallus como grupo-irmão de Megapodius e dos cracideos. Uma árvore similar foi obtida para o gene 12rDNA. Analisados separadamente por meio de busca exaustiva, os genes 16S, COI, COII e cyt b resultaram em árvores diferentes, cada uma sugerindo diferentes relações entre estes táxons: árvore 4 para cyt b, árvore 8 para COI, árvores 10 e 13 para COII, e árvore 12 para 16S rDNA. Sob o critério de parcimônia, apenas a árvore 12 obtida para o 16S rDNA é significativamente diferente da árvore mais parcimôniosa (árvore 3) obtida com o conjunto de dados combinados e com o 12S rDNA (Tab. 2). 79 Cracidae e Megapodiidae são grupos-irmãos #1 R #5 #3 R #4 R C A G C M G A G G M M A A C C #6 R #7 R #8 R C G M G G C G M M M C C A A A A R #13 R M R #9 #2 #10 R #11 R #12 R C A M A A C A M M G G G G M C C R #14 R #15 R A C A G G C M M M C A G Figura 1. Todas as possíveis árvores bifurcadas para Cracidae (C), Megapodiidae (M), outros Galliformes (G) e Anseriformes (A), tendo Rhea (R) como grupo externo. 80 Cracidae e Megapodiidae são grupos-irmãos Tabela 2. Resultados do teste de Kishino-Hasegawa para todas as possíveis árvores da figura 1 sob o critério de máxima parcimônia. Árvore Passos. dif d.p.(dif) t P IC IR CR 1 - (R(M(C(GA)))) 4281 97 38,89046 2,4942 0,0127* 0,765 0,384 0,294 2 - (R(C(M(GA)))) 4267 83 40,46376 2,0512 0,0403* 0,768 0,393 0,301 3 - (R(A(G(MC)))) 4184 MP 0,783 0,443 0,347 4 - (R(G(A(MC)))) 4190 6 31,18173 0,1924 0,8474 0,782 0,440 0,344 5 - (R(C(G(MA)))) 4253 69 43,75028 1,5771 0,1149 0,770 0,401 0,309 6 - (R(G(C(MA)))) 4190 6 31,18173 0,1924 0,8474 0,782 0,440 0,344 7 - (R(M(G(CA)))) 4283 99 40,94380 2,4179 0,0157* 0,765 0,383 0,293 8 - (R(G(M(CA)))) 4229 45 28,11769 1,6004 0,1096 0,774 0,416 0,322 9 - (R(C(A(GM)))) 4258 74 41,31333 1,7912 0,0734 0,769 0,398 0,306 10 - (R(A(C(GM)))) 4252 68 39,81238 1,7080 0,0877 0,770 0,402 0,309 11 - (R(M(A(GC)))) 4346 162 35,29852 4,5894 <0,0001* 0,754 0,344 0,259 12 - (R(A(M(GC)))) 4346 162 35,29852 4,5894 <0,0001* 0,754 0,344 0,259 13 - (R((AG)(CM)) 4229 45 28,11769 1,6004 0,1096 0,774 0,416 0,322 14 - (R((GC)(AM)) 4258 74 41,31333 1,7912 0,0734 0,769 0,398 0,306 15 - (R((AC)(GM)) 4252 68 39,81238 1,7080 0,0877 0,770 0,402 0,309 Letras indicam: R - Rhea, A - Aythya, G - Gallus, M - Megapodius, e C - o grupo restrito Cracidae. Passos.- número de passos MP - árvore mais parcimoniosa; dif –diferença com a árvore mais parcimoniosa; d.p. (dif) - desvio padrão da diferença; t - resultados do teste t ; P - probabilidade de obter um valor de t mais extremo sob a hipótese de igualdade entre as duas árvores a 5%; IC – índice de consistência; IR – índice de retenção: CR – índice de consistência reescalonado. Conforme esperado, os LRT mostraram que modelos de substituição de DNA com mais parâmetros resultaram em uma melhora da probabilidade da árvore quando comparados com modelos mais simples. O modelo geral de reversão-no-tempo (GRT, do inglês "general-time-reversible") foi o melhor modelo para o conjunto de dados combinados (Tab. 3), e foi utilizado posteriormente para cada gene separadamente. Pelo critério de máxima verossimilhança, genes individuais também resultaram em árvores diferentes. As seqüências do 16S rDNA e do COI resultaram na árvore 3, COII resultou em uma das duas árvores obtidas por máxima parcimônia (árvore 10); e cyt b resultou na árvore 12. O conjunto de dados combinado e o 12S rDNA resultaram na árvore 3. Tabela 3. Teste de Razão de Verossimilhança para modelos de evolução de DNA, admitindo heterogeneidade de taxa de substituição entre os sítios. Modelos (Lo x L1) -ln L0 -ln L1 g.l. -2log∆ JC69 x F81 13691.966464 13515.320999 353.29093* 3 F81 x HKY85 13515.320999 13020.252849 990.1363* 1 HKY85 x TN93 13020.252849 13001.84553 36.814638* 1 TN x GTR 13001.84553 12943.558024 116.575012* 3 L0 – modelo mais simples; L1 –modelo mais complexo; -ln – logarítimo da probabilidade da árvore; -2log∆ - diferença da probabilidade da árvore sob os modelos analisados; g.l. – graus de liberdade; * - significante a 5%. 81 Cracidae e Megapodiidae são grupos-irmãos As seqüências aqui utilizadas apresentaram taxa constante de substituição de nucleotídeos (P = 0.86), e o relógio molecular foi incorporado nas análises de verossimilhança. Desta forma, todas as árvores da figura 1 foram significativamente diferentes da árvore 3 ao nível de 5% (tab. 4). Tabela 4. Resultados do teste de Kishino-Hasegawa para todas as possíveis 15 árvores da figura 1, sob o critério de máxima verossimilhança com relógio molecular. Ärvore -ln L dif d.p.(dif) T P 1 - (R(M(C(GA)))) 10760.08264 32.48852 9.16802 3.5437 0.0004* 2 - (R(C(M(GA)))) 10760.08264 32.48852 9.16803 3.5437 0.0004* 3 - (R(A(G(MC)))) 10727.59412 ML 4 - (R(G(A(MC)))) 10745.73892 18.14480 7.29957 2.4857 0.0130* 5 - (R(C(G(MA)))) 10760.53000 32.93588 9.07861 3.6279 0.0003* 6 - (R(G(C(MA)))) 10745.73892 18.14480 7.29957 2.4857 0.0130* 7 - (R(M(G(CA)))) 10758.99785 31.40373 9.69611 3.2388 0.0012* 8 - (R(G(M(CA)))) 10746.28353 18.68941 6.90338 2.7073 0.0068* 9 - (R(C(A(GM)))) 10750.89306 23.29894 9.73239 2.3940 0.0167* 10 - (R(A(C(GM)))) 10755.43182 27.83770 9.89845 2.8123 0.0049* 11- (R(M(A(GC)))) 10760.08264 32.48852 9.16800 3.5437 0.0004* 12 - (R(A(M(GC)))) 10760.08264 32.48852 9.16800 3.5437 0.0004* 13 - (R((AG)(CM)) 10746.28353 18.68941 6.90338 2.7073 0.0068* 14 - (R((GC)(AM)) 10750.89306 23.29894 9.73239 2.3940 0.0167* 15 - (R((AC)(GM)) 10755.43182 27.83770 9.89845 2.8123 0.0049* Letras indicam: R - Rhea, A - Aythya, G - Gallus, M - Megapodius, e C - o grupo restrito Cracidae. ML - árvore mais verossímil; -ln L – logarítimo da probabilidade da árvore; dif– diferença com a árvore mais provável; d.p. (dif) - desvio padrão da diferença; T resultados do teste t; P(*) - probabilidade de obter um valor de t mais extremo sob a hipótese de igualdade entre as duas árvores a 5%. Discussão Nossas análises adicionam ao crescente corpo de evidências que filogenias de ramos mais profundos são difíceis de serem resolvidas sem a utilização de seqüências de um grande número de genes e sem a devida correção para variação de taxa entre os sítios (Takezaki e Gojobori, 1999). Tanto as análises de parcimônia como de verossimilhança mostraram que os cinco genes mitocondriais usados neste estudo resultaram em topologias diferentes para os Anseriformes e os Galliformes quando analisados separadamente. Se seqüências de um grande número de genes não estão disponíveis, as conclusões sobre as relações filogenéticas entre os táxons podem ser errôneas. Por exemplo, todos os genes analisados separadamente, exceto o 12S rDNA resultaram em topologias ótimas onde os Galliformes não são um grupo monofilético. 82 Cracidae e Megapodiidae são grupos-irmãos Nós concluímos que a árvore 3 (R(A(G(M,C)))) é a melhor estimativa das relações filogenéticas entre estes táxons (Fig. 2) baseados em duas linhas de evidências. Primeiro, combinar os genes aqui seqüenciados em um único conjunto de dados (Kluge, 1989; Hillis, 1987) é apropriado porque a molécula mitocondrial é herdada como um alelo único, sem recombinação significante. Conjuntos de dados maiores geralmente recuperam filogenias "conhecidas" melhor do que conjuntos menores (e.g. Cao et al., 1994; Cummings et al., 1995; Russo et al., 1996), embora o nosso conjunto combinado e o 12S rDNA resultaram na mesma topologia. Segundo, ambas as análises de máxima parcimônia e de máxima verossimilhança com correção apropriada para variação de taxa de substituição entre os sítios resultaram nessa mesma árvore ótima. As análises sugerem fortemente que os Anseriformes são grupo-irmão dos Galliformes, o qual inclui os megapodídeos e os cracídeos. Se os Galliformes deveriam ser divididos em duas unidades taxonômicas diferentes não está claro em nossas análises. Seqüências de outros Galliformes representando diferentes famílias deveriam ser incluídas em outras análises para testar se os Galliformes se dividem em duas linhagens, uma levando aos Cracidae e Megapodiidae (os Craciformes de Sibley e Ahlquist, 1990), e outra levando aos demais galliformes. Outra vantagem de empregar o modelo GTR com heterogeneidade de substituição de taxa entre os sítios é que os genes mitocondriais sob este modelo acumulam substituições de maneira constante na árvore ótima, e os nós internos podem ser datados. Admitindo que a divergência entre os Anseriformes e os Galliformes ocorreu há 112 Ma (Kumar e Hedges, 1998), podemos estimar o tempo de divergência dos táxons de Galliformes incluídos em nossa análise. A separação entre Gallus e (Cracidae, Megapodiidae) foi datada em 86,7±3,2 Ma atrás. Megapodidae e Cracidae divergiram há cerca de 75,5±3,2 Ma. A diversificação entre os gêneros de Cracidae iniciou ao redor de 30,9±1,6 Ma atrás. Estes resultados serão usados nos estudos filogenéticos das relações entre os gêneros de Cracidae (Capítulo 4) uma vez que indicam Megapodius e Gallus como grupos externos à Cracidae. 83 Cracidae e Megapodiidae são grupos-irmãos Crax Ortalis Penelope Megapodius Gallus Aythya 0.1 Rhea Figura 2. Árvore mais verossímil (Árvore número 3 da fig. 1) admitindo que as seqüências apresentam uma taxa constante de substituição e heterogeneidade de taxa de substituição entre os sítios obtida com o modelo GTR. Os desenhos não estão em escala, e foram modificados de del Hoyo et al., 1992, 1994, com permissão da Lynx Edicions, Barcelona. Barra corresponde à proporção esperada de substituição nucleotídica Referências Cabot EL, Beckenbach AT (1989). Simultaneous editing of multiple nucleic acid and protein sequences with ESEE. Comput. Appli. Biosci. 5: 233-234 Cao Y, Adachi J, Janke A, Pääbo S, Hasegawa M (1994). Phylogenetic relationships among Eutherian orders estimated from inferred sequences of mitochondrial proteins: instability of a tree based on a single gene. J. Mol. Evol. 39: 519-527. 84 Cracidae e Megapodiidae são grupos-irmãos Caspers G-J, Weerd DU, Wattel J, de Jong WW (1997). α-crystallin sequences support a Galliform/Anseriform clade. Mol. Phylogenet. Evol. 7: 185-188. Cracraft J, Mindell DP (1989). The early history of modern birds: a comparison of molecular and morphological evidence. In: "The Hierarchy of Life", B Fernholm, H Jornvall H (Eds). Elsevier, Amsterdam. pp 389-403. Cummings MP, Otto SP, Wakeley J (1995). Sampling properties of DNA sequence data in phylogenetic analysis. Mol. Biol. Evol. 12: 814-822 Czelusniak J, Goodman M, Moncrief ND, Kehoe SM (1990). Maximum parsimony approach to construction of evolutionary trees from aligned homologous sequences. Methods in Enzimology 183: 601-615. del Hoyo J, Elliott A, Sargatal J (Eds)(1992). "Handbook of the Birds of the World". Volume 1. Ostrich to Ducks. Lynx Edicions, Barcelona. del Hoyo J, Elliott A, Sargatal J (Eds)(1994). "Handbook of the Birds of the World". Volume 2. New World Vultures to Guineafowl. Lynx Edicions, Barcelona. Groth JG, Barrowclough GF (1999). Basal divergences in birds and the phylogenetic utility of the nuclear RAG-1 gene. Mol. Phylogenet. Evol. 12: 115-123. Harlid A, Arnason U (1999). Analyses of mitochondrial DNA nest ratite birds within the Neognathae: supporting a neotenous origin of ratite morphological characters. Proc. R. Soc. Lond. B266: 305-309. Harlid A, Janke A, Arnason U (1998). The complete mitochondrial genome of Rhea americana and early Avian divergences. J. Mol. Evol. 46: 669-679. Hedges SB, Simmons MD, van Dijk Mam, Caspers G-J, de Jong WW, Sibley CG (1995). Phylogenetic relationships of the hoatzin, an enigmatic South American bird. Proc. Natl. Acad, Sci USA 92: 11662-11665. Hillis DM (1987). Molecular versus morphological approaches to systematics. Ann. Rev. Ecol. Syst. 18: 23-42. Kluge AG (1989). A concern for evidence and a phylogenetic hypothesis of relationships among Epicrates (Boidae, Seprentes). Syst. Zool. 38: 7-25. Kumar S, Hedges B (1998). A molecular timescale for vertebrate evolution. Nature 392: 917920. Laskowski M Jr, Fitch WM (1989). Evolution of avian ovomucoid in birds. In: "The Hierarchy of Life", B Fernholm, H Jornvall H (Eds.). Elsevier, Amsterdam. pp 371-387. 85 Cracidae e Megapodiidae são grupos-irmãos Mindell DP, Honeycutt RL (1989). Variability in transcribed regions of ribosomal DNA and early divergence in birds. Auk 106: 539-548. Mindell,D.P., Sorenson,M.S., Dimcheff DE, Hasegawa M, Ast JC, Yuri T (1999). Interordinal relationships of birds and other reptiles based on whole mitochondrial genomes. Syst. Biol. 48: 138-152. Olson SL, Feduccia A (1980). Presbyornis and the origin of the Anseriformes (Aves: Charadriomorphae). Smithsonian Contrib. Zool. 323: 1-24 Prager EM, Wilson AC (1976). Congruency of phylogenies derived from different proteins. A molecular analysis of the phylogenetic position of cracid birds. J. Mol. Evol. 9: 45-57. Russo CAM, Takezaki N, Nei M (1996). Efficiencies of different genes and different treebuilding methods in recovering a known vertebrate phylogeny. Mol. Biol. Evol. 13: 525-536. Sibley CG, Ahlquist JE, Monroe BL (1988). A classification of the living birds of the world based on DNA-DNA hybridization studies. Auk 105: 409-423. Sibley CG, Ahlquist JE (1990). "Phylogeny and Classification of Birds. A study in molecular evolution". Yale University Press. New Haven. Stapel SO, Leunissen JAM, Versteeg M, Wattel J, de Jong WW (1984). Ratite as oldest offshot of avian stem – evidence from α-crystallin sequences. Nature 311: 257-259. Strimmer K, von Haeseler A (1999). PUZZLE. Version 4.0.2. Ludwig-Maximilians-Universität. München. Program distributed by the authors. Swofford DL (1999). PAUP*, Phylogenetic Analysis using Parsimony (*and other Methods). Version 4.0. Sinauer Associates. Sunderland, Massachusetts. Takezaki N, Gojobori T (1999). Correct and incorrect vertebrate phylogenies obtained by the entire mitochondrial DNA sequences. Mol. Biol. Evol. 16: 590-601. Thompson JD, Higgins DG, Gibson TJ (1994). CLUSTALW: improving the sensitivity of progressive alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acid. Res. 22: 4673-4680. Yang Z (1999). Phylogenetic analysis by Maximum Likelihood (PAML). Version 2.0. University of College London. Program distributed by the author. 86 Capítulo 4 Filogenia Molecular de Cracidae (Aves) 87 Filogenia molecular de Cracidae FILOGENIA MOLECULAR DE CRACIDAE (AVES) Abstract The Cracidae are one of the most endangered bird families in the Neotropics, yet the higher relationships among taxa remain uncertain. Here the molecular phylogeny of its eleven genera is inferred using 4,519 base pairs of mitochondrial genes (12S rRNA, 16S rRNA, COI, COII, COIII, and cyt b). Maximum parsimony and maximum likelihood reconstructions yielded similar results. Our estimates show the separation of two groups: one consisting of the guans and chachalacas (subfamily Penelopinae), and the other, the curassow genera (Cracinae). Rate constancy of DNA substitution among taxa was not rejected, and we dated the divergence time among the Cracidae genera, using as reference the separation between the outgroup Megapodius and Cracidae as 75.5 Mya (million years ago). Divergence time among the ancestors of the modern genera occurred in the last 33 Mya. Geomorphological changes that occurred in South America, changes in the sea level during the Miocene, glaciation in the Andes during the Pliocene, and the diversification of angiosperm families in the last 15 Mya seems to be related to genera divergence. Resumo A família Cracidae é uma das mais ameaçadas entre as aves da região Neotropical, cujas relações taxonômicas ainda são incertas. Aqui, a filogenia molecular de seus onze gêneros é inferida usando 4.519 pares de bases de genes mitocondriais (12S rRNA, 16S rRNA, COI, COII, COIII, e cyt b). Reconstruções sob os critérios de máxima parcimônia e máxima verossimilhança produziram resultados similares. Nossas estimativas mostram a separação de dois grupos: um contendo os jacus e aracuãs (subfamília Penelopinae), e o outro, os gêneros de mutuns (Cracinae). A hipótese de constância de taxa de substituição de DNA não foi rejeitada e datamos o tempo de divergência entre os gêneros de Cracidae, usando como referência a separação entre Megapodius e Cracidae há 75,5 milhões de anos atrás. O início da diversificação entre os gêneros ocorreu nos últimos 33 milhões de anos. Mudanças geomorfológicas que ocorreram na América do Sul, mudanças no nível 88 Filogenia molecular de Cracidae do mar durante o Mioceno, glaciação nos Andes durante o Plioceno e a diversificação de famílias de angiospermas nos últimos 15 milhões de anos podem estar relacionados com a divergência dos gêneros de Cracidae. Introdução A família Cracidae é composta de aves não migratórias e arbóreas que se alimentam basicamente de folhas e frutas e ocasionalmente de moluscos e insetos. A atual distribuição desta família inclui as florestas tropicais e áreas de florestas secas do sul do Texas ao norte da Argentina e Uruguai. Estas aves ocupam terras de elevada e baixa altitude. Espécies congenéricas geralmente apresentam distribuição alopátrica, excluíndo ou ocupando o nicho de outros congenéricos. Contudo, quando as espécies de cracídeos ocorrem em simpatria, eles ocupam microhabitats diferentes dentro de uma área geográfica maior (Sick, 1993). Cerca de 50 espécies e mais do que 60 subespécies são atualmente designadas entre os onze gêneros da família (del Hoyo et al., 1994; Nardelli, 1993). Os gêneros podem ser divididos em três subgrupos morfológicos: jacus (Aburria, Chamaepetes, Oreophasis, Penelope, Penelopina, e Pipile), aracuãs (Ortalis) e mutuns (Crax, Mitu, Nothocrax, e Pauxi). Um grande número de espécies de cracídeos estão listados no Livro Vermelho de Espécies Ameaçadas (Collar et al., 1992), fazendo com que esta família seja uma das mais ameaçadas da região Neotropical. As relações entre estes táxons e o status de várias espécies e subespécies questionáveis nunca foram estabelecidos com análises filogenéticas rigorosas, embora Delacour e Amadon (1973) sugerem que os mutuns tenham divergido dos demais cracídeos, e que os aracuãs eram mais proximamente relacionados aos jacus. Logo após, novos gêneros foram propostos para os mutuns (Crax foi subdividido em Crax, Mitu, e Pauxi) e os jacus (Aburria dividido em Aburria e Pipile). Sibley e Ahlquist (1990) examinaram cinco dos onze gêneros de Cracidae em seus estudos de filogenia baseados em dados de hibridação DNA-DNA, e sugeriram que Crax e Ortalis eram grupo-irmão dos jacus, e Chamaepetes era grupo-irmão do clado contendo Penelope e Pipile. 89 Filogenia molecular de Cracidae Incertezas similares ocorrem também na biogeografia dos cracídeos. Baseados na atual distribuição das espécies, Darlington (1957) propôs que eles já estavam presentes na América do Sul antes da formação da América Central ligando-a à América do Norte, e que eles sofreram eventos múltiplos de dispersão e diferenciação. Alternativamente, Delacour e Amadon (1973) sugeriram que eles se originaram na Amércia do Norte ou Central, e sua diversificação aumentou quando eles invadiram a América do Sul. Para esclarecer a sistemática dos cracídeos e testar hipóteses biogeográficas alternativas, reconstruímos a filogenia molecular dos 11 gêneros de Cracidae baseados em seqüências de DNA mitocondrial. Também utilizamos um relógio molecular para estimar a data aproximada de divergência entre os gêneros, e procuramos correlacionar a diversificação dos cracídeos com eventos da história da terra que poderiam ter fragmentado a distribuição das espécies ou promovido a diversificação de nicho (veja por exemplo, Arnaiz-Villena et al., 1999; Knowlton & Weigt, 1998; van Tuinen et al., 1998). Material e Métodos Táxons amostrados Um representante de cada um dos 11 gêneros da família Cracidae foi utilizado para as análises filogenéticas. Resultados de estudos anteriores usando diferentes combinações de um a quatro grupos externos (Anas, Cairina, Gallus, Megapodius, Rhea e Sthruthio) mostraram que independentemente da combinação de grupos externos as relações intergenéricas dos Cracidae se mantiveram as mesmas. Portanto, neste estudo apenas o megapodídeos Megapodius reinwardt foi usado como um grupo externo para enraizar a árvore baseado em sua maior proximidade aos cracídeos (Capítulo 3). Uma lista dos táxons estudados e a atual distribuição dos gêneros é apresentada na tabela 1. Extração, amplificação e seqüenciamento de DNA DNA genômico foi extraído de amostras de sangue de acordo o método descrito em detalhes por Bruford et al. (1992). As seqüências de cada um dos seis genes mitocondriais foram amplificados por PCR em 25,0 ul de reação de acordo com Hagelberg (1994), usando 30 ciclos de 95oC por 30 segundos, 47oC por 30 segundos e 90 Filogenia molecular de Cracidae 72oC por 30 segundos. Os oligonucleotídeos iniciadores ("primers") usados na amplificação possuem uma cauda do M13 de modo que os produtos podem ser seqüenciados com os dois primers universais do M13 (Tab. 2). Os produtos de PCR foram separados em gel de agarose 1% em tampão TA 1x. Tabela 1. Espécies usadas neste trabalho e a atual distribuição dos gêneros de Cracidae que elas representam. Grupo Espécie Distribuição do gênero* Jacus Aburria aburri Andes colombianos, Equador, Peru ,Venezuela Chamaepetes goudotti Florestas de montanhas da América Central, Colômbia, Peru Oreophasis derbianus Florestas de montanhas do México e da Guatemala Penelope obscura Florestas de montanhas e baixa altitude das Américas Central e do Sul, México Penelopina nigra Florestas úmidas de montanhas da América Central, México Pipile jacutinga Florestas de baixa altitude da América do Sul Aracuãs Ortalis cannicolis Áreas secas das Américas do Sul, Central e do Norte Mutuns Crax blumenbachii Florestas de montanhas das Américas do Sul e Central, savanas sulamericanas Mitu tuberosa Floresta tropical no norte da América do Sul Nothocrax urumutum Alto e Médio Rio Amazonas Pauxi pauxi Florestas de altitude elevada da Bolívia, Colômbia, Peru, Venezuela Megapodiidae Megapodius reinwardt Áreas arbustivas e florestas tropicais da Austrália Número de acesso no GenBank: 12SrDNA: AF165441-AF165452; 16SrDNA: AF165453-AF165464; COI: AF165489-AF165500; COII: AF165501-AF165512; COIII: AF165477-AF165488; cyt b: AF165465AF165476. * - Distribuição do gêneros baseada em Delacour e Amadon, 1973 e Nardelli 1993. As reações de seqüenciamento foram realizadas usando o "kit" de seqüenciamento "Thermosequenase DYEnamic direct cycle sequencing" (Amersham), e marcadas fluorescentemente com os primers universais M13 (LI-COR). As seqüências foram carregadas no seqüenciador automático bidirecional LI-COR 4200 usando o protocolo sugerido pelo fabricante. As seqüências foram montadas no programa ESEE (Cabot & Beckenbach, 1989). Os alinhamentos foram realizados no ClustalW (Thompson et al., 1994), e verificados visualmente para correção de eventual alinhamento espúrio usando o ESEE. A autenticidade das seqüências foram averiguadas pelo algoritmo BLAST do GenBank. As seqüências gênicas obtidas foram do 12S rDNA (649 nucleotídeos (nt)), 16S rDNA (946 nt), subunidades I, II, e III da citocromo c oxidase, COI (1088 nt), COII (684 nt), COIII (484 nt), e citocromo b (1002 nt). As terceiras posições dos codons para o cyt b foram excluídas da análise por se encontrarem saturadas entre os Cracídeos e o 91 Filogenia molecular de Cracidae grupo externo, resultando em 668 nt analisados para este gene. Todas as seqüências produzidas neste trabalho foram depositadas no GenBank (Tab. 1). Tabela 2. Primers usados para a amplificação (5’ → 3’). A posição se refere ao genoma mitocondrial de Gallus gallus (número de acesso no GenBank X52392, Desjardins e Moraes, 1990). Os primers foram desenhados por O. Haddrath, do Royal Ontario Museum, Canadá. Gene Primer Posição Seqüência 12SrRNA L1537 1534-1555 AAT CTT GTG CCA GCC ACC GCG G 12SEND 2241-2263 GTG CAC CTT CCG GTA CAC TTA CC 16SrRNA 16SAR 2699-2726 AAG CCW ANC GAG CYG GGT GAT AGC TGG 16SBR 3811-3831 CAT AGA TAG AAA CCG ACC TGG COI COIA 6675-6695 AAC YAA CCA CAA AGA CAT TGG H8205 8184-8205 GGG GTT CGA TTC CTT CCT TTC TTG COII L8184 8184-8205 CAA GAA AGG AAG GAA TCG AAC C LYSH 9041-9058 TCT CTA GCT TAA AAG GCT COIII A5REVTF 9914-9936 AAA YAT YTA ATG GCA CAC CAA GC GLYHTR 10707-10729 GTA ATN ANT ATA CTA GAA GAG C Cyt b B1 14965-14990 CCA TCC AAC ATC TCA GGA TGA TGA AA B6 16065-16089 GTC TTC AGT TTT GGT TTA CAA GAC Análises filogenéticas Análises de máxima parcimônia foram realizadas no PAUP* 4.0 (Swofford, 1999). Realizamos uma busca exaustiva assumindo pesos para as transversões de acordo com razão de transição/transversão estimada para cada gene. Índices de decaimento (Bremer, 1988) foram obtidos usando AutoDecay 4.0 (Eriksson, 1998) para estimar o número de passos extras necessários para perder uma associação específica de táxons. Para assegurar que o modelo mais apropriado de evolução de DNA foi usado na análise de máxima verossimilhança, usamos o programa MODELTEST 2.0 (Posada e Crandall, 1998) para obter a verossimilhança perante 40 modelos de evolução, incorporando parâmetros como frequência de bases, taxas de transição entre purinas e entre pirimidinas, taxas de transversão, proporção de sítios invariáveis, e variação de taxa de substituição entre sítios. A variação de taxas de substituição entre os sítios foi considerada de três maneiras diferentes: (1) uma proporção de sítios foi considerado invariáveis, I, e assumiu-se que os sítios variáveis evoluem a uma mesma taxa; (2) todos os sítios evoluem de acordo com uma distribuição gama discreta, Γ; e (3) o mesmo que em (1) mas os sítios variáveis evoluem de acordo com Γ. A análise de máxima verossimilhança foi realizada no PAUP* usando o melhor modelo escolhido pelo teste de 92 Filogenia molecular de Cracidae razão de verossimilhança (LRTs), que penaliza modelos com parâmetros extras desnecessários (Posada & Crandall, 1998). As diferenças entre as árvores mais parcimoniosa e mais verossímil foram avaliadas de acordo com os testes de Kishino-Hasegawa (K-H)(Kishino e Hasegawa, 1989) implementado no PAUP*. A hipótese do relógio molecular entre os cracídeos não foi rejeitada ao nível de sugnificância de 5% (Z=0,38) de acordo com os resultados obtidos no PHYLTEST 2.0 (Kumar, 1996). Um estudo prévio mostrou taxa constante de substituição entre os cracídeos, e o tempo de divergência entre Megapodius e Cracidae foi datado há 75,5 Ma (milhões de anos)(Capítulo 3). Usamos esta estimativa como calibração para o relógio molecular (Zuckerkandl & Pauling, 1962, 1965) entre os gêneros de Cracidae e o grupo externo. Os tempos de divergência foram estimados de acordo com: t= la × T lMegapodius − Cracidae , onde t é o tempo de divergência a ser estimado, la é o comprimento dos ramos levando aos táxons terminais ou a um nó interno, T é o tempo de calibração, e lMegapodius-Cracidae é o comprimento dos ramos entre Megapodius e Cracidae. Resultados Um total de 4.519 nucleotídeos foram seqüenciados para seis genes e usados para a reconstrução filogenética, representando 28,9% do genoma mitocondrial de aves (baseado em Gallus gallus). Destes sítios, 24,5% eram variáveis e 11,6% eram parcimoniosamente informativos. A razão transição/transversão estimada a partir dos dados combinados de todos os genes foi de 8,9. A composição de bases é estacionária entre os táxons, e a frequência de bases para A, C, G e T estimada dos dados foi de 28,4%, 29,9%, 17,3%, 24,4% respectivamente, similar à de outras espécies de vertebrados. A divergência média não corrigida das seqüências foi de 11,1% entre os Cracidae e 31,3% entre Cracidae-Megapodius. A árvore obtida sob busca exaustiva (Fig. 1) apresentou 6.159 passos. Oreophasis é basal na árvore e parece ser grupo-irmão dos outros jacus e dos mutuns, indicando que 93 Filogenia molecular de Cracidae os jacus são parafiléticos. Os mutuns e os demais cinco gêneros de jacus são grupos monofiléticos. Estes clados têm alto suporte como indicam os índices de Bremer. Os aracuãs representados aqui por Ortalis parecem ser basais aos mutuns, mas esta relação apresentou índice de decaimento relativamente baixo (12). Entre os jacus, Aburria e Pipile são mais relacionados entre si e têm Penelope como grupo-irmão, seguido por Chamaepetes e Penelopina. Entre os mutuns, Pauxi é grupo-irmão de (Crax, Nothocrax) e Mitu é o mais basal deles. Os índices de decaimento obtidos para as divergências entre os mutuns são relativamente baixos. Aburria 100/100 95 100/97 Pipile 52 60/64 Penelope 10 100/100 Chamaepetes 111 Penelopina Crax 0/61 19 100/100 74/67 Nothocrax 23 9 100/100 Pauxi 142 100/100 0/0 12 Mitu Ortalis Oreophasis Megapodius Figura 1. Reconstrução filogenética da família Cracidae estimada por máxima parcimônia usando busca exaustiva. Números acima dos ramos são valores de bootstrap sem e com pesos para TS eTV; números abaixo dos ramos são índices de decaimento. As aves não estão em escala, e foram modificadas do original de Hoyo et al., 1994, com permissão da Lynx Edicions, Barcelona. 94 Filogenia molecular de Cracidae Aburria Pipile Penelope Chamaepetes Penelopina Ortalis Oreophasis Crax Nothocrax Pauxi Mitu 0.1 Megapodius Figura 2. Reconstrução filogenética dos gêneros de Cracidae, usando seis genes mitocondriais. A Árvore de máxima verossimilhança foi obtida no PAUP* usando o modelo GTR+Ι+Γ. Grupo externo: Megapodius. A barra corresponde a unidades de comprimento de ramo. As aves não estão em escala, e foram modificadas do original de Hoyo et al., 1994, com permissão da Lynx Edicions, Barcelona. Testes de razão de verossimilhança (LRT) mostraram que o melhor modelo para nossas seqüências foi o modelo de reversão geral ao longo do tempo (GTR), assumindo uma proporção de sítios invariáveis (I) e heterogeneidade de taxa de substituição entre os sítios variáveis (Γ) (P<0.000001). A figura 2 mostra as relações entre os Cracidae de acordo com o obtido nas análises de máxima verossimilhança sob o modelo GTR+I+Γ, assumindo que as seqüências acumulam substituições de acordo com um relógio evolutivo. Como na árvore de máxima parcimônia, os mutuns formam um grupo 95 Filogenia molecular de Cracidae monofilético distinto, mas na árvore de máxima verossimilhança eles são grupo-irmão dos jacus e dos aracuãs (Ortalis). Os jacus parecem ser novamente parafiléticos. Uma grande diferença entre estas duas árvores envolve a posição de Oreophasis. As relações entre os gêneros de mutuns e entre os gêneros de jacus (excluindo Oreophasis) são as mesmas em ambas as árvores. Baseados em calibrações prévias que dataram a divergência Megapodius-Cracidae em aproximadamente 75 Ma atrás, a diversificação dos gêneros de mutuns dos demais táxons deve ter ocorrido há 33Ma. Jacus e aracuãs se diversificaram entre 21 e 3 Ma atrás, e os gêneros de mutuns ao redor de 8 a 6 Ma atrás. Discussão Reconstrução filogenética de Cracidae Os genes usados no presente estudo correspondem a diferentes porções da molécula de DNA mitocondrial, representando uma boa amostragem deste genoma. Conjuntos de dados maiores tendem a fornecer estimativas mais fiéis quando comparados com conjuntos de dados menores como por exemplo a obtida por um único gene (Cao et al., 1994; Cummings et al., 1995; Russo et al., 1996). Os resultados do teste de K-H mostraram que a árvore mais curta obtida pela busca exaustiva é a melhor, embora não seja significativamente diferente da árvore de máxima verossimilhança (Tab. 3). Contudo, consideramos nossa árvore de verossimilhança a melhor estimativa das relações entre os Cracidae por diversas razões: (1) o método de verossimilhança é menos susceptível do que a parcimônia as conseqüências das violações das premissas do modelo evolutivo; (2) os índices de decaimento para a linhagem levando a Ortalis é baixo na análise de parcimônia; (3) a análise de verossimilhança mostrou que a divisão inicial entre os Cracidae separa os mutuns em um clado e os jacus e aracuãs em outros. Isto está de acordo com Delacour & Amadon (1973)(Fig. 3), que distinguiram estes dois grupos como as subfamílias Cracinae e Penelopinae. O primeiro clado é formado pelos cracídeos maiores e mais pesados; o último, pelos pequenos e esguios aracuãs e pelos jacus de tamanhos médio a grandes (Delacour & Amadon, 1973); (4) Oreophasis pertence à subfamília Penelopinae, é esta 96 Filogenia molecular de Cracidae proximamente relacionado aos jacus em morfologia corporal, e vivem em florestas de elevada altitude, como os outros jacus. Esta subfamília não se comporta como um grupo monofilético na análise de parcimônia; (5) e as seqüências parecem evoluir de maneira a aceitar um relógio molecular, então os comprimentos dos ramos podem ser usados para estimar o tempo de divergência entre os táxons analisados. Tabela 3. Resultados dos testes de Kishino-Hasegawa para comparação entre as árvores de máxima parcimônia (MP) e máxima verossimilhança (ML) de nossas estimativas das relações filogenéticas entre os Cracidae. MP ML Comprimento 6159 6210 Diferença do comprimento (melhor) 51 s.d. t P 37.639 1.35 0.17 -ln L Diferença –ln L s.d. T P* 34387.49346 (melhor) 34391.42058 3.92712 5.14556 0.7632 0.4454 -ln L: logaritmo da árvore; s.d. desvio padrão; t - resultados do teste t ; P - probabilidade de obter um valor de t mais extremo sob a hipótese de igualdade entre as duas árvores a 5% MP ML Nossas estimativas das relações entre os jacus e aracuãs obtidas por verossimilhança são similares as de Delacour e Amadon (1973)(Fig. 3), exceto que Penelope se comportou como clado-irmão a Aburria e Pipile em nossas análises, ao invés de Penelopina como grupo-irmão de (Aburria, Chamaepetes). Embora Sibley & Ahlquist (1990) usaram apenas cinco dos 11 gêneros de Cracidae, nossas estimativas são muito semelhantes as deles: Crax e Ortalis são grupo-irmão do clado (Chamaepetes, (Penelope, Pipile)). Tempo de divergência entre os gêneros de Cracidae Os resultados do presente estudo são compatíveis com a diversificação dos gêneros modernos de Cracidae ocorrendo nos últimos 33 Ma (Tab. 4), com a separação das subfamílias Cracinae e Penelopinae, 42 milhões de anos após a família ter aparecido no cenário evolutivo das Aves. Um padrão semelhante de longa lacuna evolutiva entre a origem de uma linhagem e a divergência de seus gêneros modernos também foi observada em psitacídeos Neotropical (Miyaki et al., 1998) e beija-flores (Bleiweiss, 1998a, 1998b), mas não em tucanos e aves relacionadas (Nahum et al., submetido). A maioria dos 97 Filogenia molecular de Cracidae gêneros de cracídeos vivem em florestas montanhosas e de alta altitude (Delacour & Amadon, 1973). A formação da Cordilheira dos Andes na América do Sul durante o Terciário (Clapperton, 1993, Salgado-Labouriau, 1994) pode ter influenciado a diversificação dos gêneros de Cracidae. Aburria Chamaepetes Penelopina Penelope Ortalis Oreophasis Nothocrax Crax Figura 3. Relações entre Cracidae, como descrito por Delacour e Amadon (1973). Note que para estes autores, Aburria incluia Aburria e Pipile, e Crax incluia Crax, Mitu e Pauxi. A primeira divergência entre os Cracidae levou ao gênero moderno Oreophasis, uma ave que vive em altas altitudes, foi datada há cerca de 21,5 Ma. O clado levando a 98 Filogenia molecular de Cracidae Ortalis, o único gênero de cracídeos ocorrendo em áreas mais secas, foi o próximo a divergir, 20,7 Ma atrás. Regressões e transgressões marinhas durante o Oligocene, junto com o levantamento dos Andes mudaram as bacias dos rios e o clima do continente (Petri e Fúlfaro, 1988; Salgado-Labouriau, 1994), provavelmente resultando na formação das florestas de altitude e florestas de áreas secas. A diversificação daqueles clados pode ter sido influenciado por estes eventos. No Mioceno Médio, há cerca de 13 Ma, o ancestral do gênero Penelopina se separou da linhagem dos demais jacus e atualmente é encontrada na Cordilheira dos Andes. No limite entre o Mioceno Médio e Superior, o clado levando a Chamaepetes surgiu há 11,6 Ma. Estas datas são coincidentes com o soerguimento de cadeias montanhosas ao longo da costas oeste das Américas do Norte e do Sul, assim como o aparecimento das ilhas que levariam à formação da América Central, e o surgimento de novas famílias de angiospermas (Brown e Lomolino, 1998; Salgado-Labouriau, 1994). Os Cracidae se alimentam basicamente de frutas e folhas, e a diversificação das angiospermas poderia ter sido relevante para a diversificação destas aves. Novos indícios de diversificação de famílias de angiospermas existem para Mioceno Superior. A floresta Atlântica ao longo da costa leste da América do Sul tornouse isolada da Floresta Amazônica com a aridificação da região central da América do Sul, resultando na formação da savana (cerrado) brasileira (Petri e Fúlfaro, 1988). Este cenário parece ser plausível para a diversificação dos gêneros de mutuns: Mitu há 8,3 Ma, Pauxi há 7,1 Ma, e Crax e Nothocrax há 6,6 Ma, aproximadamente. Estes gêneros poderiam ter se tornado isolados em diferentes ecossistemas durante este período. Regressões marinhas também são bem caracterizadas em sedimentos do Mioceno Superior no norte e sul do Brasil (Petri e Fúlfaro, 1988) e podem ter sido responsáveis por mudanças de habitat e de clima, influenciando assim a diversificação dos mutuns. Datamos as divergências mais recentes entre os Cracidae para os ancestrais de Aburria, um gênero monoespecífico dos Andes, e Pipile, um gênero de baixa altitude, há cerca de 3,0 Ma, no Plioceno. Intensas atividades vulcânicas e glaciações que ocorreram nos Andes no final do Pliocene e no Pleistocene (Clapperton, 1993) poderiam ter influenciado os ancestrais de Pipile a abandonar as terras de altitude elevada hoje 99 Filogenia molecular de Cracidae ocupadas por Aburria e colonizar as terras de baixa altitude na América do Sul em busca de hábitats mais favoráveis. Tabela 4. Estimativas do tempo de divergência em milhões de anos (±desvio padrão) de cada linhagem levando aos modernos gêneros de Cracidae. Clado levando ao gênero moderno Tempo Geológico Eventos supostamente relacionados à Data±s,d, diversificação Mutuns x jacus Oligoceno Elevação dos Andes e mudanças nas 33,65±3,63 Inferior bacias dos rios e no clima; transgressão marinha Oreophasis x Ortalis e outros jacus 21,55±2,95 Mioceno Inferior Elevação dos Andes e mudanças nas bacias dos rios e no clima; transgressão marinha Ortalis x (Penelopina, Mioceno Inferior Elevação dos Andes e mudanças nas 20,74±2,42 (Chamaepetes, (Penelope, bacias dos rios e no clima; (Aburria, Pipile)))) transgressão marinha Mioceno Médio Novas famílias de angiospermas; Penelopina x (Chamaepetes, 13,09±1,84 soerguimento do oeste das Américas (Penelope, (Aburria, Pipile))) do Norte e do Sul, início da formação da Amércia Central Mioceno Novas famílias de angiospermas; Chamaepetes x (Penelope, 11,67±1,32 Médio/Superior soerguimento do oeste das Américas (Aburria, Pipile)) do Norte e do Sul, início da formação da Amércia Central Mitu x outros mutuns Mioceno Superior Diversificação de novas famílias de 8,38±0,97 angiospermas; isolamento da floresta Atlântica e aridificação da região central da América do Sul; transgressões marinhas Penelope x (Aburria, Pipile) Mioceno Superior Diversificação de novas famílias de 7,58±0,82 angiospermas; isolamento da floresta Atlântica e aridificação da região central da América do Sul; transgressões marinhas Pauxi x (Crax, Nothocrax) Mioceno Superior Diversificação de novas famílias de 7,10±0,53 angiospermas; isolamento da floresta Atlântica e aridificação da região central da América do Sul; transgressões marinhas Crax x Nothocrax Mioceno Superior Diversificação de novas famílias de 6,60±0,27 angiospermas; isolamento da floresta Atlântica e aridificação da região central da América do Sul; transgressões marinhas Aburria x Pipile Plioceno Intensas atividades vulcânicas e 3,04±0,34 glaciação nos Andes 100 Filogenia molecular de Cracidae Origem da família Cracidae Nossos dados são compatíveis com ambas as propostas teóricas de origem dos Cracidae, formulada por Darlington (1957) e por Delacour & Amadon (1973), Para compreender a origem da família Cracidae, um estudo biogeográfico-filogenético incluindo outros Galliformes atuais deve ser feito, Mais estudos filogenéticos de mutuns e aracuãs podem auxiliar a compreender a origem e evolução dos Cracinae e dos Penelopinae, Referências Arnaiz-Villena A, Álvarez-Tejado M, Ruíz-del-Valle V, García-de-la-Torre C, Varela P, Recio MJ, Ferre S, Martinez-Laso J (1999), Rapid radiation of Canaries (genus Serinus), Mol, Biol, Evol, 16: 2-11, Bleiweiss R (1998a), Origin of hummingbird faunas, Biological Journal of the Linnean Society 65: 77-97, Bleiweiss R (1998b), Tempo and mode of hummingbird evolution, Biological Journal of the Linnean Society 65: 63-76, Bremer K (1988), The limits of aminoacid sequence data in angiosperm phylogenetic reconstruction, Evolution 42: 795-803, Brown JH, Lomolino MV (1998), “Biogeography,” 2nd Edition, Sinauer Associates, Massachusetts, Bruford MW, Hanotte O, Brookfield JFY, Burke T (1992), Single-locus and multilocus DNA fingerprinting, In: “Molecular Genetic Analysis Of Populations - A Practical Approach,” AR Hoelzel (Ed,), Oxford University Press, New York, pp, 225-269, Cabot EL, Beckenbach AT (1989), Simultaneous editing of multiple nucleic acid and protein sequences with ESEE, Comput, Appli, Biosci, 5: 233-234 Cao Y, Adachi J, Janke A, Pääbo S, Hasegawa M (1994), Phylogenetic relationships among eutherian orders estimated from inferred sequences of mitochondrial proteins: instability of a tree based on a single gene, J, Mol, Evol, 39: 519-527, Clapperton C, (1993), “Quaternary Geology and Geomorphology of South America”, Elsevier, Amsterdam, 101 Filogenia molecular de Cracidae Collar NJ, Gonzaga LP, Krabbe N, Madroño Nieto A, Naranjo LG, Parker III TA, Wege DC (1992), “Threatened birds of the Americas, The ICBP/IUCN Red Data Book,” Third Edition, part 2, Smithsonian Institution Press, Washington, Cummings MP, Otto SP, Wakeley J (1995), Sampling properties of DNA sequence data in phylogenetic analysis, Mol, Biol, Evol, 12: 814-822, Darlington PJ, Jr (1957) “Zoogeography: The Geographical Distribution of Animals,” John Wiley & Sons, Inc, New York, Delacour J, Amadon D (1973), “Curassows and Related Birds,” The American Museum of Natural History, New York, NY, del Hoyo J, Elliott A, Sargatal J (eds)(1994), “Handbook of the Birds of the World,” Volume 2, New World Vultures to Guineafowl, Lynx Edicions, Barcelona, Desjardins P, Morais R (1990), Sequence and gene organization of the chicken mitochondrial genome, A novel gene order in higher vertebrates, J, Mol, Biol, 212: 599-634, Eriksson T (1998) AutoDecay, Version 4,0, (Program distributed by the author) Department of Botany, Stockolm University, Stockolm, Sweeden, Hagelberg E (1994), Mitochondrial DNA from ancient bones, In: “Ancient DNA,” B Herrmann, S Hummel (Eds), Springer-Verlag, pp, 195-204, Kishino H, Hasegawa M (1989), Evaluation of the maximum likelihood estimate of the evolutionary tree topologies from DNA sequence data, and the branching order in Hominoidea, J, Mol, Evol, 29: 170-179, Knowlton N, Weigt LA (1998), New dates and new rates for divergence across the Isthmus of Panama, Proc, R, Soc, Lond B265: 2257-2263, Kumar S (1996), “PHYLTEST: a program for testing phylogenetic hypothesis,” Version 2,0, Institute of Molecular Evolutionary Genetics and Department of Biology, The Pennsylvania State University, University Park, Pennsylvania, USA, Miyaki CY, Matioli SR, Burke T, Wajntal A (1998), Parrot evolution and paleogeographical events: mitochondrial DNA evidence, Mol, Biol, Evol, 15: 544-551, Nahum LA, Pereira SL, Fernandes-Matioli FMC, Matioli SR, Wajntal A (submitted), Molecular phylogeny and evolution of the Ramphastidae (aves) based on cytochrome b mitochondrial sequences, Nardelli PM (1993), “A preservação do mutum de alagoas,” Semana Ilustrada Editorial Ltda, Queimados, Rio de Janeiro, 102 Filogenia molecular de Cracidae Petri S, Fúlvaro VJ (1983), “Geologia do Brasil,” Editora da Universidade de São Paulo, São Paulo, Posada D, Crandall KA (1998), MODELTEST: testing the model of DNA substitution, Bioinformatics 14: 817-818, Russo CAM, Takezaki N, Nei M (1996), Efficiencies of different genes and different treebuilding methods in recovering a known vertebrate phylogeny, Mol, Biol, Evol, 13: 525-536, Salgado-Labouriau, M, L, (1994), “Historia ecológica da Terra,” Editora Edgard Blücher Ltda, Sao Paulo, Sibley CG, Ahlquist JE (1990), “Phylogeny and classification of birds, A study in molecular evolution,” Yale University Press, Sick H (1993), “Birds in Brazil, A natural hystory,” Princeton University Press, New Jersey Swofford DL (1999), “PAUP*, Phylogenetic Analysis Using Parsimony (* and Other Methods),” Version 4,0, Sinauer Associates, Massachusetts, Thompson JD, Higgins DG, Gibson TJ (1994), CLUSTALW: improving the sensitivity of progressive alignment through sequence weighting, position-specific gap penalties and weight matrix choice, Nucleic Acids Res, 22: 4673-4680, van Tuinen M, Sibley CG, Hedges SB (1998), Phylogeny and biogeography of ratite birds inferred from DNA sequences of the mitochondrial ribossomal genes, Mol, Biol, Evol, 15: 370-376, Zuckerkandl E, Pauling L (1962), Molecular diseases, evolution and genic heterogeneity, In: “Horizons in Biochemistry,” M Kasha, B Pullman (Eds), Academic Press, New York, pp 189-255, Zuckerkandl E, Pauling L (1965), Evolutionary divergence and convergence in proteins, In: “Evolving genes and proteins,” V Bryson, HJ Vogel (Eds), Academic Press, New York, pp, 97-166, 103 Capítulo 5 Domínio I da Região Controladora do DNA mitocondrial e a Inferência Filogenética entre os Gêneros de Cracidae (Aves) 104 Utilização da CR-I em filogenia de Cracidae O DOMÍNIO I DA REGIÃO CONTROLADORA DO DNA MITOCONDRIAL E A INFERÊNCIA FILOGENÉTICA ENTRE OS GÊNEROS DE CRACIDAE (AVES) Abstract The mitochondrial control region (D-loop) is thought to be one of the fastest evolving regions of the mitochondrial genome; thus, it is suitable for population and species studies. The region is conventionally not used for phylogenetic inference above the species level due to phylogenetic noise mediated by multiple substitutions at single sites. However, recent evidence suggests that the conserved regions of the control region are phylogenetically informative above the species level (Kimbal et al., 1999; Zink et al., 1998). Therefore, we sequenced the first domain of the mitochondrial control region (CRI) from individuals representing the eleven genera that comprise the family Cracidae (Aves). Our results demonstrate that the CR-I sequences evolve at a rate of 2.3×10-9 substitutions per site per year, which is similar to that of cracid COI and cyt b sequences, and they are not saturated with multiple DNA substitutions and that they have sufficient phylogenetic signal to infer relationships among cracid genera when an appropriate model of DNA evolution is applied to the analyses. The tree obtained with the CR-I sequences is similar to that estimated by other six mitochondrial genes. CR-I sequences should be examined in other vertebrate phylogenetic studies to evaluate the usefulness of the region for tree reconstruction, especially for tree estimates based on combined mitochondrial genes. Resumo Acredita-se que a região controladora do DNA mitocondrial (D-loop) seja uma das regiões com maior taxa de substituição de nucleotídeos, e por este motivo ela é amplamente utilizada em estudos de populações. Contudo seu uso em inferências filogenéticas acima da categoria de espécies é restrito devido ao ruído filogenético produzido por substituições múltiplas. Neste trabalho, seqüenciamos o primeiro domínio da região controladora de um representante de cada um dos onze gêneros que compõem a família Cracidae (Aves). Nossos resultados mostraram que as sequências da CR-I 105 Utilização da CR-I em filogenia de Cracidae apresentam taxa de evolução de 2,3×10-9 substitutições por sítio por ano, similar ao encontrado para as sequências do COI e cyt b de cracídeos. Estas sequências de DNA não se apresentam saturadas de substituições e têm sinal filogenético suficiente para inferir as relações entre os gêneros de cracídeos quando um modelo apropriado de evolução de DNA é empregado na análise. A inferência filogenética obtida a partir das sequências de CR-I é similar à obtida com outros seis genes mitocondriais analisados conjuntamente. As sequências do CR-I deveriam ser examinadas em outros estudos com vertebrados para avaliar a utilidade desta região em reconstrução filogenética, especialmente no caso de reconstruções baseadas em combinação de dados de sequências mitocondriais. Introdução Sequências do DNA mitocondrial (mtDNA) têm sido amplamente empregadas em reconstrução filogenética (e.g., Kocher et al., 1989; Zink et al., 1998) e filogeografia populacional (e.g., Avise et al., 1987; Baker e Marshall, 1997, Eizirik et al., 1998; Lucchini e Randi, 1998). A escolha do(s) gene(s) a ser(em) usado(s) baseia-se em sua(s) taxa(s) de evolução. Sabe-se que diferentes genes mitocondriais evoluem com taxas próprias. Genes de evolução lenta são úteis para estudos envolvendo níveis taxônomicos superiores, ao passo que genes de evolução mais rápida são amplamente empregados em níveis taxonômicos inferiores, como populações e espécies proximamente relacionadas. A região controladora do DNA mitocondrial, também conhecida como D-loop ("displacement loop"), apresenta uma das taxas de evolução mais rápidas entre as sequências do DNA mitocondrial, e por isso é amplamente usado em estudos de evolução e diferenciação populacional. Contudo, seu uso em reconstrução filogenética acima da categoria de espécies não é amplamente empregado devido à crença de que o sinal filogenético para níveis taxonômicos acima de espécies esteja suprimido pelo ruído causado por substituições múltiplas. O D-loop apresenta um domínio central flanqueado por dois domínios hipervariáveis. Estes domínios hipervariáveis apresentam heterogeneidade de comprimento devido principalmente à variação no número de repetições em tandem, e heterogeneidade de composição de bases (Baker e Marshall, 1997; Fumagalli et al., 1996, 106 Utilização da CR-I em filogenia de Cracidae e referências citadas; Saccone et al., 1991; Wilkinson et al., 1997), dificultando o alinhamento das sequências e a análise filogenética. Recentemente, Kimball et al. (1999) relataram as relações filogenéticas entre vários gêneros de faisões e perdizes usando sequências do citocromo b (cyt b) e do domínio I da região controladora. Os resultados deles mostraram que a inferência obtida usando as sequências do domínio I são altamente congruentes com as do cyt b, mostrando a utilidade do domínio I da região controladora para relações taxonômicas acima de espécies. Zink et al. (1998) também sugeriram que os domínios I e III da região controladora são úteis para estudos filogenéticos dentro e entre gêneros de aves. Neste trabalho, seqüenciamos o domínio I da região controladora de um representante de cada um dos onze gêneros de Cracidae para responder as seguintes questões: (1) Em Cracídeos, o domínio I evolui mais rapidamente que outras sequências mitocondriais? (2) Essa região seria útil para estimar as relações filogenéticas entre os gêneros de cracídeos? (3) Como se compara a inferência filogenética por meio de sequências da região controladora com aquela obtida para gêneros de Cracidae usando outros genes mitocondriais em conjunto (citocrome b, citocrome oxidase I, II e III, 12S rDNA, e 16SrDNA)(Capítulo 4)? Material e métodos DNA total foi extraído de amostras de sangue de Cracidae de acordo com o método descrito por Bruford et al. (1992). O domínio I da região controladora (CR-I) foi amplificado a partir de DNA total em um termociclador modelo TC1 (Perkin-Elmer) usando um passo inicial de desnaturação do DNA por 5 minutos a 95oC, seguido de 25 ciclos de 1 minuto a 95°C, 30 segundos a 50°C e 40 segundos a 72°C. Finalmente seguiuse um passo de extensão a 72oC por 5 minutos. Os produtos da PCR foram separados em gel de agarose 1% e recuperados em solução PEG8000 15% de acordo com Zhen e Swank (1993). Os oligonucleotídeos iniciadores ("primers") utilizados foram desenhados por G. Rowe (Leicester University, Leicester, Inglaterra) para Anseriformes: D-loop L (TTG TTC TCA ACT ACG GGA AC) e D-loop H (GTG AGG TGG ACG ATC AAT 107 Utilização da CR-I em filogenia de Cracidae AAA T), correspondendo as posições 16756 e 422 do genoma mitocondrial de Gallus gallus (Desjardins e Moraes, 1990, número de acesso GenBank X52392). As reações de seqüenciamento foram preparadas usando o "kit" de seqüenciamento Dye Terminator Cycle Sequencing (PE Applied Biosystems) ou o Termo Sequenase Dye Terminator Cycle Sequencing (Amersham Life Science) de acordo com as instruções do fabricante. Ambas as fitas do CR-I foram seqüenciadas para um espécimem representando cada um dos diferentes gêneros das subfamílias Penelopinae (Aburria aburri, Chamaepetes goudotti, Penelope obscura, Penelopina nigra, Pipile jacutinga, Oreophasis derbianus e Ortalis canicollis) e Cracinae (Crax blumenbachii, Mitu tuberosa, Nothocrax urumutum e Pauxi pauxi). As sequências foram carregadas em seqüenciador automático ABI PRISM 310 (Perkin-Elmer). Os eletroferogramas de ambas as fitas foram comparados e as ambiguidades foram corrigidas usando o programa Sequence Navigator, versão 1.0.1 (Perkin-Elmer). As sequências foram depositadas no GenBank sob números de acesso AF165430-AF165440. O alinhamento foi realizado no Clustal W (Thompson et al., 1994) e checado visualmente para correção de eventuais erros de alinhamento (Fig. 1). Distâncias de Tamura-Nei (Tamura e Nei, 1993) foram plotadas contra o número de transições e o de transversões para todas os pares de cracídeos para checar se as substituições atingiram a saturação. A taxa média de substituição por sítio por ano foi estimada por: ˆ r=k 2T , onde T é o tempo de divergência estimado anteriormente em um estudo de relações filogenéticas entre os gêneros de Cracidae e k̂ é a taxa média esperada de substituição de nucleotídeo dada por: ˆ − 3 ln1 − 4d , 4 3 sendo d̂ a distância TN93 média observada entre as sequências. 108 Utilização da CR-I em filogenia de Cracidae 1 1234567890 Aburria AATAC-GGGA Pipile ..CC.C---Penelope .......... Penelopina .....G.... Chamaepetes ....-G.... Oreophasis ....-G.... Ortalis ...GGG.... Mitu ...TAG.... Crax .......... Pauxi ....GG.... Nothocrax ...T-G.... 1111111112 1234567890 AAAATT-AAT ......TT-. .C........ C.....A.T. .......... .......... ......C.-. .C....C... ......C... .......... .......G-. 2222222223 1234567890 TTTTAACCTA .CC..----. .......... .....T..A. .....-.-.. ......-ACC .....----. ......TT.. .......T.. ......AT.. .......... 3333333334 1234567890 ACCCTCCTAC ..T....... .T........ C...C....TT.T.....A TT..C....A .G..C....A ....C....A ....C........C........C....- 4444444445 1234567890 TAA--GCACA ...GG..... .......... -.TAA..... AT.GGAA.TT AT..A...A. .GTTG.-.A. CC.GA..... CC.GA..... CC-GG...A. CC.GG...A. 5555555556 1234567890 TCTCTCTCTA .......... .......... C..T.T.T.T .......... .......... .T..C..T.T .......... .......... .T.T.T.TC. .T.T.T.T.T 6666666667 1234567890 GC-AAGGG-C --..G...C. ....G..... ....G..... .-..G..-.. .GG.G-.-.. .GG.G-.-C. .AG.G-.-A. .AG.G-.-A. .GGGG..-.. TGGGG..-A. 7777777778 1234567890 CCCCCCCC-........CC .......... ........C. ........CC ........CC ........CC .......... .......-.. ........C. ........CC 8888888889 1234567890 Aburria -TT---CCCC Pipile C..AAC.... Penelope ..-A...... Penelopina ..-A...... Chamaepetes ..-AA..... Oreophasis ..-..C.... Ortalis ..-A...... Mitu .......... Crax .......... Pauxi ..-..C.... Nothocrax ..-....... 1 9999999990 1234567890 CCCCGGGGGG .......... .......... ....A.A-.. ....C.A... ....C.AA.. ....C.A... ....A.A... ....A.A... ....A.A.A. ....C.A... 1111111111 0000000001 1234567890 GGTATGCTAT .......... ...G...... .......... ...G...... ...G...... ...G...... ...G...... ...G...... ...G...... ...G...... 1111111111 1111111112 1234567890 GTATAATCGT .......... .......... .......... .......... ......C... ......C... .......... .......... .......... .......... 1111111111 2222222223 1234567890 GCATATTTTT .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... 1111111111 3333333334 1234567890 ATGTGCCCCA .......... .......... G......... G......... G......... G......... .......... .......... .......... .......... 1111111111 4444444445 1234567890 TACATTATGG .......... .......... .......... .......... .......... .......... .......... .......... .......... G......... 1111111111 5555555556 1234567890 TCCAGTAATA .......... .......... .T........ .......... .......C.. .......... .......... .T........ .T........ .......... Figura 1. Alinhamento das sequências do primeiro domínio da região controladora em 11 espécies de Cracidae. Os números acima das seqüências reprentam a posição do sítio. 109 Utilização da CR-I em filogenia de Cracidae 1111111111 6666666667 1234567890 Aburria CATTCTATAT Pipile .......... Penelope ....T..... Penelopina .......... Chamaepetes ...A...... Oreophasis ...A...... Ortalis .......... Mitu .......... Crax .......... Pauxi .......... Nothocrax .......... 1111111111 7777777778 1234567890 ATGTACTATA .......... .......... .......... .......... .......... .......... .C........ .......... .......... ..T....... 1111111111 8888888889 1234567890 CCCAT-TATA .......... .......... .......... .......... .......... .......... .....A.... .....A.... .....A.... ..A..A..G. 1111111112 9999999990 1234567890 TGTAAACGGA ....G..... .......... ....G..... ....G.T... .......... .......... ....G..... ....G..... ....G..... .......... 2222222222 0000000001 1234567890 CATGCGTCTT .......T.C .....T.... ....-....C .......... .......... ....GC...C ......C..C ....T..... ....T....C .........C 2222222222 1111111112 1234567890 TCTAGCCACA .......... .......... .......... .T........ .......... CTC....... ..C....... .......... ..C....... ..C....C.. 2222222222 2222222223 1234567890 TTTCTCCCAA .......... .......... ...A...... .........G .......... .......... ...A.....G .........G .........G ...T.....G 2222222222 3333333334 1234567890 TGCACATTAA .......... .......... C......... C......... .......... .......... C......... C......... C......... .......... 2222222222 4444444445 1234567890 Aburria CATGTATGCT Pipile .......... Penelope .......... Penelopina .......... Chamaepetes .......... Oreophasis .......... Ortalis .......... Mitu ....C..... Crax ....C..... Pauxi .......... Nothocrax .....T.... 2222222222 5555555556 1234567890 TTAGGAC-AA .C........ .......... .......T.. C......... C......T.. .......T.. C......C.G C......C.G C......C.G C......C.G 2222222222 6666666667 1234567890 CCAGAGATAC .T........ .T...A.... .T...A...T .T...A.... .T...A...T .T...AG... .....A...T .....A...T .....A...T ........TT 2222222222 7777777778 1234567890 ACTACTTATT .....C..C. .......G.. C--..C.... G....C.GC. C--.....C. C--..C.... C--....... C--..C.... C--....... G--..C.... 2222222222 8888888889 1234567890 C-ACGATCTA .......... ........C. .......... T.......C. ........C. .......TC. ........C. .C......C. ........C. ........C. 2222222223 9999999990 1234567890 GCACATTCAA .......... .......... .......... .......... .......... .......... .......... .......... .......... ....G..... 3333333333 0000000001 1234567890 GTCACCTAAC .C........ .......... .A........ .......... .G........ .A........ .......... .......... .......... .......... 3333333333 1111111112 1234567890 CAGTGAATGG .......... .......... ..A......A .........A .........A .......... .........A .........A .........A .......G.A Figura 1. Continuação. 110 Utilização da CR-I em filogenia de Cracidae 3333333333 2222222223 1234567890 Aburria TTTCAGGGAC Pipile ...AC-..G. Penelope ...AC-.... Penelopina .C.AT-.... Chamaepete .C.AC-.... Oreophasis .C.AC-.... Ortalis .C.AC-.... Mitu .C.AC-.... Crax .C.AC..... Pauxi .C.AC-.... Nothocrax .G.AC-.... 3333333333 3333333334 1234567890 ATAATATTAA ...G...... ........T. .......... ...G...... ....AC.... ....AC.... ....AC.... ....AC.... ....AC.... ....AC.... 3333333333 4444444445 1234567890 TAATACAGCC .....T.... ..T....... ..C..T.... ..TC...T.. ..T..T.... ..TA...T.. ..T.GT..T. ..CC.T..T. ..T....T.. ..T....T.. 3333333333 5555555556 1234567890 TTATCCACAT ..G...G... .....-.... .AT....... ..-....... C.-...T... C.-...C... ..-...T... ..--.TT... ..--..T... ..--..C... 3333333333 6666666667 1234567890 TTGGGTTATG ....-..... .......... ....-..... ....-..... ....-..... ....-.G-.. ....-..... ....-..... ....-..... ....-..... 3333333333 7777777778 1234567890 CTCGACGTAT ........G. ..A...T............ .......... .......... .......... .......... .......... .......... .......-.. 33333 88888 12345 CAG-G .TA.. --.C. ...A. ...T. ..-.A..T. ...T. ..-....T. ...T. Figura 1. Continuação. 111 Utilização da CR-I em filogenia de Cracidae As análises filogenéticas foram realizadas no PAUP* (versão 4.0; Swofford, 1999) sob os critérios de máxima parcimônia, máxima verossimilhança e distância. Todas as reconstruções não foram enraizadas. Testes de razão de verossimilhança ("Likelihood ratio test - LRT") foram realizados no MODELTEST (versão 2.0, Posada e Crandall, 1998) para escolher o modelo evolutivo que mais se adequa ao CR-I de cracídeos. O modelo escolhido para estimar a filogenia sob o critério da máxima verossimilhança por meio do algoritmo de "decomposição de estrela" foi o HKY85 (Hasegawa et al., 1985) admitindo que os sítios apresentam taxa de subsitutição com distribuição gama. Análises de distância foram realizadas através do algoritmo de Neighbor-joining usando o modelo HKY (Hasegawa et al., 1985), assumindo que os sítios apresentam heterogeneidade de taxas de substituição. "Bootstrap" foi realizado com 100 réplicas. A análise de parcimônia foi feita por meio de busca exaustiva atribuindo peso igual para transições (TS) e transversões (TV) (1:1) em uma das análises, e atribuindo mais peso para as transversões (TS:TV = 1:2) em outra. "Bootstrap" foi realizado com 100 réplicas assumindo mesma probabilidade de um sítio ser reamostrado, mas aplicando os pesos dados às transversões (TS:TV = 1:2). Resultados O alinhamento final do CR-I possui 385 pares de bases (Fig. 1). Sítios com lacunas (cerca de 13% da sequência total) não se extendiam por mais do que 4 bases, e foram excluídos da análise, resultando em uma matriz de 333 pares de bases. Destes sítios, 47 eram não informativos para parcimônia, 51 informativos e 235 eram constantes (61.0%). Transições (TS) e transversões (TV) não estão saturados entre os gêneros de Cracidae (Fig 2). O número de TS variou de 8 a 33 e o de TV de 2 a 23 (Tabela 1). A razão TS/TV foi de 1.98. A composição de bases é homogênea entre os táxons usados (χ2=12,20, P=0,998), com decréscimo do conteúdo de G (14.6%) em relação as demais bases (A=28.5%, C=26.2%, T=30.7%) (tabela 2). Os resultados de avaliação do sinal filogenético contido nestas sequências foi de –0.61, obtidos por meio da utilização da estatística g1 (Hillis, 1991). 112 Utilização da CR-I em filogenia de Cracidae Número de TS e TV 40 TS TV 30 20 10 0 0 0,05 0,1 0,15 0,2 Distâncias de TN93 Figura 2. Número de transições e de transversões plotadas contra as distâncias de Tamura-Nei (TN93) para todas as comparações par-a-par entre os Cracidae estudados. Tabela 1. Número de transições (acima da diagonal) e transversões (abaixo da diagonal) observados no domínio I da região controladora para todas as comparações par-a-par entre os gêneros de Cracidae. Abu Cha Cra Mit Not Ore Ort Pau Pen Pnl Pip Aburria Abu 26 21 23 22 17 23 25 8 21 18 Chamaepetes 9 Cha 21 26 29 17 24 27 20 28 32 Crax 8 9 Cra 9 20 17 27 15 22 17 30 Mitu 11 12 3 Mit 18 18 26 14 23 22 33 Nothocrax 21 18 15 16 Not 23 21 11 24 21 33 Oreophasis 15 10 7 10 18 Ore 18 22 13 21 25 Ortalis 16 15 10 13 17 11 Ort 25 21 25 30 Pauxi 10 9 2 5 13 7 8 Pau 25 18 36 Penelope 8 11 10 11 23 17 16 12 Pen 25 22 Penelopina 10 11 10 11 23 13 14 12 12 Pnl 27 Pipile 4 9 8 9 19 15 16 10 8 10 Pip A análise da distribuição distribuição dos sítios variáveis ao longo do domínio I da região controladora de cracídeos mostrou que 48 (38.71%) dos sítios variáveis se encontram nos primeiros 100 pares de bases. Os próximos 100 pares de bases foram mais conservados com apenas 14 sítios variáveis (11.29%). O terceiro e o quarto grupo de 100 pares de bases apresentaram cada um 31 sítios variáveis (25%). A taxa média de substituição de nucleotídeos por ano e a porcentagem por milhão de anos para sete diferentes genes de cracídeos são mostrados na tabela 3. Nossos resultados mostram que em cracídeos estes setes genes evoluem a taxas entre 1,25-2,29 × 113 Utilização da CR-I em filogenia de Cracidae 10-9 (Tab. 3) e que as taxas de evolução do COI e do cyt b são similares à taxa do CR-I (2,29 × 10-9 substituições por ano). Tabela 2. Composição de bases para representantes de 11 gêneros de Cracidae. A C G T Aburria 0.300 0.249 0.141 0.309 Chamaepetes 0.279 0.252 0.147 0.321 Crax 0.285 0.273 0.144 0.297 Mitu 0.279 0.279 0.147 0.294 Nothocrax 0.264 0.258 0.162 0.315 Oreophasis 0.285 0.270 0.141 0.303 Ortalis 0.285 0.273 0.150 0.291 Pauxi 0.288 0.261 0.141 0.309 Penelope 0.288 0.243 0.141 0.327 Penelopina 0.300 0.252 0.135 0.312 Pipile 0.276 0.264 0.159 0.300 Média 0.285 0.262 0.146 0.307 Tabela 3. Taxa (r) de substituição de DNA por sítio por ano e porcentagem de divergência de sequência por milhão de ano (%/Ma) para sete genes mitocondriais de Cracidae. r (×10-9 por ano) %/My D-loop 2,29 0,4580 12S rDNA 1,37 0,2745 16S rDNA 1,25 0,2499 COI 2,32 0,4600 COII 1,79 0,3584 COIII 1,94 0,3875 Cyt b 2,29 0,4570 As relações filogenéticas entre os cracídeos estimadas por máxima verossimilhança e distância produziram resultados similares (Fig. 3-C e D). Estas análises mostraram a separação das subfamílias Penelopinae (jacus e aracuãs) e Cracinae (mutuns), e as relações entre os gêneros foram similares as estimativas obtidas usando seis genes mitocondriais em conjunto (Capítulo 4). Todas as reconstruções foram completamente resolvidas. As análises de máxima parcimônia sem ou com atribuição de pesos resultaram em árvores onde a separação das subfamílias não ocorre e os valores de "bootstrap" foram maiores do que 50% para poucas associações (Fig. 3-A e B). 114 Utilização da CR-I em filogenia de Cracidae B A Pipile Penelopina 81 Crax Penelope 58 Oreophasis 59 Penelope 84 52 Aburria Crax Mitu Pauxi Aburria 60 Mitu Pipile Penelopina 51 Pauxi Nothocrax Chamaepetes Oreophasis Chamaepetes Ortalis Ortalis Nothocrax 10 10 C D Penelopina Chamaepetes Penelopina Ortalis Ortalis Penelope Penelope Pipile Pipile Oreophasis Aburria Aburria Oreophasis Mitu Crax Pauxi Mitu Chamaepetes Crax Pauxi Nothocrax Nothocrax 0.1 0.1 Figura 3. Reconstruções filogenéticas usando o primeiro domínio da região controladora, sob os critérios de máxima parcimônia sem (A) e com atribuição de pesos (B), de máxima verossimilhança usando o modelo de evolução de DNA HKY85+Γ (C), de distâncias (Neighbor-joining) usando o modelo HKY+Γ (D). Somente as filogenias C e D são congruentes com a obtida usando outros seis genes mitocondriais. Barras correspondem ao número de substituições. Táxons sublinhados são membros da subfamília Cracinae e aqueles não sublinhados são membros de Penelopinae. 115 Utilização da CR-I em filogenia de Cracidae Discussão No presente trabalho, seqüenciamos o domínio I da região controladora (CR-I) dos 11 gêneros de cracídeos. Sabe-se que alguns genes mitocondriais, incluindo o CR-I, apresentam cópias nucleares em algumas espécies de aves (Quinn, 1997). Contudo acreditamos que nossas sequências sejam de origem mitocondrial porque (1) obtivemos uma única banda como produto da PCR e as sequências destes produtos foram "limpas", isto é, não indicaram a presença de outras sequências de fundo; (2) elas apresentaram alta similaridade com outras sequências do CR-I de aves depositadas no GenBank; e (3) a predição de sua estrutura secundária (não mostrado) apresentou aspectos similares a outros CR-I de aves (e.g. Randi e Lucchini, 1998). Apesar de ser considerado um gene com alta taxa de evolução, o CR-I em Cracidae apresentou 61% de sítios constantes. As sequências do COI e cyt b parecem evoluir a uma taxa similar ao CR-I em cracídeos. Nossos resultados são concordantes com Randi e Lucchini (1998) e Zink et al. (1998): outros genes mitocondriais podem evoluir tão ou mais rapidamente do que a região controladora. Randi e Lucchini (1998) relataram que sequências completas do D-loop em diversas espécies de Alectoris (Galliformes) apresentaram taxa de evolução menor do que a do cyt b. Zink et al. (1998) mostraram que o número observado de sítios variáveis no CR-I é similar aquele dos genes cyt b e ND2 em diversas espécies de Pipilo (Passeriformes). A estatística g1 (Hillis, 1991) aplicada as sequências de CR-I dos diferentes gêneros de Cracidae é similar à estimada para sequências não aleatórias que retem sinal filogenético, indicando que ela pode ser útil em análises de reconstruções filogenéticas acima da categoria de espécie, como já sugerido anteriormente por Kimball et al. (1999) e Zink et al. (1998). Nossa análise de parcimônia falhou em mostrar a monofilia de ambas as subfamílias de Cracidae. As incongruências se referem aquelas divergências com ramos longos, tais como Nothocrax (Cracinae), e os membros de Penelopinae Chamaepetes, Ortalis, Oreophasis, e Penelopina. Provavelmente estes táxons acumularam mais modificações que podem ser atribuídas às homoplasias e não à ancestralidade comum. A proximidade 116 Utilização da CR-I em filogenia de Cracidae filogenética aparente destes táxons pode ser devida então ao efeito de atração de ramos longos (Felsentein, 1978). Os métodos de parcimônia também podem resultar em estimativas infiéis porque modelos mais complexos de mudança evolutiva não podem ser incorporados à análise. O CR-I de Cracidae parece evoluir de uma maneira complexa. Nossos resultados mostraram que há forte heterogeneidade de taxas de substituição entre os sítios, e que ocorrem o dobro de transições em relação às transversões. Acomodar estes parâmetros em uma reconstrução filogenética pode resultar em estimativas mais fiéis da evolução de um grupo de sequências, ou os táxons que eles representam (Gaut and Lewin, 1995). De fato, nossas estimativas da evolução dos gêneros de Cracidae usando os critérios de máxima verossimilhança ou distância e admitindo haver heterogeneidade de substituição entre os sítios mostraram que as sequências do CR-I forneceram resultados similares as sequências de outros seis genes mitocondriais (Capítulo 4): a separação das subfamílias Cracinae (incluindo os cracídeos maiores e mais pesados) e Penelopinae (representado pelos pequenos e delgados aracuãs, jacus médios a grandes)(Delacour e Amadon, 1973). As relações filogenéticas obtidas entre os jacus usando as sequências do CR-I é muito similar à obtida para os seis genes mitocondriais em conjunto. Contudo, as relações entre os mutuns difere entre estes dois estudos com a associação entre Crax e Mitu em um clado, e Nothocrax e Pauxi no outro usando sequências do CR-I. De fato todos estes táxons parecem ter evoluído em um período de tempo relativamente curto (cerca de 2-3 milhões de anos), e o CR-I, ou qualquer outro gene analisado separadamente, poderia não ter sofrido substituições o suficiente para resolver a relação entre eles. Em resumo, nossos resultados mostraram que a região controladora do DNA mitocondrial pode ser apropriada para reconstruções filogenéticas entre gêneros e não deve ser ignoradas em outros estudos sistemáticos e filogenéticos. Nossa sugestão é que este gene seja avaliado não apenas em aves, mas também em outros grupos. A região controladora do DNA mitocondrial deveria ser incorporada em estudos onde diversos genes são considerados juntos na análise, a análise combinada de Kluge (1989). A razão para isto é que os genes mitocondriais são ligados e então apresentariam uma história evolutiva em 117 Utilização da CR-I em filogenia de Cracidae comum. O melhoramento e a confiabilidade da inferência irão depender do modelo de substituição de DNA: quanto mais realista o modelo, melhor a inferência obtida. Referências Avise JC, Arnold J, Ball RM, Bermingham E, Lamb T, Niegel JE, Reeb CA, Saunders NC (1987). Intraespecific phylogeography: the mitochondrial bridge between population genetics and systematics. Ann. Rev. Ecol. Syst. 18: 489-522. Baker AJ, Marshal HD (1997). Mitochondrial control region sequences as tools for understanding evolution. In: "Avian Molecular Systematics", DP Mindell (Ed.). Academic Press. USA. pp 5182. Bruford MW, Hanotte O, Brookfield JFY, Burke T (1992). Single-locus and multilocus DNA fingerprinting. In “Molecular Genetic Analysis Of Populations - A Practical Approach,” AR Hoelzel (Ed.). Oxford University Press, New York. pp. 225-269. Delacour J, Amadon D (1973). “Curassows and Related Birds,” The American Museum of Natural History. New York, NY. Desjardins P, Morais R (1990). Sequence and gene organization of the chicken mitochondrial genome. A novel gene order in higher vertebrates. J. Mol. Biol. 212: 599-634. Eizirik E, Bonatto SL, Johnson WE, Crawshaw PG, Vié JC, Brousset DM, O’Brien SJ, Salzano FM (1998). Phylogeographic patterns and evolution of the mitochondrial DNA control region in two Neotropical cats (Mammalia, Felidae). J. Mol. Evol. 47: 613-624. Felsenstein J (1978). Cases in which parsimony and compatibility methods will be positively misleading. Syst. Zool. 27: 401-410. Fumagalli L, Taberlet P, Favre L, Hausser J (1996). Origin and evolution of homologous repeated sequences in the mitochondrial DNA control region of shrews. Mol. Biol. Evol. 13: 31-46. Gaut, BS, Lewis PO (1995). Success of maximum likelihood in the four-taxon case. Mol. Biol. Evol. 12: 152-162. Hasegawa M, Kishino K, Yano T (1985). Dating the human-ape splitting by a molecular clock of mitochondrial DNA. J. Mol. Evol. 22: 160-174. Hillis, DM (1991). Discriminating between phylogenetic signal and random noise in DNA sequences. In: "Phylogenetic Analysis of DNA sequences", M Miyamoto, J Cracraft (Eds). Oxford University Press, New York. pp 278-294. 118 Utilização da CR-I em filogenia de Cracidae Kimball RT, Braun EL, Zwartjes PW, Crowe TM, Ligon JD (1999). A molecular phylogeny of the pheasants and partridges suggests that these lineages are not monophyletic. Mol. Phylogenet. Evol. 11: 38-54. Kluge AG (1989). A concern for evidence and a phylogenetic hypothesis of relationships among Epicrates (Boidae, Seprentes). Syst. Zool. 38: 7-25. Kocher TD, Thomas WK, Meyer A, Edwards SV, Pääbo S, Villablanca FX, Wilson AC (1989). Dynamics of mitochondrial DNA evolution in animals: amplification and sequencing with conserved primers. Proc. Natl. Acad. Sci. USA 86: 6196-6200. Lucchini V, Randi E (1998). Mitochondrial DNA sequence variation and phylogeographical structure of rock partridge (Alectoris graeca) populations. Heredity 81: 528-536. Posada D, Crandall KA (1998). Modeltest: testing the model of DNA substitution. Bioinformatics 14: 817-818. Quinn TW (1997). Molecular evolution of the mitochondrial genome. In: "Avian Molecular Systematics", DP Mindell (Ed). Academic Press. USA pp 3-28. Randi E, Lucchini V (1998). Organization and evolution of the mitochondrial DNA control region in the avian genus Alectoris. J. Mol. Evol. 47: 449-462. Saccone C, Pesole G, Sbisà E (1991). The main regulatory region of mammalian mitochondrial DNA: structure-function model and evolutionary pattern. J. Mol. Evol. 33: 83-91. Swofford DL (1999). PAUP*. Phylogenetic Analysis Using Parsimony (*and related methods). Version 4.0. Sinauer Associates, Sunderland, Massachusetts. Tamura K, Nei M (1993). Estimation of the number of nucleotide substitutions in the control region of mitochondrial DNA in humans and chimpanzees. Mol. Biol. Evol. 10: 512-526. Thompson JD, Higgins DG, Gibson TJ (1994). CLUSTALW: improving the sensitivity of progressive alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22: 4673-4680. Wilkinson GS, Mayer F, Kerth G, Petri B (1997). Evolution of repeated sequence arrays in the Dloop region of bat mitochondrial DNA. Genetics 146: 1035-1048. Zhen L, Swank RT (1993). A simple and high yield method for recovering DNA from agarose gels. Bio Techniques 14: 894-896. Zink RM, Weller SJ, Blackwell RC (1998). Molecular phylogenetics of the avian genus Pipilo and a biogeographic argument for taxonomic uncertainty. Mol. Phylogenet. Evol. 10: 191-201. 119 Capítulo 6 Evolução Molecular da Subunidade II da Citocromo c Oxidase em Cracidae (Aves) 120 Evolução de COII em Cracidae EVOLUÇÃO MOLECULAR DA SUBUNIDADE II DA CITOCROMO C OXIDASE EM CRACIDAE (AVES) Abstract Cytochrome c oxidase subunit II (COII) is a conserved enzyme among living organisms, from prokaryotes to eukaryotes. The pattern of nucleotide and amino acid substitutions is analysed here for the COII gene of the eleven genera of Cracidae (Aves). Amino acid positions considered to be conserved among several metazoan species were also identified in Cracidae COII sequences futher enhancing the functional importance of these positions, while others showed considerable variation suggesting that conserved positions in certain metazoan groups might not be conserved in others. Resumo O gene da subunidade II da citocromo c oxidase (COII) tem se mostrado conservado entre eucariotos e procariotos. Os padrões de substituição de nucleotídeos e de aminoácidos são analisados aqui para seqüências de COII de onze gêneros da família Cracidae (Aves). Posições de amino ácidos consideradas conservadas entre diversas espécies de metazoários também foram identificadas nas seqüências de COII de cracídeos neste estudo, reforçando a importância funcional destas posições, enquanto outras posições se mostram variáveis, sugerindo que aminoácidos conservados em determinados metazoários podem não ser em outros grupos. Introdução A cadeia respiratória, ou fosforilação oxidativa, é um de três estágios no metabolismo celular, onde os elétrons são transferidos da NADH ou da FADH2 para o O2, formando H2O e ATP, e protegendo as células do acúmulo de H+. Três grandes complexos protéicos estão envolvidos neste processo: NADH-Q redutase, citocromo redutase, e citocromo c oxidase. Estes complexos se situam na membrana interior da mitocôndria de eucariotos, e na membrana plasmática de procariotos. 121 Evolução de COII em Cracidae A citocromo c oxidase é um complexo protéico, composto de várias subunidades. Em eucariotos, as subunidades I, II, e III são codificadas pelo genoma mitocondrial e as demais no genoma nuclear. Foram também identificadas até o momento quatro subunidades (IV, Va, Vb, and VIc) codificadas pelo genoma nuclear em mamíferos, fungos e levedura (revisado em Capaldi, 1990). Somente algumas destas subunidades têm função conhecida, embora o processo catalítico atribuído a citocromo c oxidase seja bem caracterizado (Capaldi, 1990; Capaldi et al., 1983; Iwata et al., 1995; Millet et al 1983). De acordo com o modelo estrutural da subunidade II da citocromo c oxidase (COII), podemos identificar três segmentos: uma alça N-terminal, dos resíduos 1 ao 26, duas alfa hélices transmembrânicas (resíduos 27-48 e 63-82) conectadas por 13 resíduos, dos resíduos 49 ao 62, e um domínio globular C-terminal, entre os resíduos 106-227 (Capaldi et al., 1983; Iwata et al., 1995; Millett et al., 1983). A maioria dos aminoácidos das regiões em alfa hélice são hidrofóbicos, como esperado para domínios transmembrânicos que interagem com domínios de outras subunidade do complexo citocromo c oxidase e com a membrana da mitocôndria (Capaldi et al., 1983). Alguns dos resíduos do domínio C-terminal parecem formar um centro ativo de ligação para o citocromo c, como os resíduos Asp-112, Glu-114, e Asp 158 de bovinos (Capaldi, 1990; Millett et al., 1993). Outros quatro resíduos parecem estar envolvidos com a ligação do íon de cobre (His-161, Cys-196, Cys-200, e His-204) e parecem ser conservados em mamíferos (Adkins e Honeycutt, 1994, e referências citadas; Capaldi et al. 1990; Millett et al., 1983), artrópodos (Frati et al., 1997, e referências citadas), um molusco (Lecanidou et al., 1994), e bactéria (Iwata et al., 1995), mas não em Theropithecus, uma espécie de primata (Adkins e Honeycutt, 1994). Uma região rica em triptofano e tirosina foi observada entre os resíduos de aminoácidos 104 a 110 no gene da COII em vários organismos. Foi sugerido que esta região esteja envolvida com a formação de um ambiente para a transferência de elétrons (Adkins e Honeycutt,1994). O gene da COII, assim com outros genes mitocondriais, tem sido amplamente usado para estimar as relações filogenéticas para diversas categorias taxonômicas. 122 Evolução de COII em Cracidae Zardoya e Meyer (1996) o classificaram como tendo um poder mediano de resolver as relações filogenéticas dos vertebrados em comparação com os demais genes mitocondriais codificantes. De fato, parece que as seqüências de COII são úteis em casos abrangendo questões filogenéticas entre categorias taxonômicas mais próximas como espécies e gêneros (Emerson e Wallis, 1995; Frati et al., 1997; Honeycutt et al., 1995). Este trabalho trata da evolução comparada do gene da COII em Cracidae e outros grupos de metazoários. A família Cracidae é uma dos grupos de aves Neotropicais mais ameaçados de extinção (Collar et al., 1992). Material e métodos As seqüências de COII de Cracidae foram obtidas previamente (Capítulos 3 e 4)(Fig. 1), e estão depositadas no GenBank (números de acesso AF165502-AF165512). As espécies de cracídeos usadas aqui representando todos os gêneros da família foram: Aburria aburri, Chamaepetes goudotti, Crax blumenbachii, Mitu tuberosa, Nothocrax urumutum, Oreophasis derbianus, Ortalis cannicolis, Pauxi pauxi, Penelope obscura, Penelopina nigra, e Pipile jacutinga. O megapodídeo Megapodius reinwardt foi usado para o teste de taxas relativas de evolução (veja abaixo). A frequência de bases, uso preferencial de códons, número de transições e transversões, número de sítios parcimoniosos, número de sítios bi e tetradegenerados, e sinônimos, número de sítios invariáveis, e número absoluto de transições e transversões para cada comparação par-a-par foram obtidos nos programas MEGA 1.01 (Kumar et al., 1993) e MOLPHY 2.2 (Adachi e Hasegawa, 1994). O enviesamento composicional para cada posição do códon foi calculada como: EC = 2 4 c − 0.25 , 3∑ i i =1 onde ci é a frequência da iésima base (Irwin et al., 1991). Também avaliamos se a composição de bases se encontra estacionária entre os táxons para averiguar se as substituições do COII podem representar substituições múltiplas. A hipótese de constância de taxa de substituição entre os gêneros analisados foi testada no PHYLTEST (Kumar, 1996), usando a seqüência de COII do megapodídeo 123 Evolução de COII em Cracidae como grupo externo. A taxa de substituição de nucleotídeos (r) é definida como o número de substituições por sítio (K) por ano, e pode ser calculada como: r = K (2T ) , onde T é o tempo de divergência entre duas seqüências (Li, 1997). Os tempos de divergência usado para calibrar as taxas de evolução foram aqueles estimados para a separação entre os gêneros obtidos no capítulo 4. A partir da seqüência de nucleotídeos do gene COII de cracídeos, estimamos as seqüências de aminoácidos e as comparamos com as seqüências de outras aves (Corvus frugilegus, Harlid e Arnason (1999); Aythya americana, Falco peregrinus, Smithornis sharpei, Vidua chalybeata, Mindell et al. (1998); Gallus gallus Desjardins e Morais (1990); Rhea americana Harlid et al. (1998); e Struthio camelus Harlid et al., (1997)) e outros metazoários, incluindo primatas (Adkins e Honeycutt, 1994), um crocodilo (Alligator mississipiensis, Janke e Arnason, 1997, Mindell et al., 1999), uma tartaruga (Chrysemys picta; Mindell et al., 1999) e insetos (Frati et al., 1997). O objetivo desta comparação foi avaliar se estes grupos distintos apresentam aminoácidos conservados em posições consideradas fundamentais em outros organismos. Resultados Alinhamento das seqüências de COII As seqüências de COII de Cracidae puderam ser alinhadas sem nenhum evento de deleção/inserção presente. As seqüências alinhadas são mostradas na figura 1. O gene apresenta 684 nucleotídeos que codificam para 227 aminoácidos e um codon de parada. A proporção de sítios invariáveis (151 sítios no total) para primeira, segunda e terceira posição do códon das seqüências de COII de cracidae foi de 90,4; 99,1 e 44,3%, respectivamente. Entre os cracídeos, 86 sítios são parcimoniosos, 123 bidegenerados e 104 tetradegenerados. 124 TTC ..T ... ... ... ... ... ... ..T ..T ... ATA ... ... ... ... ... ... ... ... ... ... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile CTT ... ..A ..G ..A ..A ..A ..A ... ... ... CAC ... ... ... ... ... ..T ... ... ... ... GCC ... ... ... ... ... ... ... ... ... ... ATA ... ... ... ... ... ... ... ... ... ... GAC ... ... ... ... ... ... ... ... ... ... AAC ... ... ..T ... ... ... ... ... ... ... GAA ... ... ... ... ... ... ... ... ... ... CAC ... ... ... ... ... ..T ... ... ... ... CAC ... ... ... ... ... ... ... ... ... ... AAA ... ... ... ... ..G ... ... ... ... ... GCC ... ... ... ... ... ... ... ... ... ... TCC ... ..A ..A ..A ..A ... ..A ... ... ... CTA ... ... ... ... ..G ..G ... ... ... ... CTA ..G ... ... ... ... ... ... ... T.G ... CAA ... ... ... ... ... ... ... ... ... ... TCA ... ... ... ... ... ... ... ... ... ... ATA ... ... ... ... ... ... ... ... ... ... TTA C.. C.. C.. C.. C.. C.. C.. ... C.. C.. TCA ... ... ... ... ... ... ... ..G ..G ... GTA ... ... ... ... ... ... ... ... ... ... GGA ... ... ... ... ... ... ... ... ... ... AAT ..C ..C ..C ..C ..C ..C ..C ... ..C ... GCT ..C ..A ..A ..A ..C ..A ..A ... ..C ... TTC ... ... ... ... ... ... ... ... ... ... ACT ..C ... ... ... ... ... ... ... ..C ... CTA ... ... ... ... ..C ... ... ... ... ... CAA ..G ..G ..G ..G ..G ... ..G ... ... ... GTT ... ..C ..C ..C ... ..C ..C ... ... ... GCC ... ... ... ... ..T ... ... ... ..T ... GAC ... ... ... ... ... ... ... ... ..T ... GAC ... ... ... ... ... ..T ... ... ... ... ATC ... ... ... ... ... ... ... ... ... ... GCC ... ... ... ... ... ... ... ... ... ... GCC ... ... ..T ... ..T ... ... ... ..T ... TGC ... ... ..T ... ... ... ... ... ... ... TCC ... ... ... ... ... ... ... ... ... ... CAA ... ... ... ..G ... ... ..G ... ... ... AGC ... ... ... ... ... ... ..T ... ... ... TCC ... ... ... ... ... ... ... ... ... ... GAA ... ... ... ... ... ... ... ... ... ... CTC ... ... ... ... ... ..T ... ..T ..T ... CCA ... ... ... ... ... ... ... ... ... ... GTC ... ..T ..T ..T ..T ..T ..T ... ... ... GTA ... ... ..G ..G ..G ... ..G ... ... ... ATC ... ... ... ... ... ... ... ... ..T ... GAA ... ... ... ... ... ... ... ... ... ... CTC ... ... ... ... ... ... ... ... ... ... ATA ... ... ... ... ... ... ... ... ... ... CTA ... ... ... ... ... ... ... T.. ... T.. TAC ... ... ... ... ... ... ... ..T ... ... GAA ... ... ... A.. ..G ... ... ... ... ... ATT ..C ..C ..C ..C ... ..C ..C ... ... ... CTA ... ..C ..C ..C ..C ..C ..C ... ... ... GAA ..G ... ... ... ..G ... ... ... ... ... TGA ... ... ... ... ... ... ... ... ... ... CTA ... T.. T.. T.. ... ... T.. ... ... ... CTA ... T.. ... ... ... ... ... ... ..G ... Figura 1. Alinhamento das seqüências de COII em representantes de onze gêneros de Cracidae. Números correspondem ao último sítio na linha. ATG ... ... ... ... ... ... ... ... ... ... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile ACC ... ..T ... ..T ... ..T ..T ... ... ... ACC ... ..T ..T ..T ..T ... ..T ... ... ... GTC ... ... ... ... ... ... ... ... ... ... 66 GAA ... ... ... ... ... ... ... ... ... ... 132 CTT ..C ... ..C ... ..C ... ..C ... ..C ... 198 ATC ... ... ... ... ... ... ... ... ... ... Evolução de COII em Cracidae 125 ATT ..C ... ... ... ... ..C ... ..C ..C ... GAC ..T ... ... ... ... ... ... ..T ... ..T Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile TTC ... ... ... ... ... ... ... ... ... ... GAC ... ..T ..T ..T ... ..T ..T ..T ... ... CCA ... ... ... ... ... ..G ... ... ... ... AAA ... ... ... ... ... ... ... ... ... ... GAG ... ... ... ..A ... ... ... ... ... ... GCC ... ... ... ... ... ... ..T ... ... ... Figura 1. Continuação. CTG ..A ..A ..A ..A T.A ... ..A ..A ..A ... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile GAC ... ... ... ... ... ... ... ... ... ... CCA ... ... ... ... ... ... ... ... ... ... ATC ..T ... ... ... ... ... ..T ... ..T ... CTA ... ... ... ... ... ... ... ... ... ... GAC ... ... ... ... ... ... ... ... ... ... GTA ... ... ... ... ... ... ... ... ... ... TCA ... ... ... ... ... ... ... ... ... ... CTT ... ..C ..C ..C ..C ..C ..C ... ... ... CTA ..G ... T.. ... ... ... T.. ... T.. ... TTT ... ..C ..C ..C ... ..C ..C ... ... ... ACC ... ... ... ... ... ... ... ... ... ... ATT ... ... ..C ... ... ... ... ... ..C ... GAC ... ... ... ... ... ... ... ... ..T ... TTA ... ... ... ... ... C.. ... ... ... ... CTT ... ... ... ... ... ..C ... ... ... ... TCA ... ... ... ... ... ... ... ... ... ... AAG ... ..A ..A ..A ..A ..A ..A ... ... ... CTT ..C ... ... ... ..A ... ... ... ... ... TAC ... ..T ... ... ... ... ... ... ... ... GCA ... ... ... ... ... ... ... ... ... ... GCC ... ... ... ... ... ..T ... ... ... ... ATA ... ... ... ... ... ... ... ... ... ... ATC ... ... ... ... ... ... ... ... ... ... CTC ... ..T ..T ... ... ... ... ... ... ... ATC ..T ... ... ... ... ... ... ... ... ... GGT ..C ..C ..C ..C ..C ..C ..C ..C ..C ..C CCC ... ... ... ... ... ... ... ... ... ... CCA ... ... ... ... ... ... ... ... ..C ... CAC ..T ..T ..T ..T ..T ..T ..T ... ... ... TCC ... ... ... ... ... ..T ... ... ... ... ACC ... ... ... ... ... ..T ... ..T ... ... CAA ... ... ... ... ... ... ... ... ... ... CTA ... ... ... T.. T.G ... ... ... ... ... ACA ... ... ... ... ... ... ... G.. ... ..G TGA ... ... ..G ... ... ... ... ... ... ... CAA ... ... ... ... ... ... ... ... ... ... GAC ... ... ... ... ... ... ... ... ... ... TAC ... ..T ..T ..T ... ..T ..T ... ... ... ATC ... ... ... ... ... ... ... ... ... ... CTA ... ... ... ... ... ... ... ... T.. ... TGA ... ... ... ... ... ... ... ... ... ... CTC ... ... ... ... ... ... ... ..T ... ... CCC ... ... T.. ... ... ... ... ... ... ... ACC ... ... ... ... ... ... ... ... ... ... TAT ..C ..C ..C ..C ..C ..C ..C ..C ..C ... CAA ... ... ... ... ... ..G ... ... ... ... TAC ... ... ... ... ... ... ... ... ... ... ATA ... ... ... ... ... ... ... ..G ... ..G GGA ... ... ... ... ... ..C ... ... ... ... GAA ... ... ... ... ... ... ... ... ... ... ATA ... ... ... ... ... ..G ... ..G ... ... CAC ... ... ... ... ... ... ... ... ... ... TAC ... ... ... ... ... ..T ... ... ..T ... GAC ... ... ... ... ... ..T ... ... ... ... 264 GAA ... ... ... ... ... ... ... ... ..G ... 330 ACA ... ... ... ... ... ... ... ... ... ... 396 TTC ... ..T ... ... ... ... ... ... ... ... Evolução de COII em Cracidae 126 GCT ..C ..C ..C ..C ... ... ..C ... ... ... CGA ... ... ... ... ... ... ... ... ... ... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile CTT ... ... ... ... ..C ..C ... ..C ... ... GAT ... ..C ..C ..C ... ... ..C ... ..C ... TTA ... C.. C.. C.. C.. C.G C.. C.. C.. ... AAC ... ... ... ... ... ... ... ... ... ... GAC ... ... ... ... ..T ... ... ... ... ... TTA ... C.. C.. C.. C.. C.. C.. ... C.. ... Figura 1. Continuação. CGA ... ... ... ... ... ... ... ... ... ... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile CAA ... ... ... ... ... ... ... ... ... ... GTA ..G ... ... ... ... ... ... ... ... ... GAA ... ... ... ... ... ... ... ... ... ... ACC ... ..T ..T ..T ... ..T ..T ... ... ... CTT ... ..C ..C ..C ..C ..C ..C ... ... ... GTA ... ..T ..T ..T ... ..T ..T ... ... ... TCC ... ... ... ... ... ... ... ... ... ... CAC ... ... ... ... ... ... ... ... ... ... GAC ... ..T ..T ..T ..T ..T ..T ... ..T ... TTC ... ... ... ... ..T ... ... ... ... ... TCC ... ..T ..T ..T ..T ... ..T ... ... ... CAC ... ..T ..T ... ... ... ..T ... ... ... GTT A.. A.. A.. A.. A.. A.. A.C A.. A.. A.. TGA ... ... ... ... ... ... ... ... ... ... CGC ... ... ... ... ... ... ... ... ... ... ACC ... ..T ... ... ... ... ... ... ... ... GCT ... ..A ..C ..C ... ... ... ... ... ... ATC ... ..T ..T ..T ... ... ..T ... ..T ... ACT ... ... ... ... ... ... ... ... ... ... GTA ... ..G ... ... ... ... ..G ... ... ... GTA ... ... ... ... ... ... ... ... ... ... CGA ... ..G ..G ..G ... ... ..G ... ..G ... CCT ..C ..C ..C ... ... ... ..C ... ..C ... ATC G.. G.. G.. G.. G.T G.. G.. G.. ... G.. CCT ... ... ... ... ... ... ... ... ... ... ACC ... ... ..T ..T ..T ... ..T ... ..T ... CCC ..T ..T ... ..T ..T ... ... ... ..T ..T GGG ... ... ... ... ... ... ... ... ... ... CTC ... ... ... ... ... ... ... ... ... ... ATA ... ... ... ... ..G ... ... ... ... ... ATT ... ... ... ... ... ... ... ... ... ... GGA ... ... ... ... ... ... ... ... ... ... GAA ... ... ..G ... ... ... ... ... ... ... TTT ... ... ... ... ... ... ... ... ... ... GTC ... A.T A.T A.T ..T ..T A.T ... ... ... TCC ... ... ... ... ... ... ... ... ... ... TAC ... ... ... ... ... ... ... ... ... ... AAA ... ... ... ... ... ... ... ... ... ... CCC ... ... ... ... ... ... ... ... ... ..T GGA ... ... ... ... ..G ... ... ... ... ... ACA ... ... ... ... ... ... ... ... ... ... ATC ... ... ... ... ... ... ... ... ... ... CAG ... ... ... ... ... ..A ... ... ... ... GAC ... ... ... ... ... ... ... ... ... ... CGA ... ... ... ... ... ... ... ... ... ... TGC ... ... ... ... ... ... ... ... ... ... GCA ... ... ... ... ... ... ... ... ... ... GTT ... ... ... ... ... ... ..A ... ... ... TCG ..A ..A ..A ..A ..A ..A ..A ... ..A ..A ATC ... ... ... ... ... ... ... ... ... ... ATC ..T ... ... ... ... ... ... ... ... ... GAA ... ... ... ... ... ... ... ... ... ... CCA ... ... ... ... ... ... ... ... ... ... ATT ... G.C G.C ..C ..C ..C ..C ..C G.. ..C 462 ACA ... ..T ..C ..T ..T ..C ..C ... ... ... 528 GGC ... ... ... ... ... ... ... ... ... ... 594 ATC ... ... ... ... ... ... ... ... ... ... Evolução de COII em Cracidae 127 TGA ... ... ... ... ... ... ... ... ... ... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile TCT ..C ..C ... ..C ... ... ..C ... ... ... GGA ... ..G ..G ..G ..G ... ..G ..G ... ... ACA ... ..C ..C ..T ... ... ..C ... ... ... GCC ... ..T ..T ..T ... ..T ..T ... ... ... Figura 1. Continuação. TGT ..C ... ..C ..C ..C ... ..C ... ..C ... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile CTG ... ... ... ... ... ... ... ... ... ... AAT ... ..C ..C ..C ..C ..C ..C ... ..C ... CTA ... ... T.. T.. ... ... ... ... ... T.. CAC ... ... ... ... ... ... ... ... ... ... TCA ... ... ... ... ... ... ... ... ... ... AGC ... ... ... ... ... ... ... ... ... ... TCC ..T ..T C.T ..T ... ..T ..T ... ..T ... TAC ... ... ... ... ... ... ... ... ..T ... 684 TAA ... ... ... ... ... ... ... ... ... ... ATG ... ... ... ... ..A ... ... ..A ..A ... CCC ... ..T ..T ..T ... ..T ..T ..A ..T ... ATC ... ... ... ... ... ... ... ... ... ... GTA ... ... ... ... ... ..G ... ... ... ... GTA ... ... ... ... ... ... ... ... ... ... GAA ... ... ... ... ... ... ... ... ... ... TCT ..C ..C ..C ..C ..C ... ..C ... ... ... ACT ..C G.. ... ... ..C G.C ... ... ... ... CCC ... ... ... ... ... ..T ... ... ..T ... CTC .C. ... ... ... ... ... ... ..T ... ... AAG ... ... ... ..A ... ... ... ..A ... ... CAC ..T ... ... ... ... ... ... ... ... ... TTC .C. ..T ..T ..T ..T ..T ..T ... ... ... GAA ... ... ... ... ... ... ... ... ... ... 660 GCC ... ... ... ... ... ... ... ... ... ... Evolução de COII em Cracidae 128 Evolução de COII em Cracidae Composição de bases e padrões de substitutição de nucleotídeos A composição de bases para toda a sequência de COII de cracídeo e para cada uma das posições do códon é apresentada na tabela 1. Estas seqüências se mostraram homogêneas quanto à composição de bases (χ2=2,23, g.l..=30, P=1,00). A hipótese de composição de bases estacionária não foi rejeitada (P=0,72) ao nível de significância de 0,05 (P=0,94, 1,0, e 0,53, respectivamente para a primeira, segunda e terceira posições do códon). Tabela 1. Composição de bases (%) para representantes de onze gêneros de Cracidae. Gênero Todas as posições 1a posição do códon A T C G A T C G Aburria 30.3 23.5 31.9 14.3 24.6 19.7 27.2 28.5 Chamaepetes 29.8 22.2 33.2 14.8 24.6 19.3 27.6 28.5 Crax 30.0 24.1 31.3 14.6 24.1 19.3 27.6 28.9 Mitu 29.5 23.7 31.9 14.9 24.6 19.7 27.2 28.5 Nothocrax 30.4 23.8 31.7 14.0 25.4 19.7 27.2 27.6 Oreophasis 29.4 23.4 32.0 15.2 24.6 19.3 27.6 28.5 Ortalis 29.4 24.0 31.7 14.9 24.1 18.0 28.9 28.9 Pauxi 30.0 23.4 32.0 14.6 25.0 19.3 27.6 28.1 Penelope 30.1 24.0 31.3 14.6 24.1 19.7 27.2 28.9 Penelopina 29.8 24.3 31.3 14.6 24.6 19.7 27.2 28.5 Pipile 30.1 23.8 31.6 14.5 24.6 20.2 26.8 28.5 Média 29.9 23.7 31.8 14.6 24.6 19.5 27.5 28.5 Gênero 2a posição do códon 3a posição do códon A T C G A T C G Aburria 27.6 36.4 25.9 10.1 38.6 14.5 42.5 4.4 Chamaepetes 27.6 35.5 26.8 10.1 37.3 11.8 45.2 5.7 Crax 27.6 36.4 25.9 10.1 38.2 16.7 40.4 4.8 Mitu 27.6 36.4 25.9 10.1 36.4 14.9 42.5 6.1 Nothocrax 27.6 36.4 25.9 10.1 38.2 15.4 42.1 4.4 Oreophasis 27.6 36.4 25.9 10.1 36.0 14.5 42.5 7.0 Ortalis 27.6 36.4 25.9 10.1 36.4 17.5 40.4 5.7 Pauxi 27.6 36.4 25.9 10.1 37.3 14.5 42.5 5.7 Penelope 27.6 36.4 25.9 10.1 38.6 15.8 40.8 4.8 Penelopina 27.6 36.4 25.9 10.1 37.3 16.7 40.8 5.3 Pipile 27.6 36.4 25.9 10.1 38.2 14.9 42.1 4.8 Média 27.6 36.3 26.0 10.1 37.5 15.2 42.0 5.3 O gene da COII de Cracidae possui composição de bases enviesada. O índice de enviesamento composicional foi de 0.069 considerando todas as posições do códon (tabela 2). A primeira posição do códon apresentou uma leve diferença na composição de bases, com aumento do conteúdo de G e redução de T (EC=0,079). A segunda posição 129 Evolução de COII em Cracidae possui alto conteúdo de T e baixo de G (EC=0,198). As maiores diferenças são observadas na terceira posição (EC=0,393). O gene da COII de Cracidae apresentou heterogeneidade de taxa de substituição entre os sítios (α=0,16 para todas as posições do códon; α= 0,07; 97,03 e 2,41 para a primeira, segunda e terceira posição do códon, respectivamente). Tabela 2. Índices de enviesamento composicional estimados para cada posição do códon do gene da COII de Cracidae e de outros grupos de metazoários. Grupo 1a 2a 3a Referência Cracidae (11 espécies) 0.079 0.198 0.393 Este estudo Primatas (25 espécies) 0.065 0.185 0.292 Adkins e Honeycutt, 1994 Insetos Pterigotos (13 espécies) 0.175 0.233 0.490 Liu e Beckenbach, 1992 Collembola (15 espécies) 0.092 0.185 0.285 Frati et al., 1997 As transições TC superaram as transições AG, e as transversões entre CG foram raras e TG não foram observadas (tab. 3). A segunda posição do códon é altamente conservada. De fato, apenas duas substituições de nucleotídeos ocorreram (Chamaepetes apresentou um T ao invés de um C nas posições 664 e 653). A primeira e a terceira posição do códon tem taxas intermediárias e altas de substituição de nucleotídeos, como observado para outros genes mitocondriais. A figura 2 apresenta graficamente o número de transições e transversões para cada comparação par-a-par entre as 11 espécies de Cracidae estudadas aqui. Claramente, o nível de saturação das substituições no gene da COII não foi alcançado. Nenhuma transversão foi observada na primeira e na segunda posição do códon. A terceira posição apresentou 278 transversões. O número de transições observados para a primeira, segunda e terceira posições do códon foram 370, 20, e 2201, respectivamente. A razão de transição/transversão (TS/TV) para o COII de cracídeos foi de 18,03. As comparações par-a-par para táxons mais proximamente relacionados tiveram razões TS/TV maiores do que para táxons mais distantemente relacionados, como por exemplo, 25,0 para Aburria-Penelope (gêneros próximos) e 8,4 para Aburria-Mitu (gêneros distantes)(Tab. 3). 130 Evolução de COII em Cracidae Tabela 3. Razão de transição/transversão (TS/TV), número de transições (AG, TC) e transversões (AT, AC, TG, CG) observadas para cada comparação par-apar em onze gêneros de Cracidae. * - nenhuma transversão foi encontrada nestes casos, e a razão TS/TV não foi calculada. Comparação TS/TV AG TC AT AC TG CG Comparação TS/TV AG TC AT AC TG CG Aburria-Chamaepetes * 9 27 0 0 0 0 Mitu-Nothocrax * 8 17 0 0 0 0 Aburria-Crax 6.625 12 41 5 3 0 0 Mitu-Oreophasis 9.600 14 34 2 3 0 0 Aburria-Mitu 8.429 13 46 2 4 1 0 Mitu-Ortalis 18.667 18 38 0 3 0 0 Aburria-Nothocrax 7.571 14 39 5 2 0 0 Mitu-Pauxi 21.000 6 15 1 0 0 0 Aburria-Oreophasis 8.000 16 32 3 3 0 0 Mitu-Penelope 8.125 15 50 3 4 1 0 Aburria-Ortalis 8.667 12 40 3 3 0 0 Mitu-Penelopina 6.875 13 42 1 6 1 0 Aburria-Pauxi 6.875 12 43 4 4 0 0 Mitu-Pipile 8.286 12 46 2 4 1 0 Aburria-Penelope 25.000 10 15 0 1 0 0 Nothocrax-Oreophasis 8.000 14 26 3 2 0 0 Aburria-Penelopina 45.000 10 35 0 1 0 0 Nothocrax-Ortalis 16.000 18 30 1 2 0 0 Aburria-Pipile * 5 8 0 0 0 0 Nothocrax-Pauxi 18.000 4 14 1 0 0 0 Chamaepetes-Crax 6.750 11 43 4 4 0 0 Nothocrax-Penelope 7.125 14 43 6 2 0 0 Chamaepetes-Mitu 8.571 12 48 1 5 1 0 Nothocrax-Penelopina 7.375 16 43 4 4 0 0 Chamaepetes-Nothocrax 7.714 13 41 4 3 0 0 Nothocrax-Pipile 7.143 13 37 5 2 0 0 Chamaepetes-Oreophasis 8.167 13 36 2 4 0 0 Oreophasis-Ortalis 9.333 18 38 2 4 0 0 Chamaepetes-Ortalis 10.500 15 48 2 4 0 0 Oreophasis-Pauxi 7.500 12 33 3 3 0 0 Chamaepetes-Pauxi 6.500 11 41 3 5 0 0 Oreophasis-Penelope 7.571 16 37 3 4 0 0 Chamaepetes-Penelope 45.000 13 32 0 1 0 0 Oreophasis-Penelopina 7.857 18 37 3 4 0 0 Chamaepetes-Penelopina 45.000 11 34 0 1 0 0 Oreophasis-Pipile 7.833 15 32 3 3 0 0 Chamaepetes-Pipile * 8 27 0 0 0 0 Ortalis-Pauxi 12.250 16 33 1 3 0 0 Crax-Mitu 25.000 6 19 0 1 0 0 Ortalis-Penelope 7.429 16 36 4 3 0 0 Crax-Nothocrax 20.000 8 12 0 1 0 0 Ortalis-Penelopina 9.143 18 46 2 5 0 0 Crax-Oreophasis 8.000 14 34 3 3 0 0 Ortalis-Pipile 8.833 11 42 3 3 0 0 Crax-Ortalis 11.500 14 32 1 3 0 0 Pauxi-Penelope 6.778 14 47 5 4 0 0 Crax-Pauxi 9.500 4 15 2 0 0 0 Pauxi-Penelopina 6.111 14 41 3 6 0 0 Crax-Penelope 6.556 14 45 6 3 0 0 Pauxi-Pipile 7.000 11 45 4 4 0 0 Crax-Penelopina 6.556 12 47 4 5 0 0 Penelope-Penelopina 24.500 12 37 1 1 0 0 Crax-Pipile 6.500 11 41 5 3 0 0 Penelope-Pipile 24.000 9 15 0 1 0 0 Penelopina-Pipile 48.000 11 37 0 1 0 0 131 Evolução de COII em Cracidae 70 60 Transição 50 40 30 20 10 0 0 2 4 6 8 10 Transversão Figura 2. Relação entre transição e transversão para todas as comparações par-a-par entre os gêneros de Cracidae. A hipótese de constância de taxa de substituição entre os gêneros de Cracidae não foi rejeitada ao nível de 5% (Z = 0,630923). Então, a taxa evolutiva para as seqüências de COII de cracídeos foi estimada em 0,68% substituições por sítio por milhão de anos. Uso preferencial de códons A tabela 4 mostra a frequência média dos códons e o uso relativo de códons sinônimos (RSCU) para o gene COII de Cracidae. Podemos observar que os códons para a leucina terminados em G foram raramente usados. O mesmo é verdadeiro para a alanina. Este aminoácidos representam casos de códons bi e tetradegenerados. Todas as seqüências de COII dos gêneros de Cracidae iniciam com ATG (um dos dois códons para a metionina). Dos quatros códons de parada do genoma mitocondrial de mamíferos, apenas TAA é usado para terminar a transcrição de COII nos representantes dos onze gêneros de Cracidae estudados aqui. 132 Evolução de COII em Cracidae Tabela 4. Frequencia média dos códons (f) e uso relativo de códons sinônimos ("average codon frequencies and relative synonymous codon usage"-RSCU) para a COII de Cracidae. Os aminoácidos (aa) estão representados de acordo com o código de três letras. Stop representa os códons de parada. aa codon f (RSCU) aa codon f (RSCU) Phe TTT 2.5 (0.64) Ser TCT 2.2 (0.72) TTC 5.4 (1.36) TCC 7.5 (2.47) Leu TTA 3.2 (0.62) TCA 6.1 (2.02) TTG 0.2 (0.04) TCG 0.4 (0.12) CTT 5.0 (0.97) Pro CCT 3.0 (0.92) CTC 7.9 (1.54) CCC 5.1 (1.56) CTA 12.7 (2.47) CCA 4.9 (1.50) CTG 1.9 ( 0.37) CCG 0.0 (0.03) Ile ATT 5.3 (0.55) Thr ACT 4.8 (1.23) ATC 13.9 (1.45) ACC 6.9 (1.76) Met ATA 7.8 (1.56) ACA 3.9 (0.99) ATG 2.2 (0.44) ACG 0.0 (0.02) Val GTT 2.9 (0.79) Ala GCT 2.7 (0.76) GTC 3.3 (0.88) GCC 8.9 (2.50) GTA 7.9 (2.13) GCA 2.6 (0.74) GTG 0.7 (0.20) GCG 0.0 (0.00) Tyr TAT 1.1 (0.27) Cys TGT 0.5 (0.36) TAC 6.9 (1.73) TGC 2.5 (1.64) Stop TAA 1.0 (4.00) Trp TGA 4.9 (1.96) Stop TAG 0.0 (0.00) TGG 0.0 (0.04) His CAT 1.2 (0.26) Arg CGT 0.0 (0.00) CAC 7.8 (1.74) CGC 1.0 (0.80) Gln CAA 6.3 (1.57) CGA 3.5 (2.84) CAG 1.7 (0.43) CGG 0.5 (0.36) Asn AAT 0.7 (0.36) Ser AGT 0.0 (0.03) AAC 3.3 (1.64) AGC 1.9 (0.63) Lys AAA 3.7 (1.46) Stop AGA 0.0 (0.00) AAG 1.4 (0.54) Stop AGG 0.0 (0.00) Asp GAT 2.5 (0.35) Gly GGT 0.0 (0.05) GAC 11.5 (1.65) GGC 2.0 (1.00) Glu GAA 12.5 (1.80) GGA 4.3 (2.14) GAG 1.4 (0.20) GGG 1.6 (0.82) Inferência das seqüências de aminoácidos A seqüência de aminoácido da subunidade II da citocromo c oxidase (fig. 3) foi inferida a partir das seqüências de nucletídeos. A seqüência de aminoácidos é altamente conservada entre os onze gêneros de Cracidae. Apenas 11 resíduos são váriáveis e destes apenas 4 são parcimoniosamente informativos. A maioria das substituições de aminoácidos foi observada na extremidade 3’ da seqüência. Comparadas às seqüências de COII das espécies de primatas e insetos, as seqüências de aminoácidos de COII de Cracidae, de outras aves, do crocodilo e da 133 Evolução de COII em Cracidae tartaruga apresentam uma deleção de um aminoácido na posição 30, e uma inserção de um aminoácido na extremidade 3’. A posição real desta inserção não pode ser precisamente inferida, uma vez que a região entre os aminoácidos 225 e 227 apresentam uma alta variação de nucleotídeos, dificultando a determinação precisa de homologia posicional entre os nucleotídeos. Este evento de inserção/deleção na posição 30 da seqüência de aminoácido faria com que as posições conservadas como limites dos domínios transmembrânicos, posições dos aminoácidos ligados ao cobre, e outras posições de aminoácidos tivessem a numeração deslocada em um número a menos nos cracídeos e nas outras aves do que em relação à numeração descrita no modelo estrutural esquemático proposto por Millet et al. (1983). Para evitar conflitos, a numeração dada pelo modelo de Millet e colaboradores foi mantida, apesar dos aminoácidos nas posições entre 30 e 227 na seqüência do COII de Cracidae estarem na realidade uma posição aquém da correspondente no modelo estrutural; este procedimento possibilitou a comparação dos dados apresentados com os existentes na literatura. Nossos resultados mostraram que a alça N-terminal é altamente conservada entre os Cracidae. Apenas Nothocrax possui uma substituição no resíduo 18, devido a uma mudança de um nucleotídeo G para A na posição 52, correspondente à primeira posição de um códon (Fig. 1). Isto provoca uma modificação de um resíduo ácido Glu presente na maioria das espécies para um resíduo básico Lis. Todos os 15 e 18 sítios de nucleotídeos que são variávies no domínios transmembrânicos I e II, e 10 nucleotídeos do segmento entre estes dois domínios levaram a substituições sinônimas de aminoácidos. O domínio globular C-terminal possui 10 substituições de aminoácidos, todas envolvendo mudanças de e para resíduos neutros. 134 QILYMMDEID .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... SWAVPTLGVK .......... ........I. ........I. ........I. .......... .......... ........I. .......... .......... .......... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile TDAIPGRLNQ .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... EPDLTLKAIG .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... DASSPIMEEL .......... .......... .......... .......K.. .......... .......... .......... .......... .......... .......... TSFVTTRPGI ...I...... ...I...... ...I...... ...I...... ...I...... ...I...... ...I...... ...I...... ...I...... ...I...... HQWYWTYEYT .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... VEFHDHALMV .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... FYGQCSEICG .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... DFKDLSFDSY .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... ALAICSLVLY .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... ANHSYMPIVV .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... MIPTTDLPQG .......... .......... .......S.. .......... .......... .......... .......... ....A..... .......... .......... LLTLMLMEKL .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... ESTPLKHFEA ....P..S.. ..A....... .......... .......... .......... ..A....... .......... .......... .......... .......... HFRLLEVDHR .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... SSNTVDAQEV .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... WSTLLSS* ........ ........ ......P. ........ ........ ........ ........ ........ ........ ........ IVIPMESPIR ..V....... ..V....... ..V....... ..V....... ..V....... ..V....... ..V....... ..V....... .......... ..V....... ELIWTILPAI .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... VIITADDVLH .......... ..V....... ..V....... .......... .......... .......... .......... .......... ..V....... .......... VLILLALPSL .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... Figura 3. Seqüência de aminoácidos para a subunidade II da citocromo c oxidase inferidos a partir das seqüências de nucleotídeos da figura 1. MANHSQLGFQ .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... Aburria Chamaepetes Crax Mitu Nothocrax Oreophasis Ortalis Pauxi Penelope Penelopina Pipile Evolução de COII em Cracidae 135 Evolução de COII em Cracidae Discussão As seqüências do gene da subunidade II da citocromo c oxidase para os onze representantes da família Cracidae e um representante de Megapodiidae apresentaram um comprimento total de 648 nucleotídeos. Variações neste tamanho foram observadas nas aves ratitas Rhea americana (Harlid et al., 1998) e Struthio camelus (Harlid et al., 1997) onde havia três nucleotídeos extras na extremidade 3'. Diversas seqüências completas de COII de primatas também apresentaram o mesmo tamanho que as de cracídeos, embora as seqüências de Alouatta e Lagothrix apresentaram 12 nucleotídeos a mais, também na extremidade 3' (Adkins e Honeycutt, 1994). A extremidade 3’ da COII em diversas espécies de insetos Collembola também apresentaram inserção de nucleotídeos, variando o tamanho do gene entre 669 e 684 nucleotídeos (Frati et al., 1997). Além disso, Frati et al. (1997) relataram que entre as posições correspondentes aos aminoácidos 120-133 há eventos de inserção e deleção de nucleotídeos. Parece que estas regiões do gene da COII em metazoários não estão sujeita a forte seleção e portanto estão mais sujeitas à variação. Contudo, de maneira geral, o gene da citocromo c oxidase II é bastante conservado, como seria esperado para um gene codificante de uma proteína altamente conservada da cadeia respiratória de plantas, animais, e protistas (Stryer, 1995). Padrão de substituição de nucleotídeos O padrão de substituição de bases da subunidade II do gene da citocromo c oxidase em cracídeos é similar ao padrão observado em outros metazoários (Adkins e Honeycutt, 1994; Liu e Beckenbach, 1992; Frati et al., 1997; Brown, 1985; Janecek et al., 1996): a composição de bases é enviesada, especialmente na terceira posição do códon, estacionária, e considerável heterogeneidade de taxas de substituição entre os sítios foi detectada. O nível de saturação de substituições entre as espécies de cracídeos aqui analisadas não foi atingido, o que reflete em uma alta razão de TS/TV o que é esperado para táxons filogeneticamente próximos. Estes dados aumentam o corpo de evidências de que o DNA mitocondrial evolui de uma maneira complexa. 136 Evolução de COII em Cracidae A taxa de evolução estimada para as sequências de COII em Cracidae (0,68%/sítio/Ma) é similar a taxa estimada para algumas espécies de bovinos (variação de 0,76 a 2,64%; Janecek et al., 1996), Contudo, salientamos que a estimativa de taxas de evolução é um assunto bastante controverso e que ainda não foi criteriosamente explorado. Por exemplo, diferentes autores empregam diferentes calibrações para as substituições de nucleotídeos: Klicka e Zink (1997) estimaram que o DNA mitocondrial apresenta uma taxa de substituição de 2% por milhão de anos para táxons com divergência até 10 milhões de anos, baseado em dados de fragmentos de restrição; Irwin et al. (1991) estimaram que seqüências do cit b que apresentam saturação de transições, evoluem a uma taxa de cerca de 0,5% de transversões na terceira posição do códon por milhão de anos; Janecek et al. (1996) se basearam em dados paleontológicos bem estabelecidos (Savage e Russel, 1983) para calibrar a taxa de evolução de COII em bovinos. Salientamos que as estimativas de taxas de substituição nucleotídicas realizadas em diferentes estudos é de difícil comparação, e que, até que este assunto seja devidamente explorado, as estimativas deveriam somente ser realizadas entre diferentes genes de um mesmo grupo de organismos com a finalidade de avaliar a taxa de evolução relativa entre estes genes, como realizado no capítulo 5 desta tese. Embora a seqüência do COII de Megapodius apresente aspectos similares aos descritos no parágrafo anterior, o primeiro codon em sua seqüência é GTG (Valina), também encontrado em COII das aves ratitas (Harlid et al., 1997,1998; Mindell et al., 1999). Nos demais organismos comparados neste estudo, o códon inicial é ATG (Metionina). Padrões similares de iniciação da transcrição usando códons não-ATG já foram relatados para outros genes mitocondriais em diferentes organismos (Zardoya e Meyer, 1997; Desjardins e Moraes, 1990; Janke et al., 1994; e referências citadas nestes trabalhos). Padrão de substituição de aminoácidos e uso de códons A maioria das mudanças de nucleotídeos ocorridas no COII de Cracidae levou a substituições sinônimas, especialmente na porção 3'. As poucas mudanças de 137 Evolução de COII em Cracidae aminoácidos ocorridas é caracterizada por trocas entre aminoácidos fisicoquimicamente semelhantes, exceto no resíduo 18 de Nothocrax que apresenta uma lisina, um aminoácido básico, ao invés de uma glutamina, um resíduo ácido. Outros metazoários analisados não apresentaram modificação de aminoácido nesta posição (Adkinks e Honeycutt, 1994; Desjardins e Morais, 1990; Frati et. al., 1997; Emerson e Wallis, 1995; Harlid e Arnason, 1999; Janecek et al., 1996; Mindell et al., 1998; Harlid et al., 1997, 1998). A deleção de um resíduo na posição 30 da seqüência de aminoácidos parece não interferir no funcionamento da citocromo oxidase, uma vez que todas as aves analisadas, o crocodilo, e a tartaruga não apresentam este aminoácido quando comparado com os primatas (Alanina, Isoleucina, e Treonina) e insetos (Isoleucina). Todas as substituições de nucleotídeos ocorridas nas duas alfa-hélices correspondentes ao modelo estrutural de Capaldi et al (1973) mostraram substituições sinônimas em cracídeos. O mesmo foi encontrado em insetos Collembola (Frati et al., 1997) e em mamíferos membros da subfamília Bovinae (Janecek et al., 1996), mas não em comparações entre diferentes famílias de primatas (Adkins e Honeycutt, 1984), embora a hidrofobicidade seja mantida neste domínio transmembrânico. A região rica em triptofano entre os resíduos 104-110 também foi identificada em Cracídeos no presente estudo, assim como nos demais metazoários. Dos resíduos considerados conservados no domínio globular C-terminal, apenas Glu-114 não está presente no COII de cracídeos. De fato, outros aminoácidos foram propostos serem substitutos. Um deles, o resíduo Glu-109 é conservado em insetos, mamíferos e nos cracídeos. Outro resíduo, Glu-117, é conservado em Collembola, mas não em outros insetos (serina, ácido aspártico), mamíferos (diversos aminoácidos) e nas aves (alanina, serina, treonina). Um terceiro candidato, Asp-119, é conservado apenas em Collembola (Frati et al., 1997), Cracidae e outras aves (Harlid e Arnason, 1999; Mindell et al., 1998; Desjardins e Morais, 1990; Harlid et al., 1997, 1998), e em alguns mamíferos (Janecek et al., 1996). Possivelmente diferentes grupos animais "elegeram" diferentes resíduos para serem substitutos do resíduo Glu-114. Uma outra possibilidade é que 138 Evolução de COII em Cracidae apenas os resíduos Asp-112 e Asp-158 sejam críticos para o funcionamento do centro ativo. Dos resíduos propostos de estarem envolvidos na ligação com o íon de cobre no modelo estrutural do COII, todos se mostraram conservados em Cracidae (presente estudo), em outras aves e répteis (Harlid e Arnason, 1999; Mindell et al., 1998; Desjardins e Morais, 1990; Harlid et al., 1998; Harlid et al., 1997; Janke e Arnason, 1997, Mindell et al., 1999), mamíferos (Adkins e Honeycutt, 1994; Capaldi et al., 1990; Janecek et al., 1996; Millet 1983), artrópodos (Frati et al., 1997; Duering et al., 1999), em um molusco (Lecanidou et al., 1994), e bacterias (Iwata et al., 1995). O primata Theropithecus (Adkins e Honeycutt, 1994) e bovinos (Janecek et al., 1996) são uma exceção, pois apresentam uma substituição de His-200 por Glu. A estimativa do uso relativo de códons sinônimos mostrou que há a preferência pelo uso de certos códons no COII de Cracidae, como os terminados em G para a leucina e o códon GCG para a alanina. A preferência do uso destes códons bi ou tetradegenerados foi detectada também em outros organismos. De fato, eucariotos e procariotos mostram este padrão preferencial (e.g., Brown, 1985 Li, 1997; Grahtham et al., 1980; Janecek et al., 1996). Quanto aos códons de iniciação de tradução, todos as sequências de cracídeos obtidas mostraram que o COII é iniciado pelo códon ATG, similar ao usado por muitos outros grupos vertebrados (por exemplo, Adkins e Honeycutt, 1994; Delarbre et al., 1998; Desjardins e Morais, 1990; Duering et al., 1999; Janecek et al., 1996; Kumazawa et al., 1998; Mindell et al., 1999; Zardoya e Meyer, 1998; Zardoya e Meyer, 1997). Contudo, outras aves como o megapodídeo Megapodius reinwardt usado neste trabalho e as ratitas (Harlid et al., 1997, 1998), e o hemicordata Balanoglossus carnosus (Castrenata et al., 1998) apresentam GTG e os crocodilos ATA (Janke e Arnason, 1997; Mindell et al., 1999) como primeiro códon da sequência. Entre os insetos (Collembola) também há variação de códons iniciais para este gene (ATC, ATT, ATA), não sendo relatado o uso de ATG ou GTG (Frati et al., 1997). Em genes nucleares de mamíferos, outros códons além do ATG parecem ser os iniciais da transcrição (Hann et al., 1988; Peabody, 1989). 139 Evolução de COII em Cracidae Igualmente às outras aves (Mindell et al., 1998; Desjardins e Morais, 1990; Harlid et al., 1997, 1998), mamíferos placentários (Janecek et al., 1996) e muitos insetos artrópodos (Frati et al., 1997), o códon de terminação presente nas sequências de cracídeos foi TAA, constrastando com o códons T ou TA incompletos para este gene encontrado em peixes ósseos e cartiloginosos (por exemplo, Zardoya e Meyer, 1997; Delarbre et al., 1998), répteis (Kumazawa et al., 1998; Zardoya e Meyer, 1998) e mamíferos marsupiais (por exemplo, Janke et al., 1994, 1997), que se acredita ocorrer poliadenilação para transformá-lo em um códon completo de terminação (Ojala et al., 1981). Nossos resultados mostraram que as sequências da subunidade II da citocromo c oxidase de cracídeos são similares às de outros grupos de Aves, e que a variação entre as Aves parece ser menor do que a relatada para outros grupos animais. Referências Adachi J, Hasegawa M (1994). MOLPHY, Molecular Phylogenetics. Version 2.2 Adkins RM, Honeycutt RL (1994). Evolution of the primate cytochrome c oxidase subunit II gene. J. Mol. Evol. 38: 215-231. Brown WM (1985). The mitochondrial genome of animals. In: "Molecular Evolutionary Genetics", RJ MacIntyre. Plenum Press, New York. pp 95-130. Capaldi RA (1990). Structure and function of cytochrome c oxidase. Annu. Rev. Biochem. 59: 569-596. Capaldi RA, Malatesta F, Darley-Usmar VM (1983). Structure of cytochrome c oxidase. Biochimica et Biophysica Acta 726: 135-148. Castresana J, Feldmaier-Fuchs G, Yokobori S, Satoh N, Pääbo S (1998). The mitochondrial genome of the hemichordate Balanoglossus carnosus and the evolution of deuterostome mitochondria. Genetics 150: 1115-1123. Collar NJ, Gonzaga LP, Krabbe N, Madroño Nieto A, Naranjo LG, Parker III TA, Wege DC (1992). "Threatened birds of the Americas. The ICBP/IUCN Red Data Book". 3rd Edition, part 2. Smithsonian Institution Press. Delarbre C, Spruyt N, Delmarre C, Gallut C, Barriel V, Janvier P, Laudet V, Gachelin G (1998). The complete nucleotide sequence of the mitochondrial DNA of the dogfish, Scyliorhynus canicula. Genetics 150: 331-344. 140 Evolução de COII em Cracidae Desjardins P, Morais R (1990). Sequence and gene organization of the chicken mitochondrial genome. A novel gene order in higher vertebrates. J. Mol. Biol. 212: 599-634. Duering A, Brueckner M, Mossakowski D (1999). Differences between gene tree and organismal tree? Mitochondrial genes and the phylogenetic relationships of the Chrysocarabus species. Mitt. Dtsch. Ges. Allg. Entomol. in press. Emerson BC, Wallis GP (1995). Phylogenetic relationships of the Prodontia (Coleptera: Scarabaeidae; Subfamily Melolonthinae), derived from sequence variation in the mitochondrial cytochrome oxidase II gene. Mol. Phylogenet. Evol. 4: 433-447. Frati F, Simon C, Sullivan J, Swofford DL (1997). Evolution of the mitochondrial oxidase II gene in Collembola. J. Mol. Evol. 44: 145-158. Grantham R,Gautier C, Gouy M, Mercier R, Pave A (1980). Codon catalog usage and the genome hypothesis. Nucleic Acids Res. 8: r49-r62. Hann SR, King MW, Bentley DL, Anderson CW, Eisenman RN (1988). A non-AUG translational initiation in c-myc exon 1 generates a N-terminally distinct protein whose synthesis is disrupted in Burkitt's lymphomas. Cell 52: 185-195. Harlid A, Arnason U (1999). Analyses of mitochondrial DNA nest ratite birds within the Neognathae-supporting a neotenous origin of ratite morphological characters. Proc. R. Soc. Lond. B266: 305-309. Harlid A, Janke A, Arnason U (1998). The complete mitochondrial genome of Rhea americana and early avian divergences. J. Mol. Evol. 46: 669-679. Harlid A, Janke A, Arnason U (1997). The mtDNA sequence of the ostrich and the divergence between paleognathous and neognathous birds. Mol. Biol. Evol. 14: 754-761. Honeycutt RL, Nedbal MA, Adkins RM, Janecek LL (1995). Mammalian mitochondrial DNA evolution: a comparison of the cytochrome c oxidase II genes. J. Mol. Evol. 40: 260-272. Irwin DM, Kocher TD, Wilson AC (1991). Evolution of the cytochrome b gene of mammals. J. Mol. Evol. 32:128-144. Iwata S, Ostermeier C, Ludwig B, Michel H (1995). Structure at 2.8Å resolution of cytochrome c oxidase from Paracoccus denitrificans. Nature 376: 660-669. Janecek LL, Honeycutt RL, Adkins RM, Davis SK (1996). Mitochondrial gene sequences and the molecular systematics of the artiodactyl subfamily Bovinae. Mol. Phylog. Evol. 6: 107-119. Janke A, Arnason U (1997). The complete mitochondrial genome of Alligator mississippiensis and the separation between recent archosauria (birds and crocodiles). Mol. Biol. Evol. 14: 1266-1272. 141 Evolução de COII em Cracidae Janke A, Feldmaier-Fuchs G, Thomas WK, von Haeseler A, Pääbo S (1994). The marsupial mitochondrial genome and the evolution of placental mammals. Genetics 137: 243-256. Janke A, Xu X, Arnason U (1997). The complete mitochondrial genome of the wallaroo (Macropus robustus) and the phylogenetic relationship among Monotremata, Marsupialia, and Eutheria. Proc. Natl. Acad. Sci. USA 94: 1276-1281. Klicka J, Zink RM (1997). The importance of recent ice ages in speciation: a failed paradigm. Science 277: 1666-1669. Kumar S (1996). PHYLTEST, a program for phylogenetic hypothesis testing. Version 2.0. Kumar S, Tamura K, Nei M (1993). MEGA, Molecular evolutionary genetics analysis. Version 1.01. The Pennsylvannia State University. Kumasawa Y, Ota H, Nishida M, Ozawa T (1998). The complete nucleotide sequence of a snake (Dinodon semicarinatus) mitochondrial genome with two identical control regions. Genetics 150: 313-329. Lecanidou R Douris V, Rodakis GC (1994). Novel features of metazoan mtDNA revealed from sequence analysis of three mitochondrial DNA segments of the land snail Albinaria turrita (Gastropoda: Clausiliidae). J. Mol. Evol. 38: 369-382. Li W-H (1997). "Molecular Evolution". Sinauer Associates. Sunderland, MA. Liu H, Beckenback AT (1992). Evolution of the mitochondrial cytochrome oxidase II gene among 10 orders of insects. Mol. Phylogenet. Evol. 1: 41-52. Millett F, de Jong C, Paulson L, Capaldi RA (1983). Identification of specific carboxylate groups on cytochrome c oxidase that are involved in binding cytochrome c. Biochemistry 22: 546552. Mindell DP, Sorenson MD, Dimcheff DE (1998). Multiple independent origins of mitochondrial gene order in birds. Proc. Natl. Acad. Sci. USA 95: 10693-10697. Mindell DP, Sorenson MD, Dimcheff DE, Hasegawa M, Ast JC, Yuri T (1999). Interordinal relationships of birds and other reptiles based on whole mitochondrial genomes. Syst. Biol. 48: 138-152. Ojala D, Montoya J, Attardi G (1981) tRNA punctuation model of RNA processing in human mitochondria. Nature 290: 470-474. Peabody DS (1989). Translational initiation at non-AUG triplets in mammalian cells. J. Biol. Chem. 264: 5031-5035. Savage D, Russell DE (1983). "Mammalian Paleofaunas of the World", Addison-Wesley, Reading, MA, USA. 142 Evolução de COII em Cracidae Stryer L (1995). "Biochemistry". WH Freeman e Company. New York, NY. Zardoya R, Meyer A (1996). Phylogenetic performance of mitochondrial protein-coding genes in resolving relationships among vertebrates. Mol. Biol. Evol. 13: 933-942. Zardoya R, Meyer A (1998). Complete mitochondrial genome suggests diapsid affinities of turtles. Proc. Natl. Acad. Sci. USA 95: 14226-14231. Zardoya R, Meyer A (1997). The complete DNA sequences of the mitochondrial genome of a "living fossil", the coelacanth (Latimeria chalumnae). Genetics 146: 995-1010. 143 Capítulo 7 Considerações Finais 144 Considerações finais CONSIDERAÇÕES FINAIS Nas últimas décadas o uso do DNA mitocondrial (mtDNA) tornou-se comum em estudos evolutivos. Inicialmente buscou-se avaliar o grau de polimorfismo genético encontrado em grupos específicos de organismos por meio de diversas enzimas de restrição (Tarr e Fleischer, 1989; Zink, 1993; Zink e Dittmann, 1993). Posteriormente com o aprimoramento das técnicas de seqüenciamento e da automatização, o desenvolvimento da técnica de reação em cadeia da polimerase (PCR), a obtenção de seqüências de ácidos nucléicos passou a ser um trabalho rotineiro em muitos laboratórios. Desta maneira, genes mitocondriais específicos passaram a ser alvo dos estudos ornitológicos que visam distinguir populações de uma mesma espécie e a suas histórias evolutivas (Ball et al., 1988; Baker e Marshall, 1997; Freitag e Robinson, 1993), relações filogenéticas (Cooper et al., 1992; Miyaki et al., 1998, Nahum et al., submetido), definição de espécies (García-Moreno e Fjeldsa, 1999) e estimativa da diversidade genética (Gutierrez, 1994), além da própria evolução dos genes mitocondriais (Arctander, 1995; Griffiths, 1997, 1998; Randi e Lucchini, 1998). O sucesso do mtDNA como marcador em estudos evolutivos e filogenéticos se deve a várias características: a) compactação dos genes, com poucos nucleotídeos não codificantes entre os genes e até mesmo sobreposição de genes que possuem sentido de leitura em cadeias de DNA opostas (Cantatore e Saccone, 1987; e outros genomas completamente seqüenciados por diversos autores); b) ausência de recombinação, com pouquíssimas exceções documentadas (Clayton 1982, 1992; Hayashi et al., 1985); c) herança materna, com poucas exceções (Gyllestein et al., 1991; Kondo et al., 1990); d) taxa de evolução mais rápida se comparada com o genoma nuclear, possivelmente devido à ineficiência do sistema de reparo da mitocôndria em relação ao núcleo celular (Brown et al., 1979); e e) presença de muitas cópias do mtDNA em uma mesma célula (Robin e Wong 1988; Michaels et al., 1982). No presente trabalho foram seqüenciados sete genes mitocondriais (domínio I da região controladora, 12S rDNA, 16S rDNA, COI, COII, COIII e cyt b) de onze representantes da família Cracidae perfazendo um total de 5265 pares de bases para cada 145 Considerações finais táxon, e os mesmos seis genes mitocondriais (excluindo-se o domínio I da região controladora) referentes a um representante da família Megapodiidae, totalizando 4853 pares de bases para este táxon. Esses números refletem a tendência atual dos trabalhos científicos realizados nos grandes centros científicos internacionais de obter um grande número de dados de seqüências mitocondriais. Além disso, combinar e considerar estas seqüências como uma única seqüência representativa do genoma mitocondrial e a partir daí inferir as relações filogenéticas do grupo em estudo é totalmente justificável (Cao et al., 1994; Cummings et al., 1995; Hillis, 1987; Kluge, 1989; Russo et al., 1996), uma vez que este genoma é herdado como se fosse um único alelo de um loco hemizigoto. Nossos produtos de PCR sempre foram correspondentes a uma única banda de tamanho esperado para o par de primers que utilizamos na amplificação destes produtos, bem como as seqüências resultantes se mostraram limpas e sem a indicação de outras seqüências contaminantes. A homologia de cada uma das seqüências aqui obtidas foi testada usando-se o algoritmo BLAST do GenBank, o que permite averigurar neste banco de dados quais seqüências lá depositadas são homólogas as nossas. Todas as nossas buscas de homologia indicaram termos seqüenciado os genes mitocondriais corretos. Não foram detectados pseudogenes para nenhuma das seqüências estudadas. Baseados nestas indicações de correta obtenção de seqüências mitocondriais de cracídeos, realizamos diversas análises filogenéticas visando elucidar diferentes questões. Basicamente estas análises usaram de modelos evolutivos mais realistas que consideram frequência desigual de bases, heterogeneidade de taxa de substituição entre os sítios e diferentes taxas de transição e transversão. Inicialmente averiguamos a sugestão feita por Prager e Wilson (1976) a partir de distâncias imunológicas de proteínas e por Sibley et al. (1988) a partir de dados de hibridação DNA-DNA que os Cracidae e os Megapodiidae seriam tão distantes dos demais Galliformes quanto dos Anseriformes. De acordo com nossas análises as famílias Cracidae e Megapodiidae se agrupam com os Galliformes, que por sua vez se comportou como grupo-irmão dos Anseriformes. No entanto, não foi possível averiguar se entre os Galliformes temos a clara distinção de duas linhagens, uma levando aos modernos representantes das famílias Cracidae e Megapodiidae, e outra levando as demais famílias 146 Considerações finais de Galliformes, o que justificaria a sugestão de um nível taxonômico a parte para estas duas famílias. Tal fato deve ser melhor estudado com a obtenção de seqüências mitocondriais para outros representantes das demais famílias de Galliformes que não foram incluídas no presente trabalho. Este mesmo estudo permitiu definir que os megapodídeos da região australiana são o grupo mais próximo aos cracídeos. Desta maneira foi possível realizar outras análises filogenéticas para estabeler as relações entre os onze gêneros de cracídeos usando Megapodius como grupo externo. Nossas estimativas das relações entre os cracídeos mostrou a separação clara das subfamílias Penelopinae e Cracinae. As relações entre os jacus e aracuãs, membros da subfamília Penelopinae, foram bem estabelecidas. Entre os Cracinae, representados pelos mutuns, parece ter havido um período curto de diversificação dos atuais quatro gêneros, que é refletido por histórias evolutivas conflitantes quando os genes são analisados separadamente, e pelo curto comprimento dos ramos destas linhagens obtidos por análises de verossimilhancas admitindo a hipótese do relógio molecular. Estes dois primeiros estudos sugerem que os cracídeos surgiram há cerca de 75,5 milhões de anos. Esta data é anterior ao limite entre os períodos Cretáceo e Terciário (65 milhões de anos atrás), indicando que este grupo já havia se diversificado antes do final do Cretáceo e que sobreviveu ao evento de extinção em massa que delimita os períodos geológicos Cretáceo e Terciário. Dados moleculares recentes levam à conclusão de que este é o caso para muitos outros grupos de aves e mamíferos (Cooper e Penny, 1997). O soerguimento dos Andes, os períodos glaciais e a formação da América Central podem ter ocasionado a formação de novos habitats e o isolamento de outros, levando também a alterações climáticas e no nível do mar, o que poderia ter influenciado a diversificação dos atuais gêneros de Cracidae nos últimos 30 milhões de anos. Além destes fatores, a diversificação das Angiospermas também podem ter exercido influência sobre a diversificação deste grupo, uma vez que os cracídeos se alimentam pricipalmente de suas folhas e frutos. Acreditamos que nossas estimativas de datação das divergências genéricas seja confiável devido ao fato de que a calibração adotada neste estudo (separação dos 147 Considerações finais anseriformes e galiformes há 112 milhões de anos) foi baseada em um estudo extensivo feito por Kumar e Hedges (1998) baseado em um registro fóssil bem conhecido e em um número grande de genes mitocondriais e nucleares de diversos representantes de vertebrados. Infelizmente nossos dados não nos permitiram levantar conclusões sobre a origem dos Cracidae nas Américas. Nossos dados são perfeitamente congruentes com ambas as hipóteses de origem dos Cracidae, a hipótese norte ou centroamericana proposta por Delacour e Amadon (1973) e a sulamericana proposta por Darlington (1957). Para resolver esta questão é necessário um estudo abrangendo pelo menos dois representantes de cada uma das famílias de Galliformes ou até mesmo de Anseriformes bem como um registro fóssil mais completo e confiável. Estudos recentes feitos por Kimball et al. (1999) e por Zink et al. (1998) mostraram que a região controladora do DNA mitocondrial poderia ser útil em reconstruções filogenéticas acima da categoria de espécie. Baseados nestas informações obtivemos seqüências do primeiro domínio da região controladora (CR-I) dos onze representantes genéricos dos Cracidae e estimamos suas relações através deste gene. Os resultados obtidos com as seqüências do CR-I foram muito congruentes com nossos resultados usando os outros seis genes mitocondriais em conjunto. Além disso, a taxa de evolução estimada para esta região foi similar à estimada para os genes COI e cyt b. Esses resultados indicam que a região CR-I pode ser útil em análises acima do nível de espécie e que ela pode ser incluida em estudos multigênicos onde cada gene é combinado em uma única matriz de dados. O estudo da evolução das seqüências completas do gene COII mostrou que este gene parece evoluir de maneira semelhante as seqüências de outros organismos. Muitas das posições de aminoácidos consideradas conservadas em uma ampla gama de organismos também se mostraram conservadas em cracídeos. A maioria das substituições ocorridas estão presentes na terceira posição do códon, com raros casos de substituição de aminoácidos. A deleção de uma aminoácido nas seqüências de cracídeos em relação às seqüências de primatas e insetos também é encontrada em outras aves e em répteis. 148 Considerações finais Este é o primeiro estudo evolutivo-filogenético entre os gêneros da família Cracidae. A sobrevivência de muitas das espécies de cracídeos encontra-se ameaçada de alguma forma, e o conhecimento das relações filogenéticas entre elas pode auxiliar na designação de programas de manejo e conservação da família como um todo. No presente trabalho foi possível estabelecer as bases para o esclarecimento de diversos problemas taxonômicos e isto irá auxiliar a resolução de outros que ainda existem para determinados complexos de gêneros e de espécies ou subespécies de Cracidae. 149 Capítulo 8 Referências Bibliográficas 150 Referências REFERÊNCIAS BIBLIOGRÁFICAS A referências citadas em cada um dos capítulos desta tese são identificadas de acordo com os símbolos especificados a seguir: l - Capítulo 1 - Introdução 4- Capítulo 2 - Material e Métodos n - Capítulo 3 - Posicionamento Filogenético de Cracidae e Megapodiidae W - Capítulo 4 - Filogenia de Cracidae t - Capítulo 5 - Domínio I da Região Controladora s - Capítulo 6 - Citocromo Oxidase II 6 - Capítulo 7 - Considerações Finais Adachi J, Hasegawa M (1994). MOLPHY, Molecular Phylogenetics. Version 2.2. s Adkins RM, Honeycutt RL (1994). Evolution of the primate cytochrome c oxidase subunit II gene. J. Mol. Evol. 38: 215-231. s Alvarenga HMF (1995). Um primitivo membro da ordem Galliformes (Aves) do Terciário Médio da Bacia do Taubaté, estado de São Paulo. Anais da Academia Brasileira de Ciências 67: 33-44. l Arctander P (1995). Comparison of a mitochondrial gene and a corresponding nuclear pseudogene. Proc. R. Soc. Lond. B262: 13-19. 6 Arnaiz-Villena A, Álvarez-Tejado M, Ruíz-del-Valle V, García-de-la-Torre C, Varela P, Recio MJ, Ferre S, Martinez-Laso J (1999). Rapid radiation of Canaries (genus Serinus). Mol. Biol. Evol. 16: 2-11. W Avise JC (1994). Molecular Markers, Natural Hystory and Evolution, Chapman and Hall, New York, USA. l Avise JC, Arnold J, Ball RM, Bermingham E, Lamb T, Niegel JE, Reeb CA, Saunders NC (1987). Intraespecific phylogeography: the mitochondrial bridge between population genetics and systematics. Ann. Rev. Ecol. Syst. 18: 489-522. t Avise JC, Bowen BW, Lamb T, Meylan AB, Bermingham E (1992). Mitochondrial DNA evolution at a turtle’s pace: evidence for low genetic variability and reduced microevolutionary rate in the Testudines. Mol. Biol. Evol. 9: 457-473. l Azeredo R (1996). Reintrodução de Crax blumembachii na natureza. In: "Anais V Congresso Brasileiro de Ornitologia", Campinas, Brasil. p. 82. l Baker AJ, Marshal HD (1997). Mitochondrial control region sequences as tools for understanding evolution. In: "Avian Molecular Evolution and Systematics", DP Mindell (Ed.) Academic Press. pp 51-82. t6 Ball RM, JR, Freeman S, James FC, Bermingham E, Avise JC (1988). Phylogeographic population structure of red-winged blackbirds assessed by mitochondrial DNA. Proc. Natl. Acad. Sci. USA 85: 1558-1562. l6 151 Referências Bernardi N (1981). Phylogenetic relationships, monophyletic group and related concepts. Rev. Bras. Entomol. 25: 323-326. l Bleiweiss R (1998a). Origin of hummingbird faunas. Biological Journal of the Linnean Society 65: 7797. W Bleiweiss R (1998b). Tempo and mode of hummingbird evolution. Biological Journal of the Linnean Society 65: 63-76. W Bremer K (1988). The limits of aminoacid sequence data in angiosperm phylogenetic reconstruction. Evolution 42: 795-803. W Bremer K (1994). Branch support and tree stability. Cladistics 10: 295-304. 4 Briggs JC (1987). Biogeography and plate tectonics. Developments in Paleontology and Stratigraphy, 10. Elsevier, Amsterdam. l Brodkorb P (1954). A chachalaca from the Miocene of Florida. Wilson Bull. 66: 180-183. l Brown JH, Lomolino MV (1998). “Biogeography,” Second Edition. Sinauer Associates. Massachusetts. lW Brown WM (1985). The mitochondrial genome of animals. In: "Molecular Evolutionary Genetics", RJ MacIntyre. Plenum Press, New York. pp 95-130. s Brown WM, George M Jr, Wilson AC (1979). Rapid evolution of animal mitochondrial DNA. Proc. Natl. Acad. Sci. USA 76: 1967-1971. 6 Brown WM, Prager EM, Wang A, Wilson AC (1982). Mitochondrial DNA sequences of primates: tempo and mode of evolution. J. Mol. Evol. 18: 225-239. l Bruford MW, Hanotte O, Brookfield JFY, Burke T (1992). Single-locus and multilocus DNA fingerprinting. In: “Molecular Genetic Analysis Of Populations - A Practical Approach,” AR Hoelzel (Ed.). Oxford University Press, New York. pp. 225-269. Wt Cabot EL, Beckenbach AT (1989). Simultaneous editing of multiple nucleic acid and protein sequences with ESEE. Comput. Appli. Biosci. 5: 233-234. 4nW Cantatore P, Saccone C (1987). Organization, structure, and evolution of mammalian mitochondrial genes. Int. Rev. Cytol. 108: 149-208. 6 Cao Y, Adachi J, Janke A, Pääbo S, Hasegawa M (1994). Phylogenetic relationships among eutherian orders estimated from inferred sequences of mitochondrial proteins: instability of a tree based on a single gene. J. Mol. Evol. 39: 519-527. nW6 Capaldi RA (1990). Structure and function of cytochrome c oxidase. Annu. Rev. Biochem. 59: 569-596. Capaldi RA, Malatesta F, Darley-Usmar VM (1983). Structure of cytochrome c oxidase. Biochimica et Biophysica Acta 726: 135-148. s Caspers G-J, Weerd DU, Wattel J, de Jong WW (1997). α-crystallin sequences support a Galliform/Anseriform clade. Mol. Phylogenet. Evol. 7: 185-188. n Castresana J, Feldmaier-Fuchs G, Yokobori S, Satoh N, Pääbo S (1998). The mitochondrial genome of the hemichordate Balanoglossus carnosus and the evolution of deuterostome mitochondria. Genetics 150: 1115-1123. s Caziani SM, Protomastro JJ (1994). Diet of the Chaco Chachalaca. Wils. Bull. 106:640-648. l 152 Referências Clapperton C. (1993). “Quaternary Geology and Geomorphology of South America”, Elsevier, Amsterdam. W Clayton DA (1982). Replication of animal mitochondrial DNA. Cell 28: 693-705. 6 Clayton DA (1992). Structure and function of the mitochondrial genome. J. Inherit. Metab Dis. 15: 439-447. 6 Collar NJ, Gonzaga LP, Krabbe N, Madroño Nieto A, Naranjo LG, Parker III TA, Wege DC (1992). "Threatened birds of the Americas. The ICBP/IUCN Red Data Book". 3rd Edition, part 2. Smithsonian Institution Press, Washington. lWs Cooper A, Mourer-Chauviré C, Chambers GK, von Haeseler A, Wilson AC, Pääbo S (1992). Independent origins of New Zealand moas and kiwis. Proc. Natl. Acad. Sci USA 89: 8741-8744. l6 Cooper A, Penny D (1997). Mass survival of birds across the Cretaceous-Tertiary boundary: molecular evidence. Science 275: 1109-1113. l6 Cracraft J & Helm-Bychowski K (1991). Parsimony and phylogenetic inference using DNA sequence: some methodological estrategies. In: "Phylogenetic Analyses of DNA Sequences". MM Miyamoto, J Cracraft (Eds) Oxford University Press. USA. pp 184-220. l Cracraft J (1974). Continental drift and vertebrate distribution. Ann. Rev. Ecol. Syst. 5: 213-261. l Cracraft J, Mindell DP (1989). The early history of modern birds: a comparison of molecular and morphological evidence. In: "The Hierarchy of Life". B Fernholm, H Jornvall (Eds.). Elsevier, Amsterdam. pp 389-403. n Crowe TM, Short LL (1992). A new gallinaceous bird from the Oligocene of Nebraska, with comments on the phylogenetic position of the Gallunuloidae. In: “Papers in Avian Paleontology”, KE Campbell Jr (Ed.). Natural Hystory Museum of Los Angeles County, Science Series 36: 179-185. l Cummings MP, Otto SP, Wakeley J (1995). Sampling properties of DNA sequence data in phylogenetic analysis. Mol. Biol. Evol. 12: 814-822. nW6 Czelusniak J, Goodman M, Moncrief ND, Kehoe SM (1990). Maximum parsimony approach to construction of evolutionary trees from aligned homologous sequences. Methods in Enzimology 183: 601-615. n D’Angieri A (1997). Cracidae rearing and conservation in Brasil: a general view on their status in the wild and in captivity. In: "The Cracidae: their Biology and Conservation" SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 154159. l Darlington PJ, Jr (1957) “Zoogeography: The Geographical Distribution of Animals,” John Wiley & Sons, Inc. New York. lW6 del Hoyo J, Elliott A, Sargatal J (Eds)(1992). "Handbook of the Birds of the World". Volume 1. Ostrich to Ducks. Lynx Edicions, Barcelona. n del Hoyo J, Elliott A, Sargatal J (eds)(1994). “Handbook of the Birds of the World,” Volume 2. New World Vultures to Guineafowl. Lynx Edicions, Barcelona. ln 153 Referências Delacour J, Amadon D (1973). “Curassows and Related Birds,” The American Museum of Natural History. New York, NY. lWt6 Delarbre C, Spruyt N, Delmarre C, Gallut C, Barriel V, Janvier P, Laudet V, Gachelin G (1998). The complete nucleotide sequence of the mitochondrial DNA of the dogfish, Scyliorhynus canicula. Genetics 150: 331-344. s DeSalle R, Templeton A (1988). Founders effects accelerate the rate of mitochondrial DNA evolution in Hawaiian Drosophila. Evolution 42: 1076-1084. l Desjardins P, Morais R (1990). Sequence and gene organization of the chicken mitochondrial genome. A novel gene order in higher vertebrates. J. Mol. Biol. 212: 599-634. Wts Diaz-M VR, del Solar-R G (1997). Resultados parciales del plan integral para salvar a la Pava Aliblanca (Penelope albipennis). In: "The Cracidae: their Biology and Conservation" SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 467-471. l Duering A, Brueckner M, Mossakowski D (1999). Differences between gene tree and organismal tree? Mitochondrial genes and the phylogenetic relationships of the Chrysocarabus species. Mitt. Dtsch. Ges. Allg. Entomol. in press. s Eizirik E, Bonatto SL, Johnson WE, Crawshaw PG, Vié JC, Brousset DM, O’Brien SJ, Salzano FM (1998). Phylogeographic patterns and evolution of the mitochondrial DNA control region in two Neotropical cats (Mammalia, Felidae). J. Mol. Evol. 47: 613-624. t Ellegren H, Fridolfsson A-K (1997). Male-driven evolution of DNA sequences in birds. Nature Genetics 17: 182-184. l Emerson BC, Wallis GP (1995). Phylogenetic relationships of the Prodontia (Coleptera: Scarabaeidae; Subfamily Melolonthinae), derived from sequence variation in the mitochondrial cytochrome oxidase II gene. Mol. Phylogenet. Evol. 4: 433-447. s Érard C, Théry M (1994). Frugivorie et ornithocorie en fôret Guianaise: l’exemple des grans oiseaux terrestres et de la Penelope marail. Alauda 62: 27-31. l Érard C, Théry M, Sabatier D (1991). Régime alimentaire de Tinamus major, (Tinamidae), Crax alector (Cracidae) et Psophia crepitans (Psophiidae) en forêt Guianaise. Gibier Faune Sauvage 8: 183-210. l Eriksson T (1998) AutoDecay. Version 4.0. (Program distributed by the author). Department of Botany. Stockolm University. Stockolm, Sweeden. 4W Felsenstein J (1978). Cases in which parsimony and compatibility methods will be positively misleading. Syst. Zool. 27: 401-410. t Felsenstein J (1978). The number of evolutionary trees. Syst. Zool. 27: 27-33. l Felsenstein J (1981). Evolutionary trees from DNA sequences: A maximum likelihood approach. J. Mol. Evol. 17: 368-376. l Felsenstein J (1985). Confidence limits on phylogenies: an approach using the bootstrap. Evolution 39: 783-791. 4 154 Referências Felsenstein J (1988). Phylogenies from molecular sequences: inference and reliability. Ann. Rev. Genet. 22: 521-565. l4 Filipski J (1988). Why the rate of silent coding substitution is variable within a vertebrate's genome. J. Theor. Biol. 134: 159-164. l Frati F, Simon C, Sullivan J, Swofford DL (1997). Evolution of the mitochondrial oxidase II gene in Collembola. J. Mol. Evol. 44: 145-158. s Freitag S, Robinson TJ (1993). Phylogeographic patterns in mitochondrial DNA of the ostrich (Struthio camelus). Auk 110: 614-622. l6 Friesen VL, Anderson DJ (1997). Phylogenetic and evolution of the Sulidae (Aves: Pelecaniformes): a test of alternative modes of speciation. Molecular Phylogenetics and Evolution 7: 252-260. l Fumagalli L, Taberlet P, Favre L, Hausser J (1996). Origin and evolution of homologous repeated sequences in the mitochondrial DNA control region of shrews. Mol. Biol. Evol. 13: 31-46. t García-Moreno J, Fjeldsa J (1999). Re-evaluation of species limits in the genus Atlapetes based on mtDNA sequence data. Ibis 141: 199-207. 6 Gaut, BS, Lewis PO (1995). Success of maximum likelihood in the four-taxon case. Mol. Biol. Evol. 12: 152-162. t Goldman N (1993a) Simple diagnostic statistical test of models of DNA substitution. J. Mol. Evol. 37, 650-661. 4 Goldman N (1993b) Statistical tests of models of DNA substitution. J. Mol. Evol. 36, 182-198. 4 Grantham R,Gautier C, Gouy M, Mercier R, Pave A (1980). Codon catalog usage and the genome hypothesis. Nucleic Acids Res. 8: r49-r62. s Griffiths CS (1997). Correlation of funcitional domains and rates of nucleotide substitution in cytochrome b. Mol. Phylogenet. Evol. 7: 352-365. 6 Griffiths CS (1998). The correlation of protein structure and evolution of a protein-coding gene: phylogenetic inference using cytochrome oxidase III. Mol. Biol. Evol. 15: 1337-1345. 6 Groom MJ, Podolsky RD, Munn CA (1991). Tourism as a sustained use of wildlife: a case study of Madre de Dios, southeastern Peru. In: "Neotropical Wildlife Use and Conservation", JG Robinson, KH Redford (Eds.). Univ. Chicago Press. pp. 393-414. l Groth JG, Barrowclough GF (1999). Basal divergences in birds and the phylogenetic utility of the nuclear RAG-1 gene. Mol. Phylogenet. Evol. 12: 115-123. n Guix JC, Ruiz X (1997). Weevil larvae dispersal by guan in SE Brasil. Biotrop. 29:522-525. l Gutierrez PC (1994). Mitochondrial-DNA polymorphism in the oilbird (Steatornis caripensis, Steathornithidae) in Venezuela. Auk 111: 573-578. 6 Gyllestein U, Wharton D, Josefsson A, Wilson AC (1991). Paternal inheritance of mitochondrial DNA in mice. Nature 352: 255-257. 6 Hagelberg E (1994). Mitochondrial DNA from ancient bones. In: “Ancient DNA,” B Herrmann, S Hummel (Eds). Springer-Verlag. pp. 195-204. W 155 Referências Hann SR, King MW, Bentley DL, Anderson CW, Eisenman RN (1988). A non-AUG translational initiation in c-myc exon 1 generates a N-terminally distinct protein whose synthesis is disrupted in Burkitt's lymphomas. Cell 52: 185-195.s Harlid A, Arnason U (1999). Analyses of mitochondrial DNA nest ratite birds within the Neognathae: supporting a neotenous origin of ratite morphological characters. Proc. R. Soc. Lond. B266: 305309. ns Harlid A, Janke A, Arnason U (1997). The mtDNA sequence of the ostrich and the divergence between paleognathous and neognathous birds. Mol. Biol. Evol. 14: 754-761. s Harlid A, Janke A, Arnason U (1998). The complete mitochondrial genome of Rhea americana and early Avian divergences. J. Mol. Evol. 46: 669-679. 4ns Hasegawa M, Kishino H Yano T (1985).Dating of the human-ape splitting by a molecular clock of mitochondrial DNA. J. Mol. Evol. 22: 160-174. lt Hasegawa M, Yano T, Kishino H (1984). A new molecular clock of mitochondrial DNA and the evolution of hominoids. Proc. Japan. Acad. B60: 95-98. l Hayashi JI, Tagashira Y, Yoshida MC (1985). Absence of extensive recombination between interspecies and intraspecies mitochodrial DNA in mammalian cells. Exp. Cell. Res. 160: 387-395. 6 Hedges SB, Parker PH, Sibley CG, Kumar S (1996). Continental breakup and the ordinal diversification of birds and mammals. Nature 381: 226-229. l Hedges SB, Simmons MD, van Dijk Mam, Caspers G-J, de Jong WW, Sibley CG (1995). Phylogenetic relationships of the hoatzin, an enigmatic South American bird. Proc. Natl. Acad. Sci USA 92: 11662-11665. n Helm-Bychowski K, Cracraft J (1993). Recovering phylogenetic signal from DNA sequences: relationships within the corvine assemblage (Class Aves) as inferred from complete sequences of the mitochondrial DNA cytochrome-b gene. Mol. Biol. Evol. 10: 1196-1214. l Hennig W (1950). "Grundzuge einer Theorie der phylogenetischen Systematik". Deuscher Zentralverlag, Berlin. l Hennig W (1966). "Phylogenetic Systematics". Urbana, Ill. University of Illinois Press. USA. l Hillis DM (1987). Molecular versus morphological approaches to systematics. Ann. Rev. Ecol. Syst. 18: 23-42. n6 Hillis DM, (1991) Discriminating between phylogenetic signal and random noise in DNA sequences. In: "Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford University Press, New York. lt Honeycutt RL, Nedbal MA, Adkins RM, Janecek LL (1995). Mammalian mitochondrial DNA evolution: a comparison of the cytochrome c oxidase II genes. J. Mol. Evol. 40: 260-272. s Huber BT (1998). Tropical paradise at the Cretaceous Poles? Science 282: 2199-2200. l Huelsenbeck JP, Crandall KA (1997) Phylogeny estimation and hypothesis testing using maximum likelihood. Ann. Rev. Ecol. Syst. 28, 437-466. 4 156 Referências Huelsenbeck JP, Rannala B (1997) Phylogenetic methods come of age: testing hypothesis in an evolutionary context. Science 276: 227-2324 Irwin DM, Kocher TD, Wilson AC (1991). Evolution of the cytochrome b gene of mammals. J. Mol. Evol. 32:128-144. ls IUCN (1996). 1996 IUCN Red List of Threatened Animals. IUCN - The World Conservation Union, Gland, Switzerland. http://www.wcmc.org.uk/species/animals/animal_redlist.html. l Iwata S, Ostermeier C, Ludwig B, Michel H (1995). Structure at 2.8Å resolution of cytochrome c oxidase from Paracoccus denitrificans. Nature 376: 660-669. s Janecek LL, Honeycutt RL, Adkins RM, Davis SK (1996). Mitochondrial gene sequences and the molecular systematics of the artiodactyl subfamily Bovinae. Mol. Phylog. Evol. 6: 107-119. s Janke A, Arnason U (1997). The complete mitochondrial genome of Alligator mississippiensis and the separation between recent archosauria (birds and crocodiles). Mol. Biol. Evol. 14: 1266-1272. s Janke A, Feldmaier-Fuchs G, Thomas WK, von Haeseler A, Pääbo S (1994). The marsupial mitochondrial genome and the evolution of placental mammals. Genetics 137: 243-256. s Janke A, Xu X, Arnason U (1997). The complete mitochondrial genome of the wallaroo (Macropus robustus) and the phylogenetic relationship among Monotremata, Marsupialia, and Eutheria. Proc. Natl. Acad. Sci. USA 94: 1276-1281. s Jukes TH, Cantor CR (1969). Evolution of protein molecules. In: "Mammalian Protein Metabolism", HM Munro (ed). Academic Press, New York. pp 21-132. l Kimball RT, Braun EL, Zwartjes PW, Crowe TM, Ligon JD (1999). A molecular phylogeny of the pheasants and partridges suggests that these lineages are not monophyletic. Mol. Phylogenet. Evol. 11: 38-54. t6 Kimura M (1980). A simple method for estimating evolutionary rate of base substitutions through comparative studies of nucletide sequences. J. Mol. Evol. 16: 111-120. l Kishino H, Hasegawa M (1989). Evaluation of the maximum likelihood estimate of the evolutionary tree topologies from DNA sequence data, and the branching order in Hominoidea. J. Mol. Evol. 29: 170-179. W Klicka J, Zink RM (1997). The importance of recent ice ages in speciation: a failed paradigm. Science 277: 1666-1669. s Kluge AG (1989). A concern for evidence and a phylogenetic hypothesis of relationships among Epicrates (Boidae, Seprentes). Syst. Zool. 38: 7-25. nt Knowlton N, Weigt LA (1998). New dates and new rates for divergence across the Isthmus of Panama. Proc. R. Soc. Lond B265: 2257-2263. W Kocher TD, Thomas WK, Meyer A, Edwards SV, Pääbo S, Villablanca FX, Wilson AC (1989). Dynamics of mitochondrial DNA evolution in animals: amplification and sequencing with conserved primers. Proc. Natl. Acad. Sci. USA 86: 6196-6200. t Kondo R, Satta Y, Matsuura ET, Ishiwa H, Takahata N, Chigusa SI (1990). Incomplete maternal transmission of mitochondrial DNA in Drosophila. Genetics 126: 657-663. 6 157 Referências Kumar S (1996). “PHYLTEST: a program for testing phylogenetic hypothesis,” Version 2.0. Institute of Molecular Evolutionary Genetics and Department of Biology. The Pennsylvania State University, University Park, Pennsylvania, USA. Ws Kumar S, Hedges B (1998). A molecular timescale for vertebrate evolution. Nature 392: 917-920. n6 Kumar S, Tamura K, Nei M (1993). MEGA, Molecular evolutionary genetics analysis. Version 1.01. The Pennsylvannia State University. s Kumasawa Y, Ota H, Nishida M, Ozawa T (1998). The complete nucleotide sequence of a snake (Dinodon semicarinatus) mitochondrial genome with two identical control regions. Genetics 150: 313-329. s Larson A (1991). Evolutionary analysis of length-variable sequences: divergent domains of ribosomal RNA. In: "Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford University Press, USA, pp 221-248. l Laskowski M Jr, Fitch WM (1989). Evolution of avian ovomucoid in birds. In: "The Hierarchy of Life". B Fernholm, H Jornvall (Eds.). Elsevier, Amsterdam. pp 371-387. n Lecanidou R Douris V, Rodakis GC (1994). Novel features of metazoan mtDNA revealed from sequence analysis of three mitochondrial DNA segments of the land snail Albinaria turrita (Gastropoda: Clausiliidae). J. Mol. Evol. 38: 369-382. s Li W-H (1993a). So, what about the molecular clock hypothesis? Curr. Opin. Genet. Dev. 3: 896-901. l Li W-H (1993b). Unbiased estimation of the rates os synonymous and nonsynonymous substitution. J. Mol. Evol. 36: 96-99. l Li W-H (1997). "Molecular Evolution". Sinauer Associates, Inc. Sunderland, MA, USA. ls Li W-H, Graur D (1991). "Fundamentals of Molecular Evolution", Sinauer Associates, Sunderland, MA, USA. l Li W-H, Tanimura M, Sharp PM (1987). An evaluation of the molecular clock hypothesis using mammalian DNA sequences. J. Mol. Evol. 25: 330-342. l Liu H, Beckenback AT (1992). Evolution of the mitochondrial cytochrome oxidase II gene among 10 orders of insects. Mol. Phylogenet. Evol. 1: 41-52. s Lucchini V, Randi E (1998). Mitochondrial DNA sequence variation and phylogeographical structure of rock partridge (Alectoris graeca) populations. Heredity 81: 528-536. t Macedo-Ruiz H (1979). 'Extinct' bird found in Peru. Oryx 15:33-37. l Maddison WP, Donoghue MJ, Maddison DR (1984). Outgroup analysis and parsimony. Syst. Zool. 33: 83-103. l Martin AP, Palumbi SR (1993). Body size, metabolic rate, generation time, and the molecular clock. Proc. Natl. Acad. Sci. USA 90: 4087-4091. l Michaels GS, Hauswirth WW, Laipis PJ (1982). Mitochondrial DNA copy number in bovine oocytes and somatic cells. Dev. Biol. 94: 246-251. 6 Miller AH (1944). An avifauna from the lower Miocene of South Dakota. Univ. Calif. Publ., Bull. Dept. Geol. Sci. 27: 85-100. l 158 Referências Millett F, de Jong C, Paulson L, Capaldi RA (1983). Identification of specific carboxylate groups on cytochrome c oxidase that are involved in binding cytochrome c. Biochemistry 22: 546-552. s Mindell DP (1991). Aligning DNA sequences: homology and phylogenetic weighting. In: "Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford University Press, USA, pp 73-89. l Mindell DP, Honeycutt RL (1989). Variability in transcribed regions of ribosomal DNA and early divergence in birds. Auk 106: 539-548. n Mindell DP, Sorenson MD, Dimcheff DE (1998). Multiple independent origins of mitochondrial gene order in birds. Proc. Natl. Acad. Sci. USA 95: 10693-10697. s Mindell DP, Sorenson MD, Dimcheff DE, Hasegawa M, Ast JC, Yuri T (1999). Interordinal relationships of birds and other reptiles based on whole mitochondrial genomes. Syst. Biol. 48: 138-152. 4ns Mindell DP, Thacker CE (1996). Rates of molecular evolution: phylogenetic issues and applications. Ann. Rev. Ecol. Syst. 27: 279-303. l Miyaki CY, Matioli SR, Burke T, Wajntal A (1998). Parrot evolution and paleogeographical events: mitochondrial DNA evidence. Mol. Biol. Evol. 15: 544-551. lW6 Miyata T, Hayashida H, Kuma K, Mitsuyasu K, Yasunaga T (1987). Male-driven molecular evolution: a model and nucleotide sequence analysis. Cold Spring Harbor Symp. Quant. Biol. 52: 863-867. l Morrison DA, Ellis JT (1997). Effects of nucleotide sequence alignment on phylogenetic estimation: a case study of 18S rDNA of Apicomplexa. Mol. Biol. Evol. 14: 428-441. l Mourer-Chauviré C (1992). The Galliformes (Aves) from the Phosphorites du Quercy (France). Géobios 14: 169-177. l Munn CA (1992). Macaw biology and ecotourism, or “when a bird in the bush is worth two in the hand”. In: "New World Parrots in Crisis: Solutions from Conservation Biology", SR Beissinger, NFR Snyder (Eds.). Smithsonian Institution Press, Washington, D.C., USA. pp. 47-72. l Nahum LA, Pereira SL, Fernandes-Matioli FMC, Matioli SR, Wajntal A (Submitted). Molecular phylogeny and evolution of the Ramphastidae (Aves) based on cytochrome b mitochondrial sequences. lW6 Nardelli PM (1993). “A Preservação do Mutum-de-Alagoas,” Semana Ilustrada Editorial Ltda. Queimados, Rio de Janeiro. lW Nei M (1991). Relative efficiences of different tree-making methods for molecular data. In "Phylogenetic Analysis of DNA Sequences", M Miyamoto, J Cracraft (Eds.). Oxford University Press, USA, pp 90-128. l Ojala D, Montoya J, Attardi G (1981) tRNA punctuation model of RNA processing in human mitochondria. Nature 290: 470-474. s Olson SL, Feduccia A (1980). Presbyornis and the origin of the Anseriformes (Aves: Charadriomorphae). Smithsonian Contrib. Zool. 323: 1-24. n 159 Referências Ortíz EG, O'Neill JP (1997). Situación actual de la Familia Cracidae en Perú. In: "The Cracidae: their Biology and Conservation", SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 361-374. l Ortíz-T E, Díaz-M VR (1997). Estudio de campo y reevaluación de la población de pava aliblanca (Penelope albipennis). In: "The Cracidae: their Biology and Conservation" SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 218232. l Peabody DS (1989). Translational initiation at non-AUG triplets in mammalian cells. J. Biol. Chem. 264: 5031-5035. s Pereira SL, Wajntal AJ. Studies of Captive Stocks of the Endangered Red-billed Curassow (Crax blumenbachii) Suggest that this Species is not Depleted of Genetic Variability. (no prelo) In "Biology and Conservation of Galliformes in the New Millenium", J. Clinton, D. Brooks (Eds). l Peres CA, van Roosmalen MGM (1996). Avian dispersal of “mimetic seeds” of Ormosia lignivalvis by terrestrial granivores: deception or mutualism? Oikos 75: 249-258. l Petri S, Fúlvaro VJ (1983). “Geologia do Brasil,” Editora da Universidade de São Paulo, São Paulo. Posada D, Crandall KA (1998). MODELTEST: testing the model of DNA substitution.. Bioinformatics 14: 817-818. Wt Prager EM, Wilson AC (1976). Congruency of phylogenies derived from different proteins. A molecular analysis of the phylogenetic position of cracid birds. J. Mol. Evol. 9: 45-57. ln6 Prager EM, Wilson AC (1988). Ancient origin of lactalbumin from lysozyme: analysis of DNA and amino acid sequences. J. Mol. Evol. 27: 326-335. l Quinn TW (1997). Molecular evolution of the mitochondrial genome. In: "Avian Molecular Systematics", DP Mindell (Ed.). Academic Press. USA. pp 3-28. t Randi E, Lucchini V (1998). Organization and evolution of the mitochondrial DNA control region in the avian genus Alectoris. J. Mol. Evol. 47: 449-462. t6 Reeves JH (1992). Heterogeneity in the substitution process of amino acid sites of proteins coded for by mitochondrial DNA. J. Mol. Evol. 35: 17-31. l Robin ED, Wong R (1988). Mitochondrial DNA molecules and virtual number of mitochondrial per cell in mammalian cells. J. Cell. Physiol. 136: 507-513. 6 Rodríguez F, Oliver JL, Marín A, Medina R (1990). The general stochastic model of nucleotide substitution. J. Theor. Biol. 142: 485-501. l Russo CAM, Takezaki N, Nei M (1996). Efficiencies of different genes and different tree-building methods in recovering a known vertebrate phylogeny. Mol. Biol. Evol. 13: 525-536. nW6 Saccone C, Pesole G, Sbisà E (1991). The main regulatory region of mammalian mitochondrial DNA: structure-function model and evolutionary pattern. J. Mol. Evol. 33: 83-91. t Salgado-Labouriau, M. L. (1994). “Historia ecológica da Terra,” Editora Edgard Blücher Ltda, Sao Paulo. W Sambrook J, Fritsch F, Maniatis T (1989). "Molecular Cloning: a laboratory manual". Cold Spring Laboratory Press, 2nd Edition, New York. 4 160 Referências Santamaría-G M, Franco AM (1994). "Historia natural del paujil (Mitu salvini) y densidades poblacionales de cracidos en un bosque de la Amazonia Colombiana". Informe, final, WCS. l Sarich VM, Wilson AC (1967). Immunological time scale for hominid evolution. Science 158: 12001203. l Savage D, Russell DE (1983). "Mammalian Paleofaunas of the World", Addison-Wesley, Reading, MA, USA. s Scheres, G (1997). EEP Cracid TAG Annual Report. In: "EEP Yearbook 1996/1997" F Rietkerk, K Brouwer, S Smits, M Damen (Eds.). EAZA, Amsterdam. pp. 394-395. l Sedaghatkish G, Galetti M, Denny C (1999). The importance of Pipile as a seed disperser of economically important plants. In: "Biology and Conservation of the Piping Guans (Pipile)", DM Brooks, AJ Begazo, F Olmos (Eds.).. Spec. Publ. CSG 1, Houston. pp. 4-12. l Sibley CG, Ahlquist JE (1990). "Phylogeny and Classification of Birds of the World. A Study in Molecular Evolution". Yale University Press. New Haven. lnW Sibley CG, Ahlquist JE, Monroe BL (1988). A classification of the living birds of the world based on DNA-DNA hybridization studies. Auk 105: 409-423. ln6 Sick H (1993). “Birds in Brazil. A natural hystory,” Princeton University Press. New JerseylW Sidow A, Nguyen T, Speed TP (1992). Estimating the fraction of invariable codons with a capturerecapture method. J. Mol. Evol. 35: 253-260. l Silva JL, Strahl SD (1991). Human impact on populations of chachalacas, guans and curassows (Galliformes: Cracidae) in Venezuela. In: "Neotropical Wildlife Use and Conservation", JG Robinson, KH Redford (Eds.). Univ. Chicago Press. pp. 37-52. l Simpson J, Azeredo R (1997). The Red-billed Curassow project in Brasil. Pp. 472-473 In: "The Cracidae: their Biology and Conservation", SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. l Springer MS, Westerman M, Kavanagh JR, Burk A, Woodburne MO, Kao DJ, Krajewski C (1998). The origin of the Australasian marsupial fauna and the phylogenetic affinities of the enigmatic monito del monte and marsupial mole. Proc. R. Soc. Lond. B265: 2381-2386. l Stapel SO, Leunissen JAM, Versteeg M, Wattel J, de Jong WW (1984). Ratite as oldest offshot of avian stem – evidence from α-crystallin sequences. Nature 311: 257-259. n Steel MA, Székely L, Erdös PL, Waddell PJ (1993). A complete family of phylogenetic invariants for any number of taxa under Kimura's 3ST model. New Zealand J. Bot. 31: 289-296. l Strahl SD, Grajal A (1991). Conservation of large avian frugivores and the management of Neotropical protected areas. Oryx 25:50-55. l Strimmer K, von Haeseler A (1996). Quartet puzzling: a quartet maximum-likelihood method for reconstructing tree topologies. Mol. Biol. Evol.13: 964-969. l4 Strimmer K, von Haeseler A (1997). Likelihood-mapping: a simple method to visualize phylogenetic content of a sequence alignment. Proc. Natl. Acad. Sci. USA 94: 6815-6819. 4 Strimmer K, von Haeseler A (1999). PUZZLE. Version 4.0.2. Ludwig-Maximilians-Universität. München. Program distributed by the authors. ln 161 Referências Strimmer KS (1997). Maximum Likelihood Methods In Molecular Phylogenetics. Dissertation der Fakultät für Biologie der Ludwig-Maximilians-Universität München. 4 Stryer L (1995). "Biochemistry". WH Freeman e Company. New York, NY. s Swofford DL (1999). PAUP*, Phylogenetic Analysis using Parsimony (*and related methods). Version 4.0. Sinauer Associates, Sunderland, Massachusetts, USA. lnWt Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). Phylogenetic inference. In: “Molecular Systematics”, DM Hillis, C Moritz, BK Mable (Eds.). 2nd edition, Sinauer Assoc., Sunderland, MA, pp 407-514. l Takezaki N, 1995, LINTREE - Phylogenetic tests of the molecular clock and linearized tree, programa distribuído pelo autor. l Takezaki N, Gojobori T (1999). Correct and incorrect vertebrate phylogenies obtained by the entire mitochondrial DNA sequences. Mol. Biol. Evol. 16: 590-601. ln Takezaki N, Razhetsky A, Nei M (1995). Phylogenetic test of the molecular clock and linearized trees. Mol. Biol. Evol. 12: 823-833. l Tamura K, Nei M (1993). Estimation of the number of base nucleotide substitution in the control region of mitochondrial DNA in humans and chinpanzees. Mol. Biol. Evol. 10: 512-526. lt Tarr CL, Fleischer RC (1993). Mitochondrial DNA variation and evolutionary relationships in the Amakihi complex. Auk 110: 825-831. 6 Telford MJ, Holland PWH (1997). Evolution of 28S ribosoaml DNA in Chaetognaths: duplicate genes and molecular phylogeny. J. Mol. Evol. 44: 135-144. l Théry M, Érard C, Sabatier D (1992). Les fruits dans le régime alimentaire de Penelope marail (Aves and Cracidae) en forêt Guianaise: frugivorie stricte et selective? Rev. Ecol. 47:383-401. l Thompson JD, Higgins DG, Gibson TJ (1994). CLUSTALW: improving the sensitivity of progressive alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22: 4673-4680. 4nWt Tordoff HB, Macdonald JR (1957). A new bird (Family Cracidae) from the early Oligocene of South Dakota. Auk 74: 174-184. l van Tuinen M, Sibley CG, Hedges SB (1998). Phylogeny and biogeography of ratite birds inferred from DNA sequences of the mitochondrial ribossomal genes. Mol. Biol. Evol. 15: 370-376. lW Vaurie C (1968). Taxonomy of the Cracidae. Bull. Amer. Mus. Nat. Hist. 138: 135-243. l Velasco-A E (1997). Status, distribución y poblaciones de Cracidae en el Valle del Cauca, Colômbia. In: "The Cracidae: their Biology and Conservation" SD Strahl, S Beaujon, DM Brooks, AJ Begazo, G Sedaghatkish, F Olmos (Eds.). Hancock House Publ., WA. pp. 283-288. l Vuilleumier F (1965). Relationships within the Cracidae. Bull. Mus. Comp. Zool. 134: 1-27. l Wetmore A (1923). Avian fossils from the Miocence and Pliocene of Nebraska. Bull. Amer. Mus. Nat. Hist. 48: 483-507. l Wetmore A (1933). A fossil gallinaceous bird from the lower Miocene of Nebraska. Condor 35: 64-65. l Wetmore A (1956). A fossil guan from the Oligocene of South Dakota.Condor 58: 234-235. l 162 Referências Wilkinson GS, Mayer F, Kerth G, Petri B (1997). Evolution of repeated sequence arrays in the D-loop region of bat mitochondrial DNA. Genetics 146: 1035-1048. t Yang Z (1993). Maximum likelihood estimation of phylogeny from DNA sequences when substitution rates differ over sites. Mol. Biol. Evol. 10: 1396-1401. l Yang Z (1994). Estimating the pattern of nucleotide substitution. J. Mol. Evol. 39: 105-111. l Yang Z (1996). Among-site variation and its impact on phylognetic analyses. TREE 11: 367-371. l Yang Z (1997). PAML: a program package for phylogenetic analysis by maximum likelihood. CABIOS 13: 555-556. l Yang Z (1999). Phylogenetic analysis by Maximum Likelihood (PAML). Version 2.0. University of College London. Program distributed by the author. n Zardoya R, Meyer A (1996) Phylogenetic performance of mitochondrial protein-coding genes in resolving relationships among vertebrates. Mol. Biol. Evol. 13: 933-942. ls Zardoya R, Meyer A (1997). The complete DNA sequences of the mitochondrial genome of a "living fossil", the coelacanth (Latimeria chalumnae). Genetics 146: 995-1010. s Zardoya R, Meyer A (1998). Complete mitochondrial genome suggests diapsid affinities of turtles. Proc. Natl. Acad. Sci. USA 95: 14226-14231. s Zhen L, Swank RT (1993). A simple and high yield method for recovering DNA from agarose gels. Bio Techniques 14: 894-896. 4t Zink RM (1993). The geography of mitochondrial DNA variation, population structure, hybridization, and species limits in the fox sparrow (Passarella iliaca). Evolution 48: 96-111. 6 Zink RM, Dittmann DL (1993). Gene flow, refugia, and evolution of geographic variation in the song sparrow (Melospiza melodia). Evolution 47: 717-729. 6 Zink RM, Weller SJ, Blackwell RC (1998). Molecular phylogenetics of the avian genus Pipilo and a biogeographic argument for taxonomic uncertainty. Mol. Phylogenet. Evol. 10: 191-201. t6 Zuckerkandl E, Pauling L (1962). Molecular diseases, evolution and genic heterogeneity. In “Horizons in Biochemistry”, M Kasha, B Pullman (Eds). Academic Press. New York. pp 189-255. lW Zuckerkandl E, Pauling L (1965). Evolutionary divergence and convergence in proteins. In “Evolving genes and proteins”, V Bryson, HJ Vogel (Eds). Academic Press. New York. pp. 97-166. lW 163 Súmula Curricular SÚMULA CURRICULAR Sérgio Luiz Pereira Nascido em 15 de Setembro de 1971, em Palestina, SP. Filiação: José Vicente Pereira e Aparecida Farine Pereira Formação Acadêmica Doutorado (11/08/2000): "Filogenia e Evolução Molecular em Cracidae (Aves)". Departamento de Biologia, Instituto de Biociências, Universidade de São Paulo. São Paulo, SP. Área de Concentração: Biologia/Genética. Orientadora: Profa. Dra. Anita Wajntal Mestrado (15/08/1996): "Variabilidade Genética em Cracídeos e Monitoramento de Populações em Áreas reflorestadas". Departamento de Biologia, Instituto de Biociências, Universidade de São Paulo. São Paulo, SP. Área de Concentração: Biologia/Genética. Orientadora: Profa. Dra. Anita Wajntal Graduação (07/01/1994): Bacharelado em Ciências Biológicas. Instituto de Biociências, Letras e Ciências Exatas (IBILCE), Universidade Estadual Paulista Júlio de Mesquita Filho, Campus de São José do Rio Preto, SP. Publicações Pereira SL, Wajntal A (1999). Reintroduction of guans of the genus Penelope (Cracidae, Aves) in reforested areas: assessment by DNA Fingerprinting. Biological Conservation 87: 31-38. Miyaki CY, Griffiths R, Orr K, Nahum L, Pereira SL, Wajntal A (1998). Sex identification of parrots, toucans, and curassows by PCR: perspectives for wild and captive population studies. Zoo Biology 17: 415-423. Miyaki CY, Pereira SL, Biasia I, Wajntal A (1997). DNA fingerprinting applied to captive breeding programs of parrots. Ararajuba, Brazilian Journal of Ornitology 5: 127-133. Pereira SL, Miyaki CY, Wajntal A (1996). DNA fingerprinting in the rare black-fronted piping guan Pipile jacutinga (Cracidae, Aves). Rev. Brasil. Biol. 56: 783-791. Strahl SD, Brooks DM (compiladores). Mutuns, Jacus e Aracuãs: Plano de Ação de Status e Conservação (2000 - 2004). Traduções de F Gonzalez-Garcia (espanhol) e SL Pereira (português). World Pheasant Association/Birdlife International/ Grupo Especialista de Cracídeos (CSG) da IUCN. 165 Artigos no prelo Pereira SL, Wajntal A. Studies of captive stocks of the endangered Red-Billed Curassow (Crax blumenbachii) suggest that this species is not depleted of genetic variability. "Biology and Conservation of Galliformes in the New Millenium". (Ed. Eitinier JC, Brooks D) Pereira SL. Mitochondrial genome organization and vertebrate phylogenetics. Genetics and Molecular Biology. Artigos submetidos LA Nahum, SL Pereira, FMC Fernandes-Matioli, SR Matioli, A Wajntal. Divergence time estimates of toucans and aracaris (Aves: Piciformes: Ramphastidae: Ramphastinae) based on mitochondrial DNA sequences. Artigos em redação Pereira SL. A teoria da reconstrução de árvores filogenéticas moleculares. (Parte do capítulo 1 da presente tese). Pereira SL, Wajntal A. The mitochondrial control region and phylogenetic inference among genera of the Cracidae (Aves). (Capítulo 5 da presente tese). Pereira SL, Baker AJ, Wajntal A. Star radiation within the diversification of curassows, guans and chachalacas (Aves, Cracidae). (Parte do capítulo 4 da presente tese). Pereira SL, Miyaki CY, Russo CAM. Inferência de filogenias moleculares. Métodos probabilísticos. Capítulo 11 do livro Evolução, Filogenias, e Polimorfismos Moleculares, sob coordenação de Matioli SR. Russo CAM, Miyaki CY, Pereira SL. Inferência de filogenias moleculares. Métodos geométricos. Capítulo 9 do livro Evolução, Filogenias, e Polimorfismos Moleculares, sob coordenação de Matioli SR. Miyaki CY, Russo CAM, Pereira SL. Inferência de filogenias moleculares. Métodos de minimização de eventos. Capítulo 10 do livro Evolução, Filogenias, e Polimorfismos Moleculares, sob coordenação de Matioli SR. Sérgio Luiz Pereira 25 de Setembro de 2000 166