Integrando processos evolutivos
Transcrição
Integrando processos evolutivos
Integração de forças evolutivas: interação entre deriva e seleção BIO 208 - Processos Evolutivos - 2016 Diogo Meyer Ridley: Capítulo 7 menos Quadro 7.1, 7.2 e item 7.4. Modelo determinístico de seleção Vantagem do heterozigoto AA Aa aa 0,9 1 0,9 Modelo determinístico de seleção Mutação vantajosa se fixa Mutação deletéria é eliminada 90 90 90 90 67.5 67.5 67.5 67.5 45 45 45 45 22.5 22.5 22.5 22.5 0 0 0 AA Aa aa s=0.1, A recessivo Allelic Frequency ( p ) AA Aa aa 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0 0 AA Aa Autosomal aa AA Aa aa Selection s=0.1, A dominante 20 40 60 80 100 Generations ( t ) AA Aa aa AA Aa aa 1 0.9 0.9 1 1 0.9 120 140 Modelo determinístico de seleção s=0.1, A recessivo Allelic Frequency ( p ) Autosomal Selection 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0 s=0.1, A dominante 20 40 60 80 100 Generations ( t ) AA Aa aa AA Aa aa 1 0.9 0.9 1 1 0.9 120 140 Modelo estocástico: deriva Mutação irá se fixar (probabilidade é 1/2N) Mutação irá se perder (probabilidade é é 1 - 51/2N) Uma questão central da biologia evolutiva: deriva ou seleção? Há diferenças entre e dentro de espécies. Essas diferenças podem resultar de: - deriva - seleção - 60 mil diferenças de proteínas entre as duas espécies Neutralista: a maior parte das diferenças (e polimorfismos) por deriva Selecionista: a maior parte por seleção Uma questão central da biologia evolutiva: deriva ou seleção? Science, 1968 Evolutionary Rate at the Molecular Level by M O T 0 0 KIMURA National Institute of Genetics, Japan Calculating the rate of evolution in terms of nucleotide substitutions seems t o give a value so high that many of the mutations involved must be neutral ones. COMPARATIVEstudies of haemoglobin molecules among different groups of animals suggest that, during the evolutionary history of mammals, amino-acid substitution has taken place roughly at the rate of one amino-acid for a chain consisting of some aminochange in acids. For example, by comparing the and chains of manwith those of horse, pig, cattleandrabbit,the was obtained'. figure of one amino-acid change in x Nature, 1968 Uma questão central da biologia evolutiva: deriva ou seleção? ção de mutação e deriva Como responder? Testar previsões: Para neutralistas: 1. Seleção negativa (remoção de deletérias) é comum 2. Seleção positiva é rara 3. k = µ Logo, taxas de substituição constantes 4. H proporcional ao N da população Seleção negativa é comum (previsão 1) Funcionalmente importante -> muda menos Funcionalmente menos importante -> muda mais Padrão consistente com ação de seleção negativa 10 Taxas de substituição de aminoácidos entre humanos e roedores Evolução proteica (subst/sítio/milhão de anos x109) Histona 0 Mioglobina 0.57 Apolipo-proteina 3.72 Kimura, 1974 Seleção negativa é comum (predição 1): mais mudança em genes menos “restritos” ou “tolerantes” Evolução proteica (subst/sítio/milhão de anos x109) Histona 0 Mioglobina 0.57 Apolipo-proteina 3.72 D N D N D Kimura, 1974 Seleção negativa é comum (predição 1): variação em taxas não sinônimas devido a seleção negativa dS > dN Taxas de substituição segundo a visão neutralista Taxas de substituição são constantes? (previsão 3) • Taxas de substituição na hemoglobina Isso seria esperado num cenário de seleção positiva? Taxas de substituição segunda a visão neutralista • Taxas de substituição em muitos outros genes Relógio molecular varia entre espécies - taxa de mutação diferente? - Seleção? Variação genética é proporcional ao tamanho populacional (previsão 4) 2µ Crow e Kimura, 1964 H pode ser estimado a partir de dados Podemos testar a hipótese neutra: - N previsto faz sentido? 1/2N Variação genética é proporcional ao tamanho populacional (previsão 4)? (baseada na análise de variação genética) Taxa de heterozigose observada O paradoxo da variação N grande mas H baixo Taxa de heterozigose esperada (baseada no tamanho populacional e taxa de mutação) -> N prevê variação de modo impreciso -> variação nas populações grandes é menor do que a esperada pela teoria neutra Fatores que moldam Ne: diversidade é REVIEW S melhor explicada Asexual r lead to increa of chromosom 4 heterozygous This theoret empirical cor first reported quent analyse 1 In several oth ing effects of asexual linea stration of ac genome-wid 0.2 pairs in the p significant inc that was asso selection, wh tions70. This the power of 100,000 20 in characteriz Ellegren & Galtier, Nat. variation Rev. Genetics, 2016 patt Genetic diversity Propagule size (cm) 100 1 0.01 0.1 100 ecundity (o spring per day Interação entre seleção e deriva: modelo p0=0.01 s=0.1 h=1 N=500 ! p0=0.01 s=0.1 h=1 N=50 ! p0=1/2N s=0.01 h=1 N=5 ! 21 (baseada na análise de variação genética) Taxa de heterozigose observada Seleção sobre quase neutras explica padrão ex., s=0.01 é removido aqui Taxa de heterozigose esperada (baseada no tamanho populacional) Explicação: em populações maiores, mais variação fracamente deletéria é removida A teoria quase neutra “A teoria quase neutra pode ser resumida da seguinte forma. Tanto a deriva genética como a seleção influenciam o comportamento de mutações fracamente selecionadas. A deriva predomina em populações pequenas, e a seleção em populações grandes. A maioria das novas mutações é deletéria, e a maioria das mutações de efeito pequeno devem ser muito fracamente deletérias. Há seleção contra essas mutações em populações grandes, mas se comportam como neutras e populações pequenas” Tomoko Ohta Teste para seleção de mutações fracamente selecionadas Ilha: Anas luzonica Mais substituições não-sinônimas Continente: Anas zonorhyncha, Menos substituições não-sinônimas Johnson and Seger, 2001. Mol Biol Evol. Mas: “Molecular evolutionary consequences of island colonisation” diz que não. http://dx.doi.org/10.1101/014811 Teste para seleção de mutações fracamente selecionadas Africanos Europeus 25 Menos polimorfismos não sinônimos Mais polimorfismos não sinônimos Lohmueller et al., 2008. Nature ate clade (Figure 1F–I). These LRTs were all based on sed site or branch-site models of codon evolution ] (see Methods). The test for all branches was applied in the primate clade the tests for selection somewhat (nearly thr Teste para seleção de mutações fracamente selecionadas 6 mamíferos 16,500 genes Text Em rosa: dN/dS para ramo Kosiol et al., 2008. Plos Genetics Como estimar kN e kS AAA TCT ATG ACC TCC AAA AAA ACT ATG ACC TCA AAA Como estimar dN e dS AAA TCT ATG ACC TCC AAA AAA ACT ATG ACC TCA AAA N Ser −> Thr S Ser −> Ser Como estimar dN e dS AAA TCT ATG ACC TCC AAA AAA ACT ATG ACC TCA AAA total de sítios: 18 sítios não-sinônimos: 12 sítios sinônimos: 6 dN = 1/12 dS = 1/6 dN/dS=0,5 Predições a partir de kN e kS dN/dS < 1 seleção remove deletérias (seleção negativa) dN/dS = 1 ausência de seleção (neutralidade completa) dN/dS > 1 seleção fixa vantajosas (seleção positiva) Seleção positiva é rara? (predição 2) • O caso da lisozima colobinos Presbytis entellus dN/dS=3,5 na linhangem de colobinos dN/dS = 0,6 para as demais linhangens de primatas * Recently duplicated genes are removed, but orthologs sets are retained if they still contain a hum doi:10.1371/journal.pgen.1000144.t001 Seleção positiva é rara? O quão comum é dN/dS > 1? were to each other (see Methods). Requiring that each human gene had a high-confidence 1:1 ortholog in at least two other species reduced the total number of ortholog sets to 16,529. These sets contain a human gene and either five (42% of cases), four (28%), three (15%) or two (15%) non-human orthologs. Likelihood Ratio Tests for Positively Selected Genes We performed a series of nine different LRTs to identify genes under positive selection on particular branches or clades of interest Patterns of Positive Selection in Six Mammalian in the six-species phylogeny. In particular, we tested for selection Genomes on any branch of the tree (Figure 1A); on the branch leading to, and on any branch within, the primate clade (Figure 1B,C); on the Carolin Kosiol1, Tomáš Vinař1, Rute R. da Fonseca2, Melissa J. Hubisz3, Carlos D. Bustamante1, Rasmus “Of ,16,500 human genes withleading high-confidence 2 1 branch to, and on any branch within, the rodent clade , Adam Siepel * Nielsen (Figure on States each of the2 Institute four ofindividual branches within 1 Department of Biological Statistics and Computational Biology, Cornell University,1D,E); Ithaca, New and York, United of America, Biology, University of orthologs in at least two other species, 400 Copenhagen, Copenhagen, Denmark, 3 Department of Human Genetics, University of Chicago, Chicago, Illinois, United States of America the primate clade (Figure 1F–I). These LRTs were all based on genes showed significantwidely evidence used site of or positive branch-site models of codon evolution Abstract [31,26,27] (see Methods). The test for all branches was applied selection” Genome-wide scans for positively selected genes (PSGs) in mammals have provided insight into the dynamics of genome evolution, the genetic basis of differences between species, and the functions of individual genes. However, previous scans have been limited in power and accuracy owing to small numbers of available genomes. Here we present the most comprehensive examination of mammalian PSGs to date, using the six high-coverage genome assemblies now available for eutherian mammals. The increased phylogenetic depth of this dataset results in substantially improved statistical power, and permits several new lineage- and clade-specific tests to be applied. Of ,16,500 human genes with high-confidence orthologs in at least two other species, 400 genes showed significant evidence of positive selection (FDR,0.05), according to a standard likelihood ratio test. An additional 144 genes showed evidence of positive selection on particular lineages or clades. As in previous studies, the identified PSGs were enriched for roles in defense/immunity, chemosensory perception, and reproduction, but enrichments were also evident for more specific functions, such as complement-mediated immunity and taste perception. Several pathways were strongly enriched for PSGs, suggesting possible co-evolution of interacting genes. A novel Bayesian analysis of the possible ‘‘selection histories’’ of each gene indicated that most PSGs have switched multiple times between positive selection and nonselection, suggesting that positive selection is often episodic. A detailed analysis of Affymetrix exon array data indicated that PSGs are expressed at significantly lower levels, and in a more tissuespecific manner, than non-PSGs. Genes that are specifically expressed in the spleen, testes, liver, and breast are significantly enriched for PSGs, but no evidence was found for an enrichment for PSGs among brain-specific genes. This study provides additional evidence for widespread positive selection in mammalian evolution and new genome-wide insights into the functional implications of positive selection. to all 16,529 ortholog set group or ou reduced the The PSG seven (the FDR,0.05 genes identi small, prima species dive mammals d tests substa between se macaque. T in the prima the tests for somewhat (n Conclusão: Seleção positiva é detectável mas rara Citation: Kosiol C, Vinař T, da Fonseca RR, Hubisz MJ, Bustamante CD, et al. (2008) Patterns of Positive Selection in Six Mammalian Genomes. PLoS Genet 4(8): e1000144. doi:10.1371/journal.pgen.1000144 Editor: Mikkel H. Schierup, University of Aarhus, Denmark Received January 7, 2008; Accepted June 27, 2008; Published August 1, 2008 Copyright: ! 2008 Kosiol et al. This is an open-access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited. Funding: Funding was provided by NSF grants DBI-0644111 (CK, TV, AS) and NSF0516310 (CK, CDB), a Packard Fellowship (AS), and a Microsoft Research New Faculty Fellowship (AS). Competing Interests: The authors have declared that no competing interests exist. * E-mail: [email protected] 32 Kosiol et al., 2008 Mensagens da aula - Seleção contra mutações deletérias é comum e explica padrões de variação - Muita mudança evolutiva deve-se à deriva (como prevê teoria neutra) - O relógio molecular representa um teste da teoria neutra. Ainda há controvérsia. - Deriva sozinha não explica toda a variação: - há casos de genes selecionados (dN/dS revela isso) - Há menos variação (H) em populações com N grande do que seria esperado - Duas explicações: mutações fracamente deletérias e tamanho efetivo - Há evidências para o maior acúmulo de variantes fracamente deletérias em populações menores