SNPs
Transcrição
SNPs
Marcadores Genéticos Qualquer característica morfológica ou molecular que diferencia indivíduos, e que seja facilmente detectável Marcadores Morfológicos É um fenótipo de fácil identificação, normalmente determinado por um único alelo. Características fenotípicas são utilizadas como marcadores morfológicos desde os tempos de Mendel, como fenótipos de fácil identificação visual Marcadores Bioquímicos (moleculares) Baseado na propriedade de migração das proteínas, as quais podem ser separadas por eletroforese; Marcadores de DNA (moleculares) Polimorfismo detectado na seqüência de DNA Vantagens: - Não é objeto de influências ambientais; - Potencialmente ilimitado em número; Maior desvantagem é a necessidade de técnicas e equipamentos mais complexos. Características Desejáveis • • • • • • • alto polimorfismo; reprodutibilidade; amplamente distribuído através do genoma; discriminação; ausência de influências ambientais; barato; fácil de mensurar Tipos de marcadores • Hibridação – RFLP – (Restriction Fragment Length Polymorphism) – Minissatélites – VNTR –(Variable Number of Tandem Repeats) • Amplificação de DNA – RAPD – (Random Amplified Polymorphic DNA) – SCAR (Sequence Characterized Amplified Regions) ou ASA (Amplified Specific Amplicon) – Microssatélites –SSR (Simple Sequence Repeats) – AFLP (Amplified Fragment Length Polymorphism) RAPD • Polimorfismo de DNA entre indivíduos pode ser devido a: – Ausência do sítio do primer. – Surgimento de um novo sítio. – Ao comprimento da região amplificada entre sítios de primer • SNPs** Microssatélites – SSR (Simple Sequence Repeats) • Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem. • Essas seqüências são distribuídas ao acaso no genoma e constituem a classe de marcador mais polimórfica hoje disponível • Primers específicos (20 a 30 pb). • Diferentes números de elementos simples repetidos. • Cada segmento amplificado de tamanho diferente representa um alelo diferente do mesmo loco •Requer biblioteca de fragmentos genômico para o organismo de interesse Genótipos na eletroforese http://tandem.bu.edu/trf/trf.intermediate.submit.html SNPs • A Single Nucleotide Polymorphism, ou SNP ("snip"): – pequena mudança, ou variação, que pode ocorrer numa sequência de DNA em uma porção significativa (mais de 1% ) de uma população. Single Nucleotide Polymorphism • SNPs são as mais frequentes formas de variações genéticas – 90% das variações genéticas humanas vêm dos SNPs – SNPs ocorrem a cada 300~600 nucleotídeos • SNPs tem se tornado marcadores de preferência pela sua grande abundância e pelo desenvolvimento de tecnologias de genotipagem em larga escala Single Nucleotide Polymorphism • SNPs são alterações no DNA que se mantém nas gerações futuras – SNP: variação >1% – Mutação: variação <1% 94% CTTAGCTT 99.9% CTTAGCTT 6% CTTAGTTT 0.1% CTTAGTTT SNP Mutação De onde vem essas variações? • variações nas sequências são resultados de mutações TAAAAAT TAACAAT • SNPs foram mutações que se propagaram ao longo de gerações TAAAAAT TAAAAAT TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT TAACAAT Mutações and SNPs Variações genéticas SNPs Mutações Ancestral comum tempo presente observadas Classificação de SNP Nãocodificantes Codificantes Sinônimas podem modificar a estrutura e a estabilidade do RNA mensageiro Nãosinônimas conservativas Nãoconservativas Aplicações dos SNPs • Genotipagem - padrões de SNP • Pesquisas em desenvolvimentos de drogas • São marcadores para identificar genes e diferenças genéticas que podem determinar a resposta de pacientes a uma doença ou tratamento. • Descoberta e mapeamento de genes • Diagnóstico ou perfil de risco • Encontrar o par perfeito Encontrando SNPs: Mineração de SNPs baseados no sequenciamento Genomic mRNA cDNA Library BAC Library RRS Library BAC Overlap Shotgun Overlap Sequenciamento De DNA EST Overlap Encontrando SNPs: Mineração de SNPs baseados no sequenciamento DNA from multiple individuals Fragment DNA Sequence and Reassemble (known sequence) Assembly with other overlapping GTTACGCCAATACAGGATCCAGGAGATTACC GTTACGCCAATACAGCATCCAGGAGATTACC From overlap identify mismatches = SNPs Amplificação do DNA 5’ Sequenciamento 3’ Vários indivíduos Phred Phrap Base-calling Contig assembly PolyPhred Polymorphism detection Consed Sequence viewing Polymorphism tagging Analysis Relatório de polimorfismos Genotipagem individual Análise filogenética Homozigoto C/C Heterozigoto C/T Homozigoto T/T Etapas do PolyBayes Alinhamento multiplo ancorando os fragmentos na sequência de referência Filtro de parálogos: excesso de mismatchs levando em conta os valores de qualidade Detecção de SNPs -> diferença entre verdadeiros polimorfismos e erros de sequenciamento utilizando valores de qualidade Identificação de SNPs com o QualitySNP • Análise das informações do agrupamento • Detecção dos SNPs (todos os SNPs potenciais bi, tri e tetra alélico) • Filtro dos dados • Detecção dos haplótipos • Detecção dos SNPs sinônimos e não sinônimos com o fasty (blastx) • Identificação do KaKs • Geração dos dados e transferência para um banco de dados • Interface para recuperação dos dados Reconstrução dos Haplótipos com o qualitySNP • Grupo de sequências num cluster que representa o mesmo alelo de um gene • Tem o mesmo nucleotídeo no sítio polimórfico • Utiliza métodos matemáticos para minimizar falsas contruções de haplótipos causados por erro de sequenciamento Identificação dos SNPs sinônimos e nãosinônimos • Fasty para alinhamento com o UNIPROT – Permite frameshifts entre os códons – Produz melhores alinhamento com sequências de qualidade ruim • Seleciona primeiro hit • Detecta a ORF • Corrige possíveis frameshifts • Detecta sSNP/nsSNP e SNPs ou INDELs em região UTR haplótipos -A C T T T G C T C- Haplotype 1 C T C -A C T T A G C T T- Haplotype 2 C A T -A A T T T G C T C- Haplotype 3 A T C SNP1 SNP2 SNP3 SNP1 SNP2 SNP3 Blocos de haplótipos • Dentro de um bloco haplótipo, acontece pouca ou nenhuma recombinação • Os SNPs dentro de um bloco haplótipo tendem a ser passados juntos nas gerações posteriores • Dentro de um bloco haplótipo, um pequeno subconjunto de SNPs (Tag SNPs) é suficiente para distinguir cada haplótipo – Então será preciso utilizar apenas os Tag SNPs para genotipar ao invéz de usar todos os SNPs no bloco haplótipo Zonas de recombinação e Blocos de haplótipos Haplotype patterns P1 Recombination hotspots P2 P3 P4 S1 S2 S3 S4 Haplotype blocks S5 SNP loci S6 S7 S8 S9 S10 S11 Chromosome S12 : Major allele : Minor allele Exemplos de Tag SNPs Haplotype patterns P1 P2 P3 Amostra desconhecida P4 S1 S2 S3 S4 Desejamos distinguir um haplótipo desconhecido Podemos genotipar todos os SNPs para identificar a amostra desconhecida S5 SNP loci S6 S7 S8 S9 : Major allele S10 S11 S12 : Minor allele Examples of Tag SNPs Haplotype pattern P1 S1 P2 P3 P4 S2 S3 Não é necessário genotipar todos os SNPs SNPs S3, S4, e S5 podem formar um grupo de tag SNPs. S4 S5 SNP loci S6 P1 S7 S8 S3 S9 S4 S10 S5 S11 S12 P2 P3 P4 Exemplos de Tag SNPs errados Haplotype pattern P1 P2 P3 P4 S1 S2 S3 S4 S5 SNP loci S6 P1 S7 S8 S9 S10 S11 S12 S1 S2 S3 P2 P3 P4 Exemplos de Tag SNPs Haplotype pattern P1 P2 P3 P4 S1 S2 SNPs S1 e S12 podem formar um conjunto de tag SNPs Este é o menor conjunto de SNP nesse exemplo S3 S4 S5 SNP loci S6 S7 S8 S9 S10 S11 S12 P1 S1 S12 P2 P3 P4 Taxa de Evolução Para inferir uma taxa de evolução a um gene são estimados o KA e o KS KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos • Exemplo: • Prolina: – CCT – CCA – CCG – CCC • Um sítio sinônimo e dois não sinônimos KA/KS (dn/ds) A taxa KA/KS é uma medida clássica da evolução de maneira global num gene KA/KS << 1 indica que uma substancial proporção de mudanças de aminoácidos devem ter sido eliminadas por seleção de purificação. KA/KS > 1 indica seleção adaptativa ou positiva • A taxa de KAKS em humanos e chimpanzes é de 0,23. • Assumindo que mutações sinônimas são neutras, esse resultado implica que 77% das alterações de aminoácidos em genes hominideos são suficientemente deletérias e são eliminadas por seleção natural. Como mutações sinônimas não são totalmente neutras, a proporção de alterações de aminoácido neutras com consequências deletérias deve ser maior KaKs_calculator - Métodos • • • • • • • • NG: Nei, M. and Gojobori, T. (1986) - Faster LWL: Li, W.H., et al. (1985) LPB: Li, W.H. (1993) and Pamilo, P. and Bianchi, N.O. (1993) MLWL (Modified LWL), MLPB (Modified LPB): Tzeng, Y.H., et al. (2004) YN: Yang, Z. and Nielsen, R. (2000) MYN (Modified YN): Zhang, Z., et al. (2006) GY: Goldman, N. and Yang, Z. (1994) MS (Model Selection), MA (Model Averaging): based on a set of candidate models defined by Posada, D. (2003) as follows. Aula Prática • Montar Ests com sequência • Encontrar prováveis SNPs • Visualizar cromatograma para validar e identificar homozigotos de heterozigotos • Definir haplótipos • Definir tag SNPs • Caracterizar – snSNP ou sSNP; CDS; Transição ou transversão; • Desenhar sondas para separar haplotipos e genotipar