SNPs

Transcrição

SNPs
Marcadores Genéticos
Qualquer característica morfológica ou molecular que
diferencia indivíduos, e que seja facilmente detectável
Marcadores Morfológicos
É um fenótipo de fácil identificação, normalmente
determinado por um único alelo.
Características fenotípicas são utilizadas como
marcadores morfológicos desde os tempos de Mendel,
como fenótipos de fácil identificação visual
Marcadores Bioquímicos (moleculares)
Baseado na propriedade de migração das
proteínas, as quais podem ser separadas por
eletroforese;
Marcadores de DNA (moleculares)
Polimorfismo detectado na seqüência de DNA
Vantagens:
- Não é objeto de influências ambientais;
- Potencialmente ilimitado em número;
Maior desvantagem é a necessidade de técnicas e equipamentos
mais complexos.
Características Desejáveis
•
•
•
•
•
•
•
alto polimorfismo;
reprodutibilidade;
amplamente distribuído através do genoma;
discriminação;
ausência de influências ambientais;
barato;
fácil de mensurar
Tipos de marcadores
• Hibridação
– RFLP – (Restriction Fragment Length Polymorphism)
– Minissatélites – VNTR –(Variable Number of Tandem
Repeats)
• Amplificação de DNA
– RAPD – (Random Amplified Polymorphic DNA)
– SCAR (Sequence Characterized Amplified Regions) ou
ASA (Amplified Specific Amplicon)
– Microssatélites –SSR (Simple Sequence Repeats)
– AFLP (Amplified Fragment Length Polymorphism)
RAPD
• Polimorfismo de DNA entre indivíduos pode
ser devido a:
– Ausência do sítio do primer.
– Surgimento de um novo sítio.
– Ao comprimento da região amplificada entre sítios
de primer
• SNPs**
Microssatélites – SSR (Simple
Sequence Repeats)
• Significa Seqüências Simples Repetidas, a qual
consiste de pequenas seqüências de
nucleotídeos (1 a 4) repetidas em tandem.
• Essas seqüências são distribuídas ao acaso no
genoma e constituem a classe de marcador
mais polimórfica hoje disponível
• Primers específicos (20 a 30 pb).
• Diferentes números de elementos simples
repetidos.
• Cada segmento amplificado de tamanho
diferente representa um alelo diferente do
mesmo loco
•Requer biblioteca de
fragmentos genômico para
o organismo de interesse
Genótipos na eletroforese
http://tandem.bu.edu/trf/trf.intermediate.submit.html
SNPs
• A Single Nucleotide
Polymorphism, ou SNP
("snip"):
– pequena
mudança,
ou
variação, que pode ocorrer
numa sequência de DNA em
uma porção significativa (mais
de 1% ) de uma população.
Single Nucleotide Polymorphism
• SNPs são as mais frequentes formas de variações
genéticas
– 90% das variações genéticas humanas vêm dos
SNPs
– SNPs ocorrem a cada 300~600 nucleotídeos
• SNPs tem se tornado marcadores de preferência
pela sua grande abundância e pelo
desenvolvimento de tecnologias de genotipagem
em larga escala
Single Nucleotide Polymorphism
• SNPs são alterações no DNA que se mantém nas
gerações futuras
– SNP: variação >1%
– Mutação: variação <1%
94%
CTTAGCTT
99.9%
CTTAGCTT
6%
CTTAGTTT
0.1%
CTTAGTTT
SNP
Mutação
De onde vem essas variações?
• variações nas sequências são resultados de mutações
TAAAAAT
TAACAAT
• SNPs foram mutações que se
propagaram ao longo de gerações
TAAAAAT
TAAAAAT
TAAAAAT
TAAAAAT
TAACAAT
TAACAAT
TAACAAT
TAACAAT
Mutações and SNPs
Variações genéticas
SNPs
Mutações
Ancestral
comum
tempo
presente
observadas
Classificação de SNP
Nãocodificantes
Codificantes
Sinônimas
podem
modificar a
estrutura e a
estabilidade do
RNA mensageiro
Nãosinônimas
conservativas
Nãoconservativas
Aplicações dos SNPs
• Genotipagem - padrões de SNP
• Pesquisas em desenvolvimentos de drogas
• São marcadores para identificar genes e
diferenças genéticas que podem determinar a
resposta de pacientes a uma doença ou
tratamento.
• Descoberta e mapeamento de genes
• Diagnóstico ou perfil de risco
• Encontrar o par perfeito
Encontrando SNPs:
Mineração de SNPs baseados no sequenciamento
Genomic
mRNA
cDNA
Library
BAC
Library
RRS
Library
BAC
Overlap
Shotgun
Overlap
Sequenciamento
De DNA
EST
Overlap
Encontrando SNPs:
Mineração de SNPs baseados no sequenciamento
DNA from multiple individuals
Fragment DNA
Sequence and Reassemble
(known sequence)
Assembly with other overlapping
GTTACGCCAATACAGGATCCAGGAGATTACC
GTTACGCCAATACAGCATCCAGGAGATTACC
From overlap identify mismatches = SNPs
Amplificação do DNA
5’
Sequenciamento
3’
Vários indivíduos
Phred
Phrap
Base-calling
Contig assembly
PolyPhred
Polymorphism detection
Consed
Sequence viewing
Polymorphism tagging
Analysis
Relatório de polimorfismos
Genotipagem individual
Análise filogenética
Homozigoto
C/C
Heterozigoto
C/T
Homozigoto
T/T
Etapas do PolyBayes
Alinhamento multiplo ancorando os
fragmentos na sequência de referência
Filtro de parálogos: excesso de mismatchs
levando em conta os valores de qualidade
Detecção de SNPs -> diferença entre
verdadeiros polimorfismos e erros de
sequenciamento utilizando valores de
qualidade
Identificação de SNPs com o QualitySNP
• Análise das informações do agrupamento
• Detecção dos SNPs (todos os SNPs potenciais bi, tri e tetra
alélico)
• Filtro dos dados
• Detecção dos haplótipos
• Detecção dos SNPs sinônimos e não sinônimos com o fasty
(blastx)
• Identificação do KaKs
• Geração dos dados e transferência para um banco de dados
• Interface para recuperação dos dados
Reconstrução dos Haplótipos com o qualitySNP
• Grupo de sequências num cluster que representa o mesmo
alelo de um gene
• Tem o mesmo nucleotídeo no sítio polimórfico
• Utiliza métodos matemáticos para minimizar falsas
contruções de haplótipos causados por erro de
sequenciamento
Identificação dos SNPs sinônimos e nãosinônimos
• Fasty para alinhamento com o UNIPROT
– Permite frameshifts entre os códons
– Produz melhores alinhamento com sequências de
qualidade ruim
• Seleciona primeiro hit
• Detecta a ORF
• Corrige possíveis frameshifts
• Detecta sSNP/nsSNP e SNPs ou INDELs em região UTR
haplótipos
-A C T T T G C T C-
Haplotype 1
C
T
C
-A C T T A G C T T-
Haplotype 2
C
A
T
-A A T T T G C T C-
Haplotype 3
A
T
C
SNP1 SNP2
SNP3
SNP1 SNP2
SNP3
Blocos de haplótipos
• Dentro de um bloco haplótipo, acontece pouca
ou nenhuma recombinação
• Os SNPs dentro de um bloco haplótipo tendem
a ser passados juntos nas gerações posteriores
• Dentro de um bloco haplótipo, um pequeno
subconjunto de SNPs (Tag SNPs) é suficiente para
distinguir cada haplótipo
– Então será preciso utilizar apenas os Tag SNPs para
genotipar ao invéz de usar todos os SNPs no bloco haplótipo
Zonas de recombinação e Blocos de
haplótipos
Haplotype patterns
P1
Recombination
hotspots
P2
P3
P4
S1
S2
S3
S4
Haplotype
blocks
S5
SNP
loci
S6
S7
S8
S9
S10
S11
Chromosome
S12
: Major allele
: Minor allele
Exemplos de Tag SNPs
Haplotype patterns
P1
P2
P3
Amostra desconhecida
P4
S1
S2
S3
S4
Desejamos distinguir um haplótipo
desconhecido
Podemos genotipar todos os SNPs para
identificar a amostra desconhecida
S5
SNP
loci
S6
S7
S8
S9
: Major allele
S10
S11
S12
: Minor allele
Examples of Tag SNPs
Haplotype pattern
P1
S1
P2
P3
P4
S2
S3
Não é necessário genotipar todos os
SNPs
SNPs S3, S4, e S5 podem formar um
grupo de tag SNPs.
S4
S5
SNP
loci
S6
P1
S7
S8
S3
S9
S4
S10
S5
S11
S12
P2
P3
P4
Exemplos de Tag SNPs errados
Haplotype pattern
P1
P2
P3
P4
S1
S2
S3
S4
S5
SNP
loci
S6
P1
S7
S8
S9
S10
S11
S12
S1
S2
S3
P2
P3
P4
Exemplos de Tag SNPs
Haplotype pattern
P1
P2
P3
P4
S1
S2
SNPs S1 e S12 podem formar um
conjunto de tag SNPs
Este é o menor conjunto de SNP nesse
exemplo
S3
S4
S5
SNP
loci
S6
S7
S8
S9
S10
S11
S12
P1
S1
S12
P2
P3
P4
Taxa de Evolução
Para inferir uma taxa de evolução a um gene são
estimados o KA e o KS
KA - é a relação entre substituições não sinônimas e
todos os possíveis sitios não sinônimos
KS – é a relação entre substituições sinônimas e
todos os possíveis sítios sinônimos
• Exemplo:
• Prolina:
– CCT
– CCA
– CCG
– CCC
• Um sítio sinônimo e dois não sinônimos
KA/KS (dn/ds)
A taxa KA/KS é uma medida clássica da evolução de maneira
global num gene
KA/KS << 1 indica que uma substancial proporção de
mudanças de aminoácidos devem ter sido eliminadas por
seleção de purificação.
KA/KS > 1 indica seleção adaptativa ou positiva
• A taxa de KAKS em humanos e chimpanzes é de 0,23.
• Assumindo que mutações sinônimas são neutras, esse
resultado implica que 77% das alterações de aminoácidos em
genes hominideos são suficientemente deletérias e são
eliminadas por seleção natural. Como mutações sinônimas
não são totalmente neutras, a proporção de alterações de
aminoácido neutras com consequências deletérias deve ser
maior
KaKs_calculator - Métodos
•
•
•
•
•
•
•
•
NG: Nei, M. and Gojobori, T. (1986) - Faster
LWL: Li, W.H., et al. (1985)
LPB: Li, W.H. (1993) and Pamilo, P. and Bianchi, N.O. (1993)
MLWL (Modified LWL), MLPB (Modified LPB): Tzeng, Y.H., et
al. (2004)
YN: Yang, Z. and Nielsen, R. (2000)
MYN (Modified YN): Zhang, Z., et al. (2006)
GY: Goldman, N. and Yang, Z. (1994)
MS (Model Selection), MA (Model Averaging): based on a
set of candidate models defined by Posada, D. (2003) as
follows.
Aula Prática
• Montar Ests com sequência
• Encontrar prováveis SNPs
• Visualizar cromatograma para validar e identificar
homozigotos de heterozigotos
• Definir haplótipos
• Definir tag SNPs
• Caracterizar – snSNP ou sSNP; CDS; Transição ou transversão;
• Desenhar sondas para separar haplotipos e genotipar