monografia_biomedicina

Transcrição

monografia_biomedicina
Universidade Federal de Pernambuco
Centro de Ciências Biológicas
Curso de Biomedicina
Perfil de Conservação e Variabilidade Nucleotídica do Gene env
do Vírus da Imunodeficiência Humana tipo 1 (HIV-1)
João Lucena Neto
Recife
2010
João Lucena Neto
Perfil de Conservação e Variabilidade Nucleotídica do Gene env
do Vírus da Imunodeficiência Humana tipo 1 (HIV-1)
Monografia apesentada à Coordenação do Curso de
Biomedicina da Universidade Federal de
Pernambuco como parte dos requisitos para
obtenção do grau de bacharel em biomedicina.
Orientador: Prof. Ederson Akio Kido
Recife
2010
Perfil de Conservação e Variabilidade Nucleotídica do Gene env
do Vírus da Imunodeficiência Humana tipo 1 (HIV-1)
João Lucena Neto
Nota: 9,5
______________________________________________
Orientador: Prof. Ederson Akio Kido
Departamento de Genética da UFPE
Banca Examinadora
______________________________________________
1° Membro: Dr. Carlos Henrique Madeiros Castelletti
Laboratório de Imunopatologia Keizo Asami (LIKA/UFPE)
______________________________________________
2° Membro: Dr. Rafael Lima Guimarães
Laboratório de Imunopatologia Keizo Asami (LIKA/UFPE)
______________________________________________
Suplente: Dr. José Ribamar Costa Ferreira Neto
Departametno de Genética da UFPE
Dedicatória
Dedico ao meu querido e saudoso avô, João Lucena Sobrinho (em memória), pelos
momentos inesquecíveis e felizes da minha infância.
Dedico ao naturalista inglês Charles Darwin por nos ter revelado o mecanismo básico
da evolução: a seleção natural.
Dedico também ao cientista da evolução Richard Dawkins pela sua obra.
Agradecimentos
Ao Prof. Ederson Akio Kido, meu orientador, pelos prestimosos conselhos,
profissionalismo e credibilidade que me proporcionou.
Aos professores do CCB. A dedicação e o ensino nos possibilitaram chegar ao final
desta jornada e o início de uma nova fase de formação científica.
Aos voluntários que participaram deste nosso trabalho. A todos vocês sou
profundamente grato.
Resumo
A AIDS é um grande desafio para a saúde pública mundial. Apesar dos
avanços obtidos no diagnóstico e no tratamento a cura ainda não existe. O seu agente
etiológico, o vírus HIV, evoluiu a ponto de se replicar em células de defesa do hospedeiro.
Desenvolveu também um sofisticado conjunto de áreas distintas, com diferentes níveis de
mutação, que o permite contornar os anticorpos e outras defesas do hospedeiro. Pode-se
afirmar que a identificação das áreas de alta e baixa mutação no genoma do HIV é primordial
para o entendimento desse mecanismo genético e, consequentemente, como auxiliar no
desenvolvimento de anticorpos, vacinas ou outras terapias que possam neutralizar a maioria
dos isolados circulantes. Este trabalho apresenta um critério de definição de alta e baixa
mutação com base em percentuais de identidades dos alinhamentos (pairwise % identity), que
permitiu identificar 42 áreas de muito baixa mutação, 13 de baixa mutação, 17 de alta
mutação e 17 de muito alta mutação. Apresenta também uma sequência consenso com pelo
menos 75% de bases coincidentes para o gene env do HIV-1, com base em 3979 sequências
depositadas no GenBank (NCBI).
Palavras-chave: AIDS. Envelope viral. Gene env. Sequência consenso. Mutação.
Abstract
AIDS is a major challenge for global public health. Despite the progress achieved in
the diagnosis and treatment, the AIDS cure does not yet exist. Its etiological agent, the HIV,
evolved to the point where replication in the defense of host cells occurs. The virus also
presents a sophisticated set of distinct areas with different mutation degrees that allow it to
circumvent the antibodies and other host defenses. It may be affirmed that the identification of
high and low mutation areas in HIV genome is important for the understanding of this genetic
mechanism and consequently how to help the development of antibodies, vaccines or other
therapies that can neutralize the majority of the circulating isolates. This paper presents a
definition of high and low mutation based on alignments identity (pairwise % identity) that
allowed the identification of 42 areas with very low mutation, 13 with low mutation, 17 with
high mutation and 17 with too high mutation. Also presents a consensus sequence with at
least 75% of coincident nucleotides for the env gene (HIV-1) on base of 3937 sequences from
Genbank (NCBI).
Keywords: AIDS, Viral envelope, Env gene, Consensus sequence, Mutation.
Lista de Figuras
Figura 01. Representação linear da glicoproteína env do HIV-1. A seta indica o
local de clivagem para gp120 e gp41. V1 a V5 são domínios variáveis. C1 a C5
são domínios conservados. Os números dos aminoácidos são
indicados (FREED et al, 2001).
4
Figura 02. Visão geral das proteínas codificadas pelos genes do HIV-1.
6
Figura 03. Parâmetros utilizados para o alinhamento de sequências de nucleotídeos.
8
Figura 04. Parâmetros utilizados para o alinhamento de consensos.
9
Figura 05. Esquema apresentando a região de anelamento
dos primers WAHG1 e bWATG1 no gene env de consenso.
16
Figura 06. Esquema apresentando a região de anelamento
dos primers bWATG2 e WAHG2 no gene env de consenso
16
Figura 07. Posição de alguns aminoácidos do sítio de ligação CD4BS, na área
considerada de alta mutação HM-11.
18
Figura 08. Posição do aminoácido Asp457 do sítio de ligação CD4BS, na área
considerada de alta mutação HM-12.
19
Figura 09. A região V3 abrange parte das áreas LM-5, VHM-9 e HM-8.
A posição 11ª (a partir do segundo códon) codifica uma Serina (AGT) e a 25ª
posição (GAM) codificaria um ácido aspártico ou ácido glutâmico.
20
Figura 10. Resíduos de consenso de parte da região V3. A regra 11/25 baseada
nos aminoácidos nas posições 11 e 25 não foi confirmada, nem o último
resíduo GPGR do β-hairpin tip.
21
Lista de Tabelas e Mapas
Tabela 01. Critérios para definição de alta e baixa mutação
com base no percentual de identidade (pairwise % identity)
10
Tabela 02. Áreas de mutação muito baixa (VLM), quantidade de bases
contidas e percentual de identidade observado (pairwise % identity)
11
Tabela 03. Áreas de mutação consideradas muito baixa (VLM), baixa (LM),
alta (HM) e muito alta (VHM), com suas posições iniciais e finais de acordo
com o gene env do genoma NC_001802.
12
Tabela 04. Primers e sonda utilizados por Attatippaholkun
(ATTATIPPAHOLKUN et al., 2002).
15
Tabela 05. Aminoácidos envolvidos na interação da gp120 com anticorpos
neutralizantes, suas localizações em áreas de baixa (LM), muito baixa (VLM),
alta (HM) e muito alta mutação (VHM), sítio de ligação e provável mecanismo
de neutralização do HIV.
18
Tabela 06. Correlação entre glicoproteínas gp120 e gp41 do envelope viral
do HIV e sugestivas áreas imunológicas, considerando áreas de baixa (LM),
muito baixa (VLM) e alta mutação (HM)
19
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o
consenso do gene env com pelo menos 75% de bases coincidentes (partes 1 a 24).
26
Mapa 02. Consenso do gene env com pelo menos 75% de bases
coincidentes (partes 1 a 22).
38
Mapa 03. Consenso do gene env com pelo menos 75% de bases
coincidentes (nucleotídeos).
46
Mapa 04. Consenso do gene env com pelo menos 75% de bases
coincidentes (tradução).
47
Sumário
1.
Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.
Revisão da Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.1 O vírus e a taxa mutacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2 O gene env e seus produtos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
3.
Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
4.
Material e Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
4.1 Sequências nucleotídicas e alinhamentos múltiplos . . . . . . . . . . . . . . . . .
8
4.2 Identificação de áreas com maior e menor diversidade ou mutação . . . .
9
5.
Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
6.
Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
6.1 Desenho de Primers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
6.2 Potenciais áreas indutoras de reação imunológica . . . . . . . . . . . . . . . . . .
16
7.
Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
8.
Sugestões e Recomendações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
9.
Referências Bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
10.
Apêndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
1
1. Introdução
Talvez a AIDS seja, nos dias atuais, o maior desafio para a saúde pública mundial, em
especial para os países africanos. Até o final de 2008, 33,4 milhões de pessoas eram
portadoras do HIV, 2,7 milhões foram infectadas e 2,0 milhões morreram de AIDS
(UNAIDS, 2009). Muito progresso foi obtido como testes diagnósticos mais eficientes,
terapia antirretroviral (com mais de 40 drogas desenvolvidas) e ampliação do conhecimento
científico sobre o ciclo de vida do agente etiológico, o vírus da Imunodeficiência Humana
(HIV). Uma busca no banco de dados PubMed (National Institutes of Health - National
Library of Medicine, USA) retorna mais de 210.000 publicações sobre esse vírus. No entanto,
a cura ainda não foi alcançada e não há vacina para a sua prevenção.
O HIV é diferente de outros vírus, principalmente por ter como alvo células
estratégicas do sistema imunológico, o que demonstra um alto grau de adaptação evolutiva,
provavelmente desenvolvida em espécies com sistema imunológico semelhante ao humano.
Pode-se especular que em tempos remotos, para garantir a sua sobrevivência e adaptação, o
HIV não teria como alvo células de defesa, mas sim células outras sem funções tão
específicas. Pressões seletivas podem ter “guiado” mutações que resultaram em sua
capacidade de se ligar a receptores das células de defesa, representando uma significativa
mudança no estilo de vida: para o vírus, uma célula de defesa é um lugar seguro para
replicação e menos suscetível a ataques pelas defesas do hospedeiro.
Uma característica fundamental da imunidade adaptativa é a sua capacidade de
identificar proteínas estranhas. O mecanismo básico é genético e envolve rearranjos de DNA,
hipermutação somática, maturação de afinidade, entre outros (JANEWAY et al., 2000). A
essa ação, o vírus responde com mutações que são testadas quanto à capacidade de contornar
os anticorpos do hospedeiro, mantendo, então, o seu ciclo de vida.
2
Assim, identificar áreas de alta e baixa mutação no genoma do HIV é primordial para
o entendimento dos mecanismos de defesa e, consequentemente, para direcionar anticorpos
que possam neutralizar a totalidade das cepas circulantes bem como o desenvolvimento de
vacinas ou de terapias que possam reduzir ou substituir o tratamento antirretroviral (e seus
efeitos colaterais). Neste trabalho, identificou-se áreas de alta e baixa mutação no gene ENV
do HIV-1. Trata-se do gene que codifica as proteínas do envelope viral que são as mais
imunogênicas e também responsáveis pela entrada do vírus na célula hospedeira.
3
2. Revisão da Literatura
2.1 O vírus e a taxa mutacional.
O vírus da imunodeficiência humana (HIV – human immunodeficiency virus) é o
agente etiológico de síndrome da imunodeficiência adquirida (SIDA ou, em inglês AIDS), em
seres humanos. Os HIVs são classificados na família Retroviridae, gênero Lentivirus
(COFFIN et al., 1986).
Através de estudos sorológicos, evidenciaram-se, até o momento, dois tipos
antigênicos: HIV-1 e HIV-2 (WIGG et al., 2002). Imaginou-se inicialmente que o HIV-1
fosse geneticamente homogêneo, entretanto, quando amostras da Europa, África e América do
Norte foram comparadas, inicialmente com enzimas de restrição, sua extensiva
heterogeneidade genética tornou-se evidente. Quando submetidos a sequenciamento, mesmo
amostras recuperadas de um único indivíduo, exibem significativa heterogeneidade (FREED
et al, 2001; SAAG et al, 1988), sendo que alguns nucleotídeos alterados (não-sinônimos)
resultam em substituição de aminoácidos enquanto outros (sinônimos) não alteram a
sequência proteica.
Essa grande heterogeneidade genética do HIV-1 pode ser explicada pela alta taxa de
erro da transcriptase reversa viral, pela ocorrência de eventos de recombinação e a uma alta
taxa de replicação viral no hospedeiro.
Embora as mudanças de nucleotídeo estejam distribuídas por todo o genoma do HIV1, as maiores variabilidades ocorrem no gene env, responsável pelas proteínas do envelope
viral (FREED et al., 2001). Regiões de hipervariabilidade (V1 a V5) presentes na sequência
codificante da gp120 são separadas por sequências relativamente conservadas (C1 a C5,
figura 01), (STARCICH et al., 1986; WILLEY et al., 1986).
4
O HIV-1 é o tipo mais virulento e mais disseminado pelo mundo, apresentando
elevada taxa de mutação. Para descrever essa variabilidade genética usa-se o conceito de
quasi-species, no qual o HIV é considerado como subpopulações de vírus e não um genoma
único (WIGG et al., 2002). Dados coletados indicam que a população de HIV-1 presente em
um indivíduo infectado pode variar de 6% a 10% na sequência de nucleotídeos. Numa mesma
região geográfica a variação de nucleotídeos pode chegar a 15% no gene gag (gene
responsável por elementos estruturais do vírus – capsídeo viral, núcleo capsídeo e matriz) e
até 30% no gene env. Entre regiões geográficas distintas a variação genética situa-se entre
30% e 40% dependendo do gene analisado (FREED et al., 2001).
Figura 01. Representação linear da glicoproteína env do HIV-1. A seta indica o local de clivagem para gp120 e
gp41. V1 a V5 são domínios variáveis. C1 a C5 são domínios conservados. Os números dos aminoácidos são
indicados (FREED et al., 2001).
Apesar de sua natural heterogeneidade, principalmente de suas glicoproteínas do
envelope, um domínio altamente conservado e imunodominante, localizado dentro da proteína
gp41, ainda estimula anticorpos em indivíduos infectados (FREED et al., 2001; GNANN et
al., 1987).
2.2 O gene env e seus produtos.
As glicoproteínas do gene env (gp120 e gp41) têm importantes funções no ciclo de
vida do vírus. Essas glicoproteínas contêm epítopos que estimulam a resposta imune
importante tanto no diagnóstico quanto na perspectiva de desenvolvimento de uma vacina.
5
Elas possuem os determinantes que interagem com o receptor CD4 e o coreceptor (CXCR4 e
CCR5), catalisando a reação de fusão da bicamada lipídica do envelope viral com a
membrana plasmática da célula hospedeira. A ligação ao CD4 induz mudanças
conformacionais na gp120, algumas das quais envolvem a exposição e/ou formação de sítios
de ligação para receptores de quimiocinas específicas (CXCR4 e CCR5). A terceira região de
variabilidade (V3) da gp120 é a principal determinante da especificidade ao receptor de
quimiocina. Entretanto, outras estruturas mais conservadas que são expostas após a ligação ao
CD4 também parecem estar envolvidas na ligação a esse receptor. Essa exposição induzida
pelo CD4 é indicada pelo estímulo de anticorpos que eficientemente bloqueiam a formação do
complexo gp120-CD4 ao receptor supracitado (KWONG et al., 1998).
As glicoproteínas são sintetizadas a partir do mRNA do gene env e a tradução ocorre
nos ribossomos associados com o retículo endoplasmático rugoso. O precursor é a
poliproteína gp160 (160-kd) e sofre oligomerização na forma predominante de trímeros. A
gp160 é transportada para o aparelho de Golgi onde é clivada proteoliticamente por enzimas
celulares formando as glicoproteínas gp120 (SU) e gp41 (TM), (figura 02). A clivagem da
gp160 é necessária para a infectividade viral. Posterior a clivagem, gp120 e gp41 formam
uma associação não-covalente que é transportada para a superfície celular (FREED et al.,
2001; KWONG et al., 1998).
6
Figura 02. Visão geral das proteínas codificadas pelos genes do HIV-1 (FREED et al., 2001).
O complexo de glicoproteínas, em particular o domínio gp120, é fortemente
glicosilado, aproximadamente metade da massa molecular da gp160 é composta de cadeias de
oligossacarídeos. Essas numerosas cadeias de oligossacarídeos formam o que pode ser
imaginado como uma “nuvem de açúcar” ocultando boa parte do gp120 para reconhecimento
pelo sistema imune.
7
3. Objetivos
Os objetivos deste trabalho foram:
 Identificar áreas de alta e baixa mutação no gene env a partir do alinhamento de
sequências de nucleotídeos armazenadas no GenBank (NCBI).
 Apresentar uma sequência de consenso para o gene env anotando as áreas de alta e
baixa mutação.
8
4. Material e Métodos
4.1 Sequências nucleotídicas e alinhamentos múltiplos
Sequências nucleotídicas para o gene env do HIV-1 foram obtidas da base de dados
GenBank do NCBI (http://www.ncbi.nlm.nih.gov/), com ajuda programa GENEIOUS PRO da
Biomatters Ltd (DRUMMOND et al., 2010).
Devido ao elevado número de sequências completas (3979) e limitações dos recursos
computacionais, alinhamentos múltiplos foram realizados em grupos (95 grupos de 42
sequências, com exceção do último grupo, com 31). Alinhamentos dentro dos grupos foram
feitos com a ferramenta Alignment do software e parâmetros especificados na figura abaixo.
Figura 03. Parâmetros utilizados para o alinhamento de sequências de nucleotídeos.
Posteriormente, esses 95 alinhamentos iniciais foram divididos em cinco pastas e, em
cada pasta, um novo alinhamento foi gerado, com uso dos parâmetros especificados na figura
04. Os cinco alinhamentos consensos (os quatro primeiros referentes a 840 sequências cada e
o último a 619 sequências) foram alinhados novamente com os mesmos parâmetros da figura
04. Esse alinhamento final foi base para a geração da sequência de consenso do gene env com
pelo menos 75% de bases coincidentes, aqui denominada de Sequência Consenso 75%.
9
Figura 04. Parâmetros utilizados para o alinhamento de consensos.
4.2 Identificação de áreas com maior e menor diversidade ou mutação
As áreas de maior e menor diversidade, aqui referidas como de maior e menor
mutação, foram identificadas na Sequência Consenso 75%, conforme critérios definidos na
tabela 01, e de acordo com resultados do parâmetro “Pairwise % identity”, verificados no
alinhamento final. Além desse critério, somente foram consideradas áreas de muito baixa
diversidade ou mutação (VLM) àquelas com um mínimo de seis nucleotídeos. Para as regiões
menores registrou-se somente o percentual de identidade. Na Sequência Consenso 75% foram
anotadas também as regiões denominadas V1 a V5 e aquelas responsáveis pelas proteínas
gp120 e gp41.
10
Tabela 01. Critérios para definição de alta e baixa mutação
com base no percentual de identidade.
Símbolo
Descrição da área
Pairwise % Identity
VLM
Very Low Mutation
(mutação muito baixa)
LM
Low Mutation
(mutação baixa)
 87%
e
 94%
HM
High Mutation
(mutação alta)
 70%
e
 87%
VHM
Very High Mutation
(mutação muito alta)
 70%
 94%
Um alinhamento final da Sequência Consenso 75% com o gene env extraído do
genoma NC_001802 (Human immunodeficiency virus 1, complete genome) foi feito e a
Sequência Consenso 75% também foi traduzida com uso do software GENEIOUS PRO.
.
11
5. Resultados
Apesar de o HIV-1 ser considerado um vírus altamente mutante, foram evidenciadas,
neste trabalho, áreas de alto percentual de identidade entre as sequências analisadas. Tais
áreas, consideradas bem conservadas ou VLM, conforme critérios aqui estabelecidos, são
apresentadas na tabela 02.
Tabela 02. Áreas de mutação muito baixa (VLM), quantidades de bases
contidas e percentual de identidade observado (Pairwise % Identity).
Área
VLM-1
VLM-2
VLM-3
VLM-4
VLM-5
VLM-6
VLM-6A
VLM-7
VLM-8
VLM-8A
VLM-8B
VLM-8C
VLM-9
VLM-10
VLM-10A
VLM-11
VLM-12
VLM-13
VLM-14
VLM-14A
VLM-15
VLM-16
VLM-16A
VLM-17
VLM-18
VLM-19
VLM-20
VLM-21
VLM-22
VLM-22A
VLM-23
VLM-24
VLM-25
VLM-26
VLM-27
VLM-27A
VLM-27B
VLM-27C
VLM-28
VLM-28A
VLM-28B
VLM-29
Quantidade de bases
9
36
36
6
45
27
6
75
18
6
9
6
18
57
6
42
21
18
21
9
12
15
6
12
12
24
9
9
9
6
9
18
24
18
18
6
9
9
9
6
6
12
Pairwise % Identity
94,6
95,5
95,0
98,0
96,8
94,3
95,8
94,2
94,7
95,8
96,3
96,0
95,4
94,5
96,4
97,1
97,1
96,2
94,8
94,4
96,3
97,2
96,1
97,1
97,4
96,2
98,3
97,7
95,4
97,8
96,7
97,4
94,1
95,4
96,3
95,7
94,8
94,6
97,5
95,0
96,4
95,5
12
Essas áreas anotadas como sendo VLM, bem como aquelas dos demais tipos (LM,
HM e VHM) encontram-se identificadas no mapa 01 (no apêndice), envolvendo o
alinhamento do gene env extraído do genoma NC_001802 com a sequência consenso, do
mesmo gene, com pelo menos 75% de bases coincidentes, bem como no mapa 02 (apêndice),
mostrando somente a Sequência Consenso 75%.
De forma geral, foram identificadas 42 áreas de baixa diversidade ou de mutação
muito baixa (VLM), 13 áreas de mutação baixa (LM), 17 áreas de mutação alta (HM) e 17
áreas de mutação muito alta (VHM) ou de alta diversidade. A tabela 03 resume os tipos de
áreas identificados e sua posição inicial e final, tendo como referência o gene env na
sequência NC_001802 (Human immunodeficiency virus 1, complete genome).
Tabela 03. Áreas de mutação consideradas muito baixa (VLM), baixa (LM), alta (HM) e
muito alta (VHM), com suas posições iniciais e finais de acordo com o gene env do genoma
NC_001802.
tipo de área
posição
inicial
sub
posição
inicial
sub
posição
final
posição
final
VLM
1
LM
HM
1
9
10
15
1
16
27
2
28
48
49
54
55
60
61
78
79
81
82
90
91
99
100
390
VHM
Pairwise % Identity
94,6
81,7
75,4
1
1
48,4
88,9
2
3
32,5
74,8
3
4
44,5
79,8
4
2
34,3
92,0
100
135
2
95,5
148
183
3
95,0
196
201
4
98,0
205
249
5
96,8
268
294
6
94,3
298
303
6A
95,8
307
381
7
391
462
463
489
490
534
535
549
550
570
94,2
5
3
23,3
89,1
6
5
65,8
84,7
7
21,4
13
cont.
tipo de área
posição
inicial
sub
posição
inicial
sub
posição
final
posição
final
571
591
592
801
LM
HM
6
678
8
757
762
8A
858
95,8
8
918
919
933
934
1002
972
1011
1012
1026
1027
1041
1042
1050
1051
1089
1090
1179
1180
1242
1243
1317
1318
1371
1372
1401
96,3
5
88,8
9
8
10
11
6
1545
1546
1662
82,1
14
7
10
23,2
90,0
12
1485
54,9
85,3
13
1429
58,6
82,4
12
9
41,1
85,7
11
1524
1525
96
10
1419
63,0
83,2
9
1402
58,3
83,6
8C
1003
1402
7
8B
880
967
86,3
94,7
879
850
Pairwise % Identity
89,7
810
811
VHM
4
661
802
32,3
93,1
95,4
94,5
15
8
64,7
93,7
1546
1551
10A
96,4
1555
1596
11
97,1
1606
1626
12
97,1
1630
1647
13
1663
1665
1666
1830
96,2
16
9
64,8
93,3
1672
1692
14
94,8
1696
1704
14A
94,4
1708
1719
15
96,3
1723
1737
16
97,2
1741
1746
16A
96,1
1750
1761
17
97,1
1765
1776
18
97,4
1783
1806
19
96,2
1810
1818
20
98,3
1822
1830
21
97,7
1837
1845
22
95,4
1864
1869
22A
97,8
1879
1887
23
1831
1996
VLM
1995
2019
13
78,2
96,7
10
91,8
14
cont.
tipo de área
posição
inicial
sub
posição
inicial
sub
posição
final
posição
final
2020
2031
2032
2157
VLM
LM
HM
VHM
14
Pairwise % Identity
78,3
11
93,2
2032
2049
24
97,4
2053
2076
25
94,1
2080
2097
26
95,4
2116
2133
27
96,3
2137
2142
27A
95,7
2149
2157
27B
2158
2178
2179
2232
2233
2265
2266
2358
2359
2364
2365
2571
94,8
15
70,5
12
91,2
16
74,1
13
89,0
17
17
28,1
84,4
2401
2409
27C
94,6
2476
2484
28
97,5
2488
2493
28A
95,0
2527
2532
28B
96,4
2536
2547
29
95,5
15
6. Discussão
6.1 Desenho de primers
A evidência de áreas mais conservadas ou de baixa mutação (VLM) no gene env,
conforme apresentadas nas tabelas 2 e 3, são úteis para desenho de primers, visando
amplificação via PCR.
Levando-se em consideração apenas os tamanhos das áreas e suas conservações nas
sequências virais estudadas, podem-se considerar como prováveis áreas para desenho de
primers, as regiões: VLM-2, VLM-3, VLM-5, VLM-6, VLM-7, VLM-10, VLM-11, VLM12, VLM-14, VLM-19 (ou VLM-19 + ATY1 + VLM-20), VLM-25. Alguns autores (OU et
al.,
1988)
têm
utilizado
dois
pares
de
primers
no
gene
env:
(SK68
–
5’AGCAGCAGGAAGCACTATGG3’ e SK69 – 5’CCAGACTGTGAGTTGCAACAG3’;
CO1 – 5’ACAATTATTGTCTGGTATAG3’ e CO2 – 5’AGGTATCTTTCCACAGCCAG3’).
A sequência SK68 está situada na área VLM-11, SK69 nas áreas VLM-14A e VLM-15, CO1
nas áreas VLM-12 e VLM-13, e CO2 nas áreas VLM-16A e VLM-17 (vide mapa 02, partes
14, 15 e 16, no apêndice). Essas constatações corroboram a afirmativa de conservação para
essas áreas, apresentada anteriormente.
Também, ATTATIPPAHOLKUN et al. (2002), têm-se utilizado de quatro primers em
um método para detecção do DNA proviral do HIV-1 (tabela 04).
Tabela 04. Primers e sonda utilizados por Attatippaholkun
(ATTATIPPAHOLKUN et al., 2002).
Primers e sonda
Sequência nucleotídica (5’ – 3’)
Primers mais externos
WAHG1
WAHG2
Primers mais internos
bWATG1
bWATG2
sonda
WAPG
1
ATY: Adenina + Timina + (Citosina ou Timina)
TTCCTTGGGTTCTTGGGAC
AGGTATCTTTCCACAGCCAG
bGCAGCAGGAAGCACTATGG
bCCAGGACTCTTGCCTGGAGC
GAGCCTGTGCCTCTTCAGCTACCACCG
16
As figuras 06 e 07 exibem a localização desses primers nas áreas VLM-11 (forward
primers) e VLM-16+VLM-16A+VLM-17 (reverse primers) reforçando assim o caráter
conservado dessas áreas.
Figura 05. Esquema apresentando a região de anelamento dos primers WAHG1 e bWATG1
no gene env de consenso.
Figura 06. Esquema apresentando a região de anelamento dos primers bWATG2 e WAHG2
no gene env de consenso.
6.2 Potenciais áreas indutoras de reação imunológica
Outra observação importante para essas regiões de baixa diversidade é o fato de as
moléculas MHC-I apresentarem fragmentos peptídicos com 8 a 10 aminoácidos e as de classe
II, MHC-II, com 13 ou mais aminoácidos (JANEWAY et al., 2000). Sendo assim, pode-se
inicialmente eleger como potenciais áreas indutoras de reação imunológica para serem
utilizadas em vacinas de peptídeos sintéticos (Synthetic Peptide Vaccine), os segmentos de
mutação muito baixa com mais de 24 bases. São elas: VLM-2, VLM-3, VLM-5, (VLM-
17
6+VLM-6A+VLM-7), VLM-10, (VLM-11+GCGTCA), (VLM-12+CWA2+VLM-13), (VLM16+GTC+VLM-16A+GTR3+VLM-17+ARG4+VLM-18),
(VLM-24+ATA6+VLM-25+RTA7+VLM-26),
(VLM-19+ATY5+VLM-20),
(VLM-27+TAC8+VLM-27A+TTRTCR9
+VLM-27B).
O desenvolvimento de uma vacina capaz de bloquear grande parte das linhagens do
HIV-1 passa pelo design de anticorpos que interagem com as regiões de mutação muito baixa
do envelope viral.
A sequência de aminoácidos do envelope viral, em especial, da glicoproteína gp120
consiste de cinco regiões de variabilidade (V1 a V5) interpostas entre regiões mais
conservadas (C1 a C5). As regiões variáveis V1 a V4 formam alças (loops) ancoradas em
suas bases por pontes dissulfeto (WYATT et al., 1998; LEONARD et al., 1990). A região V1
foi mapeada na área VHM-5; V2 nas áreas VHM-6, HM-5, VHM-7 e HM6; V3 nas áreas
LM-5, VHM-9 e HM-8; V4 nas áreas HM-11, VHM-13 e LM-610; V5 nas áreas VHM-14 e
LM-711 (vide mapa 02 no apêndice). A área LM-3 delimita as regiões entre V1 e V2. Essas
constatações reforçam o caráter variável dessas áreas e, ao acrescentar um quantitativo de sua
variabilidade (porcentagem de identidade), permite evidenciar aminoácidos estratégicos para
a estrutura tridimensional da proteína e sua função.
Anticorpos neutralizantes reconhecem tanto as estruturas variáveis quanto as
conservadas do gp120, no entanto, os mais gerais anticorpos reconhecem epítopos
conservados em três regiões da glicoproteína gp120. Segundo Wyatt e colaboradores, 1998,
2
CWA: Citosina + (Adenina ou Timina) + Adenina.
GTR: Guanina + Timina + (Adenina ou Guanina).
4
ARG: Adenina + (Adenina ou Guanina) + Guanina.
5
ATY: Adenina + Timina + (Citosina ou Timina)
6
ATA: Adenina + Timina + Adenina.
7
RTA: (Adenina ou Guanina) + Timina + Adenina.
8
TAC: Timina + Adenina + Citosina.
9
TTRTCR: Timina + Timina + (Adenina ou Guanina) + Timina + Citosina + (Adenina ou Guanina).
10
Apenas os quatro primeiros aminoácidos de LM-6. Como a estrutura de V4 forma um laço ligado nas
extremidades por pontes dissulfeto, é de se esperar estabilidade nessas áreas. De fato, a região inicial de V4 tem
um percentual de identidade de 91,8%; a região final, 91,0%. Vide mapa 02, parte 11, no apêndice.
11
Apenas os três últimos aminoácidos. Vide mapa 02, parte 13, no apêndice.
3
18
os mais abundantes destes anticorpos são direcionados contra o sítio de ligação do CD4
(CD4BS) e bloqueiam a interação gp120-CD4. Menos comuns são anticorpos contra epítopos
induzidos ou expostos após a ligação ao CD4 (CD4i). A tabela 05 mostra os aminoácidos
envolvidos na interação da gp120 com anticorpos neutralizantes e as localizações em áreas de
baixa (LM), muito baixa (VLM), alta (HM) e muito alta mutação (VHM).
Tabela 05. Aminoácidos envolvidos na interação da gp120 com anticorpos neutralizantes,
suas localizações em áreas de baixa (LM), muito baixa (VLM), alta (HM) e muito alta
mutação (VHM), sítio de ligação e provável mecanismo de neutralização do HIV.
Sítio de
ligação
Aminoácidos em gp120 *
Localização
Neutralização do vírus
Asn 88, Asp 113, Lys 117,
LM-2 e VLM-7
Interferência na ligação gp120Ser 256, Thr 257, Asn 262, Ala 266,
LM-4
CD4. Anticorpos contra a área
Asp 368, Glu 370, Tyr 384,
CD4BS competem com CD4
HM-11
Lys 421, Trp 427,
LM-6
Asp 457,
HM-12
Pro 470,
LM-7 e VLM-9
Asp 474, Met 475,
LM-7
Asp 477,
LM-7 e VLM-10
Asp/Leu/Tyr 482/483/484
LM-7 e VLM-10
Asn 88, Lys 117, Lys 121,
LM-2 e VLM-7
Interfere com a ligação
CD4i
Lys 207,
LM-4
receptor-CXCR4/CCR5
Ser 256, Thr 257, Asn 262,
LM-4
Glu 370, Glu 381, Phe 382,
HM-11
Arg 419, Ile 420, Lys 421, Gln 422,
LM-6
Ile 423, Trp 427, Tyr 435, Pro 438,
LM-6
Met 475
LM-7
 * aminoácidos numerados de acordo com a sequência HXBC2; Adaptado de WYATT et al., 1998.
CD4BS
Embora os aminoácidos Asp368, Glu370, Tyr384 e Asp457 estejam numa área de alta
mutação, HM-11 e HM-12, suas vizinhanças são razoavelmente conservadas com percentual
de identidade de 87,3% para Asp368 e Glu370, 91,3% para Tyr384 e 92% para Asp457. Esses
percentuais classificariam essas vizinhanças como áreas de baixa mutação (LM) (figuras 07 e
08).
Figura 07. Posição de alguns aminoácidos do sítio de ligação CD4BS, na área considerada de
alta mutação HM-11.
19
Figura 08. Posição do aminoácido Asp457 do sítio de ligação CD4BS, na área considerada de
alta mutação HM-12.
Essas novas informações agregadas ao levantamento efetuado das áreas de mutação
baixa (LM) e mutação muito baixa (VLM) permitem indicar regiões conservadas, atrativas
para intervenção imunológica como o desenvolvimento de vacinas de peptídeos sintéticos ou
outras intervenções. A tabela 06 compila esses dados.
Tabela 06. Correlação entre glicoproteínas gp120 e gp41 do envelope viral do HIV e
sugestivas áreas imunológicas, considerando áreas de baixa (LM), muito baixa (VLM) e
alta mutação (HM).
Gene
Áreas imunológicas
gp120
gp41*
LM-2 (VLM-2/3/4/5/6 VLM-6A VLM-7)
LM-4 (VLM-8 VLM-8A)
LM-5
HM-11
LM-6
HM-12
LM-7 (VLM-9 VLM-10)
LM-8 (VLM-10A VLM-11/12/13)
LM-9 (VLM-14/14A/15 VLM-16 VLM-16A VLM-17/18/19/20/21)
LM-11 (VLM-24/25/26 VLM-27/27A/27B)
LM-12
LM-13
* Não foi analisada que regiões são trans membrana (não imunodominantes).
Essas novas anotações no gene env também nos permitem tecer diversos comentários
sobre a região V3. Essa região, chamada pela literatura referente ao HIV de third variable
region, foi aqui mapeada entre os segmentos LM-5, VHM-9 e HM-8 (vide figuras 09 e 10).
V3 é imunodominante e contém características essenciais para ligação ao coreceptor (CXCR4
20
ou CCR5). Acredita-se que sua conformação estendida e a acessibilidade aos anticorpos
expliquem sua imunodominância (HUANG et al., 2005). Tipicamente, V3 consiste de 35
aminoácidos (faixa de 31 a 39) e acredita-se ser fundamental tanto na ligação quando na
determinação de que coreceptor se ligar. Embora V3 seja uma região de variabilidade, está
menos sujeita a inserções e deleções do que outras regiões (HUANG et al., 2005).
Verificando o mapa 02, parte 9, e principalmente no mapa 01, parte 10 (vide apêndice) se
constatou que apenas o segmento VHM-9 comportaria inserções e deleções.
Diferentes coreceptores, CXCR4 e CCR5, podem suportar a entrada do HIV-1 e a
análise de sequências tem definido a regra 11/25 (se a décima primeira posição de V3 ou a
vigésima quinta são positivamente carregadas, o vírus irá usar o CXCR4; em qualquer outra
situação, usa-se o CCR5) (HOFFMAN et al., 2002). Essa regra precisaria ser confirmada,
pois se verificou que a 11ª posição tem uma predileção por Serina – S (códon AGT, mais de
93%) e a 25ª posição (códon GAM), por resíduos ácidos (ácido aspártico – D ou ácido
glutâmico – E) (figuras 09 e 10)
Figura 09. A região V3 abrange parte das áreas LM-5, VHM-9 e HM-8. A posição 11ª (a
partir do segundo códon) codifica uma Serina (AGT) e a 25ª posição (GAM) codificaria um
ácido aspártico ou ácido glutâmico.
A região conhecida como β-hairpin tip (ápice do loop V3; figura 10) é comumente
citada como formada por quatro resíduos GPGR (Gly-Pro-Gly-Arg) (MOHRI et al., 1997).
Nesta análise, a 4ª posição (ARA) permuta entre Arginina – R e Lisina – K, dois resíduos
básicos. Assim, essa região seria mais bem identificada como sendo GPG(R/K).
21
Figura 10. Resíduos de consenso de parte da região V3. A regra 11/25 baseada nos
aminoácidos nas posições 11 e 25 não foi confirmada, nem o último resíduo GPGR do βhairpin tip.
Do ponto de vista da variabilidade, as mutações nas posições 12, 13, 14 e 22 (em
relação ao primeiro aminoácido da área V3, em azul na figura 10) podem ser responsáveis
pela capacidade do vírus de se evadir da neutralização mediante anticorpos uma vez que
apenas os resíduos conservados nas posições 1 (C-Cys), 3 (R-Arginina), 4 (P-Prolina), 35 (CCys) e na região do beta-hairpin tip parecem definir a ligação com o coreceptor (HOFFMAN
et al., 2002; HUANG et al., 2005).
22
7. Conclusão
A sequência consenso do gene env, aqui apresentada, devidamente anotada com as
áreas de alta e baixa variabilidade nucleotídica, constitui uma valiosa informação para:
 A definição de primers;
 O estudo dos sítios de ligação do CD4 e do CXCR4/CCR5;
 O desenvolvimento de novas drogas bloqueadoras dos sítios de ligação da
GP120/GP41;
 A definição de peptídeos sintéticos com capacidade de induzir anticorpos amplamente
neutralizantes, independente do subtipo viral do HIV-1.
23
8. Sugestões e Recomendações
O elevado grau de adaptação evolutiva do HIV-1 ao sistema imunológico (SI) está a
exigir novas abordagens para o desenvolvimento de uma vacina preventiva ou terapêutica.
No que se refere a produção de anticorpos neutralizantes o maior desafio para o SI é
produzir um anticorpo que se ligue com alta afinidade a uma proteína de superfície do vírus
bloqueando a sua entrada na célula hospedeira. O sítio ideal para ligação é o CD4BS (sítio de
ligação do CD4) na glicoproteína gp120.
No entanto, os receptores das células B (Ig de membrana) podem ter afinidade para
outras áreas da gp120/gp41, em princípio, ainda permitindo a ligação do vírus com os
receptores da célula hospedeira.
Pode-se considerar duas alternativas para o desenvolvimento de uma vacina que
“guie” o sistema imunológico para a produção de anticorpos contra o sítio CD4BS:
 A partir de proteína sintética com superfície semelhante ao CD4BS;
 A partir de pequenos peptídeos representativos dos aminoácidos de baixa mutação que
compõem o sítio ativo do CD4BS. Essa alternativa, embora mais simples, perde em
capacidade estimular o SI uma vez que a afinidade 3D para o sítio de ligação é
substituída por uma afinidade linear (a sequência peptídica).
Qualquer que seja a abordagem, a sequência consenso (e suas áreas de alta e baixa
mutação), aqui apresentada, é o material básico para o desenvolvimento de antígenos
independente do subtipo viral do HIV-1.
24
9. Referências Bibliográficas
ATTATIPPAHOLKUN,
W.
H.;
LEK-NGAM,
P.;
BEJRACHANDRA,
S.;
ATTATIPPAHOLKUN, M. K. A novel molecular method for HIV-1 proviral DNA
detection: non-radioactively--reversed probe hybridization and nested PCR. Southeast
Asian J Trop Med Public Health. 2002 Mar;33(1):72-79.
COFFIN, J.; HAASE, A.; LEVY, Jay A.; MONTAGNIER, Luc; et al. Human
Immunodeficiency virus [letter]. Science 1986; 232:697.
DRUMMOND, A.J.; ASHTON, B.; CHEUNG, M.; HELED, J.; KEARSE, M.; MOIR, R.;
STONES-HAVAS, S.; THIERER, T.; WILSON, A. (2010) Geneious v5.0, Disponível em:
http://www.geneious.com/
FREED, E.O.; MARTIN, M. A. HIVs and Their Replication. In: KNIPE, D. M.; HOWLEY,
P. M. (eds.) Fundamental Virology. 4 th ed., Philadelphia: Lippincott Williams & Wilkins;
2001. Chapter 28 p. 913-983
GNANN, J. W. Jr; NELSON, J. A.; OLDSTONE, M. B. A. Fine mapping of an
immunodominant domain in the transmembrane glycoprotein of human
immunodeficiency virus. J Virol 1987; 61:2639-2641.
HOFFMAN, Noah G.; SEILLIER-MOISEIWITSCH, Francoise; AHN, JaeHyung;
WALKER, Jason M.; SWANSTROM, Ronald. Variability in the Human
Immunodeficiency Virus Type 1 gp120 Env Protein Linked to Phenotype-Associated
Changes in the V3 Loop. Journal of Virology 2002; 76:3852-3864
HUANG, Chih-chin; TANG, Min; ZHANG, Mei-Yun; MAJEED, Shahzad; MONTABANA,
Elizabeth; STANFIELD, Robyn L.; DIMITROV, Dimiter S.; KORBER, Bette; SODROSKI,
Joseph; WILSON, Ian A.; WYATT, Richard; KWONG, Peter D. Structure of a V3Containing HIV-1 gp120 Core. Science 2005; 310:1025-1028.
JANEWAY, Charles A.; TRAVERS, Paul; WALPORT, Mark; CAPRA, J. Donald.
Imunobiologia – O sistema imunológico na saúde e na doença. 4ª edição. Porto Alegre:
Artmed editora. 2000. Cap 3, p.79-113. Cap. 4, p. 115-158.
KWONG, P. D.; WYATT, R.; ROBINSON, J.; SWEET, R. W.; SODROSKI, J.;
HENDRICKSON, W. A. Structure of an HIV gp120 envelope glycoprotein in complex
with the CD4 receptor and a neutralizing human antibody. Nature 1998; 393(6686):648659.
25
LEONARD, C. K.; SPELLMAN, M. W.; RIDDLE, L.; HARRIS, R. J.; THOMAS, J. N.;
GREGORY, T. J. Assignment of intrachain disulfide bonds and characterization of
potential glycosylation sites of the type 1 recombinant human immunodeficiency virus
envelope glycoprotein (gp120) expressed in Chinese hamster ovary cells. J. Biol. Chem.
1990. 265: 10373-10382.
MOHRI H.; ASAKURA Y.; FUKUSHIMA J.; KAWAMOTO S.; OKUBO T.; OKUDA K.
Synthetic peptide from the V3 loop consensus motif with a potent anti-HIV activity
inhibits ristocetin-mediated vWF-GPIb interaction. Peptides 1997; 18:1289-1293.
OU, C. Y.; KWOK, S.; MITCHELL, S. W.; MACK, D. H.; SNINSKY, J. J.; KREBS, J. W.;
FEORINO, P.; WARFIELD, D.; SCHOCHETMAN, G. DNA amplification for direct
detection of HIV-1 in DNA of peripheral blood mononuclear cells. Science 1988;
239:295-297
SAAG, M. S.; HAHN, B. H.; GIBBONS, J. et al. Extensive variation of human
immunodeficiency virus type-1 in vivo. Nature 1988;334:440-444
STARCICH, Bruno R.; HAHN, Beatrice H.; SHAW, George M.; McNEELY, Paul D.;
MODROW, Susanne; WOLF, Hans; PARKS, Elizabeth S.; PARKS, Wade P.; JOSEPHS,
Steven F.; GALLO, Robert C.; WONG-STAAL, Flossie. Identification and
characterization of conserved and variable regions in the envelope gene of HTLVIII/LAV, the retrovirus of AIDS. Cell 1986; 45:637-648.
UNIADS. AIDS Epidemic Update 2009.
Disponível em: http://data.unaids.org/pub/Report/2009/JC1700_Epi_Update_2009_en.pdf.
WIGG, M. D. Vírus da Imunodeficiência Humana. In: SANTOS, N. S.; ROMANOS, M. T.
V.; WIGG, M. D. (Org.). Introdução à Virologia Humana. 1ª ed. Rio de Janeiro:
Guanabara-Koogan; 2002. Cap.14, p.183-197.
WILLEY, R. L.; RUTLEDGE, R. A ; DIAS, S.; FOLKS, T.; THEODORE, T.; BUCKLER,
C. E.; MARTIN, M. A. Identification of conserved and divergent domains within the
envelope gene of the acquired immunodeficiency syndrome retrovirus. PNAS 1986;
83(14): 5038-5042.
WYATT, Richard; KWONG, Peter K.; DESJARDINS, Elizabeth; SWEET, Raymond W.;
ROBINSON, James; HENDRICKSON, Wayne A.; SODROSKI, Joseph G. The antigenic
structure of the HIV gp120 envelope glycoprotein. Nature 1998; 393:705-711.
26
10. Apêndices
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (parte 1).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 2).
27
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 3).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 4).
28
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 5).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 6).
29
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 7).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 8).
30
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 9).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 10).
31
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 11).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 12).
32
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 13).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 14).
33
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 15).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 16).
34
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 17).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 18).
35
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 19).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 20).
36
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 21).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 22).
37
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 23).
Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 24).
38
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (parte 1).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 2).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 3).
39
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 4).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 5).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 6).
40
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 7).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 8).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 9).
41
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 10).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 11).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 12).
42
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 13).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 14).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 15).
43
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 16).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 17).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 18).
44
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 19).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 20).
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 21).
45
Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 22).
46
Mapa 03. Consenso do gene env com pelo menos 75% de bases coincidentes (nucleotídeos).
1
10
20
30
40
50
|
|
|
|
|
|
ATGAGAGTGAWGGRGATCAGGARGAATTRTCARCACTKNTNNNNGARATG
GGGCAYNNNNNNNNTNCTCCTTGGGATRTTRATGANNTGTARTGCTRMAN
NNNNNNNNTTGTGGGTCACAGTCTATTATGGGGTACCTGTGTGGAAAGAA
GCAAMCACCACTCTATTTTGTGCATCAGATGCTAAAGCATATGAKACAGA
RGYACATAATGTYTGGGCCACACATGCCTGTGTACCCACAGACCCCAACC
CACAAGAARTAGTATTGGRAAATNTGACAGAAAATTTTAACATGTGGAAA
AATAACATGGTAGAWCAGATGCATGAGGATATAATCAGTTTATGGGATCA
AAGCCTAAAGCCATGTGTAAAATTAACCCCACTCTGTGTTACTTTAAATT
GNNCTRANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNTRAAAAACTGCTCTTTCAATRTCACCACANRNR
NNNTAAGAGATANGRNNNNMARNANNGAATATGCNCTNTTTNATARACTT
GATRTAGTACCANTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNTATAGRTTRATAARTTGTAAYACCTCAGTCATTACACAGGCCT
GTCCAAAGGTATCCTTTGARCCAATTCCCATACATTATTGTGCCCCRGCT
GGTTTTGCGATTCTAAARTGTAATRATAAGAMRTTCAATGGAAMAGGACC
ATGTAMAAATGTCAGCACAGTACAATGTACACATGGAATTARRCCAGTAG
TRTCAACTCAACTGCTGTTAAATGGCAGTCTAGCAGAANNNANGANRNTA
GTAATTAGATCTGAMAATTTCACRRACAATGCTAAAAYCATAATAGTACA
KCTGAAYGAAWCTGTARWAATTAATTGTACAAGACCCAACAACAATACAA
GAAAAAGTATNAMTATRGGACCAGGGARAGCATTTTATRCAACAGGAGAM
ATAATAGGAGATATAAGACAAGCACATTGTAACMTTAGTRRARNNNNNRA
NTGGAATRAMACTTTAMRAMANGRTAGYTNNNNAAAATTAAGANANCAAT
TTNNNNNNAATAANACNNNANTARNCTTTAAWNAMTCCTCAGGAGGGGAC
CCAGAAATTGTAANGCACAGNTTTAATTGTNGAGGGGAATTTTTCTACTG
TAATWCAACAMAACTGTTTAATAGTACNTGNNNNNNNNNNNNNNNNNRRN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNNNNNNNTCACACTCCCATGCAGAATAAAACAAATTATAAACAT
GTGGCAGGAAGTAGGAAAAGCAATGTATGCCCCTCCCATCNRAGGANNAA
TTARMTGTTYATCAAATATTACAGGRYTRMTATTAACAAGAGATGGWGGN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAGAYCTTCAG
ACCTGGAGGAGGARATATGARGGACAATTGGAGAAGTGAATTATATAAAT
ATAAAGTAGTAAAAATTGAACCATTAGGARTAGCACCCACCAAGGCAAAG
AGAAGAGTGGTGCAGAGAGAAAAAAGAGCANNNNNNNGNNNNNTAGGAGC
TNTGTTCCTTGGGTTCTTGGGAGCAGCAGGAAGCACTATGGGCGCAGCGT
CARTRACGCTGACGGTACAGGCCAGACWATTATTGTCTGGTATAGTGCAA
CAGCAGAACAATNTGCTGAGRGCTATTGAGGCGCAACAGCATMTGTTGCA
ACTCACRGTCTGGGGCATCAARCAGCTCCAGGCAAGAGTCCTGGCTGTRG
AAAGATACCTAARGGATCAACAGCTCCTRGGRATTTGGGGTTGCTCTGGA
AAACTCATYTGCACCACTRCTGTGCCTTGGAAYRCTAGTTGGAGTNATAA
ATCTMWRRNWRABATTTGGRANAACATGACCTGGATGSAGTGGGAWARAG
ANATTRACAATTANACANNNRNYWTNATATACAMYTTAMTTGAASAATCG
CARAACCARCAAGANAAGAATGAACAAGAWTTATTRGMATTRGATAARTG
GGCAAGTTTGTGGAATTGGTTTRACATAWCAAAHTGGCTGTGGTATATAA
AAATATTCATAATGATAGTAGGAGGCTTGRTAGGTTTAAGAATAGTTTTT
RCTGTRCTTTCTATAGTRAATAGAGTTAGGCAGGGATACTCACCATTRTC
RTTTCAGACCCNCCTCCCARCCCSGAGGGNACCCGACAGGCCCGAAGGAA
YCGAAGAAGAAGGTGGAGAGAGAGACAGAGACAGATCNNNNNDNCSATTA
GTGRATGGATTCTTAGCAMTYATCTGGGWCGAYCTRCGGAGCCTGTGCCT
CTTCAKCTACCACCGCTTGAGAGACTTACTCTTGATTGYARCGAGGATTG
TGGAACTTCTGGGACNNNNNNNNNNNGGGTGGGAARYCCTCAARTATTGG
TGGAATCTCCTRCAGTATTGGAGYCAGGAACTAAAGAATAGTGCTGTTAG
CTTGCTYAAYRCCAYAGCYATAGCAGTAGCTGAGGGRACAGATAGGNTTA
TAGAARTAKTACAAAGARYTTNTAGAGCTATYCTCMACATACCTASAAGA
ATAAGACAGGGNTTRGAAAGRGCTTTGCTATAA
47
Mapa 04. Consenso do gene env com pelo menos 75% de bases coincidentes (tradução).
1
10
20
30
40
50
|
|
|
|
|
|
MRV??IR?N?QH????WG????LLG?LM?C?A????LWVTVYYGVPVWKE
A?TTLFCASDAKAY?TE?HNVWATHACVPTDPNPQE?VL?N?TENFNMWK
NNMV?QMHEDIISLWDQSLKPCVKLTPLCVTLN?????????????????
???????????????????????KNCSFN?TT???RD?????EYALF??L
D?VP???????????????YRLI?CNTSVITQACPKVSFEPIPIHYCAPA
GFAILKCN?K?FNG?GPC?NVSTVQCTHGI?PVVSTQLLLNGSLAE????
VIRS?NFT?NAK?IIV?LNE?V?INCTRPNNNTRKS???GPG?AFY?TG?
IIGDIRQAHCN?S????WN?TL???S??KLR?QF??N?T???F??SSGGD
PEIV?H?FNC?GEFFYCN?T?LFNST????????????????????????
?????TLPCRIKQIINMWQEVGKAMYAPPI?G?I?C?SNITGL?LTRDGG
?????????????E?FRPGGG?M?DNWRSELYKYKVVKIEPLG?APTKAK
RRVVQREKRA?????GA?FLGFLGAAGSTMGAAS?TLTVQAR?LLSGIVQ
QQNN?LRAIEAQQH?LQLTVWGIKQLQARVLAVERYL?DQQLLGIWGCSG
KLICTT?VPWN?SWS?KS???IW?NMTWM?W???I?N?T???IY?L?E?S
QNQQ?KNEQ?LL?LDKWASLWNWF?I??WLWYIKIFIMIVGGL?GLRIVF
?VLSIVNRVRQGYSPLSFQT?LP??R?PDRPEG?EEEGGERDRDRS???L
V?GFLA?IW?DLRSLCLF?YHRLRDLLLI??RIVELLG????GWE?LKYW
WNLLQYWSQELKNSAVSLLN??AIAVAEGTDR?IE??QR??RAIL?IP?R
IRQGLERALL*

Documentos relacionados