monografia_biomedicina
Transcrição
monografia_biomedicina
Universidade Federal de Pernambuco Centro de Ciências Biológicas Curso de Biomedicina Perfil de Conservação e Variabilidade Nucleotídica do Gene env do Vírus da Imunodeficiência Humana tipo 1 (HIV-1) João Lucena Neto Recife 2010 João Lucena Neto Perfil de Conservação e Variabilidade Nucleotídica do Gene env do Vírus da Imunodeficiência Humana tipo 1 (HIV-1) Monografia apesentada à Coordenação do Curso de Biomedicina da Universidade Federal de Pernambuco como parte dos requisitos para obtenção do grau de bacharel em biomedicina. Orientador: Prof. Ederson Akio Kido Recife 2010 Perfil de Conservação e Variabilidade Nucleotídica do Gene env do Vírus da Imunodeficiência Humana tipo 1 (HIV-1) João Lucena Neto Nota: 9,5 ______________________________________________ Orientador: Prof. Ederson Akio Kido Departamento de Genética da UFPE Banca Examinadora ______________________________________________ 1° Membro: Dr. Carlos Henrique Madeiros Castelletti Laboratório de Imunopatologia Keizo Asami (LIKA/UFPE) ______________________________________________ 2° Membro: Dr. Rafael Lima Guimarães Laboratório de Imunopatologia Keizo Asami (LIKA/UFPE) ______________________________________________ Suplente: Dr. José Ribamar Costa Ferreira Neto Departametno de Genética da UFPE Dedicatória Dedico ao meu querido e saudoso avô, João Lucena Sobrinho (em memória), pelos momentos inesquecíveis e felizes da minha infância. Dedico ao naturalista inglês Charles Darwin por nos ter revelado o mecanismo básico da evolução: a seleção natural. Dedico também ao cientista da evolução Richard Dawkins pela sua obra. Agradecimentos Ao Prof. Ederson Akio Kido, meu orientador, pelos prestimosos conselhos, profissionalismo e credibilidade que me proporcionou. Aos professores do CCB. A dedicação e o ensino nos possibilitaram chegar ao final desta jornada e o início de uma nova fase de formação científica. Aos voluntários que participaram deste nosso trabalho. A todos vocês sou profundamente grato. Resumo A AIDS é um grande desafio para a saúde pública mundial. Apesar dos avanços obtidos no diagnóstico e no tratamento a cura ainda não existe. O seu agente etiológico, o vírus HIV, evoluiu a ponto de se replicar em células de defesa do hospedeiro. Desenvolveu também um sofisticado conjunto de áreas distintas, com diferentes níveis de mutação, que o permite contornar os anticorpos e outras defesas do hospedeiro. Pode-se afirmar que a identificação das áreas de alta e baixa mutação no genoma do HIV é primordial para o entendimento desse mecanismo genético e, consequentemente, como auxiliar no desenvolvimento de anticorpos, vacinas ou outras terapias que possam neutralizar a maioria dos isolados circulantes. Este trabalho apresenta um critério de definição de alta e baixa mutação com base em percentuais de identidades dos alinhamentos (pairwise % identity), que permitiu identificar 42 áreas de muito baixa mutação, 13 de baixa mutação, 17 de alta mutação e 17 de muito alta mutação. Apresenta também uma sequência consenso com pelo menos 75% de bases coincidentes para o gene env do HIV-1, com base em 3979 sequências depositadas no GenBank (NCBI). Palavras-chave: AIDS. Envelope viral. Gene env. Sequência consenso. Mutação. Abstract AIDS is a major challenge for global public health. Despite the progress achieved in the diagnosis and treatment, the AIDS cure does not yet exist. Its etiological agent, the HIV, evolved to the point where replication in the defense of host cells occurs. The virus also presents a sophisticated set of distinct areas with different mutation degrees that allow it to circumvent the antibodies and other host defenses. It may be affirmed that the identification of high and low mutation areas in HIV genome is important for the understanding of this genetic mechanism and consequently how to help the development of antibodies, vaccines or other therapies that can neutralize the majority of the circulating isolates. This paper presents a definition of high and low mutation based on alignments identity (pairwise % identity) that allowed the identification of 42 areas with very low mutation, 13 with low mutation, 17 with high mutation and 17 with too high mutation. Also presents a consensus sequence with at least 75% of coincident nucleotides for the env gene (HIV-1) on base of 3937 sequences from Genbank (NCBI). Keywords: AIDS, Viral envelope, Env gene, Consensus sequence, Mutation. Lista de Figuras Figura 01. Representação linear da glicoproteína env do HIV-1. A seta indica o local de clivagem para gp120 e gp41. V1 a V5 são domínios variáveis. C1 a C5 são domínios conservados. Os números dos aminoácidos são indicados (FREED et al, 2001). 4 Figura 02. Visão geral das proteínas codificadas pelos genes do HIV-1. 6 Figura 03. Parâmetros utilizados para o alinhamento de sequências de nucleotídeos. 8 Figura 04. Parâmetros utilizados para o alinhamento de consensos. 9 Figura 05. Esquema apresentando a região de anelamento dos primers WAHG1 e bWATG1 no gene env de consenso. 16 Figura 06. Esquema apresentando a região de anelamento dos primers bWATG2 e WAHG2 no gene env de consenso 16 Figura 07. Posição de alguns aminoácidos do sítio de ligação CD4BS, na área considerada de alta mutação HM-11. 18 Figura 08. Posição do aminoácido Asp457 do sítio de ligação CD4BS, na área considerada de alta mutação HM-12. 19 Figura 09. A região V3 abrange parte das áreas LM-5, VHM-9 e HM-8. A posição 11ª (a partir do segundo códon) codifica uma Serina (AGT) e a 25ª posição (GAM) codificaria um ácido aspártico ou ácido glutâmico. 20 Figura 10. Resíduos de consenso de parte da região V3. A regra 11/25 baseada nos aminoácidos nas posições 11 e 25 não foi confirmada, nem o último resíduo GPGR do β-hairpin tip. 21 Lista de Tabelas e Mapas Tabela 01. Critérios para definição de alta e baixa mutação com base no percentual de identidade (pairwise % identity) 10 Tabela 02. Áreas de mutação muito baixa (VLM), quantidade de bases contidas e percentual de identidade observado (pairwise % identity) 11 Tabela 03. Áreas de mutação consideradas muito baixa (VLM), baixa (LM), alta (HM) e muito alta (VHM), com suas posições iniciais e finais de acordo com o gene env do genoma NC_001802. 12 Tabela 04. Primers e sonda utilizados por Attatippaholkun (ATTATIPPAHOLKUN et al., 2002). 15 Tabela 05. Aminoácidos envolvidos na interação da gp120 com anticorpos neutralizantes, suas localizações em áreas de baixa (LM), muito baixa (VLM), alta (HM) e muito alta mutação (VHM), sítio de ligação e provável mecanismo de neutralização do HIV. 18 Tabela 06. Correlação entre glicoproteínas gp120 e gp41 do envelope viral do HIV e sugestivas áreas imunológicas, considerando áreas de baixa (LM), muito baixa (VLM) e alta mutação (HM) 19 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (partes 1 a 24). 26 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (partes 1 a 22). 38 Mapa 03. Consenso do gene env com pelo menos 75% de bases coincidentes (nucleotídeos). 46 Mapa 04. Consenso do gene env com pelo menos 75% de bases coincidentes (tradução). 47 Sumário 1. Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2. Revisão da Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.1 O vírus e a taxa mutacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.2 O gene env e seus produtos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 4. Material e Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4.1 Sequências nucleotídicas e alinhamentos múltiplos . . . . . . . . . . . . . . . . . 8 4.2 Identificação de áreas com maior e menor diversidade ou mutação . . . . 9 5. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 6. Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 6.1 Desenho de Primers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 6.2 Potenciais áreas indutoras de reação imunológica . . . . . . . . . . . . . . . . . . 16 7. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 8. Sugestões e Recomendações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 9. Referências Bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 10. Apêndices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1 1. Introdução Talvez a AIDS seja, nos dias atuais, o maior desafio para a saúde pública mundial, em especial para os países africanos. Até o final de 2008, 33,4 milhões de pessoas eram portadoras do HIV, 2,7 milhões foram infectadas e 2,0 milhões morreram de AIDS (UNAIDS, 2009). Muito progresso foi obtido como testes diagnósticos mais eficientes, terapia antirretroviral (com mais de 40 drogas desenvolvidas) e ampliação do conhecimento científico sobre o ciclo de vida do agente etiológico, o vírus da Imunodeficiência Humana (HIV). Uma busca no banco de dados PubMed (National Institutes of Health - National Library of Medicine, USA) retorna mais de 210.000 publicações sobre esse vírus. No entanto, a cura ainda não foi alcançada e não há vacina para a sua prevenção. O HIV é diferente de outros vírus, principalmente por ter como alvo células estratégicas do sistema imunológico, o que demonstra um alto grau de adaptação evolutiva, provavelmente desenvolvida em espécies com sistema imunológico semelhante ao humano. Pode-se especular que em tempos remotos, para garantir a sua sobrevivência e adaptação, o HIV não teria como alvo células de defesa, mas sim células outras sem funções tão específicas. Pressões seletivas podem ter “guiado” mutações que resultaram em sua capacidade de se ligar a receptores das células de defesa, representando uma significativa mudança no estilo de vida: para o vírus, uma célula de defesa é um lugar seguro para replicação e menos suscetível a ataques pelas defesas do hospedeiro. Uma característica fundamental da imunidade adaptativa é a sua capacidade de identificar proteínas estranhas. O mecanismo básico é genético e envolve rearranjos de DNA, hipermutação somática, maturação de afinidade, entre outros (JANEWAY et al., 2000). A essa ação, o vírus responde com mutações que são testadas quanto à capacidade de contornar os anticorpos do hospedeiro, mantendo, então, o seu ciclo de vida. 2 Assim, identificar áreas de alta e baixa mutação no genoma do HIV é primordial para o entendimento dos mecanismos de defesa e, consequentemente, para direcionar anticorpos que possam neutralizar a totalidade das cepas circulantes bem como o desenvolvimento de vacinas ou de terapias que possam reduzir ou substituir o tratamento antirretroviral (e seus efeitos colaterais). Neste trabalho, identificou-se áreas de alta e baixa mutação no gene ENV do HIV-1. Trata-se do gene que codifica as proteínas do envelope viral que são as mais imunogênicas e também responsáveis pela entrada do vírus na célula hospedeira. 3 2. Revisão da Literatura 2.1 O vírus e a taxa mutacional. O vírus da imunodeficiência humana (HIV – human immunodeficiency virus) é o agente etiológico de síndrome da imunodeficiência adquirida (SIDA ou, em inglês AIDS), em seres humanos. Os HIVs são classificados na família Retroviridae, gênero Lentivirus (COFFIN et al., 1986). Através de estudos sorológicos, evidenciaram-se, até o momento, dois tipos antigênicos: HIV-1 e HIV-2 (WIGG et al., 2002). Imaginou-se inicialmente que o HIV-1 fosse geneticamente homogêneo, entretanto, quando amostras da Europa, África e América do Norte foram comparadas, inicialmente com enzimas de restrição, sua extensiva heterogeneidade genética tornou-se evidente. Quando submetidos a sequenciamento, mesmo amostras recuperadas de um único indivíduo, exibem significativa heterogeneidade (FREED et al, 2001; SAAG et al, 1988), sendo que alguns nucleotídeos alterados (não-sinônimos) resultam em substituição de aminoácidos enquanto outros (sinônimos) não alteram a sequência proteica. Essa grande heterogeneidade genética do HIV-1 pode ser explicada pela alta taxa de erro da transcriptase reversa viral, pela ocorrência de eventos de recombinação e a uma alta taxa de replicação viral no hospedeiro. Embora as mudanças de nucleotídeo estejam distribuídas por todo o genoma do HIV1, as maiores variabilidades ocorrem no gene env, responsável pelas proteínas do envelope viral (FREED et al., 2001). Regiões de hipervariabilidade (V1 a V5) presentes na sequência codificante da gp120 são separadas por sequências relativamente conservadas (C1 a C5, figura 01), (STARCICH et al., 1986; WILLEY et al., 1986). 4 O HIV-1 é o tipo mais virulento e mais disseminado pelo mundo, apresentando elevada taxa de mutação. Para descrever essa variabilidade genética usa-se o conceito de quasi-species, no qual o HIV é considerado como subpopulações de vírus e não um genoma único (WIGG et al., 2002). Dados coletados indicam que a população de HIV-1 presente em um indivíduo infectado pode variar de 6% a 10% na sequência de nucleotídeos. Numa mesma região geográfica a variação de nucleotídeos pode chegar a 15% no gene gag (gene responsável por elementos estruturais do vírus – capsídeo viral, núcleo capsídeo e matriz) e até 30% no gene env. Entre regiões geográficas distintas a variação genética situa-se entre 30% e 40% dependendo do gene analisado (FREED et al., 2001). Figura 01. Representação linear da glicoproteína env do HIV-1. A seta indica o local de clivagem para gp120 e gp41. V1 a V5 são domínios variáveis. C1 a C5 são domínios conservados. Os números dos aminoácidos são indicados (FREED et al., 2001). Apesar de sua natural heterogeneidade, principalmente de suas glicoproteínas do envelope, um domínio altamente conservado e imunodominante, localizado dentro da proteína gp41, ainda estimula anticorpos em indivíduos infectados (FREED et al., 2001; GNANN et al., 1987). 2.2 O gene env e seus produtos. As glicoproteínas do gene env (gp120 e gp41) têm importantes funções no ciclo de vida do vírus. Essas glicoproteínas contêm epítopos que estimulam a resposta imune importante tanto no diagnóstico quanto na perspectiva de desenvolvimento de uma vacina. 5 Elas possuem os determinantes que interagem com o receptor CD4 e o coreceptor (CXCR4 e CCR5), catalisando a reação de fusão da bicamada lipídica do envelope viral com a membrana plasmática da célula hospedeira. A ligação ao CD4 induz mudanças conformacionais na gp120, algumas das quais envolvem a exposição e/ou formação de sítios de ligação para receptores de quimiocinas específicas (CXCR4 e CCR5). A terceira região de variabilidade (V3) da gp120 é a principal determinante da especificidade ao receptor de quimiocina. Entretanto, outras estruturas mais conservadas que são expostas após a ligação ao CD4 também parecem estar envolvidas na ligação a esse receptor. Essa exposição induzida pelo CD4 é indicada pelo estímulo de anticorpos que eficientemente bloqueiam a formação do complexo gp120-CD4 ao receptor supracitado (KWONG et al., 1998). As glicoproteínas são sintetizadas a partir do mRNA do gene env e a tradução ocorre nos ribossomos associados com o retículo endoplasmático rugoso. O precursor é a poliproteína gp160 (160-kd) e sofre oligomerização na forma predominante de trímeros. A gp160 é transportada para o aparelho de Golgi onde é clivada proteoliticamente por enzimas celulares formando as glicoproteínas gp120 (SU) e gp41 (TM), (figura 02). A clivagem da gp160 é necessária para a infectividade viral. Posterior a clivagem, gp120 e gp41 formam uma associação não-covalente que é transportada para a superfície celular (FREED et al., 2001; KWONG et al., 1998). 6 Figura 02. Visão geral das proteínas codificadas pelos genes do HIV-1 (FREED et al., 2001). O complexo de glicoproteínas, em particular o domínio gp120, é fortemente glicosilado, aproximadamente metade da massa molecular da gp160 é composta de cadeias de oligossacarídeos. Essas numerosas cadeias de oligossacarídeos formam o que pode ser imaginado como uma “nuvem de açúcar” ocultando boa parte do gp120 para reconhecimento pelo sistema imune. 7 3. Objetivos Os objetivos deste trabalho foram: Identificar áreas de alta e baixa mutação no gene env a partir do alinhamento de sequências de nucleotídeos armazenadas no GenBank (NCBI). Apresentar uma sequência de consenso para o gene env anotando as áreas de alta e baixa mutação. 8 4. Material e Métodos 4.1 Sequências nucleotídicas e alinhamentos múltiplos Sequências nucleotídicas para o gene env do HIV-1 foram obtidas da base de dados GenBank do NCBI (http://www.ncbi.nlm.nih.gov/), com ajuda programa GENEIOUS PRO da Biomatters Ltd (DRUMMOND et al., 2010). Devido ao elevado número de sequências completas (3979) e limitações dos recursos computacionais, alinhamentos múltiplos foram realizados em grupos (95 grupos de 42 sequências, com exceção do último grupo, com 31). Alinhamentos dentro dos grupos foram feitos com a ferramenta Alignment do software e parâmetros especificados na figura abaixo. Figura 03. Parâmetros utilizados para o alinhamento de sequências de nucleotídeos. Posteriormente, esses 95 alinhamentos iniciais foram divididos em cinco pastas e, em cada pasta, um novo alinhamento foi gerado, com uso dos parâmetros especificados na figura 04. Os cinco alinhamentos consensos (os quatro primeiros referentes a 840 sequências cada e o último a 619 sequências) foram alinhados novamente com os mesmos parâmetros da figura 04. Esse alinhamento final foi base para a geração da sequência de consenso do gene env com pelo menos 75% de bases coincidentes, aqui denominada de Sequência Consenso 75%. 9 Figura 04. Parâmetros utilizados para o alinhamento de consensos. 4.2 Identificação de áreas com maior e menor diversidade ou mutação As áreas de maior e menor diversidade, aqui referidas como de maior e menor mutação, foram identificadas na Sequência Consenso 75%, conforme critérios definidos na tabela 01, e de acordo com resultados do parâmetro “Pairwise % identity”, verificados no alinhamento final. Além desse critério, somente foram consideradas áreas de muito baixa diversidade ou mutação (VLM) àquelas com um mínimo de seis nucleotídeos. Para as regiões menores registrou-se somente o percentual de identidade. Na Sequência Consenso 75% foram anotadas também as regiões denominadas V1 a V5 e aquelas responsáveis pelas proteínas gp120 e gp41. 10 Tabela 01. Critérios para definição de alta e baixa mutação com base no percentual de identidade. Símbolo Descrição da área Pairwise % Identity VLM Very Low Mutation (mutação muito baixa) LM Low Mutation (mutação baixa) 87% e 94% HM High Mutation (mutação alta) 70% e 87% VHM Very High Mutation (mutação muito alta) 70% 94% Um alinhamento final da Sequência Consenso 75% com o gene env extraído do genoma NC_001802 (Human immunodeficiency virus 1, complete genome) foi feito e a Sequência Consenso 75% também foi traduzida com uso do software GENEIOUS PRO. . 11 5. Resultados Apesar de o HIV-1 ser considerado um vírus altamente mutante, foram evidenciadas, neste trabalho, áreas de alto percentual de identidade entre as sequências analisadas. Tais áreas, consideradas bem conservadas ou VLM, conforme critérios aqui estabelecidos, são apresentadas na tabela 02. Tabela 02. Áreas de mutação muito baixa (VLM), quantidades de bases contidas e percentual de identidade observado (Pairwise % Identity). Área VLM-1 VLM-2 VLM-3 VLM-4 VLM-5 VLM-6 VLM-6A VLM-7 VLM-8 VLM-8A VLM-8B VLM-8C VLM-9 VLM-10 VLM-10A VLM-11 VLM-12 VLM-13 VLM-14 VLM-14A VLM-15 VLM-16 VLM-16A VLM-17 VLM-18 VLM-19 VLM-20 VLM-21 VLM-22 VLM-22A VLM-23 VLM-24 VLM-25 VLM-26 VLM-27 VLM-27A VLM-27B VLM-27C VLM-28 VLM-28A VLM-28B VLM-29 Quantidade de bases 9 36 36 6 45 27 6 75 18 6 9 6 18 57 6 42 21 18 21 9 12 15 6 12 12 24 9 9 9 6 9 18 24 18 18 6 9 9 9 6 6 12 Pairwise % Identity 94,6 95,5 95,0 98,0 96,8 94,3 95,8 94,2 94,7 95,8 96,3 96,0 95,4 94,5 96,4 97,1 97,1 96,2 94,8 94,4 96,3 97,2 96,1 97,1 97,4 96,2 98,3 97,7 95,4 97,8 96,7 97,4 94,1 95,4 96,3 95,7 94,8 94,6 97,5 95,0 96,4 95,5 12 Essas áreas anotadas como sendo VLM, bem como aquelas dos demais tipos (LM, HM e VHM) encontram-se identificadas no mapa 01 (no apêndice), envolvendo o alinhamento do gene env extraído do genoma NC_001802 com a sequência consenso, do mesmo gene, com pelo menos 75% de bases coincidentes, bem como no mapa 02 (apêndice), mostrando somente a Sequência Consenso 75%. De forma geral, foram identificadas 42 áreas de baixa diversidade ou de mutação muito baixa (VLM), 13 áreas de mutação baixa (LM), 17 áreas de mutação alta (HM) e 17 áreas de mutação muito alta (VHM) ou de alta diversidade. A tabela 03 resume os tipos de áreas identificados e sua posição inicial e final, tendo como referência o gene env na sequência NC_001802 (Human immunodeficiency virus 1, complete genome). Tabela 03. Áreas de mutação consideradas muito baixa (VLM), baixa (LM), alta (HM) e muito alta (VHM), com suas posições iniciais e finais de acordo com o gene env do genoma NC_001802. tipo de área posição inicial sub posição inicial sub posição final posição final VLM 1 LM HM 1 9 10 15 1 16 27 2 28 48 49 54 55 60 61 78 79 81 82 90 91 99 100 390 VHM Pairwise % Identity 94,6 81,7 75,4 1 1 48,4 88,9 2 3 32,5 74,8 3 4 44,5 79,8 4 2 34,3 92,0 100 135 2 95,5 148 183 3 95,0 196 201 4 98,0 205 249 5 96,8 268 294 6 94,3 298 303 6A 95,8 307 381 7 391 462 463 489 490 534 535 549 550 570 94,2 5 3 23,3 89,1 6 5 65,8 84,7 7 21,4 13 cont. tipo de área posição inicial sub posição inicial sub posição final posição final 571 591 592 801 LM HM 6 678 8 757 762 8A 858 95,8 8 918 919 933 934 1002 972 1011 1012 1026 1027 1041 1042 1050 1051 1089 1090 1179 1180 1242 1243 1317 1318 1371 1372 1401 96,3 5 88,8 9 8 10 11 6 1545 1546 1662 82,1 14 7 10 23,2 90,0 12 1485 54,9 85,3 13 1429 58,6 82,4 12 9 41,1 85,7 11 1524 1525 96 10 1419 63,0 83,2 9 1402 58,3 83,6 8C 1003 1402 7 8B 880 967 86,3 94,7 879 850 Pairwise % Identity 89,7 810 811 VHM 4 661 802 32,3 93,1 95,4 94,5 15 8 64,7 93,7 1546 1551 10A 96,4 1555 1596 11 97,1 1606 1626 12 97,1 1630 1647 13 1663 1665 1666 1830 96,2 16 9 64,8 93,3 1672 1692 14 94,8 1696 1704 14A 94,4 1708 1719 15 96,3 1723 1737 16 97,2 1741 1746 16A 96,1 1750 1761 17 97,1 1765 1776 18 97,4 1783 1806 19 96,2 1810 1818 20 98,3 1822 1830 21 97,7 1837 1845 22 95,4 1864 1869 22A 97,8 1879 1887 23 1831 1996 VLM 1995 2019 13 78,2 96,7 10 91,8 14 cont. tipo de área posição inicial sub posição inicial sub posição final posição final 2020 2031 2032 2157 VLM LM HM VHM 14 Pairwise % Identity 78,3 11 93,2 2032 2049 24 97,4 2053 2076 25 94,1 2080 2097 26 95,4 2116 2133 27 96,3 2137 2142 27A 95,7 2149 2157 27B 2158 2178 2179 2232 2233 2265 2266 2358 2359 2364 2365 2571 94,8 15 70,5 12 91,2 16 74,1 13 89,0 17 17 28,1 84,4 2401 2409 27C 94,6 2476 2484 28 97,5 2488 2493 28A 95,0 2527 2532 28B 96,4 2536 2547 29 95,5 15 6. Discussão 6.1 Desenho de primers A evidência de áreas mais conservadas ou de baixa mutação (VLM) no gene env, conforme apresentadas nas tabelas 2 e 3, são úteis para desenho de primers, visando amplificação via PCR. Levando-se em consideração apenas os tamanhos das áreas e suas conservações nas sequências virais estudadas, podem-se considerar como prováveis áreas para desenho de primers, as regiões: VLM-2, VLM-3, VLM-5, VLM-6, VLM-7, VLM-10, VLM-11, VLM12, VLM-14, VLM-19 (ou VLM-19 + ATY1 + VLM-20), VLM-25. Alguns autores (OU et al., 1988) têm utilizado dois pares de primers no gene env: (SK68 – 5’AGCAGCAGGAAGCACTATGG3’ e SK69 – 5’CCAGACTGTGAGTTGCAACAG3’; CO1 – 5’ACAATTATTGTCTGGTATAG3’ e CO2 – 5’AGGTATCTTTCCACAGCCAG3’). A sequência SK68 está situada na área VLM-11, SK69 nas áreas VLM-14A e VLM-15, CO1 nas áreas VLM-12 e VLM-13, e CO2 nas áreas VLM-16A e VLM-17 (vide mapa 02, partes 14, 15 e 16, no apêndice). Essas constatações corroboram a afirmativa de conservação para essas áreas, apresentada anteriormente. Também, ATTATIPPAHOLKUN et al. (2002), têm-se utilizado de quatro primers em um método para detecção do DNA proviral do HIV-1 (tabela 04). Tabela 04. Primers e sonda utilizados por Attatippaholkun (ATTATIPPAHOLKUN et al., 2002). Primers e sonda Sequência nucleotídica (5’ – 3’) Primers mais externos WAHG1 WAHG2 Primers mais internos bWATG1 bWATG2 sonda WAPG 1 ATY: Adenina + Timina + (Citosina ou Timina) TTCCTTGGGTTCTTGGGAC AGGTATCTTTCCACAGCCAG bGCAGCAGGAAGCACTATGG bCCAGGACTCTTGCCTGGAGC GAGCCTGTGCCTCTTCAGCTACCACCG 16 As figuras 06 e 07 exibem a localização desses primers nas áreas VLM-11 (forward primers) e VLM-16+VLM-16A+VLM-17 (reverse primers) reforçando assim o caráter conservado dessas áreas. Figura 05. Esquema apresentando a região de anelamento dos primers WAHG1 e bWATG1 no gene env de consenso. Figura 06. Esquema apresentando a região de anelamento dos primers bWATG2 e WAHG2 no gene env de consenso. 6.2 Potenciais áreas indutoras de reação imunológica Outra observação importante para essas regiões de baixa diversidade é o fato de as moléculas MHC-I apresentarem fragmentos peptídicos com 8 a 10 aminoácidos e as de classe II, MHC-II, com 13 ou mais aminoácidos (JANEWAY et al., 2000). Sendo assim, pode-se inicialmente eleger como potenciais áreas indutoras de reação imunológica para serem utilizadas em vacinas de peptídeos sintéticos (Synthetic Peptide Vaccine), os segmentos de mutação muito baixa com mais de 24 bases. São elas: VLM-2, VLM-3, VLM-5, (VLM- 17 6+VLM-6A+VLM-7), VLM-10, (VLM-11+GCGTCA), (VLM-12+CWA2+VLM-13), (VLM16+GTC+VLM-16A+GTR3+VLM-17+ARG4+VLM-18), (VLM-24+ATA6+VLM-25+RTA7+VLM-26), (VLM-19+ATY5+VLM-20), (VLM-27+TAC8+VLM-27A+TTRTCR9 +VLM-27B). O desenvolvimento de uma vacina capaz de bloquear grande parte das linhagens do HIV-1 passa pelo design de anticorpos que interagem com as regiões de mutação muito baixa do envelope viral. A sequência de aminoácidos do envelope viral, em especial, da glicoproteína gp120 consiste de cinco regiões de variabilidade (V1 a V5) interpostas entre regiões mais conservadas (C1 a C5). As regiões variáveis V1 a V4 formam alças (loops) ancoradas em suas bases por pontes dissulfeto (WYATT et al., 1998; LEONARD et al., 1990). A região V1 foi mapeada na área VHM-5; V2 nas áreas VHM-6, HM-5, VHM-7 e HM6; V3 nas áreas LM-5, VHM-9 e HM-8; V4 nas áreas HM-11, VHM-13 e LM-610; V5 nas áreas VHM-14 e LM-711 (vide mapa 02 no apêndice). A área LM-3 delimita as regiões entre V1 e V2. Essas constatações reforçam o caráter variável dessas áreas e, ao acrescentar um quantitativo de sua variabilidade (porcentagem de identidade), permite evidenciar aminoácidos estratégicos para a estrutura tridimensional da proteína e sua função. Anticorpos neutralizantes reconhecem tanto as estruturas variáveis quanto as conservadas do gp120, no entanto, os mais gerais anticorpos reconhecem epítopos conservados em três regiões da glicoproteína gp120. Segundo Wyatt e colaboradores, 1998, 2 CWA: Citosina + (Adenina ou Timina) + Adenina. GTR: Guanina + Timina + (Adenina ou Guanina). 4 ARG: Adenina + (Adenina ou Guanina) + Guanina. 5 ATY: Adenina + Timina + (Citosina ou Timina) 6 ATA: Adenina + Timina + Adenina. 7 RTA: (Adenina ou Guanina) + Timina + Adenina. 8 TAC: Timina + Adenina + Citosina. 9 TTRTCR: Timina + Timina + (Adenina ou Guanina) + Timina + Citosina + (Adenina ou Guanina). 10 Apenas os quatro primeiros aminoácidos de LM-6. Como a estrutura de V4 forma um laço ligado nas extremidades por pontes dissulfeto, é de se esperar estabilidade nessas áreas. De fato, a região inicial de V4 tem um percentual de identidade de 91,8%; a região final, 91,0%. Vide mapa 02, parte 11, no apêndice. 11 Apenas os três últimos aminoácidos. Vide mapa 02, parte 13, no apêndice. 3 18 os mais abundantes destes anticorpos são direcionados contra o sítio de ligação do CD4 (CD4BS) e bloqueiam a interação gp120-CD4. Menos comuns são anticorpos contra epítopos induzidos ou expostos após a ligação ao CD4 (CD4i). A tabela 05 mostra os aminoácidos envolvidos na interação da gp120 com anticorpos neutralizantes e as localizações em áreas de baixa (LM), muito baixa (VLM), alta (HM) e muito alta mutação (VHM). Tabela 05. Aminoácidos envolvidos na interação da gp120 com anticorpos neutralizantes, suas localizações em áreas de baixa (LM), muito baixa (VLM), alta (HM) e muito alta mutação (VHM), sítio de ligação e provável mecanismo de neutralização do HIV. Sítio de ligação Aminoácidos em gp120 * Localização Neutralização do vírus Asn 88, Asp 113, Lys 117, LM-2 e VLM-7 Interferência na ligação gp120Ser 256, Thr 257, Asn 262, Ala 266, LM-4 CD4. Anticorpos contra a área Asp 368, Glu 370, Tyr 384, CD4BS competem com CD4 HM-11 Lys 421, Trp 427, LM-6 Asp 457, HM-12 Pro 470, LM-7 e VLM-9 Asp 474, Met 475, LM-7 Asp 477, LM-7 e VLM-10 Asp/Leu/Tyr 482/483/484 LM-7 e VLM-10 Asn 88, Lys 117, Lys 121, LM-2 e VLM-7 Interfere com a ligação CD4i Lys 207, LM-4 receptor-CXCR4/CCR5 Ser 256, Thr 257, Asn 262, LM-4 Glu 370, Glu 381, Phe 382, HM-11 Arg 419, Ile 420, Lys 421, Gln 422, LM-6 Ile 423, Trp 427, Tyr 435, Pro 438, LM-6 Met 475 LM-7 * aminoácidos numerados de acordo com a sequência HXBC2; Adaptado de WYATT et al., 1998. CD4BS Embora os aminoácidos Asp368, Glu370, Tyr384 e Asp457 estejam numa área de alta mutação, HM-11 e HM-12, suas vizinhanças são razoavelmente conservadas com percentual de identidade de 87,3% para Asp368 e Glu370, 91,3% para Tyr384 e 92% para Asp457. Esses percentuais classificariam essas vizinhanças como áreas de baixa mutação (LM) (figuras 07 e 08). Figura 07. Posição de alguns aminoácidos do sítio de ligação CD4BS, na área considerada de alta mutação HM-11. 19 Figura 08. Posição do aminoácido Asp457 do sítio de ligação CD4BS, na área considerada de alta mutação HM-12. Essas novas informações agregadas ao levantamento efetuado das áreas de mutação baixa (LM) e mutação muito baixa (VLM) permitem indicar regiões conservadas, atrativas para intervenção imunológica como o desenvolvimento de vacinas de peptídeos sintéticos ou outras intervenções. A tabela 06 compila esses dados. Tabela 06. Correlação entre glicoproteínas gp120 e gp41 do envelope viral do HIV e sugestivas áreas imunológicas, considerando áreas de baixa (LM), muito baixa (VLM) e alta mutação (HM). Gene Áreas imunológicas gp120 gp41* LM-2 (VLM-2/3/4/5/6 VLM-6A VLM-7) LM-4 (VLM-8 VLM-8A) LM-5 HM-11 LM-6 HM-12 LM-7 (VLM-9 VLM-10) LM-8 (VLM-10A VLM-11/12/13) LM-9 (VLM-14/14A/15 VLM-16 VLM-16A VLM-17/18/19/20/21) LM-11 (VLM-24/25/26 VLM-27/27A/27B) LM-12 LM-13 * Não foi analisada que regiões são trans membrana (não imunodominantes). Essas novas anotações no gene env também nos permitem tecer diversos comentários sobre a região V3. Essa região, chamada pela literatura referente ao HIV de third variable region, foi aqui mapeada entre os segmentos LM-5, VHM-9 e HM-8 (vide figuras 09 e 10). V3 é imunodominante e contém características essenciais para ligação ao coreceptor (CXCR4 20 ou CCR5). Acredita-se que sua conformação estendida e a acessibilidade aos anticorpos expliquem sua imunodominância (HUANG et al., 2005). Tipicamente, V3 consiste de 35 aminoácidos (faixa de 31 a 39) e acredita-se ser fundamental tanto na ligação quando na determinação de que coreceptor se ligar. Embora V3 seja uma região de variabilidade, está menos sujeita a inserções e deleções do que outras regiões (HUANG et al., 2005). Verificando o mapa 02, parte 9, e principalmente no mapa 01, parte 10 (vide apêndice) se constatou que apenas o segmento VHM-9 comportaria inserções e deleções. Diferentes coreceptores, CXCR4 e CCR5, podem suportar a entrada do HIV-1 e a análise de sequências tem definido a regra 11/25 (se a décima primeira posição de V3 ou a vigésima quinta são positivamente carregadas, o vírus irá usar o CXCR4; em qualquer outra situação, usa-se o CCR5) (HOFFMAN et al., 2002). Essa regra precisaria ser confirmada, pois se verificou que a 11ª posição tem uma predileção por Serina – S (códon AGT, mais de 93%) e a 25ª posição (códon GAM), por resíduos ácidos (ácido aspártico – D ou ácido glutâmico – E) (figuras 09 e 10) Figura 09. A região V3 abrange parte das áreas LM-5, VHM-9 e HM-8. A posição 11ª (a partir do segundo códon) codifica uma Serina (AGT) e a 25ª posição (GAM) codificaria um ácido aspártico ou ácido glutâmico. A região conhecida como β-hairpin tip (ápice do loop V3; figura 10) é comumente citada como formada por quatro resíduos GPGR (Gly-Pro-Gly-Arg) (MOHRI et al., 1997). Nesta análise, a 4ª posição (ARA) permuta entre Arginina – R e Lisina – K, dois resíduos básicos. Assim, essa região seria mais bem identificada como sendo GPG(R/K). 21 Figura 10. Resíduos de consenso de parte da região V3. A regra 11/25 baseada nos aminoácidos nas posições 11 e 25 não foi confirmada, nem o último resíduo GPGR do βhairpin tip. Do ponto de vista da variabilidade, as mutações nas posições 12, 13, 14 e 22 (em relação ao primeiro aminoácido da área V3, em azul na figura 10) podem ser responsáveis pela capacidade do vírus de se evadir da neutralização mediante anticorpos uma vez que apenas os resíduos conservados nas posições 1 (C-Cys), 3 (R-Arginina), 4 (P-Prolina), 35 (CCys) e na região do beta-hairpin tip parecem definir a ligação com o coreceptor (HOFFMAN et al., 2002; HUANG et al., 2005). 22 7. Conclusão A sequência consenso do gene env, aqui apresentada, devidamente anotada com as áreas de alta e baixa variabilidade nucleotídica, constitui uma valiosa informação para: A definição de primers; O estudo dos sítios de ligação do CD4 e do CXCR4/CCR5; O desenvolvimento de novas drogas bloqueadoras dos sítios de ligação da GP120/GP41; A definição de peptídeos sintéticos com capacidade de induzir anticorpos amplamente neutralizantes, independente do subtipo viral do HIV-1. 23 8. Sugestões e Recomendações O elevado grau de adaptação evolutiva do HIV-1 ao sistema imunológico (SI) está a exigir novas abordagens para o desenvolvimento de uma vacina preventiva ou terapêutica. No que se refere a produção de anticorpos neutralizantes o maior desafio para o SI é produzir um anticorpo que se ligue com alta afinidade a uma proteína de superfície do vírus bloqueando a sua entrada na célula hospedeira. O sítio ideal para ligação é o CD4BS (sítio de ligação do CD4) na glicoproteína gp120. No entanto, os receptores das células B (Ig de membrana) podem ter afinidade para outras áreas da gp120/gp41, em princípio, ainda permitindo a ligação do vírus com os receptores da célula hospedeira. Pode-se considerar duas alternativas para o desenvolvimento de uma vacina que “guie” o sistema imunológico para a produção de anticorpos contra o sítio CD4BS: A partir de proteína sintética com superfície semelhante ao CD4BS; A partir de pequenos peptídeos representativos dos aminoácidos de baixa mutação que compõem o sítio ativo do CD4BS. Essa alternativa, embora mais simples, perde em capacidade estimular o SI uma vez que a afinidade 3D para o sítio de ligação é substituída por uma afinidade linear (a sequência peptídica). Qualquer que seja a abordagem, a sequência consenso (e suas áreas de alta e baixa mutação), aqui apresentada, é o material básico para o desenvolvimento de antígenos independente do subtipo viral do HIV-1. 24 9. Referências Bibliográficas ATTATIPPAHOLKUN, W. H.; LEK-NGAM, P.; BEJRACHANDRA, S.; ATTATIPPAHOLKUN, M. K. A novel molecular method for HIV-1 proviral DNA detection: non-radioactively--reversed probe hybridization and nested PCR. Southeast Asian J Trop Med Public Health. 2002 Mar;33(1):72-79. COFFIN, J.; HAASE, A.; LEVY, Jay A.; MONTAGNIER, Luc; et al. Human Immunodeficiency virus [letter]. Science 1986; 232:697. DRUMMOND, A.J.; ASHTON, B.; CHEUNG, M.; HELED, J.; KEARSE, M.; MOIR, R.; STONES-HAVAS, S.; THIERER, T.; WILSON, A. (2010) Geneious v5.0, Disponível em: http://www.geneious.com/ FREED, E.O.; MARTIN, M. A. HIVs and Their Replication. In: KNIPE, D. M.; HOWLEY, P. M. (eds.) Fundamental Virology. 4 th ed., Philadelphia: Lippincott Williams & Wilkins; 2001. Chapter 28 p. 913-983 GNANN, J. W. Jr; NELSON, J. A.; OLDSTONE, M. B. A. Fine mapping of an immunodominant domain in the transmembrane glycoprotein of human immunodeficiency virus. J Virol 1987; 61:2639-2641. HOFFMAN, Noah G.; SEILLIER-MOISEIWITSCH, Francoise; AHN, JaeHyung; WALKER, Jason M.; SWANSTROM, Ronald. Variability in the Human Immunodeficiency Virus Type 1 gp120 Env Protein Linked to Phenotype-Associated Changes in the V3 Loop. Journal of Virology 2002; 76:3852-3864 HUANG, Chih-chin; TANG, Min; ZHANG, Mei-Yun; MAJEED, Shahzad; MONTABANA, Elizabeth; STANFIELD, Robyn L.; DIMITROV, Dimiter S.; KORBER, Bette; SODROSKI, Joseph; WILSON, Ian A.; WYATT, Richard; KWONG, Peter D. Structure of a V3Containing HIV-1 gp120 Core. Science 2005; 310:1025-1028. JANEWAY, Charles A.; TRAVERS, Paul; WALPORT, Mark; CAPRA, J. Donald. Imunobiologia – O sistema imunológico na saúde e na doença. 4ª edição. Porto Alegre: Artmed editora. 2000. Cap 3, p.79-113. Cap. 4, p. 115-158. KWONG, P. D.; WYATT, R.; ROBINSON, J.; SWEET, R. W.; SODROSKI, J.; HENDRICKSON, W. A. Structure of an HIV gp120 envelope glycoprotein in complex with the CD4 receptor and a neutralizing human antibody. Nature 1998; 393(6686):648659. 25 LEONARD, C. K.; SPELLMAN, M. W.; RIDDLE, L.; HARRIS, R. J.; THOMAS, J. N.; GREGORY, T. J. Assignment of intrachain disulfide bonds and characterization of potential glycosylation sites of the type 1 recombinant human immunodeficiency virus envelope glycoprotein (gp120) expressed in Chinese hamster ovary cells. J. Biol. Chem. 1990. 265: 10373-10382. MOHRI H.; ASAKURA Y.; FUKUSHIMA J.; KAWAMOTO S.; OKUBO T.; OKUDA K. Synthetic peptide from the V3 loop consensus motif with a potent anti-HIV activity inhibits ristocetin-mediated vWF-GPIb interaction. Peptides 1997; 18:1289-1293. OU, C. Y.; KWOK, S.; MITCHELL, S. W.; MACK, D. H.; SNINSKY, J. J.; KREBS, J. W.; FEORINO, P.; WARFIELD, D.; SCHOCHETMAN, G. DNA amplification for direct detection of HIV-1 in DNA of peripheral blood mononuclear cells. Science 1988; 239:295-297 SAAG, M. S.; HAHN, B. H.; GIBBONS, J. et al. Extensive variation of human immunodeficiency virus type-1 in vivo. Nature 1988;334:440-444 STARCICH, Bruno R.; HAHN, Beatrice H.; SHAW, George M.; McNEELY, Paul D.; MODROW, Susanne; WOLF, Hans; PARKS, Elizabeth S.; PARKS, Wade P.; JOSEPHS, Steven F.; GALLO, Robert C.; WONG-STAAL, Flossie. Identification and characterization of conserved and variable regions in the envelope gene of HTLVIII/LAV, the retrovirus of AIDS. Cell 1986; 45:637-648. UNIADS. AIDS Epidemic Update 2009. Disponível em: http://data.unaids.org/pub/Report/2009/JC1700_Epi_Update_2009_en.pdf. WIGG, M. D. Vírus da Imunodeficiência Humana. In: SANTOS, N. S.; ROMANOS, M. T. V.; WIGG, M. D. (Org.). Introdução à Virologia Humana. 1ª ed. Rio de Janeiro: Guanabara-Koogan; 2002. Cap.14, p.183-197. WILLEY, R. L.; RUTLEDGE, R. A ; DIAS, S.; FOLKS, T.; THEODORE, T.; BUCKLER, C. E.; MARTIN, M. A. Identification of conserved and divergent domains within the envelope gene of the acquired immunodeficiency syndrome retrovirus. PNAS 1986; 83(14): 5038-5042. WYATT, Richard; KWONG, Peter K.; DESJARDINS, Elizabeth; SWEET, Raymond W.; ROBINSON, James; HENDRICKSON, Wayne A.; SODROSKI, Joseph G. The antigenic structure of the HIV gp120 envelope glycoprotein. Nature 1998; 393:705-711. 26 10. Apêndices Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (parte 1). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 2). 27 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 3). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 4). 28 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 5). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 6). 29 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 7). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 8). 30 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 9). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 10). 31 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 11). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 12). 32 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 13). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 14). 33 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 15). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 16). 34 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 17). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 18). 35 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 19). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 20). 36 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 21). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 22). 37 Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 23). Mapa 01. Alinhamento do gene env extraído do genoma NC_001802 com o consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 24). 38 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (parte 1). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 2). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 3). 39 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 4). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 5). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 6). 40 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 7). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 8). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 9). 41 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 10). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 11). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 12). 42 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 13). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 14). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 15). 43 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 16). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 17). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 18). 44 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 19). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 20). Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 21). 45 Mapa 02. Consenso do gene env com pelo menos 75% de bases coincidentes (continuação, parte 22). 46 Mapa 03. Consenso do gene env com pelo menos 75% de bases coincidentes (nucleotídeos). 1 10 20 30 40 50 | | | | | | ATGAGAGTGAWGGRGATCAGGARGAATTRTCARCACTKNTNNNNGARATG GGGCAYNNNNNNNNTNCTCCTTGGGATRTTRATGANNTGTARTGCTRMAN NNNNNNNNTTGTGGGTCACAGTCTATTATGGGGTACCTGTGTGGAAAGAA GCAAMCACCACTCTATTTTGTGCATCAGATGCTAAAGCATATGAKACAGA RGYACATAATGTYTGGGCCACACATGCCTGTGTACCCACAGACCCCAACC CACAAGAARTAGTATTGGRAAATNTGACAGAAAATTTTAACATGTGGAAA AATAACATGGTAGAWCAGATGCATGAGGATATAATCAGTTTATGGGATCA AAGCCTAAAGCCATGTGTAAAATTAACCCCACTCTGTGTTACTTTAAATT GNNCTRANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNTRAAAAACTGCTCTTTCAATRTCACCACANRNR NNNTAAGAGATANGRNNNNMARNANNGAATATGCNCTNTTTNATARACTT GATRTAGTACCANTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNTATAGRTTRATAARTTGTAAYACCTCAGTCATTACACAGGCCT GTCCAAAGGTATCCTTTGARCCAATTCCCATACATTATTGTGCCCCRGCT GGTTTTGCGATTCTAAARTGTAATRATAAGAMRTTCAATGGAAMAGGACC ATGTAMAAATGTCAGCACAGTACAATGTACACATGGAATTARRCCAGTAG TRTCAACTCAACTGCTGTTAAATGGCAGTCTAGCAGAANNNANGANRNTA GTAATTAGATCTGAMAATTTCACRRACAATGCTAAAAYCATAATAGTACA KCTGAAYGAAWCTGTARWAATTAATTGTACAAGACCCAACAACAATACAA GAAAAAGTATNAMTATRGGACCAGGGARAGCATTTTATRCAACAGGAGAM ATAATAGGAGATATAAGACAAGCACATTGTAACMTTAGTRRARNNNNNRA NTGGAATRAMACTTTAMRAMANGRTAGYTNNNNAAAATTAAGANANCAAT TTNNNNNNAATAANACNNNANTARNCTTTAAWNAMTCCTCAGGAGGGGAC CCAGAAATTGTAANGCACAGNTTTAATTGTNGAGGGGAATTTTTCTACTG TAATWCAACAMAACTGTTTAATAGTACNTGNNNNNNNNNNNNNNNNNRRN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNTCACACTCCCATGCAGAATAAAACAAATTATAAACAT GTGGCAGGAAGTAGGAAAAGCAATGTATGCCCCTCCCATCNRAGGANNAA TTARMTGTTYATCAAATATTACAGGRYTRMTATTAACAAGAGATGGWGGN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAGAYCTTCAG ACCTGGAGGAGGARATATGARGGACAATTGGAGAAGTGAATTATATAAAT ATAAAGTAGTAAAAATTGAACCATTAGGARTAGCACCCACCAAGGCAAAG AGAAGAGTGGTGCAGAGAGAAAAAAGAGCANNNNNNNGNNNNNTAGGAGC TNTGTTCCTTGGGTTCTTGGGAGCAGCAGGAAGCACTATGGGCGCAGCGT CARTRACGCTGACGGTACAGGCCAGACWATTATTGTCTGGTATAGTGCAA CAGCAGAACAATNTGCTGAGRGCTATTGAGGCGCAACAGCATMTGTTGCA ACTCACRGTCTGGGGCATCAARCAGCTCCAGGCAAGAGTCCTGGCTGTRG AAAGATACCTAARGGATCAACAGCTCCTRGGRATTTGGGGTTGCTCTGGA AAACTCATYTGCACCACTRCTGTGCCTTGGAAYRCTAGTTGGAGTNATAA ATCTMWRRNWRABATTTGGRANAACATGACCTGGATGSAGTGGGAWARAG ANATTRACAATTANACANNNRNYWTNATATACAMYTTAMTTGAASAATCG CARAACCARCAAGANAAGAATGAACAAGAWTTATTRGMATTRGATAARTG GGCAAGTTTGTGGAATTGGTTTRACATAWCAAAHTGGCTGTGGTATATAA AAATATTCATAATGATAGTAGGAGGCTTGRTAGGTTTAAGAATAGTTTTT RCTGTRCTTTCTATAGTRAATAGAGTTAGGCAGGGATACTCACCATTRTC RTTTCAGACCCNCCTCCCARCCCSGAGGGNACCCGACAGGCCCGAAGGAA YCGAAGAAGAAGGTGGAGAGAGAGACAGAGACAGATCNNNNNDNCSATTA GTGRATGGATTCTTAGCAMTYATCTGGGWCGAYCTRCGGAGCCTGTGCCT CTTCAKCTACCACCGCTTGAGAGACTTACTCTTGATTGYARCGAGGATTG TGGAACTTCTGGGACNNNNNNNNNNNGGGTGGGAARYCCTCAARTATTGG TGGAATCTCCTRCAGTATTGGAGYCAGGAACTAAAGAATAGTGCTGTTAG CTTGCTYAAYRCCAYAGCYATAGCAGTAGCTGAGGGRACAGATAGGNTTA TAGAARTAKTACAAAGARYTTNTAGAGCTATYCTCMACATACCTASAAGA ATAAGACAGGGNTTRGAAAGRGCTTTGCTATAA 47 Mapa 04. Consenso do gene env com pelo menos 75% de bases coincidentes (tradução). 1 10 20 30 40 50 | | | | | | MRV??IR?N?QH????WG????LLG?LM?C?A????LWVTVYYGVPVWKE A?TTLFCASDAKAY?TE?HNVWATHACVPTDPNPQE?VL?N?TENFNMWK NNMV?QMHEDIISLWDQSLKPCVKLTPLCVTLN????????????????? ???????????????????????KNCSFN?TT???RD?????EYALF??L D?VP???????????????YRLI?CNTSVITQACPKVSFEPIPIHYCAPA GFAILKCN?K?FNG?GPC?NVSTVQCTHGI?PVVSTQLLLNGSLAE???? VIRS?NFT?NAK?IIV?LNE?V?INCTRPNNNTRKS???GPG?AFY?TG? IIGDIRQAHCN?S????WN?TL???S??KLR?QF??N?T???F??SSGGD PEIV?H?FNC?GEFFYCN?T?LFNST???????????????????????? ?????TLPCRIKQIINMWQEVGKAMYAPPI?G?I?C?SNITGL?LTRDGG ?????????????E?FRPGGG?M?DNWRSELYKYKVVKIEPLG?APTKAK RRVVQREKRA?????GA?FLGFLGAAGSTMGAAS?TLTVQAR?LLSGIVQ QQNN?LRAIEAQQH?LQLTVWGIKQLQARVLAVERYL?DQQLLGIWGCSG KLICTT?VPWN?SWS?KS???IW?NMTWM?W???I?N?T???IY?L?E?S QNQQ?KNEQ?LL?LDKWASLWNWF?I??WLWYIKIFIMIVGGL?GLRIVF ?VLSIVNRVRQGYSPLSFQT?LP??R?PDRPEG?EEEGGERDRDRS???L V?GFLA?IW?DLRSLCLF?YHRLRDLLLI??RIVELLG????GWE?LKYW WNLLQYWSQELKNSAVSLLN??AIAVAEGTDR?IE??QR??RAIL?IP?R IRQGLERALL*