Título Identificação de inibidores das metaloproteases de veneno de
Transcrição
Título Identificação de inibidores das metaloproteases de veneno de
Tese de Doutorado do Programa de Pós-graduação em Bioinformática da UFMG Título Identificação de inibidores das metaloproteases de veneno de serpente atroxlisina-I e leucurolisina-a através de triagem virtual, dinâmica molecular e avaliação experimental Aluno: Raoni Almeida de Souza Orientadora: Rafaela Salgado Ferreira Co-orientador: Eladio Flores Sanchez Co-orientadores estrangeiros: Dimas Suarez Rodriguez Natalia Diaz Fernandez Índice Índice!.........................................................................................................................................................!1! Lista de Figuras e Tabelas!.....................................................................................................................!3! Resumo!......................................................................................................................................................!5! Abstract!.....................................................................................................................................................!7! 1 – Introdução!..........................................................................................................................................!9! 1.1 – Acidentes com serpentes!..........................................................................................................................!9! 1.2 - Metaloproteases de veneno de serpentes!................................................................................................!9! 1.3 - Metaloproteases relacionadas às SVMPs!........................................................................................!12! 1.4 - Modelagem molecular!............................................................................................................................!15! 1.4.1 – Mecânica quântica!..........................................................................................................................................!15! 1.4.2 – Mecânica molecular!.......................................................................................................................................!17! 1.4.3 - Campos de força!...............................................................................................................................................!18! 1.4.4 - Modelagem comparativa de proteínas!......................................................................................................!20! 1.4.5 - Docking aplicado à triagem virtual!...........................................................................................................!25! 1.4.6 - Limitações da triagem virtual utilizando docking!...........................................................................!27! 1.4.7 – Dinâmica Molecular – (DM)!......................................................................................................................!28! 1.4.7.1 – Aplicações na descoberta de inibidores!..............................................................................................................!30! 1.4.8 – Cálculos de variação de energia livre!......................................................................................................!30! 1.4.9 - MM-PBSA e variantes!....................................................................................................................................!31! 2 - Justificativa!......................................................................................................................................!34! 3 - Objetivos!..........................................................................................................................................!36! 3.1 - Objetivos principais!................................................................................................................................!36! 3.2 - Objetivos específicos!..............................................................................................................................!36! 4 – Metodologia!....................................................................................................................................!38! 4. 1 – Modelagem comparativa da toxina atroxlisina-I!.............................................................................!38! 4.2 – Cálculos do estado de ionização dos resíduos das toxinas!..............................................................!39! 4.3 – Seleção de inibidores de metaloproteases de amplo espectro!..........................................................!39! 4.4 – Produção de parâmetros para simulações de DM!............................................................................!40! 4.4.1 – Modelos da Leuc-a e Atr-I complexadas com o tripeptídeo QSW!................................................!40! 4.4.2 –Definição do estado de protonação de átomos coordenados ao zinco.!.........................................!41! 4.4.3 – Produção de parâmetros para o ambiente químico do Zn2+!........................................................!43! 4.4.3.1 – Toxinas complexadas com inibidor endógeno!................................................................................................!43! 4.4.3.2 –Toxinas complexadas com inibidores de metaloproteases de amplo espectro!......................................!44! 4.5 – Simulações de DM!.................................................................................................................................!45! 4.5.1 – Toxinas e inibidor endógeno!.......................................................................................................................!45! 1 4.5.2 – Toxinas e inibidores de metaloproteases de amplo espectro!...........................................................!45! 4.6 - Docking dos inibidores de metaloproteases de amplo espectro!.......................................................!46! 4.6.1 – Cálculos de reavaliação das poses de docking!.....................................................................................!47! 4.7 – Análises das trajetórias das simulações de DM!................................................................................!49! 4.7.1 - Toxinas e inibidor endógeno!.......................................................................................................................!49! 4.7.2.1 - Cálculos de energia livre de ligação - toxinas e inibidores de amplo espectro!....................................!50! 4.7.2.2 – Função de pontuação aplicada às poses extraídas das simulações de DM!..........................................!51! 4.8 – Cálculos do potencial eletrostático!......................................................................................................!53! 4.9 – Análises de cavidades!............................................................................................................................!54! 4.10 – Cinética enzimática!..............................................................................................................................!55! 4.11 – Triagem virtual!.....................................................................................................................................!55! 4.12 – Análise de estruturas!...........................................................................................................................!56! 4.13 – Análise estatísticas!...............................................................................................................................!56! 5 - Resultados!........................................................................................................................................!57! 5.1 - Modelagem Comparativa!.......................................................................................................................!57! 5.2 - Cálculos de pKa!.......................................................................................................................................!61! 5.3 - Ensaios de cinética enzimática com inibidores de metaloproteases de amplo espectro!..............!64! 5.4 - Simulações de DM!..................................................................................................................................!69! 5.4.1 – Escolha do estado de protonação de resíduos do sítio catalítico!...................................................!69! 5.4.2 - Simulações de DM com inibidor endógeno!............................................................................................!71! 5.4.2.1 - Análises de agrupamento da alça Ω!.....................................................................................................................!76! 5.4.2.2 - Análises de agrupamento do sítio ativo!...............................................................................................................!78! 5.4.2.3 - Análise de cavidades!...................................................................................................................................................!79! 5.4.2.4 – Interações entre as toxinas e inibidor endógeno!............................................................................................!82! 5.4.2.5 – Cálculos dos potenciais eletrostáticos e das superfícies moleculares!.....................................................!84! 5.4.3 - Inibidores de metaloproteases de amplo espectro!................................................................................!85! 5.4.3.1 – Simulações de docking!.............................................................................................................................................!85! 5.4.3.2 - Interações entre as toxinas e os ligantes!............................................................................................................!94! 5.4.3.3 - Cálculos de energia livre!.......................................................................................................................................!109! 5.5 – Triagem virtual!.....................................................................................................................................!115! 6 – Conclusões!....................................................................................................................................!116! 7 – Perspectivas!..................................................................................................................................!119! 8 – Agradecimentos!............................................................................................................................!121! 9 – Referências bibliográficas!..........................................................................................................!122! 2 Lista de Figuras e Tabelas ! Tabela!1!-!Características!principais!das!SVMP!depositadas!no!banco!PDB.!....................................................................!11! Figura!1!–!Alinhamento!estrutural!dos!sítios!catalíticos!das!ADAM17,!MMP9!e!Leuc-a.!............................................!14! Figura!2!–!Figura!mostrando!a!acurácia!e!as!possíveis!aplicações!de!modelos!tridimensionais!de!proteínas! construídos!por!modelagem!comparativa.!.......................................................................................................................................!23! Figura!3!–!Inibidores!de!metaloproteases!de!amplo!espectro!utilizados!nesse!trabalho.!..........................................!40! Figura!4!–!Sobreposição!da!estrutura!cristalográfica!com!a!estrutura!do!estado!de!protonação!da!Leuc-a! utilizado!nas!simulações!de!DM!.............................................................................................................................................................!42! Figura!5!–!Estrutura!da!Leuc-a!destacando!as!regiões!utilizadas!nos!cálculos!de!entropia!conformacional..!...!53! Figura!6!–!Alinhamento!das!sequências!da!Atr-I!e!das!toxinas!utilizadas!como!moldes!para!a!modelagem! comparativa!realizado!pelo!programa!Clustal!Omega.!As!porcentagens!indicam!a!identidade!entre!as! sequências!com!a!Atr-I.!..............................................................................................................................................................................!57! Tabela!2!–!Características!principais!da!atroxlisina-I!e!dos!moldes!utilizados!para!modelagem!comparativa. !..............................................................................................................................................................................................................................!58! Figura!7!–!Gráficos!de!ramachandran!dos!moldes!utilizados!na!modelagem!comparativa!e!do!modelo!da!Atr-I. !..............................................................................................................................................................................................................................!59! Tabela!3!-!Pontuações!dos!programas!de!avaliação!ModEval,!Prosa!e!Qmean!obtidas!pelo!modelo!selecionado! da!Atr-I!e!dos!moldes!utilizados!na!modelagem!comparativa!.................................................................................................!60! Figura!8!–!Avaliação!da!qualidade!local!e!global!do!modelo!da!Atr-I.!..................................................................................!60! Figura!9!-!Alinhamento!estrutural!das!toxinas!Atr-I!e!Leuc-a!coloridas!por!similaridade.!........................................!61! Tabela!4!–!Valores!de!pKa!dos!aminoácidos!ionizáveis!da!Leuc-a!e!Atr-I!considerando!4!constantes!dielétricas! (εint%)!diferentes.!............................................................................................................................................................................................!64! Figura!10!–!Inibidores!de!metaloproteases!de!amplo!espectro!selecionados!neste!trabalho.!.................................!66! Tabela!5!–!Valores!de!IC50!obtidos!pelos!ensaios!de!cinética!enzimática!utilizando!os!inibidores!de!amplo! espectro!e!a!toxina!Atr-I.!...........................................................................................................................................................................!67! Tabela!6!–!Valores!de!IC50!obtidos!pelos!ensaios!de!cinética!enzimática!utilizando!os!inibidores!de!amplo! espectro!e!a!toxina!Leuc-a.!.......................................................................................................................................................................!68! Figura!11!–!Curvas!de!inibição!da!atividade!proteolítica!obtidas!pelos!ensaios!de!cinética!enzimática! utilizando!os!inibidores!de!amplo!espectro!e!Atr-I.!......................................................................................................................!68! Figura!12!–!Curvas!de!inibição!da!atividade!proteolítica!obtidas!pelos!ensaios!de!cinética!enzimática! utilizando!os!inibidores!de!amplo!espectro!e!Leuc-a.!..................................................................................................................!69! Tabela!7!–!Distâncias!interatômicas!e!ângulos!X-Zn-Y!para!a!estrutura!4Q1L!e!para!as!estruturas!otimizadas! pelo!método!SCC-DFTB!com!diferentes!distribuição!de!cargas.!..............................................................................................!70! Figura!13!–!Sobreposição!da!estrutura!cristalográfica!com!a!estrutura!do!estado!de!protonação!utilizado!nas! simulações!de!DM.!.......................................................................................................................................................................................!71! Figura!14!–!Variação!da!estrutura!da!toxina!Atr-I!medida!pelos!valores!de!RMSD.!......................................................!72! Figura!15!–!Variação!da!estrutura!da!toxina!Leuc-a!medida!pelos!valores!de!RMSD.!..................................................!73! Figura!16!-!Representação!da!sobreposição!da!estrutura!média!da!simulação!de!DM!(50!ns)!com!a!estrutura! cristalográfica!(Leuc-a)!ou!com!o!modelo!comparativo!(Atr-I).!..............................................................................................!75! Tabela!8!–!Porcentagem!da!duração!e!das!distâncias!em!Å!das!interações!entre!o!íon!Ca2+!e!os!resíduos!das! toxinas.!..............................................................................................................................................................................................................!76! Figura!17!–!Estrutura!das!toxinas!com!destaque!da!cadeia!principal!da!alça!Ω!dos!representantes!dos!cinco! clusters!mais!populosos.!...........................................................................................................................................................................!77! Figura!18!–!Sobreposição!do!sítio!ativo!das!estruturas!representativas!dos!4!agrupamentos!mais!populosos! obtidos!das!simulações!de!DM!com!Atr-I!e!Leuc-a!utilizando!o!valor!de!RMSD!dos!aminoácidos!do!sítio!ativo. !..............................................................................................................................................................................................................................!79! 3 Figura!19!–!Parâmetros!utilizados!pelo!programa!LEaP!para!definir!a!representação!ligada!do!zinco!e!seus! ligantes.!.............................................................................................................................................................................................................!81! Figura!20!–!Imagem!esquemática!das!principais!interações!entre!as!toxinas!e!o!inibidor!Gln1-Ser2-Trp3,!de! Leuc-a!e!Atr-I..!................................................................................................................................................................................................!84! Figura!21!–!Superfície!acessível!ao!solvente!de!pose!extraída!após!200!ns!de!simulação!colorida!em!função!do! potencial!eletrostático.!..............................................................................................................................................................................!85! Figura!22!–!Destaque!dos!sítios!ativos!dos!complexos!entre!as!toxinas!e!os!inibidores!de!amplo!espectro!das! estruturas!iniciais!das!simulações!de!dinâmica.!.............................................................................................................................!87! Figura!23!–!Parâmetros!utilizados!pelo!programa!LEaP!para!definir!a!representação!ligada!do!zinco!e!seus! ligantes.!.............................................................................................................................................................................................................!95! Figura!24!–!Representação!esquemática!das!principais!interações!entre!os!inibidores!de!amplo!espectro!e!as! toxinas.!..............................................................................................................................................................................................................!98! Figura!25!–!Variação!de!energia!de!ligação!em!kcal/mol!pelo!método!QM/MM-PBSA!dos!complexos!da!toxina! Leuc-a!com!os!inibidores!COL!e!PRI.!.................................................................................................................................................!110! Tabela!9!–!Média!e!desvio!padrão!das!energias!livres!de!ligação!em!kcal/mol!calculadas!pelo!método!QMMM/PBSA,!para!os!complexos!Leuc-a/inibidores.!.....................................................................................................................!111! Tabela!10!–!Pontuação!final!obtida!pelo!inibidores!em!complexo!com!a!toxina!Atr-I..!............................................!112! Tabela!11!–!Pontuação!final!obtida!pelo!inibidores!em!complexo!com!a!toxina!Leuc-a.!.........................................!113! 4 Resumo Aproximadamente 90% de todos os casos de acidentes com serpentes peçonhentas no Brasil são causados por animais da família Viperidae. Os venenos desses animais são caracterizados por uma elevada atividade proteolítica e hemorrágica, muitas vezes causando hemorragia sistêmica, a principal causa de morte nesses acidentes. Grande parte dos efeitos do veneno são devidos à atividade de metaloproteases de venenos de serpentes (SVMP), um grupo de toxinas que possui um sítio catalítico altamente conservado contendo um átomo de zinco. O único tratamento eficaz para o envenenamento por serpente em seres humanos é a administração intravenosa de soros antiofídicos, embora estes soros sejam relativamente ineficazes na redução de danos locais. Portanto, compostos com atividade inibitória contra estas toxinas poderiam representar uma terapia complementar à utilização dos soros e podem contribuir para um tratamento mais eficaz contra esses efeitos locais. Neste trabalho utilizamos como modelos de SVMP as estruturas tridimensionais da toxina não-hemorrágica leucurolisina-a (código PDB 4Q1L), de Bothrops leucurus, e a toxina hemorrágica atroxlisina-I, de Bothrops atrox, obtida por modelagem comparativa, para encontrar inibidores para esse grupo de toxinas. Para isso utilizamos duas abordagens complementares, selecionando seis inibidores de metaloproteases de amplo espectro e realizando triagem virtual de compostos lead-like. Primeiramente realizamos simulações de dinâmica molecular das toxinas com o inibidor endógeno presente na estrutura cristalográfica 4Q1L, produzindo conformações utilizadas nas simulações de docking com inibidores de amplo espectro e para utilização posterior na triagem virtual, com o objetivo de representar explicitamente a flexibilidade dos receptores. Os resultados de docking foram utilizadas como estruturas iniciais das simulações de dinâmica molecular, visando a produção de poses para cálculos de energia livre de ligação, além de permitir identificar os principais aminoácidos responsáveis pelas interações dos complexos enzimas-inibidores, e a identificação de diferenças estruturais que poderiam estar relacionadas com a diferença na atividade hemorrágica das toxinas estudadas. Para complementar os resultados computacionais, foram realizados também ensaios de cinética enzimática, que permitiram confirmar a atividade inibitória dos inibidores de amplo espectro, apresentando em alguns casos potência na faixa nanomolar e indicando sua possível aplicação em acidentes com serpentes. Esse resultados também permitiram avaliar a precisão dos 5 cálculos de energia livre de ligação que, apesar não serem capazes de reproduzir exatamente a classificação dos inibidores em função dos valores de IC50, poderiam ser utilizados na identificação de inibidores entre os compostos lead-like selecionados por triagem virtual. 6 Abstract Approximately 90% of all cases of accidents with poisonous snakes in Brazil are caused by animals of the Viperidae family. The poisons of such/these animals are characterized by a high proteolytic and hemorrhagic activity, often causing systemic bleeding, the main cause of death in these accidents. Much of poison effects are due to the activity of metalloproteinase of snake venoms (SVMP), a group of toxins that presents a highly conserved catalytic site containing a zinc atom. The only effective treatment for snake poisoning in humans is the intravenous administration of antiophidic sera, although these serum are relatively ineffective in reducing local damage. Therefore, compounds with inhibitory activity against these toxins could represent a complementary therapy to sera administration and may contribute to a more effective treatment against these local effects. In this work we use as SVMP models the three-dimensional structures of nonhemorrhagic toxin leucurolysin-a (PDB code 4Q1L), of Bothrops leucurus, and the hemorrhagic toxin atroxlysin-I from Bothrops atrox, obtained by comparative modeling, to find inhibitors for that group of toxins. To achieve this we used two complementary approaches, selecting six metalloprotease inhibitors broad spectrum and conducting virtual screening with lead-like compounds. First we performed molecular dynamics simulations of toxins with endogenous inhibitor present in 4Q1L crystallographic structure, producing conformations used in docking simulations with broad-spectrum inhibitors and for later use in virtual screening, aiming to represent explicitly the flexibility of receptors. The docking results were used as initial structures for molecular dynamics simulations, performed to produce poses for binding free energy calculations, and also allowed to identify key amino acids responsible for enzyme-inhibitor interaction, and to identify structural differences that could be related to the difference in the hemorrhagic activity of the studied toxins. In order to complement computational results, enzyme kinetics assays were also conducted, which allowed to confirm the inhibitory activity of broad spectrum inhibitors, presenting in some cases potency in the nanomolar range and indicating its possible application in snakes snakes accidents. These results also allowed to evaluate the accuracy of free energy calculations that, although being unable to exactly reproduce the raking of the inhibitors in based 7 in the IC50 values, could be used to identify inhibitors among the lead-like compounds selected by virtual screening. 8 1 – Introdução 1.1 – Acidentes com serpentes Acidentes com serpentes representam um grande problema de saúde pública no mundo, fazendo parte das doenças tropicais negligenciadas1. Somente na América latina são estimados entre 130-150 mil casos e 2300 mortes por ano2, resultando também em um grande número de pessoas que apresentam sequelas mesmo recebendo o tratamento com soro antiofídico3. Os animais da família Viperidae são responsáveis por aproximadamente 90% dos acidentes nesta região como um todo2, assim como no Brasil4,5. Os venenos dessa família possuem uma grande variedade de peptídeos e proteínas biologicamente ativos2. Estes venenos produzem efeitos locais e sistêmicos, como sudorese, mionecrose, distúrbios hemostáticos e nefrotoxicidade, além de hemorragia, que pode ocorrer em vários órgãos resultando em hipovolemia, hipotensão, choque cardiovascular e acidentes cerebrovasculares. A hemorragia sistêmica é uma das manifestações mais graves do envenenamento de viperídeos, sendo a principal causa de morte6. Por causa desses efeitos os venenos de serpentes sul-americanas vêm sendo estudados há vários anos para descoberta de fármacos pró e anticoagulantes7. Outros exemplos do potencial biotecnológico dos venenos desses animais incluem descobertas de compostos que causam inibição da vascularização de tumores, da agregação plaquetária8 e da atividade bacteriana9. 1.2 - Metaloproteases de veneno de serpentes Um dos principais grupos de toxinas destes venenos são as metaloproteases de veneno de serpente (SVMP, do inglês snake venom metalloprotease), que compreende proteases dependentes de zinco com grande similaridade estrutural no domínio de ligação a esse íon2,3,5, variando de 11% a 65% das toxinas presentes do veneno10. Essas toxinas induzem vários sintomas, como mionecrose, danos nos tecidos epiteliais e inflamação, possuem grande 9 importância nos danos locais e são as principais responsáveis pelas hemorragias2,3,11,12. O processo hemorrágico ocorre quando as toxinas hidrolisam as ligações peptídicas de proteínas da membrana basal, resultando no enfraquecimento da sua estabilidade mecânica2,5. Como consequência, forças hemodinâmicas que normalmente operam no sistema circulatório distendem a estrutura dos vasos já enfraquecida, eventualmente ocasionando seu rompimento6. A clivagem das proteínas da matriz extracelular é essencial para a ocorrência da hemorragia 3,13. É importante ressaltar que o grupo das SVMPs engloba toxinas que apresentam diferentes níveis de atividade hemorrágica, incluindo toxinas que não apresentam essa atividade, apesar de todas possuirem atividade proteolítica3,12,13. As SVMPs podem ser agrupadas em quatro classes de acordo com os domínios presentes quando maduras: a classe P-I, com apenas o domínio catalítico contendo zinco; a P-II, que possui adicionalmente um domínio de desintegrina; a P-III, que contém além dos domínios presentes em P-II um domínio rico em cisteína; e P-IV, que apresenta um domínio adicional lectin-like ligado por pontes dissulfeto a uma SVMP da classe P-III4,12,13. Entretanto, como ainda não foi verificada a existência de mRNA das toxinas P-IV, acredita-se que essas toxinas são formadas por modificações pós-transducionais das toxinas P-III. Por isso as classificações mais recentes incluem as toxinas P-IV como um subtipo de toxinas P-III14. Apesar destas diferenças, todas elas apresentam um domínio de ligação ao zinco altamente conservado, assim como uma alça de metionina (met-turn), que serve como base para os três resíduos de histidinas do sítio ativo5. Outra característica comum presente nessas toxinas é a presença de duas ou três pontes dissulfeto no domínio catalítico14, resultando em grande estabilidade estrutural características dessas toxinas. A classe P-I pode ainda ser dividida em duas subclasses: P-IA, com atividade hemorrágica, e P-IB, apresentando fraca ou nenhuma atividade hemorrágica7. As variações estruturais e na composição de aminoácidos responsáveis por essa diferença ainda não estão totalmente definidas, apesar da existência de diferentes estudos com essa finalidade5,12,13,15, empregando diferentes abordagens, como alinhamento de sequências, análise das relações filogenéticas, comparação dos padrões de pontes dissulfeto e comparações estruturais7. Dentro da classe P-I existem proteínas hemorrágicas e não hemorrágicas com estruturas tridimensionais depositadas no banco PDB16 (Tabela 1), totalizando atualmente 11 estruturas, que podem ser utilizadas em estudos comparativos ou que busquem identificar inibidores utilizando técnicas computacionais. Esses estudos podem aumentar o conhecimento sobre o 10 funcionamento enzimático das toxinas, sobre as diferenças nos efeitos biológicos e ajudar no desenvolvimento de fármacos e de substratos apropriados para estudos de cinética enzimática. Toxina Código PDB Acutolisina-a 1BUD, 1BSW Acutolisina-c 1QUA Adamalisina II 4AIG 1HTD, 1ATL, Atrolisina C 1DTH BaP1 2W15 BmooMPalphaI 3GBO FII 1YP1 H2-proteinase 1WN1 Leucurolisina-a 4Q1L TM1 4J4M 1KUF, 1KUG, TM-3 1KUI, 1KUK Resolução (Å) 1.9 2.2 2 1.8-2.1 1.05 1.77 1.9 2.2 1.9 1.8 1.35 Inibidores em complexo Sim Agkistrodon acutus ̶ Sim (fraca) Agkistrodon acutus ̶ Não Crotalus adamanteus FLX 0QI, BAT, Sim (fraca) Crotalus atrox pENW* Sim (fraca) Bothrops asper WR2 Não Bothrops moojeni ̶ Não Agkistrodon acutus KNL* Não Trimeresurus flavoviridis ̶ Não Bothrops leucurus QSW* Indeterminada Trimeresurus mucrosquamatus ̶ pENW*, Não Trimeresurus mucrosquamatus pEQW*, pEKW* Hemorrágica Organismo Tabela 1 – Características principais das SVMP depositadas no banco PDB. O símbolo “*” indica os inibidores endógenos, onde pE significa ácido piroglutâmico e as outras letras representam os códigos dos aminoácidos. Entre essas toxinas depositadas no PDB, selecionamos a leucurolisina-a para realizar esse estudo. Essa toxina foi purificada do veneno de Bothrops leucurus4 e teve sua estrutura determinada por cristalografia por raios-x em complexo com um inibidor endógeno purificado junto com a toxina, o tripeptídeo QSW (código PDB 4Q1L)11. A outra toxina estudada, a atroxlisina-I, foi purificada do veneno de uma serpente sul-americana de grande importância médica, a Bothrops atrox7. Apesar de não apresentar estrutura tridimensional definida, algumas estruturas de proteínas com alta identidade de sequência, além da própria leucurolisina-a, já foram depositadas no PDB e foram utilizadas como modelos para elaboração da estrutura dessa toxina. Essas toxinas, selecionadas principalmente pela disponibilidade para realizar ensaios experimentais e pela diferença de atividade hemorrágica, apresentam identidade de 52% e estão sendo utilizadas como modelos de SVMPs neste projeto. 11 1.3 - Metaloproteases relacionadas às SVMPs Outra abordagem para descoberta de inibidores é utilizar informação sobre enzimas semelhantes as SVMPs, que fazem parte do grupo das metzincinas, um dos maiores grupos de metaloproteases. Esse grupo é composto principalmente por proteínas com múltiplos domínios, compreendendo um pró-domínio na região N-terminal envolvido na manutenção da enzima em estado inativado, um domínio com atividade catalítica e outros domínios envolvidos em interações proteína-proteína e outras funções regulatórias. As características estruturais do sítio ativo que determinam que uma enzima pertença ao grupo das metzincinas são a presença de um íon de zinco catalítico em coordenação tetraédrica com os átomos de nitrogênio de três histidinas localizadas na região de sequência HEXXHXXGXXHD17. O ácido glutâmico funciona como a base catalítica que polariza uma molécula de água envolvida no ataque nucleofílico que cliva a ligação peptídica. Igualmente conservada é a presença da estrutura de met-turn, onde a cadeia lateral de uma metionina fornece a base hidrofóbica localizada abaixo das cadeias laterais das histidinas que estão coordenadas com o íon de zinco18. As metzincinas são divididas em famílias, sendo que atualmente sete delas foram caracterizadas em nível estrutural: astacins, ADAMs/adamalysins/reprolysins, que incluem as SVMPs, serralysins, metaloproteases de matriz, snapalysins, leishmanolysins, and pappalysins. Atualmente, mais de 200 estruturas dessa classe já foram despositadas no PDB. No entanto, várias sequências oriundas dos projetos de sequenciamento de genomas indicam que ainda existem famílias não caracterizadas17. SVMPs são filogeneticamente relacionadas às proteínas com domínios de desintegrinas e metaloproteases (ADAM) de mamíferos19, possuindo estruturas e funções semelhantes20, principalmente se comparadas à classe P-III de SVMPs18. A publicação do genoma do lagarto Anolis carolinensis21 permitiu a elaboração de novos estudos filogenéticos, mostrando fortes evidências de que as SVMPs são mais próximas das ADAM28 e ADAM7 humanas22. Vários domínios catalíticos das ADAMS já foram determinados estruturalmente, apresentando alta identidade estrutural e pequenas variabilidades nas regiões das alças periféricas18,19. Essas proteínas estão envolvidas em várias funções fisiológicas normais em mamíferos, como degradação da matriz celular, fusão celular, adesão e sinalização intracelular, 12 estando envolvidas em vários processos patológicos, que vão desde doenças inflamatórias e degenerativas até a neoplásicas, possuíndo portanto grande importância médica17,20. A complexidade das ADAMs cresceu consideravelmente após a descrição de proteínas secretadas estruturalmente relacionadas que contêm várias repetições de domínios “thrombospondin-like” e ausência do domínio transmembrana, denominadas ADAMTS (ADAM com domínio thrombospondina). Essas proteínas foram caracterizadas como uma nova família de metaloproteases com propriedades funcionais e estruturais relacionadas às ADAMs4,5,20. Outra família de enzimas de grande importância médica relacionadas às SVMP são as metaloproteínases de matriz (MMP) (Figura 1), que também apresentam arquitetura do sítio ativo similar às SVMP e ADAM/ADAMT18, mas apresentam domínios adicionais regulatórios. Assim como as SVMP hemorrágicas, as MMP degradam proteínas do endotélio da membrana basal, porém em processos fisiológicos normais19. Por causa dessa semelhança entre sítios ativos, os inibidores de MMP muitas vezes também inibem as atividades das ADAM20, que podem ainda compartilhar inibidores com as SVMP. Esse é o caso da toxina BaP1 (código PDB 2W15), que foi cristalizada com um inibidor desenvolvido para a enzima ADAM1712. A semelhança entre os sítios ativos dessas enzimas e aplicação de conhecimentos obtidos sobre inibidores e estrutura tridimensionais de enzimas de uma família às de outra família já foram exploradas em diversos trabalhos18,19. 13 Figura 1 – Alinhamento estrutural dos sítios catalíticos das ADAM17 (verde), MMP9 (rosa) e Leuc-a (marrom). Figura produzida com programa Pymol23. Essas informações sobre os inibidores conhecidos dessas enzimas junto com a avaliação da semelhança dos sítios ativos podem auxiliar na predição de novos ligantes para as SVMPs. É razoável concluir que sítios de ligação similares podem ser ligar aos mesmos ligantes, e que as proteínas que se ligam a um mesmo ligante possuem grandes chances de compartilhar outros ligantes. Obviamente proteínas de uma mesma família são mais propensas a compartilhar inibidores, pois possuem maiores chances de apresentar estruturas terciárias similares, mas isso também pode ocorrer com proteínas bastante distintas em relação à estrutura como um todo, mas que apresentam sítios catalíticos similares24,25. Além da abordagem descrita acima, baseada em informações sobre inibidores conhecidos de proteases semelhantes a SVMPs, a busca por novos inibidores pode ser auxiliada por técnicas computacionais, através do emprego de modelagem molecular, como descrito no tópico 1.4. 14 1.4 - Modelagem molecular A modelagem molecular engloba todas as técnicas computacionais utilizadas para simular o comportamento de moléculas. Essas técnicas são amplamente utilizadas nos campos de química computacional e desenvolvimento de fármacos para estudar sistemas biológicos, podendo ser aplicado, portanto, na descoberta de inibidores de enzimas. 1.4.1 – Mecânica quântica Existem duas abordagens comumente aplicadas na área de modelagem molecular, que são as aproximações clássica, também denominadas mecânica molecular (MM), e as aproximações baseadas na química quântica (QM). Quando se está interessado em fenômenos que envolvem a quebra ou formação de ligações atômicas, ou a avaliação de polarização e transferência de cargas em moléculas, será necessária a utilização de métodos quânticos26. De acordo com as teorias da mecânica quântica, todo sistema pode ser descrito por sua função de onda, que fornece todas as informações sobre as propriedades observáveis do mesmo. Essa função pode ser obtida pela solução da equação de Schrödinger, uma equação diferencial, cuja resolução envolve a avaliação de um grande número de integrais, sendo portanto, uma tarefa difícil. Por isso uma série de aproximações são necessárias para que ela possa ser aplicada para sistemas químicos e biológicos de interesse prático27. Um outro método utilizado para a descrição de sistemas moleculares foi desenvolvido através da Teoria do Funcional de Densidade (DFT), que recebeu esse nome devido ao uso de funcionais, funções de outra função, na modelagem da correlação eletrônica. Segundo essa teoria, as propriedades de um sistema com muitos elétrons pode ser determinada em função da densidade eletrônica. Os métodos DFT apresentam a vantagem de considerar os efeitos de correlação eletrônica, fenômeno originado na reação de elétrons ao movimento de outros elétrons de um mesmo sistema. A alta precisão dos cálculos, além do custo computacional relativamente baixo quando comparados com métodos tradicionais, como Hartree-Fock e derivados, resultou 15 em uma grande difusão dos métodos DFT28,29. Entre esses se destaca o modelo funcional de troca híbrida de 3 parâmetros de Becke e do funcional de correlação de Lee‐Yang‐Parr (B3LYP)30, considerado um dos métodos mais eficientes para vários sistemas, incluindo aqueles com metais de transição27, apresentando resultados similares aos obtidos por métodos ab initio para geometrias e energias moleculares de complexos com zinco31. Os métodos utilizados para os cálculos quânticos se dividem em ab initio e semi‐ empíricos. Apesar das aproximações utilizadas nos métodos ab initio, eles ainda podem ser aplicados somente a moléculas de tamanhos pequenos ou médios. Nos métodos semi‐empíricos, são eliminadas dos cálculos um grande número de integrais para diminuir o custo computacional, introduzindo parâmetros empíricos ou previamente calculados na resolução da equação de Schrödinger para compensar essa eliminação27. Essa abordagem implica que esses métodos devem ser aplicados em sistemas similares aos utilizados para o desenvolvimento dos parâmetros correspondentes26. Entre os métodos semi-empíricos mais utilizados para estudos de moléculas orgânicas é o self-consistent charge density functional tight binding (SCC-DFTB)32. Uma deficiência desse método SCC-DFTB é não considerar forças de dispersão, mas que podem ser corrigidas pela utilização de um termo empírico, que utilizam parâmetros derivados experimentalmente33. Apesar das aproximações desse métodos, normalmente o tratamento de muitos sistemas de interesse bioquímico, como sistemas contendo proteínas, utilizando somente métodos QM não é aplicável devido à alta demanda computacional para tais simulações. Apesar de existirem trabalhos que utilizam somente métodos semi-empíricos, com modificações para apresentarem aumento computacional linear em função do número de átomos em estudos com proteínas, tais estudos ainda são pouco comuns na literatura34. Por isso foram desenvolvidos métodos híbridos QM/MM35, que definem um conjunto relativamente pequeno de átomos do sistema para serem modelados por QM, sendo o restante do sistema descrito utilizando MM. A região MM inclui normalmente poucos resíduos do sítio ativo, e muitas vezes de um ligante. Esses métodos são especialmente importantes para estudos de metaloenzimas, devido à dificuldade de se modelar as interações entre íons metálicos com moléculas orgânicas com a utilização de campos de força convencionais, que não consideram a transferência de carga entre o íon metálico e seus ligantes36–38. 16 Atualmente existem programas que tornam os cálculos quânticos acessíveis para os não especialistas na área, sendo o programa Gaussian39 um dos mais utilizados. 1.4.2 – Mecânica molecular Apesar de não apresentar a mesma precisão dos métodos quânticos, muito estudos de descoberta de inibidores são desenvolvidos com o uso de técnicas computacionais baseadas em mecânica molecular, que utilizam as teorias de mecânica clássica para modelar sistemas moleculares. A energia potencial desses sistemas é calculada através da utilização de campos de força, podendo ser utilizada para estudar desde moléculas pequenas a grandes moléculas biológicas, como proteínas, membranas celulares e DNA26,40. Na modelagem molecular baseada na mecânica clássica a molécula é considerada como uma coleção de massas centralizadas no núcleo (átomos) conectadas por molas (ligações químicas). Em resposta a forças intra e intermoleculares, as moléculas estendem-se, dobram e giram ao redor dessas ligações. Essa descrição clássica – uma caracterização apropriada mesmo com o aumento de informação de mecânica quântica utilizada parra gerar campos de forças – funciona geralmente bem para descrever estruturas e processos moleculares, com exceção de eventos onde ocorre quebra de ligações químicas26. Nas simulações atomísticas cada átomo é simulado como uma única partícula, a qual se atribui um raio de van der Waals (vdW) e uma carga elétrica, incluindo também em alguns casos um fator de polarização. As ligações entre essas partículas são tratadas como “molas”, cujos valores das distâncias de equilíbrio, assim como os valores dos raios e das cargas atômicas, são determinados utilizando-se cálculos quânticos e uma grande quantidade de dados experimentais, como estruturas geradas por cristalografia, espectroscopia de micro-ondas e calor de formação. Assume-se o princípio da aditividade, que determina que as forças físicas que governam esses sistemas, utilizadas para descrever energias e geometrias moleculares, podem ser calculadas a partir de termos de energias individuais, e o princípio da transferibilidade, que determina que esses termos desenvolvidos para incorporar dados experimentais obtidos a partir de estruturas representativas podem ser aplicados na predição geometrias de grandes moléculas biológicas 17 compostas pelos mesmos grupos químicos dessas estruturas, assumindo-se que os comprimentos e ângulos de ligações químicas tendem a apresentar valores similares em diferentes compostos sobre condições normais26. A minimização dessas funções pode ser utilizada para calcular regiões energeticamente favoráveis da configuração espacial do sistema e para realizar simulações de dinâmica molecular (DM), que podem explicar estados termodinamicamente acessíveis do sistema26. Entre as técnicas de modelagem molecular utilizadas para estudos de proteínas estão as técnicas de docking molecular, DM e modelagem comparativa. 1.4.3 - Campos de força Um campo de força é uma representação física de um sistema em simulações computacionais, que consiste de uma forma funcional e de um conjunto de parâmetros de ajuste às suas respectivas funções matemáticas, utilizados para descrever a energia potencial de um sistema de partículas, normalmente compostos por átomos e moléculas. Esses conjuntos de funções e parâmetros são derivados de dados experimentais e cálculos de mecânica quântica41. Os campos de força moleculares atualmente mais utilizados são AMBER42, CHARMM43, GROMOS44, OPLS45 e MMFF9446. A maioria deles divide a função de energia potencial em termos de contribuições de átomos ligados, ou seja, átomos conectados por uma, duas, ou três ligações químicas, e não-ligados, distantes um dos outros por mais de três ligações químicas, ou em moléculas diferentes41, sendo essa separação em termos locais e não-ligados de grande ajuda nos desenvolvimentos dos algoritmos utilizados nas simulações computacionais26. Um exemplo de uma função utilizada em campos de força AMBER47 apresenta a seguinte forma: (1) 18 onde (R) é o vetor com as coordenadas atômicas e U(R) representa a energia potencial do sistema. Kr , Kθ e Vn são as constantes de força de comprimento de ligação, ângulo de ligação, e torcional respectivamente. r e θ são os comprimentos de ligação e o ângulo de ligação. γ e n representam a fase e a periodicidade do ângulo diedro, respectivamente. Os primeiros três termos da expressão acima são referentes a átomos ligados e avaliam as energias de ligação atômica, energia de ângulo de ligação e energia de ângulos diedros. Os termos de ligação atômica normalmente são modelados utilizando potencial harmônico ou potencial de Morse, centralizadas em valores de equilíbrio. Os termos torcionais ou diedros apresentam múltiplos mínimos e são modelados com termos de Fourier. Muitos campos de força utilizam também o termo ângulos diedros impróprios, que é importante para manter a planaridade de certas ligações e quiralidade de grupos químicos. Este termo é utilizado, por exemplo, para manter a planaridade dos átomos envolvidos nas ligação peptídicas e nos grupos carboxilato de cadeias laterais dos aminoácidos aspartato e glutamato26. Os dois últimos termos da equação são os de Coulomb e Lennard-Jones 6-12 e contribuem para as interações externas ou não-ligadas; RAB é a distância entre os átomos, QA e QB representam as cargas parciais atômicas, ε é a constante dielétrica do meio e AAB e BAB são os parâmetros de Lennard-Jones cujo valor depende dos átomos envolvidos. Esses dois termos de energia não-ligados apresentam custo computacional muito mais elevados que os termos ligados, porque um átomo está ligado a apenas alguns poucos átomos vizinhos, mas interage com muitos outros átomos. O termo de Lennard-Jones é determinado por dois tipos de interações distintas, uma repulsiva e o outra atrativa. O termo repulsivo (r-12) modela forças de curto alcance entre dois átomos próximos o suficiente para que haja uma superposição parcial de suas nuvens eletrônicas, originadas pela repulsão entre os núcleos atômicos e e pelo princípio de exclusão de Pauli. O termo atrativo (vdW) (r-6) está relacionado com interações de curto alcance, que são as interações de Keesom, de Debye e de London. Por apresentar um decaimento rápido com o aumento da distância, é possível aplicar um valor de corte para esse termo, resultando em menor custo computacional do que o termo de Coulomb, que está relacionado com as interações eletrostáticas intra e intermoleculares, consideradas de longo alcance por exibirem dependência com o inverso da distância (r-1) entre as cargas atômicas41. A parametrização dos campos de força, utilizando compostos modelo, garante que os cálculos produzam geometria moleculares e interações energéticas apropriadas para um grupo 19 determinado de moléculas. Por exemplo, para proteínas os compostos modelos são peptídeos ou compostos similares. Para ácidos nucléicos, desoxirribonucleotídeos e compostos contendo anéis de furanoses são apropriados. Esses parâmetros são otimizados de maneira iterativa para reproduzir um número crescente de informações experimentais de geometrias moleculares e de muitas outras propriedades: medidas de frequência vibracional, calores de formação, energias e geometrias intermoleculares, barreiras torsionais, entre outras26. Cálculos empíricos de energia utilizando esses campos de força podem ser aplicados para estudos de estruturas, dinâmica e termodinâmica de proteínas, assim como de outras macromoléculas de interesse biológico43 e nas simulações de docking41. Um elemento essencial para esses cálculos é a simplicidade da função de energia potencial, que permite simulações de sistemas envolvendo meio milhão de átomos, com duração de até 5 µs48. 1.4.4 - Modelagem comparativa de proteínas A caracterização funcional de sequências proteicas é um problema frequente na área biológica49. Atualmente é bem estabelecido que o conhecimento da estrutura molecular é uma ferramenta poderosa para entender, controlar e alterar funções de biomoléculas49,50. Apesar de estruturas tridimensionais de proteínas poderem ser determinadas por cristalografia por raios-x e ressonância nuclear magnética, esses experimentos demandam tempo e grandes quantidades de proteínas em auto grau de pureza, além de possuírem algumas limitações. A técnica de NMR é difícil de ser aplicada a grandes proteínas (maior que 250 aminoácidos), ou proteínas muito flexíveis, enquanto a cristalografia por raios-x depende da obtenção de cristais com boa capacidade de difração, processo realizado por tentativa e erro, e da solução do problema de fase. Entretanto, sequências de proteínas podem ser determinadas muito mais facilmente através da utilização de técnicas de biologia molecular e sequenciamento de proteínas. Portanto, em casos onde a estrutura não pode ser determinada experimentalmente, a modelagem comparativa pode frequentemente produzir um modelo tridimensional útil de uma sequência alvo baseado na sua similaridade a uma proteína com estrutura conhecida, utilizada como proteína molde. Isso é 20 possível porque pequenas alterações na sequência normalmente resultam em pequenas alterações na estrutura tridimensional50. Existem vários métodos para a produção desses modelos. Um dos métodos utilizados é a satisfação de restrições espaciais. Esse método utiliza restrições geométricas obtidas do alinhamento da proteína alvo com os moldes junto com técnicas de otimização para satisfazer as restrições espaciais obtidas do alinhamento50. As restrições são geralmente obtidas assumindo-se que as distâncias e ângulos correspondentes entre os resíduos no molde e na proteína alvo são similares. Essas restrições geradas por comparação são suplementadas com restrições estereoquímicas de comprimento de ligação, ângulos de ligação, ângulos diedros e contatos de átomos não-ligados obtidos de um campo de força de mecânica molecular. O modelo é então gerado minimizando as violações de todas essas restrições. Como esse método utiliza muitas informações diferentes sobre a sequência alvo, ele é uma técnica muito utilizada para modelagem comparativa51. Essa metodologia consiste de quatro passos principais: identificação de pelo menos um molde, alinhamento da sequência alvo com a estrutura do molde, construção do modelo baseado nesse alinhamento e avaliação da qualidade do modelo51. Como as estruturas de proteínas obtidas por dados experimentais ou por modelagem comparativa estão sujeitas a muitas fontes de erros, é importante medir a qualidade geral da estrutura e ser capaz de identificar regiões que podem precisar de maior investigação52, pois essa avaliação é essencial para poder interpretar o modelo e determinar o tipo de informação que pode ser obtido dele51. As funções de pontuação utilizadas para essa avaliação se baseiam na hipótese termodinâmica que diz que a estrutura nativa de uma proteína representa o estado de menor energia livre em condições fisiológicas. Existem basicamente dois tipos de função de pontuação: funções de energia baseadas em campos de força e funções estatísticas baseadas em conhecimento. As últimas são funções de energia derivadas de informações de estruturas conhecidas de proteínas e são normalmente formalizadas através de potenciais de força média dependentes ou independentes de distância53. Devido à essa dependência das estruturas de proteínas conhecidas, essas funções de pontuação são também denominadas de baseadas em conhecimento ou potenciais estatísticos54. Elas são subclassificadas pelas forma de representação da proteína (se usam centróides dos resíduos de aminoácidos, Cα/Cβ, ou todos os átomos), restrições de características espaciais (acessibilidade ao solvente, contatos, distâncias, ângulos 21 torcionais) e os estados de referência, sendo amplamente utilizados em várias aplicações por causa da sua relativa simplicidade, acurácia e eficiência computacional54. A qualidade dos modelos gerados depende principalmente da existência de moldes apropriados, ou seja, com boa resolução, alta cobertura e alta identidade. Para homólogos próximos, os programas mais utilizados na maioria dos casos geram modelos muito bons, com RMSD (root mean square deviation em inglês, ou desvio médio quadrático) de aproximadamente 2Å da estrutura experimental. Geralmente uma identidade de sequência acima de 35% é suficiente para produzir bons modelos49 para proteínas acima de aproximadamente 100 aminoácidos55 e a medida que a similaridade entre o alvo e molde diminui, o erro do modelo aumenta51. Os modelos produzidos de alvos que apresentam menos de 25% de identidade de sequência com o molde produzem os piores modelos, que podem apresentar menos de 50% de carbonos alfa com menos de 3.5 Å, valor de corte frequentemente utilizado para avaliar a qualidade dos modelos tridimensionais, de diferença em relação a sua posição correta. Esses modelos ainda podem ser úteis, sendo utilizados por exemplo para auxiliar a aceitar ou rejeitar um alinhamento entre proteínas distantes filogeneticamente. Já os modelos com identidade com os moldes de aproximadamente 35% apresentam 85% dos carbonos alfa modelados com menos de 3.5 Å de diferença da sua posição correta. Vale ressaltar que os sítios ativos e de ligação são frequentemente mais conservados que o resto da estrutura, podendo ser alinhados de forma mais precisa. Esses modelos podem ser utilizados, por exemplo, para guiar experimentos de mutações sítio-dirigidas. Por último, os modelos com identidade com os moldes de 50% ou mais produzem modelos com média de erros comparados com estruturas de cristalografia por raios-x de 3 Å de resolução. Os alinhamentos desses modelos normalmente apresentam 100% dos carbonos alfa com menos de 3.5 Å da sua posição correta. Esses modelos podem ser utilizados triagem em virtual e docking de pequenas moléculas ou de macromoléculas, desenvolvimento e otimização de inibidores e para a utilização em substituição molecular aplicado à determinação de estruturas por cristalografia49. 22 Figura 2 – Figura mostrando a acurácia e as possíveis aplicações de modelos tridimensionais de proteínas construídos por modelagem comparativa em função da porcentagem de identidade da sequência do alvo com a sequência do molde, destacando duas aplicações utilizadas com o modelo da Atr-I neste trabalho. Retirado de Eswar et al, 2007. Além da comparação da posição de carbonos alfa no modelo e na estrutura experimental, diversos parâmetros e programas são empregados para verificar a qualidade de um modelo. Entre os programas utilizados para validação das características estereoquímicas das estruturas de proteínas está o programa PROCHECK52, que utiliza informações estereoquímicas selecionadas de estruturas de alta qualidade para providenciar uma avaliação geral da estrutura e para destacar regiões que necessitam refinamento. O programa pode ser utilizado independentemente dos 23 dados experimentais e ser aplicado à estruturas já publicadas, ou para estruturas geradas por modelagem comparativa52. Outro programa amplamente utilizado para validação é o ProSa56, uma ferramenta que se baseia na análise estatística de todas as estruturas de proteínas depositadas no PDB. Estruturas de proteínas solúveis cujos z-scores, uma pontuação utilizada pelo programa para avaliar a qualidade de modelos tridimensionais de proteínas, se afastam muito das médias obtidas para estruturas determinadas experimentalmente são incomuns e geralmente decorrentes de vários erros estruturais56. Essa ferramenta utiliza uma função baseada em conhecimento, do tipo Potencial de Força Média (Potential of Mean Force), que descreve as geometrias preferenciais de determinada sequência de aminoácidos através da análise estatística das geometrias de interação entre átomos de estruturas depositadas no PDB57. Já o programa Qmean53 utiliza uma abordagem relativamente diferente, utilizando uma função de pontuação composta por cinco descritores estruturais. Três desses termos potenciais estatísticos cobrem aspectos principais da estabilidade de proteínas. O primeiro analisa a geometria local, utilizando dados de ângulos de torção de sequências de três aminoácidos, o segundo avalia interações de longa distância baseadas na estrutura secundária e o terceiro descreve a área do resíduo que está em contato com outros resíduos. Os outros dois termos adicionais descrevem a concordância entre a estrutura secundária e acessibilidade ao solvente predita e calculada53. Apesar de existirem muitos programas disponíveis para realização de modelagem comparativa de estruturas tridimensionais de proteínas, um dos mais utilizados pela comunidade científica é o Modeller49, distribuído gratuitamente para a comunidade acadêmica. Ele utiliza a metodologia de satisfação de restrições espaciais para a produção de modelos e também pode realizar muitas tarefas adicionais, incluindo modelagem “de novo” de alças de estruturas de proteínas, otimização de vários modelos de estruturas de proteínas em relação à flexibilidade, alinhamento múltiplo de sequências de proteínas e/ou estruturas, agrupamentos, etc49. A principal função de pontuação do programa utilizado para avaliar e classificar os modelos produzidos é a DOPE (Discrete Optimized Protein Energy), uma função de potencial estatístico dependente de distância calculada a partir de um grupo de estruturas nativas de proteínas, baseada totalmente na teoria de probabilidades54. 24 1.4.5 - Docking aplicado à triagem virtual A compreensão dos mecanismos de reconhecimento molecular proteína-ligante é um dos aspectos centrais para a descoberta e planejamento de fármacos. Obter uma descrição acurada e automatizada do processo de reconhecimento molecular, utilizando metodologias computacionais, pode permitir a redução do tempo e dos altos custos envolvidos no desenvolvimento de novos medicamentos41,58. Dentre estas metodologias, a de docking receptor-ligante tem contribuído significativamente para avanços no desenvolvimento de fármacos, sendo empregada no refinamento e otimização de compostos protótipos previamente identificados, na triagem virtual de bases de dados e na estimativa das afinidades de ligação proteína-ligante59–62. Devido a todos esses fatores, esse método tem sido alvo de intensas pesquisas, atraindo o interesse de universidades, indústrias farmacêuticas e empresas de biotecnologia em todo o mundo 41,63. A metodologia de docking molecular tem como objetivos predizer a orientação de ligação de duas moléculas que formam um complexo estável e estimar a afinidade de ligação entre elas. Portanto, o sucesso da técnica é medido através da comparação dos resultados preditos com modos de ligação determinados por cristalografia por raios-x dos complexos e medidas de afinidade determinadas em ensaios in vitro. Para realizar a docagem molecular são necessárias basicamente três etapas: definição da estrutura da molécula alvo, localização do sítio de ligação e predição do modo e da afinidade de ligação de um ligante utilizando algoritmos específicos41. A estrutura pode ser obtida pelas técnicas de cristalografia por raios-x, NMR, ou predita computacionalmente por modelagem comparativa. A aplicação destes modelos para docking já é bem estabelecida e representa uma importante alternativa quando estruturas experimentais ainda não estão disponíveis64,65. A predição do modo e da afinidade de ligação é realizada através de algoritmos de busca e funções de avaliação, dois aspectos principais que diferenciam os programas de docking. Os algoritmos de busca são utilizados para amostrar as possíveis orientações dos ligantes ligados ao alvo proteico, considerando os graus de liberdade translacionais, rotacionais e conformacionais (que avaliam os ângulos diedrais associados às ligações covalentes simples). Esses algoritmos 25 são divididos em três classes principais: métodos de busca sistemática, de busca determinística e de busca estocástica. Nos métodos de busca sistemática, cada grau de liberdade possui valores determinados e todos eles são explorados combinatoriamente durante a busca. Os métodos de busca determinística produzem os mesmos dados de saída sempre que utilizados os mesmos dados de entrada, como métodos clássicos de minimização de energia e de simulação por DM. Os métodos de busca estocástica envolvem movimentos aleatórios, ocasionando diferentes saídas para os mesmos dados de entrada. Nessa categoria se encontram os algoritmos evolucionários, Monte Carlo e simulated annealing41. As funções de avaliação também podem ser divididas em três classes principais: funções baseadas em campos de força, funções empíricas e funções baseadas em conhecimento. As funções baseadas em campos de força utilizam um campo de força para calcular a energia de ligação entre o ligante e o alvo proteico. A funções empíricas utilizam métodos empíricos e semi-empíricos cujos coeficientes foram pré-otimizados tomando-se como base resultados experimentais de estruturas receptor-ligante e suas respectivas constantes de inibição. Essas funções buscam reproduzir dados experimentais de energia de ligação, assumindo que esta pode ser decomposta em funções que dependem das coordenadas do ligante e do receptor e que serão multiplicadas pelos coeficientes pré-otimizados. As funções baseadas em conhecimento também utilizam dados experimentais, mas utilizam estruturas cristalográficas para descrever as geometrias de interação receptor-ligante, ao invés de usar dados das constantes de inibição. Através de análises estatísticas dessas geometrias são derivados Potenciais de Força Média, que avaliam a variação de energia-livre em função das coordenadas interatômicas. Por causa dos erros associados a essas funções de avaliação das três classes, os programas mais recentes estão utilizando combinações dessas funções para produzirem funções consenso, que parece aumentar a qualidade dos resultados41 . Uma das aplicações desta metodologia é a triagem virtual, técnica na qual os vários ligantes de um grande banco de dados são avaliados contra a estrutura de um receptor alvo e classificados de acordo com as interações intermoleculares preditas66,67, priorizando potenciais ligantes para um alvo específico. Posteriormente essas moléculas podem ser avaliadas através de cálculos de energia livre mais precisos, que envolvem o uso de DM, ou ser diretamente selecionadas através de inspeção visual. A seguir os compostos selecionados são testados experimentalmente para comprovação de sua ligação as proteínas de interesse, com o objetivo de 26 guiar e validar a metodologia. Posteriormente outras características relevantes para desenvolvimento de fármacos, como toxicidade e biodisponibilidade, podem também ser avaliadas41,58. Essas metodologias in silico apresentaram vários avanços recentemente, principalmente por causa do desenvolvimento da biologia molecular, das técnicas experimentais para identificação de alvos moleculares proteicos e da obtenção de informações sobre suas estruturas tridimensionais41,68. Outro fator importante foi o aumento do número de bancos de dados de compostos químicos, como o ZINC, que se destaca por ser gratuito e por possuir um grande número de compostos, com aproximadamente 35 milhões de compostos atualmente63. Entre os vários programas existentes que realizam simulações de docking, o programa Autodock é um dos mais utilizados atualmente69. Entre as qualidades desse programa podemos destacar a possibilidade de tratar algumas cadeias laterais do receptor como flexíveis durante a simulação e a possibilidade de utilização de múltiplos CPUs para diminuir o tempo de processamento. A última versão desse programa de código aberto é AutoDock Vina70. A função de avaliação desse programa, relacionada com a classificação dos ligantes “docados”, combina vantagens de funções baseadas em conhecimento e funções empíricas, extraindo informações de preferências conformacionais de complexos receptor-ligante e medidas de afinidade obtidas experimentalmente, utilizando diferentes tipos de otimização estocástica global combinados com procedimentos de otimização local70. 1.4.6 - Limitações da triagem virtual utilizando docking Apesar da utilidade e do sucesso já demonstrado para esta técnica, a interação molecular é um processo complexo e dinâmico, e para que grandes bases de dados sejam avaliadas é necessário utilizar diversas aproximações nas funções de avaliação. Dentre elas está a desconsideração da flexibilidade da proteína alvo. Normalmente emprega-se uma única estrutura para realizar as simulações, porém sabe-se que na realidade os sítios ativos dos receptores possuem muitos estados conformacionais válidos, e que determinados inibidores não serão identificados por triagem virtual por se ligar a uma conformação que difere significativamente da 27 escolhida para realizar a docagem71. Além disso, as técnicas computacionais de docking não apresentam uma acurácia de predição de energia-livre de ligação suficiente para gerar uma classificação confiável41. Essa predição se torna ainda mais difícil quando a proteína estudada possui um íon metálico no sítio catalítico, devido à dificuldade das funções de avaliação baseadas em mecânica clássica em tratar as interações entre metais e moléculas orgânicas72. Normalmente considera-se que os compostos que estão melhor pontuados estão enriquecidos com moléculas que realmente demonstram atividade quando testadas experimentalmente. Por esses motivos a inspeção visual dos ligantes priorizados na triagem é de fundamental importância para a seleção dos compostos mais promissores, resultando na necessidade de intervenção humana41, que pode ser considerado mais uma limitação da técnica. Para diminuir o impacto dessas limitações podemos utilizar técnicas de DM para simular a flexibilidade do receptor e para calcular a energia livre de um número reduzido de ligantes préselecionados nas etapas de iniciais triagem73. A combinação de técnicas menos precisas para seleção inicial de compostos, mas com menor custo computacional, seguida por técnicas mais precisas, com maior custo computacional, utilizando um número reduzido de compostos já selecionados nas etapas iniciais, é uma estratégia promissora para identificação de ligantes para alvos proteicos71. 1.4.7 – Dinâmica Molecular – (DM) Dinâmica molecular (DM) é uma simulação computacional dos movimentos físicos de átomos e moléculas. Permite-se que os átomos e moléculas interajam por um determinado tempo, gerando uma trajetória dos átomos, determinada através da resolução das equações de movimento de Newton para um sistema de partículas que interagem entre si, onde forças entre as partículas e a energia potencial são definidos por um campo de força40. O resultado é uma trajetória que especifica como as posições e as velocidades das partículas do sistema variam com o tempo, sendo obtida através da resolução das equações diferenciais geradas a partir da segunda lei de Newton ! = !!: 28 d2xi / dt2 = ! xi / mi (2) Essa equação descreve o movimento da partícula de massa mi ao longo da coordenada xi, sendo ! xi a força resultante atuando nessa partícula nessa direção40. Resumidamente, atribui-se aos átomos do sistema posições e velocidades iniciais e escolhe-se um intervalo de tempo, ∆t. Em seguida calcula-se as forças atuantes em cada átomo utilizando-se um campo de força. Depois permite-se que cada átomo mova-se durante o ∆t resolvendo-se as equações de movimento, baseado nas acelerações obtidas através das forças atuantes em cada átomo, e incrementa-se o tempo inicial com o valor de ∆t. Esses passos são repetidos até que o tempo desejado de simulação seja atingido. Na prática as simulações são muito mais complexas que os passos descritos acima, envolvendo muitos passos adicionais, principalmente para resolver as equações de movimento, para controle de temperatura, pressão ou volume e para geração e análise de resultados26,40. Os resultados dessas simulações podem ser utilizados para determinar propriedades termodinâmicas macroscópicas do sistema, além de permitir insights dos movimentos moleculares em escala atômica26,40. Muitas simulações de proteínas, ácido nucléicos e carboidratos são realizadas atualmente utilizando o pacote de programas AMBER74, que inclui programas desenvolvidos para trabalharem em conjunto, permitindo realizar desde a preparação de estruturas e produção das simulações de dinâmica até as análise dos resultados. Essa sigla também é utilizada para se referir aos campos de força utilizados pelos programas do pacote. Tanto o pacote de programas quanto os campos de força foram utilizados nesse trabalho. A separação de programas desenvolvidos para cada etapa apresentam importantes vantagens, como facilitar o contínuo melhoramento das partes individuais com pouco impactos nos demais programas, permitir a realização de tarefas de alto desempenho em servidores remotos e a realização das análises em computadores individuais e facilitar a interface com programas externos75. Entre esses programas, podemos destacar: o Antechamber76, que automatiza grande parte da parametrização de pequenos compostos orgânicos, como os inibidores com características de fármacos, através do campo de força GAFF (general amber force field)47, desenvolvido especialmente para facilitar as simulações de proteínas em complexo com esses compostos; o SANDER (Simulated annealing with NMR-derived energy restraints), principal programa do pacote, utilizado para simulações de dinâmica molecular, possuindo a capacidade de realizar também métodos híbridos 29 QM/MM77; e o pmemd.cuda, versão otimizada do SANDER desenvolvido para trabalhar em máquinas que possuem placas GPU (graphics processing unit)78,79. 1.4.7.1 – Aplicações na descoberta de inibidores Os modelos produzidos por NMR, estruturas de cristalografia por raios-x e modelagem comparativa fornecem informações valiosas sobre a estrutura macromolecular. Entretanto, uma única conformação proteica diz pouco sobre a sua dinâmica40. Quando uma pequena molécula se aproxima do alvo em solução, ela não encontra uma única estrutura estática, mas uma macromolécula em movimento constante80. Para considerar essa flexibilidade é possível realizar simulações de DM em conjunto com a triagem virtual. Uma das maneiras de combinar estas técnicas é docar cada molécula de uma base de dados em múltiplas conformações da proteína geradas por simulações de DM, geralmente selecionadas por técnicas de agrupamento e seleção de conformações representativas. Assim, cada ligante é associado a várias pontuações obtidas com as diferentes conformações da proteína testada. Os ligantes podem ser classificados por diferentes critérios, como a média dos valores de energia de ligação predita para cada conformação ou os menores valores obtidos com uma determinada conformação. Portanto, essa metodologia considera várias conformações do receptor amostradas durante as simulações. Posteriormente os ligantes selecionados são utilizados em cálculos de energia de ligação mais precisos, mas que envolvem maior gasto computacional80. A aplicação dessa técnica em conjunto com outras técnicas de triagem geralmente apresenta boas taxas de sucesso71. 1.4.8 – Cálculos de variação de energia livre Cálculos de energia livre se tornaram uma metodologia frequentemente utilizada para a predição de energia de ligação de candidatos a fármacos. Entre as técnicas computacionais mais apuradas para calcular essa energia estão MM-PBSA (molecular mechanics Poisson-Bolzmann 30 surface)81, perturbação de energia livre (FEP)82 e integração termodinâmica (TI)83, sendo essas duas últimas as mais precisas, mas que possuem maior custo computacional, não permitindo que sejam aplicadas a um grande número de compostos. Grande parte desse custo computacional são causados pelo tratamento explícito do solvente e por calcular a energia livre de ligação em pontos intermediários ao longo da transição de um estado inicial e um final de interesse. No método MM-PBSA, os cálculos são simplificados pela utilização de solvente contínuo e por calcular a energia somente do estado inicial e final, mantendo a avaliação da influência do solvente e proporcionando uma boa relação entre o custo computacional e a precisão dos resultados84. Essa características permitem sua utilização com uma maior quantidade de compostos, e por ser mais preciso que a funções de pontuação convencionais, esse método é frequentemente utilizado para avaliar compostos pré-selecionados em trabalhos com triagem virtual85. Os resultados desses cálculos de energia de ligação podem então ser comparados com os resultados obtidos por testes in vitro, que dependem do alvo proteico em questão. No caso de estudos com metaloproteases, podem ser realizados estudos de inibição de atividade proteolítica, cinética enzimática e Isothermal titration calorimetry (ITC). Os testes de inibição de atividade proteolítica são simples de serem realizados e permitem verificar se compostos possuem atividade inibitória. Os testes de cinética enzimática e ITC permitem avaliar a afinidade do inibidor, que podem ser comparados com as energias livres de ligação preditas. Além disso, a técnica de ITC pode fornecer também informações sobre contribuições individuais da variação de entalpia e de entropia na energia de ligação, fornecendo a assinatura termodinâmica da proteína86. 1.4.9 - MM-PBSA e variantes O método MM-PBSA é um dos mais utilizados para avaliar de forma aproximada a energia livre de um sistema87. Após a extração de poses representativas e não correlacionadas de uma simulação de DM, processadas para a remoção do solvente e contra-íons, aplica-se a equação 31 〈G〉= 〈EMM〉 - 〈GPBSA〉 - TSMM (3) onde 〈G〉 significa a média das energias, 〈Emm〉 é a média das energias calculadas com o campo de força, definida pela fórmula 〈Emm〉 = 〈Elig〉 + 〈Eang〉 + 〈Etor〉 + 〈EvdW〉 + 〈Eele〉 (4) onde esses termos significam a média da energia de ligação, ângulos de ligação, energia torcional, interações de vdW e energia eletrostática, calculadas por um campo de força conforme exemplificado pela equação (1). O termo GPBSA representa a energia livre de solvatação, calculada pela resolução da equação PB para avaliar a contribuição polar da energia de solvatação, somado a um termo para cálculo da interação apolar (SA)81. A contribuição apolar é devida à necessidade da formação de uma cavidade para o soluto dentro do solvente84, que frequentemente é estimada por um termo proporcional à área de superfície acessível ao solvente do soluto88. Um método alternativo de maior precisão, implementado pelo programa PBSA do AMBER, separa a interação apolar em dois termos, um atrativo (dispersão ou Edisp) e um repulsivo (cavitação ou Ecav)89. O termo TSmm representa a entropia configuracional do soluto, normalmente estimada utilizando a aproximação rigid rotor harmonic oscillator (RRHO), aplicando analises quasi harmonic90 ou modos normais91. Uma variante desse método MM-PBSA utiliza o modelo implícito de solvatação Generalized Born (GB)92, sendo por isso denominada MM-GBSA, que apesar de apresentar um custo computacional reduzido em relação ao PB, apresenta uma aumento de erros considerável em muitos casos93. Uma das principais aplicações deste método é o cálculo de energia livre de ligação de um pequeno composto com uma proteína utilizando a equação 〈∆G〉 = 〈Gcomplexo〉 - 〈Gproteína〉 - 〈Gligante〉 (5) que pode ser calculada utilizando poses extraídas de três simulações separadas, com o complexo proteína-ligante, e com a proteína e o ligante isolados, ou somente da simulação com o complexo, diminuindo o custo computacional, assumindo que a energia livre da proteína e do 32 ligante em complexo é comparável às obtidas por trajetórias isoladas84. Outra simplificação frequentemente utilizada nessa aplicação é o negligenciamento do termo que estima a entropia, que normalmente representa uma pequena porcentagem do valor total da variação de energia livre, principalmente em estudos para estimar a energia de ligação de compostos de tamanho similar a um mesmo alvo proteico84 . Devido à dificuldade de se modelar as interações entre íons metálicos com moléculas orgânicas utilizando de campos de força convencionais, que não consideram a transferência de carga e efeitos de polarização, fenômenos de grande importância para estudo de metaloenzimas, alguns trabalhos tentam estimar a energia de ligação através de métodos híbridos QM/MM em conjunto com a metodologia de MM-PBSA (QM/MM-PBSA), apresentando resultados mais precisos que o método clássico36,37,94. 33 2 - Justificativa Acidentes com serpentes são um sério problema de saúde pública e o único tratamento efetivo para o envenenamento por estes animais em humanos é a administração intravenosa do soro antiofídico. No entanto, esses soros são relativamente ineficientes em reduzir os danos locais e apresentam baixa eficiência no tratamento de acidentes com Bothrops leucurus, espécie de grande importância médica no Brasil. Tendo em vista estas limitações, uma alternativa promissora como terapia complementar à utilização do soro é o desenvolvimento de inibidores de metaloproteases de veneno de serpente (SVMP) com características de fármacos, que pudessem ser utilizados no momento do acidente. Essas enzimas constituem bons alvos terapêuticos porque apresentam papel importante na produção de danos locais e de efeitos hemorrágicos e, por serem proteases, participam também no processo de difusão dos componentes do veneno. Possuem também como vantagem adicional alta eficiência catalítica e estabilidade estrutural por causa da presença de três pontes dissulfeto, sendo por isso bons modelos bioquímicos e, consequentemente, facilitam a produção de dados experimentais. Além disso, por causa da alta similaridade estrutural dessas enzimas, um composto que inibe uma das representantes desse grupo provavelmente também irá inibir as outras enzimas, permitindo a utilização de um número reduzido de estruturas de proteínas na busca por inibidores para todo o grupo. Entretanto, apesar da alta similaridade estrutural e o compartilhamento de inibidores, uma das características mais interessantes desse grupo é a variação na atividade hemorrágica, sem uma correlação estabelecida com as características estruturais. Por isso, neste trabalho escolhemos como modelos de SVMP as enzimas da classe P-I Leuc-a e Atr-I, uma toxina nãohemorrágica e uma hemorrágica respectivamente. Outra vantagem de trabalhar com as SVMP é a similaridade estrutural do sítio catalítico dessas toxinas com as ADAM/ADAMTS e MMP, enzimas de grande importância médica que possuem muitos inibidores conhecidos. Alguns desses compostos possuem a vantagem de terem sido testado previamente em humanos, apresentando efeito colaterais somente depois de uso prolongado, o que não impediria sua utilização em acidentes com serpentes. Aproveitando dessa vantagem, selecionamos seis desses compostos para estudos experimentais e computacionais com as SVMP, que permitiram o desenvolvimento de um protocolo computacional para realizar os cálculos de energia livre de ligação, que pode ser utilizado melhorar a qualidade de resultados 34 de triagem por empregar metodologias mais precisas que as aplicadas normalmente pelos programa de docking. As simulações de DM com esses compostos forneceram também informações sobre quais aminoácidos realizam as principais interações com os inibidores, informação que foi utilizada posteriormente nas análises de agrupamento para a seleção de conformações das toxinas para considerar a flexibilidade das toxinas nos estudos de triagem virtual. Com objetivo de descobrir também novas classes de inibidores, realizamos a primeira etapa da triagem virtual com compostos lead-like utilizando a estrutura da Leuc-a, selecionando compostos para serem empregados posteriormente em uma segunda etapa de triagem com essas conformações das toxinas geradas por DM, seguido pela posterior aplicação dos cálculos de energia livre de ligação para selecionar compostos para os testes in vitro. Desta forma, o projeto proposto emprega técnicas atuais de planejamento de fármacos, associado a validação experimental, para a descoberta de inibidores para as SVMP e dinâmica molecular para identificar variações estruturais que pudessem estar relacionadas com a diferenças na atividade hemorrágica apresentada pelas toxinas desse grupo. Finalmente, devido a parametrização das metodologias computacionais realizadas para modelar o íon Zn2+, acreditamos que o protocolo computacional utilizado nesse trabalho pode ser adaptados para descoberta de inibidores de enzimas importância médica que possuem átomo de zinco no sítio catalítico. 35 3 - Objetivos 3.1 - Objetivos gerais Os objetivos gerais deste trabalho são: • Identificar inibidores para as toxinas SVMPs Leuc-a e Atr-I, proteases provenientes dos venenos das serpentes Bothrops leucurus e Bothrops atrox, respectivamente, através de metodologias computacionais e de cinética enzimática; • Identificar diferenças estruturais das toxinas Leuc-a e Atr-I que possam estar relacionadas com as diferenças na atividade hemorrágica. 3.2 - Objetivos específicos Os objetivos específicos deste projeto são: • Produzir um modelo para a estrutura tridimensional da enzima Atr-I através de modelagem comparativa; • Produzir conformações representativas das toxinas para estudo com inibidores através de simulações de DM; • Identificar diferenças estruturais entre as duas toxinas que possam estar relacionadas com a diferença de atividade hemorrágica através de simulações de DM; • Determinar a capacidade inibitória de inibidores de metaloproteases de amplo espectro sobre a atividade enzimática das duas toxinas através de ensaios de cinética enzimática; • Determinar o modo de ligação mais prováveis dos inibidores identificados in vitro através de docking e de uma função de avaliação desenvolvida nesse trabalho; • Calcular a energia de ligação entre os inibidores de metaloproteases de amplo espectro e as toxinas Leuc-a e Atr-I através das metodologias de MM-PBSA, MM-GBSA e QM/MMPBSA; 36 • Selecionar compostos lead-like através de triagem virtual para uma segunda etapa de triagem utilizando conformações das toxinas obtidas por DM; 37 4 – Metodologia 4. 1 – Modelagem comparativa da toxina atroxlisina-I A estrutura tridimensional da atroxlisina-I foi modelada utilizando o programa Modeller (versão 9v14)50,54. Para isso utilizamos a sequência da toxina, obtida pelo banco de dados UNIPROT95 (UNIPROT ID: P85420), para realizar uma busca por sequências similares no PDB utilizando o programa Blastp96. Após análise dos resultados dessa busca, escolhemos como moldes para a modelagem as seguintes estruturas de SVMPs: acutolisina-A, de Agkistrodon acutus (código PDB 1BSW), BaP1, de Bothrops asper (código PDB 2W15), BmooMPalpha-I, de Bothrops moojeni (código PDB 3GBO) e leucurolisina-a, de Bothrops leucurus (PDB 41QL). Estes moldes foram selecionados baseados nas porcentagens de identidade e de cobertura das sequências e na resolução das estruturas cristalográficas. Posteriormente realizamos o alinhamento da sequência alvo com as sequências dos moldes e das estruturas dos moldes utilizando scripts do MODELLER e construímos mil modelos tridimensionais para a toxina. Selecionamos então cem modelos baseados na pontuação DOPE (Discrete Optimized Protein Energy)54 e os submetemos para nova classificação utilizando o programa ModFOLD4 com a metodologia de agrupamento97. O modelo com melhor pontuação foi posteriormente refinado, através da otimização de duas regiões de alça contendo os resíduos 160-163 e 172-177. Para esta etapa utilizamos somente a estrutura da acutolisina-A (código PDB 1BSW), que apresenta maior similaridade com o alvo nesta região. Após a produção de 100 modelos com diferentes conformações dessas duas alças, as estruturas foram classificadas novamente com o programa ModFOLD4 e o modelo com melhor pontuação foi então validado utilizando os programas ModEval98, Prosa56, Qmean99 e Procheck52. As estruturas utilizadas como moldes foram avaliadas pelos mesmos programas, para verificar se as avaliações obtidas eram semelhantes às obtidas por nosso modelo. 38 4.2 – Cálculos do estado de ionização dos resíduos das toxinas O web-server H++ (versão 3.1)100 foi utilizado para calcular a energia de transferência de prótons e as correspondentes curvas de titulação para todos os aminoácidos ionizáveis utilizando métodos das diferenças finitas para calcular a equação de Poisson-Boltzmann (PB)101. Os valores de pKa dependem significativamente da qualidade da estrutura e da constante dielétrica selecionada para o interior da proteína (εint). Para a leucurolisina-a utilizamos a estrutura cristalográfica depositada no PDB (código 4Q1L, resolução de 1.90 Å) e para a Atr-I utilizamos o modelo final obtido por modelagem comparativa. Os íons Zn2+ e Ca2+, com raios atômicos de 1.0 e 1.7 Å, respectivamente, e carga +2 foram mantidos na estrutura para os cálculos de pKa, enquanto o inibidor endógeno foi retirado da estrutura da Leuc-a. O valor padrão para a constante dielétrica (εint) é 10, sendo considerado apropriado na maioria dos casos. Entretanto, valores menores, como 6 ou 4, são indicados para resíduos localizados no interior de proteína, enquanto valores mais altos são aconselhados para resíduos expostos ao solvente. Portanto, para avaliar de forma consistente a predição dos valores de pKa, foram selecionados valores de εint de 4, 6, 10 e 20 para o cálculo de pKa para todos os resíduos das duas toxinas e realizamos inspeção visual sobre aqueles aminoácidos da estrutura da atroxlisina-I que apresentaram resultados diferentes dos valores padrão, obtidos principalmente por técnicas de NMR102. 4.3 – Seleção de inibidores de metaloproteases de amplo espectro Seis inibidores de metaloproteases de amplo espectro, batimastat (BAT), inibidor de colagenase-I (COL), CP-471474 (CP4), marimastat (MAR), inibidor de metaloprotease de matriz-III (MMP) e prinomastat (PRI) (Figura 3), foram selecionados para avaliação experimental contra a leucurolisina-a e a atroxlisina-I. Foram priorizados compostos desenvolvidos para inibir as enzimas do grupo das ADAM/ADAMTS e/ou MMP, cujos sítios ativos apresentam alta similaridade com os das SVMPs. Utilizamos também como critério a disponibilidade e a potência descrita na literatura para as classes de proteínas citadas acima. Com exceção do COL, todos os outros compostos inibem várias MMP na faixa de nanomolar, e os 39 compostos BAT e MAR também possuem atividades contra algumas ADAM103. Os compostos COL e MMP foram selecionados principalmente por inibirem a atividade proteolítica da Leuc-a (dados não publicados). Figura 3 – Estrutura química dos inibidores de metaloproteases de amplo espectro utilizados nesse trabalho. Os grupos hidroxamatos estão destacados. Figura produzida com o programa MarvinSketch104. 4.4 – Produção de parâmetros para simulações de DM 4.4.1 – Modelos da Leuc-a e Atr-I complexadas com o tripeptídeo QSW 40 A estrutura inicial para da Leuc-a foi obtida da estrutura cristalográfica 4Q1L, com o íon Zn2+ coordenado com os átomos Nε dos resíduos His142, His146 e His152 e apresentando interação bidentada com o grupo carboxilato da região C-terminal do inibidor endógeno Gln-Ser-Trp. Para a Atr-I, utilizamos a estrutura do modelo comparativo criado na etapa anterior, com posterior adição do tripeptídeo Gln-Ser-Trp através do alinhamento do modelo com a estrutura 4Q1L. Os átomos de hidrogênio foram adicionados às estruturas utilizando o programa LEaP, parte do pacote de programas AMBER1474. A versão ff14SB105 do campo de força Amber, versão mais recente do ff99SB106, foi utilizada durante as simulações. Inicialmente os íons Zn2+ e Ca2+ foram representados utilizando parâmetros não-ligados que reproduzem distâncias experimentais entre os íons e oxigênio e o número de coordenação da primeira camada de solvatação107. O modelo TIP3P108 foi utilizado para representar as moléculas de água. 4.4.2 –Definição do estado de protonação de átomos coordenados ao zinco. Para determinar o estado de protonação mais provável do grupo carboxilato do tripeptídeo Gln1-Ser2-Trp3 e do resíduo Glu143, que está a uma distância de ligação de hidrogênio na estrutura 4Q1L (2.6 Å e 3.2 Å entre o oxigênio do grupo carboxilato do Trp3 voltado para o Glu143 e os oxigênios do grupo carboxilato desse resíduo), analisamos diferentes distribuições de cargas do sítio ativo utilizando otimização de geometria com o método semi-empírico QM/MM. Para isso, selecionamos os tipos de resíduos apropriados no processamento da estrutura da Leuca pelo programa LEaP e adicionamos uma esfera de água de 15.0 Å de diâmetro centrada no átomo de zinco. Primeiramente as moléculas de água e os átomos de hidrogênio foram relaxados através de minimização de energia seguido de 100 ps de DM a 300 K, permitindo que somente as moléculas de água se movessem utilizando o programa SANDER do pacote de programas Amber14. Depois realizamos o processo de otimização de geometria QM/MM com o método semi-empírico SCC-DFTB32,109 adicionando parâmetros para o átomo de Zn110 e um termo de correção para efeitos de dispersão33. A região QM foi composta pelos resíduos His142 e Glu143, as cadeias laterais dos resíduos His146 e His152, o íon Zn e o resíduo Trp3 inibidor endógeno, como 41 mostra a Figura 4. Para completar as valências dos átomos da fronteira QM, foi adicionado o grupo Ace (acetil) à His142 e ao resíduo Trp3, Nme (N-metil) à Glu143, e átomos H-link aos carbonos β dos resíduos His146 and His152. Durante a otimização de geometria, somente os átomos QM podiam mover-se até que o RMS do gradiente de energia dos elementos cartesianos fosse menor que 0.02 kcal/(mol Å). Depois desta etapa, as distâncias interatômicas e os ângulos de ligação foram comparadas com a estrutura cristalográfica (Tabela 6). Apesar dos valores indicarem que os estados de protonação Trp3-COO− ····HOOC-Glu143 e Trp3-COOH···· −OOC-Glu143 serem muito próximos dos valores obtidos para a estrutura cristalográfica, decidimos utilizar o primeiro devido à transferência de próton ocorrido do Trp3 para o Glu143, como descrito anteriormente em outros trabalhos72, em consonância com mecanismo de catálise proposto na literatura, que envolve a transferência de próton do substrato para o ácido carboxílico da cadeia lateral do GLU143 (Figura 4). Portanto, as próximas simulações foram realizadas utilizando a configuração Zn-C-Trp3COO− ····HOOC-Glu143. His146 His152 His142 Trp Glu143 Figura 4 – Sobreposição da estrutura cristalográfica (azul) com a estrutura do estado de protonação (marrom) da Leuc-a utilizado nas simulações de DM, produzida com o programa Chimera. O íon Zn+2 está mostrado em cinza. 42 4.4.3 – Produção de parâmetros para o ambiente químico do Zn2+ 4.4.3.1 – Toxinas complexadas com inibidor endógeno Para garantir a preservação da estrutura de coordenação ao redor do íon Zn2+ durante a simulação de DM, foram definidas ligações explícitas entre esse íon e os átomos Nε2 dos resíduos His142, His146 e His152 e dois oxigênios do grupo carboxilato do Trp3 do inibidor endógeno. A geometria de referência, determinada pelos comprimentos e ângulos de ligação, e as cargas dos átomos coordenados ao íon Zn2+ foram obtidas do cluster que corresponde à região QM considerada nos cálculos SCC-DFTB/MM do tópico anterior. A geometria deste cluster foi otimizada utilizando o nível de teoria B3LYP/6-31G*30,111,112 combinada com o modelo de solvente continuo PCM113 (ε=20.0) implementado pelo programa Gaussian0939. As cargas parciais atômicas do cluster foram produzidas em função do potencial eletrostático calculado com o nível de teoria B3LYP/6-31G(d), utilizando o método RESP114. Durante esse procedimento, as cargas dos fragmentos Ace e Nme utilizadas foram obtidas do campo de força ffSB14 e as cargas dos átomos H-link foram zeradas. Os valores de referência dos comprimentos e ângulos de ligação para termos de distorção de comprimentos e ângulos de ligação envolvendo o íon Zn2+ foram extraídos do cluster QM otimizado. A partir desta geometria de referência, foram construídas estruturas modificando seletivamente o comprimento (±0.025, ±0.05, ±0.075 Å) e os ângulos de ligação (±3, ±6, ±9 graus) envolvendo o íon Zn, mantendo o restante da geometria do cluster inalterada. Depois de calcular a energia desse grupo de estruturas utilizando B3LYP/6-31G(d), a constante de força das ligações e ângulos MM foram obtidas através do ajuste da curva gerada por um polinômio de segunda ordem em função da variação de energia. Todos os valores de ângulos torcionais das interações entre o íon Zn e o ligante foram zeradas. Os parâmetros de Lennard-Jones para o íon Zn2+ foram obtidos de Li et al107. Os outros parâmetros e tipos atômicos foram obtidos do campo de força ff14Sb. 43 4.4.3.2 –Toxinas complexadas com inibidores de metaloproteases de amplo espectro De forma semelhante ao descrito no item anterior, foi utilizada a representação ligada do íon Zn2+ nas simulações de DM com os inibidores de metaloproteases de amplo espectro, porém o grupo carboxilato do Trp3 do inibidor endógeno foi substituído pelo grupo hidroxamato, que está presente em todos os compostos utilizados nesse trabalho. Essa mesma substituição foi realizada para calcular os valores de referência dos comprimentos e ângulos de ligação, assim como as constantes de força para os termos de distorção de comprimentos e ângulos de ligação envolvendo o íon Zn2+, que também foram obtidos utilizando os mesmos procedimentos descrito no tópico anterior. Para realizar essa etapa adicionamos ao grupo hidroxamato um fragmento Ace para completar a valência do átomo de carbono. Os cálculos das cargas RESP utilizadas nas simulações de DM foram realizadas como no tópico 4.4.3.1, extraindo os clusters das estruturas selecionadas na etapa de docking (descrita no item 4.6), formados pelos átomos das cadeias laterais dos resíduos His142, His146, His152 e Glu143, do inibidor e do íon Zn2+. Para realizar das simulações dos inibidores isolados em solução, otimizamos as estruturas dos inibidores obtidas do banco de dados ZINC63 e calculamos as cargas RESP considerando a carga global igual a -1. Os tipos atômicos, valores de torção e ângulos impróprios para átomos dos inibidores foram obtidos do campo de força GAFF47, utilizando o programa Antechamber. As otimizações de energia e cálculos das cargas RESP utilizadas para os inibidores nos cálculos de QM-MM-PBSA foram realizados com o método HF/6-31G*, utilizando a estrutura da pose com melhor pontuação obtida pelas simulações de docking para cada complexo toxina/inibidor, e depois utilizadas em todas as outras poses, assumindo que essas cargas são transferíveis para as outras conformações do ligante. 44 4.5 – Simulações de DM 4.5.1 – Toxinas e inibidor endógeno As estruturas iniciais das proteínas em complexo com o inibidor endógeno foram solvatadas em um cubo de água TIP3P com 18 Å de extensão em cada direção além das dimensões da toxina. Para a estrutura da Leuc-a foram necessários 4 íons Cl- para neutralizar o sistema, mas para a estrutura da Atr-I não foi necessário adicionar íons. Utilizamos condições periódicas para simular um sistema contínuo e o método de PME (Particle-Mesh-Ewald) para tratar as interações eletrostáticas de longo alcance com um espaçamento do grid de 1 Å e utilizando um valor de corte 9 Å para cálculo de interações de vdW. As moléculas de água, contra-íons e hidrogênios foram relaxados através de minimização de energia, utilizando um valor máximo de 2500 passos, sendo 500 passos de steepest descent e um valor máximo de 2000 passos de conjugate gradient, seguido de 100 ps de DM a 300 K com o programa SANDER. O sistema inteiro foi em seguida minimizado e aquecido gradualmente a 300 K durante 120 ps de DM (NVT) utilizando um intervalo de tempo de 1.0 fs. Em seguida o sistema foi pressurizado através de 2.0 ns de DM (NPT). A fase de produção possui 250 ns (NVT) e foi realizada com um tempo de integração de 2 fs e utilizando a versão do programa PMEMD para placas GPU (Graphical Processing Units)78. As coordenadas do sistema foram salvas a cada 2 ps. Durante a simulação utilizamos dinâmica de Langevin115 para controlar a temperatura com uma frequência de colisão de 2 ps-1 e o comprimento das ligações entre hidrogênios e outros átomos foram restringidas utilizando o algoritmo SHAKE116. Durante a fase realizada em NPT, a pressão do sistema foi controlada pelo barostato de Monte Carlo, implementado pelo programa SANDER. 4.5.2 – Toxinas e inibidores de metaloproteases de amplo espectro 45 Utilizamos como estruturas iniciais as poses selecionadas pela metodologia de docking (descrita no ítem 4.6) das toxinas com os inibidores de metaloproteases de amplo espectro. Após serem solvatadas em um cubo de água TIP3P com 18 Å de extensão além das dimensões da toxina em cada direção do complexo, foram acrescentados 3 íons Cl- para neutralizar o sistema para as estruturas da Leuc-a, enquanto para as estruturas da Atr-I foi necessário adicionar apenas um íon Na+. As outras etapas dessas simulações foram as mesmas utilizadas com as toxinas complexadas com o tripeptídeo. Nas simulações dos inibidores isolados em solução utilizamos as estruturas iniciais obtidas das otimizações de geometria, realizando a solvatação em um cubo de água TIP3P com 18 Å de extensão além das dimensões do composto em cada direção. Foi adicionado um íon de Na+ para neutralizar o sistema. As outras etapas dessas simulações de DM foram as mesmas utilizadas para os complexos toxinas-inibidores. 4.6 - Docking dos inibidores de metaloproteases de amplo espectro Essa etapa do trabalho foi realizada pelo Dr. Dimas Suarez e pela Dra. Natalia Diaz. Para introduzir flexibilidade da proteína no procedimento de docking, foram selecionadas 50 poses de cada simulação de dinâmica das toxinas em complexo com o tripeptídeo. Depois foram removidas a molécula do inibidor, as águas e os contra-íons, mantendo os íons Zn2+ e Ca2+, em cada uma delas. As estruturas iniciais dos inibidores BAT, COL, MAR, MMP e PRI foram obtidas do banco ZINC. Para fazer a docagem dos inibidores no sítio ativo das toxinas, foi utilizado o programa AutoDock4117, que emprega a técnica de Monte Carlo e simulated annealing para explorar as configurações dos complexos proteína/ligante com uma função de avaliação de energia que calcula as contribuições de energias de vdW, eletrostáticas e de solvatação. Os valores padrão dos parâmetros do Autodock118 foram utilizados, com exceção das cargas atômicas do íon Zn2+ e dos átomos coordenados com este íon, que foram modificados para produzir uma geometria de coordenação entre o Zn2+ e o grupo hidroxamato dos inibidores próxima das obtidas nas estruturas cristalográficas, seguindo estratégia similares de outros trabalhos que visavam 46 aumentar a acurácia do campo de força do Autodock para enzimas contendo átomo de zinco119,120. Foi utilizada a carga de +1.25 para o átomo de zinco, que corresponde à sua carga RESP, estimada em função do potencial eletrostático calculado pelo método B3LYP/6-31G(p) com o programa Gaussian09. Para preservar a integridade da carga do cluster, uma carga de +0.75 foi uniformemente distribuída nos resíduos His142, His146 e His152, coordenados com o átomo de zinco. A cadeia lateral do resíduo Glu143 foi neutralizada pela adição de um átomo de hidrogênio e selecionando as cargas Gasteiger apropriadas para o grupo carboxílico. Da mesma forma, o grupo hidroxamato foi modelado na sua forma aniônica. O modo de ligação desse grupo está de acordo com o modo de ligação adotado por outros inibidores que possuem o grupo hidroxamato e ácidos carboxílicos como ZBGs (zinc binding groups)121. 4.6.1 – Cálculos de reavaliação das poses de docking Para avaliar com maior rigor as poses produzidas pelo Autodock, foi realizada a reclassificação das mesmas através da otimização de geometria MM e QM/MM seguido por cálculos single-point QM/MM-PBSA para estimar a energia de interação entre as toxinas e os ligantes. Nesses cálculos, o sistema foi representado pelo campo de força Amber, versão ff14SB, e os íons Zn+2 e Ca+2 foram representados pela forma não-ligada desenvolvida por Li et. al.. Para as moléculas do ligante, foram gerados parâmetros MM automaticamente com o programa antechamber76 do AmberTools14, utilizando o campo de força GAFF com as cargas atômicas calculadas pelo método HF/6-31G(d), com o programa Gaussian09. Os cálculos QM/MM foram realizados com a metodologia SCC-DFTB, adicionando parâmetros para o íon Zn+2. A região QM foi formada pelos resíduos His142 e Glu143 ligados a grupos Ace e Nme, respectivamente, pelas cadeias laterais dos resíduos His146 e His152, ligados a átomos H-link no carbono alfa, pelo íon Zn e pelo grupo hidroxamato dos inibidores. Cada pose foi otimizada movendo o cluster, o restante da molécula do inibidor e os resíduos próximos do cluster (105-111, 166-171, 138-139 e 176) durante 500 ciclos de minimização MM utilizando o algoritmo de gradiente conjugado, seguido por 500 ciclos de minimização QM/MM com valor dielétrico dependente da distância de ε=4r para avaliar a 47 influência do solvente e com um valor de corte de 20.0 Å para interações não-ligadas. Posteriormente cálculos single-point QM/MM na fase gasosa sem valor de corte foram realizados com os complexos toxinas/ligantes, com a toxina e com o inibidor isolado utilizando a geometria otimizada do complexo toxina-inibidor. De modo similar, a energia de solvatação do complexo e dos solutos separados foi calculada com o programa PBSA incluído no AmberTools14, utilizando a equação Poisson-Boltzmann não-linear e utilizando as cargas e raios atômicos do campo de força ffSB14, com exceção das cargas dos átomos localizados na região QM utilizada nos cálculos QM/MM, para os quais foram utilizadas cargas Mulliken. As cargas dos átomos H-link foram distribuídas igualmente para o resto dos átomos QM. A equação PB foi calculada utilizando uma rede cúbica pelo método iterativo das diferenças finitas, com um espaçamento de 0.33 Å. A fronteira dielétrica considerada foi a superfície de contato entre o raio do soluto e raio de uma molécula de água (1.4 Å) utilizada como sonda. A contribuição nãopolar da energia livre de solvatação foi estimada utilizando dois termos, o termo de dispersão e o termo de cavitação, implementados pelo programa PBSA. Para classificar as poses de docking utilizando uma função de avaliação mais acurada, combinamos primeiramente a energia da fase gasosa calculada pelo método SCC-DFTB com a energia de solvatação PBSA da pose i-ésimo de cada frame j-ésimo, utilizando a fórmula (6) ! onde X= SVMP/inibidor, SVMP e inibidor. Depois cada pose determinada pelo índice (i, j) foi reclassificada pela expressão: ! (7) onde o índice ∆intG é a energia de interação SVMP/inibidor, e os dois termos em colchetes estimam a contribuição da energia de distorção para a estabilidade relativa das poses, resultante de alterações na geometria interna do inibidor e do fragmento da toxina. Para avaliar os efeitos de distorção, a energia média de cada inibidor foi calculada para todas as poses com as duas 48 toxinas, mas o termo correspondente para a toxina é a média das poses de docking, obtidas das simulações de cada pose de DM com todos os inibidores. 4.7 – Análises das trajetórias das simulações de DM 4.7.1 - Toxinas e inibidor endógeno Os cálculos de RMSD, que medem o deslocamento médio dos átomos durante a simulação, e as estruturas médias foram obtidas utilizando o programa CPPTRAJ do Amber 14, enquanto as ligações de hidrogênio e contatos vdW entre as toxinas e o tripeptídeo Gln1-Ser2-Trp3, ou os inibidores de metaloproteases de amplo espectro foram analisados utilizando um programa específico desenvolvido pelo Dr. Dimas Suarez. As ligações de hidrogênio foram caracterizadas por critérios geométricos (e.g., distância X···Y < 3.5 Å e ângulo X-···Y > 120 o). As interações hidrofóbicas foram calculadas utilizando o termo DFTB de dispersão/atração entre átomos que compõem grupos hidrofóbicos distintos. Os critérios utilizados para avaliar essas interações foram: a) a energia de dispersão é maior que 0.5 kcal/mol em valor absoluto; b) a distância entre os centros de massa dos grupos interagentes é menor que 12 Å. As análises de agrupamento foram realizadas com 2500/1500 poses das simulações com Leuc-a/Atr-I, respectivamente, baseado nas coordenadas dos átomos da cadeia principal da alça Ω (resíduos 148-179) utilizando MMTSB-tools122. Utilizamos um número menor de poses da simulação com a Atr-I devido ao tempo necessário para a estabilização do RMSD, determinado após inspeção visual do gráfico da Figura 7. O algoritmo k-mean foi empregado utilizando os valores de RMSD dos ângulos de torção da cadeia principal com um raio fixo de cluster de 30o. Os centróides de cada cluster, que representam a estrutura central de cada grupo, foram utilizadas para representação visual. Também realizamos o agrupamento com o programa CPPTRAJ sobre essas mesmas poses utilizando os valores de RMSD dos átomos pesados dos aminoácidos que interagem com os inibidores de amplo espectro (Tópico 5.3.3.2). Os parâmetros para essa análise foram retirados da referência123, utilizando agrupamento hierárquico com o método de ligação averagelinkage, 49 alterando somente o valor de Ɛ, relacionado com o momento que deve parar o processo, que termina quando a distância mínima entre os agrupamentos é maior do que épsilon. Foram considerados diferentes valores para encontrar um resultado que agrupasse mais de 50% das poses utilizadas na análise nos primeiros 4 grupos e para que nenhum dos grupos possuísse mais de 35% das poses. Para a Leuc-a foi utilizado um valor de 1Å e para a Atr-I utilizamos 0.825Å. 4.7.2.1 - Cálculos de energia livre de ligação - toxinas e inibidores de amplo espectro Para realização dos cálculos de energia livre de ligação utilizamos a metodologia de MMPBSA, além de duas variações da mesma, MM-GBSA e QM/MM-PBSA. As toxinas foram representadas pelo campo de força ffSB14, com adição dos parâmetros para os íons Zn2+ e Ca2+ 107 e os ligantes pelo campo de força GAFF, utilizando cargas atômicas obtidas pelo procedimento RESP através do potencial eletrostático calculado para os inibidores isolados, como descrito no tópico 4.4.5.1. Foram extraídas 2500 poses em intervalos de 100 ps de cada simulação de DM para a realização desses cálculos, seguido da remoção das moléculas de água e contra-íons. Nesta etapa utilizamos arquivos de topologia sem ligação explícita entre o íon Zn2+ e os inibidores. Os cálculos foram realizados utilizando todas as poses ou somente 1500 poses (60%) extraídas dos dois terços finais das trajetórias. A energia livre (G) dos complexos e dos inibidores e toxinas isoladas foram calculadas utilizando as poses extraídas uma mesma trajetória de DM para minimizar a incerteza estatística124. Cada valor de G é compostos por dois termos: G = E + ΔGsolv (8) onde E é a energia em vácuo e ∆Gsolv é a energia de solvatação. E é calculada a partir de cálculos MM com e programa SANDER. A energia de solvatação é calculada a partir de um termo que estima a energia eletrostática de solvatação obtida pelos métodos generalizado de Born (GB) ou de Poisson-Boltzmann (PB), complementado pelos termos de dispersão e de cavitação para parte apolar da energia de solvatação calculado programa PBSA. As cargas atômicas usadas nos 50 cálculos PBSA foram as mesmas utilizadas na DM. A contribuição eletrostática da energia livre de solvatação PBSA foi determinada com o método de PB não linear (PBNL), que representa o soluto como um meio dielétrico fraco, com valor de Ɛint=1 com cargas incorporadas, e o solvente como um meio dielétrico forte, com valor de Ɛint=80 sem a presença de íons. As cargas e os raios atômicos foram os mesmos descritos na produção de parâmetros. O programa PBSA foi utilizado para calcular a equação de PB ( não-linear) com um espaçamento da malha de 0.33 Å. Para realizar os cálculos de G usando a aproximação QM/MM-PBSA, além da minimização de energia do complexo utilizando somente MM, realizamos posteriormente uma minimização de energia da região QM através de QM/MM utilizando o método SCC-DFTB, seguido do teste de convergência SCF e descarte das poses que não passaram no teste. Após essa etapa a energia do complexo foi calculada através de cálculos single-point, que combinam os valores de energia da fase gasosa, calculada através do método SCC-DFTB/MM, e a energia de solvatação, calculada pelo método PBNL para a parte eletrostática e pelos termos de dispersão e de cavitação para parte apolar. Nos cálculos PB foram utilizadas cargas Mulliken para os átomos da região QM. As cargas dos link atoms foram distribuídos entre os átomos da região QM para preservar a integridade das cargas do cluster. 4.7.2.2 – Função de pontuação aplicada às poses extraídas das simulações de DM Os parâmetros empregados para os inibidores utilizados nessa etapa estão descritos no tópico 4.4.5.3 e os cálculos de energia foram realizados com o métodos MM-PB(GB)SA o QM/MM-PBSA descritos na seção anterior. A média dos valores de GMM-PBSA dos diferentes sistemas (complexo, receptor/toxina, e inibidor sozinho) pode ser utilizados para estimar a energia livre de ligação: ΔGlig = Gcomplexo − Ginibidor − Greceptor (9) 51 Como esta função não avalia as contribuições entrópicas e as energias de distorção dos ligantes e dos receptores, utilizamos uma função de avaliação elaborada pelo Dr. Dimas Suarez definida pela fórmula Trunc. " Trunc. # Gavaliaçâo (i ) = ΔGlig (i ) + ΔGdist inibidor (i ) + %G receptor (i ) − G receptor & ' ( Trunc . Trunc . receptor # * ) " receptor − T + Δ conform S inibidor (i ) + Δ rot −trans S inibidor (i ) + % Sconform (i ) − Sconform & , ' (. - (10) onde ∆ligG(i) é a energia de ligação, ∆Gdistinibidor(i) é a energia de distorção do inibidor, Gtrunc.receptor é a energia da toxina da forma truncada, G trunc.host(i) é a energia média da forma truncada da toxina com todos os inibidores, T é a temperatura em Kelvin, ∆conformSinibidor(i) é a entropia conformacional do ligante, ∆rot-transSinibidor(i) é a mudança de entropia rotacional e translacional do inibidor, Strunc.hostconform(i) é a entropia conformacional da toxina, !trunc.receptorconform(i) é a média da energia conformacional da toxina em complexo com todos os inibidores. Essa função de avaliação permite a comparação entre as poses de diferentes simulações e entre diferentes complexos toxinas-inibidores. A utilização do fragmento da toxina nesses cálculos ao invés de toda a proteína tem como objetivo diminuir a estimativa de erro dos cálculos sobre a contribuições de distorção e entrópica do processo de ligação. A entropia conformacional foi calculada pelo programa CENCALC, utilizando o método AMIE (Approximate mutual information expansion)125. Esses cálculos também foram realizados utilizando o ligante em conjunto com a região truncada das toxinas, que é formada pelos os resíduos mais próximos do ligante, compostos pelos segmentos 101 a 112 (folha-β), 123 a 128 (folha-β), 133 a 148 (α-hélice) e os 148 a 177 (alça Ω). Os cálculos dos termos ∆rot-transSinibidor foram realizadas com as fórmulas propostas por Aqvist126. 52 Figura 5 – Estrutura da Leuc-a destacando, em ribbon, as regiões utilizadas nos cálculos de entropia conformacional. O íon Zn+2 está mostrado em cinza. Figura produzida com o programa Chimera. 4.8 – Cálculos do potencial eletrostático O potencial eletrostático dos modelos Leuc-a/Atr-I em solução foram calculados para as conformações extraídas das trajetórias de DM utilizando o programa APBS127. Nos cálculos PB foram utilizadas somente os átomos das toxinas e do inibidor, sendo que as cargas e os raios atômicos foram obtidos do campo de força ff14SB. A equação de PB linear foi calculada em uma rede cúbica utilizando método das diferenças finitas, com espaçamento da grade de 0.33 Å e a fronteira da rede foi ajustada de acordo com o potencial Debye-Hückel. A fronteira dielétrica 53 foi a superfície de contato entre o soluto e uma esfera de água com raio de 1.4 Å. O potencial eletrostático foi representado na superfície molecular das toxinas utilizando o programa MSMS128 e visualizado com o programa Chimera129. 4.9 – Análises de cavidades O tamanho e a forma do bolso hidrofóbico S1’ foram monitorados durante a simulação de DM utilizando o programa MDPOCKET130, que utiliza o algoritmo de detecção de cavidades implementado pelo programa FPOCKET131. Para as trajetórias da Leuc-a foram avaliadas 5000 poses da DM igualmente espaçadas, enquanto para as da Atr-I foram utilizadas 3500, das quais foram retiradas as moléculas de água, contra-íons e o inibidor endógeno. As estruturas foram alinhadas com a estrutura média produzida com os últimos 50 ns da DM, utilizando os átomos da cadeia principal. Para cada pose, o programa FPOCKET utiliza um conjunto de esferas α geradas utilizando os parâmetros geométricos padrão para detecção de sítios de ligação para pequenos ligantes. Cada esfera α é uma esfera que não possui átomos no seu interior e está em contato com exatamente 4 átomos equidistantes do seu centro. Se esses átomos estiverem no mesmo plano formam uma esfera de raio infinito, enquanto 4 átomos agrupados nos vértices de um tetraedro delimitam um esfera com raio próximo ao valor dos raios de vdW dos átomos envolvidos. Esferas α dentro de cavidades pequenas possuem raios muito pequenos, enquanto esferas na superfície apresentam raios muito grandes. Portanto, é possível determinar sítios de ligação selecionando esferas com raios de comprimentos intermediários. Primeiramente o programa MDPOCKET cria uma rede tridimensional sobre a estrutura de referência de modo que as esferas α criadas em cada pose são associadas às esferas mais próximas criadas sobre a estrutura de referência. Depois disso as esferas de um grupo que determina um possível sítio de ligação são ponderadas em relação aos valores de frequência φ, que indicam se um determinado ponto é permanentemente acessível (φ=1), inacessível (φ=0), ou parcialmente acessível (0<φ<1). A visualização do mapa de frequência e da estrutura da proteína permite selecionar o conjunto de esferas que caracterizam o bolso S1’. Posteriormente, uma segunda rodada de utilização do MDPOCKET focando nas esferas selecionadas produziu informação específica sobre o volume e a plasticidade do bolso S1’. 54 4.10 – Cinética enzimática As toxinas atroxlisina-I e leucurolisina-a foram purificadas como descrito anteriormente4,7 e fornecidas pelo Dr. Eladio Sanchez. Os inibidores BAT, CP4, MAR e PRI foram obtidos da Sigma, enquanto os inibidores COL e MMP foram obtidos da Biosan. Para realizar os testes de cinética enzimática, incubamos as toxinas, na concentração final de 2nM, solubilizadas em tampão Tris-Hcl 50mM, pH 7,4, com 1mM de CaCl2, com os inibidores de metaloproteases de amplo espectro, em diferentes concentrações por 30 minutos, com 40µL por poço, em placas de 96 poços. Depois adicionamos 40uL da solução do peptídeo AbzLVEALYQ-EDDnp em cada poço, com concentração final de 65µM, solubilizado no mesmo tampão utilizado para as toxinas. Imediatamente após a adição do substrato a hidrólise foi monitorada por fluorescência em um equipamento Synergy Biotek 2, durante dois minutos a 37°C, utilizando o filtro de λex=340nm e λem=440nm. O cálculo da velocidade inicial da reação foi calculada utilizando a leitura do primeiro minuto, determinando-se a porcentagem de inibição a partir de comparação com um controle contendo a mesma concentração de DMSO ou etanol encontrado na solução do inibidor. Em cada ensaio para determinação de IC50 foram avaliadas no mínimo 5 concentrações de inibidor, realizados em triplicata, utilizando o programa GraphPad Prism132. 4.11 – Triagem virtual Uma base de dados de aproximadamente 3.000.000 compostos lead-like comercialmente disponíveis do banco de dados ZINC63 foi empregada na triagem virtual utilizando o programa Autodock Vina. Utilizamos o programa MGLTools133 para preparar a estrutura da Leuc-a, acrescentando hidrogênios, definindo os tipos atômicos e as cargas parciais para os átomos. Os ligantes foram preparados através da utilização de scripts obtidos no sítio do programa Autodock. A triagem foi realizada tratando a toxina como uma estrutura rígida, empregando as 55 coordenadas cristalográficas. A região da toxina utilizada para as simulações foi um cubo de 22Å de aresta centrado no átomo de zinco do sítio ativo. Foi utilizado valor padrão do programa para os parâmetros dessas simulações. Também selecionamos as conformações representativas dos 4 agrupamentos mais populosos da Atr-I e Leuc-a que foram obtidos da simulações de DM como descrito no tópico 4.7.1, para serem utilizadas futuramente em uma segunda fase de triagem virtual com 5% dos compostos lead-like melhor classificados na triagem inicial. 4.12 – Análise de estruturas As estruturas das moléculas foram analisadas utilizando os programas Chimera129, Molden134, PyMOL23, VMD135 e Chemdraw14136. 4.13 – Análise estatísticas As análises estatísticas foram feitas com o programa Octave137e R138. 56 5 - Resultados 5.1 - Modelagem Comparativa O modelo tridimensional da atroxlisina-I foi gerado com o programa MODELLER, utilizando como moldes quatro estruturas de toxinas: acutolisina A, BaP1, BmooMPalpha-I e leucurolisina-a, que apresentam 67%, 56%, 54% e 52% de identidade de sequência com o alvo. Figura 6 – Alinhamento das sequências da Atr-I e das toxinas utilizadas como moldes para a modelagem comparativa realizado pelo programa Clustal Omega. As porcentagens indicam a identidade entre as sequências com a Atr-I. A escolha dos moldes foi baseada também na cobertura de sequência e na resolução das estruturas cristalográficas, em todos casos melhor que 2Å. As principais características dos moldes estão apresentados na Tabela 2. 57 Toxina PDB Resolução (Å) Identidade de sequência Comprimento (aa) Atividade Hemorrágica Organismo de origem Acutolisina-A 1BSW 1.95 67% 197 sim Agkistrodon acutus BmooMPalpha-I 3GBO 1.77 56% 200 não Bothrops moojeni BaP1 2W15 1.05 57% 202 sim Bothrops asper Leucurolisina-a 4Q1L 1.80 52% 202 não Bothrops leucurus - - - 202 sim Bothrops atrox Atroxlisina-I Tabela 2 – Características principais da atroxlisina-I e dos moldes utilizados para modelagem comparativa. Após realizar uma inspeção visual do modelo obtido na etapa da modelagem, observamos que a cadeia lateral da Lis176, localizada na alça 149-178, estava quase completamente enterrada em uma região hidrofóbica que não permitia interações polares. Entretanto, a estrutura cristalográfica da acutolisina-a, que apresenta maior similaridade de sequência com a Atr-I nessa região quando comparada com os outros moldes, apresenta um resíduo de Lis na mesma posição, cuja cadeia lateral está totalmente acessível ao solvente. Portanto, decidimos refinar a estrutura da alça da região 172 a 177 utilizando o programa MODELLER e somente a estrutura da acutolisina-a como molde. Outros 1000 modelos foram gerados nesta etapa e os 100 melhor avaliados pela pontuação DOPE foram classificados novamente com ModFOLD4, que está entre os principais métodos de avaliação de qualidade na versão mais recente do evento Critical Assessment of protein Structure Prediction (CASP)97. Após isso, o modelo selecionado foi analisado pelo programa PROCHECK para avaliar as características estereoquímicas, mostrando que 91% (163aa) dos resíduos estão na região mais favorável do Gráfico de Ramachandran, 8,4% (15aa) estão em regiões permitidas e 0,6% (1aa) estão em regiões generosamente permitidas, resultado similar aos obtidos para as estruturas dos moldes (Figura 7). A pontuação geral do programa foi 0,02, indicando alta qualidade estereoquímica do modelo. 58 Figura 7 – Gráficos de Ramachandran dos moldes utilizados na modelagem comparativa, identificados pelo código do PDB, e do modelo da Atr-I produzidos pelo programa PROCHECK. A qualidade do modelo foi avaliada também pelos programas ModEval139, Prosa56 e QMEAN99 (Tabela 3). Como pontuações do ModEval menores que -1 indicam que a estrutura avaliada possui características próximas das experimentais, a pontuação obtida indica que o modelo da atroxlisina-I possui uma boa qualidade, assim como a pontuação obtida pelo QMEAN, com valor de z score próximo de 0. 59 Toxina ModEval (z-DOPE) Prosa Qmean a Acutolisina-A -2,26 -8,05 0,776 (0,19) BmooMPalpha-I -2,31 -7,47 0,762 (-0,44) BaP1 -2,33 -7,34 0,786 (-0.08) Leucurolisina-a -2,40 -7,48 0,727 (-0,38) Atroxlisina-I -2,08 -8,18 0,780 (-0,11) Tabela 3 - Pontuações dos programas de avaliação ModEval, Prosa e Qmean obtidas pelo modelo selecionado da Atr-I e dos moldes utilizados na modelagem comparativa. a Os z scores estão em parênteses. O programa Prosa foi utilizado também para avaliar a qualidade local do modelo, considerando a energia de interação de cada resíduo. Utilizando uma janela de 10 resíduos de comprimento, o resultado mostrou que a grande maioria dos resíduos com valores de interação de energia negativa, e somente 9 resíduos com interação positiva de energia, fornecendo evidência adicional da boa qualidade do modelo. A pontuação obtida pelo Prosa é semelhante às obtidas para a proteínas de tamanho similar determinadas por cristalografia por raios-x ou NMR, como mostra a Figura 8. Figura 8 – Avaliação da qualidade local (a) e global (b) do modelo da Atr-I produzida pelo programa Prosa. O gráfico em (b) apresenta as pontuações obtidas pelas estruturas do PBD, com a cores indicando a metodologia experimental utilizada para produzir a estrutura, azul para raios x e cinza para NMR. 60 A Figura 9, produzida pelo programa VMD135, mostra o alinhamento estrutural das toxinas Atr-I e Leuc-a coloridas por similaridade utilizando a matriz BLOSUM60, evidenciando a alto índice de similaridade estrutural e de sequência entre essas toxinas. Figura 9 - Alinhamento estrutural das toxinas Atr-I e Leuc-a coloridas por similaridade utilizando a matriz BLOSUM60 produzida com o programa VMD. As regiões com coloração azul indicam áreas conservadas, e as áreas menos conservadas possuem coloração gradativas em direção ao vermelho. 5.2 - Cálculos de pKa A Tabela 4 contêm os valores de pKa calculados utilizando o programa H++, para as toxinas Leuc-a e Atr-I em sua forma nativa, com valores de 4, 6, 10 e 20 para Ɛint . Os valores de pKa para a Leuc-a não variam drasticamente com a variação dos valores de Ɛint, e portanto o 61 estado de protonação dos resíduos tituláveis podem ser estabelecidos com segurança em pH 7. Os resíduos com maior variação de pKa com relação aos valores padrão são His158 (7,8-7,4) e Lis172 (8,2-9,3). Esses dois resíduos estão localizados na superfície da proteína na estrutura cristalográfica e suas cadeias laterais não estabelecem contatos significativos com outros aminoácidos, ou seja, estão completamente acessíveis ao solvente. Nesse cenário, os valores de pKa obtidos com Ɛint=20 podem ser mais precisos com esses dois resíduos e eles foram modelados como neutro e positivamente carregado, respectivamente. Os outros valores de pKa da Tabela 4 permitem concluir que os resíduos Asp e Glu são carregados negativamente, enquanto os resíduos Arg e Lis continuam positivamente carregados em pH 7. Todas as cisteínas que não participam da formação de pontes dissulfeto, tirosinas e histidinas devem ser modeladas com cadeia lateral neutra, protonadas no átomo Nδ para as His142, His146, His152, ou Nɛ para as outras histidinas. Também notamos que o valor estimado de pKa para o Glu143 na ausência do tripeptídeo varia em torno de 1.4-2.2, sugerindo que a forma desprotonada, com carga negativa, é a principal na enzima. Apesar disso, escolhemos a carga neutra para esse resíduo de importância catalítica para as simulações de DM, cujo grupo carboxilíco está a uma distância de aproximadamente 3Å do grupo carboxilíco do Trp do tripeptídeo, com base em cálculos semiempíricos QM/MM preliminares realizados na presença do ligante Gln-Ser-Trp, como descrito no tópico 4.4.2. De modo similar, o cálculo de pKa para as His142, His146 e His152 resultou em valores muito baixos, o que está de acordo com o papel desses resíduos de se ligarem ao átomo Zn2+. No caso da Atr-I, os valores de pKa calculados para os resíduos Glu3, Asp15, His92 ,Asp102, Lys120, , e Asp133 apresentam variações significativas (desvio padrão maior que 1.9 ou valor de pKa em Ɛint=4 com diferença maior que 1.9 do valor padrão) com a mudança de Ɛint, como mostra a Tabela 4. A maioria desses resíduos está localizada na superfície da proteína, estando portanto com as cadeias laterais acessíveis ao solvente. Portanto, os valores de pKa obtidos com Ɛint=4 podem ser descartados e os valores de pKa restantes podem ser considerados compatíveis com o estado de protonação padrão em solução aquosa. As únicas exceções são os resíduos Glu3 e Asp15, que estão parcialmente inacessíveis ao solvente, e portanto os valores de pKa obtidos com valor de Ɛint=4 podem ser significativos. Entretanto, essa orientação desses resíduos está provavelmente relacionada com a qualidade do modelo nessas áreas, porque nenhuma interação estabilizante para as cadeias laterais dos resíduos Glu3 e Asp15 com outros 62 resíduos é observada, e o relaxamento da estrutura, ocorrida principalmente durante os primeiros 100 ns da simulação de DM, resulta em uma orientação mais acessível ao solvente sem alterar a estrutura global da enzima. Consequentemente, todos os resíduos ionizáveis da Atr-I, com exceção do Glu143 e das cisteínas envolvidas na formação de pontes dissulfeto, foram modelados com seu estado de ionização padrão em pH 7, com os Asp e Glu carregados negativamente, Arg e Lis carregados positivamente, His, Tir e a Cis186 da Atr-I com carga neutra. Resíduos N-term Glu1 Arg6 Tir7 Glu9 Asp15 His16 Lis20 Lis21 Tir22 Arg30 Lis31 His34 Glu35 Arg45 Asp50 Glu57 Lis61 Lis62 Asp63 Lis66 Glu68 Lis69 Asp70 Lis73 Glu80 Arg82 Glu83 Arg84 Asp85 Arg89 His92 ε int=4 6.2 3.6 >12.0 >12.0 <0.0 <0.0 6.8 10.2 >12.0 >12.0 11.7 10.3 5.9 4.0 >12.0 3.0 1.3 10.2 11.0 3.0 10.7 5.4 >12.0 1.0 11.4 1.8 >12.0 5.1 >12.0 0.2 >12.0 <0.0 Leuc-a ε int=6 6.7 3.6 >12.0 >12.0 <0.0 <0.0 6.7 10.3 >12.0 >12.0 11.8 10.4 6.1 3.8 >12.0 3.0 1.7 10.2 10.9 2.7 10.8 4.9 >12.0 1.5 11.4 2.3 >12.0 5.0 >12.0 1.1 >12.0 <0.0 ε int=10 ε int=20 7.1 7.5 3.7 3.7 >12.0 >12.0 11.4 10.3 <0.0 1.0 <0.0 0.2 6.7 6.6 10.3 10.4 >12.0 11.9 >12.0 >12.0 11.9 >12.0 10.4 10.5 6.1 6.2 3.6 3.4 >12.0 >12.0 2.8 2.7 1.7 2.0 10.3 10.3 10.7 10.6 2.4 2.1 10.8 10.8 4.4 4.0 >12.0 11.7 1.9 2.3 11.4 11.5 2.8 3.0 >12.0 >12.0 4.8 4.4 >12.0 >12.0 1.5 2.0 >12.0 >12.0 1.3 5.2 Resíduos ε int=4 N-term 6.9 Glu3 11.6 Arg6 >12.0 Tir7 11.8 Asp9 1.4 Asp15 8.4 His16 6.2 Lis21 >12.0 Tir22 >12.0 Asp27 1.1 Lis28 10.0 Arg30 11.9 Arg31 >12.0 Arg32 >12.0 His34 5.4 Lis41 11.3 Glu42 0.9 Tyr44 >12.0 Tir48 10.9 Asp50 3.4 Glu57 1.2 Lis62 11.0 Asp63 0.6 Asp76 4.9 Glu80 4.0 Arg82 >12.0 Lis83 9.7 Asp85 2.3 Arg89 >12.0 Lis90 10.0 His92 <0.0 Asp93 <0.0 Atr-I ε int=6 7.0 9.0 >12.0 11.1 1.6 4.9 7.3 >12.0 >12.0 1.5 10.1 11.9 >12.0 >12.0 5.7 11.3 1.7 >12.0 10.8 3.3 1.4 10.9 1.4 4.4 4.1 >12.0 10.0 2.5 >12.0 10.1 <0.0 <0.0 ε int=10 7.3 7.0 >12.0 10.5 0.9 3.8 7.2 >12.0 >12.0 1.8 10.2 12.0 >12.0 >12.0 6.2 11.4 2.3 >12.0 10.6 3.1 1.2 10.9 2.2 3.9 4.2 >12.0 10.2 2.4 >12.0 10.2 3.9 <0.0 ε int=20 7.4 5.4 >12.0 10.1 1.4 2.7 7.1 >12.0 11.5 2.1 10.4 >12.0 >12.0 >12.0 6.4 11.4 2.8 >12.0 10.5 3.0 1.8 10.8 2.8 3.5 4.1 >12.0 10.4 2.5 >12.0 10.3 5.7 <0.0 63 Asp93 His94 Asp104 Glu105 Glu106 Tir112 Asp118 Asp128 His129 Lis131 Lis132 Arg135 His142 Glu143 His146 Arg151 His152 Asp153 His158 Asp168 Lis172 Glu177 Asp180 Tir186 Tir189 Lis192 His193 Lis201 C-term <0.0 <0.0 4.6 4.2 4.4 >12.0 1.7 <0.0 2.9 10.2 9.6 11.9 <0.0 3.2 <0.0 >12.0 <0.0 1.5 7.8 3.6 8.2 5.4 2.7 >12.0 >12.0 10.1 5.9 10.7 3.8 <0.0 <0.0 4.0 4.6 4.3 >12.0 2.2 <0.0 4.5 10.2 9.8 >12.0 <0.0 2.2 <0.0 >12.0 <0.0 2.0 7.7 3.5 8.6 5.0 2.9 >12.0 >12.0 10.2 6.1 10.8 3.7 <0.0 4.2 3.6 4.6 4.2 >12.0 2.4 <0.0 5.3 10.2 9.9 >12.0 <0.0 1.4 <0.0 >12.0 <0.0 2.3 7.5 3.5 8.9 4.7 3.0 >12.0 >12.0 10.2 6.2 11.2 3.6 <0.0 6.0 3.4 4.6 4.2 11.0 2.6 0.5 5.8 10.2 10.0 >12.0 <0.0 1.4 <0.0 >12.0 <0.0 2.4 7.4 3.4 9.3 4.4 3.1 >12.0 11.7 10.3 6.3 11.5 3.5 Asp102 Tir112 Asp118 Lis120 Arg121 Asp128 His129 Glu131 Asp133 His142 Glu143 His146 His152 Asp153 Tir162 His172 Glu173 Lis176 Tir177 Asp180 Tir183 Cis186 Asp188 Lis192 Glu193 Lis201 Arg202 C-term 6.1 >12.0 0.4 1.6 >12.0 <0.0 5.5 3.5 7.7 <0.0 2.9 <0.0 <0.0 5.5 10.1 6.2 3.6 >12.0 >12.0 1.7 >12.0 >12.0 5.2 >12.0 4.2 9.8 >12.0 <0.0 5.5 >12.0 1.0 10.8 >12.0 <0.0 6.7 3.5 5.6 <0.0 2.7 <0.0 <0.0 4.8 10.0 6.3 3.7 12.0 >12.0 2.3 >12.0 >12.0 4.6 11.9 4.3 10.1 >12.0 <0.0 5.0 11.8 1.2 11.1 >12.0 <0.0 7.2 3.5 4.2 <0.0 2.5 <0.0 <0.0 4.1 10.0 6.4 3.8 11.9 >12.0 2.8 >12.0 >12.0 4.1 11.7 4.3 10.4 >12.0 0.1 4.5 10.7 1.7 11.4 >12.0 0.8 7.3 3.6 3.2 <0.0 2.6 <0.0 1.0 3.5 9.9 6.4 3.9 >12.0 11.3 3.4 >12.0 11.3 3.8 11.6 4.3 10.6 >12.0 1.2 Tabela 4 – Valores de pKa calculados pelo programa H++ para os aminoácidos ionizáveis da Leuc-a e Atr-I considerando 4 constantes dielétricas (εint ) diferentes. 5.3 - Ensaios de cinética enzimática com inibidores de metaloproteases de amplo espectro Os inibidores de metaloproteases de amplo espectro utilizados nesse trabalho (Figura 10) foram desenvolvidos para inibir as enzimas do grupo das ADAM/ADAMTS e/ou MMPs. Portanto, era esperado que eles também inibissem as SVMPS, devido à similaridade dos sítios ativos entre as enzimas desses grupos. Além disso, os compostos MMP e COL já haviam sido 64 utilizados em testes iniciais de inibição de atividade proteolítica com a toxina leucurolisina-a por nosso grupo e apresentaram inibição de aproximadamente 40% e 90% em concentração de aproximadamente 15 nM (dados não publicados). Outros compostos testados anteriormente com uma SVMP foram o MAR e BAT, que inibem a atividade hemorrágica da BaP1140, que apresenta 57% de identidade com a atroxlisina-a e 78% com a leucurolisina-a, e o PRI, que foi capaz de inibir a atividade hemorrágica da toxina EoVMP2, cujo domínio catalítico apresenta 48% de identidade com a leucurolisina-a e 56% com a atroxlisina-I140. Estes últimos três compostos apresentam a grande vantagem adicional de já terem sido utilizados em seres humanos, chegando na Fase 3 de ensaios clínicos em pacientes com câncer, sendo descontinuado o seu uso devido à falta de eficácia do tratamento. Apesar disso, esses compostos apresentaram efeitos contra as metaloproteases humanas e apresentaram efeitos tóxicos somente a médio e a longo prazo141–143, características que parecem permitir sua aplicação em acidentes com serpentes. 65 Figura 10 – Estrutura química dos inibidores de metaloproteases de amplo espectro selecionados neste trabalho. Figura produzida com o programa MarvinSkecth. Os valores de IC50 desses inibidores de metaloproteases de amplo espectro, calculados em ensaios de cinética enzimática com peptídeo marcado com Abz e monitorados por fluorescência, estão mostrados nas Tabelas 5 e 6. Nossos resultados mostram que os inibidores apresentaram uma alta atividade inibitória das toxinas, algumas vezes em concentrações de nanomolar, com destaque para o composto PRI, que apresentou alta inibição contra as duas toxinas, com IC50 de 0,07µM e 0,02µM para a Atr-I e Leuc-a respectivamente, além de ter sido aprovado para tratamento em humanos e poder ser administrado oralmente. Outro inibidor que apresentou resultados inibitórios em baixa concentração contra as duas toxinas foi o CP4, com IC50 de 0,02µM para a Atr-I e 0,21µM para a Leuc-a. É interessante notar que esses dois compostos que apresentaram maior potência contra as duas toxinas representam inibidores de segunda geração, que não são peptideomiméticos como os demais e foram desenvolvidos após o descobrimento desses últimos. 66 Apesar disso, não foi possível determinar a constante de dissociação (Kd), que mede a afinidade de um inibidor por determinado alvo proteico. Geralmente esta constante pode ser calculada a partir dos valores de IC50 e da constante de Michaelis-Menten (Km). No entanto, não conseguimos realizar essa conversão, devido à impossibilidade de determinar o valor de Km do substrato para essas enzimas, porque seria necessário realizar ensaios com concentrações superiores às permitidas pela solubilidade desse composto. Outro ponto interessante desses ensaios foi a obtenção de coeficientes de Hill com valores superiores a 1, o que indicaria cooperatividade positiva de ligação dos inibidores, ou seja, a ligação de uma molécula do composto aumentaria a afinidade da toxina pelo mesmo, indicando uma possível presença de mais de um sítio de ligação. Entretanto, as variações obtidas para um mesmo composto nos ensaios com as duas toxinas, como por exemplo no caso do compostos BAT, com valores de coeficiente de Hill de 0,85 e 4,91 para Atr-I e Leuc-a respectivamente, junto com um número reduzido de pontos e com alguns valores de intervalos de confiança elevados, indicam que ainda são necessários realizar novos ensaios para confirmar a ocorrência desse fenômeno. Inibidores IC50(µM) Coeficiente de Hill R2 Número de pontos BAT 0,05±0,03 0,85 0,93 7 COL 8,69±2,18 2,28 0,92 6 CP4 0,02±0,01 2,37 0,96 7 MAR 0,08±0,01 2,05 0,99 7 MMP 0,05±0,01 1,79 0,99 7 PRI 0,07±0,05 0,77 0,90 6 Tabela 5 – Valores de IC50 e intervalos de confiança obtidos pelos ensaios de cinética enzimática utilizando inibidores de amplo espectro e a toxina atroxlisina-I (Atr-I). 67 Inibidores IC50(µM) Coeficiente de Hill R2 Número de pontos BAT 12,33±0,9 4,91 0,99 5 COL 6,46±1,67 1,65 0,96 6 CP4 0,21±0,11 0,55 0,97 7 MAR 0,78±ND 8,86 0,91 7 MMP 0,36±0,17 1,34 0,95 7 PRI 0,02±0,01 1,96 0,93 6 Tabela 6 – Valores de IC50 e intervalos de confiança obtidos pelos ensaios de cinética enzimática utilizando inibidores de amplo espectro e a toxina leucurosilina-a (Leuc-a). As curvas de inibição da atividade proteolítica utilizadas para obter os valores de IC50 estão mostradas na Figuras 11 e 12. Figura 11 – Curvas de inibição da atividade proteolítica obtidas pelos ensaios de cinética enzimática utilizando os inibidores de amplo espectro e Atr-I. 68 Figura 12 – Curvas de inibição da atividade proteolítica obtidas pelos ensaios de cinética enzimática utilizando os inibidores de amplo espectro e Leuc-a. 5.4 - Simulações de DM 5.4.1 – Escolha do estado de protonação de resíduos do sítio catalítico Após considerar diferentes estados de protonação iniciais dos ácidos carboxílicos da cadeia lateral do Glu143 e da cadeia principal do Trp3 e realizar a otimização das geometrias por QM-MM, comparamos os ângulos e as distâncias interatômicas dos átomos do sítio catalítico coordenados com o átomo de zinco para escolher aquele que se aproximava mais da geometria da estrutura cristalográfica, utilizada como estrutura de referência. Tendo em vista que os valores da Tabela 7 indicam que os estados de protonação mais próximos são Trp-COO-Glu-COOH e o Trp-COOH-Glu-COO-, decidimos utilizar o primeiro estado (Trp-COO-Glu-COOH) devido à transferência de próton ocorrido do Trp3 para o Glu143 quando realizamos a otimização de geometria com o Trp-COOH-Glu-COO-, fenômeno também observado em outros trabalhos com 69 enzimas do grupo das metzincinas72. A semelhança entre a geometria do sistema para o estado de protonação escolhido e a da estrutura cristalográfica está mostrada na Figura 13. Distancias Interatômicas Estrutura Cristalográfica Trp-COOGlu-COOH Trp-COOGlu-COO- Trp-COOH Glu-COOH Trp-COOH Glu-COO- His142@Nε2···Zn 2.02 2.00 1.98 1.97 1.99 His146@Nε2···Zn 1.98 1.97 1.98 1.94 1.96 His152@Nε2···Zn 1.93 1.99 1.98 1.95 1.98 Trp3@OXT···Zn 1.91 2.17 2.26 2.03 2.16 Trp3@O···Zn 2.41 2.22 2.13 2.74 2.22 Glu143@ε1···Trp3@O 3.15 3.29 3.30 2.66 3.26 Glu143@Oε2···Trp3@O 2.61 2.65 3.43 3.91 2.65 His142@Nε2···Zn···His146@Nε2 101.4 96.9 98.7 101.5 99.2 His142@Nε2···Zn···His152@Nε2 105.6 105.2 106.5 107.6 104.4 His146@Nε2···Zn···His152@Nε2 104.8 112.2 109.1 117.7 111.1 Trp3@OXT···Zn···His142@Nε2 106.9 109.5 106.6 104.5 110.6 Trp3@OXT···Zn···His146@Nε2 139.8 144.1 148.7 128.8 140.6 Trp3@OXT···Zn···His152@Nε2 94.5 84.5 81.4 95.1 86.2 Trp3@O···Zn···His142@Nε2 84.6 83.7 92.9 83.0 82.5 Trp3@O···Zn···His146@Nε2 98.0 99.9 100.6 88.2 100.1 Trp3@O···Zn···His152@Nε2 152.4 145.0 141.1 148.0 146.1 Ângulos X···Zn···Y Tabela 7 – Distâncias interatômicas (em Å) e ângulos X-Zn-Y (em graus) para a estrutura 4Q1L e para as estruturas otimizadas pelo método SCC-DFTB/AMBER com diferentes distribuições de cargas entre os grupos carboxílicos do Glu143 e C-Trp3 (inibidor endógeno). 70 His146 His152 His142 Trp Glu143 Figura 13 – Sobreposição da estrutura cristalográfica (azul) com a estrutura do estado de protonação (marrom) utilizado nas simulações de DM produzida com o programa Chimera. O íon Zn+2 está mostrado em cinza. 5.4.2 - Simulações de DM com inibidor endógeno A evolução estrutural das duas enzimas durante as simulações pode ser avaliada com ajuda de gráficos de RMSD e os valores médios correspondentes que foram calculados em função de estrutura cristalográfica da Leuc-a ou do modelo por homologia da Atr-I utilizando somente as coordenadas dos átomos pesados da cadeia principal (Figuras 14 e 15). 71 0.65±0.10 1.48±0.13 0.53±0.07 0.35±0.05 0.68±0.13 0.50±0.06 0.81±0.12 0.43±0.11 0.36±0.04 1.26±0.11 Figura 14 – Variação da estrutura da toxina Atr-I durante 250 ns de simulação por dinâmica molecular, medida pelos valores de RMSD dos átomos pesados da cadeia principal. 72 Figura 15 – Variação da estrutura da toxina Leuc-a durante 250 ns de simulação por dinâmica molecular, medida pelos valores de RMSD dos átomos pesados da cadeia principal. 73 A estrutura cristalográfica da Leuc-a é basicamente mantida ao longo da simulação de DM, conforme indicado pelo gráfico de RMSD. Neste caso, não há nenhuma alteração de valor acentuada e a média da simulação é baixa, com valor de 0.97±0.09 Å. A alça acessível ao solvente que conecta o Val58 na folha β2 e o Asp70 na hélice α3 apresentam o maior valor de RMSD entre os elementos das estruturas secundárias, com valor médio de 0.81±0.18 Å, e as oscilações observadas no gráfico de RMSD confirmam a flexibilidade desta região. A alça do resíduo Gli149 a Fen178 também varia com relação a estrutura inicial (0.72±0.08 Å), mas sua configuração externa permanece estável durante a simulação. A região composta pelas hélices 7-8 é a única que parece apresentar duas conformações distintas, indicado pelo aumento nos valores de RMSD dessa região que começa a partir de aproximadamente depois de 120 ns de simulação e se mantém até aproximadamente 200 ns, quando o estado original é restaurado. Entretanto, a distância dessa região em relação ao sítio ativo dificulta a realização de inferências sobre a relação dessas conformações com a afinidade por substratos por essa toxina. Diferentemente da Leuc-a, a estrutura inicial da Atr-I foi o modelo construído por homologia e o inibidor endógeno foi adicionado a partir da sobreposição estrutural do modelo com a estrutura 4QL1. Apesar da média do valor de RMSD da trajetória total da Atr-I não ser muito alta, 1.48±0.13 Å, a evolução do gráfico mostra uma ampla flutuação alcançando 2Å durante os primeiros 100 ns seguido por uma segunda fase em que o valor de RMSD flutua mais suavemente ao redor da média. Durante os últimos 150 ns a estrutura da enzima se mantém estável, mas a média do valor de RMSD indica que esta estrutura também se afasta significativamente da estrutura inicial. A análise separada das regiões revelam que as maiores mudanças ocorrem na alça Gli149-Fen178, como pode ser observado na Figura 14. Essas observações sugerem que a estrutura inicial da Atr-I passa por um refinamento por DM durante os primeiros 100 ns. Portanto, as próximas análises estruturais da simulação da Atr-I foram realizadas somente com os últimos 150 ns da simulação. Para melhor avaliar o relaxamento da geometria que ocorre na estrutura inicial da leucurolisina-a e atroxlisina-I durante a simulação por DM, a Figura 16 mostra a sobreposição das estruturas médias obtida dos últimos 50 ns de DM sobre as estrutura iniciais de cada simulação. A análise dessa figura confirma que a arquitetura média das duas enzimas são bastante estáveis em solução aquosa, apesar de pequenos rearranjos ocorridos nas alças na 74 simulação da Atr-I. De acordo com os dados de RMSD da simulação total, a mudança na estrutura inicial da Atr-I é mais evidente na alça que conecta o resíduo Gli149 e Fen178, que inclui resíduos do sítio catalítico e delimita parte do bolso S1'. Alguns dos motivos que poderiam explicar essa variação estrutural seriam a adaptação dos resíduos à presença do inibidor endógeno, pois a estrutura foi modelada sem a presença do mesmo, uma qualidade mais baixa do modelo inicial nesta região, ou uma maior flexibilidade intrínseca dessa região. Figura 16 - Representação em ribbon da sobreposição da estrutura média da simulação de DM (50 ns) com a estrutura cristalográfica (Leuc-a) ou com o modelo comparativo (Atr-I). Resíduos específicos da Leuc-a/Atr-I são mostrados na representação de bastões. As esferas CPK correspondem aos íons de Ca2+ (verde) e Zn2+ (roxo). O ligante Gln-Ser-Trp está mostrado na representação bastões e esferas. A superfície transparente delimita os pontos da rede que caracterizam o bolso S1’. Figura produzida com o programa Chimera. O íon cálcio localizado na superfície das estruturas da leucurolisina-a e da atroxlisina-I, importante para manter a estabilidade estrutural das toxinas, interage com vários resíduos, principalmente com os Tir7, Glu9/Asp9 da região N-terminal, o Asp93, e os Cis197, Asn200/Arg202 localizados na alça da região C-terminal. Essa interações entre o íon cálcio e as toxinas, descritos por parâmetros não-ligados, são estáveis ao longo das simulações, como mostram as porcentagens de ocorrência das interações e a média das distâncias interatômicas da Tabela 8. 75 Esses resultados indicam que esses parâmetros funcionam adequadamente para nossos sistemas, não havendo necessidade de desenvolver parâmetros ligados para esse íon. Leuc-a % Tir7-O···WAT···Ca 2+ Glu9-Oe1···Ca2+ Glu9-Oe2···Ca 2+ Asp93-Od1···Ca2+ Asp93-Od2···Ca Cis197-O···Ca 2+ Asn200-O···WAT···Ca 4.50 Tir7-O···WAT···Ca 72 2.35 Asp9-Od1···Ca2+ 2+ 2+ % Distância (Å) 100 4.59 68 2.32 37 5.41 71 2.35 Ser91-Og··· WAT···Ca 100 2.43 Asp93-Od1···Ca2+ 100 2.41 2.38 2+ 100 2.40 100 2.50 51 2.44 100 2+ Atr-I 98 100 2+ Distância ( Å) 34 2.41 4.41 Asp93-Od2···Ca Cis197-O···Ca 2+ Arg202-O···Ca 2+ Tabela 8 – Porcentagem da duração e das distâncias em Å das interações entre o íon Ca2+ e os resíduos das toxinas. 5.4.2.1 - Análises de agrupamento da alça Ω A alça formada pelos resíduos 149-178 é um importante elemento estrutural nas estruturas das toxinas leucurolisina-a e atroxlisina-I. Uma alça similar é um motivo recorrente em todos os membros das metalopeptidades do grupo metzincinas, como as SVMPs, MMP e ADAMs, que receberam esse nome por causa da presença da metionina altamente conservada (Met166 na Leuc-a e Atr-I), localizada próxima às três histidinas ligadas ao átomo de zinco. Para analisar a flexibilidade intrínseca da alça Ω, realizamos análises de agrupamento sobre 2500 e 1500 poses extraídas das trajetórias de Leuc-a e Atr-I, respectivamente. O alinhamento das estruturas representativas dos 5 agrupamentos mais populosos indica que o enovelamento global da alça é estável nas duas simulações (Figura 17). Provavelmente isso está relacionado com a presença de duas pontes dissulfeto (Cis159-Cis164 e Cis157-Cis181) presentes na alça e vários contatos hidrofóbicos e polares envolvendo resíduos conservados. 76 Figura 17 – Estrutura das toxinas com destaque em ribbon da cadeia principal da alça Ω dos representantes dos cinco clusters mais populosos obtidos pelo programa MMTSB. A espessura do ribbon é proporcional ao tamanho do cluster e a porcentagem total das estruturas analisadas nos clusters também está mostrada. As duas pontes dissulfeto presentes nessa alça estão representadas por linhas tracejadas. Figura produzida com o programa Chimera. Entretanto, existe uma diferença importante entre a porcentagem de poses que formam esses 5 grupos mais populosos, que é 81% para a Leuc-a e 50% para a Atr-I, sugerindo que a alça Ω é globalmente mais flexível na Atr-I que na Leuc-a. Essa diferença se deve principalmente à região dos resíduos 157-164, que apresentam uma maior variabilidade conformacional na Atr-I do que na Leuc-a. A presença dos resíduos Gli160-Gli161 na sequência da Atr-I e a ocorrência do resíduo mais rígido Pro162 na Leuc-a são provavelmente os principais motivos para essa variação de mobilidade observada nessa alça. Como uma pequena região dessa alça (Ile165-Leu170) delimita parcialmente a entrada da cavidade S1’ do sítio ativo da Leuc-a e da Atr-I, a conformação e a flexibilidade exibidas por essa alça nessa região podem influenciar a acessibilidade a essa cavidade e afetar as interações entre as toxinas e os ligantes, assim como aos substratos proteicos. Portanto, essas diferenças poderiam estar relacionadas com a diferença de atividade hemorrágica entre as duas toxinas. 77 5.4.2.2 - Análises de agrupamento do sítio ativo O sítio ativo foi definido como os resíduos de aminoácidos das toxinas Leuc-a e Atr-I que durante as simulações de DM interagem diretamente, ou através de uma molécula de água por ligações de hidrogênio, com o inibidor endógeno ou com os inibidores de amplo espectro, de acordo com os resultados do programa desenvolvido pelo Dr. Dimas Suarez, como descrito no tópico 4.7.1 da metodologia. Esses aminoácidos são os 102, 105-111, 113, 127, 129, 135, 138, 142, 143, 146, 152, 163-165, 167-171, 174 e 176. Para realizar o agrupamento utilizamos o valor de RMSD desses aminoácidos nas poses analisadas, que são as mesmas utilizadas no tópico 4.3.1, utilizando o programa cpptraj. A Figura 18 mostra as estruturas representativas dos 4 agrupamentos mais populosos dessas análises com a Atr-I e com a Leuc-a, que foram selecionadas para realizar estudos de triagem virtual. Apesar de não existir um consenso sobre o número ideal de estruturas a serem utilizadas nesses estudos (Baron & McCammon, 2013), acreditamos que esse número apresenta uma escolha equilibrada entre o tempo gasto a mais com a adição de novas estruturas e a incorporação de flexibilidade da proteína necessária para melhorar os resultados da triagem, pois essas toxinas apresentam pouca flexibilidade global, assim como na região do sítio ativo144. Isso pode ser constatado pelos valores de RMSD total dos átomos da cadeia principal das toxinas durante as simulações de DM (Figuras 14 e 15) e dos valores de RMSD dos átomos pesados dos resíduos considerados nessas análises, que foi de 1.03 ±0.11Å para a Leuc-a e 1.09±0.07Å para a Atr-I. 78 Figura 18 – Sobreposição do sítio ativo das estruturas representativas dos 4 agrupamentos mais populosos obtidos das simulações de DM com Atr-I (a) e Leuc-a (b) utilizando o valor de RMSD dos aminoácidos do sítio ativo. Figura produzida com o programa Chimera. 5.4.2.3 - Análise de cavidades Como em muitas enzimas do grupo das ADAM e MMP, variações estruturais do bolso S1' estão relacionadas com diferenças na afinidade por ligantes145, podendo resultar em diferenças na atividade biológica das enzimas, comparamos o volume e a acessibilidade dessa cavidade nas duas toxinas. A Figura 16 mostra a superfície molecular que delimita um grupo de esferas α, com 50% ou mais de acessibilidade, que caracteriza a cavidade S1’. O programa MDPOCKET130 caracteriza essa cavidade como um permanente ponto de ligação, acessível em 99.99% das poses analisadas, apesar de variar de tamanho. Podemos ver também que os tamanhos das cavidades calculados pelo programa MDPOCKET são muito parecidos para as duas toxinas, com tamanhos de 643±163 Å3 e 628±148 Å3 para Leuc-a e Atr-I, respectivamente, apesar de ser um pouco maior em Leuc-a. Além disso, a substituição do Val138 na leucurolisina-a por Ile138, um resíduo mais volumoso, na atroxlisina-I, resulta em diferença considerável na acessibilidade da porção terminal da cavidade, apesar da pequena diferença do volume total. A orientação das cadeias laterais dos Val138/Ile138, posicionados no meio do bolso S1’, é controlada 79 por um grande número de interações hidrofóbicas com os resíduos vizinhos, sendo que a interação entre Val138···Phe176 na Leuc-a é substituída por Ile138···Pro174 na Atr-I, que determina que o resíduo Ile138 se oriente de maneira diferente com relação ao Trp3 do ligante. 5.4.2.4 - Interações entre as toxinas e o inibidor endógeno No complexo leucurolisina-a e tripeptídeo, o grupo carboxilato C-terminal do Trp3 atua como um ligante bidentado e o anel aromático da cadeia lateral se posiciona dentro do bolso S1’. Para garantir que a esfera de coordenação do zinco seja mantida durante a simulação de DM, produzimos um grupo de parâmetros MM com ligações explícitas entre esse íon e os seus ligantes (Figura 19). 80 MASS Z1 65.37 BOND Z1-NF Z1-NG Z1-NH Z1-OA Z1-OB 117.00 109.00 101.00 120.00 81.00 ANGLE Z1-NF-CR Z1-NF-CV Z1-NG-CR Z1-NG-CV Z1-NH-CR Z1-NH-CV Z1-OA-C Z1-OB-C NF-Z1-NG NF-Z1-NH NG-Z1-NH OA-Z1-NF OA-Z1-NG OA-Z1-NH OB-Z1-NF OB-Z1-NH OB-Z1-NG OB-C -OA OB-Z1-OA 265.00 364.00 259.00 353.00 262.00 352.00 112.00 385.00 42.00 61.00 46.00 46.00 41.00 74.00 108.00 168.00 102.00 80.00 100.00 DIHEDRAL X -Z1-NF-X X -Z1-NG-X X -Z1-NH-X X -Z1-OA-X X -Z1-OB-X Z1-OA-C -X Z1-OB-C -X NA-CR-NF-Z1 CC-CV-NF-Z1 NA-CR-NG-Z1 CC-CV-NG-Z1 NA-CR-NH-Z1 CC-CV-NH-Z1 4 4 4 4 4 4 4 4 4 4 4 4 4 NONBONDED Z1 1.100000 0.00 ! Z1 stands for Zn type 2.02 2.01 2.03 2.00 2.74 NF NG NH OA OB ! ! ! ! ! 126.00 127.00 126.00 127.00 123.00 130.00 120.00 75.00 113.00 108.00 107.00 115.00 114.00 97.00 88.00 150.00 88.00 123.00 53.00 stands stands stands stands stands for for for for for NB type in His142 NB type in His146 NB type in His152 O2(O) type in C-Trp O2(OXT) type in C-Trp ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.532580 ! 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 ! ! ! ! ! ! ! ! ! ! ! ! ! From Li et al. FF Figura 19 – Parâmetros utilizados pelo programa LEaP para definir a representação ligada do zinco e seus ligantes. Utilizando esses parâmetros, o modo inicial de ligação do tripeptídeo ficou estável durante toda a simulação com a Leuc-a e com a Atr-I , o que pode ser evidenciado pela frequências das interações mais importantes (> 50% de ocorrência) entre esse ligante e as toxinas 81 (Figura 20). As ligações explícitas entre o Zn2+ e o inibidor mantém o carboxilato do Trp3 assimetricamente ancorado a esse íon (Zn2+···O com comprimentos de 2.0 e 2.8 Å) e coordenado por uma ligação de hidrogênio com o Glu143. A cadeia lateral do Trp3 permanece dentro da cavidade hidrofóbica do bolso S1’, interagindo principalmente com os resíduos Ile108, Val/Ile138, His142, His152, e Leu170. Também ocorrem ligações de hidrogênio dentro da cavidade S1’ entre o grupo amino da cadeia lateral do Trp3 e o grupo carbonil dos resíduos 167 e 168 da alça Ω (Figura 20). Os outros dois resíduos do inibidor, Gln1 e Ser2, também realizam interações com as toxinas. Existe uma ligação de hidrogênio estável entre a cadeia principal do grupo amino do Ile108 na folha β4 e do grupo carbonil da Ser2. Outros contatos polares entre os Ser2 e o Gln1 são menos frequentes e mediados por moléculas de água. 82 Figura 20 – Imagem esquemática das principais interações entre as toxinas e o inibidor Gln1-Ser2-Trp3, de Leuc-a (a) e Atr-I (b). Para as ligações de hidrogênio, as distâncias médias entre os átomos pesados estão em Å e o tempo de duração está indicado em porcentagem. Para os contatos hidrofóbicos, as distância média entre os centros de massa dos grupos interagentes estão em Å e os valores de energia de dispersão em parênteses. Figura produzida com o programa ChemBioDraw. ! 84! 5.4.2.5 – Cálculos dos potenciais eletrostáticos e das superfícies moleculares Diferenças mais significativas entre Leuc-a e Atr-I aparecem quando comparamos a geometria da estrutura e propriedades eletrostáticas. Isso é claramente observado na Figura 21, que mostra as poses obtidas com 200 ns de simulação, tempo suficiente para garantir que o sistema esteja estável, de Leuc-a e Atr-I coloridas em função do potencial eletrostático. Resultados similares foram observados utilizando outras poses das simulações. Em relação à área acessível ao solvente (SASA, do inglês solvent accessible surface area), a estrutura da atroxlisina-I parece mais compacta SASA=8945±137Å2) que a leucurolisina-a (SASA=9247±151Å2). Ainda mais marcante é a diferença nas propriedades eletrostáticas das duas toxinas, que possuem carga global igual a +4 na Leuc-a e 0 na Atr-I. A alça 100-108, que conecta as folha β3 e β4 e delimita parcialmente o sítio ativo, é mais volumosa e apresenta mais resíduos carregados negativamente na Leuc-a (Asp104-Glu105-Glu106) que na Atr-I (Asn104-Gli105Pro106). De forma similar, a alça 128-132, que conecta a folha β5 e a α-hélice do sítio ativo, apresenta uma diferença significante por causa das substituições da Lis131 e Lis132 na leucurolisina-a pelos resíduos Glu131 e Gln132 na atroxlisina-I. Portanto, concluímos que a forma estrutural e o potencial eletrostático da superfície acessível ao solvente em uma região próxima da alça Ω são características que diferem a leucurolisina-a e a atroxlisina-I. 84 ! Figura 21 – Superfície acessível ao solvente de pose extraída após 200 ns de simulação colorida em função do potencial eletrostático calculado com o programa APBS. A cor azul indica regiões positivas enquanto a cor vermelha indica regiões negativas. Figura produzida com o programa Chimera. 5.4.3 - Inibidores de metaloproteases de amplo espectro 5.4.3.1 – Simulações de docking Nessa etapa do trabalho, realizada pelos doutores Dimas Suarez e Natalia Diaz, foram obtidas as estruturas iniciais para simulações de DM, pois não existem estruturas cristalográficas dos complexos entre as toxinas e os inibidores estudados, não sendo possível determinar com 85 segurança o modo de ligação desses compostos. Para avaliar quais seriam esses possíveis modos, utilizamos as metodologias de docking em conjunto com minimização de energia QM-MM, seguido de cálculos QM/MM-PBSA através da função de pontuação apresentada no tópico 4.6.1. Após realizar as simulações de docking utilizando o programa Autodock4117 com 50 poses das toxinas extraídas das simulações de DM, as poses foram minimizadas, avaliadas e as 10 poses com melhor pontuação foram inspecionadas visualmente, eliminando aquelas que não apresentassem alguma região do inibidor dentro do bolso S1’ ou que não apresentassem interação entre o grupo hidroxamato e Zn2+. Após esse processo escolhemos as poses com melhores pontuações para realização inicial das simulações de DM, escolhendo mais de uma pose quando havia mais de um grupo diferente do inibidor dentro do bolso S1’, devido a baixa diferença dos valores obtidos por essas poses, que não permitiu inferir sobre o modo de ligação preferencial dos inibidores BAT, COL, MAR e MMP. A Figura 22 mostra as poses iniciais de cada simulação realizada com os complexos toxinas/inibidores estudados. Nossos resultados indicam que, para os inibidores CP4 e PRI, existe apenas um modo de ligação provável, devido à presença do grupo de ligação ao zinco e da ausência de diferentes grupos apolares que pudessem se posicionar dentro do bolso hidrofóbico S1’. 86 Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das estruturas iniciais das simulações de dinâmica. 87 Figura 22 – Destaque dos sítios ativos dos complexos entreas toxinas e os inibidores de amplo espectro das estruturas iniciais das simulações de dinâmica (continuação). 88 Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das estruturas iniciais das simulações de dinâmica (continuação). 89 Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das estruturas iniciais das simulações de dinâmica (continuação). 90 Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das estruturas iniciais das simulações de dinâmica (continuação). 91 Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das estruturas iniciais das simulações de dinâmica (continuação). As cargas RESP dos ligantes utilizadas nessa etapa foram produzidas pelo método HF/631+G* para garantir que as interações eletrostáticas sejam balanceadas, porque as cargas do campo de força ff99SB, utilizado para as toxinas, foram derivadas pelo mesmo método. Estudos iniciais realizados com a estrutura cristalográfica da Leuc-A mostraram que a utilização destas cargas aumenta a pontuação das poses que apresentam mais contato entre as proteínas e os ligantes, quando comparadas com o uso de cargas calculadas pelo método B3LYP. Essa diferença possivelmente se deve ao fato de que com a utilização de B3LYP muitas poses com grandes regiões do ligante expostas ao solvente foram hiperestabilizadas, apontando para um desequilíbrio entre a energia de solvatação e interações intramoleculares da função de avaliação. As poses produzidas pelo Autodock foram submetidas ao processo de minimização com o método SCC-DFTB/MM para garantir que a geometria de esfera de coordenação do Zn+2 seja adequada, ou seja, se aproxime da geometria de estruturas cristalográficas. A utilização da região da proteína formada pelos resíduos 105-111, 166-171, 138-139 e os átomos do ligantes que não pertencem ao grupo hidroxamato na região MM, junto com a região QM, composta por pelo Zn+2, His142, Glu143, His146 e His152 e o grupo hidroxamato do inibidor, no processo de otimização da geometria antes da realização dos cálculos energéticos, tem como objetivo permitir uma maior flexibilidade do bolso S1', resultando em uma melhor acomodação do ligante 92 nessa cavidade. A inclusão somente do grupo ZBG na região QM durante esses cálculos permite que essa metodologia possa ser aplicada a um grande número de ligantes, além de minimizar o risco de artefatos produzidos por polarização excessiva, como a interação entre o Zn e anéis do CP4, que deveriam se localizar dentro do bolso S1', como ocorreu durante essas primeiras tentativas de docking. Na tentativa de reavaliar as poses de docking obtidas nesses estudos iniciais, com a estrutura cristalográfica da leucurolisina-a, foram utilizados três protocolos distintos para cálculos single-point da energia na fase gasosa (Egas) e a energia de solvatação dos complexos toxinas/inibidores: a) QM/MM-GBSA, calculando a Egas com SCC_DFTB/MM e a energia de solvatação com GBSA. Apesar desse protocolo apresentar menor custo computacional que os demais, a utilização de GBSA para a tratar a energia de solvatação não foi adequada, conforme já descrito anteriormente por outros autores72, produzindo grandes diferenças de valores entre os compostos quando comparados com os outros métodos utilizados, além de maior variação entre poses similares; b) MM-PBSA, calculando a Egas pelo AMBER (MM) com parâmetros iod107 para Zn+2 e a energia de solvatação tratada pela solução não linear da equação PB, incluindo os termos Edisp e Ecav (int=2) pelo programa PBSA do AMBER 14. Nesse caso, a energia MM entre o ZBG e Zn não é confiável, produzindo também variações muito grandes quando comparados com os outros métodos utilizados. Isso provavelmente se deve pela dificuldade já descrita na literatura em tratar as interações entre metais e outros compostos orgânicos com parâmetros MM convencionais; c) QM/MM-PBSA, calculando a Egas com SCC-DFTB/MM e a energia de solvatação calculada pelo método PB, utilizando cargas Mulliken para os átomos da região QM, seguindo protocolo similar ao reportado por Chaskar et al.72. Esse protocolo foi o que produziu melhores resultados e foi utilizado para selecionar os modos de ligação dos inibidores, pontuando melhor as poses com orientação do grupo hidroxamato próximas das observadas em estruturas cristalográficas e com os maiores grupos apolares das moléculas dos inibidores dentro do bolso S1'. Também utilizamos esses protocolos para realizar os cálculos de energia livre de ligação com as poses extraídas da dinâmica, e assim como na etapa de docking, o último protocolo foi o que apresentou maior similaridade os dados experimentais. A utilização dos diferentes protocolos no processo de reavaliação da poses de docking permitiu escolher um protocolo mais 93 adequado para a avaliação das poses extraídas das simulações de DM, permitindo identificar algumas das limitações dos métodos utilizados. 5.4.3.2 - Interações entre as toxinas e os ligantes Nos complexos toxinas/inibidores, o grupo hidroxamato atua como um ligante bidentado e algum dos grupos hidrofóbicos dos inibidores se posiciona dentro do bolso S1’, de modo similar ao que ocorre com o inibidor endógeno. Adotamos também a mesma abordagem para garantir que a esfera de coordenação do zinco seja mantida durante a simulação de DM com os inibidores de amplo espectro, produzindo um grupo de parâmetros MM com ligações explícitas entre esse íon e os seus ligantes (Figura 23). 94 MASS Z1 BOND Z1-NF Z1-NG Z1-NH Z1-OA Z1-OB 65.37 0.00 ! 101.00 93.00 68.00 105.00 99.00 2.06 2.06 2.13 2.08 2.13 ANGLE Z1-NF-CR Z1-NF-CV Z1-NG-CR Z1-NG-CV Z1-NH-CR Z1-NH-CV Z1-OB-n Z1-OA-c NF-Z1-NG NF-Z1-NH NG-Z1-NH OB-Z1-NF OB-Z1-NG OB-Z1-NH OA-Z1-NF OA-Z1-NG OA-Z1-NH OA-Z1-OB 268.00 380.00 263.00 358.00 261.00 357.00 174.00 158.00 38.00 96.00 71.00 80.00 97.00 107.00 68.00 54.00 144.00 100.00 DIHEDRAL X -Z1-NF-X X -Z1-NG-X X -Z1-NH-X X -Z1-OA-X X -Z1-OB-X Z1-OB-c -X Z1-OB-n -hn Z1-OB-n -c2 Z1-OA-c -c3 Z1-OA-c -n NA-CR-NF-Z1 CC-CV-NF-Z1 NA-CR-NG-Z1 CC-CV-NG-Z1 NA-CR-NH-Z1 CC-CV-NH-Z1 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 NONBONDED Z1 1.100000 Z1 stands for Zn type ! ! ! ! ! NF NG NH NF NF 128.00 126.00 127.00 126.00 125.00 129.00 108.00 113.00 119.00 88.00 94.00 96.00 90.00 163.00 113.00 128.00 87.00 69.00 stands stands stands stands stands for for for for for NB type NB type NB type o(GAFF) o(GAFF) in His142 in His146 in His152 type in hydroxamte group type in hydroxamte group ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.532580 ! 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! From Li et al. FF Figura 23 – Parâmetros utilizados pelo programa LEaP para definir a representação ligada do zinco e seus ligantes. 95 As interações entre as toxinas e os ligantes foram determinadas pelo programa produzido localmente pelo Dr. Dimas Suarez, como descrito no tópico 4.7.1. Esses resultados permitiram identificar os principais resíduos de aminoácidos que interagem com os inibidores, dividindo também quais contribuem para as interações apolares e quais contribuem com interações polares (ligações de hidrogênio). É interessante notar que grande parte destas interações envolvem a cadeia principal dos aminoácidos. As contribuições polares na Leuc-a são devido principalmente aos resíduos Ile108(N), Gli109(O e N) Leu170(N), através dos átomos da cadeia principal, e com os oxigênios da cadeia lateral do Glu143, fundamental para a atividade catalítica. Na Atr-I, além desses, são de grande importância também os átomos de oxigênio da cadeia principal dos resíduos Pro106 e Pro168. Esses dados estão de acordo com outro trabalho que propõem a interação entre peptídeos e essas toxinas através de conformação similar folha β146, assim como ocorre com as estruturas cristalográficas de complexos de metaloproteases com inibidores BAT e MAR, onde essa conformação é bastante evidente. Tanto para a Atr-I quanto para a Leuc-a os principais resíduos para as contribuições apolares dentro do bolso S1' são a His142, Leu170 Ile108, e Val138(Leuc-a)/(Atr-I)Ile138 para grupos mais volumosos. Para contribuições apolares fora do bolso S1' na Leuc-a, os principais são Ile110, Hid152, Hid146, e Ile108 e Leu170 quando os grupos dos inibidores fora do bolso S1' são mais volumosos. Na Atr-I, além desses mesmos resíduos, com diferença apenas da Leu110 no lugar da Ile110, existem mais dois resíduos que se destacam, Pro106 e Val169. Na Leuc-a essas duas posições são ocupadas pelos resíduos Glu106 e Tre169, um carregado negativamente e um polar, impossibilitando portanto essas interações apolares e contribuindo para as diferenças no potencial eletrostático das toxinas, apresentado no tópico 5.3.2.5. Esse padrão de interação mostra o motivo desses inibidores possuírem atividade contra um amplo espectro de metaloproteases, pois as variações dos aminoácidos do sítio ativo entre as enzimas vão apresentar pouca influência sobre as principais ligações de hidrogênio (com maior duração) por envolverem principalmente os átomos da cadeia principal das enzimas, além dos oxigênios da cadeia lateral do Glu com atividade catalítica, que está presente em todas as enzimas da metzincinas, ocorrendo o mesmo para as principais interações apolares, que ocorrem dentro do bolso S1', que apesar de apresentar variações de tamanho e forma relacionado com a variação na composição de aminoácidos entre essas enzimas, é sempre apolar. 96 A Figura 24 mostra, de forma esquemática, as interações entre os inibidores e as toxinas, incluindo interações menos significativas quando comparadas com as citadas no texto, por não apresentar duração maior que 40% do tempo de simulação de modo constante para todos os inibidores. Os títulos das figuras indicam qual é a toxina, o inibidor e grupo do inibidor localizado no bolso S1’. 97 Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw. ! 98! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 99! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 100! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 101! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 102! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 103! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 104! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 105! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas (continuação). Figura produzida com o programa ChemBioDraw. ! 106! ! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! 107! ! Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw (continuação). ! ! 108! Entre os compostos estudados, os que apresentaram maior potência foram PRI e CP4, compostos de segunda geração desenvolvidos especificamente para inibir ADAMs e MMPs, e são os que apresentam maior número de interações com as toxinas, principalmente apolares, assim como as melhores pontuações finais (Tabelas 10 e 11). 5.4.3.3 - Cálculos de energia livre Foram realizados cálculos de energia livre utilizando as técnicas de MM-GBSA, MMPBSA e QM/MM-PBSA para calcular a energia de ligação entre as toxinas e os inibidores de amplo espectro, mas somente serão discutidos os cálculos realizados com esta última variação, que gerou os resultados de geometria de ligação do grupo hidroxamato com o Zn2+ mais próximos das geometrias verificadas em estruturas cristalográficas do PDB. Primeiramente utilizamos 2500 poses extraídas a cada 100 ps das simulações de DM. Entretanto os cálculos realizados utilizando somente 60% das poses finais apresentaram maior concordância com os dados experimentais, devido a variação de energia de alguns dos ligantes durante a etapa inicial de simulação, indicando uma adequação da geometria em relação à pose inicial, obtida por docking. Essa variação foi mais acentuada nos complexos da Leuc-a com o inibidor PRI e COL (Figura 25), mas também ocorreu em menor escala com MAR. 109 Figura 25 – Variação de energia de ligação em kcal/mol pelo método QM/MM-PBSA dos complexos da toxina Leuc-a com os inibidores COL(a) e PRI(b), sendo que o composto COL estava com o grupo isobutil no bolso S1’, mostrando os valores individuais e as médias acumuladas para todas as poses, ou para as últimas 1500 poses. Gráficos produzidos com o programa R. Apesar disso, a variação durante as simulações representa uma pequena contribuição na média das energia calculada por QM/MM-PBSA para todas as poses, sem considerar as contribuições entrópicas. Os gráficos da Figura 25 refletem a tendência geral obtida pelos nossos resultados, de uma pequena variação do valor dessa média em função do número de poses 110 utilizadas (Tabela 9), extraídas em intervalos regulares, de 100 ps, e numeradas em função do tempo de simulação. Apesar dessa variação ser importante para tentar reproduzir dados experimentais quando se trata de ordenar inibidores com potências variadas, ela poderia ser negligenciada na aplicação dessa metodologia para melhorar a qualidade de resultados obtidos por triagem virtual, utilizando um número reduzido de poses para esses cálculos. Número de poses utilizadas Inibidor 1-100 1-250 1-500 1-1000 1-2500 1000-2500 BAT fenil -79,4 ± 5,1 -82,1 ± 6,0 -84,2 ± 6,1 -84,3 ± 6,2 -85,1 ± 6,3 -85,6 ± 6,4 COL isobutil -68,3 ± 6,0 -69,5 ± 6,0 -70,5 ± 6,0 -73,6 ± 7,1 -74,7 ± 6,9 -75,4 ± 6,6 CP4 -89,8 ± 5,2 -89,6 ± 5,4 -87, 8 ± 5,8 -87,0 ± 6,1 -85,2 ± 6,7 -84,1 ± 6,8 MAR -79,8 ± 6,5 -81,1 ± 6,0 -82,7 ± 5,8 -83,5 ± 5,6 -84,6 ± 5,4 -85,3 ± 5,2 MMP fenil -76,1 ± 6,5 -77,8 ± 6,0 -78,7 ± 6,0 -78,4 ± 6,0 -77,8 ± 6,5 -77,3 ± 6,8 PRI -80,1 ± 4,6 -79,6 ± 5,2 -79,7 ± 5,1 -79,9 ± 5,0 -80,2 ± 5,3 -82,7 ± 5,8 Tabela 9 – Média e desvio padrão das energias livres de ligação em kcal/mol, sem considerar as contribuições entrópicas, calculadas pelo método QM/MM-PBSA, para os complexos Leuc-a/inibidores utilizando diferentes números de poses extraídas das simulações de DM. Para realizar a pontuação final dos inibidores (Tabelas 10 e 11), foram realizados os cálculos utilizando o cluster determinado no tópico 4.4.3.2 na região QM e o restante dos átomos do ligante e uma forma truncada da toxina na região MM para cada pose. O uso dessa forma truncada ao invés da proteína completa teve como objetivo tentar diminuir o erro associado ao cálculo de entropia vibracional utilizando modos normais124 e o custo computacional desta etapa. A contribuição entrópica foi calculada somando-se as contribuições entrópicas conformacionais do ligante e das proteínas, e a variação de entropia rotacional e translacional do ligante. A energia de solvatação foi calculada através do método PB não linear para a contribuição apolar e com os termos dispersão e cavitação implementados pelo programa PBSA. Posteriormente 1500 poses extraídas regularmente dos últimos 150 ns das simulações de um determinado complexo foram utilizados para obter a pontuação final dos compostos (Tabelas 10 e 11), utilizando a equação número 10. Nas tabelas abaixo o nome em parênteses indica a região do composto que está posicionada dentro do bolso hidrofóbico S1’. Os valores de diferença de pontuação foram 111 calculados por comparação com inibidores que apresentaram pontuação mais negativa para cada toxina. Inibidores Pontuação Diferença – pontuação Contribuição entrópica (TΔS) CP4 -85,29 ±0,45 0,00 9,45 Diferença – contribuição entrópica 5,53 PRI -78,46 ± 0,45 6,83 3,91 0,00 BAT (isobutil) -74,27 ± 0,45 11,02 8,94 5,03 BAT (fenil) -73,65 ± 0,46 11,64 10,10 6,19 BAT (tiofeno) -69,67 ± 0,44 15,62 11,37 7,46 MAR (isobutil) -75,74 ± 0,43 9,55 11,20 7,29 MAR (amida) -67,42 ± 0,44 17,87 10,28 6,37 MMP (fenil) -71,24 ± 0,66 14,05 11,48 7,57 MMP (isobutil) -64,81 ± 0,44 20,49 6,70 2,79 COL (isobutil) -66,75 ± 0,45 18,55 7,01 3,10 COL (fenil) -59,06 ± 0,45 26,24 6,65 2,74 IC50(µM) 0,02 0,07 0,05 0,08 0,05 8,69 Tabela 10 – Pontuação final e valores de IC50 obtidos pelos inibidores em complexo com a toxina atroxlisina-I, com os menores valores em vermelho. Os valores de pontuação e o erro padrão estão em kcal/mol e os valores de entropia estão em kcal/mol/K°. Entre parênteses está o grupo localizado no bolso hidrofóbico S1’. A diferença de pontuação e entropia foi calculada em função do menor valor desta tabela (pontuação), ou em função do menor valor obtido entre esta tabela e a tabela 11. 112 Inibidores Pontuação Diferença – pontuação Contribuição entrópica (TΔS) PRI -73,86 ± 0,57 0,00 8,78 Diferença – contribuição entrópica 4,86 CP4 -73,45 ± 0,47 0,41 3,92 0,01 0,21 MAR (isobutil) -71,17 ± 0,46 2,69 12,06 8,14 0,78 BAT (isobutil) -70,02 ± 0,48 3,84 9,70 5,79 BAT (fenil) -65,51 ± 0,46 8,35 12,94 9,03 BAT (tiofeno) -64,76 ± 0,48 9,10 10,21 6,30 MMP (fenil) -64,99 ± 0,46 8,87 6,89 2,97 MMP (isobutil) -52,75 ± 0,55 21,11 6,81 2,90 MMP (fenil 2) -50,28 ± 0,46 23,58 8,27 4,35 COL (isobutil) -61,54 ± 0,60 12,32 9,59 5,68 COL (fenil) -53,20 ± 0,48 20,67 8,22 4,31 IC50(µM) 0,02 12,33 0,36 6,46 Tabela 11 – Pontuação final e valores de IC50 obtidos pelos inibidores em complexo com a toxina leucurolisina-a, com os menores valores em vermelho. Os valores de pontuação e o erro padrão estão em kcal/mol e os valores de entropia estão em kcal/mol/K°. Entre parênteses está o grupo localizado no bolso hidrofóbico S1’. A diferença de pontuação e entropia foi calculada em função do menor valor desta tabela (pontuação), ou em função do menor valor obtido entre esta tabela e a tabela 10. Entre os inibidores testados, dois estão presentes em estruturas cristalográficas depositadas no PDB em complexo com enzimas que apresentam alta similaridade estrutural na região do sítio ativo com as SVMPs. Um deles é o composto BAT, presente em estruturas com 2 ADAMs e 4 MMPs, apresentando um modo de ligação que posiciona o grupo isobutil dentro da cavidade S1’. A única exceção é uma estrutura de uma SVMP, a atrolysin-C (1DTH), onde o grupo posicionado nesta cavidade é o anel tiofeno. Portanto, a disponibilidade dessas estruturas com esse inibidor não permite determinar qual o modo mais provável de ligação para esse composto. Como na etapa de docking haviam três modos entre as dez estruturas melhor avaliadas, com diferentes grupos hidrofóbicos desse composto dentro do bolso S1’, foram feitas 3 simulações para cada toxina. Entretanto os cálculos de energia de ligação realizados com as poses dessas simulações indicam que, para as nossas toxinas, o modo de ligação mais provável seja também aquele que apresenta o grupo isobutil no bolso S1’. Outro inibidor presente em estruturas depositadas no PDB é o MAR. Nas três estruturas depositadas, em complexo com ADAMs, o grupo isobutil está posicionado dentro do bolso S1’. Nossos resultados indicam que esse é também o modo de ligação com nossas toxinas, ou por ter 113 sido o único modo de ligação presente nas poses selecionadas durante o docking contra Leuc-a, ou por apresentar melhor pontuação quando comparado com as simulações realizadas com o grupo n-metil-amida dentro do bolso S1’ no caso da Atr-I. A preferência pelo o grupo isobutil dos inibidores dentro do bolso S1’, como indicam os resultados dos complexos com esses dois inibidores e com o COL, pode estar relacionada com a preferência dessas toxinas pelo aminoácido leucina na posição P1’ do substrato144. Entretanto essa tendência não foi observada para o inibidor MMP, que também apresenta esse grupo em sua composição, mas que apresentou melhores pontuações quando as simulações foram realizadas com grupo fenil dentro do bolso S1’. Uma das conclusões mais evidentes dessa avaliação é a grande diferença que pode ocorrer na pontuação quando diferentes modos de ligação são utilizados para um mesmo composto, parecendo exercer uma influência maior que a adição da contribuição entrópica nos cálculos. Essa diferença é mais marcante para os complexos Leuc-a-MMP, pois além da grande diferença entre as três simulações, houve uma das maiores diferenças entre dois modos de ligação que apresentavam o mesmo grupo dentro do bolso S1’. Dados experimentais adicionais de cristalografia são necessários para avaliar a possibilidade de aplicação dessa metodologia para determinar o modo de ligação dos inibidores. Outro ponto importante a ser destacado é a baixa contribuição relativa dos cálculos entrópicos, possuindo média de 4,86 Kcal/mol/K° (±2,51) para Atr-I e 5,53 Kcal/mol/K° (±2,45), indicando uma variação relativamente pequena entre os inibidores, apesar da variação estrutural, e representando aproximadamente ~7% do valor médio obtido de todas as pontuações de cada toxina. Essa variação entre os compostos nos diferentes complexos ou em diferentes modos de ligação pode ser verificado pelas diferenças entre as contribuições entrópicas mostradas nas Tabelas 10 e 11, calculadas em função do complexo Leuc-a/PRI, que obteve o menor valor absoluto. Esses dados sugerem que essas contribuições poderiam ser ignoradas na aplicação desse protocolo para enriquecimento dos resultados obtidos por triagem virtual. A comparação entre os resultados computacionais e os dados experimentais apresenta dificuldades relacionadas à baixa confiança de alguns dos valores de IC50, como os valores obtidos para BAT e MAR com a Leuc-a. Os coeficientes de Hill obtidos indicam uma possível interação cooperativa entre as toxinas e alguns inibidores, que poderia ocorrer em função da presença de mais de um sítio de ligação, e que dificultaria ainda mais essa comparação. 114 Infelizmente os experimentos para determinação dos valores de IC50 de não puderam ser repetidos devido à!baixa disponibilidade de substrato para os experimentos, impedindo também a utilização de um maior números de concentrações, que provavelmente aumentaria a confiabilidade dos resultados. Outra dificuldade está relacionada com o grau de incerteza intrínsecas das metodologias computacionais utilizadas. Contudo, é possível afirmar que, com dados obtidos, não existe correlação entre o ordenamento dos compostos em ordem de potência contra as toxinas realizado pelos dados experimentais e pelos dados computacionais. Ainda são necessários realizar mais experimentos computacionais e in vitro para confirmar se as metodologias aplicadas são apropriadas para distinguir entre ligantes de não-ligantes auxiliando na escolha de compostos para realização de experimentos in vitro. 5.5 – Triagem virtual Para realizar essa etapa aproximadamente 3 milhões de arquivos representando moléculas lead-like disponíveis comercialmente foram obtidos do banco de dados ZINC63 e processados com scripts distribuídos junto com o programa Autodocktools117 para produzirem arquivos para serem utilizados pelo programa Vina70, utilizando parâmetros padrão do programa. Após realizar essa etapa de triagem selecionamos 150.000 compostos em função da pontuação obtida pelo Vina. Esses compostos serão futuramente utilizados em nova rodada de triagem utilizando as conformações das toxinas descritas no tópico 5.4.2.2 e ordenadas novamente em função de média das pontuações obtidas com as diferentes conformações de cada toxina. 115 6 – Conclusões Devido ao seu papel no envenenamento causado por serpentes, produzindo uma grande variedade de efeitos tóxicos e auxiliando na difusão das outras toxinas, SVMP são alvos importantes para o desenvolvimento de fármacos. Acreditamos que nosso trabalho contribui para esse processo identificando inibidores dessas toxinas que possuem alta potência, que já foram testadas em humanos, sem apresentar efeitos tóxicos em curto prazo de tempo. Entre eles destacamos o composto prinomastat (PRI), que pode ser administrado oralmente, inibe as duas toxinas com potência similar na faixa de nanomolar (IC50 = 20 e 70 nM contra leucurolisina-a e atroxlisina-I, respectivamente), além de outra SVMP, a toxina EoVMP2140, indicando que poderia também inibir várias outras SVMPs. Outra contribuição importante é a produção do modelo estrutural da Atr-I, que devido à similaridade com os moldes e a boa resolução das suas estruturas cristalográficas, possui qualidade suficiente para ser utilizado por metodologias de descoberta de fármacos dependentes da estrutura tridimensional do alvo. Produzimos também conformações por DM das toxinas que podem ser utilizadas para considerar a flexibilidade da proteína durante a triagem virtual, e que foram de fundamental importância para a seleção dos prováveis modos de ligação dos inibidores de amplo espectro estudados. Para permitir a manutenção adequada da geometria dos ligantes coordenados ao íon Zn2+ durante as simulações de DM, produzimos parâmetros para representação ligada desse íon utilizando simulações QM/MM e QM com a estrutura da Leuc-a. Essa etapa é necessária devido à natureza da interação proteína-metal, caracterizada por uma grande transferência de cargas entre os átomos e por múltiplas geometrias de coordenação que dificultam a produção de parâmetros para campo de forças adequados para as diferentes metaloproteínas147, sendo por isso uma das principais dificuldades relacionadas com a produção de simulações de DM. Devido à alta similaridade do sítio catalítico entre as SVMPs, acreditamos que esses parâmetros podem ser utilizados para outras SVMPs, assim como foram utilizados para a Atr-I nesse trabalho. Contudo, apesar de importância da abordagem utilizada para garantir uma melhor qualidade das geometrias dos complexos entre as toxinas e os inibidores, existe a possibilidade do procedimento utilizado para a produção de cargas RESP, que considera a transferência de carga entre esse íon e os átomos do inibidor, permita a representação de ligações explícitas do Zn2+ 116 somente com os resíduos de histidinas, facilitando a parametrização necessária para a produção de simulações com inibidores que não possuem o grupo hidroxamato como ZBG. Em um simulação de 50 ns de duração realizada com o complexo Leuc-a-QSW, sem ligações explícitas entre o peptídeo e o Zn2+, foram obtidas distâncias e ângulos médios de ligação entre os oxigênios do grupo carboxilato do Trp3 próximos aos medidos durante a simulação com ligações explícitas. Entretanto, mais testes são necessários para verificar a possibilidade de aplicação dessa abordagem com outros inibidores. Com relação aos cálculos de energia livre de ligação, os resultados que melhor reproduziram a geometria de ligação do grupo hidroxamato nas simulações de docking foram obtidos com a técnica de QM/MM-PBSA, motivo pelo qual essa técnica foi selecionada para calcular a energia livre de ligação com as poses obtidas pelas simulações de DM. Estudos anteriores já haviam apontado a dificuldade de se obter resultados com MM-PBSA e MM-GBSA que reproduzissem dados experimentais em estudos com metaloenzimas contendo zinco148, que provavelmente ocorre devido a transferência de cargas entre o zinco e os seus ligantes149. Apesar de não ser possível reproduzir a ordem dos compostos por potência, acreditamos que a função de avaliação desenvolvida nesse trabalho, junto com o método de QM/MM-PBSA, possa ser utilizada para discriminar entre compostos que apresentam atividade inibitória dos compostos sem atividade. Ainda são necessários mais estudos para indicar o tempo necessário de simulação de DM, mas nossos resultados indicam que simulações com menor tempo de duração, como 30 a 50 ns, poderiam oferecer acurácia suficiente para a serem aplicadas nas etapas finais de estudos de triagem, mesmo sem calcular o termo de contribuição entrópica, que apesar de serem importantes para estimativas de energias de ligação absolutas, frequentemente aumentam as estimativa de erro dos cálculos150. Um dos objetivos principais do nosso trabalho era encontrar diferenças entre as toxinas, que apresentam alta similaridade em suas características estruturais e sequência, que poderiam estar associadas às diferenças na atividade hemorrágica. As principais diferenças encontradas entre elas são a maior flexibilidade da alça Ω na Atr-I, como mostram as análises de agrupamento e de RMSD nessa região. Essa variação na flexibilidade dessa alça entre SVMPs hemorrágicas e não-hemorrágicas já foi descrita em outro trabalho151. As análises de interações com o inibidor endógeno também não apontaram grandes diferenças entre as toxinas, com números similares de ligações de hidrogênio e contatos 117 hidrofóbicos, mesmo dentro do bolso S1’, que em muitos casos influência a afinidade por inibidores de metaloproteases por apresentar diferenças estruturais145. Os resultados também foram similares quando analisamos os inibidores de amplo espectro, com exceção da presença da Pro106 na Atr-I, produzindo um maior número de contatos hidrofóbicos com os inibidores fora do bolso S1’, que não acontece na Leuc-a devido à presença do Glu106. Essa diferença poderia explicar parte da diferença de afinidade das toxinas pelos inibidores. As maiores diferenças foram encontradas para os inibidores PRI e CP4 em relação aos outros compostos, que além de realizarem ligações de hidrogênio presentes na maioria dos complexos, apresentam maior número de contatos hidrofóbicos dentro do bolso S1’. Essas análises também permitiram identificar quais aminoácidos interagem com os inibidores, informação que foi utilizada para realizar as análises de agrupamento e escolha de conformações para a realização da próxima etapa da triagem com compostos lead-like. A diferença mais marcante encontrada entre as duas toxinas é a diferença do potencial eletrostático ao redor do sitio catalítico, mais negativo para a Leuc-a, que pode exercer grande influência entre o contato das enzimas com seus substratos proteicos e com inibidores. Uma grande contribuição para essa diferença provém da variação nos resíduos 104-106 entre as toxinas, sendo composta por Asn104-Gli105-Pro106 na Atr-I e por Asp104-Glu105-Glu106 na Leuc-a. O resíduo de Pro106 na Atr-I, além de contribuir para essa diferença, realiza importantes contatos hidrofóbicos no sítio de ligação fora do bolso S1’, podendo contribuir também para a diferença de afinidade por substratos proteicos. Portanto, as principais contribuições do nosso trabalho foram: a) produção de um modelo da toxina Atr-I com qualidade suficiente para ser utilizado em estudos de dinâmica e docking; b) confirmação da atividade dos inibidores de metaloproteases de amplo espectro contra as toxinas Leuc-a e Atr-I, que poderiam ser utilizados em acidentes com serpentes; c) identificação de principais aminoácidos das toxinas responsáveis pelas interações com os inibidores; d) produção das conformações das toxinas para utilização em estudos de docking e triagem virtual; e) seleção de 250 mil compostos lead-like, em uma primeira etapa de triagem, para estudos posteriores de identificação de inibidores; f) e a identificação de possíveis diferenças estruturais relacionadas com a diferença de atividade hemorrágica entre as duas toxinas. 118 7 – Perspectivas Assim como realizamos a divisão dos objetivos principais, o mesmo pode ser feito com as perspectivas, planejando a continuidade dos trabalhos para aprimorar os estudos com os inibidores identificados ou para a descoberta de novos inibidores, e para tentar verificar se as diferenças encontradas entre a toxina hemorrágica Atr-I e a não-hemorrágica Leuc-a também se aplicam às outras SVMP. Com relação aos estudos com os inibidores, seria de grande importância tentar validar as metodologias computacionais empregadas nesse trabalho realizando ensaios experimentais que possam determinar com maior precisão os modos de ligação e a afinidade dos inibidores pelas toxinas. Para determinar os modos de ligação dos inibidores é necessário utilizar a técnica de cristalografia por raios x, que permitirá verificar a aplicabilidade da abordagem computacional utilizada nesse trabalho para identificar esses modos de ligação de inibidores de SVMP que não possuem dados experimentais. Essa identificação é fundamental para obter cálculos de energia livre de ligação mais precisos e para determinar com maior confiabilidade as interações entre as toxinas e os inibidores. Para tentar determinar experimentalmente a afinidade dos inibidores pelas toxinas, realizamos ensaios de cinética enzimática. Entretanto, tivemos dificuldades devido à necessidade de utilização de concentrações maiores de substrato do que a permitida pela solubilidade desse composto para determinar os valores de Km, o que impediu a determinação dos valores de Ki e, consequentemente, a determinação experimental da energia livre de ligação. Além disso, a baixa quantidade disponível de substrato impediu calcular com maior precisão os valores de IC50, que poderiam ser obtidos pela repetição dos ensaios com concentrações que produziram medidas com grande desvio padrão. Por esses motivos, seria de grande importância a realização de ensaios de calorimetria com a técnica ITC para poder medir a afinidade dos inibidores pelas toxinas com maior precisão que os ensaios de cinética enzimática, permitindo uma comparação direta entre a energia livre de ligação calculada computacionalmente e determinada experimentalmente. 119 Apesar dessas técnicas apresentarem como desvantagem a necessidade de grandes quantidades de proteínas, as toxinas utilizadas nesse trabalho estão presentes em grandes quantidades nos venenos, permitindo a obtenção de grandes quantidades de proteínas após a elaboração de um protocolo de purificação. Uma outra possibilidade de verificar a acurácia das metodologias computacionais empregadas para os cálculos de energia livre e seleção dos modos de ligação seria tentar reproduzir dados disponíveis na literatura de trabalhos com outras metaloproteases do grupo da metzincinas com essas metodologias. Outra etapa fundamental na continuidade deste trabalho para a descoberta de novos inibidores é a realização da segunda etapa da triagem virtual empregando as conformações das toxinas geradas nas simulações de DM. Seriam empregados os ligantes selecionados na primeira etapa da triagem, seguido pela realização de simulações de dinâmica molecular para realizar os cálculos de variação de energia livre com a técnica de QM/MM-PBSA. Após esses cálculos, os compostos que apresentarem melhores resultados serão adquiridos para realização de ensaios experimentais. Isso implica também na automatização de muitas etapas no protocolo computacional desenvolvido nesse trabalho, para poder utilizar o maior número de compostos possível com os recursos computacionais disponíveis. É importante ressaltar que antes de realizar os cálculos de energia livre será necessário verificar se esses cálculos, com o protocolo utilizado nesse trabalho, serão capazes de reproduzir dados experimentais com as toxinas estudadas ou com os dados da literatura. Com relação a identificação das características estruturais das SVMP relacionadas com a presença ou ausência de atividade hemorrágica, será necessário verificar se as duas principais diferenças encontradas entre as toxinas estudadas, a flexibilidade da alça Ω e o potencial eletrostático ao redor do sítio catalítico, se aplicam às demais SVMP. Essa verificação será realizada com outras estruturas disponíveis no PDB e com modelos tridimensionais de toxinas com sequências depositadas no UNIPROT, que podem ser produzidos devido a alta similaridade estrutural entre esse grupo de enzimas. 120 8 – Agradecimentos Gostaria de agradecer: • aos meus orientadores Rafaela Ferreira, Eladio Sanchez, Dimas Suarez e Natalia Diaz; • aos professores Adriano Pimenta, Marcelo Santoro (in memoriam), Ronaldo Nagem, e aos doutores Francisco Santos e Rodrigo Ferreira; • aos professores Alfredo Goes, Eliane Novato, Glória Franco e Miguelito; • aos colegas de laboratório e do curso de Bioinformática; • aos colegas da FUNED, principalmente à minha chefa Dra. Eshter Bastos e à Regina de Souza; • à minha família; • ao Jóbil; • à professora Ciléa Tavares; • aos amigos Ana Paula, Cristiano, Clóvis, Daniel, Ricardo e Frederico; • aos amigos José, Hector, Karol, Natalia; • à todos os amigos da biologia, principalmente aos doutores Alice Machado e Francisco Lobo. 121 9 – Referências bibliográficas 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. Dos Santos, J. I. et al. Structural and functional studies of a bothropic myotoxin complexed to rosmarinic acid: new insights into Lys49-PLA₂ inhibition. PLoS One 6, e28521 (2011). Patiño, A. C. et al. Isolation and biological characterization of Batx-I, a weak hemorrhagic and fibrinogenolytic PI metalloproteinase from Colombian Bothrops atrox venom. Toxicon 56, 936–43 (2010). Gutiérrez, J. M. & Rucavado, a. Snake venom metalloproteinases: their role in the pathogenesis of local tissue damage. Biochimie 82, 841–50 (2000). Bello, C. a et al. Isolation and biochemical characterization of a fibrinolytic proteinase from Bothrops leucurus (white-tailed jararaca) snake venom. Biochimie 88, 189–200 (2006). Sanchez, E. F. et al. Structural and functional characterization of a P-III metalloproteinase, leucurolysin-B, from Bothrops leucurus venom. Arch. Biochem. Biophys. 468, 193–204 (2007). Gutiérrez, J. M., Escalante, T. & Rucavado, A. Experimental pathophysiology of systemic alterations induced by Bothrops asper snake venom. Toxicon 54, 976–87 (2009). Sanchez, E. F. et al. The novel metalloproteinase atroxlysin-I from Peruvian Bothrops atrox (Jergón) snake venom acts both on blood vessel ECM and platelets. Arch. Biochem. Biophys. 496, 9–20 (2010). Gomes, M. S. R. et al. Purification and functional characterization of a new metalloproteinase (BleucMP) from Bothrops leucurus snake venom. Comp. Biochem. Physiol. C. Toxicol. Pharmacol. 153, 290–300 (2011). Nunes, E. D. S. et al. Purification of a lectin with antibacterial activity from Bothrops leucurus snake venom. Comp. Biochem. Physiol. B. Biochem. Mol. Biol. 159, 57–63 (2011). Calvete, J. J., Juárez, P. & Sanz, L. Snake venomics. Strategy and applications. in J. Mass Spectrom. 42, 1405–1414 (2007). Ferreira, R. N. et al. Complete amino-acid sequence, crystallization and preliminary X-ray diffraction studies of leucurolysin-a, a nonhaemorrhagic metalloproteinase from Bothrops leucurus snake venom. Acta Crystallogr. Sect. F. Struct. Biol. Cryst. Commun. 65, 798–801 (2009). Lingott, T., Schleberger, C., Gutiérrez, J. M. & Merfort, I. High-resolution crystal structure of the snake venom metalloproteinase BaP1 complexed with a peptidomimetic: insight into inhibitor binding. Biochemistry 48, 6166–74 (2009). Watanabe, L. et al. Amino acid sequence and crystal structure of BaP1, a metalloproteinase from Bothrops asper snake venom that exerts multiple tissue-damaging activities. Protein Sci. 12, 2273– 2281 (2003). Markland, F. S. & Swenson, S. Snake venom metalloproteinases. Toxicon 62, 3–18 (2013). Escalante, T., Franceschi, a, Rucavado, a & Gutiérrez, J. M. Effectiveness of batimastat, a synthetic inhibitor of matrix metalloproteinases, in neutralizing local tissue damage induced by BaP1, a hemorrhagic metalloproteinase from the venom of the snake bothrops asper. Biochem. Pharmacol. 60, 269–74 (2000). Berman, H. M. et al. The Protein Data Bank. Nucleic Acids Res. 28, 235–242 (2000). Gomis-Rüth, F. X. Catalytic domain architecture of metzincin metalloproteases. J. Biol. Chem. 284, 15353–7 (2009). Takeda, S. Three-dimensional domain architecture of the ADAM family proteinases. Semin. Cell Dev. Biol. 20, 146–52 (2009). Takeda, S., Takeya, H. & Iwanaga, S. Snake venom metalloproteinases: structure, function and relevance to the mammalian ADAM/ADAMTS family proteins. Biochim. Biophys. Acta 1824, 164–76 (2012). Goor, H. Van. Adamalysins in biology and disease. J. … 1, 277–286 (2009). Alföldi, J., Palma, F. Di, Grabherr, M. & Williams, C. The genome of the green anole lizard and a 122 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. comparative analysis with birds and mammals. Nature 477, 587–591 (2011). Casewell, N. R. On the ancestral recruitment of metalloproteinases into the venom of snakes. Toxicon 60, 449–54 (2012). Schrodinger, L. The PyMOL Molecular Graphics System. (2010). Haupt, V. J. & Schroeder, M. Old friends in new guise: repositioning of known drugs with structural bioinformatics. Brief. Bioinform. 12, 312–26 (2011). Kalinina, O. V, Wichmann, O., Apic, G. & Russell, R. B. Combinations of protein-chemical complex structures reveal new targets for established drugs. PLoS Comput. Biol. 7, e1002043 (2011). Schlick, T. Molecular Modeling and Simulation - an interdisciplinary guide. (Springer, 2006). Sant’Anna, C. M. Métodos de Modelagem Molecular para Estudo e Planejamento de Compostos Bioativos: Uma Introdução. Rev. Virtual Química 1, (2009). Jacobsen, J. a, Fullagar, J. L., Miller, M. T. & Cohen, S. M. Identifying chelators for metalloprotein inhibitors using a fragment-based approach. J. Med. Chem. 54, 591–602 (2011). Klimes, J. & Michaelides, A. Perspective: Advances and challenges in treating van der Waals dispersion forces in density functional theory. J. Chem. Phys. 137, (2012). Becke, A. D. A new mixing of Hartree–Fock and local density-functional theories. J. Chem. Phys. 98, 1372 (1993). Rayón, V. M., Valdés, H., Díaz, N. & Suárez, D. Monoligand Zn(II) complexes: Ab initio benchmark calculations and comparison with density functional theory methodologies. J. Chem. Theory Comput. 4, 243–256 (2008). Elstner, M. et al. Self-consistent-charge density-functional tight-binding method for simulations of complex materials properties. Phys. Rev. B 58, 7260–7268 (1998). Elstner, M., Hobza, P., Frauenheim, T., Suhai, S. & Kaxiras, E. Hydrogen bonding and stacking interactions of nucleic acid base pairs: A density-functional-theory based treatment. J. Chem. Phys. 114, 5149 (2001). Stewart, J. J. P. Application of the PM6 method to modeling proteins. J. Mol. Model. 15, 765–805 (2009). Field, Martin J. Paul A. Bash, Karplus, M. A combined quantum mechanical and molecular mechanical potential for molecular dynamics simulations. J. Comput. Chem. 11, 700–733 (1990). Díaz, N., Suárez, D., Merz, K. M. & Sordo, T. L. Molecular dynamics simulations of the TEM-1 beta-lactamase complexed with cephalothin. J. Med. Chem. 48, 780–791 (2005). Raha, K. & Merz, K. M. A quantum mechanics-based scoring function: study of zinc ion-mediated ligand binding. J. Am. Chem. Soc. 126, 1020–1 (2004). Ryde, U. Combined quantum and molecular mechanics calculations on metalloproteins. Curr. Opin. Chem. Biol. 7, 136–142 (2003). Frisch MJ, Trucks GW, Schlegel HB, Scuseria GE, Robb MA, Cheeseman JR, Scalmani G, Barone V, Mennucci B, Petersson GA, Nakatsuji H, Caricato M, Li X, Hratchian HP, Izmaylov AF, Bloino J, Zheng G, Sonnenberg JL, Hada M, Ehara M, Toyota K, Fukuda R, Hasegaw, F. D. Gaussian 09. (2009). Leach, A. R. Molecular Modelling - Principles and Applications. (Pearson, 2001). Métodos de química teórica e modelagem molecular. (Livraria da Física, 2007). Cornell, W. D. et al. A Second Generation Force Field for the Simulation of Proteins, Nucleic Acids, and Organic Molecules. J. Am. Chem. Soc. 117, 5179–5197 (1995). MacKerell, A. & Bashford, D. All-Atom Empirical Potential for Molecular Modeling and Dynamics Studies of Proteins. J. … 5647, 3586–3616 (1998). Christen, M. et al. The GROMOS software for biomolecular simulation: GROMOS05. J. Comput. Chem. 26, 1719–1751 (2005). Jorgensen, W. L., Maxwell, D. S. & Tirado-Rives, J. Development and Testing of the OLPS AllAtom Force Field on Conformational Energetics and Properties of Organic Liquids. J. Am. Chem. Soc. 118, 11225–11236 (1996). 123 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. Halgren, T. A. Merck molecular force field. I. Basis, form, scope, parameterization, and performance of MMFF94. J. Comput. Chem. 17, 490–519 (1996). Wang, J., Wolf, R. M., Caldwell, J. W., Kollman, P. a & Case, D. a. Development and testing of a general amber force field. J. Comput. Chem. 25, 1157–74 (2004). Goh, B. C. et al. Atomic Modeling of an Immature Retroviral Lattice Using Molecular Dynamics and Mutagenesis. Structure 23, 1414–1425 (2015). Eswar, N. et al. Comparative protein structure modeling using MODELLER. Curr. Protoc. Protein Sci. Chapter 2, Unit 2.9 (2007). Sali, a. Comparative protein modeling by satisfaction of spatial restraints. Mol. Med. Today 1, 270–7 (1995). Martí-Renom, M. & Stuart, A. Comparative protein structure modeling of genes and genomes. Comp. protein Struct. Model. genes genomes 291–325 (2000). at <http://www.annualreviews.org/doi/pdf/10.1146/annurev.biophys.29.1.291> Laskowski, R. A., MacArthur, M. W., Moss, D. S. & Thornton, J. M. PROCHECK: a program to check the stereochemical quality of protein structures. J. Appl. Crystallogr. 26, 283–291 (1993). Benkert, P., Tosatto, S. C. E. & Schomburg, D. QMEAN: A comprehensive scoring function for model quality assessment. Proteins 71, 261–77 (2008). Shen, M. & Sali, A. Statistical potential for assessment and prediction of protein structures. Protein Sci. 2507–2524 (2006). doi:10.1110/ps.062416606.Instead Liu, T., Tang, G. W. & Capriotti, E. Comparative modeling: the state of the art and protein drug target structure prediction. Comb. Chem. High Throughput Screen. 14, 532–547 (2011). Wiederstein, M. & Sippl, M. J. ProSA-web: interactive web service for the recognition of errors in three-dimensional structures of proteins. Nucleic Acids Res. 35, W407–10 (2007). Sippl, M. J. Calculation of conformational ensembles from potentials of mean force. An approach to the knowledge-based prediction of local structures in globular proteins. J. Mol. Biol. 213, 859– 83 (1990). Jorgensen, W. L. Efficient drug lead discovery and optimization. Acc. Chem. Res. 42, 724–33 (2009). Ferreira, R. S. et al. Complementarity between a docking and a high-throughput screen in discovering new cruzain inhibitors. J. Med. Chem. 53, 4891–905 (2010). Irwin, J. J., Raushel, F. M. & Shoichet, B. K. Virtual screening against metalloenzymes for inhibitors and substrates. Biochemistry 44, 12316–28 (2005). Jorgensen, W. L. The many roles of computation in drug discovery. Science 303, 1813–8 (2004). Kobilka, B. K. et al. Structure-based discovery of beta 2-adrenergic receptor ligands. 106, (2009). Irwin, J. & Shoichet, B. ZINC-a free database of commercially available compounds for virtual screening. J. Chem. Inf. … 45, 177–182 (2005). Cavasotto, C. N. Homology models in docking and high-throughput docking. Curr. Top. Med. Chem. 11, 1528–34 (2011). Fan, H. et al. Molecular docking screens using comparative models of proteins. J. Chem. Inf. Model. 49, 2512–27 (2009). Bolstad, E. S. D. & Anderson, A. C. In pursuit of virtual lead optimization: pruning ensembles of receptor structures for increased efficiency and accuracy during docking. Proteins 75, 62–74 (2009). Shoichet, B. K. Virtual screening of chemical libraries. Nature 432, 862–5 (2004). Tomlinson, S. M. et al. Structure-based discovery of dengue virus protease inhibitors. Antiviral Res. 82, 110–4 (2009). Jaghoori, M. M., Bleijlevens, B. & Olabarriaga, S. D. 1001 Ways to run AutoDock Vina for virtual screening. J. Comput. Aided. Mol. Des. (2016). doi:10.1007/s10822-016-9900-9 Trott, O. & Olson, A. AutoDock Vina%: Improving the Speed and Accuracy of Docking with a New Scoring Function, Efficient Optimization, and Multithreading. J. Comput. Chem. (2010). doi:10.1002/jcc 124 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. Durrant, J. D. & McCammon, J. A. Molecular dynamics simulations and drug discovery. BMC Biol. 9, 71 (2011). Chaskar, P., Zoete, V. & Röhrig, U. F. Towards On-The-Fly QM / MM Docking%: Development and Benchmark of a Scoring Function. J. Chem. Inf. Model. 54, 3137–3152 (2014). Lin, J. & Perryman, A. The Relaxed Complex Method: Accommodating Receptor Flexibility for Drug Design with an Improved Scorin Scheme. Biopolymers (2003). at <http://onlinelibrary.wiley.com/doi/10.1002/bip.10218/full> Case DA, Berryman JT, Betz RM, Cerutti DS, Cheatham TEI, Darden TA, Duke RE, G. T., Gohlke H, Goetz AW, Homeyer N, Izadi S, Janowski P, Kaus J, Kovalenko A, Lee TS, LeGrand S, L., P, Luchko T, Luo R, Madej B, Merz KM, Monard G, Needham P, Nguyen H, Nguyen HT, O. I., Onufriev A, Roe DR, Roitberg A, Salomon-Ferrer R, Simmerling CL, Smith W, Swails J, W. R. & Wang J, Wolf RM, Wu X, York DM, K. P. AMBER 14. (2015). Case, D. A. et al. The Amber biomolecular simulation programs. J. Comput. Chem. 26, 1668–88 (2005). Wang, J., Wang, W., Kollman, P. A. & Case, D. A. Automatic atom type and bond type perception in molecular mechanical calculations. J. Mol. Graph. Model. 25, 247–260 (2006). Walker, R. C., Crowley, I. F. & Case, D. A. The implementation of a fast and accurate QM/MM potential method in Amber. J. Comput. Chem. 29, 1019–1031 (2008). Salomon-Ferrer, R., Götz, A. W., Poole, D., Le Grand, S. & Walker, R. C. Routine Microsecond Molecular Dynamics Simulations with AMBER on GPUs. 2. Explicit Solvent Particle Mesh Ewald. J. Chem. Theory Comput. 9, 3878–3888 (2013). Le Grand, S., Götz, A. W. & Walker, R. C. SPFP: Speed without compromise - A mixed precision model for GPU accelerated molecular dynamics simulations. Comput. Phys. Commun. 184, 374– 380 (2013). Amaro, R. E., Baron, R. & McCammon, J. A. An improved relaxed complex scheme for receptor flexibility in computer-aided drug design. J. Comput. Aided. Mol. Des. 22, 693–705 (2008). Kollman, P. a et al. Calculating structures and free energies of complex molecules: combining molecular mechanics and continuum models. Acc. Chem. Res. 33, 889–97 (2000). Kollman, P. Free energy calculations: Applications to chemical and biochemical phenomena. Chem. Rev. 93, 2395–2417 (1993). Beveridge, D. L. & DiCapua, F. M. Free energy via molecular simulation: applications to chemical and biomolecular systems. Annu. Rev. Biophys. Biophys. Chem. 18, 431–92 (1989). Homeyer, N. & Gohlke, H. Free energy calculations by the Molecular Mechanics PoissonBoltzmann Surface Area method. Mol. Inform. 31, 114–122 (2012). Hou, T., Wang, J., Li, Y. & Wang, W. Assessing the performance of the molecular mechanics/Poisson Boltzmann surface area and molecular mechanics/generalized Born surface area methods. II. The accuracy of ranking poses generated from docking. J. Comput. Chem. 32, 866–77 (2011). Baron, R. & McCammon, J. A. Molecular recognition and ligand association. Annu. Rev. Phys. Chem. 64, 151–75 (2013). Genheden, S. & Ryde, U. The MM/PBSA and MM/GBSA methods to estimate ligand-binding affinities. Expert Opin. Drug Discov. 10, 449–61 (2015). Sitkoff, D., Sharp, K. A. & Honig, B. Accurate Calculation of Hydration Free Energies Using Macroscopic Solvent Models. J. Phys. Chem. 98, 1978–1988 (1994). Tan, C., Tan, Y. H. & Luo, R. Implicit nonpolar solvent models. J. Phys. Chem. B 111, 12263– 12274 (2007). Karplus, M. & Kushick, J. N. Method for estimating the configurational entropy of macromolecules. Macromolecules 14, 325–332 (1981). Srinivasan, J., Cheatham, T. E., Cieplak, P., Kollman, P. a. & Case, D. a. Continuum solvent studies of the stability of DNA, RNA, and phosphoramidate-DNA helices. J. Am. Chem. Soc. 120, 9401–9409 (1998). 125 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. Still, W. C., Tempczyk, A., Hawley, R. C. & Hendrickson, T. Semianalytical treatment of solvation for molecular mechanics and dynamics. J. Am. Chem. Soc. 112, 6127–6129 (1990). Case DA, Berryman JT, Betz RM, Cerutti DS, Cheatham TEI, Darden TA, Duke RE, G. T., Gohlke H, Goetz AW, Homeyer N, Izadi S, Janowski P, Kaus J, Kovalenko A, Lee TS, LeGrand S, L., P, Luchko T, Luo R, Madej B, Merz KM, Monard G, Needham P, Nguyen H, Nguyen HT, O. I., Onufriev A, Roe DR, Roitberg A, Salomon-Ferrer R, Simmerling CL, Smith W, Swails J, W. R. & Wang J, Wolf RM, Wu X, York DM, K. P. Manual AMBER 14. (2014). Kaukonen, M., Heimdal, J. & Ryde, U. QM / MM-PBSA Method To Estimate Free Energies for Reactions in Proteins ¨ r So. 20, 12537–12548 (2008). Magrane, M. & Consortium, U. P. UniProt Knowledgebase: A hub of integrated protein data. Database 2011, 1–13 (2011). Altschul, S. F., Gish, W., Miller, W., Myers, E. W. & Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, 403–410 (1990). McGuffin, L. J., Buenavista, M. T. & Roche, D. B. The ModFOLD4 server for the quality assessment of 3D protein models. Nucleic Acids Res. 41, W368–W372 (2013). Eramian D, Shen M-Y, Melo F, Pieper UW, B., S. A. ModEval. (2013). Benkert, P., Künzli, M. & Schwede, T. QMEAN server for protein model quality estimation. Nucleic Acids Res. 37, W510–4 (2009). Anandakrishnan, R., Aguilar, B. & Onufriev, A. V. H++ 3.0: Automating pK prediction and the preparation of biomolecular structures for atomistic molecular modeling and simulations. Nucleic Acids Res. 40, 537–541 (2012). Sharp K, H. B. Electrostatic Interactions in Macromolecules: Theory and Applications. Annu. Rev. Biophys. Biophys. Chem. 19, 301–302 (1991). Grimsley, G. R., Scholtz, J. M. & Pace, C. N. A summary of the measured pK values of the ionizable groups in folded proteins. Protein Sci. 18, 247–251 (2009). Supuran, C. T. & Winum, J.-Y. Drug design of zinc-enzymes inhibitors. (Wiley, 2009). MarvinSketch. at <www.chemaxon.com> Maier, J. A. et al. ff14SB: Improving the Accuracy of Protein Side Chain and Backbone Parameters from ff99SB. J. Chem. Theory Comput. 11, 3696–3713 (2015). Hornak, V. et al. Comparison of Multiple Amber Force Fields and Development of Improved Protein Backbone Parameters. 725, 712–725 (2006). Li, P., Roberts, B. P., Chakravorty, D. K. & Merz, K. M. Rational design of particle mesh ewald compatible lennard-jones parameters for +2 metal cations in explicit solvent. J. Chem. Theory Comput. 9, 2733–2748 (2013). Jorgensen, W. L., Chandrasekhar, J., Madura, J. D., Impey, R. W. & Klein, M. L. Comparison of simple potential functions for simulating liquid water. J. Chem. Phys. 79, 926 (1983). Krüger, T., Elstner, M., Schiffels, P. & Frauenheim, T. Validation of the density-functional based tight-binding approximation method for the calculation of reaction energies and other data. J. Chem. Phys. 122, 114110 (2005). Moreira, N. H., Dolgonos, G., Aradi, B., da Rosa, A. L. & Frauenheim, T. Toward an Accurate Density-Functional Tight-Binding Description of Zinc-Containing Compounds. J. Chem. Theory Comput. 5, 605–614 (2009). Francl, M. M. et al. Self-consistent molecular orbital methods. XXIII. A polarization-type basis set for second-row elements. J. Chem. Phys. 77, 3654–3665 (1982). Rassolov, V. A., Pople, J. A., Ratner, M. A. & Windus, T. L. 6-31G∗ basis set for atoms K through Zn. J. Chem. Phys. 109, 1223 (1998). Cossi, M., Rega, N., Scalmani, G. & Barone, V. Energies, structures, and electronic properties of molecules in solution with the C-PCM solvation model. J. Comput. Chem. 24, 669–681 (2003). Bayly, C. C. I., Cieplak, P., Cornell, W. D. & Kollman, P. a. A well-behaved electrostatic potential based method using charge restraints for deriving atomic charges: the RESP model. J. Phys. Chem. 97, 10269–10280 (1993). 126 115. 116. 117. 118. 119. 120. 121. 122. 123. 124. 125. 126. 127. 128. 129. 130. 131. 132. 133. 134. 135. 136. 137. 138. Izaguirre, J. A., Catarello, D. P., Wozniak, J. M. & Skeel, R. D. Langevin stabilization of molecular dynamics. J. Chem. Phys. 114, 2090 (2001). Ryckaert, J.-P., Ciccotti, G. & Berendsen, H. J. . Numerical integration of the cartesian equations of motion of a system with constraints: molecular dynamics of n-alkanes. J. Comput. Phys. 23, 327–341 (1977). Morris, G. M. et al. AutoDock4 and AutoDockTools4: Automated Docking with Selective Receptor Flexibility. J. Comput. Chem. 30, 2785–2791 (2010). Huey, R., Morris, G. M., Olson, A. J. & Goodsell, D. S. A semiempirical free energy force field with charge-based desolvation. J. Comput. Chem. 28, 1145–1152 (2007). Hu, X. & Shelver, W. H. Docking studies of matrix metalloproteinase inhibitors: zinc parameter optimization to improve the binding free energy prediction. J. Mol. Graph. Model. 22, 115–126 (2003). Santos-Martins, D., Forli, S., Ramos, M. J. & Olson, A. J. AutoDock4Zn: An improved AutoDock forcefield for small-molecule docking to zinc metalloproteins. J. Chem. Inf. Model. 54, 2371−2379 (2014). Fabre, B. et al. An Integrated Computational and Experimental Approach to Gaining Selectivity for MMP-2 within the Gelatinase Subfamily. ChemBioChem 15, 399–412 (2014). Feig, M., Karanicolas, J. & Brooks, C. L. MMTSB Tool Set: enhanced sampling and multiscale modeling methods for applications in structural biology. J. Mol. Graph. Model. 22, 377–95 (2004). Galindo-Murillo, R., Roe, D. R. & Cheatham, T. E. Convergence and reproducibility in molecular dynamics simulations of the DNA duplex d(GCACGAACGAACGAACGC). Biochim. Biophys. Acta 1850, 1041–1058 (2014). Genheden, S., Kuhn, O., Mikulskis, P., Hoffmann, D. & Ryde, U. The normal-mode entropy in the MM/GBSA method: Effect of system truncation, buffer region, and dielectric constant. J. Chem. Inf. Model. 52, 2079–2088 (2012). Suárez, E., Díaz, N., Méndez, J. & Suárez, D. CENCALC: A computational tool for conformational entropy calculations from molecular simulations. J. Comput. Chem. 34, 2041– 2054 (2013). Carlsson, J. & Aqvist, J. Absolute and relative entropies from computer simulatio with application to ligand binding. J. Phys. Chem. B 109, 6448–6456 (2005). Baker, N. A., Sept, D., Joseph, S., Holst, M. J. & McCammon, J. A. Electrostatics of nanosystems: Application to microtubules and the ribosome. Proc. Natl. Acad. Sci. 98, 10037–10041 (2001). Sanner, M. F., Olson, a J. & Spehner, J. C. Reduced surface: an efficient way to compute molecular surfaces. Biopolymers 38, 305–320 (1996). Pettersen, E. F. et al. UCSF Chimera--a visualization system for exploratory research and analysis. J. Comput. Chem. 25, 1605–12 (2004). Schmidtke, P., Bidon-Chanal, A., Luque, F. J. & Barril, X. MDpocket: open-source cavity detection and characterization on molecular dynamics trajectories. Bioinformatics 27, 3276–3285 (2011). Le Guilloux, V., Schmidtke, P. & Tuffery, P. Fpocket: An open source platform for ligand pocket detection. BMC Bioinformatics 10, 168 (2009). Software, G. GraphPad Prism. at <www.graphpad.com> Dallakyan, S. MGLTools. (2010). at <http://mgltools.scripps.edu/> Schaftenaar, G. & Noordik, J. H. Molden: A pre- and post-processing program for molecular and electronic structures. J. Comput. Aided. Mol. Des. 14, 123–134 (2000). Humphrey, W., Dalke, a & Schulten, K. VMD: visual molecular dynamics. J. Mol. Graph. 14, 33–8, 27–8 (1996). Evans, D. A. & Rubenstein, S. Chemdraw14. (2014). at <http://www.cambridgesoft.com/> Eaton, J. W., Bateman, D., Hauberg, S. & Wehbring, R. GNU Octave. (2014). Team, R. D. C. R: A Language and Environment for Statistical Computing. (2013). at 127 139. 140. 141. 142. 143. 144. 145. 146. 147. 148. 149. 150. 151. <http://www.r-project.org> Eramian, D. et al. ModEval. at <http://modbase.compbio.ucsf.edu/evaluation/> Howes, J.-M., Theakston, R. D. G. & Laing, G. D. Neutralization of the haemorrhagic activities of viperine snake venoms and venom metalloproteinases using synthetic peptide inhibitors and chelators. Toxicon 49, 734–9 (2007). Bissett, D. et al. Phase III Study of Matrix Metalloproteinase Inhibitor Prinomastat in Non-SmallCell Lung Cancer. J. Clin. Oncol. 23, 842–849 (2005). Rothenberg, M. L., Nelson, a R. & Hande, K. R. New drugs on the horizon: matrix metalloproteinase inhibitors. Stem Cells 17, 237–40 (1999). Sparano, J. A. et al. Randomized Phase III Trial of Marimastat Versus Placebo in Patients With Metastatic Breast Cancer Who Have Responding or Stable Disease After First-Line Chemotherapy: Eastern Cooperative Oncology Group Trial E2196. J. Clin. Oncol. 22, 4683–4690 (2004). Paes Leme, A. F. et al. High resolution analysis of snake venom metalloproteinase (SVMP) peptide bond cleavage specificity using proteome based peptide. J. Proteomics 74, 401–10 (2011). Supuran, C. T. Drug design of zinc-enzyme inhibitors. (Wiley, 2009). Díaz, N. & Suárez, D. Peptide hydrolysis catalyzed by matrix metalloproteinase 2: a computational study. J. Phys. Chem. B 112, 8412–24 (2008). Singh, T., Adekoya, O. A. & Jayaram, B. Understanding the binding of inhibitors of matrix metalloproteinases by molecular docking, quantum mechanical calculations, molecular dynamics simulations, and a MMGBSA/MMBappl study. Mol. Biosyst. 11, 1041–1051 (2015). Lingott, T., Merfort, I. & Steinbrecher, T. Free energy calculations on snake venom metalloproteinase BaP1. Chem. Biol. Drug Des. 79, 990–1000 (2012). Díaz, N., Suarez, D. & Sordo, T. L. Quantum chemical study on the coordination environment of the catalytic zinc ion in matrix metalloproteinases. J. Phys. Chem. B 110, 24222–30 (2006). Houa, T., Wangb, J., Lia, Y. & Wang, W. Assessing the performance of the MM/PBSA and MM/GBSA methods: I. The accuracy of binding free energy calculations based on molecular dynamics simulations. J. Chem. Inf. Comput. Sci. 51, 69–82 (2011). Wallnoefer, H. G., Lingott, T., Gutiérrez, J. M., Merfort, I. & Liedl, K. R. Backbone flexibility controls the activity and specificity of a protein-protein interface: specificity in snake venom metalloproteases. J. Am. Chem. Soc. 132, 10330–7 (2010). 128