Título Identificação de inibidores das metaloproteases de veneno de

Transcrição

Título Identificação de inibidores das metaloproteases de veneno de
Tese de Doutorado do Programa de
Pós-graduação em Bioinformática da UFMG
Título
Identificação de inibidores das metaloproteases de veneno de
serpente atroxlisina-I e leucurolisina-a através de triagem
virtual, dinâmica molecular e avaliação experimental
Aluno: Raoni Almeida de Souza
Orientadora: Rafaela Salgado Ferreira
Co-orientador: Eladio Flores Sanchez
Co-orientadores estrangeiros: Dimas Suarez Rodriguez
Natalia Diaz Fernandez
Índice
Índice!.........................................................................................................................................................!1!
Lista de Figuras e Tabelas!.....................................................................................................................!3!
Resumo!......................................................................................................................................................!5!
Abstract!.....................................................................................................................................................!7!
1 – Introdução!..........................................................................................................................................!9!
1.1 – Acidentes com serpentes!..........................................................................................................................!9!
1.2 - Metaloproteases de veneno de serpentes!................................................................................................!9!
1.3 - Metaloproteases relacionadas às SVMPs!........................................................................................!12!
1.4 - Modelagem molecular!............................................................................................................................!15!
1.4.1 – Mecânica quântica!..........................................................................................................................................!15!
1.4.2 – Mecânica molecular!.......................................................................................................................................!17!
1.4.3 - Campos de força!...............................................................................................................................................!18!
1.4.4 - Modelagem comparativa de proteínas!......................................................................................................!20!
1.4.5 - Docking aplicado à triagem virtual!...........................................................................................................!25!
1.4.6 - Limitações da triagem virtual utilizando docking!...........................................................................!27!
1.4.7 – Dinâmica Molecular – (DM)!......................................................................................................................!28!
1.4.7.1 – Aplicações na descoberta de inibidores!..............................................................................................................!30!
1.4.8 – Cálculos de variação de energia livre!......................................................................................................!30!
1.4.9 - MM-PBSA e variantes!....................................................................................................................................!31!
2 - Justificativa!......................................................................................................................................!34!
3 - Objetivos!..........................................................................................................................................!36!
3.1 - Objetivos principais!................................................................................................................................!36!
3.2 - Objetivos específicos!..............................................................................................................................!36!
4 – Metodologia!....................................................................................................................................!38!
4. 1 – Modelagem comparativa da toxina atroxlisina-I!.............................................................................!38!
4.2 – Cálculos do estado de ionização dos resíduos das toxinas!..............................................................!39!
4.3 – Seleção de inibidores de metaloproteases de amplo espectro!..........................................................!39!
4.4 – Produção de parâmetros para simulações de DM!............................................................................!40!
4.4.1 – Modelos da Leuc-a e Atr-I complexadas com o tripeptídeo QSW!................................................!40!
4.4.2 –Definição do estado de protonação de átomos coordenados ao zinco.!.........................................!41!
4.4.3 – Produção de parâmetros para o ambiente químico do Zn2+!........................................................!43!
4.4.3.1 – Toxinas complexadas com inibidor endógeno!................................................................................................!43!
4.4.3.2 –Toxinas complexadas com inibidores de metaloproteases de amplo espectro!......................................!44!
4.5 – Simulações de DM!.................................................................................................................................!45!
4.5.1 – Toxinas e inibidor endógeno!.......................................................................................................................!45!
1
4.5.2 – Toxinas e inibidores de metaloproteases de amplo espectro!...........................................................!45!
4.6 - Docking dos inibidores de metaloproteases de amplo espectro!.......................................................!46!
4.6.1 – Cálculos de reavaliação das poses de docking!.....................................................................................!47!
4.7 – Análises das trajetórias das simulações de DM!................................................................................!49!
4.7.1 - Toxinas e inibidor endógeno!.......................................................................................................................!49!
4.7.2.1 - Cálculos de energia livre de ligação - toxinas e inibidores de amplo espectro!....................................!50!
4.7.2.2 – Função de pontuação aplicada às poses extraídas das simulações de DM!..........................................!51!
4.8 – Cálculos do potencial eletrostático!......................................................................................................!53!
4.9 – Análises de cavidades!............................................................................................................................!54!
4.10 – Cinética enzimática!..............................................................................................................................!55!
4.11 – Triagem virtual!.....................................................................................................................................!55!
4.12 – Análise de estruturas!...........................................................................................................................!56!
4.13 – Análise estatísticas!...............................................................................................................................!56!
5 - Resultados!........................................................................................................................................!57!
5.1 - Modelagem Comparativa!.......................................................................................................................!57!
5.2 - Cálculos de pKa!.......................................................................................................................................!61!
5.3 - Ensaios de cinética enzimática com inibidores de metaloproteases de amplo espectro!..............!64!
5.4 - Simulações de DM!..................................................................................................................................!69!
5.4.1 – Escolha do estado de protonação de resíduos do sítio catalítico!...................................................!69!
5.4.2 - Simulações de DM com inibidor endógeno!............................................................................................!71!
5.4.2.1 - Análises de agrupamento da alça Ω!.....................................................................................................................!76!
5.4.2.2 - Análises de agrupamento do sítio ativo!...............................................................................................................!78!
5.4.2.3 - Análise de cavidades!...................................................................................................................................................!79!
5.4.2.4 – Interações entre as toxinas e inibidor endógeno!............................................................................................!82!
5.4.2.5 – Cálculos dos potenciais eletrostáticos e das superfícies moleculares!.....................................................!84!
5.4.3 - Inibidores de metaloproteases de amplo espectro!................................................................................!85!
5.4.3.1 – Simulações de docking!.............................................................................................................................................!85!
5.4.3.2 - Interações entre as toxinas e os ligantes!............................................................................................................!94!
5.4.3.3 - Cálculos de energia livre!.......................................................................................................................................!109!
5.5 – Triagem virtual!.....................................................................................................................................!115!
6 – Conclusões!....................................................................................................................................!116!
7 – Perspectivas!..................................................................................................................................!119!
8 – Agradecimentos!............................................................................................................................!121!
9 – Referências bibliográficas!..........................................................................................................!122!
2
Lista de Figuras e Tabelas
!
Tabela!1!-!Características!principais!das!SVMP!depositadas!no!banco!PDB.!....................................................................!11!
Figura!1!–!Alinhamento!estrutural!dos!sítios!catalíticos!das!ADAM17,!MMP9!e!Leuc-a.!............................................!14!
Figura!2!–!Figura!mostrando!a!acurácia!e!as!possíveis!aplicações!de!modelos!tridimensionais!de!proteínas!
construídos!por!modelagem!comparativa.!.......................................................................................................................................!23!
Figura!3!–!Inibidores!de!metaloproteases!de!amplo!espectro!utilizados!nesse!trabalho.!..........................................!40!
Figura!4!–!Sobreposição!da!estrutura!cristalográfica!com!a!estrutura!do!estado!de!protonação!da!Leuc-a!
utilizado!nas!simulações!de!DM!.............................................................................................................................................................!42!
Figura!5!–!Estrutura!da!Leuc-a!destacando!as!regiões!utilizadas!nos!cálculos!de!entropia!conformacional..!...!53!
Figura!6!–!Alinhamento!das!sequências!da!Atr-I!e!das!toxinas!utilizadas!como!moldes!para!a!modelagem!
comparativa!realizado!pelo!programa!Clustal!Omega.!As!porcentagens!indicam!a!identidade!entre!as!
sequências!com!a!Atr-I.!..............................................................................................................................................................................!57!
Tabela!2!–!Características!principais!da!atroxlisina-I!e!dos!moldes!utilizados!para!modelagem!comparativa.
!..............................................................................................................................................................................................................................!58!
Figura!7!–!Gráficos!de!ramachandran!dos!moldes!utilizados!na!modelagem!comparativa!e!do!modelo!da!Atr-I.
!..............................................................................................................................................................................................................................!59!
Tabela!3!-!Pontuações!dos!programas!de!avaliação!ModEval,!Prosa!e!Qmean!obtidas!pelo!modelo!selecionado!
da!Atr-I!e!dos!moldes!utilizados!na!modelagem!comparativa!.................................................................................................!60!
Figura!8!–!Avaliação!da!qualidade!local!e!global!do!modelo!da!Atr-I.!..................................................................................!60!
Figura!9!-!Alinhamento!estrutural!das!toxinas!Atr-I!e!Leuc-a!coloridas!por!similaridade.!........................................!61!
Tabela!4!–!Valores!de!pKa!dos!aminoácidos!ionizáveis!da!Leuc-a!e!Atr-I!considerando!4!constantes!dielétricas!
(εint%)!diferentes.!............................................................................................................................................................................................!64!
Figura!10!–!Inibidores!de!metaloproteases!de!amplo!espectro!selecionados!neste!trabalho.!.................................!66!
Tabela!5!–!Valores!de!IC50!obtidos!pelos!ensaios!de!cinética!enzimática!utilizando!os!inibidores!de!amplo!
espectro!e!a!toxina!Atr-I.!...........................................................................................................................................................................!67!
Tabela!6!–!Valores!de!IC50!obtidos!pelos!ensaios!de!cinética!enzimática!utilizando!os!inibidores!de!amplo!
espectro!e!a!toxina!Leuc-a.!.......................................................................................................................................................................!68!
Figura!11!–!Curvas!de!inibição!da!atividade!proteolítica!obtidas!pelos!ensaios!de!cinética!enzimática!
utilizando!os!inibidores!de!amplo!espectro!e!Atr-I.!......................................................................................................................!68!
Figura!12!–!Curvas!de!inibição!da!atividade!proteolítica!obtidas!pelos!ensaios!de!cinética!enzimática!
utilizando!os!inibidores!de!amplo!espectro!e!Leuc-a.!..................................................................................................................!69!
Tabela!7!–!Distâncias!interatômicas!e!ângulos!X-Zn-Y!para!a!estrutura!4Q1L!e!para!as!estruturas!otimizadas!
pelo!método!SCC-DFTB!com!diferentes!distribuição!de!cargas.!..............................................................................................!70!
Figura!13!–!Sobreposição!da!estrutura!cristalográfica!com!a!estrutura!do!estado!de!protonação!utilizado!nas!
simulações!de!DM.!.......................................................................................................................................................................................!71!
Figura!14!–!Variação!da!estrutura!da!toxina!Atr-I!medida!pelos!valores!de!RMSD.!......................................................!72!
Figura!15!–!Variação!da!estrutura!da!toxina!Leuc-a!medida!pelos!valores!de!RMSD.!..................................................!73!
Figura!16!-!Representação!da!sobreposição!da!estrutura!média!da!simulação!de!DM!(50!ns)!com!a!estrutura!
cristalográfica!(Leuc-a)!ou!com!o!modelo!comparativo!(Atr-I).!..............................................................................................!75!
Tabela!8!–!Porcentagem!da!duração!e!das!distâncias!em!Å!das!interações!entre!o!íon!Ca2+!e!os!resíduos!das!
toxinas.!..............................................................................................................................................................................................................!76!
Figura!17!–!Estrutura!das!toxinas!com!destaque!da!cadeia!principal!da!alça!Ω!dos!representantes!dos!cinco!
clusters!mais!populosos.!...........................................................................................................................................................................!77!
Figura!18!–!Sobreposição!do!sítio!ativo!das!estruturas!representativas!dos!4!agrupamentos!mais!populosos!
obtidos!das!simulações!de!DM!com!Atr-I!e!Leuc-a!utilizando!o!valor!de!RMSD!dos!aminoácidos!do!sítio!ativo.
!..............................................................................................................................................................................................................................!79!
3
Figura!19!–!Parâmetros!utilizados!pelo!programa!LEaP!para!definir!a!representação!ligada!do!zinco!e!seus!
ligantes.!.............................................................................................................................................................................................................!81!
Figura!20!–!Imagem!esquemática!das!principais!interações!entre!as!toxinas!e!o!inibidor!Gln1-Ser2-Trp3,!de!
Leuc-a!e!Atr-I..!................................................................................................................................................................................................!84!
Figura!21!–!Superfície!acessível!ao!solvente!de!pose!extraída!após!200!ns!de!simulação!colorida!em!função!do!
potencial!eletrostático.!..............................................................................................................................................................................!85!
Figura!22!–!Destaque!dos!sítios!ativos!dos!complexos!entre!as!toxinas!e!os!inibidores!de!amplo!espectro!das!
estruturas!iniciais!das!simulações!de!dinâmica.!.............................................................................................................................!87!
Figura!23!–!Parâmetros!utilizados!pelo!programa!LEaP!para!definir!a!representação!ligada!do!zinco!e!seus!
ligantes.!.............................................................................................................................................................................................................!95!
Figura!24!–!Representação!esquemática!das!principais!interações!entre!os!inibidores!de!amplo!espectro!e!as!
toxinas.!..............................................................................................................................................................................................................!98!
Figura!25!–!Variação!de!energia!de!ligação!em!kcal/mol!pelo!método!QM/MM-PBSA!dos!complexos!da!toxina!
Leuc-a!com!os!inibidores!COL!e!PRI.!.................................................................................................................................................!110!
Tabela!9!–!Média!e!desvio!padrão!das!energias!livres!de!ligação!em!kcal/mol!calculadas!pelo!método!QMMM/PBSA,!para!os!complexos!Leuc-a/inibidores.!.....................................................................................................................!111!
Tabela!10!–!Pontuação!final!obtida!pelo!inibidores!em!complexo!com!a!toxina!Atr-I..!............................................!112!
Tabela!11!–!Pontuação!final!obtida!pelo!inibidores!em!complexo!com!a!toxina!Leuc-a.!.........................................!113!
4
Resumo
Aproximadamente 90% de todos os casos de acidentes com serpentes peçonhentas no
Brasil são causados por animais da família Viperidae. Os venenos desses animais são
caracterizados por uma elevada atividade proteolítica e hemorrágica, muitas vezes causando
hemorragia sistêmica, a principal causa de morte nesses acidentes. Grande parte dos efeitos do
veneno são devidos à atividade de metaloproteases de venenos de serpentes (SVMP), um grupo
de toxinas que possui um sítio catalítico altamente conservado contendo um átomo de zinco. O
único tratamento eficaz para o envenenamento por serpente em seres humanos é a administração
intravenosa de soros antiofídicos, embora estes soros sejam relativamente ineficazes na redução
de danos locais. Portanto, compostos com atividade inibitória contra estas toxinas poderiam
representar uma terapia complementar à utilização dos soros e podem contribuir para um
tratamento mais eficaz contra esses efeitos locais.
Neste trabalho utilizamos como modelos de SVMP as estruturas tridimensionais da
toxina não-hemorrágica leucurolisina-a (código PDB 4Q1L), de Bothrops leucurus, e a toxina
hemorrágica atroxlisina-I, de Bothrops atrox, obtida por modelagem comparativa, para encontrar
inibidores para esse grupo de toxinas. Para isso utilizamos duas abordagens complementares,
selecionando seis inibidores de metaloproteases de amplo espectro e realizando triagem virtual
de compostos lead-like. Primeiramente realizamos simulações de dinâmica molecular das toxinas
com o inibidor endógeno presente na estrutura cristalográfica 4Q1L, produzindo conformações
utilizadas nas simulações de docking com inibidores de amplo espectro e para utilização
posterior na triagem virtual, com o objetivo de representar explicitamente a flexibilidade dos
receptores. Os resultados de docking foram utilizadas como estruturas iniciais das simulações de
dinâmica molecular, visando a produção de poses para cálculos de energia livre de ligação, além
de permitir identificar os principais aminoácidos responsáveis pelas interações dos complexos
enzimas-inibidores, e a identificação de diferenças estruturais que poderiam estar relacionadas
com a diferença na atividade hemorrágica das toxinas estudadas.
Para complementar os resultados computacionais, foram realizados também ensaios de
cinética enzimática, que permitiram confirmar a atividade inibitória dos inibidores de amplo
espectro, apresentando em alguns casos potência na faixa nanomolar e indicando sua possível
aplicação em acidentes com serpentes. Esse resultados também permitiram avaliar a precisão dos
5
cálculos de energia livre de ligação que, apesar não serem capazes de reproduzir exatamente a
classificação dos inibidores em função dos valores de IC50, poderiam ser utilizados na
identificação de inibidores entre os compostos lead-like selecionados por triagem virtual.
6
Abstract
Approximately 90% of all cases of accidents with poisonous snakes in Brazil are caused
by animals of the Viperidae family. The poisons of such/these animals are characterized by a
high proteolytic and hemorrhagic activity, often causing systemic bleeding, the main cause of
death in these accidents. Much of poison effects are due to the activity of metalloproteinase of
snake venoms (SVMP), a group of toxins that presents a highly conserved catalytic site
containing a zinc atom. The only effective treatment for snake poisoning in humans is the
intravenous administration of antiophidic sera, although these serum are relatively ineffective in
reducing local damage. Therefore, compounds with inhibitory activity against these toxins could
represent a complementary therapy to sera administration and may contribute to a more effective
treatment against these local effects.
In this work we use as SVMP models the three-dimensional structures of nonhemorrhagic toxin leucurolysin-a (PDB code 4Q1L), of Bothrops leucurus, and the hemorrhagic
toxin atroxlysin-I from Bothrops atrox, obtained by comparative modeling, to find inhibitors for
that group of toxins. To achieve this we used two complementary approaches, selecting six
metalloprotease inhibitors broad spectrum and conducting virtual screening with lead-like
compounds. First we performed molecular dynamics simulations of toxins with endogenous
inhibitor present in 4Q1L crystallographic structure, producing conformations used in docking
simulations with broad-spectrum inhibitors and for later use in virtual screening, aiming to
represent explicitly the flexibility of receptors. The docking results were used as initial structures
for molecular dynamics simulations, performed to produce poses for binding free energy
calculations, and also allowed to identify key amino acids responsible for enzyme-inhibitor
interaction, and to identify structural differences that could be related to the difference in the
hemorrhagic activity of the studied toxins.
In order to complement computational results, enzyme kinetics assays were also
conducted, which allowed to confirm the inhibitory activity of broad spectrum inhibitors,
presenting in some cases potency in the nanomolar range and indicating its possible application
in snakes snakes accidents. These results also allowed to evaluate the accuracy of free energy
calculations that, although being unable to exactly reproduce the raking of the inhibitors in based
7
in the IC50 values, could be used to identify inhibitors among the lead-like compounds selected
by virtual screening.
8
1 – Introdução
1.1 – Acidentes com serpentes
Acidentes com serpentes representam um grande problema de saúde pública no mundo,
fazendo parte das doenças tropicais negligenciadas1. Somente na América latina são estimados
entre 130-150 mil casos e 2300 mortes por ano2, resultando também em um grande número de
pessoas que apresentam sequelas mesmo recebendo o tratamento com soro antiofídico3. Os
animais da família Viperidae são responsáveis por aproximadamente 90% dos acidentes nesta
região como um todo2, assim como no Brasil4,5.
Os venenos dessa família possuem uma grande variedade de peptídeos e proteínas
biologicamente ativos2. Estes venenos produzem efeitos locais e sistêmicos, como sudorese,
mionecrose, distúrbios hemostáticos e nefrotoxicidade, além de hemorragia, que pode ocorrer em
vários órgãos resultando em hipovolemia, hipotensão, choque cardiovascular e acidentes
cerebrovasculares. A hemorragia sistêmica é uma das manifestações mais graves do
envenenamento de viperídeos, sendo a principal causa de morte6. Por causa desses efeitos os
venenos de serpentes sul-americanas vêm sendo estudados há vários anos para descoberta de
fármacos pró e anticoagulantes7. Outros exemplos do potencial biotecnológico dos venenos
desses animais incluem descobertas de compostos que causam inibição da vascularização de
tumores, da agregação plaquetária8 e da atividade bacteriana9.
1.2 - Metaloproteases de veneno de serpentes
Um dos principais grupos de toxinas destes venenos são as metaloproteases de veneno de
serpente (SVMP, do inglês snake venom metalloprotease), que compreende proteases
dependentes de zinco com grande similaridade estrutural no domínio de ligação a esse íon2,3,5,
variando de 11% a 65% das toxinas presentes do veneno10. Essas toxinas induzem vários
sintomas, como mionecrose, danos nos tecidos epiteliais e inflamação, possuem grande
9
importância nos danos locais e são as principais responsáveis pelas hemorragias2,3,11,12. O
processo hemorrágico ocorre quando as toxinas hidrolisam as ligações peptídicas de proteínas da
membrana basal, resultando no enfraquecimento da sua estabilidade mecânica2,5. Como
consequência, forças hemodinâmicas que normalmente operam no sistema circulatório
distendem a estrutura dos vasos já enfraquecida, eventualmente ocasionando seu rompimento6. A
clivagem das proteínas da matriz extracelular é essencial para a ocorrência da hemorragia 3,13. É
importante ressaltar que o grupo das SVMPs engloba toxinas que apresentam diferentes níveis de
atividade hemorrágica, incluindo toxinas que não apresentam essa atividade, apesar de todas
possuirem atividade proteolítica3,12,13.
As SVMPs podem ser agrupadas em quatro classes de acordo com os domínios presentes
quando maduras: a classe P-I, com apenas o domínio catalítico contendo zinco; a P-II, que possui
adicionalmente um domínio de desintegrina; a P-III, que contém além dos domínios presentes
em P-II um domínio rico em cisteína; e P-IV, que apresenta um domínio adicional lectin-like
ligado por pontes dissulfeto a uma SVMP da classe P-III4,12,13. Entretanto, como ainda não foi
verificada a existência de mRNA das toxinas P-IV, acredita-se que essas toxinas são formadas
por modificações pós-transducionais das toxinas P-III. Por isso as classificações mais recentes
incluem as toxinas P-IV como um subtipo de toxinas P-III14. Apesar destas diferenças, todas elas
apresentam um domínio de ligação ao zinco altamente conservado, assim como uma alça de
metionina (met-turn), que serve como base para os três resíduos de histidinas do sítio ativo5.
Outra característica comum presente nessas toxinas é a presença de duas ou três pontes dissulfeto
no domínio catalítico14, resultando em grande estabilidade estrutural características dessas
toxinas. A classe P-I pode ainda ser dividida em duas subclasses: P-IA, com atividade
hemorrágica, e P-IB, apresentando fraca ou nenhuma atividade hemorrágica7. As variações
estruturais e na composição de aminoácidos responsáveis por essa diferença ainda não estão
totalmente definidas, apesar da existência de diferentes estudos com essa finalidade5,12,13,15,
empregando diferentes abordagens, como alinhamento de sequências, análise das relações
filogenéticas, comparação dos padrões de pontes dissulfeto e comparações estruturais7.
Dentro da classe P-I existem proteínas hemorrágicas e não hemorrágicas com estruturas
tridimensionais depositadas no banco PDB16 (Tabela 1), totalizando atualmente 11 estruturas,
que podem ser utilizadas em estudos comparativos ou que busquem identificar inibidores
utilizando técnicas computacionais. Esses estudos podem aumentar o conhecimento sobre o
10
funcionamento enzimático das toxinas, sobre as diferenças nos efeitos biológicos e ajudar no
desenvolvimento de fármacos e de substratos apropriados para estudos de cinética enzimática.
Toxina
Código PDB
Acutolisina-a 1BUD, 1BSW
Acutolisina-c
1QUA
Adamalisina II
4AIG
1HTD, 1ATL,
Atrolisina C
1DTH
BaP1
2W15
BmooMPalphaI
3GBO
FII
1YP1
H2-proteinase
1WN1
Leucurolisina-a
4Q1L
TM1
4J4M
1KUF, 1KUG,
TM-3
1KUI, 1KUK
Resolução (Å)
1.9
2.2
2
1.8-2.1
1.05
1.77
1.9
2.2
1.9
1.8
1.35
Inibidores em
complexo
Sim
Agkistrodon acutus
̶
Sim (fraca)
Agkistrodon acutus
̶
Não
Crotalus adamanteus
FLX
0QI, BAT,
Sim (fraca)
Crotalus atrox
pENW*
Sim (fraca)
Bothrops asper
WR2
Não
Bothrops moojeni
̶
Não
Agkistrodon acutus
KNL*
Não
Trimeresurus flavoviridis
̶
Não
Bothrops leucurus
QSW*
Indeterminada Trimeresurus mucrosquamatus
̶
pENW*,
Não
Trimeresurus mucrosquamatus
pEQW*, pEKW*
Hemorrágica
Organismo
Tabela 1 – Características principais das SVMP depositadas no banco PDB. O símbolo “*” indica os inibidores
endógenos, onde pE significa ácido piroglutâmico e as outras letras representam os códigos dos aminoácidos.
Entre essas toxinas depositadas no PDB, selecionamos a leucurolisina-a para realizar esse
estudo. Essa toxina foi purificada do veneno de Bothrops leucurus4 e teve sua estrutura
determinada por cristalografia por raios-x em complexo com um inibidor endógeno purificado
junto com a toxina, o tripeptídeo QSW (código PDB 4Q1L)11. A outra toxina estudada, a
atroxlisina-I, foi purificada do veneno de uma serpente sul-americana de grande importância
médica, a Bothrops atrox7. Apesar de não apresentar estrutura tridimensional definida, algumas
estruturas de proteínas com alta identidade de sequência, além da própria leucurolisina-a, já
foram depositadas no PDB e foram utilizadas como modelos para elaboração da estrutura dessa
toxina. Essas toxinas, selecionadas principalmente pela disponibilidade para realizar ensaios
experimentais e pela diferença de atividade hemorrágica, apresentam identidade de 52% e estão
sendo utilizadas como modelos de SVMPs neste projeto.
11
1.3 - Metaloproteases relacionadas às SVMPs
Outra abordagem para descoberta de inibidores é utilizar informação sobre enzimas
semelhantes as SVMPs, que fazem parte do grupo das metzincinas, um dos maiores grupos de
metaloproteases. Esse grupo é composto principalmente por proteínas com múltiplos domínios,
compreendendo um pró-domínio na região N-terminal envolvido na manutenção da enzima em
estado inativado, um domínio com atividade catalítica e outros domínios envolvidos em
interações proteína-proteína e outras funções regulatórias. As características estruturais do sítio
ativo que determinam que uma enzima pertença ao grupo das metzincinas são a presença de um
íon de zinco catalítico em coordenação tetraédrica com os átomos de nitrogênio de três histidinas
localizadas na região de sequência HEXXHXXGXXHD17. O ácido glutâmico funciona como a
base catalítica que polariza uma molécula de água envolvida no ataque nucleofílico que cliva a
ligação peptídica. Igualmente conservada é a presença da estrutura de met-turn, onde a cadeia
lateral de uma metionina fornece a base hidrofóbica localizada abaixo das cadeias laterais das
histidinas que estão coordenadas com o íon de zinco18.
As metzincinas são divididas em famílias, sendo que atualmente sete delas foram
caracterizadas em nível estrutural: astacins, ADAMs/adamalysins/reprolysins, que incluem as
SVMPs, serralysins, metaloproteases de matriz, snapalysins, leishmanolysins, and pappalysins.
Atualmente, mais de 200 estruturas dessa classe já foram despositadas no PDB. No entanto,
várias sequências oriundas dos projetos de sequenciamento de genomas indicam que ainda
existem famílias não caracterizadas17.
SVMPs são filogeneticamente relacionadas às proteínas com domínios de desintegrinas e
metaloproteases (ADAM) de mamíferos19, possuindo estruturas e funções semelhantes20,
principalmente se comparadas à classe P-III de SVMPs18. A publicação do genoma do lagarto
Anolis carolinensis21 permitiu a elaboração de novos estudos filogenéticos, mostrando fortes
evidências de que as SVMPs são mais próximas das ADAM28 e ADAM7 humanas22.
Vários domínios catalíticos das ADAMS já foram determinados estruturalmente,
apresentando alta identidade estrutural e pequenas variabilidades nas regiões das alças
periféricas18,19. Essas proteínas estão envolvidas em várias funções fisiológicas normais em
mamíferos, como degradação da matriz celular, fusão celular, adesão e sinalização intracelular,
12
estando envolvidas em vários processos patológicos, que vão desde doenças inflamatórias e
degenerativas até a neoplásicas, possuíndo portanto grande importância médica17,20.
A complexidade das ADAMs cresceu consideravelmente após a descrição de proteínas
secretadas
estruturalmente
relacionadas
que
contêm
várias
repetições
de
domínios
“thrombospondin-like” e ausência do domínio transmembrana, denominadas ADAMTS (ADAM
com domínio thrombospondina). Essas proteínas foram caracterizadas como uma nova família de
metaloproteases com propriedades funcionais e estruturais relacionadas às ADAMs4,5,20.
Outra família de enzimas de grande importância médica relacionadas às SVMP são as
metaloproteínases de matriz (MMP) (Figura 1), que também apresentam arquitetura do sítio
ativo similar às SVMP e ADAM/ADAMT18, mas apresentam domínios adicionais regulatórios.
Assim como as SVMP hemorrágicas, as MMP degradam proteínas do endotélio da membrana
basal, porém em processos fisiológicos normais19. Por causa dessa semelhança entre sítios ativos,
os inibidores de MMP muitas vezes também inibem as atividades das ADAM20, que podem
ainda compartilhar inibidores com as SVMP. Esse é o caso da toxina BaP1 (código PDB 2W15),
que foi cristalizada com um inibidor desenvolvido para a enzima ADAM1712. A semelhança
entre os sítios ativos dessas enzimas e aplicação de conhecimentos obtidos sobre inibidores e
estrutura tridimensionais de enzimas de uma família às de outra família já foram exploradas em
diversos trabalhos18,19.
13
Figura 1 – Alinhamento estrutural dos sítios catalíticos das ADAM17 (verde), MMP9 (rosa) e Leuc-a (marrom).
Figura produzida com programa Pymol23.
Essas informações sobre os inibidores conhecidos dessas enzimas junto com a avaliação
da semelhança dos sítios ativos podem auxiliar na predição de novos ligantes para as SVMPs. É
razoável concluir que sítios de ligação similares podem ser ligar aos mesmos ligantes, e que as
proteínas que se ligam a um mesmo ligante possuem grandes chances de compartilhar outros
ligantes. Obviamente proteínas de uma mesma família são mais propensas a compartilhar
inibidores, pois possuem maiores chances de apresentar estruturas terciárias similares, mas isso
também pode ocorrer com proteínas bastante distintas em relação à estrutura como um todo, mas
que apresentam sítios catalíticos similares24,25.
Além da abordagem descrita acima, baseada em informações sobre inibidores conhecidos
de proteases semelhantes a SVMPs, a busca por novos inibidores pode ser auxiliada por técnicas
computacionais, através do emprego de modelagem molecular, como descrito no tópico 1.4.
14
1.4 - Modelagem molecular
A modelagem molecular engloba todas as técnicas computacionais utilizadas para
simular o comportamento de moléculas. Essas técnicas são amplamente utilizadas nos campos de
química computacional e desenvolvimento de fármacos para estudar sistemas biológicos,
podendo ser aplicado, portanto, na descoberta de inibidores de enzimas.
1.4.1 – Mecânica quântica
Existem duas abordagens comumente aplicadas na área de modelagem molecular, que
são as aproximações clássica, também denominadas mecânica molecular (MM), e as
aproximações baseadas na química quântica (QM). Quando se está interessado em fenômenos
que envolvem a quebra ou formação de ligações atômicas, ou a avaliação de polarização e
transferência de cargas em moléculas, será necessária a utilização de métodos quânticos26.
De acordo com as teorias da mecânica quântica, todo sistema pode ser descrito por sua
função de onda, que fornece todas as informações sobre as propriedades observáveis do mesmo.
Essa função pode ser obtida pela solução da equação de Schrödinger, uma equação diferencial,
cuja resolução envolve a avaliação de um grande número de integrais, sendo portanto, uma tarefa
difícil. Por isso uma série de aproximações são necessárias para que ela possa ser aplicada para
sistemas químicos e biológicos de interesse prático27.
Um outro método utilizado para a descrição de sistemas moleculares foi desenvolvido
através da Teoria do Funcional de Densidade (DFT), que recebeu esse nome devido ao uso de
funcionais, funções de outra função, na modelagem da correlação eletrônica. Segundo essa
teoria, as propriedades de um sistema com muitos elétrons pode ser determinada em função da
densidade eletrônica. Os métodos DFT apresentam a vantagem de considerar os efeitos de
correlação eletrônica, fenômeno originado na reação de elétrons ao movimento de outros elétrons
de um mesmo sistema. A alta precisão dos cálculos, além do custo computacional relativamente
baixo quando comparados com métodos tradicionais, como Hartree-Fock e derivados, resultou
15
em uma grande difusão dos métodos DFT28,29. Entre esses se destaca o modelo funcional de troca
híbrida de 3 parâmetros de Becke e do funcional de correlação de Lee‐Yang‐Parr (B3LYP)30,
considerado um dos métodos mais eficientes para vários sistemas, incluindo aqueles com metais
de transição27, apresentando resultados similares aos obtidos por métodos ab initio para
geometrias e energias moleculares de complexos com zinco31.
Os métodos utilizados para os cálculos quânticos se dividem em ab initio e semi‐
empíricos. Apesar das aproximações utilizadas nos métodos ab initio, eles ainda podem ser
aplicados somente a moléculas de tamanhos pequenos ou médios. Nos métodos semi‐empíricos,
são eliminadas dos cálculos um grande número de integrais para diminuir o custo computacional,
introduzindo parâmetros empíricos ou previamente calculados na resolução da equação de
Schrödinger para compensar essa eliminação27. Essa abordagem implica que esses métodos
devem ser aplicados em sistemas similares aos utilizados para o desenvolvimento dos parâmetros
correspondentes26.
Entre os métodos semi-empíricos mais utilizados para estudos de moléculas orgânicas é o
self-consistent charge density functional tight binding (SCC-DFTB)32. Uma deficiência desse
método SCC-DFTB é não considerar forças de dispersão, mas que podem ser corrigidas pela
utilização de um termo empírico, que utilizam parâmetros derivados experimentalmente33.
Apesar das aproximações desse métodos, normalmente o tratamento de muitos sistemas de
interesse bioquímico, como sistemas contendo proteínas, utilizando somente métodos QM não é
aplicável devido à alta demanda computacional para tais simulações. Apesar de existirem
trabalhos que utilizam somente métodos semi-empíricos, com modificações para apresentarem
aumento computacional linear em função do número de átomos em estudos com proteínas, tais
estudos ainda são pouco comuns na literatura34. Por isso foram desenvolvidos métodos híbridos
QM/MM35, que definem um conjunto relativamente pequeno de átomos do sistema para serem
modelados por QM, sendo o restante do sistema descrito utilizando MM. A região MM inclui
normalmente poucos resíduos do sítio ativo, e muitas vezes de um ligante. Esses métodos são
especialmente importantes para estudos de metaloenzimas, devido à dificuldade de se modelar as
interações entre íons metálicos com moléculas orgânicas com a utilização de campos de força
convencionais, que não consideram a transferência de carga entre o íon metálico e seus
ligantes36–38.
16
Atualmente existem programas que tornam os cálculos quânticos acessíveis para os não
especialistas na área, sendo o programa Gaussian39 um dos mais utilizados.
1.4.2 – Mecânica molecular
Apesar de não apresentar a mesma precisão dos métodos quânticos, muito estudos de
descoberta de inibidores são desenvolvidos com o uso de técnicas computacionais baseadas em
mecânica molecular, que utilizam as teorias de mecânica clássica para modelar sistemas
moleculares. A energia potencial desses sistemas é calculada através da utilização de campos de
força, podendo ser utilizada para estudar desde moléculas pequenas a grandes moléculas
biológicas, como proteínas, membranas celulares e DNA26,40.
Na modelagem molecular baseada na mecânica clássica a molécula é considerada como
uma coleção de massas centralizadas no núcleo (átomos) conectadas por molas (ligações
químicas). Em resposta a forças intra e intermoleculares, as moléculas estendem-se, dobram e
giram ao redor dessas ligações. Essa descrição clássica – uma caracterização apropriada mesmo
com o aumento de informação de mecânica quântica utilizada parra gerar campos de forças –
funciona geralmente bem para descrever estruturas e processos moleculares, com exceção de
eventos onde ocorre quebra de ligações químicas26.
Nas simulações atomísticas cada átomo é simulado como uma única partícula, a qual se
atribui um raio de van der Waals (vdW) e uma carga elétrica, incluindo também em alguns casos
um fator de polarização. As ligações entre essas partículas são tratadas como “molas”, cujos
valores das distâncias de equilíbrio, assim como os valores dos raios e das cargas atômicas, são
determinados utilizando-se cálculos quânticos e uma grande quantidade de dados experimentais,
como estruturas geradas por cristalografia, espectroscopia de micro-ondas e calor de formação.
Assume-se o princípio da aditividade, que determina que as forças físicas que governam esses
sistemas, utilizadas para descrever energias e geometrias moleculares, podem ser calculadas a
partir de termos de energias individuais, e o princípio da transferibilidade, que determina que
esses termos desenvolvidos para incorporar dados experimentais obtidos a partir de estruturas
representativas podem ser aplicados na predição geometrias de grandes moléculas biológicas
17
compostas pelos mesmos grupos químicos dessas estruturas, assumindo-se que os comprimentos
e ângulos de ligações químicas tendem a apresentar valores similares em diferentes compostos
sobre condições normais26.
A minimização dessas funções pode ser utilizada para calcular regiões energeticamente
favoráveis da configuração espacial do sistema e para realizar simulações de dinâmica molecular
(DM), que podem explicar estados termodinamicamente acessíveis do sistema26.
Entre as técnicas de modelagem molecular utilizadas para estudos de proteínas estão as
técnicas de docking molecular, DM e modelagem comparativa.
1.4.3 - Campos de força
Um campo de força é uma representação física de um sistema em simulações
computacionais, que consiste de uma forma funcional e de um conjunto de parâmetros de ajuste
às suas respectivas funções matemáticas, utilizados para descrever a energia potencial de um
sistema de partículas, normalmente compostos por átomos e moléculas. Esses conjuntos de
funções e parâmetros são derivados de dados experimentais e cálculos de mecânica quântica41.
Os campos de força moleculares atualmente mais utilizados são AMBER42, CHARMM43,
GROMOS44, OPLS45 e MMFF9446. A maioria deles divide a função de energia potencial em
termos de contribuições de átomos ligados, ou seja, átomos conectados por uma, duas, ou três
ligações químicas, e não-ligados, distantes um dos outros por mais de três ligações químicas, ou
em moléculas diferentes41, sendo essa separação em termos locais e não-ligados de grande ajuda
nos desenvolvimentos dos algoritmos utilizados nas simulações computacionais26.
Um exemplo de uma função utilizada em campos de força AMBER47 apresenta a
seguinte forma:
(1)
18
onde (R) é o vetor com as coordenadas atômicas e U(R) representa a energia potencial do
sistema. Kr , Kθ e Vn são as constantes de força de comprimento de ligação, ângulo de ligação, e
torcional respectivamente. r e θ são os comprimentos de ligação e o ângulo de ligação. γ e n
representam a fase e a periodicidade do ângulo diedro, respectivamente. Os primeiros três termos
da expressão acima são referentes a átomos ligados e avaliam as energias de ligação atômica,
energia de ângulo de ligação e energia de ângulos diedros. Os termos de ligação atômica
normalmente são modelados utilizando potencial harmônico ou potencial de Morse,
centralizadas em valores de equilíbrio. Os termos torcionais ou diedros apresentam múltiplos
mínimos e são modelados com termos de Fourier. Muitos campos de força utilizam também o
termo ângulos diedros impróprios, que é importante para manter a planaridade de certas ligações
e quiralidade de grupos químicos. Este termo é utilizado, por exemplo, para manter a planaridade
dos átomos envolvidos nas ligação peptídicas e nos grupos carboxilato de cadeias laterais dos
aminoácidos aspartato e glutamato26.
Os dois últimos termos da equação são os de Coulomb e Lennard-Jones 6-12 e
contribuem para as interações externas ou não-ligadas; RAB é a distância entre os átomos, QA e
QB representam as cargas parciais atômicas, ε é a constante dielétrica do meio e AAB e BAB são
os parâmetros de Lennard-Jones cujo valor depende dos átomos envolvidos. Esses dois termos
de energia não-ligados apresentam custo computacional muito mais elevados que os termos
ligados, porque um átomo está ligado a apenas alguns poucos átomos vizinhos, mas interage com
muitos outros átomos. O termo de Lennard-Jones é determinado por dois tipos de interações
distintas, uma repulsiva e o outra atrativa. O termo repulsivo (r-12) modela forças de curto
alcance entre dois átomos próximos o suficiente para que haja uma superposição parcial de suas
nuvens eletrônicas, originadas pela repulsão entre os núcleos atômicos e e pelo princípio de
exclusão de Pauli. O termo atrativo (vdW) (r-6) está relacionado com interações de curto alcance,
que são as interações de Keesom, de Debye e de London. Por apresentar um decaimento rápido
com o aumento da distância, é possível aplicar um valor de corte para esse termo, resultando em
menor custo computacional do que o termo de Coulomb, que está relacionado com as interações
eletrostáticas intra e intermoleculares, consideradas de longo alcance por exibirem dependência
com o inverso da distância (r-1) entre as cargas atômicas41.
A parametrização dos campos de força, utilizando compostos modelo, garante que os
cálculos produzam geometria moleculares e interações energéticas apropriadas para um grupo
19
determinado de moléculas. Por exemplo, para proteínas os compostos modelos são peptídeos ou
compostos similares. Para ácidos nucléicos, desoxirribonucleotídeos e compostos contendo anéis
de furanoses são apropriados. Esses parâmetros são otimizados de maneira iterativa para
reproduzir um número crescente de informações experimentais de geometrias moleculares e de
muitas outras propriedades: medidas de frequência vibracional, calores de formação, energias e
geometrias intermoleculares, barreiras torsionais, entre outras26.
Cálculos empíricos de energia utilizando esses campos de força podem ser aplicados para
estudos de estruturas, dinâmica e termodinâmica de proteínas, assim como de outras
macromoléculas de interesse biológico43 e nas simulações de docking41. Um elemento essencial
para esses cálculos é a simplicidade da função de energia potencial, que permite simulações de
sistemas envolvendo meio milhão de átomos, com duração de até 5 µs48.
1.4.4 - Modelagem comparativa de proteínas
A caracterização funcional de sequências proteicas é um problema frequente na área
biológica49. Atualmente é bem estabelecido que o conhecimento da estrutura molecular é uma
ferramenta poderosa para entender, controlar e alterar funções de biomoléculas49,50. Apesar de
estruturas tridimensionais de proteínas poderem ser determinadas por cristalografia por raios-x e
ressonância nuclear magnética, esses experimentos demandam tempo e grandes quantidades de
proteínas em auto grau de pureza, além de possuírem algumas limitações. A técnica de NMR é
difícil de ser aplicada a grandes proteínas (maior que 250 aminoácidos), ou proteínas muito
flexíveis, enquanto a cristalografia por raios-x depende da obtenção de cristais com boa
capacidade de difração, processo realizado por tentativa e erro, e da solução do problema de fase.
Entretanto, sequências de proteínas podem ser determinadas muito mais facilmente através da
utilização de técnicas de biologia molecular e sequenciamento de proteínas. Portanto, em casos
onde a estrutura não pode ser determinada experimentalmente, a modelagem comparativa pode
frequentemente produzir um modelo tridimensional útil de uma sequência alvo baseado na sua
similaridade a uma proteína com estrutura conhecida, utilizada como proteína molde. Isso é
20
possível porque pequenas alterações na sequência normalmente resultam em pequenas alterações
na estrutura tridimensional50.
Existem vários métodos para a produção desses modelos. Um dos métodos utilizados é a
satisfação de restrições espaciais. Esse método utiliza restrições geométricas obtidas do
alinhamento da proteína alvo com os moldes junto com técnicas de otimização para satisfazer as
restrições espaciais obtidas do alinhamento50. As restrições são geralmente obtidas assumindo-se
que as distâncias e ângulos correspondentes entre os resíduos no molde e na proteína alvo são
similares. Essas restrições geradas por comparação são suplementadas com restrições
estereoquímicas de comprimento de ligação, ângulos de ligação, ângulos diedros e contatos de
átomos não-ligados obtidos de um campo de força de mecânica molecular. O modelo é então
gerado minimizando as violações de todas essas restrições. Como esse método utiliza muitas
informações diferentes sobre a sequência alvo, ele é uma técnica muito utilizada para modelagem
comparativa51.
Essa metodologia consiste de quatro passos principais: identificação de pelo menos um
molde, alinhamento da sequência alvo com a estrutura do molde, construção do modelo baseado
nesse alinhamento e avaliação da qualidade do modelo51. Como as estruturas de proteínas obtidas
por dados experimentais ou por modelagem comparativa estão sujeitas a muitas fontes de erros, é
importante medir a qualidade geral da estrutura e ser capaz de identificar regiões que podem
precisar de maior investigação52, pois essa avaliação é essencial para poder interpretar o modelo
e determinar o tipo de informação que pode ser obtido dele51.
As funções de pontuação utilizadas para essa avaliação se baseiam na hipótese
termodinâmica que diz que a estrutura nativa de uma proteína representa o estado de menor
energia livre em condições fisiológicas. Existem basicamente dois tipos de função de pontuação:
funções de energia baseadas em campos de força e funções estatísticas baseadas em
conhecimento. As últimas são funções de energia derivadas de informações de estruturas
conhecidas de proteínas e são normalmente formalizadas através de potenciais de força média
dependentes ou independentes de distância53. Devido à essa dependência das estruturas de
proteínas conhecidas, essas funções de pontuação são também denominadas de baseadas em
conhecimento ou potenciais estatísticos54. Elas são subclassificadas pelas forma de representação
da proteína (se usam centróides dos resíduos de aminoácidos, Cα/Cβ, ou todos os átomos),
restrições de características espaciais (acessibilidade ao solvente, contatos, distâncias, ângulos
21
torcionais) e os estados de referência, sendo amplamente utilizados em várias aplicações por
causa da sua relativa simplicidade, acurácia e eficiência computacional54.
A qualidade dos modelos gerados depende principalmente da existência de moldes
apropriados, ou seja, com boa resolução, alta cobertura e alta identidade. Para homólogos
próximos, os programas mais utilizados na maioria dos casos geram modelos muito bons, com
RMSD (root mean square deviation em inglês, ou desvio médio quadrático) de
aproximadamente 2Å da estrutura experimental. Geralmente uma identidade de sequência acima
de 35% é suficiente para produzir bons modelos49 para proteínas acima de aproximadamente 100
aminoácidos55 e a medida que a similaridade entre o alvo e molde diminui, o erro do modelo
aumenta51. Os modelos produzidos de alvos que apresentam menos de 25% de identidade de
sequência com o molde produzem os piores modelos, que podem apresentar menos de 50% de
carbonos alfa com menos de 3.5 Å, valor de corte frequentemente utilizado para avaliar a
qualidade dos modelos tridimensionais, de diferença em relação a sua posição correta. Esses
modelos ainda podem ser úteis, sendo utilizados por exemplo para auxiliar a aceitar ou rejeitar
um alinhamento entre proteínas distantes filogeneticamente. Já os modelos com identidade com
os moldes de aproximadamente 35% apresentam 85% dos carbonos alfa modelados com menos
de 3.5 Å de diferença da sua posição correta. Vale ressaltar que os sítios ativos e de ligação são
frequentemente mais conservados que o resto da estrutura, podendo ser alinhados de forma mais
precisa. Esses modelos podem ser utilizados, por exemplo, para guiar experimentos de mutações
sítio-dirigidas. Por último, os modelos com identidade com os moldes de 50% ou mais produzem
modelos com média de erros comparados com estruturas de cristalografia por raios-x de 3 Å de
resolução. Os alinhamentos desses modelos normalmente apresentam 100% dos carbonos alfa
com menos de 3.5 Å da sua posição correta. Esses modelos podem ser utilizados triagem em
virtual e docking de pequenas moléculas ou de macromoléculas, desenvolvimento e otimização
de inibidores e para a utilização em substituição molecular aplicado à determinação de estruturas
por cristalografia49.
22
Figura 2 – Figura mostrando a acurácia e as possíveis aplicações de modelos tridimensionais de proteínas
construídos por modelagem comparativa em função da porcentagem de identidade da sequência do alvo com a
sequência do molde, destacando duas aplicações utilizadas com o modelo da Atr-I neste trabalho. Retirado de Eswar
et al, 2007.
Além da comparação da posição de carbonos alfa no modelo e na estrutura experimental,
diversos parâmetros e programas são empregados para verificar a qualidade de um modelo. Entre
os programas utilizados para validação das características estereoquímicas das estruturas de
proteínas está o programa PROCHECK52, que utiliza informações estereoquímicas selecionadas
de estruturas de alta qualidade para providenciar uma avaliação geral da estrutura e para destacar
regiões que necessitam refinamento. O programa pode ser utilizado independentemente dos
23
dados experimentais e ser aplicado à estruturas já publicadas, ou para estruturas geradas por
modelagem comparativa52.
Outro programa amplamente utilizado para validação é o ProSa56, uma ferramenta que se
baseia na análise estatística de todas as estruturas de proteínas depositadas no PDB. Estruturas de
proteínas solúveis cujos z-scores, uma pontuação utilizada pelo programa para avaliar a
qualidade de modelos tridimensionais de proteínas, se afastam muito das médias obtidas para
estruturas determinadas experimentalmente são incomuns e geralmente decorrentes de vários
erros estruturais56. Essa ferramenta utiliza uma função baseada em conhecimento, do tipo
Potencial de Força Média (Potential of Mean Force), que descreve as geometrias preferenciais
de determinada sequência de aminoácidos através da análise estatística das geometrias de
interação entre átomos de estruturas depositadas no PDB57.
Já o programa Qmean53 utiliza uma abordagem relativamente diferente, utilizando uma
função de pontuação composta por cinco descritores estruturais. Três desses termos potenciais
estatísticos cobrem aspectos principais da estabilidade de proteínas. O primeiro analisa a
geometria local, utilizando dados de ângulos de torção de sequências de três aminoácidos, o
segundo avalia interações de longa distância baseadas na estrutura secundária e o terceiro
descreve a área do resíduo que está em contato com outros resíduos. Os outros dois termos
adicionais descrevem a concordância entre a estrutura secundária e acessibilidade ao solvente
predita e calculada53.
Apesar de existirem muitos programas disponíveis para realização de modelagem
comparativa de estruturas tridimensionais de proteínas, um dos mais utilizados pela comunidade
científica é o Modeller49, distribuído gratuitamente para a comunidade acadêmica. Ele utiliza a
metodologia de satisfação de restrições espaciais para a produção de modelos e também pode
realizar muitas tarefas adicionais, incluindo modelagem “de novo” de alças de estruturas de
proteínas, otimização de vários modelos de estruturas de proteínas em relação à flexibilidade,
alinhamento múltiplo de sequências de proteínas e/ou estruturas, agrupamentos, etc49. A
principal função de pontuação do programa utilizado para avaliar e classificar os modelos
produzidos é a DOPE (Discrete Optimized Protein Energy), uma função de potencial estatístico
dependente de distância calculada a partir de um grupo de estruturas nativas de proteínas,
baseada totalmente na teoria de probabilidades54.
24
1.4.5 - Docking aplicado à triagem virtual
A compreensão dos mecanismos de reconhecimento molecular proteína-ligante é um dos
aspectos centrais para a descoberta e planejamento de fármacos. Obter uma descrição acurada e
automatizada
do
processo
de
reconhecimento
molecular,
utilizando
metodologias
computacionais, pode permitir a redução do tempo e dos altos custos envolvidos no
desenvolvimento de novos medicamentos41,58.
Dentre
estas
metodologias,
a
de
docking
receptor-ligante
tem
contribuído
significativamente para avanços no desenvolvimento de fármacos, sendo empregada no
refinamento e otimização de compostos protótipos previamente identificados, na triagem virtual
de bases de dados e na estimativa das afinidades de ligação proteína-ligante59–62. Devido a todos
esses fatores, esse método tem sido alvo de intensas pesquisas, atraindo o interesse de
universidades, indústrias farmacêuticas e empresas de biotecnologia em todo o mundo 41,63.
A metodologia de docking molecular tem como objetivos predizer a orientação de ligação
de duas moléculas que formam um complexo estável e estimar a afinidade de ligação entre elas.
Portanto, o sucesso da técnica é medido através da comparação dos resultados preditos com
modos de ligação determinados por cristalografia por raios-x dos complexos e medidas de
afinidade determinadas em ensaios in vitro. Para realizar a docagem molecular são necessárias
basicamente três etapas: definição da estrutura da molécula alvo, localização do sítio de ligação e
predição do modo e da afinidade de ligação de um ligante utilizando algoritmos específicos41. A
estrutura pode ser obtida pelas técnicas de cristalografia por raios-x, NMR, ou predita
computacionalmente por modelagem comparativa. A aplicação destes modelos para docking já é
bem estabelecida e representa uma importante alternativa quando estruturas experimentais ainda
não estão disponíveis64,65.
A predição do modo e da afinidade de ligação é realizada através de algoritmos de busca
e funções de avaliação, dois aspectos principais que diferenciam os programas de docking. Os
algoritmos de busca são utilizados para amostrar as possíveis orientações dos ligantes ligados ao
alvo proteico, considerando os graus de liberdade translacionais, rotacionais e conformacionais
(que avaliam os ângulos diedrais associados às ligações covalentes simples). Esses algoritmos
25
são divididos em três classes principais: métodos de busca sistemática, de busca determinística e
de busca estocástica. Nos métodos de busca sistemática, cada grau de liberdade possui valores
determinados e todos eles são explorados combinatoriamente durante a busca. Os métodos de
busca determinística produzem os mesmos dados de saída sempre que utilizados os mesmos
dados de entrada, como métodos clássicos de minimização de energia e de simulação por DM.
Os métodos de busca estocástica envolvem movimentos aleatórios, ocasionando diferentes saídas
para os mesmos dados de entrada. Nessa categoria se encontram os algoritmos evolucionários,
Monte Carlo e simulated annealing41.
As funções de avaliação também podem ser divididas em três classes principais: funções
baseadas em campos de força, funções empíricas e funções baseadas em conhecimento. As
funções baseadas em campos de força utilizam um campo de força para calcular a energia de
ligação entre o ligante e o alvo proteico. A funções empíricas utilizam métodos empíricos e
semi-empíricos cujos coeficientes foram pré-otimizados tomando-se como base resultados
experimentais de estruturas receptor-ligante e suas respectivas constantes de inibição. Essas
funções buscam reproduzir dados experimentais de energia de ligação, assumindo que esta pode
ser decomposta em funções que dependem das coordenadas do ligante e do receptor e que serão
multiplicadas pelos coeficientes pré-otimizados. As funções baseadas em conhecimento também
utilizam dados experimentais, mas utilizam estruturas cristalográficas para descrever as
geometrias de interação receptor-ligante, ao invés de usar dados das constantes de inibição.
Através de análises estatísticas dessas geometrias são derivados Potenciais de Força Média, que
avaliam a variação de energia-livre em função das coordenadas interatômicas. Por causa dos
erros associados a essas funções de avaliação das três classes, os programas mais recentes estão
utilizando combinações dessas funções para produzirem funções consenso, que parece aumentar
a qualidade dos resultados41 .
Uma das aplicações desta metodologia é a triagem virtual, técnica na qual os vários
ligantes de um grande banco de dados são avaliados contra a estrutura de um receptor alvo e
classificados de acordo com as interações intermoleculares preditas66,67, priorizando potenciais
ligantes para um alvo específico. Posteriormente essas moléculas podem ser avaliadas através de
cálculos de energia livre mais precisos, que envolvem o uso de DM, ou ser diretamente
selecionadas através de inspeção visual. A seguir os compostos selecionados são testados
experimentalmente para comprovação de sua ligação as proteínas de interesse, com o objetivo de
26
guiar e validar a metodologia. Posteriormente outras características relevantes para
desenvolvimento de fármacos, como toxicidade e biodisponibilidade, podem também ser
avaliadas41,58.
Essas metodologias in silico apresentaram vários avanços recentemente, principalmente
por causa do desenvolvimento da biologia molecular, das técnicas experimentais para
identificação de alvos moleculares proteicos e da obtenção de informações sobre suas estruturas
tridimensionais41,68. Outro fator importante foi o aumento do número de bancos de dados de
compostos químicos, como o ZINC, que se destaca por ser gratuito e por possuir um grande
número de compostos, com aproximadamente 35 milhões de compostos atualmente63.
Entre os vários programas existentes que realizam simulações de docking, o programa
Autodock é um dos mais utilizados atualmente69. Entre as qualidades desse programa podemos
destacar a possibilidade de tratar algumas cadeias laterais do receptor como flexíveis durante a
simulação e a possibilidade de utilização de múltiplos CPUs para diminuir o tempo de
processamento. A última versão desse programa de código aberto é AutoDock Vina70. A função
de avaliação desse programa, relacionada com a classificação dos ligantes “docados”, combina
vantagens de funções baseadas em conhecimento e funções empíricas, extraindo informações de
preferências conformacionais de complexos receptor-ligante e medidas de afinidade obtidas
experimentalmente, utilizando diferentes tipos de otimização estocástica global combinados com
procedimentos de otimização local70.
1.4.6 - Limitações da triagem virtual utilizando docking
Apesar da utilidade e do sucesso já demonstrado para esta técnica, a interação molecular
é um processo complexo e dinâmico, e para que grandes bases de dados sejam avaliadas é
necessário utilizar diversas aproximações nas funções de avaliação. Dentre elas está a
desconsideração da flexibilidade da proteína alvo. Normalmente emprega-se uma única estrutura
para realizar as simulações, porém sabe-se que na realidade os sítios ativos dos receptores
possuem muitos estados conformacionais válidos, e que determinados inibidores não serão
identificados por triagem virtual por se ligar a uma conformação que difere significativamente da
27
escolhida para realizar a docagem71. Além disso, as técnicas computacionais de docking não
apresentam uma acurácia de predição de energia-livre de ligação suficiente para gerar uma
classificação confiável41. Essa predição se torna ainda mais difícil quando a proteína estudada
possui um íon metálico no sítio catalítico, devido à dificuldade das funções de avaliação
baseadas em mecânica clássica em tratar as interações entre metais e moléculas orgânicas72.
Normalmente considera-se que os compostos que estão melhor pontuados estão enriquecidos
com moléculas que realmente demonstram atividade quando testadas experimentalmente. Por
esses motivos a inspeção visual dos ligantes priorizados na triagem é de fundamental
importância para a seleção dos compostos mais promissores, resultando na necessidade de
intervenção humana41, que pode ser considerado mais uma limitação da técnica.
Para diminuir o impacto dessas limitações podemos utilizar técnicas de DM para simular
a flexibilidade do receptor e para calcular a energia livre de um número reduzido de ligantes préselecionados nas etapas de iniciais triagem73. A combinação de técnicas menos precisas para
seleção inicial de compostos, mas com menor custo computacional, seguida por técnicas mais
precisas, com maior custo computacional, utilizando um número reduzido de compostos já
selecionados nas etapas iniciais, é uma estratégia promissora para identificação de ligantes para
alvos proteicos71.
1.4.7 – Dinâmica Molecular – (DM)
Dinâmica molecular (DM) é uma simulação computacional dos movimentos físicos de
átomos e moléculas. Permite-se que os átomos e moléculas interajam por um determinado
tempo, gerando uma trajetória dos átomos, determinada através da resolução das equações de
movimento de Newton para um sistema de partículas que interagem entre si, onde forças entre as
partículas e a energia potencial são definidos por um campo de força40. O resultado é uma
trajetória que especifica como as posições e as velocidades das partículas do sistema variam com
o tempo, sendo obtida através da resolução das equações diferenciais geradas a partir da segunda
lei de Newton ! = !!:
28
d2xi / dt2 = ! xi / mi
(2)
Essa equação descreve o movimento da partícula de massa mi ao longo da coordenada xi, sendo
! xi a força resultante atuando nessa partícula nessa direção40.
Resumidamente, atribui-se aos átomos do sistema posições e velocidades iniciais e
escolhe-se um intervalo de tempo, ∆t. Em seguida calcula-se as forças atuantes em cada átomo
utilizando-se um campo de força. Depois permite-se que cada átomo mova-se durante o ∆t
resolvendo-se as equações de movimento, baseado nas acelerações obtidas através das forças
atuantes em cada átomo, e incrementa-se o tempo inicial com o valor de ∆t. Esses passos são
repetidos até que o tempo desejado de simulação seja atingido. Na prática as simulações são
muito mais complexas que os passos descritos acima, envolvendo muitos passos adicionais,
principalmente para resolver as equações de movimento, para controle de temperatura, pressão
ou volume e para geração e análise de resultados26,40. Os resultados dessas simulações podem ser
utilizados para determinar propriedades termodinâmicas macroscópicas do sistema, além de
permitir insights dos movimentos moleculares em escala atômica26,40.
Muitas simulações de proteínas, ácido nucléicos e carboidratos são realizadas atualmente
utilizando o pacote de programas AMBER74, que inclui programas desenvolvidos para
trabalharem em conjunto, permitindo realizar desde a preparação de estruturas e produção das
simulações de dinâmica até as análise dos resultados. Essa sigla também é utilizada para se
referir aos campos de força utilizados pelos programas do pacote. Tanto o pacote de programas
quanto os campos de força foram utilizados nesse trabalho. A separação de programas
desenvolvidos para cada etapa apresentam importantes vantagens, como facilitar o contínuo
melhoramento das partes individuais com pouco impactos nos demais programas, permitir a
realização de tarefas de alto desempenho em servidores remotos e a realização das análises em
computadores individuais e facilitar a interface com programas externos75. Entre esses
programas, podemos destacar: o Antechamber76, que automatiza grande parte da parametrização
de pequenos compostos orgânicos, como os inibidores com características de fármacos, através
do campo de força GAFF (general amber force field)47, desenvolvido especialmente para
facilitar as simulações de proteínas em complexo com esses compostos; o SANDER (Simulated
annealing with NMR-derived energy restraints), principal programa do pacote, utilizado para
simulações de dinâmica molecular, possuindo a capacidade de realizar também métodos híbridos
29
QM/MM77; e o pmemd.cuda, versão otimizada do SANDER desenvolvido para trabalhar em
máquinas que possuem placas GPU (graphics processing unit)78,79.
1.4.7.1 – Aplicações na descoberta de inibidores
Os modelos produzidos por NMR, estruturas de cristalografia por raios-x e modelagem
comparativa fornecem informações valiosas sobre a estrutura macromolecular. Entretanto, uma
única conformação proteica diz pouco sobre a sua dinâmica40. Quando uma pequena molécula se
aproxima do alvo em solução, ela não encontra uma única estrutura estática, mas uma
macromolécula em movimento constante80.
Para considerar essa flexibilidade é possível realizar simulações de DM em conjunto com
a triagem virtual. Uma das maneiras de combinar estas técnicas é docar cada molécula de uma
base de dados em múltiplas conformações da proteína geradas por simulações de DM,
geralmente selecionadas por técnicas de agrupamento e seleção de conformações representativas.
Assim, cada ligante é associado a várias pontuações obtidas com as diferentes conformações da
proteína testada. Os ligantes podem ser classificados por diferentes critérios, como a média dos
valores de energia de ligação predita para cada conformação ou os menores valores obtidos com
uma determinada conformação. Portanto, essa metodologia considera várias conformações do
receptor amostradas durante as simulações. Posteriormente os ligantes selecionados são
utilizados em cálculos de energia de ligação mais precisos, mas que envolvem maior gasto
computacional80. A aplicação dessa técnica em conjunto com outras técnicas de triagem
geralmente apresenta boas taxas de sucesso71.
1.4.8 – Cálculos de variação de energia livre
Cálculos de energia livre se tornaram uma metodologia frequentemente utilizada para a
predição de energia de ligação de candidatos a fármacos. Entre as técnicas computacionais mais
apuradas para calcular essa energia estão MM-PBSA (molecular mechanics Poisson-Bolzmann
30
surface)81, perturbação de energia livre (FEP)82 e integração termodinâmica (TI)83, sendo essas
duas últimas as mais precisas, mas que possuem maior custo computacional, não permitindo que
sejam aplicadas a um grande número de compostos. Grande parte desse custo computacional são
causados pelo tratamento explícito do solvente e por calcular a energia livre de ligação em
pontos intermediários ao longo da transição de um estado inicial e um final de interesse. No
método MM-PBSA, os cálculos são simplificados pela utilização de solvente contínuo e por
calcular a energia somente do estado inicial e final, mantendo a avaliação da influência do
solvente e proporcionando uma boa relação entre o custo computacional e a precisão dos
resultados84. Essa características permitem sua utilização com uma maior quantidade de
compostos, e por ser mais preciso que a funções de pontuação convencionais, esse método é
frequentemente utilizado para avaliar compostos pré-selecionados em trabalhos com triagem
virtual85.
Os resultados desses cálculos de energia de ligação podem então ser comparados com os
resultados obtidos por testes in vitro, que dependem do alvo proteico em questão. No caso de
estudos com metaloproteases, podem ser realizados estudos de inibição de atividade proteolítica,
cinética enzimática e Isothermal titration calorimetry (ITC). Os testes de inibição de atividade
proteolítica são simples de serem realizados e permitem verificar se compostos possuem
atividade inibitória. Os testes de cinética enzimática e ITC permitem avaliar a afinidade do
inibidor, que podem ser comparados com as energias livres de ligação preditas. Além disso, a
técnica de ITC pode fornecer também informações sobre contribuições individuais da variação
de entalpia e de entropia na energia de ligação, fornecendo a assinatura termodinâmica da
proteína86.
1.4.9 - MM-PBSA e variantes
O método MM-PBSA é um dos mais utilizados para avaliar de forma aproximada a
energia livre de um sistema87. Após a extração de poses representativas e não correlacionadas de
uma simulação de DM, processadas para a remoção do solvente e contra-íons, aplica-se a
equação
31
〈G〉= 〈EMM〉 - 〈GPBSA〉 - TSMM
(3)
onde 〈G〉 significa a média das energias, 〈Emm〉 é a média das energias calculadas com o campo de
força, definida pela fórmula
〈Emm〉 = 〈Elig〉 + 〈Eang〉 + 〈Etor〉 + 〈EvdW〉 + 〈Eele〉
(4)
onde esses termos significam a média da energia de ligação, ângulos de ligação, energia
torcional, interações de vdW e energia eletrostática, calculadas por um campo de força conforme
exemplificado pela equação (1). O termo GPBSA representa a energia livre de solvatação,
calculada pela resolução da equação PB para avaliar a contribuição polar da energia de
solvatação, somado a um termo para cálculo da interação apolar (SA)81. A contribuição apolar é
devida à necessidade da formação de uma cavidade para o soluto dentro do solvente84, que
frequentemente é estimada por um termo proporcional à área de superfície acessível ao solvente
do soluto88. Um método alternativo de maior precisão, implementado pelo programa PBSA do
AMBER, separa a interação apolar em dois termos, um atrativo (dispersão ou Edisp) e um
repulsivo (cavitação ou Ecav)89.
O termo TSmm representa a entropia configuracional do soluto, normalmente estimada
utilizando a aproximação rigid rotor harmonic oscillator (RRHO), aplicando analises quasi
harmonic90 ou modos normais91. Uma variante desse método MM-PBSA utiliza o modelo
implícito de solvatação Generalized Born (GB)92, sendo por isso denominada MM-GBSA, que
apesar de apresentar um custo computacional reduzido em relação ao PB, apresenta uma
aumento de erros considerável em muitos casos93.
Uma das principais aplicações deste método é o cálculo de energia livre de ligação de um
pequeno composto com uma proteína utilizando a equação
〈∆G〉 = 〈Gcomplexo〉 - 〈Gproteína〉 - 〈Gligante〉
(5)
que pode ser calculada utilizando poses extraídas de três simulações separadas, com o complexo
proteína-ligante, e com a proteína e o ligante isolados, ou somente da simulação com o
complexo, diminuindo o custo computacional, assumindo que a energia livre da proteína e do
32
ligante em complexo é comparável às obtidas por trajetórias isoladas84. Outra simplificação
frequentemente utilizada nessa aplicação é o negligenciamento do termo que estima a entropia,
que normalmente representa uma pequena porcentagem do valor total da variação de energia
livre, principalmente em estudos para estimar a energia de ligação de compostos de tamanho
similar a um mesmo alvo proteico84 .
Devido à dificuldade de se modelar as interações entre íons metálicos com moléculas
orgânicas utilizando de campos de força convencionais, que não consideram a transferência de
carga e efeitos de polarização, fenômenos de grande importância para estudo de metaloenzimas,
alguns trabalhos tentam estimar a energia de ligação através de métodos híbridos QM/MM em
conjunto com a metodologia de MM-PBSA (QM/MM-PBSA), apresentando resultados mais
precisos que o método clássico36,37,94.
33
2 - Justificativa
Acidentes com serpentes são um sério problema de saúde pública e o único tratamento
efetivo para o envenenamento por estes animais em humanos é a administração intravenosa do
soro antiofídico. No entanto, esses soros são relativamente ineficientes em reduzir os danos
locais e apresentam baixa eficiência no tratamento de acidentes com Bothrops leucurus, espécie
de grande importância médica no Brasil. Tendo em vista estas limitações, uma alternativa
promissora como terapia complementar à utilização do soro é o desenvolvimento de inibidores
de metaloproteases de veneno de serpente (SVMP) com características de fármacos, que
pudessem ser utilizados no momento do acidente. Essas enzimas constituem bons alvos
terapêuticos porque apresentam papel importante na produção de danos locais e de efeitos
hemorrágicos e, por serem proteases, participam também no processo de difusão dos
componentes do veneno. Possuem também como vantagem adicional alta eficiência catalítica e
estabilidade estrutural por causa da presença de três pontes dissulfeto, sendo por isso bons
modelos bioquímicos e, consequentemente, facilitam a produção de dados experimentais. Além
disso, por causa da alta similaridade estrutural dessas enzimas, um composto que inibe uma das
representantes desse grupo provavelmente também irá inibir as outras enzimas, permitindo a
utilização de um número reduzido de estruturas de proteínas na busca por inibidores para todo o
grupo. Entretanto, apesar da alta similaridade estrutural e o compartilhamento de inibidores, uma
das características mais interessantes desse grupo é a variação na atividade hemorrágica, sem
uma correlação estabelecida com as características estruturais. Por isso, neste trabalho
escolhemos como modelos de SVMP as enzimas da classe P-I Leuc-a e Atr-I, uma toxina nãohemorrágica e uma hemorrágica respectivamente.
Outra vantagem de trabalhar com as SVMP é a similaridade estrutural do sítio catalítico
dessas toxinas com as ADAM/ADAMTS e MMP, enzimas de grande importância médica que
possuem muitos inibidores conhecidos. Alguns desses compostos possuem a vantagem de terem
sido testado previamente em humanos, apresentando efeito colaterais somente depois de uso
prolongado, o que não impediria sua utilização em acidentes com serpentes. Aproveitando dessa
vantagem, selecionamos seis desses compostos para estudos experimentais e computacionais
com as SVMP, que permitiram o desenvolvimento de um protocolo computacional para realizar
os cálculos de energia livre de ligação, que pode ser utilizado melhorar a qualidade de resultados
34
de triagem por empregar metodologias mais precisas que as aplicadas normalmente pelos
programa de docking. As simulações de DM com esses compostos forneceram também
informações sobre quais aminoácidos realizam as principais interações com os inibidores,
informação que foi utilizada posteriormente nas análises de agrupamento para a seleção de
conformações das toxinas para considerar a flexibilidade das toxinas nos estudos de triagem
virtual.
Com objetivo de descobrir também novas classes de inibidores, realizamos a primeira
etapa da triagem virtual com compostos lead-like utilizando a estrutura da Leuc-a, selecionando
compostos para serem empregados posteriormente em uma segunda etapa de triagem com essas
conformações das toxinas geradas por DM, seguido pela posterior aplicação dos cálculos de
energia livre de ligação para selecionar compostos para os testes in vitro.
Desta forma, o projeto proposto emprega técnicas atuais de planejamento de fármacos,
associado a validação experimental, para a descoberta de inibidores para as SVMP e dinâmica
molecular para identificar variações estruturais que pudessem estar relacionadas com a
diferenças na atividade hemorrágica apresentada pelas toxinas desse grupo. Finalmente, devido a
parametrização das metodologias computacionais realizadas para modelar o íon Zn2+,
acreditamos que o protocolo computacional utilizado nesse trabalho pode ser adaptados para
descoberta de inibidores de enzimas importância médica que possuem átomo de zinco no sítio
catalítico.
35
3 - Objetivos
3.1 - Objetivos gerais
Os objetivos gerais deste trabalho são:
•
Identificar inibidores para as toxinas SVMPs Leuc-a e Atr-I, proteases provenientes dos
venenos das serpentes Bothrops leucurus e Bothrops atrox, respectivamente, através de
metodologias computacionais e de cinética enzimática;
•
Identificar diferenças estruturais das toxinas Leuc-a e Atr-I que possam estar relacionadas
com as diferenças na atividade hemorrágica.
3.2 - Objetivos específicos
Os objetivos específicos deste projeto são:
•
Produzir um modelo para a estrutura tridimensional da enzima Atr-I através de modelagem
comparativa;
•
Produzir conformações representativas das toxinas para estudo com inibidores através de
simulações de DM;
•
Identificar diferenças estruturais entre as duas toxinas que possam estar relacionadas com a
diferença de atividade hemorrágica através de simulações de DM;
•
Determinar a capacidade inibitória de inibidores de metaloproteases de amplo espectro sobre
a atividade enzimática das duas toxinas através de ensaios de cinética enzimática;
•
Determinar o modo de ligação mais prováveis dos inibidores identificados in vitro através de
docking e de uma função de avaliação desenvolvida nesse trabalho;
•
Calcular a energia de ligação entre os inibidores de metaloproteases de amplo espectro e as
toxinas Leuc-a e Atr-I através das metodologias de MM-PBSA, MM-GBSA e QM/MMPBSA;
36
•
Selecionar compostos lead-like através de triagem virtual para uma segunda etapa de triagem
utilizando conformações das toxinas obtidas por DM;
37
4 – Metodologia
4. 1 – Modelagem comparativa da toxina atroxlisina-I
A estrutura tridimensional da atroxlisina-I foi modelada utilizando o programa Modeller
(versão 9v14)50,54. Para isso utilizamos a sequência da toxina, obtida pelo banco de dados
UNIPROT95 (UNIPROT ID: P85420), para realizar uma busca por sequências similares no PDB
utilizando o programa Blastp96. Após análise dos resultados dessa busca, escolhemos como
moldes para a modelagem as seguintes estruturas de SVMPs: acutolisina-A, de Agkistrodon
acutus (código PDB 1BSW), BaP1, de Bothrops asper (código PDB 2W15), BmooMPalpha-I,
de Bothrops moojeni (código PDB 3GBO) e leucurolisina-a, de Bothrops leucurus (PDB 41QL).
Estes moldes foram selecionados baseados nas porcentagens de identidade e de cobertura das
sequências e na resolução das estruturas cristalográficas. Posteriormente realizamos o
alinhamento da sequência alvo com as sequências dos moldes e das estruturas dos moldes
utilizando scripts do MODELLER e construímos mil modelos tridimensionais para a toxina.
Selecionamos então cem modelos baseados na pontuação DOPE (Discrete Optimized Protein
Energy)54 e os submetemos para nova classificação utilizando o programa ModFOLD4 com a
metodologia de agrupamento97. O modelo com melhor pontuação foi posteriormente refinado,
através da otimização de duas regiões de alça contendo os resíduos 160-163 e 172-177. Para esta
etapa utilizamos somente a estrutura da acutolisina-A (código PDB 1BSW), que apresenta maior
similaridade com o alvo nesta região. Após a produção de 100 modelos com diferentes
conformações dessas duas alças, as estruturas foram classificadas novamente com o programa
ModFOLD4 e o modelo com melhor pontuação foi então validado utilizando os programas
ModEval98, Prosa56, Qmean99 e Procheck52. As estruturas utilizadas como moldes foram
avaliadas pelos mesmos programas, para verificar se as avaliações obtidas eram semelhantes às
obtidas por nosso modelo.
38
4.2 – Cálculos do estado de ionização dos resíduos das toxinas
O web-server H++ (versão 3.1)100 foi utilizado para calcular a energia de transferência de
prótons e as correspondentes curvas de titulação para todos os aminoácidos ionizáveis utilizando
métodos das diferenças finitas para calcular a equação de Poisson-Boltzmann (PB)101. Os valores
de pKa dependem significativamente da qualidade da estrutura e da constante dielétrica
selecionada para o interior da proteína (εint). Para a leucurolisina-a utilizamos a estrutura
cristalográfica depositada no PDB (código 4Q1L, resolução de 1.90 Å) e para a Atr-I utilizamos
o modelo final obtido por modelagem comparativa. Os íons Zn2+ e Ca2+, com raios atômicos de
1.0 e 1.7 Å, respectivamente, e carga +2 foram mantidos na estrutura para os cálculos de pKa,
enquanto o inibidor endógeno foi retirado da estrutura da Leuc-a. O valor padrão para a
constante dielétrica (εint) é 10, sendo considerado apropriado na maioria dos casos. Entretanto,
valores menores, como 6 ou 4, são indicados para resíduos localizados no interior de proteína,
enquanto valores mais altos são aconselhados para resíduos expostos ao solvente. Portanto, para
avaliar de forma consistente a predição dos valores de pKa, foram selecionados valores de εint de
4, 6, 10 e 20 para o cálculo de pKa para todos os resíduos das duas toxinas e realizamos inspeção
visual sobre aqueles aminoácidos da estrutura da atroxlisina-I que apresentaram resultados
diferentes dos valores padrão, obtidos principalmente por técnicas de NMR102.
4.3 – Seleção de inibidores de metaloproteases de amplo espectro
Seis inibidores de metaloproteases de amplo espectro, batimastat (BAT), inibidor de
colagenase-I (COL), CP-471474 (CP4), marimastat (MAR), inibidor de metaloprotease de
matriz-III (MMP) e prinomastat (PRI) (Figura 3), foram selecionados para avaliação
experimental contra a leucurolisina-a e a atroxlisina-I. Foram priorizados compostos
desenvolvidos para inibir as enzimas do grupo das ADAM/ADAMTS e/ou MMP, cujos sítios
ativos apresentam alta similaridade com os das SVMPs. Utilizamos também como critério a
disponibilidade e a potência descrita na literatura para as classes de proteínas citadas acima. Com
exceção do COL, todos os outros compostos inibem várias MMP na faixa de nanomolar, e os
39
compostos BAT e MAR também possuem atividades contra algumas ADAM103. Os compostos
COL e MMP foram selecionados principalmente por inibirem a atividade proteolítica da Leuc-a
(dados não publicados).
Figura 3 – Estrutura química dos inibidores de metaloproteases de amplo espectro utilizados nesse trabalho. Os
grupos hidroxamatos estão destacados. Figura produzida com o programa MarvinSketch104.
4.4 – Produção de parâmetros para simulações de DM
4.4.1 – Modelos da Leuc-a e Atr-I complexadas com o tripeptídeo QSW
40
A estrutura inicial para da Leuc-a foi obtida da estrutura cristalográfica 4Q1L, com o íon
Zn2+ coordenado com os átomos Nε dos resíduos His142, His146 e His152 e apresentando interação
bidentada com o grupo carboxilato da região C-terminal do inibidor endógeno Gln-Ser-Trp.
Para a Atr-I, utilizamos a estrutura do modelo comparativo criado na etapa anterior, com
posterior adição do tripeptídeo Gln-Ser-Trp através do alinhamento do modelo com a estrutura
4Q1L. Os átomos de hidrogênio foram adicionados às estruturas utilizando o programa LEaP,
parte do pacote de programas AMBER1474.
A versão ff14SB105 do campo de força Amber, versão mais recente do ff99SB106, foi
utilizada durante as simulações. Inicialmente os íons Zn2+ e Ca2+ foram representados utilizando
parâmetros não-ligados que reproduzem distâncias experimentais entre os íons e oxigênio e o
número de coordenação da primeira camada de solvatação107. O modelo TIP3P108 foi utilizado
para representar as moléculas de água.
4.4.2 –Definição do estado de protonação de átomos coordenados ao zinco.
Para determinar o estado de protonação mais provável do grupo carboxilato do
tripeptídeo Gln1-Ser2-Trp3 e do resíduo Glu143, que está a uma distância de ligação de hidrogênio
na estrutura 4Q1L (2.6 Å e 3.2 Å entre o oxigênio do grupo carboxilato do Trp3 voltado para o
Glu143 e os oxigênios do grupo carboxilato desse resíduo), analisamos diferentes distribuições de
cargas do sítio ativo utilizando otimização de geometria com o método semi-empírico QM/MM.
Para isso, selecionamos os tipos de resíduos apropriados no processamento da estrutura da Leuca pelo programa LEaP e adicionamos uma esfera de água de 15.0 Å de diâmetro centrada no
átomo de zinco. Primeiramente as moléculas de água e os átomos de hidrogênio foram relaxados
através de minimização de energia seguido de 100 ps de DM a 300 K, permitindo que somente as
moléculas de água se movessem utilizando o programa SANDER do pacote de programas
Amber14. Depois realizamos o processo de otimização de geometria QM/MM com o método
semi-empírico SCC-DFTB32,109 adicionando parâmetros para o átomo de Zn110 e um termo de
correção para efeitos de dispersão33. A região QM foi composta pelos resíduos His142 e Glu143, as
cadeias laterais dos resíduos His146 e His152, o íon Zn e o resíduo Trp3 inibidor endógeno, como
41
mostra a Figura 4. Para completar as valências dos átomos da fronteira QM, foi adicionado o
grupo Ace (acetil) à His142 e ao resíduo Trp3, Nme (N-metil) à Glu143, e átomos H-link aos
carbonos β dos resíduos His146 and His152. Durante a otimização de geometria, somente os
átomos QM podiam mover-se até que o RMS do gradiente de energia dos elementos cartesianos
fosse menor que 0.02 kcal/(mol Å).
Depois desta etapa, as distâncias interatômicas e os ângulos de ligação foram comparadas
com a estrutura cristalográfica (Tabela 6). Apesar dos valores indicarem que os estados de
protonação Trp3-COO− ····HOOC-Glu143 e Trp3-COOH···· −OOC-Glu143 serem muito próximos
dos valores obtidos para a estrutura cristalográfica, decidimos utilizar o primeiro devido à
transferência de próton ocorrido do Trp3 para o Glu143, como descrito anteriormente em outros
trabalhos72, em consonância com mecanismo de catálise proposto na literatura, que envolve a
transferência de próton do substrato para o ácido carboxílico da cadeia lateral do GLU143 (Figura
4). Portanto, as próximas simulações foram realizadas utilizando a configuração Zn-C-Trp3COO− ····HOOC-Glu143.
His146
His152
His142
Trp
Glu143
Figura 4 – Sobreposição da estrutura cristalográfica (azul) com a estrutura do estado de protonação (marrom) da
Leuc-a utilizado nas simulações de DM, produzida com o programa Chimera. O íon Zn+2 está mostrado em cinza.
42
4.4.3 – Produção de parâmetros para o ambiente químico do Zn2+
4.4.3.1 – Toxinas complexadas com inibidor endógeno
Para garantir a preservação da estrutura de coordenação ao redor do íon Zn2+ durante a
simulação de DM, foram definidas ligações explícitas entre esse íon e os átomos Nε2 dos
resíduos His142, His146 e His152 e dois oxigênios do grupo carboxilato do Trp3 do inibidor
endógeno. A geometria de referência, determinada pelos comprimentos e ângulos de ligação, e as
cargas dos átomos coordenados ao íon Zn2+ foram obtidas do cluster que corresponde à região
QM considerada nos cálculos SCC-DFTB/MM do tópico anterior. A geometria deste cluster foi
otimizada utilizando o nível de teoria B3LYP/6-31G*30,111,112 combinada com o modelo de
solvente continuo PCM113 (ε=20.0) implementado pelo programa Gaussian0939. As cargas
parciais atômicas do cluster foram produzidas em função do potencial eletrostático calculado
com o nível de teoria B3LYP/6-31G(d), utilizando o método RESP114. Durante esse
procedimento, as cargas dos fragmentos Ace e Nme utilizadas foram obtidas do campo de força
ffSB14 e as cargas dos átomos H-link foram zeradas.
Os valores de referência dos comprimentos e ângulos de ligação para termos de distorção
de comprimentos e ângulos de ligação envolvendo o íon Zn2+ foram extraídos do cluster QM
otimizado. A partir desta geometria de referência, foram construídas estruturas modificando
seletivamente o comprimento (±0.025, ±0.05, ±0.075 Å) e os ângulos de ligação (±3, ±6, ±9
graus) envolvendo o íon Zn, mantendo o restante da geometria do cluster inalterada. Depois de
calcular a energia desse grupo de estruturas utilizando B3LYP/6-31G(d), a constante de força das
ligações e ângulos MM foram obtidas através do ajuste da curva gerada por um polinômio de
segunda ordem em função da variação de energia. Todos os valores de ângulos torcionais das
interações entre o íon Zn e o ligante foram zeradas. Os parâmetros de Lennard-Jones para o íon
Zn2+ foram obtidos de Li et al107. Os outros parâmetros e tipos atômicos foram obtidos do campo
de força ff14Sb.
43
4.4.3.2 –Toxinas complexadas com inibidores de metaloproteases de amplo
espectro
De forma semelhante ao descrito no item anterior, foi utilizada a representação ligada do
íon Zn2+ nas simulações de DM com os inibidores de metaloproteases de amplo espectro, porém
o grupo carboxilato do Trp3 do inibidor endógeno foi substituído pelo grupo hidroxamato, que
está presente em todos os compostos utilizados nesse trabalho. Essa mesma substituição foi
realizada para calcular os valores de referência dos comprimentos e ângulos de ligação, assim
como as constantes de força para os termos de distorção de comprimentos e ângulos de ligação
envolvendo o íon Zn2+, que também foram obtidos utilizando os mesmos procedimentos descrito
no tópico anterior. Para realizar essa etapa adicionamos ao grupo hidroxamato um fragmento
Ace para completar a valência do átomo de carbono.
Os cálculos das cargas RESP utilizadas nas simulações de DM foram realizadas como no
tópico 4.4.3.1, extraindo os clusters das estruturas selecionadas na etapa de docking (descrita no
item 4.6), formados pelos átomos das cadeias laterais dos resíduos His142, His146, His152 e Glu143,
do inibidor e do íon Zn2+. Para realizar das simulações dos inibidores isolados em solução,
otimizamos as estruturas dos inibidores obtidas do banco de dados ZINC63 e calculamos as
cargas RESP considerando a carga global igual a -1. Os tipos atômicos, valores de torção e
ângulos impróprios para átomos dos inibidores foram obtidos do campo de força GAFF47,
utilizando o programa Antechamber.
As otimizações de energia e cálculos das cargas RESP utilizadas para os inibidores nos
cálculos de QM-MM-PBSA foram realizados com o método HF/6-31G*, utilizando a estrutura
da pose com melhor pontuação obtida pelas simulações de docking para cada complexo
toxina/inibidor, e depois utilizadas em todas as outras poses, assumindo que essas cargas são
transferíveis para as outras conformações do ligante.
44
4.5 – Simulações de DM
4.5.1 – Toxinas e inibidor endógeno
As estruturas iniciais das proteínas em complexo com o inibidor endógeno foram
solvatadas em um cubo de água TIP3P com 18 Å de extensão em cada direção além das
dimensões da toxina. Para a estrutura da Leuc-a foram necessários 4 íons Cl- para neutralizar o
sistema, mas para a estrutura da Atr-I não foi necessário adicionar íons. Utilizamos condições
periódicas para simular um sistema contínuo e o método de PME (Particle-Mesh-Ewald) para
tratar as interações eletrostáticas de longo alcance com um espaçamento do grid de 1 Å e
utilizando um valor de corte 9 Å para cálculo de interações de vdW.
As moléculas de água, contra-íons e hidrogênios foram relaxados através de minimização
de energia, utilizando um valor máximo de 2500 passos, sendo 500 passos de steepest descent e
um valor máximo de 2000 passos de conjugate gradient, seguido de 100 ps de DM a 300 K com
o programa SANDER. O sistema inteiro foi em seguida minimizado e aquecido gradualmente a
300 K durante 120 ps de DM (NVT) utilizando um intervalo de tempo de 1.0 fs. Em seguida o
sistema foi pressurizado através de 2.0 ns de DM (NPT). A fase de produção possui 250 ns
(NVT) e foi realizada com um tempo de integração de 2 fs e utilizando a versão do programa
PMEMD para placas GPU (Graphical Processing Units)78. As coordenadas do sistema foram
salvas a cada 2 ps. Durante a simulação utilizamos dinâmica de Langevin115 para controlar a
temperatura com uma frequência de colisão de 2 ps-1 e o comprimento das ligações entre
hidrogênios e outros átomos foram restringidas utilizando o algoritmo SHAKE116. Durante a fase
realizada em NPT, a pressão do sistema foi controlada pelo barostato de Monte Carlo,
implementado pelo programa SANDER.
4.5.2 – Toxinas e inibidores de metaloproteases de amplo espectro
45
Utilizamos como estruturas iniciais as poses selecionadas pela metodologia de docking
(descrita no ítem 4.6) das toxinas com os inibidores de metaloproteases de amplo espectro. Após
serem solvatadas em um cubo de água TIP3P com 18 Å de extensão além das dimensões da
toxina em cada direção do complexo, foram acrescentados 3 íons Cl- para neutralizar o sistema
para as estruturas da Leuc-a, enquanto para as estruturas da Atr-I foi necessário adicionar apenas
um íon Na+. As outras etapas dessas simulações foram as mesmas utilizadas com as toxinas
complexadas com o tripeptídeo.
Nas simulações dos inibidores isolados em solução utilizamos as estruturas iniciais
obtidas das otimizações de geometria, realizando a solvatação em um cubo de água TIP3P com
18 Å de extensão além das dimensões do composto em cada direção. Foi adicionado um íon de
Na+ para neutralizar o sistema. As outras etapas dessas simulações de DM foram as mesmas
utilizadas para os complexos toxinas-inibidores.
4.6 - Docking dos inibidores de metaloproteases de amplo espectro
Essa etapa do trabalho foi realizada pelo Dr. Dimas Suarez e pela Dra. Natalia Diaz. Para
introduzir flexibilidade da proteína no procedimento de docking, foram selecionadas 50 poses de
cada simulação de dinâmica das toxinas em complexo com o tripeptídeo. Depois foram
removidas a molécula do inibidor, as águas e os contra-íons, mantendo os íons Zn2+ e Ca2+, em
cada uma delas. As estruturas iniciais dos inibidores BAT, COL, MAR, MMP e PRI foram
obtidas do banco ZINC.
Para fazer a docagem dos inibidores no sítio ativo das toxinas, foi utilizado o programa
AutoDock4117, que emprega a técnica de Monte Carlo e simulated annealing para explorar as
configurações dos complexos proteína/ligante com uma função de avaliação de energia que
calcula as contribuições de energias de vdW, eletrostáticas e de solvatação. Os valores padrão
dos parâmetros do Autodock118 foram utilizados, com exceção das cargas atômicas do íon Zn2+ e
dos átomos coordenados com este íon, que foram modificados para produzir uma geometria de
coordenação entre o Zn2+ e o grupo hidroxamato dos inibidores próxima das obtidas nas
estruturas cristalográficas, seguindo estratégia similares de outros trabalhos que visavam
46
aumentar a acurácia do campo de força do Autodock para enzimas contendo átomo de
zinco119,120. Foi utilizada a carga de +1.25 para o átomo de zinco, que corresponde à sua carga
RESP, estimada em função do potencial eletrostático calculado pelo método B3LYP/6-31G(p)
com o programa Gaussian09. Para preservar a integridade da carga do cluster, uma carga de
+0.75 foi uniformemente distribuída nos resíduos His142, His146 e His152, coordenados com o
átomo de zinco. A cadeia lateral do resíduo Glu143 foi neutralizada pela adição de um átomo de
hidrogênio e selecionando as cargas Gasteiger apropriadas para o grupo carboxílico. Da mesma
forma, o grupo hidroxamato foi modelado na sua forma aniônica. O modo de ligação desse grupo
está de acordo com o modo de ligação adotado por outros inibidores que possuem o grupo
hidroxamato e ácidos carboxílicos como ZBGs (zinc binding groups)121.
4.6.1 – Cálculos de reavaliação das poses de docking
Para avaliar com maior rigor as poses produzidas pelo Autodock, foi realizada a
reclassificação das mesmas através da otimização de geometria MM e QM/MM seguido por
cálculos single-point QM/MM-PBSA para estimar a energia de interação entre as toxinas e os
ligantes. Nesses cálculos, o sistema foi representado pelo campo de força Amber, versão ff14SB,
e os íons Zn+2 e Ca+2 foram representados pela forma não-ligada desenvolvida por Li et. al.. Para
as moléculas do ligante, foram gerados parâmetros MM automaticamente com o programa
antechamber76 do AmberTools14, utilizando o campo de força GAFF com as cargas atômicas
calculadas pelo método HF/6-31G(d), com o programa Gaussian09. Os cálculos QM/MM foram
realizados com a metodologia SCC-DFTB, adicionando parâmetros para o íon Zn+2. A região
QM foi formada pelos resíduos His142 e Glu143 ligados a grupos Ace e Nme, respectivamente,
pelas cadeias laterais dos resíduos His146 e His152, ligados a átomos H-link no carbono alfa, pelo
íon Zn e pelo grupo hidroxamato dos inibidores.
Cada pose foi otimizada movendo o cluster, o restante da molécula do inibidor e os
resíduos próximos do cluster (105-111, 166-171, 138-139 e 176) durante 500 ciclos de
minimização MM utilizando o algoritmo de gradiente conjugado, seguido por 500 ciclos de
minimização QM/MM com valor dielétrico dependente da distância de ε=4r para avaliar a
47
influência do solvente e com um valor de corte de 20.0 Å para interações não-ligadas.
Posteriormente cálculos single-point QM/MM na fase gasosa sem valor de corte foram
realizados com os complexos toxinas/ligantes, com a toxina e com o inibidor isolado utilizando a
geometria otimizada do complexo toxina-inibidor. De modo similar, a energia de solvatação do
complexo e dos solutos separados foi calculada com o programa PBSA incluído no
AmberTools14, utilizando a equação Poisson-Boltzmann não-linear e utilizando as cargas e raios
atômicos do campo de força ffSB14, com exceção das cargas dos átomos localizados na região
QM utilizada nos cálculos QM/MM, para os quais foram utilizadas cargas Mulliken. As cargas
dos átomos H-link foram distribuídas igualmente para o resto dos átomos QM. A equação PB foi
calculada utilizando uma rede cúbica pelo método iterativo das diferenças finitas, com um
espaçamento de 0.33 Å. A fronteira dielétrica considerada foi a superfície de contato entre o raio
do soluto e raio de uma molécula de água (1.4 Å) utilizada como sonda. A contribuição nãopolar da energia livre de solvatação foi estimada utilizando dois termos, o termo de dispersão e o
termo de cavitação, implementados pelo programa PBSA.
Para classificar as poses de docking utilizando uma função de avaliação mais acurada,
combinamos primeiramente a energia da fase gasosa calculada pelo método SCC-DFTB com a
energia de solvatação PBSA da pose i-ésimo de cada frame j-ésimo, utilizando a fórmula
(6)
!
onde X= SVMP/inibidor, SVMP e inibidor. Depois cada pose determinada pelo índice (i, j) foi
reclassificada pela expressão:
!
(7)
onde o índice ∆intG é a energia de interação SVMP/inibidor, e os dois termos em colchetes
estimam a contribuição da energia de distorção para a estabilidade relativa das poses, resultante
de alterações na geometria interna do inibidor e do fragmento da toxina. Para avaliar os efeitos
de distorção, a energia média de cada inibidor foi calculada para todas as poses com as duas
48
toxinas, mas o termo correspondente para a toxina é a média das poses de docking, obtidas das
simulações de cada pose de DM com todos os inibidores.
4.7 – Análises das trajetórias das simulações de DM
4.7.1 - Toxinas e inibidor endógeno
Os cálculos de RMSD, que medem o deslocamento médio dos átomos durante a simulação,
e as estruturas médias foram obtidas utilizando o programa CPPTRAJ do Amber 14, enquanto as
ligações de hidrogênio e contatos vdW entre as toxinas e o tripeptídeo Gln1-Ser2-Trp3, ou os
inibidores de metaloproteases de amplo espectro foram analisados utilizando um programa
específico desenvolvido pelo Dr. Dimas Suarez. As ligações de hidrogênio foram caracterizadas
por critérios geométricos (e.g., distância X···Y < 3.5 Å e ângulo X-···Y > 120 o). As interações
hidrofóbicas foram calculadas utilizando o termo DFTB de dispersão/atração entre átomos que
compõem grupos hidrofóbicos distintos. Os critérios utilizados para avaliar essas interações
foram: a) a energia de dispersão é maior que 0.5 kcal/mol em valor absoluto; b) a distância entre
os centros de massa dos grupos interagentes é menor que 12 Å.
As análises de agrupamento foram realizadas com 2500/1500 poses das simulações com
Leuc-a/Atr-I, respectivamente, baseado nas coordenadas dos átomos da cadeia principal da alça
Ω (resíduos 148-179) utilizando MMTSB-tools122. Utilizamos um número menor de poses da
simulação com a Atr-I devido ao tempo necessário para a estabilização do RMSD, determinado
após inspeção visual do gráfico da Figura 7. O algoritmo k-mean foi empregado utilizando os
valores de RMSD dos ângulos de torção da cadeia principal com um raio fixo de cluster de 30o.
Os centróides de cada cluster, que representam a estrutura central de cada grupo, foram
utilizadas para representação visual.
Também realizamos o agrupamento com o programa CPPTRAJ sobre essas mesmas poses
utilizando os valores de RMSD dos átomos pesados dos aminoácidos que interagem com os
inibidores de amplo espectro (Tópico 5.3.3.2). Os parâmetros para essa análise foram retirados
da referência123, utilizando agrupamento hierárquico com o método de ligação averagelinkage,
49
alterando somente o valor de Ɛ, relacionado com o momento que deve parar o processo, que
termina quando a distância mínima entre os agrupamentos é maior do que épsilon. Foram
considerados diferentes valores para encontrar um resultado que agrupasse mais de 50% das
poses utilizadas na análise nos primeiros 4 grupos e para que nenhum dos grupos possuísse mais
de 35% das poses. Para a Leuc-a foi utilizado um valor de 1Å e para a Atr-I utilizamos 0.825Å.
4.7.2.1 - Cálculos de energia livre de ligação - toxinas e inibidores de amplo
espectro
Para realização dos cálculos de energia livre de ligação utilizamos a metodologia de MMPBSA, além de duas variações da mesma, MM-GBSA e QM/MM-PBSA. As toxinas foram
representadas pelo campo de força ffSB14, com adição dos parâmetros para os íons Zn2+ e Ca2+
107
e os ligantes pelo campo de força GAFF, utilizando cargas atômicas obtidas pelo
procedimento RESP através do potencial eletrostático calculado para os inibidores isolados,
como descrito no tópico 4.4.5.1. Foram extraídas 2500 poses em intervalos de 100 ps de cada
simulação de DM para a realização desses cálculos, seguido da remoção das moléculas de água e
contra-íons. Nesta etapa utilizamos arquivos de topologia sem ligação explícita entre o íon Zn2+ e
os inibidores. Os cálculos foram realizados utilizando todas as poses ou somente 1500 poses
(60%) extraídas dos dois terços finais das trajetórias. A energia livre (G) dos complexos e dos
inibidores e toxinas isoladas foram calculadas utilizando as poses extraídas uma mesma trajetória
de DM para minimizar a incerteza estatística124. Cada valor de G é compostos por dois termos:
G = E + ΔGsolv
(8)
onde E é a energia em vácuo e ∆Gsolv é a energia de solvatação. E é calculada a partir de cálculos
MM com e programa SANDER. A energia de solvatação é calculada a partir de um termo que
estima a energia eletrostática de solvatação obtida pelos métodos generalizado de Born (GB) ou
de Poisson-Boltzmann (PB), complementado pelos termos de dispersão e de cavitação para parte
apolar da energia de solvatação calculado programa PBSA. As cargas atômicas usadas nos
50
cálculos PBSA foram as mesmas utilizadas na DM. A contribuição eletrostática da energia livre
de solvatação PBSA foi determinada com o método de PB não linear (PBNL), que representa o
soluto como um meio dielétrico fraco, com valor de Ɛint=1 com cargas incorporadas, e o solvente
como um meio dielétrico forte, com valor de Ɛint=80 sem a presença de íons. As cargas e os raios
atômicos foram os mesmos descritos na produção de parâmetros. O programa PBSA foi utilizado
para calcular a equação de PB ( não-linear) com um espaçamento da malha de 0.33 Å.
Para realizar os cálculos de G usando a aproximação QM/MM-PBSA, além da
minimização de energia do complexo utilizando somente MM, realizamos posteriormente uma
minimização de energia da região QM através de QM/MM utilizando o método SCC-DFTB,
seguido do teste de convergência SCF e descarte das poses que não passaram no teste. Após essa
etapa a energia do complexo foi calculada através de cálculos single-point, que combinam os
valores de energia da fase gasosa, calculada através do método SCC-DFTB/MM, e a energia de
solvatação, calculada pelo método PBNL para a parte eletrostática e pelos termos de dispersão e
de cavitação para parte apolar. Nos cálculos PB foram utilizadas cargas Mulliken para os átomos
da região QM. As cargas dos link atoms foram distribuídos entre os átomos da região QM para
preservar a integridade das cargas do cluster.
4.7.2.2 – Função de pontuação aplicada às poses extraídas das simulações de
DM
Os parâmetros empregados para os inibidores utilizados nessa etapa estão descritos no
tópico 4.4.5.3 e os cálculos de energia foram realizados com o métodos MM-PB(GB)SA o
QM/MM-PBSA descritos na seção anterior. A média dos valores de GMM-PBSA dos diferentes
sistemas (complexo, receptor/toxina, e inibidor sozinho) pode ser utilizados para estimar a
energia livre de ligação:
ΔGlig = Gcomplexo − Ginibidor − Greceptor
(9)
51
Como esta função não avalia as contribuições entrópicas e as energias de distorção dos
ligantes e dos receptores, utilizamos uma função de avaliação elaborada pelo Dr. Dimas Suarez
definida pela fórmula
Trunc.
" Trunc.
#
Gavaliaçâo (i ) = ΔGlig (i ) + ΔGdist inibidor (i ) + %G receptor (i ) − G receptor &
'
(
Trunc .
Trunc .
receptor # *
)
" receptor
− T + Δ conform S inibidor (i ) + Δ rot −trans S inibidor (i ) + % Sconform (i ) − Sconform & ,
'
(.
-
(10)
onde ∆ligG(i) é a energia de ligação, ∆Gdistinibidor(i) é a energia de distorção do inibidor,
Gtrunc.receptor é a energia da toxina da forma truncada, G trunc.host(i) é a energia média da forma
truncada da toxina com todos os inibidores, T é a temperatura em Kelvin, ∆conformSinibidor(i) é a
entropia conformacional do ligante, ∆rot-transSinibidor(i) é a mudança de entropia rotacional e
translacional do inibidor, Strunc.hostconform(i) é a entropia conformacional da toxina,
!trunc.receptorconform(i) é a média da energia conformacional da toxina em complexo com todos os
inibidores. Essa função de avaliação permite a comparação entre as poses de diferentes
simulações e entre diferentes complexos toxinas-inibidores. A utilização do fragmento da toxina
nesses cálculos ao invés de toda a proteína tem como objetivo diminuir a estimativa de erro dos
cálculos sobre a contribuições de distorção e entrópica do processo de ligação.
A entropia conformacional foi calculada pelo programa CENCALC, utilizando o método
AMIE (Approximate mutual information expansion)125. Esses cálculos também foram realizados
utilizando o ligante em conjunto com a região truncada das toxinas, que é formada pelos os
resíduos mais próximos do ligante, compostos pelos segmentos 101 a 112 (folha-β), 123 a 128
(folha-β), 133 a 148 (α-hélice) e os 148 a 177 (alça Ω). Os cálculos dos termos ∆rot-transSinibidor
foram realizadas com as fórmulas propostas por Aqvist126.
52
Figura 5 – Estrutura da Leuc-a destacando, em ribbon, as regiões utilizadas nos cálculos de entropia
conformacional. O íon Zn+2 está mostrado em cinza. Figura produzida com o programa Chimera.
4.8 – Cálculos do potencial eletrostático
O potencial eletrostático dos modelos Leuc-a/Atr-I em solução foram calculados para as
conformações extraídas das trajetórias de DM utilizando o programa APBS127. Nos cálculos PB
foram utilizadas somente os átomos das toxinas e do inibidor, sendo que as cargas e os raios
atômicos foram obtidos do campo de força ff14SB. A equação de PB linear foi calculada em
uma rede cúbica utilizando método das diferenças finitas, com espaçamento da grade de 0.33 Å e
a fronteira da rede foi ajustada de acordo com o potencial Debye-Hückel. A fronteira dielétrica
53
foi a superfície de contato entre o soluto e uma esfera de água com raio de 1.4 Å. O potencial
eletrostático foi representado na superfície molecular das toxinas utilizando o programa
MSMS128 e visualizado com o programa Chimera129.
4.9 – Análises de cavidades
O tamanho e a forma do bolso hidrofóbico S1’ foram monitorados durante a simulação de
DM utilizando o programa MDPOCKET130, que utiliza o algoritmo de detecção de cavidades
implementado pelo programa FPOCKET131. Para as trajetórias da Leuc-a foram avaliadas 5000
poses da DM igualmente espaçadas, enquanto para as da Atr-I foram utilizadas 3500, das quais
foram retiradas as moléculas de água, contra-íons e o inibidor endógeno. As estruturas foram
alinhadas com a estrutura média produzida com os últimos 50 ns da DM, utilizando os átomos da
cadeia principal. Para cada pose, o programa FPOCKET utiliza um conjunto de esferas α geradas
utilizando os parâmetros geométricos padrão para detecção de sítios de ligação para pequenos
ligantes. Cada esfera α é uma esfera que não possui átomos no seu interior e está em contato com
exatamente 4 átomos equidistantes do seu centro. Se esses átomos estiverem no mesmo plano
formam uma esfera de raio infinito, enquanto 4 átomos agrupados nos vértices de um tetraedro
delimitam um esfera com raio próximo ao valor dos raios de vdW dos átomos envolvidos.
Esferas α dentro de cavidades pequenas possuem raios muito pequenos, enquanto esferas na
superfície apresentam raios muito grandes. Portanto, é possível determinar sítios de ligação
selecionando esferas com raios de comprimentos intermediários. Primeiramente o programa
MDPOCKET cria uma rede tridimensional sobre a estrutura de referência de modo que as
esferas α criadas em cada pose são associadas às esferas mais próximas criadas sobre a estrutura
de referência. Depois disso as esferas de um grupo que determina um possível sítio de ligação
são ponderadas em relação aos valores de frequência φ, que indicam se um determinado ponto é
permanentemente acessível (φ=1), inacessível (φ=0), ou parcialmente acessível (0<φ<1). A
visualização do mapa de frequência e da estrutura da proteína permite selecionar o conjunto de
esferas que caracterizam o bolso S1’. Posteriormente, uma segunda rodada de utilização do
MDPOCKET focando nas esferas selecionadas produziu informação específica sobre o volume e
a plasticidade do bolso S1’.
54
4.10 – Cinética enzimática
As
toxinas
atroxlisina-I
e
leucurolisina-a
foram
purificadas
como
descrito
anteriormente4,7 e fornecidas pelo Dr. Eladio Sanchez. Os inibidores BAT, CP4, MAR e PRI
foram obtidos da Sigma, enquanto os inibidores COL e MMP foram obtidos da Biosan. Para
realizar os testes de cinética enzimática, incubamos as toxinas, na concentração final de 2nM,
solubilizadas em tampão Tris-Hcl 50mM, pH 7,4, com 1mM de CaCl2, com os inibidores de
metaloproteases de amplo espectro, em diferentes concentrações por 30 minutos, com 40µL por
poço, em placas de 96 poços. Depois adicionamos 40uL da solução do peptídeo AbzLVEALYQ-EDDnp em cada poço, com concentração final de 65µM, solubilizado no mesmo
tampão utilizado para as toxinas. Imediatamente após a adição do substrato a hidrólise foi
monitorada por fluorescência em um equipamento Synergy Biotek 2, durante dois minutos a
37°C, utilizando o filtro de λex=340nm e λem=440nm. O cálculo da velocidade inicial da reação
foi calculada utilizando a leitura do primeiro minuto, determinando-se a porcentagem de inibição
a partir de comparação com um controle contendo a mesma concentração de DMSO ou etanol
encontrado na solução do inibidor. Em cada ensaio para determinação de IC50 foram avaliadas no
mínimo 5 concentrações de inibidor, realizados em triplicata, utilizando o programa GraphPad
Prism132.
4.11 – Triagem virtual
Uma base de dados de aproximadamente 3.000.000 compostos lead-like comercialmente
disponíveis do banco de dados ZINC63 foi empregada na triagem virtual utilizando o programa
Autodock Vina. Utilizamos o programa MGLTools133 para preparar a estrutura da Leuc-a,
acrescentando hidrogênios, definindo os tipos atômicos e as cargas parciais para os átomos. Os
ligantes foram preparados através da utilização de scripts obtidos no sítio do programa
Autodock. A triagem foi realizada tratando a toxina como uma estrutura rígida, empregando as
55
coordenadas cristalográficas. A região da toxina utilizada para as simulações foi um cubo de 22Å
de aresta centrado no átomo de zinco do sítio ativo. Foi utilizado valor padrão do programa para
os parâmetros dessas simulações.
Também selecionamos as conformações representativas dos 4 agrupamentos mais
populosos da Atr-I e Leuc-a que foram obtidos da simulações de DM como descrito no tópico
4.7.1, para serem utilizadas futuramente em uma segunda fase de triagem virtual com 5% dos
compostos lead-like melhor classificados na triagem inicial.
4.12 – Análise de estruturas
As estruturas das moléculas foram analisadas utilizando os programas Chimera129,
Molden134, PyMOL23, VMD135 e Chemdraw14136.
4.13 – Análise estatísticas
As análises estatísticas foram feitas com o programa Octave137e R138.
56
5 - Resultados
5.1 - Modelagem Comparativa
O modelo tridimensional da atroxlisina-I foi gerado com o programa MODELLER,
utilizando como moldes quatro estruturas de toxinas: acutolisina A, BaP1, BmooMPalpha-I e
leucurolisina-a, que apresentam 67%, 56%, 54% e 52% de identidade de sequência com o alvo.
Figura 6 – Alinhamento das sequências da Atr-I e das toxinas utilizadas como moldes para a modelagem
comparativa realizado pelo programa Clustal Omega. As porcentagens indicam a identidade entre as sequências com
a Atr-I.
A escolha dos moldes foi baseada também na cobertura de sequência e na resolução das
estruturas cristalográficas, em todos casos melhor que 2Å. As principais características dos
moldes estão apresentados na Tabela 2.
57
Toxina
PDB
Resolução
(Å)
Identidade de
sequência
Comprimento
(aa)
Atividade
Hemorrágica
Organismo de
origem
Acutolisina-A
1BSW
1.95
67%
197
sim
Agkistrodon
acutus
BmooMPalpha-I
3GBO
1.77
56%
200
não
Bothrops
moojeni
BaP1
2W15
1.05
57%
202
sim
Bothrops
asper
Leucurolisina-a
4Q1L
1.80
52%
202
não
Bothrops
leucurus
-
-
-
202
sim
Bothrops
atrox
Atroxlisina-I
Tabela 2 – Características principais da atroxlisina-I e dos moldes utilizados para modelagem comparativa.
Após realizar uma inspeção visual do modelo obtido na etapa da modelagem, observamos
que a cadeia lateral da Lis176, localizada na alça 149-178, estava quase completamente enterrada
em uma região hidrofóbica que não permitia interações polares. Entretanto, a estrutura
cristalográfica da acutolisina-a, que apresenta maior similaridade de sequência com a Atr-I nessa
região quando comparada com os outros moldes, apresenta um resíduo de Lis na mesma posição,
cuja cadeia lateral está totalmente acessível ao solvente. Portanto, decidimos refinar a estrutura
da alça da região 172 a 177 utilizando o programa MODELLER e somente a estrutura da
acutolisina-a como molde. Outros 1000 modelos foram gerados nesta etapa e os 100 melhor
avaliados pela pontuação DOPE foram classificados novamente com ModFOLD4, que está entre
os principais métodos de avaliação de qualidade na versão mais recente do evento Critical
Assessment of protein Structure Prediction (CASP)97. Após isso, o modelo selecionado foi
analisado pelo programa PROCHECK para avaliar as características estereoquímicas, mostrando
que 91% (163aa) dos resíduos estão na região mais favorável do Gráfico de Ramachandran,
8,4% (15aa) estão em regiões permitidas e 0,6% (1aa) estão em regiões generosamente
permitidas, resultado similar aos obtidos para as estruturas dos moldes (Figura 7). A pontuação
geral do programa foi 0,02, indicando alta qualidade estereoquímica do modelo.
58
Figura 7 – Gráficos de Ramachandran dos moldes utilizados na modelagem comparativa, identificados pelo código
do PDB, e do modelo da Atr-I produzidos pelo programa PROCHECK.
A qualidade do modelo foi avaliada também pelos programas ModEval139, Prosa56 e
QMEAN99 (Tabela 3). Como pontuações do ModEval menores que -1 indicam que a estrutura
avaliada possui características próximas das experimentais, a pontuação obtida indica que o
modelo da atroxlisina-I possui uma boa qualidade, assim como a pontuação obtida pelo
QMEAN, com valor de z score próximo de 0.
59
Toxina
ModEval (z-DOPE)
Prosa
Qmean a
Acutolisina-A
-2,26
-8,05
0,776 (0,19)
BmooMPalpha-I
-2,31
-7,47
0,762 (-0,44)
BaP1
-2,33
-7,34
0,786 (-0.08)
Leucurolisina-a
-2,40
-7,48
0,727 (-0,38)
Atroxlisina-I
-2,08
-8,18
0,780 (-0,11)
Tabela 3 - Pontuações dos programas de avaliação ModEval, Prosa e Qmean obtidas pelo modelo selecionado da
Atr-I e dos moldes utilizados na modelagem comparativa. a Os z scores estão em parênteses.
O programa Prosa foi utilizado também para avaliar a qualidade local do modelo,
considerando a energia de interação de cada resíduo. Utilizando uma janela de 10 resíduos de
comprimento, o resultado mostrou que a grande maioria dos resíduos com valores de interação
de energia negativa, e somente 9 resíduos com interação positiva de energia, fornecendo
evidência adicional da boa qualidade do modelo. A pontuação obtida pelo Prosa é semelhante às
obtidas para a proteínas de tamanho similar determinadas por cristalografia por raios-x ou NMR,
como mostra a Figura 8.
Figura 8 – Avaliação da qualidade local (a) e global (b) do modelo da Atr-I produzida pelo programa Prosa. O
gráfico em (b) apresenta as pontuações obtidas pelas estruturas do PBD, com a cores indicando a metodologia
experimental utilizada para produzir a estrutura, azul para raios x e cinza para NMR.
60
A Figura 9, produzida pelo programa VMD135, mostra o alinhamento estrutural das
toxinas Atr-I e Leuc-a coloridas por similaridade utilizando a matriz BLOSUM60, evidenciando
a alto índice de similaridade estrutural e de sequência entre essas toxinas.
Figura 9 - Alinhamento estrutural das toxinas Atr-I e Leuc-a coloridas por similaridade utilizando a matriz
BLOSUM60 produzida com o programa VMD. As regiões com coloração azul indicam áreas conservadas, e as áreas
menos conservadas possuem coloração gradativas em direção ao vermelho.
5.2 - Cálculos de pKa
A Tabela 4 contêm os valores de pKa calculados utilizando o programa H++, para as
toxinas Leuc-a e Atr-I em sua forma nativa, com valores de 4, 6, 10 e 20 para Ɛint . Os valores de
pKa para a Leuc-a não variam drasticamente com a variação dos valores de Ɛint, e portanto o
61
estado de protonação dos resíduos tituláveis podem ser estabelecidos com segurança em pH 7.
Os resíduos com maior variação de pKa com relação aos valores padrão são His158 (7,8-7,4) e
Lis172 (8,2-9,3). Esses dois resíduos estão localizados na superfície da proteína na estrutura
cristalográfica e suas cadeias laterais não estabelecem contatos significativos com outros
aminoácidos, ou seja, estão completamente acessíveis ao solvente. Nesse cenário, os valores de
pKa obtidos com Ɛint=20 podem ser mais precisos com esses dois resíduos e eles foram
modelados como neutro e positivamente carregado, respectivamente. Os outros valores de pKa da
Tabela 4 permitem concluir que os resíduos Asp e Glu são carregados negativamente, enquanto
os resíduos Arg e Lis continuam positivamente carregados em pH 7. Todas as cisteínas que não
participam da formação de pontes dissulfeto, tirosinas e histidinas devem ser modeladas com
cadeia lateral neutra, protonadas no átomo Nδ para as His142, His146, His152, ou Nɛ para as outras
histidinas. Também notamos que o valor estimado de pKa para o Glu143 na ausência do
tripeptídeo varia em torno de 1.4-2.2, sugerindo que a forma desprotonada, com carga negativa, é
a principal na enzima. Apesar disso, escolhemos a carga neutra para esse resíduo de importância
catalítica para as simulações de DM, cujo grupo carboxilíco está a uma distância de
aproximadamente 3Å do grupo carboxilíco do Trp do tripeptídeo, com base em cálculos
semiempíricos QM/MM preliminares realizados na presença do ligante Gln-Ser-Trp, como
descrito no tópico 4.4.2. De modo similar, o cálculo de pKa para as His142, His146 e His152
resultou em valores muito baixos, o que está de acordo com o papel desses resíduos de se
ligarem ao átomo Zn2+.
No caso da Atr-I, os valores de pKa calculados para os resíduos Glu3, Asp15, His92
,Asp102, Lys120, , e Asp133 apresentam variações significativas (desvio padrão maior que 1.9 ou
valor de pKa em Ɛint=4 com diferença maior que 1.9 do valor padrão) com a mudança de Ɛint,
como mostra a Tabela 4. A maioria desses resíduos está localizada na superfície da proteína,
estando portanto com as cadeias laterais acessíveis ao solvente. Portanto, os valores de pKa
obtidos com Ɛint=4 podem ser descartados e os valores de pKa restantes podem ser considerados
compatíveis com o estado de protonação padrão em solução aquosa. As únicas exceções são os
resíduos Glu3 e Asp15, que estão parcialmente inacessíveis ao solvente, e portanto os valores de
pKa obtidos com valor de Ɛint=4 podem ser significativos. Entretanto, essa orientação desses
resíduos está provavelmente relacionada com a qualidade do modelo nessas áreas, porque
nenhuma interação estabilizante para as cadeias laterais dos resíduos Glu3 e Asp15 com outros
62
resíduos é observada, e o relaxamento da estrutura, ocorrida principalmente durante os primeiros
100 ns da simulação de DM, resulta em uma orientação mais acessível ao solvente sem alterar a
estrutura global da enzima. Consequentemente, todos os resíduos ionizáveis da Atr-I, com
exceção do Glu143 e das cisteínas envolvidas na formação de pontes dissulfeto, foram modelados
com seu estado de ionização padrão em pH 7, com os Asp e Glu carregados negativamente, Arg
e Lis carregados positivamente, His, Tir e a Cis186 da Atr-I com carga neutra.
Resíduos
N-term
Glu1
Arg6
Tir7
Glu9
Asp15
His16
Lis20
Lis21
Tir22
Arg30
Lis31
His34
Glu35
Arg45
Asp50
Glu57
Lis61
Lis62
Asp63
Lis66
Glu68
Lis69
Asp70
Lis73
Glu80
Arg82
Glu83
Arg84
Asp85
Arg89
His92
ε int=4
6.2
3.6
>12.0
>12.0
<0.0
<0.0
6.8
10.2
>12.0
>12.0
11.7
10.3
5.9
4.0
>12.0
3.0
1.3
10.2
11.0
3.0
10.7
5.4
>12.0
1.0
11.4
1.8
>12.0
5.1
>12.0
0.2
>12.0
<0.0
Leuc-a
ε int=6
6.7
3.6
>12.0
>12.0
<0.0
<0.0
6.7
10.3
>12.0
>12.0
11.8
10.4
6.1
3.8
>12.0
3.0
1.7
10.2
10.9
2.7
10.8
4.9
>12.0
1.5
11.4
2.3
>12.0
5.0
>12.0
1.1
>12.0
<0.0
ε int=10 ε int=20
7.1
7.5
3.7
3.7
>12.0
>12.0
11.4
10.3
<0.0
1.0
<0.0
0.2
6.7
6.6
10.3
10.4
>12.0
11.9
>12.0
>12.0
11.9
>12.0
10.4
10.5
6.1
6.2
3.6
3.4
>12.0
>12.0
2.8
2.7
1.7
2.0
10.3
10.3
10.7
10.6
2.4
2.1
10.8
10.8
4.4
4.0
>12.0
11.7
1.9
2.3
11.4
11.5
2.8
3.0
>12.0
>12.0
4.8
4.4
>12.0
>12.0
1.5
2.0
>12.0
>12.0
1.3
5.2
Resíduos ε int=4
N-term
6.9
Glu3
11.6
Arg6
>12.0
Tir7
11.8
Asp9
1.4
Asp15
8.4
His16
6.2
Lis21
>12.0
Tir22
>12.0
Asp27
1.1
Lis28
10.0
Arg30
11.9
Arg31
>12.0
Arg32
>12.0
His34
5.4
Lis41
11.3
Glu42
0.9
Tyr44
>12.0
Tir48
10.9
Asp50
3.4
Glu57
1.2
Lis62
11.0
Asp63
0.6
Asp76
4.9
Glu80
4.0
Arg82
>12.0
Lis83
9.7
Asp85
2.3
Arg89
>12.0
Lis90
10.0
His92
<0.0
Asp93
<0.0
Atr-I
ε int=6
7.0
9.0
>12.0
11.1
1.6
4.9
7.3
>12.0
>12.0
1.5
10.1
11.9
>12.0
>12.0
5.7
11.3
1.7
>12.0
10.8
3.3
1.4
10.9
1.4
4.4
4.1
>12.0
10.0
2.5
>12.0
10.1
<0.0
<0.0
ε int=10
7.3
7.0
>12.0
10.5
0.9
3.8
7.2
>12.0
>12.0
1.8
10.2
12.0
>12.0
>12.0
6.2
11.4
2.3
>12.0
10.6
3.1
1.2
10.9
2.2
3.9
4.2
>12.0
10.2
2.4
>12.0
10.2
3.9
<0.0
ε int=20
7.4
5.4
>12.0
10.1
1.4
2.7
7.1
>12.0
11.5
2.1
10.4
>12.0
>12.0
>12.0
6.4
11.4
2.8
>12.0
10.5
3.0
1.8
10.8
2.8
3.5
4.1
>12.0
10.4
2.5
>12.0
10.3
5.7
<0.0
63
Asp93
His94
Asp104
Glu105
Glu106
Tir112
Asp118
Asp128
His129
Lis131
Lis132
Arg135
His142
Glu143
His146
Arg151
His152
Asp153
His158
Asp168
Lis172
Glu177
Asp180
Tir186
Tir189
Lis192
His193
Lis201
C-term
<0.0
<0.0
4.6
4.2
4.4
>12.0
1.7
<0.0
2.9
10.2
9.6
11.9
<0.0
3.2
<0.0
>12.0
<0.0
1.5
7.8
3.6
8.2
5.4
2.7
>12.0
>12.0
10.1
5.9
10.7
3.8
<0.0
<0.0
4.0
4.6
4.3
>12.0
2.2
<0.0
4.5
10.2
9.8
>12.0
<0.0
2.2
<0.0
>12.0
<0.0
2.0
7.7
3.5
8.6
5.0
2.9
>12.0
>12.0
10.2
6.1
10.8
3.7
<0.0
4.2
3.6
4.6
4.2
>12.0
2.4
<0.0
5.3
10.2
9.9
>12.0
<0.0
1.4
<0.0
>12.0
<0.0
2.3
7.5
3.5
8.9
4.7
3.0
>12.0
>12.0
10.2
6.2
11.2
3.6
<0.0
6.0
3.4
4.6
4.2
11.0
2.6
0.5
5.8
10.2
10.0
>12.0
<0.0
1.4
<0.0
>12.0
<0.0
2.4
7.4
3.4
9.3
4.4
3.1
>12.0
11.7
10.3
6.3
11.5
3.5
Asp102
Tir112
Asp118
Lis120
Arg121
Asp128
His129
Glu131
Asp133
His142
Glu143
His146
His152
Asp153
Tir162
His172
Glu173
Lis176
Tir177
Asp180
Tir183
Cis186
Asp188
Lis192
Glu193
Lis201
Arg202
C-term
6.1
>12.0
0.4
1.6
>12.0
<0.0
5.5
3.5
7.7
<0.0
2.9
<0.0
<0.0
5.5
10.1
6.2
3.6
>12.0
>12.0
1.7
>12.0
>12.0
5.2
>12.0
4.2
9.8
>12.0
<0.0
5.5
>12.0
1.0
10.8
>12.0
<0.0
6.7
3.5
5.6
<0.0
2.7
<0.0
<0.0
4.8
10.0
6.3
3.7
12.0
>12.0
2.3
>12.0
>12.0
4.6
11.9
4.3
10.1
>12.0
<0.0
5.0
11.8
1.2
11.1
>12.0
<0.0
7.2
3.5
4.2
<0.0
2.5
<0.0
<0.0
4.1
10.0
6.4
3.8
11.9
>12.0
2.8
>12.0
>12.0
4.1
11.7
4.3
10.4
>12.0
0.1
4.5
10.7
1.7
11.4
>12.0
0.8
7.3
3.6
3.2
<0.0
2.6
<0.0
1.0
3.5
9.9
6.4
3.9
>12.0
11.3
3.4
>12.0
11.3
3.8
11.6
4.3
10.6
>12.0
1.2
Tabela 4 – Valores de pKa calculados pelo programa H++ para os aminoácidos ionizáveis da Leuc-a e Atr-I
considerando 4 constantes dielétricas (εint ) diferentes.
5.3 - Ensaios de cinética enzimática com inibidores de metaloproteases de amplo
espectro
Os inibidores de metaloproteases de amplo espectro utilizados nesse trabalho (Figura 10)
foram desenvolvidos para inibir as enzimas do grupo das ADAM/ADAMTS e/ou MMPs.
Portanto, era esperado que eles também inibissem as SVMPS, devido à similaridade dos sítios
ativos entre as enzimas desses grupos. Além disso, os compostos MMP e COL já haviam sido
64
utilizados em testes iniciais de inibição de atividade proteolítica com a toxina leucurolisina-a por
nosso grupo e apresentaram inibição de aproximadamente 40% e 90% em concentração de
aproximadamente 15 nM (dados não publicados). Outros compostos testados anteriormente com
uma SVMP foram o MAR e BAT, que inibem a atividade hemorrágica da BaP1140, que apresenta
57% de identidade com a atroxlisina-a e 78% com a leucurolisina-a, e o PRI, que foi capaz de
inibir a atividade hemorrágica da toxina EoVMP2, cujo domínio catalítico apresenta 48% de
identidade com a leucurolisina-a e 56% com a atroxlisina-I140. Estes últimos três compostos
apresentam a grande vantagem adicional de já terem sido utilizados em seres humanos, chegando
na Fase 3 de ensaios clínicos em pacientes com câncer, sendo descontinuado o seu uso devido à
falta de eficácia do tratamento. Apesar disso, esses compostos apresentaram efeitos contra as
metaloproteases humanas e apresentaram efeitos tóxicos somente a médio e a longo prazo141–143,
características que parecem permitir sua aplicação em acidentes com serpentes.
65
Figura 10 – Estrutura química dos inibidores de metaloproteases de amplo espectro selecionados neste trabalho.
Figura produzida com o programa MarvinSkecth.
Os valores de IC50 desses inibidores de metaloproteases de amplo espectro, calculados
em ensaios de cinética enzimática com peptídeo marcado com Abz e monitorados por
fluorescência, estão mostrados nas Tabelas 5 e 6. Nossos resultados mostram que os inibidores
apresentaram uma alta atividade inibitória das toxinas, algumas vezes em concentrações de
nanomolar, com destaque para o composto PRI, que apresentou alta inibição contra as duas
toxinas, com IC50 de 0,07µM e 0,02µM para a Atr-I e Leuc-a respectivamente, além de ter sido
aprovado para tratamento em humanos e poder ser administrado oralmente. Outro inibidor que
apresentou resultados inibitórios em baixa concentração contra as duas toxinas foi o CP4, com
IC50 de 0,02µM para a Atr-I e 0,21µM para a Leuc-a. É interessante notar que esses dois
compostos que apresentaram maior potência contra as duas toxinas representam inibidores de
segunda geração, que não são peptideomiméticos como os demais e foram desenvolvidos após o
descobrimento desses últimos.
66
Apesar disso, não foi possível determinar a constante de dissociação (Kd), que mede a
afinidade de um inibidor por determinado alvo proteico. Geralmente esta constante pode ser
calculada a partir dos valores de IC50 e da constante de Michaelis-Menten (Km). No entanto, não
conseguimos realizar essa conversão, devido à impossibilidade de determinar o valor de Km do
substrato para essas enzimas, porque seria necessário realizar ensaios com concentrações
superiores às permitidas pela solubilidade desse composto.
Outro ponto interessante desses ensaios foi a obtenção de coeficientes de Hill com
valores superiores a 1, o que indicaria cooperatividade positiva de ligação dos inibidores, ou seja,
a ligação de uma molécula do composto aumentaria a afinidade da toxina pelo mesmo, indicando
uma possível presença de mais de um sítio de ligação. Entretanto, as variações obtidas para um
mesmo composto nos ensaios com as duas toxinas, como por exemplo no caso do compostos
BAT, com valores de coeficiente de Hill de 0,85 e 4,91 para Atr-I e Leuc-a respectivamente,
junto com um número reduzido de pontos e com alguns valores de intervalos de confiança
elevados, indicam que ainda são necessários realizar novos ensaios para confirmar a ocorrência
desse fenômeno.
Inibidores
IC50(µM)
Coeficiente de
Hill
R2
Número de
pontos
BAT
0,05±0,03
0,85
0,93
7
COL
8,69±2,18
2,28
0,92
6
CP4
0,02±0,01
2,37
0,96
7
MAR
0,08±0,01
2,05
0,99
7
MMP
0,05±0,01
1,79
0,99
7
PRI
0,07±0,05
0,77
0,90
6
Tabela 5 – Valores de IC50 e intervalos de confiança obtidos pelos ensaios de cinética enzimática utilizando
inibidores de amplo espectro e a toxina atroxlisina-I (Atr-I).
67
Inibidores
IC50(µM)
Coeficiente de
Hill
R2
Número de
pontos
BAT
12,33±0,9
4,91
0,99
5
COL
6,46±1,67
1,65
0,96
6
CP4
0,21±0,11
0,55
0,97
7
MAR
0,78±ND
8,86
0,91
7
MMP
0,36±0,17
1,34
0,95
7
PRI
0,02±0,01
1,96
0,93
6
Tabela 6 – Valores de IC50 e intervalos de confiança obtidos pelos ensaios de cinética enzimática utilizando
inibidores de amplo espectro e a toxina leucurosilina-a (Leuc-a).
As curvas de inibição da atividade proteolítica utilizadas para obter os valores de IC50
estão mostradas na Figuras 11 e 12.
Figura 11 – Curvas de inibição da atividade proteolítica obtidas pelos ensaios de cinética enzimática utilizando os
inibidores de amplo espectro e Atr-I.
68
Figura 12 – Curvas de inibição da atividade proteolítica obtidas pelos ensaios de cinética enzimática utilizando os
inibidores de amplo espectro e Leuc-a.
5.4 - Simulações de DM
5.4.1 – Escolha do estado de protonação de resíduos do sítio catalítico
Após considerar diferentes estados de protonação iniciais dos ácidos carboxílicos da
cadeia lateral do Glu143 e da cadeia principal do Trp3 e realizar a otimização das geometrias por
QM-MM, comparamos os ângulos e as distâncias interatômicas dos átomos do sítio catalítico
coordenados com o átomo de zinco para escolher aquele que se aproximava mais da geometria
da estrutura cristalográfica, utilizada como estrutura de referência. Tendo em vista que os valores
da Tabela 7 indicam que os estados de protonação mais próximos são Trp-COO-Glu-COOH e o
Trp-COOH-Glu-COO-, decidimos utilizar o primeiro estado (Trp-COO-Glu-COOH) devido à
transferência de próton ocorrido do Trp3 para o Glu143 quando realizamos a otimização de
geometria com o Trp-COOH-Glu-COO-, fenômeno também observado em outros trabalhos com
69
enzimas do grupo das metzincinas72. A semelhança entre a geometria do sistema para o estado de
protonação escolhido e a da estrutura cristalográfica está mostrada na Figura 13.
Distancias Interatômicas
Estrutura
Cristalográfica
Trp-COOGlu-COOH
Trp-COOGlu-COO-
Trp-COOH
Glu-COOH
Trp-COOH
Glu-COO-
His142@Nε2···Zn
2.02
2.00
1.98
1.97
1.99
His146@Nε2···Zn
1.98
1.97
1.98
1.94
1.96
His152@Nε2···Zn
1.93
1.99
1.98
1.95
1.98
Trp3@OXT···Zn
1.91
2.17
2.26
2.03
2.16
Trp3@O···Zn
2.41
2.22
2.13
2.74
2.22
Glu143@ε1···Trp3@O
3.15
3.29
3.30
2.66
3.26
Glu143@Oε2···Trp3@O
2.61
2.65
3.43
3.91
2.65
His142@Nε2···Zn···His146@Nε2
101.4
96.9
98.7
101.5
99.2
His142@Nε2···Zn···His152@Nε2
105.6
105.2
106.5
107.6
104.4
His146@Nε2···Zn···His152@Nε2
104.8
112.2
109.1
117.7
111.1
Trp3@OXT···Zn···His142@Nε2
106.9
109.5
106.6
104.5
110.6
Trp3@OXT···Zn···His146@Nε2
139.8
144.1
148.7
128.8
140.6
Trp3@OXT···Zn···His152@Nε2
94.5
84.5
81.4
95.1
86.2
Trp3@O···Zn···His142@Nε2
84.6
83.7
92.9
83.0
82.5
Trp3@O···Zn···His146@Nε2
98.0
99.9
100.6
88.2
100.1
Trp3@O···Zn···His152@Nε2
152.4
145.0
141.1
148.0
146.1
Ângulos X···Zn···Y
Tabela 7 – Distâncias interatômicas (em Å) e ângulos X-Zn-Y (em graus) para a estrutura 4Q1L e para as estruturas
otimizadas pelo método SCC-DFTB/AMBER com diferentes distribuições de cargas entre os grupos carboxílicos do
Glu143 e C-Trp3 (inibidor endógeno).
70
His146
His152
His142
Trp
Glu143
Figura 13 – Sobreposição da estrutura cristalográfica (azul) com a estrutura do estado de protonação (marrom)
utilizado nas simulações de DM produzida com o programa Chimera. O íon Zn+2 está mostrado em cinza.
5.4.2 - Simulações de DM com inibidor endógeno
A evolução estrutural das duas enzimas durante as simulações pode ser avaliada com
ajuda de gráficos de RMSD e os valores médios correspondentes que foram calculados em
função de estrutura cristalográfica da Leuc-a ou do modelo por homologia da Atr-I utilizando
somente as coordenadas dos átomos pesados da cadeia principal (Figuras 14 e 15).
71
0.65±0.10
1.48±0.13
0.53±0.07
0.35±0.05
0.68±0.13
0.50±0.06
0.81±0.12
0.43±0.11
0.36±0.04
1.26±0.11
Figura 14 – Variação da estrutura da toxina Atr-I durante 250 ns de simulação por dinâmica molecular, medida
pelos valores de RMSD dos átomos pesados da cadeia principal.
72
Figura 15 – Variação da estrutura da toxina Leuc-a durante 250 ns de simulação por dinâmica molecular, medida
pelos valores de RMSD dos átomos pesados da cadeia principal.
73
A estrutura cristalográfica da Leuc-a é basicamente mantida ao longo da simulação de
DM, conforme indicado pelo gráfico de RMSD. Neste caso, não há nenhuma alteração de valor
acentuada e a média da simulação é baixa, com valor de 0.97±0.09 Å.
A alça acessível ao solvente que conecta o Val58 na folha β2 e o Asp70 na hélice α3
apresentam o maior valor de RMSD entre os elementos das estruturas secundárias, com valor
médio de 0.81±0.18 Å, e as oscilações observadas no gráfico de RMSD confirmam a
flexibilidade desta região. A alça do resíduo Gli149 a Fen178 também varia com relação a estrutura
inicial (0.72±0.08 Å), mas sua configuração externa permanece estável durante a simulação. A
região composta pelas hélices 7-8 é a única que parece apresentar duas conformações distintas,
indicado pelo aumento nos valores de RMSD dessa região que começa a partir de
aproximadamente depois de 120 ns de simulação e se mantém até aproximadamente 200 ns,
quando o estado original é restaurado. Entretanto, a distância dessa região em relação ao sítio
ativo dificulta a realização de inferências sobre a relação dessas conformações com a afinidade
por substratos por essa toxina.
Diferentemente da Leuc-a, a estrutura inicial da Atr-I foi o modelo construído por
homologia e o inibidor endógeno foi adicionado a partir da sobreposição estrutural do modelo
com a estrutura 4QL1. Apesar da média do valor de RMSD da trajetória total da Atr-I não ser
muito alta, 1.48±0.13 Å, a evolução do gráfico mostra uma ampla flutuação alcançando 2Å
durante os primeiros 100 ns seguido por uma segunda fase em que o valor de RMSD flutua mais
suavemente ao redor da média. Durante os últimos 150 ns a estrutura da enzima se mantém
estável, mas a média do valor de RMSD indica que esta estrutura também se afasta
significativamente da estrutura inicial. A análise separada das regiões revelam que as maiores
mudanças ocorrem na alça Gli149-Fen178, como pode ser observado na Figura 14. Essas
observações sugerem que a estrutura inicial da Atr-I passa por um refinamento por DM durante
os primeiros 100 ns. Portanto, as próximas análises estruturais da simulação da Atr-I foram
realizadas somente com os últimos 150 ns da simulação.
Para melhor avaliar o relaxamento da geometria que ocorre na estrutura inicial da
leucurolisina-a e atroxlisina-I durante a simulação por DM, a Figura 16 mostra a sobreposição
das estruturas médias obtida dos últimos 50 ns de DM sobre as estrutura iniciais de cada
simulação. A análise dessa figura confirma que a arquitetura média das duas enzimas são
bastante estáveis em solução aquosa, apesar de pequenos rearranjos ocorridos nas alças na
74
simulação da Atr-I. De acordo com os dados de RMSD da simulação total, a mudança na
estrutura inicial da Atr-I é mais evidente na alça que conecta o resíduo Gli149 e Fen178, que inclui
resíduos do sítio catalítico e delimita parte do bolso S1'. Alguns dos motivos que poderiam
explicar essa variação estrutural seriam a adaptação dos resíduos à presença do inibidor
endógeno, pois a estrutura foi modelada sem a presença do mesmo, uma qualidade mais baixa do
modelo inicial nesta região, ou uma maior flexibilidade intrínseca dessa região.
Figura 16 - Representação em ribbon da sobreposição da estrutura média da simulação de DM (50 ns) com a
estrutura cristalográfica (Leuc-a) ou com o modelo comparativo (Atr-I). Resíduos específicos da Leuc-a/Atr-I são
mostrados na representação de bastões. As esferas CPK correspondem aos íons de Ca2+ (verde) e Zn2+ (roxo). O
ligante Gln-Ser-Trp está mostrado na representação bastões e esferas. A superfície transparente delimita os pontos
da rede que caracterizam o bolso S1’. Figura produzida com o programa Chimera.
O íon cálcio localizado na superfície das estruturas da leucurolisina-a e da atroxlisina-I,
importante para manter a estabilidade estrutural das toxinas, interage com vários resíduos,
principalmente com os Tir7, Glu9/Asp9 da região N-terminal, o Asp93, e os Cis197, Asn200/Arg202
localizados na alça da região C-terminal. Essa interações entre o íon cálcio e as toxinas, descritos
por parâmetros não-ligados, são estáveis ao longo das simulações, como mostram as
porcentagens de ocorrência das interações e a média das distâncias interatômicas da Tabela 8.
75
Esses resultados indicam que esses parâmetros funcionam adequadamente para nossos sistemas,
não havendo necessidade de desenvolver parâmetros ligados para esse íon.
Leuc-a
%
Tir7-O···WAT···Ca
2+
Glu9-Oe1···Ca2+
Glu9-Oe2···Ca
2+
Asp93-Od1···Ca2+
Asp93-Od2···Ca
Cis197-O···Ca
2+
Asn200-O···WAT···Ca
4.50
Tir7-O···WAT···Ca
72
2.35
Asp9-Od1···Ca2+
2+
2+
%
Distância (Å)
100
4.59
68
2.32
37
5.41
71
2.35
Ser91-Og··· WAT···Ca
100
2.43
Asp93-Od1···Ca2+
100
2.41
2.38
2+
100
2.40
100
2.50
51
2.44
100
2+
Atr-I
98
100
2+
Distância ( Å)
34
2.41
4.41
Asp93-Od2···Ca
Cis197-O···Ca
2+
Arg202-O···Ca
2+
Tabela 8 – Porcentagem da duração e das distâncias em Å das interações entre o íon Ca2+ e os resíduos das toxinas.
5.4.2.1 - Análises de agrupamento da alça Ω
A alça formada pelos resíduos 149-178 é um importante elemento estrutural nas
estruturas das toxinas leucurolisina-a e atroxlisina-I. Uma alça similar é um motivo recorrente
em todos os membros das metalopeptidades do grupo metzincinas, como as SVMPs, MMP e
ADAMs, que receberam esse nome por causa da presença da metionina altamente conservada
(Met166 na Leuc-a e Atr-I), localizada próxima às três histidinas ligadas ao átomo de zinco. Para
analisar a flexibilidade intrínseca da alça Ω, realizamos análises de agrupamento sobre 2500 e
1500 poses extraídas das trajetórias de Leuc-a e Atr-I, respectivamente. O alinhamento das
estruturas representativas dos 5 agrupamentos mais populosos indica que o enovelamento global
da alça é estável nas duas simulações (Figura 17). Provavelmente isso está relacionado com a
presença de duas pontes dissulfeto (Cis159-Cis164 e Cis157-Cis181) presentes na alça e vários
contatos hidrofóbicos e polares envolvendo resíduos conservados.
76
Figura 17 – Estrutura das toxinas com destaque em ribbon da cadeia principal da alça Ω dos representantes dos
cinco clusters mais populosos obtidos pelo programa MMTSB. A espessura do ribbon é proporcional ao tamanho do
cluster e a porcentagem total das estruturas analisadas nos clusters também está mostrada. As duas pontes dissulfeto
presentes nessa alça estão representadas por linhas tracejadas. Figura produzida com o programa Chimera.
Entretanto, existe uma diferença importante entre a porcentagem de poses que formam
esses 5 grupos mais populosos, que é 81% para a Leuc-a e 50% para a Atr-I, sugerindo que a
alça Ω é globalmente mais flexível na Atr-I que na Leuc-a. Essa diferença se deve
principalmente à região dos resíduos 157-164, que apresentam uma maior variabilidade
conformacional na Atr-I do que na Leuc-a. A presença dos resíduos Gli160-Gli161 na sequência da
Atr-I e a ocorrência do resíduo mais rígido Pro162 na Leuc-a são provavelmente os principais
motivos para essa variação de mobilidade observada nessa alça. Como uma pequena região dessa
alça (Ile165-Leu170) delimita parcialmente a entrada da cavidade S1’ do sítio ativo da Leuc-a e da
Atr-I, a conformação e a flexibilidade exibidas por essa alça nessa região podem influenciar a
acessibilidade a essa cavidade e afetar as interações entre as toxinas e os ligantes, assim como
aos substratos proteicos. Portanto, essas diferenças poderiam estar relacionadas com a diferença
de atividade hemorrágica entre as duas toxinas.
77
5.4.2.2 - Análises de agrupamento do sítio ativo
O sítio ativo foi definido como os resíduos de aminoácidos das toxinas Leuc-a e Atr-I que
durante as simulações de DM interagem diretamente, ou através de uma molécula de água por
ligações de hidrogênio, com o inibidor endógeno ou com os inibidores de amplo espectro, de
acordo com os resultados do programa desenvolvido pelo Dr. Dimas Suarez, como descrito no
tópico 4.7.1 da metodologia. Esses aminoácidos são os 102, 105-111, 113, 127, 129, 135, 138,
142, 143, 146, 152, 163-165, 167-171, 174 e 176.
Para realizar o agrupamento utilizamos o valor de RMSD desses aminoácidos nas poses
analisadas, que são as mesmas utilizadas no tópico 4.3.1, utilizando o programa cpptraj. A
Figura 18 mostra as estruturas representativas dos 4 agrupamentos mais populosos dessas
análises com a Atr-I e com a Leuc-a, que foram selecionadas para realizar estudos de triagem
virtual. Apesar de não existir um consenso sobre o número ideal de estruturas a serem utilizadas
nesses estudos (Baron & McCammon, 2013), acreditamos que esse número apresenta uma
escolha equilibrada entre o tempo gasto a mais com a adição de novas estruturas e a incorporação
de flexibilidade da proteína necessária para melhorar os resultados da triagem, pois essas toxinas
apresentam pouca flexibilidade global, assim como na região do sítio ativo144. Isso pode ser
constatado pelos valores de RMSD total dos átomos da cadeia principal das toxinas durante as
simulações de DM (Figuras 14 e 15) e dos valores de RMSD dos átomos pesados dos resíduos
considerados nessas análises, que foi de 1.03 ±0.11Å para a Leuc-a e 1.09±0.07Å para a Atr-I.
78
Figura 18 – Sobreposição do sítio ativo das estruturas representativas dos 4 agrupamentos mais populosos obtidos
das simulações de DM com Atr-I (a) e Leuc-a (b) utilizando o valor de RMSD dos aminoácidos do sítio ativo.
Figura produzida com o programa Chimera.
5.4.2.3 - Análise de cavidades
Como em muitas enzimas do grupo das ADAM e MMP, variações estruturais do bolso
S1' estão relacionadas com diferenças na afinidade por ligantes145, podendo resultar em
diferenças na atividade biológica das enzimas, comparamos o volume e a acessibilidade dessa
cavidade nas duas toxinas. A Figura 16 mostra a superfície molecular que delimita um grupo de
esferas α, com 50% ou mais de acessibilidade, que caracteriza a cavidade S1’. O programa
MDPOCKET130 caracteriza essa cavidade como um permanente ponto de ligação, acessível em
99.99% das poses analisadas, apesar de variar de tamanho. Podemos ver também que os
tamanhos das cavidades calculados pelo programa MDPOCKET são muito parecidos para as
duas toxinas, com tamanhos de 643±163 Å3 e 628±148 Å3 para Leuc-a e Atr-I, respectivamente,
apesar de ser um pouco maior em Leuc-a. Além disso, a substituição do Val138 na leucurolisina-a
por Ile138, um resíduo mais volumoso, na atroxlisina-I, resulta em diferença considerável na
acessibilidade da porção terminal da cavidade, apesar da pequena diferença do volume total. A
orientação das cadeias laterais dos Val138/Ile138, posicionados no meio do bolso S1’, é controlada
79
por um grande número de interações hidrofóbicas com os resíduos vizinhos, sendo que a
interação entre Val138···Phe176 na Leuc-a é substituída por Ile138···Pro174 na Atr-I, que determina
que o resíduo Ile138 se oriente de maneira diferente com relação ao Trp3 do ligante.
5.4.2.4 - Interações entre as toxinas e o inibidor endógeno
No complexo leucurolisina-a e tripeptídeo, o grupo carboxilato C-terminal do Trp3 atua
como um ligante bidentado e o anel aromático da cadeia lateral se posiciona dentro do bolso S1’.
Para garantir que a esfera de coordenação do zinco seja mantida durante a simulação de DM,
produzimos um grupo de parâmetros MM com ligações explícitas entre esse íon e os seus
ligantes (Figura 19).
80
MASS
Z1
65.37
BOND
Z1-NF
Z1-NG
Z1-NH
Z1-OA
Z1-OB
117.00
109.00
101.00
120.00
81.00
ANGLE
Z1-NF-CR
Z1-NF-CV
Z1-NG-CR
Z1-NG-CV
Z1-NH-CR
Z1-NH-CV
Z1-OA-C
Z1-OB-C
NF-Z1-NG
NF-Z1-NH
NG-Z1-NH
OA-Z1-NF
OA-Z1-NG
OA-Z1-NH
OB-Z1-NF
OB-Z1-NH
OB-Z1-NG
OB-C -OA
OB-Z1-OA
265.00
364.00
259.00
353.00
262.00
352.00
112.00
385.00
42.00
61.00
46.00
46.00
41.00
74.00
108.00
168.00
102.00
80.00
100.00
DIHEDRAL
X -Z1-NF-X
X -Z1-NG-X
X -Z1-NH-X
X -Z1-OA-X
X -Z1-OB-X
Z1-OA-C -X
Z1-OB-C -X
NA-CR-NF-Z1
CC-CV-NF-Z1
NA-CR-NG-Z1
CC-CV-NG-Z1
NA-CR-NH-Z1
CC-CV-NH-Z1
4
4
4
4
4
4
4
4
4
4
4
4
4
NONBONDED
Z1
1.100000
0.00 !
Z1 stands for Zn type
2.02
2.01
2.03
2.00
2.74
NF
NG
NH
OA
OB
!
!
!
!
!
126.00
127.00
126.00
127.00
123.00
130.00
120.00
75.00
113.00
108.00
107.00
115.00
114.00
97.00
88.00
150.00
88.00
123.00
53.00
stands
stands
stands
stands
stands
for
for
for
for
for
NB type in His142
NB type in His146
NB type in His152
O2(O) type in C-Trp
O2(OXT) type in C-Trp
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.532580 !
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
!
!
!
!
!
!
!
!
!
!
!
!
!
From Li et al. FF
Figura 19 – Parâmetros utilizados pelo programa LEaP para definir a representação ligada do zinco e seus ligantes.
Utilizando esses parâmetros, o modo inicial de ligação do tripeptídeo ficou estável
durante toda a simulação com a Leuc-a e com a Atr-I , o que pode ser evidenciado pela
frequências das interações mais importantes (> 50% de ocorrência) entre esse ligante e as toxinas
81
(Figura 20). As ligações explícitas entre o Zn2+ e o inibidor mantém o carboxilato do Trp3
assimetricamente ancorado a esse íon (Zn2+···O com comprimentos de 2.0 e 2.8 Å) e coordenado
por uma ligação de hidrogênio com o Glu143. A cadeia lateral do Trp3 permanece dentro da
cavidade hidrofóbica do bolso S1’, interagindo principalmente com os resíduos Ile108, Val/Ile138,
His142, His152, e Leu170. Também ocorrem ligações de hidrogênio dentro da cavidade S1’ entre o
grupo amino da cadeia lateral do Trp3 e o grupo carbonil dos resíduos 167 e 168 da alça Ω
(Figura 20). Os outros dois resíduos do inibidor, Gln1 e Ser2, também realizam interações com as
toxinas. Existe uma ligação de hidrogênio estável entre a cadeia principal do grupo amino do
Ile108 na folha β4 e do grupo carbonil da Ser2. Outros contatos polares entre os Ser2 e o Gln1 são
menos frequentes e mediados por moléculas de água.
82
Figura 20 – Imagem esquemática das principais interações entre as toxinas e o inibidor Gln1-Ser2-Trp3, de Leuc-a (a) e Atr-I (b). Para as ligações de hidrogênio,
as distâncias médias entre os átomos pesados estão em Å e o tempo de duração está indicado em porcentagem. Para os contatos hidrofóbicos, as distância média
entre os centros de massa dos grupos interagentes estão em Å e os valores de energia de dispersão em parênteses. Figura produzida com o programa
ChemBioDraw.
!
84!
5.4.2.5 – Cálculos dos potenciais eletrostáticos e das superfícies moleculares
Diferenças mais significativas entre Leuc-a e Atr-I aparecem quando comparamos a
geometria da estrutura e propriedades eletrostáticas. Isso é claramente observado na Figura 21,
que mostra as poses obtidas com 200 ns de simulação, tempo suficiente para garantir que o
sistema esteja estável, de Leuc-a e Atr-I coloridas em função do potencial eletrostático.
Resultados similares foram observados utilizando outras poses das simulações. Em relação à área
acessível ao solvente (SASA, do inglês solvent accessible surface area), a estrutura da
atroxlisina-I
parece
mais
compacta
SASA=8945±137Å2)
que
a
leucurolisina-a
(SASA=9247±151Å2). Ainda mais marcante é a diferença nas propriedades eletrostáticas das
duas toxinas, que possuem carga global igual a +4 na Leuc-a e 0 na Atr-I. A alça 100-108, que
conecta as folha β3 e β4 e delimita parcialmente o sítio ativo, é mais volumosa e apresenta mais
resíduos carregados negativamente na Leuc-a (Asp104-Glu105-Glu106) que na Atr-I (Asn104-Gli105Pro106). De forma similar, a alça 128-132, que conecta a folha β5 e a α-hélice do sítio ativo,
apresenta uma diferença significante por causa das substituições da Lis131 e Lis132 na
leucurolisina-a pelos resíduos Glu131 e Gln132 na atroxlisina-I. Portanto, concluímos que a forma
estrutural e o potencial eletrostático da superfície acessível ao solvente em uma região próxima
da alça Ω são características que diferem a leucurolisina-a e a atroxlisina-I.
84
!
Figura 21 – Superfície acessível ao solvente de pose extraída após 200 ns de simulação colorida em função do
potencial eletrostático calculado com o programa APBS. A cor azul indica regiões positivas enquanto a cor
vermelha indica regiões negativas. Figura produzida com o programa Chimera.
5.4.3 - Inibidores de metaloproteases de amplo espectro
5.4.3.1 – Simulações de docking
Nessa etapa do trabalho, realizada pelos doutores Dimas Suarez e Natalia Diaz, foram
obtidas as estruturas iniciais para simulações de DM, pois não existem estruturas cristalográficas
dos complexos entre as toxinas e os inibidores estudados, não sendo possível determinar com
85
segurança o modo de ligação desses compostos. Para avaliar quais seriam esses possíveis modos,
utilizamos as metodologias de docking em conjunto com minimização de energia QM-MM,
seguido de cálculos QM/MM-PBSA através da função de pontuação apresentada no tópico 4.6.1.
Após realizar as simulações de docking utilizando o programa Autodock4117 com 50 poses das
toxinas extraídas das simulações de DM, as poses foram minimizadas, avaliadas e as 10 poses
com melhor pontuação foram inspecionadas visualmente, eliminando aquelas que não
apresentassem alguma região do inibidor dentro do bolso S1’ ou que não apresentassem
interação entre o grupo hidroxamato e Zn2+. Após esse processo escolhemos as poses com
melhores pontuações para realização inicial das simulações de DM, escolhendo mais de uma
pose quando havia mais de um grupo diferente do inibidor dentro do bolso S1’, devido a baixa
diferença dos valores obtidos por essas poses, que não permitiu inferir sobre o modo de ligação
preferencial dos inibidores BAT, COL, MAR e MMP. A Figura 22 mostra as poses iniciais de
cada simulação realizada com os complexos toxinas/inibidores estudados. Nossos resultados
indicam que, para os inibidores CP4 e PRI, existe apenas um modo de ligação provável, devido à
presença do grupo de ligação ao zinco e da ausência de diferentes grupos apolares que pudessem
se posicionar dentro do bolso hidrofóbico S1’.
86
Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das
estruturas iniciais das simulações de dinâmica.
87
Figura 22 – Destaque dos sítios ativos dos complexos entreas toxinas e os inibidores de amplo espectro das
estruturas iniciais das simulações de dinâmica (continuação).
88
Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das
estruturas iniciais das simulações de dinâmica (continuação).
89
Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das
estruturas iniciais das simulações de dinâmica (continuação).
90
Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das
estruturas iniciais das simulações de dinâmica (continuação).
91
Figura 22 – Destaque dos sítios ativos dos complexos entre as toxinas e os inibidores de amplo espectro das
estruturas iniciais das simulações de dinâmica (continuação).
As cargas RESP dos ligantes utilizadas nessa etapa foram produzidas pelo método HF/631+G* para garantir que as interações eletrostáticas sejam balanceadas, porque as cargas do
campo de força ff99SB, utilizado para as toxinas, foram derivadas pelo mesmo método. Estudos
iniciais realizados com a estrutura cristalográfica da Leuc-A mostraram que a utilização destas
cargas aumenta a pontuação das poses que apresentam mais contato entre as proteínas e os
ligantes, quando comparadas com o uso de cargas calculadas pelo método B3LYP. Essa
diferença possivelmente se deve ao fato de que com a utilização de B3LYP muitas poses com
grandes regiões do ligante expostas ao solvente foram hiperestabilizadas, apontando para um
desequilíbrio entre a energia de solvatação e interações intramoleculares da função de avaliação.
As poses produzidas pelo Autodock foram submetidas ao processo de minimização com
o método SCC-DFTB/MM para garantir que a geometria de esfera de coordenação do Zn+2 seja
adequada, ou seja, se aproxime da geometria de estruturas cristalográficas. A utilização da região
da proteína formada pelos resíduos 105-111, 166-171, 138-139 e os átomos do ligantes que não
pertencem ao grupo hidroxamato na região MM, junto com a região QM, composta por pelo
Zn+2, His142, Glu143, His146 e His152 e o grupo hidroxamato do inibidor, no processo de
otimização da geometria antes da realização dos cálculos energéticos, tem como objetivo
permitir uma maior flexibilidade do bolso S1', resultando em uma melhor acomodação do ligante
92
nessa cavidade. A inclusão somente do grupo ZBG na região QM durante esses cálculos permite
que essa metodologia possa ser aplicada a um grande número de ligantes, além de minimizar o
risco de artefatos produzidos por polarização excessiva, como a interação entre o Zn e anéis do
CP4, que deveriam se localizar dentro do bolso S1', como ocorreu durante essas primeiras
tentativas de docking.
Na tentativa de reavaliar as poses de docking obtidas nesses estudos iniciais, com a
estrutura cristalográfica da leucurolisina-a, foram utilizados três protocolos distintos para
cálculos single-point da energia na fase gasosa (Egas) e a energia de solvatação dos complexos
toxinas/inibidores:
a) QM/MM-GBSA, calculando a Egas com SCC_DFTB/MM e a energia de solvatação com
GBSA. Apesar desse protocolo apresentar menor custo computacional que os demais, a
utilização de GBSA para a tratar a energia de solvatação não foi adequada, conforme já descrito
anteriormente por outros autores72, produzindo grandes diferenças de valores entre os compostos
quando comparados com os outros métodos utilizados, além de maior variação entre poses
similares;
b) MM-PBSA, calculando a Egas pelo AMBER (MM) com parâmetros iod107 para Zn+2 e a
energia de solvatação tratada pela solução não linear da equação PB, incluindo os termos Edisp e
Ecav (int=2) pelo programa PBSA do AMBER 14. Nesse caso, a energia MM entre o ZBG e Zn
não é confiável, produzindo também variações muito grandes quando comparados com os outros
métodos utilizados. Isso provavelmente se deve pela dificuldade já descrita na literatura em tratar
as interações entre metais e outros compostos orgânicos com parâmetros MM convencionais;
c) QM/MM-PBSA, calculando a Egas com SCC-DFTB/MM e a energia de solvatação calculada
pelo método PB, utilizando cargas Mulliken para os átomos da região QM, seguindo protocolo
similar ao reportado por Chaskar et al.72. Esse protocolo foi o que produziu melhores resultados
e foi utilizado para selecionar os modos de ligação dos inibidores, pontuando melhor as poses
com orientação do grupo hidroxamato próximas das observadas em estruturas cristalográficas e
com os maiores grupos apolares das moléculas dos inibidores dentro do bolso S1'.
Também utilizamos esses protocolos para realizar os cálculos de energia livre de ligação
com as poses extraídas da dinâmica, e assim como na etapa de docking, o último protocolo foi o
que apresentou maior similaridade os dados experimentais. A utilização dos diferentes
protocolos no processo de reavaliação da poses de docking permitiu escolher um protocolo mais
93
adequado para a avaliação das poses extraídas das simulações de DM, permitindo identificar
algumas das limitações dos métodos utilizados.
5.4.3.2 - Interações entre as toxinas e os ligantes
Nos complexos toxinas/inibidores, o grupo hidroxamato atua como um ligante bidentado
e algum dos grupos hidrofóbicos dos inibidores se posiciona dentro do bolso S1’, de modo
similar ao que ocorre com o inibidor endógeno. Adotamos também a mesma abordagem para
garantir que a esfera de coordenação do zinco seja mantida durante a simulação de DM com os
inibidores de amplo espectro, produzindo um grupo de parâmetros MM com ligações explícitas
entre esse íon e os seus ligantes (Figura 23).
94
MASS
Z1
BOND
Z1-NF
Z1-NG
Z1-NH
Z1-OA
Z1-OB
65.37
0.00 !
101.00
93.00
68.00
105.00
99.00
2.06
2.06
2.13
2.08
2.13
ANGLE
Z1-NF-CR
Z1-NF-CV
Z1-NG-CR
Z1-NG-CV
Z1-NH-CR
Z1-NH-CV
Z1-OB-n
Z1-OA-c
NF-Z1-NG
NF-Z1-NH
NG-Z1-NH
OB-Z1-NF
OB-Z1-NG
OB-Z1-NH
OA-Z1-NF
OA-Z1-NG
OA-Z1-NH
OA-Z1-OB
268.00
380.00
263.00
358.00
261.00
357.00
174.00
158.00
38.00
96.00
71.00
80.00
97.00
107.00
68.00
54.00
144.00
100.00
DIHEDRAL
X -Z1-NF-X
X -Z1-NG-X
X -Z1-NH-X
X -Z1-OA-X
X -Z1-OB-X
Z1-OB-c -X
Z1-OB-n -hn
Z1-OB-n -c2
Z1-OA-c -c3
Z1-OA-c -n
NA-CR-NF-Z1
CC-CV-NF-Z1
NA-CR-NG-Z1
CC-CV-NG-Z1
NA-CR-NH-Z1
CC-CV-NH-Z1
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
NONBONDED
Z1
1.100000
Z1 stands for Zn type
!
!
!
!
!
NF
NG
NH
NF
NF
128.00
126.00
127.00
126.00
125.00
129.00
108.00
113.00
119.00
88.00
94.00
96.00
90.00
163.00
113.00
128.00
87.00
69.00
stands
stands
stands
stands
stands
for
for
for
for
for
NB type
NB type
NB type
o(GAFF)
o(GAFF)
in His142
in His146
in His152
type in hydroxamte group
type in hydroxamte group
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.532580 !
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
3.00
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
From Li et al. FF
Figura 23 – Parâmetros utilizados pelo programa LEaP para definir a representação ligada do zinco e seus ligantes.
95
As interações entre as toxinas e os ligantes foram determinadas pelo programa produzido
localmente pelo Dr. Dimas Suarez, como descrito no tópico 4.7.1. Esses resultados permitiram
identificar os principais resíduos de aminoácidos que interagem com os inibidores, dividindo
também quais contribuem para as interações apolares e quais contribuem com interações polares
(ligações de hidrogênio). É interessante notar que grande parte destas interações envolvem a
cadeia principal dos aminoácidos. As contribuições polares na Leuc-a são devido principalmente
aos resíduos Ile108(N), Gli109(O e N) Leu170(N), através dos átomos da cadeia principal, e com os
oxigênios da cadeia lateral do Glu143, fundamental para a atividade catalítica. Na Atr-I, além
desses, são de grande importância também os átomos de oxigênio da cadeia principal dos
resíduos Pro106 e Pro168. Esses dados estão de acordo com outro trabalho que propõem a
interação entre peptídeos e essas toxinas através de conformação similar folha β146, assim como
ocorre com as estruturas cristalográficas de complexos de metaloproteases com inibidores BAT e
MAR, onde essa conformação é bastante evidente.
Tanto para a Atr-I quanto para a Leuc-a os principais resíduos para as contribuições
apolares dentro do bolso S1' são a His142, Leu170 Ile108, e Val138(Leuc-a)/(Atr-I)Ile138 para grupos
mais volumosos. Para contribuições apolares fora do bolso S1' na Leuc-a, os principais são Ile110,
Hid152, Hid146, e Ile108 e Leu170 quando os grupos dos inibidores fora do bolso S1' são mais
volumosos. Na Atr-I, além desses mesmos resíduos, com diferença apenas da Leu110 no lugar da
Ile110, existem mais dois resíduos que se destacam, Pro106 e Val169. Na Leuc-a essas duas
posições são ocupadas pelos resíduos Glu106 e Tre169, um carregado negativamente e um polar,
impossibilitando portanto essas interações apolares e contribuindo para as diferenças no
potencial eletrostático das toxinas, apresentado no tópico 5.3.2.5.
Esse padrão de interação mostra o motivo desses inibidores possuírem atividade contra
um amplo espectro de metaloproteases, pois as variações dos aminoácidos do sítio ativo entre as
enzimas vão apresentar pouca influência sobre as principais ligações de hidrogênio (com maior
duração) por envolverem principalmente os átomos da cadeia principal das enzimas, além dos
oxigênios da cadeia lateral do Glu com atividade catalítica, que está presente em todas as
enzimas da metzincinas, ocorrendo o mesmo para as principais interações apolares, que ocorrem
dentro do bolso S1', que apesar de apresentar variações de tamanho e forma relacionado com a
variação na composição de aminoácidos entre essas enzimas, é sempre apolar.
96
A Figura 24 mostra, de forma esquemática, as interações entre os inibidores e as toxinas,
incluindo interações menos significativas quando comparadas com as citadas no texto, por não
apresentar duração maior que 40% do tempo de simulação de modo constante para todos os
inibidores. Os títulos das figuras indicam qual é a toxina, o inibidor e grupo do inibidor
localizado no bolso S1’.
97
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw.
!
98!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
99!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
100!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
101!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
102!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
103!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
104!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
105!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas (continuação). Figura produzida com o programa
ChemBioDraw.
!
106!
!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
107!
!
Figura 24 – Representação esquemática das principais interações entre os inibidores de amplo espectro e as toxinas. Figura produzida com o programa ChemBioDraw
(continuação).
!
!
108!
Entre os compostos estudados, os que apresentaram maior potência foram PRI e CP4,
compostos de segunda geração desenvolvidos especificamente para inibir ADAMs e MMPs, e
são os que apresentam maior número de interações com as toxinas, principalmente apolares,
assim como as melhores pontuações finais (Tabelas 10 e 11).
5.4.3.3 - Cálculos de energia livre
Foram realizados cálculos de energia livre utilizando as técnicas de MM-GBSA, MMPBSA e QM/MM-PBSA para calcular a energia de ligação entre as toxinas e os inibidores de
amplo espectro, mas somente serão discutidos os cálculos realizados com esta última variação,
que gerou os resultados de geometria de ligação do grupo hidroxamato com o Zn2+ mais
próximos das geometrias verificadas em estruturas cristalográficas do PDB. Primeiramente
utilizamos 2500 poses extraídas a cada 100 ps das simulações de DM. Entretanto os cálculos
realizados utilizando somente 60% das poses finais apresentaram maior concordância com os
dados experimentais, devido a variação de energia de alguns dos ligantes durante a etapa inicial
de simulação, indicando uma adequação da geometria em relação à pose inicial, obtida por
docking. Essa variação foi mais acentuada nos complexos da Leuc-a com o inibidor PRI e COL
(Figura 25), mas também ocorreu em menor escala com MAR.
109
Figura 25 – Variação de energia de ligação em kcal/mol pelo método QM/MM-PBSA dos complexos da toxina
Leuc-a com os inibidores COL(a) e PRI(b), sendo que o composto COL estava com o grupo isobutil no bolso S1’,
mostrando os valores individuais e as médias acumuladas para todas as poses, ou para as últimas 1500 poses.
Gráficos produzidos com o programa R.
Apesar disso, a variação durante as simulações representa uma pequena contribuição na
média das energia calculada por QM/MM-PBSA para todas as poses, sem considerar as
contribuições entrópicas. Os gráficos da Figura 25 refletem a tendência geral obtida pelos nossos
resultados, de uma pequena variação do valor dessa média em função do número de poses
110
utilizadas (Tabela 9), extraídas em intervalos regulares, de 100 ps, e numeradas em função do
tempo de simulação. Apesar dessa variação ser importante para tentar reproduzir dados
experimentais quando se trata de ordenar inibidores com potências variadas, ela poderia ser
negligenciada na aplicação dessa metodologia para melhorar a qualidade de resultados obtidos
por triagem virtual, utilizando um número reduzido de poses para esses cálculos.
Número de poses utilizadas
Inibidor
1-100
1-250
1-500
1-1000
1-2500
1000-2500
BAT fenil
-79,4 ± 5,1
-82,1 ± 6,0
-84,2 ± 6,1
-84,3 ± 6,2
-85,1 ± 6,3
-85,6 ± 6,4
COL isobutil
-68,3 ± 6,0
-69,5 ± 6,0
-70,5 ± 6,0
-73,6 ± 7,1
-74,7 ± 6,9
-75,4 ± 6,6
CP4
-89,8 ± 5,2
-89,6 ± 5,4
-87, 8 ± 5,8
-87,0 ± 6,1
-85,2 ± 6,7
-84,1 ± 6,8
MAR
-79,8 ± 6,5
-81,1 ± 6,0
-82,7 ± 5,8
-83,5 ± 5,6
-84,6 ± 5,4
-85,3 ± 5,2
MMP fenil
-76,1 ± 6,5
-77,8 ± 6,0
-78,7 ± 6,0
-78,4 ± 6,0
-77,8 ± 6,5
-77,3 ± 6,8
PRI
-80,1 ± 4,6
-79,6 ± 5,2
-79,7 ± 5,1
-79,9 ± 5,0
-80,2 ± 5,3
-82,7 ± 5,8
Tabela 9 – Média e desvio padrão das energias livres de ligação em kcal/mol, sem considerar as contribuições
entrópicas, calculadas pelo método QM/MM-PBSA, para os complexos Leuc-a/inibidores utilizando diferentes
números de poses extraídas das simulações de DM.
Para realizar a pontuação final dos inibidores (Tabelas 10 e 11), foram realizados os
cálculos utilizando o cluster determinado no tópico 4.4.3.2 na região QM e o restante dos átomos
do ligante e uma forma truncada da toxina na região MM para cada pose. O uso dessa forma
truncada ao invés da proteína completa teve como objetivo tentar diminuir o erro associado ao
cálculo de entropia vibracional utilizando modos normais124 e o custo computacional desta etapa.
A contribuição entrópica foi calculada somando-se as contribuições entrópicas conformacionais
do ligante e das proteínas, e a variação de entropia rotacional e translacional do ligante. A
energia de solvatação foi calculada através do método PB não linear para a contribuição apolar e
com os termos dispersão e cavitação implementados pelo programa PBSA. Posteriormente 1500
poses extraídas regularmente dos últimos 150 ns das simulações de um determinado complexo
foram utilizados para obter a pontuação final dos compostos (Tabelas 10 e 11), utilizando a
equação número 10.
Nas tabelas abaixo o nome em parênteses indica a região do composto que está
posicionada dentro do bolso hidrofóbico S1’. Os valores de diferença de pontuação foram
111
calculados por comparação com inibidores que apresentaram pontuação mais negativa para cada
toxina.
Inibidores
Pontuação
Diferença –
pontuação
Contribuição
entrópica (TΔS)
CP4
-85,29 ±0,45
0,00
9,45
Diferença –
contribuição
entrópica
5,53
PRI
-78,46 ± 0,45
6,83
3,91
0,00
BAT (isobutil)
-74,27 ± 0,45
11,02
8,94
5,03
BAT (fenil)
-73,65 ± 0,46
11,64
10,10
6,19
BAT (tiofeno)
-69,67 ± 0,44
15,62
11,37
7,46
MAR (isobutil)
-75,74 ± 0,43
9,55
11,20
7,29
MAR (amida)
-67,42 ± 0,44
17,87
10,28
6,37
MMP (fenil)
-71,24 ± 0,66
14,05
11,48
7,57
MMP (isobutil)
-64,81 ± 0,44
20,49
6,70
2,79
COL (isobutil)
-66,75 ± 0,45
18,55
7,01
3,10
COL (fenil)
-59,06 ± 0,45
26,24
6,65
2,74
IC50(µM)
0,02
0,07
0,05
0,08
0,05
8,69
Tabela 10 – Pontuação final e valores de IC50 obtidos pelos inibidores em complexo com a toxina atroxlisina-I, com
os menores valores em vermelho. Os valores de pontuação e o erro padrão estão em kcal/mol e os valores de
entropia estão em kcal/mol/K°. Entre parênteses está o grupo localizado no bolso hidrofóbico S1’. A diferença de
pontuação e entropia foi calculada em função do menor valor desta tabela (pontuação), ou em função do menor valor
obtido entre esta tabela e a tabela 11.
112
Inibidores
Pontuação
Diferença –
pontuação
Contribuição
entrópica (TΔS)
PRI
-73,86 ± 0,57
0,00
8,78
Diferença –
contribuição
entrópica
4,86
CP4
-73,45 ± 0,47
0,41
3,92
0,01
0,21
MAR (isobutil)
-71,17 ± 0,46
2,69
12,06
8,14
0,78
BAT (isobutil)
-70,02 ± 0,48
3,84
9,70
5,79
BAT (fenil)
-65,51 ± 0,46
8,35
12,94
9,03
BAT (tiofeno)
-64,76 ± 0,48
9,10
10,21
6,30
MMP (fenil)
-64,99 ± 0,46
8,87
6,89
2,97
MMP (isobutil)
-52,75 ± 0,55
21,11
6,81
2,90
MMP (fenil 2)
-50,28 ± 0,46
23,58
8,27
4,35
COL (isobutil)
-61,54 ± 0,60
12,32
9,59
5,68
COL (fenil)
-53,20 ± 0,48
20,67
8,22
4,31
IC50(µM)
0,02
12,33
0,36
6,46
Tabela 11 – Pontuação final e valores de IC50 obtidos pelos inibidores em complexo com a toxina leucurolisina-a,
com os menores valores em vermelho. Os valores de pontuação e o erro padrão estão em kcal/mol e os valores de
entropia estão em kcal/mol/K°. Entre parênteses está o grupo localizado no bolso hidrofóbico S1’. A diferença de
pontuação e entropia foi calculada em função do menor valor desta tabela (pontuação), ou em função do menor valor
obtido entre esta tabela e a tabela 10.
Entre os inibidores testados, dois estão presentes em estruturas cristalográficas
depositadas no PDB em complexo com enzimas que apresentam alta similaridade estrutural na
região do sítio ativo com as SVMPs. Um deles é o composto BAT, presente em estruturas com 2
ADAMs e 4 MMPs, apresentando um modo de ligação que posiciona o grupo isobutil dentro da
cavidade S1’. A única exceção é uma estrutura de uma SVMP, a atrolysin-C (1DTH), onde o
grupo posicionado nesta cavidade é o anel tiofeno. Portanto, a disponibilidade dessas estruturas
com esse inibidor não permite determinar qual o modo mais provável de ligação para esse
composto. Como na etapa de docking haviam três modos entre as dez estruturas melhor
avaliadas, com diferentes grupos hidrofóbicos desse composto dentro do bolso S1’, foram feitas
3 simulações para cada toxina. Entretanto os cálculos de energia de ligação realizados com as
poses dessas simulações indicam que, para as nossas toxinas, o modo de ligação mais provável
seja também aquele que apresenta o grupo isobutil no bolso S1’.
Outro inibidor presente em estruturas depositadas no PDB é o MAR. Nas três estruturas
depositadas, em complexo com ADAMs, o grupo isobutil está posicionado dentro do bolso S1’.
Nossos resultados indicam que esse é também o modo de ligação com nossas toxinas, ou por ter
113
sido o único modo de ligação presente nas poses selecionadas durante o docking contra Leuc-a,
ou por apresentar melhor pontuação quando comparado com as simulações realizadas com o
grupo n-metil-amida dentro do bolso S1’ no caso da Atr-I.
A preferência pelo o grupo isobutil dos inibidores dentro do bolso S1’, como indicam os
resultados dos complexos com esses dois inibidores e com o COL, pode estar relacionada com a
preferência dessas toxinas pelo aminoácido leucina na posição P1’ do substrato144. Entretanto
essa tendência não foi observada para o inibidor MMP, que também apresenta esse grupo em sua
composição, mas que apresentou melhores pontuações quando as simulações foram realizadas
com grupo fenil dentro do bolso S1’.
Uma das conclusões mais evidentes dessa avaliação é a grande diferença que pode
ocorrer na pontuação quando diferentes modos de ligação são utilizados para um mesmo
composto, parecendo exercer uma influência maior que a adição da contribuição entrópica nos
cálculos. Essa diferença é mais marcante para os complexos Leuc-a-MMP, pois além da grande
diferença entre as três simulações, houve uma das maiores diferenças entre dois modos de
ligação que apresentavam o mesmo grupo dentro do bolso S1’. Dados experimentais adicionais
de cristalografia são necessários para avaliar a possibilidade de aplicação dessa metodologia para
determinar o modo de ligação dos inibidores.
Outro ponto importante a ser destacado é a baixa contribuição relativa dos cálculos
entrópicos, possuindo média de 4,86 Kcal/mol/K° (±2,51) para Atr-I e 5,53 Kcal/mol/K° (±2,45),
indicando uma variação relativamente pequena entre os inibidores, apesar da variação estrutural,
e representando aproximadamente ~7% do valor médio obtido de todas as pontuações de cada
toxina. Essa variação entre os compostos nos diferentes complexos ou em diferentes modos de
ligação pode ser verificado pelas diferenças entre as contribuições entrópicas mostradas nas
Tabelas 10 e 11, calculadas em função do complexo Leuc-a/PRI, que obteve o menor valor
absoluto. Esses dados sugerem que essas contribuições poderiam ser ignoradas na aplicação
desse protocolo para enriquecimento dos resultados obtidos por triagem virtual.
A comparação entre os resultados computacionais e os dados experimentais apresenta
dificuldades relacionadas à baixa confiança de alguns dos valores de IC50, como os valores
obtidos para BAT e MAR com a Leuc-a. Os coeficientes de Hill obtidos indicam uma possível
interação cooperativa entre as toxinas e alguns inibidores, que poderia ocorrer em função da
presença de mais de um sítio de ligação, e que dificultaria ainda mais essa comparação.
114
Infelizmente os experimentos para determinação dos valores de IC50 de não puderam ser
repetidos devido à!baixa disponibilidade de substrato para os experimentos, impedindo também a
utilização de um maior números de concentrações, que provavelmente aumentaria a
confiabilidade dos resultados. Outra dificuldade está relacionada com o grau de incerteza
intrínsecas das metodologias computacionais utilizadas. Contudo, é possível afirmar que, com
dados obtidos, não existe correlação entre o ordenamento dos compostos em ordem de potência
contra as toxinas realizado pelos dados experimentais e pelos dados computacionais. Ainda são
necessários realizar mais experimentos computacionais e in vitro para confirmar se as
metodologias aplicadas são apropriadas para distinguir entre ligantes de não-ligantes auxiliando
na escolha de compostos para realização de experimentos in vitro.
5.5 – Triagem virtual
Para realizar essa etapa aproximadamente 3 milhões de arquivos representando moléculas
lead-like disponíveis comercialmente foram obtidos do banco de dados ZINC63 e processados
com scripts distribuídos junto com o programa Autodocktools117 para produzirem arquivos para
serem utilizados pelo programa Vina70, utilizando parâmetros padrão do programa. Após realizar
essa etapa de triagem selecionamos 150.000 compostos em função da pontuação obtida pelo
Vina. Esses compostos serão futuramente utilizados em nova rodada de triagem utilizando as
conformações das toxinas descritas no tópico 5.4.2.2 e ordenadas novamente em função de
média das pontuações obtidas com as diferentes conformações de cada toxina.
115
6 – Conclusões
Devido ao seu papel no envenenamento causado por serpentes, produzindo uma grande
variedade de efeitos tóxicos e auxiliando na difusão das outras toxinas, SVMP são alvos
importantes para o desenvolvimento de fármacos. Acreditamos que nosso trabalho contribui para
esse processo identificando inibidores dessas toxinas que possuem alta potência, que já foram
testadas em humanos, sem apresentar efeitos tóxicos em curto prazo de tempo. Entre eles
destacamos o composto prinomastat (PRI), que pode ser administrado oralmente, inibe as duas
toxinas com potência similar na faixa de nanomolar (IC50 = 20 e 70 nM contra leucurolisina-a e
atroxlisina-I, respectivamente), além de outra SVMP, a toxina EoVMP2140, indicando que
poderia também inibir várias outras SVMPs.
Outra contribuição importante é a produção do modelo estrutural da Atr-I, que devido à
similaridade com os moldes e a boa resolução das suas estruturas cristalográficas, possui
qualidade suficiente para ser utilizado por metodologias de descoberta de fármacos dependentes
da estrutura tridimensional do alvo. Produzimos também conformações por DM das toxinas que
podem ser utilizadas para considerar a flexibilidade da proteína durante a triagem virtual, e que
foram de fundamental importância para a seleção dos prováveis modos de ligação dos inibidores
de amplo espectro estudados.
Para permitir a manutenção adequada da geometria dos ligantes coordenados ao íon Zn2+
durante as simulações de DM, produzimos parâmetros para representação ligada desse íon
utilizando simulações QM/MM e QM com a estrutura da Leuc-a. Essa etapa é necessária devido
à natureza da interação proteína-metal, caracterizada por uma grande transferência de cargas
entre os átomos e por múltiplas geometrias de coordenação que dificultam a produção de
parâmetros para campo de forças adequados para as diferentes metaloproteínas147, sendo por isso
uma das principais dificuldades relacionadas com a produção de simulações de DM. Devido à
alta similaridade do sítio catalítico entre as SVMPs, acreditamos que esses parâmetros podem ser
utilizados para outras SVMPs, assim como foram utilizados para a Atr-I nesse trabalho. Contudo,
apesar de importância da abordagem utilizada para garantir uma melhor qualidade das
geometrias dos complexos entre as toxinas e os inibidores, existe a possibilidade do
procedimento utilizado para a produção de cargas RESP, que considera a transferência de carga
entre esse íon e os átomos do inibidor, permita a representação de ligações explícitas do Zn2+
116
somente com os resíduos de histidinas, facilitando a parametrização necessária para a produção
de simulações com inibidores que não possuem o grupo hidroxamato como ZBG. Em um
simulação de 50 ns de duração realizada com o complexo Leuc-a-QSW, sem ligações explícitas
entre o peptídeo e o Zn2+, foram obtidas distâncias e ângulos médios de ligação entre os
oxigênios do grupo carboxilato do Trp3 próximos aos medidos durante a simulação com ligações
explícitas. Entretanto, mais testes são necessários para verificar a possibilidade de aplicação
dessa abordagem com outros inibidores.
Com relação aos cálculos de energia livre de ligação, os resultados que melhor
reproduziram a geometria de ligação do grupo hidroxamato nas simulações de docking foram
obtidos com a técnica de QM/MM-PBSA, motivo pelo qual essa técnica foi selecionada para
calcular a energia livre de ligação com as poses obtidas pelas simulações de DM. Estudos
anteriores já haviam apontado a dificuldade de se obter resultados com MM-PBSA e MM-GBSA
que reproduzissem dados experimentais em estudos com metaloenzimas contendo zinco148, que
provavelmente ocorre devido a transferência de cargas entre o zinco e os seus ligantes149. Apesar
de não ser possível reproduzir a ordem dos compostos por potência, acreditamos que a função de
avaliação desenvolvida nesse trabalho, junto com o método de QM/MM-PBSA, possa ser
utilizada para discriminar entre compostos que apresentam atividade inibitória dos compostos
sem atividade. Ainda são necessários mais estudos para indicar o tempo necessário de simulação
de DM, mas nossos resultados indicam que simulações com menor tempo de duração, como 30 a
50 ns, poderiam oferecer acurácia suficiente para a serem aplicadas nas etapas finais de estudos
de triagem, mesmo sem calcular o termo de contribuição entrópica, que apesar de serem
importantes para estimativas de energias de ligação absolutas, frequentemente aumentam as
estimativa de erro dos cálculos150.
Um dos objetivos principais do nosso trabalho era encontrar diferenças entre as toxinas,
que apresentam alta similaridade em suas características estruturais e sequência, que poderiam
estar associadas às diferenças na atividade hemorrágica. As principais diferenças encontradas
entre elas são a maior flexibilidade da alça Ω na Atr-I, como mostram as análises de
agrupamento e de RMSD nessa região. Essa variação na flexibilidade dessa alça entre SVMPs
hemorrágicas e não-hemorrágicas já foi descrita em outro trabalho151.
As análises de interações com o inibidor endógeno também não apontaram grandes
diferenças entre as toxinas, com números similares de ligações de hidrogênio e contatos
117
hidrofóbicos, mesmo dentro do bolso S1’, que em muitos casos influência a afinidade por
inibidores de metaloproteases por apresentar diferenças estruturais145. Os resultados também
foram similares quando analisamos os inibidores de amplo espectro, com exceção da presença da
Pro106 na Atr-I, produzindo um maior número de contatos hidrofóbicos com os inibidores fora do
bolso S1’, que não acontece na Leuc-a devido à presença do Glu106. Essa diferença poderia
explicar parte da diferença de afinidade das toxinas pelos inibidores. As maiores diferenças
foram encontradas para os inibidores PRI e CP4 em relação aos outros compostos, que além de
realizarem ligações de hidrogênio presentes na maioria dos complexos, apresentam maior
número de contatos hidrofóbicos dentro do bolso S1’. Essas análises também permitiram
identificar quais aminoácidos interagem com os inibidores, informação que foi utilizada para
realizar as análises de agrupamento e escolha de conformações para a realização da próxima
etapa da triagem com compostos lead-like.
A diferença mais marcante encontrada entre as duas toxinas é a diferença do potencial
eletrostático ao redor do sitio catalítico, mais negativo para a Leuc-a, que pode exercer grande
influência entre o contato das enzimas com seus substratos proteicos e com inibidores. Uma
grande contribuição para essa diferença provém da variação nos resíduos 104-106 entre as
toxinas, sendo composta por Asn104-Gli105-Pro106 na Atr-I e por Asp104-Glu105-Glu106 na Leuc-a.
O resíduo de Pro106 na Atr-I, além de contribuir para essa diferença, realiza importantes contatos
hidrofóbicos no sítio de ligação fora do bolso S1’, podendo contribuir também para a diferença
de afinidade por substratos proteicos.
Portanto, as principais contribuições do nosso trabalho foram: a) produção de um modelo
da toxina Atr-I com qualidade suficiente para ser utilizado em estudos de dinâmica e docking; b)
confirmação da atividade dos inibidores de metaloproteases de amplo espectro contra as toxinas
Leuc-a e Atr-I, que poderiam ser utilizados em acidentes com serpentes; c) identificação de
principais aminoácidos das toxinas responsáveis pelas interações com os inibidores; d) produção
das conformações das toxinas para utilização em estudos de docking e triagem virtual; e) seleção
de 250 mil compostos lead-like, em uma primeira etapa de triagem, para estudos posteriores de
identificação de inibidores; f) e a identificação de possíveis diferenças estruturais relacionadas
com a diferença de atividade hemorrágica entre as duas toxinas.
118
7 – Perspectivas
Assim como realizamos a divisão dos objetivos principais, o mesmo pode ser feito com
as perspectivas, planejando a continuidade dos trabalhos para aprimorar os estudos com os
inibidores identificados ou para a descoberta de novos inibidores, e para tentar verificar se as
diferenças encontradas entre a toxina hemorrágica Atr-I e a não-hemorrágica Leuc-a também se
aplicam às outras SVMP.
Com relação aos estudos com os inibidores, seria de grande importância tentar validar as
metodologias computacionais empregadas nesse trabalho realizando ensaios experimentais que
possam determinar com maior precisão os modos de ligação e a afinidade dos inibidores pelas
toxinas.
Para determinar os modos de ligação dos inibidores é necessário utilizar a técnica de
cristalografia por raios x, que permitirá verificar a aplicabilidade da abordagem computacional
utilizada nesse trabalho para identificar esses modos de ligação de inibidores de SVMP que não
possuem dados experimentais. Essa identificação é fundamental para obter cálculos de energia
livre de ligação mais precisos e para determinar com maior confiabilidade as interações entre as
toxinas e os inibidores.
Para tentar determinar experimentalmente a afinidade dos inibidores pelas toxinas,
realizamos ensaios de cinética enzimática. Entretanto, tivemos dificuldades devido à necessidade
de utilização de concentrações maiores de substrato do que a permitida pela solubilidade desse
composto para determinar os valores de Km, o que impediu a determinação dos valores de Ki e,
consequentemente, a determinação experimental da energia livre de ligação. Além disso, a baixa
quantidade disponível de substrato impediu calcular com maior precisão os valores de IC50, que
poderiam ser obtidos pela repetição dos ensaios com concentrações que produziram medidas
com grande desvio padrão. Por esses motivos, seria de grande importância a realização de
ensaios de calorimetria com a técnica ITC para poder medir a afinidade dos inibidores pelas
toxinas com maior precisão que os ensaios de cinética enzimática, permitindo uma comparação
direta entre a energia livre de ligação calculada computacionalmente e determinada
experimentalmente.
119
Apesar dessas técnicas apresentarem como desvantagem a necessidade de grandes
quantidades de proteínas, as toxinas utilizadas nesse trabalho estão presentes em grandes
quantidades nos venenos, permitindo a obtenção de grandes quantidades de proteínas após a
elaboração de um protocolo de purificação.
Uma outra possibilidade de verificar a acurácia das metodologias computacionais
empregadas para os cálculos de energia livre e seleção dos modos de ligação seria tentar
reproduzir dados disponíveis na literatura de trabalhos com outras metaloproteases do grupo da
metzincinas com essas metodologias.
Outra etapa fundamental na continuidade deste trabalho para a descoberta de novos
inibidores é a realização da segunda etapa da triagem virtual empregando as conformações das
toxinas geradas nas simulações de DM. Seriam empregados os ligantes selecionados na primeira
etapa da triagem, seguido pela realização de simulações de dinâmica molecular para realizar os
cálculos de variação de energia livre com a técnica de QM/MM-PBSA. Após esses cálculos, os
compostos que apresentarem melhores resultados serão adquiridos para realização de ensaios
experimentais. Isso implica também na automatização de muitas etapas no protocolo
computacional desenvolvido nesse trabalho, para poder utilizar o maior número de compostos
possível com os recursos computacionais disponíveis. É importante ressaltar que antes de
realizar os cálculos de energia livre será necessário verificar se esses cálculos, com o protocolo
utilizado nesse trabalho, serão capazes de reproduzir dados experimentais com as toxinas
estudadas ou com os dados da literatura.
Com relação a identificação das características estruturais das SVMP relacionadas com a
presença ou ausência de atividade hemorrágica, será necessário verificar se as duas principais
diferenças encontradas entre as toxinas estudadas, a flexibilidade da alça Ω e o potencial
eletrostático ao redor do sítio catalítico, se aplicam às demais SVMP. Essa verificação será
realizada com outras estruturas disponíveis no PDB e com modelos tridimensionais de toxinas
com sequências depositadas no UNIPROT, que podem ser produzidos devido a alta similaridade
estrutural entre esse grupo de enzimas.
120
8 – Agradecimentos
Gostaria de agradecer:
•
aos meus orientadores Rafaela Ferreira, Eladio Sanchez, Dimas Suarez e Natalia Diaz;
•
aos professores Adriano Pimenta, Marcelo Santoro (in memoriam), Ronaldo Nagem, e
aos doutores Francisco Santos e Rodrigo Ferreira;
•
aos professores Alfredo Goes, Eliane Novato, Glória Franco e Miguelito;
•
aos colegas de laboratório e do curso de Bioinformática;
•
aos colegas da FUNED, principalmente à minha chefa Dra. Eshter Bastos e à Regina de
Souza;
•
à minha família;
•
ao Jóbil;
•
à professora Ciléa Tavares;
•
aos amigos Ana Paula, Cristiano, Clóvis, Daniel, Ricardo e Frederico;
•
aos amigos José, Hector, Karol, Natalia;
•
à todos os amigos da biologia, principalmente aos doutores Alice Machado e Francisco
Lobo.
121
9 – Referências bibliográficas
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
Dos Santos, J. I. et al. Structural and functional studies of a bothropic myotoxin complexed to
rosmarinic acid: new insights into Lys49-PLA₂ inhibition. PLoS One 6, e28521 (2011).
Patiño, A. C. et al. Isolation and biological characterization of Batx-I, a weak hemorrhagic and
fibrinogenolytic PI metalloproteinase from Colombian Bothrops atrox venom. Toxicon 56, 936–43
(2010).
Gutiérrez, J. M. & Rucavado, a. Snake venom metalloproteinases: their role in the pathogenesis of
local tissue damage. Biochimie 82, 841–50 (2000).
Bello, C. a et al. Isolation and biochemical characterization of a fibrinolytic proteinase from
Bothrops leucurus (white-tailed jararaca) snake venom. Biochimie 88, 189–200 (2006).
Sanchez, E. F. et al. Structural and functional characterization of a P-III metalloproteinase,
leucurolysin-B, from Bothrops leucurus venom. Arch. Biochem. Biophys. 468, 193–204 (2007).
Gutiérrez, J. M., Escalante, T. & Rucavado, A. Experimental pathophysiology of systemic
alterations induced by Bothrops asper snake venom. Toxicon 54, 976–87 (2009).
Sanchez, E. F. et al. The novel metalloproteinase atroxlysin-I from Peruvian Bothrops atrox
(Jergón) snake venom acts both on blood vessel ECM and platelets. Arch. Biochem. Biophys. 496,
9–20 (2010).
Gomes, M. S. R. et al. Purification and functional characterization of a new metalloproteinase
(BleucMP) from Bothrops leucurus snake venom. Comp. Biochem. Physiol. C. Toxicol.
Pharmacol. 153, 290–300 (2011).
Nunes, E. D. S. et al. Purification of a lectin with antibacterial activity from Bothrops leucurus
snake venom. Comp. Biochem. Physiol. B. Biochem. Mol. Biol. 159, 57–63 (2011).
Calvete, J. J., Juárez, P. & Sanz, L. Snake venomics. Strategy and applications. in J. Mass
Spectrom. 42, 1405–1414 (2007).
Ferreira, R. N. et al. Complete amino-acid sequence, crystallization and preliminary X-ray
diffraction studies of leucurolysin-a, a nonhaemorrhagic metalloproteinase from Bothrops leucurus
snake venom. Acta Crystallogr. Sect. F. Struct. Biol. Cryst. Commun. 65, 798–801 (2009).
Lingott, T., Schleberger, C., Gutiérrez, J. M. & Merfort, I. High-resolution crystal structure of the
snake venom metalloproteinase BaP1 complexed with a peptidomimetic: insight into inhibitor
binding. Biochemistry 48, 6166–74 (2009).
Watanabe, L. et al. Amino acid sequence and crystal structure of BaP1, a metalloproteinase from
Bothrops asper snake venom that exerts multiple tissue-damaging activities. Protein Sci. 12, 2273–
2281 (2003).
Markland, F. S. & Swenson, S. Snake venom metalloproteinases. Toxicon 62, 3–18 (2013).
Escalante, T., Franceschi, a, Rucavado, a & Gutiérrez, J. M. Effectiveness of batimastat, a
synthetic inhibitor of matrix metalloproteinases, in neutralizing local tissue damage induced by
BaP1, a hemorrhagic metalloproteinase from the venom of the snake bothrops asper. Biochem.
Pharmacol. 60, 269–74 (2000).
Berman, H. M. et al. The Protein Data Bank. Nucleic Acids Res. 28, 235–242 (2000).
Gomis-Rüth, F. X. Catalytic domain architecture of metzincin metalloproteases. J. Biol. Chem.
284, 15353–7 (2009).
Takeda, S. Three-dimensional domain architecture of the ADAM family proteinases. Semin. Cell
Dev. Biol. 20, 146–52 (2009).
Takeda, S., Takeya, H. & Iwanaga, S. Snake venom metalloproteinases: structure, function and
relevance to the mammalian ADAM/ADAMTS family proteins. Biochim. Biophys. Acta 1824,
164–76 (2012).
Goor, H. Van. Adamalysins in biology and disease. J. … 1, 277–286 (2009).
Alföldi, J., Palma, F. Di, Grabherr, M. & Williams, C. The genome of the green anole lizard and a
122
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
comparative analysis with birds and mammals. Nature 477, 587–591 (2011).
Casewell, N. R. On the ancestral recruitment of metalloproteinases into the venom of snakes.
Toxicon 60, 449–54 (2012).
Schrodinger, L. The PyMOL Molecular Graphics System. (2010).
Haupt, V. J. & Schroeder, M. Old friends in new guise: repositioning of known drugs with
structural bioinformatics. Brief. Bioinform. 12, 312–26 (2011).
Kalinina, O. V, Wichmann, O., Apic, G. & Russell, R. B. Combinations of protein-chemical
complex structures reveal new targets for established drugs. PLoS Comput. Biol. 7, e1002043
(2011).
Schlick, T. Molecular Modeling and Simulation - an interdisciplinary guide. (Springer, 2006).
Sant’Anna, C. M. Métodos de Modelagem Molecular para Estudo e Planejamento de Compostos
Bioativos: Uma Introdução. Rev. Virtual Química 1, (2009).
Jacobsen, J. a, Fullagar, J. L., Miller, M. T. & Cohen, S. M. Identifying chelators for
metalloprotein inhibitors using a fragment-based approach. J. Med. Chem. 54, 591–602 (2011).
Klimes, J. & Michaelides, A. Perspective: Advances and challenges in treating van der Waals
dispersion forces in density functional theory. J. Chem. Phys. 137, (2012).
Becke, A. D. A new mixing of Hartree–Fock and local density-functional theories. J. Chem. Phys.
98, 1372 (1993).
Rayón, V. M., Valdés, H., Díaz, N. & Suárez, D. Monoligand Zn(II) complexes: Ab initio
benchmark calculations and comparison with density functional theory methodologies. J. Chem.
Theory Comput. 4, 243–256 (2008).
Elstner, M. et al. Self-consistent-charge density-functional tight-binding method for simulations of
complex materials properties. Phys. Rev. B 58, 7260–7268 (1998).
Elstner, M., Hobza, P., Frauenheim, T., Suhai, S. & Kaxiras, E. Hydrogen bonding and stacking
interactions of nucleic acid base pairs: A density-functional-theory based treatment. J. Chem.
Phys. 114, 5149 (2001).
Stewart, J. J. P. Application of the PM6 method to modeling proteins. J. Mol. Model. 15, 765–805
(2009).
Field, Martin J. Paul A. Bash, Karplus, M. A combined quantum mechanical and molecular
mechanical potential for molecular dynamics simulations. J. Comput. Chem. 11, 700–733 (1990).
Díaz, N., Suárez, D., Merz, K. M. & Sordo, T. L. Molecular dynamics simulations of the TEM-1
beta-lactamase complexed with cephalothin. J. Med. Chem. 48, 780–791 (2005).
Raha, K. & Merz, K. M. A quantum mechanics-based scoring function: study of zinc ion-mediated
ligand binding. J. Am. Chem. Soc. 126, 1020–1 (2004).
Ryde, U. Combined quantum and molecular mechanics calculations on metalloproteins. Curr.
Opin. Chem. Biol. 7, 136–142 (2003).
Frisch MJ, Trucks GW, Schlegel HB, Scuseria GE, Robb MA, Cheeseman JR, Scalmani G,
Barone V, Mennucci B, Petersson GA, Nakatsuji H, Caricato M, Li X, Hratchian HP, Izmaylov
AF, Bloino J, Zheng G, Sonnenberg JL, Hada M, Ehara M, Toyota K, Fukuda R, Hasegaw, F. D.
Gaussian 09. (2009).
Leach, A. R. Molecular Modelling - Principles and Applications. (Pearson, 2001).
Métodos de química teórica e modelagem molecular. (Livraria da Física, 2007).
Cornell, W. D. et al. A Second Generation Force Field for the Simulation of Proteins, Nucleic
Acids, and Organic Molecules. J. Am. Chem. Soc. 117, 5179–5197 (1995).
MacKerell, A. & Bashford, D. All-Atom Empirical Potential for Molecular Modeling and
Dynamics Studies of Proteins. J. … 5647, 3586–3616 (1998).
Christen, M. et al. The GROMOS software for biomolecular simulation: GROMOS05. J. Comput.
Chem. 26, 1719–1751 (2005).
Jorgensen, W. L., Maxwell, D. S. & Tirado-Rives, J. Development and Testing of the OLPS AllAtom Force Field on Conformational Energetics and Properties of Organic Liquids. J. Am. Chem.
Soc. 118, 11225–11236 (1996).
123
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
Halgren, T. A. Merck molecular force field. I. Basis, form, scope, parameterization, and
performance of MMFF94. J. Comput. Chem. 17, 490–519 (1996).
Wang, J., Wolf, R. M., Caldwell, J. W., Kollman, P. a & Case, D. a. Development and testing of a
general amber force field. J. Comput. Chem. 25, 1157–74 (2004).
Goh, B. C. et al. Atomic Modeling of an Immature Retroviral Lattice Using Molecular Dynamics
and Mutagenesis. Structure 23, 1414–1425 (2015).
Eswar, N. et al. Comparative protein structure modeling using MODELLER. Curr. Protoc.
Protein Sci. Chapter 2, Unit 2.9 (2007).
Sali, a. Comparative protein modeling by satisfaction of spatial restraints. Mol. Med. Today 1,
270–7 (1995).
Martí-Renom, M. & Stuart, A. Comparative protein structure modeling of genes and genomes.
Comp.
protein
Struct.
Model.
genes
genomes
291–325
(2000).
at
<http://www.annualreviews.org/doi/pdf/10.1146/annurev.biophys.29.1.291>
Laskowski, R. A., MacArthur, M. W., Moss, D. S. & Thornton, J. M. PROCHECK: a program to
check the stereochemical quality of protein structures. J. Appl. Crystallogr. 26, 283–291 (1993).
Benkert, P., Tosatto, S. C. E. & Schomburg, D. QMEAN: A comprehensive scoring function for
model quality assessment. Proteins 71, 261–77 (2008).
Shen, M. & Sali, A. Statistical potential for assessment and prediction of protein structures.
Protein Sci. 2507–2524 (2006). doi:10.1110/ps.062416606.Instead
Liu, T., Tang, G. W. & Capriotti, E. Comparative modeling: the state of the art and protein drug
target structure prediction. Comb. Chem. High Throughput Screen. 14, 532–547 (2011).
Wiederstein, M. & Sippl, M. J. ProSA-web: interactive web service for the recognition of errors in
three-dimensional structures of proteins. Nucleic Acids Res. 35, W407–10 (2007).
Sippl, M. J. Calculation of conformational ensembles from potentials of mean force. An approach
to the knowledge-based prediction of local structures in globular proteins. J. Mol. Biol. 213, 859–
83 (1990).
Jorgensen, W. L. Efficient drug lead discovery and optimization. Acc. Chem. Res. 42, 724–33
(2009).
Ferreira, R. S. et al. Complementarity between a docking and a high-throughput screen in
discovering new cruzain inhibitors. J. Med. Chem. 53, 4891–905 (2010).
Irwin, J. J., Raushel, F. M. & Shoichet, B. K. Virtual screening against metalloenzymes for
inhibitors and substrates. Biochemistry 44, 12316–28 (2005).
Jorgensen, W. L. The many roles of computation in drug discovery. Science 303, 1813–8 (2004).
Kobilka, B. K. et al. Structure-based discovery of beta 2-adrenergic receptor ligands. 106, (2009).
Irwin, J. & Shoichet, B. ZINC-a free database of commercially available compounds for virtual
screening. J. Chem. Inf. … 45, 177–182 (2005).
Cavasotto, C. N. Homology models in docking and high-throughput docking. Curr. Top. Med.
Chem. 11, 1528–34 (2011).
Fan, H. et al. Molecular docking screens using comparative models of proteins. J. Chem. Inf.
Model. 49, 2512–27 (2009).
Bolstad, E. S. D. & Anderson, A. C. In pursuit of virtual lead optimization: pruning ensembles of
receptor structures for increased efficiency and accuracy during docking. Proteins 75, 62–74
(2009).
Shoichet, B. K. Virtual screening of chemical libraries. Nature 432, 862–5 (2004).
Tomlinson, S. M. et al. Structure-based discovery of dengue virus protease inhibitors. Antiviral
Res. 82, 110–4 (2009).
Jaghoori, M. M., Bleijlevens, B. & Olabarriaga, S. D. 1001 Ways to run AutoDock Vina for
virtual screening. J. Comput. Aided. Mol. Des. (2016). doi:10.1007/s10822-016-9900-9
Trott, O. & Olson, A. AutoDock Vina%: Improving the Speed and Accuracy of Docking with a
New Scoring Function, Efficient Optimization, and Multithreading. J. Comput. Chem. (2010).
doi:10.1002/jcc
124
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
Durrant, J. D. & McCammon, J. A. Molecular dynamics simulations and drug discovery. BMC
Biol. 9, 71 (2011).
Chaskar, P., Zoete, V. & Röhrig, U. F. Towards On-The-Fly QM / MM Docking%: Development
and Benchmark of a Scoring Function. J. Chem. Inf. Model. 54, 3137–3152 (2014).
Lin, J. & Perryman, A. The Relaxed Complex Method: Accommodating Receptor Flexibility for
Drug
Design
with
an
Improved
Scorin
Scheme.
Biopolymers
(2003).
at
<http://onlinelibrary.wiley.com/doi/10.1002/bip.10218/full>
Case DA, Berryman JT, Betz RM, Cerutti DS, Cheatham TEI, Darden TA, Duke RE, G. T.,
Gohlke H, Goetz AW, Homeyer N, Izadi S, Janowski P, Kaus J, Kovalenko A, Lee TS, LeGrand
S, L., P, Luchko T, Luo R, Madej B, Merz KM, Monard G, Needham P, Nguyen H, Nguyen HT,
O. I., Onufriev A, Roe DR, Roitberg A, Salomon-Ferrer R, Simmerling CL, Smith W, Swails J,
W. R. & Wang J, Wolf RM, Wu X, York DM, K. P. AMBER 14. (2015).
Case, D. A. et al. The Amber biomolecular simulation programs. J. Comput. Chem. 26, 1668–88
(2005).
Wang, J., Wang, W., Kollman, P. A. & Case, D. A. Automatic atom type and bond type perception
in molecular mechanical calculations. J. Mol. Graph. Model. 25, 247–260 (2006).
Walker, R. C., Crowley, I. F. & Case, D. A. The implementation of a fast and accurate QM/MM
potential method in Amber. J. Comput. Chem. 29, 1019–1031 (2008).
Salomon-Ferrer, R., Götz, A. W., Poole, D., Le Grand, S. & Walker, R. C. Routine Microsecond
Molecular Dynamics Simulations with AMBER on GPUs. 2. Explicit Solvent Particle Mesh
Ewald. J. Chem. Theory Comput. 9, 3878–3888 (2013).
Le Grand, S., Götz, A. W. & Walker, R. C. SPFP: Speed without compromise - A mixed precision
model for GPU accelerated molecular dynamics simulations. Comput. Phys. Commun. 184, 374–
380 (2013).
Amaro, R. E., Baron, R. & McCammon, J. A. An improved relaxed complex scheme for receptor
flexibility in computer-aided drug design. J. Comput. Aided. Mol. Des. 22, 693–705 (2008).
Kollman, P. a et al. Calculating structures and free energies of complex molecules: combining
molecular mechanics and continuum models. Acc. Chem. Res. 33, 889–97 (2000).
Kollman, P. Free energy calculations: Applications to chemical and biochemical phenomena.
Chem. Rev. 93, 2395–2417 (1993).
Beveridge, D. L. & DiCapua, F. M. Free energy via molecular simulation: applications to
chemical and biomolecular systems. Annu. Rev. Biophys. Biophys. Chem. 18, 431–92 (1989).
Homeyer, N. & Gohlke, H. Free energy calculations by the Molecular Mechanics PoissonBoltzmann Surface Area method. Mol. Inform. 31, 114–122 (2012).
Hou, T., Wang, J., Li, Y. & Wang, W. Assessing the performance of the molecular
mechanics/Poisson Boltzmann surface area and molecular mechanics/generalized Born surface
area methods. II. The accuracy of ranking poses generated from docking. J. Comput. Chem. 32,
866–77 (2011).
Baron, R. & McCammon, J. A. Molecular recognition and ligand association. Annu. Rev. Phys.
Chem. 64, 151–75 (2013).
Genheden, S. & Ryde, U. The MM/PBSA and MM/GBSA methods to estimate ligand-binding
affinities. Expert Opin. Drug Discov. 10, 449–61 (2015).
Sitkoff, D., Sharp, K. A. & Honig, B. Accurate Calculation of Hydration Free Energies Using
Macroscopic Solvent Models. J. Phys. Chem. 98, 1978–1988 (1994).
Tan, C., Tan, Y. H. & Luo, R. Implicit nonpolar solvent models. J. Phys. Chem. B 111, 12263–
12274 (2007).
Karplus, M. & Kushick, J. N. Method for estimating the configurational entropy of
macromolecules. Macromolecules 14, 325–332 (1981).
Srinivasan, J., Cheatham, T. E., Cieplak, P., Kollman, P. a. & Case, D. a. Continuum solvent
studies of the stability of DNA, RNA, and phosphoramidate-DNA helices. J. Am. Chem. Soc. 120,
9401–9409 (1998).
125
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
Still, W. C., Tempczyk, A., Hawley, R. C. & Hendrickson, T. Semianalytical treatment of
solvation for molecular mechanics and dynamics. J. Am. Chem. Soc. 112, 6127–6129 (1990).
Case DA, Berryman JT, Betz RM, Cerutti DS, Cheatham TEI, Darden TA, Duke RE, G. T.,
Gohlke H, Goetz AW, Homeyer N, Izadi S, Janowski P, Kaus J, Kovalenko A, Lee TS, LeGrand
S, L., P, Luchko T, Luo R, Madej B, Merz KM, Monard G, Needham P, Nguyen H, Nguyen HT,
O. I., Onufriev A, Roe DR, Roitberg A, Salomon-Ferrer R, Simmerling CL, Smith W, Swails J,
W. R. & Wang J, Wolf RM, Wu X, York DM, K. P. Manual AMBER 14. (2014).
Kaukonen, M., Heimdal, J. & Ryde, U. QM / MM-PBSA Method To Estimate Free Energies for
Reactions in Proteins ¨ r So. 20, 12537–12548 (2008).
Magrane, M. & Consortium, U. P. UniProt Knowledgebase: A hub of integrated protein data.
Database 2011, 1–13 (2011).
Altschul, S. F., Gish, W., Miller, W., Myers, E. W. & Lipman, D. J. Basic local alignment search
tool. J. Mol. Biol. 215, 403–410 (1990).
McGuffin, L. J., Buenavista, M. T. & Roche, D. B. The ModFOLD4 server for the quality
assessment of 3D protein models. Nucleic Acids Res. 41, W368–W372 (2013).
Eramian D, Shen M-Y, Melo F, Pieper UW, B., S. A. ModEval. (2013).
Benkert, P., Künzli, M. & Schwede, T. QMEAN server for protein model quality estimation.
Nucleic Acids Res. 37, W510–4 (2009).
Anandakrishnan, R., Aguilar, B. & Onufriev, A. V. H++ 3.0: Automating pK prediction and the
preparation of biomolecular structures for atomistic molecular modeling and simulations. Nucleic
Acids Res. 40, 537–541 (2012).
Sharp K, H. B. Electrostatic Interactions in Macromolecules: Theory and Applications. Annu. Rev.
Biophys. Biophys. Chem. 19, 301–302 (1991).
Grimsley, G. R., Scholtz, J. M. & Pace, C. N. A summary of the measured pK values of the
ionizable groups in folded proteins. Protein Sci. 18, 247–251 (2009).
Supuran, C. T. & Winum, J.-Y. Drug design of zinc-enzymes inhibitors. (Wiley, 2009).
MarvinSketch. at <www.chemaxon.com>
Maier, J. A. et al. ff14SB: Improving the Accuracy of Protein Side Chain and Backbone
Parameters from ff99SB. J. Chem. Theory Comput. 11, 3696–3713 (2015).
Hornak, V. et al. Comparison of Multiple Amber Force Fields and Development of Improved
Protein Backbone Parameters. 725, 712–725 (2006).
Li, P., Roberts, B. P., Chakravorty, D. K. & Merz, K. M. Rational design of particle mesh ewald
compatible lennard-jones parameters for +2 metal cations in explicit solvent. J. Chem. Theory
Comput. 9, 2733–2748 (2013).
Jorgensen, W. L., Chandrasekhar, J., Madura, J. D., Impey, R. W. & Klein, M. L. Comparison of
simple potential functions for simulating liquid water. J. Chem. Phys. 79, 926 (1983).
Krüger, T., Elstner, M., Schiffels, P. & Frauenheim, T. Validation of the density-functional based
tight-binding approximation method for the calculation of reaction energies and other data. J.
Chem. Phys. 122, 114110 (2005).
Moreira, N. H., Dolgonos, G., Aradi, B., da Rosa, A. L. & Frauenheim, T. Toward an Accurate
Density-Functional Tight-Binding Description of Zinc-Containing Compounds. J. Chem. Theory
Comput. 5, 605–614 (2009).
Francl, M. M. et al. Self-consistent molecular orbital methods. XXIII. A polarization-type basis set
for second-row elements. J. Chem. Phys. 77, 3654–3665 (1982).
Rassolov, V. A., Pople, J. A., Ratner, M. A. & Windus, T. L. 6-31G∗ basis set for atoms K
through Zn. J. Chem. Phys. 109, 1223 (1998).
Cossi, M., Rega, N., Scalmani, G. & Barone, V. Energies, structures, and electronic properties of
molecules in solution with the C-PCM solvation model. J. Comput. Chem. 24, 669–681 (2003).
Bayly, C. C. I., Cieplak, P., Cornell, W. D. & Kollman, P. a. A well-behaved electrostatic potential
based method using charge restraints for deriving atomic charges: the RESP model. J. Phys.
Chem. 97, 10269–10280 (1993).
126
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
Izaguirre, J. A., Catarello, D. P., Wozniak, J. M. & Skeel, R. D. Langevin stabilization of
molecular dynamics. J. Chem. Phys. 114, 2090 (2001).
Ryckaert, J.-P., Ciccotti, G. & Berendsen, H. J. . Numerical integration of the cartesian equations
of motion of a system with constraints: molecular dynamics of n-alkanes. J. Comput. Phys. 23,
327–341 (1977).
Morris, G. M. et al. AutoDock4 and AutoDockTools4: Automated Docking with Selective
Receptor Flexibility. J. Comput. Chem. 30, 2785–2791 (2010).
Huey, R., Morris, G. M., Olson, A. J. & Goodsell, D. S. A semiempirical free energy force field
with charge-based desolvation. J. Comput. Chem. 28, 1145–1152 (2007).
Hu, X. & Shelver, W. H. Docking studies of matrix metalloproteinase inhibitors: zinc parameter
optimization to improve the binding free energy prediction. J. Mol. Graph. Model. 22, 115–126
(2003).
Santos-Martins, D., Forli, S., Ramos, M. J. & Olson, A. J. AutoDock4Zn: An improved AutoDock
forcefield for small-molecule docking to zinc metalloproteins. J. Chem. Inf. Model. 54, 2371−2379
(2014).
Fabre, B. et al. An Integrated Computational and Experimental Approach to Gaining Selectivity
for MMP-2 within the Gelatinase Subfamily. ChemBioChem 15, 399–412 (2014).
Feig, M., Karanicolas, J. & Brooks, C. L. MMTSB Tool Set: enhanced sampling and multiscale
modeling methods for applications in structural biology. J. Mol. Graph. Model. 22, 377–95
(2004).
Galindo-Murillo, R., Roe, D. R. & Cheatham, T. E. Convergence and reproducibility in molecular
dynamics simulations of the DNA duplex d(GCACGAACGAACGAACGC). Biochim. Biophys.
Acta 1850, 1041–1058 (2014).
Genheden, S., Kuhn, O., Mikulskis, P., Hoffmann, D. & Ryde, U. The normal-mode entropy in the
MM/GBSA method: Effect of system truncation, buffer region, and dielectric constant. J. Chem.
Inf. Model. 52, 2079–2088 (2012).
Suárez, E., Díaz, N., Méndez, J. & Suárez, D. CENCALC: A computational tool for
conformational entropy calculations from molecular simulations. J. Comput. Chem. 34, 2041–
2054 (2013).
Carlsson, J. & Aqvist, J. Absolute and relative entropies from computer simulatio with application
to ligand binding. J. Phys. Chem. B 109, 6448–6456 (2005).
Baker, N. A., Sept, D., Joseph, S., Holst, M. J. & McCammon, J. A. Electrostatics of nanosystems:
Application to microtubules and the ribosome. Proc. Natl. Acad. Sci. 98, 10037–10041 (2001).
Sanner, M. F., Olson, a J. & Spehner, J. C. Reduced surface: an efficient way to compute
molecular surfaces. Biopolymers 38, 305–320 (1996).
Pettersen, E. F. et al. UCSF Chimera--a visualization system for exploratory research and analysis.
J. Comput. Chem. 25, 1605–12 (2004).
Schmidtke, P., Bidon-Chanal, A., Luque, F. J. & Barril, X. MDpocket: open-source cavity
detection and characterization on molecular dynamics trajectories. Bioinformatics 27, 3276–3285
(2011).
Le Guilloux, V., Schmidtke, P. & Tuffery, P. Fpocket: An open source platform for ligand pocket
detection. BMC Bioinformatics 10, 168 (2009).
Software, G. GraphPad Prism. at <www.graphpad.com>
Dallakyan, S. MGLTools. (2010). at <http://mgltools.scripps.edu/>
Schaftenaar, G. & Noordik, J. H. Molden: A pre- and post-processing program for molecular and
electronic structures. J. Comput. Aided. Mol. Des. 14, 123–134 (2000).
Humphrey, W., Dalke, a & Schulten, K. VMD: visual molecular dynamics. J. Mol. Graph. 14,
33–8, 27–8 (1996).
Evans, D. A. & Rubenstein, S. Chemdraw14. (2014). at <http://www.cambridgesoft.com/>
Eaton, J. W., Bateman, D., Hauberg, S. & Wehbring, R. GNU Octave. (2014).
Team, R. D. C. R: A Language and Environment for Statistical Computing. (2013). at
127
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
<http://www.r-project.org>
Eramian, D. et al. ModEval. at <http://modbase.compbio.ucsf.edu/evaluation/>
Howes, J.-M., Theakston, R. D. G. & Laing, G. D. Neutralization of the haemorrhagic activities of
viperine snake venoms and venom metalloproteinases using synthetic peptide inhibitors and
chelators. Toxicon 49, 734–9 (2007).
Bissett, D. et al. Phase III Study of Matrix Metalloproteinase Inhibitor Prinomastat in Non-SmallCell Lung Cancer. J. Clin. Oncol. 23, 842–849 (2005).
Rothenberg, M. L., Nelson, a R. & Hande, K. R. New drugs on the horizon: matrix
metalloproteinase inhibitors. Stem Cells 17, 237–40 (1999).
Sparano, J. A. et al. Randomized Phase III Trial of Marimastat Versus Placebo in Patients With
Metastatic Breast Cancer Who Have Responding or Stable Disease After First-Line
Chemotherapy: Eastern Cooperative Oncology Group Trial E2196. J. Clin. Oncol. 22, 4683–4690
(2004).
Paes Leme, A. F. et al. High resolution analysis of snake venom metalloproteinase (SVMP)
peptide bond cleavage specificity using proteome based peptide. J. Proteomics 74, 401–10 (2011).
Supuran, C. T. Drug design of zinc-enzyme inhibitors. (Wiley, 2009).
Díaz, N. & Suárez, D. Peptide hydrolysis catalyzed by matrix metalloproteinase 2: a
computational study. J. Phys. Chem. B 112, 8412–24 (2008).
Singh, T., Adekoya, O. A. & Jayaram, B. Understanding the binding of inhibitors of matrix
metalloproteinases by molecular docking, quantum mechanical calculations, molecular dynamics
simulations, and a MMGBSA/MMBappl study. Mol. Biosyst. 11, 1041–1051 (2015).
Lingott, T., Merfort, I. & Steinbrecher, T. Free energy calculations on snake venom
metalloproteinase BaP1. Chem. Biol. Drug Des. 79, 990–1000 (2012).
Díaz, N., Suarez, D. & Sordo, T. L. Quantum chemical study on the coordination environment of
the catalytic zinc ion in matrix metalloproteinases. J. Phys. Chem. B 110, 24222–30 (2006).
Houa, T., Wangb, J., Lia, Y. & Wang, W. Assessing the performance of the MM/PBSA and
MM/GBSA methods: I. The accuracy of binding free energy calculations based on molecular
dynamics simulations. J. Chem. Inf. Comput. Sci. 51, 69–82 (2011).
Wallnoefer, H. G., Lingott, T., Gutiérrez, J. M., Merfort, I. & Liedl, K. R. Backbone flexibility
controls the activity and specificity of a protein-protein interface: specificity in snake venom
metalloproteases. J. Am. Chem. Soc. 132, 10330–7 (2010).
128