As proteínas evoluíram para serem boas em tudo, desde a contração muscular até a digestão dos alimentos e o reconhecimento de vírus. Para criar proteínas melhores, incluindo anticorpos, os cientistas muitas vezes mutam repetidamente aminoácidos (unidades dispostas para formar proteínas) em posições diferentes, resultando em função melhorada da proteína (por exemplo, desencadeando uma resposta imunológica mais forte ou capturando carbono). O dióxido de carbono pode ser extraído da atmosfera de forma mais eficiente.
No entanto, existem mais sequências de aminoácidos possíveis no mundo do que grãos de areia. E encontrar a melhor proteína e, portanto, o melhor medicamento potencial, muitas vezes é caro ou impossível.
Cientistas da Universidade de Stanford desenvolveram um novo método baseado em aprendizado de máquina para prever com mais rapidez e precisão mudanças moleculares que poderiam levar ao desenvolvimento de melhores medicamentos com anticorpos. foi anunciado em Ciência 4 de julho, A abordagem combina modelos de linguagem em grande escala baseados na estrutura 3D de backbones de proteínas e sequências de aminoácidos, permitindo aos pesquisadores identificar mutações raras e desejáveis que de outra forma só seriam descobertas com experimentação exaustiva e podem ser descobertas em minutos.
Uma equipe liderada pelo professor de bioquímica Sarafan ChEM-H e pesquisador associado Peter S. Kim e pelo professor assistente de engenharia química Brian Hie mostrou que eles podem melhorar os anticorpos SARS-CoV-2 previamente aprovados pela FDA. Foi descontinuado em novembro de 2022 porque não foi eficaz contra a nova cepa. A abordagem deles resultou em uma melhoria de 25 vezes contra o vírus.
“Muitos esforços em IA e desenvolvimento de medicamentos estão focados em misturar grandes quantidades de dados sobre quão bem uma molécula específica executa uma tarefa específica, para que os computadores possam aprender o suficiente para projetar versões melhores. Estou focado em fazer isso”, disse Kim. “O que é notável é que mostramos que é possível usar estrutura em vez de muitos dados e que o computador ainda pode aprender.”
“Agora, mais anticorpos estão sendo realmente desafiados a serem otimizados”, disse Hie, que também é pesquisador de inovação no Arc Institute.

Animação mostrando a estrutura 3D de anticorpos SARS-CoV-2 previamente aprovados pela FDA (mostrados em verde e laranja) ligados a proteínas que aparecem na superfície do vírus (mostrados em branco). A nova abordagem permitiu à equipe identificar alterações específicas nos aminoácidos que compõem os anticorpos (mostrados como esferas azuis e rosa) que os tornam 25 vezes mais eficazes contra o vírus. Varun Shanker
dobrado e moldado
Quando confrontados com o desafio de encontrar a melhor sequência de aminoácidos, os cientistas muitas vezes criam milhões de aminoácidos e testam-nos em versões miniaturizadas e simplificadas de sistemas biológicos. Eles esperam que o melhor remédio na culinária seja também o melhor remédio para os humanos.
“É difícil adivinhar ou confirmar”, disse Hie. “O objetivo de muitos algoritmos inteligentes é eliminar as suposições.”
Para acelerar esse processo, os cientistas desenvolveram algoritmos de aprendizado de máquina como o ChatGPT, que são treinados nas sequências de aminoácidos de milhões de proteínas para prever as mutações desejadas.
Mas estes modelos muitas vezes mostram aos cientistas que, uma vez geradas em laboratório, as sequências são instáveis ou em pior situação do que quando começaram.
Parte da razão é que a função da proteína depende não apenas da sequência de aminoácidos, mas também da estrutura 3D dessa sequência. Por exemplo, para desencadear uma resposta imunitária, os anticorpos devem estar na forma correta para se ligarem às moléculas na superfície de um vírus.
A equipe acreditava que a estrutura era a chave para desenvolver melhores algoritmos preditivos. Eles, portanto, restringiram a longa lista de possíveis mutações benéficas, determinadas por um modelo de linguagem baseado em sequências em larga escala, apenas a mutações que preservam a forma 3D da proteína inicial.
campo de testes
Em dezembro de 2022, a equipe de pesquisa conduziu um ensaio recentemente interrompido de uma terapia com anticorpos contra SARS-CoV-2.
“A teoria geral era que se tentássemos melhorar este anticorpo, ele falharia”, disse Varun Shankar, estudante de medicina, estudante de pós-graduação em biofísica e principal autor do estudo. “O vírus era muito inteligente. Ele evoluiu à medida que se espalhava por milhões de pessoas para saber exatamente como sofrer mutação para escapar desses anticorpos”.
A otimização da proteína usando um modelo puramente baseado em sequência resultou em um ligeiro aumento de 2 vezes na eficácia. Mas com uma abordagem baseada em estrutura, a equipe viu um aumento de 25 vezes.
“Finalmente alcançamos o vírus”, disse Shankar, que também é bolsista do Programa de Treinamento em Interface Química/Biologia da Sarafan ChEM-H.
Ensine novos truques a modelos antigos
A maioria dos esforços para usar a IA para desenvolver medicamentos melhores depende de modelos de “treinamento” ou “monitoramento”, que envolvem a análise de grandes quantidades de dados sobre a função e o desempenho de sequências de proteínas únicas. Esta abordagem leva muito tempo e cria modelos adaptados a proteínas específicas que realizam tarefas específicas.
Este modelo não requer informações sobre o que a proteína faz, quão bem ela funciona ou sobre experimentos de laboratório. Como a estrutura está intimamente ligada à função, as coordenadas das proteínas são um indicador do desempenho. Ao pesquisar novos anticorpos contra o coronavírus, restringimos a estrutura não apenas do anticorpo em si, mas também do anticorpo quando se liga ao vírus. A partir daí, o modelo “aprendeu” algumas regras de ligação de anticorpos sem precisar ser ensinado.
As primeiras experiências mostram que esta abordagem pode ser generalizada para outros tipos de proteínas, tais como enzimas que ajudam a catalisar reações químicas no corpo. Até agora, os investigadores descobriram que o modelo mostrou aos cientistas dezenas de proteínas e, em média, metade delas são melhores do que o ponto de partida.
Esta ferramenta poderia ajudar a responder rapidamente a doenças emergentes ou em evolução. Também reduz as barreiras à produção de medicamentos mais eficazes. Se o medicamento for mais potente, serão necessárias menos doses e uma determinada quantidade poderá beneficiar mais pacientes. Para doenças infecciosas como o VIH, a investigação demonstrou que doses grandes e pouco frequentes de anticorpos podem proteger os pacientes da infecção, o que pode ser transformador.
A equipe disponibilizou o modelo e o código gratuitamente para todos.
“Este é um exemplo emocionante do poder do aprendizado profundo para democratizar o processo de construção de proteínas melhores”, disse Shankar. “Isto não só permitirá que as pessoas desenvolvam novos medicamentos, mas também abrirá novas áreas de exploração científica que antes eram inacessíveis.”

