DeepMind resuelve uno de los mayores acertijos de la biología molecular con AlphaFold: el problema del plegamiento de proteínas

Investigadores de todo el mundo entusiasmados: "Esto cambiará la medicina"

Sonja Böhm

Conflictos de interés

14 de diciembre de 2020

Entre las discusiones sobre COVID-19, los cierres y confinamientos por el coronavirus y las vacunas que pronto estarán disponibles, ha pasado casi desapercibido un informe de finales de noviembre, que en opinión de muchos expertos es en realidad una sensación científica. "Esto cambiará todo", así lo tituló, por ejemplo, Nature el 30 de noviembre de 2020, que señala que ha habido gran avance que "transformará la biología".[1]

Revolución en la biología

De qué se trata: la empresa británica DeepMind, subsidiaria de Google Holding Alphabet, ha informado de un éxito hasta ahora inimaginable con su programa de inteligencia artificial AlphaFold muy mejorado, en una competencia internacional entre equipos científicos. El "problema del plegamiento de proteínas", un rompecabezas científico que ha sido objeto de investigación durante 50 años y que se equipara en su importancia con el esclarecimiento del código genético, ha sido "prácticamente resuelto". AlphaFold logró predecir, con precisión previamente inimaginable, la estructura tridimensional de las proteínas, simplemente a partir de su secuencia de aminoácidos.

DeepMind ganó con su programa AlphaFold, que se basa en aprendizaje automático, de lejos la competencia bienal Critical Assessment of Structure Prediction (CASP), en la que participaron alrededor de 100 equipos científicos de todo el mundo. Los otros equipos quedaron eclipsados a tal punto que los científicos hablan de una "revolución en la biología", debido a las nuevas posibilidades.

Una década de estructuras ahora resueltas en media hora

Las ciencias naturales y especialmente la medicina podrían beneficiarse enormemente del progreso realizado en la predicción precisa de las estructuras de las proteínas sobre la base de su secuencia de aminoácidos. "Es un cambio de juego radical", indicó Andrei Lupas, Ph. D. biólogo molecular y director del Instituto Max Planck de Biología del Desarrollo, en Tübingen, Alemania, citado en Nature.

El científico fue uno de los jurados que evaluaron el desempeño de los diferentes equipos del CASP. Él y su equipo habían presentado además proteínas como "metas" ellos mismos, incluido uno en cuya estructura habían trabajado durante una década. "Con la predicción de AlphaFold como modelo de búsqueda pudimos resolver la estructura en media hora", reportó Lupas al Science Media Center Germany.[2]

Con la predicción de AlphaFold como modelo de búsqueda pudimos resolver la estructura en media hora. Andrei Lupas

AlphaFold cambiará la forma en que trabaja y las preguntas con las que se enfrenta, destacó Lupas: "Esto cambiará la medicina, la investigación, la bioingeniería; cambiará todo".

"La estructura es función" y ahora puede ser aclarada

Sus colegas están igualmente impresionados. "Las estructuras tridimensionales de las proteínas son esenciales para comprender los sistemas biológicos a nivel molecular, ya que la forma determina su función", explicó el Sameer Velankar, Ph. D., del Laboratorio Europeo de Biología Molecular (EMBL-EBI) en Cambridge, Reino Unido.

"La estructura es función es un axioma de la biología molecular. Las estructuras se pueden utilizar para diseñar nuevas funciones proteicas, mejorar la estabilidad de proteínas existentes o desarrollar moléculas terapéuticas con aplicaciones en la biotecnología y la industria farmacéutica", continuóVelankar.

Hasta la fecha, menos de 1% de las proteínas en los humanos tiene su estructura definida. Los métodos experimentales como el análisis de la estructura cristalina con rayos X, la tomografía crioelectrónica o la espectroscopia multidimensional de resonancia magnética nuclear se consideran el patrón oro. Sin embargo, estos métodos son muy prolongados y complejos.

Los primeros intentos de utilizar computadoras para encontrar formas más simples y rápidas para determinar estructuras no tuvieron mucho éxito; aun cuando el bioquímico estadounidense, Christian Anfinsen, Ph. D., había demostrado en la fase inicial de la investigación de proteínas que la estructura de una proteína podía teóricamente derivarse de su secuencia de aminoácidos, por lo cual recibió el Premio Nobel de Química de 1972.

Predecir el plegamiento de proteínas en una computadora es complicado porque se deben posicionar correctamente varios miles de átomos... Teóricamente hay más posibilidades para esto que estrellas en el universo... Jens Meiler

El problema: "Predecir el plegamiento de proteínas en una computadora es complicado porque se deben posicionar correctamente varios miles de átomos, como un enorme rompecabezas tridimensional.

Teóricamente hay más posibilidades para esto que estrellas en el universo. Ningún programa informático puede probar todas estas posibilidades", explicó Jens Meiler, Ph. D., director del Instituto de Desarrollo de Medicamentos de la Universidad de Leipzig, y profesor de Química, Farmacología e Informática Biomédica, de Vanderbilt University, en Nashville, Estados Unidos.

Para avanzar en la investigación sobre esto, en 1994 se lanzó el experimento colectivo CASP. En cada competencia se pide a los equipos participantes que predigan la estructura de plegamiento tridimensional de 100 secuencias de proteínas, cuya estructura ya se ha determinado experimentalmente en mayor o menor grado, pero aún no publicado. Hace dos años el equipo AlphaCode participó por primera vez y ganó la competencia CASP13 en ese entonces. Pero este año en CASP14, el método de DeepMind, superó por mucho a todos los demás. Esto aun cuando los otros equipos también utilizaron métodos de aprendizaje automático de máquina.

Asombrosa precisión de 92,4 en la prueba de distancia global (GDT)

El jurado del concurso, científicos independientes como  Lupas, compararon las predicciones enviadas con los datos experimentales y evaluaron los resultados utilizando el valor denominado "prueba de distancia global" en una escala de 1 a 100. Las presentaciones son anónimas, los miembros del jurado no saben de dónde proceden.

AlphaFold presentó sus resultados como "Grupo 427". Debido a la asombrosa precisión, se sospechaba que era AlphaFold, informó Lupas en Nature. El equipo británico de DeepMind logró 92,4 de GDT en las 100 proteínas e incluso tuvo una mediana de alrededor de 87 para las proteínas "difíciles de predecir". En la competencia CASP13 de hace 2 años solo se alcanzó un valor de aproximadamente 53.

Los mejores grupos de investigación competidores lograron un valor de GDT de 75. Los científicos consideran que un valor superior a 90 es tan preciso como las determinaciones de estructura experimentales, que a menudo llevan años. AlphaFold logró incluso ayudar, gracias a sus predicciones en casi una docena de casos en los que se tuvieron que modelar secuencias de proteínas "difíciles de predecir", a optimizar los resultados experimentales de los investigadores.

El método de aprendizaje profundo es muy prometedor porque no requiere que la computadora calcule la estructura (claramente establecida por las leyes de la física) utilizando las fórmulas de la mecánica cuántica. "El esfuerzo de computación requerido para esto sería gigantesco", explicó Jürgen Cox, Ph. D., jefe del grupo de investigación bioquímica de sistemas computacionales en el Instituto Max Planck de Bioquímica, en Martinsried, cerca de Múnich.

Por el contrario, en el aprendizaje profundo se entrena sobre la base de muchos ejemplos en los que la estructura de la proteína se resolvió mediante métodos experimentales, una red neuronal profunda, la cual extrae las reglas decisivas para determinar la estructura, reemplazando así la solución de las complicadas ecuaciones físicas. La red se entrena utilizando información de bases de datos de proteínas.

Cómo lo hace la "red neural profunda", tampoco lo saben los investigadores

La desventaja del método radica en que a pesar de que los científicos son quienes programan la "red neural profunda" que hace el trabajo, los mismos investigadores no saben exactamente cómo es que se obtienen los asombrosos resultados. "AlphaFold es básicamente como conocer a una persona que puede determinar experimentalmente la estructura de una proteína en cuestión de horas, pero que no nos dice cómo lo hace"; vívida comparación que hace Gunnar Schröder, Ph. D., director del Grupo de Investigación de Biología Estructural Computacional en el Forschungszentrum Jülich.

AlphaFold es básicamente como conocer a una persona que puede determinar experimentalmente la estructura de una proteína en cuestión de horas, pero no nos dice cómo lo hace. Gunnar Schröder

Aunque se muestra igualmente entusiasmado, también es crítico: "Es fantástico y de gran valor científico tener un método que produzca modelos atómicos con tanto éxito. Sin embargo, no creo que el ‘código de plegamiento de proteínas’ haya sido realmente descifrado", destacó.

Y otros colegas también vierten agua en el vino: "Las proteínas no suelen tomar un solo pliegue, sino que cambian como una reacción al entorno, cuando se unen a otras proteínas, cuando se llevan a cabo reacciones enzimáticas o cuando se unen fármacos o anticuerpos terapéuticos. Parece ser que AlphaFold aún no puede predecir estos cambios", señaló Jan Kosinski, Ph. D., director de Grupo del Laboratorio Europeo de Biología Molecular en Hamburgo.

Grandes oportunidades para el desarrollo de fármacos

Sin embargo, en la actualidad el campo está cambiando vertiginosamente. Schröder tiene grandes esperanzas, por ejemplo, para el desarrollo de nuevos fármacos. "Las estructuras de proteínas también son directamente importantes para el desarrollo de fármacos; a menudo son el objetivo de los ingredientes activos, con los que las mismas deben inhibirse, por ejemplo. Si tenemos un modelo atómico exacto de una proteína objetivo, este se puede utilizar para desarrollar específicamente un ingrediente activo", y ve más perspectivas de futuro: "El campo de la medicina personalizada, que está creciendo rápidamente, podría incluso convertirse en medicina molecular personalizada, en la que en el futuro adaptaremos los ingredientes activos y las terapias a las estructuras proteicas personales de un solo paciente".

Si tenemos un modelo atómico exacto de una proteína objetivo, este se puede utilizar para diseñar específicamente un ingrediente activo. Gunnar Schröder

Meiler también ve un "gran éxito que sin duda permitirá el desarrollo de fármacos basados en la estructura para ciertas enfermedades. Por ejemplo, el desarrollo de agentes terapéuticos para patologías neurológicas como el Alzheimer, la esquizofrenia y la demencia puede beneficiarse, si ahora se puede calcular la estructura de ciertos receptores en el cerebro".

Cox también ve "posibilidades inimaginables para entender las enfermedades y su cura. Muchas enfermedades se basan en la interrupción del funcionamiento regular de las proteínas. La relación entre el ADN y el funcionamiento de proteínas, células, tejidos, órganos y todo el cuerpo se comprenderá mucho más gracias a la predicción de la estructura".

Pero aún queda mucho por investigar

Sin embargo, aún quedan muchas preguntas sin respuesta. Cox recordó que "aún es más difícil determinar, basándose en la predicción de las estructuras proteicas, cómo funcionan juntas estas proteínas y qué complejos proteicos se forman". Además existen diversas interacciones de las proteínas con el ADN, ARN y moléculas más pequeñas, y casi todas las proteínas presentan "modificaciones como la fosforilación, que tienen influencia importante en la estructura, función e interacción con otras biomoléculas". Todo esto aún no lo responde AlphaFold.

Alexander Schug, director del Grupo de Investigación Simulación Biomolecular Multiescala en el Instituto de Tecnología de Karlsruhe también destaca una "perspectiva social" de este avance que entra en juego. Por ejemplo, además de muchos grupos de investigación científica y de la empresa filial de Google, DeepMind, participaron este año en CASP14 también Microsoft y la empresa tecnológica china Tencent.

Schug pide que se considere: "¿Deseamos, como sociedad, que las grandes empresas internacionales de tecnología impulsen la investigación sobre inteligencia artificial de manera tan significativa, o queremos mantener una competencia independiente en la tecnología clave de inteligencia artificial en la investigación pública en las universidades e instituciones de investigación?".

¿Deseamos, como sociedad, que las grandes empresas internacionales de tecnología impulsen la investigación sobre inteligencia artificial de manera tan significativa? Alexander Schug

Ahora bien, DeepMind ha anunciado que pronto publicará un documento sobre el método y desea mediante el modelo predictivo posibilitar el análisis acelerado de la estructura de las proteínas para todos aquellos "investigadores con interés legítimo". Sin embargo, algunos científicos notan que el documento sobre el método CASP13 de hace 2 años se publicó solo recientemente, y que ahora está desactualizado, ya que los científicos de DeepMind han modificado completamente su red neuronal.

A pesar de todo, hay gran alegría y entusiasmo por el éxito en la comunidad científica. "No creía que aún vería cómo se resuelve el problema del plegamiento de proteínas", citó Nature a Janet Thornton, Ph. D., bióloga estructural del Laboratorio Europeo de Biología Molecular-Instituto Europeo de Bioinformática en Hinxton, Reino Unido.

Para más contenido siga a Medscape en Facebook, Twitter, Instagram y YouTube.

Comentario

3090D553-9492-4563-8681-AD288FA52ACE
Los comentarios están sujetos a moderación. Por favor, consulte los Términos de Uso del foro

procesando....