El problema del plegamiento y la forma de las proteínas viene siendo un desafío para la ciencia desde hace medio siglo; sin embargo, en la actualidad dos programas de inteligencia artificial están logrando resolver tal enigma.
Se puede predecir la forma de las proteínas con el uso de la inteligencia artificial
La IA está permitiendo superar lo que parecía infranqueable: la predicción de la compleja forma de las proteínas; la forma tridimensional que presenta una cadena de aminoácidos cuando pasa a ser una proteína funcional. El aprendizaje estadístico más profundo y las redes neuronales están permitiendo el inicio de una nueva era para el campo de la investigación en la medicina y la biología. Por lo tanto, este hallazgo fue elegido por la revista “Science” como el avance científico más relevante del año 2021.
Al respecto, Holden Thorp, redactor de la revista, explicó en el editorial junto al artículo, que se trata de un hito en 2 aspectos. El primero resuelve un problema científico que lleva casi cincuenta años en la lista de tareas por concluir, parecido a lo que ocurrió con el “Último Teorema de Fermat”, en el que los científicos no han dejado de investigar. Y, en segundo lugar, se trata de una técnica que lo cambia todo y que, de igual forma que CRISPR o la criomicroscopía electrónica, impulsará increíblemente los descubrimientos científicos.
Una clave de la biología molecular se encuentra en la forma de las proteínas
La arquitectura o forma de las proteínas, es una de las claves de la biología molecular; las cadenas de aminoácidos que construyen las proteínas giran y se van plegando para tomar todo tipo de formas tridimensionales. La actividad de las proteínas viene determinada justamente por dicha estructura, funcionando como una llave biológica creada para abrir una cerradura única, partiendo de enzimas determinantes para el metabolismo hasta los anticuerpos que enfrentan las infecciones en el organismo.
Hoy en día determinar el exacto contenido químico de una enzima es bastante sencillo; sin embargo, poder identificar su estructura tridimensional implicaría muchos años de investigación científica. Pero, desde este momento los expertos cuentan con el AlphaFold 2 y RoseTTA-Fold; estos son dos programas que facilitan el trabajo enormemente al anticipar la forma de las proteínas.
Los programas se fundamentan en la utilización de redes neuronales, que es un sistema matemático para perfeccionar el aprendizaje automático a través del análisis de enormes conjuntos de datos, y anticipando las incógnitas. Los creadores partieron desde una base de 170.000 estructuras proteicas conocidas; las cuales se encontraban disponibles en la base del Protein Data Bank, para utilizarlas en el programa.
Excelentes resultados en CASP
Por su parte, AlphaFold 2 se probó por primera vez en el mes de noviembre del año 2020, durante el concurso CASP, “Evaluación crítica de las técnicas para predecir la estructura proteica”; el cual es un experimento bienal destinado a determinar los avances dentro del modelado de la estructura proteica. Allí el programa obtuvo excelentes resultados en la predicción de las formas de las proteínas.
Luego de siete meses y medio, en el mes de julio de este año, DeepMind (empresa creadora de AlphaFold) publicó en la revista “Nature” par de artículos de investigación acerca de su método y de la más grande base de datos disponible, por encima de 360.000 proteínas; también publicó en esa ocasión el código fuente del software.
Recursos y conocimientos técnicos llevaron al éxito
El estudiante de doctorado de la Universidad de Oxford, Carlos Outeiral; señaló en su web Blopig que, cuando iba a mitad del artículo y luego de echarle un vistazo a la información suplementaria, notó que el ingrediente secreto fue el asombroso rendimiento de la red que resultó de la magnífica ingeniería de DeepMind.
Y que, además, “Las ideas del modelo, por mucha inteligencia que tenga, atienden estrictamente a lo que ya fue revelado por sus creadores en CASP14 el pasado noviembre. Contar con los recursos de computación, y tener conocimientos técnicos de avanzada, fue lo que llevó a esta red neuronal a alcanzar tal éxito”; escribió Outeiral en su análisis de los secretos de AlphaFold.
La comprensión del cómo toman su forma las proteínas ha representado todo un reto para los científicos. Una investigación del Centro Nacional de Supercomputación de la ciudad de Barcelona en España; señala que la referencia para cobertura de las estructuras de las proteínas en el organismo humano aumenta del 48 % hasta el 76 % cuando es utilizado el programa de AlphaFold.
Exactamente el mismo día en que DeepMind revelaba los secretos de AlphaFold 2, la publicación “Science” mostraba otro artículo donde se describía un algoritmo alternativo; se trataba de RoseTTA-Fold, que fue desarrollado en pocos meses con las mismas ideas.
Al respecto Holden Thorp escribió que, “Tanto AlphaFold 2 como RoseTTA-Fold se encuentran disponibles de manera gratuita para los científicos e investigadores. Y ya han empezado a obtener estructuras proteicas partiendo de estos algoritmos sin la necesidad de cristalizarlas o tener que acceder a herramientas de crio-EM”.