domingo, 17 de septiembre de 2023

El análisis de los 200 millones de proteínas conocidas sugiere que el ser humano tiene 13 formas tridimensionales exclusivas

 


Una nueva herramienta logra por primera vez clasificar los laberínticos ladrillos de la vida en grupos con estructuras similares.


El arquitecto estadounidense Irving Geis recibió un insólito encargo en 1961: dibujar a mano la primera estructura de una proteína desvelada gracias a los rayos X. Era la mioglobina, responsable de oxigenar los músculos y del color rojo de la carne. Es una especie de collar con 153 perlas, que se pliega formando ocho hélices enmarañadas. Geis necesitó seis meses para dibujarla, pero su esfuerzo logró despertar la fascinación mundial hacia ese invisible mundo interior. Ahora, la ciencia se ha acelerado. La empresa de inteligencia artificial DeepMind, propiedad de Google, consiguió el año pasado predecir con precisión la estructura de más de 200 millones de proteínas, casi todas las conocidas. Un bioinformático español, Iñigo Barrio, ha ayudado a organizar ese caos, agrupándolas por formas similares. Su trabajo revela datos sorprendentes. Los seres humanos poseen 13 estructuras exclusivas, que no aparecen en ningún otro ser vivo. Una bacteria ubicua en el suelo, la Acidobacteria bacterium, tiene casi 1.900 formas únicas.

El ADN de un ser vivo es un libro de recetas para fabricar proteínas, los ladrillos básicos de la vida. El ser humano tiene unos 30.000 tipos diferentes, que se ocupan de funciones esenciales, como generar energía, dar soporte y defender al organismo frente a los virus. Son moléculas grandes y complejas, algunas de ellas con formas sencillas —esferas, cilindros, anillos, estrellas, espirales e incluso esvásticas— y otras con estructuras inimaginables, como la hemoglobina, que transporta el oxígeno por la sangre desde los pulmones al resto del cuerpo. Tiene miles de átomos de carbono, hidrógeno, nitrógeno, oxígeno, azufre y hierro. Su fórmula es C₂₉₅₂H₄₆₆₄N₈₁₂O₈₃₂S₈Fe₄.

Barrio, nacido en Pamplona hace 36 años, se ha enfrentado a ese maremágnum en el Instituto Europeo de Bioinformática, en Hinxton (Reino Unido). El investigador y sus colegas han puesto a punto un nuevo algoritmo, denominado Foldseek Cluster (buscador de grupos de plegamientos), capaz de identificar patrones similares en ese vastísimo desorden. Barrio empleó la herramienta con la base de datos AlphaFold, una jungla de 215 millones de proteínas. El equipo ha identificado 2,3 millones de tipos de estructuras, más de 700.000 de ellos desconocidos. Entender la estructura de una proteína es fundamental para comprender su función y, potencialmente, para diseñar nuevos fármacos, como explican los investigadores en su estudio, que se publica este miércoles en la revista Nature, ariete de la mejor ciencia mundial.

“Casi siempre hay una relación entre la estructura de una proteína y su función. Casi siempre. En biología nunca se debe decir siempre”, señala Barrio, recién incorporado al Instituto Wellcome Sanger, también en Hinxton, muy cerca de Cambridge. Su trabajo ha logrado vincular proteínas de función conocida con otras inexploradas. “Si las proteínas A y B tienen una estructura muy parecida, puedes inferir que tendrán una función similar”, explica el investigador. Su labor recuerda a la de un arqueólogo que extrae misteriosas herramientas prehistóricas del subsuelo. “Si descubres algo con forma de pico, puedes intuir que eso sirve para picar, pero hay excepciones. Un tenedor y un peine se parecen mucho, pero no se utilizan para lo mismo”, advierte.

La base de datos AlphaFold incluye las predicciones elaboradas por DeepMind y el Instituto Europeo de Bioinformática, perteneciente al Laboratorio Europeo de Biología Molecular, un organismo con más de 1.800 trabajadores en sedes en España, Francia, Alemania, Italia y Reino Unido. El análisis de los 215 millones de proteínas sugiere que la mayor parte de las estructuras aparecieron muy pronto en la evolución de los seres vivos, en el ancestro común de animales y plantas o incluso antes. Apenas un 4% de las configuraciones parecen ser específicas de una sola especie.

“Los humanos tenemos 13 grupos de proteínas con estructuras únicas”, recalca Barrio. La cifra contrasta con las de los cinco organismos que presentan más formas tridimensionales singulares: las bacterias Acidobacteria bacteriumEscherichia coli y Chloroflexi bacterium, la araña asiática Araneus ventricosus y la sepia faraónica, con entre 1.400 y 1.900 estructuras exclusivas cada una. “Tendemos a ver la evolución como un proceso lineal, pero es más bien un árbol. Nosotros estamos al final de una rama, pero las bacterias han seguido evolucionando en sus propias ramas. Hay bacterias más nuevas que nosotros”, expone el bioinformático. “Además, desarrollar una estructura nueva para un nuevo problema no siempre es la mejor forma de evolucionar. Muchas veces se reciclan estructuras. Hay proteínas de la especie humana que posiblemente tienen una función distinta a la que tuvieron en nuestros ancestros”, argumenta Barrio.

La empresa británica DeepMind presume de que su sistema de inteligencia artificial alcanza una precisión del 95%. Sin embargo, nueve de las 13 estructuras exclusivamente humanas están basadas en predicciones con una incertidumbre alta, posiblemente porque son conformaciones especialmente desorganizadas, según Barrio. Las cuatro restantes son la VPS53, implicada en el transporte dentro de las células; la U54, una proteína de un virus del herpes integrada en el genoma humano; las anexinas, que intervienen en el tráfico a través de las membranas celulares; y una cuarta proteína poco estudiada que podría ser más bien un simple fragmento. Los 30.000 tipos de proteínas humanas se agrupan en unas 9.000 estructuras.

Otro de los autores principales del estudio, el bioinformático portugués Pedro Beltrao, destaca el hallazgo de proteínas humanas implicadas en el sistema inmunitario y muy parecidas a otras proteínas bacterianas de función desconocida. “Esto sugiere que las proteínas implicadas en el sistema inmunitario podrían tener un origen evolutivo antiguo, que compartimos con especies de bacterias. Si es cierto, esto podría transformar lo que sabemos sobre la inmunidad”, ha declarado Beltrao, de la Escuela Politécnica Federal de Zúrich (Suiza), en un comunicado.

La bióloga Júlia Domingo considera “muy necesario” el nuevo trabajo, en el que no ha participado. “Estamos entrando en una nueva era de datos masivos, y necesitamos nuevas herramientas para procesarlos, analizarlos y utilizarlos a gran velocidad”, reflexiona. Domingo desarrolló, junto a otros colegas del Centro de Regulación Genómica (CRG), en Barcelona, un método para identificar una especie de botones ocultos que cambian la función de las proteínas. Domingo advierte de que la estructura no es suficiente para averiguar el cometido. “Intervienen otras capas de funcionalidad, como las energías y la afinidad por otras proteínas”, apunta.

El arquitecto Irving Geis tardó seis meses en dibujar la mioglobina en 1961. El químico británico que le facilitó los datos, John Kendrew, ganó el Nobel de Química de 1962 por leer aquella primera estructura con rayos X. Las posibilidades que se abren ahora con la inteligencia artificial y los nuevos algoritmos son inimaginables, según explica Iñigo Barrio. “Con los métodos anteriores, habríamos necesitado 10 años para hacer este trabajo. Hemos tardado cinco días”, afirma.

Font, article de Manuel Ansede per a "El País"

No hay comentarios:

Publicar un comentario