El software de estructura de proteínas de código abierto ya está dando sus frutos

08:49 15/11/2021 | Lượt xem

Imagen de diferentes categorías de complejos proteicos.

Humphreys e. Alabama.

Ahora es relativamente trivial determinar el orden de los aminoácidos en una proteína. Sin embargo, descubrir cómo este orden se traduce en una estructura tridimensional complicada que realiza una función específica es extremadamente desafiante. Pero después de décadas de lento progreso, el grupo DeepMind AI de Google ha anunciado que ha hecho grandes avances para resolver el problema. En julio, el sistema, llamado AlphaFold, se convirtió en código abierto. Al mismo tiempo, un grupo de investigadores académicos lanzó su propio software de plegado de proteínas, llamado RoseTTAFold, construido en parte utilizando ideas derivadas del trabajo de DeepMind.

¿Qué tan efectivas son estas herramientas? Aunque no son tan buenos como sugieren algunas de las estadísticas, está claro que son mucho mejores que cualquier cosa que hayamos tenido. Entonces, ¿cómo los usarán los científicos?

Esta semana, una importante colaboración de investigación desató el software sobre un problema relacionado: cómo estas estructuras tridimensionales individuales se unen para formar los grandes complejos multiproteicos que realizan algunas de las funciones más importantes de la biología.

más allá de 3D

Muchas proteínas individuales funcionan bien por sí solas, pero algunos aspectos de la biología requieren la coordinación cuidadosa de varios cambios químicos que se llevan a cabo como una serie de pasos secuenciales ordenados. Y para estos procesos, a menudo es más fácil que las proteínas que necesitan coordinarse formen parte de un solo complejo. Por ejemplo, el complejo que hace copias de nuestros cromosomas generalmente consta de más de una docena de proteínas. El fotosistema I, que forma parte del proceso fotosintético en las plantas, tiene una escala similar. El ribosoma, que traduce la información de los ARN mensajeros en la secuencia de aminoácidos de las proteínas, puede requerir más de 75 proteínas en algunas especies.

Poner estos y otros complejos juntos requiere el plegado adecuado de sus proteínas componentes en las formas tridimensionales correctas, el problema para el que AlphaFold y RoseTTAFold fueron diseñados para resolver. Sin embargo, una vez que se realiza el plegamiento, las proteínas tienen que interactuar entre sí, adoptando la orientación correcta y estabilizando estas interacciones a través de contactos entre sus aminoácidos (lo que significa que una carga positiva en una proteína se correspondería con una carga negativa en su socio, etc.).

Hasta cierto punto, la información obtenida de AlphaFold y RoseTTAFold debería ser útil para esta aplicación, porque resolver las estructuras de proteínas individuales debería decirnos algo sobre las superficies que pueden interactuar. Pero los métodos utilizados por los algoritmos resultaron ser específicamente útiles para ensamblar complejos multiproteicos.

RoseTTAFold, por ejemplo, resuelve las estructuras de proteínas en parte cortando su secuencia de aminoácidos en trozos más pequeños y resolviendo cada uno antes de ensamblarlos en una proteína más completa. Pero los creadores del sistema encontraron que si a RoseTTAFold se le dieran piezas de dos proteínas interactuantes diferentes, estaría feliz de ensamblar ambas proteínas de una manera que también capturara sus interacciones, incluida la orientación y el espaciado correctos.

La evolución da y toma

La otra característica útil es que ambos algoritmos dependen en gran medida de la evolución para realizar sus predicciones estructurales. Un paso clave para cada uno es identificar muchas proteínas que están relacionadas por descendencia común y probablemente comparten una estructura común. Estas proteínas proporcionan restricciones importantes sobre las estructuras que son posibles dentro de una familia particular de secuencias relacionadas. Ciertos aminoácidos interfieren con la formación de la estructura helicoidal, por ejemplo.

Los complejos de proteínas pueden enfrentar restricciones similares, pero existe una diferencia importante. Digamos que la proteína A tiene un aminoácido cargado positivamente que interactúa con un aminoácido negativo en la proteína B. Si una mutación cambia a A de modo que ahora tiene una carga negativa, la interacción entre los dos se debilitaría mucho. Pero la proteína B podría compensar este problema si una mutación cambia su carga negativa por una positiva.

El seguimiento de los pares de proteínas a medida que cambian a lo largo de la evolución puede proporcionar una indicación de si los cambios en una se compensan con los cambios en la otra. La ausencia de este tipo de cambio puede decirnos que es poco probable que las proteínas interactúen.

Para mantener el análisis computacionalmente tratable, los investigadores simplemente emparejaron cada proteína con todo lo demás en el genoma. Descubrieron interacciones de pareja y luego usaron estas interacciones para construir complejos más grandes. Sin embargo, aun conociendo los pares potenciales de interacciones, permanecieron complejos que se limitaban a un pequeño número de proteínas; e intentar construir algo tan grande como la ADN polimerasa habría abrumado el hardware computacional al que los investigadores tenían acceso.

Related Posts

Magic Eraser vuelve a Google Pixel 6

Después de una breve pausa accidental, Google Photos restaura su recurso más interesante El desarrollo de software es un negocio precario, como probablemente Google sepa mejor que nadie. Uno de los últimos errores de...

lên đầu trang