DeepMind y el Instituto Europeo de Bioinformática (EMBL-EBI) de EMBL han realizado predicciones impulsadas por IA de las estructuras 3D de casi todas las proteínas indexadas conocidas por la ciencia. catalogar Disponible de forma gratuita y pública para la comunidad científica, a través de la base de datos de estructuras de proteínas AlphaFold.
Las dos organizaciones esperan que la base de datos ampliada continúe aumentando nuestra comprensión de la biología y ayude a innumerables científicos en su trabajo mientras se esfuerzan por enfrentar los desafíos globales.
Este importante logro indica que la base de datos se ha ampliado casi 200 veces. Ha pasado de casi un millón de estructuras de proteínas a más de 200 millones, y ahora cubre casi todos los organismos de la Tierra cuyo genoma ha sido secuenciado. Las estructuras pronosticadas para una amplia gama de especies, incluidas plantas, bacterias, animales y otros organismos, ahora se incluyen en la base de datos ampliada. Esto abre nuevas vías para la investigación en las ciencias de la vida que tendrán un impacto en los desafíos globales, incluida la sostenibilidad, la inseguridad alimentaria y las enfermedades desatendidas.
Ahora, la estructura predicha estará prácticamente disponible para todas las cadenas de proteínas en UniProt Base de datos de proteínas. Este lanzamiento también abrirá nuevas vías de investigación, incluido el apoyo a la bioinformática y el trabajo computacional al permitir que los científicos identifiquen patrones y tendencias en la base de datos.
“AlphaFold ahora ofrece una vista en 3D del universo de las proteínas”, dijo Edith Heard, directora general de EMBL. “La popularidad y el crecimiento de la base de datos AlphaFold es un testimonio de la exitosa colaboración entre DeepMind y EMBL. Nos muestra un vistazo al poder de la ciencia interdisciplinaria”.
“Estamos asombrados por la velocidad a la que AlphaFold ya se ha convertido en una herramienta esencial para cientos de miles de científicos en laboratorios y universidades de todo el mundo”, dijo Demis Hassabis, fundador y director ejecutivo de DeepMind. “Desde la lucha contra las enfermedades hasta la contaminación plástica, AlphaFold ya ha tenido un impacto increíble en algunos de los mayores desafíos globales que enfrentamos. Esperamos que esta base de datos ampliada ayude a innumerables científicos en su importante trabajo y abra fronteras completamente nuevas de descubrimiento científico”.
Una herramienta esencial para los científicos.
DeepMind y EMBL-EBI Lanzado Base de datos AlphaFold en julio de 2021. En ese momento contenía más de 350 000 predicciones de estructuras de proteínas, incluida la proteína humana completa. Las actualizaciones posteriores vieron la adición de UniProtKB/SwissProt y 27 nuevas proteínas, 17 de las cuales representan enfermedades tropicales desatendidas persistentes. destruir la vida de más de mil millones de personas en todo el mundo.
Más de 1000 artículos científicos han citado la base de datos y más de 500 000 investigadores de más de 190 países obtuvieron acceso a la base de datos AlphaFold para ver más de dos millones de estructuras en poco más de un año.
El equipo también ha visto a los investigadores aprovechar AlphaFold para crear y adaptar herramientas como Foldsec Y el dalí Eso permite a los usuarios buscar entradas similares a una proteína específica. Otros han adoptado las ideas básicas de aprendizaje automático detrás de AlphaFold, para formar la columna vertebral de una lista de nuevos algoritmos en este espacio, o aplicarlos a áreas como Predicción de la estructura del ARN o Desarrollar nuevos modelos para el diseño de proteínas.
El impacto y el futuro de AlphaFold y la base de datos
AlphaFold también ha mostrado un impacto en áreas como la mejora de nuestra capacidad para Luchando contra la contaminación plásticaobtener información enfermedad de Parkinsony más salud de las abejasComprensión ¿Cómo se forma el hielo?para tratar enfermedades desatendidas Como la enfermedad de Chagas, la leishmaniasis y la exploración evolución humana.
“Lanzamos AlphaFold con la esperanza de que otros equipos pudieran aprender y aprovechar el progreso que hicimos, y fue emocionante ver que sucedió tan rápido. Varias otras organizaciones de investigación de IA ahora están ingresando a este campo y aprovechando el progreso realizado por AlphaFold para lograr aún más avances. Esta es verdaderamente una nueva era en biología estructural, y los métodos basados en IA conducirán a avances asombrosos, dijo John Jumper, científico investigador y líder de AlphaFold en DeepMind.
“AlphaFold ha enviado ondas a toda la comunidad de biología molecular. Solo en el último año, ha habido más de mil artículos científicos sobre una amplia gama de temas de investigación utilizando estructuras AlphaFold; Samir Vilankar, líder del equipo en el banco de datos de proteínas EMBL-EBI en Europa, dijo: “Nunca antes había visto algo así”. Y esto es solo el efecto de un millón de predicciones; imagine el efecto de tener más de 200 millones de predicciones de estructuras de proteínas accesibles al público en la base de datos AlphaFold”.
DeepMind y EMBL-EBI continuarán actualizando la base de datos periódicamente, con el objetivo de mejorar las características y la funcionalidad en respuesta a los comentarios de los usuarios. El acceso a las estructuras permanecerá completamente abierto, bajo una licencia CC-BY 4.0, y las descargas masivas estarán disponibles a través de Conjuntos de datos públicos de Google Cloud.
“Web friki. Wannabe pensador. Lector. Evangelista de viajes independiente. Aficionado a la cultura pop. Erudito musical certificado”.