Publicidad
Publicidad

Un nuevo algoritmo revela sistemas CRISPR-Cas raros y desconocidos hasta ahora

Se han descubierto 188 módulos genéticos CRISPR raros y desconocidos hasta ahora, incluido un novedoso sistema CRISPR-Cas de tipo VII.

24/11/2023

Utilizando un nuevo algoritmo denominado FLSHclust (´flash clust´), los investigadores han descubierto 188 módulos genéticos CRISPR raros y desconocidos hasta ahora, incluido un novedoso sistema CRISPR-Cas de tipo VII, entre miles de millones de secuencias de proteínas, según publican en la revista ´Science´. El método y sus resultados ofrecen nuevas oportunidades ...

Utilizando un nuevo algoritmo denominado FLSHclust (´flash clust´), los investigadores han descubierto 188 módulos genéticos CRISPR raros y desconocidos hasta ahora, incluido un novedoso sistema CRISPR-Cas de tipo VII, entre miles de millones de secuencias de proteínas, según publican en la revista ´Science´.

El método y sus resultados ofrecen nuevas oportunidades para aprovechar los sistemas CRISPR y comprender la enorme diversidad funcional de las proteínas microbianas, aseguran.

Los sistemas CRISPR se han utilizado para desarrollar un conjunto cada vez mayor de nuevos enfoques biomoleculares, como la edición del genoma mediada por CRISPR/Cas. El descubrimiento de sistemas CRISPR desconocidos hasta ahora puede conducir a un mayor desarrollo de estas biotecnologías, incluidas terapias genómicas más seguras y eficaces.

El conjunto de herramientas CRISPR se ha ampliado mediante búsquedas computacionales en bases de datos de secuencias de proteínas. Sin embargo, los enfoques algorítmicos utilizados habitualmente se han vuelto poco prácticos para extraer conjuntos de datos de crecimiento exponencial que contienen miles de millones de proteínas.

Para hacer frente a esta limitación, Han Altae-Tran y sus colegas desarrollaron ´FLSHclust´ (fast locality-sensitive hashing-based clustering), un algoritmo para agrupar proteínas por similitud de secuencia que, a diferencia de los métodos disponibles en la actualidad, puede analizar con rapidez y eficacia enormes bases de datos de secuencias de proteínas.

Para evaluar su método, el investigador del Instituto Tecnológico de Massachusetts (MIT), Altae-Tran, y sus colegas utilizaron ´FLSHclust´ para buscar sistemas CRISPR poco comunes en una base de datos metagenómica de 8,8 terrabase pair que contenía 8.000 millones de proteínas y 10,2 millones de CRISPR arrays.

El análisis descubrió 188 genes asociados a CRISPR desconocidos hasta entonces e identificaron y caracterizaron una nueva clase de sistema CRISPR que contiene Cas-14, el tipo VII, que actúa sobre el ARN.

Según los resultados, los sistemas recién identificados eran poco frecuentes, y muchos sólo abarcaban un único clúster de los casi 130.000 clústeres vinculados a CRISPR revelados por FLSHclust.

"El descubrimiento de genes Cas y sistemas CRISPR previamente desconocidos amplía sustancialmente la diversidad CRISPR conocida, enfatizando la versatilidad funcional de CRISPR, por la que a menudo se reclutan proteínas y dominios previamente no descubiertos, sustituyendo componentes preexistentes o confiriendo funciones recientemente identificadas al andamiaje preexistente de proteínas Cas", escriben los investigadores.

"En conjunto, los resultados del trabajo revelan una flexibilidad organizativa y funcional sin precedentes y la modularidad de los sistemas CRISPR, pero también demuestra que la mayoría de las variantes son raras y sólo se encuentran en bacterias y arqueas relativamente inusuales", concluye.

Publicidad
Publicidad