El valor del análisis genómico
La herencia genética es responsable del 30 % del desarrollo de la salud de cada persona, pero esta información apenas se usa en la prevención y el tratamiento de enfermedades. Cada persona tiene de 4 a 5 millones de variantes genéticas, y cada una influye de manera diferente en los rasgos relacionados con nuestra salud. El coste de secuenciar un genoma se ha abaratado considerablemente en los últimos años, y los datos de una secuencia podrían usarse en multitud de ámbitos. No obstante, la capacidad de leer una secuencia con precisión e interpretarla correctamente sigue siendo un obstáculo para que el método del análisis genómico se adopte de manera generalizada.
Mejoramos la precisión del análisis genómico
La secuenciación de genomas nos permite identificar las variantes del ADN de una persona que indican trastornos genéticos, como un riesgo elevado de cáncer de mama.
Genomas de alta precisión con redes neuronales profundas
A pesar de que las tecnologías de secuenciación están avanzando a pasos agigantados, identificar con precisión las variantes genéticas presentes en el genoma de una persona entre miles de millones de lecturas de secuencias cortas y erróneas sigue siendo un reto. Como se publicó en Nature Biotechnology, DeepVariant, un detector de variantes de código abierto que utiliza una red neuronal profunda para identificar variantes genéticas a partir de datos de secuenciación de ADN de nueva generación, mejora considerablemente la precisión a la hora de identificar las ubicaciones de las variantes, lo que reduce la tasa de error en más del 50 %. Más información
Ganador del PrecisionFDA V2 Truth Challenge
DeepVariant recibió galardones a la mejor precisión general en 3 de las 4 categorías de instrumentos en el PrecisionFDA V2 Truth Challenge. En comparación con modelos de última generación anteriores, DeepVariant 1.0 reduce de forma significativa los errores de varios tipos de datos de secuenciación muy utilizados, incluyendo los de Illumina y Pacific Biosciences. Lee el artículo.
Identificamos las variantes responsables de causar la enfermendad en pacientes con cánce
Los investigadores querían averiguar si la tecnología automática de aprendizaje profundo mejoraría la detección de variantes responsables de causar enfermedades en pacientes con cáncer. En un estudio transversal publicado en JAMA y realizado con 2367 pacientes con cáncer de próstata y melanoma en EE. UU. y en Europa, DeepVariant detectó variantes patogénicas en un 14 % más de individuos que otros métodos anteriores de última generación.
Creamos cohortes a gran escala para la investigación en detección de asociaciones genéticas
Las grandes cohortes de individuos sometidos a secuenciación genética son la base para detectar nuevas asociaciones genéticas con enfermedades. Hemos desarrollado prácticas recomendadas para generar cohortes que mejoran considerablemente otros métodos anteriores y que UK Biobank ha adoptado para sus proyectos de secuenciación a gran escala. Leer el artículo
Mejoramos la identificación de asociaciones genéticas mediante aprendizaje automático
Para descubrir variantes genéticas asociadas a un rasgo de interés, se necesita una numerosa cohorte de individuos con información tanto genética como de rasgos. Como se publicó en AJHG, demostramos que el uso de un modelo de aprendizaje automático para predecir rasgos relacionados con enfermedades oculares a partir de imágenes del fondo del ojo mejora considerablemente la identificación de variantes genéticas que influyen en esos rasgos.
Nuestros partners de investigación genómica
Dado que los datos genómicos son muy personales, utilizamos, en la medida de lo posible, conjuntos de datos que sean totalmente públicos o que estén ampliamente disponibles para investigadores cualificados. También colaboramos con organizaciones de confianza que aportan avances en ciencia y tecnología para mejorar la calidad de los análisis genómicos y conseguir que los datos de secuenciación sean más útiles.
El proyecto de DeepVariant presentado en el concurso precisionFDA Truth Challenge V2, que utilizaba lecturas de alta fidelidad de PacBio, logró la máxima precisión con una sola tecnología, tal y como se ha publicado en el blog de PacBio y en una retrospectiva de Nature Biotechnology. La colaboración también ha permitido lanzar con éxito DeepConsensus, que mejora la calidad de las lecturas y el rendimiento de alta fidelidad con respecto a los métodos actuales de asignación de bases por consenso.
El Regeneron Genetics Center, una de las iniciativas de investigación sobre el genoma humano más importantes del mundo, ha adoptado DeepVariant y ha reentrenado modelos especializados para proyectos internos y para proporcionar 200.000 exomas a UK Biobank.
El laboratorio de Benedict Paten, situado en la universidad UC Santa Cruz, ha colaborado con Google en el proyecto PEPPER-Deepvariant, que ganó el premio a la precisión de la categoría Oxford Nanopore Technologies de PrecisionFDA. Además, este artículo se publicó en Nature Methods.
El software Clara Parabricks Pipelines de NVIDIA proporciona un paquete de herramientas bioinformáticas aceleradas para ofrecer soporte a aplicaciones de ADN y ARN que se ejecutan en una GPU. Su implementación de DeepVariant procesa el genoma humano completo con una cobertura de 30x en menos de 25 minutos, de fastq a vcf, mediante su modelo de GPU más reciente: el A100.
GenapSys entrenó un modelo personalizado de DeepVariant para proporcionar un detector de variantes de alta precisión a su nuevo instrumento de secuenciación de sobremesa de alta precisión y bajo coste.
ATGenomix crea un framework de Spark que carga DeepVariant en paralelo de forma eficiente para trabajar con varios partners del sector sanitario.
DNAnexus ofrece un sistema bioinformático seguro, colaborativo y diseñado a medida que integra herramientas punteras como DeepVariant. Colabora con referentes del sector, como Google, la FDA y UK Biobank, para aportar soluciones a la comunidad científica.
Con DNAstack, los investigadores pueden organizar, compartir y analizar datos genómicos y biomédicos con herramientas como DeepVariant en un entorno en la nube fácil de usar. Los productos de software de DNAstack utilizan estándares abiertos desarrollados por la Global Alliance for Genomics & Health.