El valor de los análisis genómicos
La herencia genética es responsable del 30% de los resultados de salud individuales, pero no suele usarse como guía para la prevención de enfermedades y la atención. Cada persona tiene entre 4 y 5 millones de variantes genéticas, cada una con una influencia variable en los rasgos relacionados con nuestra salud. Durante estos últimos años, se redujo drásticamente el costo de secuenciar un genoma y los datos de secuenciación muestran su potencial para uso ubicuo. Sin embargo, la posibilidad de leer la secuencia con precisión y de interpretarla significativamente sigue siendo un obstáculo para la adopción generalizada.
Mejorar la precisión de los análisis genómicos
Secuenciar el genoma nos permite identificar variantes en el ADN de una persona que indiquen trastornos genéticos, como un riesgo elevado de cáncer de mama.
Genomas de alta precisión con redes neuronales profundas
A pesar de los avances rápidos en las tecnologías de secuenciación, continúa siendo un desafío llamar correctamente variantes genéticas presentes en un genoma individual entre miles de millones de lecturas de secuencia breves y con errores. Como se indica en una publicación de Nature Biotechnology, DeepVariant, es un llamador de variantes de código abierto que utiliza una red neuronal profunda para llamar variantes genéticas a partir de datos de secuenciación de ADN de última generación, mejora la precisión de la identificación de ubicaciones de variantes, y reduce el porcentaje de error en más de un 50%. Más información
Ganador del PrecisionFDA V2 Truth Challenge
DeepVariant ganó premios por su precisión general en 3 de 4 categorías de instrumentos en el PrecisionFDA V2 Truth Challenge. En comparación con los modelos de vanguardia anteriores, DeepVariant v1.0 reduce considerablemente los errores por tipos de datos de secuenciación ampliamente utilizados, como Illumina y Pacific Biosciences. Leer el artículo
Identificación de variantes que causan enfermedad en pacientes con cáncer
Los investigadores querían saber si incorporar la tecnología de aprendizaje profundo automático mejoraría la detección de variantes que causan enfermedad en pacientes con cáncer. En un estudio transversal publicado en JAMA de 2,367 pacientes con melanoma y cáncer de próstata en EE.UU. y Europa, DeepVariant identificó variantes que provocan la enfermedad en un 14% más de individuos que en los métodos de última generación anteriores.
Creación de cohortes a gran escala para investigaciones de descubrimiento genético
Los grandes cohortes de individuos secuenciados son la base para el descubrimiento de nuevas asociaciones genéticas con la enfermedad. Desarrollamos prácticas recomendadas para generar cohortes que mejoren sustancialmente los métodos anteriores y que fueron adoptadas por UK Biobank en sus iniciativas de secuenciación a gran escala. Leer el artículo
Mejora de la detección de asociaciones genéticas con aprendizaje automático
Para descubrir variantes genéticas asociadas a un rasgo de interés, se necesita una gran cohorte de personas con información genética y del rasgo. Tal como se publicó en AJHG, demostramos que el uso de un modelo de aprendizaje automático para predecir rasgos relacionados con enfermedades oculares a partir de imágenes de fondos de ojos mejora la detección de variantes genéticas que influencian esos rasgos.
Nuestros socios en investigación genómica
Debido a que los datos genómicos son personales, en la mayor medida posible, usamos conjuntos de datos totalmente públicos o que están ampliamente disponibles para investigadores calificados. También nos asociamos con organizaciones de confianza que contribuyen con el desarrollo científico y tecnológico para mejorar los estándares en el análisis genómico y aumentar la utilidad de los datos de secuenciación.
El proyecto que presentó DeepVariant en PrecisionFDA Truth Challenge V2, que usaba lecturas de PacBio HiFi, logró la mayor precisión con una sola tecnología, tal como se indica en el blog de PacBio y en una retrospectiva de Nature Biotechnology. La colaboración también lanzó exitosamente DeepConsensus, que mejora el rendimiento de HiFi y la calidad de las lecturas en comparación con los métodos actuales de llamada de bases de consenso.
El Regeneron Genetics Center, una de las iniciativas de investigación sobre el genoma humano más grandes del mundo, adoptó DeepVariant y volvió a entrenar sus modelos especializados para proyectos internos y para enviar 200,000 exomas a UKBiobank.
El laboratorio de Benedict Paten de la University of California en Santa Cruz colaboró con Google en PEPPER-Deepvariant, que ganó el premio en la categoría Tecnología de nanoporos de Oxford del PrecisionFDA. El artículo también se publicó en Nature Methods.
El software Clara Parabricks Pipelines de NVIDIA proporciona un conjunto de herramientas de bioinformática aceleradas para admitir la ejecución de aplicaciones de ADN y ARN en una GPU. Su implementación de DeepVariant procesa un genoma humano completo 30x en menos de 25 minutos de fastq a vcf mediante su más reciente GPU A100.
GenapSys entrenó un modelo personalizado de DeepVariant para proporcionar un llamador de variantes de alta precisión a su nuevo instrumento de mesa de secuenciación de alta precisión y bajo costo.
ATGenomix crea un marco de trabajo de Spark que paraleliza DeepVariant de manera eficaz para su trabajo con varios socios clínicos.
DNAnexus brinda un sistema de bioinformática colaborativo específico que integra herramientas de vanguardia, como DeepVariant. Trabaja con líderes de la industria, como Google, la FDA y UK Biobank para ofrecer soluciones a la comunidad científica.
DNAstack permite a los investigadores organizar, compartir y analizar datos genómicos y biomédicos con herramientas como DeepVariant en un entorno de nube fácil de usar. Los productos de software de DNAstack usan estándares abiertos desarrollados por la Alianza Global para la Genómica y la Salud.