O valor da análise genômica
A hereditariedade genética é responsável por 30% dos resultados de saúde individuais (em inglês), mas é raramente usada para orientar a prevenção e o tratamento de doenças. Cada indivíduo carrega entre 4 e 5 milhões de variantes genéticas, cada uma com influência distinta sobre as características relacionadas a nossa saúde. O custo do sequenciamento de um genoma diminuiu drasticamente nos últimos anos, e os dados de sequenciamento demonstram um potencial para uso universal. No entanto, a capacidade de ler sequências com precisão e dar significado a elas ainda são obstáculos para a ampla adoção.
Análise genômica de maior precisão
Com o sequenciamento de genomas, é possível identificar variantes no DNA de uma pessoa que indicam doenças genéticas, como um risco elevado de câncer de mama.
Genomas de alta precisão com redes neurais profundas
Apesar dos rápidos avanços nas tecnologias de sequenciamento, ainda é desafiador fazer com precisão a chamada de variantes genéticas presentes em um genoma individual entre bilhões de leituras de sequência breves e com erros. Conforme publicado no periódico Nature Biotechnology, o DeepVariant, uma ferramenta de chamada de variantes de código aberto que usa uma rede neural profunda para fazer a chamada de variantes genéticas nos dados de sequenciamento de DNA de última geração, melhora a precisão da identificação do local da variante significativamente, reduzindo a taxa de erros em mais de 50%. Saiba mais (links em inglês)
Vencedor do PrecisionFDA V2 Truth Challenge
O DeepVariant ganhou prêmios pela melhor precisão geral em 3 das 4 categorias de instrumentos no PrecisionFDA V2 Truth Challenge. Em comparação com modelos anteriores de última geração, o DeepVariant v1.0 reduz de maneira significativa os erros para tipos de dados de sequenciamento amplamente usados, incluindo Illumina e Pacific Biosciences. Leia o artigo (links em inglês)
Identificação de variantes causadoras de doenças em pacientes com câncer
Os pesquisadores queriam entender se a incorporação da tecnologia automatizada de aprendizado profundo melhoraria a detecção das variantes causadoras de doenças em pacientes com câncer. Em um estudo transversal publicado no JAMA com 2.367 pacientes de câncer de próstata e melanoma nos EUA e na Europa, o DeepVariant encontrou variantes causadoras de doenças em 14% mais indivíduos do que os métodos anteriores de última geração.
Desenvolvimento de coortes em grande escala para a pesquisa de descoberta genética
As grandes coortes de indivíduos sequenciados são a base para a descoberta de novas associações genéticas com doenças. Desenvolvemos práticas recomendadas para a geração aprimorada de coortes em relação aos métodos anteriores, que foram adotadas pelo UK Biobank nas iniciativas de sequenciamento em grande escala. Leia o artigo (links em inglês)
Descoberta aprimorada das associações genéticas com o aprendizado de máquina
A descoberta das variantes genéticas associadas a uma característica de interesse exige uma grande coorte de indivíduos com informações genéticas e de peculiaridades. Conforme publicado no periódico AJHG (em inglês), demonstramos que usar um modelo de aprendizado de máquina para prever as características relacionadas a doenças oculares em imagens de fundo de olho melhora significativamente a descoberta das variantes genéticas que influenciam essas características.
Nossos parceiros de pesquisa genômica
Como os dados genômicos são extremamente pessoais, usamos conjuntos de dados totalmente públicos ou amplamente disponíveis para pesquisadores qualificados na medida do possível. Também colaboramos com organizações confiáveis que contribuem com o desenvolvimento científico e tecnológico para melhorar os padrões da análise genômica e aprimorar a utilidade do sequenciamento de dados.
A participação do DeepVariant no PrecisionFDA Truth Challenge V2 usando as leituras PacBio HiFi conquistou a maior precisão de uma única tecnologia. Isso apareceu no blog da PacBio e em uma retrospectiva da revista Nature Biotechnology. A colaboração também levou ao lançamento do DeepConsensus (links em inglês), que melhora a qualidade de leitura e rendimento do HiFi em comparação com os métodos basecalling de consenso.
O Regeneron Genetics Center, uma das maiores iniciativas de pesquisa do genoma humano, adotou o DeepVariant e retreinou modelos especializados para projetos internos e a entrega de 200 mil exomas para o UK Biobank (em inglês).
O laboratório do Benedict Paten na Universidade da Califórnia em Santa Cruz colaborou com o Google no PEPPER-Deepvariant, que ganhou a melhor precisão na categoria de Tecnologias Oxford Nanopore do PrecisionFDA. O artigo também foi publicado no periódico Nature Methods (links em inglês).
O software Clara Parabricks Pipelines da NVIDIA oferece um pacote de ferramentas de bioinformática aceleradas para apoiar aplicativos de DNA e RNA executados em uma GPU. Com a implementação do DeepVariant, um genoma humano inteiro é processado 30 vezes em menos de 25 minutos de fastq para vcf usando a GPU A100 mais recente.
A GenapSys treinou um modelo personalizado do DeepVariant (em inglês) para oferecer uma chamada de variante bastante exata em um novo instrumento de sequenciamento de bancada com alta precisão e baixo custo.
A ATGenomix desenvolve um framework Spark que paraleliza o DeepVariant com eficiência (em inglês) para o trabalho com diversos parceiros da saúde.
A DNAnexus oferece um sistema de bioinformática seguro, colaborativo e adaptado que integra ferramentas modernas como o DeepVariant. Ela trabalha com líderes do setor, como o Google, a FDA e o UK Biobank, na disponibilização de soluções para a comunidade científica.
A DNAstack capacita os pesquisadores para organizar, compartilhar e analisar dados genômicos e biomédicos, usando ferramentas como o DeepVariant, em um ambiente na nuvem fácil de usar. Os produtos de software da DNAstack usam padrões abertos desenvolvidos pela Aliança Global para Genômica e Saúde.