Metodología de análisis

Metodología de análisis

Descubre cómo analizamos los datos  genómicos

Software propio

Llevamos a cabo el procesamiento de los datos genómicos resultantes de la secuenciación masiva (NGS) utilizando nuestro software Genome One, el cual está certificado con la marca CE/IVD de productos sanitarios para diagnóstico in vitro de acuerdo con la legislación vigente (Número de Licencia: 7157-PS).

Podemos realizar el análisis bioinformático a partir de archivos FASTQ, BAM y VCF provenientes de tecnología Illumina y/o MGI.

Etapas del análisis bioinformático

11
Control de calidad de FASTQ

Los archivos FASTQ crudos son evaluados usando los controles de calidad de FastQC y empleamos Trimmomatic o FASTP para la eliminación de bases, adaptadores y otras secuencias de baja calidad.

12
Alineamiento

Cada FASTQ se alinea frente a la versión correspondiente del genoma humano de referencia.

13
Control de calidad del alineamiento

Los archivos BAM generados son evaluados individualmente y se lleva a cabo la eliminación de duplicados ópticos y de PCR.

14
Identificación y anotación de SNVs e InDels

SNVs e indels son identificadas mediante la combinación diferentes algoritmos de llamada a variantes, entre ellos uno propio desarrollado por Dreamgenics.

Las variantes son anotadas con diferente información relevante, procedente de múltiples bases de datos:

  • Funcionales: RefSeq, Pfam, etc.
  • Poblacionales: dbSNP, 1000 Genomes, ESP6500, ExAC, gnomAD, etc.
  • De predicción de impacto funcional in silico: dbNSFP, dbscSNV, etc.

Para generar el conjunto de SNVs e indels específico de cada muestra, se seleccionan aquellas que cumplen unos criterios de calidad dependientes del tipo de análisis, y basados en: predicción de efecto en proteína, frecuencia poblacional, cobertura total en la posición, frecuencia de la variante en la muestra, ausencia de anotaciones indicativas de una distribución/calidad de las lecturas de tipo artefactual y distancia máxima a las regiones del bed del diseño.

Identificación de CNVs

Las potenciales CNVs se analizan mediante una adaptación del algoritmo exome2cnv*. El análisis de potenciales CNVs puede llevarse a cabo en aquellos casos en los que la naturaleza y calidad de las muestras lo permita y además se disponga de un set de muestras control adecuado. Debe tratarse de muestras del mismo tipo de tejido y procesadas de igual forma que las muestras de estudio (misma metodología de extracción del ADN, generación de librería, secuenciación, etc).

*Valdés-Mas y col. (2012) PLoS One 7:e51422.

¿Estás interesado en nuestro
servicio de análisis de datos NGS?

Contacta con nosotros y te ayudaremos

Metodología de análisis

Descubre cómo analizamos los datos genómicos

Software propio

Llevamos a cabo el procesamiento de los datos genómicos resultantes de la secuenciación masiva (NGS) utilizando nuestro software Genome One, el cual está certificado con la marca CE/IVD de productos sanitarios para diagnóstico in vitro de acuerdo con la legislación vigente (Número de Licencia: 7157-PS).

Podemos realizar el análisis bioinformático a partir de archivos FASTQ, BAM y VCF provenientes de tecnología Illumina y/o MGI.

Etapas del análisis bioinformático

11
Control de calidad de FASTQ

Los archivos FASTQ crudos son evaluados usando los controles de calidad de FastQC y empleamos Trimmomatic o FASTP para la eliminación de bases, adaptadores y otras secuencias de baja calidad.

12
Alineamiento

Cada FASTQ se alinea frente a la versión correspondiente del genoma humano de referencia.

13
Control de calidad del alineamiento

Los archivos BAM generados son evaluados individualmente y se lleva a cabo la eliminación de duplicados ópticos y de PCR.

14
Identificación y anotación de SNVs e InDels

SNVs e indels son identificadas mediante la combinación diferentes algoritmos de llamada a variantes, entre ellos uno propio desarrollado por Dreamgenics.

Las variantes son anotadas con diferente información relevante, procedente de múltiples bases de datos:

  • Funcionales: RefSeq, Pfam, etc.
  • Poblacionales: dbSNP, 1000 Genomes, ESP6500, ExAC, gnomAD, etc.
  • De predicción de impacto funcional in silico: dbNSFP, dbscSNV, etc.

Para generar el conjunto de SNVs e indels específico de cada muestra, se seleccionan aquellas que cumplen unos criterios de calidad dependientes del tipo de análisis, y basados en: predicción de efecto en proteína, frecuencia poblacional, cobertura total en la posición, frecuencia de la variante en la muestra, ausencia de anotaciones indicativas de una distribución/calidad de las lecturas de tipo artefactual y distancia máxima a las regiones del bed del diseño.

Identificación de CNVs

Las potenciales CNVs se analizan mediante una adaptación del algoritmo exome2cnv*. El análisis de potenciales CNVs puede llevarse a cabo en aquellos casos en los que la naturaleza y calidad de las muestras lo permita y además se disponga de un set de muestras control adecuado. Debe tratarse de muestras del mismo tipo de tejido y procesadas de igual forma que las muestras de estudio (misma metodología de extracción del ADN, generación de librería, secuenciación, etc).

¿Estás interesado en nuestro
servicio de análisis de datos NGS?

Contacta con nosotros y te ayudaremos

Metodología de análisis

Descubre cómo analizamos los datos genómicos

Software propio

Llevamos a cabo el procesamiento de los datos genómicos resultantes de la secuenciación masiva (NGS) utilizando nuestro software Genome One, el cual está certificado con la marca CE/IVD de productos sanitarios para diagnóstico in vitro de acuerdo con la legislación vigente (Número de Licencia: 7157-PS).

Podemos realizar el análisis bioinformático a partir de archivos FASTQ, BAM y VCF provenientes de tecnología Illumina y/o BGI.

Etapas del análisis bioinformático

11
Control de calidad de FASTQ

Los archivos FASTQ crudos son evaluados usando los controles de calidad de FastQC y empleamos Trimmomatic o FASTP para la eliminación de bases, adaptadores y otras secuencias de baja calidad.

12
Alineamiento

Cada FASTQ se alinea frente a la versión correspondiente del genoma humano de referencia.

13
Control de calidad del alineamiento

Los archivos BAM generados son evaluados individualmente y se lleva a cabo la eliminación de duplicados ópticos y de PCR.

14
Identificación y anotación de SNVs e InDels

SNVs e indels son identificadas mediante la combinación diferentes algoritmos de llamada a variantes, entre ellos uno propio desarrollado por Dreamgenics.

Las variantes son anotadas con diferente información relevante, procedente de múltiples bases de datos:

  • Funcionales: RefSeq, Pfam, etc.
  • Poblacionales: dbSNP, 1000 Genomes, ESP6500, ExAC, gnomAD, etc.
  • De predicción de impacto funcional in silico: dbNSFP, dbscSNV, etc.

Para generar el conjunto de SNVs e indels específico de cada muestra, se seleccionan aquellas que cumplen unos criterios de calidad dependientes del tipo de análisis, y basados en: predicción de efecto en proteína, frecuencia poblacional, cobertura total en la posición, frecuencia de la variante en la muestra, ausencia de anotaciones indicativas de una distribución/calidad de las lecturas de tipo artefactual y distancia máxima a las regiones del bed del diseño.

Identificación de CNVs

Las potenciales CNVs se analizan mediante una adaptación del algoritmo exome2cnv*. El análisis de potenciales CNVs puede llevarse a cabo en aquellos casos en los que la naturaleza y calidad de las muestras lo permita y además se disponga de un set de muestras control adecuado. Debe tratarse de muestras del mismo tipo de tejido y procesadas de igual forma que las muestras de estudio (misma metodología de extracción del ADN, generación de librería, secuenciación, etc).

¿Estás interesado en nuestro servicio de análisis de datos NGS?

Contacta con nosotros y te ayudaremos

Genome Lab

Genome One Reports

Área privada móvil

Genome Lab

[email-download download_id="21266" contact_form_id="21261"]