Metodología de análisis
Descubre cómo analizamos los datos genómicos
Metodología de análisis
Software propio
Llevamos a cabo el procesamiento de los datos genómicos resultantes de la secuenciación masiva (NGS) utilizando nuestro software Genome One, el cual está certificado con la marca CE/IVD de productos sanitarios para diagnóstico in vitro de acuerdo con la legislación vigente (Número de Licencia: 7157-PS).
Podemos realizar el análisis bioinformático a partir de archivos FASTQ, BAM y VCF provenientes de tecnología Illumina y/o MGI.

Etapas del análisis bioinformático
Control de calidad de FASTQ
Los archivos FASTQ crudos son evaluados usando los controles de calidad de FastQC y empleamos Trimmomatic o FASTP para la eliminación de bases, adaptadores y otras secuencias de baja calidad.
Alineamiento
Cada FASTQ se alinea frente a la versión correspondiente del genoma humano de referencia.
Identificación y anotación de SNVs e InDels
SNVs e indels son identificadas mediante la combinación diferentes algoritmos de llamada a variantes, entre ellos uno propio desarrollado por Dreamgenics.
Las variantes son anotadas con diferente información relevante, procedente de múltiples bases de datos:
- Funcionales: RefSeq, Pfam, etc.
- Poblacionales: dbSNP, 1000 Genomes, ESP6500, ExAC, gnomAD, etc.
- De predicción de impacto funcional in silico: dbNSFP, dbscSNV, etc.
Para generar el conjunto de SNVs e indels específico de cada muestra, se seleccionan aquellas que cumplen unos criterios de calidad dependientes del tipo de análisis, y basados en: predicción de efecto en proteína, frecuencia poblacional, cobertura total en la posición, frecuencia de la variante en la muestra, ausencia de anotaciones indicativas de una distribución/calidad de las lecturas de tipo artefactual y distancia máxima a las regiones del bed del diseño.
Identificación de CNVs
Las potenciales CNVs se analizan mediante una adaptación del algoritmo exome2cnv*. El análisis de potenciales CNVs puede llevarse a cabo en aquellos casos en los que la naturaleza y calidad de las muestras lo permita y además se disponga de un set de muestras control adecuado. Debe tratarse de muestras del mismo tipo de tejido y procesadas de igual forma que las muestras de estudio (misma metodología de extracción del ADN, generación de librería, secuenciación, etc).

*Valdés-Mas y col. (2012) PLoS One 7:e51422.
¿Estás interesado en nuestro
servicio de análisis de datos NGS?
Contacta con nosotros y te ayudaremos
Metodología de análisis
Descubre cómo analizamos los datos genómicos
Metodología de análisis
Software propio
Llevamos a cabo el procesamiento de los datos genómicos resultantes de la secuenciación masiva (NGS) utilizando nuestro software Genome One, el cual está certificado con la marca CE/IVD de productos sanitarios para diagnóstico in vitro de acuerdo con la legislación vigente (Número de Licencia: 7157-PS).
Podemos realizar el análisis bioinformático a partir de archivos FASTQ, BAM y VCF provenientes de tecnología Illumina y/o MGI.

Etapas del análisis bioinformático
Control de calidad de FASTQ
Los archivos FASTQ crudos son evaluados usando los controles de calidad de FastQC y empleamos Trimmomatic o FASTP para la eliminación de bases, adaptadores y otras secuencias de baja calidad.
Alineamiento
Cada FASTQ se alinea frente a la versión correspondiente del genoma humano de referencia.
Identificación y anotación de SNVs e InDels
SNVs e indels son identificadas mediante la combinación diferentes algoritmos de llamada a variantes, entre ellos uno propio desarrollado por Dreamgenics.
Las variantes son anotadas con diferente información relevante, procedente de múltiples bases de datos:
- Funcionales: RefSeq, Pfam, etc.
- Poblacionales: dbSNP, 1000 Genomes, ESP6500, ExAC, gnomAD, etc.
- De predicción de impacto funcional in silico: dbNSFP, dbscSNV, etc.
Para generar el conjunto de SNVs e indels específico de cada muestra, se seleccionan aquellas que cumplen unos criterios de calidad dependientes del tipo de análisis, y basados en: predicción de efecto en proteína, frecuencia poblacional, cobertura total en la posición, frecuencia de la variante en la muestra, ausencia de anotaciones indicativas de una distribución/calidad de las lecturas de tipo artefactual y distancia máxima a las regiones del bed del diseño.
Identificación de CNVs
Las potenciales CNVs se analizan mediante una adaptación del algoritmo exome2cnv*. El análisis de potenciales CNVs puede llevarse a cabo en aquellos casos en los que la naturaleza y calidad de las muestras lo permita y además se disponga de un set de muestras control adecuado. Debe tratarse de muestras del mismo tipo de tejido y procesadas de igual forma que las muestras de estudio (misma metodología de extracción del ADN, generación de librería, secuenciación, etc).

¿Estás interesado en nuestro
servicio de análisis de datos NGS?
Contacta con nosotros y te ayudaremos
Metodología de análisis
Descubre cómo analizamos los datos genómicos
Metodología de análisis
Software propio
Llevamos a cabo el procesamiento de los datos genómicos resultantes de la secuenciación masiva (NGS) utilizando nuestro software Genome One, el cual está certificado con la marca CE/IVD de productos sanitarios para diagnóstico in vitro de acuerdo con la legislación vigente (Número de Licencia: 7157-PS).
Podemos realizar el análisis bioinformático a partir de archivos FASTQ, BAM y VCF provenientes de tecnología Illumina y/o BGI.

Etapas del análisis bioinformático
Control de calidad de FASTQ
Los archivos FASTQ crudos son evaluados usando los controles de calidad de FastQC y empleamos Trimmomatic o FASTP para la eliminación de bases, adaptadores y otras secuencias de baja calidad.
Alineamiento
Cada FASTQ se alinea frente a la versión correspondiente del genoma humano de referencia.
Identificación y anotación de SNVs e InDels
SNVs e indels son identificadas mediante la combinación diferentes algoritmos de llamada a variantes, entre ellos uno propio desarrollado por Dreamgenics.
Las variantes son anotadas con diferente información relevante, procedente de múltiples bases de datos:
- Funcionales: RefSeq, Pfam, etc.
- Poblacionales: dbSNP, 1000 Genomes, ESP6500, ExAC, gnomAD, etc.
- De predicción de impacto funcional in silico: dbNSFP, dbscSNV, etc.
Para generar el conjunto de SNVs e indels específico de cada muestra, se seleccionan aquellas que cumplen unos criterios de calidad dependientes del tipo de análisis, y basados en: predicción de efecto en proteína, frecuencia poblacional, cobertura total en la posición, frecuencia de la variante en la muestra, ausencia de anotaciones indicativas de una distribución/calidad de las lecturas de tipo artefactual y distancia máxima a las regiones del bed del diseño.
Identificación de CNVs
Las potenciales CNVs se analizan mediante una adaptación del algoritmo exome2cnv*. El análisis de potenciales CNVs puede llevarse a cabo en aquellos casos en los que la naturaleza y calidad de las muestras lo permita y además se disponga de un set de muestras control adecuado. Debe tratarse de muestras del mismo tipo de tejido y procesadas de igual forma que las muestras de estudio (misma metodología de extracción del ADN, generación de librería, secuenciación, etc).

¿Estás interesado en nuestro servicio de análisis de datos NGS?
Contacta con nosotros y te ayudaremos