El análisis secundario se realiza después delanálisis primario. El primer paso antes de realizar el análisis secundario es recortar la marca y los adaptadores, ya que estas secuencias no tienen un significado biológico.
El objetivo主要德尔分析secundario es ensamblar todas las secuencias cortas de ADN (también llamadas lecturas) para interpretar los datos de la secuencia. Antes de este reensamblaje, las lecturas en bruto de la máquina suelen evaluarse y filtrarse en cuanto a su calidad para obtener los mejores resultados. Las lecturas con puntuaciones de calidad Phred bajas deben eliminarse y hay que recortar los adaptadores. Cuando el reensamblaje se realiza desde cero sin ningún genoma de referencia, se denominaensamblaje de novo. En cambio, cuando se dispone de un genoma de referencia, el proceso es mucho más sencillo porque podemos simplementealineartodas las lecturas con el genoma de referencia.
Normalmente tenemos varias lecturas que mapean la misma zona del genoma; esto se suele denominar «profundidad de lectura». La profundidad de lectura mide el número de veces que un área determinada está cubierta por diferentes lecturas. Por ejemplo, una profundidad de lectura de diez implica que hay diez lecturas mapeadas una encima de otra en la misma área genómica.
El siguiente paso delanálisis de datos NGSse llamaanálisis terciario.