Die Sekundäranalyse wird nach derPrimaranalysedurchgeführt . Der erste Schritt vor der Durchführung der Sekundäranalyse ist das Herausschneiden von Markern und Adaptern, da diese Sequenzen keine biologische Bedeutung haben.

Das Hauptziel der Sekundäranalyse besteht darin, alle kurzen DNA-Sequenzen (auch Reads genannt) zusammenzufügen, um die Sequenzdaten zu interpretieren. Vor dieser Zusammenfügung werden die "rohen" Reads aus dem Gerät häufig bewertet und auf ihre Qualität hin gefiltert, um die besten Ergebnisse zu erzielen. Reads mit niedrigen Phred-Qualitätsscores sollten entfernt und Adapter herausgeschnitten werden. Wenn die Neuzusammensetzung von Grund auf ohne Referenzgenom durchgeführt wird, spricht man von新创一个ssembly. Im Gegensatz dazu ist der Prozess viel einfacher, wenn ein Referenzgenom zur Verfügung steht, da wir einfach alle Reads an das Referenzgenomausrichtenkönnen.

Normalerweise haben wir mehrere Reads, die denselben Bereich des Genoms abbilden; dies wird oft als „Lesetiefe“ bezeichnet. Die Lesetiefe misst, wie oft ein bestimmter Bereich von verschiedenen Reads abgedeckt wird. Eine Lesetiefe von zehn bedeutet beispielsweise, dass im selben Genombereich zehn Reads übereinander kartiert sind.

Der nächste Schritt in derNGS-Datenanalyseist dieTertiäranalyse.

Baidu