アダプター除去ソフトTrimmomaticのインストールと実行
Trimmomaticは
リードデータから、アダプターを除去し、更に品質の悪いものを除去(トリミング)するステップ。どういう品質を除去の対象とするか、判定をどうするかなど、いろいろな議論があるようである。
QC | RNA-Seq リードのクオリティチェック
https://bi.biopapyrus.jp/rnaseq/qc/
アダプター除去と簡単なトリミングを行う trimmomatic を紹介する。
USADELLAB.org – Trimmomatic: A flexible read trimming tool for Illumina NGS data
http://www.usadellab.org/cms/?page=trimmomatic
biocondaでのインストールは、他のよく使われるソフトと同様に既に済んでいるはずだが、もし起動に失敗するようならば下記のように conda install
によってインストールできる。
$ conda install -c bioconda trimmomatic
とする。
Trimmologicは起動時にいくつかのパラメータを与える。パラメータには、シングルエンドかペアエンドかの区別、入力ファイル、出力ファイルの指定のほか、除去するアダプターを書いたファイルの指定、トリミングの条件のパラメータなどを与える。上記マニュアルページのペアエンドの例では
$ trimmomatic PE \
input_forward.fq.gz input_reverse.fq.gz \
output_forward_paired.fq.gz \
output_forward_unpaired.fq.gz \
output_reverse_paired.fq.gz \
output_reverse_unpaired.fq.gz \
ILLUMINACLIP:TruSeq3-PE.fa:2:30:10:2:keepBothReads \
LEADING:3 TRAILING:3 MINLEN:36
などのように指定している。トリミングパラメータの値の選択はそれぞれのデータや用途によって調整する必要がある。またアダプターの配列は適宜メーカー等から入手する必要がある。
FastQCのインストールと実行 < アダプター除去ソフトTrimmomaticのインストールと実行 > ほげほげ