アダプター除去ソフトTrimmomaticのインストールと実行

2021年7月23日

Trimmomaticは

リードデータから、アダプターを除去し、更に品質の悪いものを除去(トリミング)するステップ。どういう品質を除去の対象とするか、判定をどうするかなど、いろいろな議論があるようである。

QC | RNA-Seq リードのクオリティチェック
https://bi.biopapyrus.jp/rnaseq/qc/

アダプター除去と簡単なトリミングを行う trimmomatic を紹介する。

USADELLAB.org - Trimmomatic: A flexible read trimming tool for Illumina NGS data
http://www.usadellab.org/cms/?page=trimmomatic

biocondaでのインストールは、他のよく使われるソフトと同様に既に済んでいるはずだが、もし起動に失敗するようならば下記のように conda install によってインストールできる。

$ conda install -c bioconda trimmomatic

とする。

TrimmologicはJava言語で書かれたプログラムであり、起動時にいくつかのパラメータを与える。パラメータには、シングルエンドかペアエンドかの区別、入力ファイル、出力ファイルの指定のほか、除去するアダプターを書いたファイルの指定、トリミングの条件のパラメータなどを与える。上記マニュアルページのペアエンドの例では

$ java -jar trimmomatic-0.39.jar PE \
  input_forward.fq.gz input_reverse.fq.gz \
  output_forward_paired.fq.gz \  
  output_forward_unpaired.fq.gz \
  output_reverse_paired.fq.gz \
  output_reverse_unpaired.fq.gz \
  ILLUMINACLIP:TruSeq3-PE.fa:2:30:10:2:keepBothReads \
  LEADING:3 TRAILING:3 MINLEN:36

などのように指定している。トリミングパラメータの値の選択はそれぞれのデータや用途によって調整する必要がある。またアダプターの配列は適宜メーカー等から入手する必要がある。


FastQCのインストールと実行 < アダプター除去ソフトTrimmomaticのインストールと実行 > ほげほげ