09.NGS softwaresバイオインフォ

#3【NGS】samtoolsのインストール

Linux初心者で、Wet系研究者の方へ。

「samtools」のインストール手順を解説します。

ねこ研究員
ねこ研究員

お急ぎの方は動画版をどうぞ!

動画の長さは2分です♪

【Linux】samtoolsのインストール実況してみた【2分】

準備

ねこ研究員
ねこ研究員

まずは作業用フォルダ「mybin」を作りましょう。手順は以下です。

  1. Linuxのターミナルを開きます。
  2. 次のコマンドで「mybin」フォルダを作成します。
    mkdir mybin
  3. 以上で完了です。
作業用フォルダを作成する理由は次の2点です。(1)問題が生じた際に原因の特定がしやすい、(2)共用の場所を避けることで他ユーザに影響が出る可能性を抑える。

「samtools」のダウンロード

  1. ブラウザを開きます。
  2. 「samtools」で検索します。
  3. samtoolsのサイトに移動します。
  4. ページ下部までスクロールすると、下記の「git」コマンドが利用したダウンロード方法が紹介されています。そこで、まずはターミナルに戻り「mybin」に移動します。続いて下記コマンドにより「samtools」をダウンロードします。
    git clone git://github.com/samtools/samtools.git
    「git」コマンドはGitHubのサイトにあるソフトウェアを一発でダウンロードできる等をはじめとして、便利なコマンドです。 「samtools」などNGS解析関連のソフトウェアを利用する方であれば、「git」コマンドを利用できる環境にしておくことをオススメします。
    「git」コマンドのインストールについてはこちらです。
    「git」コマンドがインストールされているか分からない方:「which」コマンドで確認ができます。詳しくは「パスを通す」をご参照ください。

「htslib」のインストール

  1. 「samtools」のインストールには、「htslib」が必要です。
    「samtools」のGitHubのページのREADMEに上記が説明されています。
    READMEには「bcftools」も推奨と記載されていますが、実際は「htslib」だけで大丈夫です。
  2. 「htslib」のダウンロードのために、「samtools」のGitHubのページから「htslib」のGitHubのページに移動します。
  3. 「htslib」のGitHubのページのURLをクリップボードにコピーします。
  4. ターミナルに戻り(「mybin」内で)、下記のようにして「htslib」をダウンロードします。
    git clone https://github.com/samtools/htslib 
  5. インストール方法を確認します。「htslib」のGitHubのページのREADMEによれば、以下の5つのコマンドで「htslib」のインストールができるとのことです。
    autoheader  # If using configure, generate the header template... 
    autoconf # ...and configure script (or use autoreconf to do both)
    ./configure # Optional but recommended, for choosing extra functionality
    make
    make install
    「autoconf」がインストールされていない方:こちらでインストール方法を解説しました。
    「autoconf」がインストールされているか分からない方:「which」コマンドで確認ができます。詳しくは「パスを通す」をご参照ください。
    「configure」や「make」の意味が分からない方:こちらで解説しました。
  6. ターミナルに戻り、「htslib」のダウンロードによって生成された「htslib」フォルダに移動します。
  7. 「autoheader」をします。
    autoheader
  8. 「autoconf」をします。
    autoconf
  9. 「configure」をします。「prefix」は「mybin」にします。
    ./configure --prefix=$HOME/mybin
    「prefix」の意味については、「configure」解説のページをご参照ください。
  10. 「make」します。
    make
  11. 「make install」します。
    make install
  12. ここまででエラーが出てこなければ、「htslib」のインストールは成功です。

「samtools」のインストール

  1. 「samtools」のダウンロードによって生成された「samtools」のフォルダへ移動します。
  2. 「samtools」のインストール方法を確認します。「samtools」のGitHubのページのREADMEによれば、以下の5つのコマンドでインストールができるとのことです。
    autoheader            # Build config.h.in (this may generate a warning about
                          # AC_CONFIG_SUBDIRS - please ignore it).
    autoconf -Wno-syntax  # Generate the configure script
    ./configure           # Needed for choosing optional functionality
    make
    make install
  3. ターミナルに戻り、「autoheader」をします。
    autoheader
  4. 「autoconf」をします。指示通りのオプションも付加しておきます。
    autoconf -Wno-syntax
  5. 「configure」をします。「prefix」は「mybin」にします。
    ./configure --prefix=$HOME/mybin
  6. 「make」します。
    make
  7. 「make install」します。
    make install

パスを通す

「.bash_profile」を編集して「~/mybin/bin」をパスに追加してください。

上記がわからない場合は、「パスを通す」とはの記事を読めば分かるようになります。ご参照ください。

補足:「samtools」とは?

このページにいらっしゃる多くの方は「samtools」についてご存知だと思いますが、説明いたします。

「samtools」はRNASeqのデータ解析において大活躍するソフトウェアです。

細胞から抽出して調製したmRNAライブラリを次世代シーケンサによって読むと、fastqというファイルとなって手元に返ってきます。

解析としてまず行うことは、fastqのgenomeやtranscriptomeへのmappingです。これによってアライメントの情報に関するファイルが出力されます。そのファイル形式はsam形式(またはbam形式)と言います。

sam形式のファイルを取り扱うためには、samtoolsが必要となります。従って、RNASeq解析の場合にはほぼ必須と言って過言ではないソフトウェアです。

 

ねこ研究員
ねこ研究員

お疲れ様でした!