conda下での仮想環境とjupyter notebookによるpythonプログラミング

conda下での仮想環境

pythonでは、python自体のバージョン(python2かpython3か)やパッケージのバージョンが衝突することがある。そのため、ユーザによって、またプロジェクトごとに、仮想環境を作ることができる機能が用意されている。condaの下では

conda create -n 仮想環境名 python=3.9.1

などとして新しい環境を作成できる。pythonのバージョンを指定する必要がある。

仮想環境 rnaseq を作成するには、

$ conda create -n rnaseq python=3.9.1

とする。結果は

Collecting package metadata (current_repodata.json): done
Solving environment: done
## Package Plan ##
  environment location: /Users/yamanouchi/miniconda3/envs/rnaseq
Proceed ([y]/n)? y
Preparing transaction: done
Verifying transaction: done
Executing transaction: done
#
# To activate this environment, use
#
#     $ conda activate rnaseq
#
# To deactivate an active environment, use
#
#     $ conda deactivate

のようになる。

仮想環境を作成した後、起動するには

$ conda activate rnaseq

とする。仮想環境下で python について確認すると、
$ python -V
に対しては
3.9.1
となり、
$ which python
に対しては
Users/yamanouc/miniconda3/envs/rnaseq/bin/python
となっている。つまりユーザyamanoucの下のcondaで管理されている仮想環境のうち、rnaseqのところにあるpythonを使っている、ということである。仮想環境として別のたとえば foo を作る(conda create -n foo python=...する)と、環境fooを起動(activate)すればそこで設定したpythonが使える、ということになる。

なお、仮想環境を離脱するには

$ conda deactivate

とする。

jupyter notebook の起動

前節で作った仮想環境 rnaseq の中で、jupyter notebookの環境を導入し、pythonのプログラミング作業ができるようにしよう。そのためには、

$ conda install jupyter

とする。パッケージ名はjupyterであって、その中の(サブ)システムの1つであるnotebookを使う、という建付けになっている。

必要となるいろいろな関連パッケージのリストが表示され、インストールするか、と尋ねるので、y と答えると、インストールが始まる。

インストールが終了した上で、jupyter notebookを起動する。その時、起動をする場所(コマンド jupyter notebook を実行させるときのカレントディレクトリ(作業ディレクトリ)を気にする必要があり、jupyter notebookのファイルリストではそのディレクトリの場所より下のファイルがjupyterの表示する対象(つまり扱う対象)となる。つまり、作業したいファイル(ファイル群)を含むディレクトリを起点とするように、そのディレクトリをカレントディレクトリとしておいて、そこでjupyter notebookを起動するとよい。

仮にRNAseq処理をしたいデータを含むディレクトリがホームディレクトリ直下のディレクトリ ~/RNAseqであるとすると、コマンド $cd ~/RNAseq (change directory) によってカレントディレクトリを ~/RNAseq に移動する。その上で、

$ jupyter notebook

としてjupyter notebookを起動する。

また別の例として、外部記憶媒体(外部ディスク・外部SSD等)にリードデータがあってそこを作業ディレクトリにしたい場合、その場所がたとえば

/Volumes/LOGITECHSSD/RNAseq

であれば、cd コマンドを使ってカレントディレクトリを

$ cd /Volumes/LOGITECHSSD/RNAseq

のように設定する。

jupyter notebook の簡単な使い方

jupyter notebook を起動すると、ネットブラウザーの中でnotebookの画面が開く。

新しいプログラムを作成するには、新規ボタンからPython 3を選択すると、新しいプログラミング用ウィンドウが開く。ここの下段の入力部分にプログラムを入力してゆけばよい。

なお、上部にあるUntitledをクリックすると、このファイルの名前(タイトル)を設定することができる。その名前を foo とすると、Notebookを保存するファイルは、foo.ipynb という名前になる。