機械学習やディープラーニングの技術が浸透するにつれて、これらの技術と親和性の高い言語であるPythonを習得したいという方が増えてきています。
Pythonではデータ処理に実用的なライブラリが多数提供されていますが、今、最も評価されているディストリビューションのひとつが「Anaconda(アナコンダ)」です。
こちらでは、Anacondaの概要やインストール方法、活用のポイントについてご紹介します。
公開日:2018年5月29日
Anacondaとは?Pythonとの関係を紹介!
「Anaconda」とは、Pythonのライブラリが詰め込まれたパッケージです。Pythonそのもののほか、Pythonとともに利用されることが多いライブラリが複数パッケージングされています。
有料ライセンスも用意されていますが、高速演算や並列演算が必要にならない限り、無料のタイプで対応可能です。
機械学習やデータ分析、高度な数値計算など、Pythonを使った処理はAnacondaで簡単に実現できます。Anacondaを利用するメリットや、含まれている代表的なライブラリについて紹介していきます。
Python環境構築にAnacondaを利用するメリットは?
Python環境構築の際に、Anacondaを利用するメリットは何でしょうか?
Pythonで処理を行うためには、OSに応じてライブラリをコンパイルしてインストールする必要があります。この作業は、開発従事経験があればさほど難しくないものの、単にPythonで処理がしたい方にとっては煩雑です。
そこで、Anacondaをインストールすれば、役立つライブラリがあらかじめインストールされた状態でPython環境を構築できるという点は、大きなメリットと言えます。
また、Anacondaはとりわけデータ解析に特化したプラットフォームとして制作されています。Pythonを使ったデータ解析を想定している方にとっては、非常に役立つツールとなるでしょう。
さらに、バージョン違いのPythonを切り替えて使用できる点も、古いプログラムを運用するユーザーには評価されています。
Anacondaに含まれるPythonの機械学習ライブラリ
Anacondaに含まれるPythonのライブラリを簡単にご紹介します。
NumPy | 大量データ配列の処理に特化したライブラリです。 |
SciPy | NumPyでできる処理に加え、信号処理や統計の処理も可能なライブラリです。 |
Matplotlib | データをプロットしたグラフ画像を出力できるライブラリです。 |
Pandas | NumPyのデータに対し、統計処理を実施できるライブラリです。 |
Scikit-Learn | 「アルゴリズムチートシート」を用いて、機械学習を行えるライブラリです。 |
Jupyter | 「ノートブック」形式のプログラムを実行しながら結果を記録し、分析できるライブラリです。 |
ご紹介したのはどれも機械学習に有効活用できるライブラリばかりです。
通常、Pythonだけを導入した場合は各ライブラリを個別に集める必要がありますが、Anacondaには最初からこれらのライブラリが格納されていますので、メリットと言えるでしょう。
\文字より動画で学びたいあなたへ/
Udemyで講座を探す >Anacondaの使い方!環境やインストール方法は?
続いて、実際にAnacondaを導入する際に要求される環境や、インストール方法についてご紹介しましょう。
対応しているのはWindows・MacOX・Linuxです。インストールするためには、ストレージに最低3GBの空き容量が必要です。ダウンロードページで各OSに対応したプログラムファイルをダウンロードできます。
ファイルをダウンロードした後はインストーラーを起動し、画面の指示どおりに進めていけば簡単にインストールは終了します。
途中、インストールする場所やPATHの設定を求められますが、特にこだわりがない限りはデフォルトのままでよいでしょう。
バージョンについて
各OSにはそれぞれ、旧バージョンのPythonである2.x系と、最新のバージョンである3.x系が用意されています。特別な理由がない限りは、最新の3.xを選んでおけば問題ありません。
提供されているのは基本的に64ビット版のみ。Linuxのみ32ビット版が提供されています。使用しているマシンに応じて選択してください。
condaとは?
「conda」とは、Python用のパッケージ管理システム、および環境マネジメントシステムです。Anacondaをインストールすると、自動的にcondaも使える状態になっています。代表的なコマンドをいくつか紹介します。
l 仮想環境の作成
$ conda create –name <仮想環境名> python=<バージョン> |
l 仮想環境の確認
$ conda info -e |
l インストール済みパッケージの一覧を表示
$ conda list |
Anacondaを使う上で知っておくべきこと
Anacondaは、デフォルトでも十分便利なツールですが、いくつかのポイントを知っておくとさらに利便性が向上します。
最後に、Anacondaで機械学習を実施する上で、知っておいていただきたい代表的なポイントをご紹介しましょう。
Miniconda
上述したとおり、Anacondaはデータ分析に最適な構成のパッケージです。一方で、さらにシンプルな構成で十分なユーザー向けに「Miniconda」というディストリビューションも提供されています。
Minicondaの構成はPythonとCondaのみ。複雑な構成が不要な方は、こちらをチョイスしてもよいでしょう。
Anaconda Cloud
ほかのユーザーがアップした非公式ライブラリを利用できる「Anaconda Cloud」というツールが存在します。
GitHubのようなものをイメージしていただけるとわかりやすいかもしれません。プリインストール以外のライブラリが欲しくなった際に役立つので、登録をおすすめします。
Anacondaにはデータ解析に必要なライブラリがひととおり網羅されており、ビギナーにはうってつけのパッケージを言えます。
レベルに応じて最適な講座を受けて利用すると、さらにデータ分析への理解が深まるでしょう。
Udemyでは、Pythonデータサイエンス入門レベルの講座を提供しています。データサイエンスの基礎固めとして活用してみてはいかがですか?
ディープラーニング : Pythonでゼロから構築し学ぶ人工知能(AI)と深層学習の原理
機械学習(マシンラーニング)の中でも特に注目を集めているDeep Learningを学び、TensorFlowやChainerなどのフレームワークを使わずに、畳み込みニューラルネットワーク(CNN)までゼロから構築できるようになりましょう。
\無料でプレビューをチェック!/
講座を見てみる評価:★★★★★
初心者で未知のため、ひとりで実装を実行出来るかと言えば、ほぼ無理なのですが、講師・我妻さんのおかげで、ニューラルネットワークを実装するための考え方を学ぶことが出来ました。ありがとうございました。
評価:★★★★★
実際のコードとその意味について理解が深まりました。Pythonの関数は簡単なコードで処理をこなせることが理解できました。
最新情報・キャンペーン情報発信中