演習: プレインストールされたツールを使用する
DSVM に接続できたので、これを使ってデータ サイエンスを行うことができます。 DSVM には次のツールが事前インストールされています。
- Python
- R
- Julia
- Node.js
- Java
さらに、他のプログラミング言語、デスクトップ アプリケーション、データベース ツールなどを追加できます。
Python conda 環境を一覧表示してアクティブにする
conda パッケージ マネージャーは、Python プログラミング環境を管理するための人気のある方法です。 Data Science Virtual Machine (DSVM) は、これを既定の環境マネージャーとして使います。 DSVM には、一般的なデータ サイエンスおよび機械学習パッケージと連携するように構成されたいくつかの環境が用意されています。 例として、Python 3.6 で実行される PyTorch の初期化、アクティブ化、使用方法について説明します。
目的の conda 環境をアクティブにするには:
DSVM デスクトップ ツール バーでターミナル エミュレーターのアイコンを選びます。
conda を初期化してアクティブにするには、次を実行します。
conda init && source ~/.bashrc
インストールされている conda 環境を一覧表示するには、次を実行します。
conda info --envs
出力は次のように表示されます。
# conda environments: # base * /anaconda azureml_py310_sdkv2 /anaconda/envs/azureml_py310_sdkv2 azureml_py38 /anaconda/envs/azureml_py38 azureml_py38_PT_and_TF /anaconda/envs/azureml_py38_PT_and_TF py38_default /anaconda/envs/py37_default
アスタリスクは、
base
環境が現在アクティブであることを示しています。python --version
を実行すると、基本環境で Python 3.7 が実行されていることがわかります。conda list
を実行して、どのようなパッケージがインストールされているかを確認します。conda env export -n base
を実行して、依存関係の完全な一覧を取得します。次を実行して、使用する環境をアクティブにします。
conda activate azureml_py38_PT_and_TF
python --version
とconda list
を再度実行して、Python 環境の変更を確認します。
Jupyter サーバーを起動するには、次を実行します。
jupyter notebook
起動後に、DSVM の Firefox ブラウザーが起動します。 localhost:8888/tree
が開き、DSVM ユーザーのホーム ディレクトリが表示されるはずです。 notebooks ディレクトリには、インストールされているさまざまなフレームワークに関するチュートリアルが含まれていますが、そのほとんどすべてで外部ソースからデータをダウンロードする必要があります。 このモジュールでは、無料の制限された Azure 環境で DSVM が実行されているため、現時点ではそのデータにアクセスすることはできません。
マシン上で他のソフトウェアを試してみてください。 ただし、サンドボックスの制限は、インターネット アクセスに依存するプログラムに影響します。