演習: プレインストールされたツールを使用する

完了

DSVM に接続できたので、これを使ってデータ サイエンスを行うことができます。 DSVM には次のツールが事前インストールされています。

  • Python
  • R
  • Julia
  • Node.js
  • Java

さらに、他のプログラミング言語、デスクトップ アプリケーション、データベース ツールなどを追加できます。

Python conda 環境を一覧表示してアクティブにする

conda パッケージ マネージャーは、Python プログラミング環境を管理するための人気のある方法です。 Data Science Virtual Machine (DSVM) は、これを既定の環境マネージャーとして使います。 DSVM には、一般的なデータ サイエンスおよび機械学習パッケージと連携するように構成されたいくつかの環境が用意されています。 例として、Python 3.6 で実行される PyTorch の初期化、アクティブ化、使用方法について説明します。

目的の conda 環境をアクティブにするには:

  1. DSVM デスクトップ ツール バーでターミナル エミュレーターのアイコンを選びます。

    ターミナルが強調表示されている Ubuntu デスクトップのスクリーンショット。

  2. conda を初期化してアクティブにするには、次を実行します。

    conda init && source ~/.bashrc
    
  3. インストールされている conda 環境を一覧表示するには、次を実行します。

    conda info --envs
    

    出力は次のように表示されます。

    # conda environments:
    #
    base                  *  /anaconda
    azureml_py310_sdkv2      /anaconda/envs/azureml_py310_sdkv2
    azureml_py38             /anaconda/envs/azureml_py38
    azureml_py38_PT_and_TF     /anaconda/envs/azureml_py38_PT_and_TF
    py38_default             /anaconda/envs/py37_default
    

    アスタリスクは、base 環境が現在アクティブであることを示しています。

  4. python --version を実行すると、基本環境で Python 3.7 が実行されていることがわかります。 conda list を実行して、どのようなパッケージがインストールされているかを確認します。 conda env export -n base を実行して、依存関係の完全な一覧を取得します。

  5. 次を実行して、使用する環境をアクティブにします。

    conda activate azureml_py38_PT_and_TF
    
  6. python --versionconda list を再度実行して、Python 環境の変更を確認します。

Jupyter サーバーを起動するには、次を実行します。

jupyter notebook

起動後に、DSVM の Firefox ブラウザーが起動します。 localhost:8888/tree が開き、DSVM ユーザーのホーム ディレクトリが表示されるはずです。 notebooks ディレクトリには、インストールされているさまざまなフレームワークに関するチュートリアルが含まれていますが、そのほとんどすべてで外部ソースからデータをダウンロードする必要があります。 このモジュールでは、無料の制限された Azure 環境で DSVM が実行されているため、現時点ではそのデータにアクセスすることはできません。

マシン上で他のソフトウェアを試してみてください。 ただし、サンドボックスの制限は、インターネット アクセスに依存するプログラムに影響します。