Azure Blob Storage と Python で作業を開始する

この記事では、Python 用 Azure Blob Storage クライアント ライブラリを使用して、Azure Blob Storage に接続する方法について説明します。 接続されると、コードは、Blob Storage サービスのコンテナー、BLOB、機能を使って動作できます。

API リファレンス | パッケージ (PyPi) | ライブラリのソース コード | サンプル | フィードバックを送信する

前提条件

プロジェクトの設定

このセクションでは、Python 用 Azure Blob Storage クライアント ライブラリを操作するためのプロジェクトの準備について説明します。

プロジェクト ディレクトリから、pip install コマンドを使用して、Azure Blob Storage と Azure ID のクライアント ライブラリのパッケージをインストールします。 Azure サービスへのパスワードレス接続には、azure-identity パッケージが必要です。

pip install azure-storage-blob azure-identity

次にコード ファイルを開き、必要な import ステートメントを追加します。 この例では、以下を .py ファイルに追加します。

from azure.identity import DefaultAzureCredential
from azure.storage.blob import BlobServiceClient, BlobClient, ContainerClient

BLOB クライアント ライブラリ情報:

  • azure.storage.blob: サービス、コンテナー、BLOB を操作するために使用できるプライマリ クラス ("クライアント オブジェクト") が含まれています。

非同期プログラミング

Python 用 Azure Blob Storage クライアント ライブラリでは、同期および非同期の両方の API がサポートされています。 非同期 API は、Python の asyncio ライブラリに基づいています。

プロジェクトで非同期 API を使用するには、次の手順に従います。

  • aiohttp などの非同期トランスポートをインストールします。 オプションの依存関係インストール コマンドを使用して、aiohttpazure-storage-blob と共にインストールできます。 この例では、次の pip install コマンドを使用します。

    pip install azure-storage-blob[aio]
    
  • コード ファイルを開き、必要な import ステートメントを追加します。 この例では、以下を .py ファイルに追加します。

    import asyncio
    
    from azure.identity.aio import DefaultAzureCredential
    from azure.storage.blob.aio import BlobServiceClient, BlobClient, ContainerClient
    

    import asyncio ステートメントは、コードでライブラリを使用している場合にのみ必要です。 ここでは、asyncio ライブラリを使用する開発者ガイドの記事の例として、わかりやすくするために追加されています。

  • async with を使用してクライアント オブジェクトを作成し、データ リソースの操作を開始します。 最上位のクライアントのみで async with を使用する必要があります。ここから作成された他のクライアントでは同じ接続プールを共有するためです。 この例では、async with を使用して BlobServiceClient オブジェクトを作成してから、ContainerClient オブジェクトを作成します。

    async with BlobServiceClient(account_url, credential=credential) as blob_service_client:
        container_client = blob_service_client.get_container_client(container="sample-container")
    

    詳細については、「Blob Storage へのアクセスを認可して接続する」の非同期の例を参照してください。

BLOB 非同期クライアント ライブラリ情報:

  • azure.storage.blob.aio: サービス、コンテナー、BLOB を非同期で操作するために使用できるプライマリ クラスが含まれています。

Blob Storage へのアクセスを承認して接続する

アプリを BLOB Storage に接続するには、BlobServiceClient クラスのインスタンスを作成します。 このオブジェクトは、ストレージ アカウント レベルでデータ リソースを操作するための開始点となります。 それを使って、ストレージ アカウントとそのコンテナーを操作できます。 また、操作する必要があるリソースに応じて、サービス クライアントを使用してコンテナー クライアントまたは BLOB クライアントを作成することもできます。

ベスト プラクティスを含むクライアント オブジェクトの作成と管理の詳細については、「データ リソースを操作するクライアント オブジェクトの作成および管理」を参照してください。

Microsoft Entra 認可トークン、アカウント アクセス キー、または Shared Access Signature (SAS) を使用して、BlobServiceClient オブジェクトを認可できます。 最適なセキュリティのため、Microsoft では、可能な限り、Microsoft Entra ID とマネージド ID を使って、BLOB データに対する要求を認可することをお勧めします。 詳しくは、Microsoft Entra ID を使用した BLOB へのアクセスの認可に関する記事をご覧ください。

Microsoft Entra ID を使用して認可するには、セキュリティ プリンシパルを使用する必要があります。 必要なセキュリティ プリンシパルの種類は、アプリが実行される場所によって異なります。 次の表をガイドとして使用します。

アプリが実行される場所 セキュリティ プリンシパル ガイダンス
ローカル コンピューター (開発とテスト) サービス プリンシパル アプリの登録、Microsoft Entra グループの設定、ロールの割り当て、環境変数の構成の方法を確認するには、開発者サービス プリンシパルを使用してアクセスを認可する方法に関する記事を参照してください
ローカル コンピューター (開発とテスト) ユーザー ID Microsoft Entra グループを設定し、ロールを割り当て、Azure にサインインする方法については、開発者資格情報を使用してアクセスを認可する方法に関する記事を参照してください
Azure でホスト マネージド ID マネージド ID を有効にしてロールを割り当てる方法については、マネージド ID を使用して Azure でホストされるアプリからのアクセスを承認する方法に関する記事を参照してください
Azure の外部でホストされる (オンプレミス アプリなど) サービス プリンシパル アプリを登録し、ロールを割り当て、環境変数を構成する方法については、アプリケーション サービス プリンシパルを使用してオンプレミス アプリからのアクセスを承認する方法に関する記事を参照してください

DefaultAzureCredential を使用してアクセスを承認する

Blob Storage へのアクセスを承認して接続する最も簡単で安全な方法は、DefaultAzureCredential インスタンスを作成して OAuth トークンを取得することです。 その後、その資格情報を使用して BlobServiceClient オブジェクトを作成できます。

この例では、DefaultAzureCredential を使用して BlobServiceClient オブジェクトを作成します。

def get_blob_service_client_token_credential(self):
    # TODO: Replace <storage-account-name> with your actual storage account name
    account_url = "https://<storage-account-name>.blob.core.windows.net"
    credential = DefaultAzureCredential()

    # Create the BlobServiceClient object
    blob_service_client = BlobServiceClient(account_url, credential=credential)

    return blob_service_client

プロジェクトで非同期 API を使用する場合は、async with を使用して BlobServiceClient のインスタンスを作成します。

# TODO: Replace <storage-account-name> with your actual storage account name
account_url = "https://<storage-account-name>.blob.core.windows.net"
credential = DefaultAzureCredential()

async with BlobServiceClient(account_url, credential=credential) as blob_service_client:
    # Work with data resources in the storage account

アプリの構築

Azure Blob Storage のデータ リソースを操作するアプリを構築する際、コードでは主に、ストレージ アカウント、コンテナー、BLOB という 3 つのリソースの種類と対話します。 これらのリソースの種類、リソースの相互関係、およびアプリがリソースと対話する方法について詳しくは、「アプリが Blob Storage データ リソースと対話する方法を理解する」を参照してください。

次のガイドでは、Python 用 Azure Storage クライアント ライブラリを使用してデータにアクセスし、特定のアクションを実行する方法について説明します。

ガイド 説明
再試行ポリシーを構成する クライアント操作の再試行ポリシーを実装します。
BLOB をコピーする ある場所から別の場所に BLOB をコピーします。
コンテナーの作成 BLOB コンテナーを作成します。
ユーザーの委任 SAS の作成 コンテナーまたは BLOB 用のユーザー委任 SAS を作成します。
BLOB のリースを作成および管理する BLOB に対するロックを確立して管理します。
コンテナーのリースを作成および管理する コンテナーに対するロックを確立して管理します。
BLOB の削除と復元 BLOB を削除し、論理的に削除された BLOB を復元します。
コンテナーを削除して復元する コンテナーを削除し、論理的に削除されたコンテナーを復元します。
BLOB をダウンロードする 文字列、ストリーム、ファイル パスを使って BLOB をダウンロードします。
タグを使って BLOB を検索する タグの設定と取得を行い、タグを使って BLOB を検索します。
BLOB をリストする さまざまな方法で BLOB の一覧を表示します。
コンテナーをリストする アカウントのコンテナーの一覧を表示し、さまざまなオプションを使って一覧をカスタマイズします。
プロパティとメタデータの管理 (BLOB) BLOB のプロパティとメタデータを取得および設定します。
プロパティとメタデータの管理 (コンテナー) コンテナーのプロパティとメタデータを取得および設定します。
データ転送のパフォーマンス チューニング データ転送操作のパフォーマンスを最適化します。
BLOB のアクセス層を設定または変更する ブロック BLOB のアクセス層を設定または変更します。
BLOB をアップロードする 文字列、ストリーム、ファイル パス、その他の方法を使って BLOB をアップロードする方法について説明します。