はじめに: アカウントとワークスペースのセットアップ
Azure Databricks を初めて使用する方は、まずここから始めましょう。 この記事では、アカウントを作成して最初のワークスペースを稼働するために必要な最小限の手順について説明します。
オンライン トレーニング リソースの詳細については、「無料の Databricks トレーニングを受ける」を参照してください。
Azure Databricks ワークスペースを作成する
Databricks では、Azure portal を使用して最初の Azure Databricks ワークスペースをデプロイすることをお勧めします。 次のいずれかのオプションを使用して Azure Databricks をデプロイすることもできます。
注意
Azure Databricks ワークスペースを作成するときに、 [Trial (Premium - 14-Days Free DBUs)](試用版 (Premium - 14 日間の無料 DBU)) の価格レベルを選択し、ワークスペースから 14 日間無料の Premium Azure Databricks DBU にアクセスできるようにします。
開始する前に
- Azure サブスクリプションをお持ちで、しかも無料試用版サブスクリプションでない必要があります。 無料アカウントをお持ちの場合は、次の手順を実行します。
- お使いのプロファイルにアクセスし、サブスクリプションを [従量課金制] に変更します。 「Azure の無料アカウント」を参照してください。
- 使用制限を削除します。
- リージョン内の vCPU のクォータの引き上げを要求します。
- Azure Portal にサインインします。
- Azure 共同作成者または所有者になっているか、Microsoft.ManagedIdentity リソース プロバイダーがサブスクリプションに登録されている必要があります。 Microsoft.ManagedIdentity リソース プロバイダーを登録するには、
/register/action
操作を実行するアクセス許可を持つカスタム ロールが必要です。 詳しくは、Azure リソース プロバイダーをご参照ください。
portal を使用して Azure Databricks ワークスペースを作成する
Azure portal で、 [リソースの作成]>[分析]>[Azure Databricks] の順に選択します。
[Azure Databricks サービス] で値を指定して、Databricks ワークスペースを作成します。
プロパティ 説明 ワークスペース名 Databricks ワークスペースの名前を指定します サブスクリプション ドロップダウンから Azure サブスクリプションを選択します。 リソース グループ 新しいリソース グループを作成するか、既存のリソース グループを使用するかを指定します。 リソース グループは、Azure ソリューションの関連するリソースを保持するコンテナーです。 詳しくは、Azure リソース グループの概要に関するページをご覧ください。 Location [米国西部 2] を選択します。 使用可能な他のリージョンについては、「リージョン別の利用可能な製品」をご覧ください。 価格レベル Standard、Premium、Trial のいずれかを選択します。 これらのレベルの詳細については、Databricks の価格に関するページを参照してください。 [確認および作成]、[作成] の順に選択します。 ワークスペースの作成には数分かかります。 ワークスペースの作成中に、 [通知] でデプロイの状態を表示できます。 この処理が完了すると、ユーザー アカウントが管理者ユーザーとして自動的にワークスペースに追加されます。
注意
ワークスペースのデプロイが失敗した場合でも、ワークスペースはエラー状態で作成されます。 失敗したワークスペースを削除し、デプロイ エラーのない新しいワークスペースを作成します。 失敗したワークスペースを削除すると、管理対象リソース グループと、正常にデプロイされたリソースもすべて削除されます。
次の手順
次の手順は、アカウントの組織とセキュリティのセットアップを続行するか、データ パイプラインの構築を開始するかによって異なります。
Databricks ワークスペースを外部データ ソースに接続します。 「データ ソースに接続する」を参照してください。
ワークスペースにデータを取り込みます。 「Databricks レイクハウスにデータを取り込む」を参照してください。
Databricks SQL のワークスペースにデータをオンボードします。 「Databricks SQL でストリーミング テーブルを使用してデータを読み込む」を参照してください。
アカウントの組織とセキュリティを構築します。 「Azure Databricks 管理を開始する」を参照してください。
ワークスペース内のデータへのアクセスの管理について学習します。 「Unity Catalog とは」を参照してください。
ノートブック、コンピューティング、ダッシュボード、クエリなどのワークスペース オブジェクトへのアクセスの管理について学習します。 「アクセス制御リスト」を参照してください。
ヘルプを取得
Azure Databricks の設定に関する質問があり、ライブ ヘルプが必要な場合は、メールでお問い合わせください onboarding-help@databricks.com。
組織に Azure Databricks サポート サブスクリプションがない場合、またはご自分が会社のサポート サブスクリプションのための承認された連絡先でない場合は、Databricks Office Hours で、または Databricks Community から、多くの質問に対する回答を得ることができます。
追加のヘルプが必要な場合は、毎週のライブ デモにサインアップ して、Databricks の専門家と一緒に質問し、練習してください。 または、環境の管理と保守に関するベスト プラクティスに関するこちらのブログ シリーズに従ってください。