Azure HDInsight on AKS でのクラスター作成エラー

Note

Azure HDInsight on AKS は 2025 年 1 月 31 日に廃止されます。 ワークロードの突然の終了を回避するには、2025 年 1 月 31 日より前にそのワークロードを Microsoft Fabric または同等の Azure 製品に移行する必要があります。 サブスクリプション上に残っているクラスターは停止され、ホストから削除されます。

重要

現在、この機能はプレビュー段階にあります。 ベータ版、プレビュー版、または一般提供としてまだリリースされていない Azure の機能に適用されるその他の法律条項については、「Microsoft Azure プレビューの追加の使用条件」に記載されています。 この特定のプレビューについては、「Microsoft HDInsight on AKS のプレビュー情報」を参照してください。 質問や機能の提案については、詳細を記載した要求を AskHDInsight で送信してください。また、その他の更新情報については、Azure HDInsight コミュニティのフォローをお願いいたします。

この記事では、Azure HDInsight on AKS クラスターを作成するときに発生する可能性があるエラーのトラブルシューティングと解決の方法について説明します。

シリアルいいえ エラー メッセージ 原因 解決策
1 InternalServerError UnrecognizableError このエラーは、正しくないテンプレートが使用されたことを示している可能性があります。 現時点では、データベース コネクタは ARM テンプレート経由でのみ許可されています。 そのため、テンプレートで構成の検証を行うことはできません。
2 InvalidClusterSpec - ServiceDependencyFailure - Invalid configuration ノードあたりの最大メモリ エラー。 プロパティ値の型の最大メモリ構成を参照してください。
3 WaitingClusterResourcesReadyTimeOut - Metastoreservice unready このエラーは、コンテナー名に含めることができるのが小文字、数字、ハイフンのみであることが原因である可能性があります。 コンテナー名の先頭と末尾は、文字または数字にする必要があります。 各ハイフンの前後にはハイフン以外の文字を指定する必要があります。 また、名前は 3 から 63 文字で指定する必要があります。
4 InvalidClusterSpec -Invalid configuration - ClusterUpsertActivity エラー: 無効な構成プロパティ hive.metastore.uri: may not be null Hive コネクタのドキュメントを参照してください。
5 InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
6 InternalServerError - ObjectDisposedException occurs in RP code. 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
7 PreconditionFailed - Operation failure due to quota limits on user subscription. クラスターを作成する前にクォータの検証があります。 ただし、複数のクラスターが同じサブスクリプションで同時に作成されると、最初のクラスターがクォータを占有し、その他のクラスターがクォータ不足のために失敗する可能性があります。 十分なクォータがあることを確認して、クラスター/クラスター プールの作成を再試行してください。
8 ReconcileApplicationSecurityGroupError - Internal AKS error 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
9 ResourceGroupBeingDeleted HDI on AKS リソースの作成または更新中に、関連するリソース グループ内の一部のリソースの削除もユーザーが行っています。 HDI on AKS リソースが作成または更新されているときは、HDI 関連のリソース グループ内のリソースを削除しないでください。
10 UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out AKS の問題 – 操作時に特定のリージョンのトラフィックが多かったためである可能性があります。 しばらくしてから操作を再試行してください。 可能であれば、別のリージョンを使用してください。
11 Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} 1-p サービスの原則が、テナントにオンボードされていません。 オンボードするために、新しいテナントに 1-p サービス プリンシパルをプロビジョニングするコマンドを実行してください。
12 NotFound - ARM/AKS sdk error ユーザーが HDI on AKS クラスターを更新しようとしていますが、対応するエージェント プールが削除されています。 対応するエージェント プールが削除されています。 AKS エージェント プールを直接操作することはお勧めしません。
13 AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi 操作を実行するためのアクセス許可がありません。 エラー メッセージに記載されているサービス プリンシパル アプリ ID を自分が所有しているかどうかを確認します。 している場合は、エラー メッセージに従ってアクセス許可を付与してください。 していない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
14 DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespcae failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} RP が予期せず新しいロール インスタンスに切り替わりました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
15 EntityStoreOperationError - ARM/AKS sdk error クラスターの更新中に AKS 側でデータベース操作が失敗しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
16 InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
17 InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} このエラーは、さまざまな問題が原因で発生しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
18 InternalServerError - Null reference exception occurs in RP code このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
19 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
20 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} このエラーは、さまざまな問題が原因で発生しました。 操作を再試行するか、Azure HDInsight チームへのサポート チケットを発行してください。
21 OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. 別のエージェント プール操作 (スケーリング) が進行中です。 このエラーは、RP Service Fabric の再起動が原因で発生しました。 前の操作が完了するまで待ってから、新しい操作を開始してください。 再試行後も問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
22 ReconcileVMSSAgentPoolFailed クラスターを作成する前にクォータの検証があります。 ただし、複数のクラスターが同じサブスクリプションで同時に作成されると、最初のクラスターがクォータを占有し、その他のクラスターがクォータ不足のために失敗する可能性があります。 十分なクォータがあることを確認して、クラスター/クラスター プールの作成を再試行してください。
23 ReconcileVMSSAgentPoolFailed - Unable to establish outbound connection from agents AKS/VMSS 側の問題: VM が障害を報告しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
24 InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} このエラーは、SQL 接続の一時的な問題が原因で発生しました。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
25 NotLatestOperation - ARM/AKS SDK error 操作を続行できません。 操作が別の操作によって割り込まれているか、操作に必要な情報が保存できませんでした (またはまだ保存されていません)。 しばらくしてから操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
26 ReconcileVMSSAgentPoolFailed - Agent pool drain failed スケールダウン操作に問題が発生しました。 Azure HDInsight チームへのサポート チケットを発行してください。
27 ResourceNotFound - ARM/AKS SDK error このエラー問題は、必要なリソースがユーザーによって削除されたときに発生します。 エラー メッセージに記載されているリソースが存在することを確認してから、操作を再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
28 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] SQL サーバーまたはストレージ関連の問題により、HMS の初期化がタイムアウトになる場合があります。 Azure HDInsight チームへのサポート チケットを発行してください。
29 InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] このエラーは、keyvault にアクセスできないか、秘密鍵を使用できないことが原因で発生する可能性があります。 まれに、このエラーの原因は、クラスター ノードでのポッド ID インフラストラクチャの初期化が遅くなっていることである可能性があります。 Log Analytics を有効にしている場合は、secretprovider-validate job のログを確認して理由を特定します。しばらくしてから操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
30 FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} このエラーは、イメージ プルの問題、コントローラー ポッドの準備未完了、MSI の問題などのさまざまな理由で発生する可能性があります。 しばらくしてから操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
31 FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} このエラーは、イメージ プルの問題、コントローラー ポッドの準備未完了、MSI の問題などのさまざまな理由で発生する可能性があります。 しばらくしてから操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
32 InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' このエラーは、許可されていないコンポーネントでサービス構成が構成されている場合に発生する可能性があります。 サービス構成コンポーネントを検証してから、再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
33 InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies このエラーは、HMS、SPARK、YARN の各サービスが稼働していないために発生する可能性があります。このエラーはストレージに関連している可能性があります。 Azure HDInsight チームへのサポート チケットを発行してください。
34 WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. Azure HDInsight チームへのサポート チケットを発行してください。
35 WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} このエラーは、HMS、SPARK、YARN の各サービスが稼働していないために発生する可能性があります。このエラーはストレージに関連している可能性があります。 Azure HDInsight チームへのサポート チケットを発行してください。
36 InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] このエラーは、サポートされていないファイルがサービス構成で渡されるときに発生する可能性があります。 サービス構成コンポーネントを検証してから、再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
37 InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." 認証パラメーターが無効です。ストレージの場所にアクセスできません。 認証パラメーターを修正して、再試行してください。 問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。
38 InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] このエラーは、HMS ポッドがスケジュールされていて、ポッド ID リソースがノードで開始するのに時間がかかりすぎるときに発生する可能性があります。 操作を再試行してください。問題が解決しない場合は、Azure HDInsight チームへのサポート チケットを発行してください。

次のステップ