AKS üzerinde Azure HDInsight'ta küme oluşturma hataları
Not
31 Ocak 2025'te AKS'de Azure HDInsight'ı kullanımdan kaldırmaya devam edeceğiz. 31 Ocak 2025'den önce, iş yüklerinizin aniden sonlandırılmasını önlemek için iş yüklerinizi Microsoft Fabric'e veya eşdeğer bir Azure ürününe geçirmeniz gerekir. Aboneliğinizdeki kalan kümeler durdurulur ve konaktan kaldırılır.
Kullanımdan kaldırma tarihine kadar yalnızca temel destek sağlanacaktır.
Önemli
Bu özellik şu anda önizlemededir. Microsoft Azure Önizlemeleri için Ek Kullanım Koşulları, beta, önizleme aşamasında olan veya henüz genel kullanıma sunulmamış Azure özellikleri için geçerli olan daha fazla yasal hüküm içerir. Bu belirli önizleme hakkında bilgi için bkz . AKS üzerinde Azure HDInsight önizleme bilgileri. Sorular veya özellik önerileri için lütfen AskHDInsight'ta ayrıntıları içeren bir istek gönderin ve Azure HDInsight Topluluğu hakkında daha fazla güncelleştirme için bizi takip edin.
Bu makalede AKS kümelerinde Azure HDInsight oluşturduğunuzda oluşabilecek hataların nasıl giderilebileceği ve çözülebileceği açıklanır.
Sr. Hayır | Hata İletisi | Nedeni | Çözüm |
---|---|---|---|
1 | InternalServerError UnrecognizableError | Bu hata, yanlış bir şablonun kullanıldığını gösterebilir. Şu anda veritabanı bağlayıcılarına yalnızca ARM şablonu aracılığıyla izin verilir. Bu nedenle şablonda yapılandırma doğrulaması mümkün değildir. | |
2 | InvalidClusterSpec - ServiceDependencyFailure - Geçersiz yapılandırma | Düğüm başına en fazla bellek hatası. | En yüksek bellek yapılandırmaları özellik değer türlerine bakın. |
3 | WaitingClusterResourcesReadyTimeOut - Meta veri deposu hizmeti okunmadı | Bu hatanın nedeni kapsayıcı adının yalnızca küçük harf, sayı ve kısa çizgi içermesi olabilir. Kapsayıcı adı bir harf veya sayı ile başlamalıdır. | Her kısa çizginin önüne ve ardından bir tire olmayan karakter gelmelidir. Ad da 3 ile 63 karakter uzunluğunda olmalıdır. |
4 | InvalidClusterSpec -Geçersiz yapılandırma - ClusterUpsertActivity | Hata: Geçersiz yapılandırma özelliği hive.metastore.uri: may not be null . |
Hive bağlayıcısı belgelerine bakın. |
5 | InternalServerError - An exception has been raised that is likely due to a transient failure. Consider enabling transient error resiliency by adding 'EnableRetryOnFailure()' to the 'UseSqlServer' call . |
İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. | |
6 | InternalServerError - ObjectDisposedException RP kodunda gerçekleşir. |
İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. | |
7 | PreconditionFailed - Kullanıcı aboneliğindeki kota sınırları nedeniyle işlem başarısız oldu. |
Küme oluşturmadan önce kota doğrulaması vardır. Ancak aynı abonelik altında aynı anda birkaç küme oluşturulduğunda, ilk küme kotayı kaplar ve diğeri kota yetersizliklerinden dolayı başarısız olabilir. | Yeterli kota olduğunu onaylayın ve küme/küme havuzu oluşturmayı yeniden deneyin. |
8 | ReconcileApplicationSecurityGroupError - İç AKS hatası |
İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. | |
9 | ResourceGroupBeingDeleted |
AKS kaynak oluşturma veya güncelleştirmesinde HDI sırasında, kullanıcı ilgili kaynak gruplarındaki bazı kaynakları da siliyor. | AKS kaynakları üzerinde HDI oluşturulurken veya güncelleştirilirken HDI ile ilgili kaynak gruplarındaki kaynakları silmeyin. |
10 | UpsertNodePoolTimeOut - Async operation dependentArmResourceTask has timed out . |
AKS sorunu – işlem sırasında belirli bir bölgedeki yüksek trafik nedeniyle olabilir. | Bir süre sonra işlemi yeniden deneyin. Mümkünse başka bir bölge kullanın. |
11 | Authorization_IdentityNotFound - {"code":null,"message":"The identity of the calling application could not be established."} |
1-p hizmet ilkesi kiracıya bağlı değildir. | Yeni kiracıda 1-p hizmet ilkesini sağlamak için komutunu yürüterek ekleme. |
12 | NotFound - ARM/AKS sdk error |
Kullanıcı AKS kümesinde HDI'yi güncelleştirmeyi dener ancak ilgili aracı havuzu silindi. | İlgili aracı havuzu silindi. AKS aracı havuzunun doğrudan çalıştırılması önerilmez. |
13 | AuthorizationFailed - Scope invalid role assignment issue with managed RG and cluster msi |
İşlemi gerçekleştirmek için izin eksikliği. | Size ait hata iletisinde belirtilen hizmet ilkesi uygulama kimliğini denetleyin. Evet ise, hata iletisine göre izni verin. Hayır ise Azure HDInsight ekibine bir destek bileti açın. |
14 | DeleteAksClusterFailed - {"code":"DeleteAksClusterFailed","message":"An Azure service request has failed. ErrorCode: 'DeleteAksClusterFailed', ErrorMessage: 'Delete HDI cluster namespcae failed. Additional info: 'Can't access a disposed object.\\r\\nObject name: 'Microsoft.Azure.Common.Configuration.ManagedConfiguration was already disposed'.''."} |
RP beklenmedik şekilde yeni bir rol örneğine geçti. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
15 | EntityStoreOperationError - ARM/AKS sdk error |
Küme güncelleştirmesi sırasında AKS tarafında veritabanı işlemi başarısız oldu. | Bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
16 | InternalServerError - {"exception":"System.Threading.Tasks.TaskCanceledException","message":"The operation was canceled."} |
Bu hata çeşitli sorunlara neden oldu. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
17 | InternalServerError - {"exception":"System.IO.IOException","message":"Unable to read data from the transport connection: A connection attempt failed because the connected party didn't properly respond after a period of time, or established connection failed because connected host has failed to respond."} |
Bu hata çeşitli sorunlara neden oldu. | bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
18 | InternalServerError - Null reference exception occurs in RP code . |
Bu hata çeşitli sorunlara neden oldu. | İşlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
19 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'InvalidOperationException, Sequence contains no elements.'"} |
Bu hata çeşitli sorunlara neden oldu. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
20 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'ArgumentNullException, Value can't be null. (Parameter 'roleAssignmentGuid')'"} |
Bu hata çeşitli sorunlara neden oldu. | işlemi yeniden deneyin veya Azure HDInsight ekibine bir destek bileti açın. |
21 | OperationNotAllowed - {"code":"OperationNotAllowed","message":"An Azure service request has failed. ErrorCode: 'OperationNotAllowed', ErrorMessage: 'Service request failed.\\r\\nStatus: 409 (Conflict)\\r\\n\\r\\nContent:\\r\\n{\\ n \\"code\\": \\"OperationNotAllowed\\",\\ n \\"details\\": null,\\ n \\"message\\": \\"Operation isn't allowed: Another agent pool operation (Scaling) is in progress, wait for it to finish before starting a new operation. |
Başka bir aracı havuzu işlemi (Ölçeklendirme) devam ediyor. Bu hata, RP Service Fabric'in yeniden başlatılması nedeniyle oluştu. | Yeni bir işlem başlatmadan önce önceki işlemin tamamlanmasını bekleyin. Yeniden denemeden sonra sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
22 | ReconcileVMSSAgentPoolFailed |
Küme oluşturmadan önce kota doğrulaması vardır. Ancak aynı abonelik altında aynı anda birkaç küme oluşturulduğunda, ilk küme kotayı kaplar ve diğerleri kota yetersizliklerinden dolayı başarısız olabilir. | Yeterli kota olduğunu onaylayın ve küme/küme havuzu oluşturmayı yeniden deneyin. |
23 | ReconcileVMSSAgentPoolFailed - Aracılardan giden bağlantı kurulamıyor |
AKS/VMSS yan sorun: VM bir hata bildirdi. |
bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
24 | InternalServerError - {"code":"InternalServerError","message":"An internal error has occurred, exception: 'SqlException'"} |
Bu hata geçici bir SQL bağlantısı sorunundan kaynaklanır. | bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
25 | NotLatestOperation - ARM/AKS SDK error |
İşlem devam edilemiyor. İşlem başka bir işlem tarafından önceden yüklenmiş veya işlemin gerektirdiği bilgiler kaydedilemedi (veya henüz kaydedilmedi). | bir süre sonra işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
26 | ReconcileVMSSAgentPoolFailed - Agent pool drain failed |
Ölçeği azaltma işlemiyle ilgili bir sorun oluştu. | Azure HDInsight ekibine bir destek bileti açın. |
27 | ResourceNotFound - ARM/AKS SDK error |
Bu hata sorunu, gerekli bir kaynak kullanıcı tarafından kaldırıldığında/silindiğinde oluşur. | Hata iletisinde belirtilen kaynağın mevcut olduğundan emin olun ve işlemi yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
28 | InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance _'xyz'_ has invalid request due to - [Hive metastore storage location access check timed out.] . |
SQL server veya depolamayla ilgili sorunlar nedeniyle HMS başlatma zaman aşımına uğradı. | Azure HDInsight ekibine bir destek bileti açın. |
29 | InvalidClusterSpec - The cluster instance deployment failed with reason 'System.DependencyFailure' and message 'Metastoreservice instance '_xyz_' has invalid request due to - [Keyvault secrets weren't configured properly. Failed to fetch secrets from keyvault.] . |
Bu hatanın nedeni keyvault erişilemez olması veya gizli anahtarın kullanılamaması olabilir. Bazı nadir durumlarda bu hata, küme düğümlerinde pod kimliğinin daha yavaş başlatılmasından kaynaklanıyor olabilir. |
Log Analytics'i etkinleştirdiyseniz nedenini belirlemek için günlüklerine secretprovider-validate job bakın.sorun devam ederse bir süre sonra işlemi yeniden deneyin, Azure HDInsight ekibine bir destek bileti açın. |
30 | FlinkCluster unready - {"FlinkCluster": "Status can't be determined"} |
Bu hata, görüntü çekme sorunu veya denetleyici podlarının hazır olmaması veya MSI ile ilgili bir sorun gibi çeşitli nedenlerden kaynaklanabilir. | Bir süre sonra işlemi yeniden deneyin; sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
31 | FlinkCluster unready - {"FlinkCluster": "StatefulSet instance 'flink-taskmanager' isn't ready due to - [Ready replicas don't match desired replica count]."} |
Bu hata, görüntü çekme sorunu veya denetleyici podlarının hazır olmaması veya MSI ile ilgili bir sorun gibi çeşitli nedenlerden kaynaklanabilir. | Bir süre sonra işlemi yeniden deneyin; sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
32 | InvalidClusterSpec (class com.microsoft.azure.hdinsight.services.spark.exception.ClusterConfigException:[SparkClusterValidator#ConfigurationValidator#][ISSUE:(1)-Component config valid:[[{serviceName='yarn-service,componentName=hadoop-config-client}, {serviceName='yarn-service,componentName=hadoop-config}]],current:[[{serviceName='yarn-service,componentName=yarn-config}' . |
Hizmet yapılandırması izin verilmeyen bileşenlerden oluşuyorsa bu hata oluşabilir. | Hizmet yapılandırma bileşenlerini doğrulayın ve yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
33 | InvalidClusterSpec -1,"conditions":[{"type":"RequestIsValid","status":"UNKNOWN","reason":"UNKNOWN","message":"Unable to determine status of one or more dependencies . |
Bu hata HMS, SPARK, YARN hizmetlerinin çalışmaması nedeniyle oluşabilir, bu hata depolamayla ilgili olabilir. | Azure HDInsight ekibine bir destek bileti açın. |
34 | WaitingClusterResourcesReadyTimeOut - Failed to reconcile from generation 1 to 1. |
Azure HDInsight ekibine bir destek bileti açın. | |
35 | WaitingClusterResourcesReadyTimeOut - {"YarnService":"StatefulSet instance 'resourcemanager' isn't ready due to - `` see service status for specific details and how to fix it. Failing services are: YarnService, SparkService"} |
Bu hata HMS, SPARK, YARN hizmetlerinin çalışmaması nedeniyle oluşabilir, bu hata depolamayla ilgili olabilir. | Azure HDInsight ekibine bir destek bileti açın. |
36 | InvalidClusterSpec - [spec.configs[0].files[3].fileName: Invalid value: "yarn-env.sh": spec.configs[0].files[3].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[0].files[3].values: Required value, spec.configs[1].files[2].fileName: Invalid value: "yarn-env.sh": spec.configs[1].files[2].fileName in body should match '(^yarn-site\\.xml$)|(^capacity-scheduler\\.xml$)|(^core-site\\.xml$)|(^mapred-site\\.xml$)', spec.configs[1].files[2].values: Required value] . |
Desteklenmeyen dosyalar hizmet yapılandırmasında geçirildiğinde bu hata oluşabilir. | Hizmet yapılandırma bileşenlerini doğrulayın ve yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
37 | InvalidClusterSpec - ".AccessDeniedException: Operation failed: "Server failed to authenticate the request. InvalidAuthenticationInfo, "Server failed to authenticate the request.." |
Geçersiz kimlik doğrulama parametreleri – depolama konumuna erişilemiyor. | Kimlik doğrulama parametrelerini düzeltin ve yeniden deneyin. Sorun devam ederse Azure HDInsight ekibine bir destek bileti açın. |
38 | InvalidClusterSpec - “_xyz_.dfs.core.windows.net isn't accessible. Reason: HTTP Error -1; url=. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException :. AzureADAuthenticator.getTokenCall threw java.net.SocketTimeoutException : Read timed out.] . |
Bu hata, HMS pod zamanlandığında pod kimlik kaynaklarının düğümde başlatılması çok uzun sürerse oluşabilir. | sorun devam ederse işlemi yeniden deneyin, Azure HDInsight ekibine bir destek bileti açın. |
Sonraki adımlar
- Küme yapılandırması sorunlarını giderme.