Veri kaynaklarına bağlanma
Bu makalede yöneticilerin ve diğer güçlü kullanıcıların Azure Databricks ile veri kaynakları arasındaki bağlantıları nasıl yapılandırabileceğine ilişkin ayrıntılı öneriler sağlanmaktadır. Dış sistemdeki verileri okuma erişiminizin olup olmadığını belirlemeye çalışıyorsanız, çalışma alanınızda erişiminiz olan verileri gözden geçirerek başlayın. Bkz. Verileri bulma.
Azure Databricks hesabınızı bulut nesne depolaması, ilişkisel veritabanı yönetim sistemleri, akış veri hizmetleri ve CRM'ler gibi kurumsal platformlar gibi veri kaynaklarına bağlayabilirsiniz. Bağlantıları yapılandırmak için gereken belirli ayrıcalıklar veri kaynağına, Azure Databricks çalışma alanınızdaki izinlerin nasıl yapılandırıldığına, kaynaktaki verilerle etkileşim kurmak için gereken izinlere, veri idare modelinize ve bağlanmak için tercih ettiğiniz yönteme bağlıdır.
Çoğu yöntem, sistemleri tümleştirmek için gerekli izinleri yapılandırmak için hem veri kaynağında hem de Azure Databricks çalışma alanında yükseltilmiş ayrıcalıklar gerektirir. Bu izinlere sahip olmayan kullanıcılar yardım istemelidir. Bkz. Veri kaynaklarına erişim isteme.
Nesne depolama bağlantılarını yapılandırma
Bulut nesne depolaması, Azure Databricks'te çoğu veriyi depolamak için temel sağlar. Bulut nesne depolaması ve Azure Databricks'in verileri nerede depoladığı hakkında daha fazla bilgi edinmek için bkz . Azure Databricks verileri nereye yazar?.
Databricks, bulut nesne depolamasına erişimi yapılandırmak için Unity Kataloğu'nu kullanmanızı önerir. Unity Kataloğu, bulut nesne depolama alanında hem yapılandırılmış hem de yapılandırılmamış veriler için veri idaresi sağlar. Bkz . Unity Kataloğu'nu kullanarak bulut nesne depolamasına bağlanma.
Unity Kataloğu kullanmayan müşterilerin eski yöntemleri kullanarak bağlantıları yapılandırmaları gerekir. Bkz. Azure Databricks için bulut nesne depolamasına erişimi yapılandırma.
Ağı bulut nesne depolama alanına yapılandırmak için bkz . Ağ oluşturma.
Dış veri sistemlerine bağlantıları yapılandırma
Databricks, gereksinimlerinize bağlı olarak dış veri sistemlerine bağlantıları yapılandırmak için çeşitli seçenekler önerir. Aşağıdaki tabloda bu seçeneklere üst düzey bir genel bakış sağlanmaktadır:
Seçenek | Açıklama |
---|---|
Lakehouse Federasyonu | Kurumsal veri sistemlerindeki verilere salt okunur erişim sağlar. Bağlantılar, Unity Kataloğu aracılığıyla katalog veya şema düzeyinde yapılandırılır ve birden çok tabloyu tek bir yapılandırmayla eşitler. Bkz. Lakehouse Federasyonu nedir?. |
İş Ortağı Bağlantısı | Dış veri kaynaklarına bağlanmak ve lakehouse'a veri alımını otomatikleştirmek için teknoloji iş ortağı çözümlerinden yararlanır. Bazı çözümler arasında ters ETL ve dış sistemlerden lakehouse verilerine doğrudan erişim de bulunur. Bkz. Databricks İş Ortağı Bağlantısı nedir? |
Sürücüler | Azure Databricks, her Databricks Runtime'daki dış veri sistemleri için sürücüler içerir. İsteğe bağlı olarak, diğer sistemlerdeki verilere erişmek için üçüncü taraf sürücüleri yükleyebilirsiniz. Her tablo için bağlantıları yapılandırmanız gerekir. Bazı sürücüler yazma erişimi içerir. Bkz . Dış sistemlere bağlanma. |
JDBC | Yerel JDBC desteği üzerine inşa edilen dış sistemler için dahil edilen çeşitli sürücüler ve JDBC seçeneği, diğer sistemlere bağlantıları yapılandırmak için genişletilebilir seçenekler sağlar. Her tablo için bağlantıları yapılandırmanız gerekir. Bkz. JDBC kullanarak veritabanlarını sorgulama. |
Akış veri kaynaklarına bağlanma
Azure Databricks, birçok akış veri sistemi için iyileştirilmiş bağlayıcılar sağlar.
Tüm akış veri kaynakları için erişim sağlayan kimlik bilgileri oluşturmanız ve bu kimlik bilgilerini Azure Databricks'e yüklemeniz gerekir. Databricks, tüm yapılandırma seçeneklerinde ve tüm erişim modlarında gizli dizileri kullanabileceğiniz için gizli dizileri kullanarak kimlik bilgilerinin depolanmasını önerir.
Akış kaynakları için tüm veri bağlayıcıları, akış sorguları tanımlarken seçenekleri kullanarak kimlik bilgilerinin geçirilmesini destekler. Bkz . Akış veri kaynaklarını yapılandırma.
Veri kaynaklarına erişim isteme
Birçok kuruluşta kullanıcıların çoğu Azure Databricks veya dış veri kaynaklarında veri bağlantılarını yapılandırmak için yeterli ayrıcalıklara sahip değildir.
Kuruluşunuz, bu sayfadan bağlantılı makalelerde açıklanan desenlerden birini kullanarak bir veri kaynağına erişimi zaten yapılandırmış olabilir. Kuruluşunuzun verilere erişim istemek için iyi tanımlanmış bir işlemi varsa, Databricks bu sürecin izlenmesini önerir.
Bir veri kaynağına nasıl erişim kazanabileceğinizden emin değilseniz, bu yordam size yardımcı olabilir:
- Erişebileceğiniz tabloları ve birimleri görüntülemek için Katalog Gezgini'ni kullanın. Bkz . Katalog Gezgini nedir?.
- Ekip arkadaşlarınıza veya yöneticilerinize erişebilecekleri veri kaynaklarını sorun.
- Çoğu kuruluş, çalışma alanı kullanıcılarının izinlerini yönetmek için kimlik sağlayıcılarından eşitlenen grupları (örneğin: Okta veya Microsoft Entra ID) kullanır. Ekibinizin diğer üyeleri erişmeniz gereken veri kaynaklarına erişebiliyorsa, çalışma alanı yöneticisinin size erişim vermek için sizi doğru gruba eklemesini sağlayın.
- Belirli bir tablo, birim veya veri kaynağı bir iş arkadaşı tarafından yapılandırıldıysa, bu kişinin size verilere erişim izni verme izinleri olmalıdır.
- Bazı kuruluşlar, işlem kümeleri ve SQL ambarları üzerindeki ayarlar aracılığıyla veri erişimi izinlerini yapılandırıyor.
- Veri kaynaklarına erişim, hesaplamaya göre farklılık gösterebilir.
- İşlem sekmesinde işlem oluşturucusunu görüntüleyebilirsiniz. Erişilebilir olması gereken veri kaynakları hakkında soru sormak için oluşturucuya ulaşın.