Direct Lake için göl evi oluşturma

Bu makalede, bir göl evi oluşturma, göl evinde delta tablosu oluşturma ve ardından Bir Microsoft Fabric çalışma alanında göl evi için temel bir anlam modeli oluşturma açıklanmaktadır.

Direct Lake için bir göl evi oluşturmaya başlamadan önce Direct Lake'e genel bakışokuduğunuzdan emin olun.

Göl evi oluşturma

  1. Microsoft Fabric çalışma alanınızda, Yeni>Diğer seçenekleriseçin ve ardından Veri Mühendisliğiiçinde Lakehouse kutucuğunu seçin.

    Veri mühendisliğindeki Lakehouse döşemesini gösteren ekran görüntüsü.

  2. New lakehouse iletişim kutusuna bir ad girin ve Oluşturöğesini seçin. Ad yalnızca alfasayısal karakterler ve alt çizgi içerebilir.

    Yeni göl evi iletişim kutusunu gösteren ekran görüntüsü.

  3. Yeni lakehouse'un oluşturulduğunu ve başarıyla açıldığını doğrulayın.

    Çalışma alanında oluşturulan lakehouse'un ekran görüntüsü.

Göl evinde Delta tablosu oluşturma

Yeni bir göl evi oluşturduktan sonra Direct Lake'in bazı verilere erişebilmesi için en az bir Delta tablosu oluşturmanız gerekir. Direct Lake parquet biçimli dosyaları okuyabilir, ancak en iyi performans için VORDER sıkıştırma yöntemini kullanarak verileri sıkıştırmak en iyisidir. VORDER, Power BI altyapısının yerel sıkıştırma algoritmasını kullanarak verileri sıkıştırır. Bu şekilde motor verileri mümkün olan en kısa sürede belleğe yükleyebilir.

Bir lakehouse'a veri yüklemek için veri hatları ve betikler dahil olmak üzere birden fazla seçenek vardır. Aşağıdaki adımlarda PySpark kullanarak Azure Open Datasettemelinde bir Delta tablosu bir lakehouse'a eklemek için:

  1. Yeni oluşturulan Lakehouse'ta, Not defteriniaç'ı seçin ve sonra Yeni not defteriniseçin.

    Yeni not defteri komutunu gösteren ekran görüntüsü.

  2. Spark'ın açık modele erişmesine izin vermek için aşağıdaki kod parçacığını kopyalayıp ilk kod hücresine yapıştırın ve ardından kodu çalıştırmak için Shift + Enter basın.

    # Azure storage access info
    blob_account_name = "azureopendatastorage"
    blob_container_name = "holidaydatacontainer"
    blob_relative_path = "Processed"
    blob_sas_token = r""
    
    # Allow SPARK to read from Blob remotely
    wasbs_path = 'wasbs://%s@%s.blob.core.windows.net/%s' % (blob_container_name, blob_account_name, blob_relative_path)
    spark.conf.set(
      'fs.azure.sas.%s.%s.blob.core.windows.net' % (blob_container_name, blob_account_name),
      blob_sas_token)
    print('Remote blob path: ' + wasbs_path)
    
    
  3. Kodun bir uzak blob yolunu başarıyla çıkış verdiğini doğrulayın.

    Uzak blob yolu çıkışını gösteren ekran görüntüsü.

  4. Aşağıdaki kodu kopyalayıp sonraki hücreye yapıştırın ve ardından Shift + Enter tuşlarına basın.

    # Read Parquet file into a DataFrame.
    df = spark.read.parquet(wasbs_path)
    print(df.printSchema())
    
    
  5. Kodun DataFrame şemasını başarıyla çıkardığını doğrulayın.

    Veri çerçevesi şema çıkışını gösteren ekran görüntüsü.

  6. Aşağıdaki satırları kopyalayıp sonraki hücreye yapıştırın ve ardından Shift + Enter tuşlarına basın. İlk yönerge VORDER sıkıştırma yöntemini etkinleştirir ve sonraki yönerge DataFrame'i lakehouse'da delta tablosu olarak kaydeder.

    # Save as delta table 
    spark.conf.set("spark.sql.parquet.vorder.enabled", "true")
    df.write.format("delta").saveAsTable("holidays")
    
    
  7. Tüm SPARK işlerinin başarıyla tamamlanmasını doğrulayın. Daha fazla ayrıntı görüntülemek için SPARK işleri listesini genişletin.

    SPARK işlerinin genişletilmiş listesini gösteren ekran görüntüsü.

  8. Tablonun başarıyla oluşturulup oluşturulmadığını doğrulamak için, sol üst alandaki Tablolaröğesinin yanındaki üç noktayı (...) seçin, ardından Yenileseçeneğini seçin ve sonra Tablolar düğümünü genişletin.

    Tablolar düğümü yakınındaki Yenile komutunu gösteren ekran görüntüsü.

  9. Yukarıdakiyle aynı yöntemi veya desteklenen diğer yöntemleri kullanarak analiz etmek istediğiniz veriler için daha fazla Delta tablosu ekleyin.

Göl evi için temel bir Direct Lake modeli oluşturma

  1. Lakehouse'unuzda Yeni anlamsal modelseçin ve ardından iletişim kutusunda dahil edilecek tabloları seçin.

    Yeni model oluşturmak için iletişim kutusunun ekran görüntüsü.

  2. Direct Lake modelini oluşturmak için Onayla'yı seçin. Model, lakehouse'unuzun adına göre çalışma alanına otomatik olarak kaydedilir ve ardından modeli açar.

    Power BI'da açık modeli gösteren ekran görüntüsü.

  3. Tablo ilişkileri ve DAX ölçüleri ekleyebileceğiniz Web modelleme deneyimini açmak için veri modeli seçin.

    Power BI'da Web modellemesini gösteren ekran görüntüsü.

İlişkileri ve DAX ölçülerini eklemeyi bitirdiğinizde, rapor oluşturabilir, bileşik bir model oluşturabilir ve XMLA uç noktaları aracılığıyla modeli diğer modellerle aynı şekilde sorgulayabilirsiniz.