Verileri Özetleme

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bir veri kümesindeki sütunlar için temel bir açıklayıcı istatistik raporu oluşturur

Kategori: Istatistiksel işlevler

Not

uygulama hedefi: yalnızca Machine Learning Studio (klasik)

benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.

Modüle genel bakış

bu makalede, giriş tablosundaki her bir sütunu açıklayan bir dizi standart istatistiksel ölçü oluşturmak için Machine Learning Studio 'da (klasik) özet verileri modülünün nasıl kullanılacağı açıklanır.

Bu tür Özet istatistikleri, tüm veri kümesinin özelliklerini anlamak istediğinizde faydalıdır. Örneğin, şunları bilmeniz gerekebilir:

  • Her sütunda kaç tane eksik değer var?
  • Bir özellik sütununda kaç benzersiz değer var?
  • Her sütun için Ortalama ve standart sapma nedir?

Modül her bir sütunun önemli puanlarını hesaplar ve giriş olarak girilen her değişken (veri sütunu) için bir Özet istatistikleri satırı döndürür.

İpucu

Daha önce, Studio 'daki (klasik) Görselleştir seçeneğini kullanarak bir istatistik listesinin kısa bir listesini alabileceğiniz zaten haberdar olabilirsiniz. Ancak, bu görselleştirme, bazı en çok sayıda satıra göre oluşturulur. Buna karşılık, özetleme verileri modülü tüm veri satırlarında istatistiklerini hesaplar.

Özet verileri kullanma

  1. Özet verileri modülünü denemenize ekleyin. Bu modülü, Studio 'daki Istatistiksel işlevler kategorisinde bulabilirsiniz (klasik).

  2. rapor oluşturmak istediğiniz veri kümesini Bağlan.

    Yalnızca bazı sütunlara raporlamak istiyorsanız, birlikte çalışmak üzere bir sütun alt kümesini proje yapmak için veri kümesindeki sütunları seçme modülünü kullanın.

  3. Ek parametre gerekmez. Varsayılan olarak, modül girdi olarak sunulan tüm sütunları analiz eder ve sütunlardaki değerlerin türüne bağlı olarak, sonuçlar bölümünde açıklandığı gibi ilgili bir istatistik kümesi verir.

  4. Denemeyi çalıştırın veya modüle sağ tıklayıp Seçileni Çalıştır' ı seçin.

Sonuçlar

Modülden rapor aşağıdaki istatistikleri içerebilir.

  • Oluşturulan tam istatistikler, sütun veri türüne bağlıdır. Ayrıntılar için Teknik notlar bölümüne bakın.

  • Varsayım, örneklerin bir popülasyonun temsili örneğine ait olduğu varsayımına yapılır. Bir popülasyon üzerinde istatistikleri hesapladıysanız, örnek veya popülasyon istatistiklerini hesaplabilen Hesaplama basit istatistikleri modülündeki seçenekleri kullanın.

Sütun adı Description
Özellik Sütunun adı
Count Tüm satırların sayısı
Benzersiz değer sayısı Sütundaki benzersiz değer sayısı
Eksik değer sayısı Sütundaki benzersiz değer sayısı
Min Sütundaki en düşük değer
Biçimlendir Sütundaki en yüksek değer
Ortası Tüm sütun değerlerinin ortalaması
Ortalama sapma Sütun değerlerinin ortalama sapması
1. DÖRTTEBİRLİK İlk dörttebir değer
Ortanca Ortanca sütun değeri
3. DÖRTTEBİRLİK Üçüncü dörttebir değer
Mod Sütun değerlerinin modu
Aralık Maksimum ve minimum değerler arasındaki değer sayısını temsil eden tamsayı
Örnek varyans Sütun varyansı; bkz. nota
Örnek standart sapması Sütun için standart sapma; bkz. nota
Örnek çarpıklığı Sütun için çarpıklık; bkz. nota
Örnek basıklık Sütun için basıklık; bkz. nota
P 0,5 % 0,5 yüzdebirlik
P1 1% yüzdebirlik
P5 5% yüzdebirlik
P95 %95 yüzdebirlik
P 99,5 % 99,5 yüzdebirlik

İpucu

BI raporlama araçlarındaki verileri kullanabilmeniz için istatistik raporunun bir tablo veri kümesi olarak çıkışını yapın veya bu değerleri denemenin içindeki başka bir işleme girdi olarak kullanabilirsiniz.

Örnekler

Özet verileri modülünü bir deneyle kullanma örnekleri için Azure yapay zeka Galerisibakın:

Teknik notlar

  • Sayısal ve Boole sütunlarında ortalama, ortanca, mod ve standart sapmanın çıktısını alabilirsiniz.

  • Sayısal olmayan sütunlar için yalnızca Count, Unique Value Countve Missing değer Count değerleri hesaplanır. Diğer İstatistikler için null değeri döndürülür.

  • Boole değerleri içeren sütunlar şu kurallar kullanılarak işlenir:

    • Minhesaplanırken, MANTıKSAL bir ve uygulanır.

    • Maxhesaplanırken, BIR mantıksal or uygulandı

    • İşlem aralığıhesaplanırken, modül ilk olarak sütundaki benzersiz değer sayısının 2 ' ye eşit olup olmadığını denetler.

    • Kayan nokta hesaplamaları gerektiren herhangi bir istatistiği hesaplarken, true değeri 1,0 olarak değerlendirilir ve false değerleri 0,0 olarak değerlendirilir.

Beklenen girişler

Ad Tür Description
Veri kümesi Veri tablosu Giriş veri kümesi

Çıktı

Ad Tür Description
Sonuç veri kümesi Veri tablosu Açıklayıcı istatistikleri içeren giriş veri kümesinin bir profili

Özel durumlar

Özel durum Description
Hata 0003 Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur.
Hata 0020 Modüle geçirilen bazı veri kümelerinde sütun sayısı çok küçük olduğunda özel durum oluşur.
Hata 0021 Modüle geçirilen bazı veri kümelerinde satır sayısı çok küçük olduğunda özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

İstatistiksel Işlevler
İşlem öğesel Istatistiklerini hesaplama