Verileri Özetleme
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- makine öğrenimi projelerini ML Studio (klasik) konumundan Azure Machine Learning taşımaya yönelik bilgilerebakın.
- Azure Machine Learninghakkında daha fazla bilgi edinin.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Bir veri kümesindeki sütunlar için temel bir açıklayıcı istatistik raporu oluşturur
Kategori: Istatistiksel işlevler
Not
uygulama hedefi: yalnızca Machine Learning Studio (klasik)
benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.
Modüle genel bakış
bu makalede, giriş tablosundaki her bir sütunu açıklayan bir dizi standart istatistiksel ölçü oluşturmak için Machine Learning Studio 'da (klasik) özet verileri modülünün nasıl kullanılacağı açıklanır.
Bu tür Özet istatistikleri, tüm veri kümesinin özelliklerini anlamak istediğinizde faydalıdır. Örneğin, şunları bilmeniz gerekebilir:
- Her sütunda kaç tane eksik değer var?
- Bir özellik sütununda kaç benzersiz değer var?
- Her sütun için Ortalama ve standart sapma nedir?
Modül her bir sütunun önemli puanlarını hesaplar ve giriş olarak girilen her değişken (veri sütunu) için bir Özet istatistikleri satırı döndürür.
İpucu
Daha önce, Studio 'daki (klasik) Görselleştir seçeneğini kullanarak bir istatistik listesinin kısa bir listesini alabileceğiniz zaten haberdar olabilirsiniz. Ancak, bu görselleştirme, bazı en çok sayıda satıra göre oluşturulur. Buna karşılık, özetleme verileri modülü tüm veri satırlarında istatistiklerini hesaplar.
Özet verileri kullanma
Özet verileri modülünü denemenize ekleyin. Bu modülü, Studio 'daki Istatistiksel işlevler kategorisinde bulabilirsiniz (klasik).
rapor oluşturmak istediğiniz veri kümesini Bağlan.
Yalnızca bazı sütunlara raporlamak istiyorsanız, birlikte çalışmak üzere bir sütun alt kümesini proje yapmak için veri kümesindeki sütunları seçme modülünü kullanın.
Ek parametre gerekmez. Varsayılan olarak, modül girdi olarak sunulan tüm sütunları analiz eder ve sütunlardaki değerlerin türüne bağlı olarak, sonuçlar bölümünde açıklandığı gibi ilgili bir istatistik kümesi verir.
Denemeyi çalıştırın veya modüle sağ tıklayıp Seçileni Çalıştır' ı seçin.
Sonuçlar
Modülden rapor aşağıdaki istatistikleri içerebilir.
Oluşturulan tam istatistikler, sütun veri türüne bağlıdır. Ayrıntılar için Teknik notlar bölümüne bakın.
Varsayım, örneklerin bir popülasyonun temsili örneğine ait olduğu varsayımına yapılır. Bir popülasyon üzerinde istatistikleri hesapladıysanız, örnek veya popülasyon istatistiklerini hesaplabilen Hesaplama basit istatistikleri modülündeki seçenekleri kullanın.
Sütun adı | Description |
---|---|
Özellik | Sütunun adı |
Count | Tüm satırların sayısı |
Benzersiz değer sayısı | Sütundaki benzersiz değer sayısı |
Eksik değer sayısı | Sütundaki benzersiz değer sayısı |
Min | Sütundaki en düşük değer |
Biçimlendir | Sütundaki en yüksek değer |
Ortası | Tüm sütun değerlerinin ortalaması |
Ortalama sapma | Sütun değerlerinin ortalama sapması |
1. DÖRTTEBİRLİK | İlk dörttebir değer |
Ortanca | Ortanca sütun değeri |
3. DÖRTTEBİRLİK | Üçüncü dörttebir değer |
Mod | Sütun değerlerinin modu |
Aralık | Maksimum ve minimum değerler arasındaki değer sayısını temsil eden tamsayı |
Örnek varyans | Sütun varyansı; bkz. nota |
Örnek standart sapması | Sütun için standart sapma; bkz. nota |
Örnek çarpıklığı | Sütun için çarpıklık; bkz. nota |
Örnek basıklık | Sütun için basıklık; bkz. nota |
P 0,5 | % 0,5 yüzdebirlik |
P1 | 1% yüzdebirlik |
P5 | 5% yüzdebirlik |
P95 | %95 yüzdebirlik |
P 99,5 | % 99,5 yüzdebirlik |
İpucu
BI raporlama araçlarındaki verileri kullanabilmeniz için istatistik raporunun bir tablo veri kümesi olarak çıkışını yapın veya bu değerleri denemenin içindeki başka bir işleme girdi olarak kullanabilirsiniz.
Örnekler
Özet verileri modülünü bir deneyle kullanma örnekleri için Azure yapay zeka Galerisibakın:
veri kümesini uci 'dan indir: bir veri kümesini, uci Machine Learning deposundaki URL 'sini kullanarak CSV biçiminde okur ve veri kümesiyle ilgili bazı temel istatistikleri oluşturur.
Veri kümesi işleme ve analiz: veri kümesini çalışma alanına yükler, sütun adlarını değiştirir ve meta verileri ekler.
Öğrenci performansı tahmini: Azure Blob depolama 'dan TSV biçiminde depolanan verileri okur.
Teknik notlar
Sayısal ve Boole sütunlarında ortalama, ortanca, mod ve standart sapmanın çıktısını alabilirsiniz.
Sayısal olmayan sütunlar için yalnızca Count, Unique Value Countve Missing değer Count değerleri hesaplanır. Diğer İstatistikler için null değeri döndürülür.
Boole değerleri içeren sütunlar şu kurallar kullanılarak işlenir:
Minhesaplanırken, MANTıKSAL bir ve uygulanır.
Maxhesaplanırken, BIR mantıksal or uygulandı
İşlem aralığıhesaplanırken, modül ilk olarak sütundaki benzersiz değer sayısının 2 ' ye eşit olup olmadığını denetler.
Kayan nokta hesaplamaları gerektiren herhangi bir istatistiği hesaplarken, true değeri 1,0 olarak değerlendirilir ve false değerleri 0,0 olarak değerlendirilir.
Beklenen girişler
Ad | Tür | Description |
---|---|---|
Veri kümesi | Veri tablosu | Giriş veri kümesi |
Çıktı
Ad | Tür | Description |
---|---|---|
Sonuç veri kümesi | Veri tablosu | Açıklayıcı istatistikleri içeren giriş veri kümesinin bir profili |
Özel durumlar
Özel durum | Description |
---|---|
Hata 0003 | Bir veya daha fazla giriş null veya boş olduğunda özel durum oluşur. |
Hata 0020 | Modüle geçirilen bazı veri kümelerinde sütun sayısı çok küçük olduğunda özel durum oluşur. |
Hata 0021 | Modüle geçirilen bazı veri kümelerinde satır sayısı çok küçük olduğunda özel durum oluşur. |
Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.
apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.
Ayrıca bkz.
İstatistiksel Işlevler
İşlem öğesel Istatistiklerini hesaplama