Azure Açık Veri Kümeleri nedir ve bunları nasıl kullanabilirsiniz?
Azure Açık Veri Kümeleri , daha doğru modeller için makine öğrenmesi çözümlerine senaryoya özgü özelliklere ekleyebileceğiniz genel veri kümeleridir. Açık Veri Kümeleri bulutta, Microsoft Azure'da kullanılabilir. Azure Machine Learning ile tümleşiktir ve Azure Databricks ve Machine Learning Studio (klasik) tarafından kullanılabilir. Veri kümelerine API'ler aracılığıyla da erişebilir ve bunları Power BI ve Azure Data Factory gibi diğer ürünlerde kullanabilirsiniz.
Veri kümeleri, makine öğrenmesi modellerini eğitip tahmine dayalı çözümleri zenginleştirmenize yardımcı olan hava durumu, nüfus sayımı, tatiller, kamu güvenliği ve konum için genel etki alanı verilerini içerir. Genel veri kümelerinizi Azure Açık Veri Kümeleri aracılığıyla da paylaşabilirsiniz.
Seçilmiş, hazırlanmış veri kümeleri
Azure Açık Veri Kümeleri'ndeki seçilmiş açık genel veri kümeleri, makine öğrenmesi iş akışlarında kullanım için iyileştirilmiştir.
Kullanılabilir veri kümeleri hakkında daha fazla bilgi için Azure Açık Veri Kümeleri Kataloğu kaynağını ziyaret edin.
Veri bilimciler genellikle zamanlarının çoğunu gelişmiş analiz için verileri temizlemek ve hazırlamak için harcar. Zaman kazanmak için açık Veri kümeleri Azure buluta kopyalanır ve ardından önceden işlenir. Düzenli aralıklarla, veriler kaynaklardan çekilir - örneğin, Ulusal Okyanus ve Atmosfer İdaresi 'ne (NOAA) bir FTP bağlantısı tarafından. Daha sonra veriler yapılandırılmış bir biçimde ayrıştırılır ve ardından posta kodu veya en yakın hava durumu istasyonlarının konumları gibi özelliklerle gerektiği gibi zenginleştirilir.
Veri kümeleri, erişim ve işlemeyi kolaylaştırmak için Azure'da bulut işlem ile birlikte barındırılır.
Kullanılabilir veri kümelerinin örnekleri aşağıda verilmiştir:
Hava durumu verileri
Veri kümesi | Notebooks | Açıklama |
---|---|---|
NOAA Tümleşik Surface Verileri (ISD) | Azure Notebooks Azure Databricks |
NOAA'dan Kuzey Amerika, Avrupa, Avustralya ve Asya'nın bazı bölgelerinde en iyi uzamsal kapsama sahip dünya çapında saatlik hava durumu verileri. Günlük olarak güncelleştirildi. |
NOAA Genel Tahmin Sistemi (GFS) | Azure Notebooks Azure Databricks |
NOAA'dan 15 günlük ABD saatlik hava durumu tahmini verileri. Günlük olarak güncelleştirildi. |
Takvim verileri
Veri kümesi | Notebooks | Açıklama |
---|---|---|
Resmi Tatiller | Azure Notebooks Azure Databricks |
1970'ten 2099'a kadar 41 ülke veya bölgeyi kapsayan dünya çapında resmi tatil verileri. Ülke/bölge ve çoğu kişinin ücretli izinli olup olmadığını içerir. |
Veri kümelerine erişim
Azure hesabıyla açık veri kümelerine kod aracılığıyla veya Azure hizmet arabirimi aracılığıyla erişebilirsiniz. Veriler, makine öğrenmesi çözümlerinizde kullanılmak üzere Azure bulut işlem kaynaklarıyla birlikte bulunur.
Açık Veri Kümeleri'ni Azure Machine Learning kullanıcı arabirimi ve SDK'sı aracılığıyla kullanabilirsiniz. Açık Veri Kümeleri ayrıca Azure Machine Learning ve Azure Databricks'e veri bağlayabilen Azure Notebooks ve Azure Databricks not defterleri sağlar. Veri kümelerine Python SDK'sı üzerinden de erişim sağlanabilir.
Ancak Açık Veri Kümeleri'ne erişmek için bir Azure hesabına ihtiyacınız yoktur. Spark bulunan veya bulunmayan herhangi bir Python ortamından erişebilirsiniz.
Veri kümelerini isteme veya katkıda bulunma
İstediğiniz verileri bulamıyorsanız, bir veri kümesi istemek veya bir veri kümesine katkıda bulunmak için bize e-posta gönderin.