Etiketlerle Azure Machine Learning veri kümesi oluşturma ve keşfetme
Bu makalede, bir Azure Machine Learning veri etiketleme projesindeki veri etiketlerini dışarı aktarmayı ve bunları veri keşfi için pandas veri çerçevesi gibi popüler biçimlere yüklemeyi öğreneceksiniz.
Etiketleri olan veri kümeleri nelerdir?
Etiketli Azure Machine Learning veri kümeleri etiketli veri kümeleri olarak adlandırılır. Bu belirli veri kümeleri , ayrılmış etiket sütununa sahip TabularDataset'lerdir ve yalnızca Azure Machine Learning veri etiketleme projelerinin çıktısı olarak oluşturulur. Resim etiketleme veya metin etiketleme için bir veri etiketleme projesi oluşturun. Machine Learning, resim sınıflandırması için çok etiketli veya çok sınıflı veri etiketleme projelerini ve sınırlanmış kutularla birlikte nesne tanımlamayı destekler.
Önkoşullar
- Azure aboneliği. Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.
- Python için Azure Machine Learning SDK'sı veya Azure Machine Learning stüdyosu erişimi.
- Machine Learning çalışma alanı. Bkz . Çalışma alanı kaynakları oluşturma.
- Azure Machine Learning veri etiketleme projesine erişim. Etiketleme projeniz yoksa, önce resim etiketleme veya metin etiketleme için bir proje oluşturun.
Veri etiketlerini dışarı aktarma
Veri etiketleme projesini tamamladığınızda, etiket verilerini bir etiketleme projesinden dışarı aktarabilirsiniz. Bunu yaparak hem verilere hem de etiketlerine yönelik başvuruyu yakalamanıza ve bunları COCO biçiminde veya Azure Machine Learning veri kümesi olarak dışarı aktarmanıza olanak tanır.
Etiketleme projenizin Proje ayrıntıları sayfasındaki Dışarı Aktar düğmesini kullanın.
COCO
COCO dosyası, Dışarı aktarma/coco içindeki bir klasörde Azure Machine Learning çalışma alanının varsayılan blob deposunda oluşturulur.
Not
Nesne algılama projelerinde, COCO dosyasında dışarı aktarılan "bbox": [x,y,width,height]" değerleri normalleştirilir. Bunlar 1'e ölçeklendirilir. Örnek: 640x480 piksel görüntüde 30 piksel genişliğinde, 60 piksel yüksekliğinde (10, 10) konumdaki sınırlayıcı kutuya (0,015625. 0,02083, 0,046875, 0,125) ek açıklama eklenir. Koordinatlar normalleştirildiğinden, tüm görüntüler için "genişlik" ve "yükseklik" olarak '0,0' olarak gösterilir. Gerçek genişlik ve yükseklik OpenCV veya Pillow(PIL) gibi Python kitaplığı kullanılarak elde edilebilir.
Azure Machine Learning veri kümesi
Dışarı aktarılan Azure Machine Learning veri kümesine Azure Machine Learning stüdyosu Veri Kümeleri bölümünden erişebilirsiniz. Veri kümesi Ayrıntıları sayfası ayrıca Python'dan etiketlerinize erişmek için örnek kod sağlar.
İpucu
Etiketlenmiş verilerinizi bir Azure Machine Learning veri kümesine aktardıktan sonra AutoML'yi kullanarak etiketlenmiş verileriniz üzerinde eğitilen görüntü işleme modelleri oluşturabilirsiniz. Python ile görüntü işleme modellerini eğitmek için AutoML'yi ayarlama sayfasında daha fazla bilgi edinin
Pandas veri çerçevesi aracılığıyla etiketlenmiş veri kümelerini keşfetme
Sınıfından yöntemiyle to_pandas_dataframe()
veri keşfi için popüler açık kaynak kitaplıklarından yararlanmak için etiketlenmiş veri kümelerinizi bir pandas veri çerçevesine azureml-dataprep
yükleyin.
sınıfını aşağıdaki kabuk komutuyla yükleyin:
pip install azureml-dataprep
Aşağıdaki kodda animal_labels
veri kümesi, daha önce çalışma alanına kaydedilmiş bir etiketleme projesinin çıktısıdır.
Dışarı aktarılan veri kümesi bir TabularDataset'tir.
ŞUNUN IÇIN GEÇERLIDIR: Python SDK azureml v1
import azureml.core
from azureml.core import Dataset, Workspace
# get animal_labels dataset from the workspace
animal_labels = Dataset.get_by_name(workspace, 'animal_labels')
animal_pd = animal_labels.to_pandas_dataframe()
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
#read images from dataset
img = mpimg.imread(animal_pd['image_url'].iloc(0).open())
imgplot = plt.imshow(img)
Sonraki adımlar
- Azure'da görüntü sınıflandırma modellerini eğitmeyi öğrenin
- Python ile görüntü işleme modellerini eğitmek için AutoML’yi ayarlama