Etiketlerle Azure Machine Learning veri kümesi oluşturma ve keşfetme

Bu makalede, bir Azure Machine Learning veri etiketleme projesindeki veri etiketlerini dışarı aktarmayı ve bunları veri keşfi için pandas veri çerçevesi gibi popüler biçimlere yüklemeyi öğreneceksiniz.

Etiketleri olan veri kümeleri nelerdir?

Etiketli Azure Machine Learning veri kümeleri etiketli veri kümeleri olarak adlandırılır. Bu belirli veri kümeleri , ayrılmış etiket sütununa sahip TabularDataset'lerdir ve yalnızca Azure Machine Learning veri etiketleme projelerinin çıktısı olarak oluşturulur. Resim etiketleme veya metin etiketleme için bir veri etiketleme projesi oluşturun. Machine Learning, resim sınıflandırması için çok etiketli veya çok sınıflı veri etiketleme projelerini ve sınırlanmış kutularla birlikte nesne tanımlamayı destekler.

Önkoşullar

Veri etiketlerini dışarı aktarma

Veri etiketleme projesini tamamladığınızda, etiket verilerini bir etiketleme projesinden dışarı aktarabilirsiniz. Bunu yaparak hem verilere hem de etiketlerine yönelik başvuruyu yakalamanıza ve bunları COCO biçiminde veya Azure Machine Learning veri kümesi olarak dışarı aktarmanıza olanak tanır.

Etiketleme projenizin Proje ayrıntıları sayfasındaki Dışarı Aktar düğmesini kullanın.

Studio kullanıcı arabiriminde Dışarı Aktar düğmesi

COCO

COCO dosyası, Dışarı aktarma/coco içindeki bir klasörde Azure Machine Learning çalışma alanının varsayılan blob deposunda oluşturulur.

Not

Nesne algılama projelerinde, COCO dosyasında dışarı aktarılan "bbox": [x,y,width,height]" değerleri normalleştirilir. Bunlar 1'e ölçeklendirilir. Örnek: 640x480 piksel görüntüde 30 piksel genişliğinde, 60 piksel yüksekliğinde (10, 10) konumdaki sınırlayıcı kutuya (0,015625. 0,02083, 0,046875, 0,125) ek açıklama eklenir. Koordinatlar normalleştirildiğinden, tüm görüntüler için "genişlik" ve "yükseklik" olarak '0,0' olarak gösterilir. Gerçek genişlik ve yükseklik OpenCV veya Pillow(PIL) gibi Python kitaplığı kullanılarak elde edilebilir.

Azure Machine Learning veri kümesi

Dışarı aktarılan Azure Machine Learning veri kümesine Azure Machine Learning stüdyosu Veri Kümeleri bölümünden erişebilirsiniz. Veri kümesi Ayrıntıları sayfası ayrıca Python'dan etiketlerinize erişmek için örnek kod sağlar.

Dışarı aktarılan veri kümesi

İpucu

Etiketlenmiş verilerinizi bir Azure Machine Learning veri kümesine aktardıktan sonra AutoML'yi kullanarak etiketlenmiş verileriniz üzerinde eğitilen görüntü işleme modelleri oluşturabilirsiniz. Python ile görüntü işleme modellerini eğitmek için AutoML'yi ayarlama sayfasında daha fazla bilgi edinin

Pandas veri çerçevesi aracılığıyla etiketlenmiş veri kümelerini keşfetme

Sınıfından yöntemiyle to_pandas_dataframe() veri keşfi için popüler açık kaynak kitaplıklarından yararlanmak için etiketlenmiş veri kümelerinizi bir pandas veri çerçevesine azureml-dataprep yükleyin.

sınıfını aşağıdaki kabuk komutuyla yükleyin:

pip install azureml-dataprep

Aşağıdaki kodda animal_labels veri kümesi, daha önce çalışma alanına kaydedilmiş bir etiketleme projesinin çıktısıdır. Dışarı aktarılan veri kümesi bir TabularDataset'tir.

ŞUNUN IÇIN GEÇERLIDIR: Python SDK azureml v1

import azureml.core
from azureml.core import Dataset, Workspace

# get animal_labels dataset from the workspace
animal_labels = Dataset.get_by_name(workspace, 'animal_labels')
animal_pd = animal_labels.to_pandas_dataframe()

import matplotlib.pyplot as plt
import matplotlib.image as mpimg

#read images from dataset
img = mpimg.imread(animal_pd['image_url'].iloc(0).open())
imgplot = plt.imshow(img)

Sonraki adımlar