Azure OpenAI Service modelleri

Azure OpenAI Service, farklı özelliklere ve fiyat noktalarına sahip çeşitli modeller tarafından desteklenir. Model kullanılabilirliği bölgeye ve buluta göre değişir. Azure Kamu model kullanılabilirliği için lütfen openAI hizmeti Azure Kamu bakın.

Modeller Açıklama
GPT-4o & GPT-4o mini & GPT-4 Turbo Hem metin hem de görüntüleri giriş olarak kabul edebilen, çok modüllü sürümlere sahip en son en yetenekli Azure OpenAI modelleri.
GPT-4 GPT-3.5'te iyileştiren ve doğal dil ve kod anlayıp oluşturabilen bir model kümesi.
GPT-3.5 GPT-3'te iyileştiren ve doğal dil ve kod anlayıp oluşturabilen bir model kümesi.
Eklemeler Metin benzerliğini kolaylaştırmak için metni sayısal vektör biçimine dönüştürebilen bir model kümesi.
DALL-E Doğal dilden özgün görüntüler oluşturabilen bir dizi model.
Fısıldamak Önizlemede konuşmayı metne dönüştürebilen ve çevirebilen bir dizi model.
Metin okuma (Önizleme) Önizlemede metinleri konuşmaya sentezleyebilecek bir dizi model.

Erken erişim oyun alanı (önizleme)

6 Ağustos 2024'te OpenAI, amiral gemisi GPT-4o model sürümünün en son sürümünü 2024-08-06duyurdu. GPT-4o 2024-08-06 , önceki sürümün tüm özelliklerine sahip olduğu gibi:

  • Karmaşık yapılandırılmış çıkışları desteklemeye yönelik gelişmiş bir özellik.
  • Maksimum çıkış belirteci 4.096'dan 16.384'e yükseltildi.

Azure müşterileri, yeni AI Studio erken erişim oyun alanında (önizleme) GPT-4o'yu 2024-08-06 bugün test edebilir.

Önceki erken erişim oyun alanının aksine, AI Studio erken erişim oyun alanı (önizleme) belirli bir bölgede bir kaynağınız olmasını gerektirmez.

Not

Erken erişim oyun alanı (önizleme) üzerinden yapılan istemler ve tamamlamalar herhangi bir Azure OpenAI bölgesinde işlenebilir ve şu anda Azure aboneliği başına dakikada 10 istek sınırına tabidir. Bu sınır gelecekte değişebilir.

Azure OpenAI Hizmeti kötüye kullanımı izlemesi, değişiklik için onaylanmış olsa bile tüm erken erişim oyun alanı kullanıcıları için etkinleştirilir; varsayılan içerik filtreleri etkinleştirilir ve değiştirilemez.

GPT-4o'yu 2024-08-06test etmek için bu bağlantıyı kullanarak Azure AI erken erişim oyun alanında (önizleme) oturum açın.

GPT-4o ve GPT-4 Turbo

GPT-4o, metinleri ve görüntüleri tek bir modelde tümleştirerek birden çok veri türünü aynı anda işlemesini sağlar. Bu çok modüllü yaklaşım, insan-bilgisayar etkileşimlerinde doğruluğu ve yanıt hızını artırır. GPT-4o, İngilizce olmayan dillerde ve görüntü işlerinde üstün performans sunarak yapay zeka özellikleri için yeni karşılaştırmalar ayarlayarak İngilizce metin ve kodlama görevlerinde GPT-4 Turbo ile eşleşir.

GPT-4o ve GPT-4o mini modellerine Nasıl yaparım? erişin?

GPT-4o ve GPT-4o mini, standart ve küresel standart model dağıtımı için kullanılabilir.

Modelin kullanılabilir olduğu desteklenen bir standart veya genel standart bölgede mevcut bir kaynak oluşturmanız veya kullanmanız gerekir.

Kaynağınız oluşturulduğunda GPT-4o modellerini dağıtabilirsiniz. Programlı dağıtım gerçekleştiriyorsanız model adları şunlardır:

  • gpt-4o, Sürüm 2024-05-13
  • gpt-4o-miniSürüm 2024-07-18

GPT-4 Turbo

GPT-4 Turbo, OpenAI'nin önceki modellerinden daha yüksek doğrulukla zor sorunları çözebilen büyük bir çok modüllü modeldir (metin veya görüntü girişlerini kabul etme ve metin oluşturma). GPT-3.5 Turbo ve eski GPT-4 modelleri gibi GPT-4 Turbo da sohbet için optimize edilmiştir ve geleneksel tamamlama görevleri için iyi çalışır.

GPT-4 Turbo'nun en son GA sürümü:

  • gpt-4Sürüm: turbo-2024-04-09

Bu, aşağıdaki önizleme modellerinin yerini alır:

  • gpt-4Sürüm: 1106-Preview
  • gpt-4Sürüm: 0125-Preview
  • gpt-4Sürüm: vision-preview

OpenAI ile Azure OpenAI GPT-4 Turbo GA Modelleri Arasındaki Farklar

  • OpenAI'nin en son 0409 turbo modeli sürümü tüm çıkarım istekleri için JSON modunu ve işlev çağrısını destekler.
  • Azure OpenAI'nin en son turbo-2024-04-09 sürümü şu anda görüntü (görüntü) girişiyle çıkarım istekleri yaparken JSON modu ve işlev çağrısı kullanımını desteklememektedir. Metin tabanlı giriş istekleri (ve satır içi görüntüleri olmayan image_url istekler), JSON modunu ve işlev çağrılarını destekler.

gpt-4 vision-preview ile arasındaki farklar

  • Azure AI'ye özgü Görüntü İşleme geliştirmeleri ile GPT-4 Turbo ve Görüntü İşleme tümleştirmesi Şu Sürüm için gpt-4 desteklenmez: turbo-2024-04-09. Buna Optik Karakter Tanıma (OCR), nesne topraklama, video istemleri ve görüntülerle verilerinizin daha iyi işlenmesi dahildir.

GPT-4 Turbo tarafından sağlanan yönetilen kullanılabilirlik

  • gpt-4Sürüm: turbo-2024-04-09 hem standart hem de sağlanan dağıtımlar için kullanılabilir. Şu anda bu modelin sağlanan sürümü görüntü/görüntü çıkarım isteklerini desteklememektedir. Bu modelin sağlanan dağıtımları yalnızca metin girişini kabul eder. Standart model dağıtımları hem metin hem de görüntü/görüntü çıkarım isteklerini kabul eder.

Bölgesel kullanılabilirlik

Model bölgesel kullanılabilirliği hakkında bilgi için standart ve sağlanan dağıtımlar için model matrisine başvurun.

Görüntü İşleme GA ile GPT-4 Turbo Dağıtma

Ga modelini Studio kullanıcı arabiriminden GPT-4 dağıtmak için açılan menüden turbo-2024-04-09 sürümü seçin ve ardından seçin. Model için gpt-4-turbo-2024-04-09 varsayılan kota, GPT-4-Turbo için geçerli kotayla aynı olacaktır. Bölgesel kota sınırlarına bakın.

GPT-4

GPT-4, GPT-4 Turbo'ya öncülüdür. Hem GPT-4 hem de GPT-4 Turbo modellerinin temel model adı vardır gpt-4. Model sürümünü inceleyerek GPT-4 ve Turbo modelleri arasında ayrım yapabilirsiniz.

  • gpt-4Sürüm 0314
  • gpt-4Sürüm 0613
  • gpt-4-32kSürüm 0613

Model özet tablosunda her model tarafından desteklenen belirteç bağlamı uzunluğunu görebilirsiniz.

GPT-4 ve GPT-4 Turbo modelleri

  • Bu modeller yalnızca Sohbet Tamamlama API'siyle kullanılabilir.

Azure OpenAI Hizmeti'nin model sürümü yükseltmelerini nasıl işlediğini ve GPT-4 dağıtımlarınızın model sürümü ayarlarını görüntülemeyi ve yapılandırmayı öğrenmek için modellerle çalışmayı öğrenmek için model sürümlerine bakın.

Model Kimliği Açıklama Maksimum İstek (belirteçler) Eğitim Verileri (en fazla)
gpt-4o-mini (2024-07-18)
GPT-4o mini
En son küçük GA modeli
- GPT-3.5 Turbo serisi modelleri değiştirmek için ideal hızlı, ucuz, yetenekli model.
- Metin, görüntü işleme
- JSON Modu
- paralel işlev çağrısı
Giriş: 128.000
Çıkış: 16.384
Ekim 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
En son büyük GA modeli
- Metin, görüntü işleme
- JSON Modu
- paralel işlev çağrısı
- Geliştirilmiş doğruluk ve yanıt hızı
- Görüntü İşlemeli GPT-4 Turbo ile karşılaştırıldığında İngilizce metin ve kodlama görevleriyle eşlik
- İngilizce olmayan dillerde ve görme görevlerinde üstün performans
Giriş: 128.000
Çıkış: 4.096
Ekim 2023
gpt-4 (turbo-2024-04-09)
Görüntü İşlemeli GPT-4 Turbo
Yeni GA modeli
- Önceki tüm GPT-4 önizleme modellerinin (vision-preview, 1106-Preview, 0125-Preview) yerini alır.
- Özellik kullanılabilirliği şu anda giriş yöntemine ve dağıtım türüne bağlı olarak farklıdır.
Giriş: 128.000
Çıkış: 4.096
Aralık 2023
gpt-4 (0125-Önizleme)*
GPT-4 Turbo Önizleme
Önizleme Modeli
-1106-Preview'ın yerini alır
- Daha iyi kod oluşturma performansı
- Modelin bir görevi tamamlamadığı durumları azaltır
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 128.000
Çıkış: 4.096
Aralık 2023
gpt-4 (görüntü önizleme)
Görüntü İşleme Önizleme ile GPT-4 Turbo
Önizleme modeli
- Metin ve görüntü girişini kabul eder.
- Geliştirmeleri destekler
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 128.000
Çıkış: 4.096
Nisan 2023
gpt-4 (1106-Önizleme)
GPT-4 Turbo Önizleme
Önizleme Modeli
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 128.000
Çıkış: 4.096
Nisan 2023
gpt-4-32k (0613) Eski GA modeli
- Araçlarla temel işlev çağrısı
32,768 Eylül 2021
gpt-4 (0613) Eski GA modeli
- Araçlarla temel işlev çağrısı
Kategori 8,192 Eylül 2021
gpt-4-32k(0314) Eski GA modeli
- Kullanımdan kaldırma bilgileri
32,768 Eylül 2021
gpt-4 (0314) Eski GA modeli
- Kullanımdan kaldırma bilgileri
Kategori 8,192 Eylül 2021

Dikkat

Üretimde önizleme modellerinin kullanılmasını önermiyoruz. Önizleme modellerinin tüm dağıtımlarını gelecekteki önizleme sürümlerine veya en son kararlı/GA sürümüne yükselteceğiz. Belirlenen modeller önizlemesi standart Azure OpenAI modeli yaşam döngüsünü izlemez.

  • GPT-4 sürüm 0125-preview, daha önce sürüm 1106-preview olarak yayınlanan GPT-4 Turbo önizlemesinin güncelleştirilmiş bir sürümüdür.
  • GPT-4 sürüm 0125-preview, kod oluşturma gibi görevleri gpt-4-1106-preview ile karşılaştırıldığında tamamen tamamlar. Bu nedenle, göreve bağlı olarak müşteriler GPT-4-0125-preview sürümünün gpt-4-1106-preview ile karşılaştırıldığında daha fazla çıkış ürettiğini görebilir. Müşterilerin yeni modelin çıkışlarını karşılaştırmasını öneririz. GPT-4-0125-preview, İngilizce dışındaki diller için UTF-8 işleme ile gpt-4-1106-preview sürümündeki hataları da giderir.
  • GPT-4 sürümü turbo-2024-04-09 en son GA sürümüdür ve , 1106-previewve vision-previewsürümlerinin yerini alır0125-Preview.

Önemli

  • gpt-4 sürüm 1106-Preview, 0125-Preview ve vision-preview, gelecekte kararlı bir sürümüyle gpt-4 yükseltilecektir. gpt-4 Kararlı sürüm yayımlandıktan sonra 1106-Preview, 0125-Preview ve vision-preview sürümlerinin dağıtımları "Varsayılana otomatik güncelleştirme" ve "Süresi dolduğunda yükselt" olarak ayarlanmış dağıtımlar yükseltilmeye başlar. Her dağıtım için, API çağrıları için hizmette kesinti olmadan bir model sürümü yükseltmesi gerçekleştirilir. Yükseltmeler bölgeye göre hazırlanır ve tam yükseltme işleminin 2 hafta sürmesi beklenir. "Otomatik yükseltme yok" olarak ayarlanmış 1106-Preview, 0125-Preview ve vision-preview sürümlerinin dağıtımları gpt-4 yükseltilmeyecek ve önizleme sürümü bölgede yükseltildiğinde çalışmayı durduracaktır. Yükseltmenin zamanlaması hakkında daha fazla bilgi için bkz . Azure OpenAI modeli kullanımdan kaldırmalar ve kullanımdan kaldırmalar .

GPT-3.5

GPT-3.5 modelleri doğal dili veya kodu anlayabilir ve oluşturabilir. GPT-3.5 ailesindeki en yetenekli ve uygun maliyetli model, sohbet için iyileştirilmiş ve geleneksel tamamlama görevleri için de iyi çalışan GPT-3.5 Turbo'dur. GPT-3.5 Turbo, Sohbet Tamamlamaları API'siyle kullanılabilir. GPT-3.5 Turbo Yönergesi, Sohbet Tamamlamaları text-davinci-003 API'sinin yerine Tamamlamalar API'sini kullanmaya benzer özelliklere sahiptir. GPT-3.5 Turbo ve GPT-3.5 Turbo Instruct eski GPT-3.5 ve GPT-3 modellerini kullanmanızı öneririz.

Model Kimliği Açıklama Maksimum İstek (belirteçler) Eğitim Verileri (en fazla)
gpt-35-turbo (0125) YENİ En Son GA Modeli
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
- İstenen biçimlerde yanıt vermede daha yüksek doğruluk.
- İngilizce olmayan işlev çağrıları için metin kodlama sorununa neden olan bir hata düzeltildi.
Giriş: 16.385
Çıkış: 4.096
Eylül 2021
gpt-35-turbo (1106) Eski GA Modeli
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 16.385
Çıkış: 4.096
Eylül 2021
gpt-35-turbo-instruct (0914) Yalnızca tamamlama uç noktası
- Eski tamamlama modellerinin yerini alma
4,097 Eylül 2021
gpt-35-turbo-16k (0613) Eski GA Modeli
- Araçlarla temel işlev çağrısı
16,384 Eylül 2021
gpt-35-turbo (0613) Eski GA Modeli
- Araçlarla temel işlev çağrısı
4,096 Eylül 2021
gpt-35-turbo1 (0301) Eski GA Modeli
- Kullanımdan kaldırma bilgileri
4,096 Eylül 2021

GPT-3.5 Turbo ve Sohbet Tamamlamaları API'siyle etkileşim kurma hakkında daha fazla bilgi edinmek için ayrıntılı nasıl yapılır bilgilerimize göz atın.

1 Bu model 4.096 belirteç isteklerini > kabul eder. Modelin daha yeni sürümü 4.096 belirteçle eşlendiğinden 4.096 giriş belirteci sınırının aşılması önerilmez. Bu modelde 4.096 giriş belirtecini aştığınızda sorunlarla karşılaşırsanız bu yapılandırma resmi olarak desteklenmez.

Eklemeler

text-embedding-3-large en son ve en yetenekli ekleme modelidir. Ekleme modelleri arasında yükseltme mümkün değildir. uygulamasından sizin text-embedding-ada-002 kullanımınıza geçmek için text-embedding-3-large yeni eklemeler oluşturmanız gerekir.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Test aşamasında OpenAI hem büyük hem de küçük üçüncü nesil ekleme modellerinin MIRACL karşılaştırması ile daha iyi ortalama çok dilli alma performansı sunarken MTEB karşılaştırması ile İngilizce görevleri için performansı sürdürmeye devam eder.

Değerlendirme Karşılaştırması text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL ortalaması 31.4 44.0 54.9
MTEB ortalaması 61.0 62.3 64.6

Üçüncü nesil ekleme modelleri, ekleme boyutunun yeni dimensions bir parametre aracılığıyla küçültülmesini destekler. Genellikle daha büyük ekleme işlemleri işlem, bellek ve depolama perspektifinden daha pahalıdır. Boyut sayısını ayarlayabilmek, genel maliyet ve performans üzerinde daha fazla denetime olanak tanır. dimensions Parametresi OpenAI 1.x Python kitaplığının tüm sürümlerinde desteklenmez; bu parametreden yararlanmak için en son sürüme yükseltmenizi öneririz: pip install openai --upgrade.

OpenAI'nin MTEB karşılaştırma testi, üçüncü nesil modelin boyutları 1.536'nın altına text-embeddings-ada-002 indiğinde bile performansın biraz daha iyi kaldığını tespit etti.

DALL-E

DALL-E modelleri, kullanıcının sağladığı metin istemlerinden görüntüler oluşturur. DALL-E 3 genellikle REST API'leri ile kullanılabilir. İstemci SDK'ları olan DALL-E 2 ve DALL-E 3 önizleme aşamasındadır.

Fısıldamak

Fısıltı modelleri konuşmayı metne dönüştürme için kullanılabilir.

Fısıltı modelini Azure AI Konuşma toplu transkripsiyon API'sini kullanarak da kullanabilirsiniz. Azure AI Konuşma ve Azure OpenAI Hizmeti'nin ne zaman kullanılacağı hakkında daha fazla bilgi edinmek için Fısıltı modeli nedir? konusuna göz atın.

Metin okuma (Önizleme)

Şu anda önizleme aşamasında olan OpenAI metin okuma modelleri, metni konuşmaya sentezlemek için kullanılabilir.

Ayrıca OpenAI metnini kullanarak Azure AI Konuşma aracılığıyla seslerini de paylaşabilirsiniz. Daha fazla bilgi edinmek için Bkz . Azure OpenAI Hizmeti aracılığıyla veya Azure AI Konuşma kılavuzu aracılığıyla OpenAI metni konuşma seslerine.

Model özet tablosu ve bölge kullanılabilirliği

Not

Bu makale öncelikli olarak Standart dağıtım türlerine sahip tüm Azure OpenAI müşterileri için geçerli olan model/bölge kullanılabilirliğini kapsar. Bazı belirli müşteriler, aşağıdaki birleşik tabloda listelenmeyen model/bölge birleşimlerine erişebilir. Sağlanan dağıtımlar hakkında daha fazla bilgi için Sağlanan kılavuzumuza bakın.

Standart dağıtım modeli kullanılabilirliği

Bölge gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, görüntü işleme önizleme gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 metin ekleme-ada-002, 1 metin ekleme-ada-002, 2 metin ekleme-3-küçük, 1 metin ekleme-3-büyük, 1 dall-e-2, 2.0 dall-e-3, 3.0 babbage-002, 1 davinci-002, 1 tts, 001 tts-hd, 001 fısıltı, 001
australiaeast - - - - - - - - - - - - - - - -
Güney Brezilya - - - - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - - - - -
Orta Güney ABD - - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - - - -
Orta İsveç - - - - - -
Kuzey İsviçre - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Bu tablo GPT-4o için genel standart model dağıtımı bölgesel kullanılabilirliğini veya bölgesel kullanılabilirlik bilgilerini ayarlamayı içermez. Bu bilgi için ayrılmış genel standart dağıtım bölümüne ve ince ayar bölümüne bakın.

Standart ve genel standart dağıtım modeli kotası

Bölge GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V gpt-4o gpt-4o-mini GPT-35-Turbo GPT-35-Turbo-Instruct gpt-4o - GlobalStandard gpt-4o-mini - GlobalStandard GPT-4-Turbo - GlobalStandard GPT-4o - Genel Toplu İşlem GPT-4o-mini - Genel Toplu İşlem GPT-4 - Genel Toplu İş GPT-4-Turbo - Genel Toplu İşlem gpt-35-turbo - Global-Batch Metin Ekleme-Ada-002 metin ekleme-3-küçük metin ekleme-3-büyük GPT-4o - finetune GPT-4o-mini - finetune GPT-4 - finetune Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 K 80 K 80 K 30 K - - 300 K - 30 M - 2 M - - - - - 350 K - - - - - - - - - - - -
Güney Brezilya - - - - - - - - 30 M - 2 M - - - - - 350 K - - - - - - - - - - - -
canadaeast 40 K 80 K 80 K - - - 300 K - 30 M - 2 M - - - - - 350 K 350 K 350 K - - - - - - - - - -
eastus - - 80 K - 1 M 2 M 240 K 240 K 30 M 50 M 2 M 5 B 5 B 150 M 300 M 10 B 240 K 350 K 350 K - - - - - - - - - -
eastus2 - - 80 K - 1 M - 300 K - 30 M - 2 M - - - - - 350 K 350 K 350 K - - - - - - - 250 K 250 K 250 K
francecentral 20 K 60 K 80 K - - - 240 K - 30 M - 2 M - - - - - 240 K - 350 K - - - - - - - - - -
germanywestcentral - - - - - - - - 30 M - 2 M - - - - - - - - - - - - - - - - - -
japaneast - - - 30 K - - 300 K - 30 M - 2 M - - - - - 350 K - 350 K - - - - - - - - - -
koreacentral - - - - - - - - 30 M - 2 M - - - - - - - - - - - - - - - - - -
northcentralus - - 80 K - 1 M - 300 K - 30 M - 2 M - - - - - 350 K - - 100 K 100 K 100 K 240 K 250 K 240 K 250 K 250 K 250 K 250 K
Doğu Norveç - - 150 K - - - - - 30 M - 2 M - - - - - 350 K - 350 K - - - - - - - - - -
polonyamerkez - - - - - - - - 30 M - 2 M - - - - - - - - - - - - - - - - - -
Güney Afrika'nın Kuzeyi - - - - - - - - 30 M - 2 M - - - - - 350 K - - - - - - - - - - - -
Orta Güney ABD - - 80 K - 1 M - 240 K - 30 M - 2 M - - - - - 240 K - - - - - - - - - - - -
southindia - - 150 K - - - 300 K - 30 M - 2 M - - - - - 350 K - 350 K - - - - - - - - - -
Orta İsveç 40 K 80 K 150 K 30 K 1 M 2 M 300 K 240 K 30 M 50 M 2 M 5 B 5 B 150 M 300 M 10 B 350 K - 350 K 100 K 100 K 100 K 240 K 250 K 240 K 250 K 250 K 250 K 250 K
Kuzey İsviçre 40 K 80 K - 30 K - - 300 K - 30 M - 2 M - - - - - 350 K - - - - - - - - - - - -
İsviçrewest - - - - - - - - - - - - - - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - - - 240 K - 30 M - 2 M - - - - - 350 K - 350 K - - - - - - - - - -
westeurope - - - - - - 240 K - 30 M - 2 M - - - - - 240 K - - - - - - - - - - - -
westus - - 80 K 30 K 1 M - 300 K - 30 M - 2 M 5 B 5 B 150 M 300 M 10 B 350 K - - - - - - - - - - - -
westus3 - - 80 K - 1 M - - - 30 M - 2 M - - - - - 350 K - 350 K - - - - - - - - - -

Sağlanan dağıtım modeli kullanılabilirliği

Bölge gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast -
Güney Brezilya - - -
canadacentral - - - - - -
canadaeast - - -
eastus
eastus2
francecentral - - -
germanywestcentral - -
japaneast - - - -
koreacentral - - - -
northcentralus
Doğu Norveç - - - - - -
polonyamerkez - - -
Güney Afrika'nın Kuzeyi - - - -
Orta Güney ABD -
southindia - -
Orta İsveç
Kuzey İsviçre -
İsviçrewest - - - - - - - -
uksouth -
westus -
westus3 -

Not

Sürüm: turbo-2024-04-09 öğesinin gpt-4 sağlanan sürümü şu anda yalnızca metinle sınırlıdır.

Sağlanan'a erişim Nasıl yaparım??

Sağlanan aktarım hızını elde etmek için Microsoft satış/hesap ekibinizle görüşmeniz gerekir. Satış/hesap ekibiniz yoksa, ne yazık ki şu anda sağlanan aktarım hızını satın alamazsınız.

Sağlanan dağıtımlar hakkında daha fazla bilgi için Sağlanan kılavuzumuza bakın.

Genel standart model kullanılabilirliği

gpt-4oSürüm: 2024-05-13

Desteklenen bölgeler:

  • australiaeast
  • Güney Brezilya
  • canadaeast
  • eastus
  • eastus2
  • francecentral
  • germanywestcentral
  • japaneast
  • koreacentral
  • northcentralus
  • Doğu Norveç
  • polonyamerkez
  • Güney Afrika'nın Kuzeyi
  • Orta Güney ABD
  • southindia
  • Orta İsveç
  • Kuzey İsviçre
  • uksouth
  • westeurope
  • westus
  • westus3

gpt-4o-miniSürüm: 2024-07-18

Desteklenen bölgeler:

  • eastus

Genel toplu iş modeli kullanılabilirliği

Bölge ve model desteği

Aşağıdaki modeller genel toplu işlemi destekler:

Model Sürüm Giriş biçimi
gpt-4o-mini 2024-07-18 metin + resim
gpt-4o 2024-05-13 metin + resim
gpt-4 turbo-2024-04-09 text
gpt-4 0613 text
gpt-35-turbo 0125 text
gpt-35-turbo 1106 text
gpt-35-turbo 0613 text

Genel toplu iş şu anda aşağıdaki bölgelerde desteklenmektedir:

  • Doğu ABD
  • Batı ABD
  • Orta İsveç

GPT-4 ve GPT-4 Turbo model kullanılabilirliği

Genel bulut bölgeleri

Bölge gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, görüntü işleme önizleme gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613
australiaeast - - - -
canadaeast - - - - -
eastus - - - -
eastus2 - - - - -
francecentral - - - - -
japaneast - - - - - - -
northcentralus - - - - -
Doğu Norveç - - - - - - -
Orta Güney ABD - - - - -
southindia - - - - - - -
Orta İsveç -
Kuzey İsviçre - - - - -
uksouth - - - - - -
westus - - - -
westus3 - - - - -

Müşteri erişimini seçin

Yukarıdaki tüm Azure OpenAI müşterilerinin kullanabileceği bölgelere ek olarak, bazı belirli önceden var olan müşterilere ek bölgelerde GPT-4 sürümlerine erişim verilmiştir:

Model Bölge
gpt-4 (0314)
gpt-4-32k (0314)
Doğu ABD
Orta Fransa
Orta Güney ABD
Güney Birleşik Krallık
gpt-4 (0613)
gpt-4-32k (0613)
Doğu ABD
Doğu ABD 2
Doğu Japonya
Güney Birleşik Krallık

GPT-3.5 modelleri

Önemli

YENİ gpt-35-turbo (0125) model, istenen biçimlerde yanıt vermede daha yüksek doğruluk ve İngilizce olmayan işlev çağrıları için metin kodlama sorununa neden olan bir hataya yönelik düzeltme de dahil olmak üzere çeşitli iyileştirmelere sahiptir.

GPT-3.5 Turbo, Sohbet Tamamlama API'siyle birlikte kullanılır. GPT-3.5 Turbo sürüm 0301, Tamamlamalar API'siyle de kullanılabilir, ancak bu önerilmez. GPT-3.5 Turbo sürüm 0613 ve 1106 yalnızca Sohbet Tamamlamaları API'sini destekler.

GPT-3.5 Turbo sürüm 0301, modelin yayınlanan ilk sürümüdür. Sürüm 0613 modelin ikinci sürümüdür ve işlev çağırma desteği ekler.

Azure OpenAI Hizmeti'nin model sürümü yükseltmelerini nasıl işlediğini öğrenmek için model sürümlerine bakın ve GPT-3.5 Turbo dağıtımlarınızın model sürümü ayarlarını görüntülemeyi ve yapılandırmayı öğrenmek için modellerle çalışma.

GPT-3.5-Turbo model kullanılabilirliği

Genel bulut bölgeleri

Bölge gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
Orta Güney ABD - - - -
southindia - - - - -
Orta İsveç - -
Kuzey İsviçre - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

Ekleme modelleri

Bu modeller yalnızca Ekleme API istekleriyle kullanılabilir.

Not

text-embedding-3-large en son ve en yetenekli ekleme modelidir. Ekleme modelleri arasında yükseltme mümkün değildir. uygulamasından text-embedding-ada-002 size geçiş yapmak için text-embedding-3-large yeni eklemeler oluşturmanız gerekir.

Model Kimliği Maksimum İstek (belirteçler) Çıkış Boyutları Eğitim Verileri (en fazla)
text-embedding-ada-002 (sürüm 2) 8,191 1536 Eylül 2021
text-embedding-ada-002 (sürüm 1) 2,046 1536 Eylül 2021
text-embedding-3-large 8,191 3072 Eylül 2021
text-embedding-3-small 8,191 1536 Eylül 2021

Not

Ekleme için bir giriş dizisi gönderirken, ekleme uç noktasına çağrı başına dizideki en fazla giriş öğesi sayısı 2048'dir.

Genel bulut bölgeleri

Bölge metin ekleme-ada-002, 1 metin ekleme-ada-002, 2 metin ekleme-3-küçük, 1 metin ekleme-3-büyük, 1
australiaeast - - -
Güney Brezilya - - -
canadaeast -
eastus
eastus2 -
francecentral - -
japaneast - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
Orta Güney ABD - -
southindia - -
Orta İsveç - -
Kuzey İsviçre - - -
uksouth - -
westeurope - - -
westus - - -
westus3 - -

DALL-E modelleri

Model Kimliği Özellik Kullanılabilirliği En Fazla İstek (karakterler)
dalle2 (önizleme) Doğu ABD 1.000
dall-e-3 Doğu ABD, Doğu Avustralya, Orta İsveç 4.000

Modellerde ince ayar

babbage-002 ve davinci-002 yönergeleri takip etmek için eğitilmemişlerdir. Bu temel modelleri sorgulama, yalnızca eğitiminizin ilerleme durumunu değerlendirmek için ince ayarlanmış bir sürüme başvuru noktası olarak yapılmalıdır.

gpt-35-turbo - Bu modelin ince ayarı bölgelerin bir alt kümesiyle sınırlıdır ve temel modelin kullanılabilir olduğu her bölgede kullanılamaz.

Model Kimliği Bölgelere İnce Ayar Maksimum İstek (belirteçler) Eğitim Verileri (en fazla)
babbage-002 Orta Kuzey ABD
İsveç Orta
Batı İsviçre
16,384 Eylül 2021
davinci-002 Orta Kuzey ABD
İsveç Orta
Batı İsviçre
16,384 Eylül 2021
gpt-35-turbo (0613) Doğu ABD2
Orta Kuzey ABD
İsveç Orta
Batı İsviçre
4,096 Eylül 2021
gpt-35-turbo (1106) Doğu ABD2
Orta Kuzey ABD
İsveç Orta
Batı İsviçre
Giriş: 16.385
Çıkış: 4.096
Eylül 2021
gpt-35-turbo (0125) Doğu ABD2
Orta Kuzey ABD
İsveç Orta
Batı İsviçre
16,385 Eylül 2021
gpt-4 (0613) 1 Orta Kuzey ABD
Orta İsveç
8192 Eylül 2021
gpt-4o-mini1 (2024-07-18) Orta Kuzey ABD
Orta İsveç
Giriş: 128.000
Çıkış: 16.384
Eğitim örneği bağlam uzunluğu: 64.536
Ekim 2023

1 GPT-4 ve GPT-4o mini ince ayar şu anda genel önizleme aşamasındadır. Daha fazla bilgi için GPT-4 & GPT-4o mini ince ayar güvenlik değerlendirme kılavuzumuzu inceleyin.

Fısıltı modelleri

Model Kimliği Model Kullanılabilirliği En Fazla İstek (ses dosyası boyutu)
whisper Doğu ABD 2
Orta Kuzey ABD
Doğu Norveç
Güney Hindistan
İsveç Orta
West Europe
25 MB

Metin okuma modelleri (Önizleme)

Model Kimliği Model Kullanılabilirliği
tts-1 Orta Kuzey ABD
Orta İsveç
tts-1-hd Orta Kuzey ABD
Orta İsveç

Yardımcılar (Önizleme)

Yardımcılar için desteklenen bir modelin ve desteklenen bir bölgenin birleşimi gerekir. Bazı araçlar ve özellikler için en son modeller gerekir. Aşağıdaki modeller Yardımcılar API'sinde, SDK'da, Azure Yapay Zeka Stüdyosunda ve Azure OpenAI Studio'da kullanılabilir. Aşağıdaki tablo kullandıkça öde tablosuna yöneliktir. Sağlanan Aktarım Hızı Birimi (PTU) kullanılabilirliği hakkında bilgi için bkz . sağlanan aktarım hızı. Listelenen modeller ve bölgeler hem Yardımcılar v1 hem de v2 ile kullanılabilir. Aşağıda listelenen bölgelerde destekleniyorsa genel standart modelleri kullanabilirsiniz.

Bölge gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Doğu Avustralya
Doğu ABD
Doğu ABD 2
Orta Fransa
Doğu Japonya
Norveç Doğu
Orta İsveç
Güney Birleşik Krallık
Batı ABD
Batı ABD 3

Modeli kullanımdan kaldırma

Model kullanımdan kaldırma hakkında en son bilgiler için modeli kullanımdan kaldırma kılavuzuna bakın.

Sonraki adımlar