Modely Azure OpenAI Service
Služba Azure OpenAI Service využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelu se liší podle oblastí a cloudu. Dostupnost modelu Azure Government najdete ve službě Azure Government OpenAI.
Modely | Popis |
---|---|
o1-preview a o1-mini | Modely s omezeným přístupem, které jsou speciálně navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností. |
GPT-4o & GPT-4o mini & GPT-4 Turbo | Nejnovější modely Azure OpenAI s vícemodálními verzemi, které můžou jako vstup přijímat text i obrázky. |
GPT-4o audio | Model GPT-4o, který podporuje konverzační interakce s nízkou latencí , "řeč v řeči". |
GPT-4 | Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód. |
GPT-3.5 | Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód. |
Vkládání | Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu. |
DALL-E | Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka. |
Šeptat | Řada modelů ve verzi Preview, která dokáže přepisovat a překládat řeč na text. |
Převod textu na řeč (Preview) | Řada modelů ve verzi Preview, která dokáže syntetizovat text na řeč. |
omezený přístup k modelům o1-preview a o1-mini
Azure OpenAI o1-preview
a o1-mini
modely jsou speciálně navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako jsou věda, kódování a matematika v porovnání s předchozími iteracemi.
ID modelu | Popis | Max Request (tokeny) | Trénovací data (až do) |
---|---|---|---|
o1-preview (2024-09-12) |
Nejschopnější model v řadě o1, který nabízí vylepšené schopnosti zdůvodnění. | Vstup: 128 000 Výstup: 32 768 |
Října 2023 |
o1-mini (2024-09-12) |
Rychlejší a nákladově efektivnější možnost v řadě o1, která je ideální pro psaní úkolů vyžadujících rychlost a nižší spotřebu prostředků. | Vstup: 128 000 Výstup: 65 536 |
Října 2023 |
Dostupnost
o1-mini
K dispozici jsou teď modely o1-preview
pro přístup k rozhraní API a nasazení modelu. Registrace je povinná a přístup se udělí na základě kritérií způsobilosti microsoftu.
Vyžádání přístupu: aplikace modelu omezeného přístupu
Po udělení přístupu budete muset vytvořit nasazení pro každý model.
Podpora rozhraní API
Podpora modelů řady o1 byla přidána ve verzi 2024-09-01-preview
rozhraní API .
Parametr max_tokens
je zastaralý a nahrazen novým max_completion_tokens
parametrem. Modely řad o1 budou fungovat pouze s parametrem max_completion_tokens
.
Využití
Tyto modely v současné době nepodporují stejnou sadu parametrů jako jiné modely, které používají rozhraní API pro dokončování chatu. V současné době se podporuje pouze velmi omezená podmnožina, takže běžné parametry jako temperature
, top_p
nejsou k dispozici a jejich zahrnutí způsobí selhání vaší žádosti. o1-preview
a o1-mini
modely také nepřijímají roli systémových zpráv jako součást pole zpráv.
Možná budete muset upgradovat svoji verzi knihovny OpenAI Python, abyste mohli využít výhod nového max_completion_tokens
parametru.
pip install openai --upgrade
Pokud s ověřováním začínáte používat Microsoft Entra ID, přečtěte si téma Konfigurace služby Azure OpenAI s ověřováním Microsoft Entra ID.
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
azure_ad_token_provider=token_provider,
api_version="2024-09-01-preview"
)
response = client.chat.completions.create(
model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
messages=[
{"role": "user", "content": "What steps should I think about when writing my first Python API?"},
],
max_completion_tokens = 5000
)
print(response.model_dump_json(indent=2))
Regionální dostupnost
K dispozici pro standardní a globální standardní nasazení v oblasti USA – východ, USA – východ 2, USA – středosever, USA – středojiž, Švédsko – střed, USA – západ a USA – západ3 pro schválené zákazníky.
GPT-4o audio
Model gpt-4o-realtime-preview
je součástí řady modelů GPT-4o a podporuje nízko latenci a konverzační interakce "řeč v řeči". GPT-4o zvuk je navržený tak, aby zpracovával konverzační interakce v reálném čase, s nízkou latencí a skvěle se hodí pro agenty podpory, asistenty, překladatele a další případy použití, které potřebují vysoce responzivní back-and-forth s uživatelem.
Zvuk GPT-4o je k dispozici v oblastech USA – východ 2 (eastus2
) a Švédsko – střed (swedencentral
). Pokud chcete použít zvuk GPT-4o, musíte vytvořit nebo použít existující prostředek v jedné z podporovaných oblastí.
Po vytvoření prostředku můžete nasadit zvukový model GPT-4o. Pokud provádíte programové nasazení, název modelu je gpt-4o-realtime-preview
. Další informace o tom, jak používat zvuk GPT-4o, najdete v dokumentaci k zvuku GPT-4o.
Podrobnosti o maximálních tokenech žádostí a trénovacích datech jsou k dispozici v následující tabulce.
ID modelu | Popis | Max Request (tokeny) | Trénovací data (až do) |
---|---|---|---|
gpt-4o-realtime-preview (10. 10. 2024 ve verzi Preview) GPT-4o audio |
Zvukový model pro zpracování zvuku v reálném čase | Vstup: 128 000 Výstup: 4 096 |
Října 2023 |
GPT-4o a GPT-4 Turbo
GPT-4o integruje text a obrázky v jednom modelu a umožňuje zpracovávat více datových typů současně. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače. GPT-4o odpovídá GPT-4 Turbo v anglickém textu a programovacím úlohám a nabízí vynikající výkon v neanglických jazycích a vizuálních úkolech, nastavení nových srovnávacích testů pro funkce AI.
Návody přistupovat k minimodelům GPT-4o a GPT-4o?
GPT-4o a GPT-4o mini jsou k dispozici pro standardní a globální nasazení modelu.
Potřebujete vytvořit nebo použít existující prostředek v podporované standardní nebo globální standardní oblasti, ve které je model dostupný.
Po vytvoření prostředku můžete nasadit modely GPT-4o. Pokud provádíte programové nasazení, názvy modelů jsou:
gpt-4o
Verze2024-08-06
gpt-4o
, Verze2024-05-13
gpt-4o-mini
Verze2024-07-18
GPT-4 Turbo
GPT-4 Turbo je velký multimodální model (přijímá textové nebo obrazové vstupy a generuje text), který dokáže řešit obtížné problémy s větší přesností než kterýkoli z předchozích modelů OpenAI. Stejně jako GPT-3.5 Turbo a starší modely GPT-4 GPT-4 Turbo jsou optimalizované pro chat a fungují dobře pro tradiční úkoly dokončení.
Nejnovější verze GA GPT-4 Turbo je:
gpt-4
Verze:turbo-2024-04-09
Toto je náhrada následujících modelů Preview:
gpt-4
Verze:1106-Preview
gpt-4
Verze:0125-Preview
gpt-4
Verze:vision-preview
Rozdíly mezi modely OpenAI a Azure OpenAI GPT-4 Turbo GA
- Verze nejnovějšího
0409
modelu Turbo OpenAI podporuje režim JSON a volání funkcí pro všechny žádosti o odvozování. - Verze nejnovější
turbo-2024-04-09
verze Azure OpenAI v současné době nepodporuje použití režimu JSON a volání funkcí při odvozování požadavků na odvozování pomocí vstupu obrázku (vision). Textové vstupní požadavky (požadavky bezimage_url
a vložené obrázky) podporují režim JSON a volání funkcí.
Rozdíly od gpt-4 vision-preview
- Integrace vylepšení zpracování obrazu specifické pro Azure AI s GPT-4 Turbo s vision není pro
gpt-4
verzi podporovaná:turbo-2024-04-09
Patří sem optické rozpoznávání znaků (OCR), uzemnění objektů, výzvy k videu a vylepšené zpracování dat pomocí obrázků.
Důležité
Vylepšení obrazu ve verzi Preview, včetně optického rozpoznávání znaků (OCR), uzemnění objektů, zobrazování obrazových výzev se vyřadí a po upgradu turbo-2024-04-09
na verzi vision-preview
už nebudou k dispozicigpt-4
. Pokud se v současné době spoléháte na některou z těchto funkcí ve verzi Preview, bude tento automatický upgrade modelu zásadní změnou.
Spravovaná dostupnost zřízená pomocí GPT-4 Turbo
gpt-4
Verze:turbo-2024-04-09
je k dispozici pro standardní i zřízená nasazení. V současné době zřízená verze tohoto modelu nepodporuje požadavky na odvozování obrázků a obrazu. Zřízená nasazení tohoto modelu přijímají pouze textové zadání. Nasazení standardního modelu přijímají požadavky na odvozování textu i obrazu a obrazu.
Nasazení GPT-4 Turbo s ga vision
Pokud chcete nasadit model GA z uživatelského rozhraní sady Studio, vyberte GPT-4
a pak v rozevírací nabídce zvolte turbo-2024-04-09
verzi. Výchozí kvóta modelu gpt-4-turbo-2024-04-09
bude stejná jako aktuální kvóta pro GPT-4-Turbo. Podívejte se na limity kvót v jednotlivých oblastech.
GPT-4
GPT-4 je předchůdcem GPT-4 Turbo. Modely GPT-4 a GPT-4 Turbo mají základní název gpt-4
modelu . Modely GPT-4 a Turbo můžete rozlišit prozkoumáním verze modelu.
gpt-4
Verze0314
gpt-4
Verze0613
gpt-4-32k
Verze0613
V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.
Modely GPT-4 a GPT-4 Turbo
- Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.
Podívejte se na verze modelu, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu nasazení GPT-4.
ID modelu | Popis | Max Request (tokeny) | Trénovací data (až do) |
---|---|---|---|
gpt-4o (2024-08-06) GPT-4o (Omni) |
Nejnovější velký model GA - Strukturované výstupy - Zpracování textu, obrázku – Režim JSON – paralelní volání funkce - Vyšší přesnost a rychlost odezvy - Parita s anglickým textem a kódovacími úkoly v porovnání s GPT-4 Turbo s vision - Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu |
Vstup: 128 000 Výstup: 16 384 |
Října 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Nejnovější malý model GA - Rychlý, levný a schopný model ideální pro nahrazení modelů SÉRIE GPT-3.5 Turbo. - Zpracování textu, obrázku – Režim JSON – paralelní volání funkce |
Vstup: 128 000 Výstup: 16 384 |
Října 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Zpracování textu, obrázku – Režim JSON – paralelní volání funkce - Vyšší přesnost a rychlost odezvy - Parita s anglickým textem a kódovacími úkoly v porovnání s GPT-4 Turbo s vision - Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu |
Vstup: 128 000 Výstup: 4 096 |
Října 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo s vision |
Nový model GA - Náhrada za všechny předchozí modely GPT-4 Preview ( vision-preview , 1106-Preview , 0125-Preview ). - Dostupnost funkcí se v současné době liší v závislosti na metodě vstupu a typu nasazení. |
Vstup: 128 000 Výstup: 4 096 |
Prosinec 2023 |
gpt-4 (0125-Preview)*GPT-4 Turbo Preview |
Náhled modelu -Nahrazuje 1106-Preview - Lepší výkon generování kódu – Snižuje případy, kdy model nedokončí úlohu. – Režim JSON – paralelní volání funkce - reprodukovatelný výstup (Preview) |
Vstup: 128 000 Výstup: 4 096 |
Prosinec 2023 |
gpt-4 (vision-preview)GPT-4 Turbo s vision Preview |
Model Preview - Přijímá text a vstup obrázku. - Podporuje vylepšení – Režim JSON – paralelní volání funkce - reprodukovatelný výstup (Preview) |
Vstup: 128 000 Výstup: 4 096 |
Duben 2023 |
gpt-4 (1106-Preview)GPT-4 Turbo Preview |
Náhled modelu – Režim JSON – paralelní volání funkce - reprodukovatelný výstup (Preview) |
Vstup: 128 000 Výstup: 4 096 |
Duben 2023 |
gpt-4-32k (0613) |
Starší model GA - Základní volání funkcí pomocí nástrojů |
32,768 | Zář 2021 |
gpt-4 (0613) |
Starší model GA - Základní volání funkcí pomocí nástrojů |
8,192 | Zář 2021 |
gpt-4-32k (0314) |
Starší model GA - Informace o vyřazení |
32,768 | Zář 2021 |
gpt-4 (0314) |
Starší model GA - Informace o vyřazení |
8,192 | Zář 2021 |
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely označené ve verzi Preview nedodržují standardní životní cyklus modelu Azure OpenAI.
- GPT-4 verze 0125-preview je aktualizovaná verze GPT-4 Turbo Preview, která byla dříve vydána jako verze 1106-preview.
- GPT-4 verze 0125-preview dokončí úlohy, jako je generování kódu, v porovnání s gpt-4-1106-preview. Z tohoto důvodu můžou zákazníci v závislosti na úloze zjistit, že GPT-4-0125-preview generuje ve srovnání s gpt-4-1106-preview další výstup. Doporučujeme zákazníkům porovnat výstupy nového modelu. GPT-4-0125-preview také řeší chyby v gpt-4-1106-preview se zpracováním UTF-8 pro neanglické jazyky.
- GPT-4 verze
turbo-2024-04-09
je nejnovější verze GA a nahrazuje0125-Preview
,1106-preview
avision-preview
.
Důležité
Verze 1106-Preview
0125-Preview
GPT-4 (gpt-4
) a vision-preview
budou upgradovány stabilní verzí gpt-4
v budoucnu.
gpt-4
Po vydání stabilní verze se spustí nasazení verzí1106-Preview
0125-Preview
, avision-preview
nastavte možnost Automatické aktualizace na výchozí a Upgrade po vypršení platnosti. Pro každé nasazení probíhá upgrade verze modelu bez přerušení služby pro volání rozhraní API. Upgrady jsou fázované podle oblasti a očekává se, že celý proces upgradu bude trvat 2 týdny.- Nasazení verzí
1106-Preview
0125-Preview
avision-preview
nastavená na Možnost Bez automatickéhogpt-4
upgradu se neupgraduje a při upgradu verze Preview v oblasti přestane fungovat. Další informace o načasování upgradu najdete v části Vyřazení a vyřazení modelu Azure OpenAI.
GPT-3.5
Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře i pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné možnosti jako text-davinci-003
použití rozhraní API pro dokončování místo rozhraní API pro dokončování chatu. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Pokyny pro starší modely GPT-3.5 a GPT-3.
ID modelu | Popis | Max Request (tokeny) | Trénovací data (až do) |
---|---|---|---|
gpt-35-turbo (0125) NOVÝ |
Nejnovější model GA – Režim JSON – paralelní volání funkce - reprodukovatelný výstup (Preview) - Vyšší přesnost při odpovídání v požadovaných formátech. - Oprava chyby, která způsobila problém s kódováním textu pro volání jiných než anglické jazykové funkce. |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo (1106) |
Starší model GA – Režim JSON – paralelní volání funkce - reprodukovatelný výstup (Preview) |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo-instruct (0914) |
Pouze koncový bod dokončení - Nahrazení modelů starších dokončení |
4,097 | Zář 2021 |
gpt-35-turbo-16k (0613) |
Starší model GA - Základní volání funkcí pomocí nástrojů |
16,384 | Zář 2021 |
gpt-35-turbo (0613) |
Starší model GA - Základní volání funkcí pomocí nástrojů |
4,096 | Zář 2021 |
gpt-35-turbo 1 (0301) |
Starší model GA - Informace o vyřazení |
4,096 | Zář 2021 |
Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našich podrobných návodech.
1 Tento model přijme požadavky > 4 096 tokenů. Nedoporučuje se překročit limit vstupního tokenu 4 096, protože novější verze modelu je omezena na 4 096 tokenů. Pokud při překročení 4 096 vstupních tokenů s tímto modelem narazíte na problémy, tato konfigurace se oficiálně nepodporuje.
Vkládání
text-embedding-3-large
je nejnovější a nejschopnější model vkládání. Upgrade mezi modely vkládání není možný. Aby bylo možné přejít z použití text-embedding-ada-002
na text-embedding-3-large
, budete muset vygenerovat nové vkládání.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Při testování nabízí OpenAI sestavy velkých i malých modelů vkládání třetí generace lepší průměrný výkon načítání ve více jazycích pomocí srovnávacího testu MIRACL a přitom stále zachovává výkon pro anglické úlohy s srovnávacím testem MTEB .
Srovnávací test vyhodnocení | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Průměr MIRACL | 31.4 | 44.0 | 54.9 |
Průměr MTEB | 61.0 | 62.3 | 64.6 |
Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions
parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions
není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade
Srovnávací testy MTEB OpenAI zjistily, že i když jsou dimenze modelu třetí generace sníženy na méně než text-embeddings-ada-002
1 536 dimenzí, zůstává mírně lepší.
DALL-E
Modely DALL-E generují obrázky z textových výzev, které uživatel poskytuje. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.
Šeptat
Modely Šeptání lze použít pro převod řeči na text.
Model Whisper můžete použít také prostřednictvím rozhraní API pro dávkové přepisy služby Azure AI Speech. Podívejte se na model Šeptaní? Dozvíte se více o tom, kdy používat Službu Azure AI Speech vs. Azure OpenAI.
Převod textu na řeč (Preview)
Text OpenAI na řečové modely, které jsou aktuálně ve verzi Preview, je možné použít k syntetizaci textu na řeč.
Text OpenAI můžete také použít k hlasovým hlasovým hovorům přes Azure AI Speech. Další informace najdete v tématu OpenAI text na hlasové hlasy prostřednictvím služby Azure OpenAI nebo průvodce službou Azure AI Speech .
Souhrnná tabulka modelů a dostupnost oblastí
Modely podle typu nasazení
Azure OpenAI poskytuje zákazníkům volby ve struktuře hostování, která odpovídá jejich obchodním vzorům a vzorům využití. Služba nabízí dva hlavní typy nasazení:
- Standard se nabízí s možností globálního nasazení a směrováním provozu globálně za účelem zajištění vyšší propustnosti.
- Zřizování se také nabízí s možností globálního nasazení, která zákazníkům umožňuje nakupovat a nasazovat zřízené jednotky propustnosti napříč globální infrastrukturou Azure.
Všechna nasazení můžou provádět přesně stejné operace odvozování, ale fakturace, škálování a výkon se podstatně liší. Další informace o typech nasazení Azure OpenAI najdete v průvodci typy nasazení.
- Global Standard
- Globální zřízená spravovaná
- Global Batch
- Data Zone Standard
- Standard
- Zřízená spravovaná
Globální standardní dostupnost modelu
Oblast | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4o-realtime-preview, 2024-10-01 | gpt-4, turbo-2024-04-09 |
---|---|---|---|---|---|---|---|
australiaeast | - | - | ✅ | - | ✅ | - | ✅ |
brazilsouth | - | - | ✅ | - | ✅ | - | ✅ |
canadaeast | - | - | ✅ | - | ✅ | - | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | ✅ | - | ✅ | - | ✅ |
Německo – středozápad | - | - | ✅ | - | ✅ | - | ✅ |
japaneast | - | - | ✅ | - | ✅ | - | ✅ |
koreacentral | - | - | ✅ | - | ✅ | - | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Norsko – východ | - | - | ✅ | - | ✅ | - | ✅ |
polskocentral | - | - | ✅ | - | ✅ | - | ✅ |
Jižní Afrika – sever | - | - | ✅ | - | ✅ | - | ✅ |
Střed USA – jih | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
southindia | - | - | ✅ | - | ✅ | - | ✅ |
španělskocentral | - | - | ✅ | ✅ | ✅ | - | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Švýcarsko – sever | - | - | ✅ | - | ✅ | - | ✅ |
Spojené arabské emiráty – sever | - | - | ✅ | - | ✅ | - | ✅ |
uksouth | - | - | ✅ | - | ✅ | - | ✅ |
westeurope | - | - | ✅ | - | ✅ | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Tato tabulka neobsahuje podrobné informace o dostupnosti v jednotlivých oblastech. Informace najdete v části s vyladěním.
Standardní modely podle koncového bodu
Dokončení chatu
Oblast | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ |
canadaeast | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
Norsko – východ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
Střed USA – jih | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ | - |
southindia | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
switzerlandnorth | - | - | - | - | - | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ |
uksouth | - | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
westeurope | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | ✅ | - |
Dostupnost modelu GPT-4 a GPT-4 Turbo
Výběr přístupu zákazníka
Kromě výše uvedených oblastí, které jsou dostupné všem zákazníkům Azure OpenAI, byly některým vybraným stávajícím zákazníkům udělen přístup k verzím GPT-4 v dalších oblastech:
Model | Oblast |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
USA – východ Francie – střed USA – středojižní Velká Británie – jih |
gpt-4 (0613) gpt-4-32k (0613) |
USA – východ USA – východ 2 Japonsko – východ Velká Británie – jih |
Modely GPT-3.5
Podívejte se na verze modelů, kde se dozvíte, jak služba Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu vašich nasazení GPT-3.5 Turbo.
Jemně dolaďovací modely
Poznámka:
gpt-35-turbo
– Vyladění tohoto modelu je omezené na podmnožinu oblastí a není k dispozici v každé oblasti, ve které je základní model k dispozici.
Podporované oblasti pro vyladění se můžou lišit, pokud používáte modely Azure OpenAI v projektu AI Studio oproti mimo projekt.
ID modelu | Vyladění oblastí | Maximální počet požadavků (tokeny) | Trénovací data (až do) |
---|---|---|---|
babbage-002 |
USA – středosever Švédsko – střed Švýcarsko – západ |
16,384 | Zář 2021 |
davinci-002 |
USA – středosever Švédsko – střed Švýcarsko – západ |
16,384 | Zář 2021 |
gpt-35-turbo (0613) |
USA – východ 2 USA – středosever Švédsko – střed Švýcarsko – západ |
4,096 | Zář 2021 |
gpt-35-turbo (1106) |
USA – východ 2 USA – středosever Švédsko – střed Švýcarsko – západ |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo (0125) |
USA – východ 2 USA – středosever Švédsko – střed Švýcarsko – západ |
16,385 | Zář 2021 |
gpt-4 (0613) 1 |
USA – středosever Švédsko – střed |
8192 | Zář 2021 |
gpt-4o-mini 1 (2024-07-18) |
USA – středosever Švédsko – střed |
Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 64 536 |
Října 2023 |
gpt-4o 1 (2024-08-06) |
USA – východ 2 USA – středosever Švédsko – střed |
Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 64 536 |
Října 2023 |
1 GPT-4 je aktuálně ve verzi Public Preview.
Asistenti (Preview)
Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK a Azure AI Studiu. Následující tabulka je určená pro průběžné platby. Informace o dostupnosti zřízené jednotky propustnosti (PTU) najdete v tématu Zřízená propustnost. Uvedené modely a oblasti je možné použít s asistenty v1 i v2. Globální standardní modely můžete použít, pokud jsou podporované v následujících oblastech.
Oblast | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
gpt-4o-mini (2024-07-18) |
---|---|---|---|---|---|---|---|---|
Austrálie – východ | ✅ | ✅ | ✅ | ✅ | ||||
East US | ✅ | ✅ | ✅ | ✅ | ||||
USA – východ 2 | ✅ | ✅ | ✅ | ✅ | ✅ | |||
Francie – střed | ✅ | ✅ | ✅ | ✅ | ||||
Japonsko – východ | ✅ | |||||||
Norsko – východ | ✅ | |||||||
Švédsko – střed | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Velká Británie – jih | ✅ | ✅ | ✅ | ✅ | ||||
USA – západ | ✅ | ✅ | ✅ | |||||
USA – západ 3 | ✅ | ✅ |
Vyřazení modelu
Nejnovější informace o vyřazení modelu najdete v průvodci vyřazením modelu.