Модели Службы Azure OpenAI

Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure для государственных организаций службе OpenAI.

Модели Description
GPT-4o & GPT-4o mini & GPT-4 Turbo Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
GPT-4 Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5 Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
DALL-E Серия моделей, которые могут создавать исходные изображения на естественном языке.
Шептать Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст.
Текст для речи (предварительная версия) Серия моделей в предварительной версии, которая может синтезировать текст для речи.

Площадка раннего доступа (предварительная версия)

6 августа 2024 года OpenAI объявила о последней версии своей флагманской модели 2024-08-06GPT-4o. GPT-4o 2024-08-06 имеет все возможности предыдущей версии, а также:

  • Улучшенная возможность поддержки сложных структурированных выходных данных.
  • Максимальное число выходных маркеров увеличилось с 4096 до 16 384.

Клиенты Azure могут протестировать GPT-4o 2024-08-06 сегодня в новой игровой площадке ai Studio раннего доступа (предварительная версия).

В отличие от предыдущей площадки раннего доступа, платформа раннего доступа AI Studio (предварительная версия) не требует наличия ресурса в определенном регионе.

Примечание.

Запросы и завершения, сделанные с помощью начальной площадки доступа (предварительная версия), могут обрабатываться в любом регионе Azure OpenAI и в настоящее время подвергаются 10 запросам в минуту на ограничение подписки Azure. Этот лимит может измениться в будущем.

Мониторинг злоупотреблений службОй Azure OpenAI включен для всех пользователей начальной площадки доступа, даже если оно утверждено для изменения; Фильтры содержимого по умолчанию включены и не могут быть изменены.

Чтобы протестировать GPT-4o 2024-08-06, войдите на тестовую площадку раннего доступа Azure AI (предварительная версия) с помощью этой ссылки.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Разделы справки доступ к моделям GPT-4o и GPT-4o mini?

GPT-4o и GPT-4o mini доступны для стандартного и глобального развертывания модели.

Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.

При создании ресурса можно развернуть модели GPT-4o. Если выполняется программное развертывание, имена моделей :

  • gpt-4o, версия 2024-05-13
  • gpt-4o-miniВерсия 2024-07-18

GPT-4 Turbo

GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.

Последний выпуск GPT-4 Turbo:

  • gpt-4Версия: turbo-2024-04-09

Это замена для следующих моделей предварительной версии:

  • gpt-4Версия: 1106-Preview
  • gpt-4Версия: 0125-Preview
  • gpt-4Версия: vision-preview

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

  • Версия OpenAI последней 0409 модели turbo поддерживает режим JSON и функцию, вызывая для всех запросов вывода.
  • Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов вывода с входными данными изображения (визуального зрения). Текстовые входные запросы (запросы без image_url встроенных изображений) поддерживают режим JSON и вызов функции.

Различия от gpt-4 vision-preview

  • Интеграция СИИ с GPT-4 Turbo с Vision не поддерживается для gpt-4 версии: turbo-2024-04-09 К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

GPT-4 Turbo подготовленная управляемая доступность

  • gpt-4Версия: turbo-2024-04-09 доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Доступность по регионам

Сведения о региональной доступности модели см. в матрице модели для стандартных и подготовленных развертываний.

Развертывание GPT-4 Turbo с помощью общедоступной версии vision

Чтобы развернуть модель общедоступной версии из пользовательского интерфейса Студии, выберите GPT-4 и выберите turbo-2024-04-09 версию из раскрывающегося меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

GPT-4

GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4модели. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.

  • gpt-4Версия 0314
  • gpt-4Версия 0613
  • gpt-4-32kВерсия 0613

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

Модели GPT-4 и GPT-4 Turbo

  • Эти модели можно использовать только с API завершения чата.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-4o-mini (2024-07-18)
GPT-4o mini
Последняя модель небольшой общедоступной версии
— Быстрая, недорогая модель с поддержкой идеально подходит для замены моделей серии GPT-3.5 Turbo.
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
Входные данные: 128 000
Выходные данные: 16 384
Октябрь 2023 г.
gpt-4o (2024-05-13)
GPT-4o (Omni)
Последняя модель большой общедоступной версии
— Текст, обработка изображений
— режим JSON
— параллельные вызовы функций
— улучшенная точность и скорость реагирования
— Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision
— высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения
Входные данные: 128 000
Выходные данные: 4096
Октябрь 2023 г.
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo с vision
Новая модель общедоступной версии
— замена всех предыдущих моделейvision-preview GPT-4 (, 1106-Preview, 0125-Preview).
- Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.
gpt-4 (0125-Preview)*
GPT-4 Turbo Preview
Предварительная версия модели
-Заменяет 1106-Preview
— повышение производительности создания кода
— уменьшает случаи, когда модель не завершает задачу
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Декабрь 2023 г.
gpt-4 (визуально-предварительная версия)
GPT-4 Turbo с предварительным просмотром визуального зрения
Предварительная версия модели
— принимает входные данные текста и изображения.
— поддерживает улучшения
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.
gpt-4 (1106-preview)
GPT-4 Turbo Preview
Предварительная версия модели
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 128 000
Выходные данные: 4096
Апрель 2023 г.
gpt-4-32k (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
32,768 Сентябрь 2021 г.
gpt-4 (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
8,192 Сентябрь 2021 г.
gpt-4-32k(0314) Старая модель общедоступной версии
- Сведения о прекращении поддержки
32,768 Сентябрь 2021 г.
gpt-4 (0314) Старая модель общедоступной версии
- Сведения о прекращении поддержки
8,192 Сентябрь 2021 г.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной или общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

  • GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview.
  • GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
  • GPT-4 — это последняя версия общедоступной версии turbo-2024-04-09 и заменяет , 1106-previewа vision-previewтакже 0125-Preview.

Внимание

  • gpt-4 версии 1106-Preview, 0125-Preview и vision-preview будут обновлены с стабильной версией gpt-4 в будущем. Развертывания версий gpt-4 1106-Preview, 0125-Preview и vision-preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнет обновляться после выпуска стабильной версии. Для каждого развертывания обновление версии модели происходит без прерывания работы службы вызовов API. Обновления выполняются по регионам, а процесс полного обновления, как ожидается, займет 2 недели. Развертывания версий 1106-Preview, 0125-Preview и предварительной версии визуального представления, равные "Без автоматической gpt-4 оценки", не будут обновлены и перестают работать при обновлении предварительной версии в регионе. Дополнительные сведения о времени обновления см. в статье об отмене использования модели OpenAI в Azure OpenAI.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003 API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

Model ID Description Максимальный запрос (токены) Учебные данные (до)
gpt-35-turbo (0125) NEW Последняя модель общедоступной версии
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
— более высокая точность при реагировании в запрошенных форматах.
— Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка.
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (1106) Старая модель общедоступной версии
— режим JSON
— параллельные вызовы функций
— воспроизводимые выходные данные (предварительная версия)
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo-instruct (0914) Только конечная точка завершения
— замена устаревших моделей завершения
4,097 Сентябрь 2021 г.
gpt-35-turbo-16k (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Старая модель общедоступной версии
— Базовый вызов функции с инструментами
4096 Сентябрь 2021 г.
gpt-35-turbo1 (0301) Старая модель общедоступной версии
- Сведения о прекращении поддержки
4096 Сентябрь 2021 г.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата см . в подробном руководстве.

1 Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Внедрение

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002 text-embedding-3-large к вам потребуется создать новые внедрения.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .

Тест оценки text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Среднее значение MIRACL 31,4 44.0 54.9
Среднее значение MTEB 61,0 62,3 64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002 1536 измерений производительности, остается немного лучше.

DALL-E

Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.

Шептать

Модели Whisper можно использовать для преобразования речи в текст.

Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Текст для речи (предварительная версия)

Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.

Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Сводная таблица модели и доступность региона

Примечание.

В этой статье рассматривается доступность модели или региона, которая применяется ко всем клиентам Azure OpenAI с типами развертывания standard. Некоторые клиенты имеют доступ к сочетаниям моделей и регионов, которые не перечислены в единой таблице ниже. Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.

Доступность модели развертывания уровня "Стандартный"

Регион gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 dall-e-2, 2.0 dall-e-3, 3.0 babbage-002, 1 davinci-002, 1 tts, 001 tts-hd, 001 шепет, 001
australiaeast - - - - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Эта таблица не включает региональную доступность глобальной стандартной модели для GPT-4o или подробные сведения о доступности регионов. Ознакомьтесь с выделенным разделом глобального стандартного развертывания и разделом тонкой настройки этой информации.

Квота модели развертывания уровня "Стандартный" и "Стандартный"

Область/регион GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V gpt-4o gpt-4o-mini GPT-35-Turbo GPT-35-Turbo-Instruct gpt-4o — GlobalStandard gpt-4o-mini - GlobalStandard GPT-4-Turbo — GlobalStandard GPT-4o — global-Batch GPT-4o-mini - Global-Batch GPT-4 — глобальная пакетная служба GPT-4-Turbo — глобальная пакетная служба gpt-35-turbo - Global-Batch Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large GPT-4o - finetune GPT-4o-mini - finetune GPT-4 — finetune Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 тыс. 80 K 80 K 30 K - - 300 K - 30 М - 2 млн - - - - - 350 K - - - - - - - - - - - -
brazilsouth - - - - - - - - 30 М - 2 млн - - - - - 350 K - - - - - - - - - - - -
canadaeast 40 тыс. 80 K 80 K - - - 300 K - 30 М - 2 млн - - - - - 350 K 350 K 350 K - - - - - - - - - -
eastus - - 80 K - 1 млн 2 млн 240 K 240 K 30 М 50 М 2 млн 5 B 5 B 150 М 300 М 10 B 240 K 350 K 350 K - - - - - - - - - -
eastus2 - - 80 K - 1 млн - 300 K - 30 М - 2 млн - - - - - 350 K 350 K 350 K - - - - - - - 250 K 250 K 250 K
francecentral 20 тыс. 60 K 80 K - - - 240 K - 30 М - 2 млн - - - - - 240 K - 350 K - - - - - - - - - -
germanywestcentral - - - - - - - - 30 М - 2 млн - - - - - - - - - - - - - - - - - -
japaneast - - - 30 K - - 300 K - 30 М - 2 млн - - - - - 350 K - 350 K - - - - - - - - - -
koreacentral - - - - - - - - 30 М - 2 млн - - - - - - - - - - - - - - - - - -
northcentralus - - 80 K - 1 млн - 300 K - 30 М - 2 млн - - - - - 350 K - - 100 тыс. 100 тыс. 100 тыс. 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - - - 30 М - 2 млн - - - - - 350 K - 350 K - - - - - - - - - -
польшацентральная - - - - - - - - 30 М - 2 млн - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - 30 М - 2 млн - - - - - 350 K - - - - - - - - - - - -
southcentralus - - 80 K - 1 млн - 240 K - 30 М - 2 млн - - - - - 240 K - - - - - - - - - - - -
southindia - - 150 K - - - 300 K - 30 М - 2 млн - - - - - 350 K - 350 K - - - - - - - - - -
swedencentral 40 тыс. 80 K 150 K 30 K 1 млн 2 млн 300 K 240 K 30 М 50 М 2 млн 5 B 5 B 150 М 300 М 10 B 350 K - 350 K 100 тыс. 100 тыс. 100 тыс. 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 тыс. 80 K - 30 K - - 300 K - 30 М - 2 млн - - - - - 350 K - - - - - - - - - - - -
switzerlandwest - - - - - - - - - - - - - - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - - - 240 K - 30 М - 2 млн - - - - - 350 K - 350 K - - - - - - - - - -
westeurope - - - - - - 240 K - 30 М - 2 млн - - - - - 240 K - - - - - - - - - - - -
westus - - 80 K 30 K 1 млн - 300 K - 30 М - 2 млн 5 B 5 B 150 М 300 М 10 B 350 K - - - - - - - - - - - -
westus3 - - 80 K - 1 млн - - - 30 М - 2 млн - - - - - 350 K - 350 K - - - - - - - - - -

Доступность подготовленной модели развертывания

Регион gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast -
brazilsouth - - -
canadacentral - - - - - -
canadaeast - - -
eastus
eastus2
francecentral - - -
germanywestcentral - -
japaneast - - - -
koreacentral - - - -
northcentralus
norwayeast - - - - - -
польшацентральная - - -
southafricanorth - - - -
southcentralus -
southindia - -
swedencentral
switzerlandnorth -
switzerlandwest - - - - - - - -
uksouth -
westus -
westus3 -

Примечание.

Подготовленная версия версии gpt-4 : turbo-2024-04-09 в настоящее время ограничена только текстом.

Разделы справки получить доступ к подготовленным?

Чтобы получить подготовленную пропускную способность, необходимо поговорить с группой по продажам и учетной записи Майкрософт. Если у вас нет команды по продажам и учетной записи, к сожалению, вы не можете приобрести подготовленную пропускную способность.

Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.

Доступность глобальной стандартной модели

gpt-4oВерсия: 2024-05-13

Поддерживаемые регионы:

  • australiaeast
  • brazilsouth
  • canadaeast
  • eastus
  • eastus2
  • francecentral
  • germanywestcentral
  • japaneast
  • koreacentral
  • northcentralus
  • norwayeast
  • польшацентральная
  • southafricanorth
  • southcentralus
  • southindia
  • swedencentral
  • switzerlandnorth
  • uksouth
  • westeurope
  • westus
  • westus3

gpt-4o-miniВерсия: 2024-07-18

Поддерживаемые регионы:

  • eastus

Доступность глобальной пакетной модели

Поддержка регионов и моделей

Следующие модели поддерживают глобальный пакет:

Модель Версия Формат входных данных
gpt-4o-mini 2024-07-18 текст + изображение
gpt-4o 2024-05-13 текст + изображение
gpt-4 turbo-2024-04-09 text
gpt-4 0613 text
gpt-35-turbo 0125 text
gpt-35-turbo 1106 text
gpt-35-turbo 0613 text

В настоящее время глобальный пакет поддерживается в следующих регионах:

  • Восточная часть США
  • Западная часть США
  • Центральная Швеция

Доступность модели GPT-4 и GPT-4 Turbo

Общедоступные облачные регионы

Регион gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613
australiaeast - - - -
canadaeast - - - - -
eastus - - - -
eastus2 - - - - -
francecentral - - - - -
japaneast - - - - - - -
northcentralus - - - - -
norwayeast - - - - - - -
southcentralus - - - - -
southindia - - - - - - -
swedencentral -
switzerlandnorth - - - - -
uksouth - - - - - -
westus - - - -
westus3 - - - - -

Выбор доступа к клиенту

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель Область/регион
gpt-4 (0314)
gpt-4-32k (0314)
Восточная часть США
Центральная Франция
Южная часть США
южная часть Соединенного Королевства
gpt-4 (0613)
gpt-4-32k (0613)
Восточная часть США
Восточная часть США 2
Восточная Япония
южная часть Соединенного Королевства

Модели GPT-3.5

Внимание

Новая gpt-35-turbo (0125) модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.

GPT-3.5 Turbo используется с Chat Completion API. GPT-3.5 Turbo версии 0301 также можно использовать с API завершения, хотя это не рекомендуется. GPT-3.5 Turbo версии 0613 и 1106 поддерживают только API завершения чата.

GPT-3.5 Turbo версии 0301 является первой версией модели, выпущенной. Версия 0613 является второй версией модели и добавляет поддержку вызовов функций.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели для развертываний GPT-3.5 Turbo.

Доступность модели GPT-3.5-Turbo

Общедоступные облачные регионы

Регион gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

Модели Embeddings

Эти модели можно использовать только с запросами API внедрения.

Примечание.

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Чтобы перейти от использования text-embedding-ada-002 text-embedding-3-large к вам, потребуется создать новые внедрения.

Model ID Максимальный запрос (токены) Измерения выходных данных Учебные данные (до)
text-embedding-ada-002 (версия 2) 8,191 1536 Сентябрь 2021 г.
text-embedding-ada-002 (версия 1) 2,046 1536 Сентябрь 2021 г.
text-embedding-3-large 8,191 3072 Сентябрь 2021 г.
text-embedding-3-small 8,191 1536 Сентябрь 2021 г.

Примечание.

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Общедоступные облачные регионы

Регион text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - -
japaneast - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - -
swedencentral - -
switzerlandnorth - - -
uksouth - -
westeurope - - -
westus - - -
westus3 - -

Модели DALL-E

Model ID Доступность компонентов Максимальный запрос (символы)
dalle2 (предварительная версия) Восточная часть США 1,000
dall-e-3 Восточная часть США, Восточная Австралия, Центральная Швеция 4000

Модели точной настройки

babbage-002 и davinci-002 не обучены следовать инструкциям. Запросы этих базовых моделей должны выполняться только в качестве точки ссылки на настраиваемую версию, чтобы оценить ход обучения.

gpt-35-turbo — точная настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Model ID Точное настройка регионов Максимальный запрос (токены) Учебные данные (до)
babbage-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
davinci-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
4096 Сентябрь 2021 г.
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
16,385 Сентябрь 2021 г.
gpt-4 (0613) 1 Северная часть США
Центральная Швеция
8192 Сентябрь 2021 г.
gpt-4o-mini1 (2024-07-18) Северная часть США
Центральная Швеция
Входные данные: 128 000
Выходные данные: 16 384
Длина контекста примера обучения: 64 536
Октябрь 2023 г.

1 GPT-4 и GPT-4o мини-настройка в настоящее время находится в общедоступной предварительной версии. Дополнительные сведения см. в руководстве по оценке безопасности GPT-4o и GPT-4o.

Модели Whisper

Model ID Доступность модели Максимальный запрос (размер аудиофайла)
whisper Восточная часть США 2
Северная часть США
Восточная Норвегия
Южная Индия
Центральная Швеция
Западная Европа
25 Мб

Модели преобразования текста в речь (предварительная версия)

Model ID Доступность модели
tts-1 Северная часть США
Центральная Швеция
tts-1-hd Северная часть США
Центральная Швеция

Помощники (предварительная версия)

Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK, Azure AI Studio и Azure OpenAI Studio. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.

Область/регион gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Восточная Австралия
Восточная часть США
Восточная часть США 2
Центральная Франция
Восточная Япония
Восточная Норвегия;
Центральная Швеция
южная часть Соединенного Королевства
западная часть США
Западная часть США — 3

Прекращение использования модели

Последние сведения о выходе на пенсию модели см. в руководстве по выходу на пенсию модели.

Следующие шаги