Новые возможности Службы Azure OpenAI

В этой статье приводится сводка последних выпусков и основных обновлений документации для Azure OpenAI.

Октябрь 2024 г.

Тип развертывания новой зоны данных уровня "Стандартный"

Стандартные развертывания зоны данных доступны в том же ресурсе Azure OpenAI, что и все остальные типы развертывания Azure OpenAI, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных в пределах определенной корпорацией Майкрософт зоны данных с оптимальной доступностью для каждого запроса. Стандарт зоны данных предоставляет более высокие квоты по умолчанию, чем типы развертывания на основе географии Azure. В моделях gpt-4o-2024-05-13и gpt-4o-mini-2024-07-18 моделях поддерживаются gpt-4o-2024-08-06стандартные развертывания зоны данных.

Дополнительные сведения см. в руководстве по типам развертывания.

Глобальная общедоступная версия пакетной службы

Теперь общедоступен глобальный пакет Azure OpenAI.

API пакетной службы Azure OpenAI предназначен для эффективной обработки крупномасштабных и больших объемов задач. Обработка асинхронных групп запросов с отдельной квотой с 24-часовым временным поворотом при 50% меньше затрат, чем глобальный стандарт. При пакетной обработке вместо отправки одного запроса за раз вы отправляете большое количество запросов в одном файле. Глобальные пакетные запросы имеют отдельную квоту токена, вложенную в очередь, избежать нарушений работы рабочих нагрузок в Сети.

Основные примеры таких ситуаций:

  • Обработка крупномасштабных данных: быстро анализируйте обширные наборы данных параллельно.

  • Создание содержимого: создание больших объемов текста, таких как описания продуктов или статьи.

  • Проверка и сводка документов. Автоматизация проверки и сводки длинных документов.

  • Автоматизация поддержки клиентов. Обработка многочисленных запросов одновременно для ускорения ответов.

  • Извлечение и анализ данных. Извлечение и анализ данных из огромных объемов неструктурированных данных.

  • Задачи обработки естественного языка (NLP): выполнение таких задач, как анализ тональности или перевод больших наборов данных.

  • Маркетинг и персонализация: создание персонализированного содержимого и рекомендаций в масштабе.

Дополнительные сведения о начале работы с глобальными пакетными развертываниями.

ограниченный доступ к моделям o1-preview и o1-mini

o1-mini Теперь o1-preview доступны модели для доступа к API и развертывания моделей. Регистрация требуется, и доступ будет предоставлен на основе критериев соответствия корпорации Майкрософт.

Запрос доступа: приложение модели ограниченного доступа

Клиенты, которые уже утверждены и имеют доступ к модели через детскую площадку раннего доступа, не нужно применять повторно, вы автоматически будете предоставлять доступ к API. После предоставления доступа необходимо создать развертывание для каждой модели.

Поддержка API:

Поддержка моделей серии o1 была добавлена в версию 2024-09-01-previewAPI.

Параметр max_tokens устарел и заменен новым max_completion_tokens параметром. Модели серии o1 будут работать только с параметром max_completion_tokens .

Доступность региона:

Модели доступны для стандартного и глобального стандартного развертывания в Восточной части США2 и Швеции Central для утвержденных клиентов.

Новый API GPT-4o Realtime для распознавания речи и общедоступной предварительной версии аудио

Звук Azure OpenAI GPT-4o является частью семейства моделей GPT-4o, которая поддерживает низкой задержки, "речь в, речь вне" диалоговых взаимодействий. API звука realtime GPT-4o предназначен для обработки взаимодействий в режиме реального времени, низкой задержки общения, что делает его отличным для вариантов использования с участием динамического взаимодействия между пользователем и моделью, такими как агенты поддержки клиентов, голосовые помощники и переводчики в режиме реального времени.

Модель gpt-4o-realtime-preview доступна для глобальных развертываний в регионах "Восточная часть США 2" и "Центральная Швеция".

Дополнительные сведения см. в документации по звуку GPT-4o в режиме реального времени.

Обновления глобальной пакетной поддержки

Глобальный пакет теперь поддерживает GPT-4o (2024-08-06). Дополнительные сведения см. в руководстве по началу работы с глобальным пакетом.

Сентябрь 2024 г.

Обновления пользовательского интерфейса Azure OpenAI Studio

19 сентября при доступе к Azure OpenAI Studio вы начнете не видеть устаревший пользовательский интерфейс студии по умолчанию. Если вам потребуется, вы по-прежнему сможете вернуться к предыдущему интерфейсу с помощью переключателя на старый внешний вид в верхней панели пользовательского интерфейса в течение следующих нескольких недель. Если вы переключитесь на устаревший пользовательский интерфейс Studio, это поможет вам заполнить форму обратной связи, чтобы сообщить нам, почему. Мы активно отслеживаем эту обратную связь, чтобы улучшить новый интерфейс.

Подготовленные развертывания GPT-4o 2024-08-06

GPT-4o 2024-08-06 теперь доступен для подготовленных развертываний в восточной части США, восточной части США 2, северной части США и Центральной Швеции. Он также доступен для глобальных подготовленных развертываний.

Последние сведения о доступности модели см. на странице моделей.

НОВЫЙ глобальный подготовленный тип развертывания

Глобальные развертывания доступны в одних и том же ресурсах Azure OpenAI, что и не глобальные типы развертывания, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных с наилучшей доступностью для каждого запроса. Глобальные подготовленные развертывания обеспечивают зарезервированную емкость обработки модели для высокой и прогнозируемой пропускной способности с помощью глобальной инфраструктуры Azure. Глобальные подготовленные развертывания поддерживаются и gpt-4o-2024-08-06 gpt-4o-mini-2024-07-18 модели.

Дополнительные сведения см. в руководстве по типам развертывания.

НОВЫЕ модели o1-preview и o1-mini, доступные для ограниченного доступа

Azure OpenAI o1-preview и o1-mini модели предназначены для решения задач по устранению причин и решению проблем с повышенным фокусом и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.

Ключевые возможности серии o1

  • Сложное создание кода: способен создавать алгоритмы и обрабатывать сложные задачи программирования для поддержки разработчиков.
  • Расширенное решение проблем: идеально подходит для комплексных сеансов мозгового штурма и решения сложных задач.
  • Комплексное сравнение документов: идеально подходит для анализа контрактов, файлов дела или юридических документов для выявления тонких различий.
  • Инструкции и управление рабочими процессами: особенно эффективно для управления рабочими процессами, требующими более коротких контекстов.

Варианты модели

  • o1-preview: o1-preview является более способным o1 модели серии.
  • o1-mini: o1-mini это быстрее и дешевле моделей o1 серии.

Версия модели: 2024-09-12

Запрос доступа: приложение модели ограниченного доступа

Ограничения

Модели o1 серии в настоящее время находятся в предварительной версии и не включают некоторые функции, доступные в других моделях, таких как понимание изображений и структурированные выходные данные, доступные в последней модели GPT-4o. Для многих задач общедоступные модели GPT-4o по-прежнему могут быть более подходящими.

Безопасность

OpenAI включил дополнительные меры безопасности в o1 модели, включая новые методы, которые помогут моделям отказаться от небезопасных запросов. Эти улучшения делают o1 ряд наиболее надежных моделей доступными.

Availability

o1-mini Они o1-preview доступны в регионе "Восточная часть США2" для ограниченного доступа через игровую площадку ai Studio для раннего доступа. Обработка данных для моделей o1 может происходить в другом регионе, отличном от того, где они доступны для использования.

Чтобы попробовать o1-preview и o1-mini модели в регистрации на ранней детской площадке , требуется, и доступ будет предоставлен на основе критериев соответствия майкрософт.

Запрос доступа: приложение модели ограниченного доступа

После предоставления доступа вам потребуется:

  1. Перейдите к https://ai.azure.com/resources и выберите ресурс в регионе eastus2 . Если у вас нет ресурса Azure OpenAI в этом регионе, вам потребуется создать его.
  2. eastus2 После выбора ресурса Azure OpenAI на верхней левой панели в разделе "Игровые площадки" выберите "Ранний доступ" (предварительная версия).

Август 2024 г.

Структурированные выходные данные GPT-4o 2024-08-06

Развертывания GPT-4o mini provisioned

GPT-4o mini теперь доступен для подготовленных развертываний на востоке Канады, восточной части США, восточной части США2, северной части США и Центральной Швеции.

Последние сведения о доступности модели см. на странице моделей.

GPT-4o тонкой настройки (общедоступная предварительная версия)

Предварительная настройка GPT-4o теперь доступна для Azure OpenAI в общедоступной предварительной версии в Северной части США и Швеции Central.

Дополнительные сведения см. в нашей записи блога.

Новый выпуск API предварительной версии

Версия 2024-07-01-preview API — это последний выпуск API для разработки и вывода API. Он заменяет версию 2024-05-01-preview API и добавляет поддержку:

Дополнительные сведения см. в нашей справочной документации

GPT-4o mini regional availability

  • GPT-4o mini доступен для стандартного и глобального стандартного развертывания в восточной части США и Центральной Швеции.
  • GPT-4o mini доступен для глобального пакетного развертывания в регионах "Восточная часть США", "Центральная Швеция" и "Западная часть США".

Руководство по оценке

Последняя модель GPT-4o доступна на ранней площадке доступа (предварительная версия)

6 августа 2024 года OpenAI объявила о последней версии своей флагманской модели 2024-08-06GPT-4o. GPT-4o 2024-08-06 имеет все возможности предыдущей версии, а также:

  • Улучшенная возможность поддержки сложных структурированных выходных данных.
  • Максимальное число выходных маркеров увеличилось с 4096 до 16 384.

Клиенты Azure могут протестировать GPT-4o 2024-08-06 сегодня в новой игровой площадке ai Studio раннего доступа (предварительная версия).

В отличие от предыдущей площадки раннего доступа, платформа раннего доступа AI Studio (предварительная версия) не требует наличия ресурса в определенном регионе.

Примечание.

Запросы и завершения, сделанные с помощью начальной площадки доступа (предварительная версия), могут обрабатываться в любом регионе Azure OpenAI и в настоящее время подлежат 10 запросам в минуту на ограничение подписки Azure. Это ограничение может измениться в будущем.

Мониторинг злоупотреблений службОй Azure OpenAI включен для всех пользователей начальной площадки доступа, даже если оно утверждено для изменения; Фильтры содержимого по умолчанию включены и не могут быть изменены.

Чтобы протестировать GPT-4o 2024-08-06, войдите на тестовую площадку раннего доступа Azure AI (предварительная версия) с помощью этой ссылки.

Теперь доступны глобальные развертывания пакетной службы

API пакетной службы Azure OpenAI предназначен для эффективной обработки крупномасштабных и больших объемов задач. Обработка асинхронных групп запросов с отдельной квотой с 24-часовым временным поворотом при 50% меньше затрат, чем глобальный стандарт. При пакетной обработке вместо отправки одного запроса за раз вы отправляете большое количество запросов в одном файле. Глобальные пакетные запросы имеют отдельную квоту токена, вложенную в очередь, избежать нарушений работы рабочих нагрузок в Сети.

Основные примеры таких ситуаций:

  • Обработка крупномасштабных данных: быстро анализируйте обширные наборы данных параллельно.

  • Создание содержимого: создание больших объемов текста, таких как описания продуктов или статьи.

  • Проверка и сводка документов. Автоматизация проверки и сводки длинных документов.

  • Автоматизация поддержки клиентов. Обработка многочисленных запросов одновременно для ускорения ответов.

  • Извлечение и анализ данных. Извлечение и анализ данных из огромных объемов неструктурированных данных.

  • Задачи обработки естественного языка (NLP): выполнение таких задач, как анализ тональности или перевод больших наборов данных.

  • Маркетинг и персонализация: создание персонализированного содержимого и рекомендаций в масштабе.

Дополнительные сведения о начале работы с глобальными пакетными развертываниями.

Июль 2024 г.

GPT-4o mini теперь доступен для точной настройки

GPT-4o мини-настройка теперь доступна в общедоступной предварительной версии в Швеции Центральной и Северной части США.

Теперь счет выставляется средству поиска по файлам помощников

Средство поиска файлов для Помощников теперь имеет дополнительные расходы на использование. Дополнительные сведения см. на странице с ценами.

Мини-модель GPT-4o, доступная для развертывания

GPT-4o mini — это последняя модель Azure OpenAI, объявленная 18 июля 2024 г.:

"GPT-4o mini позволяет клиентам доставлять потрясающие приложения с более низкой стоимостью с пламя скоростью. GPT-4o mini значительно умнее, чем GPT-3.5 Turbo — оценка 82% на измерении массивных многотасковых Распознавание речи (MMLU) по сравнению с 70%- и более 60% дешевле.1 Модель обеспечивает расширенное окно контекста 128K и интегрирует улучшенные многоязычные возможности GPT-4o, обеспечивая более высокое качество языков со всего мира».

В настоящее время модель доступна как для стандартного, так и глобального стандартного развертывания в регионе "Восточная часть США".

Сведения о квоте модели см . на странице квоты и ограничений, а также последние сведения о доступности модели см. на странице моделей.

Новая политика фильтрации содержимого по умолчанию для ответственного искусственного интеллекта

Новая политика DefaultV2 фильтрации содержимого по умолчанию обеспечивает последние меры безопасности и безопасности для серии моделей GPT (текст), в том числе:

  • Экраны запроса для атак в тюрьме на запросы пользователей (фильтр)
  • Защищенное обнаружение материалов для текста (фильтра) для завершения модели
  • Защищенное обнаружение материалов для кода (анотации) для завершения модели

Несмотря на отсутствие изменений в фильтрах содержимого для существующих ресурсов и развертываний (по умолчанию или настраиваемых конфигураций фильтрации содержимого остаются неизменными), новые ресурсы и развертывания GPT автоматически наследуют новую политику DefaultV2фильтрации содержимого. Клиенты могут переключаться между значениями по умолчанию безопасности и создавать пользовательские конфигурации фильтрации содержимого.

Дополнительные сведения см. в документации по политике безопасности по умолчанию.

Новый выпуск API общедоступной версии

Версия 2024-06-01 API — это последний выпуск API вывода плоскости данных общедоступной версии. Он заменяет версию 2024-02-01 API и добавляет поддержку:

  • encoding_format внедрение и dimensions параметры.
  • завершение чата logprobs и top_logprobs параметры.

Дополнительные сведения см. в справочной документации по выводу плоскости данных.

Расширение регионов, доступных для глобальных стандартных развертываний gpt-4o

GPT-4o теперь доступен для глобальных стандартных развертываний в:

  • australiaeast
  • brazilsouth
  • canadaeast
  • eastus
  • eastus2
  • francecentral git
  • germanywestcentral
  • japaneast
  • koreacentral
  • northcentralus
  • norwayeast
  • польшацентральная
  • southafricanorth
  • southcentralus
  • southindia
  • swedencentral
  • switzerlandnorth
  • uksouth
  • westeurope
  • westus
  • westus3

Дополнительные сведения о глобальной стандартной квоте см. на странице квоты и ограничений.

Июнь 2024 г.

Обновления даты выхода на пенсию

  • Обновлена gpt-35-turbo дата выхода на пенсию 0301 до 1 октября 2024 года.
  • Обновлена gpt-35-turbo дата выхода на пенсию до gpt-35-turbo-16k1 октября 2024 г.
  • Обновлена gpt-4 и gpt-4-32k 0314 устарела дата до 1 октября 2024 г. и дата выхода на пенсию до 6 июня 2025 г.

Ознакомьтесь с нашим руководством по выходу на пенсию модели, чтобы получить последние сведения о прекращении использования модели и выходе на пенсию.

Выставление счетов на основе маркеров для точной настройки

  • Выставление счетов по настройке Azure OpenAI теперь основано на количестве маркеров в учебном файле, а не на общее время обучения. Это может привести к значительному сокращению затрат на некоторые учебные запуски и значительно упрощает оценка затрат на тонкой настройке. Дополнительные сведения см. в официальном объявлении.

GPT-4o выпущено в новых регионах

  • GPT-4o теперь также доступен в:
    • Центральная Швеция для стандартного регионального развертывания.
    • Восточная Австралия, Восточная Канада, Восточная Япония, Центральная Корея, Центральная Швеция, Северная Швейцария и Западная часть США 3 для подготовленного развертывания.

Последние сведения о доступности модели см. на странице моделей.

Поддержка управляемых клиентом ключей (CMK) для помощников

Потоки и файлы в помощниках теперь поддерживают CMK в следующем регионе:

  • Западная часть США — 3

Май 2024 г.

Подготовленные развертывания GPT-4o

gpt-4o Версия: 2024-05-13 доступна как для стандартных, так и подготовленных развертываний. Подготовленные и стандартные развертывания моделей принимают как текстовые, так и запросы вывода изображений и визуального распознавания. Сведения о региональной доступности модели см. в матрице модели для подготовленных развертываний.

Помощники версии 2 (предварительная версия)

Обновление API Помощников теперь доступно в общедоступной среде. Он содержит следующие обновления:

  • Средство поиска файлов и хранилище векторов
  • Максимальная поддержка завершения и максимальной поддержки маркеров запроса для управления использованием маркеров.
  • tool_choiceпараметр для принудительного использования помощником указанного средства. Теперь вы можете создавать сообщения с ролью помощника для создания пользовательских журналов бесед в потоках.
  • temperatureПоддержка параметров , top_presponse_format параметров.
  • Поддержка потоковой передачи и опроса. Вспомогательные функции в пакете SDK для Python можно использовать для создания запусков и потоковых ответов. Мы также добавили вспомогательные помощники по пакету SDK для опроса, чтобы предоставить общий доступ к обновлениям состояния объектов без необходимости опроса.
  • Экспериментируйте с logic Apps и вызовом функций с помощью Azure OpenAI Studio. Импортируйте ИНТЕРФЕЙСы REST API, реализованные в Logic Apps в качестве функций, и студия вызывает функцию (как рабочий процесс Logic Apps) автоматически на основе запроса пользователя.
  • AutoGen by Microsoft Research предоставляет платформу общения с несколькими агентами, чтобы обеспечить удобное создание рабочих процессов большой языковой модели (LLM) в широком спектре приложений. Помощники Azure OpenAI теперь интегрированы в AutoGen через GPTAssistantAgentновый экспериментальный агент, который позволяет легко добавлять помощников в рабочие процессы с несколькими агентами на основе автогена. Это позволяет нескольким помощникам Azure OpenAI, которые могут быть задачами или доменами для совместной работы и решения сложных задач.
  • Поддержка точно настроенных gpt-3.5-turbo-0125 моделей в следующих регионах:
    • Восточная часть США 2
    • Центральная Швеция
  • Расширенная региональная поддержка :
    • Восточная Япония
    • южная часть Соединенного Королевства
    • западная часть США
    • Западная часть США — 3
    • Восточная Норвегия

Дополнительные сведения см. в записи блога о помощниках.

Общая доступность модели GPT-4o (GA)

GPT-4o ("o для "omni") является последней моделью из OpenAI, запущенной 13 мая 2024 года.

  • GPT-4o интегрирует текст и изображения в одной модели, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером.
  • GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка, и в задачах визуального распознавания, устанавливая новые тесты для возможностей искусственного интеллекта.

Сведения о региональной доступности модели см. на странице моделей.

Глобальный тип развертывания уровня "Стандартный" (предварительная версия)

Глобальные развертывания доступны в одних и том же ресурсах Azure OpenAI, что и не глобальные предложения, но позволяют использовать глобальную инфраструктуру Azure для динамического маршрутизации трафика в центр обработки данных с наилучшей доступностью для каждого запроса. Глобальный стандарт предоставляет максимальную квоту по умолчанию для новых моделей и устраняет необходимость балансировки нагрузки между несколькими ресурсами.

Дополнительные сведения см. в руководстве по типам развертывания.

Обновление тонкой настройки

Фильтры содержимого DALL-E и GPT-4 Turbo Vision GA

Создайте настраиваемые фильтры содержимого для развертываний DALL-E 2 и 3, GPT-4 Turbo с ga (turbo-2024-04-09) и GPT-4o. Фильтрование содержимого

Асинхронный фильтр доступен для всех клиентов Azure OpenAI

Асинхронное выполнение фильтров для улучшения задержки в сценариях потоковой передачи теперь доступно для всех клиентов Azure OpenAI. Фильтрование содержимого

Экраны запросов

Экраны запросов защищают приложения, управляемые моделями Azure OpenAI, из двух типов атак: прямых (с помощью режима тюрьмы) и косвенных атак. Непрямые атаки (также известные как непрямые атаки на запросы или атаки на внедрение междоменных запросов) — это тип атаки на системы, управляемые моделями генерированного ИИ, которые могут возникать при обработке сведений о приложениях, которые не были непосредственно созданы разработчиком приложения или пользователем. Фильтрование содержимого

Выпуск API 2024-05-01-preview

  • Дополнительные сведения см. в жизненном цикле версии API.

Общая доступность модели GPT-4 Turbo (GA)

Последний выпуск GPT-4 Turbo:

  • gpt-4Версия: turbo-2024-04-09

Это замена для следующих моделей предварительной версии:

  • gpt-4Версия: 1106-Preview
  • gpt-4Версия: 0125-Preview
  • gpt-4Версия: vision-preview

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

  • Версия OpenAI последней 0409 модели turbo поддерживает режим JSON и функцию, вызывая для всех запросов вывода.
  • Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов вывода с входными данными изображения (визуального зрения). Текстовые входные запросы (запросы без image_url встроенных изображений) поддерживают режим JSON и вызов функции.

Различия от gpt-4 vision-preview

  • Интеграция СИИ с GPT-4 Turbo с Vision не поддерживается для gpt-4 версии: turbo-2024-04-09 К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

Внимание

Улучшения визуального распознавания предварительных версий, включая оптическое распознавание символов (OCR), заземление объектов, запросы видео больше не будут доступны после gpt-4 обновления turbo-2024-04-09версииvision-preview. Если вы используете какие-либо из этих предварительных версий функций, это автоматическое обновление модели будет критическим изменением.

GPT-4 Turbo подготовленная управляемая доступность

  • gpt-4Версия: turbo-2024-04-09 доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Развертывание GPT-4 Turbo с помощью общедоступной версии vision

Чтобы развернуть модель общедоступной версии из пользовательского интерфейса Студии, выберите GPT-4 и выберите turbo-2024-04-09 версию из раскрывающегося меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

Апрель 2024 г.

Теперь в двух новых регионах восточная часть США 2 и Западная Швейцария поддерживаются

Теперь настройка тонкой настройки доступна с поддержкой:

Восточная часть США 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Западная Швейцария

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

Просмотрите страницу моделей, чтобы получить последние сведения о доступности моделей и поддержке точной настройки в каждом регионе.

Примеры обучения чата с несколькими поворотами

Теперь тонкой настройке поддерживаются примеры обучения чата с несколькими поворотами.

GPT-4 (0125) доступен для Azure OpenAI в ваших данных

Теперь модель GPT-4 (0125) можно использовать в доступных регионах с помощью Azure OpenAI в данных.

Март 2024 г.

Мониторинг рисков и безопасности в Azure OpenAI Studio

Azure OpenAI Studio теперь предоставляет панель мониторинга рисков и безопасности для каждого развертывания, использующего конфигурацию фильтра содержимого. Используйте его для проверки результатов действия фильтрации. Затем вы можете настроить конфигурацию фильтра, чтобы лучше обслуживать бизнес-потребности и соответствовать принципам ответственного искусственного интеллекта.

Использование мониторинга рисков и безопасности

Обновление данных в Azure OpenAI

  • Теперь вы можете подключиться к базе данных вектора Elasticsearch, которая будет использоваться с Azure OpenAI On Your Data.
  • Параметр размера блока можно использовать во время приема данных, чтобы задать максимальное количество маркеров любого заданного блока данных в индексе.

Выпущен API общедоступной доступности 2024-02-01

Это последний выпуск ОБЩЕДОСТУПНОго API и является заменой предыдущего 2023-05-15 выпуска общедоступной версии. В этом выпуске добавлена поддержка последних функций Azure OpenAI GA, таких как Whisper, DALLE-3, точная настройка данных и многое другое.

Функции, которые находятся в предварительной версии, таких как Помощники, текст в речь (TTS) и некоторые источники данных "в данных", требуют предварительной версии API. Дополнительные сведения см. в руководстве по жизненному циклу версий API.

Общедоступная версия whisper (GA)

Речь whisper к текстовой модели теперь общедоступна как для REST, так и для Python. Пакеты SDK клиентской библиотеки в настоящее время по-прежнему находятся в общедоступной предварительной версии.

Попробуйте выполнить шепет, выполнив краткое руководство.

Общедоступная доступность DALL-E 3

Модель создания образов DALL-E 3 теперь является общедоступной для REST и Python. Пакеты SDK клиентской библиотеки в настоящее время по-прежнему находятся в общедоступной предварительной версии.

Попробуйте использовать DALL-E 3, выполнив краткое руководство.

Новая региональная поддержка DALL-E 3

Теперь вы можете получить доступ к DALL-E3 с ресурсом Azure OpenAI в East US регионе AustraliaEast Или регионе Azure, а также SwedenCentral.

Устаревшие модели и выхода на пенсию

Мы добавили страницу для отслеживания устаревших моделей и выхода на пенсию в Службе Azure OpenAI. Эта страница содержит сведения о моделях, доступных в настоящее время, нерекомендуемых и устаревших.

Выпущен API 2024-03-01-preview

2024-03-01-preview имеет все те же функции, что 2024-02-15-preview и добавляет два новых параметра для внедрения:

  • encoding_format позволяет указать формат для создания внедрения в float, или base64. Значение по умолчанию — float.
  • dimensions позволяет задать количество внедрения выходных данных. Этот параметр поддерживается только в новых моделях внедрения третьего поколения: text-embedding-3-large, text-embedding-3-small. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Если вы используете предварительную версию API для использования последних функций, рекомендуем ознакомиться со статьей жизненного цикла версий API, чтобы отслеживать, сколько времени будет поддерживаться текущая версия API.

Обновление планов обновления GPT-4-1106-Preview

Обновление развертывания gpt-4 1106-Preview до gpt-4 0125-Preview, запланированное на 8 марта 2024 г. больше не происходит. Развертывания версий gpt-4 1106-Preview и 0125-Preview, для которых задано значение "Автоматическое обновление по умолчанию" и "Обновление по истечении срока действия", начнут обновляться после выпуска стабильной версии модели.

Дополнительные сведения о процессе обновления см. на странице моделей.

Февраль 2024 г.

Доступна модель GPT-3.5-turbo-0125

Эта модель имеет различные улучшения, включая более высокую точность при реагировании в запрошенных форматах и исправление ошибки, которая вызвала проблему кодирования текста для вызовов функций, отличных от английского языка.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Доступные модели внедрения третьего поколения

  • text-embedding-3-large
  • text-embedding-3-small

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя более высокую производительность для английских задач с тестом MTEB , чем вторая модель внедрения текста-ada-002.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Консолидация квоты GPT-3.5 Turbo

Чтобы упростить миграцию между различными версиями моделей GPT-3.5-Turbo (включая 16k), мы объединим все квоты GPT-3.5-Turbo в одно значение квоты.

  • Все клиенты, у которых утверждена квота, объединены в общую общую квоту, которая отражает предыдущий рост.

  • Любой клиент, текущий общий объем использования в версиях модели которого меньше, чем по умолчанию, по умолчанию получит новую объединенную общую квоту.

Доступна модель GPT-4-0125-preview

Версия gpt-4 модели 0125-preview теперь доступна в Службе Azure OpenAI в регионах "Восточная часть США", "Северная часть США" и "Южная часть США". Клиенты с развертываниями версии 1106-preview будут автоматически обновлены до 0125-preview ближайших gpt-4 недель.

Сведения о региональной доступности и обновлении модели см. на странице моделей.

Общедоступная предварительная версия API помощников

Azure OpenAI теперь поддерживает API, который обеспечивает возможности групповой политики OpenAI. Помощники По Azure OpenAI (предварительная версия) позволяют создавать помощники по ИИ, адаптированные к вашим потребностям, с помощью пользовательских инструкций и расширенных средств, таких как интерпретатор кода и пользовательские функции. Дополнительные сведения см. на следующих ресурсах:

Общедоступная предварительная версия текста OpenAI для голосовых голосов

Служба Azure OpenAI теперь поддерживает api-интерфейсы преобразования текста в речь с голосовыми данными OpenAI. Получите речь, созданную СИ, из предоставленного текста. Дополнительные сведения см. в руководстве по обзору и кратком руководстве.

Примечание.

Служба "Речь ИИ Azure" также поддерживает текст OpenAI для голосовой речи. Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Новые возможности настройки и поддержка моделей

Новая региональная поддержка Azure OpenAI в данных

Теперь вы можете использовать Azure OpenAI в данных в следующем регионе Azure:

  • Северная часть ЮАР

Общедоступная доступность Azure OpenAI для ваших данных

Декабрь 2023 г.

Azure OpenAI в данных

  • Полная поддержка VPN и частной конечной точки для Azure OpenAI On Your Data, включая поддержку безопасности для: учетных записей хранения, ресурсов Azure OpenAI и ресурсов ИИ Azure служба .
  • Новая статья по использованию Azure OpenAI On Your Data безопасно защищает данные с помощью виртуальных сетей и частных конечных точек.

GPT-4 Turbo с Vision теперь доступно

GPT-4 Turbo с Vision в службе Azure OpenAI теперь доступна в общедоступной предварительной версии. GPT-4 Turbo с Vision — это большая многомодальная модель (LMM), разработанная OpenAI, которая может анализировать изображения и предоставлять текстовые ответы на вопросы о них. Он включает как обработку естественного языка, так и визуальное понимание. С расширенным режимом вы можете использовать функции Визуального распознавания ИИ Azure для создания дополнительных аналитических сведений на основе изображений.

  • Ознакомьтесь с возможностями GPT-4 Turbo с vision в интерфейсе без кода с помощью игровой площадки Azure OpenAI. Дополнительные сведения см. в руководстве по краткому руководству.
  • Усовершенствование визуального распознавания с помощью GPT-4 Turbo с vision теперь доступно на игровой площадке Azure OpenAI и включает поддержку оптического распознавания символов, заземления объектов, поддержки изображений для "добавления данных" и поддержки видеозаписи.
  • Вызовы API чата непосредственно с помощью REST API.
  • Доступность региона в настоящее время ограничена SwitzerlandNorth, SwedenCentralWestUSиAustraliaEast
  • Узнайте больше об известных ограничениях GPT-4 Turbo с помощью Vision и других часто задаваемых вопросов.

Ноябрь 2023 г.

Поддержка новых источников данных в Azure OpenAI в данных

  • Теперь вы можете использовать Azure Cosmos DB для виртуальных ядер MongoDB и URL-адреса или веб-адреса в качестве источников данных для приема данных и чата с поддерживаемой моделью Azure OpenAI.

GPT-4 Turbo Preview и GPT-3.5-Turbo-1106 выпущены

Обе модели являются последним выпуском OpenAI с улучшенными инструкциями, режимом JSON, воспроизводимыми выходными данными и параллельными вызовами функций.

  • GPT-4 Turbo Preview имеет максимальное окно контекста 128 000 маркеров и может создавать 4096 выходных маркеров. В нем есть последние обучающие данные с знаниями до апреля 2023 года. Эта модель находится в предварительной версии и не рекомендуется для использования в рабочей среде. Все развертывания этой модели предварительной версии будут автоматически обновляться на месте после того, как стабильный выпуск станет доступным.

  • GPT-3.5-Turbo-1106 имеет максимальное окно контекста 16385 маркеров и может создавать 4096 выходных маркеров.

Сведения о региональной доступности модели см . на странице моделей.

Модели имеют собственные уникальные выделения квот на регион.

Общедоступная предварительная версия DALL-E 3

DALL-E 3 — это последняя модель создания изображений из OpenAI. В нем улучшено качество изображения, более сложные сцены и улучшена производительность при отрисовке текста в изображениях. Он также поставляется с дополнительными параметрами пропорций. DALL-E 3 доступен через OpenAI Studio и через REST API. Ресурс OpenAI должен находиться в регионе SwedenCentral Azure.

DALL-E 3 включает встроенную перезапись запросов для улучшения изображений, уменьшения предвзятости и увеличения естественного изменения.

Попробуйте использовать DALL-E 3, выполнив краткое руководство.

Ответственное применение ИИ

  • Расширенная настраиваемость клиентов: все клиенты Azure OpenAI теперь могут настроить все уровни серьезности (низкие, средние, высокие) для категорий ненависти, насилия, сексуального и самостоятельного вреда, включая фильтрацию только содержимого с высоким уровнем серьезности. Настройка фильтров содержимого

  • Учетные данные содержимого во всех моделях DALL-E: созданные ИИ изображения из всех моделей DALL-E теперь включают цифровые учетные данные, которые раскрывают содержимое в виде искусственного интеллекта. Приложения, отображающие ресурсы изображений, могут использовать пакет SDK открытый код Content Authenticity Initiative для отображения учетных данных в созданных ими образах. Учетные данные содержимого в Azure OpenAI

  • Новые модели RAI

    • Обнаружение рисков в тюрьме: атаки в тюрьме — это запросы пользователей, предназначенные для того, чтобы спровоцировать модель создания искусственного интеллекта в поведении, которое было обучено избежать или нарушить набор правил в системном сообщении. Модель обнаружения рисков в тюрьме необязательна (по умолчанию отключена) и доступна в модели аннотации и фильтрации. Он выполняется в запросах пользователей.
    • Защищенный текст материала: защищенный текст материала описывает известное текстовое содержимое (например, текст песни, статьи, рецепты и выбранное веб-содержимое), которое можно выводить большими языковыми моделями. Защищенная текстовая модель материала является необязательным (по умолчанию отключена) и доступна в модели анотации и фильтрации. Он выполняется в завершениях LLM.
    • Защищенный материальный код: защищенный исходный код описывает исходный код, соответствующий набору исходного кода из общедоступных репозиториев, которые можно выводить большими языковыми моделями без надлежащей ссылки на исходные репозитории. Модель защищенного кода материала является необязательным (по умолчанию отключена) и доступна в модели анотации и фильтрации. Он выполняется в завершениях LLM.

    Настройка фильтров содержимого

  • Блок-списки: клиенты теперь могут быстро настроить поведение фильтра содержимого для запросов и завершения, создав настраиваемый список блокировок в своих фильтрах. Настраиваемый список блокировок позволяет фильтру выполнять действия по настраиваемого списка шаблонов, например определенных терминов или шаблонов регулярных выражений. Помимо настраиваемых списков блокировок, мы предоставляем список блокировок ненормативной лексики Майкрософт (английский). Использование блок-списков

Октябрь 2023

Новые модели тонкой настройки (предварительная версия)

Azure OpenAI в данных

  • Новые настраиваемые параметры для определения количества извлеченных документов и строгости.
    • Параметр строгости задает пороговое значение для классификации документов в соответствии с вашими запросами.
    • Параметр извлеченных документов указывает количество документов с верхней оценкой из индекса данных, используемых для создания ответов.
  • Состояние приема и отправки данных можно просмотреть в Azure OpenAI Studio.
  • Поддержка частных конечных точек и виртуальных сетей для контейнеров BLOB-объектов.

Сентябрь 2023

GPT-4

GPT-4 и GPT-4-32k теперь доступны всем клиентам службы Azure OpenAI. Клиенты больше не должны применяться к списку ожидания для использования GPT-4 и GPT-4-32k (требования к регистрации ограниченного доступа продолжают применяться ко всем моделям Azure OpenAI). Доступность может отличаться по регионам. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

GPT-3.5 Turbo Instruct

Служба Azure OpenAI теперь поддерживает модель структуры Turbo GPT-3.5. Эта модель имеет производительность, сравнимую с text-davinci-003 производительностью и доступной для использования с API завершения. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Whisper public preview

Служба Azure OpenAI теперь поддерживает распознавание речи в текстовые API, созданные моделью Whisper OpenAI. Получите созданный ИИ текст на основе предоставленного вами звука речи. Дополнительные сведения см. в кратком руководстве.

Примечание.

Служба "Речь ИИ Azure" также поддерживает модель Whisper OpenAI с помощью API пакетной транскрибирования. Дополнительные сведения см. в руководстве по созданию пакетной транскрибирования . Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Новые регионы

  • Azure OpenAI теперь также доступен в регионах Швеции Центральной и Северной Швейцарии. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Увеличение ограничений региональной квоты

  • Увеличивается до максимальных ограничений квоты по умолчанию для определенных моделей и регионов. Перенос рабочих нагрузок в эти модели и регионы позволит воспользоваться преимуществами более высоких токенов в минуту (TPM).

Август 2023 г.

Обновления Azure OpenAI для собственных обновлений данных (предварительная версия)

Июль 2023 г.

Поддержка вызовов функций

Увеличение входного массива внедрения

Новые регионы

  • Azure OpenAI теперь также доступен в восточной части Канады, восточной части США 2, Восточной Японии и северной части США. Проверьте страницу моделей, чтобы получить последние сведения о доступности модели в каждом регионе.

Июнь 2023 г.

Использование Azure OpenAI для собственных данных (предварительная версия)

  • Azure OpenAI On Your Data теперь доступна в предварительной версии, что позволяет общаться с моделями OpenAI, такими как GPT-35-Turbo и GPT-4, и получать ответы на основе ваших данных.

Новые версии моделей gpt-35-turbo и gpt-4

  • gpt-35-turbo (версия 0613)
  • gpt-35-turbo-16k (версия 0613)
  • gpt-4 (версия 0613)
  • gpt-4-32k (версия 0613)

южная часть Соединенного Королевства

Фильтрация содержимого и заметки (предварительная версия)

Квота

Май 2023 г.

Поддержка пакета SDK java и JavaScript

  • Новые пакеты SDK для Предварительной версии Azure OpenAI, предлагающие поддержку JavaScript и Java.

Общая доступность чата Azure OpenAI (GA)

  • Общая поддержка доступности для:
    • Версия 2023-05-15API завершения чата.
    • Модели GPT-35-Turbo.
    • Серия моделей GPT-4.

Если вы используете 2023-03-15-preview API в настоящее время, рекомендуется перенести его в API общедоступной версии 2023-05-15 . Если вы используете версию 2022-12-01 API, этот API остается общедоступной, но не включает последние возможности завершения чата.

Внимание

Использование текущих версий моделей GPT-35-Turbo с конечной точкой завершения остается в предварительной версии.

Центральная Франция

Апрель 2023 г.

  • Общедоступная предварительная версия DALL-E 2. Служба Azure OpenAI теперь поддерживает API создания образов на основе модели DALL-E 2 OpenAI. Получите созданные ИИ изображения на основе описательного текста, который вы предоставляете. Дополнительные сведения см. в кратком руководстве.

  • Неактивные развертывания настраиваемых моделей теперь будут удалены через 15 дней; модели останутся доступными для повторного развертывания. Если настраиваемая (настраиваемая) модель развертывается более чем за 15 дней, в течение которых не выполняются или не выполняются вызовы завершения чата, развертывание будет автоматически удалено (и для этого развертывания не будет взиматься дополнительная плата за размещение). Базовая настраиваемая модель останется доступной и может быть развернута в любое время. Дополнительные сведения см. в этой статье.

Март 2023 г.

  • Модели серии GPT-4 теперь доступны в предварительной версии в Azure OpenAI. Чтобы запросить доступ, существующие клиенты Azure OpenAI могут применяться, заполнив эту форму. В настоящее время эти модели доступны в регионах восточной части США и южной части США.

  • Новый API завершения чата для моделей GPT-35-Turbo и GPT-4, выпущенных в предварительной версии 3/21. Чтобы узнать больше о обновленных кратких руководствах и руководствах.

  • GPT-35-Turbo preview. Чтобы узнать больше о руководстве, ознакомьтесь со статьей.

  • Увеличение ограничений на обучение для тонкой настройки: максимальный размер задания обучения (токены в файле обучения) x (# эпох) составляет 2 миллиарда маркеров для всех моделей. Мы также увеличили максимальное число учебных заданий с 120 до 720 часов.

  • Добавление дополнительных вариантов использования в существующий доступ. Ранее процесс добавления новых вариантов использования требовал от клиентов повторного применения к службе. Теперь мы выпускаем новый процесс, позволяющий быстро добавлять новые варианты использования в службу. Этот процесс следует установленному процессу ограниченного доступа в службах ИИ Azure. Существующие клиенты могут подтвердить все и все новые варианты использования здесь. Обратите внимание, что это необходимо в любое время, когда вы хотите использовать службу для нового варианта использования, к которому вы изначально не применялись.

2023 февраля

Новые возможности

  • Примеры предварительного выпуска | пакета SDK для .NET (вывод)
  • Обновление пакета SDK Terraform для поддержки операций управления Azure OpenAI.
  • Вставка текста в конце завершения теперь поддерживается с параметром suffix .

Обновления

  • Фильтрация содержимого включена по умолчанию.

Новые статьи:

Новый учебный курс:

2023 января

Новые возможности

  • Общедоступная версия службы. Служба Azure OpenAI теперь общедоступна.

  • Новые модели: добавление последней текстовой модели, text-davinci-003 (восточная часть США, Западная Европа), text-ada-embeddings-002 (восточная часть США, южная часть США, Западная Европа)

Декабрь 2022 г.

Новые возможности

  • Последние модели из OpenAI. Azure OpenAI предоставляет доступ ко всем последним моделям, включая серии GPT-3.5.

  • Новая версия API (2022-12-01). Это обновление включает в себя несколько запрошенных улучшений, включая сведения об использовании маркеров в ответе API, улучшенные сообщения об ошибках для файлов, выравнивание с OpenAI при точной настройке структуры данных создания и поддержку параметра суффикса, чтобы разрешить пользовательское именование настраиваемых заданий. ​

  • Более высокие ограничения запросов в секунду. 50 для моделей, отличных от Davinci. 20 для моделей Davinci.

  • Ускоренная настройка развертываний. Разверните модели Ada и Curie в течение 10 минут.

  • Более высокие ограничения на обучение: 40 млн токенов обучения для Ada, Babbage и Curie. 10M для Davinci.

  • Процесс запроса изменений в злоупотреблении и пропустить ведение журнала данных и проверку человека. Сегодня журналы служб запрашивают и отвечают на данные в целях обнаружения злоупотреблений и неправильного использования, чтобы гарантировать, что эти мощные модели не злоупотребляются. Однако многие клиенты имеют строгие требования к конфиденциальности и безопасности данных, требующие большего контроля над данными. Для поддержки этих вариантов использования мы выпускаем новый процесс для клиентов, чтобы изменить политики фильтрации содержимого или отключить ведение журнала злоупотреблений для случаев использования с низким риском. Этот процесс следует установленному процессу ограниченного доступа в службах ИИ Azure, а существующие клиенты OpenAI могут применяться здесь.

  • Шифрование управляемого клиентом ключа (CMK). CMK обеспечивает клиентам больший контроль над управлением данными в Azure OpenAI, предоставляя собственные ключи шифрования, используемые для хранения обучающих данных и настраиваемых моделей. Управляемые клиентом ключи (CMK), которые также называются ключами BYOK, обеспечивают большую гибкость при создании, смене, отключении и отзыве контроля доступа. Они также дают возможность выполнять аудит ключей шифрования, используемых для защиты ваших данных. Дополнительные сведения см. в документации по шифрованию неактивных данных.

  • Поддержка блокировки

  • Соответствие SOC-2

  • Ведение журнала и диагностика с помощью azure Работоспособность ресурсов, анализа затрат и параметров диагностики.

  • Улучшения Студии. Многочисленные улучшения удобства использования рабочего процесса Studio, включая поддержку ролей Azure AD для управления доступом к тем, кто в команде имеет доступ к созданию точно настроенных моделей и развертыванию.

Изменения (критические)

Запрос на создание api тонкой настройки обновлен, чтобы соответствовать схеме OpenAI.

Предварительные версии API:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API версии 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

Фильтрация содержимого временно отключена по умолчанию. Azure con режим палатки ration работает не так, как Azure OpenAI. Azure OpenAI запускает фильтры содержимого во время вызова создания, чтобы обнаружить вредное или оскорбительные содержимое и фильтрует их из ответа. Подробнее

Эти модели будут повторно включены в Q1 2023 и будут включены по умолчанию. ​

Действия клиента

Следующие шаги

Ознакомьтесь с дополнительными сведениями о базовых моделях, лежащих в основе Azure OpenAI.