Развертывание моделей как бессерверных API
В этой статье вы узнаете, как развернуть модель из каталога моделей в качестве бессерверного API с выставлением счетов по мере использования маркеров.
Внимание
Модели, которые находятся в предварительной версии, помечены как предварительный просмотр на своих карточках моделей в каталоге моделей.
Некоторые модели в каталоге моделей можно развернуть как бессерверный API с выставлением счетов по мере использования. Такой тип развертывания позволяет использовать модели в качестве API без размещения их в подписке, сохраняя корпоративную безопасность и соответствие требованиям, необходимым организациям. Этот параметр развертывания не требует квоты из подписки.
В этой статье используется развертывание модели Meta Llama для иллюстрации. Однако для развертывания любой модели в каталоге моделей, доступных для развертывания бессерверного API, можно использовать те же действия.
Необходимые компоненты
Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать работу.
Проект Azure AI Studio.
Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Azure AI Studio. Чтобы выполнить действия, описанные в этой статье, учетная запись пользователя должна быть назначена роли разработчика ИИ Azure в группе ресурсов. Дополнительные сведения о разрешениях см. в статье "Управление доступом на основе ролей" в Azure AI Studio.
Для работы с Azure AI Studio необходимо установить следующее программное обеспечение:
Вы можете использовать любой совместимый веб-браузер для навигации по Azure AI Studio.
Поиск модели и идентификатора модели в каталоге моделей
Войдите в Azure AI Studio.
Для моделей, предлагаемых через Azure Marketplace, убедитесь, что у вашей учетной записи есть разрешения на роль разработчика ИИ Azure в группе ресурсов или вы соответствуете разрешениям, необходимым для подписки на предложения моделей.
Счета за модели, предоставляемые поставщиками, не являющихся майкрософт (например, модели Llama и Mistral) выставляются через Azure Marketplace. Для таких моделей необходимо подписать проект на конкретное предложение модели. Модели, предлагаемые корпорацией Майкрософт (например, модели Phi-3), не имеют этого требования, так как выставление счетов выполняется по-разному. Дополнительные сведения о выставлении счетов за бессерверное развертывание моделей в каталоге моделей см. в разделе "Выставление счетов для бессерверных API".
Выберите каталог моделей на левой боковой панели и найдите карточку модели, которую вы хотите развернуть. В этой статье вы выбираете модель Meta-Llama-3-8B-Instruct .
Если вы развертываете модель с помощью Azure CLI, Python или ARM, скопируйте идентификатор модели.
Внимание
Не включайте версию при копировании идентификатора модели. Конечные точки API без сервера всегда развертывают последнюю версию модели. Например, для идентификатора
azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3
модели скопируйтеazureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct
.
В следующем разделе рассматриваются действия по подписке проекта на предложение модели. Этот раздел можно пропустить и перейти к развертыванию модели в конечной точке бессерверного API, если вы развертываете модель Майкрософт.
Подписка проекта на предложение модели
Конечные точки API без сервера могут развертывать как предлагаемые корпорацией Майкрософт, так и не майкрософт модели. Для моделей Майкрософт (таких как модели Phi-3) вам не нужно создавать подписку Azure Marketplace и развертывать их в бессерверных конечных точках API непосредственно для использования прогнозов. Для моделей, отличных от Майкрософт, сначала необходимо создать подписку. Если вы впервые развертываете модель в проекте, необходимо подписаться на проект для конкретного предложения модели из Azure Marketplace. Каждый проект имеет собственную подписку на конкретное предложение Azure Marketplace модели, что позволяет контролировать расходы и отслеживать расходы.
Совет
Пропустите этот шаг, если вы развертываете модели из семейства моделей Phi-3. Непосредственно разверните модель в конечной точке БЕССерверного API.
Примечание.
Модели, предлагаемые в Azure Marketplace, доступны для развертывания в конечных точках API без сервера в определенных регионах. Проверьте доступность модели и региона для развертываний бессерверных API, чтобы проверить, какие модели и регионы доступны. Если нужный объект не указан, можно развернуть в рабочей области в поддерживаемом регионе, а затем использовать конечные точки API без сервера из другой рабочей области.
Создайте подписку Marketplace модели. При создании подписки вы принимаете условия, связанные с предложением модели.
На странице сведений о модели выберите "Развернуть". Откроется окно параметров развертывания, предоставляющее выбор между бессерверным развертыванием API и развертыванием с помощью управляемых вычислений.
Примечание.
Для моделей, которые можно развернуть только с помощью бессерверного развертывания API, мастер развертывания бессерверных API открывается сразу после выбора " Развернуть " на странице сведений о модели.
Выберите бессерверный API с помощью azure AI Content Safety (предварительная версия), чтобы открыть мастер развертывания бессерверных API.
Выберите проект, в котором требуется развернуть модели. Чтобы использовать предложение развертывания модели API без сервера, проект должен принадлежать одному из регионов, которые поддерживаются для бессерверного развертывания для конкретной модели.
Если вы видите заметку , у вас уже есть подписка Azure Marketplace для этого проекта, вам не нужно создавать подписку, так как у вас уже есть подписка. Вы можете перейти к развертыванию модели в конечной точке бессерверного API.
В мастере развертывания выберите ссылку на условия использования Azure Marketplace, чтобы узнать больше об условиях использования. Вы также можете выбрать вкладку "Цены и условия ", чтобы узнать о ценах для выбранной модели.
Выберите "Подписаться" и " Развернуть".
Подписавшись на проект для конкретного предложения Azure Marketplace, последующие развертывания одного и того же предложения в том же проекте не требуют повторной подписки.
В любой момент вы можете просмотреть предложения модели, на которые в настоящее время подписан ваш проект:
Переход на портал Azure.
Перейдите в группу ресурсов, в которой принадлежит проект.
В фильтре типов выберите SaaS.
Вы увидите все предложения, на которые вы подписаны в настоящее время.
Выберите любой ресурс, чтобы просмотреть сведения.
Развертывание модели в конечной точке бессерверного API
После создания подписки для модели, отличной от Майкрософт, можно развернуть связанную модель в конечной точке бессерверного API. Для моделей Майкрософт (например, моделей Phi-3) вам не нужно создавать подписку.
Конечная точка БЕССерверного API предоставляет способ использования моделей в качестве API без размещения их в подписке, при этом организации безопасности и соответствия требованиям предприятия требуются. Этот параметр развертывания не требует квоты из подписки.
В этом разделе описано, как создать конечную точку с именем meta-llama3-8b-qwerty.
Создание бессерверной конечной точки
Чтобы развернуть модель Майкрософт, которая не требует подписки на предложение модели:
- Выберите "Развернуть ", а затем выберите бессерверный API с помощью azure AI Content Safety (предварительная версия), чтобы открыть мастер развертывания.
- Выберите проект, в котором требуется развернуть модель. Обратите внимание, что не все регионы поддерживаются.
Кроме того, для модели, отличной от Майкрософт, требующей подписки на модель, если вы только что подписали проект на предложение модели в предыдущем разделе, перейдите к выбору "Развернуть". Кроме того, выберите "Продолжить развертывание " (если в мастере развертывания уже есть подписка Azure Marketplace для этого проекта).
Присвойте развертыванию имя. Это имя становится частью URL-адреса API развертывания. Этот URL-адрес должен быть уникальным в каждом регионе Azure.
Совет
Параметр фильтра содержимого (предварительная версия) включен по умолчанию. Оставьте параметр по умолчанию для службы, чтобы обнаружить вредное содержимое, например ненависть, самоповредение, сексуальное и насильственное содержимое. Дополнительные сведения о фильтрации содержимого (предварительная версия) см. в статье "Фильтрация содержимого" в Azure AI Studio.
Выберите Развернуть. Подождите, пока развертывание будет готово, и вы будете перенаправлены на страницу "Развертывания".
В любой момент можно увидеть конечные точки, развернутые в проекте:
Перейдите к своему проекту.
Выберите раздел "Развертывания"
Отображаются конечные точки API без сервера.
Созданная конечная точка использует проверку подлинности ключа для авторизации. Чтобы получить ключи, связанные с данной конечной точкой, выполните следующие действия.
Вы можете вернуться на страницу "Развертывания", выбрать развертывание и заметить целевой URI конечной точки и ключ. Используйте их для вызова развертывания и создания прогнозов.
Примечание.
При использовании портал Azure конечные точки API без сервера не отображаются по умолчанию в группе ресурсов. Используйте параметр "Показать скрытые типы", чтобы отобразить их в группе ресурсов.
На этом этапе ваша конечная точка готова к использованию.
Если вам нужно использовать это развертывание из другого проекта или концентратора, или вы планируете использовать поток запросов для создания интеллектуальных приложений, необходимо создать подключение к развертыванию бессерверного API. Сведения о настройке существующей конечной точки бессерверного API в новом проекте или концентраторе см. в статье "Использование развернутых конечных точек API без сервера" из другого проекта или потока запроса.
Совет
Если вы используете поток запроса в том же проекте или центре, где развернуто развертывание, необходимо создать подключение.
Использование конечной точки API без сервера
Модели, развернутые в Машинное обучение Azure и Azure AI Studio в конечных точках БЕССерверных API, поддерживают API вывода модели ИИ Azure, предоставляющий общий набор возможностей для базовых моделей и которые могут использоваться разработчиками для использования прогнозов из различных наборов моделей в единообразном и согласованном режиме.
Узнайте больше о возможностях этого API и о том, как его использовать при создании приложений.
Сетевая изоляция
Конечные точки для моделей, развернутых как бессерверные API, следуют параметру флага доступа к общедоступной сети (PNA) центра AI Studio, в котором находится проект, в котором существует развертывание. Чтобы защитить конечную точку MaaS, отключите флаг PNA в Центре AI Studio. Вы можете защитить входящий трафик от клиента к конечной точке с помощью частной конечной точки для концентратора.
Чтобы задать флаг PNA для центра Azure AI Studio, выполните следующие действия.
- Переход на портал Azure.
- Найдите группу ресурсов, к которой принадлежит концентратор, и выберите центр ИИ Azure из ресурсов, перечисленных для этой группы ресурсов.
- На странице обзора концентратора в меню слева выберите "Параметры>сети".
- На вкладке "Общедоступный доступ" можно настроить параметры для флага доступа к общедоступной сети.
- Сохранение изменений. Для распространения изменений может потребоваться до пяти минут.
Удаление конечных точек и подписок
Вы можете удалить подписки и конечные точки модели. Удаление подписки модели делает любую связанную конечную точку неработоспособным и непригодным для использования.
Чтобы удалить конечную точку API без сервера, выполните следующие действия.
Перейдите в Azure AI Studio.
Перейдите к развертываниям> компонентов.
Откройте развертывание, которое нужно удалить.
Выберите команду Удалить.
Чтобы удалить связанную подписку модели, выполните следующие действия.
Перейдите на портал Azure.
Перейдите в группу ресурсов, в которой принадлежит проект.
В фильтре типов выберите SaaS.
Выберите подписку, которую нужно удалить.
Выберите команду Удалить.
Рекомендации по затратам и квотам для моделей, развернутых в качестве конечных точек API без сервера
Квота изменяется для каждого развертывания. Каждое развертывание имеет ограничение трафика в 200 000 токенов в минуту и 1000 запросов API в минуту. Однако в настоящее время мы ограничиваем одно развертывание на одну модель для одного проекта. Обратитесь в службу поддержки Microsoft Azure, если текущие ограничения трафика недостаточны для ваших сценариев.
Стоимость моделей Майкрософт
Вы можете найти сведения о ценах на вкладке "Цены и условия " мастера развертывания при развертывании моделей Майкрософт (например, моделей Phi-3) в качестве конечных точек бессерверных API.
Стоимость моделей, отличных от Майкрософт
Модели, не являющиеся Майкрософт, развернутые в качестве бессерверных конечных точек API, предлагаются через Azure Marketplace и интегрированы с Azure AI Studio для использования. Цены на Azure Marketplace можно найти при развертывании или настройке этих моделей.
Каждый раз, когда проект подписывается на данное предложение из Azure Marketplace, создается новый ресурс для отслеживания затрат, связанных с его потреблением. Тот же ресурс используется для отслеживания затрат, связанных с выводом и настройкой; однако для отслеживания каждого сценария по отдельности можно использовать несколько счетчиков.
Дополнительные сведения о том, как отслеживать затраты, см. в статье Мониторинг затрат для моделей, предлагаемых в Azure Marketplace.
Разрешения, необходимые для подписки на предложения моделей
Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Azure AI Studio. Чтобы выполнить действия, описанные в этой статье, учетная запись пользователя должна быть назначена роль владельца, участника или разработчика ИИ Azure для подписки Azure. Кроме того, вашей учетной записи может быть назначена настраиваемая роль, которая имеет следующие разрешения:
В подписке Azure — чтобы подписаться на рабочую область на предложение Azure Marketplace один раз для каждой рабочей области для каждого предложения:
Microsoft.MarketplaceOrdering/agreements/offers/plans/read
Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
Microsoft.SaaS/register/action
Для создания и использования ресурса SaaS в группе ресурсов выполните следующие действия:
Microsoft.SaaS/resources/read
Microsoft.SaaS/resources/write
В рабочей области — для развертывания конечных точек (роль специалиста по обработке и анализу данных машинного обучения Azure уже содержит эти разрешения):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Дополнительные сведения о разрешениях см. в статье "Управление доступом на основе ролей" в Azure AI Studio.