Provisionar um recurso de serviços de IA do Azure
Os serviços de IA do Azure incluem uma ampla gama de recursos de IA que você pode usar em seus aplicativos. Para usar qualquer um dos serviços de IA, você precisa criar recursos apropriados em uma assinatura do Azure para definir um ponto de extremidade onde o serviço pode ser consumido, fornecer chaves de acesso para acesso autenticado e gerenciar a cobrança pelo uso do serviço pelo seu aplicativo.
Opções para recursos do Azure
Para muitos dos serviços de IA disponíveis, você pode escolher entre as seguintes opções de provisionamento:
Recurso multisserviço
Você pode provisionar um recurso de serviços de IA que ofereça suporte a vários serviços de IA diferentes. Por exemplo, você pode criar um único recurso que permita usar a Linguagem de IA do Azure, a Visão de IA do Azure, a Fala da IA do Azure e outros serviços.
Essa abordagem permite gerenciar um único conjunto de credenciais de acesso para consumir vários serviços em um único ponto de extremidade e com um único ponto de cobrança pelo uso de todos os serviços.
Recurso de serviço único
Cada serviço de IA pode ser provisionado individualmente, por exemplo, criando recursos discretos de AI Language e AI Vision em sua assinatura do Azure.
Essa abordagem permite que você use pontos de extremidade separados para cada serviço (por exemplo, para provisioná-los em diferentes regiões geográficas) e gerencie as credenciais de acesso para cada serviço de forma independente. Ele também permite que você gerencie o faturamento separadamente para cada serviço.
Os recursos de serviço único geralmente oferecem um nível gratuito (com restrições de uso), tornando-os uma boa escolha para experimentar um serviço antes de usá-lo em um aplicativo de produção.
Recursos de formação e previsão
Embora a maioria dos serviços de IA possa ser usada por meio de um único recurso do Azure, alguns oferecem (ou exigem) recursos separados para treinamento e previsão de modelos. Isso permite que você gerencie o faturamento para treinar modelos personalizados separadamente do consumo de modelos por aplicativos e, na maioria dos casos, permite que você use um recurso específico de serviço dedicado para treinar um modelo, mas um recurso genérico de serviços de IA para disponibilizar o modelo para aplicativos para inferência.