Consumir pontos de extremidade de API sem servidor de um workspace diferente
Neste artigo, você aprenderá a configurar um ponto de extremidade de API sem servidor existente em um workspace diferente daquele onde foi implantado.
Alguns modelos no catálogo de modelos podem ser implantados como APIs sem servidor. Esse tipo de implantação oferece uma forma de consumir os modelos como uma API sem hospedá-los na sua assinatura, mantendo a segurança e a conformidade corporativa de que as organizações precisam. Essa opção de implantação não requer cota de sua assinatura.
A necessidade de consumir um ponto de extremidade de API sem servidor em um workspace diferente daquele usado para criar a implantação pode surgir em situações como:
- Você deseja centralizar suas implantações em um workspace específico e consumi-las a partir de diferentes espaços de trabalho em sua organização.
- Você precisa implantar um modelo em um workspace em uma região específica do Azure onde a implantação sem servidor para esse modelo esteja disponível. No entanto, você precisa consumi-lo de outra região, onde a implantação sem servidor não está disponível para os modelos em questão.
Pré-requisitos
Uma assinatura do Azure com uma forma de pagamento válida. As assinaturas gratuitas ou de avaliação do Azure não funcionarão. Caso você não tenha uma assinatura do Azure, crie uma conta paga do Azure para começar.
Um workspace do Azure Machine Learning onde você deseja consumir a implantação existente.
Um modelo implantado em um ponto de extremidade de API sem servidor. Este artigo pressupõe que você já implantou o modelo Meta-Llama-3-8B-Instruct. Para saber como implantar esse modelo como uma API sem servidor, confira Implantar modelos como APIs sem servidor.
Você precisa instalar o seguinte software para trabalhar com o Azure Machine Learning:
Você pode usar qualquer navegador compatível para acessar o Estúdio do Azure Machine Learning.
Criar uma conexão de ponto de extremidade de API sem servidor
Execute estas etapas para criar uma conexão:
Conecte-se ao workspace onde o ponto de extremidade está implantado:
Vá para o Estúdio do Azure Machine Learning e navegue até o workspace onde o ponto de extremidade que você deseja se conectar está implantado.
Obtenha a URL do ponto de extremidade e as credenciais do ponto de extremidade ao qual você deseja se conectar. Neste exemplo, você obtém os detalhes de um nome de ponto de extremidade meta-llama3-8b-qwerty.
Selecione Pontos de extremidade na barra lateral esquerda.
Selecione a guia Pontos de extremidade sem servidor para exibir os pontos de extremidade de API sem servidor.
Selecione o ponto de extremidade que você deseja se conectar.
Na guia Detalhes do ponto de extremidade, copie os valores para URI de Destino e Chave.
Agora, conecte-se ao workspace onde você deseja criar a conexão e consumir o ponto de extremidade.
Crie a conexão no workspace:
Vá para o workspace onde a conexão precisa ser criada.
Acesse a seção Gerenciar na barra de navegação à esquerda e selecione Conexões.
Selecione Criar.
Selecione Modelo sem servidor.
Para o URI de Destino, cole o valor que você copiou anteriormente.
Faça o mesmo para a Chave e cole o valor copiado.
Dê um nome para a conexão, nesse caso, meta-llama3-8b-connection.
Selecione Adicionar conexão.
Neste ponto, a conexão está pronta para consumo.
Para validar se a conexão está funcionando:
Na barra de navegação à esquerda do Estúdio do Azure Machine Learning, vá para Autoria>Prompt flow.
Selecione Criar para criar um novo fluxo.
Selecione Criar na caixa Fluxo de chat.
Dê um nome para o seu Prompt flow e selecione Criar.
Selecione o nó chat no gráfico para acessar a seção chat.
Em Conexão, abra a lista de seleção e selecione a conexão que você acabou de criar, nesse caso meta-llama3-8b-connection.
Selecione Iniciar sessão de computação na barra de navegação superior para começar um runtime automático de prompt flow.
Selecione a opção Chat. Agora você pode enviar mensagens e receber respostas.