Modelos de aplicativo de IA

Esta seção da documentação apresenta os modelos de aplicativo de IA e artigos relacionados que usam esses modelos para demonstrar como executar as principais tarefas do desenvolvedor. Os modelos de aplicativo de IA fornecem implementações de referência regulares e fáceis de implantar que ajudam a garantir um ponto de partida de alta qualidade para os aplicativos de IA.

Há duas categorias de modelos de aplicativo de IA, blocos de construção e soluções de ponta a ponta. As seções a seguir apresentam alguns dos principais modelos em cada categoria para a linguagem de programação que você selecionou no início deste artigo. Para navegar por uma lista mais abrangente, incluindo esses e outros modelos, consulte os modelos de aplicativo de IA na galeria de modelos de aplicativo de IA.

Blocos de construção

Blocos de construção são amostras em escala menor que focam em cenários e tarefas específicos. A maioria dos blocos de construção demonstra funcionalidade que aproveita a solução de ponta a ponta para um aplicativo de chat que usa seus próprios dados.

Bloco de construção Descrição
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de modelo e token do OpenAI do Azure. Esta abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do OpenAI do Azure, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Bloco de construção Descrição
Configurar a segurança do documento para o aplicativo de chat Ao criar um aplicativo de chat usando o padrão RAG com seus próprios dados, certifique-se de que cada usuário receba uma resposta com base em suas permissões. Um usuário autorizado deve ter acesso às respostas contidas nos documentos do aplicativo de chat. Um usuário não autorizado não deve ter acesso a respostas de documentos protegidos que não tem autorização para ver.
Avalie as respostas do aplicativo de chat Saiba como avaliar as respostas de um aplicativo de chat em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade fundamental). Sempre que você alterar seu aplicativo de chat de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de modelo e token do OpenAI do Azure. Esta abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do OpenAI do Azure, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Balanceamento de carga com o Gerenciamento de API Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de modelo e token do OpenAI do Azure. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do OpenAI do Azure, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Teste de carga do aplicativo de chat Python com o Locust Aprenda o processo para realizar testes de carga em um aplicativo de bate-papo Python usando o padrão RAG com o Locust, uma popular ferramenta de teste de carga de software livre. O principal objetivo do teste de carga é garantir que a carga esperada em seu aplicativo de chat não exceda a cota atual do TPM (Transações do OpenAI do Azure por Minuto). Ao simular o comportamento do usuário sob carga pesada, você pode identificar possíveis gargalos e problemas de escalabilidade em seu aplicativo.
Proteja seu aplicativo de IA com autenticação sem chave Conheça o processo para proteger seu aplicativo de chat OpenAI do Azure Python com autenticação sem chave. As solicitações de aplicativo para a maioria dos serviços do Azure devem ser autenticadas com conexões sem chave ou sem senha. A autenticação sem chave oferece vantagens de segurança e gerenciamento aprimorados com relação à chave de conta porque não há nenhuma chave (nem cadeia de conexão) para armazenar.
Bloco de construção Descrição
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de modelo e token do OpenAI do Azure. Esta abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do OpenAI do Azure, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Bloco de construção Descrição
Avalie as respostas do aplicativo de chat Saiba como avaliar as respostas de um aplicativo de chat em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade fundamental). Sempre que você alterar seu aplicativo de chat de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações.
Balanceamento de carga com Aplicativos de Contêiner do Azure Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de modelo e token do OpenAI do Azure. Esta abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do OpenAI do Azure, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.
Balanceamento de carga com o Gerenciamento de API Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de cota de modelo e token do OpenAI do Azure. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do OpenAI do Azure, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade.

Soluções de ponta a ponta

Soluções de ponta a ponta são amostras de referência abrangentes, incluindo documentação, código-fonte e implantação para permitir executar e ampliar suas próprias finalidades.

Converse com seus dados usando o OpenAI do Azure e a Pesquisa de IA do Azure com o .NET

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Geração Aumentada por Recuperação) em execução no Azure. Ele usa a Pesquisa de IA do Azure para recuperação e modelos de linguagem grandes do OpenAI do Azure para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar este modelo, consulte Introdução ao chat usando seu próprio exemplo de dados para .NET. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub azure-search-openai-demo-csharp.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para .NET.

Captura de tela do aplicativo de chat .NET no navegador mostrando várias sugestões de entrada de chat e a caixa de texto de chat para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos de Contêiner do Azure
Azure Functions
OpenAI do Azure
Pesquisa Visual Computacional do Azure
Reconhecimento de Formulários do Azure
Azure AI Search
Armazenamento do Azure
GPT 3.5 Turbo
GPT 4.0

Copilot de varejo de chat da Contoso com .NET e Kernel Semântico

Este modelo implementa a Contoso Outdoors, uma loja conceitual especializada em equipamentos para atividades ao ar livre para entusiastas de caminhadas e acampamentos. Essa loja virtual aumenta o envolvimento do cliente e o suporte de vendas por meio de um agente de chat inteligente. Esse agente é alimentado pelo padrão RG (Geração Aumentada de Recuperação) no Microsoft Azure AI Stack, enriquecido com suporte ao Kernel Semântico e Prompty.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub contoso-chat-csharp-prompty.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para o aplicativo de caminhada.

Captura de tela da loja de entusiastas de caminhadas e acampamentos .NET.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos de Contêiner do Azure
OpenAI do Azure
Microsoft Entra ID
Identidade gerenciada do Azure
Azure Monitor
Azure AI Search
Estúdio de IA do Azure
SQL do Azure
Armazenamento do Azure
GPT 3.5 Turbo
GPT 4.0

Automação de processos com conversão de fala em texto e sumarização com .NET e GPT 3.5 Turbo

Este modelo é uma solução de automação de processos que recebe problemas relatados por trabalhadores de campo e de chão de fábrica em uma empresa chamada Contoso Manufacturing, uma empresa de manufatura que fabrica baterias de carro. Os problemas são compartilhados pelos trabalhadores ao vivo por meio de entrada de microfone ou pré-gravados como arquivos de áudio. A solução traduz a entrada de áudio de fala em texto e, em seguida, usa um LLM e Prompty ou Promptflow para resumir o problema e retornar os resultados em um formato especificado pela solução.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub summarization-openai-csharp-prompty.

Captura de tela do aplicativo Web .NET com chat paralelo para fala em texto e sumarização para a Contoso Manufacturing.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos de Contêiner do Azure Conversão de Fala em Texto
Resumo
OpenAI do Azure
GPT 3.5 Turbo

Converse com seus dados usando o OpenAI do Azure e a Pesquisa de IA do Azure com o Python

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Geração Aumentada por Recuperação) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar as experiências de perguntas e respostas (perguntas e respostas) no estilo ChatGPT.

Para começar a usar este modelo, consulte Introdução ao chat usando seu próprio exemplo de dados para Python. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub azure-search-openai-demo.

Captura de tela do aplicativo de chat no navegador mostrando várias sugestões de entrada de chat e a caixa de texto de chat para inserir uma pergunta.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos de Contêiner do Azure OpenAI do Azure
Azure AI Search
Armazenamento do Blobs do Azure
Azure Monitor
Azure Document Intelligence
GPT 3.5 Turbo
GPT 4
GPT 4o
GPT 4o-mini

Copilot de Escrita Criativa Multimodal com DALL-E

Este modelo é uma solução multiagente de escrita criativa para ajudar os usuários a escrever artigos. Ele demonstra como criar e trabalhar com agentes de IA orientados pelo OpenAI do Azure.

Ele inclui:

  1. Um aplicativo Flask que recebe um artigo e instruções de um usuário.
  2. Um agente de pesquisa que usa a API de Pesquisa do Bing para pesquisar o artigo.
  3. Um agente de produto que usa o Azure AI Search para fazer uma pesquisa de similaridade semântica para produtos relacionados de um repositório de vetores.
  4. Um agente escritor para combinar a pesquisa e as informações do produto em um artigo útil.
  5. Um agente editor para refinar o artigo apresentado ao usuário.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub agent-openai-python-prompty.

Diagrama arquitetônico do aplicativo de copiloto de escrita criativa multimodal Python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Registro de Contêiner do Azure
Kubernetes do Azure
OpenAI do Azure
Pesquisa do Bing
Identidade gerenciada do Azure
Azure Monitor
Azure AI Search
Estúdio de IA do Azure
GPT 3.5 Turbo
GPT 4.0
DALL-E

Copilot de Varejo de Chat da Contoso com Estúdio de IA

Este modelo implementa o Contoso Chat – uma solução de copiloto de varejo para o Contoso Outdoor que usa um padrão de design de geração aumentada de recuperação para fundamentar as respostas do chatbot nos dados do produto e do cliente do varejista. Os clientes podem fazer perguntas no site em linguagem natural e obter respostas relevantes com possíveis recomendações com base em seu histórico de compras - com práticas responsáveis de IA para garantir a qualidade e a segurança da resposta.

Este modelo ilustra o fluxo de trabalho de ponta a ponta (GenAIOps) para criar um copiloto baseado em RAG com o Azure AI e o Prompty. Ao explorar e implantar este exemplo, aprenda a:

  1. Idealize e itere rapidamente em protótipos de aplicativos usando o Prompty
  2. Implantar e usar modelos do OpenAI do Azure para chat, inserções e avaliação
  3. Usar o Azure AI Search (índices) e o Azure Cosmos DB (bancos de dados) para seus dados
  4. Avalie a qualidade das respostas do chat usando fluxos de avaliação assistidos por IA
  5. Hospedar o aplicativo como um ponto de extremidade FastAPI implantado nos Aplicativos de Contêiner do Azure
  6. Provisionar e implantar a solução usando a CLI do Desenvolvedor do Azure
  7. Apoie as práticas de IA responsável com segurança e avaliações de conteúdo

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub contoso-chat.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end para o aplicativo de caminhada.

Captura de tela do aplicativo de chat com prompt flow no editor visual para o copiloto de varejo de chat da Contoso.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos de Contêiner do Azure
OpenAI do Azure
Azure AI Search
Estúdio de IA do Azure
Pronto
Azure Cosmos DB
GPT 3.5 Turbo
GPT 4.0
MIR (Managed Integration Runtime (MIR))

Automação de processos com conversão de fala em texto e sumarização com o Estúdio de IA

Este modelo cria um aplicativo baseado na Web que permite que os trabalhadores de uma empresa chamada Contoso Manufacturing relatem problemas por meio de texto ou fala. A entrada de áudio é traduzida em texto e depois resumida para destacar informações importantes e o relatório é enviado ao departamento apropriado.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub summarization-openai-python-promptflow .

Diagrama de arquitetura para Automação de processos com conversão de fala em texto e sumarização com o Estúdio de IA para Python.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos de Contêiner do Azure Estúdio de IA do Azure
Serviço de Conversão de Fala em Texto
Pronto
MIR (Managed Integration Runtime (MIR))
GPT 3.5 Turbo

Copiloto assistente de API Analytics com Python e IA do Azure Studio

Este modelo é uma API do Assistente para conversar com dados tabulares e realizar análises em linguagem natural.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub assistant-data-openai-python-promptflow.

Diagrama de arquitetura para uma API do Assistente para conversar com dados tabulares e executar análises em linguagem natural.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço de Machine Learning Azure AI Search
Estúdio de IA do Azure
MIR (Managed Integration Runtime (MIR))
OpenAI do Azure
GPT 3.5 Turbo
GPT 4

Converse com seus dados usando o OpenAI do Azure e a Pesquisa de IA do Azure com o Java

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Geração Aumentada por Recuperação) em execução no Azure. Ele usa a Pesquisa de IA do Azure para recuperação e modelos de linguagem grandes do OpenAI do Azure para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar este modelo, consulte Introdução ao chat usando seu próprio exemplo de dados para Java. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub azure-search-openai-demo-java.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end no Java.

Captura de tela do aplicativo de chat Java no navegador mostrando várias sugestões de entrada de chat e a caixa de texto de chat para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Serviço de Aplicativo do Azure
Aplicativos de Contêiner do Azure
Serviço de Kubernetes do Azure
OpenAI do Azure
Azure AI Search
Armazenamento do Azure
Azure Monitor

Converse com seus dados usando o OpenAI do Azure e a Pesquisa de IA do Azure com o JavaScript

Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Geração Aumentada por Recuperação) em execução no Azure. Ele usa a Pesquisa de IA do Azure para recuperação e modelos de linguagem grandes do OpenAI do Azure para potencializar experiências de perguntas e respostas no estilo ChatGPT.

Para começar a usar este modelo, consulte Introdução ao chat usando seu próprio exemplo de dados para JavaScript. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub azure-search-openai-javascript.

Diagrama mostrando a arquitetura do cliente para o aplicativo de back-end.

Captura de tela do aplicativo de chat no navegador mostrando várias sugestões de entrada de chat e a caixa de texto de chat para inserir uma pergunta.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos de Contêiner do Azure
Aplicativos Web Estáticos do Azure
OpenAI do Azure
Azure AI Search
Armazenamento do Azure
Azure Monitor
text-embedding-ada-002

Front-end de chat do OpenAI do Azure

Este modelo é um componente da web de chat do OpenAI mínimo que pode ser conectado a qualquer implementação de back-end como cliente.

Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub azure-openai-chat-frontend.

Vídeo demonstrando o aplicativo front-end de chat JavaScript.

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos Web Estáticos do Azure IA do Azure Search
OpenAI do Azure
GPT 3.5 Turbo
GPT4

Chat de IA sem servidor com RAG usando LangChain.js

O modelo é um chatbot de IA sem servidor com Geração Aumentada de Recuperação usando LangChain.js e Azure que usa um conjunto de documentos corporativos para gerar respostas às consultas do usuário. Ele usa uma empresa fictícia chamada Contoso Real Estate, e a experiência permite que seus clientes façam perguntas de suporte sobre o uso de seus produtos. Os dados de amostra incluem um conjunto de documentos que descrevem seus termos de serviço, política de privacidade e um guia de suporte.

Para saber como implantar e executar esse modelo, consulte Introdução ao Chat de IA sem servidor com RAG usando LangChain.js. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório do GitHub serverless-chat-langchainjs.

Saiba como implantar e executar este modelo de referência JavaScript.

Diagrama mostrando a arquitetura da API sem servidor usando LangChainjs para integração com o Serviço OpenAI do Azure e a Pesquisa de IA do Azure.

Vídeo do navegador de demonstração do aplicativo de chat JavaScript usando RAG e Langchain.js

Este modelo demonstra o uso desses recursos.

Solução de hospedagem do Azure Tecnologias Modelos de IA
Aplicativos Web Estáticos do Azure
Azure Functions
IA do Azure Search
OpenAI do Azure
Azure Cosmos DB
Armazenamento do Azure
Identidade gerenciada do Azure
GPT4
Mistral
Ollama