Modelos de aplicativos de IA
Esta seção da documentação apresenta os modelos de aplicativo de IA e artigos relacionados que usam esses modelos para demonstrar como executar tarefas importantes do desenvolvedor. Os modelos de aplicativos de IA fornecem implementações de referência bem mantidas e fáceis de implantar que ajudam a garantir um ponto de partida de alta qualidade para seus aplicativos de IA.
Há duas categorias de modelos de aplicativos de IA, blocos de construção e soluções de ponta a ponta. As seções a seguir apresentam alguns dos principais modelos em cada categoria para a linguagem de programação que você selecionou na parte superior deste artigo. Para navegar por uma lista mais abrangente, incluindo esses e outros modelos, consulte os modelos de aplicativo AI na galeria AI App Template.
Blocos de criação
Os blocos de construção são exemplos de menor escala que se concentram em cenários e tarefas específicos. A maioria dos blocos de construção demonstra a funcionalidade que aproveita a solução completa para um aplicativo de bate-papo que usa seus próprios dados.
Bloco de construção | Description |
---|---|
Balanceamento de carga com Aplicativos de Contêiner do Azure | Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade. |
Bloco de construção | Description |
---|---|
Configurar a segurança de documentos para o aplicativo de chat | Ao criar um aplicativo de bate-papo usando o padrão RAG com seus próprios dados, certifique-se de que cada usuário receba uma resposta com base em suas permissões. Um usuário autorizado deve ter acesso às respostas contidas nos documentos do aplicativo de bate-papo. Um utilizador não autorizado não deve ter acesso a respostas de documentos seguros que não tenha autorização para ver. |
Avaliar as respostas do aplicativo de bate-papo | Saiba como avaliar as respostas de um aplicativo de bate-papo em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade básica). Sempre que você alterar seu aplicativo de bate-papo de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações. |
Balanceamento de carga com Aplicativos de Contêiner do Azure | Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade. |
Balanceamento de carga com gerenciamento de API | Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade. |
Teste de carga do aplicativo de bate-papo Python com Locust | Aprenda o processo para executar o teste de carga em um aplicativo de chat Python usando o padrão RAG com Locust, uma ferramenta popular de teste de carga de código aberto. O objetivo principal do teste de carga é garantir que a carga esperada em seu aplicativo de chat não exceda a cota atual do Azure OpenAI Transactions Per Minute (TPM). Ao simular o comportamento do usuário sob carga pesada, você pode identificar possíveis gargalos e problemas de escalabilidade em seu aplicativo. |
Proteja seu aplicativo de IA com autenticação sem chave | Aprenda o processo para proteger seu aplicativo de chat Python Azure OpenAI com autenticação sem chave. As solicitações de aplicativos para a maioria dos serviços do Azure devem ser autenticadas com conexões sem chave ou sem senha. A autenticação sem chave oferece benefícios aprimorados de gerenciamento e segurança em relação à chave da conta, pois não há nenhuma chave (ou cadeia de conexão) para armazenar. |
Bloco de construção | Description |
---|---|
Balanceamento de carga com Aplicativos de Contêiner do Azure | Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade. |
Bloco de construção | Description |
---|---|
Avaliar as respostas do aplicativo de bate-papo | Saiba como avaliar as respostas de um aplicativo de bate-papo em relação a um conjunto de respostas corretas ou ideais (conhecidas como verdade básica). Sempre que você alterar seu aplicativo de bate-papo de uma forma que afete as respostas, execute uma avaliação para comparar as alterações. Este aplicativo de demonstração oferece ferramentas que você pode usar hoje para facilitar a execução de avaliações. |
Balanceamento de carga com Aplicativos de Contêiner do Azure | Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa os Aplicativos de Contêiner do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade. |
Balanceamento de carga com gerenciamento de API | Saiba como adicionar balanceamento de carga ao seu aplicativo para estender o aplicativo de chat além dos limites de token e cota de modelo do Azure OpenAI. Essa abordagem usa o Gerenciamento de API do Azure para criar três pontos de extremidade do Azure OpenAI, bem como um contêiner primário para direcionar o tráfego de entrada para um dos três pontos de extremidade. |
Soluções end-to-end
As soluções completas são exemplos de referência abrangentes, incluindo documentação, código-fonte e implantação, para permitir que você pegue e estenda para seus próprios propósitos.
Converse com seus dados usando o Azure OpenAI e o Azure AI Search com .NET
Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.
Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para .NET. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo-csharp .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Azure Container Apps Funções do Azure |
Azure OpenAI Azure Computer Vision Reconhecedor de Formato do Azure Pesquisa de IA do Azure Armazenamento do Azure |
GPT 3.5 Turbo GPT 4,0 |
Copiloto de varejo de bate-papo da Contoso com .NET e Kernel Semântico
Este modelo implementa a Contoso Outdoors, uma loja conceitual especializada em equipamentos ao ar livre para entusiastas de caminhadas e camping. Esta loja virtual melhora o envolvimento do cliente e o suporte de vendas através de um agente de chat inteligente. Este agente é alimentado pelo padrão Retrieval Augmented Generation (RAG) dentro do Microsoft Azure AI Stack, enriquecido com suporte a Kernel Semântico e Prompty.
Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub contoso-chat-csharp-prompty .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Azure Container Apps |
Azure OpenAI Microsoft Entra ID Identidade Gerida do Azure Azure Monitor Pesquisa de IA do Azure Azure AI Studio SQL do Azure Armazenamento do Azure |
GPT 3.5 Turbo GPT 4,0 |
Automação de processos com fala para texto e sumarização com .NET e GPT 3.5 Turbo
Este modelo é uma solução de automação de processos que recebe problemas relatados por trabalhadores de campo e chão de fábrica em uma empresa chamada Contoso Manufacturing, uma empresa de fabricação que fabrica baterias de carros. Os problemas são compartilhados pelos trabalhadores ao vivo através da entrada do microfone ou pré-gravados como arquivos de áudio. A solução traduz a entrada de áudio de fala para texto e, em seguida, usa um LLM e Prompty ou Promptflow para resumir o problema e retornar os resultados em um formato especificado pela solução.
Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub summarization-openai-csharp-prompty .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Azure Container Apps | Conversão de Voz em Texto Resumo Azure OpenAI |
GPT 3.5 Turbo |
Converse com seus dados usando o Azure OpenAI e o Azure AI Search com Python
Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa a Pesquisa de IA do Azure para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências no estilo ChatGPT e Perguntas e Respostas (P&R).
Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para Python. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Azure Container Apps | Azure OpenAI Pesquisa de IA do Azure Armazenamento de Blobs do Azure Azure Monitor Azure Document Intelligence |
GPT 3.5 Turbo GPT 4 GPT 4o GPT 4o-mini |
Copiloto de Escrita Criativa Multimodal com DALL-E
Este modelo é uma solução multiagente de escrita criativa para ajudar os usuários a escrever artigos. Ele demonstra como criar e trabalhar com agentes de IA orientados pelo Azure OpenAI.
Inclui:
- Um aplicativo Flask que recebe um artigo e instruções de um usuário.
- Um agente de pesquisa que usa a API de Pesquisa do Bing para pesquisar o artigo.
- Um agente de produto que usa a Pesquisa de IA do Azure para fazer uma pesquisa de semelhança semântica para produtos relacionados de um repositório de vetores.
- Um agente escritor para combinar a pesquisa e as informações do produto em um artigo útil.
- Um agente editor para refinar o artigo apresentado ao usuário.
Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub agent-openai-python-prompty .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Registo de Contentores do Azure Azure Kubernetes |
Azure OpenAI Pesquisa Bing Identidade Gerida do Azure Azure Monitor Pesquisa de IA do Azure Azure AI Studio |
GPT 3.5 Turbo GPT 4,0 DALL-E |
Copiloto de varejo de bate-papo da Contoso com o AI Studio
Este modelo implementa o Contoso Chat - uma solução copiloto de varejo para a Contoso Outdoor que usa um padrão de design de geração aumentada de recuperação para fundamentar as respostas do chatbot nos dados do produto e do cliente do varejista. Os clientes podem fazer perguntas do site em linguagem natural e obter respostas relevantes com possíveis recomendações com base em seu histórico de compras - com práticas de IA responsáveis para garantir a qualidade e a segurança da resposta.
Este modelo ilustra o fluxo de trabalho de ponta a ponta (GenAIOps) para criar um copiloto baseado em RAG com o Azure AI e o Prompty. Ao explorar e implantar este exemplo, aprenda a:
- Idealize e itere rapidamente em protótipos de aplicativos usando o Prompty
- Implantar e usar modelos do Azure OpenAI para bate-papo, incorporações e avaliação
- Usar o Azure AI Search (índices) e o Azure Cosmos DB (bancos de dados) para seus dados
- Avalie as respostas do chat quanto à qualidade usando fluxos de avaliação assistidos por IA
- Hospede o aplicativo como um ponto de extremidade FastAPI implantado em Aplicativos de Contêiner do Azure
- Provisionar e implantar a solução usando a CLI do Desenvolvedor do Azure
- Apoie práticas de IA responsável com avaliações de segurança de conteúdo e avaliações
Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub contoso-chat .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Azure Container Apps |
Azure OpenAI Pesquisa de IA do Azure Azure AI Studio Prontidão Azure Cosmos DB |
GPT 3.5 Turbo GPT 4,0 Tempo de execução de integração gerenciada (MIR) |
Automação de processos com fala para texto e sumarização com AI Studio
Este modelo cria um aplicativo baseado na Web que permite que os trabalhadores de uma empresa chamada Contoso Manufacturing relatem problemas por meio de texto ou fala. A entrada de áudio é traduzida para texto e, em seguida, resumida para destacar informações importantes e o relatório é enviado para o departamento apropriado.
Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub summarization-openai-python-promptflow .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Azure Container Apps | Azure AI Studio Serviço de Fala para Texto Prontidão Tempo de execução de integração gerenciada (MIR) |
GPT 3.5 Turbo |
Copiloto Assistente de Análise de API com Python e Azure AI Studio
Este modelo é uma API do Assistente para conversar com dados tabulares e realizar análises em linguagem natural.
Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub assistant-data-openai-python-promptflow .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Serviço do Machine Learning | Pesquisa de IA do Azure Azure AI Studio Tempo de execução de integração gerenciada (MIR) Azure OpenAI |
GPT 3.5 Turbo GPT 4 |
Converse com seus dados usando o Azure OpenAI e o Azure AI Search com Java
Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.
Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para Java. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-demo-java .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Serviço de Aplicações do Azure Azure Container Apps Azure Kubernetes Service |
Azure OpenAI Pesquisa de IA do Azure Armazenamento do Azure Azure Monitor |
Converse com seus dados usando o Azure OpenAI e o Azure AI Search com JavaScript
Este modelo é uma solução completa de ponta a ponta que demonstra o padrão RAG (Retrieval-Augmented Generation) em execução no Azure. Ele usa o Azure AI Search para recuperação e modelos de linguagem grandes do Azure OpenAI para potencializar experiências de perguntas e respostas no estilo ChatGPT.
Para começar a usar esse modelo, consulte Introdução ao bate-papo usando seu próprio exemplo de dados para JavaScript. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-search-openai-javascript .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Azure Container Apps Aplicações Web Estáticas do Azure |
Azure OpenAI Pesquisa de IA do Azure Armazenamento do Azure Azure Monitor |
incorporação de texto-ada-002 |
Frontend de chat do Azure OpenAI
Este modelo é um componente web de bate-papo OpenAI mínimo que pode ser conectado a qualquer implementação de back-end como cliente.
Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub azure-openai-chat-frontend .
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Aplicações Web Estáticas do Azure | Pesquisa de IA do Azure Azure OpenAI |
GPT 3.5 Turbo GPT4 |
Bate-papo de IA sem servidor com RAG usando LangChain.js
O modelo é um chatbot de IA sem servidor com Geração Aumentada de Recuperação usando LangChain.js e Azure que usa um conjunto de documentos corporativos para gerar respostas às consultas dos usuários. Ele usa uma empresa fictícia chamada Contoso Real Estate, e a experiência permite que seus clientes façam perguntas de suporte sobre o uso de seus produtos. Os dados de exemplo incluem um conjunto de documentos que descreve seus termos de serviço, política de privacidade e um guia de suporte.
Para saber como implantar e executar esse modelo, consulte Introdução ao bate-papo de IA sem servidor com o RAG usando o LangChain.js. Para acessar o código-fonte e ler detalhes detalhados sobre o modelo, consulte o repositório GitHub serverless-chat-langchainjs .
Saiba como implantar e executar este modelo de referência JavaScript.
Este modelo demonstra o uso desses recursos.
Solução de hospedagem do Azure | Tecnologias | Modelos de IA |
---|---|---|
Aplicações Web Estáticas do Azure Funções do Azure |
Pesquisa de IA do Azure Azure OpenAI Azure Cosmos DB Armazenamento do Azure Identidade Gerida do Azure |
GPT4 Mistral Ollama |