O que é resumo?

Importante

Nossa região de versão prévia, a Suécia Central, demonstra nossas técnicas de ajuste fino de LLM mais recentes e em constante evolução baseadas em modelos GPT. Você está convidado a experimentá-los com um recurso de idiomas na região da Suécia Central.

O resumo da conversa só está disponível usando:

  • API REST
  • Python
  • C#

A sumarização é um recurso oferecido pela IA do Azure Language, que é uma combinação de modelos generativos de linguagem grande e modelos de codificadores otimizados para tarefas que oferecem soluções de sumarização com maior qualidade, eficiência de custos e menor latência. Use este artigo para saber mais sobre esse recurso e como usá-lo nos seus aplicativos.

Pronto para uso, o serviço oferece soluções de resumo para três tipos de gênero: textos simples, conversas e documentos nativos. O resumo de texto aceita apenas blocos de texto simples, e o resumo de conversa aceita entrada de conversa, incluindo vários sinais de áudio de fala para que o modelo segmente e resuma com eficácia, e o documento nativo pode resumir diretamente documentos em seus formatos nativos, como Words, PDF, etc.

Esta documentação contém os seguintes tipos de artigos:

  • Os guias de início rápido são instruções de introdução que orientam sobre como fazer solicitações ao serviço.
  • Os guias de instruções contêm instruções de uso do serviço de maneiras mais específicas ou personalizadas.

Esses recursos foram projetados para reduzir o conteúdo que possa ser considerado muito longo para ser lido.

Principais recursos do resumo de texto

O resumo de texto usa técnicas de processamento de linguagem natural para gerar um resumo para textos simples, que pode ser de um documento ou conversa, ou de qualquer texto. Existem duas abordagens de resumo que essa API fornece:

  • Sumarização extrativa: Produz um resumo extraindo sentenças salientes dentro do documento, juntamente com as informações de posicionamento dessas sentenças.

    • Várias frases extraídas: essas frases transmitem em conjunto a ideia principal do documento. São frases originais extraídas do conteúdo do documento de entrada.
    • Pontuação de classificação: A pontuação de classificação indica o quão relevante uma frase é para o tópico principal. O resumo de texto classifica as frases extraídas, e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com a classificação delas. Por exemplo, se você solicitar um resumo de três frases, a sumarização extrativa retornará as três frases com maior pontuação.
    • Informações posicionais: a posição inicial e o comprimento das frases extraídas.
  • Sumarização abstrativa: Gera um resumo com frases concisas e coerentes ou palavras que não são frases extraídas literalmente do documento original.

    • Textos de resumo: o resumo abstrativo retorna um resumo para cada intervalo de entrada contextual. Uma entrada longa pode ser segmentada para que vários grupos de textos de resumo possam ser retornados com seu intervalo de entrada contextual.
    • Intervalo de entrada contextual: o intervalo dentro da entrada que foi usado para gerar o texto de resumo.

Por exemplo, considere o seguinte parágrafo de texto:

"Na Microsoft, estamos em uma busca para levar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para o aprendizado e a compreensão. Como Diretor de Tecnologia dos Serviços de IA do Azure, tenho trabalhado para transformar essa busca em realidade com uma equipe de cientistas e engenheiros incríveis. Na minha função, eu adoto uma perspectiva exclusiva para visualizar a relação entre três atributos de cognição humana: texto (X), sinais sensoriais auditivos ou visuais (Y) e multilínge (Z). Na interseção de todos os três, há mágica, o que chamamos de código XYZ, conforme ilustrado na Figura 1, uma representação conjunta para criar uma IA mais poderosa que possa falar, ouvir, ver e entender melhor os seres humanos. Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes. A meta é ter modelos pré-treinados que possam aprender representações em conjunto para dar suporte a uma ampla variedade de tarefas de IA downstream, de maneira muito similar a como os humanos fazem hoje. Nos últimos cinco anos, alcançamos desempenho humano em parâmetros de comparação em reconhecimento de fala em conversação, tradução automática, resposta às perguntas em conversação, compreensão de leitura por computador e legendas de imagens. Esses cinco avanços nos forneceram fortes sinais em direção à nossa aspiração mais ambiciosa de produzir um salto nas funcionalidades de IA, alcançando um aprendizado multissensorial e multilíngue mais próximo de como os humanos aprendem e entendem. Acredito que o código XYZ conjunto é um componente fundamental dessa aspitação, se fundamentado com fontes de conhecimento externas nas tarefas de IA downstream."

A solicitação de API do resumo de texto é processada após o recebimento da solicitação criando um trabalho para o back-end da API. Se o trabalho tiver sido bem-sucedido, a saída da API é retornada. A saída está disponível para recuperação por 24 horas. Após esse período, a saída será limpa. Devido ao suporte multilíngue e a emojis, a resposta pode conter deslocamentos de texto. Para obter mais informações, confira como processar deslocamentos.

Se usarmos o exemplo acima, a API poderá retornar esses resumos:

Sumarização extrativa:

  • "Na Microsoft, estamos em uma busca para levar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para o aprendizado e a compreensão."
  • "Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes."
  • "A meta é ter modelos pré-treinados que possam aprender representações em conjunto para dar suporte a uma ampla variedade de tarefas de IA downstream, de maneira muito similar a como os humanos fazem hoje."

Sumarização abstrativa:

  • "A Microsoft está adotando uma abordagem mais holística e centrada no aprendizado e na compreensão das pessoas. Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes. Nos últimos cinco anos, alcançamos desempenho humano em parâmetros de comparação no reconhecimento de fala em conversação."

Introdução ao resumo

Para usar a compactação, envie para análise e trate a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem nenhuma personalização adicionada para o modelo usado nos seus dados. Há duas maneiras de usar o resumo:

Opção de desenvolvimento Descrição
Language Studio O Language Studio é uma plataforma baseada na Web que permite que você experimente a vinculação de entidade com exemplos de texto sem uma conta do Azure, e seus próprios dados quando você se inscreve. Para obter mais informações, confira o site do Language Studio ou o início rápido do Language Studio.
API REST ou biblioteca de clientes (SDK do Azure) Integre o resumo de texto nos seus aplicativos usando a API REST ou a biblioteca de clientes disponível em vários idiomas. Para obter mais informações, consulte o início rápido da sumarização.

Requisitos de entrada e limites de serviço

Documentação de referência e exemplos de código

Ao usar o resumo de texto nos seus aplicativos, consulte a seguinte documentação de referência e exemplos da Linguagem de IA do Azure:

Opção/idioma de desenvolvimento Documentação de referência Exemplos
C# Documentação do C# Exemplos do C#
Java Documentação do Java Exemplos do Java
JavaScript Documentação do JavaScript Exemplos de JavaScript
Python Documentação do Python Exemplos em Python

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a utilizam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para resumo para saber mais sobre o uso e a implantação de IA responsável em seus sistemas. Para obter mais informações, consulte os seguintes artigos: