Что такое суммирование?

Внимание

Наш предварительный просмотр региона, Швеция Central, демонстрирует наши последние и постоянно развивающиеся методы тонкой настройки LLM на основе моделей GPT. Вы можете попробовать их с языковым ресурсом в Центральном регионе Швеции.

Сводка по беседам доступна только с помощью:

  • REST API
  • Python
  • C#

Сводка — это одна из функций, предлагаемых языком искусственного интеллекта Azure, которая представляет собой сочетание созданных моделей больших языков и моделей кодировщика, оптимизированных для задач, которые предлагают решения для суммирования с более высоким качеством, экономичностью и низкой задержкой. Используйте эту статью для получения дополнительных сведений о данной функции и ее использовании в приложениях.

Вне поля служба предоставляет решения для суммирования для трех типов жанров, простых текстов, бесед и собственных документов. Суммирование текста принимает только блоки обычного текста, а сводка бесед принимает входные данные беседы, включая различные звуковые сигналы речи, чтобы модель эффективно сегментировала и суммирует, а собственный документ может напрямую суммировать документы в собственных форматах, таких как слова, PDF и т. д.

Эта документация включает статьи следующих типов:

  • Краткие руководства — инструкции по началу работы и отправке запросов в службу.
  • Руководства — содержат инструкции для более специфического или специализированного использования службы.

Эти функции предназначены для сокращения содержимого, которое можно считать слишком длинным для чтения.

Ключевые функции для суммирования текста

Сводка текста использует методы обработки естественного языка для создания сводки для простых текстов, которые могут быть из документа или беседы или любого текста. Существует два подхода к обобщению этого API:

  • Извлечение сводных данных: создает сводку, извлекая в документе ключевые предложения вместе с информацией о расположении этих предложений.

    • Несколько извлеченных предложений: эти предложения коллективно передают основную идею документа. Они исходные предложения, извлеченные из содержимого входного документа.
    • Оценка ранжирования: оценка ранжирования указывает, насколько релевантно предложение к главной теме. Формирование сводных данных ранжирует извлеченные предложения, чтобы у вас была возможность определить, возвращаются ли они в том же порядке, в котором они отображаются, или в соответствии с их рейтингом. Например, если вы запрашиваете три предложения сводных сводных суммарных сводных данных, возвращает три наиболее оцененных предложения.
    • Сведения о положении в тексте: Начальное расположение и длина извлеченных предложений.
  • Абстрактная сводка: создает сводку с краткими, последовательными предложениями или словами, которые не являются подробными, извлекающими предложения из исходного документа.

    • Сводные тексты: абстрактная сводка возвращает сводку для каждого контекстного входного диапазона. Длинные входные данные можно сегментировать, чтобы можно было вернуть несколько групп сводных текстов с их контекстным диапазоном входных данных.
    • Контекстный входной диапазон: диапазон входных данных, используемый для создания сводного текста.

В качестве примера рассмотрим следующий абзац текста:

"В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию. Как главный технический директор служб ИИ Azure, я работал с командой удивительных ученых и инженеров, чтобы превратить этот поиск в реальность. Я использую в работе уникальный подход, основанный на рассмотрении взаимосвязей между тремя аспектами когнитивной деятельности человека: одноязычный текст (X), звуковые или визуальные сигналы (Y) и многоязычное восприятие (Z). На пересечении всех трех, есть магия - то, что мы называем XYZ-code, как показано на рис. 1- совместное представление для создания более мощных ИИ, которые могут говорить, слышать, видеть и понимать людей лучше. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. Наша цель состоит в том, чтобы предварительно обученные модели могли совместно изучать представления для поддержки широкого спектра нижестоящих задач ИИ, как сегодня это делают люди. За последние пять лет мы достигаем производительности на тестах в распознавании речи беседы, машинном переводе, ответе на беседы, машинном чтении и субтитрах изображений. Достижения по этим пяти направлениям дали нам твердую уверенность в возможности реализации более амбициозных задач, которые помогли бы нам совершить настоящий прорыв в области ИИ за счет мультисенсорного многоязычного обучения, которое по своей сути ближе к тому, как учатся и воспринимают информацию люди. Я полагаю, что этот совместный код XYZ может стать фундаментом для такого рывка при наличии соответствующих внешних источников знаний в нижестоящих задачах ИИ".

Запрос API суммирования текста обрабатывается при получении запроса путем создания задания для серверной части API. Если задание выполнено успешно, возвращается результат API. Выходные данные доступны для получения в течение 24 часов. По прошествии этого времени выходные данные очищаются. Благодаря поддержке многоязычных и эмодзи ответ может содержать смещения текста. Дополнительные сведения см. в статье об обработке смещения.

Если мы используем приведенный выше пример, API может вернуть следующие сводки:

Извлечение сводных данных:

  • "В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию".
  • "Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки".
  • "Цель состоит в том, чтобы иметь предварительно обученные модели, которые могут совместно изучать представления для поддержки широкого спектра подчиненных задач ИИ, много в том, как люди делают сегодня".

Абстрактная сводка:

  • "Корпорация Майкрософт принимает более целостный, ориентированный на человека подход к обучению и пониманию. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. За последние пять лет мы достигли человеческой производительности на тестах в распознавании речи беседы".

Начало работы с формированием сводных данных

Чтобы использовать сводку, вы отправляете для анализа и обрабатываете выходные данные API в приложении. Анализ выполняется как есть, без добавления настройки модели, используемой для данных. Существует два способа использования функции формирования сводных данных:

Вариант разработки Description
Студия службы "Язык" Language Studio — это веб-платформа, которая позволяет попробовать связывание сущностей с текстовыми примерами без учетной записи Azure и собственных данных при регистрации. Дополнительные сведения см. в кратком руководстве по веб-сайту Или языковой студии Language Studio.
REST API или клиентская библиотека (пакет SDK для Azure) Интеграция сводных данных текста в приложения с помощью REST API или клиентской библиотеки, доступной на различных языках. Дополнительные сведения см. в кратком руководстве по сводных данных.

Требования к входным данным и ограничения службы

Справочная документация и примеры кода

При использовании сводные данные текста в приложениях см. в следующей справочной документации и примерах для языка искусственного интеллекта Azure:

Вариант разработки и язык Справочная документация Примеры
C# Документация по C# Примеры C#
Java Документация по Java Примеры для Java
JavaScript Документация по работе с JavaScript. Примеры JavaScript
Python Документация по Python. Примеры для Python

Ответственное применение ИИ

Система ИИ включает не только технологию, но и людей, которые используют ее, людей, пострадавших от нее, и среды развертывания. Ознакомьтесь с примечанием о прозрачности для формирования сводных данных, чтобы больше узнать об ответственном использовании и развертывании решений искусственного интеллекта в своих системах. Дополнительные сведения см. в следующих статьях: