Обзор предварительно созданной обработки документов в Microsoft Syntex

Примечание.

До июня 2025 г. вы можете бесплатно опробовать предварительно созданную обработку документов и другие выбранные службы Syntex, если настроено выставление счетов с оплатой по мере использования . Сведения и ограничения см. в статье Опробуйте Microsoft Syntex и изучите его службы.

Помимо пользовательских моделей, Microsoft Syntex предоставляет готовые модели для автоматизации извлечения информации.

Примечание.

Корпорация Майкрософт уважает конфиденциальность и право владения данными, используемыми для обучения и обработки моделей в Syntex. Ни одна из данных вашей организации не используется или не передается корпорацией Майкрософт для обучения моделей ИИ, моделей с большим языком или любых других моделей. Данные остаются в безопасном состоянии в клиенте вашей организации. Дополнительные сведения см. в статье Защита и конфиденциальность данных Майкрософт.

Общие сведения о предварительно созданных моделях

В предварительно созданной обработке документов используются предварительно созданные модели , предварительно настроенные для распознавания документов и структурированной информации в документах. Вместо того, чтобы создавать новую пользовательскую модель с нуля, можно выполнить итерацию по существующей предварительно обученной модели, чтобы добавить определенные поля, которые соответствуют потребностям вашей организации.

Предварительно созданные модели используют оптическое распознавание символов (OCR) в сочетании с моделями глубокого обучения для идентификации и извлечения предопределенных полей текста и данных, общих для определенных типов документов. Сначала нужно проанализировать один из файлов по предварительно созданной модели. Затем вы выбираете обнаруженные поля, которые будут нужны для вашей цели. Если модель не обнаруживает необходимые поля, можно выполнить анализ еще раз с помощью другого файла.

Как и другие модели, предварительно созданные модели создаются и управляются в центре содержимого. При применении к библиотеке документов SharePoint модель связана с типом контента и содержит столбцы для хранения извлекаемых сведений.

После публикации своей модели используйте центр управления контентом, чтобы применить ее к любой библиотеке документов SharePoint, к которой у вас есть доступ.

Доступные предварительно созданные модели

В настоящее время доступны четыре готовые модели: контракты, счета, квитанции и конфиденциальная информация.

  • Контракты. Предварительно созданная модель контрактов анализирует и извлекает ключевую информацию из документов контракта. API анализирует контракты в различных форматах и извлекает ключевые сведения о контракте, такие как имя и адрес клиента, длительность контракта и дата продления.

  • Счета. Предварительно созданная модель счетов анализирует и извлекает ключевую информацию из счетов-фактур. API анализирует счета в различных форматах и извлекает ключевые сведения о счете , такие как имя клиента, адрес выставления счетов, дата выполнения и сумма.

  • Выручка. Предварительно созданная модель квитанций анализирует и извлекает ключевую информацию из квитанций о продажах. API анализирует печатные и рукописные квитанции и извлекает ключевые сведения о квитанциях , такие как имя продавца, номер телефона продавца, дата транзакции, налог и итог транзакции.

  • Конфиденциальная информация. Предварительно созданная модель конфиденциальной информации анализирует, обнаруживает и извлекает ключевую информацию из документов. API анализирует документы в различных форматах, обнаруживает и извлекает ключевую конфиденциальную информацию, такую как личные и финансовые идентификационные номера, физические адреса и адреса электронной почты, а также номера телефонов.

В будущих выпусках будут доступны дополнительные предварительно созданные модели.

Требования и ограничения

Сведения о требованиях, которые следует учитывать при выборе этой модели, см. в разделе Требования и ограничения для моделей в Microsoft Syntex.