Отправка рукописного текста в API Распознавателя рукописного текста

Примечание

Действие предварительной версии API Распознавателя рукописного ввода закончилось 26 августа 2020 г. Если у вас есть ресурсы Распознавателя рукописного текста, вы можете и дальше использовать их до полного прекращения работы службы 31 января 2021 г.

Цифровой рукописный текст относится к технологиям, которые обеспечивают цифровое представление таких входных данных, как рукописный текст и рисунки. Обычно для этого используется дигитайзер, который записывает движение устройств для ввода, например пера. По мере обеспечения внушительных возможностей работы с цифровым вводом искусственный интеллект и машинное обучение позволяют распознавать письменные формы и текст в любом контексте. API Распознавания рукописного ввода позволяет отправлять рукописные мазки кистью и получать подробные сведения о них.

API распознавателя рукописного ввода и службы OCR

API Распознавателя рукописного текста не использует оптическое распознавание символов (OCR). Службы OCR обрабатывают данные о пикселях с изображений, чтобы предоставлять распознавание рукописного ввода и текста. Иногда это называют автономным распознаванием. Вместо этого API Распознавателя рукописного текста требуются данные мазка кистью рукописного ввода, записываемые при использовании устройства для ввода. Обработка данных рукописного ввода таким способом может привести к получению более точных результатов распознавания, чем в службах OCR.

Отправка данных рукописного ввода

Для API Распознавателя рукописного текста требуются координаты X и Y, которые представляют мазки кистью, созданные устройством для ввода с момента касания воспринимающей поверхности до момента завершения. Точки каждого мазка кистью должны быть строкой значений, разделенных запятыми, в формате JSON, как на примере ниже. В дополнение каждый мазок кистью должен обладать уникальным идентификатором в каждом запросе. Если идентификатор повторяется в пределах того же запроса, API вернет ошибку. Для самых точных результатов распознавания необходимо не менее 8 цифр после десятичного разделителя. Началом координат (0,0) холста считается левый верхний угол холста рукописного ввода.

Примечание

Далее приведен пример недопустимого кода JSON. Полный запрос JSON Распознавателя рукописного текста можно найти на GitHub.

{
  "language": "en-US",
  "strokes": [
   {
    "id": 43,
    "points": 
        "5.1365, 12.3845,
        4.9534, 12.1301,
        4.8618, 12.1199,
        4.7906, 12.2217,
        4.7906, 12.5372,
        4.8211, 12.9849,
        4.9534, 13.6667,
        5.0958, 14.4503,
        5.3299, 15.2441,
        5.6555, 16.0480,
        ..."
   },
    ...
  ]
}

Ответ Распознавателя рукописного текста

API Распознавателя рукописного текста возвращает ответ анализа об объектах, которые он узнал из содержимого рукописного ввода. Ответ содержит единицы распознавания, которые описывают отношения между различными мазками кисти рукописного ввода. Например мазки кистью, которые создают отдельные фигуры, будут содержаться в разных единицах. Каждая единица содержит подробные сведения о мазках кистью рукописного ввода, включая распознанный объект, его координаты и другие атрибуты рисования.

Фигуры, распознанные API Распознавателя рукописного текста

API Распознавателя рукописного текста может определить самые распространенные фигуры в заметке. Ниже показаны некоторые простые примеры. Полный список фигур и другого содержимого рукописного ввода, распознанного API, см. в справочной статье об API.

Список фигур, распознанных API Распознавателя рукописного текста

Вы можете вызывать REST API Распознавателя рукописного текста в различных шаблонах в соответствии с вашим приложением.

Инициируемые пользователем вызовы API

Если вы создаете приложение, которое принимает входные данные пользователя (например, написание заметок или приложение заметок), вы можете дать ему контроль над тем, когда и какой ввод будет отправлен в API Распознавателя рукописного текста. Эта функция особенно полезна в тех случаях, когда текст и фигуры находятся на холсте, и пользователи хотят выполнить с ними разные действия. Рассмотрите возможность добавления функций выделения (например, лассо или другой инструмент геометрического выделения), позволяющих пользователю выбирать, что будет отправлено в API.

Инициируемые приложением вызовы API

Ваше приложение также может вызвать API Распознавателя рукописного текста по истечении времени ожидания. Регулярно отправляя текущие рукописные мазки кистью в API, вы можете сохранять результаты распознавания в том виде, в каком они были созданы, и при этом улучшить время отклика API. Например, вы можете отправить строку рукописного текста в API после того, как обнаружите, что пользователь ее заполнил.

Предварительное наличие результатов распознавания дает вам информацию о характеристиках рукописных мазков кистью, так как они взаимосвязаны. Например какие мазки кистью группируются для формирования одного слова, строки, списка, абзаца или фигуры. Эта информация может улучшить возможности выделения рукописного ввода приложения, позволяя, например, одновременно выбрать группы мазков кистью.

Интеграция API Распознавателя рукописного текста с Windows Ink

Windows Ink предоставляет инструменты и технологии, предоставляющие широкие возможности рукописного ввода с диапазона различных устройств. Вы можете объединить платформу Windows Ink с API Распознавателя рукописного ввода для создания приложений, которые отображают и интерпретируют росчерки рукописного ввода.

Дальнейшие действия