Форматирование данных для распознавания именованных сущностей (NER)

Фигуры набора данных NER:

  • Файл сведений ключа: файл сведений о ключе содержит список сущностей, которые служат ключевыми сведениями для обучающих данных.
  • Обучающие данные: данные обучения состоят из файла (.txt, TSV), содержащего столбцы, разделенные символом TAB. Один из столбцов — это столбец предложения, а другие представляют метки для маркеров в столбце предложения.