Форматирование данных для распознавания именованных сущностей (NER)
Фигуры набора данных NER:
- Файл сведений ключа: файл сведений о ключе содержит список сущностей, которые служат ключевыми сведениями для обучающих данных.
- Обучающие данные: данные обучения состоят из файла (.txt, TSV), содержащего столбцы, разделенные символом TAB. Один из столбцов — это столбец предложения, а другие представляют метки для маркеров в столбце предложения.
Совместная работа с нами на GitHub
Источник этого содержимого можно найти на GitHub, где также можно создавать и просматривать проблемы и запросы на вытягивание. Дополнительные сведения см. в нашем руководстве для участников.