Установка свойств домена
В этом разделе описывается, как настроить свойства домена в службах Службы Data Quality Services (DQS).
В этом разделе
Перед началом работы выполните следующие действия.
Предварительные требования
Безопасность
Установка свойств домена
Дальнейшие действия: после настройки свойств домена
Свойства домена
Имя и описание домена
Тип данных
Использование ведущих значений
Нормализация строки
Формат вывода
Язык
Включить проверку орфографии
Отключить алгоритмы поиска ошибок синтаксиса
Перед началом работы
Предварительные требования
Чтобы настроить свойства домена, необходимо создать базу знаний и домен.
Безопасность
Разрешения
Для настройки свойств домена необходимо иметь в базе данных DQS_MAIN роль dqs_administrator или dqs_kb_editor.
[В начало]
Установка свойств домена
Настройте свойства существующего домена, открыв базу знаний в операции управления доменами (см. раздел Открытие базы знаний), а затем выберите соответствующий домен в списке Домен. По умолчанию отображается страница «Свойства домена».
Задайте свойства нового домена после его создания, как описано в разделе Создание домена.
Нажмите кнопку Готово, чтобы завершить операцию управления доменами, как описано в разделе Завершение операции по управлению доменами.
[В начало]
Дальнейшие действия. после настройки свойств домена
После настройки свойств домена можно выполнить другие задачи управления доменами для этого домена, провести обнаружение набора знаний для добавления набора знаний в домен или добавить в домен политику сопоставления. Дополнительные сведения см. в разделе Обнаружение набора знаний, Управление доменом или Создание политики сопоставления.
[В начало]
Свойства домена
Имя и описание домена
После создания домена имя или описание домена можно изменить. Имя домена должно быть уникальным для базы знаний. Длина описания может быть не более 256 символов.
Тип данных
При создании домена выберите один из следующих типов данных для значений в домене: String (по умолчанию), Date, Integer или Decimal. После создания домена вы можете просмотреть его тип данных, но не изменить его. Выбранный для домена тип данных определяет тип исходных данных, которые могут быть сопоставлены с доменом. Дополнительные сведения о поддерживаемых типах данных для каждого из 4 типов данных домена в службах DQS см. в разделе Типы данных SQL Server и службы SSIS, поддерживаемые для доменов DQS.
Использование ведущих значений
Установите этот флажок, чтобы указать, что будет выдано ведущее значение в группе синонимов, а не значение, которое является его синонимом. Снимите флажок Использовать ведущие значения, чтобы указать, что каждое значение синонима выводится в правильной или исправленной форме, и не заменяется ведущим значением для группы.
Нормализация строки
Если тип данных — String, установите этот флажок, чтобы пропускать специальные символы в исходных данных. DQS выполняет внутреннюю замену специальных символов значением NULL или пробелом при загрузке данных в домен. Двоеточие, дефис, точка, двойная кавычка или запятая заменяются пробелом. Одинарная кавычка заменяется значением NULL. Использование значений NULL объединяет две части строки.
Пропуск специальных символов в строковом значении может повысить точность сопоставления. Оценка подобия двух строк может быть увеличена путем замены специальных символов значением NULL или пробелом. Знаки пунктуации или другие символы нередко отличаются в разных строках. Внутренняя замена специальных символов часто позволяет результатам сопоставления преодолеть минимальный порог сопоставления в DQS, и две строки рассматриваются как совпадающие, что было бы невозможно без нормализации. Однако выбор режима пропуска специальных символов может зависеть от типа сопоставляемых данных. Например, при обработке данных в английской системе мер пропуск двойных и одинарных кавычек в характеристиках продукта может привести к ложным положительным результатам, если двойная кавычка обозначает дюйм, а одинарная кавычка обозначает фут.
Нормализация выполняется во время загрузки и индексации данных на следующих этапах обработки данных: обнаружение, политика сопоставления, сопоставление проекта и операции очистки проекта. Если этот режим включен, нормализация и преобразование с помощью связей на основе термина выполняются на предварительном этапе перед анализом. Они выполняются в каждом домене, прежде чем применяются любые алгоритмы вычисления подобия между строками. Если требуется синтаксический анализ составного домена, он выполняется перед нормализацией и преобразованием с помощью связей на основе термина, поскольку для синтаксического анализа по разделителям требуются символы. Другие операции, такие как изменение правил и значений домена, выполняются после этих преобразований. При внутренней замене специальных символов в DQS результирующие данные не изменяется.
Формат вывода
Выберите формат, который будет применяться при выводе значений данных домена. Форматирование определяется выбранным типом данных, как показано в следующем списке. Выбор Нет означает, что не будет применяться ни один из форматов в списке.
Для строкового значения вы можете указать, что строка выводится в верхнем регистре, нижнем регистре или прописными буквами.
Для значения даты вы можете указать формат дня, месяца и года.
Для целочисленного значения вы можете указать тип маски формата, которую следует применить.
Для десятичного значения вы можете указать точность и тип маски формата, которую следует применить.
Язык
Если типом данных является String, выберите язык, который нужно связать с доменом для проверки орфографии. Этот параметр применяется только для проверки орфографии, потому что результаты зависят от используемого языка. Выбор распространяется только на один домен с данными строкового типа. Свойство языка неприменимо в составных доменах. Язык для каждой части составного домена определяется в соответствующем отдельном домене.
По умолчанию используется английский язык. Если свойству Язык задано значение Другой, проверка орфографии для домена отключается.
Совет |
---|
Если выбранный язык не отображается в раскрывающемся списке Язык, установите флажок Прочее. В этом случае средство DQS очищает и удаляет повторяющиеся данные для неперечисленных языков на основе доступных наборов знаний (правил домена, значений домена, TBR, правила сопоставления) в домене. Дополнительные сведения об очистке или сопоставлении неперечисленных языков см. в статье в блоге: Languages Supported by DQS for Cleansing and Matching. |
Включить проверку орфографии
Если типом данных является String, выберите, чтобы включить проверку орфографии DQS для домена. Средство проверки орфографии применяется лишь к доменам со строковым типом данных. Флажок Включить проверку орфографии включает проверку только для отдельного домена, связанного с флажком. Этот флажок не применяется к составному домену.
Средство проверки орфографии предлагает исправления синтаксиса и достоверности для значений в домене. Дополнительные сведения см. в разделе Использование средства проверки орфографии DQS.
Отключить алгоритмы поиска ошибок синтаксиса
Если типом данных является String, выберите, чтобы службы DQS не определяли синтаксические ошибки в домене в процессе очистки. Установите этот флажок, если определять синтаксические ошибки для этого домена не нужно. Например, синтаксические ошибки не имеют смысла для серийного номера. Этот элемент управления применяется только к данным строкового типа. Службы DQS не будут проверять синтаксические ошибки в данных нестрокового типа.
[В начало]