Службы эталонных данных в DQS

Эталонными данными называется точный и полный набор взаимосвязанных или категорированных глобальных данных (выходящих за пределы предприятия), доступных в доверенных общедоступных доменах или у поставщиков дополнительного коммерческого содержания.

Функция Reference Data Service в службах Службы Data Quality Services (DQS) позволяет подписываться на услуги сторонних поставщиков эталонных данных, а также удобно очищать и дополнять свои бизнес-данные с помощью их проверки относительно высококачественных данных. С помощью служб, предоставляемых ведущими поставщиками, из DQS вы можете выполнять стандартизацию, исправление и дополнение данных в процессе очистки. Например, для проверки адресов клиентов вы можете использовать список телефонных кодов или почтовых индексов относительно эталонных данных.

Функция службы эталонных данных предоставляет следующие преимущества.

  • Эталонные данные позволяют обеспечить качество данных путем сравнения их с данными, качество которых гарантируется сторонней компанией.

  • Процесс эталонных данных встроен в процесс создания базы знаний DQS и проекта служб DQS и позволяет создать комплексный процесс служб DQS.

  • Поддерживает использование эталонных данных из Windows Azure Marketplace, а также непосредственно от сторонних поставщиков эталонных данных.

В этом разделе

  • Использование эталонных данных из Windows Azure Marketplace

  • Использование эталонных данных, получаемых непосредственно от сторонних поставщиков эталонных данных

  • Как очистить данные с помощью эталонных данных

Использование эталонных данных из Windows Azure Marketplace

DQS поддерживает использование эталонных данных из Windows Azure Marketplace, позволяя поставщикам содержания предоставлять службы эталонных данных через Marketplace. Marketplace — это служба Microsoft, которая предоставляет отдельный рынок и канал доставки для высококачественных данных и приложений в виде облачных служб. Дополнительные сведения о Marketplace см. по адресу Сведения о Windows Azure Marketplace (https://go.microsoft.com/fwlink/?LinkId=211291).

Органичная интеграция между Marketplace и DQS упрощает шаги, связанные с обнаружением, исследованием и получением информации для проектов служб DQS из среды служб DQS. Данные из DQS обрабатываются, что помогает пользователям DQS обеспечивать высокое качество данных за счет нового подхода — использования DQS, Marketplace и поставщиков служб ссылочных данных вместе друг с другом.

Чтобы использовать эталонные данные из Marketplace в DQS для очистки, требуется наличие ключа учетной записи Marketplace. Ключ учетной записи Marketplace создается бесплатно. Платить нужно только за подписку на платные наборы данных. Сама подписка является бесплатной, также не требуется платить за использование бесплатных наборов данных. Дополнительные сведения о создании ключа учетной записи Marketplace см. по адресу Создание учетной записи (https://go.microsoft.com/fwlink/?LinkId = 212936).

Кроме того, в рамках DQS вы можете выполнить следующие операции Marketplace:

  • Просмотр наборов данных в Marketplace.

  • Создание ключа учетной записи Marketplace.

  • Управление подробными сведениями учетной записи Marketplace, например ключами учетной записи и подпиской на услуги поставщиков данных.

Вы можете выполнить эти операции на экранах Эталонные данные и Настройка в клиенте Клиент Data Quality.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Использование эталонных данных, получаемых непосредственно от сторонних поставщиков эталонных данных

Если отсутствует подключение к Интернету и, следовательно, использовать Marketplace невозможно, DQS также поддерживает прямое соединение с поставщиками данных, доступ к которым возможен в сети организации. Чтобы использовать эталонные данные от сторонних поставщиков эталонных данных, получаемых в результате прямого подключения, необходимо создать запись для поставщиков данных в DQS.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Как очистить данные с помощью эталонных данных

Очистка данных в DQS с использованием эталонных данных включает в себя следующие три шага.

  1. Настройка сведения о поставщиках эталонных данных в DQS. Перед тем как использовать эталонные данные в DQS, необходимо настроить подробные сведения о службах эталонных данных в DQS.

    1. Если используется Marketplace, потребуется действующий ключ учетной записи Marketplace. Перейдите к категории данных Службы Data Quality Services в Marketplace и подпишитесь на службы необходимых поставщиков.

    2. При использовании прямого подключения к поставщику эталонных данных перед использованием этих данных необходимо в DQS добавить подробные сведения о поставщике эталонных данных, к которому выполняется прямое подключение.

    Настройка подробных сведений о поставщиках эталонных данных в DQS выполняется для определенного поставщика данных один раз. Настраивать параметры эталонных данных в DQS могут только администраторы DQS.

  2. Сопоставление домена/составного домена в базе знаний со службой эталонных данных. Сопоставьте домен/составной домен с соответствующей службой эталонных данных, на которые выполнена подписка или которые добавлены в шаге 1.

  3. Использование сопоставленных доменов для операции очистки в проекте служб DQS. При создании проекта DQS для операции Очистка выберите базу знаний, которая содержит домены/составные домены, сопоставленные со службами эталонных данных в шаге 2, и выполните операцию очистки.

Значок стрелки, используемый со ссылкой «В начало»[Top]

Связанные задачи

Описание задачи

Раздел

Описывает, как настроить в DQS использование служб эталонных данных из Marketplace или от сторонних поставщиков данных с прямым подключением.

Настройка служб DQS для использования справочных данных

Описывает, как сопоставить домен/составной домен в базе знаний со службой эталонных данных.

Добавление домена или составного домена к ссылочным данным

Описывает очистку данных с использованием службы эталонных данных.

Очистка данных с использованием знаний о справочных данных (внешних знаний)

Значок стрелки, используемый со ссылкой «В начало»[Top]