Таблицы в хранилище данных в Microsoft Fabric

Область применения:✅ хранилище в Microsoft Fabric

В этой статье описаны основные понятия разработки таблиц в Microsoft Fabric.

В таблицах данные логически организованы в формате строк и столбцов. Каждая строка представляет собой уникальную запись, а каждый столбец — поле записи.

  • В хранилище таблицы — это объекты базы данных, содержащие все данные транзакций.

Определение категории таблицы

Схема звезды упорядочивает данные в таблицы фактов и таблицы измерений. Некоторые таблицы используются для интеграции или промежуточного хранения данных до того, как они перейдут в таблицу фактов или измерений. При конструировании таблицы решите, к какой таблице относятся данные: фактов, измерений или интеграции. Это решение информирует соответствующую структуру таблицы.

  • Таблицы фактов содержат количественные данные, которые обычно создаются в транзакционной системе, а затем загружаются в хранилище данных. Например, розничное предприятие ежедневно создает транзакции продаж, а затем загружает данные в таблицу фактов хранилища данных для анализа.

  • Таблицы измерений содержат данные атрибутов, которые могут измениться, хотя обычно это происходит редко. Например, имя и адрес клиента хранятся в таблице измерений и обновляются только при изменении профиля клиента. Чтобы минимизировать размер большой таблицы фактов, необязательно включать имя и адрес клиента в каждой строке. Вместо этого в таблице фактов и таблице измерений может совместно использоваться идентификатор клиента. Запрос может объединить две таблицы, чтобы связать профиль и транзакции клиента.

  • Таблицы интеграции служат для интеграции или промежуточного размещения данных. Например, вы можете загружать данные в промежуточную таблицу, выполнять преобразования данных в режиме промежуточного размещения, а затем вставлять их в рабочую таблицу.

Таблица хранит данные в OneLake в составе хранилища. Таблица и данные сохраняются независимо от того, открыт ли сеанс.

Таблицы в хранилище

Чтобы отобразить организацию таблиц, можно использовать factdimint или в качестве префиксов в именах таблиц. В следующей таблице показаны некоторые имена схем и таблиц для примера хранилища данных WideWorldImportersDW .

Имя исходной таблицы WideWorldImportersDW Тип таблицы Имя таблицы хранилища данных
Город Измерение wwi.DimCity
Порядок Факт wwi.FactOrder
  • Имена таблиц чувствительны к регистру.
  • Имена таблиц не могут содержать / или \ заканчиваться ими ..

Создание таблицы

Для хранилища можно создать таблицу в виде новой пустой таблицы. Вы также можете создать и заполнить таблицу результатами инструкции Select. Ниже приведены команды T-SQL для создания таблицы.

Инструкция Т-SQL Description
CREATE TABLE Создает пустую таблицу, определив все столбцы и параметры таблицы.
CREATE TABLE AS SELECT Задает новую таблицу с результатами инструкции Select. Столбцы и типы данных таблицы основаны на результатах инструкции Select. Чтобы импортировать данные, эта инструкция может выбрать данные из внешней таблицы.

В этом примере создается таблица с двумя столбцами:

CREATE TABLE MyTable (col1 int, col2 int );  

Имена схем

Хранилище поддерживает создание пользовательских схем. Как и в SQL Server, схемы — это хороший способ группировки объектов, которые используются аналогичным образом. В следующем коде создается пользовательская схема с именем wwi.

  • Имена схем чувствительны к регистру.
  • Имена схем не могут содержать / или \ заканчиваться ими ..
CREATE SCHEMA wwi;

Типы данных

Microsoft Fabric поддерживает наиболее часто используемые типы данных T-SQL.

Параметры сортировки

Latin1_General_100_BIN2_UTF8 В настоящее время используется значение по умолчанию и поддерживается только параметры сортировки для таблиц и метаданных.

Статистика

Оптимизатор запросов использует статистику уровня столбца при создании плана выполнения запроса. Чтобы повысить производительность запросов, важно получить статистику по отдельным столбцам, особенно столбцам, используемым в объединениях запросов. Хранилище поддерживает автоматическое создание статистики.

Обновление статистики выполняется вручную. Обновите статистику после добавления или изменения значительного числа строк. Например, есть смысл обновить статистику после загрузки. Дополнительные сведения см. в статье Managing statistics on tables in SQL Data Warehouse (Управление статистикой таблиц в хранилище данных SQL).

Первичный ключ, внешний ключ и уникальный ключ

Для хранилища ограничения PRIMARY KEY и UNIQUE поддерживаются только при использовании НЕКЛАСТЕРED и NOT ENFORCED.

ВНЕШНИЙ КЛЮЧ поддерживается только в том случае, если используется NOT ENFORCED.

Согласование исходных данных с хранилищем данных

Таблицы хранилища заполняются путем загрузки данных из другого источника данных. Для успешной загрузки число и типы данных столбцов исходных данных должны совпадать с определением таблицы в хранилище данных.

Если данные поступают из нескольких хранилищ данных, вы можете перенести их в хранилище данных и сохранить их в таблице интеграции. После ввода данных в таблицу интеграции можно использовать возможности хранилища данных для реализации операций преобразования. После подготовки данных их можно вставить в рабочие таблицы.

Ограничения

Хранилище поддерживает множество функций таблицы, предлагаемых другими базами данных, но не все.

В следующем списке показаны некоторые функции таблицы, которые сейчас не поддерживаются.

  • 1024 максимальных столбцов на таблицу
  • Вычисляемые столбцы
  • Индексированные представления
  • Секционированные таблицы
  • Sequence
  • Разреженные столбцы
  • Суррогатные ключи для последовательностей чисел с столбцами Identity
  • Синонимы
  • Временные таблицы
  • Триггеры
  • Уникальные индексы
  • Определяемые пользователем типы

Внимание

Существуют ограничения при добавлении ограничений таблицы или столбцов при использовании системы управления версиями с хранилищем.