Краткое руководство. Создание рабочей области Synapse

В этом кратком руководстве вы создадите рабочую область Synapse, и вы можете следовать остальным руководствам по созданию выделенного пула SQL и бессерверного пула Apache Spark.

Необходимые компоненты

  • Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.
  • Чтобы выполнить действия этого руководства, необходимо иметь доступ к группе ресурсов, для которой назначена роль владельца . Создайте рабочую область Synapse в этой группе ресурсов.

Создание рабочей области Synapse на портале Azure

Начало процесса

  1. Откройте портал Azure, в строке поиска введите Synapse, но не нажимайте ВВОД.
  2. В результатах поиска в разделе Службы выберите Azure Synapse Analytics.
  3. Щелкните Создать, чтобы создать рабочую область.

Вкладка "Основные сведения", раздел "Сведения о проекте"

Заполните следующие поля:

  1. Подписка: выберите любую подписку.
  2. Группа ресурсов: укажите любую группу ресурсов.
  3. Управляемая группа ресурсов: оставьте это поле пустым.

Вкладка "Основные сведения", раздел "Сведения о рабочей области"

Заполните следующие поля:

  1. Имя рабочей области: выберите любое глобально уникальное имя. В этом учебнике используется имя myworkspace.
  2. Регион . Выберите регион, в котором размещены клиентские приложения и службы (например, виртуальная машина Azure, Power BI, Служба анализа Azure) и хранилища, содержащие данные (например, хранилище Azure Data Lake, аналитическое хранилище Azure Cosmos DB).

Примечание.

Рабочая область, не связанная с клиентскими приложениями или хранилищем, может являться основной причиной множества проблем с производительностью. Если ваши данные или клиенты размещены в нескольких регионах, вы можете создавать отдельные рабочие области в разных регионах, размещенные вместе с вашими данными и клиентами.

В разделе Выбор Data Lake Storage 2-го поколения:

  1. В разделе Имя учетной записи выберите Создать новую и присвойте новой учетной записи хранения имя contosolake или аналогичное имя, так как оно должно быть уникальным.

    Совет

    Если вы получите сообщение об ошибке "Поставщик ресурсов Azure Synapse (Microsoft.Synapse) необходимо зарегистрировать в выбранной подписке", откройте портал Azure и выберите подписки. Выберите свою подписку. В списке параметров выберите поставщики ресурсов. Найдите Microsoft.Synapse, выберите его и нажмите кнопку "Зарегистрировать".

  2. В разделе Имя файловой системы выберите Создать новую и присвойте файловой системе имя users. Будет создан контейнер хранилища с именем users. В рабочей области эта учетная запись хранения будет использоваться как основная для таблиц и журналов приложений Spark.

  3. Установите флажок "Назначить себе роль участника данных BLOB-объектов хранилища" в поле Data Lake Storage 2-го поколения учетной записи.

Завершение процесса

Выберите Просмотреть и создать>Создать. Рабочая область будет готова через несколько минут.

Примечание.

Сведения о том, как использовать функции рабочей области из существующего выделенного пула SQL (ранее — Хранилище данных SQL), см. здесь.

Открытие Synapse Studio

После создания рабочей области Azure Synapse можно открыть Synapse Studio двумя способами:

  1. Откройте рабочую область Synapse на портале Azure и в ее разделе Обзор выберите элемент Открыть в поле Open Synapse Studio (Открыть Synapse Studio).

  2. Перейдите по адресу https://web.azuresynapse.net и войдите в рабочую область.

    Вход в рабочую область

Примечание.

Для входа в рабочую область существует два метода выбора учетной записи. Один для подписки Azure, а другой для ручного ввода. При наличии роли Azure Synapse или ролей более высокого уровня вы можете использовать оба способа входа в рабочую область. Если у вас нет связанных ролей Azure и вам назначили роль RBAC в Synapse, ручной ввод является единственным способом входа в рабочую область. Дополнительные сведения о RBAC в Synapse см. в разделе Что такое управление доступом на основе ролей в Synapse (RBAC)?.

Размещение данных примера в основной учетной записи хранения

Мы будем использовать небольшой набор данных из 100 тысяч строк для данных такси Нью-Йорка для многих примеров в этом руководстве по началу работы. Мы начнем с его размещения в основной учетной записи хранения, созданной вами для рабочей области.

  1. Скачайте набор данных о такси Нью-Йорка — зеленый набор данных поездки на компьютер:
    1. Перейдите к исходному расположению набора данных из ссылки, выберите определенный год и скачайте записи о поездке в зеленом такси в формате Parquet.
    2. Переименуйте скачанный файл в NYCTripSmall.parquet.
  2. В Synapse Studio перейдите в центр Данные.
  3. Выберите Связано.
  4. В категории Azure Data Lake Storage 2-го поколения вы увидите элемент с таким именем, как myworkspace (primary - contosolake).
  5. Выберите контейнер с именем users (Primary).
  6. Щелкните Отправить и выберите скачанный вами файл NYCTripSmall.parquet.

После отправки файла parquet он доступен через два эквивалентных URI:

  • https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet
  • abfss://users@contosolake.dfs.core.windows.net/NYCTripSmall.parquet

Совет

В контексте примеров, приведенных в данном руководстве, не забудьте заменить contosolake в пользовательском интерфейсе именем основной учетной записи хранения, которую вы выбрали для своей рабочей области.

Следующие шаги