Руководство. Разработка прогнозной модели в R с помощью машинного обучения SQL

Область применения: SQL Server 2016 (13.x) и более поздних версий Управляемый экземпляр SQL Azure

В этой серии руководств с четырьмя частью вы используете R и модель машинного обучения в службах SQL Server Машинное обучение или Кластеры больших данных для прогнозирования количества прокатов лыж.

В этой серии руководств с четырьмя частью вы используете R и модель машинного обучения в SQL Server Машинное обучение Services для прогнозирования количества прокатов лыж.

В этой серии руководств с четырьмя частью вы используете R и модель машинного обучения в службах SQL Server R Services для прогнозирования количества прокатов лыж.

В этой серии учебников с четырьмя частью вы используете R и модель машинного обучения в службах Управляемый экземпляр SQL Azure Машинное обучение для прогнозирования количества прокатов лыж.

Представьте, что вы являетесь владельцем компании по прокату лыж и хотите спрогнозировать количество прокатов за некоторый будущий период. Эта информация поможет вам подготовить инвентарь, персонал и пункты проката.

В первой части учебника вы установите необходимые компоненты. Во второй и третьей частях вы создадите сценарии R в записной книжке для подготовки данных и обучения модели машинного обучения. Из третьей части вы узнаете, как выполнить эти скрипты на языке R в базе данных с помощью хранимых процедур T-SQL.

В этой статье вы узнаете, как выполнять следующие задачи.

  • Восстановление примера базы данных

Во второй части вы узнаете, как загрузить данные из базы данных в кадр данных Python, а также подготовить данные в R.

В третьей части вы узнаете, как обучить модель машинного обучения в R.

В четвертой части вы узнаете, как сохранить модель в базе данных, а затем создать хранимые процедуры на основе сценариев R, разработанных во второй и третьей частях. Хранимые процедуры выполняются на сервере для прогнозирования на основе новых данных.

Необходимые компоненты

  • Службы SQL Server Машинное обучение — установка служб Машинное обучение см. в руководстве по установке Windows.
  • Службы SQL Server 2016 R. Чтобы установить службы R, ознакомьтесь с руководством по установке Windows.
  • Интегрированная среда разработки R — в этом руководстве используется RStudio Desktop.

  • RODBC — этот драйвер используется в скриптах R, которые вы разрабатываете в этом руководстве. Установите его с помощью команды R install.packages("RODBC"), если этот драйвер еще не установлен. Дополнительные сведения о RODBC см. в разделе CRAN - Package RODBC (CRAN: пакет RODBC).

  • Инструмент SQL-запросов — в этом учебнике предполагается, что вы используете Azure Data Studio. Дополнительные сведения см. в статье Использование записных книжек в Azure Data Studio.

Восстановление примера базы данных

Пример базы данных, используемой в этом руководстве, был сохранен в файл резервной .bak копии базы данных для скачивания и использования.

Примечание.

Если вы используете Службы машинного обучения в Кластерах больших данных, ознакомьтесь со статьей Восстановление базы данных на главном экземпляре кластера больших данных SQL Server.

  1. Скачайте файл TutorialDB.bak.

  2. Следуйте инструкциям из раздела Восстановление базы данных из файла резервной копии в Azure Data Studio, используя следующие сведения:

    • Выполните импорт из скачанного файла TutorialDB.bak.
    • Присвойте целевой базе данных имя TutorialDB.
  3. Чтобы убедиться, что восстановленная база данных существует, выполните запрос к таблице dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Скачайте файл TutorialDB.bak.

  2. Следуйте инструкциям в разделе Восстановление базы данных в Управляемый экземпляр SQL Azure в SQL Server Management Studio, используя следующие сведения.

    • Выполните импорт из скачанного файла TutorialDB.bak.
    • Присвойте целевой базе данных имя TutorialDB.
  3. Чтобы убедиться, что восстановленная база данных существует, выполните запрос к таблице dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Очистка ресурсов

Если вы не собираетесь продолжать работу с этим учебником, удалите базу данных TutorialDB.

Следующий шаг

В первой части этого учебника вы выполнили следующие действия:

  • Установка необходимых компонентов
  • Восстановленный пример базы данных

Чтобы подготовить данные из для модели машинного обучения, перейдите ко второй части этого учебника: