Рабочая нагрузка для обработки и анализа данных в Visual Studio
Рабочая нагрузка по обработке и анализу данных в Visual Studio объединяет несколько языков и их соответствующих дистрибутивов среды выполнения:
Python — это основной язык скриптов, используемый для обработки и анализа данных. Python легко узнать и получить поддержку из богатой экосистемы пакетов. Эти пакеты позволяют реализовать широкий спектр сценариев, таких как получение данных, очистка, обучение модели, развертывания и построение графиков. F# также является мощным функциональным языком .NET, применимым для различных задач обработки данных.
Установка рабочей нагрузки
Рабочая нагрузка для обработки и анализа данных доступна в установщике Visual Studio в разделе "Другие наборы инструментов" для рабочих>нагрузок:
По умолчанию рабочая нагрузка устанавливает следующие параметры, которые можно изменить в разделе сводки для рабочей нагрузки в Установщике Visual Studio:
- Поддержка языка F# для классических приложений
- Python:
- Поддержка языка Python
- Поддержка веб-приложений Python
- Встроенные средства разработки Python
Интеграция с SQL Server
SQL Server поддерживает использование Python для углубленной аналитики внутри SQL Server. Поддержка Python доступна в SQL Server 2017 CTP 2.0 и более поздних версий.
Возможность запускать код там же, где находятся ваши данные, обеспечивает следующие преимущества.
Отказ от перемещения данных: вместо перемещения данных из базы данных в приложение или модель вы можете создавать приложения в базе данных. Эта возможность устраняет барьеры безопасности, соответствия, управления, целостности и ряда аналогичных проблем, связанных с перемещением больших объемов данных. Вы также можете использовать наборы данных, которые не вписываются в память клиентского компьютера.
Простое развертывание. После подготовки модели развертывание в рабочей среде является простым вопросом внедрения модели в скрипт T-SQL. Любое клиентское приложение SQL, написанное на любом языке, может воспользоваться преимуществами моделей и аналитики через вызов хранимой процедуры. Никакие отдельные интеграции языка при этом не требуются.
Производительность и масштабирование корпоративного уровня: вы можете использовать расширенные возможности SQL Server, такие как таблица в памяти и индексы хранилища столбцов с высокопроизводительными масштабируемыми API в пакетах RevoScale. Устранение перемещения данных также означает, что вы избегаете ограничений памяти клиента по мере роста или повышения производительности приложения.
Полноценная расширяемость: вы можете установить и запустить в SQL Server любой из последних пакетов с открытым исходным кодом, чтобы создать приложения углубленного обучения и искусственного интеллекта на базе огромного объема данных в SQL Server. Установка пакета в SQL Server осуществляется также просто, как и на локальном компьютере.
Широкая доступность без дополнительных затрат: интеграции языков доступны во всех выпусках SQL Server 2017 и более поздних версий, включая экспресс-выпуск.
Установка интеграции SQL Server
Чтобы воспользоваться всеми преимуществами интеграции SQL Server, используйте Установщик Visual Studio для установки рабочей нагрузки других наборов>>инструментов хранилища данных и обработки. Выберите параметр SQL Server Data Tools, чтобы включить IntelliSense SQL, выделение синтаксиса и развертывание:
Дополнительные сведения см. в статье Python в SQL Server 2017: расширенное машинное обучение в базе данных (блог).
Другие службы и пакеты SDK
Помимо рабочих нагрузок приложений для обработки и анализа данных, записные книжки в Visual Studio Code и пакете SDK Azure для Python также полезны для обработки и анализа данных.
Пакет SDK Azure для Python — это удобное средство для работы со службами Microsoft Azure из приложений Windows, Mac и Linux. Дополнительные сведения см. в статье Azure для разработчиков Python.
Расширение Jupyter можно объединить с записными книжками в Visual Studio Code для поддержки разработки Jupyter и улучшения проекта с дополнительными расширениями языка. Эта служба содержит примеры записных книжек на языках Python, R и F#, с которых можно начать работу. Дополнительные сведения см. в статье "Записные книжки" от Майкрософт и GitHub.