¿Qué son Machine Learning Server (independiente) o R Server en SQL Server?

Se aplica a: SQL Server 2016 (13.x) y versiones posteriores

Importante

La compatibilidad con Machine Learning Server (anteriormente conocido como R Server) finalizó el 1 de julio de 2022. Para obtener más información, consulte ¿Qué sucederá con Machine Learning Server?

SQL Server proporciona soporte de instalación para un servidor R Server o Machine Learning Server independiente que se ejecuta independientemente de SQL Server. En función de la versión de SQL Server, un servidor independiente tiene una base de R de código abierto y posiblemente de Python, superpuestas con bibliotecas de alto rendimiento de Microsoft que agregan análisis predictivos y estadísticos a escala. Las bibliotecas también permiten realizar tareas de aprendizaje automático con scripts en R o Python.

En SQL Server 2016, esta característica se denomina R Server (independiente) y es de solo R. En SQL Server 2017 se denomina Machine Learning Server (independiente) e incluye R y Python.

Nota:

Tal y como se instala con el programa de instalación de SQL Server, un servidor independiente es funcionalmente equivalente a las versiones que no son de la marca SQL de Microsoft Machine Learning Server y admite los mismos escenarios de usuario, como la ejecución remota, la operacionalización y los servicios web, así como la colección completa de bibliotecas de R y Python.

Componentes

SQL Server 2016 solo admite R. SQL Server 2017 admite R y Python. En la tabla siguiente se indican las características de cada versión.

Componente Descripción
Paquetes de R RevoScaleR es la biblioteca principal para R escalable con funciones para la manipulación, transformación, visualización y análisis de datos.
MicrosoftML agrega algoritmos de aprendizaje automático para crear modelos personalizados dedicados al análisis de texto, imágenes y opiniones.
sqlRUtils proporciona funciones del asistente para colocar scripts de R en un procedimiento almacenado de T-SQL, registrar dicho procedimiento almacenado en una base de datos y ejecutarlo desde un entorno de desarrollo de R.
olapr es para especificar consultas MDX en R.
Microsoft R Open (MRO) Microsoft R Open (retirado) era la distribución de código abierto de Microsoft de R.
Herramientas de R Las ventanas de la consola de R y los símbolos del sistema son herramientas estándar en una distribución de R. Podrá encontrarlos en \Archivos de programa\Microsoft SQL Server\140\ R_SERVER\bin\x64.
Ejemplos de R y scripts Los paquetes de código abierto de R y RevoScaleR incluyen conjuntos de datos integrados para que pueda crear y ejecutar scripts con datos preinstalados. Podrá buscarlos en \Archivos de programa\Microsoft SQL Server\140\ R_SERVER\library\datasets y \library\RevoScaleR.
Paquetes de Python revoscalepy es la biblioteca principal para Python escalable con funciones para la manipulación, transformación, visualización y análisis de datos.
microsoftml agrega algoritmos de aprendizaje automático para crear modelos personalizados dedicados al análisis de texto, imágenes y opiniones.
Herramientas de Python: La herramienta integrada de línea de comandos de Python es útil para las pruebas y tareas ad hoc. Podrá encontrar la herramienta en \Archivos de programa\Microsoft SQL Server\140\PYTHON_SERVER\python.exe.
Anaconda Anaconda es una distribución de código abierto de Python y paquetes esenciales.
Ejemplos de Python y scripts Al igual que con R, Python incluye scripts y conjuntos de datos integrados. Podrá encontrar los datos de revoscalepy en \Archivos de programa\Microsoft SQL Server\140\PYTHON_SERVER\bib\site-packages\revoscalepy\data\sample-data.
Modelos previamente entrenados en R y Python Los modelos previamente entrenados se crean para casos de uso específicos y los mantiene el equipo de ingeniería de ciencia de datos de Microsoft. Puede usar los modelos previamente entrenados tal cual para puntuar la opinión positiva-negativa en el texto o para detectar características en las imágenes, con las nuevas entradas de datos que proporcione. Los modelos previamente entrenados se admiten y se pueden usar en un servidor independiente, pero no se pueden instalar a través del programa de instalación de SQL Server. Para obtener más información, vea Instalación de modelos de aprendizaje automático previamente entrenados en SQL Server.

Uso de un servidor independiente

Los desarrolladores de R y Python suelen elegir un servidor independiente para moverse más allá de la memoria y las restricciones de procesamiento de R y Python de código abierto. Las bibliotecas de R y Python que se ejecutan en un servidor independiente pueden cargar y procesar grandes cantidades de datos en varios núcleos y agregar los resultados en una sola salida consolidada. Las funciones de alto rendimiento están diseñadas para la escala y la utilidad: ofrecen un análisis predictivo, modelos estadísticos, visualizaciones de datos y algoritmos de aprendizaje automático de vanguardia en un producto de servidor comercial con ingeniería y soporte técnico de Microsoft.

Como servidor independiente desacoplado de SQL Server, la configuración, la protección y el acceso del entorno de R y Python se realizan mediante el sistema operativo subyacente y las herramientas estándar proporcionadas en el servidor independiente, y no mediante SQL Server. No hay compatibilidad integrada para los datos relacionales de SQL Server. Si quiere utilizar datos de SQL Server, puede crear objetos y conexiones de origen de datos como lo haría con cualquier cliente.

Como complemento a SQL Server, un servidor independiente también es útil como un entorno de desarrollo eficaz si necesita equipos locales y remotos. Los paquetes de R y Python en un servidor independiente son los mismos que los que se proporcionan con una instalación del motor de base de datos, lo que permite la portabilidad del código y el cambio de contexto de cálculo.

Introducción

Comience con el programa de instalación, adjunte los binarios a su herramienta de desarrollo favorita y escriba el primer script.

Paso 1: Instalar el software

Instale una de estas versiones:

Paso 2: Configurar una herramienta de desarrollo

En un servidor independiente, es habitual trabajar localmente con un desarrollo instalado en el mismo equipo.

Paso 3: escritura del primer script

Escriba el script de R o Python con las funciones de RevoScaleR, revoscalepy y los algoritmos de aprendizaje automático.

  • Exploración de R y ScaleR en 25 funciones: Comience con comandos de R básicos y, a continuación, avance hasta las funciones analíticas de RevoScaleR distribuibles que proporcionan alto rendimiento y escalabilidad para soluciones de R. Incluye versiones que se pueden usar en parelelo de muchos de los paquetes de R más conocidos, como agrupación en clústeres k-means, árboles y bosques de decisión, y herramientas para la manipulación de datos.

  • Inicio rápido: Un ejemplo de clasificación binaria con el paquete de Python de microsoftml: Cree un modelo de clasificación binaria con las funciones de microsoftml y el conocido conjunto de datos de cáncer de mama.

Elija el mejor lenguaje para la tarea. R es la mejor opción para los cálculos estadísticos que son difíciles de implementar mediante SQL. En el caso de las operaciones basadas en conjuntos sobre datos, aproveche la potencia de SQL Server para obtener el máximo rendimiento. Use el motor de base de datos en memoria para cálculos muy rápidos en columnas.

Paso 4: puesta en funcionamiento de la solución

Los servidores independientes pueden usar la funcionalidad de operacionalización de Microsoft Machine Learning Server que no son de la marca SQL. Puede configurar un servidor independiente para la operacionalización, lo que le ofrece estas ventajas: implementar y hospedar el código como servicios web, ejecutar diagnósticos y probar la capacidad del servicio web.

Paso 5: mantenimiento del servidor

SQL Server publica actualizaciones acumulativas periódicamente. La aplicación de las actualizaciones acumulativas agrega mejoras funcionales y de seguridad a una instalación existente.

Puede encontrar descripciones de la funcionalidad nueva o modificada en el artículo descargas de CAB y en las páginas web de las actualizaciones acumulativas de SQL Server 2016 y las actualizaciones acumulativas de SQL Server 2017.

Para obtener más información sobre cómo aplicar las actualizaciones a una instancia existente, vea Aplicación de actualizaciones en las instrucciones de instalación.

Consulte también

Instalación de R Server (independiente) o Machine Learning Server (independiente)