SQL Server ビッグ データ クラスターのための Machine Learning ガイド

適用対象: SQL Server 2019 (15.x)

この記事では、Machine Learning のシナリオに SQL Server ビッグ データ クラスター を使用する方法について説明します。

重要

Microsoft SQL Server 2019 ビッグ データ クラスターのアドオンは廃止されます。 SQL Server 2019 ビッグ データ クラスターのサポートは、2025 年 2 月 28 日に終了します。 ソフトウェア アシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。 詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグ データ オプション」を参照してください。

SQL Server ビッグ データ クラスターでの Machine Learning の概要

SQL Server ビッグ データ クラスター を使用すると、SQL Server Machine Learning ServicesApache Spark ML というさまざまなテクノロジ スタックを使用して機械学習のシナリオとソリューションを実現できます。

SQL Server ビッグ データ クラスター には、確立された SQL Server Machine Learning Services テクノロジ スタックを使用して SQL Server エンジン内に Machine Learning 機能が用意されており、ハイ パフォーマンスなデータベース内 Machine Learning の推論とスコアリングのシナリオを実現できます。

ビッグ データ ベースの機械学習シナリオの場合、ビッグ データ ホスティングおよび Apache Spark ML の機能に対して HDFS を使用すると、よりコスト効率が高く、スケーラブルで強力になります。

Machine Learning のシナリオ

機械学習機能を使用すると、不正行為の検出、予測、チャーン、一般的な分類と回帰タスクなど、さまざまなアプリケーションとソリューションを実現できます。 ただし、シナリオに最適なテクノロジを使用することが重要です。

側面 SQL Server Machine Learning サービス Apache Spark ML
データ配置 SQL Server の表形式データの局所性を利用します。 Premium データ層。 HDFS を使用したスケーラブルなビッグ データ データ層: 非構造化データ、半構造化データ、構造化データのいずれか。
最適な用途 低待遅延推論とスコアリングのシナリオ 1. ビッグ データを基礎とする機械学習モデルの分散バッチ トレーニングとスコアリング
2. ETL シンク、大規模データの準備と ML のための特徴量化
フィード ML を利用した BI ダッシュボード、レポート、アプリケーション。 低待遅延が必要 バッチでスコアリングされたデータは、SQL Server に昇格され、ML を利用したシナリオを推進することができます
Latency 低待遅延が必要 許容される待機時間が長い
詳細情報 SQL Server ビッグ データ クラスターで Machine Learning Services を使用して Python および R のスクリプトを実行する SQL Server ビッグ データ クラスター上の Spark Machine Learning の概要

次のステップ

詳細については、「SQL Server ビッグ データ クラスターの概要」を参照してください。