SQL Server ビッグデータクラスターのための Machine Learning ガイド

[アーティクル]
03/21/2023

適用対象: SQL Server 2019 (15.x)

この記事では、Machine Learning のシナリオに SQL Server ビッグデータクラスターを使用する方法について説明します。

重要

Microsoft SQL Server 2019 ビッグデータクラスターのアドオンは廃止されます。 SQL Server 2019 ビッグデータクラスターのサポートは、2025 年 2 月 28 日に終了します。ソフトウェアアシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグデータオプション」を参照してください。

SQL Server ビッグデータクラスターでの Machine Learning の概要

SQL Server ビッグデータクラスターを使用すると、SQL Server Machine Learning Services や Apache Spark ML というさまざまなテクノロジスタックを使用して機械学習のシナリオとソリューションを実現できます。

SQL Server ビッグデータクラスターには、確立された SQL Server Machine Learning Services テクノロジスタックを使用して SQL Server エンジン内に Machine Learning 機能が用意されており、ハイパフォーマンスなデータベース内 Machine Learning の推論とスコアリングのシナリオを実現できます。

ビッグデータベースの機械学習シナリオの場合、ビッグデータホスティングおよび Apache Spark ML の機能に対して HDFS を使用すると、よりコスト効率が高く、スケーラブルで強力になります。

Machine Learning のシナリオ

機械学習機能を使用すると、不正行為の検出、予測、チャーン、一般的な分類と回帰タスクなど、さまざまなアプリケーションとソリューションを実現できます。ただし、シナリオに最適なテクノロジを使用することが重要です。

側面	SQL Server Machine Learning サービス	Apache Spark ML
データ配置	SQL Server の表形式データの局所性を利用します。 Premium データ層。	HDFS を使用したスケーラブルなビッグデータデータ層: 非構造化データ、半構造化データ、構造化データのいずれか。
最適な用途	低待遅延推論とスコアリングのシナリオ	1. ビッグデータを基礎とする機械学習モデルの分散バッチトレーニングとスコアリング 2. ETL シンク、大規模データの準備と ML のための特徴量化
フィード	ML を利用した BI ダッシュボード、レポート、アプリケーション。低待遅延が必要	バッチでスコアリングされたデータは、SQL Server に昇格され、ML を利用したシナリオを推進することができます
Latency	低待遅延が必要	許容される待機時間が長い
詳細情報	SQL Server ビッグデータクラスターで Machine Learning Services を使用して Python および R のスクリプトを実行する	SQL Server ビッグデータクラスター上の Spark Machine Learning の概要

次のステップ

詳細については、「SQL Server ビッグデータクラスターの概要」を参照してください。

次の方法で共有

SQL Server ビッグデータクラスターのための Machine Learning ガイド

SQL Server ビッグデータクラスターでの Machine Learning の概要

Machine Learning のシナリオ

次のステップ

フィードバック

その他のリソース

次の方法で共有

SQL Server ビッグ データ クラスターのための Machine Learning ガイド

SQL Server ビッグ データ クラスターでの Machine Learning の概要

Machine Learning のシナリオ

次のステップ

フィードバック

その他のリソース

SQL Server ビッグデータクラスターのための Machine Learning ガイド

SQL Server ビッグデータクラスターでの Machine Learning の概要