SQL Server ビッグ データ クラスターのマスター プールとは

適用対象: SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 ビッグ データ クラスターのアドオンは廃止されます。 SQL Server 2019 ビッグ データ クラスターのサポートは、2025 年 2 月 28 日に終了します。 ソフトウェア アシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。 詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグ データ オプション」を参照してください。

この記事では、SQL Server ビッグ データ クラスターでの "SQL Server マスター インスタンス" の役割について説明します。 マスター プールには、SQL Server のマスター インスタンスが含まれます。 マスター インスタンスとは、SQL Server ビッグ データ クラスターで実行される SQL Server インスタンスです。 マスター インスタンスでは、接続、スケールアウト クエリ、メタデータとユーザー データベース、機械学習サービスが管理されます。

SQL Server マスター インスタンスには、次の機能があります。

接続

SQL Server マスター インスタンスにより、クラスターに対して、外部からアクセスできる TDS エンドポイントが提供されます。 他の SQL Server インスタンスと同様に、アプリケーションまたは Azure Data Studio や SQL Server Management Studio などの SQL Server ツールをこのエンドポイントに接続できます。

クエリの管理をスケールアウトする

SQL Server マスター インスタンスには、コンピューティング プール内のノード上の SQL Server インスタンス間でクエリを分散するために使用されるスケールアウト クエリ エンジンが含まれています。 スケールアウト クエリ エンジンでは、追加の構成を必要とせずに、Transact-SQL を使用してクラスター内のすべての Hive テーブルにアクセスすることもできます。

メタデータとユーザー データベース

SQL マスター インスタンスには、標準の SQL Server システム データベースに加えて、次が含まれます。

  • HDFS テーブルのメタデータを格納するメタデータ データベース。
  • データ プレーンのシャード マップ。
  • クラスター データ プレーンへのアクセスを提供する外部テーブルの詳細情報
  • ユーザー データベースで定義されている PolyBase 外部データ ソースと外部テーブル

また、独自のユーザー データベースを SQL Server マスター インスタンスに追加することもできます。

Machine Learning Services

SQL Server Machine Learning サービス機能は、データベース エンジンのアドオン機能です。 SQL Server で Java、R、および Python コードを実行するために使用する、機械学習の機能です。 この機能は SQL Server 機能拡張フレームワークに基づいています。これにより、外部プロセスがコア エンジン プロセスから分離されますが、ストアド プロシージャとして、R または Python ステートメントを含む T-SQL スクリプトとして、あるいは、T-SQL を含む Java、R、または Python コードとして、リレーショナル データと完全に統合されます。

Machine Learning Services は、SQL Server ビッグ データ クラスターの一部として既定により SQL Server マスター インスタンス上で使用できるようになります。 SQL Server マスター インスタンス上で外部スクリプトを実行できるようになると、sp_execute_external_script を使用して Java、R、Python スクリプトを実行できるようになります。

ビッグ データ クラスターでの Machine Learning Services の利点

SQL Server ビッグ データ クラスター を使用すると、通常はエンタープライズ データベースに格納されているディメンション データにビッグ データを簡単に結合できます。 ビッグ データの価値は、組織の一部で管理されているだけでなく、レポート、ダッシュボード、アプリケーションに取り込むことも行われた場合に、大幅に増加します。 同時に、データ科学者は引き続き Spark/HDFS エコシステム ツールを使用して、SQL Server マスター インスタンス内のデータと、SQL Server マスター インスタンスを "経由して" アクセス可能な外部データ ソースに、リアルタイムで簡単にアクセスできます。

SQL Server ビッグ データ クラスターを使用すると、エンタープライズ データ レイクでさらに多くのことを行うことができます。 SQL Server 開発者とアナリストは次のことができます。

  • エンタープライズ データ レイクにあるデータを消費するアプリケーションを構築する。
  • Transact-SQL クエリを使用して、すべてのデータについて推論する。
  • SQL Server のツールとアプリケーションからなる既存のエコシステムを使用して、エンタープライズ データにアクセスして分析する。
  • データの仮想化とデータ マートにより、データ移動の必要性を削減する。
  • ビッグ データのシナリオ用に引き続き Spark を使用する。
  • Spark または SQL Server を使用してインテリジェントなエンタープライズ アプリケーションを構築し、データ レイクでモデルをトレーニングする。
  • 最適なパフォーマンスを得るために、実稼働データベースでモデルを運用化する。
  • リアルタイム分析のために、エンタープライズ データ マートにデータを直接ストリーミングする。
  • 対話型分析と BI ツールを使用して、データを視覚的に探索する。

次のステップ

SQL Server ビッグ データ クラスター の詳細については、次のリソースを参照してください。