Text Analytics

重要

Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。

2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。

ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。

この記事では、Machine Learning Studio (クラシック) に含まれるテキスト分析モジュールについて説明します。 これらのモジュールは、構造化テキストと非構造化テキストの両方を操作するための特殊な計算ツールを提供します。これには次が含まれます。

  • テキストを前処理するための複数のオプション。
  • 言語検出。
  • カスタマイズ可能な n-gram 辞書を使用したテキストからの特徴の作成。
  • 特徴ハッシュ。前処理や高度な言語分析を行わずにテキストを効率的に分析します。
  • Vowpal Wabbit。テキストに対する非常に高速な機械学習用です。 Vowpal Wabbit では、機能ハッシュ、トピック モデリング (LDA)、分類がサポートされています。
  • 名前付きエンティティ認識。非構造化テキストから人、場所、組織の名前を抽出します。

注意

適用対象: Machine Learning Studio (クラシック) のみ

類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。

を使用したテキスト分析の例についてはMachine Learningを参照Azure AI Gallery

  • ニュースの分類: 特徴ハッシュを使用して、記事を定義済みのカテゴリの一覧に分類します。

  • 類似する会社を見つける: Wikipedia の記事のテキストを使用して企業を分類します。

  • テキスト分類: 感情分析 (5 部構成のサンプル) で Twitter メッセージのテキストを使用するエンドツーエンドのプロセスを示します。

モジュールの一覧

Text Analytics Studio (クラシック) の Machine Learningカテゴリには、次のモジュールが含まれています。

こちらもご覧ください