Text Analytics
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
この記事では、Machine Learning Studio (クラシック) に含まれるテキスト分析モジュールについて説明します。 これらのモジュールは、構造化テキストと非構造化テキストの両方を操作するための特殊な計算ツールを提供します。これには次が含まれます。
- テキストを前処理するための複数のオプション。
- 言語検出。
- カスタマイズ可能な n-gram 辞書を使用したテキストからの特徴の作成。
- 特徴ハッシュ。前処理や高度な言語分析を行わずにテキストを効率的に分析します。
- Vowpal Wabbit。テキストに対する非常に高速な機械学習用です。 Vowpal Wabbit では、機能ハッシュ、トピック モデリング (LDA)、分類がサポートされています。
- 名前付きエンティティ認識。非構造化テキストから人、場所、組織の名前を抽出します。
注意
適用対象: Machine Learning Studio (クラシック) のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
例
を使用したテキスト分析の例についてはMachine Learningを参照Azure AI Gallery。
ニュースの分類: 特徴ハッシュを使用して、記事を定義済みのカテゴリの一覧に分類します。
類似する会社を見つける: Wikipedia の記事のテキストを使用して企業を分類します。
テキスト分類: 感情分析 (5 部構成のサンプル) で Twitter メッセージのテキストを使用するエンドツーエンドのプロセスを示します。
モジュールの一覧
Text Analytics Studio (クラシック) の Machine Learningカテゴリには、次のモジュールが含まれています。
- 言語の検出: 入力ファイル内の各行の言語を検出します。
- テキストからキー フレーズを抽出する: 指定されたテキストからキー フレーズを抽出します。
- テキストから N-Gram の特徴を抽出する: N-Gram 辞書機能を作成し、その機能を選択します。
- 特徴ハッシュ: Vowpal Wabbit ライブラリを使用して、テキスト データを整数でエンコードされた特徴に変換します。
- Latent Dirichlet Allocation:LDA 用 Vowpal Wabbit ライブラリを使用してトピック モデリングを実行します。
- 固有表現認識: テキスト列内の名前付きエンティティを認識します。
- [テキストの前処理]: テキストに対してクリーニング操作を実行します。
- Score Vowpal Wabbit 7-4 Model(Vowpal Wabbit 7-4 モデルのスコア付け): Vowpal Wabbit 機械学習システムのバージョン 7-4 を使用して、Azure からの入力をスコア付けします。
- Score Vowpal Wabbit 7-10 Model(Vowpal Wabbit 7-10 モデルのスコア付け): Vowpal Wabbit 機械学習システムのバージョン 7 から 10 を使用して、Azure からの入力をスコア付けします。
- Score Vowpal Wabbit 8 Model(Vowpal Wabbit 8 モデルのスコア付け): Vowpal Wabbit 機械学習システムのバージョン 8 を使用して、Azure からの入力をスコア付けします。
- Vowpal Wabbit 7-4 モデルのトレーニング: Vowpal Wabbit 機械学習システムのバージョン 7-4 を使用してモデルをトレーニングします。
- Vowpal Wabbit 7-10 モデルのトレーニング: Vowpal Wabbit 機械学習システムのバージョン 7 から 10 を使用してモデルをトレーニングします。
- Vowpal Wabbit 8 モデルのトレーニング: Vowpal Wabbit 機械学習システムのバージョン 8 を使用してモデルをトレーニングします。