Databricks ノートブックでの視覚化
Azure Databricks には、Databricks SQL とノートブックの両方にグラフと視覚化の組み込みのサポートがあります。 このページでは、Databricks ノートブックで視覚化を操作する方法について説明します。 Databricks SQL で視覚化を使用する方法については、「Databricks SQL での視覚化」を参照してください。
視覚化の種類については、視覚化の種類に関するページを参照してください。
新しい視覚化を作成する
このセクションの例を再作成するには、次のコードを使用します。
sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)
視覚化を作成するには、結果の上にある [+] をクリックし、[視覚化] を選択します。 視覚エフェクト エディターが表示されます。
[視覚化の種類] ドロップダウンで、種類を選択します。
視覚エフェクトに表示するデータを選択します。 使用可能なフィールドは、選択したタイプによって異なります。
[保存] をクリックします。
新しいデータ プロファイルを作成する
Note
Databricks Runtime 9.1 LTS 以降で使用できます。
データ プロファイルには、Apache Spark DataFrame、pandas DataFrame、または SQL テーブルの概要統計情報が表形式とグラフィック形式で表示されます。 結果セルからデータ プロファイルを作成するには、[+] をクリックし、[データ プロファイル] を選択します。
Azure Databricks は、概要統計を計算して表示します。
- 数値とカテゴリの機能は、別のテーブルに表示されます。
- タブの上部で、機能を並べ替えまたは検索できます。
- グラフの列の上部に、ヒストグラム (Standard) または分位点を表示できます。
- [展開] をオンにし、グラフを拡大します。
- [ログ] をオンにし、ログ スケールでグラフを表示します。
- グラフの上にカーソルを置くと、ヒストグラム列の境界や、その中の行数、分位点の値など、より詳細な情報を確認できます。
プログラムでデータ プロファイルを生成することもできます。集計コマンド (dbutils.data.summarize) を参照してください。
視覚化とデータ プロファイルを操作する
Note
データ プロファイルは、Databricks Runtime 9.1 LTS 以降で使用できます。
視覚エフェクトまたはデータ プロファイルの名前変更、複製、または削除
視覚化またはデータ プロファイルの名前を変更、複製、または削除するには、タブ名の右側にある下向き矢印をクリックします。 メニューからダッシュボードを作成することもできます。
Note
セルにデータ プロファイルが含まれている場合、関連付けられている視覚化とデータ プロファイルはノートブック ダッシュボードにのみ追加できます。 視覚化のみを含むセルの場合、ドロップダウンに [ダッシュボードに追加] メニュー項目 が追加で表示されます。 「ダッシュボードに視覚エフェクトを追加する」を参照してください。
名前を直接クリックして、その名前を編集して変更することもできます。
視覚化を編集する
視覚エフェクトの下にある をクリックして、視覚エフェクト エディターを開きます。 変更が完了したら、[保存] をクリックします。
色を編集する
視覚化の色は、視覚化の作成時または編集時にカスタマイズできます。
- 視覚化を作成または編集します。
- [色] をクリックします。
- 色を変更するには、四角形をクリックし、次のどちらかの操作を行って新しい色を選択します。
- カラー セレクターで色をクリックする。
- 16 進数値を入力する。
- カラー セレクターの外側の任意の場所をクリックして閉じます。
- 視覚エフェクト エディターで [保存] をクリックして、変更を保存します。
系列の選択
グラフで分析する特定の系列を選択するには、次のコマンドを使用します。
- 1 つの凡例項目をクリックしてその系列を選択します
- Cmd/Ctrl キーを押しながら凡例項目をクリックして、複数の系列を選択または選択解除する
ヒントの並べ替え
折れ線グラフと非積み上げ横棒グラフのツールヒントを大きさ順に並べ替えると、分析が簡単になります。
ズーム
データ密度の高いグラフの場合、個々のデータ ポイントを拡大すると、詳細を調査したり、外れ値をトリミングしたりするのに役立ちます。 グラフを拡大するには、キャンバスをクリックしてドラッグします。 ズームをクリアするには、キャンバスの上にマウス ポインターを合わせ、視覚化の右上隅にある [ズーム のクリア] ボタンをクリックします。
拡大
視覚エフェクトを PNG ファイルとしてダウンロードする
視覚エフェクトを PNG ファイルとしてダウンロードするには、キャンバスの上にマウス ポインターを置き、右上隅にあるダウンロード アイコンをクリックします。
png ファイルがデバイスにダウンロードされます。
ダッシュボードに視覚エフェクトを追加する
- タブ名の右側にある下向き矢印をクリックします。
- [ダッシュボードに追加] を選択します。 使用可能なダッシュボード ビューの一覧が、メニュー オプションの [新しいダッシュボードに追加] と共に表示されます。
- ダッシュボードを選択するか、[新しいダッシュボードに追加] を選択します。 新しく追加された視覚化を含むダッシュボードが表示されます。
レガシ視覚エフェクト
グラフの視覚化の最新バージョンは、既定でオンになっています。 このセクションの設定では、古いグラフを操作するとき、または最新バージョンがオフになっている場合に発生する可能性がある従来の視覚化について説明します。
視覚化ツール
グラフの右上にカーソルを合わせると、Plotly ツールバーが表示され、選択、ズーム、パンなどの操作ができます。
視覚エフェクトをダウンロードする
視覚エフェクトを .png 形式でダウンロードするには、ノートブック セルまたは視覚エフェクト エディターでカメラ アイコン をクリックします。
結果のセルの上にカーソルを移動すると、セルの右上にカメラ アイコンが表示されます。
視覚エフェクト エディターでは、グラフの上にカーソルを移動すると、カメラ アイコンが表示されます。 「視覚エフェクト ツール」を参照してください。
1 つの系列を一時的に非表示または表示する
視覚化で 1 つの系列を非表示にするには、凡例内でその系列をクリックします。 系列をもう一度表示するには、凡例内でそれをもう一度クリックします。
1 つの系列のみを表示するには、凡例内でその系列をダブルクリックします。 他の系列を表示するには、各系列をクリックします。