Azure Databricks で GraphFrames を使用する方法
この記事には、Azure Databricks で GraphFrames の使用を開始するのに役立つノートブックの例が含まれています。 GraphFrames は、DataFrame ベースのグラフを提供する Apache Spark 用のパッケージです。 Java、Python、および Scala の高レベル API が用意されています。 これは、GraphX の機能と拡張機能の両方を提供することを目的としており、Spark DataFrames の利点を活用します。 この拡張機能には、モチーフ検索、DataFrame ベースのシリアル化、非常に表現力豊かなグラフ クエリなどがあります。
この記事には、Python と Scala で使用できる入門用ノートブックと Python ユーザー ガイドの 3 つのサンプル ノートブックが含まれています。 GraphFrame と Scala を使用するその他の例については、「GraphFrames ユーザー ガイド - Scala」を参照してください。
GraphFrames の Databricks ランタイムの推奨事項
Databricks では、Databricks Runtime for Machine Learning を実行するクラスターの使用をお勧めします。これには、GraphFrames の最適化されたインストールが含まれているためです。
Databricks Runtime ML を実行しているクラスターを使用していない場合は、GraphFrames ライブラリから JAR ファイルをダウンロードし、これをボリュームに読み込み、クラスターにインストールします。
GraphFrames の概要
次のノートブックでは、GraphFrames を使用してグラフ分析を実行する方法について説明します。
GraphFrames を使用したグラフ分析 (Python)。
GraphFrames を使用したグラフ分析 (Scala)
GraphFrames ユーザー ガイド (Python)
次のノートブックには、GraphFrames の使用方法の Python コード例が含まれています。