Utilisation de GraphFrames sur Azure Databricks

Cet article inclut des exemples de notebooks pour vous aider à commencer à utiliser GraphFrames sur Azure Databricks. GraphFrames est un package pour Apache Spark qui fournit des graphiques basés sur des dataframes. Il fournit des API de haut niveau en Java, Python et Scala. Le but est de fournir à la fois les fonctionnalités de GraphX et des fonctionnalités étendues qui tirent parti des DataFrames Spark. Cette fonctionnalité étendue comprend la recherche de motifs, la sérialisation basée sur DataFrame et les requêtes de graphe hautement expressives.

Cet article comprend trois exemples de notebooks : un notebook d’introduction disponible en Python et en Scala, ainsi qu’un guide utilisateur Python. Pour obtenir des exemples supplémentaires d’utilisation de GraphFrames avec Scala, consultez le guide d’utilisation de GraphFrames – Scala.

Recommandation Databricks Runtime pour GraphFrames

Databricks recommande d’utiliser un cluster exécutant Databricks Runtime pour le Machine Learning, car il comprend une installation optimisée de GraphFrames.

Si vous n’utilisez pas de cluster exécutant Databricks Runtime ML, téléchargez le fichier JAR à partir de la bibliothèque GraphFrames, chargez-le sur un volume et installez-le sur votre cluster.

Prise en main de GraphFrames

Les notebooks suivants vous montrent comment utiliser GraphFrames pour effectuer une analyse des graphes.

Analyse des graphiques avec GraphFrames (Python)

Obtenir le notebook

Analyse des graphes avec GraphFrames (Scala)

Obtenir le notebook

Guide d’utilisation de GraphFrames (Python)

Le notebook suivant inclut des exemples de code Python sur l’utilisation de GraphFrames.

GraphFrames, notebook Python

Obtenir le notebook