CACHE SELECT

S’applique à : coche marquée oui Databricks Runtime

Remarque

Sur les entrepôts SQL ou dans Databricks Runtime 14.2 et ultérieur, la fonction CACHE SELECT est ignorée.

Met en cache les données accessibles par la requête simple SELECT spécifiée dans le cache Delta. Vous pouvez choisir un sous-ensemble de colonnes à mettre en cache en fournissant une liste de noms de colonnes et choisir un sous-ensemble de lignes en fournissant un prédicat. Cela permet aux requêtes suivantes d’éviter autant que possible d’analyser les fichiers d’origine. Cette construction s’applique uniquement aux tables Delta et Parquet. Les vues sont également prises en charge, mais les requêtes développées sont limitées aux requêtes simples, comme décrit ci-dessus.

Syntaxe

CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]

Pour connaître les différences entre la mise en cache sur disque et le cache Apache Spark, consultez Cache de disque par rapport à la mise en cache Spark.

Paramètres

  • table_name

    Identifie une table existante. Le nom ne doit pas inclure de spécification temporelle ou de spécification d’options.

Exemples

CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3