CACHE SELECT
S’applique à : Databricks Runtime
Remarque
Sur les entrepôts SQL ou dans Databricks Runtime 14.2 et ultérieur, la fonction CACHE SELECT
est ignorée.
Met en cache les données accessibles par la requête simple SELECT
spécifiée dans le cache Delta.
Vous pouvez choisir un sous-ensemble de colonnes à mettre en cache en fournissant une liste de noms de colonnes et choisir un sous-ensemble de lignes en fournissant un prédicat.
Cela permet aux requêtes suivantes d’éviter autant que possible d’analyser les fichiers d’origine.
Cette construction s’applique uniquement aux tables Delta et Parquet.
Les vues sont également prises en charge, mais les requêtes développées sont limitées aux requêtes simples, comme décrit ci-dessus.
Syntaxe
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Pour connaître les différences entre la mise en cache sur disque et le cache Apache Spark, consultez Cache de disque par rapport à la mise en cache Spark.
Paramètres
-
Identifie une table existante. Le nom ne doit pas inclure de spécification temporelle ou de spécification d’options.
Exemples
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3