CACHE TABLE

S’applique à : coche marquée oui Databricks Runtime

Met en cache le contenu d’une table ou d’une sortie de requête avec le niveau de stockage donné dans un cache Apache Spark. Si une requête est mise en cache, un affichage temporaire est créé pour cette requête. Cela réduit la charge d’analyse des fichiers d’origine dans les requêtes ultérieures.

Syntaxe

CACHE [ LAZY ] TABLE table_name
  [ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]

Pour connaître les différences entre la mise en cache sur disque et le cache Apache Spark, consultez Cache de disque par rapport à la mise en cache Spark.

Paramètres

  • LAZY

    Mettre la table en cache uniquement lors de sa première utilisation, plutôt qu’immédiatement.

  • table_name

    Identifie la table ou vue Delta à mettre en cache. Le nom ne doit pas inclure de spécification temporelle ou de spécification d’options. Si la table est introuvable, Azure Databricks génère une erreur TABLE_OR_VIEW_NOT_FOUND.

  • OPTIONS ( ‘storageLevel’ [ = ] value )

    Clause OPTIONS avec paire clé/valeur storageLevel. Un avertissement est émis lorsqu’une clé autre que storageLevel est utilisée. Les options valides pour storageLevel sont les suivantes :

    • NONE
      • DISK_ONLY
      • DISK_ONLY_2
      • MEMORY_ONLY
      • MEMORY_ONLY_2
      • MEMORY_ONLY_SER
      • MEMORY_ONLY_SER_2
      • MEMORY_AND_DISK
      • MEMORY_AND_DISK_2
      • MEMORY_AND_DISK_SER
      • MEMORY_AND_DISK_SER_2
      • OFF_HEAP

    Une exception est levée quand une valeur non valide est définie pour storageLevel. Si storageLevel n’est pas défini explicitement à l’aide de la clause OPTIONS, la valeur par défaut storageLevel est MEMORY_AND_DISK.

  • query

    Requête produisant les lignes à mettre en cache. Les formats possibles sont les suivants :

    • Instruction SELECT
    • Instruction TABLE
    • Instruction FROM

Exemples

> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;