CACHE SELECT
Gäller för: Databricks Runtime
Kommentar
I SQL-lager eller i Databricks Runtime 14.2 och senare ignoreras funktionen CACHE SELECT
.
Cachelagrar data som nås av den angivna enkla SELECT
frågan i diskcachen.
Du kan välja en delmängd av kolumner som ska cachelagras genom att ange en lista med kolumnnamn och välja en delmängd av rader genom att ange ett predikat.
På så sätt kan efterföljande frågor undvika att skanna de ursprungliga filerna så mycket som möjligt.
Den här konstruktionen gäller endast för Delta-tabeller och Parquet-tabeller.
Vyer stöds också, men de utökade frågorna är begränsade till enkla frågor enligt beskrivningen ovan.
Syntax
CACHE SELECT column_name [, ...] FROM table_name [ WHERE boolean_expression ]
Se Diskcache jämfört med Spark-cache för skillnaderna mellan diskcachelagring och Apache Spark-cachen.
Parametrar
-
Identifierar en befintlig tabell. Namnet får inte innehålla någon temporal specifikation.
Exempel
CACHE SELECT * FROM boxes
CACHE SELECT width, length FROM boxes WHERE height=3