CREATE TABLE s formátem Hive

Článek
03/01/2024

Platí pro: zaškrtnutí označeného ano Databricks Runtime

Definuje tabulku pomocí formátu Hive.

Syntaxe

CREATE [ EXTERNAL ] TABLE [ IF NOT EXISTS ] table_identifier
    [ ( col_name1[:] col_type1 [ COMMENT col_comment1 ], ... ) ]
    [ COMMENT table_comment ]
    [ PARTITIONED BY ( col_name2[:] col_type2 [ COMMENT col_comment2 ], ... )
        | ( col_name1, col_name2, ... ) ]
    [ ROW FORMAT row_format ]
    [ STORED AS file_format ]
    [ LOCATION path ]
    [ TBLPROPERTIES ( key1=val1, key2=val2, ... ) ]
    [ AS select_statement ]

row_format:
    : SERDE serde_class [ WITH SERDEPROPERTIES (k1=v1, k2=v2, ... ) ]
    | DELIMITED [ FIELDS TERMINATED BY fields_terminated_char [ ESCAPED BY escaped_char ] ]
        [ COLLECTION ITEMS TERMINATED BY collection_items_terminated_char ]
        [ MAP KEYS TERMINATED BY map_key_terminated_char ]
        [ LINES TERMINATED BY row_terminated_char ]
        [ NULL DEFINED AS null_char ]

Klauzule mezi klauzulí definice sloupce a klauzulí se mohou objevit v libovolném AS SELECT pořadí. Můžete například napsat COMMENT table_comment za TBLPROPERTIES.

Poznámka:

Musíte zadat buď klauzuli STORED AS , nebo ROW FORMAT klauzuli. V opačném případě analyzátor SQL použije syntaxi CREATE TABLE [USING] k analýze a ve výchozím nastavení vytvoří tabulku Delta.

Parametry

table_identifier

Název tabulky, volitelně kvalifikovaný s názvem schématu.

Syntax: [schema_name.] table_name
EXTERNÍ

Definuje tabulku pomocí cesty zadané v LOCATION.
DĚLENÉ PODLE

Rozdělí tabulku podle zadaných sloupců.
FORMÁT ŘÁDKU

SERDE Pomocí klauzule zadejte vlastní SerDe pro jednu tabulku. V opačném případě použijte DELIMITED klauzuli k použití nativní SerDe a zadejte oddělovač, řídicí znak, znak null atd.
SERDE

Určuje vlastní SerDe pro jednu tabulku.
serde_class

Určuje plně kvalifikovaný název třídy vlastního SerDe.
SERDEPROPERTIES

Seznam párů klíč-hodnota použitých k označení definice SerDe.
ODDĚLENÝ

Klauzuli DELIMITED lze použít k určení nativní SerDe a stav oddělovače, řídicí znak, null znak atd.
POLE UKONČENA UŽIVATELEM

Slouží k definování oddělovače sloupců.
POLOŽKY KOLEKCE UKONČENÉ UŽIVATELEM

Slouží k definování oddělovače položek kolekce.
MAPOVÉ KLÍČE UKONČENÉ POMOCÍ

Slouží k definování oddělovače klíčů mapy.
ŘÁDKY UKONČENÉ UŽIVATELEM

Slouží k definování oddělovače řádků.
HODNOTA NULL DEFINOVANÁ JAKO

Slouží k definování konkrétní hodnoty pro hodnotu NULL.
ESCAPED BY

Definujte řídicí mechanismus.
POLOŽKY KOLEKCE UKONČENÉ UŽIVATELEM

Definujte oddělovač položek kolekce.
MAPOVÉ KLÍČE UKONČENÉ POMOCÍ

Definujte oddělovač klíčů mapy.
ŘÁDKY UKONČENÉ UŽIVATELEM

Definujte oddělovač řádků.
HODNOTA NULL DEFINOVANÁ JAKO

Definujte konkrétní hodnotu pro NULL.
ULOŽENO JAKO

Formát souboru tabulky. Dostupné formáty zahrnují TEXTFILE, , RCFILESEQUENCEFILE, ORC, PARQUET, a AVRO. Alternativně můžete zadat vlastní vstupní a výstupní formáty prostřednictvím INPUTFORMAT a OUTPUTFORMAT. Pouze formáty TEXTFILE, SEQUENCEFILEa RCFILE lze použít s ROW FORMAT SERDE a pouze TEXTFILE s ROW FORMAT DELIMITED.
UMÍSTĚNÍ

Cesta k adresáři, kde jsou uložena data tabulky, což může být cesta v distribuovaném úložišti.
KOMENTÁŘ

Řetězcový literál, který popisuje tabulku.
TBLPROPERTIES

Seznam párů klíč-hodnota použitých k označení definice tabulky.
SELECT_STATEMENT AS

Naplní tabulku pomocí dat z příkazu select.

Příklady

--Use hive format
CREATE TABLE student (id INT, name STRING, age INT) STORED AS ORC;

--Use data from another table
CREATE TABLE student_copy STORED AS ORC
    AS SELECT * FROM student;

--Specify table comment and properties
CREATE TABLE student (id INT, name STRING, age INT)
    COMMENT 'this is a comment'
    STORED AS ORC
    TBLPROPERTIES ('foo'='bar');

--Specify table comment and properties with different clauses order
CREATE TABLE student (id INT, name STRING, age INT)
    STORED AS ORC
    TBLPROPERTIES ('foo'='bar')
    COMMENT 'this is a comment';

--Create partitioned table
CREATE TABLE student (id INT, name STRING)
    PARTITIONED BY (age INT)
    STORED AS ORC;

--Create partitioned table with different clauses order
CREATE TABLE student (id INT, name STRING)
    STORED AS ORC
    PARTITIONED BY (age INT);

--Use Row Format and file format
CREATE TABLE student (id INT, name STRING)
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
    STORED AS TEXTFILE;

--Use complex datatype
CREATE EXTERNAL TABLE family(
        name STRING,
        friends ARRAY<STRING>,
        children MAP<STRING, INT>,
        address STRUCT<street: STRING, city: STRING>
    )
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ESCAPED BY '\\'
    COLLECTION ITEMS TERMINATED BY '_'
    MAP KEYS TERMINATED BY ':'
    LINES TERMINATED BY '\n'
    NULL DEFINED AS 'foonull'
    STORED AS TEXTFILE
    LOCATION '/tmp/family/';

--Use predefined custom SerDe
CREATE TABLE avroExample
    ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe'
    STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat'
        OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat'
    TBLPROPERTIES ('avro.schema.literal'='{ "namespace": "org.apache.hive",
        "name": "first_schema",
        "type": "record",
        "fields": [
                { "name":"string1", "type":"string" },
                { "name":"string2", "type":"string" }
            ] }');

--Use personalized custom SerDe(we may need to `ADD JAR xxx.jar` first to ensure we can find the serde_class,
--or you may run into `CLASSNOTFOUND` exception)
ADD JAR /tmp/hive_serde_example.jar;

CREATE EXTERNAL TABLE family (id INT, name STRING)
    ROW FORMAT SERDE 'com.ly.spark.serde.SerDeExample'
    STORED AS INPUTFORMAT 'com.ly.spark.example.serde.io.SerDeExampleInputFormat'
        OUTPUTFORMAT 'com.ly.spark.example.serde.io.SerDeExampleOutputFormat'
    LOCATION '/tmp/family/';

Sdílet prostřednictvím

CREATE TABLE s formátem Hive

Syntaxe

Parametry

Příklady

Váš názor

Další materiály

Sdílet prostřednictvím

CREATE TABLE s formátem Hive

Syntaxe

Parametry

Příklady

Související příkazy

Váš názor

Další materiály