HCatalog - 创建表


本章介绍如何创建表以及如何向其中插入数据。在 HCatalog 中创建表的约定与使用 Hive 创建表非常相似。

创建表语句

Create Table 是用于使用 HCatalog 在 Hive Metastore 中创建表的语句。其语法和示例如下 -

句法

CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.] table_name
[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[ROW FORMAT row_format]
[STORED AS file_format]

例子

让我们假设您需要使用CREATE TABLE语句创建一个名为employee的表。下表列出了员工表中的字段及其数据类型-

先生编号 字段名称 数据类型
1 开斋节 整数
2 姓名 细绳
3 薪水 漂浮
4 指定 细绳

以下数据定义了受支持的字段(例如注释)、行格式字段(例如字段终止符行终止符存储文件类型)

COMMENT ‘Employee details’
FIELDS TERMINATED BY ‘\t’
LINES TERMINATED BY ‘\n’
STORED IN TEXT FILE

以下查询使用上述数据创建一个名为employee的表。

./hcat –e "CREATE TABLE IF NOT EXISTS employee ( eid int, name String, 
   salary String, destination String) \
COMMENT 'Employee details' \
ROW FORMAT DELIMITED \
FIELDS TERMINATED BY ‘\t’ \
LINES TERMINATED BY ‘\n’ \
STORED AS TEXTFILE;"

如果添加选项IF NOT EXISTS,HCatalog 会在表已存在的情况下忽略该语句。

成功创建表后,您将看到以下响应 -

OK
Time taken: 5.905 seconds

加载数据语句

一般来说,在SQL中创建表后,我们可以使用Insert语句插入数据。但在 HCatalog 中,我们使用 LOAD DATA 语句插入数据。

在向HCatalog插入数据时,最好使用LOAD DATA来存储批量记录。加载数据有两种方式:一是从本地文件系统加载,二是从Hadoop文件系统加载

句法

加载数据的语法如下 -

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename
[PARTITION (partcol1=val1, partcol2=val2 ...)]
  • LOCAL 是指定本地路径的标识符。它是可选的。
  • OVERWRITE 是可选的,用于覆盖表中的数据。
  • 分区是可选的。

例子

我们将向表中插入以下数据。它是/home/user目录中名为sample.txt 的文本文件。

1201  Gopal        45000    Technical manager
1202  Manisha      45000    Proof reader
1203  Masthanvali  40000    Technical writer
1204  Kiran        40000    Hr Admin
1205  Kranthi      30000    Op Admin

以下查询将给定文本加载到表中。

./hcat –e "LOAD DATA LOCAL INPATH '/home/user/sample.txt'
OVERWRITE INTO TABLE employee;"

下载成功后,您会看到以下响应 -

OK
Time taken: 15.905 seconds