- Apache Tajo 教程
- Apache Tajo - 主页
- Apache Tajo - 简介
- Apache Tajo - 架构
- Apache Tajo - 安装
- Apache Tajo - 配置设置
- Apache Tajo - Shell 命令
- Apache Tajo - 数据类型
- Apache Tajo - 操作员
- Apache Tajo - SQL 函数
- Apache Tajo - 数学函数
- Apache Tajo - 字符串函数
- Apache Tajo - 日期时间函数
- Apache Tajo - JSON 函数
- Apache Tajo - 数据库创建
- Apache Tajo - 表管理
- Apache Tajo - SQL 语句
- 聚合和窗口函数
- Apache Tajo - SQL 查询
- Apache Tajo - 存储插件
- 与 HBase 集成
- Apache Tajo - 与 Hive 集成
- OpenStack Swift 集成
- Apache Tajo - JDBC 接口
- Apache Tajo - 自定义函数
- Apache Tajo 有用资源
- Apache Tajo - 快速指南
- Apache Tajo - 有用的资源
- Apache Tajo - 讨论
Apache Tajo - OpenStack Swift 集成
Swift 是一个分布式且一致的对象/blob 存储。Swift 提供云存储软件,以便您可以通过简单的 API 存储和检索大量数据。Tajo 支持 Swift 集成。
以下是 Swift Integration 的先决条件 -
- 迅速
- Hadoop
核心站点.xml
将以下更改添加到 hadoop“core-site.xml”文件中 -
<property> <name>fs.swift.impl</name> <value>org.apache.hadoop.fs.swift.snative.SwiftNativeFileSystem</value> <description>File system implementation for Swift</description> </property> <property> <name>fs.swift.blocksize</name> <value>131072</value> <description>Split size in KB</description> </property>
这将用于 Hadoop 访问 Swift 对象。完成所有更改后,移动到 Tajo 目录以设置 Swift 环境变量。
conf/tajo-env.h
打开 Tajo 配置文件并添加设置环境变量,如下所示 -
$ vi conf/tajo-env.h export TAJO_CLASSPATH = $HADOOP_HOME/share/hadoop/tools/lib/hadoop-openstack-x.x.x.jar
现在,Tajo 将能够使用 Swift 查询数据。
创建表
让我们创建一个外部表来访问 Tajo 中的 Swift 对象,如下所示 -
default> create external table swift(num1 int, num2 text, num3 float) using text with ('text.delimiter' = '|') location 'swift://bucket-name/table1';
创建表后,您可以运行 SQL 查询。