- Apache Tajo 教程
- Apache Tajo - 主页
- Apache Tajo - 简介
- Apache Tajo - 架构
- Apache Tajo - 安装
- Apache Tajo - 配置设置
- Apache Tajo - Shell 命令
- Apache Tajo - 数据类型
- Apache Tajo - 操作员
- Apache Tajo - SQL 函数
- Apache Tajo - 数学函数
- Apache Tajo - 字符串函数
- Apache Tajo - 日期时间函数
- Apache Tajo - JSON 函数
- Apache Tajo - 数据库创建
- Apache Tajo - 表管理
- Apache Tajo - SQL 语句
- 聚合和窗口函数
- Apache Tajo - SQL 查询
- Apache Tajo - 存储插件
- 与 HBase 集成
- Apache Tajo - 与 Hive 集成
- OpenStack Swift 集成
- Apache Tajo - JDBC 接口
- Apache Tajo - 自定义函数
- Apache Tajo 有用资源
- Apache Tajo - 快速指南
- Apache Tajo - 有用的资源
- Apache Tajo - 讨论
Apache Tajo - 自定义函数
Apache Tajo 支持自定义/用户定义函数 (UDF)。可以在 python 中创建自定义函数。
自定义函数只是带有装饰器“@output_type(<tajo sql datatype>)”的普通 python 函数,如下所示 -
@ouput_type(“integer”) def sum_py(a, b): return a + b;
可以通过在“tajosite.xml”中添加以下配置来注册带有 UDF 的 python 脚本。
<property> <name>tajo.function.python.code-dir</name> <value>file:///path/to/script1.py,file:///path/to/script2.py</value> </property>
注册脚本后,重新启动集群,UDF 将在 SQL 查询中可用,如下所示 -
select sum_py(10, 10) as pyfn;
Apache Tajo 也支持用户定义的聚合函数,但不支持用户定义的窗口函数。