Skip to main content

Hudi Connector介绍

GeaFlow Hudi 目前支持从文件中读取数据。

语法

CREATE TABLE IF NOT EXISTS hudi_person (
id BIGINT,
name VARCHAR
) WITH (
type='hudi',
geaflow.file.persistent.config.json = '{\'fs.defaultFS\':\'namenode:9000\'}',
geaflow.dsl.file.path='/path/to/hudi_person'
);

参数

参数名是否必须描述
geaflow.dsl.file.path读取或写入的文件或文件夹的路径
geaflow.file.persistent.config.jsonJSON格式的DFS配置,会覆盖系统环境配置。

示例

set geaflow.dsl.window.size = -1;

CREATE TABLE IF NOT EXISTS hudi_person (
id BIGINT,
name VARCHAR
) WITH (
type='hudi', -- hdfs 配置,也可通过HADOOP_HOME环境变量获取
`geaflow.file.persistent.config.json` = '{\'fs.defaultFS\':\'namenode:9000\'}',
geaflow.dsl.file.path='/path/to/hudi_person'
);

CREATE TABLE IF NOT EXISTS hudi_sink (
id BIGINT,
name VARCHAR
) WITH (
type='hudi', -- hdfs 配置,也可通过HADOOP_HOME环境变量获取
`geaflow.file.persistent.config.json` = '{\'fs.defaultFS\':\'namenode:9000\'}',
geaflow.dsl.file.path='/path/to/hudi_sink'
);

INSERT INTO hudi_sink
SELECT * FROM hudi_person;