Skip to main content

File Connector介绍

GeaFlow 支持从文件中读取数据,也支持向文件写入数据。

语法

CREATE TABLE file_table (
id BIGINT,
name VARCHAR,
age INT
) WITH (
type='file',
geaflow.dsl.file.path = '/path/to/file'
)

参数

参数名是否必须描述
geaflow.file.persistent.config.jsonJSON格式的DFS配置,会覆盖系统环境配置。
geaflow.dsl.file.path读取或写入的文件或文件夹的路径
geaflow.dsl.column.separator用于将文本分割为列的列分隔符。默认值为英文逗号','。
geaflow.dsl.line.separator用于将文本分割为列的行分隔符。默认值为换行符'\n'。
geaflow.dsl.file.name.regex读取文件名称正则过滤规则,默认为空。
geaflow.dsl.file.format读写文件格式,支持parquet、txt,默认为txt。

示例

CREATE TABLE file_source (
id BIGINT,
name VARCHAR,
age INT
) WITH (
type='file',
geaflow.dsl.file.path = '/path/to/file'
);

CREATE TABLE file_sink (
id BIGINT,
name VARCHAR,
age INT
) WITH (
type='file',
geaflow.dsl.file.path = '/path/to/file'
);

INSERT INTO file_sink
SELECT * FROM file_source;