数据对接—kettle使用之七

简介:

上一篇介绍了数据输入的插件,这一篇介绍一下数据输出的插件,类似数据输入,输出的插件也有很多,可以将数据输出到文本文件,excel文件,xml文件,还可以根据sql语句删除数据库表里的数据,也可以使用插入/更新插件insert或update数据库表里的指定字段,下面先来看几个输出的插件:

插入/更新

1、  步骤名称:要写入数据的表的schema名称。

2、  commit size:提交之前要改变的行数(插入/更新)。

3、  不执行任何更新:如果被选择,则不执行任何更新,只允许插入。

4、  用来查询的关键字:可以指定字段值或者比较符。可以用以下比较符:>、>=、=、<>、<、<=、between、like、is null、is not null

5、  用来查询的关键字:输入用来指定记录的关键字。

6、  更新字段:指定想要插入/更新的字段。

备注:还有一个更新的插件,它只能执行更新操作,完全可以由这个插件来代替

删除

执行删除操作。

注意:在输出中,插入/更新、删除、更新对应的是数据库的增、删、改。

Excel输出

利用这个步骤,可以写入数据到一个或者多个文件中。

1、  文件名和扩展名:可以使用变量。

2、  头部、尾部:给文件添加头部和尾部。

3、  Split every…rows:分割数据到几个输出文件中。

4、  Use template:使用模板

5、  追加excel模板:是否将Excel输出添加到指定的Excel模板中。

Access输出

1、  数据库名:注意要写入扩展名,否则输出的文件名不包含扩展名”.mdb

2、  创建数据库:选中则创建数据库。

3、  Target table:表名。

4、  Create table:选中则创建数据表。

5、  Commit size:定义输出数据时的提交尺寸。

XML输出

1、  文件名中包含步骤号码:如果你在多个拷贝中运行一个步骤,在文件扩展名的前面,将包含拷贝的号码。

2、  分割每一个行:每个xml文件中包含的记录数。0表示不分割。

3、  正在编码:在XML文件头部指定。

4、  字段选项卡

5、  元素名称:xml文件使用的元素的名称,不指定,则元素名称和字段名相同。

6、  10进制:小数点可以是”.”或者”,

7、  分组:分组符可以是”,”或者”.

8、  空:表示当字段值为空时,则用此字段值代替。

还有很多输出插件,它们的图标如下图所示:


总结:输出插件和输入插件的种类差不多,输出插件里插入/更新、更新、还有表输出,这几个插件有功能相同的地方,我们可以根据需求来选择需要的插件,因为不同的插件执行的效率也不一样,虽然插入/更新插件具备了更新插件的功能,但是我们都知道功能多的就是没有功能单一的效率高,所以我们可以根据需求来决定应该使用哪个插件更好一些。还有删除插件,这个插件也很好用,可以执行批量删除,效率也很高。

目录
相关文章
|
12月前
|
数据采集 存储 安全
「集成架构」ETL工具大比拼:Talend vs Pentaho
「集成架构」ETL工具大比拼:Talend vs Pentaho
|
12月前
|
SQL 分布式计算 Oracle
「集成架构」2020年最好的15个ETL工具(第一部)
「集成架构」2020年最好的15个ETL工具(第一部)
|
12月前
|
SQL Oracle 关系型数据库
「集成架构」2020年最好的15个ETL工具(第二部)
「集成架构」2020年最好的15个ETL工具(第二部)
|
数据采集 缓存 分布式计算
大数据 ETL 处理工具 Kettle 的核心概念
上一篇中对 Kettle 进行了简单的介绍,并快速体验了一把 Kettle,完成了「把数据从 CSV 文件复制到 Excel 文件」 HelloWrold 级别的功能。 而在实际工作中,可以使用 Kettle 的图形化的方式定义复杂的 ETL 程序和工作流,如下图就是通过一系列的转换(Transformation) 完成一个作业(Job)流程。
|
SQL XML JSON
大数据ETL开发之图解Kettle工具(入门到精通)
ETL (Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种ETL工具的使用,必不可少。
4711 0
大数据ETL开发之图解Kettle工具(入门到精通)
|
XML 数据格式
|
SQL 数据库连接 数据库