Talend Open Studio

Talend Open Studio各种最为先进的功能可以大幅提高数据集成作业设计的效率,广受认可的扩展性确保了任务执行的最佳效果。

还无法决定应该选择开源 Talend Open Studio 还是来实现您数据集成,数据迁移或是数据同步的目标吗?您可以查询功能对比总表.

您还想要了解更多使用 Talend Open Studio 来完成数据集成,数据迁移或数据同步的信息吗?敬请观看在线 demo 或亲自见证产品使用者的 使用感言.

业务建模

Talend Open Studio: 业务建模专家

Talend Open Studio的业务建模专家采用的top-down设计模式,优势明显,使得business line中所有的人员都可以按照自身在业务中的角色参与到集成设计中,监测开发进度。 业务模型在创建过程中直接使用附带的图形与连接工具库,随需随取,所建模型不可执行,但完全以业务需要为导向

业务建模专家还将所有相关的文档分类重组,采用业务友好型的图解方式,支持开源数据集成,数据同步和数据迁移所有进程的需要。在问题产生时,这是一种非常有效的检测作业,并进行冲突分析的方法。

 

图形化开发

Talend Open Studio: Mapper 映射器

Talend Open Studio 的作业设计专家为当前集成进程提供图形与功能一体化的视图窗口,使用包含各种开源组件和连接器的一个图形化Palette组件面板,执行您实际的数据集成进程。通过在界面上简单地拖拽和放置组件和连接器,用鼠标绘出关系连接线,设置属性,就可以构成一个完整的集成进程。

组件和连接器分多种类型,只需按照您的任务类型选取,既可针对要处理的数据本身,也可用于安排工作流程组织;连接器全面细致,可让您对任何数据源和目标系统进行读取,编写,完成所有数据集成,数据迁移和数据同步任务。

设置属性可集中在界面下方的标签项中完成,或直接使用元数据的属性;开发的作业可以按照您的架构理念分解成多个subjob,设置亲子关系,按顺序执行;下方console主控台中提供监测追踪执行的选项。Talend这些设计均全面考虑了用户工作中实际的需要和难点,是世界上千百万用户的使用结晶,是拓蓝人(the talended)紧密合作的研发成果。

复杂的组件都配有专用的直觉式图形化界面或内建的向导来帮助用户建立自己的作业。

为了确保每个设计的作业都可以进行技术解析,开发的作业可以按照您的架构理念分解成多个subjob,设置亲子关系,按顺序执行。另外还有一些orchestration组件,以及各种各样的关系类型,也可以用来帮助用户安排不同进程执行的顺序。

内置的console主控台可以帮助用户迅速监测到执行情况,在这样一个开源的数据集成工具中直接追踪到集成的性能水平。

元数据驱动

Talend Open Studio: 文件向导
数据库向导

Talend Open Studio是由元数据驱动的开源解决方案,面向数据集成,数据迁移和数据同步需要。元数据管理专家存储管理所有的元数据——存储在共享存储库中并提供给所有的模块共享。这个存储库集中存储了所有的project信息,确保了所有集成进程之间的连续性。

为了便于向元数据管理专家加载关系到您集成进程的源系统和目标系统元数据,Talend为您提供了文件或数据库的高级内省功能,并配备大量向导来协助您使用这些功能。同时,元数据管理专家立足于开放的关系模型之上,依存逻辑(job dependency)分析可以轻易完成,在您数据集成,数据迁移和数据同步的任务中,为您对作业的维护提供了无限便利。

用于上下文的数据,如数据库连接信息或者文件路径也可以集中存储在元数据管理专家当中,使用、更新都变得更为简便。

另外还有多种代码,routines或者methods,它们都可以统一到存储库当中,为集成更个部分的再利用和在配置提供便利。

先进灵活的连接性能

Talend Open Studio: 文件向导

Talend Open Studio提供的开源的原生连接器不受IT环境限制,既可满足technique需要,也可以回应business需求。这样一个类型广泛的连接器大系,正是实现应用程序和数据库之间互动的关键因素。它们不但以无与伦比的效能将多样,异构的数据桥接了起来,还因为有了这种广博的连接功能,使得Talend在数据集成,数据迁移和数据同步方面的方案可以不断丰富,日趋完美。

Talend Open Studio 提供的全方位连接包括:

  • 各种套装软件 (ERP, CRM, 等),数据库,大型机,文件,Web服务等,可以处理数据源之间的异化日益加深。
  • 数据仓库,数据集市,OLAP应用程序 - 用于分析,报告,仪表板监测,记分卡等
  • 内建高级ETL组件,包括字符串操作,慢速变化维,自动查找处理,批量加载支持等

点击http://www.talendforge.org/components查看所支持支持连接器的完整列表。

Talend Open Studio 使用行业标准的语言包括Java,Perl和SQL语句。用户借此能够轻松地丰富现有组件或创建自己的组件。另外还有专用的社区应用 - Talend Exchange - 可以帮助用户将新创建的开源组件原生插入到环境中。用户还可以编写用于数据集成或数据同步的例程或其他代码段并集中储存在Repository中以便重复利用。

实时调试

Talend Open Studio: 实时调试
Talend Open Studio: 调试模式

Talend Open Studio拥有强大的测试,调试和整定功能。在整个转置进程中,这些功能实现了对数据流的实时追踪,可以完成执行统计,提供高级跟踪模式。

当开源作业设计专家的界面上有集成作业执行时——图形化模式,执行情况的统计信息同步显示,包括了处理的和被拒绝的行数,已经每秒的流量,这使您可以迅速锁定在您数据集成,数据迁移或是数据同步作业中的任何瓶颈。您还可以使用追踪(trace)模式,逐行查看执行情况和数据转置结果。同时传统的调试断点和变量仍然可用。

当然,无论您使用什么样的目标语言,Talend Open Studio生成的代码始终是能够在设计环境中存取和查看的。

部署与维护

在数据集成,数据迁移和数据同步过程中,Talend对上下文先进完善的管理(测试,仿真,生产等)是实现集成部署便利化的基础。在Talend的开源作业的设计中,上下文参数的隐式加载(implicit loading)改善了对执行环境的开发和管理,为您配备的各种导出工具,使您开发的进程可以快捷地部署到公司整个系统中,既可以为您提供信息,也可以为您实现数据集成,数据迁移以及数据同步。

自动文档生成功能保证了对完整、最新的技术参考资料(XML和HTML文件)需求的满足,可以帮助各类用户和业务相关人员对所继承的进程进行维护与更新。

依存逻辑检测功能可以帮助用户确定在Talend Open Studio中开发的集成进程之间的相关性,使集中存储在Repository中的数目巨大的进程更为轻易地实现全面升级。

 

可扩展的强力执行

在数据集成,数据迁移和数据同步过程中,Talend Open Studio 突破了RDBAMS引擎或中央处理器的限制,允许用户将所有进程导出成为可执行文件,并分配到一整套的系统群的网格中,或暴露在Web服务上。这些系统不再需要一个个指定给所有执行进程,同时,Talend Open Studio还得以调用不论任何属性的所有资源。

Talend Open Studio: 作业设计专家

Talend Open Studio将常用的ETL(Extract-Transform-Load)与ELT(Extract-Load-Transform)结合在一起,是Talend一项革新性的技术。其中ELT不但可以最大化的调用RDBMS引擎的功能,执行大批量文件,甚至还可以在一个进程当中,为它的每个子集选取最佳的执行方案,实现了数据集成,数据同步以及数据迁移所追求的名副其实的scalability

该架构设计尤其适合应用廉价的服务器网格或大型系统。它使数据可以在距离数据源最近的地方得到处理,从而减少了数据传输的负担,最大化的利用了运算资源。