Talend Open Studio for Data Integration


Talend Open Studio for Data Integration 是一套强大的用于数据集成的通用开源解决方案。

我们已经可以利用它们实现模块化构思的合作开发。 在成本和时间上,传统软件模型很难与之相比。加上利用软件包开源内容的论坛和体系,我相信,当您开展不同项目时您享用着一个社区的智慧。我认为这就是 Talend 的独到之处。

Levelor 电子商务开发人员 John Shafer。

版本对比 | Talend v5 的新增功能

Talend Open Studio for Data Integration 通过简单易用的图形开发环境,大大提高了数据集成作业设计的效率。通过支持可以连接至所有源系统和目标系统的插接件以及支持所有数据集成、数据迁移和数据同步操作,这一方案加快了部署时间并降低了维护成本,并通过全球社区用户提供的不间断测试和反馈,实现高质量支持服务。

Talend Open Studio for Data Integration 包含三个主要应用程序(业务建模器、作业设计器和元数据管理器),采用基于 Eclipse 的单一图形开发环境,可以轻松满足企业需求。

强大的可扩展数据集成解决方案

提供满足一切需求、及时且经济的解决方案

  • 可扩展满足最复杂的定制需求。
  • 易于开发,将开发周期缩短到几个月、几天甚至几个小时。
  • 利用开源的优势。

满足最复杂的业务要求

  • 及时为企业提供所需信息,以帮助企业制定及时有效的决策。
  • 将数据服务扩展为允许获得批准的应用和请求人对任何企业数据进行实时访问。
  • 提供整个组织的可靠数据,以满足分析和操作需要。

用于数据存取的一整套可扩展的直观工具集

Talend Open Studio for Data Integration 是唯一的企业级开源集成工具。开源用户可以定制和扩展解决方案,以满足其特定需求,而无需依赖供应商的能力以满足特定的规范。因为其不再是黑箱式专用解决方案,这种力度的创新使用户能够关注具体问题并深刻了解功能性能。这种独有的价值通过以下方面来实现:

  • 代码生成: Talend Open Studio for Data Integration 是一种代码生成器。开发人员在画板上拖动并配置一组图形组件,然后该工具就生成所有对应的 java 代码。这种方法缩短了开发时间并提高了开发效率。
  • 插接件: Talend Open Studio for Data Integration 是唯一提供了广泛的预建插接件,可以满足任何企业的需求的解决方案。该解决方案包含超过 450 种组件,可以实时或批量地连接到几乎所有数据库和多种知名业务系统。
  • 转换: 结构化、非结构化、甚至 XML 数据,都可以轻松转换。加上 Talend 用于 Data Quality 的扩展解决方案,Talend Open Studio for Data Integration 提供原生的质量功能,作为集成流程的一部分,改善数据质量。


业务建模

Talend Open Studio for Data Integration: Business Modeler

业务建模器采用自上而下的方法,允许业务线利益相关方参与集成流程的设计和开发进程的监控。业务模型是使用便捷的形状和链接库构建的以业务为导向的非技术性视图。

业务建模器在业务图表中集合了支持开源数据集成、数据迁移和数据同步流程的所有相关文档。出现问题时,这种监控作业和执行影响分析的方法极为有效。




图形化开发

Talend Open Studio for Data Integration: Mapper
Talend Open Studio: Mapper

作业设计器使用开源组件或插接件的图形画板,提供对实际集成流程的图形化和功能性视图。集成流程通过简单的操作就可以建成,即,将这些组件和插接件拖放进工作区,绘制它们之间的连接和关系,并设置它们的属性。

组件和插接件涵盖与数据本身、数据管理和数据流排序相关的所有类型的任务和操作。 插接件有助于访问和读/写所有数据源和目标系统的数据集成、数据迁移和数据同步。请访问

http://www.talendforge.org/components 查看所支持的插接件的完整列表。

当选择作业所涉及的各个组件时,可在一个中央视图中集中配置参数。也可以从源数据管理器(资源库)中继承参数。

复杂的组件配备专用且直观的图形界面,以帮助用户构建作业。

为了保证作业设计的可读性,可以将作业图表分为几个子部分,设置为子作业或父作业,以安排它们的执行顺序。其他协调组件可以帮助用户安排进程的运行顺序。

用户可以使用内置控制台视图,直接从集成 studio 监控执行情况和跟踪性能。








元数据驱动设计

Positional Schema

Talend Open Studio for Data Integration 是一套用于数据集成、数据迁移和数据同步的由源数据驱动的开源解决方案。所有元数据都通过所有模块共享的元数据管理器(资源库)来存储和管理。资源库集中了所有项目信息,可以确保所有集成流程的一致性。

借助大量的向导,通过高级系统、数据库或文件内省,您可以在元数据管理器中轻松加载与集成流程的源和目标系统相关的元信息。元数据管理器基于开放式关系模型,使用它您可以轻松识别作业的相互依赖关系,有助于维护数据集成、数据迁移和数据同步作业。

也可以在元数据管理器中集成上下文数据(例如数据库连接详情或文件路径),更便于使用和更新。

您也可以在 Talend Schema表单中轻松检索和解读任何源或目标系统的数据结构,数据结构可以在所有集成流程的所有数据操作中重用。

您还可以在资源库中统一其他代码、例程或方法,促进流程各部分的重用和重构。


高级通用连接性

Talend Open Studio: Interoperability Discovery Job

Talend Open Studio for Data Integration 提供适用于所有 IT 环境的本地技术和业务开源插接件。支持广泛的插接件是应用程序和数据库实现互操作性的关键所在;它能够以无可比拟的性能桥接异构多样数据结构。插接件库不断扩充,因而扩展了 Talend 的数据集成、数据迁移和数据同步解决方案的性能。

Talend Open Studio for Data Integration 拥有广泛的连接性,可与以下内容连接:

  • 打包的应用程序(ERP、CRM 等)、数据库、主机、文件、Web 服务等,可以解决数据源的日益多样化问题
  • 数据仓库、数据集市、OLAP 应用程序等,用于分析、报表、仪表板、记分卡
  • 内置 ETL 高级组件,包括字符串处理、渐变维度、自动查找处理、批量下载支持等
  • 用于数据质量、数据匹配、主数据管理等的专用组件

请访问 http://www.talendforge.org/components,查看所支持的插接件的完整列表。

Talend Open Studio for Data Integration 利用行业标准语言,包括 Java 和 SQL。这允许用户轻松扩充现有组件或创建自己的组件。专用社区应用程序 Talend Exchange 可以帮助用户在本地将这些新创建的开源组件嵌入环境中。用户还可以编写数据迁移和数据同步的例程和其他代码,并将信息集中存储在资源库,以供重复使用。


实时调试

Talend Open Studio for Data Integration: Debug Mode

Talend Open Studio for Data Integration 拥有强大的测试、调试和调谐功能,允许实时跟踪整个转换流程中的数据流向,包括运行统计数据和高级跟踪模式。

当通过开源作业设计器执行集成作业时,界面上会实时出现图形模式统计数据,显示处理和拒绝的行数以及吞吐量(每秒的行数)。这有助于及时发现数据集成、数据迁移和数据同步作业的瓶颈。还可以激活跟踪模式,该模式逐行显示行为和转换结果。传统调试断点和变量也可用。

当然,Talend Open Studio for Data Integration 生成的所有代码,无论目标语言如何,都可以从设计环境中看到并进行访问。


部署与维护

Talend Open Studio for Data Integration: Deployment

高级运行环境管理(测试、分阶段执行、生产等)可以帮助数据集成、数据迁移和数据同步的集成流程部署。在开源作业设计中直接进行上下文参数的隐式加载可以帮助开发不同运行环境并轻松管理这些环境。通过便捷的导出工具,可以轻松将企业系统的流程部署当做数据服务或者数据集成、数据迁移或数据同步服务来执行。

自动文档生成提供完整的最新技术参考文档(XML 和 HTML 格式),可以帮助不同用户和利益相关方维护和更新继承的流程。

依存性检测功能可以帮助用户识别在 Talend Open Studio for Data Integration 中开发的集成流程之间的相互依存性,并简化集中存储在资源库中的大量流程的全局更新。


强大的可扩展执行

Talend Open Studio for Data Integration: ELT

与基于集中式集成服务器或只能使用 RDBMS 来处理数据的众多数据集成、数据迁移和数据同步解决方案不同,Talend Open Studio for Data Integration 允许用户将流程导出到可执行的文件中,进而分布在系统网中或用在 Web 服务中。这些系统不需要专门用于执行集成流程。相反,Talend Open Studio for Data Integration 会利用可用资源。

Talend Open Studio for Data Integration 同时利用传统 ETL(提取-转换-加载)方法和 ELT(提取-加载-转换)方法。ELT 利用 RDBMS 引擎来执行数据库中数据的转换,在高容量批次下的性能无与伦比。对于流程的各个子集,可以选择最适当的方法,因此可以获取数据集成、数据迁移和数据同步的高级性能。

这种架构设计尤其适合利用廉价服务器和高范围系统,可以在离数据源最近的位置处理数据(因此减少了数据交换的需要),并可以实现最大的计算资源使用率。

Talend 的数据集成解决方案可以满足任何规模的组织的所有数据集成需求。Talend 解决方案可以满足的广泛数据集成需求包括:

  • 操作数据集成:对于大多数组织,操作数据集成是通过实施自定义程序或例程来实现的,只能满足一个特定需求。数据迁移/加载和数据同步/复制是操作数据集成的常见应用。

  • 数据迁移: 当升级数据库或应用程序或者切换至新系统时,需要在新系统中保留数据。数据迁移的目的是将现有数据迁移到新环境中。需要将其转换为适合新系统的格式,同时保留原有的信息。了解更多有关 Talend 解决方案如何解决数据迁移方面的信息


  • 数据同步: 在信息系统中,数据常常由多个应用程序或数据库分别管理,同时还要保持这些系统的一致性。数据同步可能是永久性的(操作系统之间的同步),也可能是暂时性的(例如迁移时)。数据同步包含维护应用程序和数据库之间的数据同步的所有流程。了解更多有关 Talend 解决方案如何解决数据同步方面的信息


  • 商业智能和数据仓库的 ETL:ETL(提取、转换和加载)流程是商业智能基础设施的最关键的增值组件。ETL 流程从所有操作系统检索数据并对其进行预处理,以便分析和报告工具进行操作,而这些是 BI 平台的用户几乎看不到的。整个 BI 平台的精确性和及时性实际上是依赖于 ETL 流程。了解更多有关 Talend 如何解决用于 BI 和分析的 ETL 的信息


全球的组织从数据集成中获益

开源数据集成被所有行业、各种规模的组织广泛应用于各种项目。以下是实例研究,有助于了解实际组织从开源数据集成中获得的利益:

阅读更多案例研究和客户评语。

 
  Download
Talend Open Studio
 for Data Integration

For other versions please see below

Note that this application and its source code are provided under the GPL v2 Open Source license agreement terms. For further information about this license agreement, go to http://www.gnu.org/licenses/old-licenses/gpl-2.0.html.

里程碑、候选版本与其他版本

Talend Open Studio for Data Integration

new Version 5.0.2, 2012-02-17 (branch-5_0 r78327)
This includes Business Modeler, Job Designer & Local Repository
Main Supported Operating System Size
exe Windows 32 Windows 32 376MB
md5
zip Windows 32, Unix, Linux (GTK based) Windows 32,
Unix,
Linux (GTK based)
488MB
md5
Choose a mirror:  
US     US  
Europe     Europe  
SourceForge     SourceForge  
Choose a mirror:  
US     US  
Europe     Europe  
SourceForge     SourceForge  
You can find the Talend Open Studio for Data Integration Installation Guide in the Wiki section.
Version 4.2.4, 2012-01-12 (branch-4_2 r76583)
This includes Business Modeler, Job Designer & Local Repository
Main Supported Operating System Size
exe Windows 32 Windows 32 394MB
md5
zip Windows 32, Unix, Linux (GTK based) Windows 32,
Unix,
Linux (GTK based)
538MB
md5
Choose a mirror:  
US     US  
Europe     Europe  
SourceForge     SourceForge  
Choose a mirror:  
US     US  
Europe     Europe  
SourceForge     SourceForge  
You can find the Talend Open Studio for Data Integration Installation Guide in the Wiki section.

用户文档

用户手册

Talend Open Studio for Data Integration
   Version  Date  Language  Size
 DocumentationSet_UG&RG_50b_EN
Choose a mirror:  US   US
Europe   Europe
 5.0b new  2012-02-17 English  21MB
 DocumentationSet_UG&RG_50b_FR
Choose a mirror:  US   US
Europe   Europe
 5.0b new  2012-02-17 French  21MB

Talend Open Studio for Data Integration 用户指南 (UG):提供一般使用信息
   Version  Date  Language  Size
 TalendOpenStudio_DI_UG_50b_EN
Choose a mirror:  US   US
Europe   Europe
 5.0b new  2012-02-17 English  6228KB
 TalendOpenStudio_DI_UG_50b_FR
Choose a mirror:  US   US
Europe   Europe
 5.0b new  2012-02-17 French  6323KB
Talend Open Studio for Data Integration  User Guide (print version) on Amazon.com  还可登录 Amazon.com ,获取Talend Open Studio for Data Integration - 用户指南(印刷版)

Talend 组件的参考指南 (RG):包含用户实例 (PDF 格式)
   Version  Date  Language  Size
 TalendOpenStudio_Components_RG_50b_EN
Choose a mirror:  US   US
Europe   Europe
 5.0b new  2012-02-17 English  19MB
 TalendOpenStudio_Components_RG_50b_FR
Choose a mirror:  US   US
Europe   Europe
 5.0b new  2012-02-17 French  19MB


分析师观点 阅读白皮书 观看网络研讨会
IDC White Paper - Talend Uses Open Source to Deliver Low-Cost, Easy-to-Use Enterprise Data Integration
In this IDC White Paper sponsored by Talend, analyst Carl Olofson discusses the data integration market, examines the approach taken by Talend, and shows how the combination of Talend's technical approach and its open source licensing overcomes key barriers to adoption of data integration.
Practical Open Source Data Integration: Case Studies & Implementation Examples
This white paper presents selected case studies, illustrating real-life implementations of open source data integration and its associated benefits.
ELT: High Performance Loading for your Data Warehouse
This one-hour Webinar presents:
- What is ELT (Extraction, Loading and transformation) and the differences with the ETL mode
- The advantages of ETL approach for the data warehouse loading
- When to choose ELT, ETL or combining both
Cancel

The application is being downloaded.

In the meantime, you can download the related documentation:

Talend Open Studio for Data Integration
User Guide

more documentation options

 

To download, please fill out this form:
First Name:
*Last Name:
*Business Email:
*Company:
*Country:  
*Phone:

  
 Note: fields marked with * are required.