Talend Enterprise Data Quality


新一代数据管理

Talend Enterprise Data Quality 提供新一代的剖析、清理、匹配和监控功能,用来支持数据管控。在单一网络环境中运行一种解决方案,可以帮您解决数据质量问题,使跨职能团队能够充分利用他们的数据。


版本对比 | Talend v5 的新增功能

数据质量概述

当您需要清洁而精确的数据时,就可以交给 Talend Enterprise Data Quality 来完成。它可以识别异常现象、清理不精确和不一致的数据,处理重复的记录,并拥有增强数据质量的功能。它扩展了剖析和实时仪表板功能,可以随时了解数据质量。它不仅可以识别问题,还可以创建自动化流程以解析和清理数据。 Talend Enterprise Data Quality 适用于企业,是一种可重用的高扩展性数据管理平台。


关键功能

数据剖析

提高企业数据质量的第一步在于充分而且完全地了解数据,确保数据符合公司和行业标准。数据剖析提供了预定义测试和业务规则,以确保数据质量适合企业的应用。


标准化

识别出了问题所在,便可以纠正问题。Talend Enterprise Data Quality 包含价值可观的标准化功能组件,例如名称和地址清理、使用外部参考数据进行纠正、解析、第三方地址验证和标准化。这些强大的工具可以帮助您使用单一开发环境来管理所有数据域(包括客户、产品、财务和事务)的数据质量。


匹配与数据存活 (survivorship)

Talend Enterprise Data Quality 是新一代的数据匹配解决方案,与以往供应商使用的过度复杂的流程截然不同。这一方案摒弃了过去使用编辑和特定语言匹配的绿屏匹配规则。使用 Talend 时,匹配过程在 Talend 工作环境中配置,无需在与某些数据质量工具关联的多个 GUI 中执行繁杂的编辑规则文件和匹配语言的任务。它提供的高级匹配算法可以帮助您找到数据中完全重复和部分重复的记录。


数据监控

Data Quality Portal 提供可定制的基于 Web 的数据质量监控和报告,可以帮助组织监控影响重要业务流程的关键数据质量度量。公司通过定期查看度量并跟踪其趋势,可以利用数据剖析来跟踪数据质量的评估结果(提高或降低)。这有助于构建基准和突出待改进的区域。


适合企业、大数据和云

我们认为在系统之间传送清洁数据是势在必行的关键任务。Talend 提供的关键功能可通过卓越的连接性、性能和可扩展性,来获取更清洁的数据,从而克服了实现企业级功能所需的数据质量面临的挑战。

数据管控的数据质量

数据剖析

提高企业数据质量的第一步在于了解数据并确保数据符合公司和行业标准。使用 Talend Enterprise Data Quality,用户可以:

  • 剖析、分析和生成数据质量状态信息报告,以帮助构建质量基准和突出待改进的区域
  • 通过预定义的测试和业务规则,以确保数据质量适合企业的应用程序,可以快速启用
  • 定制业务规则和阈值,以确保在数据质量不符合规范时得到警示
  • 简单的一次右键单击,便可深入了解特定记录。
  • 您可以迅速便捷地通过实施某个流程来弥补漏洞剖析结果可以立即转换为补救操作。
  • 随时监控数据质量,以跟踪新流程对数据质量产生的影响
  • 与跨职能团队分享数据剖析结果,以促进数据管控

标准化

提高企业数据质量的第一步在于了解数据并确保数据符合公司和行业标准。使用 Talend Enterprise Data Quality,用户可以:

  • 利用内建数据集成,存取任何数据源或使用数据源来扩充数据。利用随时可用的参考数据扩充和增强数据,否则便需通过传统供应商来完成。
  • 使用单一开发环境来管理所有数据域(包括客户、产品、财务和事务)的数据质量
  • 在整个数据管控的组织过程中重复使用所有数据质量规则、参考数据和流程。
  • 针对结构化和非结构化数据使用最新解析技术。您可以使用解析器为改进报告和分析定制自由形式的数据域结构。
  • Talend 的数据质量速查表 (cheat sheet) 可减少部署时间。速查表采用简单的问题帮助您逐步了解完成数据质量作业的一些常见数据质量流程。

匹配与数据存活(survivorship)

Talend Enterprise Data Quality是新一代的数据匹配解决方案,可以帮助现实中的业务用户摒弃以往过于复杂的绿屏匹配规则编辑流程。使用 Talend Enterprise Data Quality 的匹配功能,用户可以:

  • 在 Talend 用户环境中配置匹配。不再需要繁杂的规则文件编辑编辑工作以及与大多数数据质量工具关联的多个 CUI。
  • 设置每个匹配属性的置信度权重和概率,以得到所需结果
  • 使用独一无二的匹配 studio,显示与修改匹配技术(包括关键匹配度量的图表)相关的“假设分析(what-if)”
  • 轻松识别重复的客户数据、交易数据或供应链数据,以配置匹配算法
  • 为每一属性选择规则和匹配技术,从而为您的独特数据收集最可能的匹配流程
  • 在同样的环境中编辑规则,从而无需学习匹配语言或属性匹配代码,便可完成所有数据管理。

数据监控

Data Quality Portal 提供可定制的基于 Web 的数据质量监控和报告,以帮助组织监控影响重要业务流程的关键数据质量度量。用户可以:

  • 审核数据质量度量状况,使数据管控团队可以通过数据剖析来跟踪数据质量的变化(提高或降低)。
  • 在新数据生成时执行数据质量标准。 Data Quality Portal 在基于 Web 的 portal交付自定义关键质量指标 (KQI),这样,团队便可以协作改进企业的数据质量。
  • 采用标准格式生成报告以供共享。以网页、Adobe Acrobat 和 Excel 形式生成图形报告。使用以 XML 格式存储在资源库中的报告数据用于商业智能应用程序。
  • 如果度量不满足规范,则触发事件,如发送电子邮件。数据质量不符合规范时,您可以立即知晓。

适合企业、大数据和云

我们认为在系统之间传送清洁数据是势在必行的关键任务。Talend 提供的关键功能可通过卓越的连接性、性能和可扩展性,获取更清洁的数据,从而克服了实现企业级功能所需的数据质量面临的挑战。使用 Talend Enterprise Data Quality,用户可以:

  • 实现与几乎所有数据源的通用连接,允许存取和清理任何数据源(企业或云)中的任何数据
  • 集中管理数据质量作业,从而提高了对数据管控的再利用和支持
  • 批量或实时部署数据质量服务,包括用来阻止低质量数据进入应用程序的数据质量防火墙
  • 通过共享资源库,所有应用程序和项目均可以重复利用所有剖析和数据清理作业
  • 构建、测试和部署数据质量服务,以在 Talend 的基于服务的架构 (ESB) 上支持所有应用
  • 设置多服务器和节点,包括支持 Hadoop、群集和高可用性的配置

实现企业新项目

Talend Enterprise Data Quality 本身就是一个新项目,它还可以改进 IT 项目。

项目

数据质量功能

数据质量价值


数据迁移

剖析可以在项目早期提供对数据挑战的全面了解,而标准化和匹配则是数据转换的一部分。

剖析可以在项目团队尝试迁移数据之前,提供对数据的全面了解。这可以帮助项目团队制定更精准的迁移方案。在客户进入 ETL 重复循环时,对数据未充分理解可能导致大幅成本超支和项目延迟。数据质量功能将帮助您潜在客户的潜在客户对迁移数据进行标准化。


客户关系管理 (CRM)

数据质量提供 CRM 应用中数据的标准化名称和地址。

数据质量技术可以实时运用,减小系统中的输入错误和重复数据的数量,从而改进呼叫中心的效率。组织的客户名单重复记录减少,更加清晰明了。数据剖析还可以帮助组织了解和监控采购单的质量,以避免整合过程出现第三方数据问题。


企业资源规划 (ERP) 与供应链管理 (SCM)

数据质量对“部件”数据进行了标准化,以更准确地反映库存量。

数据质量技术可用于更加精准地报告库存量,以降低库存成本。您还可以通过进一步了解供应商企业的购买力,提高与供应商的议价能力。有了准确的数据,便可对供应链的前景有更全面的了解。


数据仓库与商业智能

数据质量可以确保异构数据源在迁移到数据仓库时保持统一。

数据质量通过对异构数据进行标准化,来确保数据仓库的可行性。客户在尝试了解销售模式、收益、客户统计资料和其他重要度量时,可以生成更精准的报告。


法规遵从性

数据质量可以充分保障报告的准确性。

数据质量技术可以帮助避免报告中的客户和销售数据出现错误。必须符合行业特定、各地法律法规的相关公司需要确保其系统中数据的准确性。


主数据管理 (MDM)

数据质量是主数据管理的关键组成部分。

应用程序之间通信和共享数据的一个前提是拥有标准化数据。MDM 通过附加功能,例如永久密匙、用于调整匹配的图形用户界面、企业应用的发布和订阅功能等,来提升数据质量的基本功能。


分析师观点 阅读白皮书 观看网络研讨会
Testing Talend Enterprise Data Quality - an independent software review by IAIT
Read how independent reviewer Dr. Götz Güttich from the IAIT test lab grades Talend Enterprise Data Quality as a “must-have” for companies looking to improve the quality of their data.
This informative review is an unbiased and inclusive review completed in the spring of 2011.
The Butterfly Effect of Poor Data Quality
Poor data quality is more impactful than most people think. Chaos theory, specifically the "butterfly effect", explains how a single piece of poor data can have long-term consequences on your corporate vision. This white paper discusses the ubiquitous nature of data and how data quality monitoring, profiling, cleansing and enrichment can be used to minimize the chaos.
Create Business Friendly Data Quality Dashboards
This one hour webinar presents:
- How to set up your first dashboard
- How to centralize and manage high-performance Excel-based reporting and analysis with Palo
- How to create business-friendly reports
- How to customize reports for your business