SQL Server 2008集成服务详解

http://tech.ddvip.com   2008年05月27日    社区交流

内容摘要:这篇文章讨论了依赖于数据集成技术的业务要提供有用的、可靠的信息来维护在现今世界中的竞争优势所要面临的挑战。它讨论了SQL Server 2008集成服务(SSIS)可以怎样帮助信息技术部门达到他们公司的数据集成要求。文章中包含真实案例。

  3.2.3 SSIS和数据质量

  SSIS的一个主要特性,以及它的集成数据的能力,是它集成不同技术来操纵数据的能力。这使得SSIS包含了创新的基于“模糊逻辑”的数据清理组件。Microsoft研究实验室开发了这些组件,并且他们展示了在这个领域的最新研究。采用的方法是一个独立的域而且不依赖于任何特定的域数据,例如地址/邮编参考数据。这使得你可以将这些转换用于清理大多数类型的数据,而不仅仅是地址数据。

  SSIS与分析服务的数据挖掘功能深度集成。数据挖掘抽取了数据集的格式并将它们封装到一个挖掘模型里。然后你可以使用这个挖掘模型来预测一个数据集包含什么数据以及什么数据是反常的。这样你就可以将数据挖掘作为一个实现数据质量的工具。

  在SSIS中对复杂数据路由的支持不仅帮助你确认异常数据,而且还可以自动修改并用更好的值来替代它。这使得“闭环”清理场景可用。图6显示了一个闭环清理数据流的例子。

SQL Server 2008集成服务详解

  图6

  除了它的内置数据质量特性,SSIS还可以扩展为与第三方数据清理解决方案紧密协作。

  3.2.4 超出传统ETL的SSIS应用程序

  数据流管道操纵几乎任何类型数据的能力、与分析服务的深度集成、对使用许多数据操纵技术对它进行扩展的支持,以及包含了一个丰富的工作流引擎,这些使得SSIS可以用在很多不是传统的ETL场景中。

  服务面向架构

  SSIS包括对数据流管道中源XML数据的支持,包括从磁盘上文件中获得的数据以及通过HTTP的URL。XML数据是“粉碎”放到表格数据中的,然后它就可以在数据流中很容易地进行操纵。这个对XML的支持可以与对Web services 的支持一起使用。SSIS可以与控制流中的Web services进行交互以捕捉XML数据。

来源:IT专家网    作者:戴羽    责编:豆豆技术应用

正在加载评论...