SSIS 如何创建 ETL 包

适用于: SQL Server Azure 数据工厂中的 SSIS Integration Runtime

在本教程中,你将学习如何使用 SSIS 设计器创建一个 Microsoft SQL Server Integration Services 包。 所创建的包将从平面文件提取数据,重新设置数据的格式,然后将已重新设置格式的数据插入到事实数据表中。 在下列课程中,将扩展包以阐释循环、包配置、日志记录和错误流。

在安装教程的示例数据的同时,也会安装将在课程中创建的完整的包版本。 使用完整的包,您可以按需要跳过前面几课而从后面的课程开始学习教程。 如果本教程是你第一次使用包或新的开发环境,我们建议从第 1 课开始学习。

什么是 SQL Server Integration Services (SSIS)?

Microsoft SQL Server Integration Services (SSIS) 是一个可用于生成高性能数据集成解决方案的平台,其中包括数据仓库的提取、转换和加载 (ETL) 包。 SSIS 包括用于生成和调试包的图形工具和向导;用于执行 FTP 操作等工作流函数、执行 SQL 语句和发送电子邮件的任务;用于提取和加载数据的数据源和目标;用于清理、聚合、合并和复制数据的转换;用于管理包执行和存储的管理数据库 SSISDB;以及用于对 Integration Services 对象模型进行编程的应用程序编程接口 (API)。

学习内容

熟悉 Microsoft SQL Server Integration Services 中的新工具、控件和功能的最好方法,就是使用它们。 本教程将指导使用 SSIS 设计器创建一个 ETL 包,其中包含循环、配置、错误流逻辑和日志记录。

先决条件

本教程适用于熟悉基本数据库操作,但对 SQL Server Integration Services 中的新功能认识有限的用户。

若要运行本教程,必须安装下列组件:

  • SQL Server 和 Integration Services。 若要安装 SQL Server 和 SSIS,请参阅安装 Integration Services

  • AdventureWorksDW2022 示例数据库。 你可以从 AdventureWorks 示例数据库下载 AdventureWorksDW2022 数据库,并还原备份。

  • 示例数据文件。 示例数据与 SSIS 课程包一起提供。 要将示例数据和课程包下载为 Zip 文件,请参阅 SQL Server Integration Services 教程文件

    • 为了防止意外更改发生,zip 文件中的大部分文件都是只读文件。 若要将输出写入到文件或更改输出,必须在文件属性中关闭只读属性。
    • 示例包假定数据文件位于文件夹 C:\Program Files\Microsoft SQL Server\100\Samples\Integration Services\Tutorial\Creating a Simple ETL Package 中。 如果将下载内容解压缩到其他位置,必须在示例包中的多个位置更新文件路径。

本教程中的课程

第 1 课:使用 SSIS 创建项目和基本包
在本课中,将创建一个简单的 ETL 包,从单个平面文件中提取数据,再使用查找转换转换数据,最后将所得结果加载到目标事实数据表中。

第 2 课:使用 SSIS 添加循环
在本课中,将扩展第 1 课中创建的包,以便利用新增的循环功能,将多个平面文件提取到单个数据流进程中。

第 3 课:使用 SSIS 添加日志记录
在本课中,将扩展第 2 课中创建的包,以便利用新增的日志记录功能。

第 4 课:使用 SSIS 添加错误流重定向
在本课中,将扩展第 3 课中创建的包,以便利用新增的错误输出配置。

第 5 课:添加包部署模型的 SSIS 包配置
在本课中,将扩展第 4 课中创建的包,以便利用新增的包配置选项。

第 6 课:在 SSIS 中对项目部署模型使用参数
在本课中,将扩展第 5 课中创建的包,以便将新参数用于项目部署模型。