中文字数:3059, 英文字数:1744
数据的提取、变换和加载 通常把数据从一个应用程序或系统移到另一个的三个关键过程叫做提取、变换和加载(ETL)。 ----实际上,每个ETL应用程序的目标都是要以适时的方式使数据能被其用户得到。传统上,各公司依靠ETL例行程序把数据从旧的应用程序移到新的应用程序,或者把日常运行数据移进业务智能系统,如数据仓库和数据集市。 ----然而,由于因特网的爆炸性发展,现在ETL过程也常用于支持Web应用程序。例如,制造商可以利用ETL例行程序给基于Web的订单状况系统加载来自内部老应用程序的生产数据。ETL程序已经成为很多电子商务项目的基本构件,如 B2B、B2C的电子商务项目。 ----从广义上讲,ETL程序把数据从源数据库中提取出来,再把数据变换成适合目标数据库的格式,然后装载到目标数据库中。 ----为开始一个ETL过程,程序员利用提取例行程序读出源数据库中的记录,使那些记录中的数据能被变换处理过程利用。为把数据从源数据库中提取出来,程序员有三种选择 :他们可以编写定制程序,或依靠专用的ETL工具,或者把上述两者结合使用。 ----在实际中,多数程序员支持第三方工具加定制化程序。这程序被看作是用户的出口,执行针对不同环境的专用功能。 ----第三方的ETL产品一般比定制程序更为有效、也更为便宜。很多ETL工具给程序员提供了单一的、直观的接口,用于从多种数据库产品中提取数据。那些依靠多家公司数据库产品的公司能从这些产品的统一访问中获取好处。