精英小说

精英小说>离语 > 第291章 冬瓜(第1页)

第291章 冬瓜(第1页)

ETL是企业数据仓库构建过程中的一个核心步骤Y我们可以借助于ETL

工具来高效地完成数据抽取转换和加载工作之所以需要ETL工具Y

主要有以下几个原因X

?

1?当数据来自不同的物理主机Y这时候如果使用SQL语句去处理的

话Y就显得比较吃力且开销也更大]

?

2?数据来源可以是各种不同的数据库或者文件Y这时候需要先把它

们整理成统一的格式后才可以进行数据的处理Y这一过程用代码实现

显然有些麻烦]

?

3?在数据库中我们当然可以使用存储过程去处理数据Y但是Y处理

海量数据的时候Y存储过程显然比较吃力Y而且会占用较多数据库的

资源Y这可能会导致数据库资源不足Y进而影响数据库的性能。

在选择ETL工具时主要考虑如下因素X

?对平台的支持程度]

?抽取和装载的性能是不是较高Y且对业务系统的性能影响大不

大,高不高]。

?对数据源的支持程度]。

?是否具有良好的集成性和开放性]。

?数据转换和加工的功能。

?是否具有管理和调度的功能。

CDC解决方案包括变化捕捉代理变化数据服务和变化分发机制三个

组成部分

?

1?变化捕捉代理变化捕捉代理是一个软件组件Y它负责确定和捕

捉发生在操作型数据存储源系统中的数据变化可以对变化捕捉代理

进行专门优化Y使它适用于特定的源系统Y比如使用数据库触发器]

也可以使用通用的方法Y比如数据日志比较。

变化数据服务变化数据服务为变化数据捕捉的成功实现提供了

已完结热门小说推荐

最新标签