超大型 Oracle 数据库应用系统设计
一、概论
超大型系统的特点为:
- 处理的用户数一般都超过百万,有的还超过千万,数据库的数据量一般超过 1TB;
- 系统必须提供实时响应功能,系统需不停机运行,要求系统有很高的可用性及可扩展性。
为了能达到以上要求,除了需要性能优越的计算机和海量存储设备外,还需要先进的数据库结构设计和优化的应用系统。一般的超大型系统采用双机或多机集群系统。下面以数据库采用 ORACLE 8.0.6 并行服务器为例来谈谈超大型数据库设计方法:
- 确定系统的 ORACLE 并行服务器应用划分策略
- 数据库物理结构的设计
- 系统硬盘的划分及分配
- 备份及恢复策略的考虑
二、ORACLE 并行服务器应用划分策略
ORACLE 并行服务器允许不同节点上的多个 INSTANCE 实例同时访问一个数据库,以提高系统的可用性、可扩展性及性能。ORACLE 并行服务器中的每个 INSTANCE 实例都可将共享数据库中的表或索引的数据块读入本地的缓冲区中,这就意味着一个数据块可存在于多个 INSTANCE 实例的 SGA 区中。那么保持这些缓冲区的数据的一致性就很重要。ORACLE 使用 PCM(Parallel Cache Management)锁维护缓冲区的一致性,ORACLE 同时通过 DLM(集成的分布式锁管理器)实现 PCM 锁,并通过专门的 LCK 进程实现 INSTANCE 实例间的数据一致。
考虑这种情况:INSTANCE1 对 BLOCK X 块修改,这时 INSTANCE2 对 BLOCK X 块也需要修改。ORACLE 并行服务器利用 PCM 锁机制,使 BLOCK X 从 INSTANCE 1 的 SGA 区写入数据库数据文件中,又从数据文件中把 BLOCK X 块读入 INSTANCE2 的 SGA 区中。发生这种情况即为一个 PING。PING 使原来 1 个 MEMORY IO 可以完成的工作,变成 2 个 DISK IO 和 1 个 MEMORY IO 才能够完成,如果系统中有过多的 PING,将大大降低系统的性能。
ORACLE 并行服务器中的每个 PCM 锁可管理多个数据块。PCM 锁管理的数据块的个数与分配给一个数据文件的 PCM 锁的个数及该数据文件的大小有关。当 INSTANCE 1 和 INSTANCE 2 要操作不同的 BLOCK,如果这些 BLOCK 是由同一个 PCM 锁管理的,仍然会发生 PING。这些 PING 称为 FALSE PING。当多个 INSTANCE 访问相同的 BLOCK 而产生的 PING 是 TRUE PING。
合理的应用划分使不同的应用访问不同的数据,可避免或减少 TRUE PING;通过给 FALSE PING 较多的数据文件分配更多的 PCM 锁可减少 FALSE PING 的次数,增加 PCM 锁不能减少 TRUE PING。
所以,ORACLE 并行服务器设计的目的是使系统交易处理合理的分布在 INSTANCE 实例间,以最小化 PING,同时合理的分配 PCM 锁,减少 FALSE PING。设计的关键是找出可能产生的冲突,从而决定应用划分的策略。应用划分有如下四种方法:
- 根据功能模块划分,不同的节点运行不同的应用
- 根据用户划分,不同类型的用户运行在不同的节点上
- 根据数据划分,不同的节点访问不同的数据或索引
- 根据时间划分,不同的应用在不同的时间段运行
应用划分的两个重要原则是使 PING 最小化及使各节点的负载大致均衡。
三、数据库物理结构的设计
数据库物理结构设计包括确定表及索引的物理存储参数,确定及分配数据库表空间,确定初始的回滚段,临时表空间,redo log files 等,并确定主要的初始化参数。物理设计的目的是提高系统的性能。整个物理设计的参数可以根据实际运行情况作调整。
表及索引数据量估算及物理存储参数的设置
表及索引的存储容量估算是根据其记录长度及估算的最大记录数确定的。在容量计算中考虑了数据块的头开销及记录和字段的头开销等等。表及索引的 initial 和 next 存储参数一般设为相等,pctincrease 设为 0。
表空间的设计
ORACLE 数据库的表和索引是透过表空间 tablespace 存储在数据库中的。在 tablespace 设计时一般作以下考虑:
- 一般较大的表或索引单独分配一个 tablespace。
- Read only 对象或 Read mostly 对象分成一组,存在对应的 tablespace 中。
- 若 tablespace 中的对象皆是 read only 对象,可将 tablespace 设置成 read only 模式,在备份时,read only tablespace 只需备份一次。
- 高频率 insert 的对象分成一组,存在对应的 tablespace 中。
- 增、删、改的对象分成一组,存在对应的 tablespace 中。
- 表和索引分别存于不同的 tablespace。

