数据仓库 - 系统管理员


系统管理对于数据仓库的成功实施是必需的。最重要的系统管理器是 -

  • 系统配置管理器
  • 系统调度管理器
  • 系统事件管理器
  • 系统数据库管理器
  • 系统备份恢复管理器

系统配置管理器

  • 系统配置管理员负责数据仓库的设置和配置的管理。

  • 配置管理器的结构因操作系统而异。

  • 在 Unix 配置结构中,管理器因供应商而异。

  • 配置管理器具有单一用户界面。

  • 配置管理器的界面允许我们控制系统的各个方面。

- 最重要的配置工具是 I/O 管理器。

系统调度管理器

系统调度经理负责数据仓库的成功实施。其目的是安排临时查询。每个操作系统都有自己的调度程序和某种形式的批处理控制机制。系统调度管理器必须具备的功能列表如下 -

  • 跨集群或 MPP 边界工作
  • 处理国际时差
  • 处理作业失败
  • 处理多个查询
  • 支持工作优先事项
  • 重新启动或重新排队失败的作业
  • 作业完成时通知用户或进程
  • 在系统中断期间维护作业计划
  • 将作业重新排队到其他队列
  • 支持队列的停止和启动
  • 记录排队作业
  • 处理队列间处理

注意- 上面的列表可以用作评估良好调度程序的评估参数。

调度程序必须能够处理的一些重要工作如下:

  • 每日和临时查询调度
  • 定期报告要求的执行情况
  • 数据加载
  • 数据处理
  • 索引创建
  • 备份
  • 聚合创建
  • 数据转换

- 如果数据仓库在集群或 MPP 架构上运行,则系统调度管理器必须能够跨架构运行。

系统事件管理器

事件管理器是一种软件。事件管理器管理数据仓库系统上定义的事件。由于数据仓库的结构非常复杂,我们无法手动管理数据仓库。因此,我们需要一个能够自动处理所有事件而无需用户干预的工具。

注意- 事件管理器监视事件的发生并处理它们。事件管理器还跟踪这个复杂的数据仓库系统中可能出现的各种问题。

活动

事件是由用户或系统本身生成的操作。可以注意到,事件是定义的动作的可测量的、可观察的发生。

下面给出了需要跟踪的常见事件的列表。

  • 硬件故障
  • 某些关键磁盘上的空间不足
  • 进程死亡
  • 返回错误的进程
  • CPU 使用率超过 805 阈值
  • 数据库序列化点的内部争用
  • 缓冲区高速缓存命中率超过或失败低于阈值
  • 表达到其最大尺寸
  • 内存交换过多
  • 由于空间不足,表格无法扩展
  • 磁盘出现 I/O 瓶颈
  • 临时或排序区域的使用达到一定阈值
  • 任何其他数据库共享内存使用情况

事件最重要的是它们应该能够自行执行。事件包定义预定义事件的过程。与每个事件关联的代码称为事件处理程序。每当事件发生时就会执行此代码。

系统和数据库管理器

系统和数据库管理器可能是两个独立的软件,但它们执行相同的工作。这些工具的目标是自动化某些流程并简化其他流程的执行。选择系统和数据库管理器的标准如下 -

  • 增加用户配额。
  • 为用户分配和取消分配角色
  • 向用户分配和取消分配配置文件
  • 执行数据库空间管理
  • 监控并报告空间使用情况
  • 整理碎片和未使用的空间
  • 添加并扩展空间
  • 添加和删​​除用户
  • 管理用户密码
  • 管理摘要表或临时表
  • 为用户分配或取消分配临时空间
  • 回收旧的或过时的临时表的空间
  • 管理错误和跟踪日志
  • 浏览日志和跟踪文件
  • 重定向错误或跟踪信息
  • 打开和关闭错误和跟踪日志记录
  • 执行系统空间管理
  • 监控并报告空间使用情况
  • 清理旧的和未使用的文件目录
  • 添加或扩展空间。

系统备份恢复管理器

备份和恢复工具使运营和管理人员可以轻松备份数据。请注意,系统备份管理器必须与所使用的计划管理器软件集成。备份管理所需的重要功能如下 -

  • 调度
  • 备份数据追踪
  • 数据库意识

进行备份只是为了防止数据丢失。以下是要记住的要点 -

  • 备份软件将保留某种形式的数据库,记录备份数据的位置和时间。

  • 备份恢复管理器必须有一个良好的数据库前端。

  • 备份恢复软件应该支持数据库。

  • 了解数据库后,软件就可以用数据库术语进行处理,并且不会执行不可行的备份。