数据仓库 - 面试问题
亲爱的读者,这些数据仓库面试问题是专门为让您熟悉在面试数据仓库主题时可能遇到的问题的性质而设计的。
答:数据仓库是一个面向主题的、集成的、时变的、非易失性的数据集合,支持管理决策过程。
答:面向主题是指数据仓库存储围绕特定主题的信息,例如产品、客户、销售等。
答:一些应用包括金融服务、银行服务、消费品、零售行业、受控制造。
答:OLAP 是在线分析处理的缩写,OLTP 是在线事务处理的缩写。
答:数据仓库包含可用于分析业务的历史信息,而操作数据库包含运行业务所需的当前信息。
答:数据仓库可以实现星型模式、Snowflake模式和事实星座模式。
答:数据仓库是构建和使用数据仓库的过程。
答:数据仓库包括数据清理、数据集成和数据整合。
答:数据仓库工具和实用程序执行的功能是数据提取、数据清理、数据转换、数据加载和刷新。
答:数据提取是指从多个异构源收集数据。
答:元数据简单地定义为关于数据的数据。换句话说,我们可以说元数据是引导我们获得详细数据的汇总数据。
答:元数据呼吸包含数据仓库的定义、业务元数据、操作元数据、从操作环境到数据仓库的映射数据以及汇总算法。
A:数据立方体帮助我们以多个维度来表示数据。数据立方体由维度和事实定义。
答:维度是企业保存记录的实体。
答:数据集市包含组织范围数据的子集。该数据子集对于组织的特定组很有价值。换句话说,我们可以说数据集市包含特定于特定组的数据。
答:操作数据仓库的视图称为虚拟仓库。
答:这些阶段包括 IT 战略、教育、业务案例分析、技术蓝图、构建版本、历史加载、即席查询、需求演变、自动化和扩展范围。
答:负载管理器执行提取和加载进程所需的操作。负载管理器的大小和复杂性因数据仓库的具体解决方案而异。
答:负载管理器从源系统中提取数据。将提取的数据快速加载到临时数据存储中。对类似于数据仓库中结构的结构进行简单转换。
A : 仓库经理负责仓库管理流程。仓库管理器由第三方系统软件、C程序和shell脚本组成。仓库管理器的规模和复杂性因具体解决方案而异。
A:仓库管理员执行一致性和引用完整性检查,针对基础数据创建索引、业务视图、分区视图,将源数据转换并合并到临时存储到发布的数据仓库中,备份数据仓库中的数据,并对已达到捕获寿命终点的数据进行归档。
答:摘要信息是数据仓库中保存预定义聚合的区域。
答:查询管理器负责将查询定向到合适的表。
答:OLAP 服务器有四种类型,即关系型 OLAP、多维 OLAP、混合 OLAP 和专用 SQL 服务器。
答:多维 OLAP 比关系 OLAP 更快。
答:OLAP 执行诸如上卷、下钻、切片、切块和透视等功能。
A:只选择一维进行切片操作。
答:对于骰子操作,为给定的立方体选择两个或多个维度。
答:星型模式中只有一张事实表。
答:标准化将数据拆分到附加表中。
答:Snowflake模式使用规范化的概念。
答:规范化有助于减少数据冗余。
答:数据挖掘查询语言(DMQL)用于模式定义。
答:DMQL 基于结构化查询语言 (SQL)。
A : 分区的原因有很多,例如方便管理、协助备份恢复、提高性能等。
A:数据马丁化涉及到软硬件成本、网络接入成本、时间成本。