

你是否还在试图你的上司相信对数据仓库投资是盈利的呢?这篇文章摘选自 Han和Kamber的书Data Mining: Concepts and Techniques,讨论了从商业的角度来看数据仓库意味着什么。
“数据仓库为商业分析员提供了什么呢?”首先,数据仓库能提供相关信息来衡量绩效,做出调整,协助他们胜过竞争者。其次,数据仓库可以促进客户关系管理(CRM),因为它能持续跟踪客户和所有商业线、部门和市场的表现。最后,数据仓库能长期、持久的紧随趋势、样式和期望的变动,降低成本。
如果你要设计一种有效的数据仓库,那么你必须了解商业需求并对其加以正确的分析,然后构建一个商业分析框架。构建一项大且复杂的信息系统可以视作是构建一座大型的房屋。在建造房屋的时候,所有者,建筑师和工人都有着不同的视角,在构建系统的时候,与这些不同视角相对应的便是自上而下(top-down)、业务驱动(business-driven)和执行者的视角。
在设计数据仓库时,应考虑以下四种不同的情况:自上而下的视角(top-down)、数据资源的视角(data source),数据仓库的视角和商业质询的视角。
自上而下的视角用来选择数据仓库所必需的相关信息。这些信息必须满足当前和将来的商业需求。
数据资源视角考虑的是操作系统抓取、储存和管理的信息。这些信息可以以不同的细节程度和准确程度来分级备份,从个体数据表到整体数据表都行。数据资源一般都是以传统的数据建模技巧来建模,如实体关系模型或计算机辅助软件工程(CASE)工具。
数据仓库视角包括fact tables和dimension tables。它代表储藏再数据仓库中的信息,包括计算前的totals和counts,以及有关资源、数据和时间源的信息。
商业质询视角指的是终端用户对数据仓库中数据的看法。