概念模型的分析
完成概念模型的定义后,还要进一步考察模型中的用户要求和系统环境。分析数据仓库范围内的主要对象,确定系统的主要主题域以及主要主题域之间的关系。分析阶段将详细检查定义阶段所提出的要求,并且研究任何可能提供解决方案的环境。数据仓库的设计者通过对用户的访问,得到用户对数据仓库结构以及数据仓库存在环境的要求,并将分析结果转变成概念模型,提交给被访问者进行确认,以保证设计者对当前环境的正确理解。
概念模型一般用E-R图的形式表示图中各个对象(实体)间存在着相互关系。在E-R图中,用长方形表示实体,对应于数据仓库中的主题,在框内写上主题的名字。椭圆表示主题的属性,并用连接线将主题和属性连接起来。用菱形表示主题之间的联系,菱形框内写上联系的名字,并把表示联系的菱形与表示主题的长方形连接起来。若主题之间的联系也有属性,则把属性和联系连接起来。
以超市数据仓库为例,在界定系统的边界后,需要确定其业务系统涉及的主要主题域。
根据以上对原有分散的数据库系统的分析,考虑到超市经营者的决策分析需求,再上一步划分系统边界的基础上,首先确定超市数据仓库的三个基本主题:销售主题、商品主题和客户主题。

图1
主题之间的联系有:
·各种商品通过销售与客户发生关系;
·一种商品可以发生多次销售;
·每次销售可以包含多种商品。
这样,在商品主题与销售主题之间就存在多对多的关系。客户主题可能与销售主题发生这样一些关系:有的客户可能会发生多次销售活动,每个销售活动只针对某个特定的客户。这样在客户与销售主题之间就存在一对多的关系。而客户主题与商品主题之间并没有直接的关系,它们之间的联系是经过销售主题产生间接的联系。这样三个主题的概念模型就可以用ERD图表示,如图2所示。

图2