根据数据模型建模理论和通用的数据模型框架,数据模型在层级上可被分为主题域模型、概念模型、逻辑模型和物理模型4层,具体说明如表:
模型层级 | 定义 | 包含内容 |
主题域模型 | 包含了组织的业务过程中所涉及的业务主题域及其关系,用于组织范围内高层次的数据规划和设计 | 数据主题; 主题间的关系 |
概念模型 | 针对主题域模型中的每个主题,对主题范围内的关键业务概念对象及其关系的抽象 | 主要数据实体; 主要数据实体间的关系 |
逻辑模型 | 是对概念模型的进一步分解和细化,通常遵从数据模型设计“第三范式”分解业务概念对象并补充其属性,形成逻辑数据实体与属性 | 根据模型设计范式细化的数据实体; 数据实体的属性; 数据实体间的详细关系 |
物理模型 | 逻辑数据模型在信息系统中具体落地的实例,包含模型在考虑到数据冗余与数据库性能之间的平衡的调整,也包含模型在数据库产品、索引等具体实现的相关因素 | 根据数据库、产品、性能、索引等因素设计的数据实体,对应数据库的表; 数据实体的属性,对应数据库的字段; 数据属性的类型、长度; 数据实体间的详细关系 |
在模型构建方法方面,数据模型的设计有两种方式:
- 自上而下:即从业务需求分析开始逐步完成概念模型、逻辑模型的设计,然后进行数据的溯源、认责,与现有应用系统的模型衔接。
- 自下而上:从现有应用级模型开始,逐渐整合,形成物理模型,再从中剥离出具体数据库实现有关的元素,将其整合成逻辑模型并进一步抽象成概念模型。
自上而下方式的好处是得到的模型很容易保障权与协调一致,不存在重复定义、相互冲突 的现象,但当组织的业务非常复杂时,要对全部业务进行需求分析,则工作量巨大。
自下而上方式则服用了现有应用级模型的设计,省去了对组织的全部业务进行需求分析的巨大工作量。但由于应用级模型是在不同历史时期、由不同团队建设而成的,这些模型之间可能普遍存在重复定义、相互冲突等问题,需要对这些不一致问题进行大量的人工核对和整合。
企业中的数据模型设计通常采用自上而下与自下而上相结合的方式:
在进行主题域模型、概念模型等相对高阶的模型设计时,以自上而下的基于业务的分析为主,为实现逻辑层面的模型一致性提供指导。
而在逻辑层面,以自下而上的应用级模型的整合为主,基于使用自上而下方式建立的主题域模型及概念模型的框架,并结合应用级模型中的业务信息,构建逻辑模型。
同时,在企业间相对通用的数据领域也可以参考业界通用模型进行设计补充与提升,具体模型构建方法如表:
模型层次 | 业务流程分析方法 | 物理库表分析方法 | 参考通用模型方法 |
主题域模型 | 分析主要业务活动; | 可根据数据管理的需求,参考业界通用模型中各业务共用的数据领域的划分,作为公共数据主题的划分依据 | |
概念模型 | 通过业务调研及业务流程分析; | 通过整理物理库表及设计文档,提高业务价值的库表作为数据实体; | 根据实际数据情况参考通用模型设计,使用其中实体与关系的设计 |
逻辑模型 | 模型中的属性信息补全并规范化处理; |