现在位置:中国IDC吧>数据库>SQL server数据库> 文章内容

数据库范式

收藏发布 来源:IT专家网 作者:中国IDC吧 更新日期:2008-09-30 点击:
  数据库范式是数据库设计中必不可少的知识,没有对范式的理解,就无法设计出高效率、优雅的数据库,甚至设计出错误的数据库。本文用较为直白的语言介绍范式,旨在便于理解和记忆。

  数据库范式是数据库设计中必不可少的知识,没有对范式的理解,就无法设计出高效率、优雅的数据库,甚至设计出错误的数据库。而想要理解并掌握范式却并不是那 么容易。教科书中一般以关系代数的方法来解释数据库范式。这样做虽然能够十分准确的表达数据库范式,但比较抽象,不太直观,不便于理解,更难以记忆。

  本文用较为直白的语言介绍范式,旨在便于理解和记忆,这样做可能会出现一些不精确的表述。但对于初学者应该是个不错的入门。我写下这些的目的主要是为了加强 记忆,其实我也比较菜,我希望当我对一些概念生疏的时候,回过头来看看自己写的笔记,可以快速地进入状态。如果你发现其中用错误,请指正。

  下面开始进入正题:

  一、基础概念

  要理解范式,首先必须对知道什么是关系数据库,如果你不知道,我可以简单的不能再简单的说一下:关系数据库就是用二维表来保存数据。表和表之间可以……(省略10W字)。

  然后你应该理解以下概念:

  实体:现实世界中客观存在并可以被区别的事物。比如“一个学生”、“一本书”、“一门课”等等。值得强调的是这里所说的“事物”不仅仅是看得见摸得着的“东西”,它也可以是虚拟的,不如说“老师与学校的关系”。

  属性:教科书上解释为:“实体所具有的某一特性”,由此可见,属性一开始是个逻辑概念,比如说,“性别”是“人”的一个属性。在关系数据库中,属性又是个物理概念,属性可以看作是“表的一列”。

  元组:表中的一行就是一个元组。

  分量:元组的某个属性值。在一个关系数据库中,它是一个操作原子,即关系数据库在做任何操作的时候,属性是“不可分的”。否则就不是关系数据库了。

  码:表中可以唯一确定一个元组的某个属性(或者属性组),如果这样的码有不止一个,那么大家都叫候选码,我们从候选码中挑一个出来做老大,它就叫主码。

  全码:如果一个码包含了所有的属性,这个码就是全码。

  主属性:一个属性只要在任何一个候选码中出现过,这个属性就是主属性。

  非主属性:与上面相反,没有在任何候选码中出现过,这个属性就是非主属性。

  外码:一个属性(或属性组),它不是码,但是它别的表的码,它就是外码。

  二、6个范式 1 2 3 4 :   数据库范式是数据库设计中必不可少的知识,没有对范式的理解,就无法设计出高效率、优雅的数据库,甚至设计出错误的数据库。本文用较为直白的语言介绍范式,旨在便于理解和记忆。

  好了,上面已经介绍了我们掌握范式所需要的全部基础概念,下面我们就来讲范式。首先要明白,范式的包含关系。一个数据库设计如果符合第二范式,一定也符合第一范式。如果符合第三范式,一定也符合第二范式…

  第一范式(1NF):属性不可分。

  在前面我们已经介绍了属性值的概念,我们说,它是“不可分的”。而第一范式要求属性也不可分。那么它和属性值不可分有什么区别呢?给一个例子:

  nametelage

  大宝1361234567822

  小明13988776655010-123456721

  Ps:这个表中,属性值“分”了。

  nametelage

  手机座机

  大宝13612345678021-987654322

  小明13988776655010-123456721

  Ps:这个表中,属性 “分”了。

  这两种情况都不满足第一范式。不满足第一范式的数据库,不是关系数据库!所以,我们在任何关系数据库管理系统中,做不出这样的“表”来。

  第二范式(2NF):符合1NF,并且,非主属性完全依赖于码。

  听起来好像很神秘,其实真的没什么。

  一 个候选码中的主属性也可能是好几个。如果一个主属性,它不能单独做为一个候选码,那么它也不能确定任何一个非主属性。给一个反例:我们考虑一个小学的教务 管理系统,学生上课指定一个老师,一本教材,一个教室,一个时间,大家都上课去吧,没有问题。那么数据库怎么设计?(学生上课表)

  学生课程老师老师职称教材教室上课时间 9 1 2 3 4 :   数据库范式是数据库设计中必不可少的知识,没有对范式的理解,就无法设计出高效率、优雅的数据库,甚至设计出错误的数据库。本文用较为直白的语言介绍范式,旨在便于理解和记忆。

  小明一年级语文(上)大宝副教授《小学语文1》10114:30

  一个学生上一门课,一定在特定某个教室。所以有(学生,课程)->教室

  一个学生上一门课,一定是特定某个老师教。所以有(学生,课程)->老师

  一个学生上一门课,他老师的职称可以确定。所以有(学生,课程)->老师职称

  一个学生上一门课,一定是特定某个教材。所以有(学生,课程)->教材

  一个学生上一门课,一定在特定时间。所以有(学生,课程)->上课时间

  因此(学生,课程)是一个码。

  然而,一个课程,一定指定了某个教材,一年级语文肯定用的是《小学语文1》,那么就有课程->教材。(学生,课程)是个码,课程却决定了教材,这就叫做不完全依赖,或者说部分依赖。出现这样的情况,就不满足第二范式!

  有什么不好吗?你可以想想:

  1、校长要新增加一门课程叫“微积分”,教材是《大学数学》,怎么办?学生还没选课,而学生又是主属性,主属性不能空,课程怎么记录呢,教材记到哪呢? ……郁闷了吧?(插入异常)

  2、下学期没学生学一年级语文(上)了,学一年级语文(下)去了,那么表中将不存在一年级语文(上),也就没了《小学语文1》。这时候,校长问:一年级语文(上)用的什么教材啊?……郁闷了吧?(删除异常)

  3、校长说:一年级语文(上)换教材,换成《大学语文》。有10000个学生选了这么课,改动好大啊!改累死了……郁闷了吧?(修改异常)

上一页12 下一页
收藏此页到网摘/书签:
所有评论

评论列表

用户名: 新注册) 密码: 匿名评论