第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。
第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依 赖于主键,而不能只依赖于主键的一部分。
第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖 于非主键列 B,非主键列 B 依赖于主键的情况。
什么是范式?
简言之就是,数据库设计对数据的存储性能,还有开发人员对数据的操作都有莫大的关系。所以建立科学的,规范的的数据库是需要满足一些规范的来优化数据数据存储方式。在关系型数据库中这些规范就可以称为范式。
什么是三大范式?
第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。
第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依 赖于主键,而不能只依赖于主键的一部分。
第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖 于非主键列 B,非主键列 B 依赖于主键的情况。
注:关系实质上是一张二维表,其中每一行是一个元组,每一列是一个属性
如何理解三大范式?
第一范式(1NF):
1)、每一列属性都是不可再分的属性值,确保每一列的原子性
2)、两列的属性相近或相似或一样,尽量合并属性一样的列,确保不产生冗余数据
如果需求说要按哪个省哪个市分类,那么显然第一个表格是不容易满足需求的,也不符合第一范式。
第二范式(2NF):
每一行的数据只能与其中一列相关,即一行数据只做一件事。只要数据列中出现数据重复,就要把表拆分开来。
一个人同时买几件商品,就会出来一个订单号多条数据,这样子客户都是重复的,就会造成数据冗余。我们应该把他拆开来。
这样这张表就不会产生数据冗余了。
第三范式(3NF):
数据不能存在传递关系,即没个属性都跟主键有直接关系而不是间接关系。像:a-->b-->c 属性之间含有这样的关系,是不符合第三范式的。
考虑一个订单表T_ORDER(OrderNO,PRODUCTNO,CUSTOMERID,CUSTOMERNAME,CUSTOMERPHONE,CUSTOMERCARDID)主键是(ORDERNO)。
其中 PRODUCTNO,CUSTOMERID,CUSTOMERNAME,CUSTOMERPHONE,CUSTOMERCARDID 等非主键列都完全依赖于主键(ORDERNO),所以符合 2NF.
不过问题是CUSTOMERNAME,CUSTOMERPHONE,CUSTOMERCARDID 直接依赖的是 CUSTOMERID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。
通过拆分T_ORDER为(OrderNO,PRODUCTNO,CUSTOMERID)和T_CUSTOMER(CUSTOMERID,CUSTOMERNAME,CUSTOMERPHONE,CUSTOMERCARDID)从而达到 3NF。如下图:
结论
三大范式只是一般设计数据库的基本理念,可以建立冗余较小、结构合理的数据库。如果有特殊情况,当然要特殊对待,数据库设计最重要的是看需求跟性能,需求>性能>表结构。所以不能一味的去追求范式建立数据库。