神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL !

  • 时间:
  • 浏览:0
  • 来源:大发时时彩_时时彩手机版ios_大发时时彩手机版ios

前言

  开心一刻 

     有三个小 中国小孩参加国外的脱口秀节目,肯能语言不通,于是找了有三个小 翻译。

    主持人问:“Who is your favorite singer ?”

    翻译:”你最喜欢哪个歌手啊 ?”

    小孩兴奋地回答:”Michael Jackson”

    翻译转身对主持人说:”迈克尔-杰克逊”

    主持人看着翻译:"你爱不爱我哪此 ?"

    电视机前的观众:"我缘何不得劲蒙?" 

NULL

  NULL 用于表示缺失的值或遗漏的未知数据,都是你这人具体类型的值。数据表中的 NULL 值表示该值处于的字段为空,值为 NULL 的字段这麼值,尤其要明白的是:NULL 值与 0 肯能空字符串是不同的。

  你这人 NULL

    你这人说法亲戚朋友肯能会确实很奇怪,肯能 SQL 里只处于你这人 NULL 。然而在讨论 NULL 时,亲戚朋友一般回会将它分成你这人类型来思考:“未知”(unknown)和“不适用”(not applicable,inapplicable)。

    以“告诉我戴墨镜的人眼睛是哪此颜色”你这人情况表为例,你你这人个的眼睛肯定是有颜色的,或者肯能他不摘掉眼镜,别人就告诉我他的眼睛是哪此颜色。这就叫作未知。而“告诉我冰箱的眼睛是哪此颜色”则属于“不适用”。肯能冰箱根本就这麼眼睛,一些一些“眼睛的颜色”你这人属性何必 适用于冰箱。“冰箱的眼睛的颜色”你这人说法和“圆的体积”“男性的分娩次数”一样,都是这麼意义的。平时,亲戚朋友习惯了说“告诉我”,或者“告诉我”也分一些一些种。“不适用”你这人情况表下的 NULL ,在语义上更接近于“无意义”,而都是“不选则”。这里总结一下:“未知”指的是“确实现在告诉我,但加上一些条件后就可不时需知道”;而“不适用”指的是“无论缘何努力都无法知道”。

    关系模型的发明人者 E.F. Codd 最先给出了你这人分类。下图是他对“丢失的信息”的分类

  为哪此时需写成“IS NULL”,而都是“= NULL”

    我相信不少人有或者的困惑吧,尤其是相信刚学 SQL 的小伙伴。亲戚朋友来看个具体的案例,假设亲戚朋友有如下表以及数据

DROP TABLE IF EXISTS t_sample_null;
CREATE TABLE t_sample_null (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(500) NOT NULL COMMENT '名称',
    remark VARCHAR(5000) COMMENT '备注',
    primary key(id)
) COMMENT 'NULL样例';

INSERT INTO t_sample_null(name, remark)
VALUES('zhangsan', '张三'),('李四', NULL);

    亲戚朋友要查询备注为 NULL 的记录(为 NULL 你这人叫法你这人是不对的,或者亲戚朋友日常中肯能叫习惯了,具体往下看),缘何查,一些一些新手会写出或者的 SQL

-- SQL 不报错,但查不在

结果
SELECT * FROM t_sample_null WHERE remark = NULL;

    执行时不报错,或者查不在 亲戚朋友你会的结果, 这是为哪此了 ? 你这人问提亲戚朋友先放着,亲戚朋友往下看

三值逻辑

  你这人三值逻辑都是三目运算,指的是有三个小 逻辑值,一帮人肯能有问提了,逻辑值都是这麼真(true)和假(false)吗,哪来的第有三个小 ? 说这话时亲戚朋友时需注意处于的环境,在主流的编程语言中(C、JAVA、Python、JS等)中,逻辑值确实这麼 2 个,但在 SQL 中却处于第有三个小 逻辑值:unknown。这不得劲累似 于亲戚朋友平时所说的:对、错、告诉我。

  逻辑值 unknown 和作为 NULL 的你这人的 UNKNOWN (未知)是不同的东西。前者是明确的布尔型的逻辑值,后者既都是值也都是变量。为了便于区分,前者采用小写字母 unknown ,后者用大写字母 UNKNOWN 来表示。为了让亲戚朋友理解两者的不同,亲戚朋友来看有三个小 x=x 或者的简单等式。x 是逻辑值 unknown 时,x=x 被判断为 true ,而 x 是 UNKNOWN 时被判断为 unknown 

-- 你这人是明确的逻辑值的比较
unknown = unknown → true

-- 你这人合适NULL = NULL
UNKNOWN = UNKNOWN → unknown

   三值逻辑的逻辑值表

    NOT

    AND

    OR

    图中深紫色 主次是三值逻辑中独有的运算,这在二值逻辑中是这麼的。其余的 SQL 谓词完整篇 都能由这有三个小 逻辑运算组合而来。从你这人意义上讲,你这人十几个 逻辑表可不时需说是 SQL 的母体(matrix)。

    NOT 励志的话 ,肯能逻辑值表比较简单,一些一些很好记;或者对于 AND 和 OR,肯能组合出来的逻辑值较多,一些一些完整篇 记住非常困难。为了便于记忆,请注意这有三个小 逻辑值之间有下面或者的优先级顺序。

      AND 的情况表: false > unknown > true

      OR 的情况表: true > unknown > false

    优先级高的逻辑值会决定计算结果。累似 true AND unknown ,肯能 unknown 的优先级更高,一些一些结果是 unknown 。而 true OR unknown 励志的话 ,肯能 true 优先级更高,一些一些结果是 true 。记住你这人顺序后就能更方便地进行三值逻辑运算了。不得劲时需记住的是,当 AND 运算中所含 unknown 时,结果肯定不用是 true (反之,肯能AND 运算结果为 true ,则参与运算的双方时需都为 true )。

-- 假设 a = 2, b = 5, c = NULL,下列表达式的逻辑值如下

a < b AND b > c  → unknown
a > b OR b < c   → unknown
a < b OR b < c   → true
NOT (b <> c)     → unknown

  “IS NULL” 而非 “= NULL”

    亲戚朋友再回到问提:为哪此时需写成“IS NULL”,而都是“= NULL”

    对 NULL 使用比较谓词后得到的结果无缘无故 unknown 。而查询结果只会所含 WHERE 子句里的判断结果为 true 的行,不用所含判断结果为 false 和 unknown 的行。不或者等号,对 NULL 使用一些比较谓词,结果也都是一样的。一些一些无论 remark 是都是 NULL ,比较结果都是 unknown ,这麼永远这麼结果返回。以下的式子回会被判为 unknown

-- 以下的式子回会被判为 unknown
= NULL
> NULL
< NULL
<> NULL
NULL = NULL

    这麼,为哪此对 NULL 使用比较谓词后得到的结果永远不肯能为真呢?这是肯能,NULL 既都是值也都是变量。NULL 或者有三个小 表示“这麼值”的标记,而比较谓词只适用于值。或者,对何必 值的 NULL 使用比较谓词或者或者这麼意义的。“列的值为 NULL ”、“NULL 值” 或者的说法你这人或者错误的。肯能 NULL都是值,一些一些不在 定义域(domain)中。相反,肯能一帮人认为 NULL 是值,这麼亲戚朋友可不时需倒过来想一下:它是哪此类型的值?关系数据库中处于的值必然属于你这人类型,比如字符型或数值型等。一些一些,假如有一天 NULL 是值,这麼它就时需属于你这人类型。

    NULL 容易被认为是值的导致 有有三个小 。第有三个小 是高级编程语言中间,NULL 被定义为了有三个小 常量(一些一些语言将其定义为了整数0),这导致 了亲戚朋友的混淆。或者,SQL 里的 NULL 和一些编程语言里的 NULL 是完整篇 不同的东西。第六个导致 是,IS NULL 或者的谓词是由有三个小 单词构成的,一些一些亲戚朋友容易把 IS 当作谓词,而把 NULL 当作值。不得劲是 SQL 里还有 IS TRUE 、IS FALSE 或者的谓词,亲戚朋友由此类推,从而或者认为也都是这麼道理。或者正如讲解标准 SQL 的书里提醒亲戚朋友注意的那样,亲戚朋友应该把 IS NULL 看作是有三个小 谓词。或者,写成 IS_NULL 或者你爱不爱我更合适。

温柔的陷阱

  比较谓词和 NULL

    排中律不成立

      排中律指同有三个小 思维过程中,有三个小 相互矛盾的思想这麼同假,必有一真,即“要么A要么非A”

      假设亲戚朋友有学生表:t_student

DROP TABLE IF EXISTS t_student;
CREATE TABLE t_student (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(500) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    remark VARCHAR(5000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student(name, age)
VALUE('zhangsan', 25),('wangwu', 500),('bruce', 32),('yzb', NULL),('boss', 18);

SELECT * FROM t_student;
View Code

      表中数据 yzb 的 age 是 NULL,也或者说 yzb 的年龄未知。在现实世界里,yzb 是 20 岁,肯能都是 20 岁,二者必居其一,这毫无问提是有三个小 真命题。这麼在 SQL 的世界里了,排中律还适用吗? 亲戚朋友来看有三个小 SQL 

SELECT * FROM t_student
WHERE age = 20 OR age <> 20;

      咋一看,这不或者查询表中完整篇 记录吗? 亲戚朋友来看下实际结果

      yzb 没查出来,这是为哪此了?亲戚朋友来分析下,yzb 的 age 是 NULL,这麼这条记录的判断步骤如下

-- 1. 约翰年龄是 NULL (未知的 NULL !)
SELECT *
FROM t_student
WHERE age = NULL
OR age <> NULL;

-- 2. 对 NULL 使用比较谓词后,结果为unknown
SELECT *
FROM t_student
WHERE unknown
OR unknown;

-- 3.unknown OR unknown 的结果是unknown (参考三值逻辑的逻辑值表)
SELECT *
FROM t_student
WHERE unknown;

      SQL 励志的话 的查询结果里这麼判断结果为 true 的行。要想让 yzb 出現 在结果里,时需加上下面或者的 “第 3 个条件”

-- 加上 3 个条件:年龄是20 岁,肯能都是20 岁,肯能年龄未知
SELECT * FROM t_student
WHERE age = 20 
    OR age <> 20
    OR age IS NULL;

    CASE 表达式和 NULL

      简单 CASE 表达式如下

CASE col_1
    WHEN = 1 THEN 'o'
    WHEN NULL THEN 'x'
END

      你这人 CASE 表达式一定不用返回 ×。这是肯能,第六个 WHEN 子句是 col_1 = NULL 的缩写形式。正如亲戚朋友所知,你这人式子的逻辑值永远是 unknown ,或者 CASE 表达式的判断最好的法子与 WHERE 子句一样,只认可逻辑值为 true 的条件。正确的写法是像下面或者使用搜索 CASE 表达式

CASE WHEN col_1 = 1 THEN 'o'
    WHEN col_1 IS NULL THEN 'x'
END

  NOT IN 和 NOT EXISTS 都是等价的

    亲戚朋友在对 SQL 励志的话 进行性能优化时,无缘无故 用到的有三个小 技巧是将 IN 改写成 EXISTS ,这是等价改写,并这麼哪此问提。或者,将 NOT IN 改写成 NOT EXISTS 时,结果何必 一样。

    亲戚朋友来看个例子,亲戚朋友有如下两张表:t_student_A 和 t_student_B,分别表示 A 班学生与 B 班学生 

DROP TABLE IF EXISTS t_student_A;
CREATE TABLE t_student_A (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(500) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    city VARCHAR(500) NOT NULL COMMENT '城市',
    remark VARCHAR(5000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student_A(name, age, city)
VALUE
('zhangsan', 25,'深圳市'),('wangwu', 500, '广州市'),
('bruce', 32, '北京市'),('yzb', NULL, '深圳市'),
('boss', 43, '深圳市');

DROP TABLE IF EXISTS t_student_B;
CREATE TABLE t_student_B (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(500) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    city VARCHAR(500) NOT NULL COMMENT '城市',
    remark VARCHAR(5000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student_B(name, age, city)
VALUE
('马化腾', 45, '深圳市'),('马三', 25, '深圳市'),
('马云', 43, '杭州市'),('李彦宏', 41, '深圳市'),
('年轻人', 25, '深圳市');

SELECT * FROM t_student_A;
SELECT * FROM t_student_B;
View Code

    需求:查询与 A  班住在深圳的学生年龄不同的 B 班学生,也或者查询出 :马化腾 和 李彦宏,你这人 SQL 该如保写,像或者?

-- 查询与 A  班住在深圳的学生年龄不同的 B 班学生 ?
SELECT * FROM t_student_B
WHERE age NOT IN (
    SELECT age FROM t_student_A 
    WHERE city = '深圳市'
);

    亲戚朋友来看下执行结果

    亲戚朋友发现结果是空,查询这麼任何数据,这是为哪此了 ?这里 NULL 又现在现在开始作怪了,亲戚朋友一步一步来看看究竟处于了哪此

    可不时需看出,在进行了一系列的转换后,这麼一根绳子 记录在 WHERE 子句里被判断为 true 。也或者说,肯能 NOT IN 子查询中用到的表里被选则的列中处于 NULL ,则 SQL 励志的话 整体的查询结果永远是空。这是很可怕的问提!

    为了得到正确的结果,亲戚朋友时需使用 EXISTS 谓词

-- 正确的SQL 励志的话

:马化腾和李彦宏将被查询到
SELECT * FROM t_student_B B
WHERE NOT EXISTS ( 
    SELECT * FROM t_student_A A
    WHERE B.age = A.age
    AND A.city = '深圳市' 
);

    执行结果如下

    同样地,亲戚朋友再来一步一步地看看这段 SQL 是如保出理 年龄为 NULL 的行的

    也或者说,yzb 被作为 “与任何人的年龄都是同的人” 来出理 了。EXISTS 只会返回 true 肯能false,永远不用返回 unknown。或者都是了 IN 和 EXISTS 可不时需互相替换使用,而 NOT IN和 NOT EXISTS 却不可不时需互相替换的混乱问提。

  还有一些一些的陷阱,比如:限定谓词和 NULL、限定谓词和极值函数都是等价的、聚合函数和 NULL 等等。

总结

  1、NULL 用于表示缺失的值或遗漏的未知数据,都是你这人具体类型的值,这麼对其使用谓词

  2、对 NULL 使用谓词后的结果是 unknown,unknown 参与到逻辑运算时,SQL 的运行会和预想的不一样

  3、 IS NULL 整个是有三个小 谓词,而都是:IS 是谓词,NULL 是值;累似 的还有 IS TRUE、IS FALSE

  4、要想出理 NULL 带来的各种问提,最佳最好的法子应该是往表里加上 NOT NULL 约束来尽力排除 NULL

    我的项目所含个硬性规定:所有字段时需是 NOT NULL,建表的事先就加上此约束

参考

  《SQL进阶教程》

navicat

  https://gitee.com/youzhibing/tools/blob/master/NavicatforMySQL.rar