y数据库精选（从入门使用到底层结构）漫思|mysql数据库基础知识入门_股票知识

查询所有数据库:SHOW DATABASES;查询当前数据库：SELECT DATABASE();创建数据库：CREATE DATABASE [ IF NOT EXISTS ] 数据库名 [ DEFAULT CHARSET 字符集] [COLLATE 排序规则 ];删除数据库:DROP DATABASE [ IF EXISTS ] 数据库名;使用数据库：USE 数据库名;

查询当前数据库所有表：SHOW TABLES;查询表结构：DESC 表名;查询指定表的建表语句：SHOW CREATE TABLE 表名;

创建表：

所有的要用英文的格式最后一个字段后面没有逗号

添加字段：ALTER TABLE 表名 ADD 字段名类型(长度) [COMMENT 注释] [约束];例：ALTER TABLE emp ADD nickname varchar(20) COMMENT '昵称';

修改数据类型：ALTER TABLE 表名 MODIFY 字段名新数据类型(长度);

修改字段名和字段类型：ALTER TABLE 表名 CHANGE 旧字段名新字段名类型(长度) [COMMENT 注释] [约束];

例：将emp表的nickname字段修改为username，类型为varchar(30)ALTER TABLE emp CHANGE nickname username varchar(30) COMMENT '昵称';

删除字段：ALTER TABLE 表名 DROP 字段名;

修改表名：ALTER TABLE 表名 RENAME TO 新表名

删除表：DROP TABLE [IF EXISTS] 表名;

删除表，并重新创建该表：TRUNCATE TABLE 表名;

指定字段：INSERT INTO 表名 (字段名1, 字段名2, ...) VALUES (值1, 值2, ...);全部字段：INSERT INTO 表名 VALUES (值1, 值2, ...);

批量添加数据：INSERT INTO 表名 (字段名1, 字段名2, ...) VALUES (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...);INSERT INTO 表名 VALUES (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...);

修改数据：UPDATE 表名 SET 字段名1 = 值1, 字段名2 = 值2, ... [ WHERE 条件 ];例：UPDATE emp SET name = 'Jack' WHERE id = 1;

删除数据：DELETE FROM 表名 [ WHERE 条件 ];

语法：

查询多个字段：SELECT 字段1, 字段2, 字段3, ... FROM 表名;SELECT * FROM 表名;

设置别名：SELECT 字段1 [ AS 别名1 ], 字段2 [ AS 别名2 ], 字段3 [ AS 别名3 ], ... FROM 表名;SELECT 字段1 [ 别名1 ], 字段2 [ 别名2 ], 字段3 [ 别名3 ], ... FROM 表名;

去除重复记录：SELECT DISTINCT 字段列表 FROM 表名;

转义：SELECT * FROM 表名 WHERE name LIKE '/_张三' ESCAPE '/'/ 之后的_不作为通配符

语法：SELECT 字段列表 FROM 表名 WHERE 条件列表;

条件：

例子：

常见聚合函数：

语法：SELECT 聚合函数(字段列表) FROM 表名;例：SELECT count(id) from employee where workaddress = "广东省";

语法：SELECT 字段列表 FROM 表名 [ WHERE 条件 ] GROUP BY 分组字段名 [ HAVING 分组后的过滤条件 ];

where 和 having 的区别：

例子：

语法：SELECT 字段列表 FROM 表名 ORDER BY 字段1 排序方式1, 字段2 排序方式2;

排序方式：

例子：

如果是多字段排序，当第一个字段值相同时，才会根据第二个字段进行排序

语法：SELECT 字段列表 FROM 表名 LIMIT 起始索引, 查询记录数;

例子：

FROM -> join -> WHERE -> GROUP BY -> SELECT -> ORDER BY -> LIMIT

查询用户：

创建用户:CREATE USER '用户名'@'主机名' IDENTIFIED BY '密码';

修改用户密码：ALTER USER '用户名'@'主机名' IDENTIFIED WITH mysql_native_password BY '新密码';

删除用户：DROP USER '用户名'@'主机名';

例子：

常用权限：

查询权限：SHOW GRANTS FOR '用户名'@'主机名';

授予权限：GRANT 权限列表 ON 数据库名.表名 TO '用户名'@'主机名';

撤销权限：REVOKE 权限列表 ON 数据库名.表名 FROM '用户名'@'主机名';

函数是指一段可以直接被另外一段程序调用的程序或代码。

常用函数：

使用示例：

常见函数：

常用函数：

例子：

常用函数：

例子：

分类：

约束是作用于表中字段上的，可以再创建表/修改表的时候添加约束。

例子：

外键用来让两张表的数据之间建立连接，从而保证数据的一致性和完整性。

添加外键：

删除外键：ALTER TABLE 表名 DROP FOREIGN KEY 外键名;

更改删除/更新行为：ALTER TABLE 表名 ADD CONSTRAINT 外键名称 FOREIGN KEY (外键字段) REFERENCES 主表名(主表字段名) ON UPDATE 行为 ON DELETE 行为;

案例：部门与员工关系：一个部门对应多个员工，一个员工对应一个部门实现：在多的一方建立外键，指向一的一方的主键

案例：学生与课程关系：一个学生可以选多门课程，一门课程也可以供多个学生选修实现：建立第三张中间表，中间表至少包含两个外键，分别关联两方主键

案例：用户与用户详情关系：一对一关系，多用于单表拆分，将一张表的基础字段放在一张表中，其他详情字段放在另一张表中，以提升操作效率实现：在任意一方加入外键，关联另外一方的主键，并且设置外键为唯一的（UNIQUE）

合并查询（笛卡尔积，会展示所有组合结果）：select * from employee, dept;

笛卡尔积：两个集合A集合和B集合的所有组合情况（在多表查询时，需要消除无效的笛卡尔积）

内连接查询的是两张表交集的部分

隐式内连接：SELECT 字段列表 FROM 表1, 表2 WHERE 条件 ...;

显式内连接：SELECT 字段列表 FROM 表1 [ INNER ] JOIN 表2 ON 连接条件 ...;

显式性能比隐式高

inner join显式内连接是hashtable连接比较，O(Log N)

where隐式内连接是取笛卡尔积过滤，O(N**2)

例子：

左外连接：查询左表所有数据，以及两张表交集部分数据SELECT 字段列表 FROM 表1 LEFT [ OUTER ] JOIN 表2 ON 条件 ...;相当于查询表1的所有数据，包含表1和表2交集部分数据

右外连接：查询右表所有数据，以及两张表交集部分数据SELECT 字段列表 FROM 表1 RIGHT [ OUTER ] JOIN 表2 ON 条件 ...;

例子：

左连接可以查询到没有dept的employee，右连接可以查询到没有employee的dept

当前表与自身的连接查询，自连接必须使用表别名

语法：SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ...;

自连接查询，可以是内连接查询，也可以是外连接查询

例子：

当使用join时，又有需要限制条件如：xxx字段=1。规则：join连接表，where处理条件

例子：

①表A左连接表B ②限制表A的id为2 ③限制表B的id为3

结论：左外连接查询，左表的过滤应该使用WHERE子句，右表的过滤应该使用ON子句；右外连接查询正好相反；全外连接的过滤条件使用ON子句

拓展：

把多次查询的结果合并，形成一个新的查询集

语法：

SQL语句中嵌套SELECT语句，称谓嵌套查询，又称子查询。SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2);子查询外部的语句可以是 INSERT / UPDATE / DELETE / SELECT 的任何一个

根据子查询结果可以分为：

根据子查询位置可分为：

子查询返回的结果是单个值（数字、字符串、日期等）。常用操作符：- < > > >= < <=

例子：

返回的结果是一列（可以是多行）。

常用操作符：

例子：

返回的结果是一行（可以是多列）。常用操作符：=, <, >, IN, NOT IN

例子：

返回的结果是多行多列常用操作符：IN

特别注意点：SQL在使用in()的时候要注意，括号内一定要有数据，如果没有数据或者null则会报错SQL语法错误

例子：

事务是一组操作的集合，事务会把所有操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时失败。

基本操作：

操作方式二：

开启事务：START TRANSACTION 或 BEGIN TRANSACTION;提交事务：COMMIT;回滚事务：ROLLBACK;

操作实例：

开启事务后，只有手动提交才会改变数据库中的数据。

并发事务隔离级别：

查看事务隔离级别：SELECT @@TRANSACTION_ISOLATION;设置事务隔离级别：SET [ SESSION | GLOBAL ] TRANSACTION ISOLATION LEVEL {READ UNCOMMITTED | READ COMMITTED | REPEATABLE READ | SERIALIZABLE };SESSION 是会话级别，表示只针对当前会话有效，GLOBAL 表示对所有会话有效

拓展：

MySQL体系结构：

存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式。存储引擎是基于表而不是基于库的，所以存储引擎也可以被称为表引擎。MySQL5.5+默认存储引擎是InnoDB。

InnoDB 是一种兼顾高可靠性和高性能的通用存储引擎，在 MySQL 5.5 之后，InnoDB 是默认的 MySQL 引擎。

特点：

文件：

参数：innodb_file_per_table，决定多张表共享一个表空间还是每张表对应一个表空间

知识点：

查看 Mysql 变量：show variables like 'innodb_file_per_table';

MyISAM 是 MySQL 早期的默认存储引擎。

特点：

文件：

Memory 引擎的表数据是存储在内存中的，受硬件问题、断电问题的影响，只能将这些表作为临时表或缓存使用。

特点：

文件：

不同引擎之间主要的区别为：事务、行级锁、外键

在选择存储引擎时，应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统，还可以根据实际情况选择多种存储引擎进行组合。

查看当前数据库的 INSERT, UPDATE, DELETE, SELECT 访问频次：

-- session 是查看当前会话 ;

-- global 是查询全局数据 ;

SHOW GLOBAL STATUS LIKE 'Com_______'; 或者 SHOW SESSION STATUS LIKE 'Com_______';例：show global status like 'Com_______'

查看慢查询日志开关状态：（默认是关闭的）show variables like 'slow_query_log';

SELECT @@have_profiling;profiling 默认关闭，可以通过set语句在session/global级别开启 profiling：SET profiling = 1;查看所有语句的耗时：show profiles;查看指定query_id的SQL语句各个阶段的耗时：show profile for query query_id;查看指定query_id的SQL语句CPU的使用情况show profile cpu for query query_id;

EXPLAIN 或者 DESC 命令获取 MySQL 如何执行 SELECT 语句的信息，包括在 SELECT 语句执行过程中表如何连接和连接的顺序。语法：直接在select语句之前加上关键字 explain / descEXPLAIN SELECT 字段列表 FROM 表名 HWERE 条件;

EXPLAIN 各字段含义：

id：select 查询的序列号，表示查询中执行 select 子句或者操作表的顺序（id相同，执行顺序从上到下；id不同，值越大越先执行）

select_type：表示 SELECT 的类型，常见取值有 SIMPLE（简单表，即不适用表连接或者子查询）、PRIMARY（主查询，即外层的查询）、UNION（UNION中的第二个或者后面的查询语句）、 SUBQUERY（SELECT/WHERE之后包含了子查询）等

type：表示连接类型，性能由好到差的连接类型为 NULL、system、const、eq_ref、ref、range、index、all

聚集索引查询是const，二级索引查询是ref，不用索引查询是all（全表扫描）

possible_key：可能应用在这张表上的索引，一个或多个

Key：实际使用的索引，如果为 NULL，则没有使用索引

Key_len：表示索引中使用的字节数，该值为索引字段最大可能长度，并非实际使用长度，在不损失精确性的前提下，长度越短越好

rows：MySQL认为必须要执行的行数，在InnoDB引擎的表中，是一个估计值，可能并不总是准确的

filtered：表示返回结果的行数占需读取行数的百分比，filtered的值越大越好

索引是帮助 MySQL 高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查询算法，这种数据结构就是索引。

优点：

缺点：

红黑树也存在大数据量情况下，层级较深，检索速度慢的问题。

为了解决上述问题，可以使用 B-Tree 结构。B-Tree (多路平衡查找树) 以一棵最大度数（max-degree，指一个节点的子节点个数）为5（5阶）的 b-tree 为例（每个节点最多存储4个key，5个指针）

结构图：

注意：页与页之间是双向链表，页内是单项链表。

以下图为例：6和12之间应是单向链表；6 12 和16 18 之间应是双向链表

与 B-Tree 的区别：

MySQL 索引数据结构对经典的 B+Tree 进行了优化。在原 B+Tree 的基础上，增加一个指向相邻叶子节点的链表指针，就形成了带有顺序指针的 B+Tree，提高区间访问的性能。

注意：页与页之间是双向链表，页内是单项链表。

以下图为例：6和12之间应是单向链表；6 12 和16 18 之间应是双向链表

哈希索引就是采用一定的hash算法，将键值换算成新的hash值，映射到对应的槽位上，然后存储在hash表中。如果两个（或多个）键值，映射到一个相同的槽位上，他们就产生了hash冲突（也称为hash碰撞），可以通过链表来解决。

特点：

存储引擎支持：

在 InnoDB 存储引擎中，根据索引的存储形式，又可以分为以下两种：（也可以称为是聚簇索引和非聚簇索引）

聚集索引选取规则：

演示图：

聚集索引是存放主键为key，叶子节点数据为主键那行的所有数据

二级索引（辅助索引）是存放当前索引字段的值，叶子节点数据为索引字段当行的id值（使用二级索引【回表查询】：会根据字段值找到当行id，再使用id去查聚集索引，从而获取当行数据）

1. 以下 SQL 语句，哪个执行效率高？为什么？

答：第一条语句，因为第二条需要回表查询，相当于两个步骤。

2. InnoDB 主键索引的 B+Tree 高度为多少？

答：假设一行数据大小为1k，一页中可以存储16行这样的数据。InnoDB 的指针占用6个字节的空间，主键假设为bigint，占用字节数为8.可得公式：n * 8 + (n + 1) * 6 = 16 * 1024，其中 8 表示 bigint 占用的字节数，n 表示当前节点存储的key的数量，(n + 1) 表示指针数量（比key多一个）。算出n约为1170。

如果树的高度为2，那么他能存储的数据量大概为：1171 * 16 = 18736；如果树的高度为3，那么他能存储的数据量大概为：1171 * 1171 * 16 = 21939856。

另外，如果有成千上万的数据，那么就要考虑分表，涉及运维知识。

创建索引：CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name, ...);如果不加 CREATE 后面不加索引类型参数，则创建的是常规索引

查看索引：SHOW INDEX FROM table_name;

删除索引：DROP INDEX index_name ON table_name;

案例：

如果索引关联了多列（联合索引），要遵守最左前缀法则，最左前缀法是查询从索引的最左列开始，并且不跳过索引中的列。

最左前缀法则失效的两种情况：

查询的时候如果跳跃某一列，索引将部分失效（后面的字段索引失效）。跳过的话，后面的排序就无从说起了。

注意：最左前缀法则在用select的时候，和放的位置是没有关系的，只要存在就行（这里说的是select后面）

索引是idx_age_sta_pro，where后三者age、status、profession，顺序不能反且必须age在最前面，然后status，profession。若是age、profession则只有age才走索引。

联合索引中，出现范围查询（<, >），范围查询右侧的列索引失效。可以用>=或者<=来规避索引失效问题。因为使用了等于号后右侧的索引列仍然生效。下面这个的索引是idx_pro_age_sta

在索引列上进行运算操作，索引将失效。如：explain select * from tb_user where substring(phone, 10, 2) = '15'; 换成 explain select * from tb_user where phone = '17799990015';这是可以的。

这里的运算操作包含：函数、类型转换等

字符串类型字段使用时，不加引号会导致隐式类型转换，索引将失效。如：explain select * from tb_user where phone = 17799990015;，此处phone的值没有加引号

模糊查询中，字符开头的都会导致索引失效，如：%我、_你① 如果仅仅是尾部模糊匹配，索引不会是失效；explain select * from tb_user where profession like '软件%';② 如果是头部模糊匹配，索引失效。如：explain select * from tb_user where profession like '%工程';，③ 前后都有 % 也会失效。

用 or 分割开的条件，如果 or 其中一个条件的列没有索引，那么涉及的索引都不会被用到。

如果 MySQL 评估使用索引比全表更慢，则不使用索引。

SQL提示就是指定索引

是优化数据库的一个重要手段，简单来说，就是在SQL语句中加入一些人为的提示来达到优化操作的目的。

use 是建议，实际使用哪个索引 MySQL 还会自己权衡运行速度去更改，force就是无论如何都强制使用该索引。

覆盖索引：查询条件使用了索引，并且需要返回的列在该索引中已经全部能找到。

explain 语句中 extra 字段含义：using index condition：查找使用了索引，但是需要回表查询数据using where; using index;：查找使用了索引，但是需要的数据都在索引列中能找到，所以不需要回表查询

覆盖索引效率分析：①②③没懂可以看看前面聚集索引分类的图

① 如果在聚集索引中直接能找到对应的行，则直接返回行数据，只需要一次查询，哪怕是select *；如select * from tab where id=1;

② 如果在生成的二级索引（辅助索引）中可以一次性获得select所需要的字段，不需要回表查询。如select id, name from xxx where name='xxx';，也只需要通过辅助索引(name)查找到对应的id，返回name和name索引对应的id即可，只需要一次查询；

③ 如果是通过二级索引查找其他字段，则需要回表查询，如select id, name, gender from xxx where name='xxx';

所以尽量不要用select *，容易出现回表查询，降低效率，除非有联合索引包含了所有字段

例子：

第一条sql是直接聚集索引可以查到数据

第二条sql需要先二级索引查到id，然后再用id去聚集索引查到那行数据

面试题：一张表，有四个字段（id, username, password, status），由于数据量大，需要对以下SQL语句进行优化，该如何进行才是最优方案：select id, username, password from tb_user where username='itcast';

解：给username和password字段建立联合索引，则不需要回表查询，直接覆盖索引。username和password字段建立联合索引的叶子节点挂的就是 id 所以不需要三者同时建索引。

当字段类型为字符串（varchar, text等）时，有时候需要索引很长的字符串，这会让索引变得很大，查询时，浪费大量的磁盘IO，影响查询效率，此时可以只将字符串的一部分前缀建立索引，这样可以大大节约索引空间，从而提高索引效率。

语法：create index idx_xxxx on table_name(columnn(n));例子：create index idx_user_phone_5 on table_name(phone(5));前缀长度：可以根据索引的选择性来决定，而选择性是指不重复的索引值（基数）和数据表的记录总数的比值，索引选择性越高则查询效率越高，唯一索引的选择性是1，这是最好的索引选择性，性能也是最好的。

求选择性公式：

前缀索引中是有可能碰到相同的索引的情况的（因为选择性可能不为1），所以使用前缀索引进行查询的时候，mysql 会有一个回表查询的过程，确定是否为所需数据。如图中的查询到lvbu6之后还要进行回表，回表完再查xiaoy，看到xiaoy是不需要的数据，则停止查下一个。

show index 里面的sub_part可以看到接取的长度

单列索引：即一个索引只包含单个列联合索引：即一个索引包含了多个列在业务场景中，如果存在多个查询条件，考虑针对于查询字段建立索引时，建议建立联合索引，而非单列索引。

单列索引情况：

explain select id, phone, name from tb_user where phone = '17799990010' and name = '韩信';phone 和 name 都建立了单列索引情况下，这句只会用到phone索引字段（左边优先）

联合索引的数据组织图：先根据第一个字段排序，若第一个字段相同才根据第二个字段排序（默认顺序排序）

注意事项：

当需要查询一张表的两个字段信息，且已经有字段A索引、字段B索引、字段AB联合索引。此时查询会使用哪个索引？

答：使用AB字段联合索引。原因：MySQL的查询优化器也不能在执行前判断哪个索引才最好，所以它选择规则是：索引数量少、索引覆盖范围最广，最有可能用到的索引。

省流版：

普通插入：

采用批量插入（一次插入的数据不建议超过1000条，500 - 1000 为宜）

设置手动提交事务

mysql默认是每次操作都会提交一次事务，这样很消耗数据库性能，要改成多次操作一次性提交

主键顺序插入（主键顺序插入的效率大于乱序插入）

就是按照id：1，2，3，4，5插入比id：5，0，9，1，36，2插入效率高

大批量插入：

如果一次性需要插入大批量数据，使用insert语句插入性能较低，此时可以使用MySQL数据库提供的load指令插入。

本地文件只需要有一定规则就可以直接加载进数据库表中。

如：1,conan,男,180,120 几个字段就几个数据对应，中间用逗号/分号/句号等统一符号即可

使用load指令的操作：

主键设计原则：

数据组织方式：在InnoDB存储引擎中，表数据都是根据主键顺序组织存放的，这种存储方式的表称为索引组织表（Index organized table, IOT）

主键的顺序插入过程如下：

但是如果主键是乱序插入的话，就会导致需要插入的位置为中间的位置，会有页分裂的过程。

页分裂：页可以为空，也可以填充一般，也可以填充100%，每个页包含了2-N行数据（如果一行数据过大，会行溢出），根据主键排列。

页合并：当删除一行记录时，实际上记录并没有被物理删除，只是记录被标记（flaged）为删除并且它的空间变得允许被其他记录声明使用。当页中删除的记录到达 MERGE_THRESHOLD（默认为页的50%），InnoDB会开始寻找最靠近的页（前后）看看是否可以将这两个页合并以优化空间使用。

MERGE_THRESHOLD：合并页的阈值，可以自己设置，在创建表或创建索引时指定

总结：

创建索引时都是升序，如果order by字段全部使用升序排序或者降序排序，则都会走索引，但是如果一个字段升序排序，另一个字段降序排序，则不会走索引，explain的extra信息显示的是Using index, Using filesort，如果要优化掉Using filesort，则需要另外再创建一个索引，如：create index idx_user_age_phone_ad on tb_user(age asc, phone desc);，此时使用select id, age, phone from tb_user order by age asc, phone desc;会全部走索引

总结：

如索引为idx_user_pro_age_stat，则句式可以是select ... where profession order by age，这样也符合最左前缀法则

常见的问题如limit 2000000, 10，此时需要 MySQL 排序前2000000条记录，但仅仅返回2000000 - 2000010的记录，其他记录丢弃，查询排序的代价非常大。优化方案：一般分页查询时，通过创建覆盖索引能够比较好地提高性能，可以通过覆盖索引加子查询形式进行优化

例如：

MyISAM 引擎把一个表的总行数存在了磁盘上，因此执行 count(*) 的时候会直接返回这个数，效率很高（前提是不适用where）；InnoDB 在执行 count(*) 时，需要把数据一行一行地从引擎里面读出来，然后累计计数。优化方案：自己计数，如创建key-value表存储在内存或硬盘，或者是用redis

count的几种用法：

各种用法的性能：

按效率排序：count(字段) < count(主键) < count(1) < count(*)，所以尽量使用 count(*)

InnoDB 的行锁是针对索引加的锁，不是针对记录加的锁，并且该索引不能失效，否则会从行锁升级为表锁。

如以下两条语句：update student set no = '123' where id = 1;，这句由于id有主键索引，所以只会锁这一行；update student set no = '123' where name = 'test';，这句由于name没有索引，所以会把整张表都锁住进行数据更新，解决方法是给name字段添加索引，就可以由表锁变成行锁。

若对视图进行增数据操作是可以插入的，且插入到关联的表中

视图（View）是一种虚拟存在的表。视图中的数据并不在数据库中实际存在，行和列数据来自定义视图的查询中使用的表，并且是在使用视图时动态生成的。通俗的讲，视图只保存了查询的SQL逻辑，不保存查询结果。所以我们在创建视图的时候，主要的工作就落在创建这条SQL查询语句上。

CREATE [ OR REPLACE ] VIEW 视图名称[（列名列表）] AS SELECT 语句 [ WITH [ CASCADED | LOCAL ] CHECK OPTION ]

例子： create or replace view stu_wll as select id,name from student where id<=10;

查看创建视图语句： SHOW CREATE VIEW视图名称；

查看视图数据：SELECT*FROM 视图名称；show create view stu_v_1;

方式一：CREATE[OR REPLACE] VIEW 视图名称[（列名列表)）] AS SELECT 语句[ WITH[ CASCADED | LOCAL ] CHECK OPTION ]

方式二：ALTER VIEW 视图名称 [（列名列表)] AS SELECT语句 [WITH [CASCADED | LOCAL] CHECK OPTION]

例子：

DROP VIEW [IF EXISTS] 视图名称 [视图名称]

当使用WITH CHECK QPTION子句创建/修改视图时，MySQL会通过视图检查正在更改的每个行，例如插入，更新，删除，以使其符合视图的定义。MySQL允许基于另一个视图创建视图，它还会检查依赖视图中的规则以保持一致性。为了确定检查的范围，mysql提供了两个选项：CASCADED 和 LOCAL ，默认值为 CASCADED。

NOTE：如果没有开检查选项就不会进行检查。不同版本是不同含义的，要看版本。

级联检查：增删改的时候会检查是否符合当前视图的条件，以及与当前视图有关联的视图（如该视图是基于另一视图创建的，也需要符合另一视图的条件，因为级联检查会相当于给当前视图以及与之有关联的视图都增加CASCADED）

例子：

本地的条件也会检查，还会向上检查。在向上找的时候，就要看是否上面开了检查选项，如果没开就不检查。和 CASCADED 的区别就是 CASCADED 不管上面开没开检查选项都会进行检查。LOCAL是会递归上面有关视图，遍历到的视图开启了LOCAL才会检查条件。

例子：

视图更新限制条件：

要使视图可更新，视图中的行与基础表中的行之间必须存在一对一的关系。如果视图包含以下任何一项，则该视图不可更新

例子：使用了聚合函数，插入会失败。create view stu_v_count as select count(*) from student;insert into stu_v_count values(10);

视图作用：

视图不仅可以简化用户对数据的理解，也可以简化他们的操作。那些被经常使用的查询可以被定义为视图，从而使得用户不必为以后的操作每次指定全部的条件。

安全

数据独立

视图可帮助用户屏蔽真实表结构变化带来的影响。（查表字段的时候给字段取别名，这样视图名称不会被真是表所影响）

总而言之类似于给表加上了一个外壳，通过这个外壳访问表的时候，只能按照所设计的方式进行访问与更新。

存储过程和函数是事先经过编译并存储在数据库中的一段 SQL 语句的集合，调用存储过程和函数可以简化应用开发人员的很多工作，减少数据在数据库和应用服务器之间的传输，对于提高数据处理的效率是有好处的（存储过程思想上很简单，就是数据库SQL 语言层面的代码封装与重用）存储过程和函数的区别在于函数必须有返回值，而存储过程没有。函数：是一个有返回值的过程；过程：是一个没有返回值的函数；

特点

注意：在命令行中，执行创建存储过程的SQL时，默认是分号作为结束符，需要在执行begin end前通过关键字delimiter 指定SQL语句的结束符。

CALL 名称 ( [参数])

查询指定数据库的存储过程及状态信息

存储过程名称；--查询某个存储过程的定义

SHOW CREATE PROCEDURE

例子：

DROP PROCEDURE [ IFEXISTS ] 存储过程名称

如：drop procedure if exists pro_test1;

存储过程是可以编程的，意味着可以使用变量，表达式，控制结构，来完成比较复杂的功能。

在MySQL中变量分为三种类型: 系统变量、用户定义变量、局部变量

系统变量是MySQL服务器提供，不是用户定义的，属于服务器层面。分为全局变量（GLOBAL）、会话变量（SESSION）。

查看系统变量

设置系统变量

注意:

如果没有指定SESSION/GLOBAL，默认是SESSION会话变量

A. 全局变量(GLOBAL): 全局变量针对于所有的会话。

B. 会话变量(SESSION): 会话变量针对于单个会话，在另外一个会话窗口就不生效了。

赋值（赋值时，可以使用 = ，也可以使用 := ）

方式一：

方式二：

使用

变量类型就是数据库字段类型：INT、BIGINT、CHAR、VARCHAR、DATE、TIME等

赋值

通过 DECLARE 可以定义一个局部变量，该变量的作用范围只能在 BEGIN…END 块中。

DECLARE var_name[,...] type [DEFAULT value]示例：

直接赋值使用 SET，可以赋常量或者赋表达式，具体语法如下：

SET var_name = expr [, var_name = expr] ...示例：

也可以通过select ... into 方式进行赋值操作：

语法结构：

例子需求：

根据定义的身高变量，判定当前身高的所属的身材类型180 及以上 ----------> 身材高挑170 - 180 ---------> 标准身材170 以下 ----------> 一般身材

存储过程实现如下：

调用：call pro_test5 ( ) ;

语法格式 :

需求：每次调用存储过程的时候动态的传入身高，返回体型值

需求：定义两个参数，传入身高和身材描述的值（传出参数）

调用：

call pro_test7(178, @description);查询得到的身材描述的变量值，我们需要单独去查询下：

select @description;

需求：将传入的200分制的分数，进行换算，换算成百分制，然后返回。

语法结构 :

需求：给定一个月份, 然后计算出所在的季度

语法结构:

调用效果如下：

有条件的循环控制语句, 当满足条件的时候退出循环。while 是满足条件才执行，repeat 是满足条件就退出循环。语法结构 :

需求：计算从1到n的和

LOOP 实现简单的循环，退出循环的条件需要使用其他的语句定义，通常可以使用 LEAVE 语句实现，具体语法如下：

如果不在 statement_list 中增加退出循环的语句，那么 LOOP 语句可以用来实现简单的死循环。

用来从标注的流程构造中退出，通常和 BEGIN ... END 或者循环一起使用。下面是一个使用 LOOP 和 LEAVE 的简单例子 , 退出循环：

OPEN 光标：

FETCH 光标：

CLOSE 光标：

条件处理程序：条件处理程序（Handler）可以用来定义在流程控制结构执行过程中遇到问题时相应的处理步骤。具体语法为：

DECLARE handler action HANDLER FOR condition value L condition value]..statement

handler_action CONTINUE：继续执行当前程序

EXIT：终止执行当前程序

condition_value :

SQLSTATE sqlstate_value：状态码，如02000

SQLWARNING：所有以01开头的SQLSTATE代码的简写

NOT FOUND：所有以02开头的SQLSTATE代码的简写

SQLEXCEPTION：所有没有被SQLWARNING或NOT FOUND捕获的SQLSTATE代码的简写

例子：

要求：根据传入的参数uage，来查询用户表tb_user中，所有的用户年龄小于等于uage的用户姓名（name）和专业（profession），并将用户的姓名和专业插入到所创建的一张新表（id，name，profession）中。

示例 :

初始化脚本:

需求：查询emp表中数据, 并逐行获取进行展示

调用效果如下：

可以看到最后的时候报了一个错误：ERROR 1329 (02000): No data - zero rows fetched, selected, or processed，这是因为游标中已经没有数据了，而我们还在fetch，所以就报错了。我们要防止这个错误，就要使用循环来从游标中获取数据，如下操作：

注意：切记一点，until语句后面是没有分号结尾的

调用效果：

存储过程和存储函数的区别：存储过程更多用来封装脚本（执行一些重复性操作），存储函数更多是封装一个简单的方法（查询操作）不能修改表数据。

语法结构：

案例：定义一个存储函数, 请求满足条件的总记录数 ;

调用：

触发器是与表有关的数据库对象，指在 insert/update/delete 之前或之后，触发并执行触发器中定义的SQL语句集合。触发器的这种特性可以协助应用在数据库端确保数据的完整性 , 日志记录 , 数据校验等操作。

使用别名 OLD 和 NEW 来引用触发器中发生变化的记录内容，这与其他的数据库是相似的。现在Mysql触发器还只支持行级触发，不支持语句级触发(Oracle支持语句级触发)。

语法结构：

需求：通过触发器记录 emp 表的数据变更日志 , 包含增加, 修改 , 删除 ;

首先创建一张日志表 :

创建成功之后，我们就执行语句，往emp表中插入一条新的数据，然后查询emp_logs表，看是否有记录信息：

效果如下：

创建成功之后，我们修改一条emp表中的数据，然后再次查询emp_logs表：

效果如下：

操作成功之后，我们删除emp表中的一条数据，然后查看效果：

如果没有指定 schema_name，默认为当前数据库。

可以通过执行 SHOW TRIGGERS 命令查看触发器的状态、语法等信息。

以下的互斥是说事务还没提交之前，其他事务无法提交

锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中，除传统的计算资源（CPU、RAM、I/O）的争用以外，数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题，锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说，锁对数据库而言显得尤其重要，也更加复杂。

NOTE : 针对事物才有加锁的意义。

分类：MySQL中的锁，按照锁的粒度分，分为以下三类：

全局锁就是对整个数据库实例加锁，加锁后整个实例就处于只读状态，后续的DML的写语句，DDL语句，已经更新操作的事务提交语句都将被阻塞。使用场景：全库的逻辑备份，对所有的表进行锁定，从而获取一致性视图，保证数据的完整性。

注意：一般不用全局锁来备份，因为有不加锁的备份方式。

在InnoDB引擎中，在备份语句中加参数 --single-transaction 来完成不加锁的一致性数据备份

红色箭头是访问失败，绿色是访问成功

表级锁，每次操作锁住整张表。锁定粒度大，发生锁冲突的概率最高，并发度最低。应用在MyISAM、InnoDB、BDB等存储引擎中。

对于表级锁，主要分为以下三类：

读锁不会阻塞其他客户端的读，但是会阻塞写。写锁既会阻塞其他客户端的读，又会阻塞其他客户端的写。

红色箭头是访问失败，绿色是访问成功

元数据锁（meta data lock，MDL），MDL加锁过程是系统自动控制，无需显式使用，在访问一张表的时候会自动加上。MDL锁主要作用是维护表元数据的数据一致性，在表上有活动事务的时候，不可以对元数据进行写入操作。

重点：在MySQL5.5中引入了MDL，当对一张表进行增删改查的时候，加MDL读锁（共享）;当对表结构(alter)进行变更操作的时候，加MDL写锁（排他）。

意向锁: 为了避免DML在执行时，加的行锁与表锁的冲突，在InnoDB中引入了意向锁，使得表锁不用检查每行数据是否加锁，使用意向锁来减少表锁的检查。

重点：一个客户端对某一行加上了行锁，那么系统也会对其表加上一个意向锁，当别的客户端来想要对其加上表锁时，便会检查意向锁是否兼容，若是不兼容，便会阻塞直到意向锁释放。

行级锁，每次操作锁住对应的行数据。锁定粒度最小，发生锁冲突的概率最低，并发度最高。应用在InnoDB存储引擎中（只有InnoDB才有）InnoDB的数据是基于索引组织的，行锁是通过对索引上的索引项加锁来实现的，而不是对记录加的锁。对于行级锁，主要分为以下三类：

行锁（Record Lock）：锁定单个行记录的锁，防止其他事务对此行进行update和delete。在RC（read commit ）、RR（repeat read）隔离级别下都支持。

间隙锁（GapLock）：锁定索引记录间隙（不含该记录），确保索引记录间隙不变，防止其他事务在这个间隙进行insert，产生幻读。在RR隔离级别下都支持。比如说两个临近叶子节点为 15 23，那么间隙就是指 [15 , 23],锁的是这个间隙。

临键锁（Next-Key Lock）：行锁和间隙锁组合，同时锁住数据，并锁住数据前面的间隙Gap。在RR隔离级别下支持。

默认情况下，InnoDB在REPEATABLE READ事务隔离级别运行，InnoDB使用next-key 锁（临键锁）进行搜索和索引扫描，以防止幻读。

注意：间隙锁唯一目的是防止其他事务插入间隙。间隙锁可以共存，一个事务采用的间隙锁不会阻止另一个事务在同一间隙上采用间隙锁。

表空间（ibd文件），一个mysql实例可以对应多个表空间，用于存储记录、索引等数据。

段，分为数据段（Leaf node segment）、索引段（Non-leaf node segment）、回滚段（Rollback segment），InnoDB是索引组织表，数据段就是B+树的叶子节点，索引段即为B+树的非叶子节点。段用来管理多个Extent（区）。

区，表空间的单元结构，每个区的大小为1M。默认情况下，InnoDB存储引擎页大小为16K，即一个区中一共有64个连续的页。

页，是InnoDB存储引擎磁盘管理的最小单元，每个页的大小默认为16KB。为了保证页的连续性，InnoDB存储引擎每从磁盘申请4-5个区。一页包含若干行。

行，InnoDB存储引擎数据是按进行存放的。

Buffer Pool：缓冲池是主内存中的一个区域，里面可以缓存磁盘上经常操作的真实数据，在执行增删改查操作时，先操作缓冲池中的数据（若缓冲池没有数据，则从磁盘加载并缓存），然后再以一定频率刷新到磁盘，从而减少磁盘I0，加快处理速度。

InnoDB的整个体系结构为：

当业务操作的时候直接操作的是内存缓冲区，如果缓冲区当中没有数据，则会从磁盘中加载到缓冲区，增删改查都是在缓冲区的，后台线程以一定的速率刷新到磁盘。

事务是一组操作的集合，它是一个不可分割的工作单位，事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时败。具有ACID四大特征。

原子性，一致性，持久性这三大特性由 redo log 和 undo log 日志来保证的。隔离性是由锁机制和MVCC保证的。

redo log:

重做日志，记录的是事务提交时数据页的物理修改，是用来实现事务的持久性。该日志文件由两部分组成：重做日志缓冲（redo log buffer）以及重做日志文件（redo log file），前者是在内存中，后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中，用于在刷新脏页到磁盘，发生错误时，进行数据恢复使用。

前置知识：每次增删改都是将操作先放入Buffer Pool和redolog buffer中，然后再写入磁盘。

个人理解：事物每次提交的时候都会将数据刷到redo log中而不是直接将buffer pool中的数据直接刷到磁盘中（ibd文件中），是因为redo log 是顺序写，性能处理的够快，而Buffer Pool直接刷到ibd中，是随机写，性能慢。所以脏页是在下一次读的时候，或者后台线程采用一定的机制进行刷盘到ibd中。

最新个人理解：当Buffer Pool可以正常同步到磁盘文件时，就不用redolog日志。但假如Buffer Pool写入磁盘时发生错误（宕机），就会通过Redolog buffer将未同步的脏数据同步到磁盘。

注意：

undo log:回滚日志，用于记录数据被修改前的信息，作用包含两个：提供回滚和MVCC（多版本并发控制）。undo log和redo log记录物理日志不一样，它是逻辑日志，记录逆操作。可以认为当delete一条记录，undo log中会记录一条对应的insert记录，反之亦然，当update一条记录时，它记录一条对应相反的update记录。当执行rollback时，就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。

Undo log销毁：undo log在事务执行时产生，事务提交时，并不会立即删除undo log，因为这些日志可能还用于MVCC。Undo log存储：undo log采用段的方式进行管理和记录，存放在前面介绍的rollback segment回滚段中，内部包含1024个undo log segment。

自己Process on上的总结

面试题：

redolog和undolog的区别是什么？

redo log：记录的是数据页的物理变化，服务宕机可用来同步数据。undo log：记录的是逻辑日志，当事务滚时，通过逆操作恢复原来的数据。

区别：redo log保证了事务的持久性，undolog保证了事务的原子性和一致性

答：

1）其中redo log日志记录的是数据页的物理变化，服务宕机可用来同步数据。而undo log不同，它主要记录的是逻辑日志，当事务回滚时，通过逆操作恢复原来的数据，比如我们删除一条数据的时候，就会在undo log日志文件中新增一条delete语句，如果发生回滚就执行逆操作;2）redo log保证了事务的持久性，undo log保证了事务的原子性和一致性

读取的是记录的最新版本，读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。对于我们日常的操作，如：

简单的select（不加锁）就是快照读，快照读，读取的是记录数据的可见版本，有可能是历史数据，不加锁，是非阻塞读。

这个原理去看自己的process on 上的思维导图：

全称Multi-Version Concurrency Control，多版本并发控制。指维护一个数据的多个版本，使得读写操作没有冲突，快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现，还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView。

有三个隐藏的字段:

undo log回滚日志，在insert、update、delete的时候产生的便于数据回滚的日志。当insert的时候，产生的undo log日志只在回滚时需要，在事务提交后，可被立即删除。而update、delete的时候，产生的undo log日志不仅在回滚时需要，在快照读时也需要，不会立即被删除。

undo log 版本链：

undo log日志会记录原来的版本的数据，因为是通过undo log 日志进行回滚的。

如何确定返回哪一个版本这是由read view决定返回 undo log 中的哪一个版本。

RC隔离级别下，在事务中每一次执行快照读时生成ReadView。RR隔离级别下，在事务中第一次执行快照读时生成ReadView，后续会复用。

MVCC 靠隐藏字段 , undo log 版本链 , read view 实现的。

THE END

y数据库精选（从入门使用到底层结构）漫思

什么是y初学者入门知识

y数据库基本知识从入门到入坟

云数据库y版可弹性伸缩的托管y数据库

y数据库精选（从入门使用到底层结构）漫思

park课程综合实验案例：淘宝双数据分析与预测

林子雨编著《数据采集与预处理》教材官网