+-
数据库(MySQL) 入门实践

1 数据库

存放数据的仓库。例如你的账号信息,订单记录等。

2 SQL

Structured Query Language,用于访问和处理关系数据库的标准的计算机语言。

按照功能又可分为四大类;

DQL

查询语言,基本语句 SELECT;

DML

操纵语言,主要有三种形式,INSERT、UPDATE 和 DELETE;

DDL

定义语言,创建表、视图、索引等,CREATE TABLE;

DCL

控制语言,用来授权或回收某种特权,基本形式有 GRANT、 COMMIT 和 ROLLBACK;

3 NoSQL

Not Only SQL,泛指非关系型的数据库,通常以键值对或者文档形式存储。例如 Redis、MongoDB。

关系型数据库(MySQL)能通过外键建立表之间的联系,且相比 NoSQL 而言,还具备 ACID 特性。

但 NoSQL 操作无须 SQL 解析,读写性能较高,相比关系型数据库来说,不用预设存储结构,且天然支持分布式存储。

4 范式

数据库满足一定要求的条件称为数据库范式。又能根据程度的不同,简称为第 N 范式。

第一范式 1NF

所有属性不可再分,例如属性 product 就不能分为 title 和 price,可以单独设置两个属性 productTitle、productPrice;

第二范式 2NF

每张表都有一个属性作为唯一标识,其他属性完全依赖该标识,例如自增主键ID;

第三范式 3NF

所有的非主属性不依赖于其他的非主属性。例如订单表中可以关联商品ID,但不应该关联商品非主属性 title 和 price 等;

为了提高查询效率,通常会添加冗余字段,这也就违背了 3NF,也称之为反三范式。

5 MySQL

MySQL 是一个 Oracle 旗下的关系型数据库,使用 SQL 语言进行增删改查操作。

开源免费,性能也比较好,和 PHP、Java 等 Web 开发语言完美配合,在中小型企业应用非常广泛。

后续内容都是基于 MySQL 数据库的前提下。

6 存储引擎

常见的有 MyISAM 和 InnoDB 引擎;

引擎 默认版本 外键 锁粒度 count(*) 事务 MyISAM < 5.5 不支持 表锁 变量存储 不支持 InnoDB >= 5.5 支持 行锁 全表扫描 支持

7 事务

一条或多条 SQL 组成一个事务(transaction),具备 ACID 四个特性;

Atomicity 原子性

一个事务内的所有操作,要么全部完成,要么全部失败;

Consistency 一致性

事务开始前后结束后不会破坏数据库的完整性,也就是说写入或修改的结构需要符合预设的规则;

Isolation 隔离性

防止事务交叉执行时导致数据的不一致。根据隔离程度分为 read uncommitted、read committed、repeatable read 和 serializable;

Durability 持久性

事务结束后,对数据的修改是永久的;

事务交叉执行可能会造成“脏读”、“幻读” 和 “不可重复读”;

脏读

一个事务读取到另外一个事务还未提交的数据;

不可重复读

一个事务内,多次读取同一数据返回结果不同;由于在此期间在数据被其他事务修改并已提交;

幻读

一个事务内,多次读取,返回不存在的记录;由于在此期间有其他事务写入数据;

read uncommitted read committed repeatable read serializable 脏读 √ × × × 不可重复读 √ √ × × 幻读 √ √ √ ×

8 索引

数据库的“目录”,在数据量较大的情况下,可以极大地提高查询效率。

常见的索引数据结构有 B+ 树、Hash。以最常用的 B+ 树为例;

按照 B+ 树存储方式可以把索引分为两大类;

聚簇索引;

叶子节点存放了一整行的信息;

非聚簇索引;

叶子节点存放的是对应那行数据的主键,和该索引的值;

为什么是 B+ 树?

磁盘代价低; 查询更加稳定; 便于遍历; 支持范围查询;

一张结构为 id,groupId,name 的 t_user 表,id 为主键(聚簇索引),groupId 为普通索引(非聚簇索引)。

select name from t_user where groupId = 123;

先在叶子节点上得到对应的主键 id,然后再根据主键 id 得到 name 的值,这种行为称之为回表

select groupId from t_user where groupId = 123;

直接在叶子节点上就能得到 groupId 的值,不用回表操作,这种索引也被称为覆盖索引

按照功能类型又可以把索引分为三大类;

普通索引;

最基本的索引类型,没有限制条件;

唯一索引;

保证索引字段的值唯一,允许有 NULL;主键是一种特殊的唯一索引,不允许有 NULL;

联合索引;

多个字段组成一个索引,具有“最左前缀”的原则;

什么是最左前缀?

a、b、c 三个字段组成联合索引,那么生效的列为 a、ab、abc、ac。(等值判断时顺序可交换,范围查询时会停止匹配)

9 锁

宏观来看,锁分为两种;行锁可归纳为两类;

共享锁(S)

share,又称为读锁,已有 S 锁,可以加其他 S 锁,但不能加 X 锁;

排他锁(X)

exclusive,又称为写锁,X 与其他任何锁互斥;

InnoDB 是通过给索引项加锁实现的行锁,可分为三种类型;

record lock

行级锁,锁定对应索引项;

gap lock

间隙锁,锁定索引项之间的间隙,左开右闭;

next-key lock

前两种的结合;

如果不通过索引项检索数据,会锁住整个表。

InnoDB 加锁方法:

对于 UPDATE、DELETE、INSERT 自动加 X 锁; 对于普通 SELECT 不会加任何锁; SELECT ... LOCK IN SHARE MODE 显示加 S 锁; SELECT ... FOR UPDATE 显示加 X 锁;

查询当前数据库锁状态;

select * from information_schema.innodb_locks;

对于不同类型的索引,加锁的方式也不一样;

普通索引

加 next-key lock;

唯一索引

加 record lock;

由于普通索引叶子节点存储了主键,所以加锁的字段是:普通索引 + 主键索引;

假设有如下数据表 t_ lock,其中 id 为主键,xid 为 普通索引;

+-----+----+
| xid | id |
+-----+----+
|   1 | 10 |
|   3 | 20 |
|   5 | 30 |
|   8 | 40 |
|  11 | 50 |
+-----+----+

给 (8, 40) 这条记录加 X 锁;

select * from t_lock where xid = 8 for update;

那么根据 next-key lock 的定义,锁住区间为 (5, 30) 到 (8, 40),(8, 40) 到 (11, 50) 这两个区间;

便于理解我会合并为一个区间 (5, 30) 到 (11, 50)。

按照所以排序规则,假设另插入 (xid, id) 记录,那么总是满足以下条件;

xid < 5;id 无限制;(正常) xid = 5;id < 30;(正常) xid = 5;id > 30;(阻塞) xid > 5 && xid < 11;id 无限制;(阻塞) xid = 11;id < 50;(阻塞) xid = 11;id > 50;(正常) xid > 11;id 无限制;(正常)

简单图示,当插入的数据落在这个区间则会阻塞,反之亦然;

10 RR 幻读

上面事务章节描述 RR 会导致幻读,MySQL 在 RR 下通过如下两点规避掉了;

MVCC

Multi-Version Concurrency Control,多版本并发控制。在普通 SELECT (快照度)时引入版本,同一个事务中只能读取不大于当前版本的数据快照;

next-key lock

需要加 X 锁的操作(当前读),加 next-key lock 可以有效避免产生幻读;

11 SQL 执行顺序

根据创建时间升序,查找支付成功超过 3 单的用户,需要去重;

select distinct t1.nickname
from t1 inner join t2
on t1.uid = t2.uid
where t2.pay_time > 0
group by t1.uid, t1.nickname
having count(*) > 3
order by t2.create_time
limit 10
from on join where group having order select distinct limit

12 binlog

binlog 是 MySQL 最重要的日志,记录了所有的 DDL 和 DML 语句,主要目的是;

主从复制;

在 Master 开启 binlog,并传递到 Slave 节点来达到 Master-Slave 数据一致性;

数据恢复;

通过 mysqlbinlog 恢复数据;

检查 binlog 是否开启;

show variables like 'log_bin';

编辑 mysql 配置文件/etc/mysql/mysql.conf.d/mysqld.cnf,开启 binlog 功能;

[mysqld]
server-id=1
log-bin=/var/lib/mysql/mysql-bin

常用几个命令;

show master status; show binary logs; mysqlbinlog -v --start-position 2755 --stop-position 3076 mysql-bin.000003;

例如误删除了某条记录;

通过 mysqlbinlog 定位到误操作的 position; 通过 mysqlbinlog 定位到误删之前最早入库的 position; 截取中间 binlog 日志, echo > db.sql 输出到可执行 SQL 文件中; 执行恢复数据即可;
可直接流式执行:mysqlbinlog -v --start-position 2432 --stop-position 2533 mysql-bin.000003 | mysql -uroot -p

mysqldump 是用来备份数据库的,例如备份 db_test 数据库;

mysqldump -h127.0.0.1 -uroot -p123456 db_test > db.sql

13 性能优化

索引;

给经常用作查询条件,且区分度较高的字段建立索引;

分页查询;

where id > ${lastId} order by id limit ${size},提高大表分页效率;

批量操作;

批量插入用 insert into xxx values (xxx...), (xxx...),批量更新用 case when id;

not null;

null 会额外占用空间,且 count(xxx) 不会参与统计,若是索引列 is not null 也会失效;