Mysql

1.什么是mysql

mysql其实是关系型数据库管理系统RDBMS，但人们习惯称他为数据库。

2. SQL的分类

DDL数据库定义语言Data Definition Language

例如create drop alter

DQL数据库查询语言Data Query Language

例如select

DML数据库操作语言Data Manipulation Language

例如insert delete update

TCL事务操作语言Transactional Control Language

DCL数据控制语言Data Control Language

3.mysql常用命令

创建数据库：

create datebase 数据库名;

查询当前所用数据库：

select database();

查看现有的数据库：

show databases;

使用数据库:

use 数据库名;

查看当前数据库的表：

show tables;

查看表结构：

decs 表名;

查看建表语句：

show create table 表名;

4.select语句中可以进行算术运算

如select empno, ename, sal*12 from emp;

5.给字段起别名：

格式：字段名 as 'xxx'

as可以省略

6.运算符

运算符	说明
=	等于
<>或!=	不等于
<	小于
<=	小于等于
>	大于
>=	大于等于
between … and ….	两个值之间,等同于 >= and <=
is null	为null（is not null 不为空）
and	并且
or	或者
in	包含，相当于多个or（not in不在这个范围中）
not	not可以取非，主要用在is 或in中
like	like称为模糊查询，支持%或下划线匹配 %匹配任意个字符下划线，一个下划线只匹配一个字符

7.判断某个值为null

用is null。如select * from emp where comm is null;

！！！！切记不可以用等号判断是否为null！！！

8.当null参与算术运算结果一定是null

如(null+12)*10 结果为null。

9.ifnull(字段名,给定值)

当字段对应的值为null时，将null改为给定的值返回。

所以当记录的字段含null时，应该这样写(ifnull(字段名,0)+12)*10

10.order by排序

默认asc升序。可指定排序方式，在order by后面加 asc或者desc降序。

多字段排序：靠前面的起决定性作用越大。靠后面的影响越小。

如select * from emp order by job desc, sal asc;

先按工作进行降序排序，再将工作相同的记录按工资进行升序排。

11.group by分组 having分组后过滤

1.若没有指定分组，整张表自成一组

2.若按某个字段进行分组，select后接的字段只能是被分组的字段或者分组函数。

3.where后面不能有分组函数。因为先from再where再groupby[再having]再select。所以where是在groupby之前执行的，还没有分组何来分组函数。

4.having是对分组后的记录进行再次过滤，having可以使用分组函数。

5.having过滤的效率较低，尽量在where中完成过滤。必要时再用having。

12.分组函数

sum求和

avg求平均

count求总数

max求最大值

min求最小值

分组函数自动忽略null值。所以用分组函数不需要在where后面排除字段为null的记录。

13.连接查询

内连接：两张表是平等的，没有主副之分。匹配不到就忽略

等值连接

非等值连接

自连接：自己连接自己

外连接：两张表有主副之分，必须保证主表的数据全部查出来，若匹配不到自动补null。

左外连接：左边为主表

右外连接：右边为主表

全连接（几乎不用）：左右都为主表

14.子查询

select中嵌套（基本不用）

from中嵌套子查询：from后面接select语句作为临时表t。join后面也可。

如：select e.empno, e.ename from emp e join (select distinct mgr from emp where mgr is not null) m on e.empno=m.mgr;

where中嵌套子查询：where后面接查询语句作为判断的标准。

如：select empno, ename from emp where empno in(select mgr from emp where mgr is not null);

15.union

两张表相加，字段的数量必须相同，且字段相同才有意义。

16.分页limit pageNum,pageSize

select * from emp limit 0,5;

第pageNum页 limit (pageNum-1)*pageSize,pageSize

17. DDL数据定义语言建表

create table tableName(

   columnName dataType(length),

   ………………..

   columnName dataType(length)

);

表名建议是t_xxxx或者tbl_xxxx

dataType有：int,bigint,char定长字符串,varchar可变长字符串,float,double,Date日期,BLOB二进制流媒体大对象,CLOB文本大对象。

18.约束条件

not null非空约束：字段不能为null。

unique唯一性约束：值不能重复。

primary key主键约束：不能重复且不能为null，主键最好与业务无关，只起区分每个记录的作用。

auto_increment：主键自增从1开始。

foreign key外键约束：来源于其他表。理解父表子表的概念。

not null是列级约束。

primary key是列级，表级约束（可以是联合主键）。

unique是列级，表级约束（可以是多个字段联合是唯一的）。

foreign key 表级约束foreign key(xxx) references t_aa(xxxx) 。

19.DML数据库操作语言 insert delete update

insert into 表名 (字段,字段......) values ('a','b'.....);

可不写字段名，要求values后面给全部字段赋值。

可连续插入多条values(),values().....

delete from 表名 where ...

update 表名 set 字段=a,字段=b.... where

20.存储引擎

mysql常用的存储引擎有MyISAM，InnoDB，Memory。

mysql自建表默认的存储引擎是InnoDB。

MyISAM是mysql内部最常用的存储引擎。不支持事务，用三个文件表示每一张表。表结构文件，数据文件，索引文件。

InnoDB存储引擎支持事务机制，有行级锁，比较安全。java开发通常用的都是这个引擎。在mysql崩溃后提供自动恢复。可级联删除，级联更新，父表（被引用代表）删除一条记录，级联删除子表中对应的记录。父表更新一条记录，记录更新子表中的记录。级联删除级联更新比较危险，谨慎使用。

MEMORY存储引擎不支持事务，数据存储在内存中，读取速度很快，但数据容易丢失。

21. 事务

事务的四个特征ACID Atomicity Consistency Isolation Durability

Atomicity原子性：事务中的DML语句是一个整体，要么全部执行，要么全部不执行。

Consistency一致性：在事务开始前和结束之后，数据库都保持一致的状态。

Isolation隔离性：事务之间互不影响。

Durability持久性：在事务完成之后，该事务对数据库所做的更改会持久地保存在数据库之中，并不会被回滚。

22.事务的隔离级别

读未提交read uncommitted：在A事务并未提交的情况下，B事务读取到了A事务对表修改的数据称为读未提交。也称为脏读dirty read。因为A事务可能会回滚，所以会导致B读到不正确的数据。

读已提交read committed：B事务在A事务提交之前读到的数据和B事务在A事务提交后读到的数据不一致。缺点:不可重复读。

可持续读repeatable read：B事务在A事务提交之前读到的数据和在A事务提交之后得到的数据保持一致。缺点：会出现幻读。读到了不存在的数据，只是之前的一个备份。java中默认的隔离级别

串行化serializable：解决了上述全部问题，但效率最低。事务对同一表的DML操作排队执行。

23.索引是什么？有什么用？

索引相当于一本书的目录，根据索引能快速定位，查找到所需数据。索引被用来快速在一个列上找到特定值的行。如果不使用索引，将从表中第一条记录一条一条找，效率较低。索引底层采用b+tree数据结构。

24.什么时候要用到索引？

1.表中该字段数据量庞大

2.某字段在where后出现的频率高

3.经常被DML（更新，修改，删除）的字段不建议添加索引

25.索引的操作

创建索引 create index 索引名 on 表名 (字段名);

删除索引 drop index 索引名 on 表名;

26.索引的细粒度分类：（主键索引，单列索引，复合索引，唯一索引）InnoDB，（全文索引）MyISAM。

主键索引：在InnoDB中主键自动被添加索引。

单列索引：给非主键字段添加索引。

复合索引：给多个非主键字段添加索引。

唯一索引：给唯一的字段添加索引，值可以为NULL。

全文索引：类似于ES的分词机制。

27.索引的粗粒度分类：聚簇索引和非聚簇索引

聚簇索引：叶子结点存储索引和数据。

非聚簇索引：叶子节点不存放数据，叶子节点存放索引和指向数据对应的位置（一般为主键）。

28.MyISAM索引的原理：

给表中的某一字段加上索引，数据库就会为该字段的数据先排序，然后分页建立一个B+树。并且携带数据在内存或硬盘的物理地址。例如当select * from emp where ename='smith'。查询该语句时会先找ename字段上的索引，找到索引之后根据's'去s区找，再定位m...返回物理地址。此时直接根据物理地址找到所求记录。MyISAM索引文件和数据文件是分离的，索引文件仅保存数据记录的地址。

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAempzMTIwMQ==,size_20,color_FFFFFF,t_70,g_se,x_16

29.InnoDB中索引的原理：

1）主键会默认被加上索引，而且是聚簇索引。按主键字段进行排序，每个记录被封装成【主键 +一条记录+指针指向下一条记录】。每页的默认大小为16KB，当插入一条新的记录，且当前16KB的页不够装时，就会分页，新开一页继续放。上层页保存下层每页的首索引和指针。

在InnoDB中，表数据文件本身就是按B+Tree组织的一个索引结构，这棵树的叶节点data域保存了完整的数据记录。这个索引的key是数据表的主键，因此InnoDB表数据文件本身就是主索引。

(图inndb主键索引）是InnoDB主索引（同时也是数据文件）的示意图，可以看到叶节点包含了完整的数据记录。这种索引叫做聚集索引。因为InnoDB的数据文件本身要按主键聚集，所以InnoDB要求表必须有主键（MyISAM可以没有），如果没有显式指定，则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键，如果不存在这种列，则MySQL自动为InnoDB表生成一个隐含字段作为主键，这个字段长度为6个字节，类型为长整形。

2）InnoDB的辅助索引，非主键字段加的索引。

InnoDB的所有辅助索引都引用主键作为data域。

InnoDB 表是基于聚簇索引建立的。因此InnoDB 的索引能提供一种非常快速的主键查找性能。不过，它的辅助索引（Secondary Index，也就是非主键索引）也会包含主键列，所以，如果主键定义的比较大，其他索引也将很大。如果想在表上定义、很多索引，则争取尽量把主键定义得小一些。InnoDB 不会压缩索引。

3）InnoDB使用的是聚簇索引，将主键组织到一棵B+树中，而行数据就储存在叶子节点上，若使用"where id = 14"这样的条件查找主键，则按照B+树的检索算法即可查找到对应的叶节点，之后获得行数据。若对Name列进行条件搜索，则需要两个步骤：第一步在辅助索引B+树中检索Name，到达其叶子节点获取对应的主键。第二步使用主键在主索引B+树种再执行一次B+树检索操作，最终到达叶子节点即可获取整行数据。

30.使用主键索引时有什么建议？

不建议使用uuid作为主键：因为uuid很难排序，容易往树中间插入数据，导致树结构改变。耗费大量数据库资源。而且uuid不是自增的。

建议使用int类型作为主键必要时用bigInt：因为int类型可以排序，而且可以自增。自增的话插入数据可以直接在末尾插入，几乎不影响前面的页。

建议主键值不要过大。因为辅助索引存储的是主键值，而主键值过大会加大辅助索引存储需要的空间。

31.索引不是万能的也会失效。

1.当模糊查询时name='%s%' ,第一个通配符为%索引就会失效。

2.不符合最左前缀原则。

例如给name age bir三个字段加上复合索引

根据where name and age and bir ：使用索引

根据where name and age ：使用索引

根据where name：使用索引

根据where age：不使用索引

根据where bir：不使用索引

根据where age and bir：不使用索引

3.用or。

例如给name age 字段加上复合索引

根据where name and age ：使用索引

根据where name or age ：不使用索引

32.索引有什么缺点：

给字段添加索引会耗费数据库资源。

当对表进行DML时也会对索引树进行修改，耗费数据库资源。

33.视图是什么？有什么用？

视图是一种根据查询（也就是SELECT表达式）定义的数据库对象，用于获取想要看到和使用的局部数据。可以隐藏表中的某些字段。对不同用户显示不同的内容等。

对视图进行CRUD实际上是对原表的CRUD。

34. 创建视图

例子：create view v_dept_emp as select ename,dname,sal,hiredate,e.deptno from emp e,dept d where e.deptno= e.deptno and e.deptno = 10;

创建视图时select语句不能嵌套子查询。

35.数据库三范式

第一范式：每个表必须有主键，表中的所有字段原子上不可再分。

第二范式：基于第一范式，主键外的字段完全依赖于主键，不能产生部分依赖。复合主键大概率产生部分依赖。

多对多，三张表，中间表为关系表。

第三范式：基于第二范式，主键外的字段不能传递依赖于主键。

一对多，多的表加外键。

在真实开发中，以满足客户需求为主。有时需要拿数据冗余来换取效率。因为连接查询效率会降低。

36.一对一怎么表示关系

主键复用：A表的主键作为B表的主键和外键。

唯一外键：B表中添加一个唯一unique字段，指向A表的主键。