二、优化数据库对象
1、优化表的数据类型
应用设计的时候需要考虑字段的长度留有一定的冗余,但不推荐很多字段都留有大量的冗余,这样既浪费磁盘空间,也在应用操作时浪费物理内存。
在MySQL中,可以使用函数PROCEDURE ANALYSE()对表进行分析,给出优化建议。(16, 256)是指不为包含的值多于16或者256字节的ENUM类型提出建议。
Optimal_fieldtype为优化建议,可以通过alter修改字段类型:ALTER TABLE TAB_NAME MODIFY COLUMN Optimal_fieldtype_VALUE;
2、逆规范化
反规划的好处是降低连接操作的需求、降低外码和索引的数目、减少表的数目,带来的问题可能会出现数据的完整性问题,虽然查询加快,但是会降低修改速度。在进行反规范操作之前,要充分考虑数据的存取需求、常用表的大小、一些特殊的计算、数据的物理存储位置。常用的反规范技术如下:
- 增加冗余列:指在多个表中具有相同的列,它常用来查询时避免连接操作。
- 增加派生列:指增加的列来自其他表中的数据,由其他表中的数据经过计算生成,作用是减少连接操作,避免使用集函数。
- 重新组表:指如果许多用户需要查看两个表连接出来的结果数据,则把这两个表重新组成一个表来减少连接而提高性能。
- 分库分表:
3、使用中间表提高统计查询速度
对于数据量较大的表,在其上进行统计查询通常会效率很低,并且还会对线上应用产生负面影响。此种情况下可以使用中间表提高统计查询的效率。
一般步骤:创建表结构和原表结构相同的表,迁移数据需要统计的数据,进行统计。
中间表在统计查询中的优点:
- 中间表复制源表数据,并且与源表相“隔离”,在中间表上做统计查询不会对线上应用产生负面影响。
- 中间表上可以灵活的添加索引或增加临时用的新字段,从而达到提高统计查询效率和辅助统计查询作用。
三、锁问题
1、锁概述
MyISAM和MEMORY存储引擎采用表级锁,BDB存储引擎(MySQL5.1后不直接支持此存储引擎)采用的页面锁,也支持表级锁,InnoDB支持行级锁和表级锁,默认是行级。
- 表级锁:开销小,加锁快,不会出现死锁,锁定粒度大,发生锁冲突的概率最高,并发度最低。
- 行级锁:开销大,加锁慢,会出现死锁,锁定粒度小,发生冲突的概率最低,并发度也最高。
- 页面锁:开销和加锁时间界于表锁和行锁之间,会出现死锁,锁定粒度界于表锁和行锁之间,并发度一般。
表级锁更适合以查询为主,只有少量按索引条件更新数据的应用,如Web应用。而行级锁更适合有大量按索引条件并发更新少量不同数据,同时又有并发查询的应用,如在线事物处理系统。
2、MyISAM表锁
MyISAM只支持表锁。
2.1 查询表级锁争用情况
Table_locks_immediate:产生表级锁定的次数。
如果Table_locks_waited比较高,说明存在着严重的表级锁争用情况。
2.2 MySQL表级锁的锁模式
表级锁分为表共享读锁和表独占写锁。兼容性如下:
对于MyISAM表的读操作,不会阻塞其他用户对同一表的读请求,但会阻塞对同一个表的写请求。对表的写操作,会阻塞同一表的读和写。MyISAM读操作和写操作以及写操作之间是串行的。
2.3 如何加锁表
MyISAM在执行SELECT、UPDATE、DELETE、INSERT前,会自动给涉及的表加锁,无需用户干预。
显式加锁情况:比如同时要查询或者比对两个表中的内容,为防止在查其中一个时另一个有更新或者新数据,此时需要显式的为两个表加锁。
加锁命令:LOCK TABLES tab_name READ LOCAL, tab_name2 READ LOCAL; -- LOCAL表示允许其他用户在MyISAM表尾并发插入记录。使用显式加锁时,必须同时取得所有涉及表的锁,而且加锁后只能访问加锁的这些表,不能访问其他表。并且如果加的是读锁,那么只能执行查询操作。并且加锁时需要对别名也要加锁。
2.4 MyISAM并发插入
MyISAM通过concurrent_insert参数决定是否允许并发插入
- 0:不允许并发插入
- 1:MyISAM表中无空洞,允许读的同时在表末尾插入记录。默认设置
- 2:无论是否有无空洞,都能插入。
可以利用并发插入特性来解决应用中对同一表查询和插入的锁争用。同时定期在系统空闲时整理空间碎片,收回因删除记录而产生的中间空洞。
注意:只能insert不能update和delete。且锁表的session不能获取到新插入到的数据。
2.5 MyISAM的锁调度
同一时刻请求的写锁和读锁,MySQL会优先处理写进程。即使是读请求先到等待队列,写锁也会插入到读锁请求之前,这也是MyISAM表不太适合于有大量更新操作和查询操作应用的原因。
调节MyISAM的调度行为:
- 通过制定启动参数low-priority-updates, 使MyISAM引擎默认给予读请求以优先的权利。
- 通过执行命令 SET LOW_PRIORITY_UPDATES = 1,来降低更新请求的优先级。
- 通过制定INSERT、UPDATE、DELETE语句的LOW_PRIORITY属性,降低该语句的优先级。
MySQL也提供了一种折中的办法,即给系统参数max_write_lock_count设置一个合适的值,当一个表的读锁达到这个值后,MySQL就暂时将写请求的优先级降低。
3、InnoDB锁问题
3.1 背景知识
3.1.1 事务及其ACID属性
事务是由一组SQL语句组成的逻辑处理单元,具有以下4个属性,通常简称为事务的ACID属性。
- 原子性:事务是一个原子操作单元,其对数据的修改,要么全部执行,要么全都不执行。
- 一致性:在事务开始和完成时,数据都必须保持一致状态。这意味着所有相关的数据规则都必须应用于事务的修改,以保持数据的完整性;事务结束时,所有的内部数据结构也都必须是正确的。
- 隔离性:数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的独立环境执行。
- 持久性:事务完成之后,它对于数据的修改是永久性的,即使出现系统故障也能够保持。
3.1.2 并发事务处理的问题
相对于串行处理来说,并发事务处理能大大增加数据库资源利用率,提供吞吐量,但会引起下列问题:
- 更新丢失:两个或多个事务同时操作同一行,会覆盖其他事务的更新。
- 脏读:当一个事务在对一条记录做修改未完成并提交前,另一个事务来读取同一条记录,这时读取到的数据叫脏读。
- 不可重复读:一个事务在读取某些数据后的某个时间,再次读取,发现读出的数据已经发生了改变或某些记录已经被删除了。
- 幻读:一个事务按相同的查询条件重新读取以前检索过的数据,其他事务插入了满足其条件的新数据。
3.1.3 事务隔离级别
线上业务应完全避免更新丢失,但是避免此情况需要应用程序对要更新的数据加必要的锁来解决。但是关于读一致性,必须由数据库提供一定的事务隔离机制来解决。数据库事务隔离的方式,基本上可分为以下两种:
- 在读取数据之前,对其加锁。
- 使用数据多版本并发控制(MVCC/MCC),按照请求时间点创建快照。
数据库的事务隔离越严格,并发副作用越小,相应的代价也就越大,因为事务隔离实质是进行"串行化"。
为了解决隔离和并发的矛盾,ISO/ANSI SQL92定义了4个事务隔离级别。应用可以根据自己的业务逻辑要求,选择不同的隔离级别来平衡隔离和并发的矛盾。
3.2 获取InnoDB行锁争用情况
如果Innodb_row_lock_waits和Innodb_row_lock_time_avg的值比较高,则争用比较严重。
此时可以通过查询information_schema数据库中的表来查看锁情况,或者通过设置InnoDB Monitors来观察发生锁冲突的表、数据行等。
- 通过information_schema
SELECT * FROM innodb_locks;
SELECT * FROM innodb_lock_waits;
- 通过InnoDB Monitors
CREATE TABLE innodb_monitor(a INT) ENGINE = INNODB;
然后通过:SHOW ENGINE INNODB STATUS查看
关闭监视器:DROP TABLE innodb_monitor;
3.3 InnoDB行锁模式及加锁方法
InnoDB实现了两种类型的行锁:
- 共享锁:允许另一个事务也获得共享锁,但是阻止其他事务获得相同数据集的排他锁。
- 排他锁:允许获得排他锁的事务更新数据,阻止其他事务取得相同数据集的共享读锁和排他写锁。
事务获取锁的方式:
- 共享锁:SELECT ... WHERE ... LOCK IN SHARE MODE;
- 排他锁:SELECT ... WHERE ... FOR UPDATE;
对于锁定行后需要进行更新操作的应用,用过使用排他锁。
3.4 InnoDB行锁实现方式
InnoDB行锁是通过索引上的索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来记录加锁。分为3种情形:
- Record lock:对索引项加锁。
- Gap lock:对索引项之间的“间隙”、第一条记录前的“间隙”或最后一条记录后的“间隙”加锁。
- Next-key lock:前两种的组合,对记录及其前面的间隙加锁。
注意:如果不通过索引条件检索数据,那么InnoDB将对表中的所有记录加锁,等同于表锁,生产环境中需要注意这一特性防止导致大量的锁冲突,从而影响并发性能。
由于MySQL的行锁是针对索引加的锁,不是针对记录加的锁,所以虽然是访问不同行的记录,但是如果使用相同的索引建,会出现锁冲突。
当表有多个索引的时候,不同的事务可以使用不同的索引锁定不同的行,但是当不同的session查询相同的数据时,同样会阻塞。
当表的数据较少,此时MySQL可能会全盘扫描,此时会导致不使用索引查询,进而导致全表加锁。
MySQL检索的数据类型与索引字段不同,会进行数据转换,但却不会使用索引,所以会导致InnoDB对所有的记录加锁。
3.5 Next-Key锁
当我们使用范围查询,并请求共享或排他锁时,InnoDB会给符合条件的所有索引项加锁,对于在范围内但是不存在的记录,叫做间隙GAP,同时也会被加锁,这个锁叫做Next-Key锁。Next-Key锁时为了防止幻读。
当使用范围检索并锁定记录时,InnoDB会阻塞条件范围内键值的并发插入,这往往会造成严重的锁等待。因此,在实际应用开发中,尤其是并发插入比较多的应用,尽量使用相等条件来访问更新数据,避免使用范围条件。
3.6 什么时候使用行级锁
对于InnoDB,绝大部分情况下都应该使用行级锁,个别特殊事务中,可以考虑使用表级锁。
- 事务需要更新大部分或全部数据,表比较大,如果使用默认的行锁,会造成事务执行效率低,而且可能造成其他事务长时间锁等待和锁冲突。这种情况考虑使用表锁来提高事务的执行速度。
- 事务设计多个表,比较复杂,很可能引起死锁,造成大量事务回滚,此时可考虑使用表锁避免死锁,减少数据库因事务回滚带来的开销。
当然,生产环境中最好不要出现这两种事务,否则就应该考虑MyISAM了。
表锁注意事项:
- 表锁不是由InnoDB存储引擎管理的,而是由MySQL Server负责的,仅当autocommit=0,innodb_table_locas=1(缺省值)时,InnoDB才能知道MySQL加的表锁,也才能感知InnoDB加的行锁, 这种情况下,InnoDB才能自动识别涉及表级锁的死锁,否则InnoDB将无法自动检测并处理这种死锁。
- 在用LOCK TABLES对InnoDB加锁时,需要将AUTOCOMMIT设为0,否则不会给表加锁;事务结束前,不要用UNLOCKS TABLES释放表锁,因为UNLOCK TABLES会隐含提交事务;COMMIT或ROLLBACK并不能释放用LOCK TABLES加的表级锁,必须用UNLOCK TABLES释放表锁。
方式如下:写表t1并从表t2读
SET AUTOCOMMIT = 0;
LOCK TABLES t1 WRITE, t2 READ;
[do something..]
COMMIT;
UNLOCK TABLES;
3.7 关于死锁
MyISAM表锁是一次获得所需全部锁,要么全部满足,要么等待,因为不会出现死锁。但InnoDB锁是逐步获得的,所以InnoDB会发生死锁的可能。
比如:session1正在对table_1进行 select for update(获得tb1排他锁) ,此时session2对table_2进行select for update(获得tb2排他锁),如果此时session1对tb2进行select for update,会出现等待,直到session2释放,但是如果session2没有释放并且又请求tb1进行select for update,那么此时会出现死锁。
发生死锁后,InnoDB一般都能自动检测到,然后释放一个事务锁并回退,另一个事务获得锁继续完成事务。但在涉及外部锁或涉及锁的情况下,InnoDB并不能完全自动检测到死锁,这需要通过设置锁超时参数innodb_lock_wait_timeout来解决,但这个参数并不是用来解决死锁问题,在并发访问比较高的情况下,如果大量事务因无法立即获得所需的锁而挂起,会拖垮数据库,设置合适的值可以避免或者减少此种情况的发生。
通常来说,死锁都是应用设计的问题,通过调整业务流程、数据库对象设计、事务大小,以及访问数据库的SQL语句,绝大部分死锁都可以避免。
避免死锁的常用方法:
- 程序并发存取多个表,尽量约定相同的顺序来访问量。
- 程序批量处理数据的时候,事先对数据排序,保证每个线程按固定的顺序来处理记录。
- 在事务中,如果要更新记录,应该直接申请足够级别的排他锁,而不是先申请共享锁,后申请排他锁。要不然其他事务可能已经获得了相同的共享锁,从而造成锁冲突。
- 在REPEATABLE-READ隔离级别下,如果两个线程同时对相同条件记录用SELECT FOR UPDATE加排他锁,在没有符合条件的记录的情况下,两个线程都会加锁成功。因为两个线程查询均无此记录,便会尝试插入一条新纪录,如果两个线程都这么做,就会出现死锁。这种情况将隔离级别改成READ COMMITTED就可避免。