03 | 事务隔离:为什么你改了我还看不见?

2019-07-09 16:54:24

本文的总结源于林晓斌在极客时间里面的课程,为避免产生商业问题,我只是用于个人学习总结。
原文地址:https://time.geekbang.org/column/article/68963

思维导图

wei-shi-yao-ni-gai-liao-wo-huan-kan-bu-jian-1

图形解说

7dea45932a6b722eb069d2264d0066f8
针对上面看到的四个隔离级别,并结合这个案例来进行解说,我们来看看不同的隔离级别下,事务A会有哪些不同的返回结果,也就是图里面V1、V2、V3的返回值分别是什么

  • 若隔离级别是“读未提交”,则V1的值就是2.这时候事务B虽然还没有提交,但是结果已经被A看到了。因此,V2、V3也都是2.
  • 若隔离级别是“读提交”,则V1是1,V2的值是2.事务B的更新在提交后才能被A看到。所以V3的值也是2.
  • 若隔离级别是“可重复读”,则V1、V2是1,V3是2.之所以V2还是1,遵循的就是这个要求:事务在执行期间看到的数据前后必须是一致的。
  • 若隔离级别是“串行化”,则在事务B执行“将1改成2”的时候,会被锁住。直到事务A提交后,事务B才可以继续执行。所以从A的角度看,V1、V2值是1,V3的值是2.

小结

除了上面说到的几个隔离级别以外,还有下面的几点:

  1. 事务隔离级别从上到下一致性由低到高,但同时处理效率也是由高到低
  2. 配置方法:启动参数transaction-isolation
  3. 事务隔离的实现:每条记录在更新的时候都会同时记录一条回滚操作。同一条记录在系统中可以存在多个版本,这就是数据库的多版本并发控制(MVCC)
  4. 回滚日志什么时候删除?系统会判断当没有事务需要用到这些回滚日志的时候,回滚日志会被删除。
  5. 什么时候不需要了?当系统里么有比这个回滚日志更早的read-view的时候。
  6. 为什么尽量不要使用长事务。长事务意味着系统里面会存在很老的事务视图,在这个事务提交之前,回滚记录都要保留,这会导致大量占用存储空间。除此之外,长事务还占用锁资源,可能会拖垮库。
  7. 事务启动方式:一、显式启动事务语句,begin或者start transaction,提交commit,回滚rollback;二、set autocommit=0,该命令会把这个线程的自动提交关掉。这样只要执行一个select语句,事务就启动,并不会自动提交,直到主动执行commit或rollback或断开连接。
  8. 建议使用方法一,如果考虑多一次交互问题,可以使用commit work and chain语法。在autocommit=1的情况下用begin显式启动事务,如果执行commit则提交事务。如果执行commit work and chain则提交事务并自动启动下一个事务。
02 | 日志系统:一条SQL更新语句是如何执行的?

本文的总结源于林晓斌在极客时间里面的课程,为避免产生商业问题,我只是用于个人学习总结。 原文地址:https://time.geekbang.org/column/article/68633 本篇重点 一条SQL语句的执行步骤 update T set c=c+1 where ID=2; 执行流程图 小结 redo是物理的,binlog是逻辑的;现在由于redo是属于InnoDB引擎,所以必须要有binlog,因为你可以使用别的引擎 保证数据库的一致性,必须要保证2份日志一致,使用的2阶段式提交;其实感觉像事务,不是成功就是失败,不能让中间环节出现,也就是一个成功,一个失败 如果有一天mysql只有InnoDB引擎了,有redo来实现复制,那么感觉oracle的DG就诞生了,物理的速度也将远超逻辑的,毕竟只记录了改动向量 binlog几大模式,一般采用row,因为遇到时间,从库可能会出现不一致的情况,但是row更新前后都有,会导致日志变大 最后2个参数,保证事务成功,

04 | 深入浅出索引(上)

本文的总结源于林晓斌在极客时间里面的课程,为避免产生商业问题,我只是用于个人学习总结。 原文地址:https://time.geekbang.org/column/article/69236 小结 索引的作用:提高数据查询效率 常见索引模型:哈希表、有序数组、搜索树 哈希表:键-值(key-value) 哈希思路:把值放在数组里,用一个哈希函数把key换算成一个确定的位置,然后把value放在数组的这个位置 哈希冲突的处理办法:链表 哈希表适用场景:只有等值查询的场景 有序数组:按顺序存储。查询用二分法就可以快速查询,时间复杂度是:O(log(N)) 有序数组查询效率高,更新效率低 有序数组的适用场景:静态存储引擎(比如往年数据,不会进行变动的数据) 二叉搜索树:每个节点的左儿子小于父节点,父节点又小于右儿子 二叉搜索树:查询时间复杂度O(log(N)),更新时间复杂度O(