logo头像
Snippet 博客主题

【Java并发编程实战】-Java内存模型

本文于525天之前发表,文中内容可能已经过时

硬件的效率与一致性

计算机内部运算流程

  1. 计算机执行若干个运算任务,所有的计算任务不可能仅仅靠处理器“计算”来完成,计算器存储设备与处理器的运算速度有几个数量级的差距;
  2. 至少要与内存进行交互,如读取运算数据、存储运算结果,不能仅仅靠CPU寄存器来完成
  3. 随着计算机硬件的快速发展,任何设备的读写速度要尽可能接近处理器运算速度的高速缓存(Cache)来作为内存与处理器之间的缓冲;
  4. 运算时先从内存读取,然后将数据缓存到高速缓存区,让CPU能够高效运算,当运算结束后,将运算结果从缓存中同步到内存中。

缓存一致性

高速缓存很好的解决了处理器与内存的速度矛盾,如图1,但是存在问题:缓存一致性问题

  • 多处理器中,每个处理器都有自己的高速缓存,但是又共享一个主内存,可能存在缓存数据不一致,同步到主内存不知道以哪个缓存数据为准;
  • 为了解决一致性问题,各个处理器访问要遵循某些协议,在读写时要根据协议来进行操作,常见协议有:MSI、MESI、MOSI、Synapse、Firefly及Dragon Protocol等;
  • 除了增加高速缓存之外,为了使得处理器内部的运算单元尽量被充分利用,处理器会在不影响执行结果的条件下对输入的代码进行乱序执行,Java虚拟机定义为指令重排序。

图1:处理器、高速缓存、主内存存在的交互关系

Java内存模型

Java内存模型(JMM)来屏蔽掉各种硬件和操作系统的内存访问差异,以实现Java程序在各种下都能达到一致的并发效果,在JDK1.5(实现了JSR-133)发布后,JMM已经成熟和完善起来。

Java内存的主要目标是定义程序中的各个变量的访问规则,即虚拟机中将变量存储到内存和从内存中取出变量主要的底层实现,需要注意的是此变量非彼变量,这里的变量包括实例字段、静态字段、构成数组对象的元素,不包括局部变量与方法参数,因为后者是线程私有的,不会被共享,自然不存在竞争问题。

主内存与工作内存

  1. 主内存: JMM规定所有的变量都存储在主内存中;

  2. 工作内存:每条线程都有自己的工作内存,线程的工作内存保存了被该线程使用到的变量的主内存副本拷贝;

  3. 工作内存:线程对变量的所以操作都必须在工作内存中进行,不能直接读写到主内存中;

  4. 工作内存:线程间各自的工作内存不可见,数据传递操作在主内存来完成,如图2,线程、主内存、工作内存三者之间的交互关系。

    图2:线程、主内存、工作内存三者之间的交互关系

内存间原子操作

  • 锁定(lock):作用于主内存的变量,它把一个变量标识为一条线程独占的状态;
  • 解锁(unlock):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定;
  • 读取(read):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用;
  • 载入(load):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中;
  • 使用(use):作用于工作内存的变量,它把工作内存中的一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作;
  • 赋值(assign):作用于工作内存的变量,它把从执行引擎接受到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作;
  • 存储(store):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用;
  • 写入(write):作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。

如果要把一个变量从主内存复制到工作内存,那就要按照顺序地执行read和load操作,如果要把变量从工作内存同步回主存,就要按顺序地执行store和write操作。需要注意的是,JMM只要求上述两个操作必须按顺序执行,而没有保证必须是连续执行的。也就说说read与load之间、store和write之间是可插入其他指令的,如对主内存中的变量a、b进行访问时,很可能出现read a、read b、load b、load a,除此之外,JMM还规定在执行上述八种操作时必须满足如下规则:

  • 不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者从工作内存发起回写但主内存不接受的情况出现;
  • 不允许一个线程丢弃它的最近的assign操作,即变量在工作内存中改变了之后必须把该变化的结果回写到主内存中;
  • 不允许任何一个线程无原因地(没有发生过任何的assign操作)把数据从线程的工作内存同步回主内存中;
  • 一个新的变量只能在主内存中“诞生”,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量。即对一个变量实施use和store操作之前,必须先执行过assign和load操作;
  • 一个变量在同一个时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会解锁;
  • 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值;
  • 如果一个变量事先没有被lock锁定操作,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁住的变量;
  • 对一个变量执行unlock之前,必须先把此变量同步回主内存中(执行store和write操作);

happens-before 原则

这个原则非常重要,它是判断数据是否存在竞争、线程是否安全的主要依据,依靠这个原则,我们可以通过几条规则一揽子地 解决并发环境下两个操作之间是否可能存在冲突的所有问题。

现在就来看看“先行发生”原则指的是什么。先行发生是Java内存模型中定义的两项操作之间的偏序关系,如果说操作A先行发生于操作B,其实就是说在发生操作B之前,操作A产生的影响能被操作B观察到,“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等。

1
2
3
4
5
6
//以下操作在线程A中执行
int i=1;
//以下操作在线程B中执行
int j=i;
//以下操作在线程C中执行
int i=2;

通过上述代码分析:假设线程A中的操作“i=1”先行发生于线程B的操作“j=i”,那么可以确定在线程B的操作执行后,变量j的值一定等于1,得出这个结论的依据有两个:一是根据先行发生原 则,“i=1”的结果可以被观察到;二是线程C还没“登场”,线程A操作结束之后没有其他线程会修改变量i的值。现在再来考虑线程C,我们依然保持线程A和线程B之间的先行发生关 系,而线程C出现在线程A和线程B的操作之间,但是线程C与线程B没有先行发生关系,那j的值会是多少呢?答案是不确定!1和2都有可能,因为线程C对变量i的影响可能会被线程B观察到,也可能不会,这时候线程B就存在读取到过期数据的风险,不具备多线程安全性。

Java 内存模型定义基于一些操作,比如读写字段、 Monitor 同步等。这些操作可以按照 happens-before 关系进行排序。这种关系可用来推断一个线程何时看到另一个线程的操作结果,以及构成一个程序同步后的所有信息。

天然的先行发生关系:

  • 程序次序规则(Program Order Rule):在一个线程内,按照程序代码顺序,书写在前面的操作先行发生于书写在后面的操作。准确地说,应该是控制流顺序而不是程序代码顺序, 因为要考虑分支、循环等结构。
  • 管程锁定规则(Monitor Lock Rule):一个unlock操作先行发生于后面对同一个锁的lock 操作。即在获取 Monitor 前,释放该 Monitor。这里必须强调的是同一个锁,而“后面”是指时间上的先后顺序。
  • volatile变量规则(Volatile Variable Rule):对一个volatile变量的写操作先行发生于后面对这个变量的读操作,即在读取 volatile 变量前,对该变量执行一次写操作,这里的“后面”同样是指时间上的先后顺序。
  • 线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作。即在线程开始所有操作前调用 Thread#start。
  • 线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值等手段检测到线程已经终止执行。
  • 线程中断规则(Thread Interruption Rule):对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生,可以通过Thread.interrupted()方法检测到是否有 中断发生。
  • 对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发 生于它的finalize()方法的开始。
  • 传递性(Transitivity):如果操作A先行发生于操作B,操作B先行发生于操作C,那就可以得出操作A先行发生于操作C的结论。

总结::时间先后顺序与先行发生原则之间基本没有太大的关系,所以我们衡量并发安全问题的时候不要受到时间顺序的干扰,一切必须以先行发生原则为准。

原子性、可见性和有序性

原子性(Atomicity):我们大致可以认为基本数据类型的访问读写是具备原子性的(例外就是long和double的非原子性协定)。原子操作的特点是要么全部操作成功要么全部操作失败,不允许部分成功,部分失败。尽管虚拟机未把lock和unlock操作直接开放给用户使用, 但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作,这两个字节码指令反映到Java代码中就是同步块synchronized关键字,因此在synchronized块之间的操作也具备原子性。

可见性(Visibility):可见性是指当一个线程修改了共享变量的值,其他线程能够立即 得知这个修改。Java内存模型是通过在变量修改后将新值同步回主内存,在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方式来实现可见性的。简单说就是一个线程看到另一个线程发生更改所需的条件,即synchronized和final实现了可见性的条件。

有序性(Ordering):如果在本线程内观察,所有的操作都是有序的;如果在一个线程中观察另一个线程,所有的操作都是无序的。前半句是指“线程内表 现为串行的语义”(Within-Thread As-If-Serial Semantics),后半句是指“指令重排序”现象 和“工作内存与主内存同步延迟”现象。

参考资料

  • 《深入理解Java虚拟机(第2版)》周志明著
支付宝打赏 微信打赏

请作者喝杯咖啡吧