线程的合理使用能够提升程序的处理性能,主要有两个方面:
- 第一个是能够利用多核 cpu 以及超线程技术来实现线程的并行执行;
- 第二个是线程的异步化执行相比于同步执行来说,异步执行能够很好的优化程序的处理性能提升并发吞吐量同时,也带来了很多麻烦;
因此我们来对 synchronized 一探究竟。
1. synchronized 的基本语法
synchronized 有三种方式来加锁,分别是:
-
修饰实例方法,作用于当前实例加锁,进入同步代码前要获得当前实例的锁
-
静态方法,作用于当前类对象加锁,进入同步代码前要获得当前类对象的锁
-
修饰代码块,指定加锁对象,对给定对象加锁,进入同步代码库前要获得给定对象的锁。
不同的修饰类型,代表锁的控制粒度
2. synchronized 的应用
举一个简单的例子,使用 synchronized 实现数据的安全性, 如下示例中每次的计算结果总是为 1000。
public class SynchronizedDemo {
private static int count = 0;
public static void inc() {
synchronized (SynchronizedDemo.class) {
count++;
try {
Thread.sleep(1);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
public static void main(String[] args) throws InterruptedException {
for (int i = 0; i < 1000; i++) {
new Thread(()-> SynchronizedDemo.inc()).start();
}
Thread.sleep(2000);
System.out.println("count = " + count); //count = 1000
}
}
3. 思考锁的存储
可以思考一下,要实现多线程的互斥特性,那这把锁需要哪些因素?
-
锁需要有一个东西来表示,比如获得锁是什么状态?无锁状态是什么状态?
-
这个状态需要对多个线程共享,如果进行共享?
那么我们来分析,synchronized 锁是如何存储的呢?观察的整个语法发现,synchronized(lock) 是基于lock 这个对象的生命周期来控制锁粒度的,那是不是锁的存储和这个 lock 对象有关系呢?于是我们以对象在 jvm 内存中是如何存储作为切入点,去看看对象里面有什么特性能够实现锁。
3.1 对象在内存中的布局
在 Hotspot 虚拟机中,对象在内存中的存储布局,可以分为三个区域:对象头(Header)、实例数据(Instance Data)、对齐填充(Padding),如图所示:
3.2 探究 Jvm 源码实现
当我们在 Java 代码中,使用 new 创建一个对象实例的时候,(hotspot 虚拟机)JVM 层面实际上会创建一个instanceOopDesc 对象。Hotspot 虚拟机采用 OOP-Klass 模型来描述 Java 对象实例,OOP(Ordinary Object Point)指的是普通对象指针,Klass 用来描述对象实例的具体类型。Hotspot 采用instanceOopDesc 和 arrayOopDesc 来 描述对象 头,arrayOopDesc 对象用来描述数组类型 instanceOopDesc 的定义在 Hotspot 源 码 中 的instanceOop.hpp 文件中,另外,arrayOopDesc 的定义对应 arrayOop.hpp。
#ifndef SHARE_VM_OOPS_INSTANCEOOP_HPP
#define SHARE_VM_OOPS_INSTANCEOOP_HPP
#include "oops/oop.hpp"
// An instanceOop is an instance of a Java Class
// Evaluating "new HashTable()" will create an instanceOop.
class instanceOopDesc : public oopDesc {
public:
// aligned header size.
static int header_size() { return sizeof(instanceOopDesc)/HeapWordSize; }
// If compressed, the offset of the fields of the instance may not be aligned.
static int base_offset_in_bytes() {
// offset computation code breaks if UseCompressedClassPointers
// only is true
return (UseCompressedOops && UseCompressedClassPointers) ?
klass_gap_offset_in_bytes() :
sizeof(instanceOopDesc);
}
static bool contains_field_offset(int offset, int nonstatic_field_size) {
int base_in_bytes = base_offset_in_bytes();
return (offset >= base_in_bytes &&
(offset-base_in_bytes) < nonstatic_field_size * heapOopSize);
}
};
#endif // SHARE_VM_OOPS_INSTANCEOOP_HPP
从 instanceOopDesc 代码中可以看到 instanceOopDesc继承自 oopDesc,oopDesc 的定义载 Hotspot 源码中的oop.hpp 文件中;
在普通实例对象中,oopDesc 的定义包含两个成员,分别是 _mark 和 _metadata:
_mark 表示对象标记、属于 markOop 类型,也就是接下来要讲解的 Mark World,它记录了对象和锁有关的信息;
_metadata 表示类元信息,类元信息存储的是对象指向它的类元数据(Klass)的首地址,其中 Klass 表示普通指针、_compressed_klass 表示压缩类指针。
class oopDesc {
friend class VMStructs;
private:
volatile markOop _mark;
union _metadata {
Klass* _klass;
narrowKlass _compressed_klass;
} _metadata;
...
}
- MarkWord
在 Hotspot 中,markOop 的定义在 markOop.hpp 文件中,代码如下:
class markOopDesc: public oopDesc {
private:
// Conversion
uintptr_t value() const { return (uintptr_t) this; }
public:
// Constants
enum { age_bits = 4, // 分代年龄
lock_bits = 2, // 锁标识
biased_lock_bits = 1, // 是否为偏向锁
max_hash_bits = BitsPerWord - age_bits - lock_bits - biased_lock_bits,
hash_bits = max_hash_bits > 31 ? 31 : max_hash_bits,
cms_bits = LP64_ONLY(1) NOT_LP64(0),
epoch_bits = 2 // 偏向锁的时间戳
};
...
}
Mark word 记录了对象和锁有关的信息,当某个对象被synchronized 关键字当成同步锁时,那么围绕这个锁的一系列操作都和 Mark word 有关系。Mark Word 在 32 位虚拟机的长度是 32bit、在 64 位虚拟机的长度是 64bit。Mark Word 里面存储的数据会随着锁标志位的变化而变化,Mark Word 可能变化为存储以下 5 中情况:
25bit | 4bit | 1bit | 2bit | ||
---|---|---|---|---|---|
锁状态 | 23bit | 2bit | 是否偏向锁 | 锁标志位 | |
无锁 | hashcode | 分代年龄 | 0 | 01 | |
偏向锁 | 线程ID | epoch | 分代年龄 | 1 | 01 |
轻量级锁 | 指向栈中锁记录的指针 | 00 | |||
重量级锁 | 指向重量级锁的指针 | 10 | |||
GC标记 | 空 | 11 |
-
为什么任何对象都可以实现锁
-
首先,Java 中的每个对象都派生自 Object 类,而每个Java Object 在 JVM 内部都有一个 native 的 C++对象oop/oopDesc 进行对应。
-
线程在获取锁的时候,实际上就是获得一个监视器对象(monitor) ,monitor 可以认为是一个同步对象,所有的Java 对象是天生携带 monitor。在 hotspot 源码的markOop.hpp 文件中,可以看到下面这段代码:
ObjectMonitor* monitor() const { assert(has_monitor(), "check"); // Use xor instead of &~ to provide one extra tag-bit check. return (ObjectMonitor*) (value() ^ monitor_value); }
多个线程访问同步代码块时,相当于去争抢对象监视器修改对象中的锁标识,上面的代码中ObjectMonitor这个对象和线程争抢锁的逻辑有密切的关系。
-
4. synchronized 锁的升级
在分析 markword 时,提到了偏向锁、轻量级锁、重量级锁。在分析这几种锁的区别时,我们先来思考一个问题使用锁能够实现数据的安全性,但是会带来性能的下降。不使用锁能够基于线程并行提升程序性能,但是却不能保证线程安全性。这两者之间似乎是没有办法达到既能满足性能也能满足安全性的要求。
hotspot 虚拟机的作者经过调查发现,大部分情况下,加锁的代码不存在多线程的竞争,而且总是由同一个线程多次获得。所以基于这样一个概率,是的 synchronized 在JDK1.6 之后做了一些优化,为了减少获得锁和释放锁带来的性能开销,引入了偏向锁、轻量级锁的概念。因此大家会发现在 synchronized 中,锁存在四种状态分别是:无锁、偏向锁、轻量级锁、重量级锁,根据竞争激烈的程度从低到高不断升级。
4.1 偏向锁的基本原理
前面说过,大部分情况下,锁不存在多线程的竞争,而是总是由同一个线程多次获得,为了让线程获取锁的代价更低就引入了偏向锁的概念。怎么理解偏向锁呢?
当一个线程访问加了同步锁的代码块时,会在对象头中存储当前线程的 ID,后续这个线程进入和退出这段加了同步锁的代码块时,不需要再次加锁和释放锁。而是直接比较对象头里面是否存储了指向当前线程的偏向锁。如果相等表示偏向锁是偏向于当前线程的,就不需要再尝试获得锁了。
- 偏向锁的获取
-
首先获取锁对象的 Markword,判断是否处于可偏向状态。(biased_lock_bits=1、且 ThreadId 为空);
-
如果是可偏向状态,则通过 CAS 操作,把当前线程的 ID写入到 MarkWord;
-
如果 cas 成功,那么 markword 就会变成这样
T1|epoch|1|01
。表示已经获得了锁对象的偏向锁,接着执行同步代码块; -
如果 cas 失败,说明有其他线程已经获得了偏向锁,这种情况说明当前锁存在竞争,需要撤销已获得偏向
锁的线程,并且把它持有的锁升级为轻量级锁(这个操作需要等到全局安全点,也就是没有线程在执行字节码)才能执行。
-
-
如果是已偏向状态,需要检查 markword 中存储的ThreadID 是否等于当前线程的 ThreadID
-
如果相等,不需要再次获得锁,可直接执行同步代码块;
-
如果不相等,说明当前锁偏向于其他线程,需要撤销偏向锁并升级到轻量级锁;
-
-
偏向锁的撤销
偏向锁的撤销并不是把对象恢复到无锁可偏向状态(因为偏向锁并不存在锁释放的概念),而是在获取偏向锁的过程中,发现 cas 失败也就是存在线程竞争时,直接把被偏向的锁对象升级到被加了轻量级锁的状态。
对原持有偏向锁的线程进行撤销时,原获得偏向锁的线程有两种情况:
- 原获得偏向锁的线程如果已经退出了临界区,也就是同步代码块执行完了,那么这个时候会把对象头设置成无锁状态并且争抢锁的线程可以基于 CAS 重新偏向当前线程;
- 如果原获得偏向锁的线程的同步代码块还没执行完,处于临界区之内,这个时候会把原获得偏向锁的线程升级为轻量级锁后继续执行同步代码块;
在我们的应用开发中,绝大部分情况下一定会存在 2 个以上的线程竞争,那么如果开启偏向锁,反而会提升获取锁的资源消耗。所以可以通过 jvm 参数 UseBiasedLocking 来设置开启或关闭偏向锁。
4.2 轻量级锁的基本原理
-
轻量级锁的加锁
锁升级为轻量级锁之后,对象的 Markword 也会进行相应的的变化。升级为轻量级锁的过程:
-
线程在自己的栈桢中创建锁记录 LockRecord。
-
将锁对象的对象头中的MarkWord复制到线程的刚刚创建的锁记录中。
-
将锁记录中的 Owner 指针指向锁对象。
-
将锁对象的对象头的 MarkWord替换为指向锁记录的指针。
-
-
自旋锁
轻量级锁在加锁过程中,用到了自旋锁。所谓自旋,就是指当有另外一个线程来竞争锁时,这个线程会在原地循环等待,而不是把该线程给阻塞,直到那个获得锁的线程释放锁之后,这个线程就可以马上获得锁。
注意,锁在原地循环的时候,是会消耗 cpu 的,就相当于在执行一个啥也没有的 for 循环。所以,轻量级锁适用于那些同步代码块执行的很快的场景,这样,线程原地等待很短的时间就能够获得锁了。
自旋锁的使用,其实也是有一定的概率背景,在大部分同步代码块执行的时间都是很短的。所以通过看似无异议的循环反而能提升锁的性能。但是自旋必须要有一定的条件控制,否则如果一个线程执行同步代码块的时间很长,那么这个线程不断的循环反而会消耗 CPU 资源。默认情况下自旋的次数是 10 次,可以通过 preBlockSpin 来修改。
在 JDK1.6 之后,引入了自适应自旋锁,自适应意味着自旋的次数不是固定不变的,而是根据前一次在同一个锁上自旋的时间以及锁的拥有者的状态来决定。
如果在同一个锁对象上,自旋等待刚刚成功获得过锁,并且持有锁的线程正在运行中,那么虚拟机就会认为这次自旋也是很有可能再次成功,进而它将允许自旋等待持续相对更长的时间。如果对于某个锁,自旋很少成功获得过,那在以后尝试获取这个锁时将可能省略掉自旋过程,直接阻塞线程,避免浪费处理器资源。
-
轻量级锁的解锁
轻量级锁的锁释放逻辑其实就是获得锁的逆向逻辑,通过CAS 操作把线程栈帧中的 LockRecord 替换回到锁对象的MarkWord 中,如果成功表示没有竞争。如果失败,表示当前锁存在竞争,那么轻量级锁就会膨胀成为重量级锁。
4.3 重量级锁的基本原理
当轻量级锁膨胀到重量级锁之后,意味着线程只能被挂起阻塞来等待被唤醒了。
创建一个类如下:
public class App {
public synchronized static void test() {
System.out.println("test...");
}
public static void main(String[] args) {
synchronized (App.class) {
}
// 静态方法中锁为类锁
test();
}
}
通过 javap -c App.class 反编译后可以看到如下信息:
Compiled from "App.java"
public class com.hanlinsir.concurrent.thread04_synchronized.App {
public com.hanlinsir.concurrent.thread04_synchronized.App();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static synchronized void test();
Code:
0: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
3: ldc #3 // String test...
5: invokevirtual #4 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
8: return
public static void main(java.lang.String[]);
Code:
0: ldc #5 // class com/hanlinsir/concurrent/thread04_synchronized/App
2: dup
3: astore_1
4: monitorenter
5: aload_1
6: monitorexit
7: goto 15
10: astore_2
11: aload_1
12: monitorexit
13: aload_2
14: athrow
15: invokestatic #6 // Method test:()V
18: return
Exception table:
from to target type
5 7 10 any
10 13 10 any
}
可以看到加了同步代码块以后,在字节码中会看到一个monitorenter 和 monitorexit。每一个 JAVA 对象都会与一个监视器 monitor 关联,我们可以把它理解成为一把锁,当一个线程想要执行一段被synchronized 修饰的同步方法或者代码块时,该线程得先获取到 synchronized 修饰的对象对应的 monitor。monitorenter 表示去获得一个对象监视器。monitorexit 表示释放 monitor 监视器的所有权,使得其他被阻塞的线程可以尝试去获得这个监视器monitor 依赖操作系统的 MutexLock(互斥锁)来实现的, 线程被阻塞后便进入内核(Linux)调度状态,这个会导致系统在用户态与内核态之间来回切换,严重影响锁的性能。
任意线程对 Object(Object 由 synchronized 保护)的访问,首先要获得 Object 的监视器。如果获取失败,线程进入同步队列,线程状态变为 BLOCKED。当访问 Object 的前驱(获得了锁的线程)释放了锁,则该释放操作唤醒阻塞在同步队列中的线程,使其重新尝试对监视器的获取。
5. Synchronized 结合wait,notify,notifyAll
Synchronized锁定代码,被阻塞的线程什么时候被唤醒,取决于获得锁的线程什么时候执行完同步代码块并且释放锁。那怎么做到显示控制呢?我们就需要借助一个信号机制:wait/notify/notifyall,可以用于控制线程的状态。
5.1 wait/notify/notifyall 基本概念
- wait:表示持有对象锁的线程 A 准备释放对象锁权限,释放 cpu 资源并进入等待状态。
-
notify:表示持有对象锁的线程 A 准备释放对象锁权限,通知 jvm 唤醒摸个竞争锁的线程X 。 线 程 A synchronized 代码执行结束并且释放了锁之后,线程 X 直接获得对象锁权限,其他竞争线程继续等待(即使线程 X 同步完毕,释放对象锁,其他竞争线程仍然等待,直至有新的 notify ,notifyAll 被调用)。
- notifyAll:notifyall 和 notify 的区别在于,notifyAll 会唤醒所有竞争同一个对象锁的所有线程,当已经获得锁的线程A 释放锁之后,所有被唤醒的线程都有可能获得对象锁权限。
需要注意的是:三个方法都必须在 synchronized 同步关键字 所 限 定 的 作 用 域 中 调 用 , 否 则 会 报 错 java.lang.IllegalMonitorStateException ,意思是因为没有同步,所以线程对对象锁的状态是不确定的,不能调用这些方法。另外,通过同步机制来确保线程从 wait 方法返回时能够感知到感知到 notify 线程对变量做出的修改。
5.2 wait/notify 的基本使用
-
ThreadA
public class ThreadA extends Thread{ private Object lock; public ThreadA(Object lock) { this.lock = lock; } @Override public void run() { synchronized (lock){ System.out.println("start ThreadA"); try { lock.wait(); //实现线程的阻塞 } catch (InterruptedException e) { e.printStackTrace(); } System.out.println("end ThreadA"); } } }
-
ThreadB
public class ThreadB extends Thread{ private Object lock; public ThreadB(Object lock) { this.lock = lock; } @Override public void run() { synchronized (lock){ System.out.println("start ThreadB"); lock.notify(); //唤醒被阻塞的线程 System.out.println("end ThreadB"); } } }
-
WaitNotifyDemo
public class WaitNotifyDemo { public static void main(String[] args) { Object lock=new Object(); ThreadA threadA=new ThreadA(lock); threadA.start(); ThreadB threadB=new ThreadB(lock); threadB.start(); } } // start ThreadA -- A 先进入 // start ThreadB -- A wait, B进入 // end ThreadB -- B 发出唤醒通知,B执行完毕 // end ThreadA -- A 执行完毕
-
wait/notify的基本原理
微信扫描二维码
(转载本站文章请注明作者和出处 鲁先生-hanlinsir)