現(xiàn)代操作系統(tǒng)在運行一個程序時,會為其創(chuàng)建一個進(jìn)程,例如,我們啟動一個 Java 程序,系統(tǒng)就會創(chuàng)建一個 Java 進(jìn)程,在一個進(jìn)程里可以創(chuàng)建多個線程,這些線程擁有自己的計數(shù)器、堆棧和局部變量等屬性,引入線程的概念可以將一個進(jìn)程的資源分配和執(zhí)行調(diào)度分開,并且能夠訪問共享的內(nèi)存變量,如內(nèi)存地址和文件 I/O 等,線程是計算機中比進(jìn)程更輕量級的調(diào)度執(zhí)行單元,也是系統(tǒng)調(diào)度的最小單元,也叫輕量級進(jìn)程(Light Weight Process, LWP),CPU 在這些線程上高速切換,讓使用者感覺到這些線程在同時執(zhí)行。
一個 Java 程序從 main() 方法開始執(zhí)行,然后按照既定的代碼邏輯執(zhí)行,看似沒有其他線程參與,但實際上 Java 程序天生就是多線程程序,因為執(zhí)行 main() 方法的是一個名稱為 main 的線程。我們通過一段代碼看下一個普通的 Java 程序包含哪些線程。
public class thread { public static void main(String[] args) { // 獲取Java線程管理 ThreadMXBean threadMXBean = ManagementFactory.getThreadMXBean(); // 僅獲取線程和線程堆棧信息 ThreadInfo[] threadInfos = threadMXBean.dumpAllThreads(false, false); // 遍歷線程信息,僅僅打印線程 ID 和線程名稱信息 for (ThreadInfo threadInfo : threadInfos) { System.out.println("[" + threadInfo.getThreadId() + "]" + threadInfo.getThreadName()); } }}
圖片
可以看到,一個 Java 程序的運行不僅僅是 main() 方法的運行,而是 main 線程和多個其他線程的同時運行。
主流的操作系統(tǒng)都提供了線程實現(xiàn)。Java 語言則提供了在不同硬件和操作系統(tǒng)平臺下對線程操作統(tǒng)一處理的能力。在 Java 中,每個已經(jīng)執(zhí)行 start() 方法且尚未結(jié)束的 java.lang.Thread 類的實例代表一個線程。
查看 JDK 的 Thread 類可以看到 Thread 類與大部分 Java API 有明顯的差異,它的關(guān)鍵方法都被聲明為 Native。在 Java API 中,Native 方法通常意味著該方法沒有使用或無法使用平臺無關(guān)的手段來實現(xiàn)(說明需要操作的是很底層的東西了,已經(jīng)脫離了 Java 語言層面的范疇)。
圖片
實現(xiàn)線程主要有 3 種方式:使用內(nèi)核線程實現(xiàn)( 1:1 實現(xiàn))、使用用戶線程實現(xiàn)( N:1 實現(xiàn))和使用用戶線程加輕量級進(jìn)程混合實現(xiàn)( N:M 實現(xiàn))。
內(nèi)核線程(Kernel-Level Thread, KLT)是由操作系統(tǒng)內(nèi)核直接支持的線程,內(nèi)核通過操縱調(diào)度器(Scheduler)對線程進(jìn)行調(diào)度,并負(fù)責(zé)將線程的任務(wù)映射到各個處理器上。下圖中 KLT 線程上面都有一個 LWP 與之對應(yīng),每個內(nèi)核線程可以視為內(nèi)核的一個分身,這樣操作系統(tǒng)就能夠同時處理多個任務(wù),從而支持多線程。
程序一般不會直接使用內(nèi)核線程,而是使用內(nèi)核線程的一種高級接口——輕量級進(jìn)程(Light Weight Process, LWP)。輕量級進(jìn)程是我們通常所說的線程,由于每個輕量級進(jìn)程都由一個內(nèi)核線程支持,因此只有先支持內(nèi)核線程,才能有輕量級進(jìn)程。輕量級進(jìn)程與內(nèi)核線程之間是一對一的關(guān)系,稱為一對一的線程模型。
由于內(nèi)核線程的支持,每個輕量級進(jìn)程都成為一個獨立的調(diào)度單元,即使有一個輕量級進(jìn)程在系統(tǒng)調(diào)用中阻塞了,也不會影響整個進(jìn)程繼續(xù)工作。但輕量級進(jìn)程也有一些局限性:由于是基于內(nèi)核線程實現(xiàn)的,各種線程操作,如創(chuàng)建、析構(gòu)及同步,都需要進(jìn)行系統(tǒng)調(diào)用。而系統(tǒng)調(diào)用的代價相對較高,需要在用戶態(tài)(User Mode)和內(nèi)核態(tài)(Kernel Mode)之間來回切換。其次,每個輕量級進(jìn)程都需要有一個內(nèi)核線程的支持,因此輕量級進(jìn)程要消耗一定的內(nèi)核資源(例如內(nèi)核線程的棧空間),因此一個系統(tǒng)支持輕量級進(jìn)程的數(shù)量是有限的。
圖片
輕量級進(jìn)程與內(nèi)核線程之間1:1的示意圖
用戶線程是指完全建立在用戶空間線程庫之上的線程實現(xiàn),系統(tǒng)內(nèi)核對其不可感知。即所有的用戶線程都會對應(yīng)到一個內(nèi)核線程中,用戶線程的創(chuàng)建、同步、銷毀和調(diào)度完全在用戶空間中完成,無需內(nèi)核的幫助。如果程序?qū)崿F(xiàn)得當(dāng),這些線程無需切換到內(nèi)核模式,從而實現(xiàn)快速且低開銷的操作。它們還可以支持更多的線程數(shù)量,因此在高性能數(shù)據(jù)庫等場景中經(jīng)常使用用戶線程。進(jìn)程與用戶線程之間的關(guān)系采用一對多的線程模型。
使用用戶線程的優(yōu)勢在于不需要系統(tǒng)內(nèi)核的支持。然而劣勢在于它們也缺乏系統(tǒng)內(nèi)核的支持,所有線程操作都需要用戶程序自己處理。需要考慮線程創(chuàng)建、切換和調(diào)度等問題。在某一線程被阻塞時,會導(dǎo)致整個所屬進(jìn)程阻塞。Java 曾經(jīng)使用過用戶線程,但最終放棄了使用它們。但是比如 Golang、Erlang 等一些新的、以高并發(fā)為賣點的變成語言普遍支持了用戶線程。
進(jìn)程與用戶線程之間N:1的關(guān)系示意圖
內(nèi)核線程和用戶線程結(jié)合的實現(xiàn)方式。在這種混合實現(xiàn)中,用戶線程和輕量級進(jìn)程同時存在。用戶線程仍然完全建立在用戶空間中,因此創(chuàng)建、切換和銷毀用戶線程的操作仍然是廉價的,并且可以同時支持大量的用戶線程。操作系統(tǒng)提供對輕量級進(jìn)程的支持,它們充當(dāng)用戶線程和內(nèi)核線程之間的橋梁。這樣可以利用內(nèi)核提供的線程調(diào)度和處理器映射功能。用戶線程的系統(tǒng)調(diào)用通過輕量級進(jìn)程來處理,大大降低了整個進(jìn)程被完全阻塞的風(fēng)險。在這種混合模型中,用戶線程和輕量級進(jìn)程的比例可以變化,形成一個 N:M 的關(guān)系。
許多 UNIX 系列的操作系統(tǒng)都提供了 N:M 的線程模型實現(xiàn)。這些操作系統(tǒng)上的應(yīng)用也相對更容易應(yīng)用 N:M 的線程模型。
用戶線程與輕量級進(jìn)程之間N:M的關(guān)系示意圖
操作系統(tǒng)支持怎么樣的線程模型,很大程度上會影響上面的 Java 虛擬機的線程是怎么映射的,JVM 規(guī)范里面沒有規(guī)定,必須使用哪一種模型。線程模型主要影響線程的并發(fā)規(guī)模和操作成本,對于 Java 程序的編碼和運行過程來說,這些差異都是透明的, Java 作為上層應(yīng)用,其實是感知不到上面三種模型之間的區(qū)別的,即開發(fā)者無需關(guān)注具體的線程模型細(xì)節(jié)。
在 JDK 1.2 之前,Java 線程使用的是稱為“綠色線程”(Green Threads)的用戶級線程實現(xiàn)。但是在 JDK 1.3 起,線程模型被替換為基于操作系統(tǒng)原生線程模型的實現(xiàn)方式,即采用 1:1 的線程模型。
Java SE 最常用的 JVM 是 Oracle/Sun 研發(fā)的 HotSpot VM。在這個 JVM 的較新版本所支持的所有平臺上,它都是使用 1:1 線程模型的——除了 Solaris 之外,它是個特例。也就是說一個 Java 線程是直接通過一個操作系統(tǒng)原生線程來實現(xiàn)的,中間并沒有額外的間接結(jié)構(gòu)。而且 HotSpot VM 自己也不干涉線程的調(diào)度,全權(quán)交給底下的 OS 去處理。
線程調(diào)度是指系統(tǒng)為線程分配處理器使用權(quán)的過程,主要調(diào)度方式有兩種,分別是協(xié)同式線程調(diào)度(Cooperative Threads-Scheduling)和搶占式線程調(diào)度(Preemptive Threads-Scheduling)。
如果在多線程系統(tǒng)中使用協(xié)同式調(diào)度,每個線程的執(zhí)行時間由線程自身控制。在完成工作后,線程需要主動通知系統(tǒng)切換到另一個線程。協(xié)同式多線程的主要優(yōu)勢在于簡單性,由于線程切換由線程自身知曉,因此不存在線程同步問題。協(xié)同式調(diào)度也存在明顯的缺點。線程的執(zhí)行時間無法控制,如果一個線程出現(xiàn)問題并且沒有通知系統(tǒng)切換線程,整個進(jìn)程可能會無限期地被阻塞。
如果一個多線程系統(tǒng)采用搶占式調(diào)度,系統(tǒng)會為每個線程分配執(zhí)行時間,線程切換不由線程自身決定(在 Java 中,Thread.yield() 可以讓出執(zhí)行時間,但線程本身無法控制獲取執(zhí)行時間)。在這種線程調(diào)度實現(xiàn)中,線程的執(zhí)行時間由系統(tǒng)控制,不會出現(xiàn)一個線程阻塞整個進(jìn)程的情況。Java 使用搶占式調(diào)度作為其線程調(diào)度機制。如果一個進(jìn)程遇到問題,我們可以使用“任務(wù)管理器”終止該進(jìn)程,而不會導(dǎo)致系統(tǒng)崩潰。
說到計算調(diào)度這里還要說一下 CPU 時間片
在單個處理器的時期,操作系統(tǒng)就能處理多線程并發(fā)任務(wù)。處理器給每個線程分配 CPU 時間片(Time Slice),線程在分配獲得的時間片內(nèi)執(zhí)行任務(wù)。CPU 時間片是 CPU 分配給每個線程執(zhí)行的時間段,一般為幾十毫秒。在這么短的時間內(nèi)線程互相切換,我們根本感覺不到,所以看上去就好像是同時進(jìn)行的一樣。
時間片決定了一個線程可以連續(xù)占用處理器運行的時長。當(dāng)一個線程的時間片用完了,或者因自身原因被迫暫停運行了,這個時候,另外一個線程(可以是同一個線程或者其它進(jìn)程的線程)就會被操作系統(tǒng)選中,來占用處理器。這種一個線程被暫停剝奪使用權(quán),另外一個線程被選中開始或者繼續(xù)運行的過程就叫做上下文切換。
當(dāng)一個線程讓出 CPU 時間片時,它需要記錄下整個執(zhí)行上下文,以便在恢復(fù)執(zhí)行時從上次離開的地方繼續(xù)。這包括變量、計算結(jié)果、程序計數(shù)器等等。就像是對線程的運行環(huán)境進(jìn)行快照,這樣當(dāng)它重新獲得 CPU 時間時,可以通過檢索保存的數(shù)據(jù)快速恢復(fù)先前的執(zhí)行上下文。這個過程被稱為“上下文切換”。
在一個擁有多個 CPU 的系統(tǒng)中,操作系統(tǒng)以循環(huán)方式將 CPU 分配給不同的線程。這導(dǎo)致上下文切換更加頻繁,特別是在跨不同 CPU 進(jìn)行上下文切換時,比單個 CPU 內(nèi)的上下文切換更加昂貴。
在操作系統(tǒng)中,上下文切換可以發(fā)生在進(jìn)程之間或線程之間。在多線程編程的背景下,我們主要關(guān)注線程之間上下文切換的性能影響。現(xiàn)在,讓我們探討一下多線程中上下文切換的原因。但在此之前,讓我們先了解一下系統(tǒng)線程的生命周期狀態(tài)。
圖片
系統(tǒng)線程主要有“新建”(NEW)、“就緒”(RUNNABLE)、“運行”(RUNNING)、“阻塞”(BLOCKED)、“死亡”(DEAD)五種狀態(tài)。到了 Java 層面它們都被映射為了 NEW、RUNABLE、BLOCKED、WAITING、TIMED_WAITING、TERMINADTED 等 6 種狀態(tài)。
在這個運行過程中,線程由 RUNNABLE 轉(zhuǎn)為非 RUNNABLE 的過程就是線程上下文切換。一個線程的狀態(tài)由 RUNNING 轉(zhuǎn)為 BLOCKED ,再由 BLOCKED 轉(zhuǎn)為 RUNNABLE ,然后再被調(diào)度器選中執(zhí)行,這就是一個上下文切換的過程。多線程的上下文切換實際上就是由多線程兩個運行狀態(tài)的互相切換導(dǎo)致的。
那么在線程運行時,線程狀態(tài)由 RUNNING 轉(zhuǎn)為 BLOCKED 或者由 BLOCKED 轉(zhuǎn)為 RUNNABLE,是怎么誘發(fā)的呢?
系統(tǒng)線程切換可以由多種情況下誘發(fā),包括但不限于以下幾種情況:
我們可以分兩種情況來分析,一種是程序本身觸發(fā)的切換,這種我們稱為自發(fā)性上下文切換,另一種是由系統(tǒng)或者虛擬機誘發(fā)的非自發(fā)性上下文切換。
接下來我們看一段代碼,來對比串聯(lián)執(zhí)行和并發(fā)執(zhí)行的速度
package com.yuyy.test;public class DemoApplication { public static void main(String[] args) { // 運行多線程 MultiThreadTester test1 = new MultiThreadTester(); test1.Start(); // 運行單線程 SerialTester test2 = new SerialTester(); test2.Start(); } static class MultiThreadTester extends ThreadContextSwitchTester { @Override public void Start() { long start = System.currentTimeMillis(); MyRunnable myRunnable1 = new MyRunnable(); Thread[] threads = new Thread[4]; // 創(chuàng)建多個線程 for (int i = 0; i < 4; i++) { threads[i] = new Thread(myRunnable1); threads[i].start(); } for (int i = 0; i < 4; i++) { try { // 等待一起運行完 threads[i].join(); } catch (InterruptedException e) { e.printStackTrace(); } } long end = System.currentTimeMillis(); System.out.println("multi thread exec time: " + (end - start) + "s"); System.out.println("counter: " + counter); } // 創(chuàng)建一個實現(xiàn)Runnable的類 class MyRunnable implements Runnable { public void run() { while (counter < 100000000) { synchronized (this) { if(counter < 100000000) { increaseCounter(); } } } } } } // 創(chuàng)建一個單線程 static class SerialTester extends ThreadContextSwitchTester{ @Override public void Start() { long start = System.currentTimeMillis(); for (long i = 0; i < count; i++) { increaseCounter(); } long end = System.currentTimeMillis(); System.out.println("serial exec time: " + (end - start) + "s"); System.out.println("counter: " + counter); } } static abstract class ThreadContextSwitchTester { public static final int count = 100000000; public volatile int counter = 0; public void increaseCounter() { this.counter += 1; } public abstract void Start(); }}
執(zhí)行之后,看一下兩者的時間測試結(jié)果:串聯(lián)的執(zhí)行速度比并發(fā)的執(zhí)行速度要快。這就是因為線程的上下文切換導(dǎo)致了額外的開銷。
圖片
雖然 Java 線程調(diào)度由系統(tǒng)自動處理,但我們?nèi)匀豢梢浴敖ㄗh”系統(tǒng)為某些線程分配更多的執(zhí)行時間,而為其他線程分配較少的執(zhí)行時間。這可以通過設(shè)置線程優(yōu)先級來實現(xiàn)。Java 語言提供了 10 個級別的線程優(yōu)先級。當(dāng)兩個線程同時處于 Ready 狀態(tài)時,優(yōu)先級較高的線程更有可能被系統(tǒng)選擇執(zhí)行,其實就是讓高優(yōu)先級的線程獲得更多的CPU 時間片。
設(shè)置優(yōu)先級有助于”線程規(guī)劃期“確定在下一次選擇哪一個線程來優(yōu)先執(zhí)行,設(shè)置線程優(yōu)先級使用 setPriority() 方法
圖片
但是,線程優(yōu)先級并不總是可靠的,因為 Java 線程最終是通過映射到底層操作系統(tǒng)的原生線程來實現(xiàn)的。因此,線程調(diào)度仍然取決于操作系統(tǒng)。盡管許多操作系統(tǒng)提供了線程優(yōu)先級的概念,但它們不一定直接對應(yīng)于 Java 線程優(yōu)先級。例如,Solaris 擁有 2,147,483,648(2^32)個優(yōu)先級級別,而 Windows 只有 7 個。如果操作系統(tǒng)的優(yōu)先級級別多于 Java,將它們映射是相對簡單的,可以在它們之間留下一些空位。然而,如果操作系統(tǒng)的優(yōu)先級級別少于 Java,可能會出現(xiàn)多個優(yōu)先級映射到同一級別的情況。
下圖顯示了 Java 線程優(yōu)先級與 Windows 線程優(yōu)先級之間的對應(yīng)關(guān)系,不包括 THREAD_PRIORITY_IDLE,因為它在 Windows 平臺的 JDK 中未使用。因此如果在 Java 程序中對兩個線程設(shè)置的優(yōu)先級分別是 3 和 4 那么對于Windows 來說他們的優(yōu)先級還是一致的。還有例如 Windows 系統(tǒng)中存在一個叫做“優(yōu)先級推進(jìn)器”的功能,大致作用是當(dāng)系統(tǒng)發(fā)現(xiàn)一個線程被執(zhí)行的特別頻繁的時候,可能會越過線程優(yōu)先級去為它分配執(zhí)行時間,從而減少線程頻繁切換而帶來的性能損耗。因此我們在程序中并不能判斷同樣為就緒狀態(tài)且優(yōu)先級一致的多個線程系統(tǒng)會先執(zhí)行哪一個。
圖片
對于任何支持多線程的計算機語言來說,深入理解線程及寫好多線程程序,都是一個巨大的挑戰(zhàn)。本主要簡述 Java 線程與操作系統(tǒng)線程之間的關(guān)系。java 中的線程和操作系統(tǒng)中的線程分別存在于虛擬機和操作系統(tǒng)中,一個 Java 線程是直接通過一個操作系統(tǒng)線程來實現(xiàn)的。其中還有很多值得深挖的點。大家有興趣的話,可以仔細(xì)研究一下。
深入理解Java虛擬機(第3版)
本文鏈接:http://www.tebozhan.com/showinfo-26-16010-0.html我們一起聊聊Java線程和CPU調(diào)度
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com