今天來從操作系統層面理解一下多線程沖突的問題,話不多說,開始~~
同一進程內的線程是共享同一內存空間的,所以在多個線程的進程里,線程是可以同時操作這個進程空間的數據的,線程之間可以共享進程的資源:比如代碼段、堆空間、數據段、打開的文件等資源,但每個線程也有自己獨立的棧空間。如果多個線程如果競爭共享資源,如果不采取有效的措施,則會造成共享數據的混亂。
舉個小栗子:一個房子里(代表一個進程),只有一個廁所(代表共享資源)。屋子里面有兩個人A和B(代表兩個線程),共用這個廁所。一天A去上廁所了,不過廁所門的鎖壞了,就沒法鎖門。這是B也想去上廁所,直接就開門進去了,然后發現A在里面。
上面這個故事說明,對于共享資源,如果沒有上鎖,在多線程的環境里,那么就可能會發生翻車現場。
做個小實驗,創建五個線程,它們分別對共享變量 i 自增 1 執行 1000 次
package com.atguigu.juc.atomics;public class Station{ int i = 0; public void add() { for(int m = 0; m < 1000; m++){ try { //使用sleep()模擬業務時間,如果不加,大概率不會出現并發問題 Thread.sleep(1); i += 1; } catch (InterruptedException e) { e.printStackTrace(); } } } public static void main(String[] args) throws InterruptedException { //實例化站臺對象,并為每一個站臺取名字 Station station = new Station(); new Thread(station::add,"線程1").start(); new Thread(station::add,"線程2").start(); new Thread(station::add,"線程3").start(); new Thread(station::add,"線程4").start(); new Thread(station::add,"線程5").start(); Thread.sleep(20000); // 讓每一個站臺對象各自開始工作 System.out.println(station.i); Thread.sleep(5000); System.out.println(station.i); }}
運行了幾次發現,每次運行得到不同的結果。在計算機里是不能容忍的,雖然是小概率出現的錯誤,但是小概率事件它一定是會發生的。
為什么會出現這樣的問題呢?
為了理解為什么會發生這種情況,我們必須了解編譯器為更新計數器 i 變量生成的代碼序列,也就是要了解匯編指令的執行順序。
在這個例子中,我們只是想給 i 加上數字 1,那么它對應的匯編指令執行過程是這樣的:
可以發現,只是單純給 i 加上數字 1,在 CPU 運行的時候,實際上要執行 3 條指令。
設想我們的線程 1 進入這個代碼區域,它將 i 的值(假設此時是 50 )從內存加載到它的寄存器中,然后它向寄存器加 1,此時在寄存器中的 i 值是 51。
現在,一件不幸的事情發生了:當前線程被掛起了,線程 2 被調度運行,并進入同一段代碼。它也執行了第一條指令,從內存獲取 i 值并將其放入到寄存器中,此時內存中 i 的值仍為 50,因此線程 2 寄存器中的 i 值也是 50。假設線程 2 執行接下來的兩條指令,將寄存器中的 i 值 + 1,然后將寄存器中的 i 值保存到內存中,于是此時全局變量 i 值是 51。
最后,又發生一次上下文切換,線程 1 恢復執行。還記得它已經執行了兩條匯編指令,現在準備執行最后一條指令。回憶一下, 線程 1 寄存器中的 i 值是51,因此,執行最后一條指令后,將值保存到內存,全局變量 i 的值再次被設置為 51。
簡單來說,增加 i (值為 50 )的代碼被運行兩次,按理來說,最后的 i 值應該是 52,但是由于不可控的調度,導致最后 i 值卻是 51。
針對上面線程 1 和線程 2 的執行過程,我畫了一張流程圖,會更明確一些:
上面展示的情況稱為競爭條件(race condition),當多線程相互競爭操作共享變量時,由于運氣不好,即在執行過程中發生了上下文切換,我們得到了錯誤的結果,事實上,每次運行都可能得到不同的結果,因此輸出的結果存在不確定性(indeterminate)。
由于多線程執行操作共享變量的這段代碼可能會導致競爭狀態,因此我們將此段代碼稱為臨界區(critical section),它是訪問共享資源的代碼片段,一定不能給多線程同時執行。
我們希望這段代碼是互斥(mutualexclusion)的,也就說保證一個線程在臨界區執行時,其他線程應該被阻止進入臨界區,說白了,就是這段代碼執行過程中,最多只能出現一個線程。
另外,說一下互斥也并不是只針對多線程。在多進程競爭共享資源的時候,也同樣是可以使用互斥的方式來避免資源競爭造成的資源混亂。
所謂同步,就是并發進程/線程在一些關鍵點上可能需要互相等待與互通消息,這種相互制約的等待與互通信息稱為進程/線程同步。
上面那個栗子:一A去上廁所了,發現廁所門的鎖壞了,告訴B一聲。這是B想去上廁所的話,就會先問一下A是不是還在里面,然后再開門進去了。這也是互通消息的方式,如果鎖沒有壞,A直接把門鎖上,這就是相互等待的方式。
為了實現進程/線程間正確的協作,操作系統必須提供實現進程協作的措施和方法,主要的方法有兩種:
這兩個都可以方便地實現進程/線程互斥,而信號量比鎖的功能更強一些,它還可以方便地實現進程/線程同步。
使用加鎖操作和解鎖操作可以解決并發線程/進程的互斥問題。
任何想進入臨界區的線程,必須先執行加鎖操作。若加鎖操作順利通過,則線程可進入臨界區;在完成對臨界資源的訪問后再執行解鎖操作,以釋放該臨界資源。
信號量是操作系統提供的一種協調共享資源訪問的方法。通常信號量表示資源的數量,對應的變量是一個整型(sem)變量。
另外,還有兩個原子操作的系統調用函數來控制信號量的,分別是:
舉個類比,2 個資源的信號量,相當于 2 條火車軌道,PV 操作如下圖過程:
本文鏈接:http://www.tebozhan.com/showinfo-26-84017-0.html我們一起聊聊從操作系統層面理解多線程沖突
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: C#中的正則表達式:強大的文本處理工具