當前位置：首頁 > 科技 > 軟件

利用貝葉斯網絡預測醫院服務患者數量

來源：責編：時間：2023-10-18 09:18:43 314觀看

導讀譯者 | 朱先忠審校 | 重樓駕馭復雜性：預測醫療保健中的患者數量在醫療保健領域，準確預測即將到來的患者數量不僅對手術成功至關重要，也是一個非常棘手的問題。原因很簡單：需要考慮的依賴性因素太多了——患者的嚴重程度和

譯者 | 朱先忠

審校 | 重樓

駕馭復雜性：預測醫療保健中的患者數量

在醫療保健領域，準確預測即將到來的患者數量不僅對手術成功至關重要，也是一個非常棘手的問題。原因很簡單：需要考慮的依賴性因素太多了——患者的嚴重程度和特殊要求、管理需求、檢查室限制、員工請病假、嚴重的暴風雪等等。更糟糕的是，意外情況可能會對日程安排和資源分配產生連鎖影響，甚至可能與最高質量的Excel項目預測結果產生矛盾。

從數據的角度來看，這些挑戰真的很有趣，因為它們極其復雜，足夠你考慮一段時間的。但是，即使是輕微的改進也可能帶來重大的勝利（例如，提高患者吞吐量、縮短等待時間、讓醫療保健提供者更快樂、降低成本等）。

另一種預測方法：貝葉斯模型

那么，還有什么替代方案呢？Epic為我們提供了大量數據，包括患者何時赴約的實際記錄。在已知歷史“顯示”和“未顯示”的情況下，我們可以在監督學習的空間中操作，貝葉斯網絡（BN：Bayesian Networks）提供了很好的概率圖形模型來預測未來的訪問概率。

雖然生活中的大多數決定都可以通過一個輸入來決定（例如，考慮“我應該帶雨衣嗎？”。假設外面下雨，那么這個決定應該是“是”），但貝葉斯網絡可以很容易地處理更復雜的決策——涉及多個輸入的決策（例如，天氣潮濕，步行僅3分鐘，你的雨衣在另一層樓，你的朋友可能有傘，等等），具有不同的概率結果和依賴性。在這篇文章中，我將在Python語言環境中構造一個超簡單的貝葉斯網絡，它可以根據癥狀、癌癥分期和治療目標這三個因素的已知概率，輸出患者在2個月內到達的概率得分。

理解貝葉斯網絡

貝葉斯網絡的核心是使用有向無環圖（DAG）的聯合概率分布的圖形表示。DAG中的節點表示隨機變量，有向邊表示這些變量之間的因果關系或條件依賴關系。正如所有數據科學項目一樣，在一開始就花大量時間與利益相關者協商，以正確映射決策中涉及的工作流程（例如變量），這對于高質量的預測結果是至關重要的。

因此，我將發明一個場景，讓我們與乳腺腫瘤合作伙伴會面，由他們來解釋三個變量——患者癥狀、癌癥分期和當前治療目標，對于確定患者是否需要在2個月內預約至關重要。

（事實上，影響未來患者數量的因素不下幾十個，其中一些是單一或多重依賴性的，另一些則是完全獨立但仍有影響的）。

現在，假設我們同意如下工作流程：階段取決于他們的癥狀，但治療類型與癥狀無關，也影響到2個月內的預約。

基于此，我們將從我們的數據源（對我們來說是Epic）中獲取這些變量的數據，該數據源將再次包含我們的分數節點（Appointment_2months）的已知值，標記為“是”或“否”。這種數據整理是一個重要部分；你需要根據這些變量在2個月前表明的情況，正確地捕捉2個月內真正到達患者的病例。

# 安裝包import pandas as pd # 用于數據處理 import networkx as nx # 用于繪圖import matplotlib.pyplot as plt # 用于繪圖!pip install pybbn# 用于創建貝葉斯置信網絡（BBN）from pybbn.graph.dag import Bbnfrom pybbn.graph.edge import Edge, EdgeTypefrom pybbn.graph.jointree import EvidenceBuilderfrom pybbn.graph.node import BbnNodefrom pybbn.graph.variable import Variablefrom pybbn.pptc.inferencecontroller import InferenceController# 通過手動鍵入概率創建節點Symptom = BbnNode(Variable(0, 'Symptom', ['Non-Malignant', 'Malignant']), [0.30658, 0.69342])Stage = BbnNode(Variable(1, 'Stage', ['Stage_III_IV', 'Stage_I_II']), [0.92827, 0.07173,  0.55760, 0.44240])TreatmentTypeCat = BbnNode(Variable(2, 'TreatmentTypeCat', ['Adjuvant/Neoadjuvant', 'Treatment', 'Therapy']), [0.58660, 0.24040, 0.17300])Appointment_2weeks = BbnNode(Variable(3, 'Appointment_2weeks', ['No', 'Yes']), [0.92314, 0.07686,  0.89072, 0.10928,  0.76008, 0.23992,  0.64250, 0.35750,  0.49168, 0.50832,  0.32182, 0.67818])

上面代碼中，讓我們手動輸入每個變量（節點）中對應級別的一些概率值。注意，這些概率值沒有被猜測，甚至會是最好的猜測結果。不過，在實踐應用中，您還將再次根據現有數據來計算對應的頻率。

讓我們以癥狀（symptom）變量為例。我會得到它們的2級頻率值：大約31%是非惡性的，69%是惡性的，請參考下圖：

然后，我們考慮下一個變量Stage，并使用Symptom進行交叉表計算，以獲得這些頻率。我們這樣做是因為階段（Stage）取決于癥狀（Symptom），因為它們每個變量都對應兩個場景，所以它們實際上存在4個概率結果。

依此類推，直到定義了父子對之間的所有交叉表。

現在，大多數貝葉斯網絡包括許多父子關系，因此計算概率可能會變得乏味（而且非常容易出錯），下面的函數可以用來計算與0、1或2個父節點對應的任何子節點的概率矩陣。雖然醫學洞見不能也不應該被自動化處理，但數據準備部分的工作完全可以也應該通過自動化的方式來實現。

# 此函數有助于計算進入BBN的概率分布（注意，最多可以處理2個父節點）def probs(data, child, parent1=None, parent2=None): if parent1==None: # 計算概率 prob=pd.crosstab(data[child], 'Empty', margins=False, normalize='columns').sort_index().to_numpy().reshape(-1).tolist() elif parent1!=None: # 檢查子節點是否有1個父節點或2個父節點 if parent2==None: # 計算概率 prob=pd.crosstab(data[parent1],data[child], margins=False, normalize='index').sort_index().to_numpy().reshape(-1).tolist() else:  # 計算概率 prob=pd.crosstab([data[parent1],data[parent2]],data[child], margins=False, normalize='index').sort_index().to_numpy().reshape(-1).tolist() else: print("Error in Probability Frequency Calculations") return prob

接下來，我們創建實際的貝葉斯網絡節點和網絡本身：

# 通過使用我們早期的函數自動計算概率來創建節點Symptom = BbnNode(Variable(0, 'Symptom', ['Non-Malignant', 'Malignant']), probs(df, child='SymptomCat'))Stage = BbnNode(Variable(1, 'Stage', ['Stage_I_II', 'Stage_III_IV']), probs(df, child='StagingCat', parent1='SymptomCat'))TreatmentTypeCat = BbnNode(Variable(2, 'TreatmentTypeCat', ['Adjuvant/Neoadjuvant', 'Treatment', 'Therapy']), probs(df, child='TreatmentTypeCat'))Appointment_2months = BbnNode(Variable(3, 'Appointment_2months', ['No', 'Yes']), probs(df, child='Appointment_2months', parent1='StagingCat', parent2='TreatmentTypeCat'))# 創建貝葉斯網絡bbn = Bbn() / .add_node(Symptom) / .add_node(Stage) / .add_node(TreatmentTypeCat) / .add_node(Appointment_2months) / .add_edge(Edge(Symptom, Stage, EdgeType.DIRECTED)) / .add_edge(Edge(Stage, Appointment_2months, EdgeType.DIRECTED)) / .add_edge(Edge(TreatmentTypeCat, Appointment_2months, EdgeType.DIRECTED))# 將BBN轉換為連接樹join_tree = InferenceController.apply(bbn)

現在，我們準備好了一切。接下來，讓我們通過貝葉斯網絡運行一些假設，并給出評估輸出。

評估貝葉斯網絡輸出

首先，讓我們看看每個節點的概率，而不需要具體聲明任何條件。

# 定義打印邊際概率的函數#每個節點的概率def print_probs(): for node in join_tree.get_bbn_nodes(): potential = join_tree.get_bbn_potential(node) print("Node:", node) print("Values:") print(potential) print('----------------')# 使用以上函數打印邊際概率print_probs()輸出結果如下：Node: 1|Stage|Stage_I_II,Stage_III_IVValues:1=Stage_I_II|0.671241=Stage_III_IV|0.32876----------------Node: 0|Symptom|Non-Malignant,MalignantValues:0=Non-Malignant|0.693420=Malignant|0.30658----------------Node: 2|TreatmentTypeCat|Adjuvant/Neoadjuvant,Treatment,TherapyValues:2=Adjuvant/Neoadjuvant|0.586602=Treatment|0.173002=Therapy|0.24040----------------Node: 3|Appointment_2weeks|No,YesValues:3=No|0.776553=Yes|0.22345----------------

上述情況表明，該數據集中的所有患者都有67%的概率為Stage_I_II，69%的概率為非惡性（Non-Malignant），58%的概率需要輔助/新輔助（Adjuvant/Neoadjuvant）治療，其中只有22%的患者需要在2個月后預約。

顯然，我們可以很容易地從沒有貝葉斯網絡的簡單頻率表中得到這一點。

但現在，讓我們問一個更有條件的問題：考慮到患者患有階段=Stage_I_II和TreatmentTypeCat=Therapy，患者在2個月內需要護理的可能性有多大。此外，考慮到醫療保健提供者對他們的癥狀一無所知（也許他們還沒有見過病人）。

我們將在節點中運行我們所知道的正確內容：

# 添加已發生事件的證據，以便重新計算概率分布def evidence(ev, nod, cat, val): ev = EvidenceBuilder() / .with_node(join_tree.get_bbn_node_by_name(nod)) / .with_evidence(cat, val) / .build() join_tree.set_observation(ev)# 添加更多證據evidence('ev1', 'Stage', 'Stage_I_II', 1.0)evidence('ev2', 'TreatmentTypeCat', 'Therapy', 1.0)# 打印邊際概率print_probs()

上述代碼的執行將返回如下內容：

Node: 1|Stage|Stage_I_II,Stage_III_IVValues:1=Stage_I_II|1.000001=Stage_III_IV|0.00000----------------Node: 0|Symptom|Non-Malignant,MalignantValues:0=Non-Malignant|0.576020=Malignant|0.42398----------------Node: 2|TreatmentTypeCat|Adjuvant/Neoadjuvant,Treatment,TherapyValues:2=Adjuvant/Neoadjuvant|0.000002=Treatment|0.000002=Therapy|1.00000----------------Node: 3|Appointment_2months|No,YesValues:3=No|0.890723=Yes|0.10928----------------

上面結果顯示，這個病人在兩個月內到達的幾率只有11%。我們可以詢問我們變量的已知或未知特征的任何排列，以預測患者在2個月內到達的概率。可以利用進一步的算法和函數來收集許多患者或患者組的概率，或優化這些概率。

關于質量輸入變量重要性的說明

Python代碼編寫是一回事，但貝葉斯網絡在提供可靠的未來就診估計方面的真正成功在很大程度上取決于患者護理工作流程的準確映射。所有這些需要時間、談話和白板——而不是僅僅的編碼工作。這樣的信息取得甚至可能需要幾次數據挖掘，并與客戶重新接觸，以進行壓力測試假設：“我們之前說過，護士導航儀總是在報告癥狀不佳后給患者打電話，但這種情況只發生了10%。下一次與患者交談是與他們的醫療服務提供者進行的。”。

在類似的情況下，表現相似的患者通常需要類似的服務，并以類似的節奏進入。這些輸入的排列，其特征可以從臨床到管理，最終對應于服務需求的某種確定性路徑。但是，時間預測越復雜或越遠，就越需要更具體、更復雜的具有高質量輸入的貝葉斯網絡。

原因如下：

精確表示：貝葉斯網絡的結構必須反映變量之間的實際關系。選擇不當的變量或誤解的依賴關系可能導致不準確的預測和見解。
有效推理：高質量的輸入變量增強了模型執行概率推理的能力。當變量根據其條件依賴性準確連接時，網絡可以提供更可靠的見解。
降低復雜性：包含不相關或冗余的變量會使模型不必要地復雜化，并增加計算需求。高質量的投入使網絡更加高效。

譯者介紹

朱先忠，51CTO社區編輯，51CTO專家博客、講師，濰坊一所高校計算機教師，自由編程界老兵一枚。

原文標題：Using Bayesian Networks to forecast ancillary service volume in hospitals，作者：Gabe Verzino

本文鏈接：http://www.tebozhan.com/showinfo-26-13844-0.html利用貝葉斯網絡預測醫院服務患者數量

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Kubernetes 中的 Java 應用的內存調優

下一篇： Python字符串處理：掌握文本的藝術

標簽：

熱門焦點

6月安卓手機性能榜：vivo/iQOO霸占旗艦排行榜前三

2023年上半年已經正式過去了，我們也迎來了安兔兔V10版本，在新的驍龍8Gen3和天璣9300發布之前，性能榜的榜單大體會以驍龍8Gen2和天璣9200+為主，至于那顆3.36GHz的驍龍8Gen2領先
自律，給不了Keep自由！

來源 | 互聯網品牌官作者 | 李大為編排 | 又耳審核 | 谷曉輝自律能不能給用戶自由暫時不好說，但大概率不能給Keep自由。近日，全球最大的在線健身平臺Keep正式登陸港交所，努力
阿里瓴羊One推出背后，零售企業迎數字化新解

作者:劉曠近年來隨著數字經濟的高速發展，各式各樣的SaaS應用服務更是層出不窮，但本質上SaaS大多局限于單一業務流層面，對用戶核心關切的增長問題等則沒有提供更好的解法。在Saa
馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

來源：直播觀察提起“馮提莫”這個名字，很多網友或許聽過，但應該不記得她是哪位主播了。其實，作為曾經的“斗魚一姐”，馮提莫在游戲直播的年代影響力不輸于現
小米MIX Fold 3下月亮相：今年唯一無短板的全能折疊屏

這段時間以來，包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都有新的進展，其中榮耀、三星都已陸續發布了最新的折疊屏旗艦，尤其號榮耀Magi
華為和江淮汽車合作開發百萬元問界MPV？雙方回應來了

8月1日消息，郭明錤今天在社交平臺發文稱，華為正在和江淮汽車合作，開發售價在100萬元的問界MPV，預計在2024年第2季度量產，銷量目標為上市首年交付5萬輛。
2納米決戰2025

集微網報道從三強爭霸到四雄逐鹿，2nm的廝殺聲已然隱約傳來。無論是老牌勁旅臺積電、三星，還是誓言重回先進制程領先地位的英特爾，甚至初成立不久的新
AMD的AI芯片轉單給三星可能性不大與臺積電已合作至2nm制程

據 DIGITIMES 消息，英偉達 AI GPU 出貨逐季飆升，接下來 AMD MI 300 系列將在第 4 季底量產。而半導體業內人士表示，近日傳出 AMD 的 AI 芯片將轉單給
蘋果140W USB-C充電器：采用氮化鎵技術

據10 月 30 日 9to5 Mac 消息報道，當蘋果推出新的 MacBook Pro 2021 時，該公司還推出了新的 140W USB-C 充電器，附贈在 MacBook Pro 16 英寸機型的盒子里，也支

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

利用貝葉斯網絡預測醫院服務患者數量

駕馭復雜性：預測醫療保健中的患者數量

另一種預測方法：貝葉斯模型

理解貝葉斯網絡

評估貝葉斯網絡輸出

關于質量輸入變量重要性的說明

譯者介紹

6月安卓手機性能榜：vivo/iQOO霸占旗艦排行榜前三

自律，給不了Keep自由！

阿里瓴羊One推出背后，零售企業迎數字化新解

馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

小米MIX Fold 3下月亮相：今年唯一無短板的全能折疊屏

華為和江淮汽車合作開發百萬元問界MPV？雙方回應來了

2納米決戰2025

AMD的AI芯片轉單給三星可能性不大與臺積電已合作至2nm制程

蘋果140W USB-C充電器：采用氮化鎵技術

最新推薦

猜你喜歡

熱門推薦

相關資訊