本發(fā)明涉及醫(yī)療數(shù)據(jù)處理,更具體地說,本發(fā)明涉及一種預(yù)測胃腸道腫瘤患者術(shù)后并發(fā)癥的模型構(gòu)建方法。
背景技術(shù):
1、胃腸道腫瘤患者術(shù)后并發(fā)癥預(yù)測模型的構(gòu)建是指基于患者術(shù)前、術(shù)中和術(shù)后收集的臨床數(shù)據(jù),利用統(tǒng)計學(xué)方法、機器學(xué)習(xí)算法和時間序列分析技術(shù),提取出與術(shù)后并發(fā)癥相關(guān)的關(guān)鍵特征,并將這些特征輸入到預(yù)測模型中,以預(yù)測患者術(shù)后可能出現(xiàn)的并發(fā)癥。該模型旨在通過對大量患者數(shù)據(jù)的分析,識別出高風(fēng)險患者,并為臨床決策提供支持,從而提高患者的術(shù)后管理質(zhì)量,減少并發(fā)癥的發(fā)生率,改善患者的預(yù)后。例如在公開號為cn114822821a的發(fā)明一種預(yù)測胃腸道腫瘤患者術(shù)后并發(fā)癥發(fā)生概率的列線圖模型及構(gòu)建方法中,通過對患者臨床特征數(shù)據(jù)的分析選擇,得到與術(shù)后并發(fā)癥相關(guān)性顯著的因素,進一步構(gòu)建相應(yīng)的列線圖模型;提供2種列線圖模型,分別用于預(yù)測胃腸道腫瘤患者術(shù)后7天內(nèi)、30天內(nèi)的并發(fā)癥發(fā)生概率,以達到提早識別術(shù)后并發(fā)癥高危人群并及早干預(yù)的目的;模型預(yù)測準確度和區(qū)分度高,簡單、直觀、易于臨床推廣應(yīng)用,可輔助醫(yī)生提早判斷胃腸道腫瘤患者的術(shù)后并發(fā)癥發(fā)生,同時利于臨床醫(yī)生對胃腸道腫瘤疾病進行個體化管理。
2、在進行胃腸道腫瘤患者術(shù)后并發(fā)癥預(yù)測模型的構(gòu)建過程中,對胃腸道腫瘤患者的全面數(shù)據(jù)的時間序列數(shù)據(jù)的處理和特征提取是關(guān)鍵步驟。時間序列數(shù)據(jù)中蘊含了大量關(guān)于患者術(shù)后健康變化的信息,這些信息對預(yù)測并發(fā)癥的發(fā)生具有重要意義。
3、在時間序列數(shù)據(jù)中特征提取中,若不能準確的對提取特征的準確性進行評估,可能會導(dǎo)致所選特征在模型中的表現(xiàn)不穩(wěn)定,這種不穩(wěn)定性會導(dǎo)致預(yù)測模型對特征的依賴性不合理,進而影響模型的整體預(yù)測性能和可靠性。此外,現(xiàn)有方法在面對數(shù)據(jù)的多樣性和復(fù)雜性時,缺乏系統(tǒng)性的分析工具來有效篩選和驗證這些關(guān)鍵時間依賴特征。這種不足不僅影響了特征的選擇質(zhì)量,也削弱了模型在實際應(yīng)用中的魯棒性和可靠性。
4、為了解決上述問題,現(xiàn)提供一種技術(shù)方案。
技術(shù)實現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的實施例提供一種預(yù)測胃腸道腫瘤患者術(shù)后并發(fā)癥的模型構(gòu)建方法以解決上述背景技術(shù)中提出的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種預(yù)測胃腸道腫瘤患者術(shù)后并發(fā)癥的模型構(gòu)建方法,包括如下步驟:
4、s1:收集胃腸道腫瘤患者的全面數(shù)據(jù),胃腸道腫瘤患者的全面數(shù)據(jù)包括術(shù)前數(shù)據(jù)、術(shù)中數(shù)據(jù)以及術(shù)后數(shù)據(jù);
5、s2:對收集的胃腸道腫瘤患者的全面數(shù)據(jù)進行標準化處理,建立全面數(shù)據(jù)集;
6、s3:利用統(tǒng)計方法和時間序列分析技術(shù)從全面數(shù)據(jù)集中提取關(guān)鍵時間依賴特征;引入神經(jīng)網(wǎng)絡(luò)中的門控機制,動態(tài)調(diào)整不同時間點關(guān)鍵時間依賴特征的權(quán)重;
7、s4:采用bootstrap技術(shù)對全面數(shù)據(jù)集進行重采樣,通過多次提取關(guān)鍵時間依賴特征,結(jié)合kl散度與js散度,評估關(guān)鍵時間依賴特征的穩(wěn)定性;
8、s5:引入變點檢測方法來評估關(guān)鍵時間依賴特征的時間依賴性是否隨時間發(fā)生顯著改變;
9、s6:基于步驟s4和步驟s5綜合判斷提取的關(guān)鍵時間依賴特征可信度是否達標。
10、在一個優(yōu)選的實施方式中,對收集的胃腸道腫瘤患者的全面數(shù)據(jù)進行標準化處理,建立全面數(shù)據(jù)集,具體為:
11、將術(shù)前數(shù)據(jù)、術(shù)中數(shù)據(jù)以及術(shù)后數(shù)據(jù)整合到統(tǒng)一的數(shù)據(jù)庫中;
12、將所有數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式;對數(shù)值數(shù)據(jù)進行量綱統(tǒng)一處理;識別數(shù)據(jù)中的缺失值并進行填充;
13、對分類數(shù)據(jù)進行編碼處理;對數(shù)值型數(shù)據(jù)進行歸一化處理;
14、將處理后的數(shù)據(jù)編譯成最終的全面數(shù)據(jù)集,用于后續(xù)的模型訓(xùn)練和分析。
15、在一個優(yōu)選的實施方式中,利用統(tǒng)計方法和時間序列分析技術(shù)從全面數(shù)據(jù)集中提取關(guān)鍵時間依賴特征;引入神經(jīng)網(wǎng)絡(luò)中的門控機制,動態(tài)調(diào)整不同時間點關(guān)鍵時間依賴特征的權(quán)重,具體包括:
16、s301:應(yīng)用自回歸移動平均模型,從全面數(shù)據(jù)集中提取基礎(chǔ)的時間依賴特征;
17、s302:運用傅里葉變換分析方法識別全面數(shù)據(jù)中的周期性和趨勢性特征;
18、s303:使用門控循環(huán)單元處理和優(yōu)化時間序列數(shù)據(jù)的關(guān)鍵時間依賴特征:
19、門控循環(huán)單元的更新門表示為:;門控循環(huán)單元的重置門表示為:;其中,和分別為更新門和重置門,為上一個時刻的隱藏狀態(tài),為當(dāng)前輸入,和分別為更新門和重置門的權(quán)重矩陣;為sigmoid激活函數(shù);
20、使用adam優(yōu)化器對gru模型進行訓(xùn)練;
21、s304:在神經(jīng)網(wǎng)絡(luò)中集成注意力機制,根據(jù)模型在訓(xùn)練過程中的表現(xiàn)動態(tài)調(diào)整各時間點關(guān)鍵時間依賴特征的權(quán)重:
22、根據(jù)每個時間步的重要性分配權(quán)重,具體公式為:;其中,用于計算輸入序列中每個元素的加權(quán)和,為查詢矩陣,為鍵矩陣,為值矩陣,為softmax激活函數(shù),為查詢矩陣與鍵矩陣的轉(zhuǎn)置矩陣的點積,為鍵矩陣的維度。
23、在一個優(yōu)選的實施方式中,采用bootstrap技術(shù)對全面數(shù)據(jù)集進行重采樣,通過多次提取關(guān)鍵時間依賴特征,結(jié)合kl散度與js散度,評估關(guān)鍵時間依賴特征的穩(wěn)定性,具體包括:
24、s401:應(yīng)用bootstrap技術(shù)對全面數(shù)據(jù)集進行多次重采樣:確定重采樣的次數(shù),對于每一次重采樣,通過從原始全面數(shù)據(jù)集中隨機抽取多個數(shù)據(jù)點生成樣本集;
25、s402:在每個重采樣樣本集中提取關(guān)鍵時間依賴特征:在每個重采樣樣本集中應(yīng)用預(yù)先定義的統(tǒng)計方法和時間序列分析技術(shù)提取關(guān)鍵時間依賴特征;
26、s403:對每次重采樣后提取的特征進行概率分布估計,建立每次重采樣的特征分布:
27、對提取的關(guān)鍵時間依賴特征進行概率分布估計的常用方法包括使用核密度估計和直方圖來估計特征的概率分布;
28、通過對每個重采樣樣本中的特征進行概率分布估計,構(gòu)建每個重采樣樣本集的特征分布;
29、s404:使用kl散度計算每個重采樣樣本與原始數(shù)據(jù)特征分布的差異,衡量特征一致性;通過js散度評估重采樣樣本與原始數(shù)據(jù)特征分布的相似性,測度特征的差異性;
30、s405:結(jié)合kl散度和js散度,計算動態(tài)bootstrap一致性和差異性測度來評估關(guān)鍵時間依賴特征的穩(wěn)定性。
31、在一個優(yōu)選的實施方式中,步驟s404具體為:
32、使用kl散度計算每個重采樣樣本與原始數(shù)據(jù)特征分布的差異,公式為:;
33、為kl散度,為原始數(shù)據(jù)中特征的概率分布值,為第次重采樣中對應(yīng)特征的概率分布值,為關(guān)鍵時間依賴特征的第個取值;
34、通過js散度評估重采樣樣本與原始數(shù)據(jù)特征分布的相似性,公式為:;其中,;
35、為js散度,為原始數(shù)據(jù)特征分布與均值分布之間的kl散度,為第次重采樣的特征分布與均值分布之間的kl散度,為原始數(shù)據(jù)特征分布,為第次重采樣特征分布。
36、在一個優(yōu)選的實施方式中,步驟s405具體為:通過綜合考慮kl散度和js散度,計算關(guān)鍵時間依賴特征的動態(tài)bootstrap一致性和差異性測度;公式為:;其中,為特征的穩(wěn)定性測度,是重采樣的總次數(shù)。
37、在一個優(yōu)選的實施方式中,引入變點檢測方法來評估關(guān)鍵時間依賴特征的時間依賴性是否隨時間發(fā)生顯著改變,具體包括:
38、s501:將關(guān)鍵時間依賴特征在時間維度上構(gòu)建為時間序列;
39、s502:選用貝葉斯變點檢測識別時間序列中的潛在變點:定義貝葉斯模型的先驗分布,模型使用事后概率評估每個時間點作為變點的可能性;通過動態(tài)規(guī)劃算法計算貝葉斯后驗概率,識別時間序列中的潛在變點;
40、s503:對時間序列進行窗口劃分,通過滑動窗口計算檢測特征在不同時間段內(nèi)的穩(wěn)定性:設(shè)定窗口大小,將時間序列按窗口劃分為多個子序列;在每個窗口內(nèi),計算關(guān)鍵時間依賴特征的局部均值和方差以評估特征在不同時間段內(nèi)的穩(wěn)定性;
41、s504:對檢測到的潛在變點進行顯著性測試,評估變點是否在統(tǒng)計意義上顯著;
42、s505:結(jié)合變點檢測結(jié)果,評估關(guān)鍵時間依賴特征的時間依賴性是否發(fā)生顯著改變:將通過顯著性測試驗證的變點信息整合到時間序列分析結(jié)果中;評估在檢測到的變點處,關(guān)鍵時間依賴特征的時間依賴性是否發(fā)生顯著改變;根據(jù)變點檢測和時間依賴性評估的結(jié)果,判斷關(guān)鍵時間依賴特征的時間依賴性是否在整個時間序列中保持穩(wěn)定。
43、在一個優(yōu)選的實施方式中,基于步驟s4和步驟s5綜合判斷提取的關(guān)鍵時間依賴特征可信度是否達標,具體為:
44、獲取關(guān)鍵時間依賴特征的時間依賴性是否隨時間發(fā)生顯著改變的判斷結(jié)果;
45、設(shè)定特征的穩(wěn)定性測度對應(yīng)的特征穩(wěn)定評估閾值,將特征的穩(wěn)定性測度與特征穩(wěn)定評估閾值進行比較:
46、當(dāng)特征的穩(wěn)定性測度小于等于特征穩(wěn)定評估閾值時,則判定關(guān)鍵時間依賴特征的穩(wěn)定性正常;當(dāng)特征的穩(wěn)定性測度大于特征穩(wěn)定評估閾值時,則判定關(guān)鍵時間依賴特征的穩(wěn)定性差;
47、當(dāng)關(guān)鍵時間依賴特征的時間依賴性未隨時間發(fā)生顯著改變,且關(guān)鍵時間依賴特征的穩(wěn)定性正常時,則判定提取的關(guān)鍵時間依賴特征可信度達標;否則,則判定提取的關(guān)鍵時間依賴特征可信度不達標。
48、本發(fā)明一種預(yù)測胃腸道腫瘤患者術(shù)后并發(fā)癥的模型構(gòu)建方法的技術(shù)效果和優(yōu)點:
49、1、通過整合和分析胃腸道腫瘤患者的術(shù)前、術(shù)中及術(shù)后數(shù)據(jù),提供了準確預(yù)測術(shù)后并發(fā)癥的堅實基礎(chǔ),通過標準化處理,確保了數(shù)據(jù)的一致性和可比性,提高了后續(xù)分析的準確度和效率,利用統(tǒng)計方法和時間序列分析技術(shù),結(jié)合神經(jīng)網(wǎng)絡(luò)中的門控機制,增強了數(shù)據(jù)分析的深度,提升了模型對時間變化的敏感性和適應(yīng)性,這些處理確保從復(fù)雜醫(yī)療數(shù)據(jù)中提取的關(guān)鍵特征能夠真實反映患者的健康狀態(tài)和術(shù)后風(fēng)險,從而大幅提升預(yù)測模型的準確性和實用性。
50、2、通過引入bootstrap技術(shù)和變點檢測方法,進一步增強了對關(guān)鍵時間依賴特征的分析精度和可信度,bootstrap技術(shù)通過對數(shù)據(jù)集進行多次重采樣,配合kl散度與js散度分析,提供了一種量化特征穩(wěn)定性的科學(xué)方法,這種方法有效識別出在不同條件下保持一致性的特征,從而篩選出更為可靠的預(yù)測指標,變點檢測使得模型能夠識別數(shù)據(jù)中的關(guān)鍵變化點,對特征的時間依賴性進行精確評估,這些技術(shù)的應(yīng)用顯著增強了模型在實際臨床環(huán)境中的適應(yīng)性和預(yù)測力,極大地幫助醫(yī)療專業(yè)人員進行術(shù)后風(fēng)險管理和治療決策,旨在降低患者的并發(fā)癥風(fēng)險并改善其術(shù)后恢復(fù)情況。