午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的欺詐行為分析系統(tǒng)的制作方法

文檔序號:39718961發(fā)布日期:2024-10-22 13:06閱讀:2來源:國知局
基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的欺詐行為分析系統(tǒng)的制作方法

本發(fā)明涉及數(shù)據(jù)分析,具體涉及基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的欺詐行為分析系統(tǒng)。


背景技術(shù):

1、數(shù)據(jù)挖掘是從大量數(shù)據(jù)中自動提取出有用信息和知識的過程,它涉及多種技術(shù),包括統(tǒng)計(jì)分析、數(shù)據(jù)庫管理和機(jī)器學(xué)習(xí);機(jī)器學(xué)習(xí)是一種人工智能技術(shù),它通過算法和統(tǒng)計(jì)模型使計(jì)算機(jī)系統(tǒng)在沒有明確編程指令的情況下能夠進(jìn)行某些任務(wù),機(jī)器學(xué)習(xí)特別適合處理復(fù)雜、多變的數(shù)據(jù),通過從數(shù)據(jù)中學(xué)習(xí)并作出預(yù)測或決策。

2、傳統(tǒng)系統(tǒng)通常依賴人工制定的規(guī)則來識別欺詐行為,但這些規(guī)則可能無法覆蓋所有情況,難以應(yīng)對新型的欺詐手段和變種,且傳統(tǒng)系統(tǒng)的規(guī)則和邏輯一般較為固定,難以根據(jù)實(shí)時數(shù)據(jù)和變化的欺詐模式做出調(diào)整和優(yōu)化,并且在處理大量交易數(shù)據(jù)時,傳統(tǒng)系統(tǒng)可能無法有效地捕捉和分析復(fù)雜的特征之間的關(guān)聯(lián)關(guān)系,導(dǎo)致識別能力受限,而且人工規(guī)則的維護(hù)和更新需要大量的人力成本,而且系統(tǒng)可能會產(chǎn)生大量誤報(bào),增加了處理的負(fù)擔(dān)。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明目的是針對背景技術(shù)中存在的問題,提出基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的欺詐行為分析系統(tǒng)。

2、本發(fā)明的技術(shù)方案:基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的欺詐行為分析系統(tǒng),包括特征平衡模塊、特征去噪模塊、模型訓(xùn)練模塊、實(shí)時監(jiān)控模塊和報(bào)警與響應(yīng)模塊,還包括:

3、數(shù)據(jù)獲取模塊,所述數(shù)據(jù)獲取模塊用于獲取目標(biāo)交易平臺的交易數(shù)據(jù)和行為數(shù)據(jù),所述交易數(shù)據(jù)包括下單數(shù)據(jù)和售后數(shù)據(jù),所述行為數(shù)據(jù)包括搜索數(shù)據(jù)、瀏覽數(shù)據(jù)和點(diǎn)擊數(shù)據(jù),并將所述交易數(shù)據(jù)和所述行為數(shù)據(jù)傳輸至數(shù)據(jù)預(yù)處理模塊;

4、數(shù)據(jù)預(yù)處理模塊,所述數(shù)據(jù)預(yù)處理模塊對數(shù)據(jù)獲取模塊傳輸?shù)乃鼋灰讛?shù)據(jù)和所述行為數(shù)據(jù)進(jìn)行接收,并對所述交易數(shù)據(jù)和所述行為數(shù)據(jù)進(jìn)行清洗、歸一化和降維,以得到標(biāo)準(zhǔn)交易數(shù)據(jù)和標(biāo)準(zhǔn)行為數(shù)據(jù),并將所述標(biāo)準(zhǔn)交易數(shù)據(jù)和所述標(biāo)準(zhǔn)行為數(shù)據(jù)傳輸至特征工程模塊;

5、特征工程模塊,所述特征工程模塊對數(shù)據(jù)預(yù)處理模塊傳輸?shù)乃鰳?biāo)準(zhǔn)交易數(shù)據(jù)和所述標(biāo)準(zhǔn)行為數(shù)據(jù)進(jìn)行接收,并對所述標(biāo)準(zhǔn)交易數(shù)據(jù)和所述標(biāo)準(zhǔn)行為數(shù)據(jù)進(jìn)行集劃分與標(biāo)簽處理,以將所述標(biāo)準(zhǔn)交易數(shù)據(jù)和所述標(biāo)準(zhǔn)行為數(shù)據(jù)劃分為訓(xùn)練集和測試集,并根據(jù)欺詐交易和正常交易,將標(biāo)簽設(shè)置為1和0,將所述訓(xùn)練集和所述測試集中的字符串特征的數(shù)據(jù)列進(jìn)行one-hot編碼,通過特征縮放方法對所述訓(xùn)練集和所述測試集特征縮放,以得到特征訓(xùn)練集和特征測試集,并將所述特征訓(xùn)練集和所述特征測試集傳輸至特征平衡模塊。

6、優(yōu)選的,所述特征平衡模塊對特征工程模塊傳輸?shù)乃鎏卣饔?xùn)練集和所述特征測試集進(jìn)行接收,并通過特征平衡方法對所述特征訓(xùn)練集和所述特征測試集進(jìn)行特征平衡,以得到平衡特征訓(xùn)練集和平衡特征測試集,并將所述平衡特征訓(xùn)練集和所述平衡特征測試集傳輸至特征去噪模塊。

7、優(yōu)選的,所述特征去噪模塊對特征平衡模塊傳輸?shù)乃銎胶馓卣饔?xùn)練集和所述平衡特征測試集進(jìn)行接收,并通過特征去噪方法對所述平衡特征訓(xùn)練集和所述平衡特征測試集進(jìn)行特征去噪,以得到標(biāo)準(zhǔn)訓(xùn)練集和標(biāo)準(zhǔn)測試集,并將所述標(biāo)準(zhǔn)訓(xùn)練集和所述標(biāo)準(zhǔn)測試集傳輸至模型訓(xùn)練模塊。

8、優(yōu)選的,所述模型訓(xùn)練模塊對特征去噪模塊傳輸?shù)乃鰳?biāo)準(zhǔn)訓(xùn)練集和所述標(biāo)準(zhǔn)測試集進(jìn)行接收,并基于神經(jīng)網(wǎng)絡(luò)構(gòu)建欺詐行為識別模型,并基于所述標(biāo)準(zhǔn)訓(xùn)練集通過損失函數(shù)對所述行為識別模型進(jìn)行訓(xùn)練和參數(shù)調(diào)優(yōu),以得到訓(xùn)練好的欺詐行為識別模型,并通過所述標(biāo)準(zhǔn)測試集對所述訓(xùn)練好的欺詐行為識別模型進(jìn)行測試,以得到優(yōu)化的欺詐行為識別模型,并將所述優(yōu)化的欺詐行為識別模型傳輸至實(shí)時監(jiān)控模塊。

9、優(yōu)選的,所述實(shí)時監(jiān)控模塊對模型訓(xùn)練模塊傳輸?shù)乃鰞?yōu)化的欺詐行為識別模型進(jìn)行接收,并通過所述優(yōu)化的欺詐行為識別模型對實(shí)時交易數(shù)據(jù)和實(shí)時行為數(shù)據(jù)進(jìn)行分析,以得到欺詐行為識別結(jié)果,并將所述欺詐行為識別結(jié)果傳輸至報(bào)警與響應(yīng)模塊。

10、優(yōu)選的,所述報(bào)警與響應(yīng)模塊對實(shí)時監(jiān)控模塊傳輸?shù)乃銎墼p行為識別結(jié)果進(jìn)行接收,并將所述欺詐行為識別結(jié)果與預(yù)設(shè)的報(bào)警觸發(fā)表進(jìn)行匹配,以得到相應(yīng)的報(bào)警機(jī)制,基于所述報(bào)警機(jī)制進(jìn)行相應(yīng)的響應(yīng)措施。

11、優(yōu)選的,所述特征平衡方法,包括以下步驟:

12、a1、計(jì)算所述特征訓(xùn)練集和所述特征測試集中的每個數(shù)據(jù)點(diǎn)與其他樣本點(diǎn)的歐式距離,以確定k個最近鄰樣本,其中,k表示預(yù)設(shè)的數(shù)量閾值;

13、a2、根據(jù)所述特征訓(xùn)練集和所述特征測試集的不平衡比例,確定采樣倍率n,對于每數(shù)據(jù)點(diǎn)的k個最近鄰樣本隨機(jī)選擇n個樣本,以得到隨機(jī)樣本;

14、a3、通過隨機(jī)線性插值在所述數(shù)據(jù)點(diǎn)和所述隨機(jī)樣本之間合成新樣本,所述隨機(jī)線性插值公式如下:

15、xnew=xi+γ(xi-xold);

16、其中,xnew表示新樣本,xi表示數(shù)據(jù)點(diǎn),γ表示區(qū)間[0,1]之間的隨機(jī)數(shù),xold表示隨機(jī)樣本。

17、優(yōu)選的,所述特征去噪方法,包括以下步驟:

18、b1、基于knn算法找到所述特征訓(xùn)練集和所述特征測試集中每個樣本的k個最近鄰居;

19、b2、比較所述特征訓(xùn)練集和所述特征測試集中每個樣本與其最近鄰居之間的類標(biāo)簽是否相同,若最近鄰居的類標(biāo)簽與樣本不同,則將所述樣本從所述特征訓(xùn)練集和所述特征測試集中刪除。

20、優(yōu)選的,所述欺詐行為識別模型包括輸入層、隱藏層和輸出層,所述輸入層、所述隱藏層和所述輸出層的神經(jīng)元均通過全連接方式連接,將上一層神經(jīng)元的輸出值與相應(yīng)的權(quán)重矩陣相乘,并將結(jié)果累加求和,并加上偏置項(xiàng),且將總和傳遞到下一層與相應(yīng)神經(jīng)元相連,經(jīng)過激活函數(shù)的映射后作為下一層神經(jīng)元的輸入值,所述輸入值計(jì)算公式如下:

21、

22、其中,表示第l層的第k個神經(jīng)元的相對應(yīng)的輸出值,表示第l-1層的第k個神經(jīng)元連接到第l層的第i個神經(jīng)元相對應(yīng)的權(quán)重,表示第l-1層的第k個神經(jīng)元的相對應(yīng)的輸出值,表示偏移量,σ表示相關(guān)的激活函數(shù)。

23、與現(xiàn)有技術(shù)相比,本發(fā)明的上述技術(shù)方案具有如下有益的技術(shù)效果:

24、1、本發(fā)明通過數(shù)據(jù)獲取模塊自動獲取并傳輸交易平臺的交易數(shù)據(jù)和行為數(shù)據(jù),包括下單數(shù)據(jù)、售后數(shù)據(jù)、搜索數(shù)據(jù)、瀏覽數(shù)據(jù)和點(diǎn)擊數(shù)據(jù),確保數(shù)據(jù)源的全面性和實(shí)時性,為后續(xù)數(shù)據(jù)分析提供基礎(chǔ),通過數(shù)據(jù)預(yù)處理模塊對獲取的數(shù)據(jù)進(jìn)行清洗、歸一化和降維處理,去除噪聲和異常值,提高數(shù)據(jù)質(zhì)量和一致性,為特征工程打下良好基礎(chǔ),通過特征工程模塊進(jìn)行特征提取、集劃分與標(biāo)簽處理,將數(shù)據(jù)轉(zhuǎn)換為適用于機(jī)器學(xué)習(xí)模型的格式,提升模型訓(xùn)練的效果,且通過one-hot編碼和特征縮放,進(jìn)一步優(yōu)化數(shù)據(jù)特征,使模型更易于學(xué)習(xí)和泛化,通過特征平衡模塊利用特征平衡方法處理訓(xùn)練集和測試集中的數(shù)據(jù)不平衡問題,防止模型偏向多數(shù)類數(shù)據(jù),從而提升模型對少數(shù)類的識別能力。

25、2、本發(fā)明通過特征去噪模塊去除數(shù)據(jù)中的噪聲,保留關(guān)鍵特征,減少模型誤判的可能性,提高模型的準(zhǔn)確性和魯棒性,通過模型訓(xùn)練模塊基于神經(jīng)網(wǎng)絡(luò)方法構(gòu)建欺詐行為識別模型,并通過損失函數(shù)進(jìn)行訓(xùn)練和參數(shù)調(diào)優(yōu),得到優(yōu)化的、準(zhǔn)確度高的欺詐行為識別模型,從而有效識別潛在的欺詐行為,通過實(shí)時監(jiān)控模塊利用優(yōu)化的欺詐行為識別模型對實(shí)時交易數(shù)據(jù)和行為數(shù)據(jù)進(jìn)行分析,及時檢測出欺詐行為,實(shí)現(xiàn)實(shí)時監(jiān)控,提高平臺安全性,通過報(bào)警與響應(yīng)模塊根據(jù)識別出的欺詐行為結(jié)果與預(yù)設(shè)的報(bào)警觸發(fā)表進(jìn)行匹配,觸發(fā)相應(yīng)的報(bào)警機(jī)制和響應(yīng)措施,及時阻止和處理欺詐事件,保護(hù)用戶和平臺免受損失。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1