本發(fā)明屬于異常行為識別,尤其涉及一種多用戶端聯(lián)合作弊識別方法及裝置。
背景技術:
1、o2o形式的平臺經(jīng)濟是近些年互聯(lián)網(wǎng)發(fā)展的重要組成成分,o2o類經(jīng)營模式具有線上線下結合、多用戶端交互的特征,在以上的特征中極容易出現(xiàn)多用戶端之間聯(lián)合作弊,進而通過偽造虛假訂單的方式來套取o2o平臺的營銷獎勵。
2、在正常的o2o交易平臺中,在o2o平臺中被服務者通過被服務者用戶端在平臺進行下單,服務者通過服務者用戶端在平臺進行接單,服務者與被服務者之間通過行為交互來完成該筆訂單,服務者的服務報酬由被服務者來承擔。平臺為刺激交易訂單量會通過營銷補貼方式為服務者和被服務者提高訂單收入,進而會出現(xiàn)服務者和被服務者通過聯(lián)合偽造虛假訂單方式來獲取平臺營銷補貼。
3、對于該類聯(lián)合偽造虛假訂單的場景,行業(yè)內通常會通過分析服務者和被服務者行為特征,結合專家經(jīng)驗通過規(guī)則方式進行虛假訂單識別,該類方式雖然可以高效率識別低程度偽造訂單,但對于高程度偽造訂單識別效果較差,僅通過規(guī)則性組合很難提高識別準確率。故本文通過引入模型來增強識別能力,同時可以有效提升作弊識別的泛化能力。
4、具體而言,現(xiàn)有技術存在如下問題:
5、(1)需要對服務者和被服務者的聯(lián)合作弊行為特征進行篩選,傳統(tǒng)的專家經(jīng)驗篩選方式雖然具備較好的可解釋性,但是準確率較難提升且容易出現(xiàn)較大規(guī)模漏識別;
6、(2)近年來,模型識別逐漸應用至異常行為識別中。但是對于本文中提及的聯(lián)合作弊行為識別,具有數(shù)據(jù)復雜度高、多用戶端交互、高緯特征多的特性,且大部分模型在面臨大規(guī)模數(shù)據(jù)集和高緯特征特性的場景,會存在速度和效率的問題。
7、(3)雖然模型的應用可以較大幅度來突破識別的準確率和召回率,但是模型在應用過程中存在可解釋性低的問題。
技術實現(xiàn)思路
1、針對現(xiàn)有技術存在的問題,本申請實施例的目的是提供一種多用戶端聯(lián)合作弊識別方法及裝置。
2、根據(jù)本申請實施例的第一方面,提供一種多用戶端聯(lián)合作弊識別方法,包括:
3、獲取各訂單的服務者和被服務者從登錄到履約完成環(huán)節(jié)的行為信息、訂單和支付信息,從其中提取訂單特征;
4、基于每個訂單的訂單特征和作弊可能性構建訓練集和測試集,利用訓練集對作弊識別模型進行訓練,其中所述作弊識別模型采用lightgbm模型;
5、基于訓練后的作弊識別模型,預測測試集中各訂單的作弊概率,從而得到作弊概率有效區(qū)間;
6、將所述作弊概率有效區(qū)間與預定的規(guī)則組進行結合,得到全局最優(yōu)的組合方式;
7、獲取待識別訂單,基于所述全局最優(yōu)的組合方式,進行所述待識別訂單的作弊識別。
8、進一步地,獲取各訂單的服務者和被服務者從登錄到履約完成環(huán)節(jié)的行為信息、訂單和支付信息,從其中提取訂單特征,包括:
9、根據(jù)專家經(jīng)驗,對服務者和被服務者從登錄到履約完成環(huán)節(jié)所需要的行為信息以及訂單和支付信息進行采集;
10、對采集到的信息進行數(shù)據(jù)預處理;
11、對預處理后的信息通過數(shù)據(jù)onehot或標簽編碼進行處理,從而包括服務者行為特征、被服務者行為特征和訂單與支付特征的訂單特征。
12、進一步地,基于每個訂單的訂單特征,對作弊識別模型進行訓練,包括:
13、根據(jù)專家經(jīng)驗設置每個訂單的作弊可能性;
14、基于每個訂單的訂單特征和作弊可能性構造訓練集;
15、利用所述訓練集,對作弊識別模型進行有監(jiān)督訓練。
16、進一步地,基于訓練后的作弊識別模型,預測測試集中各訂單進的作弊概率,從而得到作弊概率有效區(qū)間,具體為:
17、基于訓練后的作弊識別模型,預測測試集中各訂單的作弊概率;
18、根據(jù)測試集中各訂單的作弊概率,繪制接受者操作特性曲線;
19、計算接受者操作特性曲線下面積auc,將auc~1作為作弊概率有效區(qū)間。
20、進一步地,將訓練后的作弊識別模型的預測值與預定的規(guī)則組進行結合,得到全局最優(yōu)的組合方式,包括:
21、對預定的規(guī)則組中的所有規(guī)則進行如下遍歷過程:將一規(guī)則與訓練后的作弊識別模型的預測值進行組合,得到組合規(guī)則,將該組合規(guī)則與所述規(guī)則組中的其余規(guī)則組合,形成組合規(guī)則組,利用所述組合規(guī)則組判斷訂單是否作弊,得到該組合規(guī)則組的價值;
22、比較每個組合規(guī)則組的價值,從而得到價值最高的組合規(guī)則組,作為全局最優(yōu)的組合方式。
23、進一步地,所述組合規(guī)則組的價值為準確率或召回率。
24、根據(jù)本申請實施例的第二方面,提供一種多用戶端聯(lián)合作弊識別裝置,包括:
25、信息獲取及特征提取模塊,用于獲取各訂單的服務者和被服務者從登錄到履約完成環(huán)節(jié)的行為信息、訂單和支付信息,從其中提取訂單特征;
26、模型訓練模塊,用于基于每個訂單的訂單特征和作弊可能性構建訓練集和測試集,利用訓練集對作弊識別模型進行訓練,其中所述作弊識別模型采用lightgbm模型;
27、作弊概率有效區(qū)間計算模塊,用于基于訓練后的作弊識別模型,預測測試集中各訂單的作弊概率,從而得到作弊概率有效區(qū)間;
28、組合尋優(yōu)模塊,用于將所述作弊概率有效區(qū)間與預定的規(guī)則組進行結合,得到全局最優(yōu)的組合方式;
29、作弊識別模塊,用于獲取待識別訂單,基于所述全局最優(yōu)的組合方式,進行所述待識別訂單的作弊識別。
30、根據(jù)本申請實施例的第三方面,提供一種計算機程序產品,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)如第一方面所述的方法。
31、根據(jù)本申請實施例的第四方面,提供一種電子設備,包括:
32、一個或多個處理器;
33、存儲器,用于存儲一個或多個程序;
34、當所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如第一方面所述的方法。
35、根據(jù)本申請實施例的第五方面,提供一種計算機可讀存儲介質,其上存儲有計算機指令,該指令被處理器執(zhí)行時實現(xiàn)如第一方面所述方法的步驟。
36、本申請的實施例提供的技術方案可以包括以下有益效果:
37、由上述實施例可知,本申請通過引入lightgbm模型,將模型的預測結果與多個核心規(guī)則進行組合,創(chuàng)新性地采用組合后全局最優(yōu)的牽引策略來實現(xiàn)整體識別效果的最優(yōu),即通過模型嵌入原規(guī)則體系的方式來篩選出全局最優(yōu)的組合方法,以上方式可以較好的提升作弊識別的精準度和召回率,并對異常識別結果具備較好的解釋性。
38、應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本申請。
1.一種多用戶端聯(lián)合作弊識別方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,獲取各訂單的服務者和被服務者從登錄到履約完成環(huán)節(jié)的行為信息、訂單和支付信息,從其中提取訂單特征,包括:
3.根據(jù)權利要求1所述的方法,其特征在于,基于每個訂單的訂單特征,對作弊識別模型進行訓練,包括:
4.根據(jù)權利要求1所述的方法,其特征在于,基于訓練后的作弊識別模型,預測測試集中各訂單進的作弊概率,從而得到作弊概率有效區(qū)間,具體為:
5.根據(jù)權利要求1所述的方法,其特征在于,將訓練后的作弊識別模型的預測值與預定的規(guī)則組進行結合,得到全局最優(yōu)的組合方式,包括:
6.根據(jù)權利要求1所述的方法,其特征在于,所述組合規(guī)則組的價值為準確率或召回率。
7.一種多用戶端聯(lián)合作弊識別裝置,其特征在于,包括:
8.一種計算機程序產品,包括計算機程序/指令,其特征在于,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)如權利要求1-6任一項所述的方法。
9.一種電子設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其上存儲有計算機指令,其特征在于,該指令被處理器執(zhí)行時實現(xiàn)如權利要求1-6中任一項所述方法的步驟。