本公開涉及大數(shù)據(jù),尤其涉及一種用戶畫像識別方法、裝置、設備及存儲介質。
背景技術:
1、隨著互聯(lián)網(wǎng)信息技術和5g網(wǎng)絡的迅猛發(fā)展,手機用戶上網(wǎng)行為數(shù)據(jù)量呈爆發(fā)式增長,大數(shù)據(jù)和人工智能算法將會有很廣泛的應用場景。手機用戶在日常上網(wǎng)行為過程中產(chǎn)生了各種類型數(shù)據(jù)。
2、隨著互聯(lián)網(wǎng)的不斷發(fā)展、用戶信息、行為記錄越來越豐富,通過大數(shù)據(jù)處理和統(tǒng)計分析技術,計算出每一個用戶的特征進而識別用戶畫像是常用的識別手段。特征是從人的基本屬性、社會屬性、生活習慣、消費行為等信息抽象出來的一個個具體的標簽。
3、目前,用戶畫像識別的準確度較低。
技術實現(xiàn)思路
1、本公開提供一種用戶畫像識別方法、裝置、設備及存儲介質,以至少解決現(xiàn)有用戶畫像識別的準確度較低的問題。
2、本公開的技術方案如下:
3、本公開實施例提供一種用戶畫像識別方法,包括:
4、獲取目標屬性類型的目標用戶的出行時空軌跡數(shù)據(jù);
5、根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵;
6、根據(jù)多個所述維度特征的信息熵,確定所述目標用戶的信息熵。
7、可選地,在所述根據(jù)多個所述維度特征的信息熵,確定所述目標用戶的信息熵之后,所述方法還包括:
8、針對第一用戶,確定所述第一用戶的信息熵,其中,所述第一用戶為與所述目標用戶不同的用戶;
9、確定所述第一用戶的信息熵與所述目標用戶的信息熵的差值;
10、在所述差值小于設定差值閾值,則所述第一用戶為所述目標屬性類型;
11、在所述差值大于等于設定差值閾值的情況下,則所述第一用戶不為所述目標屬性類型。
12、可選地,所述獲取目標屬性類型的目標用戶的出行時空軌跡數(shù)據(jù),包括:
13、獲取目標用戶的通信標識;
14、根據(jù)通信標識,查詢目標用戶的控制面話單和工參表;
15、根據(jù)控制面話單和工參表,確定所述目標用戶的出行時空軌跡數(shù)據(jù)。
16、可選地,所述多個維度特征包括:基站附著維度,所述基站附著維度對應的信息熵為:基站附著信息熵;所述根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵,包括:
17、根據(jù)所述出行時空軌跡數(shù)據(jù),統(tǒng)計多個時間周期下的基站附著次數(shù);
18、根據(jù)基站附著維度基站個數(shù)和所述多個時間周期下的基站附著次數(shù),確定基站附著的概率;
19、根據(jù)所述基站附著的概率,確定所述基站附著信息熵。
20、可選地,所述多個維度特征包括:出行速度維度,所述出行速度維度對應的信息熵為:出行速度信息熵;所述根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵,包括:
21、根據(jù)所述出行時空軌跡數(shù)據(jù),獲取每次基站切換的兩個基站的經(jīng)緯度和所述兩個基站切換的時間;
22、根據(jù)所述兩個基站的經(jīng)緯度,確定基站距離;
23、根據(jù)所述兩個基站切換的時間,確定基站切換時間;
24、根據(jù)所述基站距離和所述基站切換時間,確定每次基站切換的基站切換速度;
25、統(tǒng)計在多個時間周期下的每次切換基站的所述基站切換速度和在設定速度區(qū)間出行的次數(shù);
26、根據(jù)每次切換基站的所述基站切換速度和在所述設定速度區(qū)間出行的次數(shù),確定所述出行速度概率;
27、根據(jù)所述出行速度概率,確定出行速度信息熵。
28、可選地,所述多個維度特征包括:出行里程維度,所述出行里程維度對應的信息熵為:出行里程信息熵;所述根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵,包括:
29、根據(jù)所述出行時空軌跡數(shù)據(jù),統(tǒng)計設定時長內(nèi)出行里程屬于設定里程區(qū)間的小時數(shù);
30、根據(jù)出行里程屬于設定里程區(qū)間的小時數(shù)和設定時長,確定特征小時出現(xiàn)的概率;
31、根據(jù)所述特征小時出現(xiàn)的概率,確定所述出行里程信息熵。
32、可選地,所述根據(jù)多個所述維度特征的信息熵,確定所述目標用戶的信息熵,包括:
33、獲取每個所述維度特征對應的浮動基站數(shù);
34、根據(jù)每個所述維度特征對應的浮動基站數(shù)和每個所述維度特征的信息熵,確定所述目標用戶的信息熵。
35、本公開實施例還提供一種用戶畫像識別裝置,包括:
36、獲取模塊,用于獲取目標屬性類型的目標用戶的出行時空軌跡數(shù)據(jù);
37、第一確定模塊,用于根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵;
38、第二確定模塊,用于根據(jù)多個所述維度特征的信息熵,確定所述目標用戶的信息熵。
39、本公開實施例還提供一種電子設備,包括:
40、處理器;
41、用于存儲處理器可執(zhí)行指令的存儲器;
42、其中,所述處理器被配置為執(zhí)行所述指令,以實現(xiàn)上述的方法中的各步驟。
43、本公開實施例還提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的方法中的各步驟。
44、本公開的實施例提供的技術方案至少帶來以下有益效果:
45、在本公開的一些實施例中,獲取目標屬性類型的目標用戶的出行時空軌跡數(shù)據(jù);根據(jù)出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵;根據(jù)多個維度特征的信息熵,確定目標用戶的信息熵,將目標用戶的信息熵作為目標屬性類型的目標用戶的屬性標簽,為用戶畫像識別提供數(shù)據(jù)依據(jù),提高用戶畫像識別的準確度。
46、應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
1.一種用戶畫像識別方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,在所述根據(jù)多個所述維度特征的信息熵,確定所述目標用戶的信息熵之后,所述方法還包括:
3.根據(jù)權利要求1所述的方法,其特征在于,所述獲取目標屬性類型的目標用戶的出行時空軌跡數(shù)據(jù),包括:
4.根據(jù)權利要求1所述的方法,其特征在于,所述多個維度特征包括:基站附著維度,所述基站附著維度對應的信息熵為:基站附著信息熵;所述根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵,包括:
5.根據(jù)權利要求1所述的方法,其特征在于,所述多個維度特征包括:出行速度維度,所述出行速度維度對應的信息熵為:出行速度信息熵;所述根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵,包括:
6.根據(jù)權利要求1所述的方法,其特征在于,所述多個維度特征包括:出行里程維度,所述出行里程維度對應的信息熵為:出行里程信息熵;所述根據(jù)所述出行時空軌跡數(shù)據(jù),確定多個維度特征的信息熵,包括:
7.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)多個所述維度特征的信息熵,確定所述目標用戶的信息熵,包括:
8.一種用戶畫像識別裝置,其特征在于,包括:
9.一種電子設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1-7中任一項所述的方法中的各步驟。