一種社交網(wǎng)絡(luò)中的用戶影響力評估方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及社交網(wǎng)絡(luò)分析技術(shù)領(lǐng)域,特別是一種社交網(wǎng)絡(luò)中的用戶影響力評估方 法。
【背景技術(shù)】
[0002] 社會影響力是指由于用戶、組織或者社區(qū)與其他用戶、組織或者社區(qū)等具有社交 關(guān)系,導(dǎo)致自身行為隨其他用戶、組織或者社區(qū)的變化而變化的一種現(xiàn)象。社會影響力是社 交網(wǎng)絡(luò)中常見的一種現(xiàn)象。在社交網(wǎng)絡(luò)中,各種各樣的因素都可能對影響力產(chǎn)生影響。通 過對社交網(wǎng)絡(luò)中節(jié)點的影響力進(jìn)行分析,可以發(fā)現(xiàn)社交網(wǎng)絡(luò)中的具有重要影響力的核心節(jié) 點,可用于企業(yè)商業(yè)營銷、廣告定向投放、言論渠道推薦、輿情監(jiān)控等諸多領(lǐng)域。
[0003] 目前對節(jié)點的影響力分析方法主要包括兩大類,一類方法是基于節(jié)點的度數(shù)、介 數(shù)和K-shell等中心化指標(biāo)。利用度數(shù)來評估節(jié)點影響力,適用于符合冪律的非均勻網(wǎng)絡(luò) 中,但是其忽略了網(wǎng)絡(luò)豐富的拓?fù)浣Y(jié)構(gòu)特征;介數(shù)則是以經(jīng)過某個節(jié)點的最短路徑的數(shù)目 來刻畫節(jié)點的重要性,雖然將網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)列入考量,但是其復(fù)雜度過高不適于大型的 真實網(wǎng)絡(luò);通過K-shell分解得到的結(jié)果存在大量具有相同大小的h核節(jié)點,與社交網(wǎng)絡(luò) 中節(jié)點的多樣性不相符?;贙-shell分解的思想,在分解的過程中,通過將已刪除的邊和 仍存在的邊的數(shù)量考慮在內(nèi),Zeng等提出了MDD (Mixed Degree Decomposition)方法用于 區(qū)分具有相同h核值的節(jié)點影響力,但是該方法的參數(shù)2在不同網(wǎng)絡(luò)中的最優(yōu)取值難以 確定;另一類方法是基于鏈接分析的網(wǎng)頁排名算法,如經(jīng)典的PageRank和HITS方法以及其 改進(jìn)方法等;如朱天等基于社交網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu),提出InnerPageRank和OutterPageRank 兩種評估方法,分別用于計算節(jié)點在社區(qū)內(nèi)部和外部的影響力。此類方法需要多次重復(fù)的 迭代,時間復(fù)雜度較高,普遍適用性較弱。
[0004] 綜上,現(xiàn)有的針對社交網(wǎng)絡(luò)中用戶個體的影響力評估方法,面對大規(guī)模社交網(wǎng)絡(luò) 的場景,無論是在分析效果和效率上都難以滿足要求。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種社交網(wǎng)絡(luò)中的用戶影響力評估 方法,該方法具有接近線性的時間復(fù)雜度,有利于提高用戶影響力評估的效果和效率。
[0006] 為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種社交網(wǎng)絡(luò)中的用戶影響力評估方法, 包括如下步驟: 步驟A :讀取社交網(wǎng)絡(luò)數(shù)據(jù),構(gòu)造以社交網(wǎng)絡(luò)用戶為節(jié)點,用戶關(guān)系為邊的社交網(wǎng)絡(luò)圖 G-, 步驟B :根據(jù)社交網(wǎng)絡(luò)圖,遍歷社交網(wǎng)絡(luò)圖中的所有節(jié)點,根據(jù)節(jié)點的度初始化每個節(jié) 點的影響力標(biāo)簽,結(jié)束遍歷; 步驟C :根據(jù)社交網(wǎng)絡(luò)圖,遍歷社交網(wǎng)絡(luò)圖中的所有節(jié)點,根據(jù)所遍歷節(jié)點的鄰居節(jié)點 的影響力等級,計算所遍歷節(jié)點的影響力等級; 步驟D :重復(fù)步驟C,直到每個節(jié)點的影響力等級均收斂。
[0007] 進(jìn)一步地,所述步驟B中,根據(jù)節(jié)點的度初始化節(jié)點的影響力標(biāo)簽的方法為: 定義節(jié)點i的影響力標(biāo)簽Zi為:
【主權(quán)項】
1. 一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,包括如下步驟: 步驟A ;讀取社交網(wǎng)絡(luò)數(shù)據(jù),構(gòu)造W社交網(wǎng)絡(luò)用戶為節(jié)點,用戶關(guān)系為邊的社交網(wǎng)絡(luò)圖 G-, 步驟B;根據(jù)社交網(wǎng)絡(luò)圖,遍歷社交網(wǎng)絡(luò)圖中的所有節(jié)點,根據(jù)節(jié)點的度初始化每個節(jié) 點的影響力標(biāo)簽,結(jié)束遍歷; 步驟C;根據(jù)社交網(wǎng)絡(luò)圖,遍歷社交網(wǎng)絡(luò)圖中的所有節(jié)點,根據(jù)所遍歷節(jié)點的鄰居節(jié)點 的影響力等級,計算所遍歷節(jié)點的影響力等級; 步驟D ;重復(fù)步驟C,直到每個節(jié)點的影響力等級均收斂。
2. 根據(jù)權(quán)利要求1所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,所述 步驟B中,根據(jù)節(jié)點的度初始化節(jié)點的影響力標(biāo)簽的方法為: 定義節(jié)點i的影響力標(biāo)簽為: k < hA > 節(jié)點i的影響力標(biāo)簽包含兩個屬性,其中7,表示節(jié)點i的影響力等級,4表示節(jié)點 i的度數(shù);
在一個給定的靜態(tài)網(wǎng)絡(luò)中,每個節(jié)點的度數(shù)都是固定的,因此對節(jié)點的影響力標(biāo)簽初 始化,等價于對節(jié)點的影響力等級初始化。
3. 根據(jù)權(quán)利要求2所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,所述 步驟C中,計算所遍歷節(jié)點的影響力等級,包括W下步驟: C1 ;對于所遍歷的節(jié)點i,通過對比其鄰居節(jié)點的影響力等級,計算節(jié)點i的優(yōu)質(zhì)鄰居 數(shù); C2 ;根據(jù)計算得到的節(jié)點i的優(yōu)質(zhì)鄰居數(shù),計算并更新節(jié)點i的影響力等級; C3 ;對節(jié)點i的影響力等級進(jìn)行增益處理; C4 ;重復(fù)步驟C1?C3,直到所有節(jié)點均已遍歷。
4. 根據(jù)權(quán)利要求3所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,所述 步驟C1中,計算節(jié)點i的優(yōu)質(zhì)鄰居數(shù),包括W下步驟: C11 ;初始化節(jié)點i的優(yōu)質(zhì)鄰居數(shù); C12 ;遍歷節(jié)點i的鄰居集合,對于所遍歷的鄰居節(jié)點乂根據(jù)節(jié)點J前影響力等級,更 新節(jié)點i的優(yōu)質(zhì)鄰居數(shù); C13 ;重復(fù)步驟C12,直到節(jié)點i的鄰居集合的所有節(jié)點均已遍歷。
5. 根據(jù)權(quán)利要求4所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,所述 步驟C11中,節(jié)點i的優(yōu)質(zhì)鄰居數(shù)為節(jié)點i的優(yōu)質(zhì)鄰居集合的大小,定義為:
其中i^l^Z表示給定的影響力等級最大值,里7表示節(jié)點/的鄰居節(jié)點中影響力等級不
小于X的優(yōu)質(zhì)鄰居集合,即節(jié)點i的鄰居節(jié)點中影響力等級不小于X的節(jié)點構(gòu)成的集合,定 義為:
其中M(i)表示節(jié)點i的鄰居節(jié)點集合,即由與節(jié)點i有邊相連的所有節(jié)點構(gòu)成的集 合,定義為:
其中別為社交網(wǎng)絡(luò)圖端]節(jié)點集合與邊集合; 初始化節(jié)點i的優(yōu)質(zhì)鄰居數(shù)的方法為;根據(jù)給定的影響力等級最大值必UZ,將節(jié)點i 的優(yōu)質(zhì)鄰居數(shù)I灰:/ |。|及/ |,..,.,|公/^ I均初始化為0。
6. 根據(jù)權(quán)利要求5所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于, 所述步驟C12中,對于所遍歷的鄰居節(jié)點乂根據(jù)節(jié)點J前影響力等級,更新節(jié)點i的 優(yōu)質(zhì)鄰居數(shù),具體方法為;若節(jié)點J前影響力等級與大于節(jié)點i的影響力等級7,,則對 足-|,|.么-盧'+1 |、.,一|義-嚴(yán)組I的值加1。
7. 根據(jù)權(quán)利要求6所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,所述 步驟C2中,根據(jù)計算得到的節(jié)點i的優(yōu)質(zhì)鄰居數(shù),計算并更新節(jié)點i的影響力等級,具體方 法為:
其中心表示節(jié)點i的鄰居節(jié)點J前影響力等級,表示節(jié)點i的鄰居 節(jié)點集合中的影響力等級最大值,假設(shè)函數(shù)^^('^)二|每|,)二J + 1, /H,、')二(乂托,由于/,u)是一個單調(diào)不增函數(shù),aU)是一個單調(diào)遞增 函數(shù),因此與U)在區(qū)間[7,,上存在一個唯一的最大值,該最大值即為節(jié)點i的 最終影響力等級/;。
8. 根據(jù)權(quán)利要求7所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,所述 步驟C3中,對節(jié)點的影響力等級進(jìn)行增益處理,具體公式為:
其中,//為步驟C2更新后的節(jié)點i的影響力等級,為增益處理后的節(jié)點i的影響力 等級,表示向下取整函數(shù),《為增益函數(shù),增益函數(shù)《的作用是控制節(jié)點影響力等級 的增益量,定義為:
其中〇〉0為增益參數(shù),u為對數(shù)函數(shù)的底,J為增益因子,定義為:
即將優(yōu)質(zhì)鄰居數(shù)和節(jié)點自身影響力等級的乘積作為一個影響力基數(shù),并根據(jù)鄰居影響 力等級總和W及所述影響力基數(shù)來設(shè)定增益因子 只對增益因子較大的節(jié)點的影響力等級作所述增益處理,即當(dāng)增益因子滿足^>公 時,才進(jìn)行所述增益處理,公為設(shè)定的增益闊值。
9.根據(jù)權(quán)利要求8所述的一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,其特征在于,所述 步驟D中,重復(fù)步驟C,直到每個節(jié)點的影響力等級收斂,具體的迭代終止條件為;前后兩次 迭代的影響力等級相差值A(chǔ)小于闊值為所有節(jié)點前后兩次迭代影響力等級差值的 最大值,定義為:
其中7,(針1)為第針1次迭代時節(jié)點i的影響力等級,7,U)為第欲迭代時節(jié)點i的 影響力等級,似3節(jié)點數(shù)。
【專利摘要】本發(fā)明涉及一種社交網(wǎng)絡(luò)中的用戶影響力評估方法,該方法包括如下步驟:步驟A:讀取社交網(wǎng)絡(luò)數(shù)據(jù),構(gòu)造以社交網(wǎng)絡(luò)用戶為節(jié)點,用戶關(guān)系為邊的社交網(wǎng)絡(luò)圖G;步驟B:根據(jù)社交網(wǎng)絡(luò)圖,遍歷社交網(wǎng)絡(luò)圖中的所有節(jié)點,根據(jù)節(jié)點的度初始化每個節(jié)點的影響力標(biāo)簽,結(jié)束遍歷;步驟C:根據(jù)社交網(wǎng)絡(luò)圖,遍歷社交網(wǎng)絡(luò)圖中的所有節(jié)點,根據(jù)所遍歷節(jié)點的鄰居節(jié)點的影響力等級,計算所遍歷節(jié)點的影響力等級;步驟D:重復(fù)步驟C,直到每個節(jié)點的影響力等級均收斂。該方法具有接近線性的線性時間復(fù)雜度,可有效地分析大規(guī)模社交網(wǎng)絡(luò)中的用戶影響力分布情況,挖掘高影響力用戶,可應(yīng)用于網(wǎng)絡(luò)營銷等領(lǐng)域。
【IPC分類】G06F17-30
【公開號】CN104598605
【申請?zhí)枴緾N201510046398
【發(fā)明人】牛玉貞, 陳羽中, 郭文忠, 羅宇敏
【申請人】福州大學(xué)
【公開日】2015年5月6日
【申請日】2015年1月30日