午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種基于知識(shí)強(qiáng)化的購(gòu)物籃可解釋推薦方法與系統(tǒng)

文檔序號(hào):39712217發(fā)布日期:2024-10-22 12:57閱讀:2來(lái)源:國(guó)知局
一種基于知識(shí)強(qiáng)化的購(gòu)物籃可解釋推薦方法與系統(tǒng)

本發(fā)明涉及購(gòu)物推薦,尤其涉及一種基于知識(shí)強(qiáng)化的購(gòu)物籃可解釋推薦方法與系統(tǒng)。


背景技術(shù):

1、在電子商務(wù)領(lǐng)域中,推薦系統(tǒng)已經(jīng)廣泛應(yīng)用來(lái)幫助用戶快速找到感興趣的商品。特別是在b2b場(chǎng)景中,b2b用戶通常一次性購(gòu)買多個(gè)商品,且購(gòu)買數(shù)量大、重復(fù)性強(qiáng)。這使得b2b交易中的推薦系統(tǒng)不單單是推薦一個(gè)商品,而要推薦一組商品。而且推薦系統(tǒng)不僅僅需要準(zhǔn)確預(yù)測(cè)用戶未來(lái)的采購(gòu)需求,還需要能夠解釋推薦結(jié)果,以便用戶在決策過(guò)程中能夠理解和信任推薦結(jié)果,從而更好的促成交易??山忉屬?gòu)物籃推薦旨在根據(jù)用戶過(guò)去購(gòu)買的購(gòu)物籃序列推薦一組用戶下次可能購(gòu)買的商品,并提供推薦解釋。

2、已有的購(gòu)物籃推薦大部分是對(duì)商品的相關(guān)性進(jìn)行建模,并挖掘隱藏在購(gòu)物籃序列中的用戶偏好,試圖用挖掘的信息推斷出一組傾向于在下一個(gè)購(gòu)物籃中的商品。現(xiàn)有的購(gòu)物籃推薦主要是基于馬爾科夫鏈和循環(huán)神經(jīng)網(wǎng)絡(luò)兩種。然而,推薦方法中的一個(gè)常見(jiàn)問(wèn)題是數(shù)據(jù)稀疏性,用戶和商品之間的交互較少,僅僅依靠交互信息很難推斷出購(gòu)物籃及用戶偏好的高質(zhì)量表征。目前購(gòu)物籃推薦的研究專注于提升推薦準(zhǔn)確度,已經(jīng)取得了很好的推薦性能。但是大多數(shù)購(gòu)物籃推薦是深度學(xué)習(xí)的黑盒模型,沒(méi)有可解釋性。缺乏可解釋性會(huì)造成客戶不理解推薦結(jié)果,影響推薦的有效性。但是目前沒(méi)有針對(duì)購(gòu)物籃推薦可解釋性的研究,且已有的購(gòu)物籃推薦主要集中在b2c領(lǐng)域,b2b領(lǐng)域很少。

3、知識(shí)圖譜具有交互信息以外的豐富信息和拓?fù)浣Y(jié)構(gòu),可以利用知識(shí)圖譜的豐富信息學(xué)得高質(zhì)量預(yù)訓(xùn)練表征,還可以利用知識(shí)圖譜的拓?fù)浣Y(jié)構(gòu)進(jìn)行推理得到可解釋路徑。因此,我們?nèi)绾螛?gòu)建針對(duì)b2b電子商務(wù)場(chǎng)景的購(gòu)物籃知識(shí)圖譜,并獲得具有b2b用戶特性的用戶表征,實(shí)現(xiàn)購(gòu)物籃的可解釋推薦是亟需解決的問(wèn)題。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明克服了現(xiàn)有技術(shù)的不足,提供了一種基于知識(shí)強(qiáng)化的購(gòu)物籃可解釋推薦方法與系統(tǒng)。

2、為達(dá)上述目的,本發(fā)明采用的技術(shù)方案為:

3、本發(fā)明第一方面提供了一種基于知識(shí)強(qiáng)化的購(gòu)物籃可解釋推薦方法,包括:

4、獲取用戶在購(gòu)物系統(tǒng)相關(guān)歷史時(shí)間段的交互信息和商品信息,基于所述交互信息和商品信息提取出各屬性實(shí)體以及屬性實(shí)體之間的關(guān)系,并構(gòu)建購(gòu)物籃知識(shí)圖譜;

5、構(gòu)建transr模型,將所述購(gòu)物籃知識(shí)圖譜輸入到所述transr模型得到預(yù)訓(xùn)練表征;所述屬性實(shí)體包括用戶、商品、購(gòu)物籃、商品屬性;

6、基于所述購(gòu)物知識(shí)圖譜中最近購(gòu)買的商品、購(gòu)物籃、商品屬性構(gòu)建用戶特有的三步圖,根據(jù)所述用戶特有的三步圖構(gòu)建購(gòu)物籃的表征序列,并通過(guò)lstm生成用戶的購(gòu)物籃序列級(jí)別表征;

7、從包含購(gòu)物籃的交互數(shù)據(jù)中篩選出用戶在預(yù)設(shè)時(shí)間之內(nèi)的交互數(shù)據(jù),得到用戶最近購(gòu)買的購(gòu)物籃序列,并基于所述用戶最近購(gòu)買的購(gòu)物籃序列進(jìn)行加權(quán)學(xué)習(xí)生成用戶的復(fù)購(gòu)表征;

8、學(xué)習(xí)權(quán)重融合所述預(yù)訓(xùn)練表征、購(gòu)物籃序列級(jí)別表征和復(fù)購(gòu)表征,得到用戶預(yù)測(cè)向量;

9、將用戶預(yù)測(cè)向量代替用戶預(yù)訓(xùn)練表征,通過(guò)強(qiáng)化學(xué)習(xí)在購(gòu)物籃知識(shí)圖譜上進(jìn)行路徑推理,得到購(gòu)物籃的推薦商品及解釋路徑。

10、進(jìn)一步的,在本方法中,獲取用戶在購(gòu)物系統(tǒng)相關(guān)歷史時(shí)間段的交互信息和商品信息,基于所述交互信息和商品信息提取出各屬性實(shí)體以及屬性實(shí)體之間的關(guān)系,并構(gòu)建購(gòu)物籃知識(shí)圖譜,具體為:

11、獲取用戶在購(gòu)物系統(tǒng)相關(guān)歷史時(shí)間段的交互信息和商品信息;

12、對(duì)用戶購(gòu)物系統(tǒng)的交互信息按時(shí)間劃分,得到包含購(gòu)物籃的數(shù)據(jù);

13、對(duì)用戶購(gòu)物系統(tǒng)的交互信息和商品信息進(jìn)行屬性實(shí)體提取和屬性實(shí)體之間的關(guān)系提??;

14、基于提取出的各屬性實(shí)體和屬性實(shí)體之間的關(guān)系構(gòu)建購(gòu)物籃知識(shí)圖譜。

15、進(jìn)一步的,在本方法中,構(gòu)建transr模型,將所述購(gòu)物籃知識(shí)圖譜輸入到所述transr模型得到預(yù)訓(xùn)練表征,具體為:

16、構(gòu)建transr模型,將所述購(gòu)物籃知識(shí)圖譜輸入到所述,得到實(shí)體的預(yù)訓(xùn)練表征,其中,預(yù)訓(xùn)練表征滿足以下關(guān)系式:

17、;

18、表示購(gòu)物籃知識(shí)圖譜,其中,表示實(shí)體集合,表示實(shí)體之間的關(guān)系集合,三元組表示觀察到頭部實(shí)體與尾部實(shí)體之間存在關(guān)系。

19、進(jìn)一步的,在本方法中,基于所述購(gòu)物知識(shí)圖譜中最近購(gòu)買的商品、購(gòu)物籃、商品屬性構(gòu)建用戶特有的三步圖,根據(jù)所述用戶特有的三步圖構(gòu)建購(gòu)物籃的表征序列,并通過(guò)lstm生成用戶的購(gòu)物籃序列級(jí)別表征,具體包括:

20、針對(duì)每個(gè)用戶,獲取所述購(gòu)物知識(shí)圖譜中最近購(gòu)買的商品、購(gòu)物籃、商品屬性數(shù)據(jù),并基于所述購(gòu)物知識(shí)圖譜中最近購(gòu)買的商品、購(gòu)物籃、商品屬性構(gòu)建用戶特有的三步圖;

21、通過(guò)gat模型來(lái)聚合用戶特有的三步圖中不同實(shí)體的表征,得到每個(gè)用戶的購(gòu)物籃臨時(shí)表征;

22、通過(guò)lstm建模用戶最近的購(gòu)物籃序列的購(gòu)物籃臨時(shí)表征,得到用戶的購(gòu)物籃序列級(jí)別的表征。

23、進(jìn)一步的,在本方法中,從包含購(gòu)物籃的交互數(shù)據(jù)中篩選出用戶在預(yù)設(shè)時(shí)間之內(nèi)的交互數(shù)據(jù),得到用戶最近購(gòu)買的購(gòu)物籃序列,并基于所述用戶最近購(gòu)買的購(gòu)物籃序列進(jìn)行加權(quán)學(xué)習(xí)生成用戶的復(fù)購(gòu)表征,具體為:

24、從包含購(gòu)物籃的交互數(shù)據(jù)中篩選出用戶在預(yù)設(shè)時(shí)間之內(nèi)的交互數(shù)據(jù),得到用戶最近購(gòu)買的購(gòu)物籃序列;

25、基于所述用戶最近購(gòu)買的購(gòu)物籃序列統(tǒng)計(jì)用戶最近購(gòu)買的購(gòu)物籃里每個(gè)商品的購(gòu)買次數(shù);

26、篩選出最近購(gòu)買次數(shù)中購(gòu)買次數(shù)最多的若干個(gè)商品,并對(duì)購(gòu)買次數(shù)最多的若干個(gè)商品、購(gòu)買次數(shù)進(jìn)行加權(quán)學(xué)習(xí)處理,獲取用戶的復(fù)購(gòu)表征。

27、進(jìn)一步的,在本方法中,學(xué)習(xí)權(quán)重融合所述預(yù)訓(xùn)練表征、購(gòu)物籃序列級(jí)別表征和復(fù)購(gòu)表征,得到用戶預(yù)測(cè)向量,具體為:

28、其中,通過(guò)計(jì)算用戶預(yù)訓(xùn)練表征、用戶購(gòu)物籃序列級(jí)別表征和用戶復(fù)購(gòu)表征的加權(quán)和來(lái)融合得到用戶的用戶預(yù)測(cè)向量,不同的用戶表征可能對(duì)推薦中的用戶預(yù)測(cè)向量有不同的貢獻(xiàn),我們?yōu)槊糠N用戶表征分配一個(gè)權(quán)重,其中滿足以下關(guān)系式:

29、;

30、其中,和分別對(duì)應(yīng)用戶預(yù)訓(xùn)練表征、用戶購(gòu)物籃序列級(jí)別表征和用戶復(fù)購(gòu)表征的權(quán)重。

31、進(jìn)一步的,在本方法中,將用戶預(yù)測(cè)向量代替用戶預(yù)訓(xùn)練表征,通過(guò)強(qiáng)化學(xué)習(xí)在購(gòu)物籃知識(shí)圖譜上進(jìn)行路徑推理,得到購(gòu)物籃的推薦商品及解釋路徑,具體為:

32、將用戶預(yù)測(cè)向量代替購(gòu)物籃知識(shí)圖譜預(yù)訓(xùn)練得到的實(shí)體和關(guān)系表征中的用戶預(yù)訓(xùn)練表征;

33、構(gòu)建強(qiáng)化學(xué)習(xí)的mdp環(huán)境,通過(guò)所述mdp環(huán)境來(lái)訓(xùn)練策略網(wǎng)絡(luò),使得累積獎(jiǎng)勵(lì)最大,通過(guò)使用動(dòng)作概率引導(dǎo)波束搜索進(jìn)行路徑推理得到推理路徑;

34、通過(guò)mlp計(jì)算用戶預(yù)測(cè)向量和商品預(yù)訓(xùn)練嵌入來(lái)得到用戶對(duì)商品的評(píng)分,并通過(guò)從路徑終點(diǎn)的商品中篩選出評(píng)分最高的幾個(gè)商品做為購(gòu)物籃推薦結(jié)果。

35、進(jìn)一步的,在本方法中,通過(guò)mlp計(jì)算用戶預(yù)測(cè)向量和商品預(yù)訓(xùn)練嵌入來(lái)得到用戶對(duì)商品的評(píng)分,具體包括:

36、通過(guò)一個(gè)mlp計(jì)算用戶預(yù)測(cè)向量和商品預(yù)訓(xùn)練嵌入來(lái)得到用戶對(duì)商品的評(píng)分,計(jì)算公式為:

37、;

38、其中,為評(píng)分,為用戶預(yù)測(cè)向量,是商品的預(yù)訓(xùn)練表征。

39、本發(fā)明第二方面提供了一種基于知識(shí)強(qiáng)化的可解釋購(gòu)物籃推薦系統(tǒng),包括:

40、數(shù)據(jù)預(yù)處理模塊:負(fù)責(zé)獲取用戶在購(gòu)物系統(tǒng)相關(guān)歷史時(shí)間段的交互信息和商品信息,并對(duì)獲取到的信息進(jìn)行預(yù)處理;

41、購(gòu)物籃知識(shí)圖譜構(gòu)建及預(yù)訓(xùn)練表征模塊:基于所述交互信息和商品信息提取出各屬性實(shí)體以及屬性實(shí)體之間的關(guān)系,并構(gòu)建購(gòu)物籃知識(shí)圖譜,并構(gòu)建transr模型,將所述購(gòu)物籃知識(shí)圖譜輸入到所述transr模型得到預(yù)訓(xùn)練表征;

42、用戶預(yù)測(cè)向量模塊:負(fù)責(zé)基于所述購(gòu)物知識(shí)圖譜中最近購(gòu)買的商品、購(gòu)物籃、商品屬性構(gòu)建用戶特有的三步圖,根據(jù)所述用戶特有的三步圖構(gòu)建購(gòu)物籃的表征序列,并通過(guò)lstm生成用戶的購(gòu)物籃序列級(jí)別表征,從包含購(gòu)物籃的交互數(shù)據(jù)中篩選出用戶在預(yù)設(shè)時(shí)間之內(nèi)的交互數(shù)據(jù),得到用戶最近購(gòu)買的購(gòu)物籃序列,并基于所述用戶最近購(gòu)買的購(gòu)物籃序列進(jìn)行加權(quán)學(xué)習(xí)生成用戶的復(fù)購(gòu)表征,學(xué)習(xí)權(quán)重融合所述預(yù)訓(xùn)練表征、購(gòu)物籃序列級(jí)別表征和復(fù)購(gòu)表征,得到用戶預(yù)測(cè)向量;

43、路徑推理及可解釋推薦模塊:負(fù)責(zé)將用戶預(yù)測(cè)向量代替用戶預(yù)訓(xùn)練表征,通過(guò)強(qiáng)化學(xué)習(xí)在購(gòu)物籃知識(shí)圖譜上進(jìn)行路徑推理,得到購(gòu)物籃的推薦商品及解釋路徑;

44、用戶交易模塊:負(fù)責(zé)展示推薦及解釋結(jié)果,提供用戶和供應(yīng)商的在線交易服務(wù),收集交互數(shù)據(jù)并存儲(chǔ)。

45、本發(fā)明第三方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中包括基于知識(shí)強(qiáng)化的可解釋購(gòu)物籃推薦方法程序,所述基于知識(shí)強(qiáng)化的可解釋購(gòu)物籃推薦方法程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)任一項(xiàng)所述的基于知識(shí)強(qiáng)化的可解釋購(gòu)物籃推薦方法的步驟。

46、本發(fā)明解決了背景技術(shù)中存在的缺陷,本發(fā)明具備以下有益效果:

47、本發(fā)明引入了購(gòu)物籃場(chǎng)景的可解釋推薦。傳統(tǒng)的購(gòu)物籃推薦,只是注重于提升推薦性能的準(zhǔn)確性,這樣的方法可能會(huì)造成用戶不理解推薦結(jié)果,從而沒(méi)有使用推薦結(jié)果,影響了客戶的體驗(yàn)感和推薦系統(tǒng)的實(shí)用性。但是本發(fā)明提出的可解釋購(gòu)物籃推薦,在提升推薦性能準(zhǔn)確性的同時(shí),來(lái)提供了推薦解釋,讓用戶更加理解推薦結(jié)果,更信任推薦系統(tǒng),更容易完成交易。本發(fā)明引入了購(gòu)物籃知識(shí)圖譜。傳統(tǒng)的購(gòu)物籃推薦大多是針對(duì)序列模式建?;蛘呤峭ㄟ^(guò)構(gòu)建簡(jiǎn)單的三步圖的方式進(jìn)行表征增強(qiáng),忽略了知識(shí)圖譜豐富的信息和拓?fù)浣Y(jié)構(gòu)的作用。本發(fā)明提出的方法,引入了購(gòu)物籃實(shí)體,利用知識(shí)圖譜豐富的信息來(lái)得到各實(shí)體表征,還利用了知識(shí)圖譜的拓?fù)浣Y(jié)構(gòu)進(jìn)行強(qiáng)化學(xué)習(xí)的路徑推理,得到推薦及解釋。本發(fā)明引入了針對(duì)b2b場(chǎng)景用戶的特性建模。傳統(tǒng)的購(gòu)物籃推薦大多應(yīng)用于b2c場(chǎng)景,可能不適用于b2b場(chǎng)景的客戶。本發(fā)明提出的方法,針對(duì)b2b用戶的特性,特別是復(fù)購(gòu)性進(jìn)行建模,所得的用戶預(yù)測(cè)向量包括了知識(shí)圖譜豐富的信息、用戶購(gòu)物籃序列信息以及用戶復(fù)購(gòu)行為信息,可以很好的提升推薦性能。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1