用于信譽(yù)生成的方法、裝置、計算機(jī)程序產(chǎn)品和系統(tǒng)與流程

文檔序號：11142263閱讀：515來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

用于信譽(yù)生成的方法、裝置、計算機(jī)程序產(chǎn)品和系統(tǒng)與制造工藝

本公開的實(shí)施例一般涉及信息技術(shù)，并且更具體地涉及基于計算機(jī)的數(shù)據(jù)挖掘和融合。

背景技術(shù)：

網(wǎng)絡(luò)的快速發(fā)展已經(jīng)顯著地改變了人們表達(dá)他們的觀點(diǎn)的方式?，F(xiàn)今，人們能夠通過許多聯(lián)網(wǎng)應(yīng)用(諸如網(wǎng)站或平臺等)自由地發(fā)布他們對任何實(shí)體(例如，產(chǎn)品、旅店、服務(wù)等)的見解、反饋、評論和態(tài)度，以表達(dá)他們的個人觀點(diǎn)。他們也能夠在在線和移動社交網(wǎng)絡(luò)中自由地分享他們的態(tài)度和評論。隨著在自然語言中，觀點(diǎn)表達(dá)了人們的主觀態(tài)度、評價和推測；由聯(lián)網(wǎng)用戶所貢獻(xiàn)的這種類型的內(nèi)容已經(jīng)被公認(rèn)為是有價值的信息。它可以被利用以分析對特定對象(例如，話題或產(chǎn)品)的公眾觀點(diǎn)。

對于做出明智決策而言，提取實(shí)體的信譽(yù)信息是重要的。然而，沒有現(xiàn)有方法能夠以綜合的方式通過對以自然語言表達(dá)的觀點(diǎn)、以及觀點(diǎn)投票、觀點(diǎn)引用和用戶反饋評分進(jìn)行挖掘和融合，來生成信譽(yù)。此外，缺乏信譽(yù)的綜合可視化以高效地幫助用戶進(jìn)行決策。因此，期望的是提供用于信譽(yù)生成的改進(jìn)的技術(shù)解決方案。

技術(shù)實(shí)現(xiàn)要素：

提供發(fā)明內(nèi)容以便以簡要的方式介紹構(gòu)思的選擇，將在以下詳細(xì)的描述中進(jìn)一步描述該構(gòu)思的選擇。發(fā)明內(nèi)容不旨在確定所要求保護(hù)的主題的關(guān)鍵特征或基本特征，也不旨在用于限制所要求保護(hù)的主題的范圍。

根據(jù)本公開的一個方面，提供了一種方法，該方法用于從與實(shí)體相關(guān)聯(lián)的多個觀點(diǎn)來生成該實(shí)體的信譽(yù)，其中以自然語言來表達(dá)所述實(shí)體和所述多個觀點(diǎn)。所述方法包括：基于關(guān)于所述實(shí)體的每個觀點(diǎn)的相關(guān)性，過濾所述多個觀點(diǎn)；將過濾的觀點(diǎn)融合到至少一個主要觀點(diǎn)集中；以及基于所述至少一個主要觀點(diǎn)集，生成信譽(yù)值。

根據(jù)本公開的另一個方面，提供了一種計算機(jī)程序產(chǎn)品，其被包含在由計算機(jī)可讀的分發(fā)介質(zhì)上，并且包括程序指令，當(dāng)所述程序指令被加載到計算機(jī)中時，所述程序指令執(zhí)行上述方法。

根據(jù)本公開的另一個方面，提供了一種非短暫性的計算機(jī)可讀介質(zhì)，在其上編碼有語句和指令以使得處理器執(zhí)行上述方法。

根據(jù)本公開的另一個方面，提供了一種用于從與實(shí)體相關(guān)聯(lián)的多個觀點(diǎn)來生成該實(shí)體的信譽(yù)的裝置，其中以自然語言來表達(dá)所述實(shí)體和所述多個觀點(diǎn)。所述裝置包括：過濾器，其被配置為基于關(guān)于所述實(shí)體的每個觀點(diǎn)的相關(guān)性，過濾所述多個觀點(diǎn)；融合器，其被配置為將過濾的觀點(diǎn)融合到至少一個主要觀點(diǎn)集中；以及信譽(yù)生成器，其被配置為基于所述至少一個主要觀點(diǎn)集，生成信譽(yù)值。

根據(jù)本公開的另一個方面，提供了一種系統(tǒng)，該系統(tǒng)包括上述裝置和觀點(diǎn)數(shù)據(jù)，所述觀點(diǎn)數(shù)據(jù)被配置為存儲關(guān)于與實(shí)體相關(guān)聯(lián)的多個觀點(diǎn)的信息。

從結(jié)合附圖一起閱讀的本公開的說明性實(shí)施例的以下詳細(xì)描述，本公開的這些和其它目標(biāo)、特征和優(yōu)點(diǎn)將變得明顯。

附圖說明

圖1是根據(jù)實(shí)施例的說明系統(tǒng)的簡化框圖；

圖2是根據(jù)另一個實(shí)施例的說明系統(tǒng)的簡化框圖；

圖3是根據(jù)又一個實(shí)施例的說明系統(tǒng)的簡化框圖；

圖4是根據(jù)又一個實(shí)施例的說明系統(tǒng)的簡化框圖；

圖5是根據(jù)又一個實(shí)施例的說明系統(tǒng)的簡化框圖；

圖6是根據(jù)實(shí)施例的描繪信譽(yù)生成的過程的流程圖；

圖7是根據(jù)實(shí)施例的描繪信譽(yù)生成和可視化的過程的流程圖；

圖8是根據(jù)實(shí)施例的描繪推薦的過程的流程圖；

圖9示出了根據(jù)實(shí)施例的信譽(yù)可視化的示例。

具體實(shí)施方式

出于解釋的目的，在以下描述中闡述細(xì)節(jié)以便提供所公開的實(shí)施例的徹底理解。然而，對于本領(lǐng)域的技術(shù)人員而言將明顯的是，可以在沒有這些具體細(xì)節(jié)或使用等同的布置來實(shí)現(xiàn)實(shí)施例。

如本文中描述的，本公開的一個方面包括：提供用于從與實(shí)體相關(guān)聯(lián)的多個觀點(diǎn)生成該實(shí)體的信譽(yù)的技術(shù)解決方案。圖1示出了能夠?qū)崿F(xiàn)本公開的一些實(shí)施例的系統(tǒng)100。

如圖1所示出的，系統(tǒng)100包括：多個用戶設(shè)備1011-101n，它們每個操作地連接到應(yīng)用服務(wù)器102。用戶設(shè)備1011-101n可以是任何種類的用戶設(shè)備或計算設(shè)備，其包括但不限于，智能電話、平板計算機(jī)、便攜式計算機(jī)、服務(wù)器、瘦客戶端、機(jī)頂盒和PC，它們運(yùn)行任何種類的操作系統(tǒng)，操作系統(tǒng)包括但不限于，Windows、Linux、UNIX、Android、iOS和它們的變型。例如，用戶設(shè)備1011-101n可以是Windows電話，其具有安裝中其中的應(yīng)用，使用該應(yīng)用，用戶能夠訪問由應(yīng)用服務(wù)器102提供的服務(wù)。服務(wù)可以是任何種類的服務(wù)，其包括但不限于，新聞服務(wù)(諸如，Nokia Xpress Now,NBC News)、社交網(wǎng)絡(luò)服務(wù)(LinkedIn、Facebook、Twitter、YouTube)，消息傳送服務(wù)(諸如，WeChat,Yahoo！Mail)、以及在線購物服務(wù)(諸如，Amazon、Alibaba、TaoBao等)。用戶也可以使用安裝在用戶設(shè)備1011-101n中的網(wǎng)絡(luò)瀏覽器(諸如Internet Explorer,Chrome和Firefox)或其他合適的應(yīng)用來訪問服務(wù)。在這種情況下，應(yīng)用服務(wù)器102將是網(wǎng)絡(luò)服務(wù)器。

用戶可以發(fā)布關(guān)于實(shí)體的以自然語言表達(dá)的他的觀點(diǎn)。此處，詞語“觀點(diǎn)”一般指由用戶做出的任何長度的表達(dá)，其包括但不限于，評論、評語、批評、偏好、反饋、陳述、聲明和主張。此處，詞語“實(shí)體”一般指用戶能夠獲得的項目，其包括但不限于，產(chǎn)品、旅店、飯店、服務(wù)、音樂或藝術(shù)作品、文學(xué)作品(諸如新聞、文章、故事、書籍和報告)。此外，用戶能夠?qū)?shí)體評分，例如，從“0”到“5”，其中“0”用于最不喜歡，“5”用于最喜歡。而且，第二用戶能夠?qū)Φ谝挥脩舻挠^點(diǎn)進(jìn)行投票或引用。例如，第二用戶可以贊成或反對(例如，喜歡或不喜歡)第一用戶的觀點(diǎn)，并且也可以對該實(shí)體表達(dá)他自己的觀點(diǎn)。例如，應(yīng)用服務(wù)器102能夠在觀點(diǎn)數(shù)據(jù)103中存儲和檢索與實(shí)體相關(guān)聯(lián)的觀點(diǎn)，并且向正在查看該實(shí)體的用戶提供關(guān)于實(shí)體的觀點(diǎn)。

觀點(diǎn)數(shù)據(jù)103具有關(guān)于可以提供給用戶的實(shí)體的信息和與每個實(shí)體相關(guān)聯(lián)的觀點(diǎn)，其可以由應(yīng)用服務(wù)器102和系統(tǒng)100的其它組件使用。實(shí)體和觀點(diǎn)被表達(dá)在自然語言中，諸如英語或漢語。例如，當(dāng)實(shí)體是文學(xué)作品時，它的表達(dá)可以是該作品本身；當(dāng)實(shí)體是產(chǎn)品或服務(wù)時，它的表達(dá)可以是該實(shí)體的描述。觀點(diǎn)數(shù)據(jù)103可以被存儲在中心或分布式數(shù)據(jù)庫中，諸如RDBMS、SQL、NoSQL等，或存儲為在任何存儲介質(zhì)(諸如HDD、磁盤、CD、DVD、藍(lán)光盤、EEPROM、SSD等)上的一個或多個文件?？梢詮膽?yīng)用服務(wù)器102或從另一個連接的元件(諸如另一個應(yīng)用服務(wù)器、網(wǎng)站、平臺、存儲設(shè)備等)獲取觀點(diǎn)數(shù)據(jù)103，并且它們可以實(shí)時地或在一段時間段上被自動地或手工地更新。注意的是，在本公開中描述的實(shí)施例不局限于特定種類的服務(wù)、服務(wù)的特定實(shí)現(xiàn)方式、特定種類的實(shí)體、或特定的自然語言。

系統(tǒng)100包括：過濾器104，其被配置為：基于關(guān)于實(shí)體的每個觀點(diǎn)的相關(guān)性，過濾多個觀點(diǎn)，其中該實(shí)體與每個觀點(diǎn)相關(guān)聯(lián)。如上所述，用戶可以發(fā)布以自然語言表達(dá)的他們的觀點(diǎn)，并且用戶可以自由地對其它觀點(diǎn)進(jìn)行投票或引用。一些不負(fù)責(zé)的或甚至惡意的用戶可以在實(shí)體下輸入廣告信息、垃圾信息或不相關(guān)的語句，或者惡意地夸大或打擊實(shí)體。因此，過濾器104旨在過濾掉與它們相關(guān)聯(lián)的實(shí)體不相關(guān)或相對于他們相關(guān)聯(lián)的實(shí)體具有較小的相關(guān)性或關(guān)聯(lián)性的觀點(diǎn)。

根據(jù)一個實(shí)施例，過濾器104能夠使用觀點(diǎn)相關(guān)性以測量觀點(diǎn)與它的相關(guān)聯(lián)的實(shí)體的關(guān)聯(lián)性。通過示例，觀點(diǎn)相關(guān)性可以被表示為正規(guī)化數(shù)值，諸如在[0，1]之間，其指示可以基于它們的相似性和關(guān)聯(lián)性從實(shí)體生成觀點(diǎn)的概率。因此，相關(guān)性值可以區(qū)分關(guān)聯(lián)性的程度，而不是在一些現(xiàn)有技術(shù)中僅將觀點(diǎn)分類為垃圾信息或非垃圾信息。

在這個實(shí)施例中，過濾器104基于在觀點(diǎn)和實(shí)體之間的相似性，以及在與該實(shí)體相關(guān)聯(lián)的多個觀點(diǎn)之間的關(guān)聯(lián)性，計算每個觀點(diǎn)的相關(guān)性?？紤]以下因素中的至少一個因素，使用向量空間模型(VSM)來計算相似性，該因素包括在表達(dá)中的詞語的重要性和在詞語之間的語義相似性。在本領(lǐng)域中，VSM是眾所周知的，其作為代數(shù)模型用于將文本文檔(以及一般地，任何對象)表示為標(biāo)識符(諸如索引詞語)的向量。在這個實(shí)施例中，觀點(diǎn)或?qū)嶓w被表達(dá)在自然語言中，其可以由VSM來表示。例如，實(shí)體或觀點(diǎn)的表達(dá)D可以被視為在多維向量空間中的點(diǎn)，其被表示為(t_l,w₁；t₂,w₂；...；t_m,w_m)。這里，t_i表示在D中出現(xiàn)的詞語i，w_i表示在D中出現(xiàn)的詞語t_i的次數(shù)，其用于評估在D中的詞語t_i的重要性。

例如，可以如下使用VSM來計算在觀點(diǎn)r和它相關(guān)聯(lián)的實(shí)體A之間的相似性：

其中函數(shù)c(w,r)表示在r中出現(xiàn)的詞語w的次數(shù)，c(w,A)表示在A中出現(xiàn)的詞語W的次數(shù)。c(w,r)和c(w,A)分別是在觀點(diǎn)r和實(shí)體A的向量表示中的詞語w的權(quán)重。

與傳統(tǒng)的VSM不同，在這個實(shí)施例中，過濾器104也考慮了在表達(dá)中的詞語的重要性(例如，權(quán)重)和在詞語之間的語義相似性以計算相似性。例如，可以基于在實(shí)體中詞語的重要性來調(diào)節(jié)在實(shí)體A中的詞語w的權(quán)重。在A中廣泛分布的和/或在標(biāo)題中或在段落的第一/最后句子中出現(xiàn)的詞語可能是表達(dá)中的關(guān)鍵詞語。因此在這個實(shí)施例中，過濾器104能夠使用以下公式2來計算在A中的詞語w的權(quán)重：

Weight(w,A)＝c(w,A)*M*Pos(w)+1 (2)

其中，Weight(w,A)表示在A中的詞語w的權(quán)重，c(w,A)表示在A中出現(xiàn)的詞語w的次數(shù)，M表示包含詞語w的段落的數(shù)量。取決于w的位置來設(shè)置Pos(w)的值。在這個實(shí)施例中，過濾器104通過將“1”添加在公式(2)的末尾以避免零的可能性，使用數(shù)據(jù)平滑方法。

根據(jù)這個實(shí)施例，過濾器104也考慮在詞語之間的語義相似性。在自然語言中，許多語義上相似的概念可以使用不同的詞組或短語來表達(dá)。有可能的是，不同的詞語可以用在實(shí)體及其相關(guān)聯(lián)的觀點(diǎn)的表達(dá)中。因此，使用基于詞語的VSM的直接比較可能是有危害的。過濾器104可以使用任何現(xiàn)有的或?qū)淼恼Z義相似性技術(shù)以發(fā)現(xiàn)語義上相似的詞語。例如，Y.Neuman等人描述了語義相似性測量的細(xì)節(jié)，文章標(biāo)題為“Fusing distributional and experiential information for measuring semantic relatedness”(Information Fusion,14(3)(2012),281-287)，通過引用將該文獻(xiàn)整體并入本文。另一個示例是HowNet(www.keenage.com)，其是針對自然語言(例如，漢語和英語)的權(quán)威本體論。在HowNet中，每個詞語鏈接到若干概念，并且每個概念由逗號分隔的若干原始(primitive)表達(dá)來表示。由Y.Guan等人公開了量化語義相似性的細(xì)節(jié)，文章標(biāo)題為“Quantifying semantic similarity of Chinese words from HowNet”(Proceedings of the International Conference on Machine Learning and Cybernetics(2002)234-239)，通過引用將該文獻(xiàn)整體并入本文。

在這個實(shí)施例中，在兩個詞語之間的相似性被定義為它們對應(yīng)的概念的最大相似性，以及可以基于它們的原始表達(dá)的相似性來計算兩個概念的相似性。因此，可以使用以下公式：

Semantic(w₁,w₂)＝max Semantic(c_1i,c_2j) (3)

其中Semantic(w1,w2)是在詞語w₁和w₂的語義相似性測量；c_1i是w₁的概念，以及c_2i是w₂的概念。

從以上，可以如下獲得最終的公式以計算在觀點(diǎn)r和它相關(guān)聯(lián)的實(shí)體A之間的相似性：

如以上示出的，這個實(shí)施例使用了改進(jìn)的VSM，其考慮了兩個新的因素：在A中的詞語的重要性和在詞語之間的語義相似性。以這種方式，這個實(shí)施例能夠提供比傳統(tǒng)的VSM更準(zhǔn)確的相似性計算。

此外，在這個實(shí)施例中，過濾器104不僅基于在觀點(diǎn)和實(shí)體之間的相似性，而且基于在觀點(diǎn)之間的關(guān)聯(lián)性，來計算每個觀點(diǎn)的相關(guān)性。作為示例，在觀點(diǎn)r類似于具有針對實(shí)體的高關(guān)聯(lián)度的另一個觀點(diǎn)，則觀點(diǎn)r應(yīng)當(dāng)也與該實(shí)體有關(guān)，即使它沒有與該實(shí)體的高度相似度。

根據(jù)這個實(shí)施例，在兩個觀點(diǎn)之間的關(guān)聯(lián)性可以被表示為它們的余弦相似性?；谟^點(diǎn)之間的余弦相似性，構(gòu)建觀點(diǎn)的無向圖。在該圖中，每個節(jié)點(diǎn)表示觀點(diǎn)；它的值表示與實(shí)體的觀點(diǎn)相關(guān)性；在兩個節(jié)點(diǎn)之間的邊的權(quán)重表示兩個對應(yīng)的觀點(diǎn)的余弦相似性。如果在兩個觀點(diǎn)之間的相似性不是零，則在該圖中，對應(yīng)的節(jié)點(diǎn)作為鄰居被彼此連接。根據(jù)這個圖，融合器105能夠基于合適的算法(諸如隨機(jī)游走算法)，計算由觀點(diǎn)之間的關(guān)聯(lián)性所貢獻(xiàn)的觀點(diǎn)r_i的相關(guān)性Per(r_i’,A)，例如，使用以下加權(quán)方案：

其中ad_j[r_i]表示r_i的鄰居的觀點(diǎn)。w(r_j,r_i)是r_j和r_i之間的余弦相似性。注意的是，盡管在這個實(shí)施例中，w(r_j,r_i)指r_j和r_i之間的余弦相似性，但是公式4和其它算法也能夠用于計算r_j和r_i之間的相似性。在某些情況下，公式4可以獲得更好的結(jié)果，因?yàn)槿缟纤?，它考慮了詞語的重要性和詞語的語義相似性。

在一個實(shí)施例中，過濾器104能夠整合兩種測量，即在觀點(diǎn)和它相關(guān)聯(lián)的實(shí)體之間的相似性，和觀點(diǎn)之間的關(guān)聯(lián)性。作為示例，過濾器104可以使用如下的整合公式：

其中r_i是關(guān)于實(shí)體A的觀點(diǎn)，R是關(guān)于A的所有觀點(diǎn)的集合，Sim(r_i,A)表示基于公式(4)的在r_i和A之間的正規(guī)化的相似性。Pertinence(r_i,A)表示r_i與A的關(guān)聯(lián)度。參數(shù)d表示衰減系數(shù)，其控制在該公式中在兩個項目之間的折中。注意的是，在不同的情況下，d可以被設(shè)置為不同的值。根據(jù)實(shí)施例，d被設(shè)置為d＝0.7。adj[r_i]和w(r_j,r_i)具有如公式(5)中的相同含義。

在下面的算法1中描述了根據(jù)實(shí)施例的計算最終相關(guān)性的詳細(xì)過程。這里，輸出被定義為向量p_k，其表示在k_th次迭代后所有觀點(diǎn)的平穩(wěn)的相關(guān)值。閾值ε(其是預(yù)定值)用于控制迭代的終止。||p_k-p_k-1||表示在p_k和p_k-1之間的差。如果||p_k-p_k-1||小于閾值ε，則迭代將自動終止。

在計算了每個觀點(diǎn)的相關(guān)性之后，過濾器104可以過濾掉其相關(guān)性小于第一閾值的觀點(diǎn)。在不同的上下文中可以區(qū)別地定義第一閾值。例如，如果與目標(biāo)實(shí)體相關(guān)聯(lián)的觀點(diǎn)的數(shù)量非常大，則第一閾值可以被定義為較大以盡可能地排除許多不太相關(guān)聯(lián)的觀點(diǎn)。作為對照，如果僅有小數(shù)量的觀點(diǎn)與目標(biāo)實(shí)體相關(guān)聯(lián)，則第一閾值可以被定義為相對小以包含盡可能多的觀點(diǎn)。在另一個實(shí)施例中，可以通過基于訓(xùn)練或歷史數(shù)據(jù)的機(jī)器學(xué)習(xí)，來確定第一閾值。此外，可以在一段時間后，或當(dāng)滿足一個或多個預(yù)定條件時，修改或更新第一閾值。另外，第一閾值被配置以便在計算效率和觀點(diǎn)過濾的準(zhǔn)確性之間進(jìn)行平衡。

如在圖1中示出的，系統(tǒng)100還包括：融合器105，其被配置為將過濾的觀點(diǎn)融合到至少一個主要觀點(diǎn)集中。主要觀點(diǎn)集被定義為相似觀點(diǎn)的集合。在確定觀點(diǎn)之間的相似性中，融合器105可以使用任何現(xiàn)有的技術(shù)(諸如公式(1))或改進(jìn)的技術(shù)(諸如公式(4))。

在一個實(shí)施例中，融合器105還被配置為：基于兩個觀點(diǎn)之間的關(guān)系，將兩個觀點(diǎn)之間的相似性設(shè)置為某一值。如上所述，第二用戶可以贊成或反對(例如喜歡或不喜歡)第一用戶的現(xiàn)有觀點(diǎn)，或在新的觀點(diǎn)中引用舊的觀點(diǎn)。

在這個實(shí)施例中，在肯定投票觀點(diǎn)和它投票的觀點(diǎn)之間的相似性被設(shè)置為“1”；而在否定投票觀點(diǎn)和它投票的觀點(diǎn)之間的相似性被設(shè)置為“0”。針對引用觀點(diǎn)，在肯定引用觀點(diǎn)和它引用的觀點(diǎn)之間的相似性被設(shè)置為c(0.5<c<＝1)，而在否定引用觀點(diǎn)和它引用的觀點(diǎn)之間的相似性被設(shè)置為1-c。

在獲得觀點(diǎn)之間的相似性之后，如果觀點(diǎn)之間的相似性大于第二閾值，則融合器105隨后可以將那些觀點(diǎn)融合到主要觀點(diǎn)集中。

根據(jù)實(shí)施例，融合器105可以使用以下觀點(diǎn)融合算法：

如上示出的，除了融合之外，算法2還返回以下輸出：在每個主要觀點(diǎn)集中的相似性的和S_k，在每個主要觀點(diǎn)集中的相似觀點(diǎn)的數(shù)量N_k，在每個主要觀點(diǎn)集中的關(guān)于實(shí)體A的評分的和V_k。假設(shè)每個觀點(diǎn)具有關(guān)于相關(guān)聯(lián)的實(shí)體的評分。然而，針對每個觀點(diǎn)，可能未必是這樣。

根據(jù)一個實(shí)施例，系統(tǒng)100還可以包括：第一評分器(未示出)，其被配置為生成觀點(diǎn)的評分，其中該觀點(diǎn)沒有提供關(guān)于相關(guān)聯(lián)的實(shí)體的評分。例如，在相同主要觀點(diǎn)集中的其他觀點(diǎn)的平均評分可以用于未評分的觀點(diǎn)。當(dāng)在主要觀點(diǎn)集中的所有觀點(diǎn)未能提供關(guān)于相關(guān)聯(lián)的實(shí)體的任何評分時，第一評分器可以通過使用任何現(xiàn)有的或?qū)淼脑u分生成技術(shù)，生成針對每個觀點(diǎn)的評分。例如，由C.W.Leung等人已經(jīng)公開了評分生成的細(xì)節(jié)，其文章名稱為“A probabilistic rating inference framework for mining user preferences from reviews”(World Wide Web 14(2011)187-215)，通過引用將該文章整體并入本文。

如在圖1中示出的，系統(tǒng)100還包括：信譽(yù)生成器106，其被配置為基于與實(shí)體相關(guān)聯(lián)的至少一個主要觀點(diǎn)集來生成針對該實(shí)體的信譽(yù)值。在一個實(shí)施例中，信譽(yù)生成器106可以如下來生成信譽(yù)值：

這里，瑞利(Rayleigh)累積分布函數(shù)應(yīng)用于建模整數(shù)N的影響，其中σ＞0是參數(shù)，其相反地控制數(shù)字N如何快速地影響θ(N)的增加。如在公式(7)中示出的，瑞利累積分布函數(shù)用于建模主要觀點(diǎn)的流行度，其由它的觀點(diǎn)集平均相似性S_k/N_k和平均評分值V_k/N_k來調(diào)整。注意的是，公式(7)僅是示例性公式，本領(lǐng)域的技術(shù)人員將能夠通過使用融合器105的至少一些或所有結(jié)果來設(shè)想出其它合適的公式。

在一個實(shí)施例中，信譽(yù)生成器106能夠在觀點(diǎn)數(shù)據(jù)103中存儲針對實(shí)體的信譽(yù)值和有關(guān)信息(諸如，融合器105的融合結(jié)果和輸出)。例如，融合結(jié)果可以包括：在每個主要觀點(diǎn)集中的相似性的和，在每個主要觀點(diǎn)集中相似觀點(diǎn)的數(shù)量，在每個主要觀點(diǎn)集中關(guān)于實(shí)體的評分的和，所有主要觀點(diǎn)集的相似性的分布，所有主要觀點(diǎn)集的觀點(diǎn)的分布，所有主要觀點(diǎn)集的評分的分布，等。以這種方式，如果諸如用戶設(shè)備1011的用戶設(shè)備或應(yīng)用服務(wù)器102請求實(shí)體的信譽(yù)值和有關(guān)信息，則系統(tǒng)可以從那里檢索它們。因此，能夠節(jié)省時間和計算資源。同時，對于服務(wù)器有可能的是，提供對應(yīng)的服務(wù)以提供所請求的聚合信息，從而擔(dān)當(dāng)觀點(diǎn)挖掘的(云)服務(wù)提供商。

圖2是根據(jù)另一個示例的說明系統(tǒng)200的簡化框圖。系統(tǒng)200包括多個用戶設(shè)備1011-101n、應(yīng)用服務(wù)器102、觀點(diǎn)數(shù)據(jù)103、過濾器104、融合器105和信譽(yù)生成器106。在圖1和圖2中，使用類似的標(biāo)記表示類似的組件。出于簡潔，在此省略了類似組件的描述。

如在圖2中示出的，系統(tǒng)200還包括：第一推薦器108，其被配置為基于實(shí)體的信譽(yù)值來推薦實(shí)體。根據(jù)實(shí)施例，在觀點(diǎn)數(shù)據(jù)103中，存在多個實(shí)體和它們相關(guān)聯(lián)的觀點(diǎn)，信譽(yù)生成器106如上所述生成針對每個實(shí)體的信譽(yù)值。第一推薦器108然后可以根據(jù)它們的信譽(yù)值對實(shí)體進(jìn)行排名，并且推薦具有最高信譽(yù)值的實(shí)體，例如，前10個實(shí)體。

如在圖2中示出的，系統(tǒng)200還包括：可視化器107，其被配置為向用戶提供信譽(yù)可視化。根據(jù)實(shí)施例，可視化器107能夠向用戶呈現(xiàn)充分的信息以便幫助他的決策。例如，它能夠示出前面的主要觀點(diǎn)和它們的流行度，主要觀點(diǎn)的平均相似性，主要觀點(diǎn)的平均評分，以及正規(guī)化的信譽(yù)值。

圖9示出了根據(jù)實(shí)施例的信譽(yù)可視化的示例。在這個示例中，針對每個實(shí)體，具有最高流行度的前三個主要觀點(diǎn)被示出為矩形條。每個條的長度(寬度)指示流行度(持有類似觀點(diǎn)的人的百分比)，條的顏色或樣式指示主要觀點(diǎn)集的平均評分。不同的顏色或樣式可以用于指示觀點(diǎn)類型或類別，例如，非常好、好、中立、差、非常差等。條的高度示出主要觀點(diǎn)集的觀點(diǎn)相似性。整個尺度是1。條被連接。在條的末尾處，示出了用于信譽(yù)生成的過濾的觀點(diǎn)的總數(shù)量和正規(guī)化的信譽(yù)值?？商娲兀抛u(yù)值可以被顯示在其他形式中，諸如星的數(shù)量。注意的是，圖9僅是說明性示例，本領(lǐng)域的技術(shù)人員將能夠設(shè)想出其它方式以呈現(xiàn)信譽(yù)和有關(guān)信息。在這個實(shí)施例中，信譽(yù)可視化旨在提供關(guān)于從過濾的觀點(diǎn)數(shù)據(jù)所挖掘的主要觀點(diǎn)的充分的視圖。

圖3是根據(jù)另一個實(shí)施例的說明系統(tǒng)300的簡化框圖。系統(tǒng)300包括多個用戶設(shè)備1011-101n、應(yīng)用服務(wù)器102、觀點(diǎn)數(shù)據(jù)103和過濾器104。在圖1到圖3中，使用類似的標(biāo)記表示類似的組件。出于簡潔，在此省略了類似組件的描述。

如在圖3中示出的，系統(tǒng)300還包括：第二推薦器301，其被配置為：基于其它用戶的評分和用戶和其它用戶的現(xiàn)有觀點(diǎn)，計算關(guān)于候選實(shí)體的該用戶的估計評分，其中該用戶還沒有對該實(shí)體進(jìn)行評論，并且基于估計的評分來推薦該實(shí)體。應(yīng)當(dāng)理解的是，類似的用戶具有類似的偏好。因此，可能的是，預(yù)測用戶關(guān)于候選實(shí)體的評分，即使該用戶還沒有提供關(guān)于候選實(shí)體的他的觀點(diǎn)或評分，或即使該用戶還沒有看到該實(shí)體。這可以通過以下來實(shí)現(xiàn)：檢查具有相似品味或偏好的其他用戶的活動。

在一個實(shí)施例中，第二推薦器301可以如下計算關(guān)于候選實(shí)體的用戶的估計評分：

這里，假設(shè)的是，用戶u₀對多個實(shí)體AA＝{A₁,……,A_m}持有觀點(diǎn){r_0,1,r_0,2,r_0,3,……,r_0,m}；多個其他用戶u₁,…,u_n還提供關(guān)于不僅在AA中的實(shí)體，而且沒有由用戶u₀評論的其他實(shí)體Ap(p∈P)的觀點(diǎn)。r_i,j表示由u_i提供的關(guān)于A_j的觀點(diǎn)，V_i,p表示關(guān)于A_p的u_i的評分。Sim(r_0,j,r_i,j)表示關(guān)于相同的實(shí)體A_j在用戶u₀的觀點(diǎn)和類似用戶u_i的觀點(diǎn)之間的相似性。如上所述，可以通過使用現(xiàn)有的技術(shù)(諸如公式(1))或改進(jìn)的技術(shù)(諸如公式(4))來計算相似性。t₀是閾值，其可以是預(yù)定義的值或根據(jù)上下文來確定，以及用于排除與用戶u₀不是非常相似的一些用戶。V_0,p表示關(guān)于A_p的u₀的估計評分。

在計算估計的評分之后，第二推薦器301基于估計評分來推薦一個或多個實(shí)體。例如，如果在A_p中存在多個實(shí)體，則第二推薦器301能夠根據(jù)它們的估計評分對實(shí)體進(jìn)行排名，并且推薦具有最高估計評分的實(shí)體，例如前10個實(shí)體。

類似于以上描述的實(shí)施例，在計算估計評分之前，過濾器103可以對觀點(diǎn)數(shù)據(jù)進(jìn)行過濾以排除不相關(guān)的觀點(diǎn)或垃圾信息。以這種方式，能夠改進(jìn)用于推薦的估計的準(zhǔn)確性。

圖4是根據(jù)另一個實(shí)施例的說明系統(tǒng)400的簡化框圖。系統(tǒng)400包括多個用戶設(shè)備1011-101n、應(yīng)用服務(wù)器102、觀點(diǎn)數(shù)據(jù)103和過濾器104。在圖1到圖4中，使用類似的標(biāo)記表示類似的組件。出于簡潔，在此省略了類似組件的描述。

如在圖4中示出的，系統(tǒng)400還包括：觀點(diǎn)估計器401，其被配置為基于用戶和其它用戶現(xiàn)有的觀點(diǎn)，生成關(guān)于候選實(shí)體的該用戶的估計的觀點(diǎn)，其中該用戶還沒有對該候選實(shí)體評論。如上所解釋的，類似的用戶具有類似的偏好?？赡艿氖?，預(yù)測關(guān)于候選實(shí)體的用戶的觀點(diǎn)，即使該用戶還沒有評論候選實(shí)體，或甚至該用戶還沒有看到該實(shí)體。這可以通過檢查具有類似的品味或偏好的其他用戶的活動來實(shí)現(xiàn)。

在一個實(shí)施例中，觀點(diǎn)估計器401能夠如下生成關(guān)于候選實(shí)體的用戶的估計觀點(diǎn)。：

這里，假設(shè)用戶u₀持有關(guān)于多個實(shí)體AA＝{A₁,……,A_m}的觀點(diǎn){r_0,1,r_0,2,r_0,3,……,r_0,m}，多個其他用戶u₁,…,u_n也提供關(guān)于不僅在AA中的實(shí)體而且沒有被用戶u₀評論的其他實(shí)體Ap(p∈P)的觀點(diǎn)。r_i,j表示由u_i提供的關(guān)于A_j的觀點(diǎn)，Sim(r_0,j,r_i,j)表示關(guān)于相同實(shí)體A_j在用戶u₀的觀點(diǎn)和用戶u_i的觀點(diǎn)之間的相似性。如上所述，可以通過使用現(xiàn)有的技術(shù)(諸如公式(1))或改進(jìn)的技術(shù)(諸如公式(4))來計算相似性。t₀是閾值，其可以是預(yù)定義的值或根據(jù)上下文來確定，以及用于排除與用戶u₀不是非常相似的一些用戶。r_0,p表示關(guān)于A_p的u₀的估計觀點(diǎn)。

類似于上述實(shí)施例。在計算估計觀點(diǎn)之前，過濾器103可以對觀點(diǎn)數(shù)據(jù)進(jìn)行過濾以排除不相關(guān)的觀點(diǎn)或垃圾信息。以這種方式，能夠改進(jìn)估計的準(zhǔn)確性。

圖5是根據(jù)另一個實(shí)施例的說明系統(tǒng)500的簡化框圖。系統(tǒng)500包括多個用戶設(shè)備1011-101n、應(yīng)用服務(wù)器102、觀點(diǎn)數(shù)據(jù)103和過濾器104。在圖1到圖5中，使用類似的標(biāo)記表示類似的組件。出于簡潔，在此省略了類似組件的描述。

如在圖5中示出的，系統(tǒng)500還包括：第三推薦器501，其被配置為基于關(guān)于實(shí)體的與用戶類似的其他用戶的感情來推薦該實(shí)體。如以上解釋的，類似的用戶具有類似的偏好?？赡艿氖?，預(yù)測關(guān)于候選實(shí)體的用戶的偏好，即使該用戶還沒有評論候選實(shí)體，或甚至該用戶還沒有看到該實(shí)體。這可以通過檢查具有類似的品味或偏好的其他用戶的活動來實(shí)現(xiàn)。

在這個實(shí)施例中，假設(shè)用戶u₀持有關(guān)于多個實(shí)體AA＝{A₁,……,A_m}的觀點(diǎn){r_0,1,r_0,2,r_0,3,……,r_0,m}，多個其他用戶u₁,…,u_n也提供關(guān)于不僅在AA中的實(shí)體而且沒有被用戶u₀評論的其他實(shí)體Ap(p∈P)的觀點(diǎn)。第三推薦器501可以如下計算在用戶u₀和其他用戶u₁,…,u_n之間的相似性：

這里，r_0,j表示由u₀提供的關(guān)于A_j的觀點(diǎn)，r_i,j表示由另一個用戶u_i提供的關(guān)于A_j的觀點(diǎn)(i＝1…n)。Sim(r_0,j,r_i,j)表示關(guān)于相同實(shí)體A_j在兩個觀點(diǎn)(即用戶u₀的觀點(diǎn)和用戶u_i的觀點(diǎn))之間的相似性。如上所述，可以通過使用現(xiàn)有的技術(shù)(諸如公式(1))或改進(jìn)的技術(shù)(諸如公式(4))來計算相似性。針對用戶u₁,…,u_n中的每個用戶，第三推薦器501將用戶u_i和用戶u₀之間的所有觀點(diǎn)相似性進(jìn)行求和。該和用作用戶u₀和用戶u_i之間的相似性的測量。第三推薦器501然后根據(jù)關(guān)于用戶u₀的它們的相似性對用戶u₁,…,u_n進(jìn)行排名。從而，第三推薦器501可以找出最相似的用戶或多個用戶。最后，第三推薦器501基于最相似的用戶(多個)的感情來推薦用戶u₀還沒評論的一個或多個實(shí)體。例如，第三推薦器501向用戶u₀推薦最相似用戶(多個)“喜歡”或“不喜歡”的實(shí)體。

將了解的是，上述實(shí)施例和它們的組件可以以各種方式被組合。例如，第一推薦器208、第二推薦器301、觀點(diǎn)估計器401、第三推薦器501或它們的任何組合可以被并入到在圖1和圖2中說明的實(shí)施例中。融合器105、信譽(yù)生成器106和/或可視化器207也可以被并入到在圖3至圖5說明的實(shí)施例中。

圖6是根據(jù)實(shí)施例的描繪信譽(yù)生成的過程600的流程圖。如在該圖中示出的，過程600從步驟601開始，其中基于關(guān)于觀點(diǎn)相關(guān)聯(lián)的實(shí)體的每個觀點(diǎn)的相關(guān)性，來過濾多個觀點(diǎn)。如上使用其它實(shí)施例所描述的，在步驟601處，系統(tǒng)基于觀點(diǎn)和實(shí)體之間的相似性，多個觀點(diǎn)之間的關(guān)聯(lián)性，來計算每個觀點(diǎn)的相關(guān)性。此外，在相似性和關(guān)聯(lián)性的計算中，可以通過考慮以下因素中的至少一個因素，使用向量空間模型(VSM)，該因素包括在表達(dá)中的詞語的重要性和在詞語之間的語義相似性。在獲得每個觀點(diǎn)的相關(guān)性值后，第一閾值可以用于過濾掉其相關(guān)性值小于第一閾值的哪些觀點(diǎn)。

在過濾后，該過程前進(jìn)到步驟605，其中過濾的觀點(diǎn)被進(jìn)一步融合到至少一個主要觀點(diǎn)集中。如以上使用其它實(shí)施例所描述的，在步驟605，系統(tǒng)計算過濾的觀點(diǎn)之間的相似性。如果在類似的觀點(diǎn)之間的相似性大于第二閾值，則類似的觀點(diǎn)被融合到主要觀點(diǎn)集中。類似于上述實(shí)施例，可以通過使用現(xiàn)有的技術(shù)(諸如公式(1))或改進(jìn)的技術(shù)(諸如公式(4))來計算相似性。例如，如上所述，系統(tǒng)可以考慮以下因素中的至少一個因素，使用向量空間模型，該因素包括在表達(dá)中的詞語的重要性和在詞語之間的語義相似性。

此外，在兩個觀點(diǎn)具有投票關(guān)系的情況下，即一個觀點(diǎn)對另一個觀點(diǎn)進(jìn)行投票，則兩個觀點(diǎn)之間的相似性可以被設(shè)置為某一值。例如，在肯定投票觀點(diǎn)和它投票的觀點(diǎn)之間的相似性可以被設(shè)置為“1”；而在否定投票觀點(diǎn)和它投票的觀點(diǎn)之間的相似性可以被設(shè)置為“0”。此外，在兩個觀點(diǎn)具有引用關(guān)系的情況下，即一個觀點(diǎn)引用另一個觀點(diǎn)，則這兩個觀點(diǎn)之間的相似性被設(shè)置為另一個值。例如，肯定引用觀點(diǎn)和它引用的觀點(diǎn)之間的相似性可以被設(shè)置為c(0.5<c<＝1)，而否定引用觀點(diǎn)和它引用的觀點(diǎn)之間的相似性可以被設(shè)置為1-c。

在融合后，該過程前進(jìn)到步驟610，其中基于至少一個主要觀點(diǎn)集，生成針對實(shí)體的信譽(yù)值。如上所述，在生成信譽(yù)值中，可以考慮多個因素，諸如在每個主要觀點(diǎn)集中的觀點(diǎn)的數(shù)量，它的觀點(diǎn)集平均相似性和它的平均評分值。

圖7是根據(jù)實(shí)施例的描繪信譽(yù)生成和可視化的過程700的流程圖。在這個實(shí)施例中，步驟701，705和710分別類似于在圖6中的601、605和610。出于簡化，在此省略這些步驟的描述。如在圖7中示出的，在步驟710處生成針對實(shí)體的信譽(yù)值之后，該過程前進(jìn)到步驟715，其中參考至少一個主要觀點(diǎn)集，來可視化觀點(diǎn)和實(shí)體的信譽(yù)值。如上所述，圖9示出了信譽(yù)可視化的示例。針對每個實(shí)體，具有最高流行度的前三個主要觀點(diǎn)被示出為矩形條。這些條被連接。在條的末尾處，示出了用于信譽(yù)生成的過濾觀點(diǎn)的總數(shù)和正規(guī)化的信譽(yù)值。此外，圖9僅是說明性示例，并且本領(lǐng)域的技術(shù)人員將能夠設(shè)想出其它方式以呈現(xiàn)信譽(yù)和有關(guān)信息。

圖8是根據(jù)實(shí)施例的描繪推薦的過程800的流程圖。在這個實(shí)施例中，步驟801，805和810分別類似于在圖6中的601、605和610，和圖7中的步驟701，705和710。出于簡化，在此省略這些步驟的描述。如在圖8中示出的，在這個實(shí)施例中，在步驟810處生成針對實(shí)體的信譽(yù)值之后，系統(tǒng)基于它的信譽(yù)值推薦實(shí)體。例如，在存在多個實(shí)體的情況下，可以通過步驟801至810獲得每個實(shí)體的信譽(yù)值。然后，系統(tǒng)根據(jù)它們的信譽(yù)值進(jìn)行排名，并且推薦具有最高信譽(yù)值的實(shí)體，例如前10個實(shí)體。

在另一個實(shí)施例中，提供了推薦過程以基于其它用戶的評分和用戶和其它用戶的現(xiàn)有觀點(diǎn)，來計算該用戶對候選實(shí)體的估計評分，其中該用戶還沒有對該實(shí)體進(jìn)行評論。如上解釋的，類似的用戶具有類似的偏好?？赡艿氖牵A(yù)測用戶關(guān)于候選實(shí)體的評分，即使該用戶還沒有提供關(guān)于候選實(shí)體的他的觀點(diǎn)或評分，或即使該用戶還沒有看到該實(shí)體。這可以通過以下來實(shí)現(xiàn)：檢查具有相似品味或偏好的其他用戶的活動。類似地，以上描述的公式(8)可以用于估計用戶關(guān)于候選實(shí)體的評分。在計算相似性中，如上所述，系統(tǒng)可以使用現(xiàn)有技術(shù)(諸如公式(1))或改進(jìn)的技術(shù)(諸如公式(4))。在計算了估計評分后，在A_p中的多個實(shí)體可以根據(jù)它們估計的評分被排名，并且可以推薦具有最高估計評分的實(shí)體。

在這個實(shí)施例中，在計算估計評分之前，系統(tǒng)可以對觀點(diǎn)數(shù)據(jù)進(jìn)行過濾以排除不相關(guān)的觀點(diǎn)或垃圾信息。以這種方式，能夠改進(jìn)估計的準(zhǔn)確性。然而，例如在觀點(diǎn)數(shù)據(jù)相對干凈并且不包含許多垃圾信息或不相關(guān)的觀點(diǎn)的情況下，可以省略過濾的步驟。

在另一個實(shí)施例中，提供觀點(diǎn)估計的過程以基于用戶和其它用戶的現(xiàn)有觀點(diǎn)，生成關(guān)于候選實(shí)體的該用戶的估計觀點(diǎn)，其中該用戶還沒有對候選實(shí)體進(jìn)行評論。如上解釋的，類似的用戶具有類似的偏好?？赡艿氖牵A(yù)測用戶關(guān)于候選實(shí)體的觀點(diǎn)，即使該用戶還沒有評論候選實(shí)體，或即使該用戶還沒有看到該實(shí)體。這可以通過以下來實(shí)現(xiàn)：檢查具有相似品味或偏好的其他用戶的活動。類似地，以上描述的公式(9)可以用于生成用戶關(guān)于候選實(shí)體的估計觀點(diǎn)。在計算相似性中，如上所述，系統(tǒng)可以使用現(xiàn)有技術(shù)(諸如公式(1))或改進(jìn)的技術(shù)(諸如公式(4))。

類似于上述實(shí)施例，在計算估計評分之前，系統(tǒng)可以對觀點(diǎn)數(shù)據(jù)進(jìn)行過濾以排除不相關(guān)的觀點(diǎn)或垃圾信息。以這種方式，能夠改進(jìn)估計的準(zhǔn)確性。然而，例如在觀點(diǎn)數(shù)據(jù)相對干凈并且不包含許多垃圾信息或不相關(guān)的觀點(diǎn)的情況下，可以省略過濾的步驟。

在另一個實(shí)施例中，提供推薦的過程以基于用戶最相似的其它用戶關(guān)于實(shí)體的感情，來推薦實(shí)體，其中該用戶還沒有對候選實(shí)體進(jìn)行評論。如上解釋的，類似的用戶具有類似的偏好?？赡艿氖?，預(yù)測關(guān)于候選實(shí)體的用戶的偏好，即使該用戶還沒有評論候選實(shí)體，或即使該用戶還沒有看到該實(shí)體。這可以通過以下來實(shí)現(xiàn)：檢查具有相似品味或偏好的其他用戶的活動。該過程首先使用上述公式(10)以計算在目標(biāo)用戶u₀和其它用戶u₁,…,u_n中的每個用戶之間的相似性。在獲得相似性之后，根據(jù)關(guān)于用戶u₀的它們的相似性對用戶u₁,…,u_n進(jìn)行排名。從而，該過程可以找出最相似的用戶(多個)。最后，該過程基于最相似的用戶(多個)的感情，來推薦一個或多個實(shí)體，其中用戶u₀還沒有對該一個或多個實(shí)體進(jìn)行評論。例如，該過程可以向用戶u₀推薦最相似用戶(多個)“喜歡”或“不喜歡”的實(shí)體。

類似于上述實(shí)施例，在這個實(shí)施例中，在計算估計評分之前，系統(tǒng)可以對觀點(diǎn)數(shù)據(jù)進(jìn)行過濾以排除不相關(guān)的觀點(diǎn)或垃圾信息。以這種方式，能夠改進(jìn)估計的準(zhǔn)確性。然而，例如在觀點(diǎn)數(shù)據(jù)相對干凈并且不包含許多垃圾信息或不相關(guān)的觀點(diǎn)的情況下，可以省略過濾的步驟。

將了解的是，上述實(shí)施例和它們的組件可以以各種方式被組合。例如，在一個實(shí)施例中，上述推薦中的任何推薦可以被組合在一起以例如基于如上所述的信譽(yù)值、觀點(diǎn)的相似性、評分和/或感情，提供推薦結(jié)果。此外，推薦和它們的組合也可以被并入到信譽(yù)生成的過程中。

根據(jù)本公開的一個方面，提供了一種裝置，該裝置用于從與實(shí)體相關(guān)聯(lián)的多個觀點(diǎn)來生成該實(shí)體的信譽(yù)，其中以自然語言來表達(dá)所述實(shí)體和所述多個觀點(diǎn)，該裝置包括：被配置為實(shí)現(xiàn)上述方法的構(gòu)件。在一個實(shí)施例中，該裝置包括：被配置為基于關(guān)于所述實(shí)體的每個觀點(diǎn)的相關(guān)性，過濾所述多個觀點(diǎn)的構(gòu)件；被配置為將過濾的觀點(diǎn)融合到至少一個主要觀點(diǎn)集中的構(gòu)件；以及被配置為基于所述至少一個主要觀點(diǎn)集，生成信譽(yù)值的構(gòu)件。

該裝置還可以包括：構(gòu)件，其被配置為基于觀點(diǎn)和實(shí)體之間的相似性，在所述多個觀點(diǎn)之間的關(guān)聯(lián)性，來計算每個觀點(diǎn)的相關(guān)性，以及構(gòu)件，其被配置為過濾掉其相關(guān)性小于第一閾值的觀點(diǎn)。

根據(jù)一個實(shí)施例，考慮以下因素中的至少一個因素，使用向量空間模型來計算相似性，該因素包括在表達(dá)中的詞語的重要性和在詞語之間的語義相似性。

根據(jù)一個實(shí)施例，該裝置還包括：構(gòu)件，其被配置為計算在過濾的觀點(diǎn)之間的相似性，以及構(gòu)件，其被配置為如果在兩個觀點(diǎn)之間的相似性大于第二閾值，則將這兩個觀點(diǎn)融合到主要觀點(diǎn)集中。

根據(jù)一個實(shí)施例，兩個觀點(diǎn)包括第一觀點(diǎn)和對所述第一觀點(diǎn)投票的第二觀點(diǎn)；以及在兩個觀點(diǎn)之間的相似性被設(shè)置為第一相似值。

根據(jù)一個實(shí)施例，兩個觀點(diǎn)包括第一觀點(diǎn)和對所述第一觀點(diǎn)引用的第二觀點(diǎn)；以及在兩個觀點(diǎn)之間的相似性被設(shè)置為第二相似值。

根據(jù)一個實(shí)施例，該方法還包括：構(gòu)件，其被配置為基于在每個主要觀點(diǎn)集中的觀點(diǎn)的數(shù)量，它的觀點(diǎn)集平均相似性和它的平均評分值，來生成信譽(yù)值。

根據(jù)一個實(shí)施例，該裝置還包括：構(gòu)件，其被配置為針對未能提供關(guān)于相關(guān)聯(lián)的實(shí)體的評分的觀點(diǎn)而設(shè)置評分。

在一個實(shí)施例中，該裝置還包括：構(gòu)件，其被配置為通過參考至少一個主要觀點(diǎn)集，對觀點(diǎn)和實(shí)體的信譽(yù)進(jìn)行可視化。

在一個實(shí)施例中，該裝置還包括：構(gòu)件，其被配置為基于實(shí)體的信譽(yù)值來推薦實(shí)體。

在一個實(shí)施例中，該裝置還包括：構(gòu)件，其被配置為基于其它用戶的評分和用戶和其它用戶的現(xiàn)有觀點(diǎn)，計算該用戶關(guān)于候選實(shí)體的估計的評分，其中該用戶還沒有對候選實(shí)體進(jìn)行評論；以及構(gòu)件，其被配置為基于估計的評分來推薦該實(shí)體。

在一個實(shí)施例中，該裝置還包括：構(gòu)件，其被配置為基于其它用戶的觀點(diǎn)和用戶和其它用戶的現(xiàn)有觀點(diǎn)，計算該用戶關(guān)于候選實(shí)體的估計的觀點(diǎn)，其中該用戶還沒有對候選實(shí)體進(jìn)行評論。

在一個實(shí)施例中，該裝置還包括：構(gòu)件，其被配置為基于用戶的最相似的用戶關(guān)于實(shí)體的感情，來推薦該實(shí)體，其中該用戶還沒有對該實(shí)體進(jìn)行評論。

注意的是，在圖1-5中描繪的系統(tǒng)100、200、300、400和500的組件中的任何組件可以被實(shí)現(xiàn)為硬件或軟件模塊。在軟件模塊的情況下，可以將它們包含在有形的計算機(jī)可讀可記錄存儲介質(zhì)上。例如，所有軟件模塊(或其任何子集)可以在相同的介質(zhì)上，或每個軟件模塊可以在不同的介質(zhì)上。例如，軟件模塊可以在硬件處理器上運(yùn)行?？梢允褂眠\(yùn)行在硬件處理器上的如上所述的不同的軟件模塊來執(zhí)行方法步驟。

另外，本公開的一個方面可以使用在通用計算機(jī)或工作站上運(yùn)行的軟件。此類實(shí)現(xiàn)方式可以使用例如處理器、存儲器和例如由顯示器和鍵盤形成的輸入/輸出接口。如本文中使用的詞語“處理器”旨在包含任何處理設(shè)備，諸如例如，包含CPU(中央處理器)和/或其它形式的處理電路的處理器。此外，詞語“處理器”可以指不只一個個體處理器。詞語“存儲器”旨在包含與處理器或CPU相關(guān)聯(lián)的存儲器，諸如例如RAM(隨機(jī)訪問存儲器)、ROM(只讀存儲器)、固定存儲器(例如，硬盤)、可移動存儲設(shè)備(例如，磁盤)、閃速存儲器等。處理器、存儲器和輸入/輸出接口(諸如顯示器和鍵盤)可以例如經(jīng)由作為數(shù)據(jù)處理單元的一部分的總線互連。合適的互連(例如，經(jīng)由總線)也可以被提供給網(wǎng)絡(luò)接口(諸如網(wǎng)卡)，其可以用于與計算機(jī)網(wǎng)絡(luò)進(jìn)行接口，以及被提供給介質(zhì)接口，諸如磁盤或CD-ROM驅(qū)動器，其可以用于與介質(zhì)進(jìn)行接口。

因此，計算機(jī)軟件(其包含用于執(zhí)行如本文所描述的本公開的方法的指令和代碼)可以被存儲在相關(guān)聯(lián)的存儲器設(shè)備中的一個或多個相關(guān)聯(lián)的存儲器設(shè)備中，并且當(dāng)準(zhǔn)備好被使用時，被部分地或全部地加載(例如加載到RAM中)并由CPU執(zhí)行。此類軟件可以包括但不限于固件、駐留軟件、微碼、以及諸如此類。

如指出的，本公開的一些方面可以采用包含在計算機(jī)可讀介質(zhì)中的計算機(jī)程序產(chǎn)品的形式，該計算機(jī)可讀介質(zhì)具有在其上包含的計算機(jī)可讀程序代碼。此外，可以使用任何組合的計算機(jī)可讀介質(zhì)。計算機(jī)可讀介質(zhì)可以是計算機(jī)可讀信號介質(zhì)或計算機(jī)可讀存儲介質(zhì)。例如，計算機(jī)可讀存儲介質(zhì)可以是但不限于電、磁、光、電磁、紅外線或半導(dǎo)體系統(tǒng)、裝置、或設(shè)備、或上述的任何合適組合。計算機(jī)可讀存儲介質(zhì)的更具體的示例(非限制性列表)可以包括以下：具有一個或多個線纜的電連接、便攜式計算機(jī)磁盤、硬盤、隨機(jī)訪問存儲器(RAM)、只讀存儲器(ROM)、可擦除可編程只讀存儲器(EPROM或閃速存儲器)、光纖、便攜式光盤只讀存儲器(CD-ROM)、光存儲設(shè)備、磁存儲設(shè)備、或上述的任何合適組合。在本文檔的上下文中，計算機(jī)可讀介質(zhì)可以是任何有形的介質(zhì)，其可以包括或存儲程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備使用或與其連接。

用于執(zhí)行針對本公開的多個方面的操作的計算機(jī)程序代碼可以被編寫在至少一種編程語言的任何組合中，其包括面向?qū)ο蟮木幊陶Z言(諸如Java,Smalltalk,C++等)和傳統(tǒng)的過程編程語言(諸如“C”編程語言)或類似的編程語言。程序代碼全部可以在用戶計算機(jī)上運(yùn)行，部分地在用戶計算機(jī)上運(yùn)行，作為獨(dú)立的軟件包，部分地在用戶計算機(jī)上運(yùn)行并且部分地在遠(yuǎn)程計算機(jī)上運(yùn)行，或全部在遠(yuǎn)程計算機(jī)或服務(wù)器上運(yùn)行。

在附圖中的流程圖和框圖說明了根據(jù)本公開的可能的實(shí)現(xiàn)方式的架構(gòu)、功能和操作。在這點(diǎn)上，在流程圖或框圖中的每個框可以表示代碼的模塊、組件、段、或部分，其包括用于實(shí)現(xiàn)指定的邏輯功能(多個)的至少一個可執(zhí)行指令。還應(yīng)當(dāng)注意的是，在一些可替代的實(shí)現(xiàn)方式中，在框中注明的功能可以以與圖中所注明的順序不同的順序而發(fā)生。例如，取決于所涉及的功能，順序地示出的兩個框可以實(shí)際上大體上同時執(zhí)行，或一些框有時可以以相反的順序來執(zhí)行。還需要注意的是，框圖和/或流程圖中的框的組合可以由來基于專用硬件的系統(tǒng)(其執(zhí)行指定功能或動作)、或?qū)Ｓ糜布陀嬎銠C(jī)指令的組合來實(shí)現(xiàn)。

在任何情況下，應(yīng)當(dāng)理解的是，在本公開中說明的組件可以被實(shí)現(xiàn)在各種形式的硬件、軟件或它們的組合中，例如專用集成電路(ASIC)、功能電路、適當(dāng)編程的通用數(shù)字計算機(jī)(其具有相關(guān)聯(lián)的存儲器)以及諸如此類?？紤]到本文中提供的本公開的教導(dǎo)，相關(guān)領(lǐng)域的技術(shù)人員將能夠設(shè)想出本公開的組件的其它實(shí)現(xiàn)方式。

本文所使用的詞語僅是出于描述特定實(shí)施例的目的，并且不是意在限制實(shí)施例。如本文所使用的，單數(shù)形式“一個”、“一種”和“所述”意味著也包含復(fù)數(shù)形式，除非上下文中清楚地另外指明。還應(yīng)當(dāng)理解的是，當(dāng)在本文使用時，詞語“包括”和/或“包含”指存在所闡明的特征、數(shù)字、步驟、操作、元素和/或組件，但是不排除存在或附加一個或多個其它特征、數(shù)字、步驟、操作、元素、組件和/或其組合。

出于說明的目的，已經(jīng)提供了各種實(shí)施例的描述，但是描述不旨在是詳盡的或限制于所公開的實(shí)施例。在不背離所描述的實(shí)施例的范圍和精神的情況下，許多修改和變型對于本領(lǐng)域的技術(shù)人員而言將是明顯的。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：閆崢;
技術(shù)所有人：諾基亞技術(shù)有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>