本發(fā)明屬于信息處理領(lǐng)域,尤其涉及一種視頻節(jié)目推薦方法及視頻節(jié)目推薦裝置。
背景技術(shù):
:基于內(nèi)容的推薦算法(Content-basedRecommendations,CB)是目前最流行的一種推薦方法。它根據(jù)用戶過去喜歡的產(chǎn)品(item),為用戶推薦與之相似的其他產(chǎn)品。例如,一個(gè)推薦飯店的系統(tǒng)可以依據(jù)某個(gè)用戶之前喜歡的多個(gè)烤肉店,從而為他推薦其他烤肉店。在真實(shí)的應(yīng)用場景中,每個(gè)item往往都會(huì)有一些可以描述其特征內(nèi)容的屬性。這些屬性通??梢苑譃閮煞N:結(jié)構(gòu)化的屬性與非結(jié)構(gòu)化的屬性。包含結(jié)構(gòu)化屬性的數(shù)據(jù)可以直接被分析處理,但是,對(duì)于包含非結(jié)構(gòu)化屬性的數(shù)據(jù)而言,例如一篇文章數(shù)據(jù),則先要把它轉(zhuǎn)化為結(jié)構(gòu)化屬性的數(shù)據(jù)后,才能加以分析使用。由于CB算法并非專門應(yīng)用于視頻節(jié)目的推薦算法,因此,根據(jù)CB算法的原理來推薦視頻節(jié)目,則需要先將視頻節(jié)目的內(nèi)容轉(zhuǎn)化為具體的結(jié)構(gòu)化數(shù)據(jù)。在該過程中,由于視頻節(jié)目的內(nèi)容復(fù)雜,視頻畫面變化多端,因此,計(jì)算復(fù)雜度過大,容易出現(xiàn)誤差,從而導(dǎo)致視頻節(jié)目推薦的效果難以滿足用戶的實(shí)際需求。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例的目的在于提供一種視頻節(jié)目推薦方法及視頻節(jié)目推薦裝置,旨在解決現(xiàn)有視頻節(jié)目推薦方法中計(jì)算復(fù)雜度過大,容易出現(xiàn)誤差,從而導(dǎo)致視頻節(jié)目推薦的效果難以滿足用戶實(shí)際需求的問題。本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種視頻節(jié)目推薦方法,包括:獲取多個(gè)視頻節(jié)目,所述多個(gè)視頻節(jié)目包括第一視頻節(jié)目以及多個(gè)第二視頻節(jié)目,所述第一視頻節(jié)目為用戶最近一次觀看的視頻節(jié)目,所述第二視頻節(jié)目為待推薦節(jié)目;獲取每個(gè)所述視頻節(jié)目中各節(jié)目屬性的屬性值;根據(jù)所述屬性值,分別計(jì)算所述第一視頻節(jié)目與每個(gè)所述第二視頻節(jié)目之間的相似度;將所述相似度最大的一個(gè)所述第二視頻節(jié)目輸出為推薦節(jié)目。本發(fā)明實(shí)施例的另一目的在于提供一種視頻節(jié)目推薦裝置,包括:第一獲取單元,用于獲取多個(gè)視頻節(jié)目,所述多個(gè)視頻節(jié)目包括第一視頻節(jié)目以及多個(gè)第二視頻節(jié)目,所述第一視頻節(jié)目為用戶最近一次觀看的視頻節(jié)目,所述第二視頻節(jié)目為待推薦節(jié)目;第二獲取單元,用于獲取每個(gè)所述視頻節(jié)目中各節(jié)目屬性的屬性值;計(jì)算單元,用于根據(jù)所述屬性值,分別計(jì)算所述第一視頻節(jié)目與每個(gè)所述第二視頻節(jié)目之間的相似度;推薦單元,用于將所述相似度最大的一個(gè)所述第二視頻節(jié)目輸出為推薦節(jié)目。本發(fā)明實(shí)施例中,只需根據(jù)視頻節(jié)目中各個(gè)節(jié)目屬性的屬性值,就能計(jì)算出每個(gè)第二視頻節(jié)目與用戶最近一次觀看的視頻節(jié)目之間的相似度,并將相似度最大的第二視頻節(jié)目作為推薦節(jié)目,因此,該推薦節(jié)目能夠最大程度上地符合用戶當(dāng)前的興趣愛好,提高了視頻節(jié)目推薦的準(zhǔn)確性。此外,相對(duì)于CB算法,由于本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法無須將視頻節(jié)目的內(nèi)容轉(zhuǎn)化為具體的結(jié)構(gòu)化數(shù)據(jù),因此,降低了計(jì)算復(fù)雜度以及計(jì)算誤差出現(xiàn)的可能性,由此提高了節(jié)目的推薦效率,滿足了用戶對(duì)節(jié)目推薦的實(shí)際需求。附圖說明圖1是本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法的實(shí)現(xiàn)流程圖;圖2是本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法S103的具體實(shí)現(xiàn)流程圖;圖3是本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法S201的具體實(shí)現(xiàn)流程圖;圖4是本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法S301的具體實(shí)現(xiàn)流程圖;圖5是本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法S302的具體實(shí)現(xiàn)流程圖;圖6是本發(fā)明實(shí)施例提供的視頻節(jié)目推薦裝置的結(jié)構(gòu)框圖。具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。圖1示出了本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法的實(shí)現(xiàn)流程,詳述如下:在S101中,獲取多個(gè)視頻節(jié)目,所述多個(gè)視頻節(jié)目包括第一視頻節(jié)目以及多個(gè)第二視頻節(jié)目,所述第一視頻節(jié)目為用戶最近一次觀看的視頻節(jié)目,所述第二視頻節(jié)目為待推薦節(jié)目。在本實(shí)施例中,視頻節(jié)目播放系統(tǒng)能夠?yàn)橛脩敉扑]視頻節(jié)目。在該視頻節(jié)目播放系統(tǒng)的內(nèi)部,預(yù)設(shè)有包含多個(gè)視頻節(jié)目的視頻節(jié)目列表,視頻節(jié)目列表中記載了每個(gè)視頻節(jié)目的片名。視頻播放系統(tǒng)對(duì)系統(tǒng)中運(yùn)行的各個(gè)進(jìn)程進(jìn)行監(jiān)聽,當(dāng)監(jiān)聽到視頻播放系統(tǒng)中的視頻播放程序被調(diào)用至前臺(tái)運(yùn)行時(shí),表示用戶打開了視頻播放界面并準(zhǔn)備瀏覽節(jié)目列表或準(zhǔn)備觀看視頻節(jié)目,因此,該視頻播放系統(tǒng)讀取列表中可播放的所有視頻節(jié)目的片名。特別地,視頻播放系統(tǒng)還能夠從外部設(shè)備中獲取或更新視頻節(jié)目列表。例如,當(dāng)滿足預(yù)設(shè)的時(shí)間間隔時(shí),從云端服務(wù)器中獲取更新的視頻節(jié)目列表。當(dāng)用戶利用視頻播放系統(tǒng)觀看了一個(gè)視頻節(jié)目后,視頻播放系統(tǒng)在獲取視頻節(jié)目列表中各個(gè)視頻節(jié)目的同時(shí),還能夠基于用戶的播放記錄,準(zhǔn)確獲取該用戶最近一次觀看的一個(gè)視頻節(jié)目的片名,該視頻節(jié)目稱為第一視頻節(jié)目。在視頻節(jié)目列表中,除第一視頻節(jié)目之外的所有視頻節(jié)目均為第二視頻節(jié)目,每個(gè)第二視頻節(jié)目都有可能被推薦至用戶,因此稱為待推薦節(jié)目。在S102中,獲取每個(gè)所述視頻節(jié)目中各節(jié)目屬性的屬性值。對(duì)于視頻節(jié)目列表中的每個(gè)視頻節(jié)目,可從本地?cái)?shù)據(jù)庫或云端服務(wù)器中查詢到該視頻節(jié)目在各個(gè)節(jié)目屬性上所對(duì)應(yīng)的屬性值。作為本發(fā)明的一個(gè)實(shí)施例,所述節(jié)目屬性包括以下至少一項(xiàng):導(dǎo)演屬性、演員屬性、編劇屬性、片名屬性、類型屬性、國家屬性、語言屬性以及年份屬性。每個(gè)節(jié)目屬性代表視頻節(jié)目中的一類基本信息,除了上述列出的八個(gè)基本節(jié)目屬性之外,視頻節(jié)目的節(jié)目屬性還可以包括制作人屬性、翻譯屬性、效果屬性、公司屬性、音樂類型屬性、背景年份屬性等。在確定每一個(gè)節(jié)目屬性后,還要獲取該節(jié)目屬性的屬性值。例如,當(dāng)視頻節(jié)目《變形金剛》的節(jié)目屬性為導(dǎo)演屬性時(shí),該節(jié)目屬性的屬性值為邁克爾·貝。優(yōu)選地,在本實(shí)施例中,需要獲取上述八個(gè)基本節(jié)目屬性的屬性值。在特定需求的場景之下,還可以根據(jù)實(shí)際所需,獲取上述八個(gè)基本節(jié)目屬性之中的一個(gè)或多個(gè)屬性值,或者,獲取除上述八個(gè)基本節(jié)目屬性之外的其他節(jié)目屬性的屬性值。在S103中,根據(jù)所述屬性值,分別計(jì)算所述第一視頻節(jié)目與每個(gè)所述第二視頻節(jié)目之間的相似度。對(duì)于任意一個(gè)第二視頻節(jié)目,其各個(gè)節(jié)目屬性在第一視頻節(jié)目中均存在,因此,通過確定第一視頻節(jié)目與第二視頻節(jié)目之間每個(gè)節(jié)目屬性的屬性值之間的特征差異,可得知第一視頻節(jié)目與每個(gè)第二視頻節(jié)目的關(guān)聯(lián)程度,以相似度來量化二者之間的關(guān)聯(lián)程度。作為本發(fā)明的一個(gè)實(shí)施例,圖2示出了本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法S103的具體實(shí)現(xiàn)流程,詳述如下:在S201中,對(duì)于任意一個(gè)所述第二視頻節(jié)目,根據(jù)所述屬性值,計(jì)算該第二視頻節(jié)目與所述第一視頻節(jié)目之間相同所述節(jié)目屬性的屬性值相似度。獲取第二視頻節(jié)目與所述第一視頻節(jié)目之間相同的一個(gè)或多個(gè)節(jié)目屬性,則每個(gè)相同的節(jié)目屬性在第一視頻節(jié)目與在第二視頻節(jié)目中的屬性值分別稱為第一節(jié)目屬性值以及第二節(jié)目屬性值。例如,當(dāng)?shù)谝灰曨l節(jié)目與任意一個(gè)第二視頻節(jié)目中的國家屬性為相同節(jié)目屬性,則獲取第一視頻節(jié)目與第二視頻節(jié)目中該國家屬性對(duì)應(yīng)的屬性值,如“中國”、“美國”。若一個(gè)第二視頻節(jié)目與第一視頻節(jié)目之間相同的節(jié)目屬性有八個(gè),則存在八個(gè)第一節(jié)目屬性值,分別為A、B、C、D、E、F、G、H,在該第二視頻節(jié)目中,對(duì)應(yīng)的第二節(jié)目屬性值也有八個(gè),分別為a、b、c、d、e、f、g、h。在每個(gè)相同屬性之間,計(jì)算屬性值相似度。即判斷第一視頻節(jié)目中第一節(jié)目屬性值與第二視頻節(jié)目中第二節(jié)目屬性值的關(guān)聯(lián)程度。在上述例子中,計(jì)算屬性值相似度的過程具體如下:計(jì)算A與a的屬性值相似度、B與b的屬性值相似度、C與c的屬性值相似度、D與d的屬性值相似度、E與e的屬性值相似度、F與f的屬性值相似度、G與g的屬性值相似度以及F與f的屬性值相似度,因此,在每個(gè)視頻節(jié)目中都具有上述八個(gè)基本節(jié)目屬性前提下,對(duì)于每個(gè)第二視頻節(jié)目,可得到分別對(duì)應(yīng)第一視頻節(jié)目中八個(gè)屬性值的八個(gè)屬性值相似度。對(duì)于僅為線性相關(guān),而不可向量化的兩個(gè)屬性值而言(如兩個(gè)年份屬性的屬性值),如果兩個(gè)屬性值的大小越接近,則其屬性值相似度越高。作為本發(fā)明的一個(gè)實(shí)施例,如圖3所示,上述S201具體如下:在S301中,當(dāng)相同節(jié)目屬性為可向量化的節(jié)目屬性時(shí),對(duì)所述相同節(jié)目屬性分別在所述第一視頻節(jié)目與該第二視頻節(jié)目中的所述屬性值進(jìn)行分詞處理,以得到每個(gè)所述屬性值對(duì)應(yīng)的多個(gè)分詞。在本實(shí)施例中,在上述八個(gè)基本節(jié)目屬性的前提下,第一節(jié)目屬性值與第二節(jié)目屬性值是可向量化的相同節(jié)目屬性的屬性值,如導(dǎo)演屬性、演員屬性、編劇屬性、片名屬性等。如果兩個(gè)屬性值之間相同的特征越多,則兩個(gè)屬性值越相關(guān)。由于屬性值的每個(gè)特征可由屬性值內(nèi)部的每個(gè)詞語來體現(xiàn),因此,為了提取第一節(jié)目屬性值中的多個(gè)特征,先對(duì)屬性值進(jìn)行分詞處理。作為本發(fā)明的一個(gè)實(shí)施例,如圖4所示,上述S301具體如下:在S401中,對(duì)于所述相同節(jié)目屬性分別在所述第一視頻節(jié)目與該第二視頻節(jié)目中的每個(gè)所述屬性值,當(dāng)該屬性值中包含有標(biāo)點(diǎn)符號(hào)時(shí),以所述標(biāo)點(diǎn)符號(hào)為分詞拆分點(diǎn),對(duì)該屬性值進(jìn)行分詞,以得到該屬性值對(duì)應(yīng)的多個(gè)分詞。在S402中,當(dāng)該屬性值中未包含有任何標(biāo)點(diǎn)符號(hào)時(shí),獲取預(yù)設(shè)的標(biāo)準(zhǔn)詞庫中的各個(gè)詞語。在S403中,判斷該屬性值是否包含所述標(biāo)準(zhǔn)詞庫中的至少一個(gè)所述詞語;若該屬性值包含所述標(biāo)準(zhǔn)詞庫中的至少一個(gè)所述詞語,則將其包含的每個(gè)詞語作為該屬性值對(duì)應(yīng)的多個(gè)分詞。即,在本實(shí)施例中,對(duì)屬性值進(jìn)行分詞時(shí),分詞過程包括以下兩種情況:情況一:若屬性值中包含有標(biāo)點(diǎn)符號(hào),則直接以所述標(biāo)點(diǎn)符號(hào)為拆分點(diǎn)。當(dāng)檢測到第一個(gè)標(biāo)點(diǎn)符號(hào)出現(xiàn)時(shí),以該標(biāo)點(diǎn)符號(hào)之前的所有字符作為一個(gè)分詞;若確定當(dāng)前檢測到的標(biāo)點(diǎn)符號(hào)為最后一個(gè)標(biāo)點(diǎn)符號(hào),則以該標(biāo)點(diǎn)符號(hào)之后的所有字符作為一個(gè)分詞;若當(dāng)前檢測到的標(biāo)點(diǎn)符號(hào)并非為最后一個(gè)標(biāo)點(diǎn)符號(hào),則將該標(biāo)點(diǎn)符號(hào)與下一個(gè)標(biāo)點(diǎn)符號(hào)之間的所有字符作為一個(gè)分詞。其中,標(biāo)點(diǎn)符號(hào)包括空格符號(hào)。例如,對(duì)于第一視頻節(jié)目中的演員屬性,其屬性值為“張涵予、鄧超、袁文康、湯嬿、王寶強(qiáng)”,則以該屬性值中的頓號(hào)“、”為拆分點(diǎn),從而得到該屬性值對(duì)應(yīng)的多個(gè)分詞為“張涵予”、“鄧超”、“袁文康”、“湯嬿”、“王寶強(qiáng)”。情況二:若屬性值中未包含有任何標(biāo)點(diǎn)符號(hào),則以標(biāo)準(zhǔn)詞庫中的各個(gè)詞語為比較對(duì)象,若該屬性值中包含有標(biāo)準(zhǔn)詞庫中的詞語,則將該詞語作為該屬性值中的一個(gè)分詞。由于屬性值中的同一個(gè)字符可能會(huì)匹配標(biāo)準(zhǔn)詞庫中的不同詞語,因此,將該字符匹配的所有詞語都記錄下來,一并作為該屬性值中的分詞。例如,對(duì)于第一視頻節(jié)目中的片名屬性,其屬性值為“變形金剛”,則應(yīng)當(dāng)采用上述情況二中的分詞算法。該屬性值匹配到標(biāo)準(zhǔn)詞庫中的詞語有“變形金剛”、“金剛”、“變形”,雖然屬性值中的兩個(gè)字符“金剛”匹配到了兩個(gè)不同的詞語(分別為“變形金剛”和“金剛”),但依照該算法的原理中,需要將匹配到的所有詞語記錄下來,因此,該屬性值對(duì)應(yīng)的多個(gè)分詞應(yīng)當(dāng)為“變形金剛”、“金剛”、“變形”。在S302中,在一個(gè)所述屬性值對(duì)應(yīng)的多個(gè)分詞中,對(duì)每個(gè)所述分詞進(jìn)行排序,并為每個(gè)所述分詞分配權(quán)重,以使排序在前的分詞的權(quán)重大于或等于排序在后的分詞的權(quán)重。作為本發(fā)明的一個(gè)實(shí)施例,圖5示出了本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法S302的具體實(shí)現(xiàn)流程,詳述如下:在S501中,在一個(gè)所述屬性值對(duì)應(yīng)的多個(gè)分詞中,依照每個(gè)所述分詞在該屬性值中出現(xiàn)的先后次序,對(duì)各個(gè)分詞進(jìn)行排序,以得到分詞序列。在S502中,在所述分詞序列中,若存在包含有至少兩個(gè)相同起始字符的兩個(gè)分詞,則將其中字符長度較大的分詞排在字符長度較小的分詞前面。在S503中,依照所述分詞的排序順序,為每個(gè)所述分詞分配權(quán)重,以使排序在前的分詞的權(quán)重大于或等于排序在后的分詞的權(quán)重。在S504中,生成權(quán)重列表,所述權(quán)重列表包含每個(gè)所述分詞對(duì)應(yīng)的所述權(quán)重。具體地,在本實(shí)施例中,依照每個(gè)分詞在屬性值中出現(xiàn)的先后次序,對(duì)各個(gè)分詞進(jìn)行排序。若兩個(gè)分詞中包含有相同的起始詞語,則將其中字符長度較大的分詞排在字符長度較小的分詞前面。此后,依照各個(gè)分詞的排序順序,分配權(quán)重。繼續(xù)以上述例子中“變形金剛”所對(duì)應(yīng)的多個(gè)分詞為例,該屬性值“變形金剛”對(duì)應(yīng)的多個(gè)分詞為“變形金剛”、“金剛”和“變形”。由于分詞“變形金剛”與“變形”相對(duì)于分詞“金剛”來說,在屬性值“變形金剛”中較先出現(xiàn),因此,“金剛”的排序?yàn)槿齻€(gè)分詞中的最后一個(gè)。并且,分詞“變形金剛”與分詞“變形”均包含有相同的起始詞語,而分詞“變形金剛”的字符長度為4個(gè)漢字符,比分詞“變形”的字符長度長,因此,分詞“變形金剛”應(yīng)當(dāng)排在“變形”的前面。根據(jù)該排序過程可知,屬性值“變形金剛”對(duì)應(yīng)的分詞排序序列為{“變形金剛”,“變形”,“金剛”}。此時(shí),為該序列中的各個(gè)分詞分配一個(gè)權(quán)重,并且權(quán)重的大小依照排序順序依次遞減或保持不變,從而得到對(duì)應(yīng)該排序序列的一個(gè)權(quán)重列表。特別地,在本實(shí)施例中,當(dāng)屬性值對(duì)應(yīng)的分詞個(gè)數(shù)在五個(gè)以內(nèi)時(shí),依照各個(gè)分詞的順序,為每個(gè)分詞分配的權(quán)重依次為5、4、3、2、2,因此,屬性值“變形金剛”所對(duì)應(yīng)的權(quán)重列表如表1所示:表1分詞權(quán)重變形金剛5變形4金剛3在S303中,在每一個(gè)所述屬性值中,根據(jù)各個(gè)所述分詞的所述權(quán)重,生成該屬性值對(duì)應(yīng)的一個(gè)特征向量。具體地,在每一個(gè)所述屬性值中,根據(jù)各個(gè)所述分詞的所述權(quán)重,生成該屬性值對(duì)應(yīng)的一個(gè)特征向量,所述特征向量中的每個(gè)元素值依次為所述權(quán)重列表中每個(gè)所述分詞對(duì)應(yīng)的所述權(quán)重。在本實(shí)施例中,以向量化的形式表示第一節(jié)目屬性值。在上述八個(gè)基本節(jié)目屬性的屬性值之中,除了年份屬性的屬性值外,每個(gè)第一節(jié)目屬性值均能夠表示為一個(gè)特征向量。以權(quán)重列表中每個(gè)分詞對(duì)應(yīng)的權(quán)重作為特征向量中的一個(gè)元素值,以每個(gè)分詞的排序作為特征向量中元素值的排序。因此,在上述例子中,屬性值“變形金剛”對(duì)應(yīng)的特征向量為{5,4,3}。同理,以向量化的形式表示第二節(jié)目屬性值,可得到第二節(jié)目屬性值對(duì)應(yīng)的特征向量。在S304中,計(jì)算第一特征向量與第二特征向量之間的余弦相似度,所述第一特征向量與所述第二特征向量為所述相同節(jié)目屬性在所述第一視頻節(jié)目與該第二視頻節(jié)目中的所述屬性值所分別對(duì)應(yīng)的所述特征向量。余弦相似度S的計(jì)算公式為:其中,xa表示第一特征向量的第a個(gè)元素值;yb表示第一特征向量的第b個(gè)元素值;m、n分別表示第一特征向量、第二特征向量中的元素總數(shù);Sj,k表示滿足第一條件的各個(gè)xj·k值的總和,第一條件具體為:在第一特性向量中第j個(gè)元素值xj對(duì)應(yīng)的分詞與第二特性向量中第k個(gè)元素值yk對(duì)應(yīng)的分詞相同,且j≤n,k≤m。表2示出了第一節(jié)目屬性值為“變形金剛Ⅰ”的情況下,該屬性值對(duì)應(yīng)的權(quán)重列表,表3示出了第二節(jié)目屬性值為“變形金剛Ⅳ”的情況下,該屬性值對(duì)應(yīng)的權(quán)重列表。根據(jù)上述權(quán)重列表可知,第一特征向量為{5,4,3,2},第二特征向量為{5,4,3,2},且第一特征向量中的第1、2、3個(gè)元素分別與第二特征向量中的第1、2、3個(gè)元素對(duì)應(yīng)的分詞相同,因此,根據(jù)上述計(jì)算公式可得“變形金剛Ⅰ”與“變形金剛Ⅳ”的余弦相似度為:在S305中,將所述余弦相似度輸出為該第二視頻節(jié)目與所述第一視頻節(jié)目之間所述相同節(jié)目屬性的屬性值相似度。作為本發(fā)明的一個(gè)實(shí)施例,上述S201還包括:當(dāng)相同節(jié)目屬性為不可向量化的節(jié)目屬性時(shí),通過預(yù)設(shè)公式計(jì)算該第二視頻節(jié)目與所述第一視頻節(jié)目之間不可向量化的所述相同節(jié)目屬性的屬性值相似度Sy,所述預(yù)設(shè)公式包括:其中,所述a1與所述b1為不可向量化的所述相同節(jié)目屬性分別在所述第一視頻節(jié)目與該第二視頻節(jié)目中的屬性值。在本實(shí)施例中,在上述八個(gè)基本節(jié)目屬性的前提下,僅存在年份屬性為不可向量化的節(jié)目屬性。當(dāng)?shù)谝还?jié)目屬性值與第二節(jié)目屬性值均為年份屬性的屬性值時(shí),第一節(jié)目屬性值與第二節(jié)目屬性值均為具體的年份數(shù)值。作為本發(fā)明的一個(gè)實(shí)施示例,若第一視頻節(jié)目為《變形金剛》,第二視頻節(jié)目為《金剛》,則對(duì)于第一視頻節(jié)目中的年份屬性,其屬性值a1為2007,對(duì)于該第二視頻節(jié)目中的年份屬性,其屬性值b2為2006,因此,兩個(gè)屬性值之間的屬性值相似度Syear為:在S202中,將計(jì)算得到的各個(gè)所述節(jié)目屬性對(duì)應(yīng)的所述屬性值相似度進(jìn)行加權(quán)處理,得到該第二視頻節(jié)目與所述第一視頻節(jié)目的相似度。由于第一視頻節(jié)目包含有八個(gè)第一節(jié)目屬性值,因此,得到每個(gè)第一節(jié)目屬性值與第二視頻節(jié)目中對(duì)應(yīng)的第二節(jié)目屬性值之間的屬性值相似度后,需要匯總計(jì)算出第一視頻節(jié)目與第二視頻節(jié)目之間的一個(gè)總的相似度。該相似度Stotal根據(jù)如下公式進(jìn)行計(jì)算:Stotal=Wa*SCasts+Wd*Sdirector+Ww*Swriters+Wt*Stitle+Wy*Syear+Wg*Sgenres+Wc*Scontury+Wl*Slanguage其中,SCasts、Sdirector、Swriters、Swriters、Stitle、Syear、Sgenres、Scountry、Slanguage分別表示第一視頻節(jié)目與第二視頻節(jié)目在演員屬性、導(dǎo)演屬性、編劇屬性、片名屬性、年份屬性、類型屬性、國家屬性以及語言屬性中的屬性值相似度,Wa、Wd、Ww、Wt、Wy、Wg、Wc以及W1均為加權(quán)因子,且滿足以下關(guān)系:Wa+Wd+Ww+Wt+Wy+Wg+Wc+Wl=1在S104中,將所述相似度最大的一個(gè)所述第二視頻節(jié)目輸出為推薦節(jié)目。對(duì)于視頻節(jié)目列表中的每一個(gè)第二視頻節(jié)目,均可以根據(jù)上述計(jì)算原理得出其與第一視頻節(jié)目之間的相似度。在所有視頻節(jié)目之中選出相似度最大的一個(gè)第二視頻節(jié)目,將其顯示在用戶的顯示屏中,以作為推薦節(jié)目,推薦至該用戶。本發(fā)明實(shí)施例中,只需根據(jù)視頻節(jié)目中各個(gè)節(jié)目屬性的屬性值,就能計(jì)算出每個(gè)第二視頻節(jié)目與用戶最近一次觀看的視頻節(jié)目之間的相似度,并將相似度最大的第二視頻節(jié)目作為推薦節(jié)目,因此,該推薦節(jié)目能夠最大程度上地符合用戶當(dāng)前的興趣愛好,提高了視頻節(jié)目推薦的準(zhǔn)確性。此外,相對(duì)于CB算法,由于本發(fā)明實(shí)施例提供的視頻節(jié)目推薦方法無須將視頻節(jié)目的內(nèi)容轉(zhuǎn)化為具體的結(jié)構(gòu)化數(shù)據(jù),因此,降低了計(jì)算復(fù)雜度以及計(jì)算誤差出現(xiàn)的可能性,由此提高了節(jié)目的推薦效率,滿足了用戶對(duì)節(jié)目推薦的實(shí)際需求。應(yīng)理解,在本發(fā)明實(shí)施例中,上述各過程的序號(hào)的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對(duì)本發(fā)明實(shí)施例的實(shí)施過程構(gòu)成任何限定。對(duì)應(yīng)于本發(fā)明實(shí)施例所提供的視頻節(jié)目推薦方法,圖6示出了本發(fā)明實(shí)施例提供的視頻節(jié)目推薦裝置的結(jié)構(gòu)框圖,該裝置可以運(yùn)行于具有顯示屏的終端設(shè)備之中,例如手機(jī)、平板、筆記本電腦、電視機(jī)、計(jì)算機(jī),等等。為了便于說明,僅示出了與本實(shí)施例相關(guān)的部分。參照?qǐng)D6,該裝置包括:第一獲取單元61,用于獲取多個(gè)視頻節(jié)目,所述多個(gè)視頻節(jié)目包括第一視頻節(jié)目以及多個(gè)第二視頻節(jié)目,所述第一視頻節(jié)目為用戶最近一次觀看的視頻節(jié)目,所述第二視頻節(jié)目為待推薦節(jié)目。第二獲取單元62,用于獲取每個(gè)所述視頻節(jié)目中各節(jié)目屬性的屬性值。計(jì)算單元63,用于根據(jù)所述屬性值,分別計(jì)算所述第一視頻節(jié)目與每個(gè)所述第二視頻節(jié)目之間的相似度。推薦單元64,用于將所述相似度最大的一個(gè)所述第二視頻節(jié)目輸出為推薦節(jié)目。可選地,所述節(jié)目屬性包括以下至少一項(xiàng):導(dǎo)演屬性、演員屬性、編劇屬性、片名屬性、類型屬性、國家屬性、語言屬性以及年份屬性??蛇x地,所述計(jì)算單元63包括:計(jì)算子單元,用于對(duì)于任意一個(gè)所述第二視頻節(jié)目,根據(jù)所述屬性值,計(jì)算該第二視頻節(jié)目與所述第一視頻節(jié)目之間相同所述節(jié)目屬性的屬性值相似度。加權(quán)子單元,用于將計(jì)算得到的各個(gè)所述節(jié)目屬性對(duì)應(yīng)的所述屬性值相似度進(jìn)行加權(quán)處理,得到該第二視頻節(jié)目與所述第一視頻節(jié)目的相似度??蛇x地,所述計(jì)算子單元具體用于:當(dāng)相同節(jié)目屬性為可向量化的節(jié)目屬性時(shí),對(duì)所述相同節(jié)目屬性分別在所述第一視頻節(jié)目與該第二視頻節(jié)目中的所述屬性值進(jìn)行分詞處理,以得到每個(gè)所述屬性值對(duì)應(yīng)的多個(gè)分詞;在一個(gè)所述屬性值對(duì)應(yīng)的多個(gè)分詞中,對(duì)每個(gè)所述分詞進(jìn)行排序,并為每個(gè)所述分詞分配權(quán)重,以使排序在前的分詞的權(quán)重大于或等于排序在后的分詞的權(quán)重;在每一個(gè)所述屬性值中,根據(jù)各個(gè)所述分詞的所述權(quán)重,生成該屬性值對(duì)應(yīng)的一個(gè)特征向量;計(jì)算第一特征向量與第二特征向量之間的余弦相似度,所述第一特征向量與所述第二特征向量為所述相同節(jié)目屬性在所述第一視頻節(jié)目與該第二視頻節(jié)目中的所述屬性值所分別對(duì)應(yīng)的所述特征向量;將所述余弦相似度輸出為該第二視頻節(jié)目與所述第一視頻節(jié)目之間所述相同節(jié)目屬性的屬性值相似度??蛇x地,所述計(jì)算子單元還用于:對(duì)于所述相同節(jié)目屬性分別在所述第一視頻節(jié)目與該第二視頻節(jié)目中的每個(gè)所述屬性值,當(dāng)該屬性值中包含有標(biāo)點(diǎn)符號(hào)時(shí),以所述標(biāo)點(diǎn)符號(hào)為分詞拆分點(diǎn),對(duì)該屬性值進(jìn)行分詞,以得到該屬性值對(duì)應(yīng)的多個(gè)分詞;當(dāng)該屬性值中未包含有任何標(biāo)點(diǎn)符號(hào)時(shí),獲取預(yù)設(shè)的標(biāo)準(zhǔn)詞庫中的各個(gè)詞語;判斷該屬性值是否包含所述標(biāo)準(zhǔn)詞庫中的至少一個(gè)所述詞語;若該屬性值包含所述標(biāo)準(zhǔn)詞庫中的至少一個(gè)所述詞語,則將其包含的每個(gè)詞語作為該屬性值對(duì)應(yīng)的多個(gè)分詞。可選地,所述計(jì)算子單元還用于:在一個(gè)所述屬性值對(duì)應(yīng)的多個(gè)分詞中,依照每個(gè)所述分詞在該屬性值中出現(xiàn)的先后次序,對(duì)各個(gè)分詞進(jìn)行排序,以得到分詞序列;在所述分詞序列中,若存在包含有至少兩個(gè)相同起始字符的兩個(gè)分詞,則將其中字符長度較大的分詞排在字符長度較小的分詞前面;依照所述分詞的排序順序,為每個(gè)所述分詞分配權(quán)重,以使排序在前的分詞的權(quán)重大于或等于排序在后的分詞的權(quán)重;生成權(quán)重列表,所述權(quán)重列表包含每個(gè)所述分詞對(duì)應(yīng)的所述權(quán)重??蛇x地,所述計(jì)算子單元還用于:在每一個(gè)所述屬性值中,根據(jù)各個(gè)所述分詞的所述權(quán)重,生成該屬性值對(duì)應(yīng)的一個(gè)特征向量,所述特征向量中的每個(gè)元素值依次為所述權(quán)重列表中每個(gè)所述分詞對(duì)應(yīng)的所述權(quán)重。可選地,所述計(jì)算子單元具體用于:當(dāng)相同節(jié)目屬性為不可向量化的節(jié)目屬性時(shí),通過預(yù)設(shè)公式計(jì)算該第二視頻節(jié)目與所述第一視頻節(jié)目之間不可向量化的所述相同節(jié)目屬性的屬性值相似度Sy,所述預(yù)設(shè)公式包括:其中,所述a1與所述b1為不可向量化的所述相同節(jié)目屬性分別在所述第一視頻節(jié)目與該第二視頻節(jié)目中的屬性值。本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲(chǔ)器(RAM,RandomAccessMemory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本
技術(shù)領(lǐng)域:
的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。當(dāng)前第1頁1 2 3