午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種信息處理方法及服務(wù)器的制造方法

文檔序號(hào):10534967閱讀:283來源:國知局
一種信息處理方法及服務(wù)器的制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種信息處理方法及服務(wù)器。所述方法包括:獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù)中的多個(gè)屬性參數(shù);將所述多個(gè)音頻數(shù)據(jù)按照所述多個(gè)屬性參數(shù)映射到預(yù)先設(shè)置的多維坐標(biāo)系中,獲得所述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所述坐標(biāo)系的維度與所述屬性參數(shù)的類型數(shù)量相匹配;基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù);所述第一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù);基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù)。
【專利說明】
一種信息處理方法及服務(wù)器
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及信息處理技術(shù),具體涉及一種信息處理方法及服務(wù)器。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,用戶可以通過互聯(lián)網(wǎng)操作各種事務(wù),例如聽音樂。用戶通 常會(huì)依據(jù)主觀喜好對(duì)歌曲進(jìn)行主動(dòng)操作,例如收藏操作、下載操作或者創(chuàng)建歌單操作等等。 但這些操作并不一定能夠真實(shí)反映用戶的喜好,一方面是由于用戶的喜好會(huì)隨著時(shí)間的推 移可能產(chǎn)生變化,另一方面用戶的操作可能是一些誤操作。上述這種操作獲得的數(shù)據(jù)可以 稱為異常數(shù)據(jù)或噪聲數(shù)據(jù)。
[0003] 在用戶畫像數(shù)據(jù)或個(gè)性化推薦數(shù)據(jù)的處理過程中,需要對(duì)待處理的數(shù)據(jù)進(jìn)行鑒別 篩選,剔除噪聲數(shù)據(jù)?,F(xiàn)有技術(shù)中,通常采用基于人工經(jīng)驗(yàn)的策略規(guī)則對(duì)噪聲數(shù)據(jù)進(jìn)行判 定。這種方式通常邏輯簡單,不僅難以挖掘出更深層的特點(diǎn),另外也難以適用于所有人群, 導(dǎo)致噪聲數(shù)據(jù)的判定準(zhǔn)確率不高,從而使得用戶畫像數(shù)據(jù)或個(gè)性化推薦數(shù)據(jù)的不準(zhǔn)確,影 響用戶的體驗(yàn)。

【發(fā)明內(nèi)容】

[0004] 為解決現(xiàn)有存在的技術(shù)問題,本發(fā)明實(shí)施例提供一種信息處理方法及服務(wù)器,能 夠提高噪聲數(shù)據(jù)的鑒別準(zhǔn)確率。
[0005] 為達(dá)到上述目的,本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0006] 本發(fā)明實(shí)施例提供了一種信息處理方法,所述方法包括:
[0007] 獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù)中的多個(gè)屬性參數(shù);
[0008] 將所述多個(gè)音頻數(shù)據(jù)按照所述多個(gè)屬性參數(shù)映射到預(yù)先設(shè)置的多維坐標(biāo)系中,獲 得所述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所述坐標(biāo)系的維度與所述屬性參數(shù)的類型數(shù)量 相匹配;
[0009] 基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù);所 述第一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù);
[0010] 基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù)。
[0011]上述方案中,所述基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù)的 局部密度參數(shù),包括:
[0012] 基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照局部密度因子(L0F)算法計(jì)算第一音頻數(shù)據(jù)的局 部密度參數(shù)。
[0013] 上述方案中,所述基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照L0F算法計(jì)算第一音頻數(shù)據(jù)的 局部密度參數(shù),包括:
[0014] 獲得與所述第一音頻數(shù)據(jù)對(duì)應(yīng)的第一坐標(biāo)點(diǎn)a的歐式距離最近的k個(gè)坐標(biāo)點(diǎn),生成 第一集合,所述第一集合記為Nk(a);
[0015] 計(jì)算所述第一坐標(biāo)點(diǎn)a與所述第一集合中每個(gè)坐標(biāo)點(diǎn)的之間的可達(dá)距離;所述可 達(dá)距離滿足以下表達(dá)式:
[0016] reachability_distance_k(a,b)=max{k_distance(b),d(a,b)};
[0017] 其中,reachability_distance_k(a,b)表示第一坐標(biāo)點(diǎn)a與第二坐標(biāo)點(diǎn)b之間的可 達(dá)距離;k_distanCe(b)表示所述第二坐標(biāo)點(diǎn)b與第二集合中與所述第二坐標(biāo)點(diǎn)b的歐式距 離最遠(yuǎn)的第三坐標(biāo)點(diǎn)之間的歐式距離;其中,所述第二集合為與所述第二坐標(biāo)點(diǎn)b的歐式距 離最近的kl個(gè)坐標(biāo)點(diǎn)生成的集合;當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b滿足第一條件 時(shí),reachability_distance_k(a,b)等于k_distance(b);當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二 坐標(biāo)點(diǎn)b不滿足第一條件時(shí),reachability_distance_k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述 第二坐標(biāo)點(diǎn)b之間的歐式距離;
[0018] 計(jì)算所述第一坐標(biāo)點(diǎn)的第一局部密度:所述局部密度滿足以下表達(dá)式:
[0020]計(jì)算每個(gè)坐標(biāo)點(diǎn)的局部密度,獲得所述第一集合中的k個(gè)坐標(biāo)點(diǎn)的平均局部密度 和所述第一局部密度的比值;所述比值滿足以下表達(dá)式:
[0022] 上述方案中,所述滿足第一條件,包括:所述第一坐標(biāo)點(diǎn)a屬于所述第二坐標(biāo)點(diǎn)b對(duì) 應(yīng)的第二集合;
[0023] 所述不滿足第一條件,包括:所述第一坐標(biāo)點(diǎn)a不屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第 二集合。
[0024] 上述方案中,所述基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù),包括:
[0025] 當(dāng)所述比值大于預(yù)設(shè)閾值時(shí),確定所述第一音頻數(shù)據(jù)為噪聲數(shù)據(jù);其中,所述預(yù)設(shè) 閾值大于等于1。
[0026] 本發(fā)明實(shí)施例還提供了一種服務(wù)器,所述服務(wù)器包括:數(shù)據(jù)獲取單元、映射單元、 計(jì)算單元和判定單元;其中,
[0027] 所述數(shù)據(jù)獲取單元,用于獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù)中 的多個(gè)屬性參數(shù);
[0028] 所述映射單元,用于將所述數(shù)據(jù)獲取單元獲得的多個(gè)音頻數(shù)據(jù)按照所述多個(gè)屬性 參數(shù)映射到預(yù)先設(shè)置的多維坐標(biāo)系中,獲得所述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所述坐 標(biāo)系的維度與所述屬性參數(shù)的類型數(shù)量相匹配;
[0029] 所述計(jì)算單元,用于基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù) 的局部密度參數(shù);所述第一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù);
[0030] 所述判定單元,用于基于所述計(jì)算單元獲得的計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是 否是噪聲數(shù)據(jù)。
[0031] 上述方案中,所述計(jì)算單元,用于基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照局部密度因子 (L0F)算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù)。
[0032] 上述方案中,所述計(jì)算單元,用于獲得與所述第一音頻數(shù)據(jù)對(duì)應(yīng)的第一坐標(biāo)點(diǎn)a的 歐式距離最近的k個(gè)坐標(biāo)點(diǎn),生成第一集合,所述第一集合記為Nk(a);
[0033]計(jì)算所述第一坐標(biāo)點(diǎn)a與所述第一集合中每個(gè)坐標(biāo)點(diǎn)的之間的可達(dá)距離;所述可 達(dá)距離滿足以下表達(dá)式:
[0034] reachability_distance_k(a,b)=max{k_distance(b),d(a,b)};
[0035] 其中,reachability_distance_k(a,b)表示第一坐標(biāo)點(diǎn)a與第二坐標(biāo)點(diǎn)b之間的可 達(dá)距離;k_distan Ce(b)表示所述第二坐標(biāo)點(diǎn)b與第二集合中與所述第二坐標(biāo)點(diǎn)b的歐式距 離最遠(yuǎn)的第三坐標(biāo)點(diǎn)之間的歐式距離;其中,所述第二集合為與所述第二坐標(biāo)點(diǎn)b的歐式距 離最近的kl個(gè)坐標(biāo)點(diǎn)生成的集合;當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b滿足第一條件 時(shí),reachability_distance_k(a,b)等于k_distance(b);當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二 坐標(biāo)點(diǎn)b不滿足第一條件時(shí),reachability_distance_k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述 第二坐標(biāo)點(diǎn)b之間的歐式距離;
[0036] 計(jì)算所述第一坐標(biāo)點(diǎn)的第一局部密度;所述局部密度滿足以下表達(dá)式:
[0038]計(jì)算每個(gè)坐標(biāo)點(diǎn)的局部密度,獲得所述第一集合中的k個(gè)坐標(biāo)點(diǎn)的平均局部密度 和所述第一局部密度的比值;所述比值滿足以下表達(dá)式:
[0040] 上述方案中,所述滿足第一條件,包括:所述第一坐標(biāo)點(diǎn)a屬于所述第二坐標(biāo)點(diǎn)b對(duì) 應(yīng)的第二集合;
[0041] 所述不滿足第一條件,包括:所述第一坐標(biāo)點(diǎn)a不屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第 二集合。
[0042]上述方案中,所述判定單元,用于當(dāng)所述比值大于預(yù)設(shè)閾值時(shí),確定所述第一音頻 數(shù)據(jù)為噪聲數(shù)據(jù);其中,所述預(yù)設(shè)閾值大于等于1。
[0043]本發(fā)明實(shí)施例提供的信息處理方法及服務(wù)器,所述方法包括:獲得與用戶對(duì)應(yīng)的 多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù)中的多個(gè)屬性參數(shù);將所述多個(gè)音頻數(shù)據(jù)按照所述多個(gè) 屬性參數(shù)映射到預(yù)先設(shè)置的多維坐標(biāo)系中,獲得所述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所 述坐標(biāo)系的維度與所述屬性參數(shù)的類型數(shù)量相匹配;基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè) 算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù);所述第一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一 音頻數(shù)據(jù);基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù)。如此,采用本發(fā)明實(shí)施例 的技術(shù)方案,無需依賴人為的設(shè)定,僅依據(jù)音頻數(shù)據(jù)自身的屬性信息(例如歌手、語言、年 代、流派等)將音頻數(shù)據(jù)映射為多維坐標(biāo)系中的離散坐標(biāo)點(diǎn),計(jì)算坐標(biāo)點(diǎn)的局部密度參數(shù), 基于計(jì)算結(jié)果判定所述音頻數(shù)據(jù)是否為噪聲數(shù)據(jù),大大提高了噪聲數(shù)據(jù)的鑒別準(zhǔn)確率,為 后續(xù)的例如用戶畫像數(shù)據(jù)的確定或者個(gè)性化推薦數(shù)據(jù)的確定提供了可靠的數(shù)據(jù)來源。
【附圖說明】
[0044]圖la至圖lc為本發(fā)明實(shí)施例的信息處理方法的應(yīng)用場景示意圖;
[0045] 圖2為本發(fā)明實(shí)施例的信息處理方法的流程示意圖;
[0046] 圖3為本發(fā)明實(shí)施例中的坐標(biāo)系的映射示意圖;
[0047] 圖4為本發(fā)明實(shí)施例中基于L0F算法確定的局部密度的示意圖;
[0048]圖5a為采用本發(fā)明實(shí)施例的信息處理方案之前的效果示意圖;
[0049]圖5b為采用本發(fā)明實(shí)施例的信息處理方案之后的效果示意圖;
[0050]圖6為本發(fā)明實(shí)施例的服務(wù)器的組成結(jié)構(gòu)示意圖;
[0051 ]圖7為本發(fā)明實(shí)施例的服務(wù)器的硬件構(gòu)成示意圖。
【具體實(shí)施方式】
[0052]下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0053]本發(fā)明實(shí)施例中,采用本發(fā)明實(shí)施例的信息處理方法進(jìn)行處理的音頻數(shù)據(jù)在終端 側(cè)可通過歌曲的形式呈現(xiàn),所述歌曲可通過終端的播放應(yīng)用輸出播放,也可以通過網(wǎng)頁輸 出播放;所述歌曲不限于是終端中存儲(chǔ)的(已下載)的歌曲,也可以是在線播放的歌曲。在服 務(wù)器側(cè),進(jìn)行處理的音頻數(shù)據(jù)即對(duì)應(yīng)于終端側(cè)播放的歌曲。
[0054] 隨著網(wǎng)絡(luò)業(yè)務(wù)個(gè)性化的發(fā)展,通常會(huì)基于用戶的操作確定該用戶的喜好,以及針 對(duì)不同用戶的喜好為用戶推薦不同的內(nèi)容,即確定用戶畫像數(shù)據(jù)以及針對(duì)不同用戶的個(gè)性 化推薦。圖la至圖lc為本發(fā)明實(shí)施例的信息處理方法的應(yīng)用場景示意圖;以歌曲通過終端 的播放應(yīng)用進(jìn)行播放為例,服務(wù)器會(huì)根據(jù)用戶的歌曲播放習(xí)慣,確定該用戶的喜好,例如喜 歡的歌手、喜歡的歌曲流派、喜歡的歌曲語言、喜歡的歌曲的年代等信息;進(jìn)一步將上述篩 選的信息推送至播放應(yīng)用的頁面上顯示,如圖la至圖lc所示。
[0055] 通常情況下,服務(wù)器是根據(jù)終端反饋的表征用戶操作的數(shù)據(jù)確定該用戶的喜好, 所述用戶操作例如下載操作、收藏操作、創(chuàng)建歌單操作、播放操作等等。進(jìn)一步地基于獲得 的操作數(shù)據(jù)采用基于人工經(jīng)驗(yàn)的策略規(guī)則對(duì)噪音數(shù)據(jù)進(jìn)行判定的數(shù)據(jù)確定方式,例如,當(dāng) 一首歌曲在一年前被點(diǎn)擊,并且用戶近期沒有再聽過這首歌或這個(gè)歌手的歌曲,則可以判 定該歌曲已經(jīng)不是用戶感興趣的歌曲,應(yīng)該被判定為噪聲數(shù)據(jù)。
[0056] 上述基于人工經(jīng)驗(yàn)的策略規(guī)則完全依賴于人為設(shè)定,且規(guī)則過于簡單,很容易導(dǎo) 致噪聲數(shù)據(jù)的判定錯(cuò)誤。例如,終端中對(duì)應(yīng)收藏了三百首歌曲,其中大部分為中文歌曲,幾 首的英文歌曲;且這幾首英文歌曲最近也沒有播放過;可能是用戶之前喜歡聽英文歌曲,現(xiàn) 在喜歡聽中文歌曲,只是最近沒有播放過英文歌曲。在這種場景下,如果把這幾首英文歌曲 判定為噪聲數(shù)據(jù)是不準(zhǔn)確的。
[0057] 基于上述策略規(guī)則的缺點(diǎn),本發(fā)明實(shí)施例的信息處理方案,結(jié)合數(shù)據(jù)挖掘技術(shù),依 據(jù)音頻數(shù)據(jù)的屬性信息(例如歌手、語言、年代、流派等)將音頻數(shù)據(jù)映射為多維坐標(biāo)系中的 離散坐標(biāo)點(diǎn)。由于每個(gè)用戶的聽歌習(xí)慣會(huì)集中在一定的范圍內(nèi),則噪聲數(shù)據(jù)表現(xiàn)為所述多 維坐標(biāo)系中的孤立坐標(biāo)點(diǎn)。
[0058]下面對(duì)本發(fā)明實(shí)施例的信息處理方法進(jìn)行詳細(xì)的描述。
[0059] 實(shí)施例一
[0060]本發(fā)明實(shí)施例提供了一種信息處理方法。圖2為本發(fā)明實(shí)施例的信息處理方法的 流程示意圖;如圖2所示,所述信息處理方法包括:
[0061]步驟101:獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù)中的多個(gè)屬性參 數(shù)。
[0062] 步驟102:將所述多個(gè)音頻數(shù)據(jù)按照所述多個(gè)屬性參數(shù)映射到預(yù)先設(shè)置的多維坐 標(biāo)系中,獲得所述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所述坐標(biāo)系的維度與所述屬性參數(shù)的 類型數(shù)量相匹配。
[0063] 步驟103:基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù)的局部密 度參數(shù);所述第一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù)。
[0064] 步驟104:基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù)。
[0065] 本實(shí)施例中,所述信息處理方法應(yīng)用于服務(wù)器或服務(wù)器集群中。所述服務(wù)器或服 務(wù)器集群可以為播放應(yīng)用對(duì)應(yīng)的服務(wù)器或服務(wù)器集群,也可以為網(wǎng)頁對(duì)應(yīng)的服務(wù)器或服務(wù) 器集群??梢岳斫鉃?,當(dāng)終端側(cè)通過播放應(yīng)用播放歌曲時(shí),所述信息處理方法應(yīng)用于所述播 放應(yīng)用對(duì)應(yīng)的服務(wù)器或服務(wù)器集群。當(dāng)終端側(cè)通過網(wǎng)頁播放歌曲時(shí),所述信息處理方法應(yīng) 用于網(wǎng)頁對(duì)應(yīng)的服務(wù)器或服務(wù)器集群。
[0066] 步驟101中,所述獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),為:獲得與用戶標(biāo)識(shí)(例如用戶 名、IP地址)對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù)。具體的,所述用戶標(biāo)識(shí)可以為用戶在完成注冊(cè)或登錄時(shí) 輸入的用戶名,也可以為用戶進(jìn)行音樂播放時(shí)所持有的終端的IP地址。進(jìn)一步地,服務(wù)器中 會(huì)記錄與所述用戶標(biāo)識(shí)相關(guān)聯(lián)的基于用戶操作的各種信息,包括音頻數(shù)據(jù),例如播放某一 個(gè)音頻、下載某一個(gè)音頻、收藏某一個(gè)音頻等等?;诖耍雠c用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù), 可以是用戶操作過的所有音頻數(shù)據(jù),包括以下音頻數(shù)據(jù)的至少之一:用戶通過下載操作下 載到本地的音頻數(shù)據(jù)、用戶通過播放操作在線播放的音頻數(shù)據(jù)、用戶通過收藏操作收藏的 音頻數(shù)據(jù)等等。其中,服務(wù)器獲得的音頻數(shù)據(jù)可以為音頻文件數(shù)據(jù);可以理解為,所述音頻 文件數(shù)據(jù)是可以通過播放工具直接播放輸出的數(shù)據(jù);所述音頻文件數(shù)據(jù)中包括音頻的相關(guān) 信息。另外,服務(wù)器獲得的音頻數(shù)據(jù)還可以直接為音頻的相關(guān)信息。其中,所述音頻的相關(guān) 信息例如音頻的標(biāo)識(shí)(例如名稱)、摘要信息等等;所述摘要信息中可包括歌手、語言、年代、 地區(qū)等信息。進(jìn)一步的,服務(wù)器識(shí)別所述音頻數(shù)據(jù)中的摘要信息中的每一個(gè)信息作為一類 屬性參數(shù),例如,識(shí)別音頻數(shù)據(jù)中的歌手信息作為第一類屬性參數(shù);識(shí)別音頻數(shù)據(jù)中的語言 信息作為第二類屬性參數(shù),以此類推。當(dāng)然,本發(fā)明實(shí)施例中不限于上述類型的屬性信息。
[0067] 步驟102中,依據(jù)屬性參數(shù)的類型設(shè)置多維坐標(biāo)系,例如,以屬性信息包括:歌手、 語言、年代和地區(qū)為例,屬性信息的類型數(shù)量為四,相應(yīng)的,設(shè)置四維坐標(biāo)系,所述四維坐標(biāo) 系中的每個(gè)坐標(biāo)軸表示一類屬性參數(shù)。圖3為本發(fā)明實(shí)施例中的坐標(biāo)系的映射示意圖;圖3 所示的坐標(biāo)系僅以二維進(jìn)行示例,例如x軸表示歌手,y軸表示年代;將每一個(gè)歌手分別與x 軸上的數(shù)值對(duì)應(yīng),相應(yīng)的,將不同的年代分別與y軸上的數(shù)值對(duì)應(yīng)。依據(jù)每一個(gè)音頻數(shù)據(jù)的 年代與歌手分別將音頻數(shù)據(jù)對(duì)應(yīng)坐標(biāo)系中的不同的坐標(biāo)點(diǎn),如圖3所示,從中我們可以初步 的看出,箭頭指向的兩個(gè)坐標(biāo)點(diǎn)相對(duì)于其他坐標(biāo)點(diǎn)來說相對(duì)孤立。當(dāng)然,當(dāng)屬性參數(shù)的類型 數(shù)量大于上述兩類時(shí),與上述方式同理,建立多維坐標(biāo)系,將每個(gè)音頻數(shù)據(jù)映射到所述多維 坐標(biāo)系中,獲得每個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn)。
[0068] 步驟103中,所述基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù)的 局部密度參數(shù),包括:
[0069] 基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照局部密度因子(L0F,Local Outlier Factor)算 法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù)。
[0070] 具體的,本實(shí)施例中,所述按照L0F算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù)包括以 下幾個(gè)步驟:
[0071] 獲得與所述第一音頻數(shù)據(jù)對(duì)應(yīng)的第一坐標(biāo)點(diǎn)的歐式距離最近的k個(gè)坐標(biāo)點(diǎn),生成 第一集合,所述第一集合記為Nk(a);
[0072]計(jì)算所述第一坐標(biāo)點(diǎn)a與所述第一集合中每個(gè)坐標(biāo)點(diǎn)的之間的可達(dá)距離;所述可 達(dá)距離滿足公式(1):
[0073] reachability_distance_k(a,b)=max{k_distance(b),d(a,b)} (1)
[0074] 其中,reachability_distance_k(a,b)表示第一坐標(biāo)點(diǎn)a與第二坐標(biāo)點(diǎn)b之間的可 達(dá)距離;k_distan Ce(b)表示所述第二坐標(biāo)點(diǎn)b與第二集合中與所述第二坐標(biāo)點(diǎn)b的歐式距 離最遠(yuǎn)的第三坐標(biāo)點(diǎn)之間的歐式距離;所述第三坐標(biāo)點(diǎn)在本示意中可記為第三坐標(biāo)點(diǎn)k;其 中,所述第二集合為與所述第二坐標(biāo)點(diǎn)b的歐式距離最近的kl個(gè)坐標(biāo)點(diǎn)生成的集合;當(dāng)所述 第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b滿足第一條件時(shí),reachability_distance_k(a,b)等于k_ distance(b);當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b不滿足第一條件時(shí),reachability# distance_k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的歐式距離;
[0075] 計(jì)算所述第一坐標(biāo)點(diǎn)的第一局部密度;所述局部密度滿足公式(2):
⑵:
[0077]計(jì)算每個(gè)坐標(biāo)點(diǎn)的局部密度,獲得所述第一集合中的k個(gè)坐標(biāo)點(diǎn)的平均局部密度 和所述第一局部密度的比值;所述比值滿足公式(3):
(3)
[0079] 其中,Ird(b)表示第二坐標(biāo)點(diǎn)b的局部密度,可記為第二局部密度。
[0080] 具體的,對(duì)于與用戶相關(guān)聯(lián)的所有的音頻數(shù)據(jù)所對(duì)應(yīng)的坐標(biāo)點(diǎn),這里可稱為坐標(biāo) 點(diǎn)集合;首先,確定所述坐標(biāo)點(diǎn)集合中每一個(gè)坐標(biāo)點(diǎn)的所有近鄰結(jié)點(diǎn),這里,以所述坐標(biāo)點(diǎn) 集合中的第一坐標(biāo)點(diǎn)a的近鄰結(jié)點(diǎn)為例,若確定所述坐標(biāo)點(diǎn)集合中的第一坐標(biāo)點(diǎn)a的近鄰結(jié) 點(diǎn)有k個(gè),則將所述k鄰結(jié)點(diǎn)(即k個(gè)坐標(biāo)點(diǎn))記為第一集合,所述第一集合記為N k(a)。其中, 所述k鄰結(jié)點(diǎn)表示與與所述第一坐標(biāo)點(diǎn)a的歐式距離最近的k個(gè)坐標(biāo)點(diǎn)。本實(shí)施例中,歐式距 離的計(jì)算方式可參照現(xiàn)有技術(shù)所述,本實(shí)施例中不做詳細(xì)描述。
[00811第二,確定兩個(gè)坐標(biāo)點(diǎn)的可達(dá)距離滿足公式(1)所示,這里,兩個(gè)坐標(biāo)點(diǎn)的可達(dá)距 離并不一定是兩個(gè)坐標(biāo)點(diǎn)的歐式距離。具體的,當(dāng)所述第一坐標(biāo)點(diǎn)a屬于所述第二坐標(biāo)點(diǎn)b 對(duì)應(yīng)的第二集合時(shí),reachability_distance_k(a,b)等于k_distance(b);當(dāng)所述第一坐標(biāo) 點(diǎn)a不屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集合時(shí),reachability_distance_k(a,b)等于所述 第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的歐式距離;其中,所述第二集合為與所述第二坐標(biāo) 點(diǎn)b的歐式距離最近的kl個(gè)坐標(biāo)點(diǎn)生成的集合。也就是說,當(dāng)所述第一坐標(biāo)點(diǎn)a屬于第二坐 標(biāo)點(diǎn)b的鄰結(jié)點(diǎn)集合時(shí),所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的可達(dá)距離等于所述第 二坐標(biāo)點(diǎn)b與其最近的鄰結(jié)點(diǎn)之間的歐式距離。當(dāng)所述第一坐標(biāo)點(diǎn)a不屬于第二坐標(biāo)點(diǎn)b的 鄰結(jié)點(diǎn)集合時(shí),所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的可達(dá)距離等于所述第一坐標(biāo)點(diǎn) a與所述第二坐標(biāo)點(diǎn)b之間的歐式距離。這樣使后續(xù)的局部密度的計(jì)算的穩(wěn)定性更佳。
[0082] 第三,基于上述兩個(gè)步驟進(jìn)行局部密度的獲得。以計(jì)算第一坐標(biāo)點(diǎn)a的第一局部密 度Ird(a)為例,所述第一局部密度Ird(a)滿足公式(2)所示,其中,b表示第二坐標(biāo)點(diǎn),并且b GN k(a),表示所述第二坐標(biāo)點(diǎn)b屬于第一集合Nk(a),即所述第二坐標(biāo)點(diǎn)b為與所述第一坐標(biāo) 點(diǎn)a的歐式距離最近的k個(gè)坐標(biāo)點(diǎn)的其中之一。由公式(2)可以看出,所述第一坐標(biāo)點(diǎn)a的第 一局部密度滿足所述第一坐標(biāo)點(diǎn)a與其所述第一集合N k(a)中的所有坐標(biāo)點(diǎn)的平均可達(dá)距 離的倒數(shù)?;谏鲜龇绞将@得每個(gè)坐標(biāo)點(diǎn)的局部密度。
[0083] 最后,比較所述第一集合中的所有坐標(biāo)點(diǎn)的平均局部密度和所述第一坐標(biāo)點(diǎn)a的 第一局部密度的比值;所述比值滿足公式(3)所示,本發(fā)明實(shí)施例中通過獲得的比值大小確 定所述第一坐標(biāo)點(diǎn)對(duì)應(yīng)的第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù)。
[0084] 步驟104中,所述基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù),包括:當(dāng) 所述比值大于預(yù)設(shè)閾值時(shí),確定所述第一音頻數(shù)據(jù)為噪聲數(shù)據(jù);其中,所述預(yù)設(shè)閾值大于等 于1。
[0085] 具體的,當(dāng)計(jì)算結(jié)果(即獲得的比值)小于等于1時(shí),表明所述第一坐標(biāo)點(diǎn)a被所述 第一集合中的坐標(biāo)點(diǎn)包圍,即所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn)之間相對(duì)位置 較緊密。當(dāng)計(jì)算結(jié)果(即獲得的比值)大于1時(shí),表明所述第一坐標(biāo)點(diǎn)a在所述第一集合外部; 比值越接近1,所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn)之間的相對(duì)位置相對(duì)緊密;比 值越遠(yuǎn)離1,表明所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn)之間的相對(duì)位置越疏遠(yuǎn),可 以確定所述第一坐標(biāo)點(diǎn)a為噪聲數(shù)據(jù)的可能性越高。圖4為本發(fā)明實(shí)施例中基于L0F算法確 定的局部密度的示意圖;如圖4所示,用環(huán)形圈出的坐標(biāo)點(diǎn)均為獲得的比值大于1對(duì)應(yīng)的坐 標(biāo)點(diǎn)。基于此,在本實(shí)施例中,可基于需求配置一預(yù)設(shè)閾值,所述預(yù)設(shè)閾值大于等于1;所述 預(yù)設(shè)閾值越大,噪聲數(shù)據(jù)的判定準(zhǔn)確率越高。所述預(yù)設(shè)閾值例如3,則當(dāng)獲得的比值大于3 時(shí),可確定比值對(duì)應(yīng)的坐標(biāo)點(diǎn)相對(duì)應(yīng)的音頻數(shù)據(jù)為噪聲數(shù)據(jù)。
[0086] 采用本發(fā)明實(shí)施例的技術(shù)方案,無需依賴人為的設(shè)定,僅依據(jù)音頻數(shù)據(jù)自身的屬 性信息(例如歌手、語言、年代、流派等)將音頻數(shù)據(jù)映射為多維坐標(biāo)系中的離散坐標(biāo)點(diǎn),計(jì) 算坐標(biāo)點(diǎn)的局部密度參數(shù),基于計(jì)算結(jié)果判定所述音頻數(shù)據(jù)是否為噪聲數(shù)據(jù),大大提高了 噪聲數(shù)據(jù)的鑒別準(zhǔn)確率,為后續(xù)的例如用戶畫像數(shù)據(jù)的確定或者個(gè)性化推薦數(shù)據(jù)的確定提 供了可靠的數(shù)據(jù)來源。
[0087] 實(shí)施例二
[0088] 本實(shí)施例結(jié)合具體的應(yīng)用場景對(duì)本發(fā)明實(shí)施例的信息處理方法進(jìn)行詳細(xì)描述。以 用戶對(duì)應(yīng)的客戶端(所述客戶端例如音樂類應(yīng)用)收藏(或者下載)了三百首歌曲為例,這三 百首歌曲中很有可能是由于用戶的誤操作導(dǎo)致收藏(或下載)的,或者可能存在用戶在很久 之前收藏(或下載)但最近一段時(shí)間內(nèi)未播放過的。
[0089] 第一步,識(shí)別所述三百首歌曲的屬性參數(shù),以識(shí)別出的屬性參數(shù)包括:歌手、語言、 年代、流派四類屬性參數(shù)為例,則對(duì)應(yīng)建立四維坐標(biāo)系,所述四維坐標(biāo)系中每個(gè)坐標(biāo)軸分別 對(duì)應(yīng)一類屬性參數(shù);坐標(biāo)軸上的坐標(biāo)值分別對(duì)應(yīng)相應(yīng)屬性參數(shù)對(duì)應(yīng)的值。例如,將每一個(gè)歌 手分別與第一坐標(biāo)軸上的數(shù)值對(duì)應(yīng),將不同的年代分別與第二坐標(biāo)軸上的數(shù)值對(duì)應(yīng)等等, 以此類推。將所述三百首歌曲按照歌手、語言、年代、流派分別映射到所述四維坐標(biāo)系上,獲 得所述三百首歌曲對(duì)應(yīng)在所述四維坐標(biāo)系上的坐標(biāo)點(diǎn),獲得坐標(biāo)點(diǎn)集合。其中,每一個(gè)坐標(biāo) 點(diǎn)可通過特征向量表示,所述特征向量包含四個(gè)特征向量值。
[0090]第二步,對(duì)于所述坐標(biāo)點(diǎn)集合,獲得所述坐標(biāo)點(diǎn)集合中每一個(gè)坐標(biāo)點(diǎn)的所有近鄰 結(jié)點(diǎn),生成第一集合。若第一坐標(biāo)點(diǎn)a的近鄰結(jié)點(diǎn)有k個(gè),則所述第一集合記為Nk(a)。其中, 所述第一坐標(biāo)點(diǎn)a的近鄰結(jié)點(diǎn)表示與所述第一坐標(biāo)點(diǎn)a的歐式距離最近的坐標(biāo)點(diǎn)。
[0091] 第三步,計(jì)算兩個(gè)坐標(biāo)點(diǎn)的可達(dá)距離,所述可達(dá)距離可通過上述公式(1)計(jì)算獲 得。reachability_distance_k(a,b)表示第一坐標(biāo)點(diǎn)a與第二坐標(biāo)點(diǎn)b之間的可達(dá)距離;k_ distanced)表示所述第二坐標(biāo)點(diǎn)b與第二集合中與所述第二坐標(biāo)點(diǎn)b的歐式距離最遠(yuǎn)的第 三坐標(biāo)點(diǎn)之間的歐式距離;所述第三坐標(biāo)點(diǎn)在本示意中可記為第三坐標(biāo)點(diǎn)k;其中,所述第 二集合為與所述第二坐標(biāo)點(diǎn)b的歐式距離最近的kl個(gè)坐標(biāo)點(diǎn)生成的集合。當(dāng)所述第一坐標(biāo) 點(diǎn)a屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集合時(shí),^3(:1^13;[1;^7_(118七31106_1^(3,13)等于1^_ distance(b);當(dāng)所述第一坐標(biāo)點(diǎn)a不屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集合時(shí), reachability_distance_k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的歐式距 離。也就是說,當(dāng)所述第一坐標(biāo)點(diǎn)a屬于第二坐標(biāo)點(diǎn)b的鄰結(jié)點(diǎn)集合時(shí),所述第一坐標(biāo)點(diǎn)a與 所述第二坐標(biāo)點(diǎn)b之間的可達(dá)距離等于所述第二坐標(biāo)點(diǎn)b與其最近的鄰結(jié)點(diǎn)之間的歐式距 離。當(dāng)所述第一坐標(biāo)點(diǎn)a不屬于第二坐標(biāo)點(diǎn)b的鄰結(jié)點(diǎn)集合時(shí),所述第一坐標(biāo)點(diǎn)a與所述第二 坐標(biāo)點(diǎn)b之間的可達(dá)距離等于所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的歐式距離。這樣 使后續(xù)的局部密度的計(jì)算的穩(wěn)定性更佳。
[0092] 第四步,計(jì)算每個(gè)坐標(biāo)點(diǎn)的局部密度。以計(jì)算第一坐標(biāo)點(diǎn)a的第一局部密度為例, 所述第一局部密度可通過公式(2)計(jì)算獲得。
[0093] 第五步,獲得所述第一集合中的k個(gè)坐標(biāo)點(diǎn)的平均局部密度和所述第一局部密度 的比值;所述比值可通過公式(3)獲得。具體的,當(dāng)計(jì)算結(jié)果(即獲得的比值)小于等于1時(shí), 表明所述第一坐標(biāo)點(diǎn)a被所述第一集合中的坐標(biāo)點(diǎn)包圍,即所述第一坐標(biāo)點(diǎn)a與所述第一集 合中的坐標(biāo)點(diǎn)之間相對(duì)位置較緊密。當(dāng)計(jì)算結(jié)果(即獲得的比值)大于1時(shí),表明所述第一坐 標(biāo)點(diǎn)a在所述第一集合外部;比值越接近1,所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn)之 間的相對(duì)位置相對(duì)緊密;比值越遠(yuǎn)離1,表明所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn) 之間的相對(duì)位置越疏遠(yuǎn),可以確定所述第一坐標(biāo)點(diǎn)a為噪聲數(shù)據(jù)的可能性越高。如圖4所示, 用環(huán)形圈出的坐標(biāo)點(diǎn)均為獲得的比值大于1對(duì)應(yīng)的坐標(biāo)點(diǎn)。基于此,在本實(shí)施例中,可基于 需求配置一預(yù)設(shè)閾值,所述預(yù)設(shè)閾值大于等于1;所述預(yù)設(shè)閾值越大,噪聲數(shù)據(jù)的判定準(zhǔn)確 率越高。所述預(yù)設(shè)閾值例如3,則當(dāng)獲得的比值大于3時(shí),可確定比值對(duì)應(yīng)的坐標(biāo)點(diǎn)相對(duì)應(yīng)的 音頻數(shù)據(jù)為噪聲數(shù)據(jù)。
[0094]采用本發(fā)明實(shí)施例的技術(shù)方案,無需依賴人為的設(shè)定,僅依據(jù)音頻數(shù)據(jù)自身的屬 性信息(例如歌手、語言、年代、流派等)將音頻數(shù)據(jù)映射為多維坐標(biāo)系中的離散坐標(biāo)點(diǎn),計(jì) 算坐標(biāo)點(diǎn)的局部密度參數(shù),基于計(jì)算結(jié)果判定所述音頻數(shù)據(jù)是否為噪聲數(shù)據(jù),大大提高了 噪聲數(shù)據(jù)的鑒別準(zhǔn)確率,為后續(xù)的例如用戶畫像數(shù)據(jù)的確定或者個(gè)性化推薦數(shù)據(jù)的確定提 供了可靠的數(shù)據(jù)來源。
[0095] 通過上述信息處理方法的描述,本發(fā)明實(shí)施例的技術(shù)方案可應(yīng)用于如下場景:
[0096]場景一,對(duì)于某些應(yīng)用,本場景中以音樂類應(yīng)用為例,在用戶使用音樂類應(yīng)用時(shí), 通常會(huì)依據(jù)用戶的喜好為用戶推薦用戶可能喜歡的歌曲(即個(gè)性化推薦)。如果采用現(xiàn)有技 術(shù)中的噪聲數(shù)據(jù)的鑒別方式,很可能會(huì)導(dǎo)致鑒別不準(zhǔn)確,則可能會(huì)導(dǎo)致給用戶推薦的歌曲 很可能時(shí)用戶不喜歡的。圖5a為采用本發(fā)明實(shí)施例的信息處理方案之前的效果示意圖;當(dāng) 推薦給用戶不喜歡的歌曲時(shí),用戶很可能會(huì)點(diǎn)擊表征切換功能的"換一批"按鍵,以切換下 一首或下一頁為該用戶推薦的歌曲。由此可如圖5a所示,采用現(xiàn)有技術(shù)的處理方案,反饋得 到的"換一批率"始終保持在一個(gè)較高的數(shù)值(大于1.5%)。而采用本發(fā)明實(shí)施例的技術(shù)方 案,剔除真正的噪聲數(shù)據(jù)后,服務(wù)器可確定用戶的真正喜好,從而為用戶推薦的歌曲是用戶 喜歡的概率顯著提高。圖5b為采用本發(fā)明實(shí)施例的信息處理方案之后的效果示意圖;如圖 5b所示,表征負(fù)反饋指標(biāo)的"垃圾桶率"均發(fā)生了下降趨勢(shì)(如箭頭所示是呈下降趨勢(shì))。 [0097]場景二,對(duì)于用戶畫像數(shù)據(jù)的確定,本場景中以音樂類應(yīng)用中的用戶畫像數(shù)據(jù)的 確定為例,在用戶使用音樂類應(yīng)用時(shí),應(yīng)用的個(gè)人展示頁,通常會(huì)展示個(gè)人的喜好,具體可 參照?qǐng)Dla至圖lc所示,例如用戶喜歡的歌手、用戶喜歡的歌曲流派、用戶喜歡的歌曲年代等 等。如果采用現(xiàn)有技術(shù)中的噪聲數(shù)據(jù)的鑒別方式,很可能會(huì)導(dǎo)致展示的信息與用戶的喜好 有較大的區(qū)別,不利于用戶的體驗(yàn)。而采用現(xiàn)有技術(shù)的處理方案,能夠大大提升噪聲數(shù)據(jù)的 鑒別正確率,從而會(huì)使展示的信息與用戶的喜好區(qū)別較小,提升用戶的體驗(yàn)。
[0098] 實(shí)施例三
[0099]本發(fā)明實(shí)施例還提供了一種服務(wù)器。圖6為本發(fā)明實(shí)施例的服務(wù)器的組成結(jié)構(gòu)示 意圖;如圖6所示,所述服務(wù)器包括:數(shù)據(jù)獲取單元21、映射單元22、計(jì)算單元23和判定單元 24;其中,
[0100]所述數(shù)據(jù)獲取單元21,用于獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù) 中的多個(gè)屬性參數(shù);
[0101] 所述映射單元22,用于將所述數(shù)據(jù)獲取單元21獲得的多個(gè)音頻數(shù)據(jù)按照所述多個(gè) 屬性參數(shù)映射到預(yù)先設(shè)置的多維坐標(biāo)系中,獲得所述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所 述坐標(biāo)系的維度與所述屬性參數(shù)的類型數(shù)量相匹配;
[0102] 所述計(jì)算單元23,用于基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù) 據(jù)的局部密度參數(shù);所述第一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù);
[0103] 所述判定單元24,用于基于所述計(jì)算單元23獲得的計(jì)算結(jié)果確定所述第一音頻數(shù) 據(jù)是否是噪聲數(shù)據(jù)。
[0104] 本實(shí)施例中,所述服務(wù)器或服務(wù)器集群可以為播放應(yīng)用對(duì)應(yīng)的服務(wù)器或服務(wù)器集 群,也可以為網(wǎng)頁對(duì)應(yīng)的服務(wù)器或服務(wù)器集群。可以理解為,當(dāng)終端側(cè)通過播放應(yīng)用播放歌 曲時(shí),所述信息處理方法應(yīng)用于所述播放應(yīng)用對(duì)應(yīng)的服務(wù)器或服務(wù)器集群。當(dāng)終端側(cè)通過 網(wǎng)頁播放歌曲時(shí),所述信息處理方法應(yīng)用于網(wǎng)頁對(duì)應(yīng)的服務(wù)器或服務(wù)器集群。
[0105] 本實(shí)施例中,所述音頻數(shù)據(jù)的屬性參數(shù)例如歌手信息、語言信息、年代信息、地區(qū) 信息等等。所述映射單元22預(yù)先依據(jù)屬性參數(shù)的類型設(shè)置多維坐標(biāo)系,所述多維坐標(biāo)系中 的每個(gè)坐標(biāo)軸表示一類屬性參數(shù)。圖3所示的坐標(biāo)系僅以二維進(jìn)行示例,例如x軸表示歌手, y軸表示年代;將每一個(gè)歌手分別與x軸上的數(shù)值對(duì)應(yīng),相應(yīng)的,將不同的年代分別與y軸上 的數(shù)值對(duì)應(yīng)。依據(jù)每一個(gè)音頻數(shù)據(jù)的年代與歌手分別將音頻數(shù)據(jù)對(duì)應(yīng)坐標(biāo)系中的不同的坐 標(biāo)點(diǎn),如圖3所示,從中我們可以初步的看出,箭頭指向的兩個(gè)坐標(biāo)點(diǎn)相對(duì)于其他坐標(biāo)點(diǎn)來 說相對(duì)孤立。當(dāng)然,當(dāng)屬性參數(shù)的類型數(shù)量大于上述兩類時(shí),與上述方式同理,建立多維坐 標(biāo)系,將每個(gè)音頻數(shù)據(jù)映射到所述多維坐標(biāo)系中,獲得每個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn)。
[0106] 本實(shí)施例中,所述計(jì)算單元23,具體用于基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照L0F算法 計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù)。
[0107] 具體的,所述計(jì)算單元23,用于獲得與所述第一音頻數(shù)據(jù)對(duì)應(yīng)的第一坐標(biāo)點(diǎn)a的歐 式距離最近的k個(gè)坐標(biāo)點(diǎn),生成第一集合,所述第一集合記為N k(a);
[0108] 計(jì)算所述第一坐標(biāo)點(diǎn)a與所述第一集合中每個(gè)坐標(biāo)點(diǎn)的之間的可達(dá)距離;所述可 達(dá)距離滿足公式(1):
[0109] reachability_distance_k(a,b)=max{k_distance(b),d(a,b)} (1)
[0110] 其中,reachability_distance_k(a,b)表示第一坐標(biāo)點(diǎn)a與第二坐標(biāo)點(diǎn)b之間的可 達(dá)距離;k_distanCe(b)表示所述第二坐標(biāo)點(diǎn)b與第二集合中與所述第二坐標(biāo)點(diǎn)b的歐式距 離最遠(yuǎn)的第三坐標(biāo)點(diǎn)之間的歐式距離;所述第三坐標(biāo)點(diǎn)在本示意中可記為第三坐標(biāo)點(diǎn)k;其 中,所述第二集合為與所述第二坐標(biāo)點(diǎn)b的歐式距離最近的kl個(gè)坐標(biāo)點(diǎn)生成的集合;當(dāng)所述 第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b滿足第一條件時(shí),reachability_distance_k(a,b)等于k_ distance(b);當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b不滿足第一條件時(shí),reachability# distance_k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的歐式距離;
[0111]計(jì)算所述第一坐標(biāo)點(diǎn)的第一局部密度;所述局部密度滿足公式(2):
(2)
[0113]計(jì)算每個(gè)坐標(biāo)點(diǎn)的局部密度,獲得所述第一集合中的k個(gè)坐標(biāo)點(diǎn)的平均局部密度 和所述第一局部密度的比值;所述比值滿足公式(3):
(3)
[0115] 其中,Ird(b)表示第二坐標(biāo)點(diǎn)b的局部密度,可記為第二局部密度。
[0116] 具體的,對(duì)于與用戶相關(guān)聯(lián)的所有的音頻數(shù)據(jù)所對(duì)應(yīng)的坐標(biāo)點(diǎn),這里可稱為坐標(biāo) 點(diǎn)集合;首先,所述計(jì)算單元23確定所述坐標(biāo)點(diǎn)集合中每一個(gè)坐標(biāo)點(diǎn)的所有近鄰結(jié)點(diǎn),這 里,以所述坐標(biāo)點(diǎn)集合中的第一坐標(biāo)點(diǎn)a的近鄰結(jié)點(diǎn)為例,若確定所述坐標(biāo)點(diǎn)集合中的第一 坐標(biāo)點(diǎn)a的近鄰結(jié)點(diǎn)有k個(gè),則將所述k鄰結(jié)點(diǎn)(即k個(gè)坐標(biāo)點(diǎn))記為第一集合,所述第一集合 記為N k(a)。其中,所述k鄰結(jié)點(diǎn)表示與與所述第一坐標(biāo)點(diǎn)a的歐式距離最近的k個(gè)坐標(biāo)點(diǎn)。本 實(shí)施例中,歐式距離的計(jì)算方式可參照現(xiàn)有技術(shù)所述,本實(shí)施例中不做詳細(xì)描述。
[0117] 第二,所述計(jì)算單元23確定兩個(gè)坐標(biāo)點(diǎn)的可達(dá)距離滿足公式(1)所示,這里,兩個(gè) 坐標(biāo)點(diǎn)的可達(dá)距離并不一定是兩個(gè)坐標(biāo)點(diǎn)的歐式距離。具體的,當(dāng)所述第一坐標(biāo)點(diǎn)a屬于所 述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集合時(shí),reachability_distance_k(a,b)等于k_distance(b); 當(dāng)所述第一坐標(biāo)點(diǎn)a不屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集合時(shí),reachability_distance_ k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的歐式距離;其中,所述第二集合為 與所述第二坐標(biāo)點(diǎn)b的歐式距離最近的kl個(gè)坐標(biāo)點(diǎn)生成的集合。也就是說,當(dāng)所述第一坐標(biāo) 點(diǎn)a屬于第二坐標(biāo)點(diǎn)b的鄰結(jié)點(diǎn)集合時(shí),所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的可達(dá)距 離等于所述第二坐標(biāo)點(diǎn)b與其最近的鄰結(jié)點(diǎn)之間的歐式距離。當(dāng)所述第一坐標(biāo)點(diǎn)a不屬于第 二坐標(biāo)點(diǎn)b的鄰結(jié)點(diǎn)集合時(shí),所述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的可達(dá)距離等于所 述第一坐標(biāo)點(diǎn)a與所述第二坐標(biāo)點(diǎn)b之間的歐式距離。這樣使后續(xù)的局部密度的計(jì)算的穩(wěn)定 性更佳。
[0118]第三,所述計(jì)算單元23基于上述兩個(gè)步驟進(jìn)行局部密度的獲得。以計(jì)算第一坐標(biāo) 點(diǎn)a的第一局部密度Ird(a)為例,所述第一局部密度Ird(a)滿足公式(2)所示,其中,b表示 第二坐標(biāo)點(diǎn),并且bGN k(a),表示所述第二坐標(biāo)點(diǎn)b屬于第一集合Nk(a),即所述第二坐標(biāo)點(diǎn)b 為與所述第一坐標(biāo)點(diǎn)a的歐式距離最近的k個(gè)坐標(biāo)點(diǎn)的其中之一。由公式(2)可以看出,所述 第一坐標(biāo)點(diǎn)a的第一局部密度滿足所述第一坐標(biāo)點(diǎn)a與其所述第一集合N k(a)中的所有坐標(biāo) 點(diǎn)的平均可達(dá)距離的倒數(shù)?;谏鲜龇绞将@得每個(gè)坐標(biāo)點(diǎn)的局部密度。
[0119] 最后,所述計(jì)算單元23比較所述第一集合中的所有坐標(biāo)點(diǎn)的平均局部密度和所述 第一坐標(biāo)點(diǎn)a的第一局部密度的比值;所述比值滿足公式(3)所示,本發(fā)明實(shí)施例中通過獲 得的比值大小確定所述第一坐標(biāo)點(diǎn)對(duì)應(yīng)的第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù)。
[0120] 本實(shí)施例中,所述判定單元24,用于當(dāng)所述比值大于預(yù)設(shè)閾值時(shí),確定所述第一音 頻數(shù)據(jù)為噪聲數(shù)據(jù);其中,所述預(yù)設(shè)閾值大于等于1。
[0121] 具體的,當(dāng)計(jì)算結(jié)果(即獲得的比值)小于等于1時(shí),表明所述第一坐標(biāo)點(diǎn)a被所述 第一集合中的坐標(biāo)點(diǎn)包圍,即所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn)之間相對(duì)位置 較緊密。當(dāng)計(jì)算結(jié)果(即獲得的比值)大于1時(shí),表明所述第一坐標(biāo)點(diǎn)a在所述第一集合外部; 比值越接近1,所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn)之間的相對(duì)位置相對(duì)緊密;比 值越遠(yuǎn)離1,表明所述第一坐標(biāo)點(diǎn)a與所述第一集合中的坐標(biāo)點(diǎn)之間的相對(duì)位置越疏遠(yuǎn),可 以確定所述第一坐標(biāo)點(diǎn)a為噪聲數(shù)據(jù)的可能性越高。如圖4所示,用環(huán)形圈出的坐標(biāo)點(diǎn)均為 獲得的比值大于1對(duì)應(yīng)的坐標(biāo)點(diǎn)?;诖?,在本實(shí)施例中,可基于需求配置一預(yù)設(shè)閾值,所述 預(yù)設(shè)閾值大于等于1;所述預(yù)設(shè)閾值越大,噪聲數(shù)據(jù)的判定準(zhǔn)確率越高。所述預(yù)設(shè)閾值例如 3,則當(dāng)獲得的比值大于3時(shí),可確定比值對(duì)應(yīng)的坐標(biāo)點(diǎn)相對(duì)應(yīng)的音頻數(shù)據(jù)為噪聲數(shù)據(jù)。
[0122] 本實(shí)施例中,所述服務(wù)器中的數(shù)據(jù)獲取單元21、映射單元22、計(jì)算單元23和判定單 元24,在實(shí)際應(yīng)用中均可由所述服務(wù)器中的中央處理器(CPU,Central Processing Unit)、 數(shù)字信號(hào)處理器(DSP,Digital Signal Processor)或可編程門陣列(FPGA,F(xiàn)ield - Programmable Gate Array)實(shí)現(xiàn)。
[0123] 圖7為本發(fā)明實(shí)施例的服務(wù)器的硬件構(gòu)成示意圖;服務(wù)器作為硬件實(shí)體的一個(gè)示 例如圖7所示,包括處理器31、存儲(chǔ)介質(zhì)32以及至少一個(gè)外部通信接口 33;所述處理器31、存 儲(chǔ)介質(zhì)32以及外部通信接口 33均通過總線34連接。
[0124] 這里需要指出的是:以上涉及服務(wù)器項(xiàng)的描述,與上述方法描述是類似的,同方法 的有益效果描述,不做贅述。對(duì)于本發(fā)明服務(wù)器實(shí)施例中未披露的技術(shù)細(xì)節(jié),請(qǐng)參照本發(fā)明 方法實(shí)施例的描述。
[0125] 在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過其 它的方式實(shí)現(xiàn)。以上所描述的設(shè)備實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為 一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,如:多個(gè)單元或組件可以結(jié)合,或 可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部 分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設(shè)備或單元的間接耦合 或通信連接,可以是電性的、機(jī)械的或其它形式的。
[0126] 上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯 示的部件可以是、或也可以不是物理單元,即可以位于一個(gè)地方,也可以分布到多個(gè)網(wǎng)絡(luò)單 元上;可以根據(jù)實(shí)際的需要選擇其中的部分或全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
[0127] 另外,在本發(fā)明各實(shí)施例中的各功能單元可以全部集成在一個(gè)處理單元中,也可 以是各單元分別單獨(dú)作為一個(gè)單元,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中;上述 集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0128] 本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過 程序指令相關(guān)的硬件來完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序 在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:移動(dòng)存儲(chǔ)設(shè)備、只讀 存儲(chǔ)器(R0M,Read_0nly Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或 者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0129] 或者,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品 銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明實(shí)施 例的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來, 該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以 是個(gè)人計(jì)算機(jī)、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分。 而前述的存儲(chǔ)介質(zhì)包括:移動(dòng)存儲(chǔ)設(shè)備、R〇M、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼 的介質(zhì)。
[0130] 以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種信息處理方法,其特征在于,所述方法包括: 獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù)中的多個(gè)屬性參數(shù); 將所述多個(gè)音頻數(shù)據(jù)按照所述多個(gè)屬性參數(shù)映射到預(yù)先設(shè)置的多維坐標(biāo)系中,獲得所 述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所述坐標(biāo)系的維度與所述屬性參數(shù)的類型數(shù)量相匹 配; 基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù);所述第 一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù); 基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是噪聲數(shù)據(jù)。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè) 算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù),包括: 基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照局部密度因子LOF算法計(jì)算第一音頻數(shù)據(jù)的局部密度 參數(shù)。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照LOF 算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù),包括: 獲得與所述第一音頻數(shù)據(jù)對(duì)應(yīng)的第一坐標(biāo)點(diǎn)a的歐式距離最近的k個(gè)坐標(biāo)點(diǎn),生成第一 集合,所述第一集合記為Nk(a); 計(jì)算所述第一坐標(biāo)點(diǎn)a與所述第一集合中每個(gè)坐標(biāo)點(diǎn)的之間的可達(dá)距離;所述可達(dá)距 離滿足以下表達(dá)式: reachability_distance_k(a,b)=max{k_distance(b),d(a,b)}; 其中,reachability_distance_k(a,b)表示第一坐標(biāo)點(diǎn)a與第二坐標(biāo)點(diǎn)b之間的可達(dá)距 離;k_diStance(b)表示所述第二坐標(biāo)點(diǎn)b與第二集合中與所述第二坐標(biāo)點(diǎn)b的歐式距離最 遠(yuǎn)的第三坐標(biāo)點(diǎn)之間的歐式距離;其中,所述第二集合為與所述第二坐標(biāo)點(diǎn)b的歐式距離最 近的kl個(gè)坐標(biāo)點(diǎn)生成的集合;當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b滿足第一條件時(shí), reachability_distance_k(a,b)等于k_distance(b);當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo) 點(diǎn)b不滿足第一條件時(shí),reachability_distance_k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述第二 坐標(biāo)點(diǎn)b之間的歐式距離; 計(jì)算所述第一坐標(biāo)點(diǎn)的第一局部密度;所述局部密度滿足以下表達(dá)式:計(jì)算每個(gè)坐標(biāo)點(diǎn)的局部密度,獲得所述第一集合中的k個(gè)坐標(biāo)點(diǎn)的平均局部密度和所 述第一局部密度的比值;所述比值滿足以下表達(dá)式:4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述滿足第一條件,包括:所述第一坐標(biāo)點(diǎn) a屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集合; 所述不滿足第一條件,包括:所述第一坐標(biāo)點(diǎn)a不屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集 合。5. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù) 是否是噪聲數(shù)據(jù),包括: 當(dāng)所述比值大于預(yù)設(shè)閾值時(shí),確定所述第一音頻數(shù)據(jù)為噪聲數(shù)據(jù);其中,所述預(yù)設(shè)閾值 大于等于1。6. -種服務(wù)器,其特征在于,所述服務(wù)器包括:數(shù)據(jù)獲取單元、映射單元、計(jì)算單元和判 定單元;其中, 所述數(shù)據(jù)獲取單元,用于獲得與用戶對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),識(shí)別所述音頻數(shù)據(jù)中的多 個(gè)屬性參數(shù); 所述映射單元,用于將所述數(shù)據(jù)獲取單元獲得的多個(gè)音頻數(shù)據(jù)按照所述多個(gè)屬性參數(shù) 映射到預(yù)先設(shè)置的多維坐標(biāo)系中,獲得所述多個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的坐標(biāo)點(diǎn);其中,所述坐標(biāo)系 的維度與所述屬性參數(shù)的類型數(shù)量相匹配; 所述計(jì)算單元,用于基于每個(gè)音頻數(shù)據(jù)的坐標(biāo)點(diǎn)按照預(yù)設(shè)算法計(jì)算第一音頻數(shù)據(jù)的局 部密度參數(shù);所述第一音頻數(shù)據(jù)為所述多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù); 所述判定單元,用于基于所述計(jì)算單元獲得的計(jì)算結(jié)果確定所述第一音頻數(shù)據(jù)是否是 噪聲數(shù)據(jù)。7. 根據(jù)權(quán)利要求6所述的服務(wù)器,其特征在于,所述計(jì)算單元,用于基于每個(gè)音頻數(shù)據(jù) 的坐標(biāo)點(diǎn)按照局部密度因子LOF算法計(jì)算第一音頻數(shù)據(jù)的局部密度參數(shù)。8. 根據(jù)權(quán)利要求7所述的服務(wù)器,其特征在于,所述計(jì)算單元,用于獲得與所述第一音 頻數(shù)據(jù)對(duì)應(yīng)的第一坐標(biāo)點(diǎn)a的歐式距離最近的k個(gè)坐標(biāo)點(diǎn),生成第一集合,所述第一集合記 為Nk(a); 計(jì)算所述第一坐標(biāo)點(diǎn)a與所述第一集合中每個(gè)坐標(biāo)點(diǎn)的之間的可達(dá)距離;所述可達(dá)距 離滿足以下表達(dá)式: reachability_distance_k(a,b)=max{k_distance(b),d(a,b)}; 其中,reachability_distance_k(a,b)表示第一坐標(biāo)點(diǎn)a與第二坐標(biāo)點(diǎn)b之間的可達(dá)距 離;k_diStance(b)表示所述第二坐標(biāo)點(diǎn)b與第二集合中與所述第二坐標(biāo)點(diǎn)b的歐式距離最 遠(yuǎn)的第三坐標(biāo)點(diǎn)之間的歐式距離;其中,所述第二集合為與所述第二坐標(biāo)點(diǎn)b的歐式距離最 近的kl個(gè)坐標(biāo)點(diǎn)生成的集合;當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo)點(diǎn)b滿足第一條件時(shí), reachability_distance_k(a,b)等于k_distance(b);當(dāng)所述第一坐標(biāo)點(diǎn)a和所述第二坐標(biāo) 點(diǎn)b不滿足第一條件時(shí),reachability_distance_k(a,b)等于所述第一坐標(biāo)點(diǎn)a與所述第二 坐標(biāo)點(diǎn)b之間的歐式距離; 計(jì)算所述第一坐標(biāo)點(diǎn)的第一局部密度:所述局部密度滿足以下表達(dá)式:計(jì)算每個(gè)坐標(biāo)點(diǎn)的局部密度,獲得所述第一集合中的k個(gè)坐標(biāo)點(diǎn)的平均局部密度和所 述第一局部密度的比值;所述比值滿足以下表達(dá)式:9. 根據(jù)權(quán)利要求8所述的服務(wù)器,其特征在于,所述滿足第一條件,包括:所述第一坐標(biāo) 點(diǎn)a屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集合; 所述不滿足第一條件,包括:所述第一坐標(biāo)點(diǎn)a不屬于所述第二坐標(biāo)點(diǎn)b對(duì)應(yīng)的第二集 合。10. 根據(jù)權(quán)利要求8所述的服務(wù)器,其特征在于,所述判定單元,用于當(dāng)所述比值大于預(yù) 設(shè)閾值時(shí),確定所述第一音頻數(shù)據(jù)為噪聲數(shù)據(jù);其中,所述預(yù)設(shè)閾值大于等于1。
【文檔編號(hào)】G06F17/30GK105893515SQ201610193015
【公開日】2016年8月24日
【申請(qǐng)日】2016年3月30日
【發(fā)明人】黃安埠
【申請(qǐng)人】騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1