午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種相似性時(shí)間序列搜索的方法和裝置制造方法

文檔序號:6625137閱讀:197來源:國知局
一種相似性時(shí)間序列搜索的方法和裝置制造方法
【專利摘要】本發(fā)明提供一種相似性時(shí)間序列搜索的方法和裝置,能夠?qū)崿F(xiàn)數(shù)據(jù)的宏觀狀態(tài)的比較并且有較高的計(jì)算效率。本發(fā)明的相似性時(shí)間序列搜索的方法包括:按預(yù)設(shè)的狀態(tài)集,將多個(gè)對象的目標(biāo)時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為目標(biāo)狀態(tài)序列數(shù)據(jù);將狀態(tài)描述序列與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配,在所述目標(biāo)狀態(tài)序列數(shù)據(jù)中有連續(xù)的數(shù)據(jù)與所述狀態(tài)描述序列中的全部描述項(xiàng)匹配成功的情況下,輸出所述連續(xù)的數(shù)據(jù)所屬的對象的標(biāo)識。
【專利說明】一種相似性時(shí)間序列搜索的方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種相似性時(shí)間序列搜索的方法和裝置。

【背景技術(shù)】
[0002]隨著現(xiàn)代科技的發(fā)展,數(shù)據(jù)的存儲能力飛速增強(qiáng),使得更多的數(shù)據(jù)得以保存起來,在與人們生活息息相關(guān)的各行業(yè)中涌現(xiàn)出各類海量數(shù)據(jù)。時(shí)間序列數(shù)據(jù)就是這樣的數(shù)據(jù),按照固定的時(shí)間間隔收集并存儲。比如股市數(shù)據(jù)、氣溫變化數(shù)據(jù)、心跳變化數(shù)據(jù)等。對這些數(shù)據(jù)進(jìn)行分析,可揭示出事物變化、發(fā)展規(guī)律,為科學(xué)決策提供幫助。時(shí)間序列數(shù)據(jù)是數(shù)據(jù)挖掘的基礎(chǔ)之一,相似性時(shí)間序列的搜索技術(shù)對于時(shí)間序列數(shù)據(jù)挖掘變得越來越重要。時(shí)間序列具有數(shù)據(jù)維度高的特性,使得時(shí)間序列的挖掘具有比較高的難度。時(shí)間序列的相似性搜索是時(shí)間序列數(shù)據(jù)挖掘的一種重要手段。
[0003]現(xiàn)有時(shí)間序列相似性技術(shù),多采用形態(tài)學(xué)匹配計(jì)算歐式距離,S卩比對兩個(gè)時(shí)間序列曲線的形狀。歐式距離越小則越相似。這種技術(shù)著重于形態(tài)學(xué)上的匹配,局限于微觀的數(shù)值比較,從而限制了現(xiàn)有時(shí)間序列相似性搜索的范疇。對于超越了形態(tài)學(xué)的相似性比較,特別是數(shù)據(jù)在一定程度的宏觀的屬性的比較,現(xiàn)有技術(shù)很難滿足需求。另外,現(xiàn)有時(shí)間序列相似性搜索技術(shù)參與計(jì)算的維度很高,這會引入計(jì)算誤差問題和計(jì)算量代價(jià)高的問題。


【發(fā)明內(nèi)容】

[0004]有鑒于此,本發(fā)明提供一種相似性時(shí)間序列搜索的方法和裝置,能夠?qū)崿F(xiàn)數(shù)據(jù)的宏觀狀態(tài)的比較并且有較高的計(jì)算效率。
[0005]為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種相似性時(shí)間序列搜索的方法。
[0006]本發(fā)明的相似性時(shí)間序列搜索的方法包括:按預(yù)設(shè)的狀態(tài)集,將多個(gè)對象的目標(biāo)時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為目標(biāo)狀態(tài)序列數(shù)據(jù);將狀態(tài)描述序列與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配,在所述目標(biāo)狀態(tài)序列數(shù)據(jù)中有連續(xù)的數(shù)據(jù)與所述狀態(tài)描述序列中的全部描述項(xiàng)匹配成功的情況下,輸出所述連續(xù)的數(shù)據(jù)所屬的對象的標(biāo)識。
[0007]可選地,所述狀態(tài)描述序列中的各個(gè)描述項(xiàng)包括狀態(tài)名、匹配方式、最小計(jì)數(shù)限制條件、以及最大限制計(jì)數(shù)條件,其中:所述狀態(tài)名用于指定所在描述項(xiàng)涉及的狀態(tài),描述項(xiàng)中狀態(tài)名為空表示任意狀態(tài);所述匹配方式用于指定在將本描述項(xiàng)中的狀態(tài)名與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配時(shí)的匹配方式,包括直接匹配和取非匹配,其中所述狀態(tài)名與目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名一致時(shí)表示對狀態(tài)名直接匹配成功,對所述狀態(tài)名所表示的狀態(tài)進(jìn)行取非之后得到的狀態(tài)包含了目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名時(shí)表示對狀態(tài)名取非匹配成功;所述最小計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最短持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長大于該最短持續(xù)時(shí)間的情況下表示最小計(jì)數(shù)條件匹配成功,所述最小計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最小計(jì)數(shù)條件都匹配成功;所述最大計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最長持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長小于該最短持續(xù)時(shí)間的情況下表示最大計(jì)數(shù)條件匹配成功,所述最大計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最大計(jì)數(shù)條件都匹配成功。
[0008]可選地,所述對象是商品,所述時(shí)間序列數(shù)據(jù)是各種商品各自的日銷量。
[0009]根據(jù)本發(fā)明的另一方面,提供了一種相似性時(shí)間序列搜索的裝置。
[0010]本發(fā)明的相似性時(shí)間序列搜索的裝置包括:數(shù)據(jù)轉(zhuǎn)換模塊,用于按預(yù)設(shè)的狀態(tài)集,將多個(gè)對象的目標(biāo)時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為目標(biāo)狀態(tài)序列數(shù)據(jù);匹配輸出模塊,用于將狀態(tài)描述序列與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配,在所述目標(biāo)狀態(tài)序列數(shù)據(jù)中有連續(xù)的數(shù)據(jù)與所述狀態(tài)描述序列中的全部描述項(xiàng)匹配的情況下,輸出所述連續(xù)的數(shù)據(jù)所屬的對象的標(biāo)識。[0011 ] 可選地,所述狀態(tài)描述序列中的各個(gè)描述項(xiàng)包括狀態(tài)名、匹配方式、最小計(jì)數(shù)限制條件、以及最大限制計(jì)數(shù)條件,其中:所述狀態(tài)名用于指定所在描述項(xiàng)涉及的狀態(tài),描述項(xiàng)中狀態(tài)名為空表示任意狀態(tài);所述匹配方式用于指定在將本描述項(xiàng)中的狀態(tài)名與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配時(shí)的匹配方式,包括直接匹配和取非匹配,其中所述狀態(tài)名與目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名一致時(shí)表示對狀態(tài)名直接匹配成功,對所述狀態(tài)名所表示的狀態(tài)進(jìn)行取非之后得到的狀態(tài)包含了目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名時(shí)表示對狀態(tài)名取非匹配成功;所述最小計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最短持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長大于該最短持續(xù)時(shí)間的情況下表示最小計(jì)數(shù)條件匹配成功,所述最小計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最小計(jì)數(shù)條件都匹配成功;所述最大計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最長持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長小于該最短持續(xù)時(shí)間的情況下表示最大計(jì)數(shù)條件匹配成功,所述最大計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最大計(jì)數(shù)條件都匹配成功。
[0012]可選地,所述對象是商品,所述時(shí)間序列數(shù)據(jù)是各種商品各自的日銷量。
[0013]根據(jù)本發(fā)明的技術(shù)方案,將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù),再用指定的狀態(tài)描述序列與各個(gè)狀態(tài)序列數(shù)據(jù)分別進(jìn)行匹配,一方面能夠從進(jìn)行搜索的用戶的實(shí)際需求出發(fā),從宏觀上以狀態(tài)描述序列的方式準(zhǔn)確提供用戶的搜索條件,使搜索更加實(shí)用、準(zhǔn)確;另一方面還有助于降低參與匹配的數(shù)據(jù)量,提高計(jì)算效率。

【專利附圖】

【附圖說明】
[0014]附圖用于更好地理解本發(fā)明,不構(gòu)成對本發(fā)明的不當(dāng)限定。其中:
[0015]圖1是根據(jù)本發(fā)明實(shí)施例的相似性時(shí)間序列搜索的方法的基本流程的示意圖;
[0016]圖2是根據(jù)本發(fā)明實(shí)施例的相似性時(shí)間序列搜索的裝置的基本結(jié)構(gòu)的示意圖。

【具體實(shí)施方式】
[0017]以下結(jié)合附圖對本發(fā)明的示范性實(shí)施例做出說明,其中包括本發(fā)明實(shí)施例的各種細(xì)節(jié)以助于理解,應(yīng)當(dāng)將它們認(rèn)為僅僅是示范性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識至IJ,可以對這里描述的實(shí)施例做出各種改變和修改,而不會背離本發(fā)明的范圍和精神。同樣,為了清楚和簡明,以下的描述中省略了對公知功能和結(jié)構(gòu)的描述。
[0018]在本發(fā)明實(shí)施例中,主要以處理商品銷量數(shù)據(jù)為例加以說明。這里的商品銷量數(shù)據(jù)是多種商品各自的日銷量數(shù)據(jù),多日的日銷量數(shù)據(jù)即構(gòu)成時(shí)間序列數(shù)據(jù),對于多種商品即相應(yīng)有多項(xiàng)時(shí)間序列數(shù)據(jù)。搜索的任務(wù)就是要從作為目標(biāo)時(shí)間序列數(shù)據(jù)的海量的商品的日銷量數(shù)據(jù)中,確定哪些商品的銷量特征符合我們預(yù)先指定的銷量特征??梢钥闯雒宽?xiàng)時(shí)間序列數(shù)據(jù)包含大量數(shù)據(jù),為了提高計(jì)算效率,本實(shí)施例中對于目標(biāo)時(shí)間序列數(shù)據(jù)進(jìn)行降維處理,將其轉(zhuǎn)換為目標(biāo)狀態(tài)序列數(shù)據(jù),從而將時(shí)間序列數(shù)據(jù)的搜索轉(zhuǎn)換為對狀態(tài)序列數(shù)據(jù)的搜索,搜索得到的狀態(tài)序列數(shù)據(jù)所對應(yīng)的商品即為需要確定的商品。
[0019]以下先對本實(shí)施例中涉及的狀態(tài)的概念加以介紹。狀態(tài)是時(shí)間序列數(shù)據(jù)在某一段范圍內(nèi)所表現(xiàn)出來的一種特征,在不同的時(shí)間,狀態(tài)可能相同也可能不同,但狀態(tài)的總數(shù)必須在兩個(gè)以上,構(gòu)成一個(gè)狀態(tài)集。狀態(tài)的定義遵循一個(gè)原則,即狀態(tài)間是沒有交集的、所有狀態(tài)的概率之和是I。也就是說時(shí)間序列數(shù)據(jù)中的每個(gè)數(shù)據(jù)必然處于并且僅處于一種狀態(tài)中。以商品銷量數(shù)據(jù)為例,事先設(shè)定銷量的高低兩個(gè)閾值,則商品銷量數(shù)據(jù)的狀態(tài)集共有四種狀態(tài):斷貨、高銷量、正常銷量、低銷量。其中日銷量高于設(shè)定的高閾值則狀態(tài)為高銷量,日銷量低于設(shè)定的低閾值則狀態(tài)為低銷量,日銷量介于高低閾值之間則為正常銷量,另外無貨供應(yīng)時(shí)銷量為零,狀態(tài)為斷貨,因?yàn)閷τ谝话闵唐穪碚f不會出現(xiàn)存在供貨正常但一件也未賣出的情況。
[0020]在時(shí)間序列數(shù)據(jù)中,位于不同的時(shí)間段的數(shù)據(jù)屬于不同的狀態(tài),變化的狀態(tài)形成一個(gè)狀態(tài)序列。本實(shí)施例中,將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù),狀態(tài)序列數(shù)據(jù)中的每個(gè)數(shù)據(jù)的結(jié)構(gòu)為(s,num),其中s表示該數(shù)據(jù)的狀態(tài),num表示該狀態(tài)的持續(xù)時(shí)間,如果時(shí)間序列數(shù)據(jù)是每天一個(gè)數(shù)據(jù),例如商品的日銷量,則該持續(xù)時(shí)間可以是天數(shù)。因?yàn)橥ǔ碚f時(shí)間序列中一般是相鄰多個(gè)數(shù)據(jù)屬于同一狀態(tài),所以將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù)之后,該狀態(tài)序列數(shù)據(jù)中的數(shù)據(jù)個(gè)數(shù)將顯著減少,有助于提高后續(xù)計(jì)算的效率。
[0021]在將商品的日銷量的時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù)時(shí),可以先計(jì)算該時(shí)間序列數(shù)據(jù)的平均值和標(biāo)準(zhǔn)差,將該平均值與標(biāo)準(zhǔn)差的和作設(shè)定為高閾值,二者之差設(shè)定為低閾值;然后遍歷該時(shí)間序列數(shù)據(jù),對于遍歷到的當(dāng)前數(shù)據(jù),若大于該高閾值則作為高銷量狀態(tài),若小于該低閾值則作為低銷量狀態(tài),介于該高閾值和低閾值之間則作為正常銷量狀態(tài),值為零則作為斷貨狀態(tài)。一般來說在時(shí)間序列數(shù)據(jù)會存在連續(xù)若干個(gè)數(shù)值屬于同一狀態(tài),此時(shí)將它們合并為狀態(tài)序列數(shù)據(jù)中的一個(gè)數(shù)據(jù),例如連續(xù)10天的銷量屬于高銷量狀態(tài),第11天為斷貨狀態(tài),則這10天的時(shí)間序列數(shù)據(jù)被轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù)中的I個(gè)數(shù)據(jù),值為(高銷量,10)。因此時(shí)間序列數(shù)據(jù)在轉(zhuǎn)換得到狀態(tài)序列數(shù)據(jù)之后,數(shù)據(jù)量有顯著的減小。
[0022]以下再對本實(shí)施例中的狀態(tài)描述序列做出說明。在將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù)的情況下,對于時(shí)間序列數(shù)據(jù)的搜索即轉(zhuǎn)化成為對狀態(tài)序列數(shù)據(jù)的搜索,相應(yīng)地,搜索條件應(yīng)當(dāng)對指定的狀態(tài)的組合進(jìn)行描述,即給出一種狀態(tài)描述序列。本實(shí)施例給出一種狀態(tài)描述方式,有助于方便、清晰地形成狀態(tài)描述序列。
[0023]本實(shí)施例中的狀態(tài)描述序列由多個(gè)描述項(xiàng)構(gòu)成,每個(gè)描述項(xiàng)包含狀態(tài)名、匹配方式、最小計(jì)數(shù)限制條件、以及最大限制計(jì)數(shù)條件這四個(gè)參數(shù)。狀態(tài)名用于指定所在描述項(xiàng)涉及的狀態(tài),描述項(xiàng)中狀態(tài)名為空表示任意狀態(tài)。匹配方式用于指定在將本描述項(xiàng)中的狀態(tài)名與目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配時(shí)的匹配方式,包括直接匹配和取非匹配,其中狀態(tài)名與目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名一致時(shí)表示對狀態(tài)名直接匹配成功,對狀態(tài)名所表示的狀態(tài)進(jìn)行取非之后得到的狀態(tài)包含了目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名時(shí)表示對狀態(tài)名取非匹配成功。最小計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最短持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長大于該最短持續(xù)時(shí)間的情況下表示最小計(jì)數(shù)條件匹配成功,最小計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最小計(jì)數(shù)條件都匹配成功。最大計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最長持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長小于該最短持續(xù)時(shí)間的情況下表示最大計(jì)數(shù)條件匹配成功,最大計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最大計(jì)數(shù)條件都匹配成功。
[0024]舉例來說,一個(gè)狀態(tài)描述序列包含四個(gè)描述項(xiàng),分別如下(每個(gè)描述項(xiàng)中的參數(shù)分別為狀態(tài)名、匹配方式、最小計(jì)數(shù)限制條件、以及最大限制計(jì)數(shù)條件):
[0025]描述項(xiàng)1:(高銷量,直接匹配,5,空);
[0026]描述項(xiàng)2:(空,直接匹配,空,空);
[0027]描述項(xiàng)3:(斷貨,直接匹配,10,空);
[0028]描述項(xiàng)4:(斷貨,取非匹配,I,40)。
[0029]上述描述項(xiàng)I至4是按時(shí)間先后進(jìn)行描述,這4個(gè)描述項(xiàng)合起來即表示如下含義:“近期(1-40天)商品供貨正常(即非斷貨),在此之前出現(xiàn)過較為長期(10天以上)的斷貨,在斷貨之前曾經(jīng)出現(xiàn)過5天以上的高銷量”。按人們考察事物時(shí)在時(shí)間順序上的思維習(xí)慣,一般是從近期向遠(yuǎn)期進(jìn)行歷史上溯,所以上述的含義也是先近期再遠(yuǎn)期的回顧描述。這里的用語“在斷貨之前曾經(jīng)出現(xiàn)過”表示出現(xiàn)的高銷量與發(fā)生斷貨之間存在或不存在時(shí)間間隔,但搜索時(shí)對此并不關(guān)心,因此在高銷量狀態(tài)(即描述項(xiàng)I)與斷貨狀態(tài)(即描述項(xiàng)3)之間添加一個(gè)描述項(xiàng)2,在該描述項(xiàng)2中,狀態(tài)為空,表示任意狀態(tài)都匹配成功,即表達(dá)了不關(guān)心此時(shí)狀態(tài)的意思。
[0030]以下再對本實(shí)施例中的將狀態(tài)描述序列與目標(biāo)狀態(tài)序列數(shù)據(jù)的匹配加以說明。在提供了狀態(tài)描述序列之后,就可以將其與目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配。匹配一般從目標(biāo)狀態(tài)序列數(shù)據(jù)的起始數(shù)據(jù)開始,將狀態(tài)描述序列的描述項(xiàng)的第I項(xiàng)與目標(biāo)狀態(tài)序列數(shù)據(jù)的第I個(gè)數(shù)據(jù)進(jìn)行匹配,若匹配成功,再將狀態(tài)描述序列的描述項(xiàng)的第2項(xiàng)與目標(biāo)狀態(tài)序列數(shù)據(jù)的第2個(gè)數(shù)據(jù)進(jìn)行匹配;若在一次匹配中不成功,例如將狀態(tài)描述序列的描述項(xiàng)的第2項(xiàng)與目標(biāo)狀態(tài)序列數(shù)據(jù)的第2個(gè)數(shù)據(jù)進(jìn)行匹配未成功,則需返回狀態(tài)描述序列的描述項(xiàng)的第I項(xiàng),將其與目標(biāo)狀態(tài)序列數(shù)據(jù)的第2個(gè)數(shù)據(jù)進(jìn)行匹配。也就是說,在匹配時(shí),需要從目標(biāo)狀態(tài)序列中找到連續(xù)的若干個(gè)目標(biāo)狀態(tài)數(shù)據(jù),這些數(shù)據(jù)分別對應(yīng)地與狀態(tài)描述序列中的每個(gè)描述項(xiàng)匹配成功。舉例來說,狀態(tài)描述序列包含ABCD四個(gè)描述項(xiàng),有一個(gè)目標(biāo)狀態(tài)序列包含100個(gè)數(shù)據(jù),如果這ABCD四個(gè)描述項(xiàng)的匹配方式都為直接匹配,在該目標(biāo)狀態(tài)序列中有4個(gè)數(shù)據(jù)一一對應(yīng)地與ABCD四個(gè)描述項(xiàng)匹配才算是匹配成功。
[0031]但是對于取非匹配的匹配方式,匹配操作時(shí)需考慮特殊情況。例如:狀態(tài)描述序列ABCD四個(gè)描述項(xiàng)中,描述項(xiàng)C是(斷貨,取非匹配,7,空);描述項(xiàng)D是(高銷量,直接匹配,10,空);另外在目標(biāo)狀態(tài)序列中,第35個(gè)數(shù)據(jù)是(低銷量,10);第36個(gè)數(shù)據(jù)是(正常銷量,20)。假設(shè)在該目標(biāo)狀態(tài)序列中,第33、34個(gè)數(shù)據(jù)分別與上述狀態(tài)描述序列ABCD四個(gè)描述項(xiàng)中的描述項(xiàng)A、B匹配成功,接下來將描述項(xiàng)C與第35個(gè)數(shù)據(jù)進(jìn)行匹配,可以看出匹配能夠成功;然后再將描述項(xiàng)D與第36個(gè)數(shù)據(jù)時(shí)行匹配,可以看出匹配不成功,但注意到第36個(gè)數(shù)據(jù)與第35個(gè)數(shù)據(jù)合起來表達(dá)的狀態(tài)的實(shí)際含義是非斷貨持續(xù)了 20天,這實(shí)際上與描述項(xiàng)C能夠匹配成功,此時(shí)就應(yīng)當(dāng)認(rèn)為描述項(xiàng)與第35、36個(gè)數(shù)據(jù)匹配成功,并且接下來應(yīng)當(dāng)是將描述項(xiàng)37與描述項(xiàng)D進(jìn)行匹配,如匹配成功,則狀態(tài)描述序列整體與第34至第37個(gè)數(shù)據(jù)匹配成功;如描述項(xiàng)37與描述項(xiàng)D匹配不成功,仍需返回去考察第35至第37個(gè)數(shù)據(jù)是否合起來與描述項(xiàng)C匹配成功,如成功則再將第38個(gè)數(shù)據(jù)與描述項(xiàng)D進(jìn)行匹配,依此類推;如第35至第37個(gè)數(shù)據(jù)合起來與描述項(xiàng)C匹配不成功才算是狀態(tài)描述序列ABCD未與第33至第37個(gè)數(shù)據(jù)匹配不成功。從上面的例子可以看出,對于取非匹配的描述項(xiàng),它有可能與目標(biāo)狀態(tài)描述序列中的多個(gè)連續(xù)數(shù)據(jù)的合并狀態(tài)匹配成功。
[0032]在狀態(tài)描述序列與某個(gè)狀態(tài)序列數(shù)據(jù)中的若干個(gè)連續(xù)的數(shù)據(jù)匹配成功的情況下,確定該連續(xù)的數(shù)據(jù)是屬于哪個(gè)商品的,然后輸出該商品的標(biāo)識,例如其SKU(庫存量單位)編號。此時(shí)意味著該商品的銷量特征符合狀態(tài)描述序列所指定的銷量特征。實(shí)際上,提供的描述項(xiàng)一般能夠與多個(gè)狀態(tài)序列數(shù)據(jù)中的若干個(gè)連續(xù)的數(shù)據(jù)匹配成功,也就是說可以搜索出多個(gè)商品,這些商品的銷量特征都符合狀態(tài)描述序列所指定的銷量特征。所以一般來說要對從商品銷量數(shù)據(jù)庫中數(shù)據(jù)得到的所有狀態(tài)序列數(shù)據(jù)進(jìn)行匹配處理。
[0033]綜上,在從商品銷量數(shù)據(jù)庫中搜索具備指定銷量特征的數(shù)據(jù)時(shí),可采用圖1所示的流程,圖1是根據(jù)本發(fā)明實(shí)施例的相似性時(shí)間序列搜索的方法的基本流程的示意圖。
[0034]步驟Sll:將多個(gè)商品的日銷量數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù)。這里的商品是以SKU作為區(qū)分。在轉(zhuǎn)換之后商品的SKU與狀態(tài)序列數(shù)據(jù)一一對應(yīng)。
[0035]步驟S12:取I個(gè)狀態(tài)序列數(shù)據(jù),與狀態(tài)描述序列進(jìn)行匹配。從本步驟開始,對步驟Sll中得到的多個(gè)狀態(tài)序列數(shù)據(jù)進(jìn)行遍歷并匹配。具體即按上文說明的方法進(jìn)行。
[0036]步驟S13:判斷匹配是否成功,若是,進(jìn)入步驟S14 ;否則進(jìn)入步驟S15。
[0037]步驟S14:輸出參與匹配的狀態(tài)序列數(shù)據(jù)對應(yīng)的商品的標(biāo)識。
[0038]步驟S15:判斷遍歷是否完成。這里的遍歷是指步驟S12中開始的遍歷。若完成則結(jié)束流程,否則返回步驟S12,取下一個(gè)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配。
[0039]以上是以商品銷量數(shù)據(jù)這種時(shí)間序列為例進(jìn)行了說明,實(shí)際上本實(shí)施例的方法也適用于其他時(shí)間序列數(shù)據(jù)。另外,狀態(tài)可由發(fā)起搜索的用戶自己定義,以進(jìn)行不同條件的搜索。需要注意的是定義的狀態(tài)要滿足前文所述的狀態(tài)的定義所遵循的原則。
[0040]圖2是根據(jù)本發(fā)明實(shí)施例的相似性時(shí)間序列搜索的裝置的基本結(jié)構(gòu)的示意圖。如圖2所示,相似性時(shí)間序列搜索的裝置20主要包括數(shù)據(jù)轉(zhuǎn)換模塊21和匹配輸出模塊22。數(shù)據(jù)轉(zhuǎn)換模塊21用于按預(yù)設(shè)的狀態(tài)集,將多個(gè)對象的目標(biāo)時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為目標(biāo)狀態(tài)序列數(shù)據(jù);匹配輸出模塊22用于將狀態(tài)描述序列與上述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配,在上述目標(biāo)狀態(tài)序列數(shù)據(jù)中有連續(xù)的數(shù)據(jù)與上述狀態(tài)描述序列中的全部描述項(xiàng)匹配的情況下,輸出上述連續(xù)的數(shù)據(jù)所屬的對象的標(biāo)識。
[0041]根據(jù)本發(fā)明實(shí)施例的技術(shù)方案,將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為狀態(tài)序列數(shù)據(jù),再用指定的狀態(tài)描述序列與各個(gè)狀態(tài)序列數(shù)據(jù)分別進(jìn)行匹配,一方面能夠從進(jìn)行搜索的用戶的實(shí)際需求出發(fā),從宏觀上以狀態(tài)描述序列的方式準(zhǔn)確提供用戶的搜索條件,使搜索更加實(shí)用、準(zhǔn)確;另一方面還有助于降低參與匹配的數(shù)據(jù)量,提高計(jì)算效率。
[0042]以上結(jié)合具體實(shí)施例描述了本發(fā)明的基本原理,但是,需要指出的是,對本領(lǐng)域的普通技術(shù)人員而言,能夠理解本發(fā)明的方法和設(shè)備的全部或者任何步驟或者部件,可以在任何計(jì)算裝置(包括處理器、存儲介質(zhì)等)或者計(jì)算裝置的網(wǎng)絡(luò)中,以硬件、固件、軟件或者它們的組合加以實(shí)現(xiàn),這是本領(lǐng)域普通技術(shù)人員在閱讀了本發(fā)明的說明的情況下運(yùn)用他們的基本編程技能就能實(shí)現(xiàn)的。
[0043]因此,本發(fā)明的目的還可以通過在任何計(jì)算裝置上運(yùn)行一個(gè)程序或者一組程序來實(shí)現(xiàn)。所述計(jì)算裝置可以是公知的通用裝置。因此,本發(fā)明的目的也可以僅僅通過提供包含實(shí)現(xiàn)所述方法或者裝置的程序代碼的程序產(chǎn)品來實(shí)現(xiàn)。也就是說,這樣的程序產(chǎn)品也構(gòu)成本發(fā)明,并且存儲有這樣的程序產(chǎn)品的存儲介質(zhì)也構(gòu)成本發(fā)明。顯然,所述存儲介質(zhì)可以是任何公知的存儲介質(zhì)或者將來開發(fā)出的任何存儲介質(zhì)。
[0044]還需要指出的是,在本發(fā)明的裝置和方法中,顯然,各部件或各步驟是可以分解和/或重新組合的。這些分解和/或重新組合應(yīng)視為本發(fā)明的等效方案。并且,執(zhí)行上述系列處理的步驟可以自然地按照說明的順序按時(shí)間順序執(zhí)行,但是并不需要一定按照時(shí)間順序執(zhí)行。某些步驟可以并行或彼此獨(dú)立地執(zhí)行。
[0045]上述【具體實(shí)施方式】,并不構(gòu)成對本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員應(yīng)該明白的是,取決于設(shè)計(jì)要求和其他因素,可以發(fā)生各種各樣的修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種相似性時(shí)間序列搜索的方法,其特征在于,包括: 按預(yù)設(shè)的狀態(tài)集,將多個(gè)對象的目標(biāo)時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為目標(biāo)狀態(tài)序列數(shù)據(jù); 將狀態(tài)描述序列與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配,在所述目標(biāo)狀態(tài)序列數(shù)據(jù)中有連續(xù)的數(shù)據(jù)與所述狀態(tài)描述序列中的全部描述項(xiàng)匹配成功的情況下,輸出所述連續(xù)的數(shù)據(jù)所屬的對象的標(biāo)識。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述狀態(tài)描述序列中的各個(gè)描述項(xiàng)包括狀態(tài)名、匹配方式、最小計(jì)數(shù)限制條件、以及最大限制計(jì)數(shù)條件,其中: 所述狀態(tài)名用于指定所在描述項(xiàng)涉及的狀態(tài),描述項(xiàng)中狀態(tài)名為空表示任意狀態(tài); 所述匹配方式用于指定在將本描述項(xiàng)中的狀態(tài)名與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配時(shí)的匹配方式,包括直接匹配和取非匹配,其中所述狀態(tài)名與目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名一致時(shí)表示對狀態(tài)名直接匹配成功,對所述狀態(tài)名所表示的狀態(tài)進(jìn)行取非之后得到的狀態(tài)包含了目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名時(shí)表示對狀態(tài)名取非匹配成功; 所述最小計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最短持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長大于該最短持續(xù)時(shí)間的情況下表示最小計(jì)數(shù)條件匹配成功,所述最小計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最小計(jì)數(shù)條件都匹配成功; 所述最大計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最長持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長小于該最短持續(xù)時(shí)間的情況下表示最大計(jì)數(shù)條件匹配成功,所述最大計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最大計(jì)數(shù)條件都匹配成功。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述對象是商品,所述時(shí)間序列數(shù)據(jù)是各種商品各自的日銷量。
4.一種相似性時(shí)間序列搜索的裝置,其特征在于,包括: 數(shù)據(jù)轉(zhuǎn)換模塊,用于按預(yù)設(shè)的狀態(tài)集,將多個(gè)對象的目標(biāo)時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為目標(biāo)狀態(tài)序列數(shù)據(jù); 匹配輸出模塊,用于將狀態(tài)描述序列與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配,在所述目標(biāo)狀態(tài)序列數(shù)據(jù)中有連續(xù)的數(shù)據(jù)與所述狀態(tài)描述序列中的全部描述項(xiàng)匹配的情況下,輸出所述連續(xù)的數(shù)據(jù)所屬的對象的標(biāo)識。
5.根據(jù)權(quán)利要求4所述的裝置,其特征在于,所述狀態(tài)描述序列中的各個(gè)描述項(xiàng)包括狀態(tài)名、匹配方式、最小計(jì)數(shù)限制條件、以及最大限制計(jì)數(shù)條件,其中: 所述狀態(tài)名用于指定所在描述項(xiàng)涉及的狀態(tài),描述項(xiàng)中狀態(tài)名為空表示任意狀態(tài); 所述匹配方式用于指定在將本描述項(xiàng)中的狀態(tài)名與所述目標(biāo)狀態(tài)序列數(shù)據(jù)進(jìn)行匹配時(shí)的匹配方式,包括直接匹配和取非匹配,其中所述狀態(tài)名與目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名一致時(shí)表示對狀態(tài)名直接匹配成功,對所述狀態(tài)名所表示的狀態(tài)進(jìn)行取非之后得到的狀態(tài)包含了目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)名時(shí)表示對狀態(tài)名取非匹配成功; 所述最小計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最短持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長大于該最短持續(xù)時(shí)間的情況下表示最小計(jì)數(shù)條件匹配成功,所述最小計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最小計(jì)數(shù)條件都匹配成功; 所述最大計(jì)數(shù)條件用于指定所在描述項(xiàng)涉及的狀態(tài)的最長持續(xù)時(shí)間,在目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長小于該最短持續(xù)時(shí)間的情況下表示最大計(jì)數(shù)條件匹配成功,所述最大計(jì)數(shù)條件為空表示目標(biāo)狀態(tài)序列數(shù)據(jù)中的狀態(tài)持續(xù)時(shí)長為任意值時(shí)最大計(jì)數(shù)條件都匹配成功。
6.根據(jù)權(quán)利要求4或5所述的裝置,其特征在于,所述對象是商品,所述時(shí)間序列數(shù)據(jù)是各種商品各自的日銷量。
【文檔編號】G06F17/30GK104166727SQ201410430784
【公開日】2014年11月26日 申請日期:2014年8月28日 優(yōu)先權(quán)日:2014年8月28日
【發(fā)明者】周敏, 胡浩, 謝蔚, 劉紹敏, 陳鵬, 王文豹, 王媛, 倪華 申請人:北京京東尚科信息技術(shù)有限公司, 北京京東世紀(jì)貿(mào)易有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1