午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

頁面轉(zhuǎn)化參數(shù)的處理方法及裝置的制造方法

文檔序號:10687071閱讀:600來源:國知局
頁面轉(zhuǎn)化參數(shù)的處理方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種頁面轉(zhuǎn)化參數(shù)的處理方法及裝置。其中所述方法包括:根據(jù)待分析的日志樣本,獲取每個用戶的映射訪問序列;根據(jù)各所述用戶的所述映射訪問序列,生成頁面訪問的鄰接矩陣;根據(jù)所述頁面訪問的鄰接矩陣,獲取各所述頁面的轉(zhuǎn)化參數(shù)。本發(fā)明還提供了一種采用上述方法的裝置。本發(fā)明通過采用上述技術方案,實現(xiàn)根據(jù)待分析的日志樣本即可以實現(xiàn)頁面的轉(zhuǎn)化參數(shù)的獲取,與現(xiàn)有技術相比,不需要修改線上產(chǎn)品的源代碼,從而可以保證線上產(chǎn)品的安全性以及穩(wěn)定性。
【專利說明】頁面轉(zhuǎn)化參數(shù)的處理方法及裝置 【技術領域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)技術領域,尤其涉及一種頁面轉(zhuǎn)化參數(shù)的處理方法及裝置。 【【背景技術】】
[0002] 隨著互聯(lián)網(wǎng)科技的發(fā)展,涌現(xiàn)出了各種各樣的互聯(lián)網(wǎng)產(chǎn)品,極大地方便了人們的 生活。
[0003] 對于互聯(lián)網(wǎng)產(chǎn)品,無論是個人計算機(Person Computer;PC)端網(wǎng)頁形態(tài),或是移 動端網(wǎng)頁形態(tài),或者移動端應用程序(Application ;App)形態(tài),相應的網(wǎng)站需要了解用戶在 產(chǎn)品內(nèi)各頁面的跳轉(zhuǎn)和離開情況,以分析頁面的轉(zhuǎn)化情況如頁面的轉(zhuǎn)化率和流失率,進而 優(yōu)化頁面設計和各頁面之間的跳轉(zhuǎn)?,F(xiàn)有技術中,通常采用在線上產(chǎn)品的源代碼中額外添 加統(tǒng)計代碼,定制打點記錄的方式,將用戶使用產(chǎn)品過程中的點擊行為,記錄并傳回后端服 務器(server),然后在后端sever做統(tǒng)一處理和統(tǒng)計,來獲取用戶對不同頁面的訪問熱度, 從而計算頁面的轉(zhuǎn)化率和流失率等頁面轉(zhuǎn)化參數(shù)。
[0004] 但是,現(xiàn)有技術中頁面轉(zhuǎn)化參數(shù)的處理采用在線上產(chǎn)品中額外添加統(tǒng)計代碼,為 了兼容添加的統(tǒng)計代碼的運行,通常需要修改線上產(chǎn)品的源代碼,導致線上產(chǎn)品的安全性 以及穩(wěn)定性較差。 【
【發(fā)明內(nèi)容】

[0005] 本發(fā)明提供了一種頁面轉(zhuǎn)化參數(shù)的處理方法及裝置,以實現(xiàn)對頁面轉(zhuǎn)化參數(shù)的處 理的同時,保證線上產(chǎn)品的安全性以及穩(wěn)定性。
[0006] 本發(fā)明提供一種頁面轉(zhuǎn)化參數(shù)的處理方法,所述方法包括:
[0007] 根據(jù)待分析的日志樣本,獲取每個用戶的映射訪問序列;
[0008] 根據(jù)各所述用戶的所述映射訪問序列,生成頁面訪問的鄰接矩陣;
[0009] 根據(jù)所述頁面訪問的鄰接矩陣,獲取各所述頁面的轉(zhuǎn)化參數(shù)。
[0010] 本發(fā)明還提供一種頁面轉(zhuǎn)化參數(shù)的處理裝置,所述裝置包括:
[0011]映射訪問序列獲取模塊,用于根據(jù)待分析的日志樣本,獲取每個用戶的映射訪問 序列;
[0012] 鄰接矩陣生成模塊,用于根據(jù)各所述用戶的所述映射訪問序列,生成頁面訪問的 鄰接矩陣;
[0013] 頁面的轉(zhuǎn)化參數(shù)獲取模塊,還用于根據(jù)所述頁面訪問的鄰接矩陣,獲取各所述頁 面的轉(zhuǎn)化參數(shù)。
[0014] 本發(fā)明的頁面轉(zhuǎn)化參數(shù)的處理方法及裝置,通過采用上述技術方案,實現(xiàn)根據(jù)待 分析的日志樣本即可以實現(xiàn)頁面的轉(zhuǎn)化參數(shù)的獲取,與現(xiàn)有技術相比,不需要修改線上產(chǎn) 品的源代碼,從而可以保證線上產(chǎn)品的安全性以及穩(wěn)定性。 【【附圖說明】】
[0015] 圖1為本發(fā)明的頁面轉(zhuǎn)化參數(shù)的處理方法實施例的流程圖。
[0016] 圖2為本發(fā)明實施例提供的一個應用產(chǎn)品的頁面轉(zhuǎn)化率關系圖。
[0017] 圖3為本發(fā)明的頁面轉(zhuǎn)化參數(shù)的處理裝置實施例一的結構示意圖。
[0018] 圖4為本發(fā)明的頁面轉(zhuǎn)化參數(shù)的處理裝置實施例二的結構示意圖。 【【具體實施方式】】
[0019] 為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖和具體實施例對 本發(fā)明進行詳細描述。
[0020] 圖1為本發(fā)明的頁面轉(zhuǎn)化參數(shù)的處理方法實施例的流程圖。如圖1所示,本實施例 的頁面轉(zhuǎn)化參數(shù)的處理方法,具體可以包括如下步驟:
[0021 ] 100、根據(jù)待分析的日志樣本,獲取每個用戶的映射訪問序列;
[0022] 本實施例的待分析的日志樣本可以從待分析頁面對應的網(wǎng)站的服務器來獲取,具 體可以網(wǎng)站的日志中獲取全部或者部分作為待分析的日志。該網(wǎng)站的日志中會記錄訪問該 網(wǎng)站內(nèi)網(wǎng)頁的所有用戶的日志信息,包括用戶字段集合以及每個用戶訪問該網(wǎng)站中的各個 頁面信息等等。
[0023] 本實施例中的映射訪問序列可以理解為采用索引的方式例如采用數(shù)字的方式,來 表示用戶的訪問序列。具體地,可以將待分析的日志樣本中各個頁面標識參數(shù)分別映射為 一個數(shù)字來表示,對應地,可以根據(jù)每個用戶的訪問頁面標識參數(shù)對應的頁面的順序,找出 該用戶的映射訪問序列。
[0024] 例如,該步驟100的一種實現(xiàn)方式,具體可以包括如下步驟:
[0025] (al)根據(jù)待分析的日志樣本,獲取每個用戶的訪問序列;
[0026] 本實施例的訪問序列包括對應的用戶按照訪問先后順序訪問的頁面標識參數(shù)。例 如本實施例的頁面標識參數(shù)可以包括統(tǒng)一資源定位符(Uniform Resource Locator ;URL)、 統(tǒng)一資源標識符(Uniform Resource Identifier;URI)、以及URI與頁面參數(shù)的組合中的任 意一種。
[0027] 本實施例中的頁面標識參數(shù)具體可以根據(jù)待分析的頁面的粒度來確定。例如當需 要對網(wǎng)站的每一個網(wǎng)頁作為一類進行分析時,每一個頁面的訪問作為一個訪問,此時對應 的頁面標識參數(shù)可以為頁面的URL。當放大待分析頁面的粒度,將多個具有共同特性的同一 類頁面的訪問作為同一訪問時,此時可以采用該類頁面對應的URI作為該類頁面的頁面標 識參數(shù)。如果采用URI無法準確定位到待分析的某一類頁面時,可以采用URI與頁面參數(shù)的 組合來唯一確定該類頁面,其中的頁面參數(shù)可以為該類頁面中URL中的參數(shù)信息。
[0028] (a2)將各用戶的訪問序列中的所有頁面標識參數(shù)匯總并去重,生成頁面詞典;
[0029] 由于不同用戶的訪問序列中的頁面標識參數(shù)可能會有重復,本實施例中,需要將 所有用戶的訪問序列中的所有頁面標識參數(shù)匯總并去重,得到包括所有頁面參數(shù)的頁面詞 典。
[0030] (a3)根據(jù)頁面詞典和各用戶的訪問序列,獲取各用戶的映射訪問序列。
[0031] 由于頁面詞典中包括有用戶的訪問序列的頁面標識參數(shù),為了便于記錄用戶的訪 問序列,可以將頁面詞典中的每一個頁面標識參數(shù)用一個數(shù)字來代替,這樣,可以根據(jù)頁面 詞典中每一個頁面標識參數(shù)對應的數(shù)字,將用戶的訪問序列也映射為數(shù)字格式的映射訪問 序列。
[0032]例如該步驟(a3)的一種實現(xiàn)方式,具體可以包括如下步驟:
[0033] (bl)為頁面詞典中各頁面標識參數(shù)標注對應的數(shù)字節(jié)點;
[0034]例如頁面詞典中的頁面標識參數(shù)A對應的數(shù)字節(jié)點為1,頁面標識參數(shù)B對應的數(shù) 字節(jié)點為2,以此類推,可以將頁面詞典中所有的頁面標識參數(shù)按照數(shù)字順序標注對應的數(shù) 字節(jié)點。
[0035] (b2)根據(jù)頁面詞典中各頁面標識參數(shù)對應的數(shù)字節(jié)點,將各用戶的訪問序列映射 為數(shù)字格式,得到各用戶的映射訪問序列。
[0036]例如根據(jù)上述處理,可以得到某用戶的映射訪問序列為1 - 3-5-7,表示該用戶 從數(shù)字節(jié)點1對應的頁面跳轉(zhuǎn)到數(shù)字節(jié)點3對應的頁面、再跳轉(zhuǎn)到數(shù)字節(jié)點5對應的頁面,再 跳轉(zhuǎn)到數(shù)字節(jié)點7對應的頁面,之后離開。
[0037] 101、根據(jù)各用戶的映射訪問序列,生成頁面訪問的鄰接矩陣;
[0038] 例如,鄰接矩陣是表示頂點之間相鄰關系的矩陣。本實施例的鄰接矩陣具體是根 據(jù)各用戶的映射訪問序列生成。各用戶的映射訪問序列中的各點形成了頁面訪問的鄰接矩 陣中的各頂點。由于各用戶的映射訪問序列表征了該用戶訪問的頁面的順序,因此本實施 例的頁面訪問的鄰接矩陣為有向鄰接矩陣。根據(jù)鄰接矩陣的特性,本實施例中將各用戶的 映射訪問序列中的頁面間的跳轉(zhuǎn)關系,一起體現(xiàn)在一鄰接矩陣中,得到該頁面訪問的鄰接 矩陣。
[0039]例如,該步驟101的一種實現(xiàn)方式,具體可以包括如下步驟:
[0040] (cl)建立鄰接矩陣模型;
[0041] 本實施例的鄰接矩陣模型的階數(shù)等于n+1,即該鄰接矩陣模型中,共包括n+1行,n+ 1列。其中n為頁面詞典中包括的頁面標識參數(shù)的總數(shù);鄰接矩陣模型中各元素初始值為0。 [0042] (c2)在各用戶的映射訪問序列的開頭和結尾分別增加數(shù)字節(jié)點0,作為對應的開 始頁面和結束頁面,以調(diào)整各用戶的映射訪問序列;
[0043] 該步驟(c2)和上述步驟(cl)可以沒有先后時序限制。為了便于鄰接矩陣的生成, 可以在用戶的映射訪問序列的開頭和結尾分別增加數(shù)字節(jié)點〇,表示開始訪問和訪問結束 的零頁面。例如,對于某用戶的映射訪問序列1-3-5-7,調(diào)整之后的映射訪問序列可以表 不為0~>1~>3~>5~>7~>0〇
[0044] (c3)按照調(diào)整后的各用戶的映射訪問序列的訪問順序,將對應的頁面的跳轉(zhuǎn)次數(shù) 累加在鄰接矩陣模型中對應的位置,得到頁面訪問的鄰接矩陣。
[0045] 例如,對于某用戶的映射訪問序列041-34547-0,用戶由數(shù)字節(jié)點0開始訪問 數(shù)字節(jié)點1對應的頁面,則在鄰接矩陣模型中第〇行第1列的位置累加1;然后用戶由數(shù)字節(jié) 點1對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點3對應的頁面,則在鄰接矩陣模型中第1行、第3列的位置累 加1;緊接著,該用戶再從數(shù)字節(jié)點3對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點7對應的頁面,則在鄰接矩 陣模型中第3行、第7列的位置累加1;最后用戶從數(shù)字節(jié)點7對應的頁面離開,則在鄰接矩陣 模型中第7行、第0列的位置累加1。按照上述方式,以此類推,可以將各用戶的映射訪問序 列,按照訪問順序,依次將對應的頁面的跳轉(zhuǎn)次數(shù)累加在鄰接矩陣模型中對應的位置,最終 得到頁面訪問的鄰接矩陣。
[0046]頁面訪問的鄰接矩陣中除去增加的數(shù)字節(jié)點0對應的頂點,有效地的頂點數(shù)為 vex,該vex等于頁面詞典中頁面標識參數(shù)的總數(shù)。本實施例中頁面訪問的鄰接矩陣的各頂 點采用數(shù)字節(jié)點來表示,每一個數(shù)字節(jié)點對應一個頁面標識參數(shù)。其中頁面訪問的鄰接矩 陣中每一個元素的值為對應位置的有向邊的數(shù)值,具體地,第p行第q列所對應的有向邊arc [P ][ q]的值等于數(shù)字節(jié)點P對應的頁面到數(shù)字節(jié)點q對應的頁面的跳轉(zhuǎn)數(shù)。
[0047] 頁面訪問的鄰接矩陣中的頂點入度表示該頂點對應的導入流量,在本實施例中表 示跳轉(zhuǎn)至該頂點對應的數(shù)字節(jié)點所對應的頁面的跳轉(zhuǎn)數(shù),具體等于頁面訪問的鄰接矩陣中 該數(shù)字節(jié)點對應的列的所有有向邊的值的和。例如頂點3對應的導入流量,即表示從其它頁 面跳轉(zhuǎn)至數(shù)字節(jié)點3對應的頁面的跳轉(zhuǎn)次數(shù)的和,可以包括從開始頁面的0頁面跳轉(zhuǎn)至數(shù)字 節(jié)點3對應的頁面的跳轉(zhuǎn)次數(shù)、從數(shù)字節(jié)點1對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點3對應的頁面的跳 轉(zhuǎn)次數(shù)、從數(shù)字節(jié)點2對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點3對應的頁面的跳轉(zhuǎn)次數(shù)等等,以此類推, 一直到數(shù)字節(jié)點n對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點3對應的頁面的跳轉(zhuǎn)次數(shù)的總和。在頁面訪問 的鄰接矩陣中,對應將i從〇到n的所有有向邊arc[i][3]取和,即;EC= narc[T||;3],得到該頂 點3對應的導入流量。
[0048] 頁面訪問的鄰接矩陣中的頂點出度表示該頂點對應的導出流量,在本實施例中, 表示從該頂點對應的數(shù)字節(jié)點所對應的頁面跳轉(zhuǎn)出去的跳轉(zhuǎn)數(shù)。具體等于頁面訪問的鄰接 矩陣中該數(shù)字節(jié)點對應的行的所有有向邊的值的和。例如頂點3對應的導出流量,即表示從 數(shù)字節(jié)點3對應的頁面跳轉(zhuǎn)至其它頁面的跳轉(zhuǎn)次數(shù)的和,可以包括從數(shù)字節(jié)點3對應的頁面 跳轉(zhuǎn)至結束頁面的0頁面的跳轉(zhuǎn)次數(shù)、從數(shù)字節(jié)點3對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點1對應的頁 面的跳轉(zhuǎn)次數(shù)、從數(shù)字節(jié)點3對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點2對應的頁面的跳轉(zhuǎn)次數(shù)等等,以 此類推,一直到從數(shù)字節(jié)點3對應的頁面跳轉(zhuǎn)至數(shù)字節(jié)點n對應的頁面的跳轉(zhuǎn)次數(shù)的總和。 在頁面訪問的鄰接矩陣中,對應將i從0到n的所有有向邊arc [3] [i ]取和,即 2f=0 arc[3] [i],得到頂點3對應的導出流量。
[0049] 頁面訪問的鄰接矩陣中的主對角線值表示用戶在對角線對應頁面的連續(xù)操作次 數(shù),例如搜索頁面的上用戶搜索完之后,搜索結果不滿意,可以直接改變搜索詞再次在該頁 面進行搜索,在URI為單位的分析粒度下,訪問的頁面可以不變。因此,訪問序列中包括有X -X的訪問,此時,對應的在頁面訪問的鄰接矩陣中對角線上的第X行第X列的數(shù)字節(jié)點的跳 轉(zhuǎn)次數(shù)累加1.。
[0050] 102、根據(jù)頁面訪問的鄰接矩陣,獲取各頁面的轉(zhuǎn)化參數(shù)。
[0051] 根據(jù)頁面訪問的鄰接矩陣可以獲取各頂點的導出流量、導入流量、該頂點對應的 頁面跳轉(zhuǎn)至其他某一頂點對應的頁面的跳轉(zhuǎn)次數(shù)、以及其他某一頂點對應的頁面跳轉(zhuǎn)至該 頂點對應的頁面的跳轉(zhuǎn)次數(shù),從而可以計算出該頁面的轉(zhuǎn)化參數(shù),例如該頁面的轉(zhuǎn)化參數(shù) 可以包括頁面的跳轉(zhuǎn)率和/或頁面的流失率。
[0052]例如,當頁面轉(zhuǎn)化參數(shù)包括頁面的跳轉(zhuǎn)率時,該步驟102具體包括:
[0053]根據(jù)頁面訪問的鄰接矩陣,計算數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié)點q對應的頁面的 跳轉(zhuǎn)率為:
[0055] 其中,arc[p][q]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié)點q對 應的頁面的跳轉(zhuǎn)數(shù);arc[p][i]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié)點 i對應的頁面的跳轉(zhuǎn)數(shù)。根據(jù)上述公式可以算出每一個數(shù)字節(jié)點P對應的頁面跳轉(zhuǎn)率,進而 可以根據(jù)網(wǎng)站中各網(wǎng)頁的跳轉(zhuǎn)率,指導產(chǎn)品頁面的優(yōu)化,以改善頁面的跳轉(zhuǎn)關系。例如圖2 為本發(fā)明實施例提供的一個應用產(chǎn)品的頁面轉(zhuǎn)化率關系圖。如圖2所示,根據(jù)現(xiàn)有的各頁面 的轉(zhuǎn)化率,可以建議增加頁面1、頁面3到頁面8對應節(jié)點的導流;還可以建議增加頁面6、頁 面9到其它頁面的導流,以改善頁面的跳轉(zhuǎn)關系、優(yōu)化該應用產(chǎn)品。
[0056] 當頁面轉(zhuǎn)化參數(shù)包括頁面的流失率時,該步驟102具體包括:
[0057] 根據(jù)頁面訪問的鄰接矩陣,計算數(shù)字節(jié)點p對應的頁面的用戶流失率為:
[0059] 其中,arc[p][0]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面的用戶流失數(shù); arc[p][i]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié)點i對應的頁面的跳轉(zhuǎn) 數(shù)。
[0060] 本實施例的頁面轉(zhuǎn)化參數(shù)的處理方法,通過采用上述技術方案,通過待分析的日 志樣本即可以實現(xiàn)頁面的轉(zhuǎn)化參數(shù)的獲取,與現(xiàn)有技術相比,不需要修改線上產(chǎn)品的源代 碼,從而可以保證線上產(chǎn)品的安全性以及穩(wěn)定性。
[0061] 而且現(xiàn)有技術由于需要修改線上產(chǎn)品的代碼,針對一個線上產(chǎn)品的修改的代碼通 常并不適用于其它線上產(chǎn)品,通用性較差。而本實施例的頁面轉(zhuǎn)化參數(shù)的處理方法,由于不 需要修改線上產(chǎn)品的源代碼,可以適用于所有線上產(chǎn)品,具有較強的通用性。
[0062] 而且現(xiàn)有技術中修改線上產(chǎn)品的代碼,統(tǒng)計各頁面的點擊情況之后,還需要經(jīng)過 復雜的計算方式計算頁面轉(zhuǎn)化參數(shù)。而本實施例的頁面轉(zhuǎn)化參數(shù)處理方法中,通過根據(jù)待 分析的日志樣本,獲取每個用戶的映射訪問序列,根據(jù)各用戶的映射訪問序列,生成頁面訪 問的鄰接矩陣;并根據(jù)頁面訪問的鄰接矩陣,獲取各頁面的轉(zhuǎn)化參數(shù)。與現(xiàn)有技術相比,獲 取頁面的轉(zhuǎn)化參數(shù)的過程不需要經(jīng)過復雜的計算,通過簡單的分析和計算即可實現(xiàn),獲取 頁面的轉(zhuǎn)化參數(shù)的效率非常高。
[0063] 而且現(xiàn)有技術僅能夠?qū)崿F(xiàn)對全網(wǎng)中每一個頁面進行分析,無法調(diào)整UV粒度,而本 實施例中,可以設置訪問壓面的頁面標識參數(shù)的粒度大小,調(diào)整分析粒度,提高分析精度和 效率。且根據(jù)本實施例的得到的頁面轉(zhuǎn)化參數(shù),可以進一步更加有效地指導產(chǎn)品頁面的優(yōu) 化,以改善頁面的跳轉(zhuǎn)關系。
[0064] 進一步可選地,在上述實施例的技術方案的基礎上,在步驟100之前,還可以包括: 獲取原始日志;對原始日志進行預處理,得到待分析的日志樣本。
[0065]本實施例中的原始日志可以為網(wǎng)站的服務器中記錄的日志。其中對原始日志進行 預處理,具體包括如下至少一種操作:
[0066]對原始日志進行過濾處理,去掉非真實用戶的日志;
[0067]對原始日志進行去燥處理;以及
[0068] 對原始日志按照設定的渠道類別或者流量類別進行過濾。
[0069] 其中對原始日志進行過濾處理,具體可以過濾掉原始日志中的非真實用戶的日 志,提高待分析日志樣本的有效性。對原始日志進行去燥處理,具體可以去除原始日志中時 間間隔很小的同一頁面的跳轉(zhuǎn)。因為時間間隔很小的跳轉(zhuǎn)可能是網(wǎng)絡不好,用戶刷新頁面 引起的,此時可以將刷新引起的同一頁面的多次訪問合并為一個頁面訪問。具體地,可以設 定一個時間閾值,當訪問同一頁面標識參數(shù)對應的頁面的時間間隔超出該時間閾值,說明 用戶已經(jīng)查看內(nèi)容之后的第二次訪問,如用戶使用某搜索引擎網(wǎng)站搜索某關鍵詞,用戶查 看結果之后,修改搜索關鍵詞繼續(xù)在該網(wǎng)站搜索。由于用戶查看第一次搜索結果需要一定 的時間,該時間間隔超出了設定的時間閾值,此時可以認為連續(xù)訪問該同一面標識參數(shù)對 應的頁面的兩次訪問就是兩次訪問。否則當時間間隔未超出設定的時間閾值,可以認為是 用戶在刷新頁面,連續(xù)訪問該同一面標識參數(shù)對應的頁面的兩次訪問合為一次訪問,具體 可以保留首次訪問,去掉后面的訪問。
[0070] 對原始日志按照設定的渠道類別或者流量類別進行過濾,具體可以根據(jù)分析需 求,如果本實施例的頁面轉(zhuǎn)換參數(shù)的處理可以根據(jù)渠道對原始日志進行過濾獲取待分析的 日志樣本,例如可以從原始日志中過濾出PC端的日志或者手機端的日志作為待分析的日志 樣本?;蛘哌€可以根據(jù)流量類別對原始日志進行過濾過濾出某種流量的用戶的日志,得到 待分析的日志樣本,與現(xiàn)有技術中僅能做全量用戶的統(tǒng)計分析相比,本實施例的技術方案 可以細化提取到某一渠道或者某一種流量進行頁面轉(zhuǎn)化參數(shù)的處理,提高頁面轉(zhuǎn)化參數(shù)的 處理精度。
[0071] 圖3為本發(fā)明的頁面轉(zhuǎn)化參數(shù)的處理裝置實施例一的結構示意圖。如圖3所示,本 實施例的頁面轉(zhuǎn)化參數(shù)的處理裝置,具體可以包括:映射訪問序列獲取模塊10、鄰接矩陣生 成模塊11和頁面的轉(zhuǎn)化參數(shù)獲取模塊12。
[0072] 其中映射訪問序列獲取模塊10用于根據(jù)待分析的日志樣本,獲取每個用戶的映射 訪問序列;鄰接矩陣生成模塊11用于根據(jù)映射訪問序列獲取模塊10獲取的各用戶的映射訪 問序列,生成頁面訪問的鄰接矩陣;頁面的轉(zhuǎn)化參數(shù)獲取模塊12還用于根據(jù)鄰接矩陣生成 模塊11生成的頁面訪問的鄰接矩陣,獲取各頁面的轉(zhuǎn)化參數(shù)。
[0073] 圖4為本發(fā)明的頁面轉(zhuǎn)化參數(shù)的處理裝置實施例二的結構示意圖。如圖2所示,本 實施例的頁面轉(zhuǎn)化參數(shù)的處理裝置在上述圖3所示實施例的技術方案的基礎上,進一步更 加詳細地介紹本發(fā)明的技術方案。
[0074] 如圖4所示,本實施例的頁面轉(zhuǎn)化參數(shù)的處理裝置中映射訪問序列獲取模塊10具 體可以包括:訪問序列獲取單元101、頁面詞典生成單元102和映射訪問序列獲取單元103。
[0075] 其中訪問序列獲取單元101用于根據(jù)待分析的日志樣本,獲取每個用戶的訪問序 列,該訪問序列包括對應的用戶按照訪問先后順序訪問的頁面標識參數(shù);頁面詞典生成單 元102用于將訪問序列獲取單元101獲取的各用戶的訪問序列中的所有頁面標識參數(shù)匯總 并去重,生成頁面詞典;映射訪問序列獲取單元103用于根據(jù)頁面詞典生成單元102生成的 頁面詞典和訪問序列獲取單元101獲取的各用戶的訪問序列,獲取各用戶的映射訪問序列。 [0076] 進一步可選地,其中的頁面標識參數(shù)包括URL、URI、以及URI與頁面參數(shù)的組合中 的任意一種。其中URL為一種具體的URI。
[0077]進一步可選地,映射訪問序列獲取單元103具體用于為頁面詞典生成單元102生成 的頁面詞典中各頁面標識參數(shù)標注對應的數(shù)字節(jié)點;根據(jù)頁面詞典生成單元102生成的頁 面詞典中各頁面標識參數(shù)對應的數(shù)字節(jié)點,將訪問序列獲取單元101獲取的各用戶的訪問 序列映射為數(shù)字格式,得到各用戶的映射訪問序列。
[0078] 進一步可選地,如圖4所示,本實施例的頁面轉(zhuǎn)化參數(shù)的處理裝置中,鄰接矩陣生 成模塊11具體可以包括:鄰接矩陣模型建立單元111、映射訪問序列調(diào)整單元112和累加處 理單元113。
[0079] 其中鄰接矩陣模型建立單元111用于建立鄰接矩陣模型,該鄰接矩陣模型的階數(shù) 等于n+1,其中n為頁面詞典中包括的頁面標識參數(shù)的總數(shù);鄰接矩陣模型中各元素為0;映 射訪問序列調(diào)整單元112用于在映射訪問序列獲取單元103獲取的各用戶的映射訪問序列 的開頭和結尾分別增加數(shù)字節(jié)點〇,作為對應的開始頁面和結束頁面,以調(diào)整各用戶的映射 訪問序列;累加處理單元113用于按照映射訪問序列調(diào)整單元112調(diào)整后的各用戶的映射訪 問序列的訪問順序,將對應的頁面的跳轉(zhuǎn)次數(shù)累加在鄰接矩陣模型建立單元111建立的鄰 接矩陣模型中對應的位置,得到頁面訪問的鄰接矩陣。
[0080] 進一步可選地,本實施例的頁面的轉(zhuǎn)化參數(shù)獲取模塊12具體用于當頁面轉(zhuǎn)化參數(shù) 包括頁面的跳轉(zhuǎn)率時,根據(jù)頁面訪問的鄰接矩陣,計算數(shù)字節(jié)點P對應的頁面到數(shù)字節(jié)點q 對應的頁面的跳轉(zhuǎn)率為:
[0082] 其中,arc[p][q]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié)點q對 應的頁面的跳轉(zhuǎn)數(shù);arc[p][i]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié)點 i對應的頁面的跳轉(zhuǎn)數(shù);
[0083] 或者頁面的轉(zhuǎn)化參數(shù)獲取模塊12具體還用于當頁面轉(zhuǎn)化參數(shù)包括頁面的流失率 時,根據(jù)頁面訪問的鄰接矩陣,計算數(shù)字節(jié)點P對應的頁面的用戶流失率為:
[0085]其中,arc[p][0]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面的用戶流失數(shù); arc[p][i]為頁面訪問的鄰接矩陣中數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié)點i對應的頁面的跳轉(zhuǎn) 數(shù)。
[0086]進一步可選地,如圖4所示,本實施例的頁面轉(zhuǎn)化參數(shù)的處理裝置中還包括:原始 日志獲取模塊13和預處理模塊14。
[0087]原始日志獲取模塊13用于獲取原始日志;預處理模塊14用于對原始日志獲取模塊 13獲取的原始日志進行預處理,得到待分析的日志樣本。
[0088]其中預處理模塊13具體用于執(zhí)行包括如下至少一種操作:
[0089]對原始日志進行過濾處理,去掉非真實用戶的日志;
[0090]對原始日志進行去燥處理;以及
[0091 ]對原始日志按照設定的渠道類別或者流量類別進行過濾。
[0092] 圖4所示實施例以包括上述所有方案為例描述本發(fā)明的技術方案,實際應用中,上 述結構可以采用可結合的方式任意組合,形成本發(fā)明的可選實施例,在此不再一一贅述。
[0093] 上述實施例的頁面轉(zhuǎn)化參數(shù)的處理裝置,通過采用上述模塊實現(xiàn)頁面轉(zhuǎn)化參數(shù)的 處理與上述相關方法實施例的實現(xiàn)機制以及技術效果相同,詳細可以參考上述相關方法實 施例的記載,在此不再贅述。
[0094]在本發(fā)明所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng),裝置和方法,可以 通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式。
[0095]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目 的。
[0096] 另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單 元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0097] 上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機可讀取存 儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機 設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)或處理器(processor)執(zhí)行本發(fā)明各個 實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(Read-Only Memory ,R0M)、隨機存取存儲器 (Random Access Memory ,RAM)、磁碟或者光盤等各種 可以存儲程序代碼的介質(zhì)。
[0098] 以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明保護的范圍之內(nèi)。
【主權項】
1. 一種頁面轉(zhuǎn)化參數(shù)的處理方法,其特征在于,所述方法包括: 根據(jù)待分析的日志樣本,獲取每個用戶的映射訪問序列; 根據(jù)各所述用戶的所述映射訪問序列,生成頁面訪問的鄰接矩陣; 根據(jù)所述頁面訪問的鄰接矩陣,獲取各所述頁面的轉(zhuǎn)化參數(shù)。2. 根據(jù)權利要求1所述的方法,其特征在于,根據(jù)待分析的日志樣本,獲取每個用戶的 映射訪問序列,包括: 根據(jù)所述待分析的日志樣本,獲取每個所述用戶的訪問序列,所述訪問序列包括對應 的所述用戶按照訪問先后順序訪問的頁面標識參數(shù); 將各所述用戶的訪問序列中的所有頁面標識參數(shù)匯總并去重,生成頁面詞典; 根據(jù)所述頁面詞典和各所述用戶的訪問序列,獲取各所述用戶的映射訪問序列。3. 根據(jù)權利要求2所述的方法,其特征在于,所述頁面標識參數(shù)包括統(tǒng)一資源定位符、 統(tǒng)一資源標識符、以及所述統(tǒng)一資源標識符與頁面參數(shù)的組合中的任意一種。4. 根據(jù)權利要求2所述的方法,其特征在于,根據(jù)所述頁面詞典和各所述用戶的訪問序 列,獲取各所述用戶的映射訪問序列,具體包括: 為所述頁面詞典中各所述頁面標識參數(shù)標注對應的數(shù)字節(jié)點; 根據(jù)所述頁面詞典中各所述頁面標識參數(shù)對應的所述數(shù)字節(jié)點,將各所述用戶的訪問 序列映射為數(shù)字格式,得到各所述用戶的映射訪問序列。5. 根據(jù)權利要求4所述的方法,其特征在于,根據(jù)各所述用戶的所述映射訪問序列,生 成頁面訪問的鄰接矩陣,具體包括: 建立鄰接矩陣模型,所述鄰接矩陣模型的階數(shù)等于n+1,其中所述n為所述頁面詞典中 包括的所述頁面標識參數(shù)的總數(shù);所述鄰接矩陣模型中各元素的初始值為〇; 在各所述用戶的所述映射訪問序列的開頭和結尾分別增加數(shù)字節(jié)點〇,作為對應的開 始頁面和結束頁面,以調(diào)整各所述用戶的所述映射訪問序列; 按照調(diào)整后的各所述用戶的所述映射訪問序列的訪問順序,將對應的頁面的跳轉(zhuǎn)次數(shù) 累加在所述鄰接矩陣模型中對應的位置,得到所述頁面訪問的鄰接矩陣。6. 根據(jù)權利要求4或5所述的方法,其特征在于,當所述頁面轉(zhuǎn)化參數(shù)包括頁面的跳轉(zhuǎn) 率時,根據(jù)所述頁面訪問的鄰接矩陣,獲取各所述頁面的轉(zhuǎn)化參數(shù),具體包括: 根據(jù)所述頁面訪問的鄰接矩陣,計算數(shù)字節(jié)點P對應的頁面到數(shù)字節(jié)點q對應的頁面的 跳轉(zhuǎn)率為:其中,所述arc[p][q]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié)點p對應的頁面到所述 數(shù)字節(jié)點q對應的頁面的跳轉(zhuǎn)數(shù);所述arc[p][i]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié) 點P對應的頁面到數(shù)字節(jié)點i對應的頁面的跳轉(zhuǎn)數(shù); 當所述頁面轉(zhuǎn)化參數(shù)包括頁面的流失率時,根據(jù)所述頁面訪問的鄰接矩陣,獲取各所 述頁面的轉(zhuǎn)化參數(shù),具體包括: 根據(jù)所述頁面訪問的鄰接矩陣,計算數(shù)字節(jié)點P對應的頁面的用戶流失率為:其中,所述arc[p][0]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié)點p對應的頁面的用戶 流失數(shù);所述arc[p][i]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié) 點i對應的頁面的跳轉(zhuǎn)數(shù)。7. 根據(jù)權利要求1-5任一所述的方法,其特征在于,根據(jù)待分析的日志樣本,獲取每個 用戶的映射訪問序列之前,所述方法還包括: 獲取原始日志; 對所述原始日志進行預處理,得到所述待分析的日志樣本。8. 根據(jù)權利要求7所述的方法,其特征在于,對所述原始日志進行預處理,具體包括如 下至少一種操作: 對所述原始日志進行過濾處理,去掉非真實用戶的日志; 對所述原始日志進行去燥處理;以及 對所述原始日志按照設定的渠道類別或者流量類別進行過濾。9. 一種頁面轉(zhuǎn)化參數(shù)的處理裝置,其特征在于,所述裝置包括: 映射訪問序列獲取模塊,用于根據(jù)待分析的日志樣本,獲取每個用戶的映射訪問序列; 鄰接矩陣生成模塊,用于根據(jù)各所述用戶的所述映射訪問序列,生成頁面訪問的鄰接 矩陣; 頁面的轉(zhuǎn)化參數(shù)獲取模塊,還用于根據(jù)所述頁面訪問的鄰接矩陣,獲取各所述頁面的 轉(zhuǎn)化參數(shù)。10. 根據(jù)權利要求9所述的裝置,其特征在于,所述映射訪問序列獲取模塊,具體包括: 訪問序列獲取單元,用于根據(jù)所述待分析的日志樣本,獲取每個所述用戶的訪問序列, 所述訪問序列包括對應的所述用戶按照訪問先后順序訪問的頁面標識參數(shù); 頁面詞典生成單元,用于將各所述用戶的訪問序列中的所有頁面標識參數(shù)匯總并去 重,生成頁面詞典; 映射訪問序列獲取單元,用于根據(jù)所述頁面詞典和各所述用戶的訪問序列,獲取各所 述用戶的映射訪問序列。11. 根據(jù)權利要求10所述的裝置,其特征在于,所述頁面標識參數(shù)包括統(tǒng)一資源定位 符、統(tǒng)一資源標識符、以及所述統(tǒng)一資源標識符與頁面參數(shù)的組合中的任意一種。12. 根據(jù)權利要求10所述的裝置,其特征在于,所述映射訪問序列獲取單元,具體用于: 為所述頁面詞典中各所述頁面標識參數(shù)標注對應的數(shù)字節(jié)點; 根據(jù)所述頁面詞典中各所述頁面標識參數(shù)對應的所述數(shù)字節(jié)點,將各所述用戶的訪問 序列映射為數(shù)字格式,得到各所述用戶的映射訪問序列。13. 根據(jù)權利要求12所述的裝置,其特征在于,所述鄰接矩陣生成模塊,具體包括: 鄰接矩陣模型建立單元,用于建立鄰接矩陣模型,所述鄰接矩陣模型的階數(shù)等于n+1, 其中所述n為所述頁面詞典中包括的所述頁面標識參數(shù)的總數(shù);所述鄰接矩陣模型中各元 素的初始值為〇; 映射訪問序列調(diào)整單元,用于在各所述用戶的所述映射訪問序列的開頭和結尾分別增 加數(shù)字節(jié)點0,作為對應的開始頁面和結束頁面,以調(diào)整各所述用戶的所述映射訪問序列; 累加處理單元,用于按照調(diào)整后的各所述用戶的所述映射訪問序列的訪問順序,將對 應的頁面的跳轉(zhuǎn)次數(shù)累加在所述鄰接矩陣模型中對應的位置,得到所述頁面訪問的鄰接矩 陣。14. 根據(jù)權利要求12或13所述的裝置,其特征在于,所述頁面的轉(zhuǎn)化參數(shù)獲取模塊,具 體用于當所述頁面轉(zhuǎn)化參數(shù)包括頁面的跳轉(zhuǎn)率時,根據(jù)所述頁面訪問的鄰接矩陣,計算數(shù) 字節(jié)點P對應的頁面到數(shù)字節(jié)點q對應的頁面的跳轉(zhuǎn)率為:其中,所述arc[p][q]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié)點p對應的頁面到所述 數(shù)字節(jié)點q對應的頁面的跳轉(zhuǎn)數(shù);所述arc[p][i]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié) 點P對應的頁面到數(shù)字節(jié)點i對應的頁面的跳轉(zhuǎn)數(shù); 或者所述頁面的轉(zhuǎn)化參數(shù)獲取模塊,具體還用于當所述頁面轉(zhuǎn)化參數(shù)包括頁面的流失 率時,根據(jù)所述頁面訪問的鄰接矩陣,計算數(shù)字節(jié)點P對應的頁面的用戶流失率為:其中,所述arc[p][0]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié)點p對應的頁面的用戶 流失數(shù);所述arc[p][i]為所述頁面訪問的鄰接矩陣中所述數(shù)字節(jié)點p對應的頁面到數(shù)字節(jié) 點i對應的頁面的跳轉(zhuǎn)數(shù)。15. 根據(jù)權利要求9-13任一所述的裝置,其特征在于,所述裝置還包括: 原始日志獲取模塊,用于獲取原始日志; 預處理模塊,用于對所述原始日志進行預處理,得到所述待分析的日志樣本。16. 根據(jù)權利要求15所述的裝置,其特征在于,所述預處理模塊,具體用于執(zhí)行包括如 下至少一種操作: 對所述原始日志進行過濾處理,去掉非真實用戶的日志; 對所述原始日志進行去燥處理;以及 對所述原始日志按照設定的渠道類別或者流量類別進行過濾。
【文檔編號】G06F17/30GK106055572SQ201610339765
【公開日】2016年10月26日
【申請日】2016年5月20日
【發(fā)明人】李曼, 覃健
【申請人】百度在線網(wǎng)絡技術(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1