一種基于多維標(biāo)識(shí)的數(shù)據(jù)采集方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種數(shù)據(jù)采集技術(shù)領(lǐng)域,尤其涉及一種基于多維標(biāo)識(shí)的數(shù)據(jù)采集方法。
【背景技術(shù)】
[0002]傳統(tǒng)網(wǎng)絡(luò)環(huán)境下,汽車、房地產(chǎn)等特殊行業(yè)客戶的采集捕獲數(shù)據(jù)變化的方式比較常見(jiàn)的是垂直門戶網(wǎng)上采集和線下采集,這里主要將網(wǎng)絡(luò)環(huán)境的門戶網(wǎng)站線上采集,垂直門戶網(wǎng)站通過(guò)網(wǎng)上團(tuán)購(gòu)、會(huì)員用戶注冊(cè)信息中抓取客戶基本信息。
[0003]通過(guò)數(shù)據(jù)采集技術(shù),網(wǎng)站將通過(guò)活動(dòng)鏈接方式,將用戶導(dǎo)流到團(tuán)購(gòu)或活動(dòng)申請(qǐng)界面,用戶通過(guò)注冊(cè)報(bào)名的方式,按網(wǎng)頁(yè)輸入框輸入姓名、聯(lián)系電話、預(yù)計(jì)訂單時(shí)間等,通過(guò)網(wǎng)頁(yè)對(duì)應(yīng)入口,用戶基本信息采集完成后(簡(jiǎn)稱源數(shù)據(jù)),源數(shù)據(jù)通過(guò)采集、上傳的方式來(lái)處理數(shù)據(jù)流,其工作原理是:客戶在網(wǎng)站填寫一份源數(shù)據(jù),所在網(wǎng)頁(yè)服務(wù)器負(fù)責(zé)收集并上傳數(shù)據(jù),并將描述客戶數(shù)據(jù)源的元數(shù)據(jù)即主題(共享數(shù)據(jù)模型)發(fā)布到一個(gè)或多個(gè)公共的信息目錄服務(wù)器,使有需求的一個(gè)或多個(gè)需求者可從信息目錄服務(wù)器獲得主題信息、基于主題通過(guò)組合裁剪等手段定向信息,并將客戶提交給平臺(tái)專題數(shù)據(jù)庫(kù)。
[0004]但是,網(wǎng)上數(shù)據(jù)采集技術(shù)存在如下問(wèn)題:
(一)、網(wǎng)站采集方式需要進(jìn)入門戶網(wǎng)站,找到活動(dòng)入口,在通過(guò)活動(dòng)宣傳網(wǎng)頁(yè),選擇申請(qǐng)報(bào)名,再進(jìn)入采集填寫入口,且采集填寫入口的數(shù)據(jù)為基本信息,無(wú)法實(shí)現(xiàn)精準(zhǔn)采集和后期的精準(zhǔn)分發(fā);
(二)使用采集入口觸發(fā)器方式捕獲數(shù)據(jù)變化主要是基礎(chǔ)信息,維度比較單一且精準(zhǔn)度不高,同時(shí)因維度單一,網(wǎng)站需要為每個(gè)源數(shù)據(jù)進(jìn)行二次篩選和加工,采集效率很低、精準(zhǔn)度低。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的是提供一種基于多維標(biāo)識(shí)的數(shù)據(jù)采集方法,該方法改變了傳統(tǒng)網(wǎng)頁(yè)數(shù)據(jù)采集的采集模式,由廣泛采集轉(zhuǎn)變?yōu)閰^(qū)域注冊(cè)用戶采集,由網(wǎng)頁(yè)采集轉(zhuǎn)變?yōu)橐苿?dòng)APP注冊(cè)認(rèn)證用戶的采集,避免了源數(shù)據(jù)的重復(fù)采集,讓源數(shù)據(jù)的更加精準(zhǔn)。
[0006]本發(fā)明實(shí)現(xiàn)其發(fā)明目的,所采用的技術(shù)方案是:
一種基于多維標(biāo)識(shí)的數(shù)據(jù)采集方法,包括以下步驟:
(I)、登陸認(rèn)證
在客戶端上輸入用戶信息,用戶管理服務(wù)器對(duì)用戶信息進(jìn)行認(rèn)證判斷,若認(rèn)證注冊(cè),則成功登陸,然后進(jìn)行下一步;
(2 )、訪問(wèn)業(yè)務(wù)服務(wù)器并拉取最新設(shè)置
成功登陸后,用戶管理服務(wù)器生成用戶token并返回給客戶端,同時(shí)用戶訪問(wèn)業(yè)務(wù)服務(wù)器,并向業(yè)務(wù)服務(wù)器拉取最新設(shè)置,然后返回客戶端進(jìn)行下一步;
(3)、填寫源數(shù)據(jù)用戶在最新設(shè)置中填寫源數(shù)據(jù),包括基礎(chǔ)標(biāo)識(shí)、選擇至少一個(gè)已看訂單型號(hào)、選擇至少一個(gè)意向訂單型號(hào)、時(shí)間標(biāo)識(shí),并將其發(fā)送到數(shù)據(jù)采集服務(wù)器;當(dāng)用戶調(diào)用源數(shù)據(jù)采集時(shí),數(shù)據(jù)采集服務(wù)器通過(guò)與用戶管理服務(wù)器關(guān)聯(lián),啟動(dòng)數(shù)據(jù)采集服務(wù)器,然后進(jìn)行下一步;
(4)、對(duì)基礎(chǔ)標(biāo)識(shí)進(jìn)行多維標(biāo)識(shí)采集
通過(guò)遍歷N日內(nèi)的歷史采集數(shù)據(jù),N由數(shù)據(jù)采集服務(wù)器設(shè)置,判斷源數(shù)據(jù)中基礎(chǔ)標(biāo)識(shí)是否存在;若基礎(chǔ)標(biāo)識(shí)存在,則進(jìn)行下一步;
(5)、對(duì)已看訂單型號(hào)進(jìn)行多維標(biāo)識(shí)采集
用戶選擇已看訂單型號(hào),將已看訂單型號(hào)作為意向訂單型號(hào)的比對(duì)標(biāo)識(shí),當(dāng)意向訂單型號(hào)標(biāo)識(shí)與已看訂單型號(hào)標(biāo)識(shí)不重復(fù)、不沖突時(shí),進(jìn)行下一步;
(6)、對(duì)時(shí)間標(biāo)識(shí)進(jìn)行多維標(biāo)識(shí)采集
通過(guò)調(diào)用時(shí)鐘服務(wù),選擇源數(shù)據(jù)的時(shí)間標(biāo)識(shí),對(duì)源數(shù)據(jù)進(jìn)行年、月、日、時(shí)刻的時(shí)間標(biāo)識(shí);然后進(jìn)行下一步;
(7)、對(duì)意向訂單型號(hào)進(jìn)行多維標(biāo)識(shí)采集
用戶選擇至少I個(gè)意向訂單型號(hào),然后將基礎(chǔ)標(biāo)識(shí)、時(shí)間標(biāo)識(shí)、已看訂單型號(hào)標(biāo)識(shí)、意向訂單型號(hào)標(biāo)識(shí)發(fā)送到數(shù)據(jù)采集服務(wù)器,完成源數(shù)據(jù)采集。
[0007]進(jìn)一步地,上述步驟(I)用戶管理服務(wù)器對(duì)用戶信息進(jìn)行認(rèn)證判斷,還包括:若無(wú)法登陸,則用戶未注冊(cè),用戶管理服務(wù)器收到未注冊(cè)提示。
[0008]進(jìn)一步地,上述步驟(4)對(duì)基礎(chǔ)標(biāo)識(shí)進(jìn)行多維標(biāo)識(shí)采集,還包括:通過(guò)遍歷N日內(nèi)的歷史采集數(shù)據(jù),NS數(shù)據(jù)采集服務(wù)器設(shè)置,判斷源數(shù)據(jù)中基礎(chǔ)標(biāo)識(shí)是否存在;若不存在則提示客戶端不可上傳分享,不將其發(fā)送到數(shù)據(jù)采集服務(wù)器。
[0009]進(jìn)一步地,上述步驟(5)對(duì)已看訂單型號(hào)進(jìn)行多維標(biāo)識(shí)采集,還包括:用戶選擇已看訂單型號(hào),將已看訂單型號(hào)作為意向訂單型號(hào)的比對(duì)標(biāo)識(shí),當(dāng)意向訂單型號(hào)標(biāo)識(shí)與已看訂單型號(hào)標(biāo)識(shí)重復(fù)、沖突時(shí),無(wú)法完成源數(shù)據(jù)采集。
[0010]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
(一)、本發(fā)明改變了傳統(tǒng)網(wǎng)頁(yè)數(shù)據(jù)采集的采集模式,由廣泛采集轉(zhuǎn)變?yōu)閰^(qū)域注冊(cè)用戶采集,由網(wǎng)頁(yè)采集轉(zhuǎn)變?yōu)橐苿?dòng)APP注冊(cè)認(rèn)證用戶的采集。
[0011](二)、本發(fā)明用戶上傳的客戶源數(shù)據(jù),發(fā)生在用戶與客戶就訂單意向進(jìn)行現(xiàn)場(chǎng)溝通、追蹤和深度溝通后的時(shí)間段,客戶意向行為已進(jìn)入訂單比價(jià)實(shí)施階段。
[0012](三)、本發(fā)明無(wú)論注冊(cè)用戶何時(shí)進(jìn)行源數(shù)據(jù)采集,平臺(tái)得到的都是具有多維標(biāo)識(shí)的精準(zhǔn)數(shù)據(jù),同時(shí)配合更新標(biāo)識(shí)位策略、優(yōu)先上傳機(jī)制、維度標(biāo)識(shí)數(shù)據(jù)剔重策略,避免了源數(shù)據(jù)的重復(fù)采集,讓源數(shù)據(jù)的更加精準(zhǔn)。
[0013]下面結(jié)合【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。
【具體實(shí)施方式】
實(shí)施例
[0014]本例的數(shù)據(jù)采集方法是這樣實(shí)現(xiàn)的:
1、登陸認(rèn)證
移動(dòng)APP用戶輸入手機(jī)號(hào)碼與密碼,用戶管理服務(wù)器判斷經(jīng)紀(jì)人狀態(tài)兩種狀態(tài):已注冊(cè)、未注冊(cè);未注冊(cè),則無(wú)法登陸,經(jīng)紀(jì)人收到未激活提示。
[0015]若已注冊(cè):成功登陸,用戶管理服務(wù)器生成用戶唯一token(記號(hào))并返回給手機(jī)端,然后訪問(wèn)業(yè)務(wù)服務(wù)器,向服務(wù)器拉取最新設(shè)置(包括:分享獎(jiǎng)勵(lì)值、可分享源數(shù)據(jù)、每一條源數(shù)據(jù)可選擇品牌數(shù)、今日已分享數(shù)、用戶關(guān)聯(lián)品牌、城市等基本信息),再返回手機(jī)APP端。
[0016]2、源數(shù)據(jù)采集調(diào)用:
移動(dòng)APP認(rèn)證通過(guò)的用戶填寫源數(shù)據(jù):包括基礎(chǔ)標(biāo)識(shí)(姓名、電話)、選擇已看訂單型號(hào)(必選I個(gè))、選擇意向訂單型號(hào)(必選I個(gè),