午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種用于藥店會員分析的H?RFM用戶建模方法及系統(tǒng)與流程

文檔序號:12125270閱讀:1479來源:國知局
一種用于藥店會員分析的H?RFM用戶建模方法及系統(tǒng)與流程
本發(fā)明涉及醫(yī)療健康數(shù)據(jù)分析與挖掘領(lǐng)域,具體涉及一種用于藥店會員分析的H-RFM用戶建模方法;此外,本發(fā)明還涉及一種用于藥店會員分析的H-RFM用戶建模系統(tǒng)。
背景技術(shù)
:會員是連鎖藥店最核心的資源,藥店通過多年積累下來的會員資料“堆積如山”,然而真正識得數(shù)據(jù)價值的藥店卻少之又少。一些藥店管理者對數(shù)據(jù)的認識還停留在會員檔案、銷售額等層次,對數(shù)據(jù)的深入挖掘、全面利用意識尚未形成。大部分藥店對會員管理采取的還是“胡子眉毛一把抓”的粗放式管理方法,在實際情況中體現(xiàn)在“會員日送雞蛋”和“群發(fā)短信”等活動上?!皶T日送雞蛋”等活動刺激了會員的短期沖動消費,但是會降低藥店在會員心中的品牌價值,“群發(fā)短信”則會招致非合適受眾的反感。這些粗放的會員管理方法從長遠來看都會導(dǎo)致會員流失,所以并不可取。實際上,會員管理中存在所謂的“二八定律”,即百分之二十的會員貢獻了百分之八十的利潤。因此利用大數(shù)據(jù)分析做用戶建模,對會員進行精細化分類,從而實現(xiàn)精準(zhǔn)而高效的會員管理。本發(fā)明將提出一種用于藥店會員管理的大數(shù)據(jù)用戶建模方法。技術(shù)實現(xiàn)要素:本發(fā)明要解決的技術(shù)問題在于提供一種用于藥店會員分析的H-RFM用戶建模方法,克服了現(xiàn)有技術(shù)的上述缺陷,利用大數(shù)據(jù)分析做用戶建模,對會員進行精細化分類和分析,從而實現(xiàn)精準(zhǔn)而高效的會員管理。為此,本發(fā)明還提供一種用于藥店會員分析的H-RFM用戶建模系統(tǒng)。零售數(shù)據(jù)中有三個神奇的要素,這三個要素構(gòu)成了數(shù)據(jù)分析最好的指標(biāo):最近一次消費(Recency,簡稱R)、消費頻率(Frequency,簡稱F)、消費金額(Monetary,簡稱M)。最近一次消費R意指上一次購買的時間,消費頻率F是顧客在限定期內(nèi)購買的次數(shù),消費金額M是顧客在限定期內(nèi)購買的金額或平均客單價。而在藥店這樣一個健康場景下,有別于其它零售行業(yè)的特點是會員的健康(Health,簡稱H)水平,因為從會員的角度來看,購買藥品的目的是為了改善健康。健康水平H是依據(jù)藥店會員的健康數(shù)據(jù)得到的一個量化指標(biāo),用于定量的描述會員的健康狀況,可以是單個的健康指標(biāo)也可以是多個健康指標(biāo)的加權(quán)和?;谒幍甑馁徦幱涗洿髷?shù)據(jù)和會員的健康大數(shù)據(jù)構(gòu)建用戶模型,本發(fā)明從以上四個維度健康水平H,最近一次消費R,消費頻率F,消費金額M完整地顯示一個藥店會員的輪廓,提供一種用于藥店會員分析的H-RFM用戶建模方法,這為個性化的溝通和服務(wù)提供了依據(jù)。同時,隨著時間的發(fā)展和數(shù)據(jù)的積累,四項指標(biāo)能夠越來越精確地判斷該會員的長期價值(甚至是終身價值)。所以,對于連鎖藥店來說,大數(shù)據(jù)用戶建模是一個不斷成長、貼近會員真實價值,并不斷助力會員管理的過程。為解決上述技術(shù)問題,本發(fā)明提供一種用于藥店會員分析的H-RFM用戶建模方法,采用基于健康水平H、消費近度R、消費頻度F和消費額度M的K均值K-means聚類方法進行聚類,并計算每個聚類會員的加權(quán)平均HRFM得分用來確定它們的會員終身價值CLV大小順序,以實現(xiàn)會員分類。作為本發(fā)明優(yōu)選的技術(shù)方案,該方法具體包括如下步驟:第一步,數(shù)據(jù)清洗:針對購藥記錄的特點,以天為單位整合每個會員的購藥信息,把同一天購藥信息整合并作為單次購藥信息,刪除干擾信息;第二步,特征提取:提取會員的健康水平H、消費近度R、消費頻度F和消費額度M特征;所述消費近度R是會員最近一次購藥時間距當(dāng)前研究時間的天數(shù)或該研究時間段內(nèi)的持續(xù)購藥天數(shù);所述消費頻度F是會員在研究時間段內(nèi)總的購藥次數(shù);所述消費額度M是會員在研究時間段的購藥單價或購藥總費用;第三步,加權(quán)處理:初步確定HRFM四者權(quán)重的初步比例關(guān)系;對特征進行兩兩比較得到相應(yīng)的評價矩陣,并進行相應(yīng)的調(diào)整以使其通過一致性檢驗;利用層次分析法求得HRFM四個特征的權(quán)重;第四步,聚類分析:利用K-means聚類算法對加權(quán)后的HRFM作聚類分析;第五步,類型定義:對每類會員標(biāo)準(zhǔn)化后的HRFM取平均,將平均值加權(quán)求和,得到相應(yīng)的加權(quán)后的會員終身價值CLV得分,并在此基礎(chǔ)上確定每類會員的終身價值大小排序;將每類會員的HRFM平均值和全部會員的HRFM平均值比較,得到每類會員的HRFM的變動情況用來分析該會員類別的性質(zhì),并結(jié)合每類會員的終身價值大小排序和藥店自身的運營經(jīng)驗定義會員類型。作為本發(fā)明優(yōu)選的技術(shù)方案,第一步中,所述干擾信息包括:有退藥記錄的會員;單次購藥金額很小的記錄;單次消費金額最大的5%的會員的記錄或者單次消費金額在一定金額以上的會員的記錄;數(shù)據(jù)重復(fù)記錄。作為本發(fā)明優(yōu)選的技術(shù)方案,第二步中,所述健康水平H是會員的BMI值、血壓級別和血糖級別的加權(quán)和,其計算如公式(1)所示:H=LevelBMI*WBMI+LevelBP*WBP+LevelBS*WBS(1)其中,LevelBMI、LevelBP和LevelBS分別是BMI值、血壓值和血糖值在系統(tǒng)中定義的級別,WBMI、WBP和WBS是BMI值、血壓值和血糖值的相應(yīng)權(quán)重。作為本發(fā)明優(yōu)選的技術(shù)方案,第二步中,對提取的所述健康水平H、消費近度R、消費頻度F和消費額度M特征進行標(biāo)準(zhǔn)化處理。所述標(biāo)準(zhǔn)化處理可以采用每個特征的標(biāo)準(zhǔn)分數(shù)來代替原來相應(yīng)特征的具體值。作為本發(fā)明優(yōu)選的技術(shù)方案,第四步中,所述K-means聚類算法,包括如下步驟:步驟1:隨機選取K個點作為K個聚類的初始中心點;步驟2:將每個樣本分配給與其距離最近的聚類;步驟3:更新每個聚類的中心點位置;步驟4:滿足終止條件則終止,否則回到步驟2;終止條件可以設(shè)置為每個聚類中心點位置幾乎不變動,即小于設(shè)定的閾值。作為本發(fā)明優(yōu)選的技術(shù)方案,第五步中,所述將平均值加權(quán)求和,按照公式(2)加權(quán)求和:CLVscore=NH*WH+NR*WR+NF*WF+NM*WM(2)其中,NH、NR、NF和NM分別代表標(biāo)準(zhǔn)化后的H、R、F、M值,WH、WR、WF和WM是對應(yīng)的權(quán)重。此外,本發(fā)明還提供一種實現(xiàn)上述方法的用于藥店會員分析的H-RFM用戶建模系統(tǒng),包括數(shù)據(jù)清洗模塊、特征提取模塊、加權(quán)處理模塊、聚類分析模塊以及類型定義模塊;所述數(shù)據(jù)清洗模塊用于整合每個會員每天購藥信息作為單次購藥信息,并刪除干擾信息;所述特征提取模塊用于提取會員的健康水平H、消費近度R、消費頻度F和消費額度M特征;所述消費近度R是會員最近一次購藥時間距當(dāng)前研究時間的天數(shù)或該研究時間段內(nèi)的持續(xù)購藥天數(shù);所述消費頻度F是會員在研究時間段內(nèi)總的購藥次數(shù);所述消費額度M是會員在研究時間段的購藥單價或購藥總費用;所述加權(quán)處理模塊用于確定初步確定健康水平H、消費近度R、消費頻度F和消費額度M四個特征的權(quán)重;所述聚類分析模塊用于利用K-means聚類算法對加權(quán)后的HRFM作聚類分析;所述類型定義模塊用于計算每個聚類會員的加權(quán)平均HRFM得分用來確定其會員終身價值CLV大小順序,以實現(xiàn)會員分類。根據(jù)以上提供的技術(shù)方案,與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:1、本發(fā)明將RFM模型引入藥店行業(yè),并根據(jù)藥店行業(yè)的特點引入會員的健康水平H,幫助藥店進行更加精確的會員分析;2、本發(fā)明考慮H-RFM四個指標(biāo)的權(quán)重,幫助藥店進行更加個性化的會員分析;3、本發(fā)明運用加權(quán)處理以及聚類分析方法來分析會員類別的性質(zhì),并在此基礎(chǔ)上定義會員類型,經(jīng)過多次實驗分析,得到了健康水平H以及會員終身價值CLV的經(jīng)驗公式,有利于更合理地、更準(zhǔn)確地對會員進行精細化分類。附圖說明下面結(jié)合附圖和實施例對本發(fā)明進一步說明。圖1是本發(fā)明的整體流程圖及系統(tǒng)模塊圖。圖2是本發(fā)明中K-means聚類算法流程圖。具體實施方式現(xiàn)在結(jié)合附圖對本發(fā)明作進一步詳細的說明。這些附圖均為簡化的示意圖,僅以示意方式說明本發(fā)明的基本結(jié)構(gòu),因此其僅顯示與本發(fā)明有關(guān)的構(gòu)成。本發(fā)明一種用于藥店會員分析的H-RFM用戶建模方法,采用基于健康水平H(Health)、消費近度R(Recency)、消費頻度F(Frequency)和消費額度M(Monetary)的K均值K-means聚類方法進行聚類,并計算每個聚類會員的加權(quán)平均HRFM得分用來確定它們的會員終身價值CLV(CustomerLifetimeValue)大小順序,以實現(xiàn)會員分類。該方法的整體流程如圖1所示,具體實現(xiàn)步驟如下:1)數(shù)據(jù)清洗針對購藥記錄的特點,以天為單位整合每個會員的購藥信息,把同一天購藥信息整合并作為單次購藥信息;刪除有退藥記錄的會員;刪除單次購藥金額很小的記錄;刪除單次消費金額最大的5%的會員的記錄或者刪除單次消費金額在一定金額以上的會員的記錄(這兩種情況一般為團體性而非個人購藥行為,此刪除處理,主要是想把團體性購藥行為與個人購藥行為分開討論,團體性購藥主要表現(xiàn)就是單次購藥金額很大),如發(fā)現(xiàn)有數(shù)據(jù)重復(fù)問題,去除重復(fù)記錄僅保留一條記錄即可。2)特征提取從會員基本信息表、血壓測量表和血糖測量表中分別提取會員的最新BMI值(體質(zhì)指數(shù)BMI=體重(kg)÷身高2(m))、血壓級別和血糖級別。本發(fā)明中BMI、血壓和血糖分級標(biāo)準(zhǔn),分別如表1、2和3所示。表1BMI分級標(biāo)準(zhǔn)BMI分級偏瘦-1<18.5正常-018.5-23.9偏胖-124-27.9肥胖-2>28表2血壓分級標(biāo)準(zhǔn)表3血糖分級標(biāo)準(zhǔn)H(Health)代表會員(顧客)健康水平,可以是單個的健康指標(biāo)也可以是多個健康指標(biāo)的加權(quán)和,在本方法中,H是會員的BMI值、血壓級別和血糖級別的加權(quán)和,如公式(1)所示。H=LevelBMI*WBMI+LevelBP*WBP+LevelBS*WBS(1)其中,LevelBMI、LevelBP和LevelBS分別是BMI值、血壓值(BP)和血糖值(BS)在系統(tǒng)中定義的級別,WBMI、WBP和WBS是相應(yīng)的BMI值、血壓值和血糖值的權(quán)重。比如可以將BMI值、血壓值和血糖值的權(quán)重比例關(guān)系確定為2:4:4,那么一個偏胖、二級高血壓但血糖正常的會員,他或她的H指標(biāo)值就是14。H=1*2+3*4+0*4=14R(Recency)是會員(顧客)最近一次購藥時間距當(dāng)前研究時間的天數(shù)或該研究時間段內(nèi)的持續(xù)購藥天數(shù)。F(Frequency)是會員(顧客)在研究時間段內(nèi)總的購藥次數(shù)。M(Monetary)是會員(顧客)在研究時間段的購藥單價或購藥總費用。由于不同特征的量綱不同,需要進行標(biāo)準(zhǔn)化處理,比如可以用每個特征的標(biāo)準(zhǔn)分數(shù)standardscore來代替原來相應(yīng)特征的具體值。標(biāo)準(zhǔn)分數(shù)(standardscore)也叫z分數(shù)(z-score),是一個分數(shù)與平均數(shù)的差再除以標(biāo)準(zhǔn)差的過程。用公式表示為:z=(x-μ)/σ。其中x為某一具體分數(shù),μ為平均數(shù),σ為標(biāo)準(zhǔn)差。3)加權(quán)處理考慮到藥店對HRFM各類特征的重視程度可能不同,因此可以對這四個不同特征賦予相應(yīng)的權(quán)重。在本方法中,采用專家咨詢的方式,結(jié)合藥店運營一線的調(diào)研反饋,初步確定HRFM四者權(quán)重的初步比例關(guān)系。比如對于某家藥店,它所采用的HRFM的權(quán)重比例關(guān)系為2:3:3:2。如果需要調(diào)整權(quán)值,可以對特征進行兩兩比較得到相應(yīng)的評價矩陣,并進行相應(yīng)的調(diào)整以使其通過一致性檢驗,然后利用層次分析法求得HRFM四個特征的權(quán)重。假設(shè)某家藥店所采用的HRFM評價矩陣如表4所示,該表對應(yīng)的一致性比例為0.055,小于0.1表明該矩陣的一致性可以接受,計算得到HRFM各指標(biāo)相對權(quán)重為(0.232,0.402,0.061,0.305)。表4示例評價矩陣HRFMH11/351R3151F1/51/511/5M11514)聚類分析利用K-means聚類算法對加權(quán)后的HRFM作聚類分析。在本方法中,依據(jù)藥店運營的經(jīng)驗和建議,來確定聚類的數(shù)目K值。K-means是非常經(jīng)典的聚類算法,其主要計算過程如圖2所示,包括如下步驟:步驟1:隨機選取K個點作為K個聚類的初始中心點;步驟2:將每個樣本分配給與其距離最近的聚類;步驟3:更新每個聚類的中心點位置;步驟4:滿足終止條件則終止,否則回到步驟2;終止條件可以設(shè)置為每個聚類中心點位置幾乎不變動,即小于設(shè)定的閾值。5)類型定義對每類會員標(biāo)準(zhǔn)化后的HRFM取平均,將平均值按照公式(2)加權(quán)求和,得到相應(yīng)的加權(quán)后的CLV得分,并在此基礎(chǔ)上確定每類會員的終身價值大小排序。CLVscore=NH*WH+NR*WR+NF*WF+NM*WM(2)其中,NH、NR、NF和NM分別代表標(biāo)準(zhǔn)化后的H、R、F、M值,WH、WR、WF和WM是對應(yīng)的權(quán)重。假設(shè)某家藥店的HRFM對應(yīng)的權(quán)重依次為0.2、-0.3、0.3和0.2,有兩個會員聚類,它們標(biāo)準(zhǔn)化后的HRFM平均值依次為(0.21,0.09,0.32,0.12)和(0.28,0.31,0.11,0.14)。前一個會員聚類的加權(quán)CLV得分為0.135大于后一個會員聚類的0.024,所以前一個會員聚類的會員終身價值CLVscore1大于后一個會員的CLVscore2。具體計算過程如下:CLVscore1=0.21*0.2-0.09*0.3+0.32*0.3+0.12*0.2=0.135CLVscore2=0.28*0.2-0.31*0.3+0.11*0.3+0.14*0.2=0.024將每類會員的HRFM平均值和全部會員的HRFM平均值比較,得到每類會員的HRFM的變動情況用來分析該會員類別的性質(zhì),并結(jié)合每類會員的終身價值大小排序和藥店自身的運營經(jīng)驗定義會員類型。例如某家藥店的重要挽留型會員的典型特征是R很大明顯高于平均水平表明距上次購藥有很長的一段時間了,M很大遠高于平均水平或H明顯高于平均水平。該家藥店全部會員的HRFM平均值依次為2.31、93.71、7.97和46.61,其中一個會員聚類的HRFM平均值依次為3.28、145.11、2.26和151.11。它的R值明顯大于全部會員的平均水平,有近5個月沒有來過藥店,但它的M值是全部會員的平均水平的3倍多,可以將此類會員定義為重要挽留會員。如圖1所示,本發(fā)明一種用于藥店會員分析的H-RFM用戶建模系統(tǒng),包括數(shù)據(jù)清洗模塊、特征提取模塊、加權(quán)處理模塊、聚類分析模塊以及類型定義;所述數(shù)據(jù)清洗模塊用于整合每個會員每天購藥信息作為單次購藥信息,并刪除干擾信息;所述特征提取模塊用于提取會員的健康水平H、消費近度R、消費頻度F和消費額度M特征;所述消費近度R是會員最近一次購藥時間距當(dāng)前研究時間的天數(shù)或該研究時間段內(nèi)的持續(xù)購藥天數(shù);所述消費頻度F是會員在研究時間段內(nèi)總的購藥次數(shù);所述消費額度M是會員在研究時間段的購藥單價或購藥總費用;所述加權(quán)處理模塊用于確定初步確定健康水平H、消費近度R、消費頻度F和消費額度M四個特征的權(quán)重;所述聚類分析模塊用于利用K-means聚類算法對加權(quán)后的HRFM作聚類分析;所述類型定義模塊用于計算每個聚類會員的加權(quán)平均HRFM得分用來確定其會員終身價值CLV大小順序,以實現(xiàn)會員分類。以上述依據(jù)本發(fā)明的理想實施例為啟示,通過上述的說明內(nèi)容,相關(guān)工作人員完全可以在不偏離本項發(fā)明技術(shù)思想的范圍內(nèi),進行多樣的變更以及修改。本項發(fā)明的技術(shù)性范圍并不局限于說明書上的內(nèi)容,必須要根據(jù)權(quán)利要求范圍來確定其技術(shù)性范圍。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1