一種智能比對(duì)的基因序列分析裝置的制造方法
【專利摘要】本發(fā)明公開了一種智能比對(duì)的基因序列分析裝置,本發(fā)明通過對(duì)醫(yī)院各種治療設(shè)備存儲(chǔ)的基因庫的設(shè)計(jì)出包含基因庫服務(wù)器、序列比對(duì)模塊、智能比拼模塊、健康分析模塊四部分。本裝置利用一定數(shù)量的標(biāo)準(zhǔn)用例基因作為標(biāo)準(zhǔn)基因序列,將用戶個(gè)人的基因序列與標(biāo)準(zhǔn)基因序列通過一定的比對(duì)生成進(jìn)行比對(duì),對(duì)相似度結(jié)果進(jìn)行分析,得出該用戶存在亞健康或者不健康的可能性結(jié)論,并給出生產(chǎn)生活指導(dǎo),用戶可以與好友進(jìn)行智能比對(duì),得出勝負(fù),以智能比對(duì)結(jié)果友好地提示用戶的基因潛在亞健康的概率高低,引起用戶自身的注意。
【專利說明】
一種智能比對(duì)的基因序列分析裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種全國(guó)性基因服務(wù)器中的基因序列分析裝置,具體涉及一種基于基 因序列比對(duì)的智能分析裝置。
【背景技術(shù)】
[0002] 基因是生物體的遺傳物質(zhì),它由特定的編碼序列決定生物體不同的性狀表現(xiàn)。人 類的諸多亞健康等疑難癥狀,與人類的基因密切相關(guān),如果我們能通過分析人的基因序列 來檢測(cè)是否有發(fā)生潛在的亞健康的可能,那么我們就能夠提前采取措施預(yù)防或,以達(dá)到更 好的效果,為社會(huì)造福。
[0003] 該技術(shù)的前提是基因測(cè)序技術(shù)和序列比對(duì)技術(shù),隨著生物信息科學(xué)的迅速發(fā)展基 因測(cè)序和序列比對(duì)的技術(shù)已經(jīng)非常先進(jìn),為基于基因序列比對(duì)的趣味性亞健康分析技術(shù)的 出現(xiàn)提供了可能。
[0004] 目前,隨著二代測(cè)序技術(shù)的日臻成熟,人類基因組測(cè)序已從開始的30億美金下降 到約1000美金。不久的將來就會(huì)實(shí)現(xiàn)數(shù)百美金甚至更低來測(cè)序一個(gè)人的整個(gè)基因組序列。 個(gè)性化基因序列分析,亞健康分析等與基因組信息相關(guān)的產(chǎn)業(yè)將隨著測(cè)序價(jià)格的下調(diào)呈井 噴式增長(zhǎng)。
[0005] 另一方面,隨著生活水平的提高,人們對(duì)于健康的生活方式越來越關(guān)心,通過基因 比對(duì)分析得到的對(duì)健康生活的指導(dǎo)性意義也越來越受歡迎。而且現(xiàn)在人們生活富足了,會(huì) 有更多的人愿意拿錢去測(cè)序自己的基因。
[0006] 隨著海量生物信息數(shù)據(jù)的涌現(xiàn),通過大量基因庫服務(wù)器中的個(gè)人生物信息數(shù)據(jù) (基因、蛋白質(zhì)序列)分析和生物信息數(shù)據(jù)將成為新的潮流。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明為了檢測(cè)可能會(huì)處于的某些由遺傳基因決定的亞健康狀態(tài),并提前采取相 應(yīng)措施進(jìn)展預(yù)防和防護(hù),提供一種智能比對(duì)的基因序列分析裝置,其利用一定數(shù)量的標(biāo)準(zhǔn) 用例基因作為標(biāo)準(zhǔn)基因序列,將用戶個(gè)人的基因序列與標(biāo)準(zhǔn)基因序列通過一定的比對(duì)生成 進(jìn)行比對(duì),對(duì)相似度結(jié)果進(jìn)行分析,得出該用戶患得某種亞健康的可能性結(jié)論,并給出健康 指導(dǎo)和日常生活建議。
[0008] 本發(fā)明所采用的技術(shù)方案為,一種智能比對(duì)的基因序列分析裝置,其特征在于,包 括:
[0009] 基因庫服務(wù)器,按照不同類別、不同程度存儲(chǔ)用戶個(gè)人的基因序列和標(biāo)準(zhǔn)用例的 基因序列;
[0010] 序列比對(duì)模塊,用于將用戶個(gè)人的基因序列與相對(duì)應(yīng)類別的標(biāo)準(zhǔn)用例的基因序列 進(jìn)行相似度比對(duì),并返回與標(biāo)準(zhǔn)用例的基因序列的相似度值;
[0011]智能比拼模塊,用于用戶之間相同類別的基因序列與標(biāo)準(zhǔn)用例的基因序列的相似 度比拼;
[0012] 健康分析模塊,用于通過分析某一類別的用戶個(gè)人的基因序列與標(biāo)準(zhǔn)用例的基因 序列在不同程度下的基因序列的相似度,得出用戶健康的發(fā)展趨勢(shì),并給出健康指導(dǎo)以及 日常生活建議;
[0013] 基因庫服務(wù)器具體包括:數(shù)據(jù)庫存儲(chǔ)單元、數(shù)據(jù)庫控制單元;
[0014] 數(shù)據(jù)庫存儲(chǔ)單元,用于存儲(chǔ)相互關(guān)聯(lián)的"用戶"、"基因類別"、"表現(xiàn)程度"信息,通 過合理的數(shù)據(jù)庫設(shè)計(jì),將標(biāo)準(zhǔn)用例的基因序列和用戶個(gè)人的基因序列與"表現(xiàn)程度"與"基 因類別"聯(lián)系,將標(biāo)準(zhǔn)用例的基因序列和用戶個(gè)人的基因序列與"用戶"相聯(lián)系;每個(gè)用戶只 能訪問自己的基因庫,不能訪問其他用戶的用戶個(gè)人的基因序列和標(biāo)準(zhǔn)用例的基因庫;
[0015] 數(shù)據(jù)庫控制單元,對(duì)數(shù)據(jù)庫存儲(chǔ)單元進(jìn)行添加、修改、刪除等操作;
[0016] 序列比對(duì)模塊包括:序列比對(duì)生成單元,用于用戶個(gè)人的基因序列與標(biāo)準(zhǔn)用例的 基因序列之間進(jìn)行相似度比對(duì),并提取將得到的相似度比對(duì)的結(jié)果進(jìn)行返回,智能比對(duì)生 成包括以下步驟:
[0017] 步驟1:對(duì)參與比對(duì)的兩條序列對(duì)進(jìn)行字母表劃分得到十個(gè)點(diǎn)位的特征向量;
[0018] 步驟2:通過十個(gè)點(diǎn)位的特征向量的數(shù)據(jù)期望的值,根據(jù)公式:
[0019] 通過標(biāo)準(zhǔn)用例的基因序列的標(biāo)準(zhǔn)數(shù)據(jù)期望的值1^進(jìn)行計(jì)算,得出與用戶個(gè)人的基 因序列的特征差,記A h,并根據(jù)下列公式對(duì)典型亞健康的平均數(shù)據(jù)期望kave的值通過下列 公式生成序列第i點(diǎn)位的分值信息:
[0020]
[0021]其中e為自然常數(shù);
[0022]通過得到的&1創(chuàng)建打分矩陣;
[0023] 步驟3:根據(jù)得到的打分矩陣打分;
[0024] 步驟4:對(duì)由步驟3得到的高于一定閾值的參與比對(duì)的兩條序列對(duì)進(jìn)行兩端延伸;
[0025] 步驟5:對(duì)由步驟4得到的高于一定閾值的參與比對(duì)的兩條序列對(duì)進(jìn)行評(píng)估,得出 最后的尚分片段;
[0026] 計(jì)算統(tǒng)計(jì)單元,用于統(tǒng)計(jì)由步驟5得出的高分片段,并根據(jù)參與比對(duì)的參與比對(duì)的 兩條序列對(duì)的長(zhǎng)度計(jì)算出相似度值;
[0027]智能比拼模塊具體包括:
[0028]智能比對(duì)單元,用于用戶之間進(jìn)行相同類型基因的比拼,即以各自帳戶里的用戶 個(gè)人的基因序列與標(biāo)準(zhǔn)用例的基因序列的比對(duì)值為比拼依據(jù),按分值的高低分出勝負(fù),從 分?jǐn)?shù)中得出勝者可能向該基因的表達(dá)性狀發(fā)展趨勢(shì)更大,記為智能比對(duì)結(jié)果并記錄;
[0029]健康分析模塊具體包括:
[0030] 健康分析單元,用于在用戶的各自帳戶里分析用戶個(gè)人的基因序列與對(duì)應(yīng)類別下 全部程度的標(biāo)準(zhǔn)用例的基因序列的比對(duì)結(jié)果值,比對(duì)結(jié)果值的目的是分析用戶的用戶個(gè)人 的基因序列是否與某種亞健康的基因序列類似,如果類似,記為A,并生成目前用戶個(gè)人身 體狀態(tài)要達(dá)到這種亞健康程序所需要的時(shí)間^和可能性μ,以及這種亞健康通常持續(xù)時(shí)間 t2,根據(jù)不同的用戶特征把類似A、tjPt2與這種亞健康進(jìn)行進(jìn)行映射,其映射公式f(A)為:
[0031]
[0032] 從而得出用戶由某一類型基因決定的潛在的亞健康發(fā)展趨勢(shì),并將潛在的亞健康 發(fā)展趨勢(shì)結(jié)果返回;由于用戶個(gè)人的基因序列受環(huán)境控制容易產(chǎn)生變化,可以將映射公式f (A)為存儲(chǔ)在一個(gè)可以查詢的循環(huán)鏈表,用于序列表的匹配,如果發(fā)生個(gè)人基因序列的異常 狀態(tài),便把結(jié)果發(fā)送給指導(dǎo)建議單元;
[0033] 指導(dǎo)建議單元,用于針對(duì)健康分析單元所得出的結(jié)果,給出合理的健康生活指導(dǎo), 以及生活生產(chǎn)建議。
【附圖說明】
[0034]圖1為本發(fā)明的結(jié)構(gòu)示意圖;
【具體實(shí)施方式】
[0035] 為了使本發(fā)明所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚明白,以下結(jié) 合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行詳細(xì)的說明。應(yīng)當(dāng)說明的是,此處所描述的具體實(shí)施例僅用 以解釋本發(fā)明,并不用于限定本發(fā)明,能實(shí)現(xiàn)同樣功能的產(chǎn)品屬于等同替換和改進(jìn),均包含 在本發(fā)明的保護(hù)范圍之內(nèi)。具體方法如下:
[0036] 實(shí)施例1:如圖1所示,本發(fā)明通過對(duì)醫(yī)院治療設(shè)備存儲(chǔ)的基因庫的改造,可以實(shí)現(xiàn) 包含基因庫服務(wù)器、序列比對(duì)模塊、智能比拼模塊、健康分析模塊,共四大部分?;驇旆?wù) 器,用于按不同類別、不同程度存儲(chǔ)標(biāo)準(zhǔn)用例的基因序列和用戶個(gè)人的基因序列;序列比對(duì) 模塊,用于將用戶個(gè)人的基因序列與對(duì)應(yīng)類別的標(biāo)準(zhǔn)用例的基因序列進(jìn)行相似度比對(duì),并 返回與每一種程度的標(biāo)準(zhǔn)用例的基因序列的相似度值;智能比拼模塊,用于用戶之間相同 類別的基因序列與標(biāo)準(zhǔn)用例的基因序列的相似度比拼;健康分析模塊,用于通過分析用戶 的某一類別的基因序列與標(biāo)準(zhǔn)用例的基因序列不同程度下的基因序列的相似度,得出用戶 健康的發(fā)展趨勢(shì),并給出健康指導(dǎo)以及日常生活建議。
[0037] 本實(shí)施例開始前應(yīng)該先由技術(shù)使用不同的亞健康基因方式選擇一定數(shù)量的足夠 標(biāo)準(zhǔn)用例患病人群,抽取血樣,通過各種通信方式進(jìn)行全國(guó)范圍內(nèi)的基因庫構(gòu)建,并通過調(diào) 用基因庫服務(wù)器將得到的基因序列,按照不同的亞健康、不同的表現(xiàn)程度上傳到基因庫服 務(wù)器中。
[0038] 用戶首先要在基因測(cè)序公司或醫(yī)院的各種設(shè)備測(cè)序自己的基因序列,并轉(zhuǎn)換成與 本基于基因序列智能比對(duì)的健康分析裝置要求相符的文件。然后在本基于基因序列智能比 對(duì)的健康分析裝置注冊(cè)賬號(hào)并登錄,然后進(jìn)入醫(yī)院的設(shè)備個(gè)人中心的個(gè)人基因庫,按照相 應(yīng)的基因類別上傳自己的基因序列文件,此時(shí)基因庫服務(wù)器中的數(shù)據(jù)庫單元使用相應(yīng)的操 作方法將序列文件保存到數(shù)據(jù)庫中,并與用戶賬號(hào)和基因類別關(guān)聯(lián)。
[0039] 序列比對(duì)模塊中的序列比對(duì)生成單元,通過數(shù)據(jù)庫模塊將某一類別下的用戶個(gè)人 的基因序列和標(biāo)準(zhǔn)用例的基因序列從數(shù)據(jù)庫中查詢出來,把用戶個(gè)人的基因序列與每個(gè)表 現(xiàn)程度下的標(biāo)準(zhǔn)用例的基因序列一一進(jìn)行比對(duì)。具體流程如下:對(duì)參與比對(duì)的兩條序列進(jìn) 行劃分字母表;然后創(chuàng)建合理的打分矩陣;把兩條序列的基因序列進(jìn)行一一比對(duì)并根據(jù)打 分矩陣打分;得到的高于一定閾值的序列對(duì)進(jìn)行兩端延伸,并再次打分,高于一定閾值的序 列對(duì)進(jìn)行評(píng)估,得出最后的高分片段。計(jì)算統(tǒng)計(jì)單元根據(jù)參與比對(duì)的序列的長(zhǎng)度計(jì)算出相 似度值,將每一表現(xiàn)程度下的比對(duì)結(jié)果求取平均值,然后每個(gè)表現(xiàn)程度的平均值再經(jīng)過計(jì) 算求得各自所占的比例,得出每一種表現(xiàn)程度的概率作為最后結(jié)果統(tǒng)計(jì)出,并保存在數(shù)據(jù) 庫中,與用戶關(guān)聯(lián)。
[0040] 基因庫服務(wù)器,按照不同類別、不同程度存儲(chǔ)用戶個(gè)人的基因序列和標(biāo)準(zhǔn)用例的 基因序列;
[0041] 序列比對(duì)模塊,用于將用戶個(gè)人的基因序列與相對(duì)應(yīng)類別的標(biāo)準(zhǔn)用例的基因序列 進(jìn)行相似度比對(duì),并返回與標(biāo)準(zhǔn)用例的基因序列的相似度值;
[0042] 智能比拼模塊,用于用戶之間相同類別的基因序列與標(biāo)準(zhǔn)用例的基因序列的相似 度比拼;
[0043] 健康分析模塊,用于通過分析某一類別的用戶個(gè)人的基因序列與標(biāo)準(zhǔn)用例的基因 序列在不同程度下的基因序列的相似度,得出用戶健康的發(fā)展趨勢(shì),并給出健康指導(dǎo)以及 日常生活建議;
[0044] 基因庫服務(wù)器具體包括:數(shù)據(jù)庫存儲(chǔ)單元、數(shù)據(jù)庫控制單元;
[0045] 數(shù)據(jù)庫存儲(chǔ)單元,用于存儲(chǔ)相互關(guān)聯(lián)的"用戶"、"基因類別"、"表現(xiàn)程度"信息,通 過合理的數(shù)據(jù)庫設(shè)計(jì),將標(biāo)準(zhǔn)用例的基因序列和用戶個(gè)人的基因序列與"表現(xiàn)程度"與"基 因類別"聯(lián)系,將標(biāo)準(zhǔn)用例的基因序列和用戶個(gè)人的基因序列與"用戶"相聯(lián)系;每個(gè)用戶只 能訪問自己的基因庫,不能訪問其他用戶的用戶個(gè)人的基因序列和標(biāo)準(zhǔn)用例的基因庫;
[0046] 數(shù)據(jù)庫控制單元,對(duì)數(shù)據(jù)庫存儲(chǔ)單元進(jìn)行添加、修改、刪除等操作;
[0047] 序列比對(duì)模塊包括:序列比對(duì)生成單元,用于用戶個(gè)人的基因序列與標(biāo)準(zhǔn)用例的 基因序列之間進(jìn)行相似度比對(duì),并提取將得到的相似度比對(duì)的結(jié)果進(jìn)行返回,智能比對(duì)生 成包括以下步驟:
[0048] 步驟1:對(duì)參與比對(duì)的兩條序列對(duì)進(jìn)行字母表劃分得到十個(gè)點(diǎn)位的特征向量;
[0049] 步驟2:通過十個(gè)點(diǎn)位的特征向量的數(shù)據(jù)期望的值,根據(jù)公式:
[0050] 通過標(biāo)準(zhǔn)用例的基因序列的標(biāo)準(zhǔn)數(shù)據(jù)期望的值1^進(jìn)行計(jì)算,得出與用戶個(gè)人的基 因序列的特征差,記A h,并根據(jù)下列公式對(duì)典型亞健康的平均數(shù)據(jù)期望kave的值通過下列 公式生成序列第i點(diǎn)位的分值信息:
[0051]
[0052]其中e為自然常數(shù);
[0053]通過得到的ai創(chuàng)建打分矩陣;
[0054]步驟3:根據(jù)得到的打分矩陣打分;
[0055] 步驟4:對(duì)由步驟3得到的高于一定閾值的參與比對(duì)的兩條序列對(duì)進(jìn)行兩端延伸;
[0056] 步驟5:對(duì)由步驟4得到的高于一定閾值的參與比對(duì)的兩條序列對(duì)進(jìn)行評(píng)估,得出 最后的尚分片段;
[0057] 計(jì)算統(tǒng)計(jì)單元,用于統(tǒng)計(jì)由步驟5得出的高分片段,并根據(jù)參與比對(duì)的參與比對(duì)的 兩條序列對(duì)的長(zhǎng)度計(jì)算出相似度值;
[0058]用戶軟件平臺(tái)搜索其他用戶,并互相加為好友,則可以使用智能比拼模塊進(jìn)行相 同類別基因的比拼。智能比拼模塊中的智能比對(duì)單元兩個(gè)用戶的相同類別的基因比對(duì)結(jié)果 進(jìn)行比較,得出勝負(fù),以智能比對(duì)結(jié)果友好地提示用戶的基因潛在患病的概率高低,引起用 戶自身的注意。
[0059] 在實(shí)際中智能比拼模塊具體包括:智能比對(duì)單元,用于用戶之間進(jìn)行相同類型基 因的比拼,即以通過基因庫設(shè)備中各自帳戶里的用戶個(gè)人的基因序列與標(biāo)準(zhǔn)用例的基因序 列的比對(duì)值為比拼依據(jù),按分值的高低分出勝負(fù),從分?jǐn)?shù)中得出勝者可能向該基因的表達(dá) 性狀發(fā)展趨勢(shì)更大,記為智能比對(duì)結(jié)果并記錄;
[0060] 健康分析模塊具體包括:健康分析單元,用于在用戶的各自帳戶里分析用戶個(gè)人 的基因序列與對(duì)應(yīng)類別下全部程度的標(biāo)準(zhǔn)用例的基因序列的比對(duì)結(jié)果值,比對(duì)結(jié)果值的目 的是分析用戶的用戶個(gè)人的基因序列是否與某種亞健康類似,如果類似,記為A,并生成目 前用戶個(gè)人身體狀態(tài)要達(dá)到這種亞健康程序所需要的時(shí)間七和可能性μ以及這種亞健康通 常治療時(shí)間t 2,根據(jù)不同的用戶特征把類似A、tjPt2與這種亞健康進(jìn)行進(jìn)行映射,其映射公 式f(A)為:
[0061]
[0062] 從而得出用戶由某一類型基因決定的潛在的健康發(fā)展趨勢(shì),并將潛在的健康發(fā)展 趨勢(shì)結(jié)果返回;
[0063] 健康分析模塊的健康分析單元分析用戶個(gè)人的基因序列與對(duì)應(yīng)類別下全部程度 的標(biāo)準(zhǔn)用例的基因序列的比對(duì)結(jié)果值,得出用戶由該類型基因決定的潛在的健康發(fā)展趨 勢(shì);指導(dǎo)建議單元專業(yè)的角度針對(duì)該結(jié)果給出合理的健康生活指導(dǎo),以及日常生活建議。
[0064] 實(shí)施例2:如圖1所示,一種基于序列比對(duì)的趣味性健康分析裝置,包括基因庫服務(wù) 器,用于按不同類別、不同程度存儲(chǔ)標(biāo)準(zhǔn)用例的基因序列和用戶個(gè)人的基因序列;
[0065] 序列比對(duì)模塊,用于將用戶個(gè)人的基因序列與對(duì)應(yīng)類別的標(biāo)準(zhǔn)用例的基因序列進(jìn) 行相似度比對(duì),并返回與每一種程度的標(biāo)準(zhǔn)用例的基因序列的相似度值;
[0066] 智能比拼模塊,用于用戶之間相同類別的基因序列與標(biāo)準(zhǔn)用例的基因序列的相似 度比拼;
[0067] 健康分析模塊,用于通過分析用戶的某一類別的基因序列與標(biāo)準(zhǔn)用例的基因序列 不同程度下的基因序列的相似度,得出用戶健康的發(fā)展趨勢(shì),并給出健康指導(dǎo)以及日常生 活建議。
[0068] 首先技術(shù)使用方要通過基因存儲(chǔ)設(shè)備按照不同的亞健康選擇一定數(shù)量的足夠標(biāo) 準(zhǔn)用例患病人群,抽取血樣,進(jìn)行基因測(cè)序。將得到的基因序列,按照不同的亞健康、不同的 表現(xiàn)程度上傳到基因庫服務(wù)器中。用戶取自己的血樣測(cè)序基因,并將自己的基因序列按照 相應(yīng)分類上傳到自己的基因庫中。
[0069] 基因序列比對(duì)模塊將用戶上傳的基因序列與基因庫中相應(yīng)分類的各個(gè)程度標(biāo)準(zhǔn) 基因序列使用智能比對(duì)序列比對(duì)生成進(jìn)行比對(duì)。某一類別的亞健康下有多個(gè)表現(xiàn)程度,每 個(gè)表現(xiàn)程度下有多個(gè)基因序列,每個(gè)基因序列都與用戶基因序列比對(duì),每個(gè)表現(xiàn)程度的多 個(gè)相似度結(jié)果求得平均值,每個(gè)表現(xiàn)程度的平均值再經(jīng)過計(jì)算求得各自所占的比例,得出 每一種表現(xiàn)程度的概率作為最后結(jié)果統(tǒng)計(jì)出,并保存在用戶的數(shù)據(jù)庫中。
[0070] 用戶可以與好友進(jìn)行智能比對(duì)比拼,兩個(gè)用戶的相同類別的基因比對(duì)結(jié)果進(jìn)行比 較,得出勝負(fù),以智能比對(duì)結(jié)果友好地提示用戶的基因潛在患病的概率高低,引起用戶自身 的注意。
[0071] 健康分析模塊分析用戶個(gè)人的基因序列與對(duì)應(yīng)類別下全部程度的標(biāo)準(zhǔn)用例的基 因序列的比對(duì)結(jié)果值,得出用戶由該類型基因決定的潛在的健康發(fā)展趨勢(shì),并以專業(yè)的角 度針對(duì)該結(jié)果給出合理的健康生活指導(dǎo),以及日常生活建議。
[0072]本發(fā)明的有益效果是,可以利用先進(jìn)的技術(shù)分析亞健康導(dǎo)致的基因序列變化的可 能性和用戶身體健康的發(fā)展趨勢(shì),并給出合理的生活指導(dǎo)和日常生活建議,及時(shí)采取措施 預(yù)防和治療亞健康,為社會(huì)造福。
【主權(quán)項(xiàng)】
1. 一種智能比對(duì)的基因序列分析裝置,其特征在于,包括: 基因庫服務(wù)器,按照不同類別、不同程度存儲(chǔ)用戶個(gè)人的基因序列和標(biāo)準(zhǔn)用例的基因 序列; 序列比對(duì)模塊,用于將所述用戶個(gè)人的基因序列與相對(duì)應(yīng)類別的所述標(biāo)準(zhǔn)用例的基因 序列進(jìn)行相似度比對(duì),并返回與標(biāo)準(zhǔn)用例的基因序列的相似度值; 智能比拼模塊,用于用戶之間相同類別的基因序列與所述標(biāo)準(zhǔn)用例的基因序列的相似 度比拼; 健康分析模塊,用于通過分析某一類別的所述用戶個(gè)人的基因序列與所述標(biāo)準(zhǔn)用例的 基因序列在不同程度下的基因序列的相似度,得出用戶亞健康的發(fā)展趨勢(shì),并給出健康指 導(dǎo)W及日常生活建議; 所述基因庫服務(wù)器具體包括:數(shù)據(jù)庫存儲(chǔ)單元、數(shù)據(jù)庫控制單元; 所述數(shù)據(jù)庫存儲(chǔ)單元,用于存儲(chǔ)相互關(guān)聯(lián)的"用戶"、"基因類別"、"表現(xiàn)程度"信息,通 過合理的數(shù)據(jù)庫設(shè)計(jì),將所述用戶個(gè)人的基因序列和所述標(biāo)準(zhǔn)用例的基因序列與所述"表 現(xiàn)程度"與所述"基因類別"聯(lián)系,將所述用戶個(gè)人的基因序列和所述標(biāo)準(zhǔn)用例的基因序列 與所述"用戶'相聯(lián)系;每個(gè)用戶只能訪問自己的基因庫,不能訪問基因庫服務(wù)器中其他用 戶的所述用戶個(gè)人的基因序列和標(biāo)準(zhǔn)用例的基因序列; 所述數(shù)據(jù)庫控制單元,對(duì)所述數(shù)據(jù)庫存儲(chǔ)單元進(jìn)行添加、修改、刪除等操作; 所述序列比對(duì)模塊包括:序列比對(duì)生成單元,用于所述用戶個(gè)人的基因序列與所述標(biāo) 準(zhǔn)用例的基因序列之間進(jìn)行相似度比對(duì),并提取將得到的所述相似度比對(duì)的結(jié)果進(jìn)行返 回,智能比對(duì)生成包括W下步驟: 步驟1:對(duì)所述參與比對(duì)的兩條序列對(duì)進(jìn)行字母表劃分得到十個(gè)點(diǎn)位的特征向量; 步驟2:通過十個(gè)點(diǎn)位的特征向量的數(shù)據(jù)期望的值ki,根據(jù)公式: 通過對(duì)所述十個(gè)點(diǎn)位的特征向量的數(shù)據(jù)期望的值ki進(jìn)行計(jì)算,得出與所述標(biāo)準(zhǔn)用例的 基因序列的標(biāo)準(zhǔn)數(shù)據(jù)期望的值kp的特征差,記Aki,并根據(jù)對(duì)所述用戶個(gè)人的基因序列的平 均數(shù)據(jù)期望kave的值通過下列公式生成序列第i點(diǎn)位的分值信息:其中e為自然常數(shù); 通過得到的所述曰1創(chuàng)建打分矩陣; 步驟3:根據(jù)得到的所述打分矩陣打分; 步驟4:對(duì)由步驟3得到的高于一定闊值的所述參與比對(duì)的兩條序列對(duì)進(jìn)行兩端延伸; 步驟5:對(duì)由步驟4得到的高于一定闊值的所述參與比對(duì)的兩條序列對(duì)進(jìn)行評(píng)估,得出 最后的局分片段; 計(jì)算統(tǒng)計(jì)單元,用于統(tǒng)計(jì)由所述步驟5得出的高分片段,并根據(jù)參與比對(duì)的所述參與比 對(duì)的兩條序列對(duì)的長(zhǎng)度計(jì)算出相似度值; 所述智能比拼模塊具體包括: 智能比對(duì)單元,用于用戶之間進(jìn)行相同類型基因的比拼,即W各自帳戶里的所述用戶 個(gè)人的基因序列與所述標(biāo)準(zhǔn)用例的基因序列的比對(duì)值為比拼依據(jù),按分值的高低分出勝 負(fù),從分?jǐn)?shù)中得出勝者可能向該基因的表達(dá)性狀發(fā)展趨勢(shì)更大,記為智能比對(duì)結(jié)果并記錄; 所述健康分析模塊具體包括: 健康分析單元,用于在用戶的各自帳戶里分析所述用戶個(gè)人的基因序列與對(duì)應(yīng)類別下 全部程度的所述標(biāo)準(zhǔn)用例的基因序列的比對(duì)結(jié)果值,比對(duì)結(jié)果值的目的是分析用戶的所述 用戶個(gè)人的基因序列是否與某種亞健康的基因序列類似,如果類似,記為A,并生成目前用 戶個(gè)人身體狀態(tài)要達(dá)到運(yùn)種亞健康程序所需要的時(shí)間ti和可能性μ, W及所述運(yùn)種亞健康 通常持續(xù)時(shí)間t2,根據(jù)不同的用戶特征把所述類似Α、所述tl和t2與所述運(yùn)種亞健康進(jìn)行進(jìn) 行映射,其映射公式f(A)為:從而得出用戶由某一類型基因決定的潛在的亞健康發(fā)展趨勢(shì),并將所述潛在的亞健康 發(fā)展趨勢(shì)結(jié)果返回;由于所述用戶個(gè)人的基因序列受環(huán)境控制容易產(chǎn)生變化,可W將所述 映射公式f(A)為存儲(chǔ)在一個(gè)可W查詢的循環(huán)鏈表,用于序列表的匹配,如果發(fā)生個(gè)人基因 序列的異常狀態(tài),便把結(jié)果發(fā)送給指導(dǎo)建議單元; 所述指導(dǎo)建議單元,用于針對(duì)健康分析單元所得出的結(jié)果,給出合理的健康生活指導(dǎo), W及日常生活建議。
【文檔編號(hào)】G06F19/22GK105975811SQ201610301745
【公開日】2016年9月28日
【申請(qǐng)日】2016年5月9日
【發(fā)明人】管仁初, 賀冠楠, 梁艷春
【申請(qǐng)人】管仁初