午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

結(jié)直腸癌生物標(biāo)志物的制作方法_4

文檔序號(hào):9713198閱讀:來源:國知局
135]
[0136]表9.樣品V30的基因相對豐度

[0139]由此,發(fā)明人利用最小冗余最大相關(guān)(mRMR)特征選擇法基于140455個(gè)CRC關(guān)聯(lián)的 標(biāo)志物鑒定并驗(yàn)證了 31個(gè)標(biāo)志物的集合?;谶@31個(gè)腸道微生物基因標(biāo)志物,發(fā)明人通過 計(jì)算腸道健康指數(shù)來評估CRC疾病的風(fēng)險(xiǎn)。
[0140] 實(shí)施例3:從128個(gè)中國個(gè)體中鑒定物種標(biāo)志物
[0141] 基于實(shí)施例1中所述第一群體128個(gè)微生物群組的測序序列,發(fā)明人檢查了對照和 CRC相關(guān)的微生物群組之間的分類學(xué)差異,從而鑒定促成生態(tài)失調(diào)的微生物類群。對于此, 由于不同方法得到的支持證據(jù)會(huì)加強(qiáng)關(guān)聯(lián)性,因此,發(fā)明人利用三種不同的方法對得到的 分類譜進(jìn)行分析。首先,發(fā)明人將宏基因組測序序列定位到MG數(shù)據(jù)庫(400版本)的4650個(gè) 微生物基因組上并評估包含在這個(gè)數(shù)據(jù)庫中的微生物物種(命名為MG物種)的豐度。其次, 發(fā)明人利用通用系統(tǒng)發(fā)生標(biāo)志物基因評估種水平分子操作分類單元(mOTU)的豐度。第三, 發(fā)明人將MGWAS鑒定出來的140455個(gè)基因整理成代表源自同一個(gè)基因組的基因簇的宏基因 組連鎖群(MLG),盡可能利用頂G數(shù)據(jù)庫對MLG進(jìn)行種水平的注釋,基于這些物種注釋信息將 MLG進(jìn)行分組,并隨后評估這些物種(命名為MLG物種)的豐度。
[0142] 3.1頂G基因組物種注釋
[0143] 對于每個(gè)MG基因組,根據(jù)MG提供的NCBI分類標(biāo)識(shí),發(fā)明人利用NCBI分類轉(zhuǎn)儲(chǔ)文 件在種水平和屬水平上鑒定出對應(yīng)的NCBI分類學(xué)分類。沒有對應(yīng)的NCBI物種名的基因組保 留其原始的IMG名,其中不能分類的占到大多數(shù)。
[0144] 3.2數(shù)據(jù)譜構(gòu)建
[0145] 3.2.1 基因譜
[0146] 發(fā)明人將高質(zhì)量測序序列定位到利用歐洲和中國成人建立起來的已公開的參考 腸道基因集的基因集(相似性> = 90% )上,基于此,發(fā)明人利用Qin等人2012年發(fā)表的關(guān)于 T2D的文獻(xiàn)(同上)里記載的相同方法構(gòu)建了基因譜。
[0147] 3.2.2 mOTU譜
[0148] 將干凈測序序列(實(shí)施例1的高質(zhì)量測序序列)比對至mOTU參考集(共79268條序 列),使用默認(rèn)的參數(shù)(S. Sunagawa et al. ,Metagenomic species profiling using universal phylogenetic marker genes .Nature methods 10,1196(Dec ,2013),通過引 用 并入此處)。鑒定出549個(gè)種水平的mOTU,包括307個(gè)注釋的物種和242個(gè)沒有代表性基因組 的mOTU連鎖群,推測其為厚壁菌門(Firmicutes)和擬桿菌門(Bacteroidetes)。
[0149] 3.2.3頂G種和頂G屬特征譜
[0150] 從http://ftp. jgi_psf.org下載IMG v400參考數(shù)據(jù)庫(V.M.Markowitz et al ·, IMG:the Integrated Microbial Genomes database and comparative analysis system.Nucleic acids research 40,D115(Jan,2012),通過引用并入此處),并從中提取 細(xì)菌、古細(xì)菌和真菌序列。總共得到522093條序列,基于原始文件7個(gè)相同大小的塊構(gòu)建 SOAP參考指數(shù)。利用SOAP校準(zhǔn)器(R.Li et al.,SOAP2:an improved ultrafast tool for short read alignment.Bioinformatics 25,1966(Aug 1,2009),通過引用并入此處)第 2.22版將干凈測序序列與參考進(jìn)行比對,使用參數(shù)"_m 4 -s 32 -r 2 -n 100 -x 600 -v 8 -c 0.9 -P 3"。然后,利用SOAP覆蓋度軟件計(jì)算每個(gè)基因組的測序序列覆蓋度,利用基因 組長度進(jìn)行標(biāo)準(zhǔn)化,并進(jìn)一步標(biāo)準(zhǔn)化至每個(gè)個(gè)體樣品的相對豐度。僅基于唯一定位的測序 序列生成特征譜。
[0151] 3.3鑒定結(jié)直腸癌關(guān)聯(lián)的MLG物種
[0152]基于鑒定出的與結(jié)直腸癌關(guān)聯(lián)的140455個(gè)標(biāo)志物基因譜,發(fā)明人利用先前Qin等 人在2012年發(fā)表的II型糖尿病研究(同上)里描述的方法構(gòu)建結(jié)直腸癌關(guān)聯(lián)的MLG。將所有 的基因?qū)Ρ鹊組G數(shù)據(jù)庫v400中的參考基因組以獲取基因組水平的注釋。如果大于50%的 組成性基因被注釋到一個(gè)基因組,則將MLG歸屬于該基因組,否則將其稱為未分類??偣?7 個(gè)基因數(shù)目超過100個(gè)的MLG被選擇為與結(jié)直腸癌相關(guān)聯(lián)的MLG。基于這些基因組的物種注 釋將這些MLG分組,從而構(gòu)建出MLG物種。
[0153] 為了評估MLG物種的相對豐度,發(fā)明人首先去除豐度最高的5%基因和豐度最低的 5%基因,然后評估MLG物種的基因的平均豐度。通過計(jì)算屬于該物種的頂G基因組的豐度之 和,從而評估IMG物種的相對豐度。
[0154] 通過以上分析方法,發(fā)明人鑒定到30個(gè)頂G物種、21個(gè)mOTU以及86個(gè)MLG物種與CRC 狀態(tài)顯著關(guān)聯(lián)(WiIcoxon秩和檢驗(yàn),q〈0.05;見表10,11)。其中,凸腹真桿菌(Eubacterium ventriosum)在所有三種方法中均在對照微生物群組中富集(Wi Icoxon秩和檢驗(yàn)-IMG :q = 0 · 0414;mOTU: q = 0 · 012757;MLG: q = 5.446x10-4),而挑剔真桿菌(Eubacterium eligens)在 兩種方法中在對照微生物群組中富集(Wi Icoxon秩和檢驗(yàn)-IMG : q = 0.069 ;MLG : q = 0.00031)。另一方面,微小小單胞菌(Parvimonas micra)(q〈l .80xlCT5),胃消化鏈球菌 (Peptostreptococcus stomatis) (q〈l ·80x10-5),莫氏細(xì)小桿菌(Solobacterium moorei) (q〈0 · 004331)和具核梭桿菌動(dòng)物亞種(Fusobacterium nucleatum) (q〈0 · 004565)在所有三 種方法中均在CRC患者微生物群組中富集(圖6,圖7)。其中,P. stomatis與口腔癌有關(guān)聯(lián), S.moorei與菌血癥有關(guān)聯(lián)。最近的16S rRNA測序研究已觀察到,F(xiàn).nucleatum在CRC腫瘤樣 品中具有顯著的富集,且這種細(xì)菌已被顯示具有粘合性、侵入性和促炎性性質(zhì)。本發(fā)明的結(jié) 果在具有不同的遺傳和文化來源的新群體中證實(shí)了此關(guān)聯(lián)性。然而,P.micra在CRC關(guān)聯(lián)的 微生物群組中的高度顯著富集是新的發(fā)現(xiàn),該菌屬于專性厭氧菌,可以像F.nucleatum-樣 引起口腔感染。P.micra涉及牙周炎的病因?qū)W,并且其產(chǎn)生廣譜蛋白水解酶,并使用蛋白胨 和氨基酸作為能量來源。已知它還產(chǎn)生硫化氫,其促進(jìn)腫瘤生長和結(jié)腸癌細(xì)胞的增殖。還需 要更進(jìn)一步的研究去證實(shí)P.micra是參與CRC的致病機(jī)理還是其富集是結(jié)腸和/或直腸中 CRC相關(guān)變化的結(jié)果。盡管如此,它可表現(xiàn)出用作CRC非侵入式診斷的生物標(biāo)志物的機(jī)會(huì)。
[0155] 3.4物種標(biāo)志物鑒定
[0156] 為了評估這些分類學(xué)關(guān)聯(lián)分析的預(yù)測功效,發(fā)明人利用隨機(jī)森林系統(tǒng)學(xué)習(xí)法 (D.Knights,E.K.Costello,R.Knight,Supervised classification of human microbiota.FEMS microbiology reviews 35,343(Mar,2011),通過引用并入此處)鑒定三 種不同方法得到的物種譜中的關(guān)鍵物種標(biāo)志物。
[0157] 3.4.1 MLG物種標(biāo)志物鑒定
[0158] 基于構(gòu)建的基因數(shù)目超過100個(gè)的87個(gè)MLG,發(fā)明人采用Benjamini-Hochberg調(diào)整 法對每一個(gè)MLG進(jìn)行Wi I coxon秩和檢驗(yàn),篩選出86個(gè)MLG與CRC顯著相關(guān)(q〈0.05)?;谶@86 個(gè)結(jié)直腸癌相關(guān)的MLG物種,發(fā)明人采用R(2.10版)中的"randomForest 4.5-36"工具包來 鑒定MLG物種標(biāo)志物。首先,發(fā)明人根據(jù)"randomForest"方法得出的重要性對所有86個(gè)MLG 物種進(jìn)行排序。通過創(chuàng)建排名最高的MLG物種的遞增子集,從包含1個(gè)物種開始至包含所有 86個(gè)MLG物種結(jié)束,從而構(gòu)建MLG標(biāo)志物集。
[0159] 對于每個(gè)MLG標(biāo)志物集,發(fā)明人計(jì)算出其在128個(gè)中國人群體(第一群體)中的錯(cuò)誤 預(yù)測率。最后,選取錯(cuò)誤預(yù)測率最低的MLG物種集作為MLG物種標(biāo)志物。此外,發(fā)明人利用基 于篩選出來的MLG物種標(biāo)志物得到的疾病發(fā)生概率繪制ROC曲線。
[0160] 3.4.2ΠΚ物種標(biāo)志物和mOTU物種標(biāo)志物鑒定
[0161 ] 基于IMG物種譜和mOTU物種譜,發(fā)明人同樣采用Benjamini-Hochberg調(diào)整法進(jìn)行 Wi Icoxon秩和檢驗(yàn),從而篩選出與CRC顯著相關(guān)(q〈0.05)的頂G物種和mOTU物種。接著,利用 與篩選MLG物種標(biāo)志物相同的方法,即采用隨機(jī)森林法篩選頂G物種標(biāo)志物和mOTU物種標(biāo)志 物。
[0162] 此分析揭示,16個(gè)頂G物種、10個(gè)種水平mOTU和21個(gè)MLG物種對CRC狀態(tài)具有較高的 預(yù)測能力(表12、13),通過1?0(:分析得到其預(yù)測功效分別是0.86、0.90和0.94(圖8)。微小小 單胞菌(Parvimonas mi era)在三種方法中都被鑒定為關(guān)鍵物種;具核梭桿菌動(dòng)物亞種 (Fusobacterium nucleatum)和莫氏細(xì)小桿菌(Solobacterium moorei)在其中兩種方法中 被鑒定為關(guān)鍵物種,這為它們與CRC狀態(tài)的關(guān)聯(lián)進(jìn)一步提供了統(tǒng)計(jì)學(xué)支持。
[0163] 3.5 MLG、頂G和mOTU物種的階段富集分析
[0164] 由于三種方法預(yù)測的與CRC狀態(tài)關(guān)聯(lián)的物種相一致,而且發(fā)明人記錄了 CRC患者的 疾病階段(表2),因此,發(fā)明人對物種譜進(jìn)行了探索,以尋求鑒定早期CRC的特異性標(biāo)記。發(fā) 明人推測,這種努力可能揭示很難在全局分析中進(jìn)行鑒定的階段特異性關(guān)聯(lián)。為了確定在 CRC的四個(gè)階段或健康對照中有哪些物種富集,發(fā)明人對基因數(shù)目超過100的MLG物種和q〈 0.05(采用Benjamini-Hochberg調(diào)整法的Wi Icoxon秩和檢驗(yàn))的所有IMG物種和mOTU物種進(jìn) 行Kruskal檢驗(yàn),利用在CRC四個(gè)階段和健康對照中最高的秩平均獲得物種富集信息。發(fā)明 人還利用成對Wilcoxon軼和檢驗(yàn)對各組兩兩之間的顯著性進(jìn)行比較。
[0165]在中國人第一群體,有幾個(gè)物種在不同的階段顯示顯著不同的豐度。其中,相較于 所有其它階段和對照樣品,發(fā)明人沒有鑒定出在第一階段富集的任何物種。相較于對照樣 品,胃消化鏈球菌(Peptostreptococcus stomat i s ),變黑普雷沃氏菌(Prevotella nigrescens)和共生梭菌(Clostridium symbiosum)在第二階段以后富集,表明它們在CRC 形成之后開始在結(jié)腸/直腸定殖(圖9)。然而,相較于對照,具
當(dāng)前第4頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1