用于檢測重排基因組序列中的斷點的方法
【專利說明】用于檢測重排基因組序列中的斷點的方法
[0001] 相關(guān)申請的交叉引用
[0002] (無)
[0003] 關(guān)于聯(lián)邦政府資助研究或開發(fā)的聲明
[0004] (無)
[0005] 對光盤上材料的引用
[0006] (無)
[0007] 發(fā)明背景 發(fā)明領(lǐng)域
[000引本發(fā)明設(shè)及用于檢測BRCA1基因座中的序列擴增的方法,所述序列的末端由序列 延伸組成或被包含在序列延伸中,所述序列延伸在BRCA1基因座中至少是雙重存在的,而 且所述擴增導(dǎo)致擴增序列的至少兩個或至少Ξ個,特別是Ξ個串聯(lián)拷貝。本發(fā)明還設(shè)及用 于確定與運些擴增相關(guān)的疾病或病癥的傾向的方法,包括卵巢癌或乳腺癌的傾向。本發(fā)明 還設(shè)及用于檢測其它基因座中具有類似特征的擴增的方法。
[000引相關(guān)領(lǐng)域的描述
[0010] 乳腺癌是女性中最常見的惡性腫瘤,影響大約10%的女性人群。發(fā)病率逐年增加, 據(jù)估計每年全球?qū)⒂写蠹s一百四十萬女性被診斷為乳腺癌,并且有大約460, 000女性死于 該疾病。遺傳性乳腺癌和卵巢癌易感基因BRCAl(MIM#1137〇W和6賄42曲加#60018。中的 胚系突變是高外顯性的化ingetal.,2003),(化thansonet曰1.,2001)。BRCA1 和BRCA2 基因連同其它基因例如NBR2基因一起被鑒別、表征并在基因組上定位,運些數(shù)據(jù)都是公眾 可W獲得的。對于具有陽性家族史的個體的遺傳咨詢W及對于突變攜帶者的早期診斷或預(yù) 防,篩查是重要的。當(dāng)鑒別有BRCA1或BRCA2突變時,為大于18歲的所有家族成員提供預(yù) 測性測試。如果一位女性測試為陰性,她的風(fēng)險再次變?yōu)槠胀ㄈ巳旱娘L(fēng)險。如果她測試為 陽性,則提出個性化監(jiān)測方案:其包括從早期開始的乳腺放射成像(mammographic)篩查, W及可能進行的預(yù)防性手術(shù)。用抗雌激素(anti-estrogens)對乳腺癌進行化學(xué)預(yù)防目前 也在進行臨床測試,并且將來可能被使用。
[0011] 許多有害突變由導(dǎo)致提前出現(xiàn)終止子的小的移碼(插入或缺失)或點突變、保守 域中的錯義突變、或?qū)е庐惓^D(zhuǎn)錄加工的剪接位點突變組成(Szaboetal.,2000)。然而, 突變還包括更復(fù)雜的重排,包括大的基因組區(qū)域的缺失和重復(fù),傳統(tǒng)的基于PCR的突變篩 查結(jié)合DNA測序檢測不到它們(Mazoyer,2005)。迄今為止僅報道了一種設(shè)及超過兩個拷貝 擴增化ogevorstet曰1.,2003)。運種擴增是在BRCA1基因的3'部分中的Ξ重復(fù),其設(shè)及 外顯子17-19,并且由Alu重組導(dǎo)致。
[001引能夠檢測運些復(fù)雜重排的技術(shù)包括Southern印跡分析結(jié)合長片段PCR或蛋白質(zhì)截短檢測技術(shù)(PTT)、短巧光片段的定量多重PCR(QMPSF)Olofmannet al.,2002)、實時PCR、巧光DNA陣列測定、多重連接依賴性探針擴增(MLPA)Kasilliet al.,2002),Olofmannetal.,2002)和高分辨率寡核巧酸陣列比較基因組雜交(aCGH) (Rouleauetal., 2007),(Staafetal., 2008)。近來已經(jīng)開發(fā)了新的方法,提供初篩 和定量信息,例如qPCR-HRM和EMMA,并且已提出通過基因組捕獲結(jié)合大規(guī)模平行測序同 時檢測對乳腺癌和卵巢癌所設(shè)及的21個基因有影響的小的突變和大的重排(Walshet al.,2010)。用于檢測運些復(fù)雜基因重排的其它技術(shù)包括分子梳(MolecularCombing) GferrickandBensimon, 2009) ;(Schu;rraandBensimon, 2009);化adetal. ,2001),化ad etal., 2002a),(Gadetal., 2003);(Qieesemanetal. 2012) ;0JS61553906)。
[0013] 當(dāng)擴增設(shè)及擴增序列的超過一個的額外拷貝時,和/或當(dāng)擴增序列包括在野生型 BRCA1基因或周圍座位(surroundinglocus)中的多拷貝中存在的序列部分時,和/或當(dāng) 擴增序列屬于重復(fù)序列含量非常高的BRCA1基因座的一部分時,現(xiàn)有技術(shù)方法無法檢測和 /或表征運種擴增。在本文中,發(fā)明人提供了檢測和/或表征運種擴增,W及檢測和/或表 征其它基因座中具有類似特征的擴增的方法。
[0014] 發(fā)明簡述
[0015] 乳腺癌和卵巢癌易感性設(shè)及具有高外顯性的BRCA1和BRCA2基因。可W預(yù)期大約 2 %至4%的具有陽性家族史且BRCA1和BRCA2點突變?yōu)殛幮缘娜橄侔┗颊咴谶\兩個基因之 一中,特別是BRCA1中攜帶有大的基因組改變(特別是缺失或重復(fù))。然而,可用的技術(shù)遺 漏了一些大的重排。運些重排包括序列的串聯(lián)擴增,其特征是擴增序列的超過一個的額外 拷貝被引入的事實,和/或其特征是在野生型座位中和/或當(dāng)擴增序列處于富含重復(fù)序列 的區(qū)域中時,擴增序列的端部(重復(fù)的序列單元)存在于多拷貝中的事實,所述多拷貝彼此 完全同源或高度同源。
[0016] 用于檢測和/或表征運些類型的擴增的體外方法是本發(fā)明的一個目的。運些包括 用于檢測序列片段的Ξ重復(fù)的體外方法,所述序列片段包含BRCA1的外顯子la、化和2W 及NBR2基因的片段。該區(qū)域特別富含Alu序列,且常見的拷貝數(shù)目評估技術(shù)不能正確表征 該Ξ重復(fù)。運種串聯(lián)Ξ重復(fù)的斷點相互在48個堿基對上具有完全的序列同一'性。在參考 人基因組序列的BRCA1和NBR2基因中都發(fā)現(xiàn)了運48個堿基對化P)序列。圍繞運個48-bp 序列的序列在200-300bp上表現(xiàn)出高度的同源性(80-95% )。
[0017] 本發(fā)明設(shè)及用于預(yù)測或用于檢測與生物樣品的核酸中的重排相關(guān)的斷點的方法, 所述生物樣品包含染色體核酸,特別是人染色體核酸的代表性核酸;
[0018] 本發(fā)明設(shè)及用于運種Ξ重復(fù)和相關(guān)擴增的測試或方法,其使用分子梳(Molecular Combing)。運種直接的可視化方法允許立即檢測和表征運些擴增,而不受到它們的重復(fù)序 列含量、同源端部或拷貝數(shù)目的阻礙。本發(fā)明還設(shè)及測試或方法,其允許對運種Ξ重復(fù)和相 關(guān)擴增進行體外檢測和表征,其是基于生物樣品中包含該Ξ重復(fù)的特定DNA多核巧酸的富 集。運些方法是基于聚合酶鏈?zhǔn)椒磻?yīng)(PCR)、測序和其它相關(guān)技術(shù)。用于實施運些方法的試 劑盒也在本發(fā)明的范圍內(nèi)。運些方法和試劑盒相對于現(xiàn)有的方法具有實質(zhì)性的改進,現(xiàn)有 的方法無法檢測運種擴增。
[0019] 公開了四個不相關(guān)患者的結(jié)果,結(jié)果顯示在所有四個患者樣品中都有Ξ重復(fù)。也 通過現(xiàn)有技術(shù)的其它方法對患者進行了測試,Ξ重復(fù)未能被正確檢測或表征,表明發(fā)明人 相對于現(xiàn)有技術(shù)的實質(zhì)性改進。
[0020] 本發(fā)明還設(shè)及基于運些測試或方法確定卵巢癌或乳腺癌傾向(也被稱為相對于 參考人群有更高風(fēng)險)的方法。而且,發(fā)明人描述了調(diào)整患者的醫(yī)學(xué)隨訪和/或治療的方 法,所述患者的乳腺癌或卵巢癌風(fēng)險增加和/或患有與運種擴增家族關(guān)聯(lián)的卵巢乳腺癌。
[0021] 組成本文所述Ξ重復(fù)的斷點的48bp的序列也存在于BRCA1基因及周圍座位的其 它地方,而且由于在基因組中其它地方可W發(fā)現(xiàn)具有類似特征的序列擴增,本發(fā)明設(shè)及用 于檢測運種擴增的方法和試劑盒,其相對于現(xiàn)有的方法具有實質(zhì)性的改進,現(xiàn)有的方法無 法檢測運種擴增。
[0022] 附圖簡述
[0023] 本專利或申請文件包含至少一幅彩色附圖。
[0024]圖1 :設(shè)計用于BRCA1基因組區(qū)域的高分辨率物理作圖的計算機模擬產(chǎn)生的 GenomicMorseCodes4.0(GMC4.0)。(A)完整的BRCA1GMC4.0 覆蓋 200化的基因組區(qū)域, 由14個不同顏色(綠色、紅色或藍(lán)色)的信號(曰1/曰2,S1,Sex21,S2,S3Big,S4,S5,S6,Syn tl,S7,S8,S9,b2/b3,SIO)組成。每個信號由1-2個小水平條組成,每一條相應(yīng)于一個DM 探針。編碼BRCA1(81.21A)和NBR2(19. 5化)基因的區(qū)域由8個"基序"(m化l-m8bl)。每 個基序由1-3個小水平條和一個黑色的"缺口 "(無信號)組成。度)BRCA1基因特異性信 號的放大圖和24個外顯子的相對位置。
[002引圖2 :乳腺癌細(xì)胞系10799001的分子梳分析。
[0026] 通過分子梳對DNA進行分析,所述DNA分離自從自乳腺癌患者收集的邸V永生化 B淋己細(xì)胞(細(xì)胞系10799001)。
[0027] (A)BRCAlv4. 0GMC計算機模擬顯示在最上面,顯微鏡觀察(microscopic visualization)后獲得的BRCA1信號顯示在最下面。對每個等位基因顯示3個顯微鏡信 號。
[0028]Ξ重復(fù),可見為紅色信號SYNT1和綠色信號S7的串聯(lián)重復(fù)Ξ重復(fù)。檢測到的Ξ重 復(fù)的位置用豎直的澄色虛線標(biāo)出。wt=野生型等位基因;mut=具有Ξ重復(fù)的突變等位基 因
[002引 度)與(A)相同,但DNA探針S7的顏色由綠色變?yōu)樗{(lán)色,W驗證突變中設(shè)及的探針 的性質(zhì)。
[0030]圖3 :BRCA1中外顯子la、化和2的立重復(fù)的物理作圖。(A)由分子梳實驗和相關(guān) 測量獲得的初步物理圖譜。上面是突變等位基因(具有Ξ重復(fù))和野生型等位基因(相應(yīng) 于參考人基因組序列)的物理圖譜,下面是放大圖。實線代表突變等位基因中未改變的序 列,而虛線代表突變等位基因中擴增的序列。豎直波浪線是估計的斷點位置及它在突 變等位基因中的重復(fù))。Syntl和S7表示來自相應(yīng)探針的全長信號,而(Syntl)表示Syntl 探針產(chǎn)生的部分信號。Wbp表示的尺寸是探針和缺口的實際尺寸,而W化區(qū)間表示的尺寸 是由分子梳實驗估計的。四個引物作為斷點擴增的引物定位的代表性實例被顯示。度)-(c) 在細(xì)胞系0799001或?qū)φ占?xì)胞系40中進行PCR之后得到的DM片段。
[003。 圖4 :外顯子la、化和2的BRCA1立重復(fù)的準(zhǔn)確物理作圖。
[0032] 上圖顯示了將兩個斷點的預(yù)測位置的序列與相應(yīng)的基因組坐標(biāo)進行比較時,顯示 有同源性的位置。運些28化P的序列延伸之間的總體同源性為86. 5%,其中48-bp的部分 顯示出100%的同一性(實線,W及相應(yīng)的基因組坐標(biāo))。
[0033] 下圖顯示了斷點測序的結(jié)果:F7R7PCR片段的序列數(shù)據(jù)與參考人基因組序列之間 的序列同一性由實屯、水平條表示,序列同源性由虛線表示,并給出相應(yīng)的基因組坐標(biāo)。
[0034]圖5:優(yōu)化的PCR反應(yīng),W篩查臨床樣品中的BRCAlΞ重復(fù)。(A)從8個引物對獲 得對BRCA1S重復(fù)特異性的片段。在突變陽性細(xì)胞系10799001中用引物對巧/R2、F5/R3 和F6/R3找到一個DNA片段,其沒有任何干擾的非特異性片段,而在對照細(xì)胞系38中沒有 找到。度)在具有該擴增的3個不相關(guān)患者中觀察到引物對巧/R2、F5/R3和F6/R3的PCR 片段的特異性擴增。在兩個陰性對照中未觀察到PCR產(chǎn)物。
[00對發(fā)明詳述
[0036] 本發(fā)明設(shè)及用于預(yù)測或用于檢測與生物樣品核酸中的重排相關(guān)的斷點的方法,所 述生物樣品包含染色體核酸,特別是人染色體核酸的代表性核酸;
[0037] 本文公開的發(fā)明提供了用于體外測試生物樣品中基因序列(例如DNA延伸)擴 增的存在的方法,所述生物樣品包含染色體的代表性核酸,特別是人染色體17的代表性核 酸,特別是染色體17的基因組核酸,該方法包括:
[0038]-對所述生物樣品進行運樣的步驟,所述步驟允許對從BRCA1基因的外顯子2延伸 至NBR2基因的區(qū)域進行物理作圖;
[0039]-檢測超過兩個連續(xù)樣品(拷貝)(兩個或更多個重復(fù),特別是Ξ重復(fù))的從BRCA1 的內(nèi)含子2延伸至NBR2基因的6化-至8化-序列。
[0040] 本發(fā)明還提供用本發(fā)明的方法對樣品中基因序列擴增的存在進行體外測試的方 法。
[0041] 本發(fā)明設(shè)及用于體外預(yù)測與生物樣品核酸中的重排,特別是大的重排相關(guān)的斷點 的方法,所述生物樣品包含染色體核酸,特別是人染色體核酸的代表性核酸,該方法包括:
[0042] -對生物樣品的核酸進行作圖,特別是利用分子梳或相關(guān)的直接作圖方法;
[0043]-確定重排的尺寸和/或其尺寸的置信區(qū)間、重排一端的一個斷點的位置和/或其 位置的置信區(qū)間、和重排序列的另一端的斷點的位置和/或其位置的置信區(qū)間;
[0044]-確定所確定的斷點位置的預(yù)測序列之間的序列同源性,運些預(yù)測序列由參考數(shù) 據(jù)庫,特別是人參考基因組通過確定特定同源序列延伸的存在獲得,所述同源序列延伸在 序列延伸長度上的核巧酸具有80-98%的核巧酸同一性,核酸中每一個用于確定同源性的 序列延伸具有至少20化P的長度;
[0045]-在所述鑒別的同源序列延伸內(nèi),確定在部分同源核酸序列的上的嚴(yán)格序列同一 性,所述嚴(yán)格同一性存在于大約2化至大約80bp的序列部分上,特別是存在于至少30或至 少40或至少45bp,尤其是小于80pb的序列上;
[0046] -W及,當(dāng)運種部分存在時,顯示運種序列同一性,報告運種部分有可能包含序列 重排的斷點。
[0047] 本發(fā)明還設(shè)及用于檢測與生物樣品核酸中的重排,特別是大的重排相關(guān)的斷點的 方法,所述生物樣品包含染色體核酸,特別是人染色體核酸的代表性核酸,該方法包括:
[0048] -對生物樣品的核酸進行作圖,特別是利用分子梳或相關(guān)的直接作圖方法;
[0049]-確定重排的尺寸和/或其尺寸的置信區(qū)間、重排一端的一個斷點的位置和/或其 位置的置信區(qū)間、和重排序列的另一端的斷點的位置和/或其位置的置信區(qū)間;
[0050]-確定所確定的斷點位置的預(yù)測序列之間的序列同源性,運些預(yù)測序列由參考數(shù) 據(jù)庫,特別是人參考基因組通過確定特定同源序列延伸的存在獲得,所述同源序列延伸在 序列延伸長度上的核巧酸具有80-98%的核巧酸同一性,核酸中每一個用于確定同源性的 序列延伸具有至少20化p的長度;
[0051] -在所述鑒別的同源序列延伸內(nèi),確定在部分同源核酸序列的上的嚴(yán)格序列同一 性,所述嚴(yán)格同一性存在于大約2化至大約80bp的序列部分上,特別是存在于至少30或至 少40或至少45bp,尤其是小于80pb的序列上;
[0052] -當(dāng)運種部分存在時,顯示運種序列同一性,推斷運種部分有可能包含序列重排的 斷點;
[0053] -通過分子測試,特別是通過PCR擴增或功能上相關(guān)的方法和/或測序,確認(rèn)斷點 的位置。
[0054] 根據(jù)本發(fā)明方法的特定實施方案,通過局部比對捜索、特別是連續(xù)比對捜索確定 樣品核酸內(nèi)的同源性和同一性。
[0055] 在根據(jù)本發(fā)明方法的特定實施方案中,同源性捜索不包括確定聚-N區(qū)段,即給定 核巧酸(腳的重復(fù)的同源性,所述區(qū)段中該核巧酸連續(xù)重復(fù)至少5次。
[0056] 在特定的實施方案中,本發(fā)明設(shè)及方法,其中同源性水平在相同核巧酸為85-95% 的范圍內(nèi)。
[0057] 特別地,根據(jù)本發(fā)明的方法,在具有200-5(K)bp,特別是200-3(K)bp,特別是大約 300bp的序列上確定同源性。
[0058] 在本發(fā)明的另一個特定實施方案中,本文定義的方法是運樣的,斷點的預(yù)測或檢 測與重排相關(guān),所述重排由基因組核酸中核酸序列的擴增、序列的缺失組成。
[0059] 在本發(fā)明方法的特定實施方案中,在對人基因組序列的代表性核酸序列中的重排 進行檢測之后進行斷點的預(yù)測或檢測。
[0060] 在根據(jù)本發(fā)明方法的另一個特定實施方案中,斷點的預(yù)測或檢測在基因組的基因 座上進行,所述基因座包含已知與疾病或疾病傾向相關(guān)的基因,例如與乳腺和/或卵巢癌 傾向相關(guān)的基因,特別是BRCA1和BRCA2 ;與Lynch綜合征相關(guān)或與結(jié)腸直腸癌傾向相關(guān)的 基因,特別是MS肥、MLH1、MS冊和PMS2。
[0061] 在本發(fā)明方法的特定實施方案中,在BRCA1基因座中檢測斷點。
[0062] 本發(fā)明還設(shè)及本文所定義的方法,其中通過PCR進行斷點的確認(rèn),所述PCR使用按 如下選擇的引物對:
[0063] - 一個正向引物,其位置距離重排一端的可能斷點位置優(yōu)選小于5化,更優(yōu)選小于 2化,更優(yōu)選小于化bW及更優(yōu)選小于5(K)bp,W及
[0064] - -個反向引物,其位置距離重排另一端的可能斷點位置優(yōu)選小于5化,更優(yōu)選小 于沈b,更優(yōu)選小于化bW及更優(yōu)選小于5(K)bp,并且引物方向使得在野生型樣品中通過PCR 無法擴增出來。
[0065] 本發(fā)明還