采用一組snp的人身份識(shí)別的制作方法
【專(zhuān)利說(shuō)明】
[0001] 相關(guān)申請(qǐng)的交叉參考
[0002] 本申請(qǐng)引入發(fā)明人為 John LeamoruMark Andersen 和 Michael Thornton 的、標(biāo)題 為"用于多重PCR的方法和組合物"、于2012年4月27日提交的美國(guó)申請(qǐng)序列號(hào)13/458, 739 的全文作為參考。
技術(shù)領(lǐng)域
[0003] 在一些實(shí)施方案中,本公開(kāi)內(nèi)容一般性涉及擴(kuò)增含有多個(gè)靶序列的樣品內(nèi)的一個(gè) 或多個(gè)靶序列以識(shí)別人身份的方法、組合物、系統(tǒng)、設(shè)備和試劑盒。任選地,多個(gè)靶序列(例 如,至少10、20、30、40、50、60、70、80、90、100、110、120、130或更多個(gè)序列)在單個(gè)擴(kuò)增反應(yīng) 內(nèi)進(jìn)行擴(kuò)增。在一些實(shí)施方案中,本公開(kāi)內(nèi)容一般性涉及用于從單個(gè)來(lái)源(如基因組DNA、 福爾馬林固定石蠟包埋(FFPE)DNA或法醫(yī)樣品)擴(kuò)增一個(gè)或多個(gè)靶序列的方法、組合物、系 統(tǒng)、設(shè)備和試劑盒。具體地,公開(kāi)了有效用于采用具有可切割基團(tuán)的引物擴(kuò)增一個(gè)或多個(gè)靶 序列的方法、試劑盒、系統(tǒng)、設(shè)備和組合物。
[0004] 發(fā)明背景
[0005] 幾種生物學(xué)應(yīng)用設(shè)計(jì)在群體內(nèi)選擇性擴(kuò)增核酸分子。例如,下一代測(cè)序方法可設(shè) 計(jì)在大群核酸分子內(nèi)選定靶標(biāo)的分析。對(duì)于這樣的應(yīng)用,增加在單個(gè)擴(kuò)增反應(yīng)內(nèi)從群體選 擇性擴(kuò)增的靶標(biāo)的總數(shù)可能是有用的。這樣的選擇性擴(kuò)增典型地通過(guò)能夠與特定靶核酸分 子選擇性雜交或選擇性促進(jìn)其擴(kuò)增的一個(gè)或多個(gè)引物的使用來(lái)實(shí)現(xiàn)。這樣的選擇性擴(kuò)增可 能由于擴(kuò)增假體(artifact)的形成(如引物二聚體等)而變得復(fù)雜。這樣的擴(kuò)增假體的 形成(本文也稱(chēng)為非特異性擴(kuò)增產(chǎn)物)可以消耗關(guān)鍵擴(kuò)增試劑,例如,核苷酸、聚合酶、引物 等。另外,這樣的假體可相對(duì)于預(yù)期產(chǎn)物頻繁具有更短的長(zhǎng)度,在這樣的情況下可比預(yù)期產(chǎn) 物更有效地?cái)U(kuò)增并支配反應(yīng)輸出。選擇性擴(kuò)增還可能由于'超級(jí)擴(kuò)增子'的形成(即延長(zhǎng) 的擴(kuò)增子的形成)而變得復(fù)雜,其可以在第一引物的延伸通過(guò)相鄰的靶核酸序列延長(zhǎng)時(shí)發(fā) 生,從而創(chuàng)造長(zhǎng)的非特異性擴(kuò)增產(chǎn)物,其可以作為與第二引物延伸的模板。在擴(kuò)增反應(yīng)中這 樣的假體的形成,即使當(dāng)僅采用單個(gè)引物對(duì)時(shí),可以使得下游應(yīng)用(如qPCR、克隆、基因表 達(dá)分析和用于下一代測(cè)序的樣品制備)復(fù)雜化。因?yàn)樵摷袤w會(huì)在二次擴(kuò)增過(guò)程中被進(jìn)一步 放大,所以在一些下游應(yīng)用中,包括幾種下一代測(cè)序方法,這樣的問(wèn)題會(huì)由于要求進(jìn)行二次 擴(kuò)增步驟而被加重。例如,下游測(cè)序應(yīng)用可以涉及克隆擴(kuò)增的核酸群體的產(chǎn)生,其被分別附 著到分離的支持物(如珠),采用乳液PCR( "emPCR")和通過(guò)陽(yáng)性選擇所進(jìn)行的針對(duì)克隆 擴(kuò)增子的富集。在這樣的應(yīng)用中,該假體可以通過(guò)文庫(kù)產(chǎn)生過(guò)程一路被帶到emPCR階段,產(chǎn) 生包括非特異性擴(kuò)增產(chǎn)物的DNA捕獲珠。用含有模板的珠在富集過(guò)程中可以選擇這些含有 假體的珠,但它們是遺傳上無(wú)信息的。
[0006] 在多重PCR反應(yīng)中擴(kuò)增的核酸分子可以在有或者沒(méi)有進(jìn)一步純化或操作的情況 下被用于多個(gè)下游分析或測(cè)定。例如,以足夠的產(chǎn)率獲得的多重PCR反應(yīng)的產(chǎn)物(擴(kuò)增子) 可以被用于單核苷酸多態(tài)性(SNP)分析、基因分型、拷貝數(shù)變異分析、表觀遺傳分析、基因 表達(dá)分析、雜交陣列、基因突變的分析(包括但不限于疾病狀態(tài)的檢測(cè)、預(yù)后和/或診斷)、 稀有或低頻等位基因突變的檢測(cè)和分析、核酸測(cè)序(包括但不限于從頭(de novo)測(cè)序或 靶向重新測(cè)序)等。
[0007] 不例性下一代測(cè)序系統(tǒng)包括Ion Torrent PGM?測(cè)序儀(Life Technologies)和 Ion Torrent Proton?測(cè)序儀(Life Technologies),其為基于離子的測(cè)序系統(tǒng),其通過(guò)檢 測(cè)作為核苷酸摻入的副產(chǎn)物所產(chǎn)生的離子來(lái)對(duì)核酸模板進(jìn)行測(cè)序。典型地,氫離子是作為 在通過(guò)聚合酶進(jìn)行模板依賴(lài)性核酸合成過(guò)程中發(fā)生的核苷酸摻入的副產(chǎn)物而釋放的。Ion Torrent PGM?測(cè)序儀和離子質(zhì)子TE?J序儀通過(guò)檢測(cè)核苷酸摻入的氫離子副產(chǎn)物來(lái)檢測(cè)核 苷酸摻入。Ion Torrent PGM?測(cè)序儀和離子質(zhì)子,則序儀包括要被測(cè)序的多個(gè)核酸模板, 每個(gè)模板位于陣列中各自測(cè)序反應(yīng)孔內(nèi)。陣列的每個(gè)孔偶聯(lián)了至少一個(gè)離子傳感器,其能 夠檢測(cè)作為核苷酸摻入的副產(chǎn)物所產(chǎn)生的H +離子的釋放或溶液pH的變化。離子傳感器包 含場(chǎng)效應(yīng)晶體管(FET),其被偶聯(lián)至能夠感知H+離子的存在或溶液pH的變化的離子敏感性 檢測(cè)層。該離子傳感器提供指示核苷酸摻入的輸出信號(hào),其可表示為幅度與各自孔或反應(yīng) 室中的H +離子濃度相關(guān)的電壓變化。不同類(lèi)型的核苷酸被連續(xù)流入該反應(yīng)室,并且通過(guò)聚 合酶以由模板的序列所確定的順序被摻入延伸的引物(或聚合位點(diǎn))。每個(gè)核苷酸摻入伴 隨反應(yīng)孔中H +離子的釋放,以及伴隨的局部pH的變化。H +離子的釋放由傳感器的FET記 錄,其產(chǎn)生指示核苷酸摻入的發(fā)生的信號(hào)。在特定的核苷酸流的過(guò)程中沒(méi)有被摻入的核苷 酸不會(huì)產(chǎn)生信號(hào)。來(lái)自FET的信號(hào)的振幅還可以與摻入延伸的還是分子的特定類(lèi)型的核 苷酸數(shù)目相關(guān),從而運(yùn)行均聚物區(qū)域要被解析。因此,在測(cè)序儀運(yùn)行過(guò)程中,與跨多個(gè)孔或 反應(yīng)室的摻入監(jiān)測(cè)一起,進(jìn)入反應(yīng)室的多個(gè)核苷酸流允許儀器同時(shí)解析多個(gè)核酸模板的序 列。關(guān)于Ion Torrent PGM?測(cè)序儀的組成、設(shè)計(jì)和操作的進(jìn)一步的細(xì)節(jié)可以見(jiàn)于例如美 國(guó)專(zhuān)利申請(qǐng)序列號(hào)12/002781(現(xiàn)在以美國(guó)專(zhuān)利公開(kāi)號(hào)2009/0026082公開(kāi))、美國(guó)專(zhuān)利申 請(qǐng)序列號(hào)12/474897(現(xiàn)在以美國(guó)專(zhuān)利公開(kāi)號(hào)2010/0137143公開(kāi))和美國(guó)專(zhuān)利申請(qǐng)序列 號(hào)12/492844(現(xiàn)在以美國(guó)專(zhuān)利公開(kāi)號(hào)2010/0282617公開(kāi)),所有這些申請(qǐng)全文作為參考 引入。在一些實(shí)施方案中,擴(kuò)增子可以通過(guò)橋擴(kuò)增或emPCR被操作或擴(kuò)增以產(chǎn)生多個(gè)克隆 模板,其適于各種下游過(guò)程(process)(包括核酸測(cè)序)。在一個(gè)實(shí)施方案中,要被采用Ion Torrent PGM?或Ion Torrent Proton?系統(tǒng)測(cè)序的核酸模板可以采用本文所述的祀特異 性擴(kuò)增技術(shù)中的一個(gè)或多個(gè)從核酸分子群體進(jìn)行制備。任選地,接著靶特異性擴(kuò)增,可以進(jìn) 行二次和/或三級(jí)擴(kuò)增過(guò)程包括但不限于文庫(kù)擴(kuò)增步驟和/或克隆擴(kuò)增步驟(如emPCR)。
[0008] 當(dāng)所期望的(desired)在樣品核酸群體內(nèi)擴(kuò)增的核酸靶標(biāo)的數(shù)量增加時(shí),選擇性 擴(kuò)增這些靶標(biāo)同時(shí)避免不期望的擴(kuò)增假體的挑戰(zhàn)會(huì)相應(yīng)增加。例如,包括引物二聚體和超 級(jí)擴(kuò)增子的假體的形成在針對(duì)多個(gè)靶標(biāo)的PCR引物被合并在單個(gè)反應(yīng)管中并且共擴(kuò)增的 多重PCR反應(yīng)中會(huì)是更大的問(wèn)題。在多重PCR中,以相對(duì)于模板DNA提高的濃度的另外的 引物對(duì)的存在使得引物-引物發(fā)生相互作用,并且更容易形成引物二聚體和其它假體。
[0009] 目前在核酸擴(kuò)增過(guò)程中用于避免或減少假體(如引物二聚體)形成的方法以包 圍引物設(shè)計(jì)過(guò)程為中心,并經(jīng)常利用專(zhuān)門(mén)的軟件包(例如,DNA軟件的可視0MP、MultiPLX、 ΑΒΓ S Primer Express等)來(lái)設(shè)計(jì)引物對(duì),其被預(yù)測(cè)為在擴(kuò)增過(guò)程中在池(pool)中顯示 與其它引物之間最小的相互作用。通過(guò)使用這樣的軟件,引物可以被設(shè)計(jì)為盡可能地靶特 異性或擴(kuò)增子特異性,并經(jīng)常被分組成子集以盡量減少引物-引物相互作用、引物二聚體 形成和超級(jí)擴(kuò)增子。但是,嚴(yán)格的設(shè)計(jì)參數(shù)限制了可被同時(shí)共擴(kuò)增的擴(kuò)增子的數(shù)量,并且在 一些情況下可能干脆阻止一些擴(kuò)增子的擴(kuò)增。目前的其它方法需要使用多個(gè)PCR引物池以 將引物分隔成不重疊的池以盡量減少或阻止擴(kuò)增步驟過(guò)程中的引物假體。其它方法包括使 用多個(gè)引物池或單個(gè)復(fù)雜反應(yīng)來(lái)增強(qiáng)每個(gè)反應(yīng)的擴(kuò)增產(chǎn)物的總產(chǎn)率。在多重PCR反應(yīng)中, 每個(gè)引物對(duì)在擴(kuò)增反應(yīng)中與另外的引物對(duì)爭(zhēng)奪有限量的dNTPs、聚合酶和其它試劑。因此, 需要改善的方法、組合物、系統(tǒng)、設(shè)備和試劑盒,其允許在核酸分子群體內(nèi)選擇性擴(kuò)增多個(gè) 靶核酸分子,同時(shí)避免或盡量減少假體(也稱(chēng)作非特異性擴(kuò)增產(chǎn)物)(包括引物二聚體)的 形成。還需要改善的方法、組合物、系統(tǒng)、設(shè)備和試劑盒,其允許從單個(gè)核酸樣品(如基因組 DNA和/或)福爾馬林固定石蠟包埋(FFPE)DNA選擇性擴(kuò)增多個(gè)靶核酸分子,同時(shí)避免或盡 量減少假體的形成。本領(lǐng)域還需要改善的方法、組合物、系統(tǒng)和試劑盒,其允許在單個(gè)反應(yīng) 中同時(shí)擴(kuò)增成千上萬(wàn)的靶特異性核酸分子,其可以被用于任何可適用的下游測(cè)定或分析。 [0010] 除非另外指出,否則本主題的實(shí)施可以采用有機(jī)化學(xué)、分子生物學(xué)(包括重組技 術(shù))、細(xì)胞生物學(xué)和生物化學(xué)的常規(guī)技術(shù)和說(shuō)明,其是在本領(lǐng)域的技術(shù)范圍內(nèi)的。這樣的 常規(guī)技術(shù)包括但不限于合成多核苷酸的制備、聚合技術(shù)、聚合物顆粒的化學(xué)和物理分析、核 酸文庫(kù)的制備、核酸測(cè)序和分析等。合適的技術(shù)的具體說(shuō)明參考本文所提供的例子進(jìn)行使 用。也可以使用其它等效的常規(guī)操作。這樣的常規(guī)技術(shù)和說(shuō)明可見(jiàn)于標(biāo)準(zhǔn)實(shí)驗(yàn)室手冊(cè),如 Genome Analysis:A Laboratory Manual Series(Vols. I-IV)、PCR Primer:A Laboratory Manual, and Molecular Cloning:A Laboratory Manual (均來(lái)自 Cold Spring Harbor Laboratory Press)、Hermanson, Bioconjugate Techniques, Second Edition(Academic Press,2008) ;Merkus, Particle Size Measurements(Springer,2009) ;Rubinstein and Colby, Polymer Physics (Oxford University Press, 2003)等。 toon] 除非另有定義,否則本文所使用的所有技術(shù)和科學(xué)術(shù)語(yǔ)具有本發(fā)明所屬技術(shù)領(lǐng)域 普通技術(shù)人員通常所理解的相同的含義。本文所引用的所有專(zhuān)利、專(zhuān)利申請(qǐng)、公開(kāi)的申請(qǐng)、 論文和其它出版物(上文和下文),全文都作為參考引入。如果本文所述的定義和/或說(shuō)明 與本文作為參考引入的專(zhuān)利、專(zhuān)利申請(qǐng)、公開(kāi)的申請(qǐng)和其它出版物所述任何定義相反或以 其它方式不一致,本文所述的定義和/或說(shuō)明優(yōu)先于作為參考引入的定義。
[0012] 如本文所用,術(shù)語(yǔ)"包含(comprises) "、"包含(comprising) "、"包括 (includes) "、"包括(including) "、"具有(has) "、"具有(having) "或其任何其它變體,旨 在涵蓋非排他性的包括。例如,包含一系列特征的過(guò)程、方法、物品或設(shè)備不必僅限制于那 些特征但可以包括這樣的過(guò)程、方法、物品或設(shè)備的未明確列出或固有的其它特征。另外, 除非明確有相反的說(shuō)明,否則"或(or)"是指包含性的或而不是排他性的或。例如,條件A 或B由以下任意一種情況滿(mǎn)足:A是真(或存在)且B是假(或不存在)、A是假(或不存 在)且B是真(或存在)和A和B均是真(或存在)。
[0013] 本文所用的章節(jié)標(biāo)題僅用于組織性目的,并且不應(yīng)當(dāng)被解釋為以任何方式限制所 述主題。
[0014] 發(fā)明概述
[0015] 在本發(fā)明的一個(gè)方面,提供了被配置為與人基因組的一組SNP區(qū)域特異性雜交的 多個(gè)引物對(duì),其中所述SPN區(qū)域的組選自表1的SNP區(qū)域,并且其中至少一個(gè)引物對(duì)中的至 少一個(gè)引物包含可切割的核苷酸。在一些實(shí)施方案中,所述多個(gè)引物對(duì)被配置為與表1的 條目1-136的一組SNPs雜交。在其它實(shí)施方案中,所述多個(gè)引物對(duì)被配置為與表1的條目 1-103的一組SNPs雜交。在又一些其它實(shí)施方案中,所述至少一個(gè)引物對(duì)中的至少一個(gè)引 物包含可切割的尿嘧啶核苷酸。
[0016] 在本發(fā)明的另一個(gè)方面,提供了用于擴(kuò)增樣品內(nèi)的多個(gè)不同靶序列的方法,其包 括以下步驟:在單個(gè)擴(kuò)增反應(yīng)混合物內(nèi)從包括多個(gè)不同靶序列的樣品擴(kuò)增所述多個(gè)不同靶 序列,其中所述擴(kuò)增包括在擴(kuò)增條件下將所述樣品中的至少一些部分接觸多個(gè)靶特異性引 物和聚合酶,從而產(chǎn)生擴(kuò)增的多個(gè)靶序列,其中不同擴(kuò)增的靶序列中的至少兩個(gè)是彼此小 于50 %互補(bǔ)的,并且其中所述多個(gè)靶特異性引物中的至少一個(gè)和所述擴(kuò)增的靶序列中的 至少一個(gè)包括可切割的基團(tuán);切割所擴(kuò)增的多個(gè)靶序列中的至少一個(gè)擴(kuò)增的靶序列的可切 割的基團(tuán);在平端連接反應(yīng)中將至少一個(gè)接頭連接至至少一個(gè)擴(kuò)增的靶序列,從而產(chǎn)生一 個(gè)或多個(gè)接頭連接的擴(kuò)增的靶序列,以及再擴(kuò)增所述接頭連接的擴(kuò)增的靶序列中的至少一 個(gè)。
[0017] 在一些實(shí)施方案中,所述至少一個(gè)接頭中的一個(gè)或多個(gè)基本上不與至少一個(gè)擴(kuò)增 的靶序列互補(bǔ)。在其它實(shí)施方案中,所述再擴(kuò)增包括在擴(kuò)增條件下將所述至少一個(gè)接頭連 接的擴(kuò)增的靶序列與包括與所述接頭或它們的互補(bǔ)序列中的至少一個(gè)互補(bǔ)的序列的一個(gè) 或多個(gè)引物和聚合酶接觸,從而產(chǎn)生至少一個(gè)再擴(kuò)增的接頭連接的擴(kuò)增的靶序列。在又一 些其它實(shí)施方案中,所述一個(gè)或多個(gè)接頭或它們的互補(bǔ)序列中的至少一個(gè)基本上不與至少 一個(gè)擴(kuò)增的靶序列互補(bǔ)。本發(fā)明還提供了基本上與所述樣品中的相應(yīng)靶序列的至少一部分 基本上互補(bǔ)的至少一個(gè)靶特異性引物。在其它實(shí)施方案中,被連接至所述擴(kuò)增的靶序列中 的至少一個(gè)的接頭易受核酸外切酶消化。在又一些其它實(shí)施方案中,被連接至所述擴(kuò)增的 靶序列中的至少一個(gè)的接頭不包括保護(hù)性基團(tuán)。在又一些其它實(shí)施方案中,所述連接步驟 包括在連接條件下將具有3'端和5'端的至少一個(gè)擴(kuò)增的靶序列與包括一個(gè)或多個(gè)接頭和 連接酶的連接反應(yīng)混合物接觸,其中,在所述連接之前,所述連接反應(yīng)混合物中的所述接頭 沒(méi)有一個(gè)包括靶特異性序列。本發(fā)明還提供了所述連接步驟包括在連接條件下將至少一個(gè) 擴(kuò)增的靶序列與包括一個(gè)或多個(gè)接頭和連接酶的連接反應(yīng)混合物接觸,其中,在將所述一 個(gè)或多個(gè)接頭連接到至少一個(gè)擴(kuò)增的靶序列之前,所述連接反應(yīng)混合物不