本發(fā)明涉及確定多個(gè)分析物的存在、不存在或確定多個(gè)分析物的一個(gè)或多個(gè)特征的新方法。本發(fā)明涉及將第一分析物與含有檢測器的膜偶聯(lián),并使用檢測器研究第一分析物。本發(fā)明還涉及將第二分析物偶聯(lián)到膜上并研究第二分析物。在研究第二分析物之前,使第一分析物與膜解偶聯(lián)。本發(fā)明還涉及多核苷酸的測序。
背景技術(shù):
目前需要涉及廣泛應(yīng)用范圍的快速且廉價(jià)的多核苷酸(例如DNA或RNA)測序和識(shí)別技術(shù)。現(xiàn)有技術(shù)緩慢且昂貴,主要是因?yàn)樗鼈円揽繑U(kuò)增技術(shù)來產(chǎn)生大量的多核苷酸,并且需要大量的專門的熒光化學(xué)物質(zhì)用于信號(hào)檢測。
跨膜孔(納米孔)具有作為用于聚合物和各種小分子的直接的電生物傳感器的巨大潛力。特別地,作為潛在DNA測序技術(shù)的納米孔已成為最近焦點(diǎn)。
當(dāng)跨越納米孔施加電位時(shí),當(dāng)分析物(例如核苷酸)在桶狀體中短暫駐留一段時(shí)間后,電流發(fā)生變化。對核苷酸的納米孔檢測給出了已知標(biāo)記的電流變化和持續(xù)時(shí)間。在鏈測序方法中,使單個(gè)多核苷酸鏈穿過孔,得到對核苷酸的識(shí)別。鏈測序可以包括使用多核苷酸結(jié)合蛋白來控制多核苷酸穿過孔的移動(dòng)。
之前已經(jīng)證明,可以通過將分析物偶聯(lián)到其中存在相關(guān)檢測器的膜來實(shí)現(xiàn)超低濃度分析物傳送。這進(jìn)行檢測所需的分析物的量降低了幾個(gè)數(shù)量級(jí)(WO 2012/164270)。
技術(shù)實(shí)現(xiàn)要素:
發(fā)明人驚奇地證明,可以通過將分析物順序偶聯(lián)到其中存在檢測器的膜,研究多個(gè)樣品中的多個(gè)分析物。在研究第二分析物之前,使第一分析物與膜解偶聯(lián)。
因此,本發(fā)明提供了用于確定在兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征的方法,包括:
(a)使用一個(gè)或多個(gè)錨將第一樣品中的第一分析物偶聯(lián)至膜;
(b)使所述第一分析物與存在于所述膜中的檢測器相互作用,并由此確定所述第一分析物的存在、不存在或一個(gè)或多個(gè)特征;
(c)使所述第一分析物與所述膜解偶聯(lián);
(d)使用一個(gè)或多個(gè)錨將第二樣品中的第二分析物偶聯(lián)至所述膜;以及
(e)允許第二分析物與膜中的檢測器相互作用,并由此確定第二分析物的存在、不存在或一個(gè)或多個(gè)特征。
本發(fā)明還提供:
-使用膽固醇偶聯(lián)到膜上的分析物與膜解偶聯(lián)的方法,包括使分析物與環(huán)糊精或其衍生物接觸,并由此使分析物與膜解偶聯(lián);以及
-用于確定在兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物存在、不存在或一個(gè)或多個(gè)特征的試劑盒,包含(a)膜,(b)兩個(gè)或更多個(gè)錨,其能夠?qū)⑺鰞蓚€(gè)或更多個(gè)分析物偶聯(lián)至膜,和(c)一個(gè)或多個(gè)能夠使所述兩個(gè)或更多個(gè)分析物中的至少一個(gè)與所述膜解偶聯(lián)的試劑。
附圖說明
圖1在(1)部分中顯示了用于制備實(shí)施例2-4中使用的DNA的DNA模板(SEQ ID NO:31,標(biāo)記為A1,SEQ ID NO:47標(biāo)記為A2)。(2)部分顯示了構(gòu)建體X(在實(shí)施例2材料和方法中完整描述)的卡通圖示——iSpC3間隔區(qū)顯示為十字,四個(gè)5-硝基吲哚顯示為灰色框,膽固醇系鏈顯示為灰色橢圓形;標(biāo)記b=SEQ ID NO:34,標(biāo)記c=SEQ ID NO:35,標(biāo)記d=SEQ ID NO:39,標(biāo)記e=SEQ ID NO:41。(3)部分顯示了構(gòu)建體Y(在實(shí)施例2材料和方法中完整描述)的卡通圖示——iSpC3間隔區(qū)顯示為十字,四個(gè)5-硝基吲哚顯示為灰色框,膽固醇系鏈顯示為灰色橢圓形;標(biāo)簽b=SEQ ID NO:34,標(biāo)簽f=SEQ ID NO:37,標(biāo)簽g=SEQ ID NO:40,標(biāo)簽h=SEQ ID NO:30。
圖2顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記=時(shí)間(s),y軸標(biāo)記=百分比(%))。如標(biāo)記為X的箭頭所示,在2400秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為Y的箭頭所示,在7200秒時(shí)加入DNA構(gòu)建體Y。
圖3顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記=時(shí)間(s),y軸標(biāo)記=百分比(%))。如標(biāo)記為X的箭頭所示,在2700秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭所示,在7500秒時(shí)進(jìn)行緩沖液沖洗(10mL)。
圖4顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間的分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記=時(shí)間(s),y軸標(biāo)記=百分比(%))。如標(biāo)記為X的箭頭所示,在2700秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭所示,在6900秒時(shí)進(jìn)行1分鐘甲基-β-環(huán)糊精孵育然后沖洗(100μM,150μL)。
圖5顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記=時(shí)間(s),y軸標(biāo)記=百分比(%))。如標(biāo)記為X的箭頭所示,在2400秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭和白色框所示,在6600至6900秒之間進(jìn)行10分鐘甲基-β-環(huán)糊精孵育然后沖洗(100μM,150μL)。
圖6顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記=時(shí)間(s),y軸標(biāo)記=百分比(%))。如標(biāo)記為X的箭頭所示,在2400秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭和白色框所示,在6300至8100秒之間進(jìn)行30分鐘甲基-β-環(huán)糊精孵育然后沖洗(100μM,150μL)。
圖7顯示了實(shí)施例5中使用的DNA構(gòu)建體如何系在膜上(標(biāo)記為i)。移位穿過納米孔的DNA鏈標(biāo)記為a(SEQ ID NO:42,其3′端連接到四個(gè)iSpC3間隔區(qū)(標(biāo)記為十字),所述間隔區(qū)在另一端連接到SEQ ID NO:43的5′端)。它與標(biāo)記為b和c的兩條鏈(分別為SEQ ID NO:44和45)雜交。SEQ ID NO:45在其3′端連接到6個(gè)iSp18間隔區(qū)(標(biāo)記為d并顯示為虛線),所述間隔區(qū)在其另一端連接到兩個(gè)胸腺嘧啶和生物素基團(tuán)(標(biāo)記為f)。生物素基團(tuán)與鏈霉親和素(標(biāo)記為e)結(jié)合,所述鏈霉親和素還結(jié)合到脫硫生物素(標(biāo)記為g)。脫硫生物素連接到SEQ ID NO:46的5′端,SEQ ID NO:46的另一端具有3′膽固醇TEG(標(biāo)記為h)。
圖8顯示了實(shí)施例5中描述的實(shí)驗(yàn)的電流軌跡(y軸標(biāo)記=電流(pA),x軸標(biāo)記=時(shí)間(s))。所述軌跡顯示了偶聯(lián)步驟和使用游離的生物素去除偶聯(lián)的DNA。*1標(biāo)記對應(yīng)于脫硫生物素劑(desthiobiotin extender)的添加,*2對應(yīng)于DNA構(gòu)建體P的添加,*3對應(yīng)于游離生物素的添加,*4對應(yīng)于緩沖沖洗液(buffer flush)的添加。
圖9顯示了圖8中所示電流軌跡的三個(gè)放大區(qū)域(所有三個(gè)軌跡都具有以下軸標(biāo)記-y軸標(biāo)記=電流(pA),x軸標(biāo)記=時(shí)間(s))。軌跡A,B和C是圖8中所示軌跡的一部分的連續(xù)快照圖。*1標(biāo)記對應(yīng)于脫硫生物素劑的添加,*2對應(yīng)于DNA構(gòu)建體P的添加,*3對應(yīng)于游離生物素的添加,*4對應(yīng)于緩沖沖洗液的添加。
序列表說明
SEQ ID NO:1顯示了編碼MS-B1突變MspA單體的密碼子優(yōu)化的多核苷酸序列。該突變體缺少信號(hào)序列并包括以下突變:D90N,D91N,D93N,D118R,D134R和E139K。
SEQ ID NO:2顯示MspA單體的MS-Bi突變體的成熟形式的氨基酸序列。該突變體缺少信號(hào)序列并包括以下突變:D90N,D91N,D93N,D118R,D134R和E139K。
SEQ ID NO:3顯示編碼α-溶血素-E111N/K147N(α-HL-NN;Stoddart等人,PNAS,2009;106(19):7702-7707)的一個(gè)單體的多核昔酸序列。
SEQ ID NO:4顯示α-HL-NN的一個(gè)單體的氨基酸序列。
SEQ ID NO:5至7示出了MspB、C和D的氨基酸序列。
SEQ ID NO:8示出了編碼Phi29DNA聚合酶的多核苷酸序列。
SEQ ID NO:9示出了Phi29DNA聚合酶的氨基酸序列。
SEQ ID NO:10示出了來自大腸桿菌的sbcB基因的密碼子優(yōu)化的多核昔酸序列。它編碼來自大腸桿菌的核酸外切酶I(EcoExo I)。
SEQ ID NO:11示出了來自大腸桿菌的核酸外切酶I(EcoExo I)的氨基酸序列。
SEQ ID NO:12示出了來自大腸桿菌的xthA基因的密碼子優(yōu)化的多核苷酸序列。它編碼來自大腸桿菌的核酸外切酶III。
SEQ ID NO:13示出了來自大腸桿菌的核酸外切酶III的氨基酸序列。該酶從雙鏈DNA(dsDNA)的一條鏈以3′-5′方向進(jìn)行5′單磷酸核苷的分布消化。鏈上的酶的引發(fā)需要約4個(gè)核苷酸的5′突出(overhang)。
SEQ ID NO:14示出了來自嗜熱棲熱菌(T.thermophilus)的recJ基因的密碼子優(yōu)化的多核苷酸序列。它編碼來自嗜熱棲熱菌的RecJ酶(TthReeJ-cd)。
SEQ ID NO:15示出了來自嗜熱棲熱菌的RecJ酶的氨基酸序列(TthReeJ-cd)。該酶從ssDNA以5′-3′方向進(jìn)行5′單磷酸核苷的進(jìn)行性(processive)消化。鏈上的酶引發(fā)需要至少4個(gè)核苷酸。
SEQ ID NO:16示出了衍生自噬菌體λexo(redX)基因的密碼子優(yōu)化的多核苷酸序列。它編碼噬菌體λ核酸外切酶。
SEQ ID NO:17示出了噬菌體λ核酸外切酶的氨基酸序列。該序列是組裝成三聚體的三個(gè)相同亞基之一。該酶從dsDNA的一條鏈以5′-3′方向進(jìn)行核苷酸的高度進(jìn)行性消化(http://www.neb.com/nebecomm/products/productM0262.asp)。鏈上的酶引發(fā)優(yōu)先需要約4個(gè)具有5′磷酸的核苷酸的5′突出。
SEQ ID NO:18示出了Hel308Mbu的氨基酸序列。
SEQ ID NO:19示出了Hel308Csy的氨基酸序列。
SEQ ID NO:20示出了Hel308Tga的的氨基酸序列。
SEQ ID NO:21示出了Hel308Mhu的氨基酸序列。
SEQ ID NO:22示出了TraI Eco的氨基酸序列。
SEQ ID NO:23示出了XPD Mbu的氨基酸序列。
SEQ ID NO:24示出了Dda 1993的氨基酸序列。
SEQ ID NO:25示出了Trwc Cba的氨基酸序列。
SEQ ID NO:26顯示實(shí)施例1中使用的多核苷酸序列。
SEQ ID NO:27顯示實(shí)施例1中使用的多核苷酸序列。SEQ ID NO:27其3′端連接到四個(gè)iSp18間隔區(qū),所述間隔區(qū)在其另一端連接到SEQ ID NO:28的5′端。
SEQ ID NO:28顯示實(shí)施例1中使用的多核苷酸序列。SEQ ID NO:28其5′端連接到四個(gè)iSp18間隔區(qū),所述間隔區(qū)在其另一端連接到SEQ ID NO:27的3′端。
SEQ ID NO:29顯示實(shí)施例1中使用的多核苷酸序列。
SEQ ID NO:30至41顯示了實(shí)施例2中使用的多核苷酸序列。
SEQ ID NO:42至46顯示了實(shí)施例5中使用的多核苷酸序列。
SEQ ID NO:47顯示實(shí)施例2中使用的多核苷酸序列。
具體實(shí)施方式
應(yīng)該理解的是,所公開的產(chǎn)品和方法的不同應(yīng)用可以適用于本領(lǐng)域中的特定需要。也應(yīng)理解的是,本文使用的術(shù)語僅用于描述本發(fā)明的具體實(shí)施方案,并且不意在限制。
此外,除非內(nèi)容另外明確指出,否則用于本說明書和所附權(quán)利要求書中的單數(shù)形式“一”,“一個(gè)”,和“所述”包括復(fù)數(shù)指代。因此,例如,涉及“分析物”時(shí)包括兩個(gè)或更多個(gè)分析物,涉及“多核苷酸”時(shí)包括兩個(gè)或更多個(gè)多核昔酸,涉及“錨”時(shí)包括兩個(gè)或更多個(gè)錨,涉及“解旋酶”時(shí)包括兩個(gè)或更多個(gè)解旋酶,涉及“跨膜孔”時(shí)包括兩個(gè)或更多個(gè)孔,等。
文本無論在上文還是下文中引用的所有出版物、專利和專利申請,以全文引用的方式納入本文。
本發(fā)明的方法
本發(fā)明提供了用于確定兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征的方法。該方法包括使用一個(gè)或多個(gè)錨將第一樣品中的第一分析物偶聯(lián)至膜,并允許所述分析物與膜中存在的檢測器相互作用。由此確定第一分析物的存在、不存在或一個(gè)或多個(gè)特征。該方法還包括使用一個(gè)或多個(gè)錨將第二樣品中的第二分析物偶聯(lián)至膜,并允許第二分析物與膜中存在的檢測器相互作用。由此確定第二分析物的存在、不存在或一個(gè)或多個(gè)特征。第一分析物可以在第二分析物偶聯(lián)到膜上之前,之后或同時(shí)從膜上解偶聯(lián)。
發(fā)明人驚奇地證明,通過將分析物偶聯(lián)到其中存在檢測器的膜可以實(shí)現(xiàn)將超低濃度的分析物傳遞到檢測器。這使進(jìn)行檢測所需的分析物的量降低了幾個(gè)數(shù)量級(jí)。不能預(yù)測所需分析物的量減少的程度。
特別地,本發(fā)明人令人驚訝地報(bào)道了單鏈多核苷酸的捕獲比先前報(bào)道的提高了4個(gè)數(shù)量級(jí)。當(dāng)檢測器和分析物現(xiàn)在在同一平面上時(shí),每秒會(huì)發(fā)生~103M s-1以上的相互作用,因?yàn)檫@兩個(gè)分子在二維而不是三維上進(jìn)行擴(kuò)散。這對樣品制備要求具有顯著的影響,這些要求是診斷裝置如下一代測序系統(tǒng)的關(guān)鍵問題。
此外,將分析物偶聯(lián)至膜對于各種納米孔-酶測序應(yīng)用具有增加的優(yōu)點(diǎn)。在鏈測序中,當(dāng)在孔中引入多核苷酸分析物時(shí),孔可以永久或暫時(shí)的阻斷,從而阻止多核苷酸的測序。當(dāng)多核苷酸分析物的一端遠(yuǎn)離孔定位時(shí),例如通過偶聯(lián)或系鏈(tethering)到膜上而定位,令人驚訝地發(fā)現(xiàn),不再觀察到這種暫時(shí)或永久的阻斷。通過將多核苷酸的一端偶聯(lián)到膜上而占據(jù)該端,還起到有效地增加檢測器上的分析物濃度的作用,并因此增加測序系統(tǒng)的工作循環(huán)。
該方法當(dāng)然有利于檢測以低濃度存在的多個(gè)分析物。當(dāng)兩個(gè)或更多個(gè)待測定分析物中的每個(gè)分析物以約0.001pM至約1nM,例如小于0.01pM,小于0.1pM,小于1pM,小于10pM或小于100pM的濃度存在時(shí),該方法優(yōu)選允許確定所述兩個(gè)或更多個(gè)待測定分析物的存在或一個(gè)或多個(gè)特征。
本發(fā)明的方法對于多核苷酸測序是特別有利的,因?yàn)閮H可以從人血液獲得少量的純化多核苷酸。所述方法優(yōu)選允許估計(jì)以約0.001pM至約1nM,例如小于0.01pM,小于0.1pM,小于1pM,小于10pM或小于100pM的濃度存在的多核苷酸的序列或允許對該多核昔酸的測序。如下文更詳細(xì)討論的,所述兩個(gè)或更多個(gè)分析物可以是兩個(gè)或更多個(gè)相同分析物。這在多核昔酸測序中是有利的,因?yàn)槠湓试S多于一次地調(diào)查多核昔酸的序列。這導(dǎo)致提高的測序效率和準(zhǔn)確性。
將多核昔酸的一端偶聯(lián)至膜(甚至?xí)簳r(shí)地)也意味著將阻止該端干擾基于納米孔的測序過程。
本發(fā)明的方法還具有其它優(yōu)點(diǎn)。該方法提供了同時(shí)測定兩個(gè)或更多個(gè)分析物的替代方案,其消除了對從每個(gè)分析物獲得的測量信號(hào)進(jìn)行解偶聯(lián)的需要。該方法使得能夠順序測定兩個(gè)或更多個(gè)分析物,其中,例如,用于確定每個(gè)分析物所需的條件不同,因此使得同時(shí)測量是不切實(shí)際的。該方法還方便地使得能夠使用相同的膜測量兩個(gè)或更多個(gè)分析物,從而提供膜多次使用的可能性并延長膜的壽命。
分析物
本發(fā)明的方法涉及確定兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征??梢匝芯咳魏螖?shù)量的分析物。例如,本發(fā)明的方法可以涉及確定3,4,5,6,7,8,9,10,20,30,50,100或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征。如果使用本發(fā)明的方法研究三個(gè)或更多個(gè)分析物,則第二分析物也與膜解偶聯(lián),并針對第三分析物時(shí)增加所需數(shù)量的步驟。對于四個(gè)或更多個(gè)分析物時(shí)也是如此。
本發(fā)明的方法可包括確定或測定每個(gè)分析物的一個(gè)或多個(gè)特征。該方法可以涉及確定或測定每個(gè)分析物的兩個(gè),三個(gè),四個(gè)或五個(gè)或更多個(gè)特征。所述一個(gè)或多個(gè)特征優(yōu)選選自(i)分析物的大小,(ii)分析物的同一性,(iii)分析物的二級(jí)結(jié)構(gòu),和(iv)分析物是否被修飾??梢愿鶕?jù)本發(fā)明測量(i)至(iv)的任何組合,例如{i},{ii},{iii},{iv},{i,ii},{i,iii}i,ii,iv},{i,iii,iv},{ii,iii},{i,iii,iv}或{i,ii,iii,iv}。與第二分析物相比,對于第一分析物,可以測量(i)至(iv)的不同組合,包括上面列出的那些組合中的任一種。該方法優(yōu)選包括,估計(jì)第一多核苷酸和/或第二多核苷酸的序列或?qū)Φ谝欢嗪塑账岷?或第二多核苷酸進(jìn)行測序。
每個(gè)分析物可以是任何物質(zhì)。合適的分析物包括但不限于金屬離子,無機(jī)鹽,聚合物,例如聚合酸或堿,染料,漂白劑,藥物,診斷劑,興奮劑,爆炸物和環(huán)境污染物。
第一分析物和/或第二分析物可以是從細(xì)胞分泌的分析物?;蛘?,第一分析物和/或第二分析物可以是存在于細(xì)胞內(nèi)的分析物,使得在進(jìn)行本發(fā)明之前必須從細(xì)胞中提取該分析物。
第一分析物和/或第二分析物優(yōu)選是氨基酸、肽、多肽、蛋白質(zhì)或多核苷酸。氨基酸、肽,多肽或蛋白質(zhì)可以是天然存在的或非天然存在的。多肽或蛋白質(zhì)中可以包括合成或修飾的氨基酸。對于氨基酸的許多不同類型的修飾是本領(lǐng)域已知的。對于本發(fā)明,應(yīng)當(dāng)理解,第一分析物和/或第二分析物可以通過本領(lǐng)域可用的任何方法進(jìn)行修飾。
蛋白質(zhì)可以是酶、抗體、激素、生長因子或生長調(diào)節(jié)蛋白,例如細(xì)胞因子。細(xì)胞因子可以選自白介素,優(yōu)選IFN-1,IL-2,IL-4,IL-5,IL-6,IL-10,IL-12或IL-13,干擾素,優(yōu)選IL-γ或其它細(xì)胞因子如TNF-α。蛋白質(zhì)可以是細(xì)菌蛋白質(zhì),真菌蛋白質(zhì),病毒蛋白質(zhì)或寄生蟲衍生的蛋白質(zhì)。在其與檢測器接觸之前,蛋白質(zhì)可以解折疊以形成多肽鏈。
第一分析物和/或第二分析物最優(yōu)選是多核苷酸,例如核酸。以下更詳細(xì)地討論多核苷酸。多核昔酸可以在其5′端或3′端或沿著鏈的一個(gè)或多個(gè)中間點(diǎn)偶聯(lián)至膜。多核苷酸可以是如下所討論的單鏈或雙鏈。多核苷酸可以是環(huán)狀的。多核苷酸可以是適配體,與微小RNA(microRNA)雜交的探針或微小RNA自身(Wang,Y.等人,自然納米技術(shù)(Nature Nanotechnology),2011,6,668-674)。這兩種多核苷酸分析物可以是結(jié)合兩個(gè)蛋白質(zhì)的多核苷酸,并且可以用于表征蛋白質(zhì),例如用于確定它們的濃度。
當(dāng)分析物是與微小RNA雜交的探針時(shí),探針可永久或暫時(shí)地偶聯(lián)到膜上。這將在下面更詳細(xì)地討論。探針本身可以被配置為直接偶聯(lián)至膜或可以與已經(jīng)被配置為偶聯(lián)至膜的互補(bǔ)多核苷酸雜交。分析物可以是雜交到探針的微小RNA的復(fù)合物,其中探針具有獨(dú)特的序列或條形碼,使其能夠被明確地鑒定。
當(dāng)?shù)谝环治鑫锖?或第二分析物是適配體時(shí),適配體可永久或暫時(shí)偶聯(lián)至膜。適配體本身可以被配置為直接偶聯(lián)至膜或可以與已經(jīng)被配置為偶聯(lián)至膜的互補(bǔ)多核苷酸雜交。適配體可以結(jié)合或未結(jié)合到蛋白質(zhì)分析物,檢測適配體的最終目的可以是檢測其結(jié)合的蛋白質(zhì)分析物的存在、不存在或一個(gè)或多個(gè)特征。
第一分析物和第二分析物可以彼此不同。例如,第一分析物可以是蛋白質(zhì),第二分析物可以是多核苷酸?;蛘撸谝缓偷诙治鑫锟梢允遣煌亩嗪塑账?。在這種情況下,可以不需要在添加第二樣品之前去除至少一部分第一樣品。這將在下面更詳細(xì)地討論。如果該方法涉及研究三個(gè)或更多個(gè)分析物,則它們可以全部彼此不同或者它們中的一些可以彼此不同。
第一分析物和第二分析物可以是相同分析物的兩個(gè)實(shí)例。第一分析物可以與第二分析物相同。這允許校驗(yàn)(proof reading),特別是如果分析物是多核苷酸。如果該方法涉及研究三個(gè)或更多個(gè)分析物,則它們可以全部是相同分析物的三個(gè)或更多個(gè)實(shí)例,或者它們中的一些可以是相同分析物的單獨(dú)實(shí)例。
多核苷酸
第一和/或第二分析物優(yōu)選是多核苷酸。多核苷酸,例如核酸,是包含兩個(gè)或更多個(gè)核苷酸的大分子。多核苷酸或核酸可以包含任何核苷酸的任何組合。核苷酸可以是天然存在的或人工的。多核苷酸中的一個(gè)或多個(gè)核苷酸可以被氧化或甲基化。多核苷酸中的一個(gè)或多個(gè)核苷酸可能被損傷。例如,多核苷酸可以包含嘧啶二聚體。這樣的二聚體通常與紫外線導(dǎo)致的損傷相關(guān),并且是皮膚黑素瘤的主要原因。多核苷酸中的一個(gè)或多個(gè)核苷酸可以被修飾,例如用標(biāo)記或標(biāo)簽修飾。合適的標(biāo)記如下所述。多核苷酸可以包含一個(gè)或多個(gè)間隔區(qū)。
核苷酸通常含有核堿基、糖和至少一個(gè)磷酸基團(tuán)。核堿基和糖形成核苷。
核堿基通常是雜環(huán)的。核堿基包括但不限于嘌呤和嘧啶,更具體地,腺嘌呤(A),鳥嘌呤(G),胸腺嘧啶(T),尿嘧啶(U)和胞嘧啶(C)。
糖通常是戊糖。核苷酸糖包括但不限于核糖和脫氧核糖。糖優(yōu)選是脫氧核糖。
多核苷酸優(yōu)選包含以下核苷:脫氧腺苷(dA),脫氧尿苷(dU)和/或胸苷(dT),脫氧鳥苷(dG)和脫氧胞苷(dC)。
核苷酸通常是核糖核苷酸或脫氧核糖核苷酸。核苷酸通常含有單磷酸,二磷酸或三磷酸。核苷酸可以包含多于三個(gè)磷酸,例如4或5個(gè)磷酸。磷酸可以連接在核昔酸的5′或3′側(cè)。核昔酸包括但不限于腺苷單磷酸(AMP),鳥苷單磷酸(GMP),胸昔單磷酸(TMP),尿苷單磷酸(UMP),5-甲基胞苷單磷酸,5-羥甲基胞苷單磷酸,胞苷單磷酸(CMP),環(huán)腺苷單磷酸(cAMP),環(huán)鳥苷單磷酸(cGMP),脫氧腺苷單磷酸(dAMP),脫氧鳥昔單磷酸(dGMP),脫氧胸昔單磷酸(dTMP),脫氧尿苷單磷酸(dUMP),脫氧胞苷單磷酸(dCMP)和脫氧甲基胞苷單磷酸。核苷酸優(yōu)選選自AMP,TMP,GMP,CMP,UMP,dAMP,dTMP,dGMP,dCMP和dUMP。
核苷酸可以是無堿基的(即缺乏核堿基)。核苷酸也可以缺少核堿基和糖(即,是C3間隔區(qū))。
多核苷酸中的核苷酸可以以任何方式彼此連接。核苷酸通常通過其糖和磷酸基團(tuán)連接,如在核酸中。核苷酸可以通過其核堿基連接,如在嘧啶二聚體中。
多核苷酸可以是單鏈或雙鏈的。至少多核苷酸的一部分優(yōu)選是雙鏈的。
多核苷酸可以是核酸,例如脫氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含與DNA的一條鏈雜交的一條RNA鏈。多核苷酸可以是本領(lǐng)域已知的任何合成核酸,例如肽核酸(PNA),甘油核酸(GNA),蘇糖核酸(TNA),鎖核酸(LNA),橋聯(lián)核酸(BNA)或其他具有核苷酸側(cè)鏈的合成聚合物。PNA骨架由通過肽鍵連接的N-(2-氨基乙基)-甘氨酸重復(fù)單元組成。GNA骨架由通過磷酸二酯鍵連接的重復(fù)的乙二醇單元組成。TNA骨架由通過磷酸二酯鍵連接在一起的重復(fù)蘇糖組成。LNA由如上所述的具有連接核糖部分中的2′氧和4′碳的額外橋的核糖核苷酸形成。
多核苷酸最優(yōu)選核糖核酸(RNA)或脫氧核糖核酸(DNA)。
多核苷酸可以是任何長度。例如,多核苷酸可以是至少10,至少50,至少100,至少150,至少200,至少250,至少300,至少400或至少500個(gè)核苷酸或核苷酸對長度。多核苷酸可以是1000個(gè)或更多個(gè)核苷酸或核苷酸對,5000個(gè)或更多個(gè)核苷酸或核苷酸對長度,或100000或更多個(gè)核苷酸或核苷酸對長度。
樣品
每個(gè)分析物通常存在于任何合適的樣品中。本發(fā)明通常針對已知含有或懷疑含有分析物的兩個(gè)或更多個(gè)樣品實(shí)施?;蛘撸景l(fā)明可以針對兩個(gè)或更多個(gè)樣品實(shí)施以確認(rèn)兩個(gè)或更多個(gè)已知或預(yù)期存在于樣品中的分析物。
第一樣品和/或第二樣品可以是生物樣品。本發(fā)明可以使用從任何有機(jī)體或微生物獲得或提取的至少一種樣品在體外進(jìn)行實(shí)施。有機(jī)體或微生物通常是古細(xì)菌、原核生物或真核生物,并且通常屬于以下五界之一:植物、動(dòng)物、真菌、原核生物和原生生物。本發(fā)明可以對至少一種獲自或提取自任何病毒的樣品在體外進(jìn)行實(shí)施。第一樣品和/或第二樣品優(yōu)選是流體樣品。第一樣品和/或第二樣品通常包括患者的體液。第一樣品和/或第二樣品可以是尿、淋巴液、唾液、粘液或羊水,但優(yōu)選是血液、血漿或血清。通常,第一樣品和/或第二樣品是來源于人的,但是替代地,其可以來自另一種哺乳動(dòng)物,例如來自商業(yè)養(yǎng)殖的動(dòng)物,如馬,牛,羊,魚,雞或豬,或者可以是寵物,例如貓或狗?;蛘?,第一樣品和/或第二樣品可以是來源于植物,例如獲自以下的樣品:商業(yè)作物如谷物,豆類,水果或蔬菜,例如小麥,大麥,燕麥,油菜,玉米,大豆,水稻,大黃,香蕉,蘋果,番茄,土豆,葡萄,煙草,豆類,小扁豆,甘蔗,可可,棉花。
第一樣品和/或第二樣品可以是非生物樣品。非生物樣品優(yōu)選是流體樣品。非生物樣品的實(shí)例包括外科手術(shù)流體,水如飲用水,海水或河水,以及用于實(shí)驗(yàn)室試驗(yàn)的試劑。
第一樣品和/或第二樣品通常在用于本發(fā)明之前進(jìn)行處理,例如通過離心或通過膜過濾掉不想要的分子或細(xì)胞(例如紅細(xì)胞)。第一樣品和/或第二樣品可以在獲取后立即測量。第一樣品和/或第二樣品也可以典型地在測定之前儲(chǔ)存,優(yōu)選在低于-70℃。
第一樣品和第二樣品可以彼此不同。例如,第一樣品可以來自人,第二樣品可以來自病毒。如果第一和第二樣品彼此不同,它們可以含有或被懷疑含有相同的第一和第二分析物。如果該方法涉及研究三個(gè)或更多個(gè)樣品,則它們可以全部彼此不同或者它們中的一些可以彼此不同。
第一樣品和第二樣品優(yōu)選是相同樣品的兩個(gè)實(shí)例。第一樣品優(yōu)選與第二樣品相同。這允許校驗(yàn)讀取,特別是如果分析物是多核苷酸。如果該方法涉及研究三個(gè)或更多個(gè)樣品,則它們可以全部是相同樣品的三個(gè)或更多個(gè)實(shí)例,或者它們中的一些可以是相同樣品的單獨(dú)實(shí)例。
膜
根據(jù)本發(fā)明可以使用任何膜。合適的膜是本領(lǐng)域公知的。膜優(yōu)選是兩親性層。兩親性層是由兩親性分子形成的層,例如磷脂,其具有親水性和親脂性。兩親分子可以是合成的或天然存在的。形成單層的非天然存在的兩親物(一個(gè)或多個(gè))是本領(lǐng)域已知的,包括例如嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中兩個(gè)或更多個(gè)單體亞單元聚合在一起產(chǎn)生單一聚合物鏈的聚合物材料。嵌段共聚物通常具有由每個(gè)單體亞單元貢獻(xiàn)的性質(zhì)。然而,嵌段共聚物可具有由各個(gè)亞單元形成的聚合物不具有的獨(dú)特性質(zhì)。可以改造嵌段共聚物,使得單體亞單元之一是疏水的(即親脂的),而其它亞單元在水性介質(zhì)中是親水的。在這種情況下,嵌段共聚物可以具有兩親性質(zhì)并且可以形成能模擬生物膜的結(jié)構(gòu)。嵌段共聚物可以是二嵌段(由兩個(gè)單體亞單元組成),但也可以由多于兩個(gè)單體亞單元構(gòu)成,以形成表現(xiàn)為兩親物的更復(fù)雜的構(gòu)型。共聚物可以是三嵌段,四嵌段或五嵌段共聚物。膜優(yōu)選是三嵌段共聚物膜。
古細(xì)菌雙極性性四醚脂質(zhì)(bipolar tetraether lipids)是天然存在的脂質(zhì),其被構(gòu)建為使得該脂質(zhì)形成單層膜。這些脂質(zhì)通常存在于在惡劣的生物環(huán)境存活的極端微生物,嗜熱菌,嗜鹽菌和嗜酸菌中。它們的穩(wěn)定性被認(rèn)為源于最終雙層的融合性質(zhì)。通過產(chǎn)生具有親水-疏水-親水的通用基序的三嵌段聚合物,可以直接構(gòu)建模擬這些生物實(shí)體的嵌段共聚物材料。這種材料可以形成單體膜,其類似于脂質(zhì)雙層而發(fā)揮作用,并且包括從囊泡到層狀膜的一系列相行為。由這些三嵌段共聚物形成的膜與生物脂質(zhì)膜相比具有一些優(yōu)點(diǎn)。因?yàn)樗鋈抖喂簿畚锸呛铣傻?,可仔?xì)控制精確的構(gòu)造以提供形成膜和與孔及其它蛋白質(zhì)相互作用所需的正確的鏈長度和性質(zhì)。
嵌段共聚物也可以由不歸類為脂質(zhì)亞材料的亞單元構(gòu)造而成;例如疏水性聚合物可以由硅氧烷或其它非烴基單體制成。嵌段共聚物的親水性子部也可以具有低的蛋白質(zhì)結(jié)合性質(zhì),這允許產(chǎn)生當(dāng)暴露于未加工的生物樣品時(shí)高度耐受的膜。該頭部基團(tuán)單元還可以衍生自非經(jīng)典脂質(zhì)頭部基團(tuán)。
與生物脂質(zhì)膜相比,三嵌段共聚物膜還具有增加的機(jī)械和環(huán)境穩(wěn)定性,例如高得多的操作溫度或pH范圍。嵌段共聚物的合成性質(zhì)為廣泛的應(yīng)用提供了定制基于聚合物的膜的平臺(tái)。
在優(yōu)選的實(shí)施方案中,本發(fā)明提供了用于確定兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或更多個(gè)特征的方法,包括(a)使用一個(gè)或多個(gè)錨將第一樣品中的第一分析物偶聯(lián)至膜,所述錨包括三嵌段共聚物,任選地其中所述膜被修飾以促進(jìn)偶聯(lián);(b)使所述第一分析物與存在于所述膜中的檢測器相互作用,由此確定所述第一分析物的存在、不存在或一個(gè)或多個(gè)特征;(c)使所述第一分析物與所述膜解偶聯(lián);(d)使用一個(gè)或多個(gè)錨將第二樣品中的第二分析物偶聯(lián)至所述膜;和(e)允許第二分析物與膜中的檢測器相互作用,由此確定第二分析物的存在、不存在或一個(gè)或多個(gè)特征。
該膜最優(yōu)選是國際申請?zhí)朠CT/GB2013/052766或PCT/GB2013/052767中公開的膜之一。
兩親性分子可被化學(xué)修飾或官能化以促進(jìn)分析物的偶聯(lián)。
兩親性層可以是單層或雙層。兩親性層通常是平面的。兩親性層可以是彎曲的。兩親性層可以被支撐。
兩親性膜通常是天然可移動(dòng)的,基本上用作具有約10-8cm s-1的脂質(zhì)擴(kuò)散速率的二維流體。這意味著檢測器和偶聯(lián)的分析物通??梢栽趦捎H性膜內(nèi)移動(dòng)。
膜可以是脂質(zhì)雙層。脂質(zhì)雙層是細(xì)胞膜的模型,并且作為一系列實(shí)驗(yàn)研究的優(yōu)良平臺(tái)。例如,脂質(zhì)雙層可以用于通過單通道記錄進(jìn)行的膜蛋白的體外研究?;蛘撸|(zhì)雙層可用作生物傳感器以檢測多種物質(zhì)的存在。脂質(zhì)雙層可以是任何脂質(zhì)雙層。合適的脂質(zhì)雙層包括但不限于平面脂質(zhì)雙層、受支撐雙層,或脂質(zhì)體。脂質(zhì)雙層優(yōu)選為平面脂質(zhì)雙層。合適的脂質(zhì)雙層在國際申請?zhí)朠CT/GB08/000563(公開為WO 2008/102121),國際申請?zhí)朠CT/GB08/004127(公開為WO 2009/077734)和國際申請?zhí)朠CT/GB2006/001057(公開為WO 2006/100484)中公開。
形成脂質(zhì)雙層的方法是本領(lǐng)域已知的。合適的方法公開在實(shí)施例中。脂質(zhì)雙層通常通過Montal和Mueller(Proc.Natl.Acad.Sci.USA.,1972;69:3561-3566)的方法形成,其中脂質(zhì)單層被攜帶在水溶液/空氣界面上,穿過垂直于該界面的孔的任一側(cè)。通常通過下述將脂質(zhì)添加到電解質(zhì)水溶液的表面:首先將脂質(zhì)溶解在有機(jī)溶劑中,然后允許溶劑滴在孔的任一側(cè)上的水溶液的表面上蒸發(fā)。一旦有機(jī)溶劑蒸發(fā),孔的任一側(cè)上的溶液/空氣界面物理地上下移動(dòng),穿過所述孔直到形成雙層。平面脂質(zhì)雙層可以形成為,穿過膜中的孔或穿過開口而進(jìn)入凹部。
Montal&Mueller的方法是受歡迎的,因?yàn)樗切纬蛇m合于蛋白質(zhì)孔插入的優(yōu)質(zhì)脂質(zhì)雙層的成本劃算和相對直接的方法。形成雙層的其他常見方法包括尖端浸漬、涂覆雙層,和膜片鉗夾脂質(zhì)體雙層(patch-clamping of liposome bilayers)。
尖端浸漬雙層的形成需要使孔表面(例如,移液管尖端)接觸到攜帶單層脂質(zhì)的測試溶液的表面上。另外,首先通過允許溶解在有機(jī)溶劑中的脂質(zhì)滴在溶液表面蒸發(fā)而在溶液/空氣界面處產(chǎn)生脂質(zhì)單層。然后通過Langmuir-Schaefer方法形成雙層,并且需要機(jī)械自動(dòng)化設(shè)備以相對于溶液表面移動(dòng)孔。
對于涂覆的雙層,將溶解在有機(jī)溶劑中的脂質(zhì)滴直接施加到孔中,將其浸沒在水性測試溶液中。使用油漆刷或等效物將脂質(zhì)溶液稀薄地鋪在孔上。溶劑的稀釋導(dǎo)致脂質(zhì)雙層的形成。然而,從雙層中完全去除溶劑是困難的,因此由該方法形成的雙層在電化學(xué)測量期間不太穩(wěn)定且更容易產(chǎn)生噪聲。
膜片鉗夾通常用于生物細(xì)胞膜的研究。通過抽吸將細(xì)胞膜夾到移液管的末端,并且膜的貼片附著在孔上。該方法已經(jīng)被調(diào)整為通過夾持脂質(zhì)體產(chǎn)生脂質(zhì)雙層,然后脂質(zhì)體破裂以在移液管的孔口上留下脂質(zhì)雙層密封。該方法需要穩(wěn)定的巨大且單層的脂質(zhì)體以及在具有玻璃表面的材料中制造小孔。
脂質(zhì)體可以通過超聲,擠出或Mozafari方法(Colas等人(2007)Micron 38:841-847)形成。
在優(yōu)選的實(shí)施方案中,脂質(zhì)雙層如國際申請?zhí)朠CT/GB08/004127(公開為WO 2009/077734)中所述形成。有利地,在該方法中,脂質(zhì)雙層由干燥的脂質(zhì)形成。在最優(yōu)選的實(shí)施方案中,脂質(zhì)雙層穿越開口形成,如WO2009/077734(PCT/GB08/004127)中所述。
脂質(zhì)雙層由兩個(gè)相對的脂質(zhì)層形成。兩層脂質(zhì)排列成使得它們的疏水尾部基團(tuán)彼此面對以形成疏水內(nèi)部。脂質(zhì)的親水性頭部基團(tuán)在雙層的每一側(cè)上面向外朝向水性環(huán)境。雙層可存在于許多脂質(zhì)相中,包括但不限于液體無序相(流體層狀相),液體有序相,固體有序相(層狀凝膠相,交叉凝膠相(interdigitated gel phase))和平面雙層晶體(層狀亞凝膠相,層狀結(jié)晶相)。
可以使用形成脂質(zhì)雙層的任何脂質(zhì)組合物。選擇脂質(zhì)組合物,使得形成具有所需性質(zhì)(例如表面電荷)、支持膜蛋白的能力、堆積密度或機(jī)械性質(zhì)的脂質(zhì)雙層。脂質(zhì)組合物可以包含一個(gè)或多個(gè)不同的脂質(zhì)。例如,脂質(zhì)組合物可以含有多達(dá)100種脂質(zhì)。脂質(zhì)組合物優(yōu)選含有1至10種脂質(zhì)。脂質(zhì)組合物可以包含天然存在的脂質(zhì)和/或人工脂質(zhì)。
脂質(zhì)通常包含頭部基團(tuán)、界面部分和兩個(gè)可以相同或不同的疏水尾部基團(tuán)。合適的頭部基團(tuán)包括但不限于中性頭部基團(tuán),例如二?;视王?DG)和神經(jīng)酰胺(CM);兩性離子頭部基團(tuán),例如磷脂酰膽堿(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);帶負(fù)電荷的頭部基團(tuán),例如磷脂酰甘油(PG);磷脂酰絲氨酸(PS),磷脂酰肌醇(PI),磷酸(PA)和心磷脂(CA);以及帶正電荷的頭部基團(tuán),例如三甲基銨-丙烷(TAP)。合適的界面部分包括但不限于天然存在的界面部分,例如基于甘油或基于神經(jīng)酰胺的部分。合適的疏水性尾部基團(tuán)包括但不限于飽和烴鏈,例如月桂酸(正十二烷酸),肉豆蔻酸(正十四烷酸),棕櫚酸(正十六烷酸),硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不飽和烴鏈,例如油酸(順-9-十八烷酸);和支鏈烴鏈,例如植烷?;?。鏈的長度和不飽和烴鏈中雙鍵的位置和數(shù)目可以變化。鏈的長度和支鏈烴鏈中支鏈(例如甲基)的位置和數(shù)目可以變化。疏水性尾部基團(tuán)可以作為醚或酯連接到界面部分。脂質(zhì)可以是分枝菌酸。
脂質(zhì)也可以是化學(xué)修飾的。脂質(zhì)的頭部基團(tuán)或尾部基團(tuán)可以是化學(xué)修飾的。頭部基團(tuán)已被化學(xué)修飾的合適的脂質(zhì)包括但不限于PEG修飾的脂質(zhì),例如1,2-二酰基-sn-甘油基-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];官能化的PEG脂質(zhì),例如1,2-二硬脂?;?sn-甘油基-3-磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];和修飾為用于軛合的脂質(zhì),例如1,2-二油?;?sn-甘油基-3-磷酸乙醇胺-N-(琥珀?;?和1,2-二棕櫚酰基-sn-甘油基-3-磷酸乙醇胺-N-(生物素基)。尾部基團(tuán)已經(jīng)化學(xué)修飾的合適的脂質(zhì)包括但不限于可聚合脂質(zhì),例如1,2-雙(10,12-二十三碳二炔?;?-sn-甘油基-3-磷酸膽堿;氟化脂質(zhì),例如1-棕櫚?;?2-(16-氟棕櫚?;?-sn-甘油基-3-磷酸膽堿;氘代脂質(zhì),例如1,2-二棕櫚?;?D62-sn-甘油-3-磷酸膽堿;和醚連接的脂質(zhì),例如1,2-二-O-植烷基-sn-甘油基-3-磷酸膽堿。脂質(zhì)可以被化學(xué)修飾或官能化以促進(jìn)分析物的偶聯(lián)。
兩親性層,例如脂質(zhì)組合物,通常包含一個(gè)或多個(gè)將影響該層的性質(zhì)的添加劑。合適的添加劑包括但不限于脂肪酸,例如棕櫚酸,肉豆蔻酸和油酸;脂肪醇,例如棕櫚醇,肉豆蔻醇和油醇;甾醇,例如膽固醇,麥角固醇,羊毛甾醇,谷甾醇和豆甾醇;溶血磷脂,例如1-酰基-2-羥基-sn-甘油基-3-磷酸膽堿;和神經(jīng)酰胺。
在另一個(gè)優(yōu)選的實(shí)施方案中,膜是固態(tài)層。固態(tài)層可以由有機(jī)和無機(jī)材料形成,包括但不限于微電子材料,絕緣材料例如Si3N4,Al2O3和SiO,有機(jī)和無機(jī)聚合物例如聚酰胺,塑料例如或者彈性體例如雙組分加成固化硅橡膠,以及玻璃。固態(tài)層可以由石墨烯形成。合適的石墨烯層公開在國際申請?zhí)朠CT/US2008/010637(公開為WO 2009/035647)中。
該方法通常使用(i)包含孔的人工兩親性層,(ii)包含孔的分離的天然存在的脂質(zhì)雙層,或(iii)其中插入有孔的細(xì)胞進(jìn)行實(shí)施。該方法通常使用人工兩親性層如人工三嵌段共聚物層進(jìn)行實(shí)施。該層除了孔之外還可以包含其它跨膜蛋白和/或膜內(nèi)蛋白以及其他分子。下面討論合適的裝置和條件。本發(fā)明的方法通常在體外進(jìn)行。
偶聯(lián)
每個(gè)分析物可以使用任何已知的方法偶聯(lián)到膜上。使用一個(gè)或多個(gè)錨將每個(gè)分析物偶聯(lián)至膜。
偶聯(lián)意味著使用一個(gè)或多個(gè)錨將分析物有意地與膜連接。該方法優(yōu)選包括使用一個(gè)或多個(gè)錨將第一分析物特異性偶聯(lián)到膜上。該方法優(yōu)選包括使用一個(gè)或多個(gè)錨將第二分析物特異性偶聯(lián)到膜上。第一分析物和/或第二分析物優(yōu)選不通過非特異性相互作用與膜偶聯(lián)。
每個(gè)錨包含偶聯(lián)(或結(jié)合)至適配體的基團(tuán)和偶聯(lián)(或結(jié)合)至膜的基團(tuán)。每個(gè)錨可以共價(jià)地偶聯(lián)(或結(jié)合)到適配體和/或膜。
每個(gè)分析物可以使用任何數(shù)量的錨,例如2,3,4個(gè)或更多個(gè)錨偶聯(lián)到膜。例如,一個(gè)分析物可以使用兩個(gè)錨偶聯(lián)到膜,其中每個(gè)錨單獨(dú)偶聯(lián)(或結(jié)合)到分析物和膜。
所述一個(gè)或多個(gè)錨可以包含一個(gè)或多個(gè)多核苷酸結(jié)合蛋白。每個(gè)錨可以包含一個(gè)或多個(gè)多核苷酸結(jié)合蛋白。多核苷酸結(jié)合蛋白可以是下面討論的任何一種。
在一些實(shí)施方案中,使用在第一分析物解偶聯(lián)后留在膜中的一個(gè)或多個(gè)錨將第二分析物偶聯(lián)到膜?;蛘?,使用其它(或分開的)一個(gè)或多個(gè)錨將第二分析物偶聯(lián)至膜。用于偶聯(lián)第二分析物的一個(gè)或多個(gè)錨可以與用于偶聯(lián)第一分析物的錨是相同類型,或者可以是不同類型的錨。這將在下面更詳細(xì)地討論。
如果膜是兩親性層,例如三嵌段共聚物膜,則一個(gè)或多個(gè)錨優(yōu)選包含存在于膜中的多肽錨和/或存在于膜中的疏水錨。疏水錨優(yōu)選是脂質(zhì),脂肪酸,固醇,碳納米管,多肽,蛋白質(zhì)或氨基酸,例如膽固醇,棕櫚酸酯或生育酚。在優(yōu)選實(shí)施例中,所述一個(gè)或多個(gè)錨不是檢測器。
膜的組分,例如兩親性分子,共聚物或脂質(zhì),可以被化學(xué)修飾或官能化以形成一個(gè)或多個(gè)錨。以下更詳細(xì)地討論合適的化學(xué)修飾和官能化膜的組分的合適方式的實(shí)例。任何比例,例如至少0.01%,至少0.1%,至少1%,至少10%,至少25%,至少50%或100%的膜組分可以官能化。
第一和/或第二分析物可以直接偶聯(lián)到膜。用于將第一分析物和/或第二分析物偶聯(lián)至膜的一個(gè)或多個(gè)錨優(yōu)選包含接頭。所述一個(gè)或多個(gè)錨可包含一個(gè)或多個(gè),例如2,3,4或更多個(gè)接頭。一個(gè)接頭可以用于將多于一個(gè),例如2,3,4或更多個(gè)分析物偶聯(lián)到膜上。
優(yōu)選的接頭包括但不限于聚合物,例如多核苷酸,聚乙二醇(PEG),多糖和多肽。這些連接體可以是直鏈、支鏈或環(huán)狀的。例如,接頭可以是環(huán)狀多核苷酸。如果分析物本身是多核昔酸,其可以與環(huán)狀多核苷酸接頭上的互補(bǔ)序列雜交。
所述一個(gè)或多個(gè)錨或一個(gè)或多個(gè)接頭可以包括可以被切割或分解的組分,例如限制位點(diǎn)或光不穩(wěn)定基團(tuán)。
官能化接頭和它們可以偶聯(lián)分子的方式是本領(lǐng)域已知的。例如,用馬來酰亞胺基團(tuán)官能化的接頭將與蛋白質(zhì)中的半胱氨酸殘基反應(yīng)并連接。在本發(fā)明的上下文中,蛋白質(zhì)可以存在于膜中,可以是分析物本身或可以用于偶聯(lián)(或結(jié)合)到分析物。這將在下面更詳細(xì)地討論。
可以使用“鎖和鑰匙”構(gòu)造來避免分析物的交聯(lián)。每個(gè)接頭僅一端可以一起反應(yīng)以形成更長的接頭,并且接頭的其他端各自分別與分析物或膜反應(yīng)。這樣的接頭在國際申請?zhí)朠CT/GBl0/000132(公開為WO 2010/086602)中描述。
接頭優(yōu)選在下文討論的測序?qū)嵤┓桨钢惺褂?。如果多核昔酸分析物直接永久偶?lián)至膜,意義在于,其在與檢測器相互作用時(shí)不會(huì)解偶聯(lián)(即在步驟(b)或(e)中不解偶聯(lián)),則一些序列數(shù)據(jù)將由于膜和檢測器之間的距離導(dǎo)致測序不能繼續(xù)進(jìn)行到多核苷酸的末端而丟失。如果使用接頭,則可以將多核苷酸分析物進(jìn)行到完成。
偶聯(lián)可以是永久的或穩(wěn)定的。換句話說,偶聯(lián)可以使得分析物在與檢測器相互作用時(shí)保持偶聯(lián)到膜(即在步驟(b)或(e)中不解偶聯(lián))。
偶聯(lián)可以是暫時(shí)的。換句話說,偶聯(lián)可以使得分析物在與檢測器相互作用時(shí)從膜解偶聯(lián)(即可以在步驟(b)或(e)中解偶聯(lián))。通常,第一分析物的一些保持偶聯(lián)到膜,例如,因?yàn)樗鼈儾慌c檢測器相互作用,因此需要在步驟(c)中解偶聯(lián)。對于某些應(yīng)用,例如適體器檢測和多核苷酸測序,優(yōu)選暫時(shí)性質(zhì)的偶聯(lián)。如果永久或穩(wěn)定的接頭直接連接到多核昔酸的5′或3′末端,并且接頭短于膜和跨膜孔通道之間的距離,則一些序列數(shù)據(jù)將丟失,因?yàn)闇y序不能繼續(xù)進(jìn)行到多核苷酸的末端。如果偶聯(lián)是暫時(shí)的,則當(dāng)偶聯(lián)的末端隨機(jī)變得不含膜時(shí),則多核苷酸可以進(jìn)行到完成。形成永久/穩(wěn)定或暫時(shí)連接的化學(xué)基團(tuán)在下面更詳細(xì)地討論。分析物可以使用膽固醇或脂肪?;湑簳r(shí)地偶聯(lián)至兩親性層或三嵌段共聚物膜??梢允褂镁哂?至30個(gè)碳原子長度的任何脂肪?;湥缡樗?。
在優(yōu)選的實(shí)施方案中,多核苷酸分析物例如核酸偶聯(lián)到兩親性層,例如三嵌段共聚物膜或脂質(zhì)雙層。之前已經(jīng)用各種不同的系鏈策略進(jìn)行了核酸與合成脂質(zhì)雙層的偶聯(lián)。這些結(jié)果總結(jié)在下表1中。
表1
合成的多核昔酸分析物和/或接頭可以在合成反應(yīng)中使用修飾的亞磷酰胺來官能化,其易于與直接加入的合適的錨基團(tuán)如膽固醇,生育酚,棕櫚酸酯,硫醇,脂質(zhì)和生物素基團(tuán)兼容。這些不同的連接化學(xué)基團(tuán)提供了用于連接到多核苷酸的一組選擇。每個(gè)不同的修飾基團(tuán)以略微不同的方式偶聯(lián)多核昔酸,并且偶聯(lián)不總是永久性的,因此對分析物到膜提供了不同停留時(shí)間。上面討論了暫時(shí)性偶聯(lián)的優(yōu)點(diǎn)。
多核苷酸到接頭或到功能化膜的偶聯(lián)也可以通過許多其它方式實(shí)現(xiàn),條件是可以將互補(bǔ)反應(yīng)性基團(tuán)或錨定基團(tuán)添加到多核苷酸。先前已經(jīng)報(bào)道了向多核苷酸的任一端添加反應(yīng)性基團(tuán)??墒褂肨4多核苷酸激酶和ATPγS將硫醇基團(tuán)添加到ssDNA或dsDNA的5′端(Grant,GP和PZQin(2007).″A facile method for attaching nitroxide spin labels at the 5′terminus of nucleic acids.″Nucleic Acids Res 35(10):e77)。使用T4多核苷酸激酶和γ-[2-疊氮基乙基]-ATP或γ-[6-疊氮基己基]-ATP將疊氮基添加到ssDNA或dsDNA的5′-磷酸。使用硫醇或Click化學(xué),可以將含有硫醇、碘乙酰胺OPSS或馬來酰亞胺基團(tuán)(對硫醇具有反應(yīng)性)或DIBO(二苯并環(huán)辛炔)或炔基(對疊氮化物具有反應(yīng)性)的系鏈共價(jià)連接到分析物??梢允褂媚┒宿D(zhuǎn)移酶添加更多樣化學(xué)基團(tuán)例如生物素、硫醇和熒光團(tuán)的選擇,以將修飾的寡核昔酸納入ssDNA的3′(Kumar,A.,P.Tchen,等(1988).″Nonradioactive labeling of synthetic oligonucleotide probes with terminal deoxynucleotidyl transferase.″Anal Biochem 169(2):376-82)。鏈霉親和素/生物素和/或鏈霉親和素/脫硫生物素偶聯(lián)可用于任何其它分析物。下面的實(shí)施例描述了如何使用鏈霉親和素/生物素和鏈霉親和素/脫硫生物素將多核苷酸偶聯(lián)到膜上。也可以使用具有適當(dāng)修飾的核苷酸(例如膽固醇或棕櫚酸酯)通過末端轉(zhuǎn)移酶將錨直接添加到多核苷酶。
所述一個(gè)或多個(gè)錨優(yōu)選通過雜交將第一分析物和/或第二分析物偶聯(lián)到膜。雜交可以存在于一個(gè)或多個(gè)錨的任何部分中,例如存在于一個(gè)或多個(gè)錨和分析物之間,存在于一個(gè)或多個(gè)錨內(nèi),或存在于一個(gè)或多個(gè)錨和膜之間。在一個(gè)或多個(gè)錨中的雜交允許以如上所述的暫時(shí)方式偶聯(lián)。例如,接頭可以包含兩個(gè)或更多個(gè)多核苷酸,例如3,4或5個(gè)多核苷酸,它們雜交在一起。如果第一分析物和/或第二分析物本身是多核苷酸,則所述一個(gè)或多個(gè)錨可以與第一多核苷酸分析物和/或第二多核苷酸分析物雜交。所述一個(gè)或多個(gè)錨可以直接與多核苷酸分析物雜交,直接與Y適配體和/或連接到多核苷酸分析物的前導(dǎo)序列雜交,或直接與多核苷酸分析物連接的發(fā)夾環(huán)適配體雜交(如下文更詳細(xì)討論的)。或者,所述一個(gè)或多個(gè)錨可以與一個(gè)或多個(gè),例如2或3個(gè)中間多核苷酸(或“夾板(splint)”)雜交,其中所述中間多核苷酸雜交到多核苷酸分析物,雜交到Y(jié)適配體和/或連接到多核苷酸分析物的前導(dǎo)序列,或雜交到與多核昔酸分析物連接的發(fā)夾環(huán)適配體上(如下面更詳細(xì)討論的)。
所述一個(gè)或多個(gè)錨可以包括單鏈或雙鏈多核苷酸。錨的一部分可以連接到單鏈或雙鏈多核苷酸分析物。已經(jīng)報(bào)道了使用T4RNA連接酶I連接ssDNA短片段(Troutt,A.B.,M.G.McHeyzer-Williams,等人(1992).″Ligation-anchored PCR:a simple amplification technique with single-sided specificity.″Proc Natl Acad Sci USA 89(20):9823-5)?;蛘?,單鏈或雙鏈多核苷酸可以連接到雙鏈多核昔酸分析物,然后通過熱或化學(xué)變性分離兩條鏈。對于雙鏈多核苷酸,可以向雙鏈的一個(gè)或兩個(gè)末端添加一段單鏈多核苷酸,或者向一個(gè)或兩個(gè)末端添加雙鏈多核昔酸。對于將單鏈多核苷酸添加到雙鏈多核苷酸,可以使用T4RNA連接酶I實(shí)現(xiàn),用于與單鏈多核苷酸的其他區(qū)域連接。對于將雙鏈多核苷酸添加到雙鏈多核苷酸分析物,連接可以用分別在分析物和添加的多核苷酸上的互補(bǔ)的3′dA/dT尾部“平端化(blunt-ended)”(對于許多樣品制備應(yīng)用,常規(guī)這樣進(jìn)行,以防止多聯(lián)體或二聚體形成),或使用通過分析物的限制性消化產(chǎn)生的“粘性末端”以及連接相容的適配體“平端化”。然后,當(dāng)雙鏈體被變性,如果單鏈多核苷酸用于連接,則每條單鏈將具有5′或3′修飾,或者如果雙鏈多核苷酸用于連接,則每條單鏈將具有在5′末端,3′末端或這兩個(gè)末端的修飾。
如果多核苷酸分析物是合成的鏈,則可以在多核苷酸的化學(xué)合成期間加入一個(gè)或多個(gè)錨。例如,可以使用具有與其連接的反應(yīng)性基團(tuán)的引物合成多核苷酸。
腺苷酸化多核苷酸是連接反應(yīng)中的中間體,其中腺苷單磷酸連接到多核苷酸的5′-磷酸。各種試劑盒可用于產(chǎn)生該中間體,例如來自NEB的5′DNA腺苷酸化試劑盒。通過在反應(yīng)中用ATP代替修飾的核苷三磷酸,然后向多核昔酸的5′添加反應(yīng)性基團(tuán)(例如硫醇,胺,生物素,疊氮化物等)是可行的。也可以使用具有適當(dāng)修飾的核苷酸(例如膽固醇或棕櫚酸酯)的5′DNA腺苷酸化試劑盒將錨直接添加到多核苷酸。
用于擴(kuò)增基因組DNA的片段的常見技術(shù)是使用聚合酶鏈反應(yīng)(PCR)。這里,使用兩個(gè)合成的寡核苷酸引物,可以產(chǎn)生相同的DNA片段的多個(gè)拷貝,其中對于每個(gè)拷貝,雙鏈中每條鏈的5′將是合成的多核苷酸??梢酝ㄟ^使用聚合酶將單個(gè)或多個(gè)核苷酸加入單鏈或雙鏈DNA的3′端??梢允褂玫木酆厦傅膶?shí)例包括但不限于末端轉(zhuǎn)移酶,Klenow和大腸桿菌Poly(A)聚合酶。通過在反應(yīng)中用ATP代替修飾的核苷三磷酸,然后可以將錨例如膽固醇,硫醇,胺,疊氮化物,生物素或脂質(zhì)摻入雙鏈多核苷酸中。因此,擴(kuò)增的多核苷酸的每個(gè)拷貝將含有錨。
理想地,分析物偶聯(lián)至膜而不需要官能化所述分析物。這可以通過將一個(gè)或多個(gè)錨如多核苷酸結(jié)合蛋白或化學(xué)基團(tuán)偶聯(lián)至膜并允許一個(gè)或多個(gè)錨與分析物相互作用或通過使膜官能化來實(shí)現(xiàn)。所述一個(gè)或多個(gè)錨可以通過本文所述的任何方法偶聯(lián)至膜。特別地,所述一個(gè)或多個(gè)錨可以包含一個(gè)或多個(gè)接頭,例如馬來酰亞胺官能化的接頭。
在該實(shí)施方案中,分析物通常是RNA,DNA,PNA,TNA或LNA,并且可以是雙鏈或單鏈的。該實(shí)施方案特別適合于基因組DNA分析物。
一個(gè)或多個(gè)錨可以包括下述任何基團(tuán):所述基團(tuán)與單鏈或雙鏈多核苷酸、分析物內(nèi)的特定核苷酸序列或分析物內(nèi)修飾的核苷酸模式,或存在于多核苷酸上的任何其它配體偶聯(lián)、結(jié)合或相互作用。
用于錨中的合適的結(jié)合蛋白包括但不限于大腸桿菌單鏈結(jié)合蛋白,P5單鏈結(jié)合蛋白,T4gp32單鏈結(jié)合蛋白,TOPO V dsDNA結(jié)合區(qū),人組蛋白,大腸桿菌HU DNA結(jié)合蛋白和其它古細(xì)菌、原核或真核的單鏈或雙鏈多核苷酸(或核酸)結(jié)合蛋白,包括下面列出的那些。
特定核苷酸序列可以是由轉(zhuǎn)錄因子、核糖體、內(nèi)切核酸酶、拓?fù)洚悩?gòu)酶或復(fù)制起始因子識(shí)別的序列。修飾的核苷酸的模式可以是甲基化或損傷模式。
所述一個(gè)或多個(gè)錨可以包括與多核苷酸分析物偶聯(lián)、結(jié)合、插入或相互作用的任何基團(tuán)。所述基團(tuán)可以通過靜電、氫鍵或范德華相互作用而插入多核苷酸分析物或與多核苷酸分析物相互作用。這些基團(tuán)包括賴氨酸單體、聚賴氨酸(其將與ssDNA或dsDNA相互作用)、溴化乙錠(其將插入dsDNA)、通用堿基或通用核苷酸(其可與任何多核苷酸分析物雜交)和鋨復(fù)合物(其與甲基化堿基反應(yīng))。因此,多核苷酸分析物可以使用連接到膜上的一個(gè)或多個(gè)通用核苷酸與膜偶聯(lián)。每個(gè)通用核苷酸可以使用一個(gè)或多個(gè)接頭偶聯(lián)至膜。通用核苷酸優(yōu)選包含以下核昔堿基之一:次黃嘌呤,4-硝基吲哚,5-硝基吲哚,6-硝基吲哚,甲酰基吲哚,3-硝基吡咯,硝基咪唑,4-硝基吡唑,4-硝基苯并咪唑,5-硝基吲唑,4-氨基苯并咪唑或苯基(C6-芳香環(huán))。通用核苷酸更優(yōu)選包含以下核苷之一:2′-脫氧肌昔,肌昔,7-脫氮-2′-脫氧肌昔,7-脫氮肌苷,2-氮雜-脫氧肌苷,2-氮雜-肌苷,2-O′-甲基肌昔,4-硝基吲哚2′-脫氧核糖核苷,4-硝基吲哚核糖核苷,5-硝基吲哚2′-脫氧核糖核苷,5-硝基吲哚核糖核苷,6-硝基吲哚2′-脫氧核糖核苷,6-硝基吲哚核糖核苷,3-硝基吡咯2′-脫氧核糖核苷,3-硝基吡咯核糖核苷,次黃嘌呤的無環(huán)糖類似物,硝基咪唑2′-脫氧核糖核苷,硝基咪唑核糖核苷,4-硝基吡唑2′-脫氧核糖核苷,4-硝基吡唑核糖核苷,4-硝基苯并咪唑2′-脫氧核糖核苷,4-硝基苯并咪唑核糖核苷,5-硝基吲唑2′-脫氧核糖核苷,5-硝基吲唑脫氧核糖核苷,4-氨基苯并咪唑2′-脫氧核糖核苷,4-氨基苯并咪唑核糖核苷,苯基C-核糖核苷,苯基C-2′-脫氧核糖核苷,2′-脫氧鳥氨酸(2′-deoxynebularine),2′-脫氧異鳥嘌呤核苷,K-2′-脫氧核糖,P-2′脫氧核糖和吡咯烷。通用核苷酸更優(yōu)選包含2′-脫氧肌苷。通用核苷酸更優(yōu)選為IMP或dIMP。通用核苷酸最優(yōu)選為dPMP(2′-脫氧-β-核苷單磷酸)或dKMP(N6-甲氧基-2,6-二氨基嘌呤單磷酸)。
所述一個(gè)或多個(gè)錨可以通過Hoogsteen氫鍵(其中兩個(gè)核堿基通過氫鍵保持在一起)或反向的Hoogsteen氫鍵(其中一個(gè)核堿基相對于另一個(gè)核堿基旋轉(zhuǎn)180°)偶聯(lián)(或結(jié)合)多核苷酸分析物。例如,所述一個(gè)或多個(gè)錨可以包含一個(gè)或多個(gè)核苷酸,一個(gè)或多個(gè)寡核苷酸或一個(gè)或多個(gè)多核苷酸,其與多核苷酸分析物形成Hoogsteen氫鍵或反向Hoogsteen氫鍵。這些類型的氫鍵允許第三多核苷酸鏈纏繞在雙鏈螺旋上并形成三鏈體。所述一個(gè)或多個(gè)錨可以通過與雙鏈體形成三鏈體而偶聯(lián)(或結(jié)合)到雙鏈多核苷酸分析物。
在該實(shí)施方案中,至少1%,至少10%,至少25%,至少50%或100%的膜組分可以被官能化。
當(dāng)所述一個(gè)或多個(gè)錨包含蛋白質(zhì)時(shí),它們能夠直接錨定到膜中,而不進(jìn)行進(jìn)一步的官能化,例如如果它已經(jīng)具有與膜相容的外部疏水區(qū)域。此類蛋白質(zhì)的實(shí)例包括但不限于跨膜蛋白,膜內(nèi)蛋白和膜蛋白?;蛘撸鞍踪|(zhì)可以用與膜兼容的基因融合的疏水區(qū)表達(dá)。這種疏水性蛋白質(zhì)區(qū)域是本領(lǐng)域已知的。
所述一個(gè)或多個(gè)錨優(yōu)選在與膜接觸之前與分析物混合,但是所述一個(gè)或多個(gè)錨可以與膜接觸并隨后與分析物接觸。
在另一方面,分析物可以使用上述方法進(jìn)行官能化,使得其可以被特異性結(jié)合基團(tuán)識(shí)別。具體地,分析物可以用配體如生物素(用于結(jié)合鏈霉親和素)、直鏈淀粉(用于結(jié)合麥芽糖結(jié)合蛋白或融合蛋白)、Ni-NTA(用于結(jié)合聚組氨酸或聚組氨酸標(biāo)記的蛋白)或肽(例如抗原)官能化。
根據(jù)優(yōu)選的實(shí)施方案,當(dāng)分析物連接到優(yōu)先旋入孔中的前導(dǎo)序列時(shí),一個(gè)或多個(gè)錨可以用于將多核苷酸分析物偶聯(lián)到膜上。前導(dǎo)序列在下面更詳細(xì)地討論。優(yōu)選地,多核昔酸分析物結(jié)合(例如連接)到優(yōu)先旋入孔中的前導(dǎo)序列。這種前導(dǎo)序列可以包含均聚多核苷酸或無堿基區(qū)。前導(dǎo)序列通常設(shè)計(jì)為直接或經(jīng)由一個(gè)或多個(gè)中間多核苷酸(或夾板)與一個(gè)或多個(gè)錨雜交。在這種情況下,一個(gè)或多個(gè)錨通常包含與前導(dǎo)序列中的序列互補(bǔ)或與一個(gè)或多個(gè)中間多核昔酸(或夾板)中的序列互補(bǔ)的多核苷酸序列。在這種情況下,一個(gè)或多個(gè)夾板通常包含與前導(dǎo)序列中的序列互補(bǔ)的多核苷酸序列。
上文討論的用于將多核苷酸偶聯(lián)至膜,例如兩親性層的任何方法當(dāng)然可以應(yīng)用于其它分析物和膜組合。在一些實(shí)施方案中,氨基酸、肽、多肽或蛋白質(zhì)偶聯(lián)至兩親性層,例如三嵌段共聚物層或脂質(zhì)雙層。對于這類分析物的化學(xué)連接可以使用各種方法。化學(xué)連接中使用的分子的實(shí)例是EDC(1-乙基-3-[3-二甲基氨基丙基]碳二亞胺鹽酸鹽)。還可以使用市售試劑盒(Thermo Pierce,Part No.22980)將反應(yīng)性基團(tuán)加入到多核苷酸的5′端。合適的方法包括但不限于,使用組氨酸殘基和Ni-NTA進(jìn)行的暫時(shí)親和性連接,以及通過反應(yīng)性半胱氨酸、賴氨酸或非天然氨基酸進(jìn)行的更強(qiáng)的共價(jià)連接。
檢測器
步驟(b)和(e)包括使第一分析物和第二分析物分別與膜中存在的檢測器相互作用,從而分別確定第一分析物和第二分析物的存在、不存在或一個(gè)或多個(gè)特征。每個(gè)步驟中的檢測器可以不同。每個(gè)步驟中的檢測器通常是相同的。例如,優(yōu)選允許第一和第二分析物與跨膜孔,優(yōu)選相同的跨膜孔相互作用。
第一分析物和/或第二分析物的偶聯(lián)對于分析物與檢測器相互作用不是必需的。該偶聯(lián)允許超低濃度分析物傳遞到檢測器。
檢測器可以是響應(yīng)第一和/或第二分析物的存在、不存在或一個(gè)或多個(gè)特征而提供可讀信號(hào)的任何結(jié)構(gòu)。檢測器可以是響應(yīng)第一和/或第二分析物的存在或不存在而提供可讀信號(hào)的任何結(jié)構(gòu)。合適的檢測器是本領(lǐng)域已知的。它們包括但不限于跨膜孔,隧道電極,分類電極(classis electrode),納米管,F(xiàn)ET(場效應(yīng)晶體管)和光學(xué)檢測器,例如原子力顯微鏡(AFM)和掃描隧道顯微鏡(STM)。
可以進(jìn)行各種不同類型的測量。這包括但不限于:電測量和光學(xué)測量??赡艿碾姕y量包括:電流測量,阻抗測量,隧道測量(Ivanov AP等人,Nano Lett.2011 Jan 12;11(1):279-85)和FET測量(國際申請WO 2005/124888)。光學(xué)測量可以與電測量結(jié)合(Soni GV等人,Rev Sci Instrum.2010Jan;81(1):014301)。所述測量可以是跨膜電流測量,例如流過孔的離子電流測量。
可以使用如StoddartD等人,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR等人,J Am Chem Soc.2010;132(50):17961-72和國際申請WO 2000/28312中描述的標(biāo)準(zhǔn)單通道記錄設(shè)備進(jìn)行電測量?;蛘?,可以使用多通道系統(tǒng)進(jìn)行電測量,例如如國際申請WO 2009/077734和國際申請WO 2011/067559中所述。
該方法優(yōu)選在跨膜施加電位的情況下進(jìn)行。施加的電位可以是電壓電位。或者,施加的電位可以是化學(xué)電位。其一個(gè)實(shí)例是使用跨膜,例如兩親性層的鹽梯度。鹽梯度在Holden等人,J Am Chem Soc。2007Jul 11;129(27):8650-5中公開。在一些情況下,隨著多核苷酸分析物相對于孔移動(dòng),穿過檢測器(或孔)的電流被用于估計(jì)或確定多核苷酸的序列。這是鏈測序。
在其他優(yōu)選實(shí)施方案中,檢測器不使用熒光手段檢測分析物。
檢測器優(yōu)選包含跨膜孔??缒た资窃谝欢ǔ潭壬洗┻^膜的結(jié)構(gòu)。它允許由施加的電位驅(qū)動(dòng)水合離子流過膜或在膜內(nèi)流動(dòng)。跨膜孔典型地穿過整個(gè)膜,使得水合離子可以從膜的一側(cè)流到膜的另一側(cè)。然而,跨膜孔不用必須穿過膜。它可以在一端封閉。例如,孔可以是膜一一水合離子可以沿著其流動(dòng)或可以流入其中——中的阱,間隙,通道,溝槽或狹縫。
如果檢測器是孔,步驟(b)優(yōu)選包括(i)允許第一分析物與檢測器相互作用,和(ii)在相互作用期間測量穿過檢測器的電流,由此確定第一分析物的存在、不存在或一個(gè)或多個(gè)特征,和/或步驟(e)包括(i)允許第二分析物與檢測器相互作用,和(ii)在相互作用期間測量穿過檢測器的電流,由此確定第二分析物存在、不存在或一個(gè)或多個(gè)特征。
如果電流以對分析物特異的方式(即,如果檢測到與分析物相關(guān)的流經(jīng)孔的特征電流)流過孔,則存在第一或第二分析物。如果電流不以對分析物特異的方式流過孔,則不存在第一或第二分析物。類似地,可以使用在相互作用期間流過孔的電流來確定分析物的特征。
因此,本發(fā)明涉及分析物的納米孔感測。本發(fā)明可以用于基于分析物對通過孔的電流的不同影響來區(qū)分相似結(jié)構(gòu)的分析物。本發(fā)明還可以用于測量樣品中特定分析物的濃度。
本發(fā)明還可以用于在體感測(bulk sensing)應(yīng)用中使用許多或數(shù)千個(gè)孔的傳感器中。
在第一或第二分析物與孔之間的相互作用期間,分析物以對該分析物特異的方式影響流過孔的電流。例如,特定分析物將在特定平均時(shí)間段和特定程度上減少流過孔的電流。換句話說,流過孔的電流對于特定分析物是不同的??梢赃M(jìn)行對照實(shí)驗(yàn)以確定特定分析物對流過孔的電流的影響。然后可以將對測試樣品實(shí)施本發(fā)明方法獲得的結(jié)果與從這種對照實(shí)驗(yàn)得到的結(jié)果進(jìn)行比較,以鑒定樣品中的特定分析物,確定樣品中是否存在特定分析物或確定各分析物的特征。以代表特定分析物的方式影響流過孔的電流的頻率可以用于確定樣品中分析物的濃度。
任何跨膜孔可用于本發(fā)明??卓梢允巧锘蛉嗽斓?。合適的孔包括但不限于蛋白質(zhì)孔,多核苷酸孔和固態(tài)孔。孔可以是DNA折紙孔(origami pore)(Langecker等人,Science,2012;338:932-936)。
跨膜孔優(yōu)選是跨膜蛋白孔??缒さ鞍卓资窃试S水合離子如分析物從膜的一側(cè)流到膜的另一側(cè)的多肽或多肽的集合。在本發(fā)明中,跨膜蛋白孔能夠形成允許由施加電位驅(qū)動(dòng)水合離子從膜的一側(cè)流向另一側(cè)的孔??缒さ鞍踪|(zhì)孔優(yōu)選允許分析物例如核苷酸從膜(例如三嵌段共聚物膜)的一側(cè)流向另一側(cè)??缒さ鞍卓自试S多核苷酸,例如DNA或RNA,移動(dòng)穿過所述孔。
跨膜蛋白孔可以是單體或低聚體。孔優(yōu)選由幾個(gè)重復(fù)亞基組成,例如至少3個(gè),至少4個(gè),至少5個(gè),至少6個(gè),至少7個(gè),至少8個(gè),至少9個(gè),至少10個(gè),至少11個(gè),至少12個(gè),至少13個(gè)或至少14個(gè)亞基,例如3,4,5,6,7,8,9,10,11,12,13或14個(gè)亞基??變?yōu)選是六聚體,七聚體,八聚體或九聚體孔??卓梢允峭吹途畚锘虍愒吹途畚?。
跨膜蛋白孔通常包括離子可以流過的桶或通道??椎膩喕ǔ@中心軸,并且向跨膜β桶或通道或跨膜α-螺旋束或通道貢獻(xiàn)鏈。
跨膜蛋白孔的桶或通道通常包含促進(jìn)與分析物相互作用的氨基酸,例如核苷酸,多核苷酸或核酸。這些氨基酸優(yōu)選位于桶或通道的收縮部附近??缒さ鞍卓淄ǔ0粋€(gè)或多個(gè)帶正電荷的氨基酸,例如精氨酸,賴氨酸或組氨酸,或芳族氨基酸,例如酪氨酸或色氨酸。這些氨基酸通常促進(jìn)孔和核苷酸、多核苷酸或核酸之間的相互作用。
根據(jù)本發(fā)明使用的跨膜蛋白孔可以衍生自β桶孔或α-螺旋束孔。β-桶孔包括由β-鏈形成的桶或通道。合適的β-桶孔包括但不限于β-毒素,例如α-溶血素,炭疽毒素和殺白細(xì)胞素,以及細(xì)菌的外膜蛋白/孔蛋白,例如恥垢分枝桿菌(Mycobacterium smegmatis)孔蛋白(Msp),例如MspA,MspB,MspC或MspD,胞溶素,外膜孔蛋白F(OmpF),外膜孔蛋白G(OmpG),外膜磷脂酶A和奈瑟氏菌自轉(zhuǎn)運(yùn)脂蛋白(NalP)。α-螺旋束孔包括由α-螺旋形成的桶或通道。合適的α-螺旋束孔包括但不限于內(nèi)膜蛋白和α外膜蛋白,例如WZA和ClyA毒素??缒た卓梢匝苌园芩?。在國際申請?zhí)朠CT/GB2013/050667(公開為WO 2013/153359)中公開了衍生自胞溶素的合適的孔??缒た卓梢匝苌訫sp或α-溶血素(α-HL)。
跨膜蛋白孔優(yōu)選衍生自Msp,優(yōu)選MspA。這種孔將是低聚的,并且通常包含7,8,9或10個(gè)衍生自Msp的單體??卓梢允茄苌缘腗sp的同源低聚孔,包含相同的單體。或者,孔可以是衍生自Msp的異源低聚孔,包含至少一種不同于其它單體的單體。優(yōu)選地,所述孔源自MspA或其同源物或旁系物。
衍生自Msp的單體通常包含SEQ ID NO:2或其變體所示的序列。SEQ ID NO:2是MspA單體的MS-(B1)8突變體。其包括以下突變:D90N,D91N,D93N,D118R,D134R和E139K。SEQ ID NO:2的變體是具有這樣的氨基酸序列的多肽:從SEQ ID NO:2的氨基酸序列變化而來并且保留其形成孔的能力。變體形成孔的能力可以使用本領(lǐng)域已知的任何方法測定。例如,變體可以與其它合適的亞基一起插入兩親性層中,并且可以確定其低聚以形成孔的能力。用于將亞基插入膜例如兩親性層中的方法是本領(lǐng)域已知的。例如,亞基可以以純化形式懸浮在含有三嵌段共聚物膜的溶液中,使得它擴(kuò)散到膜并通過結(jié)合到膜并組裝成功能狀態(tài)而插入?;蛘撸瑏喕梢允褂肕.A.Holden,H.Bayley.J.Am.Chem.Soc.2005,127,6502-6503和國際申請No.PCT/GB2006/001057(公開號(hào)WO 2006/100484)中所述的“拾取和放置”方法直接插入膜中。
在SEQ ID NO:2的氨基酸序列的整個(gè)長度上,基于氨基酸同一性,變體將優(yōu)選與該序列至少50%同源。更優(yōu)選地,基于氨基酸同一性,所述變體可以是至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,且更優(yōu)選至少95%,97%或99%在整個(gè)序列上與SEQ ID NO:2的氨基酸序列同源。在100個(gè)或更多個(gè),例如125,150,175或200個(gè)或更多個(gè)連續(xù)氨基酸的片段(stretch)上,可以具有至少80%,例如至少85%,90%或95%的氨基酸同一性(“嚴(yán)格同源性(hardhomology)”)。
可用本領(lǐng)域的標(biāo)準(zhǔn)方法測定同源性。例如,UWGCG包提供了用于計(jì)算同源性的BESTFIT程序,例如使用其默認(rèn)設(shè)置(Devereux等人(1984)Nucleic Acids Research 12,p387-395)。可用PILEUP和BLAST算法計(jì)算同源性或比對(line up)序列(例如鑒定等效殘基或相應(yīng)序列(通?;谄淠J(rèn)設(shè)置)),例如Altschul S.F.(1993)J Mol Evol 36:290-300;Altschul,S.F等人(1990)J Mol Biol 215:403-10中所述。用于執(zhí)行BLAST分析的軟件可通過國家生物技術(shù)信息中心(http://www,ncbi.nlm.nih.gov/)公開獲得。
SEQ ID NO:2是MspA單體的MS-(B1)8突變體。與MspA相比,該變體可以包含MspB、C或D單體中的任何突變。MspB、C和D的成熟形式示于SEQ ID NO:5至7中。特別地,所述變體可以包含存在于MspB:A138P中的以下取代。所述變體可以包含存在于MspC中的一個(gè)或多個(gè)下列取代:A96G,N102E和A138P。所述變體可包含存在于MspD中的一個(gè)或多個(gè)以下突變:G1,L2V,E5Q,L8V,D13G,W21A,D22E,K47T,I49H,I68V,D91G,A96Q,N102D,S103T,V104I,S136K和G141A的缺失。所述變體可以包含來自Msp B、C和D中的一個(gè)或多個(gè)突變和取代的組合。變體優(yōu)選包含突變L88N。SEQ ID NO:2的變體除了MS-B1的所有突變之外還具有突變L88N,并稱為MS-(B2)8。本發(fā)明中使用的孔優(yōu)選為MS-(B2)8。除了MS-B1的所有突變之外,SEQ ID NO:2的變體具有突變G75S/G77S/L88N/Q126R,并稱為MS-B2C。本發(fā)明中使用的孔優(yōu)選為MS-(B2)8或MS-(B2C)8。
除了上文論述的那些之外,可以對SEQ ID NO:2的氨基酸序列進(jìn)行氨基酸取代,例如高達(dá)1,2,3,4,5,10,20或30個(gè)取代。保守取代用具有相似化學(xué)結(jié)構(gòu)、相似化學(xué)性質(zhì)或相似側(cè)鏈體積的其他氨基酸替換氨基酸。引入的氨基酸可以具有與它們替代的氨基酸相似的極性、親水性、疏水性、堿性、酸性、中性或電荷。或者,保守取代可以引入另一個(gè)芳香族或脂肪族氨基酸代替之前存在的芳香族或脂肪族氨基酸。
SEQ ID NO:2的氨基酸序列的一個(gè)或多個(gè)氨基酸殘基可以另外從上述多肽中缺失。可以缺失多至1,2,3,4,5,10,20或30個(gè)殘基或更多個(gè)殘基。
變體可以包括SEQ ID NO:2的片段。這類片段保留成孔活性。片段的長度可以為至少50,100,150或200個(gè)氨基酸。這樣的片段可以用于產(chǎn)生孔。片段優(yōu)選包含SEQ ID NO:2的孔形成結(jié)構(gòu)域。片段必須包括SEQ IDNO:2的殘基88,90,91,105,118和134中的一個(gè)。通常,片段包括SEQ ID NO:2的所有殘基88,90,91,105,118和134。
一個(gè)或多個(gè)氨基酸可以替代地或另外地添加到上述多肽??梢栽赟EQ ID NO:2或其多肽變體或其片段的氨基酸序列的氨基末端或羧基末端提供延伸。延伸可以非常短,例如1至10個(gè)氨基酸長度?;蛘?,延伸可以較長,例如高達(dá)50或100個(gè)氨基酸。載體蛋白可以與本發(fā)明的氨基酸序列融合。其它融合蛋白在下面更詳細(xì)地論述。
如上所述,變體是具有下述氨基酸序列的多肽:從SEQ ID NO:2的氨基酸序列變化而來并且保留其形成孔的能力。變體通常包含負(fù)責(zé)形成孔的SEQ ID NO:2的區(qū)域。含有β桶狀體的Msp的孔形成能力由每個(gè)亞基中的β片體提供。SEQ ID NO:2的變體通常包含SEQ ID NO:2中形成β片體的區(qū)域??梢詫EQ ID NO:2的形成β片體的區(qū)域進(jìn)行一個(gè)或多個(gè)修飾,只要所得變體保留其形成孔的能力即可。SEQ ID NO:2的變體優(yōu)選包括在其α螺旋和/或環(huán)區(qū)域內(nèi)的一個(gè)或多個(gè)修飾,例如取代、添加或缺失。
衍生自Msp的單體含有一個(gè)或多個(gè)特異性修飾以便于對核苷酸的鑒別。衍生自Msp的單體也可以含有其它非特異性修飾,只要它們不干擾孔形成即可。許多非特異性側(cè)鏈修飾是本領(lǐng)域已知的,并且可以對衍生自Msp的單體的側(cè)鏈進(jìn)行。這樣的修飾包括例如通過與醛反應(yīng)、然后用NaBH4還原而進(jìn)行的氨基酸的還原性烷基化,用甲基乙酰亞胺酯(methylacetimidate)進(jìn)行的脒基化,或用乙酸酐進(jìn)行的?;?。
衍生自Msp的單體可以使用本領(lǐng)域中已知的標(biāo)準(zhǔn)方法來制備。衍生自Msp的單體可以通過合成或重組方式制成。例如,所述孔可通過體外翻譯和轉(zhuǎn)錄(IVTT)合成。制造孔的合適的方法在國際申請No.PCT/GB09/001690(公開號(hào)為WO 2010/004273),PCT/GB09/001679(公開號(hào)為WO 2010/004265)或PCT/GB10/000133(公開號(hào)為WO 2010/086603)中有論述。論述了將孔插入膜的方法。
跨膜蛋白孔也優(yōu)選衍生自α-溶血素(α-HL)。野生型α-HL孔由七個(gè)相同的單體或亞基形成(即它是七聚體)。α-溶血素-NN的一個(gè)單體或亞基的序列顯示在SEQ ID NO:4中。
在一些實(shí)施方案中,跨膜蛋白孔是經(jīng)化學(xué)修飾的。所述孔可以任何方式在任何位點(diǎn)進(jìn)行化學(xué)修飾。所述跨膜蛋白孔優(yōu)選通過下述進(jìn)行化學(xué)修飾:將分子連接到一個(gè)或多個(gè)半胱氨酸(半胱氨酸連接),將分子連接到一個(gè)或多個(gè)賴氨酸,將分子連接到一個(gè)或多個(gè)非天然氨基酸,表位的酶修飾或末端的修飾。適用于進(jìn)行這些修飾的方法是本領(lǐng)域已知的。所述跨膜蛋白孔可通過連接任何分子被化學(xué)修飾。例如,所述孔可以通過連接染料或熒光團(tuán)被化學(xué)修飾。
孔中的任何數(shù)量的單體可以是化學(xué)修飾的。一個(gè)或多個(gè),例如2,3,4,5,6,7,8,9或10個(gè)單體優(yōu)選如上所述進(jìn)行化學(xué)修飾。
半胱氨酸殘基的反應(yīng)性可以通過修飾相鄰殘基來增強(qiáng)。例如,側(cè)翼精氨酸、組氨酸或賴氨酸殘基的堿基將半胱氨酸硫醇基團(tuán)的pKa變?yōu)楦叻磻?yīng)性的S-基團(tuán)的pKa。半胱氨酸殘基的反應(yīng)性可以用硫醇保護(hù)基團(tuán)如dTNB保護(hù)。所述保護(hù)基團(tuán)可以在接頭連接之前與孔的一個(gè)或多個(gè)半胱氨酸殘基反應(yīng)。
所述分子(使用其對孔進(jìn)行化學(xué)修飾)可以直接連接到所述孔或如國際申請No.PCT/GB09/001690(公開號(hào)WO 2010/004273),PCT/GB09/001679(公開號(hào)WO 2010/004265)或PCT/GB10/000133(公開號(hào)WO 2010/086603)中所公開通過接頭連接到所述孔。
本文所述的任何蛋白質(zhì),例如跨膜蛋白孔可以使用本領(lǐng)域已知的標(biāo)準(zhǔn)方法制備。編碼孔或構(gòu)建體的多核苷酸序列可以使用本領(lǐng)域的標(biāo)準(zhǔn)方法衍生和復(fù)制。編碼孔或構(gòu)建體的多核苷酸序列可以使用本領(lǐng)域標(biāo)準(zhǔn)技術(shù)在細(xì)菌宿主細(xì)胞中表達(dá)??卓梢酝ㄟ^在細(xì)胞中由重組表達(dá)載體的多肽的原位表達(dá)而制備。表達(dá)載體任選地?cái)y帶誘導(dǎo)型啟動(dòng)子以控制多肽的表達(dá)。這些方法在Sambrook,J.和Russell,D.(2001).Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY中有描述。
孔可以從產(chǎn)生蛋白質(zhì)的生物體通過任何蛋白質(zhì)液相色譜系統(tǒng)純化后,或在重組表達(dá)后大規(guī)模生產(chǎn)。典型的蛋白質(zhì)液相色譜系統(tǒng)包括FPLC系統(tǒng)、AKTA系統(tǒng)、Bio-Cad系統(tǒng)、Bio-Rad BioLogic系統(tǒng)和Gilson HPLC系統(tǒng)。
解偶聯(lián)
本發(fā)明的方法包括將第一分析物與膜解偶聯(lián)。本發(fā)明的方法可以包括將第二分析物與膜解偶聯(lián),例如如研究三個(gè)或更多個(gè)分析物時(shí)。
步驟(c)(即第一分析物的解偶聯(lián))可以在步驟(d)之前(即在將第二分析物偶聯(lián)到膜之前)進(jìn)行。步驟(d)可以在步驟(c)之前進(jìn)行。如果第二分析物在第一分析物解偶聯(lián)之前偶聯(lián)到膜,步驟(c)優(yōu)選包括從膜選擇性地解偶聯(lián)第一分析物(即,使第一分析物而不是第二分析物與膜解偶聯(lián))。本領(lǐng)域技術(shù)人員可以設(shè)計(jì)在其中實(shí)現(xiàn)選擇性解偶聯(lián)的系統(tǒng)。步驟(c)和(d)可以同時(shí)進(jìn)行。這將在下面更詳細(xì)地討論。
在步驟(c)中,優(yōu)選至少10%的第一分析物與膜解偶聯(lián)。例如,第一分析物的至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或至少95%可以從膜解偶聯(lián)。優(yōu)選地,所有第一分析物與膜解偶聯(lián)??梢允褂脵z測器確定從膜解偶聯(lián)的第一分析物的量。這在實(shí)施例中公開。
第一分析物可以使用任何已知的方法從膜上解偶聯(lián)。第一分析物優(yōu)選不使用檢測器例如跨膜孔在步驟(c)中與膜解偶聯(lián)。第一分析物優(yōu)選不使用電壓或施加電位與膜解偶聯(lián)。
步驟(c)優(yōu)選包括通過從膜上去除一個(gè)或多個(gè)錨而從膜上解偶聯(lián)第一分析物。在這樣的實(shí)施方案中,第二分析物使用其它(或單獨(dú)的)一個(gè)或多個(gè)錨偶聯(lián)到膜。用于偶聯(lián)第二分析物的一個(gè)或多個(gè)錨可以與用于偶聯(lián)第一分析物的錨是相同類型或不同類型的錨。
步驟(c)更優(yōu)選包括使所述一個(gè)或多個(gè)錨與試劑接觸,所述試劑對所述一個(gè)或多個(gè)錨具有比一個(gè)或多個(gè)錨對膜更高的親和力。用于競爭性結(jié)合或免疫放射測定以確定分子的特異性結(jié)合能力的多種方案是本領(lǐng)域熟知的(參見例如Maddox等人,J.Exp.Med.158,1211-1226,1993)。該試劑從膜上去除一個(gè)或多個(gè)錨,從而使第一分析物解偶聯(lián)。所述試劑優(yōu)選是糖??梢允褂脤λ鲆粋€(gè)或多個(gè)錨具有比一個(gè)或多個(gè)錨對膜更高的親和力的任何糖。糖可以是如下所述的環(huán)糊精或其衍生物。
所述一個(gè)或多個(gè)錨優(yōu)選包含疏水錨,例如膽固醇,并且試劑優(yōu)選是環(huán)糊精或其衍生物或脂質(zhì)。環(huán)糊精或其衍生物可以是Eliseev,A.V.,和Schneider,H-J.(1994)J.Am.Chem.Soc.116,6081-6088中公開的任意一個(gè)。該試劑更優(yōu)選為七-6-氨基-β-環(huán)糊精(am7-βCD),6-單脫氧-6-單氨基-β-環(huán)糊精(am1-βCD),七-(6-脫氧-6-胍基)環(huán)糊精(gu7-βCD),七(2,3,6-三-O-甲基)-β-環(huán)糊精或(2-羥丙基)-β-環(huán)糊精??梢允褂帽疚墓_的任何脂質(zhì)。
所述一個(gè)或多個(gè)錨優(yōu)選包含鏈霉親和素,生物素或脫硫生物素,并且所述試劑優(yōu)選是生物素,脫硫生物素或鏈霉親和素。生物素和脫硫生物素二者結(jié)合鏈霉親和素的親和力比鏈霉親和素結(jié)合到膜上的親和力更高。生物素對鏈霉親和素比對脫硫生物素具有更強(qiáng)的親和力。因此,可以使用生物素或脫硫生物素從膜上去除包含鏈霉親和素的錨,這取決于錨的組成。如實(shí)施例5和圖7所示。
所述一個(gè)或多個(gè)錨優(yōu)選包含蛋白質(zhì),并且所述試劑優(yōu)選是特異性結(jié)合所述蛋白質(zhì)的抗體或其片段。如果抗體以優(yōu)先或高親和力結(jié)合蛋白質(zhì),但不結(jié)合或者僅以低親和力結(jié)合其它蛋白質(zhì)或不同蛋白質(zhì),則抗體特異性結(jié)合該蛋白質(zhì)。如果抗體以1×10-6M或更小,更優(yōu)選1×10-7M或更小,5×10-8M或更小,更優(yōu)選1×10-8M或更小或更優(yōu)選5x 10-9M或更小的Kd結(jié)合,則抗體以優(yōu)先或高的親和力結(jié)合。如果抗體以1×10-6M或更高,更優(yōu)選1×10-5M或更高,更優(yōu)選1×10-4M或更高,更優(yōu)選1×10-3M或更高,更優(yōu)選為1×10-2M或更高的Kd結(jié)合,則抗體以低親和力結(jié)合。任何方法可以用于檢測結(jié)合或特異性結(jié)合。定量測量抗體與蛋白質(zhì)的結(jié)合的方法是本領(lǐng)域熟知的??贵w可以是單克隆抗體或多克隆抗體。合適的抗體片段包括但不限于Fv,F(xiàn)(ab′)和F(ab’)2片段,以及單鏈抗體。此外,抗體或其片段可以是嵌合抗體或其片段,CDR接枝抗體或其片段,或人源化抗體或其片段。
步驟(c)優(yōu)選包括使一個(gè)或多個(gè)錨與使其偶聯(lián)至膜的能力降低的試劑接觸。例如,試劑可以干擾一個(gè)或多個(gè)錨的結(jié)構(gòu)和/或疏水性,從而降低它們偶聯(lián)到膜的能力。所述一個(gè)或多個(gè)錨優(yōu)選包含膽固醇,并且試劑優(yōu)選為膽固醇脫氫酶。所述一個(gè)或多個(gè)錨優(yōu)選包含脂質(zhì),并且試劑優(yōu)選是磷脂酶。所述一個(gè)或多個(gè)錨優(yōu)選包含蛋白質(zhì),并且試劑優(yōu)選是蛋白酶或脲。合適的錨和試劑的其它組合對于本領(lǐng)域技術(shù)人員是清楚的。
步驟(c)優(yōu)選包括通過將第一分析物與一個(gè)或多個(gè)錨分離而從膜上解偶聯(lián)第一分析物。這可以以任何方式完成。例如,接頭可以在包含接頭的一個(gè)或多個(gè)錨中被切下。該實(shí)施方案特別適用于涉及通過雜交連接的一個(gè)或多個(gè)錨。這種錨在上文已討論。
步驟(c)更優(yōu)選包括通過使第一分析物和一個(gè)或多個(gè)錨與試劑接觸,所述試劑與第一分析物競爭結(jié)合到一個(gè)或多個(gè)錨,從膜上解偶聯(lián)第一分析物。用于測定和測量競爭性結(jié)合的方法是本領(lǐng)域已知的。試劑優(yōu)選是與第一分析物競爭雜交到一個(gè)或多個(gè)錨的多核苷酸。例如,如果使用涉及雜交的一個(gè)或多個(gè)錨將第一分析物偶聯(lián)到膜上,則可以通過使一個(gè)或多個(gè)錨與也與雜交位點(diǎn)雜交的多核苷酸接觸來解偶聯(lián)分析物。多核苷酸試劑通常以高于第一分析物和一個(gè)或多個(gè)錨的濃度的濃度添加?;蛘?,多核苷酸試劑可以比第一分析物更強(qiáng)地與一個(gè)或多個(gè)錨雜交。
步驟(c)更優(yōu)選包括(i)使第一分析物和一個(gè)或多個(gè)錨與以下物質(zhì)接觸:脲,三(2-羧乙基)膦(TCEP),二硫蘇糖醇(DTT),鏈霉親和素或生物素,UV光,酶或結(jié)合劑;(ii)加熱所述第一分析物和一個(gè)或多個(gè)錨;或(iii)改變pH。脲,三(2-羧乙基)膦(TCEP)或二硫蘇糖醇(DTT)能夠破壞錨并將第一分析物與膜分離。如果錨包含鏈霉親和素-生物素連接,則鏈霉親和素試劑將競爭結(jié)合生物素。如果錨包含鏈霉親和素-脫硫生物素連接,則生物素試劑將競爭結(jié)合鏈霉親和素。紫外光可用于分解光不穩(wěn)定基團(tuán)。酶和結(jié)合劑可用于切下,分解或解開錨。優(yōu)選的酶包括但不限于外切核酸酶,內(nèi)切核酸酶或解旋酶。優(yōu)選的結(jié)合劑包括但不限于酶,抗體或其片段或單鏈結(jié)合蛋白(SSB)??梢允褂孟旅嬗懻摰娜魏蚊富蛏厦嬗懻摰目贵w。加熱和pH可以用于破壞雜交和其它連接。
如果通過使第一分析物與一個(gè)或多個(gè)錨分離將第一分析物與膜解偶聯(lián),則所述一個(gè)或多個(gè)錨將保留在膜中。步驟(d)優(yōu)選包括使用與第一分析物分離的一個(gè)或多個(gè)錨將第二分析物偶聯(lián)至膜。例如,第二分析物還可以具有與保留在膜中的一個(gè)或多個(gè)錨雜交的多核苷酸?;蛘撸襟E(d)優(yōu)選包括使用相對于與第一分析物分離的一個(gè)或多個(gè)錨而言獨(dú)立的一個(gè)或多個(gè)錨(即,其它一個(gè)或多個(gè)錨)將第二分析物偶聯(lián)至膜。所述獨(dú)立的一個(gè)或多個(gè)錨可以與用于將第一分析物偶聯(lián)到膜的錨是相同類型的錨或者可以是不同類型的錨。步驟(d)優(yōu)選包括使用不同于與第一分析物分離的錨的一個(gè)或多個(gè)錨來將第二分析物偶聯(lián)到膜上。
在優(yōu)選的實(shí)施方案中,步驟(c)和(d)包括通過使膜與第二分析物接觸而使得第二分析物與第一分析物競爭結(jié)合一個(gè)或多個(gè)錨并取代第一分析物,從而使第一分析物與膜解偶聯(lián)。例如,如果使用涉及雜交的一個(gè)或多個(gè)錨將第一分析物偶聯(lián)到膜上,則所述分析物可以通過使所述一個(gè)或多個(gè)錨與結(jié)合到多核苷酸的第二分析物接觸來解偶聯(lián),其中所述多核苷酸也雜交到所述一個(gè)或多個(gè)錨中的雜交位點(diǎn)。第二分析物通常以高于第一分析物和一個(gè)或多個(gè)錨的濃度的濃度添加?;蛘撸诙治鑫锟梢员鹊谝环治鑫锔鼜?qiáng)地與一個(gè)或多個(gè)錨雜交。
去除或清洗
盡管在步驟(c)中第一分析物與膜解偶聯(lián),但是其不一定被去除或洗去。如果第二分析物可以容易地與第一分析物區(qū)分開,則不需要去除第一分析物。
在步驟(c)和(d)之間,所述方法優(yōu)選還包括從膜去除至少一些第一樣品??梢匀コ辽?0%的第一樣品,例如可以去除至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%或至少90%的第一樣品。該方法更優(yōu)選還包括從膜去除所有第一樣品。這可以以任何方式完成。例如,在第一分析物已經(jīng)解偶聯(lián)后,可以用緩沖液洗滌膜。合適的緩沖液如下所述。
多核苷酸表征
本發(fā)明的方法優(yōu)選涉及測量兩個(gè)或更多個(gè)多核苷酸的一個(gè)或多個(gè)特征。所述兩個(gè)或更多個(gè)多核苷酸可以是不同的多核苷酸或相同多核苷酸的兩個(gè)實(shí)例。
可以研究任何數(shù)量的多核苷酸。例如,本發(fā)明的方法可以涉及確定3,4,5,6,7,8,9,10,20,30,50,100或更多個(gè)多核苷酸的存在、不存在或一個(gè)或多個(gè)特征。如果使用本發(fā)明的方法研究三個(gè)或更多個(gè)多核苷酸,則第二多核苷酸也與膜解偶聯(lián),并且針對第三多核苷酸增加所需數(shù)目的步驟。四個(gè)或更多個(gè)多核苷酸時(shí)也是如此。
多核苷酸可以是天然存在的或人工的。例如,該方法可用于驗(yàn)證兩個(gè)或更多個(gè)制造的寡核苷酸的序列。所述方法通常在體外進(jìn)行。
所述方法可以包括測量每個(gè)多核苷酸的兩個(gè)、三個(gè)、四個(gè)或五個(gè)或更多個(gè)特征。所述的一個(gè)或多個(gè)特征優(yōu)選選自(i)多核苷酸的長度,(ii)多核苷酸的同一性,(iii)多核苷酸的序列,(iv)多核苷酸的二級(jí)結(jié)構(gòu),以及(v)多核苷酸是否被修飾。根據(jù)本發(fā)明可以測量(i)到(v)的任意組合,例如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v},{ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。可以測量第一多核苷酸的與第二多核苷酸相比不同的(i)到(v)的組合,包括上面所列的任意組合。
對于(i),多核苷酸的長度可以例如通過確定所述多核苷酸和所述孔之間相互作用的次數(shù)或所述多核苷酸和所述孔之間相互作用的持續(xù)時(shí)間進(jìn)行測量。
對于(ii),對多核苷酸的鑒別可以通過多種方式進(jìn)行測定。對多核苷酸的識(shí)別可以聯(lián)合多核苷酸序列的測定或不聯(lián)合多核苷酸序列的測定而進(jìn)行測定。前者是直接測定;對所述多核苷酸進(jìn)行測序,并由此進(jìn)行識(shí)別。后者可以多種方式完成。例如,可以測定多核苷酸中特定模序的存在(不需要測定多核苷酸的其余序列)。替代地,在所述方法中特定電和/或光信號(hào)的測定可以鑒別來自特定來源的多核苷酸。
對于(iii),多核苷酸的序列可以如前文所述進(jìn)行測定。適合的測序方法,特別是那些使用電測量的方法,在Stoddart D等人,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR等人,J Am Chem Soc.2010;132(50):17961-72,以及國際申請WO 2000/28312中有描述。
對于(iv),二級(jí)結(jié)構(gòu)可以多種方式測定。例如,如果所述方法涉及電測量,則二級(jí)結(jié)構(gòu)可以利用流經(jīng)孔的停留時(shí)間的變化或電流的變化進(jìn)行測定。這使得能夠?qū)捂満碗p鏈多核苷酸區(qū)域進(jìn)行辨別。
對于(v),可以測定任何修飾的存在與否。所述方法優(yōu)選包括確定所述多核苷酸是否通過甲基化、氧化、損傷、用一個(gè)或多個(gè)蛋白質(zhì)或一個(gè)或多個(gè)標(biāo)記物、標(biāo)簽或間隔區(qū)進(jìn)行了修飾。特定的修飾將導(dǎo)致與孔的特定的相互作用,這可使用下述方法測定。例如,可以基于孔與每個(gè)核苷酸的相互作用過程中流經(jīng)所述孔的電流,來區(qū)分甲基胞嘧啶和胞嘧啶。
該方法可以使用適于研究膜/孔系統(tǒng)——其中孔存在于膜中——的任何設(shè)備進(jìn)行。該方法可以使用適合于跨膜孔傳感的任何設(shè)備進(jìn)行。例如,所述設(shè)備包括含水溶液的腔室,以及將所述腔室分成兩個(gè)區(qū)段的屏障。所述屏障典型地具有開孔,含所述孔的膜形成于所述開孔中。替代地,所述屏障形成其中存在孔的膜。
該方法可使用國際申請No.PCT/GB08/000562(WO 2008/102120)中描述的設(shè)備進(jìn)行。
所述方法可以包括測量所述多核苷酸相對于所述孔移動(dòng)時(shí)穿過所述孔的電流。因此,所述設(shè)備也可以包括能夠施加電位并測量穿過所述膜和孔的電信號(hào)的電路。所述方法可以使用膜片鉗或電壓鉗進(jìn)行。所述方法優(yōu)選涉及使用電壓鉗。
本發(fā)明方法可包括,當(dāng)多核苷酸相對于孔移動(dòng)時(shí),測量穿過該孔的電流。用于測量穿過跨膜蛋白孔的離子電流的適宜條件是本領(lǐng)域已知的并在實(shí)施例中公開。所述方法通常通過跨膜和孔施加電壓來實(shí)施。使用的電壓通常為+5V到-5V,例如+4V到-4V,+3V到-3V或+2V到-2V。使用的電壓通常為-600mV到+600mV或-400mV到+400mV。使用的電壓優(yōu)選在具有以下下限和上限的范圍內(nèi),所述下限選自-400mV,-300mV,-200mV,-150mV,-100mV,-50mV,-20mV和0mV,所述上限獨(dú)立地選自+10mV,+20mV,+50mV,+100mV,+150mV,+200mV,+300mV和+400mV。使用的電壓更優(yōu)選在100mV到240mV范圍內(nèi),最優(yōu)選在120mV到220mV范圍內(nèi)。可通過對孔施加提高的電位來增加對不同核苷酸的鑒別力。
所述方法通常在任何載荷子諸如金屬鹽(如堿金屬鹽)、鹵鹽(如氯化物鹽(如堿金屬氯化物鹽))的存在下實(shí)施。載荷子可包括離子液體或有機(jī)鹽,例如四甲基氯化銨、三甲基苯基氯化銨、苯基三甲基氯化銨或1-乙基-3-甲基氯化咪唑鎓。在上述示例性設(shè)備中,所述鹽以水溶液存在于室中。通常使用氯化鉀(KCl)、氯化鈉(NaCl)、氯化銫(CsCl),或亞鐵氰化鉀和鐵氰化鉀的混合物。優(yōu)選KCl、NaCl,和亞鐵氰化鉀和鐵氰化鉀的混合物。載荷子可以是跨所述膜不對稱的。例如,所述載荷子的類型和/或濃度在膜的每一側(cè)上可以不同。
所述鹽濃度可以是飽和的。所述鹽濃度可以是3M或更低并且通常為0.1-2.5M,0.3-1.9M,0.5-1.8M,0.7-1.7M,0.9-1.6M或1M-1.4M。所述鹽濃度優(yōu)選為150mM-1M。所述方法優(yōu)選使用至少0.3M,例如至少0.4M,至少0.5M,至少0.6M,至少0.8M,至少1.0M,至少1.5M,至少2.0M,至少2.5M或至少3.0M的鹽濃度而實(shí)施。高的鹽濃度提供高的信噪比并使得電流能在正常電流波動(dòng)的背景下識(shí)別代表核苷酸存在。
所述方法通常在緩沖劑的存在下實(shí)施。在上述示例性設(shè)備中,所述緩沖劑以水溶液存在于所述室中。任何緩沖劑均可用在本發(fā)明方法中。通常,所述緩沖劑為磷酸鹽緩沖液。另一個(gè)適宜的緩沖劑為HEPES和三羥甲基氨基甲烷-HCl(Tris-HCl)緩沖液。所述方法通常在4.0-12.0,4.5-10.0,5.0-9.0,5.5-8.8,6.0-8.7或7.0-8.8或7.5-8.5的pH下實(shí)施。所用pH優(yōu)選約為7.5。
所述方法可在0℃-100℃、15℃-95℃、16℃-90℃、17℃-85℃、18℃-80℃、19℃-70℃或20℃-60℃實(shí)施。所述方法通常在室溫實(shí)施。所述方法可選地在能支持酶功能的溫度下,例如約37℃實(shí)施。
步驟(b)優(yōu)選包括使第一多核苷酸與控制第一多核苷酸與膜中存在的檢測器的相互作用的多核苷酸結(jié)合蛋白相互作用,和/或步驟(e)優(yōu)選包括允許第二多核苷酸與控制第二多核苷酸與膜中存在的檢測器的相互作用的多核苷酸結(jié)合蛋白相互作用。
更優(yōu)選地,所述方法包括(a)使用一個(gè)或多個(gè)錨將第一樣品中的第一多核苷酸偶聯(lián)至膜;(b)使所述第一多核苷酸與跨膜孔接觸,使得所述第一多核苷酸移動(dòng)穿過所述孔;(c)隨著所述第一多核苷酸相對于所述孔移動(dòng)獲取一個(gè)或多個(gè)測量值,其中所述測量值代表所述第一多核苷酸的一個(gè)或多個(gè)特征,由此表征所述第一多核昔酸;(d)使所述第一多核苷酸與所述膜解偶聯(lián);(e)使用一個(gè)或多個(gè)錨將第二樣品中的第二多核苷酸偶聯(lián)至所述膜;(f)使所述第二多核昔酸與跨膜孔接觸,使得所述第二多核苷酸移動(dòng)穿過所述孔;和(g)隨著所述第二多核苷酸相對于所述孔移動(dòng)獲取一個(gè)或多個(gè)測量值,其中所述測量值代表所述第二多核苷酸的一個(gè)或多個(gè)特征,由此表征所述第二多核苷酸。在該實(shí)施方案中,步驟(b)優(yōu)選包括使第一多核苷酸與跨膜孔和多核苷酸結(jié)合蛋白質(zhì)接觸,使得所述蛋白質(zhì)控制第一多核苷酸穿過孔的移動(dòng),和/或步驟(f)優(yōu)選包括使第二多核苷酸與跨膜孔和多核苷酸結(jié)合蛋白質(zhì)接觸,使得所述蛋白質(zhì)控制第二多核苷酸穿過所述孔的移動(dòng)。
所述多核苷酸結(jié)合蛋白可以是能夠結(jié)合到多核苷酸并控制其移動(dòng)穿過所述孔的任何蛋白質(zhì)?,F(xiàn)有技術(shù)中可直接確定蛋白質(zhì)是否結(jié)合到多核苷酸。該蛋白質(zhì)通常與多核苷酸相互作用并修改其至少一種性質(zhì)。該蛋白質(zhì)可通過使多核苷酸裂解形成各單個(gè)核昔酸或短鏈核苷酸如二核苷酸或三核苷酸而修飾該多核苷酸。該部分可以通過將多核苷酸定向到或?qū)⑵湟苿?dòng)到特定位置,即控制其移動(dòng),而修飾所述多核苷酸。
所述多核苷酸結(jié)合蛋白優(yōu)選地衍生自多核苷酸處理酶。多核苷酸處理酶是能夠與多核苷酸相互作用并修飾其至少一種性質(zhì)的多肽。該酶可以通過使多核苷酸裂解形成各單個(gè)核昔酸或短鏈核苷酸如二核苷酸或三核苷酸而修飾該多核苷酸。該酶可以通過使其定向到或?qū)⑵湟苿?dòng)到特定位置而修飾所述多核苷酸。所述多核苷酸處理酶不需要顯示酶活性,只要它能夠結(jié)合多核苷酸并控制其移動(dòng)穿過所述孔即可。例如,該酶可以被修飾,以去除其酶活性,或者可以在防止其作為酶發(fā)揮作用的條件下使用。這樣的條件在下面更詳細(xì)地論述。
所述多核苷酸處理酶優(yōu)選衍生自溶核酶。在酶的構(gòu)建體中使用的所述多核苷酸處理酶更優(yōu)選衍生自酶分類(EC)組3.1.11,3.1.13,3.1.14,3.1.15,3.1.16,3.1.21,3.1.22,3.1.25,3.1.26,3.1.27,3.1.30和3.1.31中的任意成員。所述酶可以是國際申請PCT/GB10/000133(公開號(hào)為WO 2010/086603)中公開的任意酶。
優(yōu)選的酶為聚合酶、核酸外切酶、解旋酶和拓?fù)洚悩?gòu)酶,例如促旋酶。合適的酶包括,但不限于,來自大腸桿菌的核酸外切酶I(SEQ ID NO:11)、來自大腸桿菌的核酸外切酶III(SEQ ID NO:13)、來自嗜熱棲熱菌的RecJ(SEQ ID NO:15),和噬菌體λ核酸外切酶(SEQ ID NO:17)及其變體。包含SEQ ID NO:15或其變體所示序列的三個(gè)亞基相互作用形成三聚體核酸外切酶。所述酶優(yōu)選是Phi29DNA聚合酶(SEQ ID NO:9)或其變體。拓?fù)洚悩?gòu)酶優(yōu)選是部分分類(EC)組5.99.1.2和5.99.1.3中的任意成員。
所述酶最優(yōu)選衍生自解旋酶,如Hel308Mbu(SEQ ID NO:18),Hel308Csy(SEQ ID NO:19),Hel308Mhu(SEQ ID NO:20),TraI Eco(SEQ ID NO:21),XPD Mbu(SEQ ID NO:22)或其變體。本發(fā)明可以使用任何解旋酶。所述解旋酶可以是或者衍生自Hel308解旋酶、RecD解旋酶,例如TraI解旋酶或TrwC解旋酶、XPD解旋酶或Dda解旋酶。所述解旋酶可以是國際申請No.PCT/GB2012/052579(公開號(hào)WO 2013/057495);PCT/GB2012/053274(公開號(hào)WO 2013/098562);PCT/GB2012/053273(公開號(hào)WO2013098561);PCT/GB2013/051925(公開號(hào)WO 2014/013260);PCT/GB2013/051924(公開號(hào)WO 2014/013259);PCT/GB2013/051928(公開號(hào)WO 2014/013262);以及PCT/GB2014/052736中公開的解旋酶、經(jīng)修飾的解旋酶或解旋酶構(gòu)建體中的任意成員。
所述解旋酶優(yōu)選包含SEQ ID NO:25(Trwc Cba)或其變體中所示序列,SEQ ID NO:18(Hel308Mbu)或其變體中所示序列,或者SEQ ID NO:24(Dda)或其變體中所示序列。各變體可以以下文針對跨膜孔所述任意方式不同于天然序列。SEQ ID NO:24的優(yōu)選變體包含E94C/A360C和之后的(ΔM1)G1G2(即M1缺失,然后添加G1和G2)或E94C/A360C/C109A/C136A和之后的(ΔM1)G1G2。
本發(fā)明可以使用任何數(shù)目的解旋酶。例如,可以使用1,2,3,4,5,6,7,8,9,10或更多個(gè)解旋酶。在一些實(shí)施方案中,可使用其他數(shù)目的解旋酶。
本發(fā)明方法優(yōu)選包括使第一多核苷酸分析物和/或第二多核昔酸分析物與兩個(gè)或更多個(gè)解旋酶接觸。所述兩個(gè)或更多個(gè)解旋酶通常為相同解旋酶。所述兩個(gè)或更多個(gè)解旋酶可以是不同解旋酶。
所述兩個(gè)或更多個(gè)解旋酶可以是上文提及的解旋酶的任意組合。所述兩個(gè)或更多個(gè)解旋酶可以是兩個(gè)或更多個(gè)Dda解旋酶。所述兩個(gè)或更多個(gè)解旋酶可以是一個(gè)或多個(gè)Dda解旋酶和一個(gè)或多個(gè)TrwC解旋酶。所述兩個(gè)或更多個(gè)解旋酶可以是相同解旋酶的不同變體。
所述兩個(gè)或更多個(gè)解旋酶優(yōu)選彼此連接。所述兩個(gè)或更多個(gè)解旋酶更優(yōu)選彼此共價(jià)連接。所述解旋酶可以以任何順序使用任何方法連接。用于本發(fā)明的優(yōu)選的解旋酶構(gòu)建體在國際申請PCT/GB2013/051925(公開號(hào)WO 2014/013260);PCT/GB2013/051924(公開號(hào)WO 2014/013259);PCT/GB2013/051928(公開號(hào)WO 2014/013262);以及PCT/GB2014/052736中有描述。
SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的變體是具有下述氨基酸序列的酶:所述氨基酸序列從SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25變化而來并保留多核苷酸結(jié)合能力。這可以使用本領(lǐng)域已知的任何方法測定。例如,使所述變體與多核苷酸接觸,然后測量其結(jié)合到多核苷酸并沿多核苷酸移動(dòng)的能力。所述變體可以包括能促進(jìn)對多核苷酸的結(jié)合和/或促進(jìn)其在高鹽濃度和/或室溫下活性的修飾。各變體可以被修飾為,使其結(jié)合多核苷酸(即保留多核苷酸結(jié)合能力),但不具有解旋酶功能(即當(dāng)提供了有助于移動(dòng)的所有必要組分例如ATP和Mg2+時(shí)仍不能沿多核苷酸移動(dòng))。這種修飾是本領(lǐng)域公知的。例如,對解旋酶中Mg2+結(jié)合結(jié)構(gòu)域的修飾通常導(dǎo)致不具有解旋酶功能的變體。這些類型的變體可用作分子制動(dòng)器(見下文)。
基于氨基酸同一性,在SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列的整個(gè)長度上,變體將優(yōu)選與該序列至少50%同源。更優(yōu)選,基于氨基酸同一性,所述變體多肽在整個(gè)長度上可以與SEQ ID NO:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列,至少55%,至少60%至少65%,至少70%,至少75%至少80%,至少85%,至少90%且更優(yōu)選至少95%,97%或99%同源。在200或更多,例如230,250,270,280,300,400,500,600,700,800,900或1000或更多個(gè)連續(xù)氨基酸片段上,可以具有至少為80%,例如至少85%,90%或95%的氨基酸同源性(“嚴(yán)格同源性”)。同源性可如上文所述進(jìn)行確定。所述變體可以上文針對SEQ ID NO:2和4論述的任意方式不同于野生型序列。所述酶可以共價(jià)連接到孔??墒褂萌魏畏椒▽⑺雒腹矁r(jià)連接到孔。
優(yōu)選的分子制動(dòng)器是TrwC Cba-Q594A(SEQ ID NO:25,具有突變Q594A)。該變異不具有解旋酶的功能(即能結(jié)合多核苷酸,但當(dāng)提供了有助于移動(dòng)的所有必要組分例如ATP和Mg2+時(shí)仍不能沿多核苷酸移動(dòng))。
在鏈測序中,所述多核苷酸順著或逆著所施加電位移位穿過所述孔。逐漸地或進(jìn)行性地作用于雙鏈多核苷酸上的核酸外切酶可用于在施加的電位下在所述孔的順側(cè)上使剩余的單鏈穿過,或者在反向電位下在所述孔的反側(cè)上使剩余的單鏈穿過。同樣地,解開雙鏈DNA的解旋酶也可以類似的方式使用。也可以使用聚合酶。還有可能有這樣的測序應(yīng)用:其需要使鏈逆著施加電位移位,但是DNA必須在反向電位或沒有電位的情況下首先被所述酶“捕獲”。然后隨著在結(jié)合之后電位被翻轉(zhuǎn),所述鏈將從順側(cè)到反側(cè)而穿過所述孔并通過電流保持延伸的構(gòu)造。單鏈DNA核酸外切酶或單鏈DNA依賴性聚合酶可用作分子馬達(dá),用于以受控且逐步的方式將最近移位的單鏈逆著施加的電位從反側(cè)到順側(cè)穿過所述孔而拉回。
解旋酶(一個(gè)或多個(gè))和分子制動(dòng)器(一個(gè)或多個(gè))
在優(yōu)選實(shí)施方式中,該方法包括:
(a)對第一樣品中的第一多核苷酸提供連接到第一多核苷酸的一個(gè)或多個(gè)解旋酶和連接到第一多核昔酸的一個(gè)或多個(gè)分子制動(dòng)器;
(b)對第二樣品中的第二多核苷酸提供連接到第二多核苷酸的一個(gè)或多個(gè)解旋酶和連接到第二多核苷酸的一個(gè)或多個(gè)分子制動(dòng)器;
(c)使用一個(gè)或多個(gè)錨將第一樣品中的第一多核苷酸偶聯(lián)至膜;
(d)使所述第一多核苷酸與跨膜孔接觸,并跨所述孔施加電位,使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起,并且一起控制所述第一多核昔酸穿過所述孔的移動(dòng);
(e)隨著所述第一多核苷酸相對于所述孔移動(dòng),獲取一個(gè)或多個(gè)測量值,其中所述測量值代表所述第一多核苷酸的一個(gè)或多個(gè)特征,由此表征所述第一多核苷酸;
(f)使所述第一多核苷酸與所述膜解偶聯(lián);
(g)使用一個(gè)或多個(gè)錨將所述第二樣品中的所述第二多核苷酸偶聯(lián)至所述膜;
(h)使所述第二多核苷酸與跨膜孔接觸,并跨所述孔施加電位,使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起,并且一起控制所述第二多核苷酸通過所述孔的移動(dòng);和
(i)隨著第二多核苷酸相對于所述孔移動(dòng),獲取一個(gè)或多個(gè)測量值,其中所述測量值代表第二多核苷酸的一個(gè)或多個(gè)特征,由此表征第二多核苷酸。
這種類型的方法在國際申請PCT/GB2014/052737中詳細(xì)討論。
步驟(f)(即第一多核苷酸的解偶聯(lián))可以在步驟(g)之前(即在將第二多核苷酸偶聯(lián)至膜之前)進(jìn)行。步驟(g)可以在步驟(f)之前進(jìn)行。如果第二多核苷酸在第一多核苷酸解偶聯(lián)之前與膜偶聯(lián),則步驟(f)優(yōu)選包括從所述膜上選擇性地解偶聯(lián)第一多核苷酸(即,使第一多核苷酸而不是第二多核苷酸與膜解偶聯(lián))。本領(lǐng)域技術(shù)人員可以設(shè)計(jì)在其中實(shí)現(xiàn)選擇性解偶聯(lián)的系統(tǒng)。步驟(f)和(g)可以同時(shí)進(jìn)行。這將在下面更詳細(xì)地討論。
所述一個(gè)或多個(gè)解旋酶可以使上文所述的任何解旋酶。所述一個(gè)或多個(gè)分子制動(dòng)器可以為結(jié)合到多核苷酸并減緩該多核苷酸穿過所述孔的移動(dòng)的任何化合物或分子。所述一個(gè)或多個(gè)分子制動(dòng)器優(yōu)選為一個(gè)或多個(gè)多核苷酸結(jié)合蛋白。所述多核苷酸結(jié)合蛋白可以是能夠結(jié)合到多核苷酸并控制其移動(dòng)穿過所述孔的任何蛋白質(zhì)。現(xiàn)有技術(shù)中可直接確定蛋白質(zhì)是否結(jié)合到多核苷酸。所述蛋白通常與多核苷酸相互作用并修飾所述多核苷酸的至少一種特征。所述蛋白可通過使多核苷酸裂解形成各單個(gè)核苷酸或短鏈核苷酸,如二核苷酸或三核苷酸,來修飾所述多核苷酸。該部分可以通過將多核苷酸定向到或?qū)⑵湟苿?dòng)到特定位置,即控制其移動(dòng),來修飾所述多核昔酸。
所述多核苷酸結(jié)合蛋白優(yōu)選衍生自多核苷酸處理酶。所述一個(gè)或多個(gè)分子制動(dòng)器可以衍生自上述的任何多核苷酸處理酶。用作分子制動(dòng)器的Phi29聚合酶的經(jīng)修飾的變體(SEQ ID NO:9)在美國專利No.5576204中公開。充當(dāng)分子制動(dòng)器的Phi29聚合酶的經(jīng)修飾的變體(SEQ ID NO:8)在美國專利5,576,204中有公開。所述一個(gè)或多個(gè)分子制動(dòng)器優(yōu)選衍生自解旋酶。
多核苷酸分析物中的間隔區(qū)
所述一個(gè)或多個(gè)解旋酶可以在一個(gè)或多個(gè)間隔區(qū)停滯,如在國際申請No.PCT/GB2014/050175(公開為WO 2014/135838)中論述的。本發(fā)明中可以使用在該國際申請中公開的一個(gè)或多個(gè)解旋酶和一個(gè)或多個(gè)間隔區(qū)的任意構(gòu)造。
雙鏈多核苷酸
第一多核苷酸分析物和/或第二多核苷酸分析物可以是雙鏈的。如果多核苷酸分析物是雙鏈的,則該方法優(yōu)選地還包括在偶聯(lián)步驟之前將發(fā)夾環(huán)適配體連接到多核昔酸的一端并分離多核苷酸的兩條鏈以形成單鏈多核苷酸構(gòu)建體。然后可以允許單鏈多核昔酸構(gòu)建體與根據(jù)本發(fā)明的檢測器相互作用。以這種方式連接和探究(interrogating)在雙鏈構(gòu)建體上的兩條鏈提高了表征的效率和準(zhǔn)確性。在國際申請?zhí)朠CT/GB2010/000160(公開為WO 2010/086622)和PCT/GB2012/051786(公開為WO 2013/014451)中公開了使用發(fā)夾環(huán)適配體進(jìn)行的測序。
前導(dǎo)序列
在偶聯(lián)步驟之前,所述方法優(yōu)選包括將優(yōu)先旋入孔中的前導(dǎo)序列連接到第一和/或第二多核苷酸分析物。前導(dǎo)序列促進(jìn)了本發(fā)明的方法。前導(dǎo)序列被設(shè)計(jì)成優(yōu)先旋入跨膜孔,從而促進(jìn)多核苷酸分析物穿過孔的移動(dòng)。前導(dǎo)序列也可以用于將多核苷酸連接到如上所述的一個(gè)或多個(gè)錨。
前導(dǎo)序列通常包含聚合物。聚合物優(yōu)選帶負(fù)電荷。聚合物優(yōu)選是多核苷酸,例如DNA或RNA,修飾的多核苷酸(例如脫堿基DNA),PNA,LNA,聚乙二醇(PEG)或多肽。前導(dǎo)序列優(yōu)選包含多核苷酸,更優(yōu)選包含單鏈多核苷酸。前導(dǎo)序列可以包含上述任何多核苷酸。單鏈前導(dǎo)序列最優(yōu)選包含單鏈DNA,例如poly dT部分。前導(dǎo)序列優(yōu)選包含一個(gè)或多個(gè)間隔區(qū)。
前導(dǎo)序列可以是任何長度,但通常10至150個(gè)核苷酸長度,例如20至150個(gè)核苷酸長度。前導(dǎo)序列的長度通常取決于方法中使用的跨膜孔。
雙偶聯(lián)
本發(fā)明的方法可以涉及多個(gè)雙鏈多核苷酸的雙偶聯(lián)。在優(yōu)選的實(shí)施方案中,本發(fā)明涉及表征多個(gè)雙鏈多核苷酸。該方法優(yōu)選地包括:
(a)在第一樣品中提供第一雙鏈多核苷酸,其一端具有Y適配體并且另一端具有發(fā)夾環(huán)適配體,其中所述Y適配體包含用于將所述多核苷酸偶聯(lián)至所述膜的一個(gè)或多個(gè)第一錨,其中所述發(fā)夾環(huán)適配體包含用于將所述多核苷酸偶聯(lián)至所述膜的一個(gè)或多個(gè)第二錨,并且其中發(fā)夾環(huán)適配體與膜的偶聯(lián)強(qiáng)度大于Y適配體與膜的偶聯(lián)強(qiáng)度;
(b)以步驟(a)中定義的形式在第二樣品中提供第二雙鏈多核苷酸;
(c)將步驟(a)中提供的第一多核苷酸與膜偶聯(lián);
(d)使步驟(c)中偶聯(lián)的第一多核苷酸與跨膜孔接觸,使得第一多核苷酸的至少一條鏈移動(dòng)通過所述孔;
(e)隨著第一多核苷酸的至少一條鏈相對于所述孔移動(dòng),獲取一個(gè)或多個(gè)測量值,其中所述測量值代表第一多核苷酸的至少一條鏈的一個(gè)或多個(gè)特征,由此表征第一多核苷酸;
(f)使所述第一多核苷酸與所述膜解偶聯(lián);
(g)將步驟(b)中提供的第二多核苷酸與所述膜偶聯(lián);
(h)使在步驟(g)中偶聯(lián)的第二多核苷酸與跨膜孔接觸,使得第二多核苷酸的至少一條鏈移動(dòng)通過所述孔;和
(i)隨著第二多核苷酸的至少一條鏈相對于所述孔移動(dòng),獲取一個(gè)或多個(gè)測量值,其中所述測量值代表第二多核苷酸的至少一條鏈的一個(gè)或多個(gè)特征,由此表征第二多核苷酸。
這種類型的方法在英國申請1406147.7和1407815.8以及與本申請同時(shí)提交的國際申請中詳細(xì)討論。
所述雙鏈多核苷酸在一端提供有Y適配體,在另一端提供有發(fā)夾環(huán)適配體。Y適配體和/或發(fā)夾環(huán)適配體通常是多核昔酸適配體。它們可以由上述任何多核苷酸形成。
Y適配體通常包含(a)雙鏈區(qū)域和(b)單鏈區(qū)域或在另一端不互補(bǔ)的區(qū)域。如果Y適配體包含單鏈區(qū)域,則其可被描述為具有突出端。在Y適配體中存在非互補(bǔ)區(qū)域給予該適配體Y形狀,因?yàn)閮蓷l鏈通常不像雙鏈部分那樣彼此雜交。Y適配體包括一個(gè)或多個(gè)第一錨。錨在上面更詳細(xì)地討論。
Y適配體優(yōu)選包含優(yōu)先旋入孔中的前導(dǎo)序列。前導(dǎo)序列如上所述。
發(fā)夾環(huán)適配體優(yōu)選包含如上所述的可選擇的結(jié)合部分。發(fā)夾環(huán)適配體和/或可選擇的結(jié)合部分可以包括可以被切下,切割,劈開或水解的區(qū)域,如上文所述。
可以使用本領(lǐng)域已知的任何方法將Y適配體和/或發(fā)夾環(huán)適配體連接到多核苷酸。一個(gè)或兩個(gè)適配體可以使用連接酶如T4DNA連接酶,大腸桿菌DNA連接酶,Taq DNA連接酶,Tma DNA連接酶和9°N DNA連接酶連接?;蛘?,可以使用下面討論的本發(fā)明的方法將適配體添加到多核苷酸。
在優(yōu)選的實(shí)施方案中,所述方法的步驟a)包括修飾雙鏈多核苷酸,使得其一端包含Y適配體和另一端包含發(fā)夾環(huán)適配體。可以使用任何方式的修飾。該方法優(yōu)選包括根據(jù)本發(fā)明修飾雙鏈多核苷酸。這將在下面更詳細(xì)地討論。修飾和表征的方法可以以任何方式組合。
發(fā)夾環(huán)適配體與膜偶聯(lián)(或結(jié)合)強(qiáng)度大于Y適配體與膜偶聯(lián)(或結(jié)合)強(qiáng)度。這可以以任何方式測量。用于測量偶聯(lián)(或結(jié)合)強(qiáng)度的合適方法公開在英國申請1406147.7和1407815.8的實(shí)施例中以及與本申請同時(shí)提交的國際申請中。
發(fā)夾環(huán)適配體的偶聯(lián)(或結(jié)合)強(qiáng)度優(yōu)選是Y適配體偶聯(lián)(或結(jié)合)強(qiáng)度的至少1.5倍,例如Y適配體偶聯(lián)(或結(jié)合)強(qiáng)度的至少兩倍,至少三倍,至少四倍,至少五倍或至少十倍。發(fā)夾環(huán)適配體對于膜的親和常數(shù)(Kd)優(yōu)選是Y適配體的親和常數(shù)的至少1.5倍,例如多Y適配體偶聯(lián)強(qiáng)度發(fā)至少兩倍,至少三倍,至少四倍,至少五倍或至少十倍。
有幾種方式使發(fā)夾環(huán)適配體比Y適配體更強(qiáng)地偶聯(lián)(或結(jié)合)到膜。例如,發(fā)夾環(huán)適配體可以包括比Y適配體更多的錨。例如,發(fā)夾環(huán)適配體可以包括2,3或更多個(gè)第二錨,而Y適配體可以包括一個(gè)第一錨。
所述一個(gè)或多個(gè)第二錨與膜的偶聯(lián)(或結(jié)合)強(qiáng)度可大于所述一個(gè)或多個(gè)第一錨偶聯(lián)(或結(jié)合)至膜的強(qiáng)度。一個(gè)或多個(gè)第二錨偶聯(lián)(或結(jié)合)到發(fā)夾環(huán)適配體的強(qiáng)度可以大于一個(gè)或多個(gè)第一錨偶聯(lián)(或結(jié)合)到Y(jié)適配體的強(qiáng)度。一個(gè)或多個(gè)第一錨和一個(gè)或多個(gè)第二錨可以通過雜交連接到它們各自的適配體,并且一個(gè)或多個(gè)第二錨的雜交強(qiáng)度大于一個(gè)或多個(gè)第一錨的雜交強(qiáng)度。這些實(shí)施例的任何組合也可以用于本發(fā)明中。偶聯(lián)(或結(jié)合)強(qiáng)度可以使用本領(lǐng)域已知的技術(shù)來測量。
一個(gè)或多個(gè)第二錨優(yōu)選地包括一個(gè)或多個(gè)基團(tuán),其偶聯(lián)(或結(jié)合)到膜的強(qiáng)度大于一個(gè)或多個(gè)第一錨的一個(gè)或多個(gè)基團(tuán)偶聯(lián)(或結(jié)合)到膜上的強(qiáng)度。在優(yōu)選的實(shí)施方案中,發(fā)夾環(huán)適配體/一個(gè)或多個(gè)第二錨使用膽固醇與膜偶聯(lián)(或結(jié)合),Y適配體/一個(gè)或多個(gè)第一錨使用棕櫚酸酯與膜偶聯(lián)(或結(jié)合)。膽固醇比棕櫚酸酯更強(qiáng)地結(jié)合到三嵌段共聚物膜和脂質(zhì)膜。在一個(gè)替換的實(shí)施方案中,發(fā)夾環(huán)適配體/一個(gè)或多個(gè)第二錨使用單酰基物質(zhì)例如棕櫚酸酯偶聯(lián)(或結(jié)合)到膜上,并且Y適配體/一個(gè)或多個(gè)第一錨使用二?;镔|(zhì),例如二棕櫚酰磷脂酰膽堿偶聯(lián)(或結(jié)合)所述膜。
添加發(fā)夾環(huán)和前導(dǎo)序列
在偶聯(lián)步驟之前,雙鏈多核苷酸分析物優(yōu)選與MuA轉(zhuǎn)座酶和雙鏈MuA底物組接觸,其中底物組中的一部分底物是包含前導(dǎo)序列的Y適配體,并且底物組中的一部分底物是發(fā)夾環(huán)適配體。轉(zhuǎn)座酶片段化雙鏈多核苷酸分析物并將MuA底物連接到片段的一端或兩端。這產(chǎn)生了多個(gè)修飾的雙鏈多核苷酸,其一端包含前導(dǎo)序列,在另一端包含發(fā)夾環(huán)。然后可以使用本發(fā)明的方法研究修飾的雙鏈多核苷酸。
這些基于MuA的方法公開在國際申請?zhí)朠CT/GB2014/052505(公開為WO2015022544)中。它們還在英國申請1406147.7和1407815.8中,以及與本申請同時(shí)提交的國際申請(ONT IP 056)中詳細(xì)討論。
修飾的多核苷酸分析物
在表征之前,可以在通過使用多核苷酸分析物作為模板使聚合酶形成修飾的多核苷酸分析物的條件下,使多核苷酸分析物與聚合酶及游離核苷酸組接觸來修飾第一多核苷酸分析物和/或第二多核苷酸分析物,其中當(dāng)形成修飾的多核苷酸分析物時(shí),聚合酶用不同的核苷酸種類替換多核苷酸分析物中的一個(gè)或多個(gè)核苷酸種類。然后可以如步驟a)和/或d)中那樣將修飾的多核苷酸分析物偶聯(lián)到膜上。這種類型的修改在國際申請No.PCT/GB2015/050483中描述??梢允褂蒙鲜鋈魏尉酆厦?。聚合酶優(yōu)選Klenow或9o North。
在其中聚合酶使用模板多核苷酸作為模板形成修飾的多核苷酸的條件下,使模板多核苷酸與聚合酶接觸。這樣的條件是本領(lǐng)域已知的。例如,多核苷酸通常與可商購的聚合酶緩沖液中的聚合酶接觸,例如來自New England的緩沖液。對于Klenow,溫度優(yōu)選為20至37℃,或者,對于9o North,溫度優(yōu)選為60至75℃。引物或3′發(fā)夾通常用作聚合酶延伸時(shí)的成核點(diǎn)。
使用跨膜孔進(jìn)行的多核苷酸的表征,例如測序,通常包括分析由k個(gè)核苷酸組成的聚合物單元,其中k是正整數(shù)(即“k-聚體”)。這在國際申請?zhí)朠CT/GB2012/052343(公開為WO 2013/041878)中討論。盡管期望在不同k聚體的電流測量值之間具有清楚的分離,但是通常這些測量值中的一些重疊的。特別是在k聚體中具有高數(shù)量的聚合物單元,即高k值時(shí),變得難以分辨由不同k聚體產(chǎn)生的測量值以確定關(guān)于多核苷酸的導(dǎo)出信息,例如評估該多核苷酸的基本序列(underlying sequence)。
通過將模板多核苷酸分析物中的一個(gè)或多個(gè)核苷酸物質(zhì)用經(jīng)修飾多核苷酸分析物中的不同核苷酸物質(zhì)替代,所述經(jīng)修飾多核苷酸分析物含有與模板多核昔酸分析物中的k聚體不同的k聚體。所述經(jīng)修飾多核苷酸分析物中的所述不同的k聚體能夠產(chǎn)生與模板多核苷酸分析物中的k聚體不同的電流測量值,由此所述經(jīng)修飾多核苷酸分析物提供不同于模板多核苷酸分析物的信息。來自所述經(jīng)修飾多核苷酸分析物的這些額外信息使得更容易表征所述模板多核苷酸分析物。在一些情況下,所述經(jīng)修飾多核苷酸分析物本身可以更容易地表征。例如,可將所述經(jīng)修飾多核苷酸設(shè)計(jì)為包括其電流測量值之間具有增強(qiáng)的分離或明確的分離的k聚體,或者包括具有降低的噪聲的k聚體。
優(yōu)選實(shí)施方式
本發(fā)明提供了表征兩個(gè)或更多個(gè)雙鏈多核苷酸的方法,包括:
(a)在第一樣品中提供第一雙鏈多核苷酸,其一端具有第一Y適配體且另一端具有第一發(fā)夾環(huán)適配體,其中所述第一Y適配體包含一個(gè)或多個(gè)第一解旋酶和一個(gè)或多個(gè)用于將所述多核苷酸偶聯(lián)至所述膜的第一錨,其中所述第一發(fā)夾環(huán)適配體包含所述一個(gè)或多個(gè)第一分子制動(dòng)器和一個(gè)或多個(gè)用于將所述第一多核苷酸偶聯(lián)至所述膜的第二錨,并且其中所述第一發(fā)夾環(huán)適配體與所述膜的偶聯(lián)強(qiáng)度大于所述第一Y適配體與所述膜的偶聯(lián)強(qiáng)度;
(b)在第二樣品中提供第二雙鏈多核昔酸,其一端具有第二Y適配體且另一端具有第二發(fā)夾環(huán)適配體,其中所述第二Y適配體包含一個(gè)或多個(gè)第二解旋酶和一個(gè)或多個(gè)用于將所述多核苷酸偶聯(lián)至所述膜的第三錨,其中所述第二發(fā)夾環(huán)適配體包含一個(gè)或多個(gè)第二分子制動(dòng)器和一個(gè)或多個(gè)用于將所述第二多核苷酸偶聯(lián)至所述膜的第四錨,并且其中所述第二發(fā)夾環(huán)適配體與所述膜的偶聯(lián)強(qiáng)度大于所述第二Y適配體到所述膜的偶聯(lián)強(qiáng)度;
(c)將所述第一樣品中的所述第一多核昔酸偶聯(lián)至所述膜;
(d)使所述第一多核苷酸與跨膜孔接觸,并跨所述孔施加電位,使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起,并且二者一起控制所述第一多核苷酸穿過所述孔的移動(dòng);
(e)隨著所述第一多核苷酸相對于所述孔移動(dòng),獲取進(jìn)行一個(gè)或多個(gè)測量值,其中所述測量值代表所述第一多核苷酸的一個(gè)或多個(gè)特征,由此表征所述第一多核苷酸;
(f)使所述第一多核苷酸與所述膜解偶聯(lián);
(g)將所述第二樣品中的所述第二多核苷酸偶聯(lián)至所述膜;
(h)使所述第二多核苷酸與跨膜孔接觸,并跨所述孔施加電位,使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起,并且二者一起控制所述第二多核苷酸通過所述孔的移動(dòng);和
(i)隨著所述第二多核苷酸相對于所述孔移動(dòng),獲取進(jìn)行一個(gè)或多個(gè)測量值,其中所述測量值代表第二多核苷酸的一個(gè)或多個(gè)特征,由此表征第二多核苷酸。
這結(jié)合了在英國申請1406155.0,1406147.7,1407815.8和1406151.9以及國際申請PCT/GB2014/052737以及當(dāng)時(shí)與本申請共同提交的國際申請(ONT IP056)中公開的方法。其中公開的任何實(shí)施例可以應(yīng)用于優(yōu)選實(shí)施方式。
其他表征方法
在另一個(gè)實(shí)施方案中,第一多核苷酸分析物和/或第二多核苷酸分析物通過當(dāng)聚合酶將核苷酸摻入多核昔酸中時(shí)檢測釋放的標(biāo)記物質(zhì)進(jìn)行表征。聚合酶使用第一和/或第二多核苷酸分析物作為模板。每個(gè)標(biāo)記的物質(zhì)對于每個(gè)核苷酸是特異性的。第一和/或第二多核苷酸分析物與跨膜孔、聚合酶和標(biāo)記的核苷酸接觸,使得當(dāng)通過聚合酶將核昔酸添加到多核苷酸時(shí),磷酸鹽標(biāo)記的物質(zhì)被順序地釋放,其中磷酸鹽物質(zhì)含有對每個(gè)核苷酸特異性的標(biāo)記。聚合酶可以是上述聚合酶中的任何一種。使用孔檢測磷酸鹽標(biāo)記的物質(zhì),從而表征第一和/或第二多核苷酸分析物。這種類型的方法公開在歐洲申請?zhí)?3187149.3(公開為EP 2682460)中。上面討論的任何實(shí)施例同樣適用于該方法。
涉及膽固醇和環(huán)糊精的方法
本發(fā)明還提供了將使用包含膽固醇的錨偶聯(lián)到膜上的分析物從膜解偶聯(lián)的方法,包括使分析物與環(huán)糊精或其衍生物接觸,由此使該分析物與膜解偶聯(lián)。上述任何實(shí)施方案,特別是涉及分析物、錨、環(huán)糊精或其衍生物和膜的那些實(shí)施方案,同樣適用于該方法。分析物優(yōu)選是多核苷酸。多核苷酸優(yōu)選包含如上定義的前導(dǎo)序列。膽固醇錨優(yōu)選包含與前導(dǎo)序列雜交的多核苷酸序列。多核苷酸序列優(yōu)選與錨中的膽固醇共價(jià)連接。
試劑盒
本發(fā)明還提供了用于確定兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征的試劑盒,其包含(a)膜,(b)一個(gè)或多個(gè)錨,其能夠?qū)蓚€(gè)或多個(gè)更多的分析物偶聯(lián)到膜,例如能夠?qū)⒌谝环治鑫锱悸?lián)到膜的一個(gè)或多個(gè)第一錨和能夠?qū)⒌诙治鑫锱悸?lián)到膜的一個(gè)或多個(gè)第二錨,以及(c)一個(gè)或多個(gè)試劑,能夠從膜解偶聯(lián)所述兩個(gè)或更多個(gè)分析物中的至少一個(gè),例如兩個(gè)。一個(gè)或多個(gè)錨和一個(gè)或多個(gè)試劑可以是上文參照本發(fā)明的方法討論的那些中的任何一個(gè)。
試劑盒優(yōu)選進(jìn)一步包括檢測器,例如跨膜孔。上面討論的任何檢測器可以在試劑盒中。
試劑盒優(yōu)選地還包含能夠優(yōu)先旋入跨膜孔的發(fā)夾環(huán)和/或前導(dǎo)序列。試劑盒優(yōu)選還包含多核苷酸結(jié)合蛋白。上文討論了優(yōu)選的發(fā)夾環(huán),前導(dǎo)序列和多核苷酸結(jié)合蛋白。
以上關(guān)于本發(fā)明的方法討論的任何實(shí)施方案同樣適用于試劑盒。試劑盒可以進(jìn)一步包含膜的組分,例如兩親性層或三嵌段共聚物膜的組分。
本發(fā)明的試劑盒可另外包括一種或多種能實(shí)施上述任何實(shí)施方案的其他試劑或儀器。所述試劑或儀器包括以下中的一種或多種:合適的緩沖液(水性溶液)、用于從受體獲得樣本的工具(如含有針的導(dǎo)管或儀器)、用于擴(kuò)增和/或表達(dá)多核苷酸的工具,上文限定的膜,或者電壓鉗或膜片鉗設(shè)備。試劑可以干態(tài)存在于所述試劑盒中,使得液體樣本使該試劑重懸(resuspend)??蛇x地,所述試劑盒還可包括使該試劑盒能在本發(fā)明方法中使用的說明書或關(guān)于該方法可以用于哪種有機(jī)體的詳細(xì)資料。
以下實(shí)施例用于說明本發(fā)明。
實(shí)施例
實(shí)施例1
該實(shí)施例顯示了對照實(shí)驗(yàn),其說明了通過在實(shí)驗(yàn)系統(tǒng)中存在甲基-β-環(huán)糊精,沒有阻止溶液中未偶聯(lián)至膜的游離DNA進(jìn)入納米孔。
材料和方法
在緩沖液(600mM KCl,25mM磷酸鉀,75mM亞鐵氰化鉀(II),25mM鐵氰化鉀(III),pH8.0)中在15℃的溫度下從插入嵌段共聚物中的單個(gè)MspA納米孔MS(B1-G75S/G77S/L88N/Q126R)8MspA(MspA-B2C)(具有突變G75S/G77S/L88N/Q126R的SEQ ID NO:2)獲得電測量值。在實(shí)現(xiàn)單個(gè)孔插入嵌段共聚物之后,然后將緩沖液(1mL,600mM KCl,25mM磷酸鉀,75mM亞鐵氰化鉀(II),25mM鐵氰化鉀(III)pH8.0)流過系統(tǒng)以去除任何過量的MspA-B2C納米孔。將兩個(gè)DNA樣品(100nM,1-SEQ ID NO:26和SEQ ID NO:29和2-SEQ ID NO:27,在其5′端連接到4個(gè)iSp18間隔區(qū),所述間隔區(qū)在其另一端連接到SEQ ID NO:28的3′端)加入到系統(tǒng)中,實(shí)驗(yàn)在施加的120mV電位下運(yùn)行30分鐘。然后用甲基-β-環(huán)糊精(100μM)和濃度為100nM的DNA樣品1和2以500μL的總體積沖洗該系統(tǒng),實(shí)驗(yàn)在施加的120mV電位下進(jìn)行另外30分鐘。然后用兩個(gè)1mL甲基-β-環(huán)糊精(100μM)沖洗液和濃度為100nM的DNA樣品1和2沖洗該系統(tǒng)。
除了對于所有包含甲基-β-環(huán)糊精的步驟之外,進(jìn)行與上述相似的對照實(shí)驗(yàn),僅加入DNA樣品,沒有甲基-β-環(huán)糊精沖洗流過該系統(tǒng)。
結(jié)果
其中僅將游離DNA加入系統(tǒng)的對照實(shí)驗(yàn)一致地在電流軌跡中表現(xiàn)出短尖峰,該鋒對應(yīng)于DNA在所施加的電位下移位穿過納米孔。這說明,每次用DNA樣品1和2沖洗納米孔系統(tǒng)都觀察到DNA移位。
進(jìn)行這些對照以確認(rèn),觀察到的DNA移位數(shù)目的減少(參見實(shí)施例4)是由于甲基-β-環(huán)糊精從膜表面去除膽固醇,而不是防止鏈進(jìn)入孔。該對照測試了環(huán)糊精是否可以沿著DNA的長度結(jié)合,阻礙DNA螺旋穿過孔的能力,并且因此防止該鏈被檢測到,但是它仍然連接在膜上。在這些實(shí)驗(yàn)中,使用了游離DNA,其沒有錨將其偶聯(lián)到膜上,如果環(huán)糊精的相互作用特異性地限于膽固醇,則在這種情況下環(huán)糊精應(yīng)該對DNA沒有影響。因此,觀察到的DNA移位數(shù)目的任何減少都是由于DNA主體的結(jié)合。在存在或不存在環(huán)糊精的情況下觀察到DNA移位數(shù)目沒有差異,這表明存在于系統(tǒng)中的環(huán)糊精不結(jié)合游離DNA,不阻止其穿過納米孔的移位。
實(shí)施例2
該實(shí)施例顯示了進(jìn)一步的對照實(shí)驗(yàn),其說明了當(dāng)將偶聯(lián)的DNA的第一樣品加入到納米孔系統(tǒng)中,然后加入第二樣品,而不用沒有DNA存在的解偶聯(lián)劑或緩沖液沖洗系統(tǒng)時(shí),在限定的時(shí)期內(nèi)檢測到的解旋酶控制的DNA移動(dòng)的數(shù)目保持相當(dāng)恒定,兩個(gè)樣品都觀察到解旋酶控制的DNA移動(dòng)。
材料和方法
本研究中使用的鏈來自λ基因組的45,042bp和48,487bp之間的區(qū)域。通過聚合酶PCR方法制備分析物,以根據(jù)需要在模板和模板互補(bǔ)鏈中每一個(gè)的限定末端包含雜交位點(diǎn)。對λ基因組DNA進(jìn)行PCR。
使用KAPA HiFi 2x Master mix,λDNA(NEB)和引物SEQ ID NO:32和SEQ ID NO:33制備DNA模板(SEQ ID NO:31,其對應(yīng)于與SEQ ID NO:47雜交的標(biāo)記為A1的鏈的序列,SEQ ID NO:47對應(yīng)于標(biāo)記為A2的鏈的序列,參見圖1(1))。使反應(yīng)循環(huán)20次,通過在Sephacryl S1000柱上凝膠過濾而純化正確大小的產(chǎn)物,并使用Millipore Ultracel 15 50kDa濃縮器濃縮至0.25mg/ml。
根據(jù)相同的反應(yīng)混合物制備用于電生理學(xué)實(shí)驗(yàn)的DNA構(gòu)建體(X和Y);2x LongAmp Taq master mix,300nM引物1和2或3和4,1.2ng ul-1 DNA模板(SEQ ID NO:31,其對應(yīng)于與SEQ ID NO:47雜交的標(biāo)記A1的鏈的序列,SEQ ID NO:47對應(yīng)于標(biāo)記A2的鏈的序列,參見圖1(1))。DNA構(gòu)建體均根據(jù)相同的循環(huán)程序擴(kuò)增;94℃2分鐘,[94℃15秒,58℃30秒,65℃2分鐘]12和65℃5分鐘。DNA構(gòu)建體根據(jù)制造商的說明書全部從0.8%瓊脂糖凝膠中純化(Qiagen Gel Extraction試劑盒),然后SPRI根據(jù)制造商的說明書進(jìn)行純化(Agencourt AMPure珠)。
對于DNA構(gòu)建體X=SEQ ID NO:34,其3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在其相對端連接到到SEQ ID NO:35的5′端;SEQ ID NO:35在3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在其相對端連接到四個(gè)5-硝基吲哚,5-硝基吲哚連接到SEQ ID NO:39的3′端。用于產(chǎn)生構(gòu)建體X的引物是引物1——SEQ ID NO:34,其3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在其另一端連接到SEQ ID NO:35的5′端;SEQ ID NO:35還在3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在其相對端連接到四個(gè)5-硝基吲哚,5-硝基吲哚連接到SEQ ID NO:36的5′端,和引物2——SEQ ID NO:37,其3′端連接到四個(gè)5-硝基吲哚,5-硝基吲哚在相對端連接到SEQ ID NO:38的5′端。
然后將構(gòu)建體X與SEQ ID NO:41雜交,所述SEQ ID NO:41在3′端連接到6個(gè)iSp18間隔區(qū),所述間隔區(qū)在其相對端連接到兩個(gè)胸腺嘧啶和3′膽固醇TEG(圖1(2)示出了構(gòu)建體X的卡通示意圖)。將系鏈在5倍過量下在室溫在25mM磷酸鉀緩沖液,151mM氯化鉀,pH 8.0中退火10分鐘。
對于DNA構(gòu)建體Y=SEQ ID NO:34,其3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在相對端連接到在SEQ ID NO:37的5′端;SEQ ID NO:37在3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在其相對端連接到四個(gè)5-硝基吲哚,5-硝基吲哚連接到SEQ ID NO:40的5′端。用于產(chǎn)生構(gòu)建體Y的引物是引物3——SEQ ID NO:34,其3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在其相對端連接到SEQ ID NO:37的5′端;SEQ ID NO:37還在3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在相對端連接到四個(gè)5-硝基吲哚,5-硝基吲哚連接到SEQ ID NO:38的5′端,和引物4——SEQ ID NO:35,在3′端連接到四個(gè)5-硝基吲哚,5-硝基吲哚在相對端連接到SEQ ID NO:36的5′端。
然后將構(gòu)建體Y與SEQ ID NO:30雜交,所述SEQ IDNO:30在3′端連接到6個(gè)iSp18間隔區(qū),所述間隔區(qū)在相對端連接到兩個(gè)胸腺嘧啶和3′膽固醇TEG(圖1(3)示出了構(gòu)建體X的卡通示意圖)。將系鏈在5倍過量下在室溫在25mM磷酸鉀緩沖液,151mM氯化鉀,pH 8.0中退火10分鐘。
在建立實(shí)驗(yàn)之前,將具有適當(dāng)系鏈的DNA構(gòu)建體X和Y(儲(chǔ)液濃度20nM,添加至納米孔系統(tǒng)的終濃度為0.1nM)獨(dú)立地用所述試劑孵育。首先,在緩沖液(151mM KCl,25mM磷酸鹽,2mM EDTA,pH8.0)中將所述DNA用T4Dda-E94C/A360C(儲(chǔ)液濃度250nM,添加到納米孔系統(tǒng)的終濃度為1nM,具有突變E94C/A360C的SEQ ID NO:24)在室溫預(yù)孵育5分鐘。5分鐘后,將TMAD(500μM)加入到預(yù)混物中,將混合物再孵育5分鐘。最后,向預(yù)混合物中加入MgCl2(10mM終濃度),ATP(2.5mM終濃度)和緩沖液(150mM亞鐵氰化鉀(II),150mM鐵氰化鉀和25mM磷酸鉀pH 8.0)。
在緩沖液(25mM磷酸鉀,150mM亞鐵氰化鉀(II),150mM鐵氰化鉀(III),pH 8.0)中從插入嵌段共聚物中的單個(gè)MspA納米孔(MspA-B2C)獲得電測量值。在實(shí)現(xiàn)單個(gè)孔插入嵌段共聚物后,將緩沖液(2mL,25mM磷酸鉀pH 8.0,150mM亞鐵氰化鉀(II)和150mM鐵氰化鉀(III))流過系統(tǒng)以去除任何過量MspA納米孔。然后將酶(T4Dda-E94C/A360C,1nM終濃度),DNA構(gòu)建體X(0.1nM終濃度),燃料(MgCl2 10mM終濃度,ATP 2.5mM終濃度)的預(yù)混合物(總共150μL)加入到單納米孔實(shí)驗(yàn)系統(tǒng)中,并且實(shí)驗(yàn)在120mV的保持電位下運(yùn)行2小時(shí),并監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后,停止實(shí)驗(yàn),將電位設(shè)置為零,然后將沒有解偶聯(lián)劑或沖洗緩沖液的DNA構(gòu)建體Y/酶預(yù)混物(總共150μL)直接加入系統(tǒng)中。然后將實(shí)驗(yàn)在120mV的保持電位下再運(yùn)行2小時(shí),并監(jiān)測解旋酶控制的DNA移動(dòng)。
結(jié)果和討論
由λ噬菌體基因組的相同3.8kb片段制備DNA構(gòu)建體X和Y(分別顯示于圖1(a)和(b))。連接適配體以在雙鏈體的一端產(chǎn)生突出的“前導(dǎo)體”,這允許通過孔進(jìn)行捕獲和旋入以及提供酶結(jié)合位點(diǎn)。另一端是鈍化的,因此只有具有前導(dǎo)體的鏈被捕獲并測序。兩個(gè)樣品具有連接到相反末端的適配體,使得前導(dǎo)體連接到DNA構(gòu)建體X中的鏈A1(圖1(2)中所示)和DNA構(gòu)建體Y中的鏈A2(圖1(3)中所示)。這意味著DNA構(gòu)建體X和Y使用僅映射到λ基因組的不同區(qū)域的序列產(chǎn)生可檢測的鏈移動(dòng)。這些移動(dòng)很容易區(qū)分,因此提供了一種方便的方法來識(shí)別兩個(gè)不同的測試樣品;然而,也可以使用具有不同序列的任何其他樣品。
對于DNA構(gòu)建體X和Y,用T4Dda-E94C/A360C觀察到解旋酶控制的DNA移動(dòng)。圖2顯示了納米孔處于未阻斷狀態(tài)(顯示為淺灰色)時(shí)相比于解旋酶DNA移動(dòng)發(fā)生且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程。對于第一個(gè)2100秒,沒有DNA存在于系統(tǒng)中,因此,納米孔處于未阻斷狀態(tài)。在2400秒時(shí)加入DNA構(gòu)建體X,并且在約80%的時(shí)間內(nèi)發(fā)生解旋酶控制的DNA穿過納米孔的移動(dòng)。然后將DNA構(gòu)建體Y在7200秒時(shí)流入納米孔系統(tǒng),并且在大約80%的時(shí)間內(nèi)觀察到解旋酶控制的DNA穿過納米孔移動(dòng)。
加入構(gòu)建體X后,觀察到的解旋酶控制的DNA移動(dòng)都被認(rèn)定為對應(yīng)于該構(gòu)建體。當(dāng)構(gòu)建體Y流入系統(tǒng)時(shí),檢測到對應(yīng)于Y的解旋酶控制的DNA移動(dòng)以及對應(yīng)于構(gòu)建體X的顯著數(shù)量的移動(dòng)。實(shí)驗(yàn)數(shù)據(jù)顯示,在整個(gè)實(shí)驗(yàn)中檢測的解旋酶控制的DNA移動(dòng)的速率保持相當(dāng)恒定,通過向系統(tǒng)中加入構(gòu)建體Y,沒有額外的沖洗或解偶聯(lián)劑,兩個(gè)樣品都檢測到解旋酶控制的DNA移動(dòng)。
實(shí)施例3
該實(shí)施例說明當(dāng)將偶聯(lián)的DNA構(gòu)建體X加入到納米孔系統(tǒng)中時(shí),不可能簡單地通過用大量體積的緩沖液沖洗系統(tǒng)來去除樣品。
材料和方法
如實(shí)施例2所述制備DNA構(gòu)建體X和Y。如實(shí)施例2所述,用酶預(yù)孵育DNA構(gòu)建體,用于產(chǎn)生構(gòu)建體X和構(gòu)建體Y預(yù)混物。
如實(shí)施例2中所述建立納米孔實(shí)驗(yàn)系統(tǒng)。將DNA構(gòu)建體X/酶預(yù)混物(總共300μL)加入到實(shí)驗(yàn)系統(tǒng)中,并且實(shí)驗(yàn)在120mV的保持電位下運(yùn)行2小時(shí),監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后,停止實(shí)驗(yàn)方案,將電位設(shè)置為零,并將緩沖液(10mL,150mM亞鐵氰化鉀(II),150mM鐵氰化鉀(III),25mM磷酸鉀pH 8.0)流過納米孔系統(tǒng)以便試圖去除偶聯(lián)的DNA構(gòu)建體X。在緩沖液沖洗后,在沒有額外的DNA加入系統(tǒng)并在120mV的保持電位下進(jìn)行實(shí)驗(yàn)兩小時(shí),并監(jiān)測解旋酶控制的DNA移動(dòng)。最后,將DNA構(gòu)建體Y/酶預(yù)混物(總共300μL)加入到實(shí)驗(yàn)系統(tǒng)中,并且在120mV的保持電位下運(yùn)行實(shí)驗(yàn)2小時(shí),并監(jiān)測解旋酶控制的DNA移動(dòng)。
結(jié)果和討論
對于DNA構(gòu)建體X和Y,用T4Dda-E94C/A360C都觀察到解旋酶控制的DNA移動(dòng)。圖3顯示了納米孔處于未阻斷狀態(tài)(顯示為淺灰色)時(shí)相比于解旋酶DNA移動(dòng)發(fā)生且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程的一部分。對于第一個(gè)2400秒,沒有DNA存在于系統(tǒng)中,因此,納米孔處于未阻斷狀態(tài)。在2700秒時(shí)加入DNA構(gòu)建體X,約80%的時(shí)間發(fā)生解旋酶控制的DNA穿過納米孔移動(dòng)。在7500秒,使緩沖液(10mL)流過系統(tǒng),然后監(jiān)測納米孔由于解旋酶控制的DNA移動(dòng)而被部分阻斷的時(shí)間百分比。用緩沖液沖洗后,約50%的時(shí)間發(fā)生解旋酶控制的DNA穿過納米孔移動(dòng)。這表明存在于系統(tǒng)中的偶聯(lián)的DNA構(gòu)建體X的量已經(jīng)通過緩沖液沖洗而減少,然而,仍然檢測到大量解旋酶控制的DNA移動(dòng)。在添加DNA構(gòu)建體Y時(shí),檢測到對應(yīng)于Y的解旋酶控制的DNA移動(dòng)以及對應(yīng)于仍存在于系統(tǒng)中的構(gòu)建體X的大量的解旋酶控制的DNA移動(dòng)。
實(shí)施例4
該實(shí)施例說明了如何使用甲基-β-環(huán)糊精來將使用膽固醇TEG偶聯(lián)到膜上的DNA從膜上解偶聯(lián)。將甲基-β-環(huán)糊精的溶液加入到納米孔系統(tǒng)中,達(dá)1,10和30分鐘,并且在每次孵育后監(jiān)測在限定的時(shí)間段內(nèi)檢測到的解旋酶控制的DNA移動(dòng)的數(shù)量。該實(shí)驗(yàn)說明,即使使用僅一分鐘的孵育時(shí)間,也能檢測到DNA與膜的顯著解偶聯(lián)。
材料和方法
如實(shí)施例2所述制備DNA構(gòu)建體X和Y。如實(shí)施例2所述,用酶預(yù)孵育DNA構(gòu)建體,從而產(chǎn)生構(gòu)建體X和構(gòu)建體Y預(yù)混物。
如實(shí)施例2中所述設(shè)置納米孔實(shí)驗(yàn)系統(tǒng)。將DNA構(gòu)建體X/酶預(yù)混物(總共150μL)加入到實(shí)驗(yàn)系統(tǒng)中,并且實(shí)驗(yàn)在120mV的保持電位下運(yùn)行2小時(shí),監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后,停止實(shí)驗(yàn)方案,將電位設(shè)置為零,并將甲基-β-環(huán)糊精(150μL,100μM)流至納米孔系統(tǒng)上,并孵育1,10或30分鐘,以嘗試去除偶聯(lián)的DNA構(gòu)建體X。在適當(dāng)?shù)姆跤龝r(shí)間后,將緩沖液(150μL,150mM亞鐵氰化鉀(II),150mM鐵氰化鉀(III),25mM磷酸鉀,pH 8.0)沖洗流過系統(tǒng)以去除任何解偶聯(lián)的DNA和過量的甲基-β-環(huán)糊精。在緩沖液沖洗之后,在沒有額外的DNA加入系統(tǒng)并在120mV的保持電位下進(jìn)行實(shí)驗(yàn)兩小時(shí),并監(jiān)測解旋酶控制的DNA移動(dòng)。最后,將DNA構(gòu)建體Y/酶預(yù)混物(總共150μL)加入到實(shí)驗(yàn)系統(tǒng)中,并且在120mV的保持電位下運(yùn)行實(shí)驗(yàn)2小時(shí),并監(jiān)測解旋酶控制的DNA移動(dòng)。然后對DNA構(gòu)建體Y重復(fù)相同的解偶聯(lián)過程。
結(jié)果和討論
對于DNA構(gòu)建體X和Y,用T4Dda-E94C/A360C都觀察到解旋酶控制的DNA移動(dòng)。圖4,圖5和圖6顯示了納米孔處于未阻斷狀態(tài)(顯示為淺灰色)時(shí)相比于解旋酶DNA移動(dòng)發(fā)生且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程的一部分。圖4,5和6分別對應(yīng)于使用甲基-β-環(huán)糊精的孵育時(shí)間為1,10和30分鐘。對于所有三個(gè)實(shí)驗(yàn),在添加DNA之前,很少觀察到或沒有觀察到解旋酶控制的DNA移動(dòng)。在添加構(gòu)建體X時(shí),在約80%的時(shí)間內(nèi)發(fā)生解旋酶控制的DNA穿過納米孔移動(dòng)。在針對不同孵育期和相應(yīng)的緩沖液沖洗而加入甲基-β-環(huán)糊精后,納米孔由于解旋酶控制的DNA移動(dòng)而被部分阻斷的時(shí)間百分比急劇降低至約20%,并且當(dāng)孵育期為30分鐘時(shí),降至小于10%。這表明甲基-β-環(huán)糊精成功地將使用膽固醇偶聯(lián)至膜的DNA從膜解偶聯(lián)。與用緩沖液沖洗相比,甲基-β-環(huán)糊精顯著地使更多偶聯(lián)的DNA解偶聯(lián)。
在向系統(tǒng)中加入DNA構(gòu)建體Y后,鑒定了對應(yīng)于構(gòu)建體Y的解旋酶控制的DNA移動(dòng)。小部分移動(dòng)被鑒定為對應(yīng)于構(gòu)建體X,然而,相比于其中構(gòu)建體X未從系統(tǒng)中沖洗(參見實(shí)施例2)或其中系鏈的構(gòu)建體X用10mL緩沖液處理以試圖將其從系統(tǒng)中去除(參見實(shí)施例3)的實(shí)驗(yàn),被鑒定為X的事件的比例顯著減少。對構(gòu)建體Y重復(fù)甲基-β-環(huán)糊精解偶聯(lián)過程,并且還顯示使用該方法可以成功地將構(gòu)建體Y與膜解偶聯(lián)。
實(shí)施例5
該實(shí)施例說明了DNA如何通過結(jié)合有延伸鏈(extender)(其3′端還具有膽固醇)的5′脫硫生物素的鏈霉親和素偶聯(lián)到膜上,其中所述DNA已經(jīng)具有生物素系鏈雜交到其上并且已經(jīng)用鏈霉親和素預(yù)孵育(參見圖7的卡通示意圖)。然后可以通過用游離生物素沖洗系統(tǒng)將該DNA構(gòu)建體與膜解偶聯(lián)。由于生物素對鏈霉親和素比脫硫生物素對鏈霉親和素具有更強(qiáng)的結(jié)合親和力,因此,當(dāng)生物素加入到系統(tǒng)中時(shí),生物素競爭掉脫硫生物素,這確保了鏈的有效去除。這使得延伸鏈偶聯(lián)到雙層上并可用于將第二DNA構(gòu)建體偶聯(lián)到膜上。
材料和方法
實(shí)施例5中使用的DNA構(gòu)建體顯示于圖7中。通過在50℃下雜交SEQ ID NO:45(50nM,其具有連接至其3′末端的6個(gè)iSp18間隔區(qū),所述間隔區(qū)在相對端連接到兩個(gè)胸腺嘧啶和3′生物素TEG)與由SEQ ID NO:42組成的DNA鏈10分鐘,然后緩慢冷卻而制備DNA構(gòu)建體,其中所述SEQ ID NO:42在其3′端連接到四個(gè)iSpC3間隔區(qū),所述間隔區(qū)在相對端連接到SEQ ID NO:43(50nM)的5′端。將鏈霉親和素(終濃度50nM)加入到DNA混合物中(終濃度25nM),并在室溫下孵育10分鐘。該復(fù)合體將被稱為DNA構(gòu)建體P。
如實(shí)施例2中所述設(shè)置納米孔實(shí)驗(yàn)系統(tǒng)。在120mV的施加電位下、沒有向系統(tǒng)中添加DNA下進(jìn)行對照實(shí)驗(yàn)15分鐘。然后將脫硫生物素延伸鏈(SEQ ID NO:46,其5′端連接有脫硫生物素且3′端連接有膽固醇TEG)加入到納米孔系統(tǒng)中,實(shí)驗(yàn)運(yùn)行15分鐘,使其偶聯(lián)到膜。將DNA構(gòu)建體P加入到實(shí)驗(yàn)系統(tǒng)(25nM)中,并且實(shí)驗(yàn)在120mV的施加電位下運(yùn)行30分鐘。然后向系統(tǒng)中加入游離生物素(50μM),實(shí)驗(yàn)進(jìn)行另外30分鐘。在生物素孵育后,使緩沖液流過系統(tǒng)(1mL,625mM KCl,100mM HEPES,pH8)以去除任何過量的生物素和解偶聯(lián)的DNA。
結(jié)果和討論
該實(shí)驗(yàn)說明了從膜上解偶聯(lián)DNA構(gòu)建體的另一種方法。圖8示出了上述完整實(shí)驗(yàn)的電流軌跡。圖9示出了前述實(shí)驗(yàn)步驟的幾個(gè)連續(xù)快照。圖9(A)顯示當(dāng)系統(tǒng)中不存在DNA時(shí),納米孔是開放的并且顯示出幾個(gè)區(qū)塊(block)。*1標(biāo)記了實(shí)驗(yàn)中當(dāng)將延伸的脫硫生物素添加到系統(tǒng)中的點(diǎn),未觀察到對應(yīng)于該短片段的電流區(qū)塊。*2標(biāo)記了將DNA構(gòu)建體P加入系統(tǒng)的點(diǎn)。DNA的添加導(dǎo)致DNA電流區(qū)塊,其一致地在70和100pA之間(參見圖9A(軌跡的最后部分,9B是軌跡的第一部分))。*3標(biāo)記了向系統(tǒng)中添加生物素(50μM)的點(diǎn)。顯然,在添加生物素后,觀察到的DNA電流區(qū)塊的數(shù)量急劇減少。最后,*4對應(yīng)于緩沖液沖洗步驟,其中DNA和生物素從系統(tǒng)中去除。該實(shí)驗(yàn)表明,通過將生物素沖洗到系統(tǒng)中,DNA構(gòu)建體P可以從膜上解偶聯(lián)。由于生物素對鏈霉親和素比對脫硫生物素對鏈霉親和素具有更強(qiáng)的結(jié)合親和力,因此當(dāng)生物素加入到系統(tǒng)中時(shí),它競爭掉脫硫生物素,這確保了鏈的有效去除。生物素還與鏈霉親和素上的其他空白結(jié)合位點(diǎn)結(jié)合,并從系統(tǒng)中去除整個(gè)鏈霉親和素DNA復(fù)合體。這使得延伸鏈偶聯(lián)到雙層上并可用于將第二DNA構(gòu)建體偶聯(lián)到膜上。
實(shí)施例6
該實(shí)施例說明了如何使用(2-羥丙基)-β-環(huán)糊精從膜上解偶聯(lián)使用膽固醇TEG與膜偶聯(lián)的DNA。將各種不同濃度的(2-羥丙基)-β-環(huán)糊精加入到納米孔系統(tǒng)中,監(jiān)測對每個(gè)納米孔在規(guī)定時(shí)間內(nèi)檢測到的解旋酶控制的DNA移動(dòng)的數(shù)量的%變化。該實(shí)驗(yàn)說明,低至20mM(2-羥丙基)-β-環(huán)糊精的濃度導(dǎo)致孵育后對每個(gè)納米孔檢測到的解旋酶控制的DNA移動(dòng)的數(shù)量減少(參見表2)。
材料和方法
如實(shí)施例2所述制備DNA構(gòu)建體X。如實(shí)施例2所述,用酶預(yù)孵育DNA構(gòu)建體,來制備構(gòu)建體X預(yù)混物。
如實(shí)施例2所述設(shè)置納米孔實(shí)驗(yàn)系統(tǒng)。將DNA構(gòu)建體X/酶預(yù)混物(總共150μL)加入到實(shí)驗(yàn)系統(tǒng)中,并且實(shí)驗(yàn)在140mV的保持電位下運(yùn)行2小時(shí),監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后,停止實(shí)驗(yàn)方案,將電位設(shè)置為零,并將(2-羥丙基)-β-環(huán)糊精(150μL,在500mM KCl中20mM,50mM,100mM或200mM,25mM磷酸鉀pH8)流到納米孔系統(tǒng)上并孵育10分鐘,以試圖去除偶聯(lián)的DNA構(gòu)建體X。在孵育后,將緩沖液(150μL,500mM KCl,25mM磷酸鉀pH8)沖洗流過系統(tǒng)以去除任何解偶聯(lián)的DNA和過量的(2-羥丙基)-β-環(huán)糊精。在緩沖液沖洗后,將緩沖液(含有燃料)加入系統(tǒng)(150uL 500mM KCl,25mM磷酸鉀,2mM ATP,2mM MgCl 2pH8),沒有額外的DNA,在保持電位140mV下持續(xù)2小時(shí),監(jiān)測解旋酶控制DNA移動(dòng)。
結(jié)果和討論
對于DNA構(gòu)建體X,用T4Dda-E94C/A360C觀察到解旋酶控制的DNA移動(dòng)。下表2顯示在系統(tǒng)用不同濃度的(2-羥丙基)-β-環(huán)糊精孵育后,對每個(gè)納米孔檢測到解旋酶控制的DNA移動(dòng)的數(shù)目的平均%變化。對于所有實(shí)驗(yàn),在加入DNA之前,觀察到很少或沒有觀察到解旋酶控制的DNA移動(dòng)。添加構(gòu)建體X后,發(fā)生解旋酶控制的DNA移動(dòng)穿過納米孔。在加入不同濃度的(2-羥丙基)-β-環(huán)糊精和相應(yīng)的緩沖液沖洗后,對每個(gè)納米孔檢測的解旋酶控制的DNA移動(dòng)的數(shù)量的平均百分比變化為至少50%,并且當(dāng)在200mM濃度下孵育時(shí)高達(dá)90%。這表明(2-羥丙基)-β-環(huán)糊精成功地將使用膽固醇偶聯(lián)到膜上的DNA從膜上解偶聯(lián)。
表2
序列表
<110> 牛津納米孔技術(shù)公司
<120> 方法
<130> N402334WO
<150> GB1406155.0
<151> 2014-04-04
<150> PCT/GB2014/052737
<151> 2014-09-10
<160> 47
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> 人工序列
<220>
<223> 恥垢分枝桿菌孔蛋白A突變體(Mycobacterium smegmatis)
(D90N/D91N/D93N/D118R/D134R/E193K)
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> 人工序列
<220>
<223> 恥垢分枝桿菌孔蛋白A突變體
(D90N/D91N/D93N/D118R/D134R/E139K)
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> 人工序列
<220>
<223> α-溶血素突變體 (E111N/K147N)
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> 人工序列
<220>
<223> α-溶血素突變體 (E111N/K147N)
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> 恥垢分枝桿菌
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> 恥垢分枝桿菌
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> 恥垢分枝桿菌
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 1830
<212> DNA
<213> 枯草芽孢桿菌噬菌體(Bacillus subtilis phage) phi29
<400> 8
atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60
gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120
ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180
cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240
tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300
tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360
gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420
gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480
gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540
tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600
atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660
gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720
gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780
cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840
tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900
accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960
ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020
gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080
aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140
ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200
ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260
acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320
accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380
catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440
ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500
atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560
tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620
gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680
gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740
tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800
tggagccacc cgcagtttga aaaataataa 1830
<210> 9
<211> 608
<212> PRT
<213> 枯草芽孢桿菌噬菌體 phi29
<400> 9
Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr
1 5 10 15
Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile
20 25 30
Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met
35 40 45
Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys
50 55 60
Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys
65 70 75 80
Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg
85 90 95
Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys
100 105 110
Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe
115 120 125
Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly
130 135 140
Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro
145 150 155 160
Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala
165 170 175
Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser
180 185 190
Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys
195 200 205
Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr
210 215 220
Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys
225 230 235 240
Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala
245 250 255
Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu
260 265 270
Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile
275 280 285
Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile
290 295 300
Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly
305 310 315 320
Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met
325 330 335
Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys
340 345 350
Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr
355 360 365
Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu
370 375 380
Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr
385 390 395 400
Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu
405 410 415
Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe
420 425 430
Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys
435 440 445
Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly
450 455 460
Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu
465 470 475 480
Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg
485 490 495
Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys
500 505 510
Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val
515 520 525
Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu
530 535 540
Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln
545 550 555 560
Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser
565 570 575
Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser
580 585 590
Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys
595 600 605
<210> 10
<211> 1390
<212> DNA
<213> 大腸桿菌
<400> 10
atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60
acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120
aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180
ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240
gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300
ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360
tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420
atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480
ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540
catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600
cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660
attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720
ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780
atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840
gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900
gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960
gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020
ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080
gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140
aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200
aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260
tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320
cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380
gtggcgctgc 1390
<210> 11
<211> 485
<212> PRT
<213> 大腸桿菌
<400> 11
Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr
1 5 10 15
Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala
20 25 30
Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val
35 40 45
Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val
50 55 60
Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn
65 70 75 80
Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys
85 90 95
Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr
100 105 110
Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp
115 120 125
Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys
130 135 140
Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly
145 150 155 160
Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu
165 170 175
His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala
180 185 190
Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu
195 200 205
Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro
210 215 220
Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg
225 230 235 240
Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg
245 250 255
Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu
260 265 270
Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr
275 280 285
Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn
290 295 300
Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala
305 310 315 320
Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile
325 330 335
Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala
340 345 350
Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr
355 360 365
Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu
370 375 380
Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp
385 390 395 400
Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro
405 410 415
Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg
420 425 430
Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln
435 440 445
Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu
450 455 460
Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His
465 470 475 480
His His His His His
485
<210> 12
<211> 804
<212> DNA
<213> 大腸桿菌
<400> 12
atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60
atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120
atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180
ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240
cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300
ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360
aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420
aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480
atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540
ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600
catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660
gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720
tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780
cccgtctggg cgaccttccg ccgc 804
<210> 13
<211> 268
<212> PRT
<213> 大腸桿菌
<400> 13
Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His
1 5 10 15
Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu
20 25 30
Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala
35 40 45
Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly
50 55 60
Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe
65 70 75 80
Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile
85 90 95
Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln
100 105 110
Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe
115 120 125
Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn
130 135 140
Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp
145 150 155 160
Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys
165 170 175
Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser
180 185 190
Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp
195 200 205
Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg
210 215 220
Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys
225 230 235 240
Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro
245 250 255
Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg
260 265
<210> 14
<211> 1275
<212> DNA
<213> 嗜熱棲熱菌(Thermus thermophilus)
<400> 14
atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60
cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120
ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180
ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240
atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300
attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360
gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420
ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480
catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540
attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600
cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660
ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720
ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780
ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840
cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900
ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960
gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020
gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080
ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140
gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200
ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260
gaaccgctgt tcctg 1275
<210> 15
<211> 425
<212> PRT
<213> 嗜熱棲熱菌
<400> 15
Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro
1 5 10 15
Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg
20 25 30
Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu
35 40 45
Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp
50 55 60
Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu
65 70 75 80
Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr
85 90 95
Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu
100 105 110
Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr
115 120 125
Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys
130 135 140
Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu
145 150 155 160
His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala
165 170 175
Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg
180 185 190
Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val
195 200 205
Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val
210 215 220
Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu
225 230 235 240
Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala
245 250 255
Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg
260 265 270
Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp
275 280 285
Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly
290 295 300
Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro
305 310 315 320
Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro
325 330 335
Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg
340 345 350
Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu
355 360 365
Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro
370 375 380
Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly
385 390 395 400
Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly
405 410 415
Glu Gly Asn Pro Glu Pro Leu Phe Leu
420 425
<210> 16
<211> 738
<212> DNA
<213> 噬菌體λ
<400> 16
tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60
gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120
gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180
cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240
ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300
ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360
agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420
aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480
aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540
tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600
cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660
gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720
tccggcagcg gttccgga 738
<210> 17
<211> 226
<212> PRT
<213> 噬菌體λ
<400> 17
Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala
1 5 10 15
Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile
20 25 30
Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys
35 40 45
Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu
50 55 60
Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp
65 70 75 80
Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser
85 90 95
Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met
100 105 110
Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu
115 120 125
Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu
130 135 140
Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr
145 150 155 160
Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp
165 170 175
Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp
180 185 190
Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu
195 200 205
Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln
210 215 220
Trp Arg
225
<210> 18
<211> 760
<212> PRT
<213> 布氏擬甲烷球菌(Methanococcoides burtonii)
<400> 18
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 19
<211> 707
<212> PRT
<213> 海綿共生古菌(Cenarchaeum symbiosum)
<400> 19
Met Arg Ile Ser Glu Leu Asp Ile Pro Arg Pro Ala Ile Glu Phe Leu
1 5 10 15
Glu Gly Glu Gly Tyr Lys Lys Leu Tyr Pro Pro Gln Ala Ala Ala Ala
20 25 30
Lys Ala Gly Leu Thr Asp Gly Lys Ser Val Leu Val Ser Ala Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Ile Ala Ala Ile Ala Met Ile Ser His Leu
50 55 60
Ser Arg Asn Arg Gly Lys Ala Val Tyr Leu Ser Pro Leu Arg Ala Leu
65 70 75 80
Ala Ala Glu Lys Phe Ala Glu Phe Gly Lys Ile Gly Gly Ile Pro Leu
85 90 95
Gly Arg Pro Val Arg Val Gly Val Ser Thr Gly Asp Phe Glu Lys Ala
100 105 110
Gly Arg Ser Leu Gly Asn Asn Asp Ile Leu Val Leu Thr Asn Glu Arg
115 120 125
Met Asp Ser Leu Ile Arg Arg Arg Pro Asp Trp Met Asp Glu Val Gly
130 135 140
Leu Val Ile Ala Asp Glu Ile His Leu Ile Gly Asp Arg Ser Arg Gly
145 150 155 160
Pro Thr Leu Glu Met Val Leu Thr Lys Leu Arg Gly Leu Arg Ser Ser
165 170 175
Pro Gln Val Val Ala Leu Ser Ala Thr Ile Ser Asn Ala Asp Glu Ile
180 185 190
Ala Gly Trp Leu Asp Cys Thr Leu Val His Ser Thr Trp Arg Pro Val
195 200 205
Pro Leu Ser Glu Gly Val Tyr Gln Asp Gly Glu Val Ala Met Gly Asp
210 215 220
Gly Ser Arg His Glu Val Ala Ala Thr Gly Gly Gly Pro Ala Val Asp
225 230 235 240
Leu Ala Ala Glu Ser Val Ala Glu Gly Gly Gln Ser Leu Ile Phe Ala
245 250 255
Asp Thr Arg Ala Arg Ser Ala Ser Leu Ala Ala Lys Ala Ser Ala Val
260 265 270
Ile Pro Glu Ala Lys Gly Ala Asp Ala Ala Lys Leu Ala Ala Ala Ala
275 280 285
Lys Lys Ile Ile Ser Ser Gly Gly Glu Thr Lys Leu Ala Lys Thr Leu
290 295 300
Ala Glu Leu Val Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Asn
305 310 315 320
Gln Asp Cys Arg Ser Val Val Glu Glu Glu Phe Arg Ser Gly Arg Ile
325 330 335
Arg Leu Leu Ala Ser Thr Pro Thr Leu Ala Ala Gly Val Asn Leu Pro
340 345 350
Ala Arg Arg Val Val Ile Ser Ser Val Met Arg Tyr Asn Ser Ser Ser
355 360 365
Gly Met Ser Glu Pro Ile Ser Ile Leu Glu Tyr Lys Gln Leu Cys Gly
370 375 380
Arg Ala Gly Arg Pro Gln Tyr Asp Lys Ser Gly Glu Ala Ile Val Val
385 390 395 400
Gly Gly Val Asn Ala Asp Glu Ile Phe Asp Arg Tyr Ile Gly Gly Glu
405 410 415
Pro Glu Pro Ile Arg Ser Ala Met Val Asp Asp Arg Ala Leu Arg Ile
420 425 430
His Val Leu Ser Leu Val Thr Thr Ser Pro Gly Ile Lys Glu Asp Asp
435 440 445
Val Thr Glu Phe Phe Leu Gly Thr Leu Gly Gly Gln Gln Ser Gly Glu
450 455 460
Ser Thr Val Lys Phe Ser Val Ala Val Ala Leu Arg Phe Leu Gln Glu
465 470 475 480
Glu Gly Met Leu Gly Arg Arg Gly Gly Arg Leu Ala Ala Thr Lys Met
485 490 495
Gly Arg Leu Val Ser Arg Leu Tyr Met Asp Pro Met Thr Ala Val Thr
500 505 510
Leu Arg Asp Ala Val Gly Glu Ala Ser Pro Gly Arg Met His Thr Leu
515 520 525
Gly Phe Leu His Leu Val Ser Glu Cys Ser Glu Phe Met Pro Arg Phe
530 535 540
Ala Leu Arg Gln Lys Asp His Glu Val Ala Glu Met Met Leu Glu Ala
545 550 555 560
Gly Arg Gly Glu Leu Leu Arg Pro Val Tyr Ser Tyr Glu Cys Gly Arg
565 570 575
Gly Leu Leu Ala Leu His Arg Trp Ile Gly Glu Ser Pro Glu Ala Lys
580 585 590
Leu Ala Glu Asp Leu Lys Phe Glu Ser Gly Asp Val His Arg Met Val
595 600 605
Glu Ser Ser Gly Trp Leu Leu Arg Cys Ile Trp Glu Ile Ser Lys His
610 615 620
Gln Glu Arg Pro Asp Leu Leu Gly Glu Leu Asp Val Leu Arg Ser Arg
625 630 635 640
Val Ala Tyr Gly Ile Lys Ala Glu Leu Val Pro Leu Val Ser Ile Lys
645 650 655
Gly Ile Gly Arg Val Arg Ser Arg Arg Leu Phe Arg Gly Gly Ile Lys
660 665 670
Gly Pro Gly Asp Leu Ala Ala Val Pro Val Glu Arg Leu Ser Arg Val
675 680 685
Glu Gly Ile Gly Ala Thr Leu Ala Asn Asn Ile Lys Ser Gln Leu Arg
690 695 700
Lys Gly Gly
705
<210> 20
<211> 720
<212> PRT
<213> 科超嗜熱古菌(Thermococcus gammatolerans)
<400> 20
Met Lys Val Asp Glu Leu Pro Val Asp Glu Arg Leu Lys Ala Val Leu
1 5 10 15
Lys Glu Arg Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Leu
20 25 30
Lys Ser Gly Ala Leu Glu Gly Arg Asn Leu Val Leu Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Val Ser Glu Ile Val Met Val Asn Lys Leu
50 55 60
Ile Gln Glu Gly Gly Lys Ala Val Tyr Leu Val Pro Leu Lys Ala Leu
65 70 75 80
Ala Glu Glu Lys Tyr Arg Glu Phe Lys Glu Trp Glu Lys Leu Gly Leu
85 90 95
Lys Val Ala Ala Thr Thr Gly Asp Tyr Asp Ser Thr Asp Asp Trp Leu
100 105 110
Gly Arg Tyr Asp Ile Ile Val Ala Thr Ala Glu Lys Phe Asp Ser Leu
115 120 125
Leu Arg His Gly Ala Arg Trp Ile Asn Asp Val Lys Leu Val Val Ala
130 135 140
Asp Glu Val His Leu Ile Gly Ser Tyr Asp Arg Gly Ala Thr Leu Glu
145 150 155 160
Met Ile Leu Thr His Met Leu Gly Arg Ala Gln Ile Leu Ala Leu Ser
165 170 175
Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu Trp Leu Asp Ala Ser
180 185 190
Leu Val Val Ser Asp Trp Arg Pro Val Gln Leu Arg Arg Gly Val Phe
195 200 205
His Leu Gly Thr Leu Ile Trp Glu Asp Gly Lys Val Glu Ser Tyr Pro
210 215 220
Glu Asn Trp Tyr Ser Leu Val Val Asp Ala Val Lys Arg Gly Lys Gly
225 230 235 240
Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala Glu Lys Glu Ala Leu
245 250 255
Ala Leu Ser Lys Leu Val Ser Ser His Leu Thr Lys Pro Glu Lys Arg
260 265 270
Ala Leu Glu Ser Leu Ala Ser Gln Leu Glu Asp Asn Pro Thr Ser Glu
275 280 285
Lys Leu Lys Arg Ala Leu Arg Gly Gly Val Ala Phe His His Ala Gly
290 295 300
Leu Ser Arg Val Glu Arg Thr Leu Ile Glu Asp Ala Phe Arg Glu Gly
305 310 315 320
Leu Ile Lys Val Ile Thr Ala Thr Pro Thr Leu Ser Ala Gly Val Asn
325 330 335
Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr Lys Arg Tyr Ala Gly
340 345 350
Phe Gly Trp Thr Asp Ile Pro Val Leu Glu Ile Gln Gln Met Met Gly
355 360 365
Arg Ala Gly Arg Pro Arg Tyr Asp Lys Tyr Gly Glu Ala Ile Ile Val
370 375 380
Ala Arg Thr Asp Glu Pro Gly Lys Leu Met Glu Arg Tyr Ile Arg Gly
385 390 395 400
Lys Pro Glu Lys Leu Phe Ser Met Leu Ala Asn Glu Gln Ala Phe Arg
405 410 415
Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly Ile Arg Ser Phe Pro
420 425 430
Glu Leu Val Arg Phe Leu Glu Arg Thr Phe Tyr Ala His Gln Arg Lys
435 440 445
Asp Leu Ser Ser Leu Glu Tyr Lys Ala Lys Glu Val Val Tyr Phe Leu
450 455 460
Ile Glu Asn Glu Phe Ile Asp Leu Asp Leu Glu Asp Arg Phe Ile Pro
465 470 475 480
Leu Pro Phe Gly Lys Arg Thr Ser Gln Leu Tyr Ile Asp Pro Leu Thr
485 490 495
Ala Lys Lys Phe Lys Asp Ala Phe Pro Ala Ile Glu Arg Asn Pro Asn
500 505 510
Pro Phe Gly Ile Phe Gln Leu Ile Ala Ser Thr Pro Asp Met Ala Thr
515 520 525
Leu Thr Ala Arg Arg Arg Glu Met Glu Asp Tyr Leu Asp Leu Ala Tyr
530 535 540
Glu Leu Glu Asp Lys Leu Tyr Ala Ser Ile Pro Tyr Tyr Glu Asp Ser
545 550 555 560
Arg Phe Gln Gly Phe Leu Gly Gln Val Lys Thr Ala Lys Val Leu Leu
565 570 575
Asp Trp Ile Asn Glu Val Pro Glu Ala Arg Ile Tyr Glu Thr Tyr Ser
580 585 590
Ile Asp Pro Gly Asp Leu Tyr Arg Leu Leu Glu Leu Ala Asp Trp Leu
595 600 605
Met Tyr Ser Leu Ile Glu Leu Tyr Lys Leu Phe Glu Pro Lys Glu Glu
610 615 620
Ile Leu Asn Tyr Leu Arg Asp Leu His Leu Arg Leu Arg His Gly Val
625 630 635 640
Arg Glu Glu Leu Leu Glu Leu Val Arg Leu Pro Asn Ile Gly Arg Lys
645 650 655
Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Arg Ser Val Glu Ala Ile
660 665 670
Ala Asn Ala Lys Pro Ala Glu Leu Leu Ala Val Glu Gly Ile Gly Ala
675 680 685
Lys Ile Leu Asp Gly Ile Tyr Arg His Leu Gly Ile Glu Lys Arg Val
690 695 700
Thr Glu Glu Lys Pro Lys Arg Lys Gly Thr Leu Glu Asp Phe Leu Arg
705 710 715 720
<210> 21
<211> 799
<212> PRT
<213> 亨氏甲烷螺菌(Methanospirillum hungatei)
<400> 21
Met Glu Ile Ala Ser Leu Pro Leu Pro Asp Ser Phe Ile Arg Ala Cys
1 5 10 15
His Ala Lys Gly Ile Arg Ser Leu Tyr Pro Pro Gln Ala Glu Cys Ile
20 25 30
Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ile Ser Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Trp Ser Arg Ile
50 55 60
Ala Ala Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Tyr Asp Glu Phe Ser Lys Lys Gly Val Ile Arg Val Gly
85 90 95
Ile Ala Thr Gly Asp Leu Asp Arg Thr Asp Ala Tyr Leu Gly Glu Asn
100 105 110
Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu Arg Asn
115 120 125
Arg Thr Pro Trp Leu Ser Gln Ile Thr Cys Ile Val Leu Asp Glu Val
130 135 140
His Leu Ile Gly Ser Glu Asn Arg Gly Ala Thr Leu Glu Met Val Ile
145 150 155 160
Thr Lys Leu Arg Tyr Thr Asn Pro Val Met Gln Ile Ile Gly Leu Ser
165 170 175
Ala Thr Ile Gly Asn Pro Ala Gln Leu Ala Glu Trp Leu Asp Ala Thr
180 185 190
Leu Ile Thr Ser Thr Trp Arg Pro Val Asp Leu Arg Gln Gly Val Tyr
195 200 205
Tyr Asn Gly Lys Ile Arg Phe Ser Asp Ser Glu Arg Pro Ile Gln Gly
210 215 220
Lys Thr Lys His Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Glu Glu
225 230 235 240
Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly
245 250 255
Phe Ala Lys Lys Ala Ala Gly Ala Leu Lys Ala Gly Ser Pro Asp Ser
260 265 270
Lys Ala Leu Ala Gln Glu Leu Arg Arg Leu Arg Asp Arg Asp Glu Gly
275 280 285
Asn Val Leu Ala Asp Cys Val Glu Arg Gly Ala Ala Phe His His Ala
290 295 300
Gly Leu Ile Arg Gln Glu Arg Thr Ile Ile Glu Glu Gly Phe Arg Asn
305 310 315 320
Gly Tyr Ile Glu Val Ile Ala Ala Thr Pro Thr Leu Ala Ala Gly Leu
325 330 335
Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Asn Arg Phe Ala
340 345 350
Ser Gly Leu Gly Met Val Pro Ile Pro Val Gly Glu Tyr His Gln Met
355 360 365
Ala Gly Arg Ala Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Val
370 375 380
Leu Leu Ala Lys Asp Ala Pro Ser Val Glu Arg Leu Phe Glu Thr Phe
385 390 395 400
Ile Asp Ala Glu Ala Glu Arg Val Asp Ser Gln Cys Val Asp Asp Ala
405 410 415
Ser Leu Cys Ala His Ile Leu Ser Leu Ile Ala Thr Gly Phe Ala His
420 425 430
Asp Gln Glu Ala Leu Ser Ser Phe Met Glu Arg Thr Phe Tyr Phe Phe
435 440 445
Gln His Pro Lys Thr Arg Ser Leu Pro Arg Leu Val Ala Asp Ala Ile
450 455 460
Arg Phe Leu Thr Thr Ala Gly Met Val Glu Glu Arg Glu Asn Thr Leu
465 470 475 480
Ser Ala Thr Arg Leu Gly Ser Leu Val Ser Arg Leu Tyr Leu Asn Pro
485 490 495
Cys Thr Ala Arg Leu Ile Leu Asp Ser Leu Lys Ser Cys Lys Thr Pro
500 505 510
Thr Leu Ile Gly Leu Leu His Val Ile Cys Val Ser Pro Asp Met Gln
515 520 525
Arg Leu Tyr Leu Lys Ala Ala Asp Thr Gln Leu Leu Arg Thr Phe Leu
530 535 540
Phe Lys His Lys Asp Asp Leu Ile Leu Pro Leu Pro Phe Glu Gln Glu
545 550 555 560
Glu Glu Glu Leu Trp Leu Ser Gly Leu Lys Thr Ala Leu Val Leu Thr
565 570 575
Asp Trp Ala Asp Glu Phe Ser Glu Gly Met Ile Glu Glu Arg Tyr Gly
580 585 590
Ile Gly Ala Gly Asp Leu Tyr Asn Ile Val Asp Ser Gly Lys Trp Leu
595 600 605
Leu His Gly Thr Glu Arg Leu Val Ser Val Glu Met Pro Glu Met Ser
610 615 620
Gln Val Val Lys Thr Leu Ser Val Arg Val His His Gly Val Lys Ser
625 630 635 640
Glu Leu Leu Pro Leu Val Ala Leu Arg Asn Ile Gly Arg Val Arg Ala
645 650 655
Arg Thr Leu Tyr Asn Ala Gly Tyr Pro Asp Pro Glu Ala Val Ala Arg
660 665 670
Ala Gly Leu Ser Thr Ile Ala Arg Ile Ile Gly Glu Gly Ile Ala Arg
675 680 685
Gln Val Ile Asp Glu Ile Thr Gly Val Lys Arg Ser Gly Ile His Ser
690 695 700
Ser Asp Asp Asp Tyr Gln Gln Lys Thr Pro Glu Leu Leu Thr Asp Ile
705 710 715 720
Pro Gly Ile Gly Lys Lys Met Ala Glu Lys Leu Gln Asn Ala Gly Ile
725 730 735
Ile Thr Val Ser Asp Leu Leu Thr Ala Asp Glu Val Leu Leu Ser Asp
740 745 750
Val Leu Gly Ala Ala Arg Ala Arg Lys Val Leu Ala Phe Leu Ser Asn
755 760 765
Ser Glu Lys Glu Asn Ser Ser Ser Asp Lys Thr Glu Glu Ile Pro Asp
770 775 780
Thr Gln Lys Ile Arg Gly Gln Ser Ser Trp Glu Asp Phe Gly Cys
785 790 795
<210> 22
<211> 1756
<212> PRT
<213> 大腸桿菌
<400> 22
Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr
1 5 10 15
Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg
20 25 30
Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp
35 40 45
Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala
50 55 60
Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr
65 70 75 80
Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu
85 90 95
Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe
100 105 110
Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp
115 120 125
Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe
130 135 140
Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala
145 150 155 160
Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser
165 170 175
Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn
180 185 190
Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val
195 200 205
Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp
210 215 220
Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala
225 230 235 240
Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val
245 250 255
Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile
260 265 270
Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile
275 280 285
Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln
290 295 300
Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val
305 310 315 320
Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr
325 330 335
Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly
340 345 350
Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu
355 360 365
Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile
370 375 380
His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met
385 390 395 400
Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr
405 410 415
Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser
420 425 430
Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg
435 440 445
Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln
450 455 460
Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu
465 470 475 480
Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly
485 490 495
Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys
500 505 510
Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His
515 520 525
Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly
530 535 540
Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp
545 550 555 560
Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg
565 570 575
Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys
580 585 590
Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala
595 600 605
Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu
610 615 620
Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp
625 630 635 640
Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met
645 650 655
Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp
660 665 670
Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly
675 680 685
Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu
690 695 700
Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val
705 710 715 720
Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln
725 730 735
Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg
740 745 750
Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu
755 760 765
Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp
770 775 780
Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala
785 790 795 800
Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser
805 810 815
Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser
820 825 830
Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu
835 840 845
Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala
850 855 860
Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu
865 870 875 880
Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala
885 890 895
Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile
900 905 910
Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr
915 920 925
Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu
930 935 940
Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg
945 950 955 960
Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala
965 970 975
Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly
980 985 990
Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala
995 1000 1005
Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu
1010 1015 1020
Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val
1025 1030 1035
Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln
1040 1045 1050
Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu
1055 1060 1065
Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala
1070 1075 1080
Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly
1085 1090 1095
Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg
1100 1105 1110
Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu
1115 1120 1125
Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu
1130 1135 1140
Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val
1145 1150 1155
Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu
1160 1165 1170
His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala
1175 1180 1185
Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp
1190 1195 1200
Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly
1205 1210 1215
Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu
1220 1225 1230
Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg
1235 1240 1245
Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val
1250 1255 1260
Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser
1265 1270 1275
Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val
1280 1285 1290
Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr
1295 1300 1305
Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu
1310 1315 1320
Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg
1325 1330 1335
Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu
1340 1345 1350
Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser
1355 1360 1365
Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile
1370 1375 1380
Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr
1385 1390 1395
Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala
1400 1405 1410
Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly
1415 1420 1425
Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val
1430 1435 1440
Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn
1445 1450 1455
Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys
1460 1465 1470
Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala
1475 1480 1485
Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln
1490 1495 1500
Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro
1505 1510 1515
Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp
1520 1525 1530
Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr
1535 1540 1545
Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val
1550 1555 1560
Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg
1565 1570 1575
Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg
1580 1585 1590
Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala
1595 1600 1605
Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg
1610 1615 1620
Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly
1625 1630 1635
Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala
1640 1645 1650
Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile
1655 1660 1665
Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys
1670 1675 1680
Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg
1685 1690 1695
Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu
1700 1705 1710
Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg
1715 1720 1725
Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met
1730 1735 1740
Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp
1745 1750 1755
<210> 23
<211> 726
<212> PRT
<213> 布氏擬甲烷球菌(Methanococcoides burtonii)
<400> 23
Met Ser Asp Lys Pro Ala Phe Met Lys Tyr Phe Thr Gln Ser Ser Cys
1 5 10 15
Tyr Pro Asn Gln Gln Glu Ala Met Asp Arg Ile His Ser Ala Leu Met
20 25 30
Gln Gln Gln Leu Val Leu Phe Glu Gly Ala Cys Gly Thr Gly Lys Thr
35 40 45
Leu Ser Ala Leu Val Pro Ala Leu His Val Gly Lys Met Leu Gly Lys
50 55 60
Thr Val Ile Ile Ala Thr Asn Val His Gln Gln Met Val Gln Phe Ile
65 70 75 80
Asn Glu Ala Arg Asp Ile Lys Lys Val Gln Asp Val Lys Val Ala Val
85 90 95
Ile Lys Gly Lys Thr Ala Met Cys Pro Gln Glu Ala Asp Tyr Glu Glu
100 105 110
Cys Ser Val Lys Arg Glu Asn Thr Phe Glu Leu Met Glu Thr Glu Arg
115 120 125
Glu Ile Tyr Leu Lys Arg Gln Glu Leu Asn Ser Ala Arg Asp Ser Tyr
130 135 140
Lys Lys Ser His Asp Pro Ala Phe Val Thr Leu Arg Asp Glu Leu Ser
145 150 155 160
Lys Glu Ile Asp Ala Val Glu Glu Lys Ala Arg Gly Leu Arg Asp Arg
165 170 175
Ala Cys Asn Asp Leu Tyr Glu Val Leu Arg Ser Asp Ser Glu Lys Phe
180 185 190
Arg Glu Trp Leu Tyr Lys Glu Val Arg Ser Pro Glu Glu Ile Asn Asp
195 200 205
His Ala Ile Lys Asp Gly Met Cys Gly Tyr Glu Leu Val Lys Arg Glu
210 215 220
Leu Lys His Ala Asp Leu Leu Ile Cys Asn Tyr His His Val Leu Asn
225 230 235 240
Pro Asp Ile Phe Ser Thr Val Leu Gly Trp Ile Glu Lys Glu Pro Gln
245 250 255
Glu Thr Ile Val Ile Phe Asp Glu Ala His Asn Leu Glu Ser Ala Ala
260 265 270
Arg Ser His Ser Ser Leu Ser Leu Thr Glu His Ser Ile Glu Lys Ala
275 280 285
Ile Thr Glu Leu Glu Ala Asn Leu Asp Leu Leu Ala Asp Asp Asn Ile
290 295 300
His Asn Leu Phe Asn Ile Phe Leu Glu Val Ile Ser Asp Thr Tyr Asn
305 310 315 320
Ser Arg Phe Lys Phe Gly Glu Arg Glu Arg Val Arg Lys Asn Trp Tyr
325 330 335
Asp Ile Arg Ile Ser Asp Pro Tyr Glu Arg Asn Asp Ile Val Arg Gly
340 345 350
Lys Phe Leu Arg Gln Ala Lys Gly Asp Phe Gly Glu Lys Asp Asp Ile
355 360 365
Gln Ile Leu Leu Ser Glu Ala Ser Glu Leu Gly Ala Lys Leu Asp Glu
370 375 380
Thr Tyr Arg Asp Gln Tyr Lys Lys Gly Leu Ser Ser Val Met Lys Arg
385 390 395 400
Ser His Ile Arg Tyr Val Ala Asp Phe Met Ser Ala Tyr Ile Glu Leu
405 410 415
Ser His Asn Leu Asn Tyr Tyr Pro Ile Leu Asn Val Arg Arg Asp Met
420 425 430
Asn Asp Glu Ile Tyr Gly Arg Val Glu Leu Phe Thr Cys Ile Pro Lys
435 440 445
Asn Val Thr Glu Pro Leu Phe Asn Ser Leu Phe Ser Val Ile Leu Met
450 455 460
Ser Ala Thr Leu His Pro Phe Glu Met Val Lys Lys Thr Leu Gly Ile
465 470 475 480
Thr Arg Asp Thr Cys Glu Met Ser Tyr Gly Thr Ser Phe Pro Glu Glu
485 490 495
Lys Arg Leu Ser Ile Ala Val Ser Ile Pro Pro Leu Phe Ala Lys Asn
500 505 510
Arg Asp Asp Arg His Val Thr Glu Leu Leu Glu Gln Val Leu Leu Asp
515 520 525
Ser Ile Glu Asn Ser Lys Gly Asn Val Ile Leu Phe Phe Gln Ser Ala
530 535 540
Phe Glu Ala Lys Arg Tyr Tyr Ser Lys Ile Glu Pro Leu Val Asn Val
545 550 555 560
Pro Val Phe Leu Asp Glu Val Gly Ile Ser Ser Gln Asp Val Arg Glu
565 570 575
Glu Phe Phe Ser Ile Gly Glu Glu Asn Gly Lys Ala Val Leu Leu Ser
580 585 590
Tyr Leu Trp Gly Thr Leu Ser Glu Gly Ile Asp Tyr Arg Asp Gly Arg
595 600 605
Gly Arg Thr Val Ile Ile Ile Gly Val Gly Tyr Pro Ala Leu Asn Asp
610 615 620
Arg Met Asn Ala Val Glu Ser Ala Tyr Asp His Val Phe Gly Tyr Gly
625 630 635 640
Ala Gly Trp Glu Phe Ala Ile Gln Val Pro Thr Ile Arg Lys Ile Arg
645 650 655
Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg
660 665 670
Ile Leu Leu Asp Gly Arg Phe Leu Thr Asp Ser Lys Lys Arg Phe Gly
675 680 685
Lys Phe Ser Val Phe Glu Val Phe Pro Pro Ala Glu Arg Ser Glu Phe
690 695 700
Val Asp Val Asp Pro Glu Lys Val Lys Tyr Ser Leu Met Asn Phe Phe
705 710 715 720
Met Asp Asn Asp Glu Gln
725
<210> 24
<211> 439
<212> PRT
<213> 腸桿菌噬菌體(Enterobacteria phage)T4
<400> 24
Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile
1 5 10 15
Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly
20 25 30
Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala
35 40 45
Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His
50 55 60
Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr
65 70 75 80
Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val
85 90 95
Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu
115 120 125
Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn
130 135 140
Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser
145 150 155 160
Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val
165 170 175
Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn
180 185 190
Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly
195 200 205
Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser
210 215 220
Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe
225 230 235 240
Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile
245 250 255
Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln
260 265 270
Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu
275 280 285
Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr
290 295 300
Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile
305 310 315 320
Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr
325 330 335
Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe
340 345 350
Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys
355 360 365
Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe
370 375 380
Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly
385 390 395 400
Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala
405 410 415
Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly
420 425 430
Arg Tyr Asp Val Phe Tyr Val
435
<210> 25
<211> 970
<212> PRT
<213> 肉毒桿菌(Clostridium botulinum)
<400> 25
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly
115 120 125
Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser
260 265 270
Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro
420 425 430
Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg
450 455 460
Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile
690 695 700
Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr
740 745 750
Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu
915 920 925
Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp
930 935 940
Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 26
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例1中使用的序列。
<400> 26
tttttttttt cttttttttc ttttttggtt ggttgttggt tgg 43
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例1中使用的序列。
<400> 27
tttttttttt cttttttttt 20
<210> 28
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例1中使用的序列。
<400> 28
ggttggttgt tggttgg 17
<210> 29
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例1中使用的序列。
<400> 29
ttaatgctaa tcgtgatagg ggt 23
<210> 30
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 30
gttctactaa accgtgtcaa tcagtgtc 28
<210> 31
<211> 3560
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 31
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgcgct aacaacctcc tgccgttttg cccgtgcata tcggtcacga acaaatctga 120
ttactaaaca cagtagcctg gatttgttct atcagtaatc gaccttattc ctaattaaat 180
agagcaaatc cccttattgg gggtaagaca tgaagatgcc agaaaaacat gacctgttgg 240
ccgccattct cgcggcaaag gaacaaggca tcggggcaat ccttgcgttt gcaatggcgt 300
accttcgcgg cagatataat ggcggtgcgt ttacaaaaac agtaatcgac gcaacgatgt 360
gcgccattat cgcctagttc attcgtgacc ttctcgactt cgccggacta agtagcaatc 420
tcgcttatat aacgagcgtg tttatcggct acatcggtac tgactcgatt ggttcgctta 480
tcaaacgctt cgctgctaaa aaagccggag tagaagatgg tagaaatcaa taatcaacgt 540
aaggcgttcc tcgatatgct ggcgtggtcg gagggaactg ataacggacg tcagaaaacc 600
agaaatcatg gttatgacgt cattgtaggc ggagagctat ttactgatta ctccgatcac 660
cctcgcaaac ttgtcacgct aaacccaaaa ctcaaatcaa caggcgccgg acgctaccag 720
cttctttccc gttggtggga tgcctaccgc aagcagcttg gcctgaaaga cttctctccg 780
aaaagtcagg acgctgtggc attgcagcag attaaggagc gtggcgcttt acctatgatt 840
gatcgtggtg atatccgtca ggcaatcgac cgttgcagca atatctgggc ttcactgccg 900
ggcgctggtt atggtcagtt cgagcataag gctgacagcc tgattgcaaa attcaaagaa 960
gcgggcggaa cggtcagaga gattgatgta tgagcagagt caccgcgatt atctccgctc 1020
tggttatctg catcatcgtc tgcctgtcat gggctgttaa tcattaccgt gataacgcca 1080
ttacctacaa agcccagcgc gacaaaaatg ccagagaact gaagctggcg aacgcggcaa 1140
ttactgacat gcagatgcgt cagcgtgatg ttgctgcgct cgatgcaaaa tacacgaagg 1200
agttagctga tgctaaagct gaaaatgatg ctctgcgtga tgatgttgcc gctggtcgtc 1260
gtcggttgca catcaaagca gtctgtcagt cagtgcgtga agccaccacc gcctccggcg 1320
tggataatgc agcctccccc cgactggcag acaccgctga acgggattat ttcaccctca 1380
gagagaggct gatcactatg caaaaacaac tggaaggaac ccagaagtat attaatgagc 1440
agtgcagata gagttgccca tatcgatggg caactcatgc aattattgtg agcaatacac 1500
acgcgcttcc agcggagtat aaatgcctaa agtaataaaa ccgagcaatc catttacgaa 1560
tgtttgctgg gtttctgttt taacaacatt ttctgcgccg ccacaaattt tggctgcatc 1620
gacagttttc ttctgcccaa ttccagaaac gaagaaatga tgggtgatgg tttcctttgg 1680
tgctactgct gccggtttgt tttgaacagt aaacgtctgt tgagcacatc ctgtaataag 1740
cagggccagc gcagtagcga gtagcatttt tttcatggtg ttattcccga tgctttttga 1800
agttcgcaga atcgtatgtg tagaaaatta aacaaaccct aaacaatgag ttgaaatttc 1860
atattgttaa tatttattaa tgtatgtcag gtgcgatgaa tcgtcattgt attcccggat 1920
taactatgtc cacagccctg acggggaact tctctgcggg agtgtccggg aataattaaa 1980
acgatgcaca cagggtttag cgcgtacacg tattgcatta tgccaacgcc ccggtgctga 2040
cacggaagaa accggacgtt atgatttagc gtggaaagat ttgtgtagtg ttctgaatgc 2100
tctcagtaaa tagtaatgaa ttatcaaagg tatagtaata tcttttatgt tcatggatat 2160
ttgtaaccca tcggaaaact cctgctttag caagattttc cctgtattgc tgaaatgtga 2220
tttctcttga tttcaaccta tcataggacg tttctataag atgcgtgttt cttgagaatt 2280
taacatttac aaccttttta agtcctttta ttaacacggt gttatcgttt tctaacacga 2340
tgtgaatatt atctgtggct agatagtaaa tataatgtga gacgttgtga cgttttagtt 2400
cagaataaaa caattcacag tctaaatctt ttcgcacttg atcgaatatt tctttaaaaa 2460
tggcaacctg agccattggt aaaaccttcc atgtgatacg agggcgcgta gtttgcatta 2520
tcgtttttat cgtttcaatc tggtctgacc tccttgtgtt ttgttgatga tttatgtcaa 2580
atattaggaa tgttttcact taatagtatt ggttgcgtaa caaagtgcgg tcctgctggc 2640
attctggagg gaaatacaac cgacagatgt atgtaaggcc aacgtgctca aatcttcata 2700
cagaaagatt tgaagtaata ttttaaccgc tagatgaaga gcaagcgcat ggagcgacaa 2760
aatgaataaa gaacaatctg ctgatgatcc ctccgtggat ctgattcgtg taaaaaatat 2820
gcttaatagc accatttcta tgagttaccc tgatgttgta attgcatgta tagaacataa 2880
ggtgtctctg gaagcattca gagcaattga ggcagcgttg gtgaagcacg ataataatat 2940
gaaggattat tccctggtgg ttgactgatc accataactg ctaatcattc aaactattta 3000
gtctgtgaca gagccaacac gcagtctgtc actgtcagga aagtggtaaa actgcaactc 3060
aattactgca atgccctcgt aattaagtga atttacaata tcgtcctgtt cggagggaag 3120
aacgcgggat gttcattctt catcactttt aattgatgta tatgctctct tttctgacgt 3180
tagtctccga cggcaggctt caatgaccca ggctgagaaa ttcccggacc ctttttgctc 3240
aagagcgatg ttaatttgtt caatcatttg gttaggaaag cggatgttgc gggttgttgt 3300
tctgcgggtt ctgttcttcg ttgacatgag gttgccccgt attcagtgtc gctgatttgt 3360
attgtctgaa gttgttttta cgttaagttg atgcagatca attaatacga tacctgcgtc 3420
ataattgatt atttgacgtg gtttgatggc ctccacgcac gttgtgatat gtagatgata 3480
atcattatca ctttacgggt cctttccggt gaaaaaaaag gtaccaaaaa aaacatcgtc 3540
gtgagtagtg aaccgtaagc 3560
<210> 32
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 32
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgcgct aacaacctcc tgccg 85
<210> 33
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 33
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60
acccgtaaag tg 72
<210> 34
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 34
tttttttttt tttttttttt tttttttttt tttttttttt tttttt 46
<210> 35
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 35
ggttgtttct gttggtgctg atattgc 27
<210> 36
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 36
gccatcagat tgtgtttgtt agtcgct 27
<210> 37
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 37
acactgattg acacggttta gtagaac 27
<210> 38
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 38
gcttacggtt cactactcac gacgatg 27
<210> 39
<211> 3587
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 39
gccatcagat tgtgtttgtt agtcgctgcc atcagattgt gtttgttagt cgcttttttt 60
ttttggaatt ttttttttgg aatttttttt ttgcgctaac aacctcctgc cgttttgccc 120
gtgcatatcg gtcacgaaca aatctgatta ctaaacacag tagcctggat ttgttctatc 180
agtaatcgac cttattccta attaaataga gcaaatcccc ttattggggg taagacatga 240
agatgccaga aaaacatgac ctgttggccg ccattctcgc ggcaaaggaa caaggcatcg 300
gggcaatcct tgcgtttgca atggcgtacc ttcgcggcag atataatggc ggtgcgttta 360
caaaaacagt aatcgacgca acgatgtgcg ccattatcgc ctagttcatt cgtgaccttc 420
tcgacttcgc cggactaagt agcaatctcg cttatataac gagcgtgttt atcggctaca 480
tcggtactga ctcgattggt tcgcttatca aacgcttcgc tgctaaaaaa gccggagtag 540
aagatggtag aaatcaataa tcaacgtaag gcgttcctcg atatgctggc gtggtcggag 600
ggaactgata acggacgtca gaaaaccaga aatcatggtt atgacgtcat tgtaggcgga 660
gagctattta ctgattactc cgatcaccct cgcaaacttg tcacgctaaa cccaaaactc 720
aaatcaacag gcgccggacg ctaccagctt ctttcccgtt ggtgggatgc ctaccgcaag 780
cagcttggcc tgaaagactt ctctccgaaa agtcaggacg ctgtggcatt gcagcagatt 840
aaggagcgtg gcgctttacc tatgattgat cgtggtgata tccgtcaggc aatcgaccgt 900
tgcagcaata tctgggcttc actgccgggc gctggttatg gtcagttcga gcataaggct 960
gacagcctga ttgcaaaatt caaagaagcg ggcggaacgg tcagagagat tgatgtatga 1020
gcagagtcac cgcgattatc tccgctctgg ttatctgcat catcgtctgc ctgtcatggg 1080
ctgttaatca ttaccgtgat aacgccatta cctacaaagc ccagcgcgac aaaaatgcca 1140
gagaactgaa gctggcgaac gcggcaatta ctgacatgca gatgcgtcag cgtgatgttg 1200
ctgcgctcga tgcaaaatac acgaaggagt tagctgatgc taaagctgaa aatgatgctc 1260
tgcgtgatga tgttgccgct ggtcgtcgtc ggttgcacat caaagcagtc tgtcagtcag 1320
tgcgtgaagc caccaccgcc tccggcgtgg ataatgcagc ctccccccga ctggcagaca 1380
ccgctgaacg ggattatttc accctcagag agaggctgat cactatgcaa aaacaactgg 1440
aaggaaccca gaagtatatt aatgagcagt gcagatagag ttgcccatat cgatgggcaa 1500
ctcatgcaat tattgtgagc aatacacacg cgcttccagc ggagtataaa tgcctaaagt 1560
aataaaaccg agcaatccat ttacgaatgt ttgctgggtt tctgttttaa caacattttc 1620
tgcgccgcca caaattttgg ctgcatcgac agttttcttc tgcccaattc cagaaacgaa 1680
gaaatgatgg gtgatggttt cctttggtgc tactgctgcc ggtttgtttt gaacagtaaa 1740
cgtctgttga gcacatcctg taataagcag ggccagcgca gtagcgagta gcattttttt 1800
catggtgtta ttcccgatgc tttttgaagt tcgcagaatc gtatgtgtag aaaattaaac 1860
aaaccctaaa caatgagttg aaatttcata ttgttaatat ttattaatgt atgtcaggtg 1920
cgatgaatcg tcattgtatt cccggattaa ctatgtccac agccctgacg gggaacttct 1980
ctgcgggagt gtccgggaat aattaaaacg atgcacacag ggtttagcgc gtacacgtat 2040
tgcattatgc caacgccccg gtgctgacac ggaagaaacc ggacgttatg atttagcgtg 2100
gaaagatttg tgtagtgttc tgaatgctct cagtaaatag taatgaatta tcaaaggtat 2160
agtaatatct tttatgttca tggatatttg taacccatcg gaaaactcct gctttagcaa 2220
gattttccct gtattgctga aatgtgattt ctcttgattt caacctatca taggacgttt 2280
ctataagatg cgtgtttctt gagaatttaa catttacaac ctttttaagt ccttttatta 2340
acacggtgtt atcgttttct aacacgatgt gaatattatc tgtggctaga tagtaaatat 2400
aatgtgagac gttgtgacgt tttagttcag aataaaacaa ttcacagtct aaatcttttc 2460
gcacttgatc gaatatttct ttaaaaatgg caacctgagc cattggtaaa accttccatg 2520
tgatacgagg gcgcgtagtt tgcattatcg tttttatcgt ttcaatctgg tctgacctcc 2580
ttgtgttttg ttgatgattt atgtcaaata ttaggaatgt tttcacttaa tagtattggt 2640
tgcgtaacaa agtgcggtcc tgctggcatt ctggagggaa atacaaccga cagatgtatg 2700
taaggccaac gtgctcaaat cttcatacag aaagatttga agtaatattt taaccgctag 2760
atgaagagca agcgcatgga gcgacaaaat gaataaagaa caatctgctg atgatccctc 2820
cgtggatctg attcgtgtaa aaaatatgct taatagcacc atttctatga gttaccctga 2880
tgttgtaatt gcatgtatag aacataaggt gtctctggaa gcattcagag caattgaggc 2940
agcgttggtg aagcacgata ataatatgaa ggattattcc ctggtggttg actgatcacc 3000
ataactgcta atcattcaaa ctatttagtc tgtgacagag ccaacacgca gtctgtcact 3060
gtcaggaaag tggtaaaact gcaactcaat tactgcaatg ccctcgtaat taagtgaatt 3120
tacaatatcg tcctgttcgg agggaagaac gcgggatgtt cattcttcat cacttttaat 3180
tgatgtatat gctctctttt ctgacgttag tctccgacgg caggcttcaa tgacccaggc 3240
tgagaaattc ccggaccctt tttgctcaag agcgatgtta atttgttcaa tcatttggtt 3300
aggaaagcgg atgttgcggg ttgttgttct gcgggttctg ttcttcgttg acatgaggtt 3360
gccccgtatt cagtgtcgct gatttgtatt gtctgaagtt gtttttacgt taagttgatg 3420
cagatcaatt aatacgatac ctgcgtcata attgattatt tgacgtggtt tgatggcctc 3480
cacgcacgtt gtgatatgta gatgataatc attatcactt tacgggtcct ttccggtgaa 3540
aaaaaaggta ccaaaaaaaa catcgtcgtg agtagtgaac cgtaagc 3587
<210> 40
<211> 3560
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 40
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60
acccgtaaag tgataatgat tatcatctac atatcacaac gtgcgtggag gccatcaaac 120
cacgtcaaat aatcaattat gacgcaggta tcgtattaat tgatctgcat caacttaacg 180
taaaaacaac ttcagacaat acaaatcagc gacactgaat acggggcaac ctcatgtcaa 240
cgaagaacag aacccgcaga acaacaaccc gcaacatccg ctttcctaac caaatgattg 300
aacaaattaa catcgctctt gagcaaaaag ggtccgggaa tttctcagcc tgggtcattg 360
aagcctgccg tcggagacta acgtcagaaa agagagcata tacatcaatt aaaagtgatg 420
aagaatgaac atcccgcgtt cttccctccg aacaggacga tattgtaaat tcacttaatt 480
acgagggcat tgcagtaatt gagttgcagt tttaccactt tcctgacagt gacagactgc 540
gtgttggctc tgtcacagac taaatagttt gaatgattag cagttatggt gatcagtcaa 600
ccaccaggga ataatccttc atattattat cgtgcttcac caacgctgcc tcaattgctc 660
tgaatgcttc cagagacacc ttatgttcta tacatgcaat tacaacatca gggtaactca 720
tagaaatggt gctattaagc atatttttta cacgaatcag atccacggag ggatcatcag 780
cagattgttc tttattcatt ttgtcgctcc atgcgcttgc tcttcatcta gcggttaaaa 840
tattacttca aatctttctg tatgaagatt tgagcacgtt ggccttacat acatctgtcg 900
gttgtatttc cctccagaat gccagcagga ccgcactttg ttacgcaacc aatactatta 960
agtgaaaaca ttcctaatat ttgacataaa tcatcaacaa aacacaagga ggtcagacca 1020
gattgaaacg ataaaaacga taatgcaaac tacgcgccct cgtatcacat ggaaggtttt 1080
accaatggct caggttgcca tttttaaaga aatattcgat caagtgcgaa aagatttaga 1140
ctgtgaattg ttttattctg aactaaaacg tcacaacgtc tcacattata tttactatct 1200
agccacagat aatattcaca tcgtgttaga aaacgataac accgtgttaa taaaaggact 1260
taaaaaggtt gtaaatgtta aattctcaag aaacacgcat cttatagaaa cgtcctatga 1320
taggttgaaa tcaagagaaa tcacatttca gcaatacagg gaaaatcttg ctaaagcagg 1380
agttttccga tgggttacaa atatccatga acataaaaga tattactata cctttgataa 1440
ttcattacta tttactgaga gcattcagaa cactacacaa atctttccac gctaaatcat 1500
aacgtccggt ttcttccgtg tcagcaccgg ggcgttggca taatgcaata cgtgtacgcg 1560
ctaaaccctg tgtgcatcgt tttaattatt cccggacact cccgcagaga agttccccgt 1620
cagggctgtg gacatagtta atccgggaat acaatgacga ttcatcgcac ctgacataca 1680
ttaataaata ttaacaatat gaaatttcaa ctcattgttt agggtttgtt taattttcta 1740
cacatacgat tctgcgaact tcaaaaagca tcgggaataa caccatgaaa aaaatgctac 1800
tcgctactgc gctggccctg cttattacag gatgtgctca acagacgttt actgttcaaa 1860
acaaaccggc agcagtagca ccaaaggaaa ccatcaccca tcatttcttc gtttctggaa 1920
ttgggcagaa gaaaactgtc gatgcagcca aaatttgtgg cggcgcagaa aatgttgtta 1980
aaacagaaac ccagcaaaca ttcgtaaatg gattgctcgg ttttattact ttaggcattt 2040
atactccgct ggaagcgcgt gtgtattgct cacaataatt gcatgagttg cccatcgata 2100
tgggcaactc tatctgcact gctcattaat atacttctgg gttccttcca gttgtttttg 2160
catagtgatc agcctctctc tgagggtgaa ataatcccgt tcagcggtgt ctgccagtcg 2220
gggggaggct gcattatcca cgccggaggc ggtggtggct tcacgcactg actgacagac 2280
tgctttgatg tgcaaccgac gacgaccagc ggcaacatca tcacgcagag catcattttc 2340
agctttagca tcagctaact ccttcgtgta ttttgcatcg agcgcagcaa catcacgctg 2400
acgcatctgc atgtcagtaa ttgccgcgtt cgccagcttc agttctctgg catttttgtc 2460
gcgctgggct ttgtaggtaa tggcgttatc acggtaatga ttaacagccc atgacaggca 2520
gacgatgatg cagataacca gagcggagat aatcgcggtg actctgctca tacatcaatc 2580
tctctgaccg ttccgcccgc ttctttgaat tttgcaatca ggctgtcagc cttatgctcg 2640
aactgaccat aaccagcgcc cggcagtgaa gcccagatat tgctgcaacg gtcgattgcc 2700
tgacggatat caccacgatc aatcataggt aaagcgccac gctccttaat ctgctgcaat 2760
gccacagcgt cctgactttt cggagagaag tctttcaggc caagctgctt gcggtaggca 2820
tcccaccaac gggaaagaag ctggtagcgt ccggcgcctg ttgatttgag ttttgggttt 2880
agcgtgacaa gtttgcgagg gtgatcggag taatcagtaa atagctctcc gcctacaatg 2940
acgtcataac catgatttct ggttttctga cgtccgttat cagttccctc cgaccacgcc 3000
agcatatcga ggaacgcctt acgttgatta ttgatttcta ccatcttcta ctccggcttt 3060
tttagcagcg aagcgtttga taagcgaacc aatcgagtca gtaccgatgt agccgataaa 3120
cacgctcgtt atataagcga gattgctact tagtccggcg aagtcgagaa ggtcacgaat 3180
gaactaggcg ataatggcgc acatcgttgc gtcgattact gtttttgtaa acgcaccgcc 3240
attatatctg ccgcgaaggt acgccattgc aaacgcaagg attgccccga tgccttgttc 3300
ctttgccgcg agaatggcgg ccaacaggtc atgtttttct ggcatcttca tgtcttaccc 3360
ccaataaggg gatttgctct atttaattag gaataaggtc gattactgat agaacaaatc 3420
caggctactg tgtttagtaa tcagatttgt tcgtgaccga tatgcacggg caaaacggca 3480
ggaggttgtt agcgcaaaaa aaaaattcca aaaaaaaaat tccaaaaaaa aaaagcgact 3540
aacaaacaca atctgatggc 3560
<210> 41
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 41
gcaatatcag caccaacaga aacaacctt 29
<210> 42
<211> 103
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例5中使用的序列。
<400> 42
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 60
tttttttttt ttttttggtt gtttctgttg gtgctgatat tgc 103
<210> 43
<211> 606
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例5中使用的序列。
<400> 43
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgacgc tcagtaatgt gacgatagct gaaaactgta cgataaacgg tacgctgagg 120
gcggaaaaaa tcgtcgggga cattgtaaag gcggcgagcg cggcttttcc gcgccagcgt 180
gaaagcagtg tggactggcc gtcaggtacc cgtactgtca ccgtgaccga tgaccatcct 240
tttgatcgcc agatagtggt gcttccgctg acgtttcgcg gaagtaagcg tactgtcagc 300
ggcaggacaa cgtattcgat gtgttatctg aaagtactga tgaacggtgc ggtgatttat 360
gatggcgcgg cgaacgaggc ggtacaggtg ttctcccgta ttgttgacat gccagcgggt 420
cggggaaacg tgatcctgac gttcacgctt acgtccacac ggcattcggc agatattccg 480
ccgtatacgt ttgccagcga tgtgcaggtt atggtgatta agaaacaggc gctgggcatc 540
agcgtggtct gagtgtgaaa aaaaaggtac caaaaaaaac atcgtcgtga gtagtgaacc 600
gtaagc 606
<210> 44
<211> 606
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例5中使用的序列。
<400> 44
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc acactcagac 60
cacgctgatg cccagcgcct gtttcttaat caccataacc tgcacatcgc tggcaaacgt 120
atacggcgga atatctgccg aatgccgtgt ggacgtaagc gtgaacgtca ggatcacgtt 180
tccccgaccc gctggcatgt caacaatacg ggagaacacc tgtaccgcct cgttcgccgc 240
gccatcataa atcaccgcac cgttcatcag tactttcaga taacacatcg aatacgttgt 300
cctgccgctg acagtacgct tacttccgcg aaacgtcagc ggaagcacca ctatctggcg 360
atcaaaagga tggtcatcgg tcacggtgac agtacgggta cctgacggcc agtccacact 420
gctttcacgc tggcgcggaa aagccgcgct cgccgccttt acaatgtccc cgacgatttt 480
ttccgccctc agcgtaccgt ttatcgtaca gttttcagct atcgtcacat tactgagcgt 540
caaaaaaaaa attccaaaaa aaaaattcca aaaaaaaaaa gcgactaaca aacacaatct 600
gatggc 606
<210> 45
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例5中使用的序列。
<400> 45
gcaatatcag caccaacaga aacaacct 28
<210> 46
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例5中使用的序列。
<400> 46
tttttttttt 10
<210> 47
<211> 3560
<212> DNA
<213> 人工序列
<220>
<223> 實(shí)施例2中使用的序列。
<400> 47
gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60
acccgtaaag tgataatgat tatcatctac atatcacaac gtgcgtggag gccatcaaac 120
cacgtcaaat aatcaattat gacgcaggta tcgtattaat tgatctgcat caacttaacg 180
taaaaacaac ttcagacaat acaaatcagc gacactgaat acggggcaac ctcatgtcaa 240
cgaagaacag aacccgcaga acaacaaccc gcaacatccg ctttcctaac caaatgattg 300
aacaaattaa catcgctctt gagcaaaaag ggtccgggaa tttctcagcc tgggtcattg 360
aagcctgccg tcggagacta acgtcagaaa agagagcata tacatcaatt aaaagtgatg 420
aagaatgaac atcccgcgtt cttccctccg aacaggacga tattgtaaat tcacttaatt 480
acgagggcat tgcagtaatt gagttgcagt tttaccactt tcctgacagt gacagactgc 540
gtgttggctc tgtcacagac taaatagttt gaatgattag cagttatggt gatcagtcaa 600
ccaccaggga ataatccttc atattattat cgtgcttcac caacgctgcc tcaattgctc 660
tgaatgcttc cagagacacc ttatgttcta tacatgcaat tacaacatca gggtaactca 720
tagaaatggt gctattaagc atatttttta cacgaatcag atccacggag ggatcatcag 780
cagattgttc tttattcatt ttgtcgctcc atgcgcttgc tcttcatcta gcggttaaaa 840
tattacttca aatctttctg tatgaagatt tgagcacgtt ggccttacat acatctgtcg 900
gttgtatttc cctccagaat gccagcagga ccgcactttg ttacgcaacc aatactatta 960
agtgaaaaca ttcctaatat ttgacataaa tcatcaacaa aacacaagga ggtcagacca 1020
gattgaaacg ataaaaacga taatgcaaac tacgcgccct cgtatcacat ggaaggtttt 1080
accaatggct caggttgcca tttttaaaga aatattcgat caagtgcgaa aagatttaga 1140
ctgtgaattg ttttattctg aactaaaacg tcacaacgtc tcacattata tttactatct 1200
agccacagat aatattcaca tcgtgttaga aaacgataac accgtgttaa taaaaggact 1260
taaaaaggtt gtaaatgtta aattctcaag aaacacgcat cttatagaaa cgtcctatga 1320
taggttgaaa tcaagagaaa tcacatttca gcaatacagg gaaaatcttg ctaaagcagg 1380
agttttccga tgggttacaa atatccatga acataaaaga tattactata cctttgataa 1440
ttcattacta tttactgaga gcattcagaa cactacacaa atctttccac gctaaatcat 1500
aacgtccggt ttcttccgtg tcagcaccgg ggcgttggca taatgcaata cgtgtacgcg 1560
ctaaaccctg tgtgcatcgt tttaattatt cccggacact cccgcagaga agttccccgt 1620
cagggctgtg gacatagtta atccgggaat acaatgacga ttcatcgcac ctgacataca 1680
ttaataaata ttaacaatat gaaatttcaa ctcattgttt agggtttgtt taattttcta 1740
cacatacgat tctgcgaact tcaaaaagca tcgggaataa caccatgaaa aaaatgctac 1800
tcgctactgc gctggccctg cttattacag gatgtgctca acagacgttt actgttcaaa 1860
acaaaccggc agcagtagca ccaaaggaaa ccatcaccca tcatttcttc gtttctggaa 1920
ttgggcagaa gaaaactgtc gatgcagcca aaatttgtgg cggcgcagaa aatgttgtta 1980
aaacagaaac ccagcaaaca ttcgtaaatg gattgctcgg ttttattact ttaggcattt 2040
atactccgct ggaagcgcgt gtgtattgct cacaataatt gcatgagttg cccatcgata 2100
tgggcaactc tatctgcact gctcattaat atacttctgg gttccttcca gttgtttttg 2160
catagtgatc agcctctctc tgagggtgaa ataatcccgt tcagcggtgt ctgccagtcg 2220
gggggaggct gcattatcca cgccggaggc ggtggtggct tcacgcactg actgacagac 2280
tgctttgatg tgcaaccgac gacgaccagc ggcaacatca tcacgcagag catcattttc 2340
agctttagca tcagctaact ccttcgtgta ttttgcatcg agcgcagcaa catcacgctg 2400
acgcatctgc atgtcagtaa ttgccgcgtt cgccagcttc agttctctgg catttttgtc 2460
gcgctgggct ttgtaggtaa tggcgttatc acggtaatga ttaacagccc atgacaggca 2520
gacgatgatg cagataacca gagcggagat aatcgcggtg actctgctca tacatcaatc 2580
tctctgaccg ttccgcccgc ttctttgaat tttgcaatca ggctgtcagc cttatgctcg 2640
aactgaccat aaccagcgcc cggcagtgaa gcccagatat tgctgcaacg gtcgattgcc 2700
tgacggatat caccacgatc aatcataggt aaagcgccac gctccttaat ctgctgcaat 2760
gccacagcgt cctgactttt cggagagaag tctttcaggc caagctgctt gcggtaggca 2820
tcccaccaac gggaaagaag ctggtagcgt ccggcgcctg ttgatttgag ttttgggttt 2880
agcgtgacaa gtttgcgagg gtgatcggag taatcagtaa atagctctcc gcctacaatg 2940
acgtcataac catgatttct ggttttctga cgtccgttat cagttccctc cgaccacgcc 3000
agcatatcga ggaacgcctt acgttgatta ttgatttcta ccatcttcta ctccggcttt 3060
tttagcagcg aagcgtttga taagcgaacc aatcgagtca gtaccgatgt agccgataaa 3120
cacgctcgtt atataagcga gattgctact tagtccggcg aagtcgagaa ggtcacgaat 3180
gaactaggcg ataatggcgc acatcgttgc gtcgattact gtttttgtaa acgcaccgcc 3240
attatatctg ccgcgaaggt acgccattgc aaacgcaagg attgccccga tgccttgttc 3300
ctttgccgcg agaatggcgg ccaacaggtc atgtttttct ggcatcttca tgtcttaccc 3360
ccaataaggg gatttgctct atttaattag gaataaggtc gattactgat agaacaaatc 3420
caggctactg tgtttagtaa tcagatttgt tcgtgaccga tatgcacggg caaaacggca 3480
ggaggttgtt agcgcaaaaa aaaaattcca aaaaaaaaat tccaaaaaaa aaaagcgact 3540
aacaaacaca atctgatggc 3560