利用分子孔表征目標(biāo)分子的方法與流程

文檔序號(hào)：11141503閱讀：938來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>有機(jī)化合物處理,合成應(yīng)用技術(shù)

本發(fā)明涉及確定多個(gè)分析物的存在、不存在或確定多個(gè)分析物的一個(gè)或多個(gè)特征的新方法。本發(fā)明涉及將第一分析物與含有檢測器的膜偶聯(lián)，并使用檢測器研究第一分析物。本發(fā)明還涉及將第二分析物偶聯(lián)到膜上并研究第二分析物。在研究第二分析物之前，使第一分析物與膜解偶聯(lián)。本發(fā)明還涉及多核苷酸的測序。

背景技術(shù)：

目前需要涉及廣泛應(yīng)用范圍的快速且廉價(jià)的多核苷酸(例如DNA或RNA)測序和識(shí)別技術(shù)。現(xiàn)有技術(shù)緩慢且昂貴，主要是因?yàn)樗鼈円揽繑U(kuò)增技術(shù)來產(chǎn)生大量的多核苷酸，并且需要大量的專門的熒光化學(xué)物質(zhì)用于信號(hào)檢測。

跨膜孔(納米孔)具有作為用于聚合物和各種小分子的直接的電生物傳感器的巨大潛力。特別地，作為潛在DNA測序技術(shù)的納米孔已成為最近焦點(diǎn)。

當(dāng)跨越納米孔施加電位時(shí)，當(dāng)分析物(例如核苷酸)在桶狀體中短暫駐留一段時(shí)間后，電流發(fā)生變化。對核苷酸的納米孔檢測給出了已知標(biāo)記的電流變化和持續(xù)時(shí)間。在鏈測序方法中，使單個(gè)多核苷酸鏈穿過孔，得到對核苷酸的識(shí)別。鏈測序可以包括使用多核苷酸結(jié)合蛋白來控制多核苷酸穿過孔的移動(dòng)。

之前已經(jīng)證明，可以通過將分析物偶聯(lián)到其中存在相關(guān)檢測器的膜來實(shí)現(xiàn)超低濃度分析物傳送。這進(jìn)行檢測所需的分析物的量降低了幾個(gè)數(shù)量級(jí)(WO 2012/164270)。

技術(shù)實(shí)現(xiàn)要素：

發(fā)明人驚奇地證明，可以通過將分析物順序偶聯(lián)到其中存在檢測器的膜，研究多個(gè)樣品中的多個(gè)分析物。在研究第二分析物之前，使第一分析物與膜解偶聯(lián)。

因此，本發(fā)明提供了用于確定在兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征的方法，包括：

(a)使用一個(gè)或多個(gè)錨將第一樣品中的第一分析物偶聯(lián)至膜；

(b)使所述第一分析物與存在于所述膜中的檢測器相互作用，并由此確定所述第一分析物的存在、不存在或一個(gè)或多個(gè)特征；

(c)使所述第一分析物與所述膜解偶聯(lián)；

(d)使用一個(gè)或多個(gè)錨將第二樣品中的第二分析物偶聯(lián)至所述膜；以及

(e)允許第二分析物與膜中的檢測器相互作用，并由此確定第二分析物的存在、不存在或一個(gè)或多個(gè)特征。

本發(fā)明還提供：

-使用膽固醇偶聯(lián)到膜上的分析物與膜解偶聯(lián)的方法，包括使分析物與環(huán)糊精或其衍生物接觸，并由此使分析物與膜解偶聯(lián)；以及

-用于確定在兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物存在、不存在或一個(gè)或多個(gè)特征的試劑盒，包含(a)膜，(b)兩個(gè)或更多個(gè)錨，其能夠?qū)⑺鰞蓚€(gè)或更多個(gè)分析物偶聯(lián)至膜，和(c)一個(gè)或多個(gè)能夠使所述兩個(gè)或更多個(gè)分析物中的至少一個(gè)與所述膜解偶聯(lián)的試劑。

附圖說明

圖1在(1)部分中顯示了用于制備實(shí)施例2-4中使用的DNA的DNA模板(SEQ ID NO：31，標(biāo)記為A1，SEQ ID NO：47標(biāo)記為A2)。(2)部分顯示了構(gòu)建體X(在實(shí)施例2材料和方法中完整描述)的卡通圖示——iSpC3間隔區(qū)顯示為十字，四個(gè)5-硝基吲哚顯示為灰色框，膽固醇系鏈顯示為灰色橢圓形；標(biāo)記b＝SEQ ID NO：34，標(biāo)記c＝SEQ ID NO：35，標(biāo)記d＝SEQ ID NO：39，標(biāo)記e＝SEQ ID NO：41。(3)部分顯示了構(gòu)建體Y(在實(shí)施例2材料和方法中完整描述)的卡通圖示——iSpC3間隔區(qū)顯示為十字，四個(gè)5-硝基吲哚顯示為灰色框，膽固醇系鏈顯示為灰色橢圓形；標(biāo)簽b＝SEQ ID NO：34，標(biāo)簽f＝SEQ ID NO：37，標(biāo)簽g＝SEQ ID NO：40，標(biāo)簽h＝SEQ ID NO：30。

圖2顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記＝時(shí)間(s)，y軸標(biāo)記＝百分比(％))。如標(biāo)記為X的箭頭所示，在2400秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為Y的箭頭所示，在7200秒時(shí)加入DNA構(gòu)建體Y。

圖3顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記＝時(shí)間(s)，y軸標(biāo)記＝百分比(％))。如標(biāo)記為X的箭頭所示，在2700秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭所示，在7500秒時(shí)進(jìn)行緩沖液沖洗(10mL)。

圖4顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間的分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記＝時(shí)間(s)，y軸標(biāo)記＝百分比(％))。如標(biāo)記為X的箭頭所示，在2700秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭所示，在6900秒時(shí)進(jìn)行1分鐘甲基-β-環(huán)糊精孵育然后沖洗(100μM，150μL)。

圖5顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記＝時(shí)間(s)，y軸標(biāo)記＝百分比(％))。如標(biāo)記為X的箭頭所示，在2400秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭和白色框所示，在6600至6900秒之間進(jìn)行10分鐘甲基-β-環(huán)糊精孵育然后沖洗(100μM，150μL)。

圖6顯示了納米孔以其未阻斷狀態(tài)存在(顯示為淺灰色)時(shí)相比于當(dāng)發(fā)生解旋酶DNA移動(dòng)并且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的部分實(shí)驗(yàn)時(shí)間進(jìn)程(x軸標(biāo)記＝時(shí)間(s)，y軸標(biāo)記＝百分比(％))。如標(biāo)記為X的箭頭所示，在2400秒時(shí)加入DNA構(gòu)建體X。如標(biāo)記為F的箭頭和白色框所示，在6300至8100秒之間進(jìn)行30分鐘甲基-β-環(huán)糊精孵育然后沖洗(100μM，150μL)。

圖7顯示了實(shí)施例5中使用的DNA構(gòu)建體如何系在膜上(標(biāo)記為i)。移位穿過納米孔的DNA鏈標(biāo)記為a(SEQ ID NO：42，其3′端連接到四個(gè)iSpC3間隔區(qū)(標(biāo)記為十字)，所述間隔區(qū)在另一端連接到SEQ ID NO：43的5′端)。它與標(biāo)記為b和c的兩條鏈(分別為SEQ ID NO：44和45)雜交。SEQ ID NO：45在其3′端連接到6個(gè)iSp18間隔區(qū)(標(biāo)記為d并顯示為虛線)，所述間隔區(qū)在其另一端連接到兩個(gè)胸腺嘧啶和生物素基團(tuán)(標(biāo)記為f)。生物素基團(tuán)與鏈霉親和素(標(biāo)記為e)結(jié)合，所述鏈霉親和素還結(jié)合到脫硫生物素(標(biāo)記為g)。脫硫生物素連接到SEQ ID NO：46的5′端，SEQ ID NO：46的另一端具有3′膽固醇TEG(標(biāo)記為h)。

圖8顯示了實(shí)施例5中描述的實(shí)驗(yàn)的電流軌跡(y軸標(biāo)記＝電流(pA)，x軸標(biāo)記＝時(shí)間(s))。所述軌跡顯示了偶聯(lián)步驟和使用游離的生物素去除偶聯(lián)的DNA。*1標(biāo)記對應(yīng)于脫硫生物素劑(desthiobiotin extender)的添加，*2對應(yīng)于DNA構(gòu)建體P的添加，*3對應(yīng)于游離生物素的添加，*4對應(yīng)于緩沖沖洗液(buffer flush)的添加。

圖9顯示了圖8中所示電流軌跡的三個(gè)放大區(qū)域(所有三個(gè)軌跡都具有以下軸標(biāo)記-y軸標(biāo)記＝電流(pA)，x軸標(biāo)記＝時(shí)間(s))。軌跡A，B和C是圖8中所示軌跡的一部分的連續(xù)快照圖。*1標(biāo)記對應(yīng)于脫硫生物素劑的添加，*2對應(yīng)于DNA構(gòu)建體P的添加，*3對應(yīng)于游離生物素的添加，*4對應(yīng)于緩沖沖洗液的添加。

序列表說明

SEQ ID NO：1顯示了編碼MS-B1突變MspA單體的密碼子優(yōu)化的多核苷酸序列。該突變體缺少信號(hào)序列并包括以下突變：D90N，D91N，D93N，D118R，D134R和E139K。

SEQ ID NO：2顯示MspA單體的MS-Bi突變體的成熟形式的氨基酸序列。該突變體缺少信號(hào)序列并包括以下突變：D90N，D91N，D93N，D118R，D134R和E139K。

SEQ ID NO：3顯示編碼α-溶血素-E111N/K147N(α-HL-NN；Stoddart等人，PNAS，2009；106(19)：7702-7707)的一個(gè)單體的多核昔酸序列。

SEQ ID NO：4顯示α-HL-NN的一個(gè)單體的氨基酸序列。

SEQ ID NO：5至7示出了MspB、C和D的氨基酸序列。

SEQ ID NO：8示出了編碼Phi29DNA聚合酶的多核苷酸序列。

SEQ ID NO：9示出了Phi29DNA聚合酶的氨基酸序列。

SEQ ID NO：10示出了來自大腸桿菌的sbcB基因的密碼子優(yōu)化的多核昔酸序列。它編碼來自大腸桿菌的核酸外切酶I(EcoExo I)。

SEQ ID NO：11示出了來自大腸桿菌的核酸外切酶I(EcoExo I)的氨基酸序列。

SEQ ID NO：12示出了來自大腸桿菌的xthA基因的密碼子優(yōu)化的多核苷酸序列。它編碼來自大腸桿菌的核酸外切酶III。

SEQ ID NO：13示出了來自大腸桿菌的核酸外切酶III的氨基酸序列。該酶從雙鏈DNA(dsDNA)的一條鏈以3′-5′方向進(jìn)行5′單磷酸核苷的分布消化。鏈上的酶的引發(fā)需要約4個(gè)核苷酸的5′突出(overhang)。

SEQ ID NO：14示出了來自嗜熱棲熱菌(T.thermophilus)的recJ基因的密碼子優(yōu)化的多核苷酸序列。它編碼來自嗜熱棲熱菌的RecJ酶(TthReeJ-cd)。

SEQ ID NO：15示出了來自嗜熱棲熱菌的RecJ酶的氨基酸序列(TthReeJ-cd)。該酶從ssDNA以5′-3′方向進(jìn)行5′單磷酸核苷的進(jìn)行性(processive)消化。鏈上的酶引發(fā)需要至少4個(gè)核苷酸。

SEQ ID NO：16示出了衍生自噬菌體λexo(redX)基因的密碼子優(yōu)化的多核苷酸序列。它編碼噬菌體λ核酸外切酶。

SEQ ID NO：17示出了噬菌體λ核酸外切酶的氨基酸序列。該序列是組裝成三聚體的三個(gè)相同亞基之一。該酶從dsDNA的一條鏈以5′-3′方向進(jìn)行核苷酸的高度進(jìn)行性消化(http：//www.neb.com/nebecomm/products/productM0262.asp)。鏈上的酶引發(fā)優(yōu)先需要約4個(gè)具有5′磷酸的核苷酸的5′突出。

SEQ ID NO：18示出了Hel308Mbu的氨基酸序列。

SEQ ID NO：19示出了Hel308Csy的氨基酸序列。

SEQ ID NO：20示出了Hel308Tga的的氨基酸序列。

SEQ ID NO：21示出了Hel308Mhu的氨基酸序列。

SEQ ID NO：22示出了TraI Eco的氨基酸序列。

SEQ ID NO：23示出了XPD Mbu的氨基酸序列。

SEQ ID NO：24示出了Dda 1993的氨基酸序列。

SEQ ID NO：25示出了Trwc Cba的氨基酸序列。

SEQ ID NO：26顯示實(shí)施例1中使用的多核苷酸序列。

SEQ ID NO：27顯示實(shí)施例1中使用的多核苷酸序列。SEQ ID NO：27其3′端連接到四個(gè)iSp18間隔區(qū)，所述間隔區(qū)在其另一端連接到SEQ ID NO：28的5′端。

SEQ ID NO：28顯示實(shí)施例1中使用的多核苷酸序列。SEQ ID NO：28其5′端連接到四個(gè)iSp18間隔區(qū)，所述間隔區(qū)在其另一端連接到SEQ ID NO：27的3′端。

SEQ ID NO：29顯示實(shí)施例1中使用的多核苷酸序列。

SEQ ID NO：30至41顯示了實(shí)施例2中使用的多核苷酸序列。

SEQ ID NO：42至46顯示了實(shí)施例5中使用的多核苷酸序列。

SEQ ID NO：47顯示實(shí)施例2中使用的多核苷酸序列。

具體實(shí)施方式

應(yīng)該理解的是，所公開的產(chǎn)品和方法的不同應(yīng)用可以適用于本領(lǐng)域中的特定需要。也應(yīng)理解的是，本文使用的術(shù)語僅用于描述本發(fā)明的具體實(shí)施方案，并且不意在限制。

此外，除非內(nèi)容另外明確指出，否則用于本說明書和所附權(quán)利要求書中的單數(shù)形式“一”，“一個(gè)”，和“所述”包括復(fù)數(shù)指代。因此，例如，涉及“分析物”時(shí)包括兩個(gè)或更多個(gè)分析物，涉及“多核苷酸”時(shí)包括兩個(gè)或更多個(gè)多核昔酸，涉及“錨”時(shí)包括兩個(gè)或更多個(gè)錨，涉及“解旋酶”時(shí)包括兩個(gè)或更多個(gè)解旋酶，涉及“跨膜孔”時(shí)包括兩個(gè)或更多個(gè)孔，等。

文本無論在上文還是下文中引用的所有出版物、專利和專利申請，以全文引用的方式納入本文。

本發(fā)明的方法

本發(fā)明提供了用于確定兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征的方法。該方法包括使用一個(gè)或多個(gè)錨將第一樣品中的第一分析物偶聯(lián)至膜，并允許所述分析物與膜中存在的檢測器相互作用。由此確定第一分析物的存在、不存在或一個(gè)或多個(gè)特征。該方法還包括使用一個(gè)或多個(gè)錨將第二樣品中的第二分析物偶聯(lián)至膜，并允許第二分析物與膜中存在的檢測器相互作用。由此確定第二分析物的存在、不存在或一個(gè)或多個(gè)特征。第一分析物可以在第二分析物偶聯(lián)到膜上之前，之后或同時(shí)從膜上解偶聯(lián)。

發(fā)明人驚奇地證明，通過將分析物偶聯(lián)到其中存在檢測器的膜可以實(shí)現(xiàn)將超低濃度的分析物傳遞到檢測器。這使進(jìn)行檢測所需的分析物的量降低了幾個(gè)數(shù)量級(jí)。不能預(yù)測所需分析物的量減少的程度。

特別地，本發(fā)明人令人驚訝地報(bào)道了單鏈多核苷酸的捕獲比先前報(bào)道的提高了4個(gè)數(shù)量級(jí)。當(dāng)檢測器和分析物現(xiàn)在在同一平面上時(shí)，每秒會(huì)發(fā)生～10³M s^-1以上的相互作用，因?yàn)檫@兩個(gè)分子在二維而不是三維上進(jìn)行擴(kuò)散。這對樣品制備要求具有顯著的影響，這些要求是診斷裝置如下一代測序系統(tǒng)的關(guān)鍵問題。

此外，將分析物偶聯(lián)至膜對于各種納米孔-酶測序應(yīng)用具有增加的優(yōu)點(diǎn)。在鏈測序中，當(dāng)在孔中引入多核苷酸分析物時(shí)，孔可以永久或暫時(shí)的阻斷，從而阻止多核苷酸的測序。當(dāng)多核苷酸分析物的一端遠(yuǎn)離孔定位時(shí)，例如通過偶聯(lián)或系鏈(tethering)到膜上而定位，令人驚訝地發(fā)現(xiàn)，不再觀察到這種暫時(shí)或永久的阻斷。通過將多核苷酸的一端偶聯(lián)到膜上而占據(jù)該端，還起到有效地增加檢測器上的分析物濃度的作用，并因此增加測序系統(tǒng)的工作循環(huán)。

該方法當(dāng)然有利于檢測以低濃度存在的多個(gè)分析物。當(dāng)兩個(gè)或更多個(gè)待測定分析物中的每個(gè)分析物以約0.001pM至約1nM，例如小于0.01pM，小于0.1pM，小于1pM，小于10pM或小于100pM的濃度存在時(shí)，該方法優(yōu)選允許確定所述兩個(gè)或更多個(gè)待測定分析物的存在或一個(gè)或多個(gè)特征。

本發(fā)明的方法對于多核苷酸測序是特別有利的，因?yàn)閮H可以從人血液獲得少量的純化多核苷酸。所述方法優(yōu)選允許估計(jì)以約0.001pM至約1nM，例如小于0.01pM，小于0.1pM，小于1pM，小于10pM或小于100pM的濃度存在的多核苷酸的序列或允許對該多核昔酸的測序。如下文更詳細(xì)討論的，所述兩個(gè)或更多個(gè)分析物可以是兩個(gè)或更多個(gè)相同分析物。這在多核昔酸測序中是有利的，因?yàn)槠湓试S多于一次地調(diào)查多核昔酸的序列。這導(dǎo)致提高的測序效率和準(zhǔn)確性。

將多核昔酸的一端偶聯(lián)至膜(甚至?xí)簳r(shí)地)也意味著將阻止該端干擾基于納米孔的測序過程。

本發(fā)明的方法還具有其它優(yōu)點(diǎn)。該方法提供了同時(shí)測定兩個(gè)或更多個(gè)分析物的替代方案，其消除了對從每個(gè)分析物獲得的測量信號(hào)進(jìn)行解偶聯(lián)的需要。該方法使得能夠順序測定兩個(gè)或更多個(gè)分析物，其中，例如，用于確定每個(gè)分析物所需的條件不同，因此使得同時(shí)測量是不切實(shí)際的。該方法還方便地使得能夠使用相同的膜測量兩個(gè)或更多個(gè)分析物，從而提供膜多次使用的可能性并延長膜的壽命。

分析物

本發(fā)明的方法涉及確定兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征?？梢匝芯咳魏螖?shù)量的分析物。例如，本發(fā)明的方法可以涉及確定3，4，5，6，7，8，9，10，20，30，50，100或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征。如果使用本發(fā)明的方法研究三個(gè)或更多個(gè)分析物，則第二分析物也與膜解偶聯(lián)，并針對第三分析物時(shí)增加所需數(shù)量的步驟。對于四個(gè)或更多個(gè)分析物時(shí)也是如此。

本發(fā)明的方法可包括確定或測定每個(gè)分析物的一個(gè)或多個(gè)特征。該方法可以涉及確定或測定每個(gè)分析物的兩個(gè)，三個(gè)，四個(gè)或五個(gè)或更多個(gè)特征。所述一個(gè)或多個(gè)特征優(yōu)選選自(i)分析物的大小，(ii)分析物的同一性，(iii)分析物的二級(jí)結(jié)構(gòu)，和(iv)分析物是否被修飾?？梢愿鶕?jù)本發(fā)明測量(i)至(iv)的任何組合，例如{i}，{ii}，{iii}，{iv}，{i，ii}，{i，iii}i，ii，iv}，{i，iii，iv}，{ii，iii}，{i，iii，iv}或{i，ii，iii，iv}。與第二分析物相比，對于第一分析物，可以測量(i)至(iv)的不同組合，包括上面列出的那些組合中的任一種。該方法優(yōu)選包括，估計(jì)第一多核苷酸和/或第二多核苷酸的序列或?qū)Φ谝欢嗪塑账岷?或第二多核苷酸進(jìn)行測序。

每個(gè)分析物可以是任何物質(zhì)。合適的分析物包括但不限于金屬離子，無機(jī)鹽，聚合物，例如聚合酸或堿，染料，漂白劑，藥物，診斷劑，興奮劑，爆炸物和環(huán)境污染物。

第一分析物和/或第二分析物可以是從細(xì)胞分泌的分析物?；蛘?，第一分析物和/或第二分析物可以是存在于細(xì)胞內(nèi)的分析物，使得在進(jìn)行本發(fā)明之前必須從細(xì)胞中提取該分析物。

第一分析物和/或第二分析物優(yōu)選是氨基酸、肽、多肽、蛋白質(zhì)或多核苷酸。氨基酸、肽，多肽或蛋白質(zhì)可以是天然存在的或非天然存在的。多肽或蛋白質(zhì)中可以包括合成或修飾的氨基酸。對于氨基酸的許多不同類型的修飾是本領(lǐng)域已知的。對于本發(fā)明，應(yīng)當(dāng)理解，第一分析物和/或第二分析物可以通過本領(lǐng)域可用的任何方法進(jìn)行修飾。

蛋白質(zhì)可以是酶、抗體、激素、生長因子或生長調(diào)節(jié)蛋白，例如細(xì)胞因子。細(xì)胞因子可以選自白介素，優(yōu)選IFN-1，IL-2，IL-4，IL-5，IL-6，IL-10，IL-12或IL-13，干擾素，優(yōu)選IL-γ或其它細(xì)胞因子如TNF-α。蛋白質(zhì)可以是細(xì)菌蛋白質(zhì)，真菌蛋白質(zhì)，病毒蛋白質(zhì)或寄生蟲衍生的蛋白質(zhì)。在其與檢測器接觸之前，蛋白質(zhì)可以解折疊以形成多肽鏈。

第一分析物和/或第二分析物最優(yōu)選是多核苷酸，例如核酸。以下更詳細(xì)地討論多核苷酸。多核昔酸可以在其5′端或3′端或沿著鏈的一個(gè)或多個(gè)中間點(diǎn)偶聯(lián)至膜。多核苷酸可以是如下所討論的單鏈或雙鏈。多核苷酸可以是環(huán)狀的。多核苷酸可以是適配體，與微小RNA(microRNA)雜交的探針或微小RNA自身(Wang，Y.等人，自然納米技術(shù)(Nature Nanotechnology)，2011，6，668-674)。這兩種多核苷酸分析物可以是結(jié)合兩個(gè)蛋白質(zhì)的多核苷酸，并且可以用于表征蛋白質(zhì)，例如用于確定它們的濃度。

當(dāng)分析物是與微小RNA雜交的探針時(shí)，探針可永久或暫時(shí)地偶聯(lián)到膜上。這將在下面更詳細(xì)地討論。探針本身可以被配置為直接偶聯(lián)至膜或可以與已經(jīng)被配置為偶聯(lián)至膜的互補(bǔ)多核苷酸雜交。分析物可以是雜交到探針的微小RNA的復(fù)合物，其中探針具有獨(dú)特的序列或條形碼，使其能夠被明確地鑒定。

當(dāng)?shù)谝环治鑫锖?或第二分析物是適配體時(shí)，適配體可永久或暫時(shí)偶聯(lián)至膜。適配體本身可以被配置為直接偶聯(lián)至膜或可以與已經(jīng)被配置為偶聯(lián)至膜的互補(bǔ)多核苷酸雜交。適配體可以結(jié)合或未結(jié)合到蛋白質(zhì)分析物，檢測適配體的最終目的可以是檢測其結(jié)合的蛋白質(zhì)分析物的存在、不存在或一個(gè)或多個(gè)特征。

第一分析物和第二分析物可以彼此不同。例如，第一分析物可以是蛋白質(zhì)，第二分析物可以是多核苷酸?；蛘撸谝缓偷诙治鑫锟梢允遣煌亩嗪塑账?。在這種情況下，可以不需要在添加第二樣品之前去除至少一部分第一樣品。這將在下面更詳細(xì)地討論。如果該方法涉及研究三個(gè)或更多個(gè)分析物，則它們可以全部彼此不同或者它們中的一些可以彼此不同。

第一分析物和第二分析物可以是相同分析物的兩個(gè)實(shí)例。第一分析物可以與第二分析物相同。這允許校驗(yàn)(proof reading)，特別是如果分析物是多核苷酸。如果該方法涉及研究三個(gè)或更多個(gè)分析物，則它們可以全部是相同分析物的三個(gè)或更多個(gè)實(shí)例，或者它們中的一些可以是相同分析物的單獨(dú)實(shí)例。

多核苷酸

第一和/或第二分析物優(yōu)選是多核苷酸。多核苷酸，例如核酸，是包含兩個(gè)或更多個(gè)核苷酸的大分子。多核苷酸或核酸可以包含任何核苷酸的任何組合。核苷酸可以是天然存在的或人工的。多核苷酸中的一個(gè)或多個(gè)核苷酸可以被氧化或甲基化。多核苷酸中的一個(gè)或多個(gè)核苷酸可能被損傷。例如，多核苷酸可以包含嘧啶二聚體。這樣的二聚體通常與紫外線導(dǎo)致的損傷相關(guān)，并且是皮膚黑素瘤的主要原因。多核苷酸中的一個(gè)或多個(gè)核苷酸可以被修飾，例如用標(biāo)記或標(biāo)簽修飾。合適的標(biāo)記如下所述。多核苷酸可以包含一個(gè)或多個(gè)間隔區(qū)。

核苷酸通常含有核堿基、糖和至少一個(gè)磷酸基團(tuán)。核堿基和糖形成核苷。

核堿基通常是雜環(huán)的。核堿基包括但不限于嘌呤和嘧啶，更具體地，腺嘌呤(A)，鳥嘌呤(G)，胸腺嘧啶(T)，尿嘧啶(U)和胞嘧啶(C)。

糖通常是戊糖。核苷酸糖包括但不限于核糖和脫氧核糖。糖優(yōu)選是脫氧核糖。

多核苷酸優(yōu)選包含以下核苷：脫氧腺苷(dA)，脫氧尿苷(dU)和/或胸苷(dT)，脫氧鳥苷(dG)和脫氧胞苷(dC)。

核苷酸通常是核糖核苷酸或脫氧核糖核苷酸。核苷酸通常含有單磷酸，二磷酸或三磷酸。核苷酸可以包含多于三個(gè)磷酸，例如4或5個(gè)磷酸。磷酸可以連接在核昔酸的5′或3′側(cè)。核昔酸包括但不限于腺苷單磷酸(AMP)，鳥苷單磷酸(GMP)，胸昔單磷酸(TMP)，尿苷單磷酸(UMP)，5-甲基胞苷單磷酸，5-羥甲基胞苷單磷酸，胞苷單磷酸(CMP)，環(huán)腺苷單磷酸(cAMP)，環(huán)鳥苷單磷酸(cGMP)，脫氧腺苷單磷酸(dAMP)，脫氧鳥昔單磷酸(dGMP)，脫氧胸昔單磷酸(dTMP)，脫氧尿苷單磷酸(dUMP)，脫氧胞苷單磷酸(dCMP)和脫氧甲基胞苷單磷酸。核苷酸優(yōu)選選自AMP，TMP，GMP，CMP，UMP，dAMP，dTMP，dGMP，dCMP和dUMP。

核苷酸可以是無堿基的(即缺乏核堿基)。核苷酸也可以缺少核堿基和糖(即，是C3間隔區(qū))。

多核苷酸中的核苷酸可以以任何方式彼此連接。核苷酸通常通過其糖和磷酸基團(tuán)連接，如在核酸中。核苷酸可以通過其核堿基連接，如在嘧啶二聚體中。

多核苷酸可以是單鏈或雙鏈的。至少多核苷酸的一部分優(yōu)選是雙鏈的。

多核苷酸可以是核酸，例如脫氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含與DNA的一條鏈雜交的一條RNA鏈。多核苷酸可以是本領(lǐng)域已知的任何合成核酸，例如肽核酸(PNA)，甘油核酸(GNA)，蘇糖核酸(TNA)，鎖核酸(LNA)，橋聯(lián)核酸(BNA)或其他具有核苷酸側(cè)鏈的合成聚合物。PNA骨架由通過肽鍵連接的N-(2-氨基乙基)-甘氨酸重復(fù)單元組成。GNA骨架由通過磷酸二酯鍵連接的重復(fù)的乙二醇單元組成。TNA骨架由通過磷酸二酯鍵連接在一起的重復(fù)蘇糖組成。LNA由如上所述的具有連接核糖部分中的2′氧和4′碳的額外橋的核糖核苷酸形成。

多核苷酸最優(yōu)選核糖核酸(RNA)或脫氧核糖核酸(DNA)。

多核苷酸可以是任何長度。例如，多核苷酸可以是至少10，至少50，至少100，至少150，至少200，至少250，至少300，至少400或至少500個(gè)核苷酸或核苷酸對長度。多核苷酸可以是1000個(gè)或更多個(gè)核苷酸或核苷酸對，5000個(gè)或更多個(gè)核苷酸或核苷酸對長度，或100000或更多個(gè)核苷酸或核苷酸對長度。

樣品

每個(gè)分析物通常存在于任何合適的樣品中。本發(fā)明通常針對已知含有或懷疑含有分析物的兩個(gè)或更多個(gè)樣品實(shí)施?；蛘撸景l(fā)明可以針對兩個(gè)或更多個(gè)樣品實(shí)施以確認(rèn)兩個(gè)或更多個(gè)已知或預(yù)期存在于樣品中的分析物。

第一樣品和/或第二樣品可以是生物樣品。本發(fā)明可以使用從任何有機(jī)體或微生物獲得或提取的至少一種樣品在體外進(jìn)行實(shí)施。有機(jī)體或微生物通常是古細(xì)菌、原核生物或真核生物，并且通常屬于以下五界之一：植物、動(dòng)物、真菌、原核生物和原生生物。本發(fā)明可以對至少一種獲自或提取自任何病毒的樣品在體外進(jìn)行實(shí)施。第一樣品和/或第二樣品優(yōu)選是流體樣品。第一樣品和/或第二樣品通常包括患者的體液。第一樣品和/或第二樣品可以是尿、淋巴液、唾液、粘液或羊水，但優(yōu)選是血液、血漿或血清。通常，第一樣品和/或第二樣品是來源于人的，但是替代地，其可以來自另一種哺乳動(dòng)物，例如來自商業(yè)養(yǎng)殖的動(dòng)物，如馬，牛，羊，魚，雞或豬，或者可以是寵物，例如貓或狗?；蛘?，第一樣品和/或第二樣品可以是來源于植物，例如獲自以下的樣品：商業(yè)作物如谷物，豆類，水果或蔬菜，例如小麥，大麥，燕麥，油菜，玉米，大豆，水稻，大黃，香蕉，蘋果，番茄，土豆，葡萄，煙草，豆類，小扁豆，甘蔗，可可，棉花。

第一樣品和/或第二樣品可以是非生物樣品。非生物樣品優(yōu)選是流體樣品。非生物樣品的實(shí)例包括外科手術(shù)流體，水如飲用水，海水或河水，以及用于實(shí)驗(yàn)室試驗(yàn)的試劑。

第一樣品和/或第二樣品通常在用于本發(fā)明之前進(jìn)行處理，例如通過離心或通過膜過濾掉不想要的分子或細(xì)胞(例如紅細(xì)胞)。第一樣品和/或第二樣品可以在獲取后立即測量。第一樣品和/或第二樣品也可以典型地在測定之前儲(chǔ)存，優(yōu)選在低于-70℃。

第一樣品和第二樣品可以彼此不同。例如，第一樣品可以來自人，第二樣品可以來自病毒。如果第一和第二樣品彼此不同，它們可以含有或被懷疑含有相同的第一和第二分析物。如果該方法涉及研究三個(gè)或更多個(gè)樣品，則它們可以全部彼此不同或者它們中的一些可以彼此不同。

第一樣品和第二樣品優(yōu)選是相同樣品的兩個(gè)實(shí)例。第一樣品優(yōu)選與第二樣品相同。這允許校驗(yàn)讀取，特別是如果分析物是多核苷酸。如果該方法涉及研究三個(gè)或更多個(gè)樣品，則它們可以全部是相同樣品的三個(gè)或更多個(gè)實(shí)例，或者它們中的一些可以是相同樣品的單獨(dú)實(shí)例。

膜

根據(jù)本發(fā)明可以使用任何膜。合適的膜是本領(lǐng)域公知的。膜優(yōu)選是兩親性層。兩親性層是由兩親性分子形成的層，例如磷脂，其具有親水性和親脂性。兩親分子可以是合成的或天然存在的。形成單層的非天然存在的兩親物(一個(gè)或多個(gè))是本領(lǐng)域已知的，包括例如嵌段共聚物(Gonzalez-Perez等人，Langmuir，2009，25，10447-10450)。嵌段共聚物是其中兩個(gè)或更多個(gè)單體亞單元聚合在一起產(chǎn)生單一聚合物鏈的聚合物材料。嵌段共聚物通常具有由每個(gè)單體亞單元貢獻(xiàn)的性質(zhì)。然而，嵌段共聚物可具有由各個(gè)亞單元形成的聚合物不具有的獨(dú)特性質(zhì)。可以改造嵌段共聚物，使得單體亞單元之一是疏水的(即親脂的)，而其它亞單元在水性介質(zhì)中是親水的。在這種情況下，嵌段共聚物可以具有兩親性質(zhì)并且可以形成能模擬生物膜的結(jié)構(gòu)。嵌段共聚物可以是二嵌段(由兩個(gè)單體亞單元組成)，但也可以由多于兩個(gè)單體亞單元構(gòu)成，以形成表現(xiàn)為兩親物的更復(fù)雜的構(gòu)型。共聚物可以是三嵌段，四嵌段或五嵌段共聚物。膜優(yōu)選是三嵌段共聚物膜。

古細(xì)菌雙極性性四醚脂質(zhì)(bipolar tetraether lipids)是天然存在的脂質(zhì)，其被構(gòu)建為使得該脂質(zhì)形成單層膜。這些脂質(zhì)通常存在于在惡劣的生物環(huán)境存活的極端微生物，嗜熱菌，嗜鹽菌和嗜酸菌中。它們的穩(wěn)定性被認(rèn)為源于最終雙層的融合性質(zhì)。通過產(chǎn)生具有親水-疏水-親水的通用基序的三嵌段聚合物，可以直接構(gòu)建模擬這些生物實(shí)體的嵌段共聚物材料。這種材料可以形成單體膜，其類似于脂質(zhì)雙層而發(fā)揮作用，并且包括從囊泡到層狀膜的一系列相行為。由這些三嵌段共聚物形成的膜與生物脂質(zhì)膜相比具有一些優(yōu)點(diǎn)。因?yàn)樗鋈抖喂簿畚锸呛铣傻?，可仔?xì)控制精確的構(gòu)造以提供形成膜和與孔及其它蛋白質(zhì)相互作用所需的正確的鏈長度和性質(zhì)。

嵌段共聚物也可以由不歸類為脂質(zhì)亞材料的亞單元構(gòu)造而成；例如疏水性聚合物可以由硅氧烷或其它非烴基單體制成。嵌段共聚物的親水性子部也可以具有低的蛋白質(zhì)結(jié)合性質(zhì)，這允許產(chǎn)生當(dāng)暴露于未加工的生物樣品時(shí)高度耐受的膜。該頭部基團(tuán)單元還可以衍生自非經(jīng)典脂質(zhì)頭部基團(tuán)。

與生物脂質(zhì)膜相比，三嵌段共聚物膜還具有增加的機(jī)械和環(huán)境穩(wěn)定性，例如高得多的操作溫度或pH范圍。嵌段共聚物的合成性質(zhì)為廣泛的應(yīng)用提供了定制基于聚合物的膜的平臺(tái)。

在優(yōu)選的實(shí)施方案中，本發(fā)明提供了用于確定兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或更多個(gè)特征的方法，包括(a)使用一個(gè)或多個(gè)錨將第一樣品中的第一分析物偶聯(lián)至膜，所述錨包括三嵌段共聚物，任選地其中所述膜被修飾以促進(jìn)偶聯(lián)；(b)使所述第一分析物與存在于所述膜中的檢測器相互作用，由此確定所述第一分析物的存在、不存在或一個(gè)或多個(gè)特征；(c)使所述第一分析物與所述膜解偶聯(lián)；(d)使用一個(gè)或多個(gè)錨將第二樣品中的第二分析物偶聯(lián)至所述膜；和(e)允許第二分析物與膜中的檢測器相互作用，由此確定第二分析物的存在、不存在或一個(gè)或多個(gè)特征。

該膜最優(yōu)選是國際申請?zhí)朠CT/GB2013/052766或PCT/GB2013/052767中公開的膜之一。

兩親性分子可被化學(xué)修飾或官能化以促進(jìn)分析物的偶聯(lián)。

兩親性層可以是單層或雙層。兩親性層通常是平面的。兩親性層可以是彎曲的。兩親性層可以被支撐。

兩親性膜通常是天然可移動(dòng)的，基本上用作具有約10^-8cm s-1的脂質(zhì)擴(kuò)散速率的二維流體。這意味著檢測器和偶聯(lián)的分析物通?？梢栽趦捎H性膜內(nèi)移動(dòng)。

膜可以是脂質(zhì)雙層。脂質(zhì)雙層是細(xì)胞膜的模型，并且作為一系列實(shí)驗(yàn)研究的優(yōu)良平臺(tái)。例如，脂質(zhì)雙層可以用于通過單通道記錄進(jìn)行的膜蛋白的體外研究?；蛘撸|(zhì)雙層可用作生物傳感器以檢測多種物質(zhì)的存在。脂質(zhì)雙層可以是任何脂質(zhì)雙層。合適的脂質(zhì)雙層包括但不限于平面脂質(zhì)雙層、受支撐雙層，或脂質(zhì)體。脂質(zhì)雙層優(yōu)選為平面脂質(zhì)雙層。合適的脂質(zhì)雙層在國際申請?zhí)朠CT/GB08/000563(公開為WO 2008/102121)，國際申請?zhí)朠CT/GB08/004127(公開為WO 2009/077734)和國際申請?zhí)朠CT/GB2006/001057(公開為WO 2006/100484)中公開。

形成脂質(zhì)雙層的方法是本領(lǐng)域已知的。合適的方法公開在實(shí)施例中。脂質(zhì)雙層通常通過Montal和Mueller(Proc.Natl.Acad.Sci.USA.，1972；69：3561-3566)的方法形成，其中脂質(zhì)單層被攜帶在水溶液/空氣界面上，穿過垂直于該界面的孔的任一側(cè)。通常通過下述將脂質(zhì)添加到電解質(zhì)水溶液的表面：首先將脂質(zhì)溶解在有機(jī)溶劑中，然后允許溶劑滴在孔的任一側(cè)上的水溶液的表面上蒸發(fā)。一旦有機(jī)溶劑蒸發(fā)，孔的任一側(cè)上的溶液/空氣界面物理地上下移動(dòng)，穿過所述孔直到形成雙層。平面脂質(zhì)雙層可以形成為，穿過膜中的孔或穿過開口而進(jìn)入凹部。

Montal&Mueller的方法是受歡迎的，因?yàn)樗切纬蛇m合于蛋白質(zhì)孔插入的優(yōu)質(zhì)脂質(zhì)雙層的成本劃算和相對直接的方法。形成雙層的其他常見方法包括尖端浸漬、涂覆雙層，和膜片鉗夾脂質(zhì)體雙層(patch-clamping of liposome bilayers)。

尖端浸漬雙層的形成需要使孔表面(例如，移液管尖端)接觸到攜帶單層脂質(zhì)的測試溶液的表面上。另外，首先通過允許溶解在有機(jī)溶劑中的脂質(zhì)滴在溶液表面蒸發(fā)而在溶液/空氣界面處產(chǎn)生脂質(zhì)單層。然后通過Langmuir-Schaefer方法形成雙層，并且需要機(jī)械自動(dòng)化設(shè)備以相對于溶液表面移動(dòng)孔。

對于涂覆的雙層，將溶解在有機(jī)溶劑中的脂質(zhì)滴直接施加到孔中，將其浸沒在水性測試溶液中。使用油漆刷或等效物將脂質(zhì)溶液稀薄地鋪在孔上。溶劑的稀釋導(dǎo)致脂質(zhì)雙層的形成。然而，從雙層中完全去除溶劑是困難的，因此由該方法形成的雙層在電化學(xué)測量期間不太穩(wěn)定且更容易產(chǎn)生噪聲。

膜片鉗夾通常用于生物細(xì)胞膜的研究。通過抽吸將細(xì)胞膜夾到移液管的末端，并且膜的貼片附著在孔上。該方法已經(jīng)被調(diào)整為通過夾持脂質(zhì)體產(chǎn)生脂質(zhì)雙層，然后脂質(zhì)體破裂以在移液管的孔口上留下脂質(zhì)雙層密封。該方法需要穩(wěn)定的巨大且單層的脂質(zhì)體以及在具有玻璃表面的材料中制造小孔。

脂質(zhì)體可以通過超聲，擠出或Mozafari方法(Colas等人(2007)Micron 38：841-847)形成。

在優(yōu)選的實(shí)施方案中，脂質(zhì)雙層如國際申請?zhí)朠CT/GB08/004127(公開為WO 2009/077734)中所述形成。有利地，在該方法中，脂質(zhì)雙層由干燥的脂質(zhì)形成。在最優(yōu)選的實(shí)施方案中，脂質(zhì)雙層穿越開口形成，如WO2009/077734(PCT/GB08/004127)中所述。

脂質(zhì)雙層由兩個(gè)相對的脂質(zhì)層形成。兩層脂質(zhì)排列成使得它們的疏水尾部基團(tuán)彼此面對以形成疏水內(nèi)部。脂質(zhì)的親水性頭部基團(tuán)在雙層的每一側(cè)上面向外朝向水性環(huán)境。雙層可存在于許多脂質(zhì)相中，包括但不限于液體無序相(流體層狀相)，液體有序相，固體有序相(層狀凝膠相，交叉凝膠相(interdigitated gel phase))和平面雙層晶體(層狀亞凝膠相，層狀結(jié)晶相)。

可以使用形成脂質(zhì)雙層的任何脂質(zhì)組合物。選擇脂質(zhì)組合物，使得形成具有所需性質(zhì)(例如表面電荷)、支持膜蛋白的能力、堆積密度或機(jī)械性質(zhì)的脂質(zhì)雙層。脂質(zhì)組合物可以包含一個(gè)或多個(gè)不同的脂質(zhì)。例如，脂質(zhì)組合物可以含有多達(dá)100種脂質(zhì)。脂質(zhì)組合物優(yōu)選含有1至10種脂質(zhì)。脂質(zhì)組合物可以包含天然存在的脂質(zhì)和/或人工脂質(zhì)。

脂質(zhì)通常包含頭部基團(tuán)、界面部分和兩個(gè)可以相同或不同的疏水尾部基團(tuán)。合適的頭部基團(tuán)包括但不限于中性頭部基團(tuán)，例如二?；视王?DG)和神經(jīng)酰胺(CM)；兩性離子頭部基團(tuán)，例如磷脂酰膽堿(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM)；帶負(fù)電荷的頭部基團(tuán)，例如磷脂酰甘油(PG)；磷脂酰絲氨酸(PS)，磷脂酰肌醇(PI)，磷酸(PA)和心磷脂(CA)；以及帶正電荷的頭部基團(tuán)，例如三甲基銨-丙烷(TAP)。合適的界面部分包括但不限于天然存在的界面部分，例如基于甘油或基于神經(jīng)酰胺的部分。合適的疏水性尾部基團(tuán)包括但不限于飽和烴鏈，例如月桂酸(正十二烷酸)，肉豆蔻酸(正十四烷酸)，棕櫚酸(正十六烷酸)，硬脂酸(正十八烷酸)和花生酸(正二十烷酸)；不飽和烴鏈，例如油酸(順-9-十八烷酸)；和支鏈烴鏈，例如植烷?；?。鏈的長度和不飽和烴鏈中雙鍵的位置和數(shù)目可以變化。鏈的長度和支鏈烴鏈中支鏈(例如甲基)的位置和數(shù)目可以變化。疏水性尾部基團(tuán)可以作為醚或酯連接到界面部分。脂質(zhì)可以是分枝菌酸。

脂質(zhì)也可以是化學(xué)修飾的。脂質(zhì)的頭部基團(tuán)或尾部基團(tuán)可以是化學(xué)修飾的。頭部基團(tuán)已被化學(xué)修飾的合適的脂質(zhì)包括但不限于PEG修飾的脂質(zhì)，例如1，2-二酰基-sn-甘油基-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000]；官能化的PEG脂質(zhì)，例如1，2-二硬脂?；?sn-甘油基-3-磷酸乙醇胺-N-[生物素基(聚乙二醇)2000]；和修飾為用于軛合的脂質(zhì)，例如1，2-二油?；?sn-甘油基-3-磷酸乙醇胺-N-(琥珀?；?和1，2-二棕櫚酰基-sn-甘油基-3-磷酸乙醇胺-N-(生物素基)。尾部基團(tuán)已經(jīng)化學(xué)修飾的合適的脂質(zhì)包括但不限于可聚合脂質(zhì)，例如1，2-雙(10，12-二十三碳二炔?；?-sn-甘油基-3-磷酸膽堿；氟化脂質(zhì)，例如1-棕櫚?；?2-(16-氟棕櫚?；?-sn-甘油基-3-磷酸膽堿；氘代脂質(zhì)，例如1，2-二棕櫚?；?D62-sn-甘油-3-磷酸膽堿；和醚連接的脂質(zhì)，例如1，2-二-O-植烷基-sn-甘油基-3-磷酸膽堿。脂質(zhì)可以被化學(xué)修飾或官能化以促進(jìn)分析物的偶聯(lián)。

兩親性層，例如脂質(zhì)組合物，通常包含一個(gè)或多個(gè)將影響該層的性質(zhì)的添加劑。合適的添加劑包括但不限于脂肪酸，例如棕櫚酸，肉豆蔻酸和油酸；脂肪醇，例如棕櫚醇，肉豆蔻醇和油醇；甾醇，例如膽固醇，麥角固醇，羊毛甾醇，谷甾醇和豆甾醇；溶血磷脂，例如1-酰基-2-羥基-sn-甘油基-3-磷酸膽堿；和神經(jīng)酰胺。

在另一個(gè)優(yōu)選的實(shí)施方案中，膜是固態(tài)層。固態(tài)層可以由有機(jī)和無機(jī)材料形成，包括但不限于微電子材料，絕緣材料例如Si₃N₄，Al₂O₃和SiO，有機(jī)和無機(jī)聚合物例如聚酰胺，塑料例如或者彈性體例如雙組分加成固化硅橡膠，以及玻璃。固態(tài)層可以由石墨烯形成。合適的石墨烯層公開在國際申請?zhí)朠CT/US2008/010637(公開為WO 2009/035647)中。

該方法通常使用(i)包含孔的人工兩親性層，(ii)包含孔的分離的天然存在的脂質(zhì)雙層，或(iii)其中插入有孔的細(xì)胞進(jìn)行實(shí)施。該方法通常使用人工兩親性層如人工三嵌段共聚物層進(jìn)行實(shí)施。該層除了孔之外還可以包含其它跨膜蛋白和/或膜內(nèi)蛋白以及其他分子。下面討論合適的裝置和條件。本發(fā)明的方法通常在體外進(jìn)行。

偶聯(lián)

每個(gè)分析物可以使用任何已知的方法偶聯(lián)到膜上。使用一個(gè)或多個(gè)錨將每個(gè)分析物偶聯(lián)至膜。

偶聯(lián)意味著使用一個(gè)或多個(gè)錨將分析物有意地與膜連接。該方法優(yōu)選包括使用一個(gè)或多個(gè)錨將第一分析物特異性偶聯(lián)到膜上。該方法優(yōu)選包括使用一個(gè)或多個(gè)錨將第二分析物特異性偶聯(lián)到膜上。第一分析物和/或第二分析物優(yōu)選不通過非特異性相互作用與膜偶聯(lián)。

每個(gè)錨包含偶聯(lián)(或結(jié)合)至適配體的基團(tuán)和偶聯(lián)(或結(jié)合)至膜的基團(tuán)。每個(gè)錨可以共價(jià)地偶聯(lián)(或結(jié)合)到適配體和/或膜。

每個(gè)分析物可以使用任何數(shù)量的錨，例如2，3，4個(gè)或更多個(gè)錨偶聯(lián)到膜。例如，一個(gè)分析物可以使用兩個(gè)錨偶聯(lián)到膜，其中每個(gè)錨單獨(dú)偶聯(lián)(或結(jié)合)到分析物和膜。

所述一個(gè)或多個(gè)錨可以包含一個(gè)或多個(gè)多核苷酸結(jié)合蛋白。每個(gè)錨可以包含一個(gè)或多個(gè)多核苷酸結(jié)合蛋白。多核苷酸結(jié)合蛋白可以是下面討論的任何一種。

在一些實(shí)施方案中，使用在第一分析物解偶聯(lián)后留在膜中的一個(gè)或多個(gè)錨將第二分析物偶聯(lián)到膜?；蛘?，使用其它(或分開的)一個(gè)或多個(gè)錨將第二分析物偶聯(lián)至膜。用于偶聯(lián)第二分析物的一個(gè)或多個(gè)錨可以與用于偶聯(lián)第一分析物的錨是相同類型，或者可以是不同類型的錨。這將在下面更詳細(xì)地討論。

如果膜是兩親性層，例如三嵌段共聚物膜，則一個(gè)或多個(gè)錨優(yōu)選包含存在于膜中的多肽錨和/或存在于膜中的疏水錨。疏水錨優(yōu)選是脂質(zhì)，脂肪酸，固醇，碳納米管，多肽，蛋白質(zhì)或氨基酸，例如膽固醇，棕櫚酸酯或生育酚。在優(yōu)選實(shí)施例中，所述一個(gè)或多個(gè)錨不是檢測器。

膜的組分，例如兩親性分子，共聚物或脂質(zhì)，可以被化學(xué)修飾或官能化以形成一個(gè)或多個(gè)錨。以下更詳細(xì)地討論合適的化學(xué)修飾和官能化膜的組分的合適方式的實(shí)例。任何比例，例如至少0.01％，至少0.1％，至少1％，至少10％，至少25％，至少50％或100％的膜組分可以官能化。

第一和/或第二分析物可以直接偶聯(lián)到膜。用于將第一分析物和/或第二分析物偶聯(lián)至膜的一個(gè)或多個(gè)錨優(yōu)選包含接頭。所述一個(gè)或多個(gè)錨可包含一個(gè)或多個(gè)，例如2，3，4或更多個(gè)接頭。一個(gè)接頭可以用于將多于一個(gè)，例如2，3，4或更多個(gè)分析物偶聯(lián)到膜上。

優(yōu)選的接頭包括但不限于聚合物，例如多核苷酸，聚乙二醇(PEG)，多糖和多肽。這些連接體可以是直鏈、支鏈或環(huán)狀的。例如，接頭可以是環(huán)狀多核苷酸。如果分析物本身是多核昔酸，其可以與環(huán)狀多核苷酸接頭上的互補(bǔ)序列雜交。

所述一個(gè)或多個(gè)錨或一個(gè)或多個(gè)接頭可以包括可以被切割或分解的組分，例如限制位點(diǎn)或光不穩(wěn)定基團(tuán)。

官能化接頭和它們可以偶聯(lián)分子的方式是本領(lǐng)域已知的。例如，用馬來酰亞胺基團(tuán)官能化的接頭將與蛋白質(zhì)中的半胱氨酸殘基反應(yīng)并連接。在本發(fā)明的上下文中，蛋白質(zhì)可以存在于膜中，可以是分析物本身或可以用于偶聯(lián)(或結(jié)合)到分析物。這將在下面更詳細(xì)地討論。

可以使用“鎖和鑰匙”構(gòu)造來避免分析物的交聯(lián)。每個(gè)接頭僅一端可以一起反應(yīng)以形成更長的接頭，并且接頭的其他端各自分別與分析物或膜反應(yīng)。這樣的接頭在國際申請?zhí)朠CT/GBl0/000132(公開為WO 2010/086602)中描述。

接頭優(yōu)選在下文討論的測序?qū)嵤┓桨钢惺褂?。如果多核昔酸分析物直接永久偶?lián)至膜，意義在于，其在與檢測器相互作用時(shí)不會(huì)解偶聯(lián)(即在步驟(b)或(e)中不解偶聯(lián))，則一些序列數(shù)據(jù)將由于膜和檢測器之間的距離導(dǎo)致測序不能繼續(xù)進(jìn)行到多核苷酸的末端而丟失。如果使用接頭，則可以將多核苷酸分析物進(jìn)行到完成。

偶聯(lián)可以是永久的或穩(wěn)定的。換句話說，偶聯(lián)可以使得分析物在與檢測器相互作用時(shí)保持偶聯(lián)到膜(即在步驟(b)或(e)中不解偶聯(lián))。

偶聯(lián)可以是暫時(shí)的。換句話說，偶聯(lián)可以使得分析物在與檢測器相互作用時(shí)從膜解偶聯(lián)(即可以在步驟(b)或(e)中解偶聯(lián))。通常，第一分析物的一些保持偶聯(lián)到膜，例如，因?yàn)樗鼈儾慌c檢測器相互作用，因此需要在步驟(c)中解偶聯(lián)。對于某些應(yīng)用，例如適體器檢測和多核苷酸測序，優(yōu)選暫時(shí)性質(zhì)的偶聯(lián)。如果永久或穩(wěn)定的接頭直接連接到多核昔酸的5′或3′末端，并且接頭短于膜和跨膜孔通道之間的距離，則一些序列數(shù)據(jù)將丟失，因?yàn)闇y序不能繼續(xù)進(jìn)行到多核苷酸的末端。如果偶聯(lián)是暫時(shí)的，則當(dāng)偶聯(lián)的末端隨機(jī)變得不含膜時(shí)，則多核苷酸可以進(jìn)行到完成。形成永久/穩(wěn)定或暫時(shí)連接的化學(xué)基團(tuán)在下面更詳細(xì)地討論。分析物可以使用膽固醇或脂肪?；湑簳r(shí)地偶聯(lián)至兩親性層或三嵌段共聚物膜?？梢允褂镁哂?至30個(gè)碳原子長度的任何脂肪?；湥缡樗?。

在優(yōu)選的實(shí)施方案中，多核苷酸分析物例如核酸偶聯(lián)到兩親性層，例如三嵌段共聚物膜或脂質(zhì)雙層。之前已經(jīng)用各種不同的系鏈策略進(jìn)行了核酸與合成脂質(zhì)雙層的偶聯(lián)。這些結(jié)果總結(jié)在下表1中。

表1

合成的多核昔酸分析物和/或接頭可以在合成反應(yīng)中使用修飾的亞磷酰胺來官能化，其易于與直接加入的合適的錨基團(tuán)如膽固醇，生育酚，棕櫚酸酯，硫醇，脂質(zhì)和生物素基團(tuán)兼容。這些不同的連接化學(xué)基團(tuán)提供了用于連接到多核苷酸的一組選擇。每個(gè)不同的修飾基團(tuán)以略微不同的方式偶聯(lián)多核昔酸，并且偶聯(lián)不總是永久性的，因此對分析物到膜提供了不同停留時(shí)間。上面討論了暫時(shí)性偶聯(lián)的優(yōu)點(diǎn)。

多核苷酸到接頭或到功能化膜的偶聯(lián)也可以通過許多其它方式實(shí)現(xiàn)，條件是可以將互補(bǔ)反應(yīng)性基團(tuán)或錨定基團(tuán)添加到多核苷酸。先前已經(jīng)報(bào)道了向多核苷酸的任一端添加反應(yīng)性基團(tuán)?？墒褂肨4多核苷酸激酶和ATPγS將硫醇基團(tuán)添加到ssDNA或dsDNA的5′端(Grant，GP和PZQin(2007).″A facile method for attaching nitroxide spin labels at the 5′terminus of nucleic acids.″Nucleic Acids Res 35(10)：e77)。使用T4多核苷酸激酶和γ-[2-疊氮基乙基]-ATP或γ-[6-疊氮基己基]-ATP將疊氮基添加到ssDNA或dsDNA的5′-磷酸。使用硫醇或Click化學(xué)，可以將含有硫醇、碘乙酰胺OPSS或馬來酰亞胺基團(tuán)(對硫醇具有反應(yīng)性)或DIBO(二苯并環(huán)辛炔)或炔基(對疊氮化物具有反應(yīng)性)的系鏈共價(jià)連接到分析物?？梢允褂媚┒宿D(zhuǎn)移酶添加更多樣化學(xué)基團(tuán)例如生物素、硫醇和熒光團(tuán)的選擇，以將修飾的寡核昔酸納入ssDNA的3′(Kumar，A.，P.Tchen，等(1988).″Nonradioactive labeling of synthetic oligonucleotide probes with terminal deoxynucleotidyl transferase.″Anal Biochem 169(2)：376-82)。鏈霉親和素/生物素和/或鏈霉親和素/脫硫生物素偶聯(lián)可用于任何其它分析物。下面的實(shí)施例描述了如何使用鏈霉親和素/生物素和鏈霉親和素/脫硫生物素將多核苷酸偶聯(lián)到膜上。也可以使用具有適當(dāng)修飾的核苷酸(例如膽固醇或棕櫚酸酯)通過末端轉(zhuǎn)移酶將錨直接添加到多核苷酶。

所述一個(gè)或多個(gè)錨優(yōu)選通過雜交將第一分析物和/或第二分析物偶聯(lián)到膜。雜交可以存在于一個(gè)或多個(gè)錨的任何部分中，例如存在于一個(gè)或多個(gè)錨和分析物之間，存在于一個(gè)或多個(gè)錨內(nèi)，或存在于一個(gè)或多個(gè)錨和膜之間。在一個(gè)或多個(gè)錨中的雜交允許以如上所述的暫時(shí)方式偶聯(lián)。例如，接頭可以包含兩個(gè)或更多個(gè)多核苷酸，例如3，4或5個(gè)多核苷酸，它們雜交在一起。如果第一分析物和/或第二分析物本身是多核苷酸，則所述一個(gè)或多個(gè)錨可以與第一多核苷酸分析物和/或第二多核苷酸分析物雜交。所述一個(gè)或多個(gè)錨可以直接與多核苷酸分析物雜交，直接與Y適配體和/或連接到多核苷酸分析物的前導(dǎo)序列雜交，或直接與多核苷酸分析物連接的發(fā)夾環(huán)適配體雜交(如下文更詳細(xì)討論的)。或者，所述一個(gè)或多個(gè)錨可以與一個(gè)或多個(gè)，例如2或3個(gè)中間多核苷酸(或“夾板(splint)”)雜交，其中所述中間多核苷酸雜交到多核苷酸分析物，雜交到Y(jié)適配體和/或連接到多核苷酸分析物的前導(dǎo)序列，或雜交到與多核昔酸分析物連接的發(fā)夾環(huán)適配體上(如下面更詳細(xì)討論的)。

所述一個(gè)或多個(gè)錨可以包括單鏈或雙鏈多核苷酸。錨的一部分可以連接到單鏈或雙鏈多核苷酸分析物。已經(jīng)報(bào)道了使用T4RNA連接酶I連接ssDNA短片段(Troutt，A.B.，M.G.McHeyzer-Williams，等人(1992).″Ligation-anchored PCR：a simple amplification technique with single-sided specificity.″Proc Natl Acad Sci USA 89(20)：9823-5)?；蛘?，單鏈或雙鏈多核苷酸可以連接到雙鏈多核昔酸分析物，然后通過熱或化學(xué)變性分離兩條鏈。對于雙鏈多核苷酸，可以向雙鏈的一個(gè)或兩個(gè)末端添加一段單鏈多核苷酸，或者向一個(gè)或兩個(gè)末端添加雙鏈多核昔酸。對于將單鏈多核苷酸添加到雙鏈多核苷酸，可以使用T4RNA連接酶I實(shí)現(xiàn)，用于與單鏈多核苷酸的其他區(qū)域連接。對于將雙鏈多核苷酸添加到雙鏈多核苷酸分析物，連接可以用分別在分析物和添加的多核苷酸上的互補(bǔ)的3′dA/dT尾部“平端化(blunt-ended)”(對于許多樣品制備應(yīng)用，常規(guī)這樣進(jìn)行，以防止多聯(lián)體或二聚體形成)，或使用通過分析物的限制性消化產(chǎn)生的“粘性末端”以及連接相容的適配體“平端化”。然后，當(dāng)雙鏈體被變性，如果單鏈多核苷酸用于連接，則每條單鏈將具有5′或3′修飾，或者如果雙鏈多核苷酸用于連接，則每條單鏈將具有在5′末端，3′末端或這兩個(gè)末端的修飾。

如果多核苷酸分析物是合成的鏈，則可以在多核苷酸的化學(xué)合成期間加入一個(gè)或多個(gè)錨。例如，可以使用具有與其連接的反應(yīng)性基團(tuán)的引物合成多核苷酸。

腺苷酸化多核苷酸是連接反應(yīng)中的中間體，其中腺苷單磷酸連接到多核苷酸的5′-磷酸。各種試劑盒可用于產(chǎn)生該中間體，例如來自NEB的5′DNA腺苷酸化試劑盒。通過在反應(yīng)中用ATP代替修飾的核苷三磷酸，然后向多核昔酸的5′添加反應(yīng)性基團(tuán)(例如硫醇，胺，生物素，疊氮化物等)是可行的。也可以使用具有適當(dāng)修飾的核苷酸(例如膽固醇或棕櫚酸酯)的5′DNA腺苷酸化試劑盒將錨直接添加到多核苷酸。

用于擴(kuò)增基因組DNA的片段的常見技術(shù)是使用聚合酶鏈反應(yīng)(PCR)。這里，使用兩個(gè)合成的寡核苷酸引物，可以產(chǎn)生相同的DNA片段的多個(gè)拷貝，其中對于每個(gè)拷貝，雙鏈中每條鏈的5′將是合成的多核苷酸?？梢酝ㄟ^使用聚合酶將單個(gè)或多個(gè)核苷酸加入單鏈或雙鏈DNA的3′端?？梢允褂玫木酆厦傅膶?shí)例包括但不限于末端轉(zhuǎn)移酶，Klenow和大腸桿菌Poly(A)聚合酶。通過在反應(yīng)中用ATP代替修飾的核苷三磷酸，然后可以將錨例如膽固醇，硫醇，胺，疊氮化物，生物素或脂質(zhì)摻入雙鏈多核苷酸中。因此，擴(kuò)增的多核苷酸的每個(gè)拷貝將含有錨。

理想地，分析物偶聯(lián)至膜而不需要官能化所述分析物。這可以通過將一個(gè)或多個(gè)錨如多核苷酸結(jié)合蛋白或化學(xué)基團(tuán)偶聯(lián)至膜并允許一個(gè)或多個(gè)錨與分析物相互作用或通過使膜官能化來實(shí)現(xiàn)。所述一個(gè)或多個(gè)錨可以通過本文所述的任何方法偶聯(lián)至膜。特別地，所述一個(gè)或多個(gè)錨可以包含一個(gè)或多個(gè)接頭，例如馬來酰亞胺官能化的接頭。

在該實(shí)施方案中，分析物通常是RNA，DNA，PNA，TNA或LNA，并且可以是雙鏈或單鏈的。該實(shí)施方案特別適合于基因組DNA分析物。

一個(gè)或多個(gè)錨可以包括下述任何基團(tuán)：所述基團(tuán)與單鏈或雙鏈多核苷酸、分析物內(nèi)的特定核苷酸序列或分析物內(nèi)修飾的核苷酸模式，或存在于多核苷酸上的任何其它配體偶聯(lián)、結(jié)合或相互作用。

用于錨中的合適的結(jié)合蛋白包括但不限于大腸桿菌單鏈結(jié)合蛋白，P5單鏈結(jié)合蛋白，T4gp32單鏈結(jié)合蛋白，TOPO V dsDNA結(jié)合區(qū)，人組蛋白，大腸桿菌HU DNA結(jié)合蛋白和其它古細(xì)菌、原核或真核的單鏈或雙鏈多核苷酸(或核酸)結(jié)合蛋白，包括下面列出的那些。

特定核苷酸序列可以是由轉(zhuǎn)錄因子、核糖體、內(nèi)切核酸酶、拓?fù)洚悩?gòu)酶或復(fù)制起始因子識(shí)別的序列。修飾的核苷酸的模式可以是甲基化或損傷模式。

所述一個(gè)或多個(gè)錨可以包括與多核苷酸分析物偶聯(lián)、結(jié)合、插入或相互作用的任何基團(tuán)。所述基團(tuán)可以通過靜電、氫鍵或范德華相互作用而插入多核苷酸分析物或與多核苷酸分析物相互作用。這些基團(tuán)包括賴氨酸單體、聚賴氨酸(其將與ssDNA或dsDNA相互作用)、溴化乙錠(其將插入dsDNA)、通用堿基或通用核苷酸(其可與任何多核苷酸分析物雜交)和鋨復(fù)合物(其與甲基化堿基反應(yīng))。因此，多核苷酸分析物可以使用連接到膜上的一個(gè)或多個(gè)通用核苷酸與膜偶聯(lián)。每個(gè)通用核苷酸可以使用一個(gè)或多個(gè)接頭偶聯(lián)至膜。通用核苷酸優(yōu)選包含以下核昔堿基之一：次黃嘌呤，4-硝基吲哚，5-硝基吲哚，6-硝基吲哚，甲酰基吲哚，3-硝基吡咯，硝基咪唑，4-硝基吡唑，4-硝基苯并咪唑，5-硝基吲唑，4-氨基苯并咪唑或苯基(C6-芳香環(huán))。通用核苷酸更優(yōu)選包含以下核苷之一：2′-脫氧肌昔，肌昔，7-脫氮-2′-脫氧肌昔，7-脫氮肌苷，2-氮雜-脫氧肌苷，2-氮雜-肌苷，2-O′-甲基肌昔，4-硝基吲哚2′-脫氧核糖核苷，4-硝基吲哚核糖核苷，5-硝基吲哚2′-脫氧核糖核苷，5-硝基吲哚核糖核苷，6-硝基吲哚2′-脫氧核糖核苷，6-硝基吲哚核糖核苷，3-硝基吡咯2′-脫氧核糖核苷，3-硝基吡咯核糖核苷，次黃嘌呤的無環(huán)糖類似物，硝基咪唑2′-脫氧核糖核苷，硝基咪唑核糖核苷，4-硝基吡唑2′-脫氧核糖核苷，4-硝基吡唑核糖核苷，4-硝基苯并咪唑2′-脫氧核糖核苷，4-硝基苯并咪唑核糖核苷，5-硝基吲唑2′-脫氧核糖核苷，5-硝基吲唑脫氧核糖核苷，4-氨基苯并咪唑2′-脫氧核糖核苷，4-氨基苯并咪唑核糖核苷，苯基C-核糖核苷，苯基C-2′-脫氧核糖核苷，2′-脫氧鳥氨酸(2′-deoxynebularine)，2′-脫氧異鳥嘌呤核苷，K-2′-脫氧核糖，P-2′脫氧核糖和吡咯烷。通用核苷酸更優(yōu)選包含2′-脫氧肌苷。通用核苷酸更優(yōu)選為IMP或dIMP。通用核苷酸最優(yōu)選為dPMP(2′-脫氧-β-核苷單磷酸)或dKMP(N6-甲氧基-2，6-二氨基嘌呤單磷酸)。

所述一個(gè)或多個(gè)錨可以通過Hoogsteen氫鍵(其中兩個(gè)核堿基通過氫鍵保持在一起)或反向的Hoogsteen氫鍵(其中一個(gè)核堿基相對于另一個(gè)核堿基旋轉(zhuǎn)180°)偶聯(lián)(或結(jié)合)多核苷酸分析物。例如，所述一個(gè)或多個(gè)錨可以包含一個(gè)或多個(gè)核苷酸，一個(gè)或多個(gè)寡核苷酸或一個(gè)或多個(gè)多核苷酸，其與多核苷酸分析物形成Hoogsteen氫鍵或反向Hoogsteen氫鍵。這些類型的氫鍵允許第三多核苷酸鏈纏繞在雙鏈螺旋上并形成三鏈體。所述一個(gè)或多個(gè)錨可以通過與雙鏈體形成三鏈體而偶聯(lián)(或結(jié)合)到雙鏈多核苷酸分析物。

在該實(shí)施方案中，至少1％，至少10％，至少25％，至少50％或100％的膜組分可以被官能化。

當(dāng)所述一個(gè)或多個(gè)錨包含蛋白質(zhì)時(shí)，它們能夠直接錨定到膜中，而不進(jìn)行進(jìn)一步的官能化，例如如果它已經(jīng)具有與膜相容的外部疏水區(qū)域。此類蛋白質(zhì)的實(shí)例包括但不限于跨膜蛋白，膜內(nèi)蛋白和膜蛋白?；蛘撸鞍踪|(zhì)可以用與膜兼容的基因融合的疏水區(qū)表達(dá)。這種疏水性蛋白質(zhì)區(qū)域是本領(lǐng)域已知的。

所述一個(gè)或多個(gè)錨優(yōu)選在與膜接觸之前與分析物混合，但是所述一個(gè)或多個(gè)錨可以與膜接觸并隨后與分析物接觸。

在另一方面，分析物可以使用上述方法進(jìn)行官能化，使得其可以被特異性結(jié)合基團(tuán)識(shí)別。具體地，分析物可以用配體如生物素(用于結(jié)合鏈霉親和素)、直鏈淀粉(用于結(jié)合麥芽糖結(jié)合蛋白或融合蛋白)、Ni-NTA(用于結(jié)合聚組氨酸或聚組氨酸標(biāo)記的蛋白)或肽(例如抗原)官能化。

根據(jù)優(yōu)選的實(shí)施方案，當(dāng)分析物連接到優(yōu)先旋入孔中的前導(dǎo)序列時(shí)，一個(gè)或多個(gè)錨可以用于將多核苷酸分析物偶聯(lián)到膜上。前導(dǎo)序列在下面更詳細(xì)地討論。優(yōu)選地，多核昔酸分析物結(jié)合(例如連接)到優(yōu)先旋入孔中的前導(dǎo)序列。這種前導(dǎo)序列可以包含均聚多核苷酸或無堿基區(qū)。前導(dǎo)序列通常設(shè)計(jì)為直接或經(jīng)由一個(gè)或多個(gè)中間多核苷酸(或夾板)與一個(gè)或多個(gè)錨雜交。在這種情況下，一個(gè)或多個(gè)錨通常包含與前導(dǎo)序列中的序列互補(bǔ)或與一個(gè)或多個(gè)中間多核昔酸(或夾板)中的序列互補(bǔ)的多核苷酸序列。在這種情況下，一個(gè)或多個(gè)夾板通常包含與前導(dǎo)序列中的序列互補(bǔ)的多核苷酸序列。

上文討論的用于將多核苷酸偶聯(lián)至膜，例如兩親性層的任何方法當(dāng)然可以應(yīng)用于其它分析物和膜組合。在一些實(shí)施方案中，氨基酸、肽、多肽或蛋白質(zhì)偶聯(lián)至兩親性層，例如三嵌段共聚物層或脂質(zhì)雙層。對于這類分析物的化學(xué)連接可以使用各種方法。化學(xué)連接中使用的分子的實(shí)例是EDC(1-乙基-3-[3-二甲基氨基丙基]碳二亞胺鹽酸鹽)。還可以使用市售試劑盒(Thermo Pierce，Part No.22980)將反應(yīng)性基團(tuán)加入到多核苷酸的5′端。合適的方法包括但不限于，使用組氨酸殘基和Ni-NTA進(jìn)行的暫時(shí)親和性連接，以及通過反應(yīng)性半胱氨酸、賴氨酸或非天然氨基酸進(jìn)行的更強(qiáng)的共價(jià)連接。

檢測器

步驟(b)和(e)包括使第一分析物和第二分析物分別與膜中存在的檢測器相互作用，從而分別確定第一分析物和第二分析物的存在、不存在或一個(gè)或多個(gè)特征。每個(gè)步驟中的檢測器可以不同。每個(gè)步驟中的檢測器通常是相同的。例如，優(yōu)選允許第一和第二分析物與跨膜孔，優(yōu)選相同的跨膜孔相互作用。

第一分析物和/或第二分析物的偶聯(lián)對于分析物與檢測器相互作用不是必需的。該偶聯(lián)允許超低濃度分析物傳遞到檢測器。

檢測器可以是響應(yīng)第一和/或第二分析物的存在、不存在或一個(gè)或多個(gè)特征而提供可讀信號(hào)的任何結(jié)構(gòu)。檢測器可以是響應(yīng)第一和/或第二分析物的存在或不存在而提供可讀信號(hào)的任何結(jié)構(gòu)。合適的檢測器是本領(lǐng)域已知的。它們包括但不限于跨膜孔，隧道電極，分類電極(classis electrode)，納米管，F(xiàn)ET(場效應(yīng)晶體管)和光學(xué)檢測器，例如原子力顯微鏡(AFM)和掃描隧道顯微鏡(STM)。

可以進(jìn)行各種不同類型的測量。這包括但不限于：電測量和光學(xué)測量?？赡艿碾姕y量包括：電流測量，阻抗測量，隧道測量(Ivanov AP等人，Nano Lett.2011 Jan 12；11(1)：279-85)和FET測量(國際申請WO 2005/124888)。光學(xué)測量可以與電測量結(jié)合(Soni GV等人，Rev Sci Instrum.2010Jan；81(1)：014301)。所述測量可以是跨膜電流測量，例如流過孔的離子電流測量。

可以使用如StoddartD等人，Proc Natl Acad Sci，12；106(19)：7702-7，Lieberman KR等人，J Am Chem Soc.2010；132(50)：17961-72和國際申請WO 2000/28312中描述的標(biāo)準(zhǔn)單通道記錄設(shè)備進(jìn)行電測量?；蛘?，可以使用多通道系統(tǒng)進(jìn)行電測量，例如如國際申請WO 2009/077734和國際申請WO 2011/067559中所述。

該方法優(yōu)選在跨膜施加電位的情況下進(jìn)行。施加的電位可以是電壓電位。或者，施加的電位可以是化學(xué)電位。其一個(gè)實(shí)例是使用跨膜，例如兩親性層的鹽梯度。鹽梯度在Holden等人，J Am Chem Soc。2007Jul 11；129(27)：8650-5中公開。在一些情況下，隨著多核苷酸分析物相對于孔移動(dòng)，穿過檢測器(或孔)的電流被用于估計(jì)或確定多核苷酸的序列。這是鏈測序。

在其他優(yōu)選實(shí)施方案中，檢測器不使用熒光手段檢測分析物。

檢測器優(yōu)選包含跨膜孔?？缒た资窃谝欢ǔ潭壬洗┻^膜的結(jié)構(gòu)。它允許由施加的電位驅(qū)動(dòng)水合離子流過膜或在膜內(nèi)流動(dòng)。跨膜孔典型地穿過整個(gè)膜，使得水合離子可以從膜的一側(cè)流到膜的另一側(cè)。然而，跨膜孔不用必須穿過膜。它可以在一端封閉。例如，孔可以是膜一一水合離子可以沿著其流動(dòng)或可以流入其中——中的阱，間隙，通道，溝槽或狹縫。

如果檢測器是孔，步驟(b)優(yōu)選包括(i)允許第一分析物與檢測器相互作用，和(ii)在相互作用期間測量穿過檢測器的電流，由此確定第一分析物的存在、不存在或一個(gè)或多個(gè)特征，和/或步驟(e)包括(i)允許第二分析物與檢測器相互作用，和(ii)在相互作用期間測量穿過檢測器的電流，由此確定第二分析物存在、不存在或一個(gè)或多個(gè)特征。

如果電流以對分析物特異的方式(即，如果檢測到與分析物相關(guān)的流經(jīng)孔的特征電流)流過孔，則存在第一或第二分析物。如果電流不以對分析物特異的方式流過孔，則不存在第一或第二分析物。類似地，可以使用在相互作用期間流過孔的電流來確定分析物的特征。

因此，本發(fā)明涉及分析物的納米孔感測。本發(fā)明可以用于基于分析物對通過孔的電流的不同影響來區(qū)分相似結(jié)構(gòu)的分析物。本發(fā)明還可以用于測量樣品中特定分析物的濃度。

本發(fā)明還可以用于在體感測(bulk sensing)應(yīng)用中使用許多或數(shù)千個(gè)孔的傳感器中。

在第一或第二分析物與孔之間的相互作用期間，分析物以對該分析物特異的方式影響流過孔的電流。例如，特定分析物將在特定平均時(shí)間段和特定程度上減少流過孔的電流。換句話說，流過孔的電流對于特定分析物是不同的?？梢赃M(jìn)行對照實(shí)驗(yàn)以確定特定分析物對流過孔的電流的影響。然后可以將對測試樣品實(shí)施本發(fā)明方法獲得的結(jié)果與從這種對照實(shí)驗(yàn)得到的結(jié)果進(jìn)行比較，以鑒定樣品中的特定分析物，確定樣品中是否存在特定分析物或確定各分析物的特征。以代表特定分析物的方式影響流過孔的電流的頻率可以用于確定樣品中分析物的濃度。

任何跨膜孔可用于本發(fā)明?？卓梢允巧锘蛉嗽斓?。合適的孔包括但不限于蛋白質(zhì)孔，多核苷酸孔和固態(tài)孔。孔可以是DNA折紙孔(origami pore)(Langecker等人，Science，2012；338：932-936)。

跨膜孔優(yōu)選是跨膜蛋白孔?？缒さ鞍卓资窃试S水合離子如分析物從膜的一側(cè)流到膜的另一側(cè)的多肽或多肽的集合。在本發(fā)明中，跨膜蛋白孔能夠形成允許由施加電位驅(qū)動(dòng)水合離子從膜的一側(cè)流向另一側(cè)的孔?？缒さ鞍踪|(zhì)孔優(yōu)選允許分析物例如核苷酸從膜(例如三嵌段共聚物膜)的一側(cè)流向另一側(cè)?？缒さ鞍卓自试S多核苷酸，例如DNA或RNA，移動(dòng)穿過所述孔。

跨膜蛋白孔可以是單體或低聚體。孔優(yōu)選由幾個(gè)重復(fù)亞基組成，例如至少3個(gè)，至少4個(gè)，至少5個(gè)，至少6個(gè)，至少7個(gè)，至少8個(gè)，至少9個(gè)，至少10個(gè)，至少11個(gè)，至少12個(gè)，至少13個(gè)或至少14個(gè)亞基，例如3，4，5，6，7，8，9，10，11，12，13或14個(gè)亞基?？變?yōu)選是六聚體，七聚體，八聚體或九聚體孔?？卓梢允峭吹途畚锘虍愒吹途畚?。

跨膜蛋白孔通常包括離子可以流過的桶或通道?？椎膩喕ǔ@中心軸，并且向跨膜β桶或通道或跨膜α-螺旋束或通道貢獻(xiàn)鏈。

跨膜蛋白孔的桶或通道通常包含促進(jìn)與分析物相互作用的氨基酸，例如核苷酸，多核苷酸或核酸。這些氨基酸優(yōu)選位于桶或通道的收縮部附近?？缒さ鞍卓淄ǔ０粋€(gè)或多個(gè)帶正電荷的氨基酸，例如精氨酸，賴氨酸或組氨酸，或芳族氨基酸，例如酪氨酸或色氨酸。這些氨基酸通常促進(jìn)孔和核苷酸、多核苷酸或核酸之間的相互作用。

根據(jù)本發(fā)明使用的跨膜蛋白孔可以衍生自β桶孔或α-螺旋束孔。β-桶孔包括由β-鏈形成的桶或通道。合適的β-桶孔包括但不限于β-毒素，例如α-溶血素，炭疽毒素和殺白細(xì)胞素，以及細(xì)菌的外膜蛋白/孔蛋白，例如恥垢分枝桿菌(Mycobacterium smegmatis)孔蛋白(Msp)，例如MspA，MspB，MspC或MspD，胞溶素，外膜孔蛋白F(OmpF)，外膜孔蛋白G(OmpG)，外膜磷脂酶A和奈瑟氏菌自轉(zhuǎn)運(yùn)脂蛋白(NalP)。α-螺旋束孔包括由α-螺旋形成的桶或通道。合適的α-螺旋束孔包括但不限于內(nèi)膜蛋白和α外膜蛋白，例如WZA和ClyA毒素?？缒た卓梢匝苌园芩?。在國際申請?zhí)朠CT/GB2013/050667(公開為WO 2013/153359)中公開了衍生自胞溶素的合適的孔?？缒た卓梢匝苌訫sp或α-溶血素(α-HL)。

跨膜蛋白孔優(yōu)選衍生自Msp，優(yōu)選MspA。這種孔將是低聚的，并且通常包含7，8，9或10個(gè)衍生自Msp的單體?？卓梢允茄苌缘腗sp的同源低聚孔，包含相同的單體。或者，孔可以是衍生自Msp的異源低聚孔，包含至少一種不同于其它單體的單體。優(yōu)選地，所述孔源自MspA或其同源物或旁系物。

衍生自Msp的單體通常包含SEQ ID NO：2或其變體所示的序列。SEQ ID NO：2是MspA單體的MS-(B1)8突變體。其包括以下突變：D90N，D91N，D93N，D118R，D134R和E139K。SEQ ID NO：2的變體是具有這樣的氨基酸序列的多肽：從SEQ ID NO：2的氨基酸序列變化而來并且保留其形成孔的能力。變體形成孔的能力可以使用本領(lǐng)域已知的任何方法測定。例如，變體可以與其它合適的亞基一起插入兩親性層中，并且可以確定其低聚以形成孔的能力。用于將亞基插入膜例如兩親性層中的方法是本領(lǐng)域已知的。例如，亞基可以以純化形式懸浮在含有三嵌段共聚物膜的溶液中，使得它擴(kuò)散到膜并通過結(jié)合到膜并組裝成功能狀態(tài)而插入?；蛘撸瑏喕梢允褂肕.A.Holden，H.Bayley.J.Am.Chem.Soc.2005，127，6502-6503和國際申請No.PCT/GB2006/001057(公開號(hào)WO 2006/100484)中所述的“拾取和放置”方法直接插入膜中。

在SEQ ID NO：2的氨基酸序列的整個(gè)長度上，基于氨基酸同一性，變體將優(yōu)選與該序列至少50％同源。更優(yōu)選地，基于氨基酸同一性，所述變體可以是至少55％，至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％，且更優(yōu)選至少95％，97％或99％在整個(gè)序列上與SEQ ID NO：2的氨基酸序列同源。在100個(gè)或更多個(gè)，例如125，150，175或200個(gè)或更多個(gè)連續(xù)氨基酸的片段(stretch)上，可以具有至少80％，例如至少85％，90％或95％的氨基酸同一性(“嚴(yán)格同源性(hardhomology)”)。

可用本領(lǐng)域的標(biāo)準(zhǔn)方法測定同源性。例如，UWGCG包提供了用于計(jì)算同源性的BESTFIT程序，例如使用其默認(rèn)設(shè)置(Devereux等人(1984)Nucleic Acids Research 12，p387-395)。可用PILEUP和BLAST算法計(jì)算同源性或比對(line up)序列(例如鑒定等效殘基或相應(yīng)序列(通?；谄淠J(rèn)設(shè)置))，例如Altschul S.F.(1993)J Mol Evol 36：290-300；Altschul，S.F等人(1990)J Mol Biol 215：403-10中所述。用于執(zhí)行BLAST分析的軟件可通過國家生物技術(shù)信息中心(http：//www，ncbi.nlm.nih.gov/)公開獲得。

SEQ ID NO：2是MspA單體的MS-(B1)8突變體。與MspA相比，該變體可以包含MspB、C或D單體中的任何突變。MspB、C和D的成熟形式示于SEQ ID NO：5至7中。特別地，所述變體可以包含存在于MspB：A138P中的以下取代。所述變體可以包含存在于MspC中的一個(gè)或多個(gè)下列取代：A96G，N102E和A138P。所述變體可包含存在于MspD中的一個(gè)或多個(gè)以下突變：G1，L2V，E5Q，L8V，D13G，W21A，D22E，K47T，I49H，I68V，D91G，A96Q，N102D，S103T，V104I，S136K和G141A的缺失。所述變體可以包含來自Msp B、C和D中的一個(gè)或多個(gè)突變和取代的組合。變體優(yōu)選包含突變L88N。SEQ ID NO：2的變體除了MS-B1的所有突變之外還具有突變L88N，并稱為MS-(B2)8。本發(fā)明中使用的孔優(yōu)選為MS-(B2)8。除了MS-B1的所有突變之外，SEQ ID NO：2的變體具有突變G75S/G77S/L88N/Q126R，并稱為MS-B2C。本發(fā)明中使用的孔優(yōu)選為MS-(B2)8或MS-(B2C)8。

除了上文論述的那些之外，可以對SEQ ID NO：2的氨基酸序列進(jìn)行氨基酸取代，例如高達(dá)1，2，3，4，5，10，20或30個(gè)取代。保守取代用具有相似化學(xué)結(jié)構(gòu)、相似化學(xué)性質(zhì)或相似側(cè)鏈體積的其他氨基酸替換氨基酸。引入的氨基酸可以具有與它們替代的氨基酸相似的極性、親水性、疏水性、堿性、酸性、中性或電荷。或者，保守取代可以引入另一個(gè)芳香族或脂肪族氨基酸代替之前存在的芳香族或脂肪族氨基酸。

SEQ ID NO：2的氨基酸序列的一個(gè)或多個(gè)氨基酸殘基可以另外從上述多肽中缺失。可以缺失多至1，2，3，4，5，10，20或30個(gè)殘基或更多個(gè)殘基。

變體可以包括SEQ ID NO：2的片段。這類片段保留成孔活性。片段的長度可以為至少50，100，150或200個(gè)氨基酸。這樣的片段可以用于產(chǎn)生孔。片段優(yōu)選包含SEQ ID NO：2的孔形成結(jié)構(gòu)域。片段必須包括SEQ IDNO：2的殘基88，90，91，105，118和134中的一個(gè)。通常，片段包括SEQ ID NO：2的所有殘基88，90，91，105，118和134。

一個(gè)或多個(gè)氨基酸可以替代地或另外地添加到上述多肽?？梢栽赟EQ ID NO：2或其多肽變體或其片段的氨基酸序列的氨基末端或羧基末端提供延伸。延伸可以非常短，例如1至10個(gè)氨基酸長度?；蛘?，延伸可以較長，例如高達(dá)50或100個(gè)氨基酸。載體蛋白可以與本發(fā)明的氨基酸序列融合。其它融合蛋白在下面更詳細(xì)地論述。

如上所述，變體是具有下述氨基酸序列的多肽：從SEQ ID NO：2的氨基酸序列變化而來并且保留其形成孔的能力。變體通常包含負(fù)責(zé)形成孔的SEQ ID NO：2的區(qū)域。含有β桶狀體的Msp的孔形成能力由每個(gè)亞基中的β片體提供。SEQ ID NO：2的變體通常包含SEQ ID NO：2中形成β片體的區(qū)域?？梢詫EQ ID NO：2的形成β片體的區(qū)域進(jìn)行一個(gè)或多個(gè)修飾，只要所得變體保留其形成孔的能力即可。SEQ ID NO：2的變體優(yōu)選包括在其α螺旋和/或環(huán)區(qū)域內(nèi)的一個(gè)或多個(gè)修飾，例如取代、添加或缺失。

衍生自Msp的單體含有一個(gè)或多個(gè)特異性修飾以便于對核苷酸的鑒別。衍生自Msp的單體也可以含有其它非特異性修飾，只要它們不干擾孔形成即可。許多非特異性側(cè)鏈修飾是本領(lǐng)域已知的，并且可以對衍生自Msp的單體的側(cè)鏈進(jìn)行。這樣的修飾包括例如通過與醛反應(yīng)、然后用NaBH₄還原而進(jìn)行的氨基酸的還原性烷基化，用甲基乙酰亞胺酯(methylacetimidate)進(jìn)行的脒基化，或用乙酸酐進(jìn)行的?；?。

衍生自Msp的單體可以使用本領(lǐng)域中已知的標(biāo)準(zhǔn)方法來制備。衍生自Msp的單體可以通過合成或重組方式制成。例如，所述孔可通過體外翻譯和轉(zhuǎn)錄(IVTT)合成。制造孔的合適的方法在國際申請No.PCT/GB09/001690(公開號(hào)為WO 2010/004273)，PCT/GB09/001679(公開號(hào)為WO 2010/004265)或PCT/GB10/000133(公開號(hào)為WO 2010/086603)中有論述。論述了將孔插入膜的方法。

跨膜蛋白孔也優(yōu)選衍生自α-溶血素(α-HL)。野生型α-HL孔由七個(gè)相同的單體或亞基形成(即它是七聚體)。α-溶血素-NN的一個(gè)單體或亞基的序列顯示在SEQ ID NO：4中。

在一些實(shí)施方案中，跨膜蛋白孔是經(jīng)化學(xué)修飾的。所述孔可以任何方式在任何位點(diǎn)進(jìn)行化學(xué)修飾。所述跨膜蛋白孔優(yōu)選通過下述進(jìn)行化學(xué)修飾：將分子連接到一個(gè)或多個(gè)半胱氨酸(半胱氨酸連接)，將分子連接到一個(gè)或多個(gè)賴氨酸，將分子連接到一個(gè)或多個(gè)非天然氨基酸，表位的酶修飾或末端的修飾。適用于進(jìn)行這些修飾的方法是本領(lǐng)域已知的。所述跨膜蛋白孔可通過連接任何分子被化學(xué)修飾。例如，所述孔可以通過連接染料或熒光團(tuán)被化學(xué)修飾。

孔中的任何數(shù)量的單體可以是化學(xué)修飾的。一個(gè)或多個(gè)，例如2，3，4，5，6，7，8，9或10個(gè)單體優(yōu)選如上所述進(jìn)行化學(xué)修飾。

半胱氨酸殘基的反應(yīng)性可以通過修飾相鄰殘基來增強(qiáng)。例如，側(cè)翼精氨酸、組氨酸或賴氨酸殘基的堿基將半胱氨酸硫醇基團(tuán)的pKa變?yōu)楦叻磻?yīng)性的S-基團(tuán)的pKa。半胱氨酸殘基的反應(yīng)性可以用硫醇保護(hù)基團(tuán)如dTNB保護(hù)。所述保護(hù)基團(tuán)可以在接頭連接之前與孔的一個(gè)或多個(gè)半胱氨酸殘基反應(yīng)。

所述分子(使用其對孔進(jìn)行化學(xué)修飾)可以直接連接到所述孔或如國際申請No.PCT/GB09/001690(公開號(hào)WO 2010/004273)，PCT/GB09/001679(公開號(hào)WO 2010/004265)或PCT/GB10/000133(公開號(hào)WO 2010/086603)中所公開通過接頭連接到所述孔。

本文所述的任何蛋白質(zhì)，例如跨膜蛋白孔可以使用本領(lǐng)域已知的標(biāo)準(zhǔn)方法制備。編碼孔或構(gòu)建體的多核苷酸序列可以使用本領(lǐng)域的標(biāo)準(zhǔn)方法衍生和復(fù)制。編碼孔或構(gòu)建體的多核苷酸序列可以使用本領(lǐng)域標(biāo)準(zhǔn)技術(shù)在細(xì)菌宿主細(xì)胞中表達(dá)?？卓梢酝ㄟ^在細(xì)胞中由重組表達(dá)載體的多肽的原位表達(dá)而制備。表達(dá)載體任選地?cái)y帶誘導(dǎo)型啟動(dòng)子以控制多肽的表達(dá)。這些方法在Sambrook，J.和Russell，D.(2001).Molecular Cloning：A Laboratory Manual，第3版，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY中有描述。

孔可以從產(chǎn)生蛋白質(zhì)的生物體通過任何蛋白質(zhì)液相色譜系統(tǒng)純化后，或在重組表達(dá)后大規(guī)模生產(chǎn)。典型的蛋白質(zhì)液相色譜系統(tǒng)包括FPLC系統(tǒng)、AKTA系統(tǒng)、Bio-Cad系統(tǒng)、Bio-Rad BioLogic系統(tǒng)和Gilson HPLC系統(tǒng)。

解偶聯(lián)

本發(fā)明的方法包括將第一分析物與膜解偶聯(lián)。本發(fā)明的方法可以包括將第二分析物與膜解偶聯(lián)，例如如研究三個(gè)或更多個(gè)分析物時(shí)。

步驟(c)(即第一分析物的解偶聯(lián))可以在步驟(d)之前(即在將第二分析物偶聯(lián)到膜之前)進(jìn)行。步驟(d)可以在步驟(c)之前進(jìn)行。如果第二分析物在第一分析物解偶聯(lián)之前偶聯(lián)到膜，步驟(c)優(yōu)選包括從膜選擇性地解偶聯(lián)第一分析物(即，使第一分析物而不是第二分析物與膜解偶聯(lián))。本領(lǐng)域技術(shù)人員可以設(shè)計(jì)在其中實(shí)現(xiàn)選擇性解偶聯(lián)的系統(tǒng)。步驟(c)和(d)可以同時(shí)進(jìn)行。這將在下面更詳細(xì)地討論。

在步驟(c)中，優(yōu)選至少10％的第一分析物與膜解偶聯(lián)。例如，第一分析物的至少20％，至少30％，至少40％，至少50％，至少60％，至少70％，至少80％，至少90％或至少95％可以從膜解偶聯(lián)。優(yōu)選地，所有第一分析物與膜解偶聯(lián)?？梢允褂脵z測器確定從膜解偶聯(lián)的第一分析物的量。這在實(shí)施例中公開。

第一分析物可以使用任何已知的方法從膜上解偶聯(lián)。第一分析物優(yōu)選不使用檢測器例如跨膜孔在步驟(c)中與膜解偶聯(lián)。第一分析物優(yōu)選不使用電壓或施加電位與膜解偶聯(lián)。

步驟(c)優(yōu)選包括通過從膜上去除一個(gè)或多個(gè)錨而從膜上解偶聯(lián)第一分析物。在這樣的實(shí)施方案中，第二分析物使用其它(或單獨(dú)的)一個(gè)或多個(gè)錨偶聯(lián)到膜。用于偶聯(lián)第二分析物的一個(gè)或多個(gè)錨可以與用于偶聯(lián)第一分析物的錨是相同類型或不同類型的錨。

步驟(c)更優(yōu)選包括使所述一個(gè)或多個(gè)錨與試劑接觸，所述試劑對所述一個(gè)或多個(gè)錨具有比一個(gè)或多個(gè)錨對膜更高的親和力。用于競爭性結(jié)合或免疫放射測定以確定分子的特異性結(jié)合能力的多種方案是本領(lǐng)域熟知的(參見例如Maddox等人，J.Exp.Med.158，1211-1226，1993)。該試劑從膜上去除一個(gè)或多個(gè)錨，從而使第一分析物解偶聯(lián)。所述試劑優(yōu)選是糖?？梢允褂脤λ鲆粋€(gè)或多個(gè)錨具有比一個(gè)或多個(gè)錨對膜更高的親和力的任何糖。糖可以是如下所述的環(huán)糊精或其衍生物。

所述一個(gè)或多個(gè)錨優(yōu)選包含疏水錨，例如膽固醇，并且試劑優(yōu)選是環(huán)糊精或其衍生物或脂質(zhì)。環(huán)糊精或其衍生物可以是Eliseev，A.V.，和Schneider，H-J.(1994)J.Am.Chem.Soc.116，6081-6088中公開的任意一個(gè)。該試劑更優(yōu)選為七-6-氨基-β-環(huán)糊精(am₇-βCD)，6-單脫氧-6-單氨基-β-環(huán)糊精(am₁-βCD)，七-(6-脫氧-6-胍基)環(huán)糊精(gu₇-βCD)，七(2，3，6-三-O-甲基)-β-環(huán)糊精或(2-羥丙基)-β-環(huán)糊精?？梢允褂帽疚墓_的任何脂質(zhì)。

所述一個(gè)或多個(gè)錨優(yōu)選包含鏈霉親和素，生物素或脫硫生物素，并且所述試劑優(yōu)選是生物素，脫硫生物素或鏈霉親和素。生物素和脫硫生物素二者結(jié)合鏈霉親和素的親和力比鏈霉親和素結(jié)合到膜上的親和力更高。生物素對鏈霉親和素比對脫硫生物素具有更強(qiáng)的親和力。因此，可以使用生物素或脫硫生物素從膜上去除包含鏈霉親和素的錨，這取決于錨的組成。如實(shí)施例5和圖7所示。

所述一個(gè)或多個(gè)錨優(yōu)選包含蛋白質(zhì)，并且所述試劑優(yōu)選是特異性結(jié)合所述蛋白質(zhì)的抗體或其片段。如果抗體以優(yōu)先或高親和力結(jié)合蛋白質(zhì)，但不結(jié)合或者僅以低親和力結(jié)合其它蛋白質(zhì)或不同蛋白質(zhì)，則抗體特異性結(jié)合該蛋白質(zhì)。如果抗體以1×10^-6M或更小，更優(yōu)選1×10^-7M或更小，5×10^-8M或更小，更優(yōu)選1×10^-8M或更小或更優(yōu)選5x 10^-9M或更小的Kd結(jié)合，則抗體以優(yōu)先或高的親和力結(jié)合。如果抗體以1×10^-6M或更高，更優(yōu)選1×10^-5M或更高，更優(yōu)選1×10^-4M或更高，更優(yōu)選1×10^-3M或更高，更優(yōu)選為1×10^-2M或更高的Kd結(jié)合，則抗體以低親和力結(jié)合。任何方法可以用于檢測結(jié)合或特異性結(jié)合。定量測量抗體與蛋白質(zhì)的結(jié)合的方法是本領(lǐng)域熟知的?？贵w可以是單克隆抗體或多克隆抗體。合適的抗體片段包括但不限于Fv，F(xiàn)(ab′)和F(ab’)₂片段，以及單鏈抗體。此外，抗體或其片段可以是嵌合抗體或其片段，CDR接枝抗體或其片段，或人源化抗體或其片段。

步驟(c)優(yōu)選包括使一個(gè)或多個(gè)錨與使其偶聯(lián)至膜的能力降低的試劑接觸。例如，試劑可以干擾一個(gè)或多個(gè)錨的結(jié)構(gòu)和/或疏水性，從而降低它們偶聯(lián)到膜的能力。所述一個(gè)或多個(gè)錨優(yōu)選包含膽固醇，并且試劑優(yōu)選為膽固醇脫氫酶。所述一個(gè)或多個(gè)錨優(yōu)選包含脂質(zhì)，并且試劑優(yōu)選是磷脂酶。所述一個(gè)或多個(gè)錨優(yōu)選包含蛋白質(zhì)，并且試劑優(yōu)選是蛋白酶或脲。合適的錨和試劑的其它組合對于本領(lǐng)域技術(shù)人員是清楚的。

步驟(c)優(yōu)選包括通過將第一分析物與一個(gè)或多個(gè)錨分離而從膜上解偶聯(lián)第一分析物。這可以以任何方式完成。例如，接頭可以在包含接頭的一個(gè)或多個(gè)錨中被切下。該實(shí)施方案特別適用于涉及通過雜交連接的一個(gè)或多個(gè)錨。這種錨在上文已討論。

步驟(c)更優(yōu)選包括通過使第一分析物和一個(gè)或多個(gè)錨與試劑接觸，所述試劑與第一分析物競爭結(jié)合到一個(gè)或多個(gè)錨，從膜上解偶聯(lián)第一分析物。用于測定和測量競爭性結(jié)合的方法是本領(lǐng)域已知的。試劑優(yōu)選是與第一分析物競爭雜交到一個(gè)或多個(gè)錨的多核苷酸。例如，如果使用涉及雜交的一個(gè)或多個(gè)錨將第一分析物偶聯(lián)到膜上，則可以通過使一個(gè)或多個(gè)錨與也與雜交位點(diǎn)雜交的多核苷酸接觸來解偶聯(lián)分析物。多核苷酸試劑通常以高于第一分析物和一個(gè)或多個(gè)錨的濃度的濃度添加?；蛘?，多核苷酸試劑可以比第一分析物更強(qiáng)地與一個(gè)或多個(gè)錨雜交。

步驟(c)更優(yōu)選包括(i)使第一分析物和一個(gè)或多個(gè)錨與以下物質(zhì)接觸：脲，三(2-羧乙基)膦(TCEP)，二硫蘇糖醇(DTT)，鏈霉親和素或生物素，UV光，酶或結(jié)合劑；(ii)加熱所述第一分析物和一個(gè)或多個(gè)錨；或(iii)改變pH。脲，三(2-羧乙基)膦(TCEP)或二硫蘇糖醇(DTT)能夠破壞錨并將第一分析物與膜分離。如果錨包含鏈霉親和素-生物素連接，則鏈霉親和素試劑將競爭結(jié)合生物素。如果錨包含鏈霉親和素-脫硫生物素連接，則生物素試劑將競爭結(jié)合鏈霉親和素。紫外光可用于分解光不穩(wěn)定基團(tuán)。酶和結(jié)合劑可用于切下，分解或解開錨。優(yōu)選的酶包括但不限于外切核酸酶，內(nèi)切核酸酶或解旋酶。優(yōu)選的結(jié)合劑包括但不限于酶，抗體或其片段或單鏈結(jié)合蛋白(SSB)?？梢允褂孟旅嬗懻摰娜魏蚊富蛏厦嬗懻摰目贵w。加熱和pH可以用于破壞雜交和其它連接。

如果通過使第一分析物與一個(gè)或多個(gè)錨分離將第一分析物與膜解偶聯(lián)，則所述一個(gè)或多個(gè)錨將保留在膜中。步驟(d)優(yōu)選包括使用與第一分析物分離的一個(gè)或多個(gè)錨將第二分析物偶聯(lián)至膜。例如，第二分析物還可以具有與保留在膜中的一個(gè)或多個(gè)錨雜交的多核苷酸?；蛘撸襟E(d)優(yōu)選包括使用相對于與第一分析物分離的一個(gè)或多個(gè)錨而言獨(dú)立的一個(gè)或多個(gè)錨(即，其它一個(gè)或多個(gè)錨)將第二分析物偶聯(lián)至膜。所述獨(dú)立的一個(gè)或多個(gè)錨可以與用于將第一分析物偶聯(lián)到膜的錨是相同類型的錨或者可以是不同類型的錨。步驟(d)優(yōu)選包括使用不同于與第一分析物分離的錨的一個(gè)或多個(gè)錨來將第二分析物偶聯(lián)到膜上。

在優(yōu)選的實(shí)施方案中，步驟(c)和(d)包括通過使膜與第二分析物接觸而使得第二分析物與第一分析物競爭結(jié)合一個(gè)或多個(gè)錨并取代第一分析物，從而使第一分析物與膜解偶聯(lián)。例如，如果使用涉及雜交的一個(gè)或多個(gè)錨將第一分析物偶聯(lián)到膜上，則所述分析物可以通過使所述一個(gè)或多個(gè)錨與結(jié)合到多核苷酸的第二分析物接觸來解偶聯(lián)，其中所述多核苷酸也雜交到所述一個(gè)或多個(gè)錨中的雜交位點(diǎn)。第二分析物通常以高于第一分析物和一個(gè)或多個(gè)錨的濃度的濃度添加?；蛘撸诙治鑫锟梢员鹊谝环治鑫锔鼜?qiáng)地與一個(gè)或多個(gè)錨雜交。

去除或清洗

盡管在步驟(c)中第一分析物與膜解偶聯(lián)，但是其不一定被去除或洗去。如果第二分析物可以容易地與第一分析物區(qū)分開，則不需要去除第一分析物。

在步驟(c)和(d)之間，所述方法優(yōu)選還包括從膜去除至少一些第一樣品?？梢匀コ辽?0％的第一樣品，例如可以去除至少20％，至少30％，至少40％，至少50％，至少60％，至少70％，至少80％或至少90％的第一樣品。該方法更優(yōu)選還包括從膜去除所有第一樣品。這可以以任何方式完成。例如，在第一分析物已經(jīng)解偶聯(lián)后，可以用緩沖液洗滌膜。合適的緩沖液如下所述。

多核苷酸表征

本發(fā)明的方法優(yōu)選涉及測量兩個(gè)或更多個(gè)多核苷酸的一個(gè)或多個(gè)特征。所述兩個(gè)或更多個(gè)多核苷酸可以是不同的多核苷酸或相同多核苷酸的兩個(gè)實(shí)例。

可以研究任何數(shù)量的多核苷酸。例如，本發(fā)明的方法可以涉及確定3，4，5，6，7，8，9，10，20，30，50，100或更多個(gè)多核苷酸的存在、不存在或一個(gè)或多個(gè)特征。如果使用本發(fā)明的方法研究三個(gè)或更多個(gè)多核苷酸，則第二多核苷酸也與膜解偶聯(lián)，并且針對第三多核苷酸增加所需數(shù)目的步驟。四個(gè)或更多個(gè)多核苷酸時(shí)也是如此。

多核苷酸可以是天然存在的或人工的。例如，該方法可用于驗(yàn)證兩個(gè)或更多個(gè)制造的寡核苷酸的序列。所述方法通常在體外進(jìn)行。

所述方法可以包括測量每個(gè)多核苷酸的兩個(gè)、三個(gè)、四個(gè)或五個(gè)或更多個(gè)特征。所述的一個(gè)或多個(gè)特征優(yōu)選選自(i)多核苷酸的長度，(ii)多核苷酸的同一性，(iii)多核苷酸的序列，(iv)多核苷酸的二級(jí)結(jié)構(gòu)，以及(v)多核苷酸是否被修飾。根據(jù)本發(fā)明可以測量(i)到(v)的任意組合，例如{i}，{ii}，{iii}，{iv}，{v}，{i，ii}，{i，iii}，{i，iv}，{i，v}，{ii，iii}，{ii，iv}，{ii，v}，{iii，iv}，{iii，v}，{iv，v}，{i，ii，iii}，{i，ii，iv}，{i，ii，v}，{i，iii，iv}，{i，iii，v}，{i，iv，v}，{ii，iii，iv}，{ii，iii，v}，{ii，iv，v}，{iii，iv，v}，{i，ii，iii，iv}，{i，ii，iii，v}，{i，ii，iv，v}，{i，iii，iv，v}，{ii，iii，iv，v}或{i，ii，iii，iv，v}。可以測量第一多核苷酸的與第二多核苷酸相比不同的(i)到(v)的組合，包括上面所列的任意組合。

對于(i)，多核苷酸的長度可以例如通過確定所述多核苷酸和所述孔之間相互作用的次數(shù)或所述多核苷酸和所述孔之間相互作用的持續(xù)時(shí)間進(jìn)行測量。

對于(ii)，對多核苷酸的鑒別可以通過多種方式進(jìn)行測定。對多核苷酸的識(shí)別可以聯(lián)合多核苷酸序列的測定或不聯(lián)合多核苷酸序列的測定而進(jìn)行測定。前者是直接測定；對所述多核苷酸進(jìn)行測序，并由此進(jìn)行識(shí)別。后者可以多種方式完成。例如，可以測定多核苷酸中特定模序的存在(不需要測定多核苷酸的其余序列)。替代地，在所述方法中特定電和/或光信號(hào)的測定可以鑒別來自特定來源的多核苷酸。

對于(iii)，多核苷酸的序列可以如前文所述進(jìn)行測定。適合的測序方法，特別是那些使用電測量的方法，在Stoddart D等人，Proc Natl Acad Sci，12；106(19)：7702-7，Lieberman KR等人，J Am Chem Soc.2010；132(50)：17961-72，以及國際申請WO 2000/28312中有描述。

對于(iv)，二級(jí)結(jié)構(gòu)可以多種方式測定。例如，如果所述方法涉及電測量，則二級(jí)結(jié)構(gòu)可以利用流經(jīng)孔的停留時(shí)間的變化或電流的變化進(jìn)行測定。這使得能夠?qū)捂満碗p鏈多核苷酸區(qū)域進(jìn)行辨別。

對于(v)，可以測定任何修飾的存在與否。所述方法優(yōu)選包括確定所述多核苷酸是否通過甲基化、氧化、損傷、用一個(gè)或多個(gè)蛋白質(zhì)或一個(gè)或多個(gè)標(biāo)記物、標(biāo)簽或間隔區(qū)進(jìn)行了修飾。特定的修飾將導(dǎo)致與孔的特定的相互作用，這可使用下述方法測定。例如，可以基于孔與每個(gè)核苷酸的相互作用過程中流經(jīng)所述孔的電流，來區(qū)分甲基胞嘧啶和胞嘧啶。

該方法可以使用適于研究膜/孔系統(tǒng)——其中孔存在于膜中——的任何設(shè)備進(jìn)行。該方法可以使用適合于跨膜孔傳感的任何設(shè)備進(jìn)行。例如，所述設(shè)備包括含水溶液的腔室，以及將所述腔室分成兩個(gè)區(qū)段的屏障。所述屏障典型地具有開孔，含所述孔的膜形成于所述開孔中。替代地，所述屏障形成其中存在孔的膜。

該方法可使用國際申請No.PCT/GB08/000562(WO 2008/102120)中描述的設(shè)備進(jìn)行。

所述方法可以包括測量所述多核苷酸相對于所述孔移動(dòng)時(shí)穿過所述孔的電流。因此，所述設(shè)備也可以包括能夠施加電位并測量穿過所述膜和孔的電信號(hào)的電路。所述方法可以使用膜片鉗或電壓鉗進(jìn)行。所述方法優(yōu)選涉及使用電壓鉗。

本發(fā)明方法可包括，當(dāng)多核苷酸相對于孔移動(dòng)時(shí)，測量穿過該孔的電流。用于測量穿過跨膜蛋白孔的離子電流的適宜條件是本領(lǐng)域已知的并在實(shí)施例中公開。所述方法通常通過跨膜和孔施加電壓來實(shí)施。使用的電壓通常為+5V到-5V，例如+4V到-4V，+3V到-3V或+2V到-2V。使用的電壓通常為-600mV到+600mV或-400mV到+400mV。使用的電壓優(yōu)選在具有以下下限和上限的范圍內(nèi)，所述下限選自-400mV，-300mV，-200mV，-150mV，-100mV，-50mV，-20mV和0mV，所述上限獨(dú)立地選自+10mV，+20mV，+50mV，+100mV，+150mV，+200mV，+300mV和+400mV。使用的電壓更優(yōu)選在100mV到240mV范圍內(nèi)，最優(yōu)選在120mV到220mV范圍內(nèi)。可通過對孔施加提高的電位來增加對不同核苷酸的鑒別力。

所述方法通常在任何載荷子諸如金屬鹽(如堿金屬鹽)、鹵鹽(如氯化物鹽(如堿金屬氯化物鹽))的存在下實(shí)施。載荷子可包括離子液體或有機(jī)鹽，例如四甲基氯化銨、三甲基苯基氯化銨、苯基三甲基氯化銨或1-乙基-3-甲基氯化咪唑鎓。在上述示例性設(shè)備中，所述鹽以水溶液存在于室中。通常使用氯化鉀(KCl)、氯化鈉(NaCl)、氯化銫(CsCl)，或亞鐵氰化鉀和鐵氰化鉀的混合物。優(yōu)選KCl、NaCl，和亞鐵氰化鉀和鐵氰化鉀的混合物。載荷子可以是跨所述膜不對稱的。例如，所述載荷子的類型和/或濃度在膜的每一側(cè)上可以不同。

所述鹽濃度可以是飽和的。所述鹽濃度可以是3M或更低并且通常為0.1-2.5M，0.3-1.9M，0.5-1.8M，0.7-1.7M，0.9-1.6M或1M-1.4M。所述鹽濃度優(yōu)選為150mM-1M。所述方法優(yōu)選使用至少0.3M，例如至少0.4M，至少0.5M，至少0.6M，至少0.8M，至少1.0M，至少1.5M，至少2.0M，至少2.5M或至少3.0M的鹽濃度而實(shí)施。高的鹽濃度提供高的信噪比并使得電流能在正常電流波動(dòng)的背景下識(shí)別代表核苷酸存在。

所述方法通常在緩沖劑的存在下實(shí)施。在上述示例性設(shè)備中，所述緩沖劑以水溶液存在于所述室中。任何緩沖劑均可用在本發(fā)明方法中。通常，所述緩沖劑為磷酸鹽緩沖液。另一個(gè)適宜的緩沖劑為HEPES和三羥甲基氨基甲烷-HCl(Tris-HCl)緩沖液。所述方法通常在4.0-12.0，4.5-10.0，5.0-9.0，5.5-8.8，6.0-8.7或7.0-8.8或7.5-8.5的pH下實(shí)施。所用pH優(yōu)選約為7.5。

所述方法可在0℃-100℃、15℃-95℃、16℃-90℃、17℃-85℃、18℃-80℃、19℃-70℃或20℃-60℃實(shí)施。所述方法通常在室溫實(shí)施。所述方法可選地在能支持酶功能的溫度下，例如約37℃實(shí)施。

步驟(b)優(yōu)選包括使第一多核苷酸與控制第一多核苷酸與膜中存在的檢測器的相互作用的多核苷酸結(jié)合蛋白相互作用，和/或步驟(e)優(yōu)選包括允許第二多核苷酸與控制第二多核苷酸與膜中存在的檢測器的相互作用的多核苷酸結(jié)合蛋白相互作用。

更優(yōu)選地，所述方法包括(a)使用一個(gè)或多個(gè)錨將第一樣品中的第一多核苷酸偶聯(lián)至膜；(b)使所述第一多核苷酸與跨膜孔接觸，使得所述第一多核苷酸移動(dòng)穿過所述孔；(c)隨著所述第一多核苷酸相對于所述孔移動(dòng)獲取一個(gè)或多個(gè)測量值，其中所述測量值代表所述第一多核苷酸的一個(gè)或多個(gè)特征，由此表征所述第一多核昔酸；(d)使所述第一多核苷酸與所述膜解偶聯(lián)；(e)使用一個(gè)或多個(gè)錨將第二樣品中的第二多核苷酸偶聯(lián)至所述膜；(f)使所述第二多核昔酸與跨膜孔接觸，使得所述第二多核苷酸移動(dòng)穿過所述孔；和(g)隨著所述第二多核苷酸相對于所述孔移動(dòng)獲取一個(gè)或多個(gè)測量值，其中所述測量值代表所述第二多核苷酸的一個(gè)或多個(gè)特征，由此表征所述第二多核苷酸。在該實(shí)施方案中，步驟(b)優(yōu)選包括使第一多核苷酸與跨膜孔和多核苷酸結(jié)合蛋白質(zhì)接觸，使得所述蛋白質(zhì)控制第一多核苷酸穿過孔的移動(dòng)，和/或步驟(f)優(yōu)選包括使第二多核苷酸與跨膜孔和多核苷酸結(jié)合蛋白質(zhì)接觸，使得所述蛋白質(zhì)控制第二多核苷酸穿過所述孔的移動(dòng)。

所述多核苷酸結(jié)合蛋白可以是能夠結(jié)合到多核苷酸并控制其移動(dòng)穿過所述孔的任何蛋白質(zhì)?，F(xiàn)有技術(shù)中可直接確定蛋白質(zhì)是否結(jié)合到多核苷酸。該蛋白質(zhì)通常與多核苷酸相互作用并修改其至少一種性質(zhì)。該蛋白質(zhì)可通過使多核苷酸裂解形成各單個(gè)核昔酸或短鏈核苷酸如二核苷酸或三核苷酸而修飾該多核苷酸。該部分可以通過將多核苷酸定向到或?qū)⑵湟苿?dòng)到特定位置，即控制其移動(dòng)，而修飾所述多核苷酸。

所述多核苷酸結(jié)合蛋白優(yōu)選地衍生自多核苷酸處理酶。多核苷酸處理酶是能夠與多核苷酸相互作用并修飾其至少一種性質(zhì)的多肽。該酶可以通過使多核苷酸裂解形成各單個(gè)核昔酸或短鏈核苷酸如二核苷酸或三核苷酸而修飾該多核苷酸。該酶可以通過使其定向到或?qū)⑵湟苿?dòng)到特定位置而修飾所述多核苷酸。所述多核苷酸處理酶不需要顯示酶活性，只要它能夠結(jié)合多核苷酸并控制其移動(dòng)穿過所述孔即可。例如，該酶可以被修飾，以去除其酶活性，或者可以在防止其作為酶發(fā)揮作用的條件下使用。這樣的條件在下面更詳細(xì)地論述。

所述多核苷酸處理酶優(yōu)選衍生自溶核酶。在酶的構(gòu)建體中使用的所述多核苷酸處理酶更優(yōu)選衍生自酶分類(EC)組3.1.11，3.1.13，3.1.14，3.1.15，3.1.16，3.1.21，3.1.22，3.1.25，3.1.26，3.1.27，3.1.30和3.1.31中的任意成員。所述酶可以是國際申請PCT/GB10/000133(公開號(hào)為WO 2010/086603)中公開的任意酶。

優(yōu)選的酶為聚合酶、核酸外切酶、解旋酶和拓?fù)洚悩?gòu)酶，例如促旋酶。合適的酶包括，但不限于，來自大腸桿菌的核酸外切酶I(SEQ ID NO：11)、來自大腸桿菌的核酸外切酶III(SEQ ID NO：13)、來自嗜熱棲熱菌的RecJ(SEQ ID NO：15)，和噬菌體λ核酸外切酶(SEQ ID NO：17)及其變體。包含SEQ ID NO：15或其變體所示序列的三個(gè)亞基相互作用形成三聚體核酸外切酶。所述酶優(yōu)選是Phi29DNA聚合酶(SEQ ID NO：9)或其變體。拓?fù)洚悩?gòu)酶優(yōu)選是部分分類(EC)組5.99.1.2和5.99.1.3中的任意成員。

所述酶最優(yōu)選衍生自解旋酶，如Hel308Mbu(SEQ ID NO：18)，Hel308Csy(SEQ ID NO：19)，Hel308Mhu(SEQ ID NO：20)，TraI Eco(SEQ ID NO：21)，XPD Mbu(SEQ ID NO：22)或其變體。本發(fā)明可以使用任何解旋酶。所述解旋酶可以是或者衍生自Hel308解旋酶、RecD解旋酶，例如TraI解旋酶或TrwC解旋酶、XPD解旋酶或Dda解旋酶。所述解旋酶可以是國際申請No.PCT/GB2012/052579(公開號(hào)WO 2013/057495)；PCT/GB2012/053274(公開號(hào)WO 2013/098562)；PCT/GB2012/053273(公開號(hào)WO2013098561)；PCT/GB2013/051925(公開號(hào)WO 2014/013260)；PCT/GB2013/051924(公開號(hào)WO 2014/013259)；PCT/GB2013/051928(公開號(hào)WO 2014/013262)；以及PCT/GB2014/052736中公開的解旋酶、經(jīng)修飾的解旋酶或解旋酶構(gòu)建體中的任意成員。

所述解旋酶優(yōu)選包含SEQ ID NO：25(Trwc Cba)或其變體中所示序列，SEQ ID NO：18(Hel308Mbu)或其變體中所示序列，或者SEQ ID NO：24(Dda)或其變體中所示序列。各變體可以以下文針對跨膜孔所述任意方式不同于天然序列。SEQ ID NO：24的優(yōu)選變體包含E94C/A360C和之后的(ΔM1)G1G2(即M1缺失，然后添加G1和G2)或E94C/A360C/C109A/C136A和之后的(ΔM1)G1G2。

本發(fā)明可以使用任何數(shù)目的解旋酶。例如，可以使用1，2，3，4，5，6，7，8，9，10或更多個(gè)解旋酶。在一些實(shí)施方案中，可使用其他數(shù)目的解旋酶。

本發(fā)明方法優(yōu)選包括使第一多核苷酸分析物和/或第二多核昔酸分析物與兩個(gè)或更多個(gè)解旋酶接觸。所述兩個(gè)或更多個(gè)解旋酶通常為相同解旋酶。所述兩個(gè)或更多個(gè)解旋酶可以是不同解旋酶。

所述兩個(gè)或更多個(gè)解旋酶可以是上文提及的解旋酶的任意組合。所述兩個(gè)或更多個(gè)解旋酶可以是兩個(gè)或更多個(gè)Dda解旋酶。所述兩個(gè)或更多個(gè)解旋酶可以是一個(gè)或多個(gè)Dda解旋酶和一個(gè)或多個(gè)TrwC解旋酶。所述兩個(gè)或更多個(gè)解旋酶可以是相同解旋酶的不同變體。

所述兩個(gè)或更多個(gè)解旋酶優(yōu)選彼此連接。所述兩個(gè)或更多個(gè)解旋酶更優(yōu)選彼此共價(jià)連接。所述解旋酶可以以任何順序使用任何方法連接。用于本發(fā)明的優(yōu)選的解旋酶構(gòu)建體在國際申請PCT/GB2013/051925(公開號(hào)WO 2014/013260)；PCT/GB2013/051924(公開號(hào)WO 2014/013259)；PCT/GB2013/051928(公開號(hào)WO 2014/013262)；以及PCT/GB2014/052736中有描述。

SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25的變體是具有下述氨基酸序列的酶：所述氨基酸序列從SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25變化而來并保留多核苷酸結(jié)合能力。這可以使用本領(lǐng)域已知的任何方法測定。例如，使所述變體與多核苷酸接觸，然后測量其結(jié)合到多核苷酸并沿多核苷酸移動(dòng)的能力。所述變體可以包括能促進(jìn)對多核苷酸的結(jié)合和/或促進(jìn)其在高鹽濃度和/或室溫下活性的修飾。各變體可以被修飾為，使其結(jié)合多核苷酸(即保留多核苷酸結(jié)合能力)，但不具有解旋酶功能(即當(dāng)提供了有助于移動(dòng)的所有必要組分例如ATP和Mg²⁺時(shí)仍不能沿多核苷酸移動(dòng))。這種修飾是本領(lǐng)域公知的。例如，對解旋酶中Mg²⁺結(jié)合結(jié)構(gòu)域的修飾通常導(dǎo)致不具有解旋酶功能的變體。這些類型的變體可用作分子制動(dòng)器(見下文)。

基于氨基酸同一性，在SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25的氨基酸序列的整個(gè)長度上，變體將優(yōu)選與該序列至少50％同源。更優(yōu)選，基于氨基酸同一性，所述變體多肽在整個(gè)長度上可以與SEQ ID NO：9，11，13，15，17，18，19，20，21，22，23，24或25的氨基酸序列，至少55％，至少60％至少65％，至少70％，至少75％至少80％，至少85％，至少90％且更優(yōu)選至少95％，97％或99％同源。在200或更多，例如230，250，270，280，300，400，500，600，700，800，900或1000或更多個(gè)連續(xù)氨基酸片段上，可以具有至少為80％，例如至少85％，90％或95％的氨基酸同源性(“嚴(yán)格同源性”)。同源性可如上文所述進(jìn)行確定。所述變體可以上文針對SEQ ID NO：2和4論述的任意方式不同于野生型序列。所述酶可以共價(jià)連接到孔?？墒褂萌魏畏椒▽⑺雒腹矁r(jià)連接到孔。

優(yōu)選的分子制動(dòng)器是TrwC Cba-Q594A(SEQ ID NO：25，具有突變Q594A)。該變異不具有解旋酶的功能(即能結(jié)合多核苷酸，但當(dāng)提供了有助于移動(dòng)的所有必要組分例如ATP和Mg²⁺時(shí)仍不能沿多核苷酸移動(dòng))。

在鏈測序中，所述多核苷酸順著或逆著所施加電位移位穿過所述孔。逐漸地或進(jìn)行性地作用于雙鏈多核苷酸上的核酸外切酶可用于在施加的電位下在所述孔的順側(cè)上使剩余的單鏈穿過，或者在反向電位下在所述孔的反側(cè)上使剩余的單鏈穿過。同樣地，解開雙鏈DNA的解旋酶也可以類似的方式使用。也可以使用聚合酶。還有可能有這樣的測序應(yīng)用：其需要使鏈逆著施加電位移位，但是DNA必須在反向電位或沒有電位的情況下首先被所述酶“捕獲”。然后隨著在結(jié)合之后電位被翻轉(zhuǎn)，所述鏈將從順側(cè)到反側(cè)而穿過所述孔并通過電流保持延伸的構(gòu)造。單鏈DNA核酸外切酶或單鏈DNA依賴性聚合酶可用作分子馬達(dá)，用于以受控且逐步的方式將最近移位的單鏈逆著施加的電位從反側(cè)到順側(cè)穿過所述孔而拉回。

解旋酶(一個(gè)或多個(gè))和分子制動(dòng)器(一個(gè)或多個(gè))

在優(yōu)選實(shí)施方式中，該方法包括：

(a)對第一樣品中的第一多核苷酸提供連接到第一多核苷酸的一個(gè)或多個(gè)解旋酶和連接到第一多核昔酸的一個(gè)或多個(gè)分子制動(dòng)器；

(b)對第二樣品中的第二多核苷酸提供連接到第二多核苷酸的一個(gè)或多個(gè)解旋酶和連接到第二多核苷酸的一個(gè)或多個(gè)分子制動(dòng)器；

(c)使用一個(gè)或多個(gè)錨將第一樣品中的第一多核苷酸偶聯(lián)至膜；

(d)使所述第一多核苷酸與跨膜孔接觸，并跨所述孔施加電位，使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起，并且一起控制所述第一多核昔酸穿過所述孔的移動(dòng)；

(e)隨著所述第一多核苷酸相對于所述孔移動(dòng)，獲取一個(gè)或多個(gè)測量值，其中所述測量值代表所述第一多核苷酸的一個(gè)或多個(gè)特征，由此表征所述第一多核苷酸；

(f)使所述第一多核苷酸與所述膜解偶聯(lián)；

(g)使用一個(gè)或多個(gè)錨將所述第二樣品中的所述第二多核苷酸偶聯(lián)至所述膜；

(h)使所述第二多核苷酸與跨膜孔接觸，并跨所述孔施加電位，使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起，并且一起控制所述第二多核苷酸通過所述孔的移動(dòng)；和

(i)隨著第二多核苷酸相對于所述孔移動(dòng)，獲取一個(gè)或多個(gè)測量值，其中所述測量值代表第二多核苷酸的一個(gè)或多個(gè)特征，由此表征第二多核苷酸。

這種類型的方法在國際申請PCT/GB2014/052737中詳細(xì)討論。

步驟(f)(即第一多核苷酸的解偶聯(lián))可以在步驟(g)之前(即在將第二多核苷酸偶聯(lián)至膜之前)進(jìn)行。步驟(g)可以在步驟(f)之前進(jìn)行。如果第二多核苷酸在第一多核苷酸解偶聯(lián)之前與膜偶聯(lián)，則步驟(f)優(yōu)選包括從所述膜上選擇性地解偶聯(lián)第一多核苷酸(即，使第一多核苷酸而不是第二多核苷酸與膜解偶聯(lián))。本領(lǐng)域技術(shù)人員可以設(shè)計(jì)在其中實(shí)現(xiàn)選擇性解偶聯(lián)的系統(tǒng)。步驟(f)和(g)可以同時(shí)進(jìn)行。這將在下面更詳細(xì)地討論。

所述一個(gè)或多個(gè)解旋酶可以使上文所述的任何解旋酶。所述一個(gè)或多個(gè)分子制動(dòng)器可以為結(jié)合到多核苷酸并減緩該多核苷酸穿過所述孔的移動(dòng)的任何化合物或分子。所述一個(gè)或多個(gè)分子制動(dòng)器優(yōu)選為一個(gè)或多個(gè)多核苷酸結(jié)合蛋白。所述多核苷酸結(jié)合蛋白可以是能夠結(jié)合到多核苷酸并控制其移動(dòng)穿過所述孔的任何蛋白質(zhì)。現(xiàn)有技術(shù)中可直接確定蛋白質(zhì)是否結(jié)合到多核苷酸。所述蛋白通常與多核苷酸相互作用并修飾所述多核苷酸的至少一種特征。所述蛋白可通過使多核苷酸裂解形成各單個(gè)核苷酸或短鏈核苷酸，如二核苷酸或三核苷酸，來修飾所述多核苷酸。該部分可以通過將多核苷酸定向到或?qū)⑵湟苿?dòng)到特定位置，即控制其移動(dòng)，來修飾所述多核昔酸。

所述多核苷酸結(jié)合蛋白優(yōu)選衍生自多核苷酸處理酶。所述一個(gè)或多個(gè)分子制動(dòng)器可以衍生自上述的任何多核苷酸處理酶。用作分子制動(dòng)器的Phi29聚合酶的經(jīng)修飾的變體(SEQ ID NO：9)在美國專利No.5576204中公開。充當(dāng)分子制動(dòng)器的Phi29聚合酶的經(jīng)修飾的變體(SEQ ID NO：8)在美國專利5,576,204中有公開。所述一個(gè)或多個(gè)分子制動(dòng)器優(yōu)選衍生自解旋酶。

多核苷酸分析物中的間隔區(qū)

所述一個(gè)或多個(gè)解旋酶可以在一個(gè)或多個(gè)間隔區(qū)停滯，如在國際申請No.PCT/GB2014/050175(公開為WO 2014/135838)中論述的。本發(fā)明中可以使用在該國際申請中公開的一個(gè)或多個(gè)解旋酶和一個(gè)或多個(gè)間隔區(qū)的任意構(gòu)造。

雙鏈多核苷酸

第一多核苷酸分析物和/或第二多核苷酸分析物可以是雙鏈的。如果多核苷酸分析物是雙鏈的，則該方法優(yōu)選地還包括在偶聯(lián)步驟之前將發(fā)夾環(huán)適配體連接到多核昔酸的一端并分離多核苷酸的兩條鏈以形成單鏈多核苷酸構(gòu)建體。然后可以允許單鏈多核昔酸構(gòu)建體與根據(jù)本發(fā)明的檢測器相互作用。以這種方式連接和探究(interrogating)在雙鏈構(gòu)建體上的兩條鏈提高了表征的效率和準(zhǔn)確性。在國際申請?zhí)朠CT/GB2010/000160(公開為WO 2010/086622)和PCT/GB2012/051786(公開為WO 2013/014451)中公開了使用發(fā)夾環(huán)適配體進(jìn)行的測序。

前導(dǎo)序列

在偶聯(lián)步驟之前，所述方法優(yōu)選包括將優(yōu)先旋入孔中的前導(dǎo)序列連接到第一和/或第二多核苷酸分析物。前導(dǎo)序列促進(jìn)了本發(fā)明的方法。前導(dǎo)序列被設(shè)計(jì)成優(yōu)先旋入跨膜孔，從而促進(jìn)多核苷酸分析物穿過孔的移動(dòng)。前導(dǎo)序列也可以用于將多核苷酸連接到如上所述的一個(gè)或多個(gè)錨。

前導(dǎo)序列通常包含聚合物。聚合物優(yōu)選帶負(fù)電荷。聚合物優(yōu)選是多核苷酸，例如DNA或RNA，修飾的多核苷酸(例如脫堿基DNA)，PNA，LNA，聚乙二醇(PEG)或多肽。前導(dǎo)序列優(yōu)選包含多核苷酸，更優(yōu)選包含單鏈多核苷酸。前導(dǎo)序列可以包含上述任何多核苷酸。單鏈前導(dǎo)序列最優(yōu)選包含單鏈DNA，例如poly dT部分。前導(dǎo)序列優(yōu)選包含一個(gè)或多個(gè)間隔區(qū)。

前導(dǎo)序列可以是任何長度，但通常10至150個(gè)核苷酸長度，例如20至150個(gè)核苷酸長度。前導(dǎo)序列的長度通常取決于方法中使用的跨膜孔。

雙偶聯(lián)

本發(fā)明的方法可以涉及多個(gè)雙鏈多核苷酸的雙偶聯(lián)。在優(yōu)選的實(shí)施方案中，本發(fā)明涉及表征多個(gè)雙鏈多核苷酸。該方法優(yōu)選地包括：

(a)在第一樣品中提供第一雙鏈多核苷酸，其一端具有Y適配體并且另一端具有發(fā)夾環(huán)適配體，其中所述Y適配體包含用于將所述多核苷酸偶聯(lián)至所述膜的一個(gè)或多個(gè)第一錨，其中所述發(fā)夾環(huán)適配體包含用于將所述多核苷酸偶聯(lián)至所述膜的一個(gè)或多個(gè)第二錨，并且其中發(fā)夾環(huán)適配體與膜的偶聯(lián)強(qiáng)度大于Y適配體與膜的偶聯(lián)強(qiáng)度；

(b)以步驟(a)中定義的形式在第二樣品中提供第二雙鏈多核苷酸；

(c)將步驟(a)中提供的第一多核苷酸與膜偶聯(lián)；

(d)使步驟(c)中偶聯(lián)的第一多核苷酸與跨膜孔接觸，使得第一多核苷酸的至少一條鏈移動(dòng)通過所述孔；

(e)隨著第一多核苷酸的至少一條鏈相對于所述孔移動(dòng)，獲取一個(gè)或多個(gè)測量值，其中所述測量值代表第一多核苷酸的至少一條鏈的一個(gè)或多個(gè)特征，由此表征第一多核苷酸；

(f)使所述第一多核苷酸與所述膜解偶聯(lián)；

(g)將步驟(b)中提供的第二多核苷酸與所述膜偶聯(lián)；

(h)使在步驟(g)中偶聯(lián)的第二多核苷酸與跨膜孔接觸，使得第二多核苷酸的至少一條鏈移動(dòng)通過所述孔；和

(i)隨著第二多核苷酸的至少一條鏈相對于所述孔移動(dòng)，獲取一個(gè)或多個(gè)測量值，其中所述測量值代表第二多核苷酸的至少一條鏈的一個(gè)或多個(gè)特征，由此表征第二多核苷酸。

這種類型的方法在英國申請1406147.7和1407815.8以及與本申請同時(shí)提交的國際申請中詳細(xì)討論。

所述雙鏈多核苷酸在一端提供有Y適配體，在另一端提供有發(fā)夾環(huán)適配體。Y適配體和/或發(fā)夾環(huán)適配體通常是多核昔酸適配體。它們可以由上述任何多核苷酸形成。

Y適配體通常包含(a)雙鏈區(qū)域和(b)單鏈區(qū)域或在另一端不互補(bǔ)的區(qū)域。如果Y適配體包含單鏈區(qū)域，則其可被描述為具有突出端。在Y適配體中存在非互補(bǔ)區(qū)域給予該適配體Y形狀，因?yàn)閮蓷l鏈通常不像雙鏈部分那樣彼此雜交。Y適配體包括一個(gè)或多個(gè)第一錨。錨在上面更詳細(xì)地討論。

Y適配體優(yōu)選包含優(yōu)先旋入孔中的前導(dǎo)序列。前導(dǎo)序列如上所述。

發(fā)夾環(huán)適配體優(yōu)選包含如上所述的可選擇的結(jié)合部分。發(fā)夾環(huán)適配體和/或可選擇的結(jié)合部分可以包括可以被切下，切割，劈開或水解的區(qū)域，如上文所述。

可以使用本領(lǐng)域已知的任何方法將Y適配體和/或發(fā)夾環(huán)適配體連接到多核苷酸。一個(gè)或兩個(gè)適配體可以使用連接酶如T4DNA連接酶，大腸桿菌DNA連接酶，Taq DNA連接酶，Tma DNA連接酶和9°N DNA連接酶連接?；蛘?，可以使用下面討論的本發(fā)明的方法將適配體添加到多核苷酸。

在優(yōu)選的實(shí)施方案中，所述方法的步驟a)包括修飾雙鏈多核苷酸，使得其一端包含Y適配體和另一端包含發(fā)夾環(huán)適配體。可以使用任何方式的修飾。該方法優(yōu)選包括根據(jù)本發(fā)明修飾雙鏈多核苷酸。這將在下面更詳細(xì)地討論。修飾和表征的方法可以以任何方式組合。

發(fā)夾環(huán)適配體與膜偶聯(lián)(或結(jié)合)強(qiáng)度大于Y適配體與膜偶聯(lián)(或結(jié)合)強(qiáng)度。這可以以任何方式測量。用于測量偶聯(lián)(或結(jié)合)強(qiáng)度的合適方法公開在英國申請1406147.7和1407815.8的實(shí)施例中以及與本申請同時(shí)提交的國際申請中。

發(fā)夾環(huán)適配體的偶聯(lián)(或結(jié)合)強(qiáng)度優(yōu)選是Y適配體偶聯(lián)(或結(jié)合)強(qiáng)度的至少1.5倍，例如Y適配體偶聯(lián)(或結(jié)合)強(qiáng)度的至少兩倍，至少三倍，至少四倍，至少五倍或至少十倍。發(fā)夾環(huán)適配體對于膜的親和常數(shù)(Kd)優(yōu)選是Y適配體的親和常數(shù)的至少1.5倍，例如多Y適配體偶聯(lián)強(qiáng)度發(fā)至少兩倍，至少三倍，至少四倍，至少五倍或至少十倍。

有幾種方式使發(fā)夾環(huán)適配體比Y適配體更強(qiáng)地偶聯(lián)(或結(jié)合)到膜。例如，發(fā)夾環(huán)適配體可以包括比Y適配體更多的錨。例如，發(fā)夾環(huán)適配體可以包括2，3或更多個(gè)第二錨，而Y適配體可以包括一個(gè)第一錨。

所述一個(gè)或多個(gè)第二錨與膜的偶聯(lián)(或結(jié)合)強(qiáng)度可大于所述一個(gè)或多個(gè)第一錨偶聯(lián)(或結(jié)合)至膜的強(qiáng)度。一個(gè)或多個(gè)第二錨偶聯(lián)(或結(jié)合)到發(fā)夾環(huán)適配體的強(qiáng)度可以大于一個(gè)或多個(gè)第一錨偶聯(lián)(或結(jié)合)到Y(jié)適配體的強(qiáng)度。一個(gè)或多個(gè)第一錨和一個(gè)或多個(gè)第二錨可以通過雜交連接到它們各自的適配體，并且一個(gè)或多個(gè)第二錨的雜交強(qiáng)度大于一個(gè)或多個(gè)第一錨的雜交強(qiáng)度。這些實(shí)施例的任何組合也可以用于本發(fā)明中。偶聯(lián)(或結(jié)合)強(qiáng)度可以使用本領(lǐng)域已知的技術(shù)來測量。

一個(gè)或多個(gè)第二錨優(yōu)選地包括一個(gè)或多個(gè)基團(tuán)，其偶聯(lián)(或結(jié)合)到膜的強(qiáng)度大于一個(gè)或多個(gè)第一錨的一個(gè)或多個(gè)基團(tuán)偶聯(lián)(或結(jié)合)到膜上的強(qiáng)度。在優(yōu)選的實(shí)施方案中，發(fā)夾環(huán)適配體/一個(gè)或多個(gè)第二錨使用膽固醇與膜偶聯(lián)(或結(jié)合)，Y適配體/一個(gè)或多個(gè)第一錨使用棕櫚酸酯與膜偶聯(lián)(或結(jié)合)。膽固醇比棕櫚酸酯更強(qiáng)地結(jié)合到三嵌段共聚物膜和脂質(zhì)膜。在一個(gè)替換的實(shí)施方案中，發(fā)夾環(huán)適配體/一個(gè)或多個(gè)第二錨使用單酰基物質(zhì)例如棕櫚酸酯偶聯(lián)(或結(jié)合)到膜上，并且Y適配體/一個(gè)或多個(gè)第一錨使用二?；镔|(zhì)，例如二棕櫚酰磷脂酰膽堿偶聯(lián)(或結(jié)合)所述膜。

添加發(fā)夾環(huán)和前導(dǎo)序列

在偶聯(lián)步驟之前，雙鏈多核苷酸分析物優(yōu)選與MuA轉(zhuǎn)座酶和雙鏈MuA底物組接觸，其中底物組中的一部分底物是包含前導(dǎo)序列的Y適配體，并且底物組中的一部分底物是發(fā)夾環(huán)適配體。轉(zhuǎn)座酶片段化雙鏈多核苷酸分析物并將MuA底物連接到片段的一端或兩端。這產(chǎn)生了多個(gè)修飾的雙鏈多核苷酸，其一端包含前導(dǎo)序列，在另一端包含發(fā)夾環(huán)。然后可以使用本發(fā)明的方法研究修飾的雙鏈多核苷酸。

這些基于MuA的方法公開在國際申請?zhí)朠CT/GB2014/052505(公開為WO2015022544)中。它們還在英國申請1406147.7和1407815.8中，以及與本申請同時(shí)提交的國際申請(ONT IP 056)中詳細(xì)討論。

修飾的多核苷酸分析物

在表征之前，可以在通過使用多核苷酸分析物作為模板使聚合酶形成修飾的多核苷酸分析物的條件下，使多核苷酸分析物與聚合酶及游離核苷酸組接觸來修飾第一多核苷酸分析物和/或第二多核苷酸分析物，其中當(dāng)形成修飾的多核苷酸分析物時(shí)，聚合酶用不同的核苷酸種類替換多核苷酸分析物中的一個(gè)或多個(gè)核苷酸種類。然后可以如步驟a)和/或d)中那樣將修飾的多核苷酸分析物偶聯(lián)到膜上。這種類型的修改在國際申請No.PCT/GB2015/050483中描述?？梢允褂蒙鲜鋈魏尉酆厦?。聚合酶優(yōu)選Klenow或9o North。

在其中聚合酶使用模板多核苷酸作為模板形成修飾的多核苷酸的條件下，使模板多核苷酸與聚合酶接觸。這樣的條件是本領(lǐng)域已知的。例如，多核苷酸通常與可商購的聚合酶緩沖液中的聚合酶接觸，例如來自New England的緩沖液。對于Klenow，溫度優(yōu)選為20至37℃，或者，對于9o North，溫度優(yōu)選為60至75℃。引物或3′發(fā)夾通常用作聚合酶延伸時(shí)的成核點(diǎn)。

使用跨膜孔進(jìn)行的多核苷酸的表征，例如測序，通常包括分析由k個(gè)核苷酸組成的聚合物單元，其中k是正整數(shù)(即“k-聚體”)。這在國際申請?zhí)朠CT/GB2012/052343(公開為WO 2013/041878)中討論。盡管期望在不同k聚體的電流測量值之間具有清楚的分離，但是通常這些測量值中的一些重疊的。特別是在k聚體中具有高數(shù)量的聚合物單元，即高k值時(shí)，變得難以分辨由不同k聚體產(chǎn)生的測量值以確定關(guān)于多核苷酸的導(dǎo)出信息，例如評估該多核苷酸的基本序列(underlying sequence)。

通過將模板多核苷酸分析物中的一個(gè)或多個(gè)核苷酸物質(zhì)用經(jīng)修飾多核苷酸分析物中的不同核苷酸物質(zhì)替代，所述經(jīng)修飾多核苷酸分析物含有與模板多核昔酸分析物中的k聚體不同的k聚體。所述經(jīng)修飾多核苷酸分析物中的所述不同的k聚體能夠產(chǎn)生與模板多核苷酸分析物中的k聚體不同的電流測量值，由此所述經(jīng)修飾多核苷酸分析物提供不同于模板多核苷酸分析物的信息。來自所述經(jīng)修飾多核苷酸分析物的這些額外信息使得更容易表征所述模板多核苷酸分析物。在一些情況下，所述經(jīng)修飾多核苷酸分析物本身可以更容易地表征。例如，可將所述經(jīng)修飾多核苷酸設(shè)計(jì)為包括其電流測量值之間具有增強(qiáng)的分離或明確的分離的k聚體，或者包括具有降低的噪聲的k聚體。

優(yōu)選實(shí)施方式

本發(fā)明提供了表征兩個(gè)或更多個(gè)雙鏈多核苷酸的方法，包括：

(a)在第一樣品中提供第一雙鏈多核苷酸，其一端具有第一Y適配體且另一端具有第一發(fā)夾環(huán)適配體，其中所述第一Y適配體包含一個(gè)或多個(gè)第一解旋酶和一個(gè)或多個(gè)用于將所述多核苷酸偶聯(lián)至所述膜的第一錨，其中所述第一發(fā)夾環(huán)適配體包含所述一個(gè)或多個(gè)第一分子制動(dòng)器和一個(gè)或多個(gè)用于將所述第一多核苷酸偶聯(lián)至所述膜的第二錨，并且其中所述第一發(fā)夾環(huán)適配體與所述膜的偶聯(lián)強(qiáng)度大于所述第一Y適配體與所述膜的偶聯(lián)強(qiáng)度；

(b)在第二樣品中提供第二雙鏈多核昔酸，其一端具有第二Y適配體且另一端具有第二發(fā)夾環(huán)適配體，其中所述第二Y適配體包含一個(gè)或多個(gè)第二解旋酶和一個(gè)或多個(gè)用于將所述多核苷酸偶聯(lián)至所述膜的第三錨，其中所述第二發(fā)夾環(huán)適配體包含一個(gè)或多個(gè)第二分子制動(dòng)器和一個(gè)或多個(gè)用于將所述第二多核苷酸偶聯(lián)至所述膜的第四錨，并且其中所述第二發(fā)夾環(huán)適配體與所述膜的偶聯(lián)強(qiáng)度大于所述第二Y適配體到所述膜的偶聯(lián)強(qiáng)度；

(c)將所述第一樣品中的所述第一多核昔酸偶聯(lián)至所述膜；

(d)使所述第一多核苷酸與跨膜孔接觸，并跨所述孔施加電位，使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起，并且二者一起控制所述第一多核苷酸穿過所述孔的移動(dòng)；

(e)隨著所述第一多核苷酸相對于所述孔移動(dòng)，獲取進(jìn)行一個(gè)或多個(gè)測量值，其中所述測量值代表所述第一多核苷酸的一個(gè)或多個(gè)特征，由此表征所述第一多核苷酸；

(f)使所述第一多核苷酸與所述膜解偶聯(lián)；

(g)將所述第二樣品中的所述第二多核苷酸偶聯(lián)至所述膜；

(h)使所述第二多核苷酸與跨膜孔接觸，并跨所述孔施加電位，使得所述一個(gè)或多個(gè)解旋酶和所述一個(gè)或多個(gè)分子制動(dòng)器結(jié)合在一起，并且二者一起控制所述第二多核苷酸通過所述孔的移動(dòng)；和

(i)隨著所述第二多核苷酸相對于所述孔移動(dòng)，獲取進(jìn)行一個(gè)或多個(gè)測量值，其中所述測量值代表第二多核苷酸的一個(gè)或多個(gè)特征，由此表征第二多核苷酸。

這結(jié)合了在英國申請1406155.0，1406147.7，1407815.8和1406151.9以及國際申請PCT/GB2014/052737以及當(dāng)時(shí)與本申請共同提交的國際申請(ONT IP056)中公開的方法。其中公開的任何實(shí)施例可以應(yīng)用于優(yōu)選實(shí)施方式。

其他表征方法

在另一個(gè)實(shí)施方案中，第一多核苷酸分析物和/或第二多核苷酸分析物通過當(dāng)聚合酶將核苷酸摻入多核昔酸中時(shí)檢測釋放的標(biāo)記物質(zhì)進(jìn)行表征。聚合酶使用第一和/或第二多核苷酸分析物作為模板。每個(gè)標(biāo)記的物質(zhì)對于每個(gè)核苷酸是特異性的。第一和/或第二多核苷酸分析物與跨膜孔、聚合酶和標(biāo)記的核苷酸接觸，使得當(dāng)通過聚合酶將核昔酸添加到多核苷酸時(shí)，磷酸鹽標(biāo)記的物質(zhì)被順序地釋放，其中磷酸鹽物質(zhì)含有對每個(gè)核苷酸特異性的標(biāo)記。聚合酶可以是上述聚合酶中的任何一種。使用孔檢測磷酸鹽標(biāo)記的物質(zhì)，從而表征第一和/或第二多核苷酸分析物。這種類型的方法公開在歐洲申請?zhí)?3187149.3(公開為EP 2682460)中。上面討論的任何實(shí)施例同樣適用于該方法。

涉及膽固醇和環(huán)糊精的方法

本發(fā)明還提供了將使用包含膽固醇的錨偶聯(lián)到膜上的分析物從膜解偶聯(lián)的方法，包括使分析物與環(huán)糊精或其衍生物接觸，由此使該分析物與膜解偶聯(lián)。上述任何實(shí)施方案，特別是涉及分析物、錨、環(huán)糊精或其衍生物和膜的那些實(shí)施方案，同樣適用于該方法。分析物優(yōu)選是多核苷酸。多核苷酸優(yōu)選包含如上定義的前導(dǎo)序列。膽固醇錨優(yōu)選包含與前導(dǎo)序列雜交的多核苷酸序列。多核苷酸序列優(yōu)選與錨中的膽固醇共價(jià)連接。

試劑盒

本發(fā)明還提供了用于確定兩個(gè)或更多個(gè)樣品中兩個(gè)或更多個(gè)分析物的存在、不存在或一個(gè)或多個(gè)特征的試劑盒，其包含(a)膜，(b)一個(gè)或多個(gè)錨，其能夠?qū)蓚€(gè)或多個(gè)更多的分析物偶聯(lián)到膜，例如能夠?qū)⒌谝环治鑫锱悸?lián)到膜的一個(gè)或多個(gè)第一錨和能夠?qū)⒌诙治鑫锱悸?lián)到膜的一個(gè)或多個(gè)第二錨，以及(c)一個(gè)或多個(gè)試劑，能夠從膜解偶聯(lián)所述兩個(gè)或更多個(gè)分析物中的至少一個(gè)，例如兩個(gè)。一個(gè)或多個(gè)錨和一個(gè)或多個(gè)試劑可以是上文參照本發(fā)明的方法討論的那些中的任何一個(gè)。

試劑盒優(yōu)選進(jìn)一步包括檢測器，例如跨膜孔。上面討論的任何檢測器可以在試劑盒中。

試劑盒優(yōu)選地還包含能夠優(yōu)先旋入跨膜孔的發(fā)夾環(huán)和/或前導(dǎo)序列。試劑盒優(yōu)選還包含多核苷酸結(jié)合蛋白。上文討論了優(yōu)選的發(fā)夾環(huán)，前導(dǎo)序列和多核苷酸結(jié)合蛋白。

以上關(guān)于本發(fā)明的方法討論的任何實(shí)施方案同樣適用于試劑盒。試劑盒可以進(jìn)一步包含膜的組分，例如兩親性層或三嵌段共聚物膜的組分。

本發(fā)明的試劑盒可另外包括一種或多種能實(shí)施上述任何實(shí)施方案的其他試劑或儀器。所述試劑或儀器包括以下中的一種或多種：合適的緩沖液(水性溶液)、用于從受體獲得樣本的工具(如含有針的導(dǎo)管或儀器)、用于擴(kuò)增和/或表達(dá)多核苷酸的工具，上文限定的膜，或者電壓鉗或膜片鉗設(shè)備。試劑可以干態(tài)存在于所述試劑盒中，使得液體樣本使該試劑重懸(resuspend)?？蛇x地，所述試劑盒還可包括使該試劑盒能在本發(fā)明方法中使用的說明書或關(guān)于該方法可以用于哪種有機(jī)體的詳細(xì)資料。

以下實(shí)施例用于說明本發(fā)明。

實(shí)施例

實(shí)施例1

該實(shí)施例顯示了對照實(shí)驗(yàn)，其說明了通過在實(shí)驗(yàn)系統(tǒng)中存在甲基-β-環(huán)糊精，沒有阻止溶液中未偶聯(lián)至膜的游離DNA進(jìn)入納米孔。

材料和方法

在緩沖液(600mM KCl，25mM磷酸鉀，75mM亞鐵氰化鉀(II)，25mM鐵氰化鉀(III)，pH8.0)中在15℃的溫度下從插入嵌段共聚物中的單個(gè)MspA納米孔MS(B1-G75S/G77S/L88N/Q126R)8MspA(MspA-B2C)(具有突變G75S/G77S/L88N/Q126R的SEQ ID NO：2)獲得電測量值。在實(shí)現(xiàn)單個(gè)孔插入嵌段共聚物之后，然后將緩沖液(1mL，600mM KCl，25mM磷酸鉀，75mM亞鐵氰化鉀(II)，25mM鐵氰化鉀(III)pH8.0)流過系統(tǒng)以去除任何過量的MspA-B2C納米孔。將兩個(gè)DNA樣品(100nM，1-SEQ ID NO：26和SEQ ID NO：29和2-SEQ ID NO：27，在其5′端連接到4個(gè)iSp18間隔區(qū)，所述間隔區(qū)在其另一端連接到SEQ ID NO：28的3′端)加入到系統(tǒng)中，實(shí)驗(yàn)在施加的120mV電位下運(yùn)行30分鐘。然后用甲基-β-環(huán)糊精(100μM)和濃度為100nM的DNA樣品1和2以500μL的總體積沖洗該系統(tǒng)，實(shí)驗(yàn)在施加的120mV電位下進(jìn)行另外30分鐘。然后用兩個(gè)1mL甲基-β-環(huán)糊精(100μM)沖洗液和濃度為100nM的DNA樣品1和2沖洗該系統(tǒng)。

除了對于所有包含甲基-β-環(huán)糊精的步驟之外，進(jìn)行與上述相似的對照實(shí)驗(yàn)，僅加入DNA樣品，沒有甲基-β-環(huán)糊精沖洗流過該系統(tǒng)。

結(jié)果

其中僅將游離DNA加入系統(tǒng)的對照實(shí)驗(yàn)一致地在電流軌跡中表現(xiàn)出短尖峰，該鋒對應(yīng)于DNA在所施加的電位下移位穿過納米孔。這說明，每次用DNA樣品1和2沖洗納米孔系統(tǒng)都觀察到DNA移位。

進(jìn)行這些對照以確認(rèn)，觀察到的DNA移位數(shù)目的減少(參見實(shí)施例4)是由于甲基-β-環(huán)糊精從膜表面去除膽固醇，而不是防止鏈進(jìn)入孔。該對照測試了環(huán)糊精是否可以沿著DNA的長度結(jié)合，阻礙DNA螺旋穿過孔的能力，并且因此防止該鏈被檢測到，但是它仍然連接在膜上。在這些實(shí)驗(yàn)中，使用了游離DNA，其沒有錨將其偶聯(lián)到膜上，如果環(huán)糊精的相互作用特異性地限于膽固醇，則在這種情況下環(huán)糊精應(yīng)該對DNA沒有影響。因此，觀察到的DNA移位數(shù)目的任何減少都是由于DNA主體的結(jié)合。在存在或不存在環(huán)糊精的情況下觀察到DNA移位數(shù)目沒有差異，這表明存在于系統(tǒng)中的環(huán)糊精不結(jié)合游離DNA，不阻止其穿過納米孔的移位。

實(shí)施例2

該實(shí)施例顯示了進(jìn)一步的對照實(shí)驗(yàn)，其說明了當(dāng)將偶聯(lián)的DNA的第一樣品加入到納米孔系統(tǒng)中，然后加入第二樣品，而不用沒有DNA存在的解偶聯(lián)劑或緩沖液沖洗系統(tǒng)時(shí)，在限定的時(shí)期內(nèi)檢測到的解旋酶控制的DNA移動(dòng)的數(shù)目保持相當(dāng)恒定，兩個(gè)樣品都觀察到解旋酶控制的DNA移動(dòng)。

材料和方法

本研究中使用的鏈來自λ基因組的45,042bp和48,487bp之間的區(qū)域。通過聚合酶PCR方法制備分析物，以根據(jù)需要在模板和模板互補(bǔ)鏈中每一個(gè)的限定末端包含雜交位點(diǎn)。對λ基因組DNA進(jìn)行PCR。

使用KAPA HiFi 2x Master mix，λDNA(NEB)和引物SEQ ID NO：32和SEQ ID NO：33制備DNA模板(SEQ ID NO：31，其對應(yīng)于與SEQ ID NO：47雜交的標(biāo)記為A1的鏈的序列，SEQ ID NO：47對應(yīng)于標(biāo)記為A2的鏈的序列，參見圖1(1))。使反應(yīng)循環(huán)20次，通過在Sephacryl S1000柱上凝膠過濾而純化正確大小的產(chǎn)物，并使用Millipore Ultracel 15 50kDa濃縮器濃縮至0.25mg/ml。

根據(jù)相同的反應(yīng)混合物制備用于電生理學(xué)實(shí)驗(yàn)的DNA構(gòu)建體(X和Y)；2x LongAmp Taq master mix，300nM引物1和2或3和4，1.2ng ul^-1 DNA模板(SEQ ID NO：31，其對應(yīng)于與SEQ ID NO：47雜交的標(biāo)記A1的鏈的序列，SEQ ID NO：47對應(yīng)于標(biāo)記A2的鏈的序列，參見圖1(1))。DNA構(gòu)建體均根據(jù)相同的循環(huán)程序擴(kuò)增；94℃2分鐘，[94℃15秒，58℃30秒，65℃2分鐘]₁₂和65℃5分鐘。DNA構(gòu)建體根據(jù)制造商的說明書全部從0.8％瓊脂糖凝膠中純化(Qiagen Gel Extraction試劑盒)，然后SPRI根據(jù)制造商的說明書進(jìn)行純化(Agencourt AMPure珠)。

對于DNA構(gòu)建體X＝SEQ ID NO：34，其3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在其相對端連接到到SEQ ID NO：35的5′端；SEQ ID NO：35在3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在其相對端連接到四個(gè)5-硝基吲哚，5-硝基吲哚連接到SEQ ID NO：39的3′端。用于產(chǎn)生構(gòu)建體X的引物是引物1——SEQ ID NO：34，其3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在其另一端連接到SEQ ID NO：35的5′端；SEQ ID NO：35還在3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在其相對端連接到四個(gè)5-硝基吲哚，5-硝基吲哚連接到SEQ ID NO：36的5′端，和引物2——SEQ ID NO：37，其3′端連接到四個(gè)5-硝基吲哚，5-硝基吲哚在相對端連接到SEQ ID NO：38的5′端。

然后將構(gòu)建體X與SEQ ID NO：41雜交，所述SEQ ID NO：41在3′端連接到6個(gè)iSp18間隔區(qū)，所述間隔區(qū)在其相對端連接到兩個(gè)胸腺嘧啶和3′膽固醇TEG(圖1(2)示出了構(gòu)建體X的卡通示意圖)。將系鏈在5倍過量下在室溫在25mM磷酸鉀緩沖液，151mM氯化鉀，pH 8.0中退火10分鐘。

對于DNA構(gòu)建體Y＝SEQ ID NO：34，其3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在相對端連接到在SEQ ID NO：37的5′端；SEQ ID NO：37在3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在其相對端連接到四個(gè)5-硝基吲哚，5-硝基吲哚連接到SEQ ID NO：40的5′端。用于產(chǎn)生構(gòu)建體Y的引物是引物3——SEQ ID NO：34，其3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在其相對端連接到SEQ ID NO：37的5′端；SEQ ID NO：37還在3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在相對端連接到四個(gè)5-硝基吲哚，5-硝基吲哚連接到SEQ ID NO：38的5′端，和引物4——SEQ ID NO：35，在3′端連接到四個(gè)5-硝基吲哚，5-硝基吲哚在相對端連接到SEQ ID NO：36的5′端。

然后將構(gòu)建體Y與SEQ ID NO：30雜交，所述SEQ IDNO：30在3′端連接到6個(gè)iSp18間隔區(qū)，所述間隔區(qū)在相對端連接到兩個(gè)胸腺嘧啶和3′膽固醇TEG(圖1(3)示出了構(gòu)建體X的卡通示意圖)。將系鏈在5倍過量下在室溫在25mM磷酸鉀緩沖液，151mM氯化鉀，pH 8.0中退火10分鐘。

在建立實(shí)驗(yàn)之前，將具有適當(dāng)系鏈的DNA構(gòu)建體X和Y(儲(chǔ)液濃度20nM，添加至納米孔系統(tǒng)的終濃度為0.1nM)獨(dú)立地用所述試劑孵育。首先，在緩沖液(151mM KCl，25mM磷酸鹽，2mM EDTA，pH8.0)中將所述DNA用T4Dda-E94C/A360C(儲(chǔ)液濃度250nM，添加到納米孔系統(tǒng)的終濃度為1nM，具有突變E94C/A360C的SEQ ID NO：24)在室溫預(yù)孵育5分鐘。5分鐘后，將TMAD(500μM)加入到預(yù)混物中，將混合物再孵育5分鐘。最后，向預(yù)混合物中加入MgCl2(10mM終濃度)，ATP(2.5mM終濃度)和緩沖液(150mM亞鐵氰化鉀(II)，150mM鐵氰化鉀和25mM磷酸鉀pH 8.0)。

在緩沖液(25mM磷酸鉀，150mM亞鐵氰化鉀(II)，150mM鐵氰化鉀(III)，pH 8.0)中從插入嵌段共聚物中的單個(gè)MspA納米孔(MspA-B2C)獲得電測量值。在實(shí)現(xiàn)單個(gè)孔插入嵌段共聚物后，將緩沖液(2mL，25mM磷酸鉀pH 8.0，150mM亞鐵氰化鉀(II)和150mM鐵氰化鉀(III))流過系統(tǒng)以去除任何過量MspA納米孔。然后將酶(T4Dda-E94C/A360C，1nM終濃度)，DNA構(gòu)建體X(0.1nM終濃度)，燃料(MgCl2 10mM終濃度，ATP 2.5mM終濃度)的預(yù)混合物(總共150μL)加入到單納米孔實(shí)驗(yàn)系統(tǒng)中，并且實(shí)驗(yàn)在120mV的保持電位下運(yùn)行2小時(shí)，并監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后，停止實(shí)驗(yàn)，將電位設(shè)置為零，然后將沒有解偶聯(lián)劑或沖洗緩沖液的DNA構(gòu)建體Y/酶預(yù)混物(總共150μL)直接加入系統(tǒng)中。然后將實(shí)驗(yàn)在120mV的保持電位下再運(yùn)行2小時(shí)，并監(jiān)測解旋酶控制的DNA移動(dòng)。

結(jié)果和討論

由λ噬菌體基因組的相同3.8kb片段制備DNA構(gòu)建體X和Y(分別顯示于圖1(a)和(b))。連接適配體以在雙鏈體的一端產(chǎn)生突出的“前導(dǎo)體”，這允許通過孔進(jìn)行捕獲和旋入以及提供酶結(jié)合位點(diǎn)。另一端是鈍化的，因此只有具有前導(dǎo)體的鏈被捕獲并測序。兩個(gè)樣品具有連接到相反末端的適配體，使得前導(dǎo)體連接到DNA構(gòu)建體X中的鏈A1(圖1(2)中所示)和DNA構(gòu)建體Y中的鏈A2(圖1(3)中所示)。這意味著DNA構(gòu)建體X和Y使用僅映射到λ基因組的不同區(qū)域的序列產(chǎn)生可檢測的鏈移動(dòng)。這些移動(dòng)很容易區(qū)分，因此提供了一種方便的方法來識(shí)別兩個(gè)不同的測試樣品；然而，也可以使用具有不同序列的任何其他樣品。

對于DNA構(gòu)建體X和Y，用T4Dda-E94C/A360C觀察到解旋酶控制的DNA移動(dòng)。圖2顯示了納米孔處于未阻斷狀態(tài)(顯示為淺灰色)時(shí)相比于解旋酶DNA移動(dòng)發(fā)生且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程。對于第一個(gè)2100秒，沒有DNA存在于系統(tǒng)中，因此，納米孔處于未阻斷狀態(tài)。在2400秒時(shí)加入DNA構(gòu)建體X，并且在約80％的時(shí)間內(nèi)發(fā)生解旋酶控制的DNA穿過納米孔的移動(dòng)。然后將DNA構(gòu)建體Y在7200秒時(shí)流入納米孔系統(tǒng)，并且在大約80％的時(shí)間內(nèi)觀察到解旋酶控制的DNA穿過納米孔移動(dòng)。

加入構(gòu)建體X后，觀察到的解旋酶控制的DNA移動(dòng)都被認(rèn)定為對應(yīng)于該構(gòu)建體。當(dāng)構(gòu)建體Y流入系統(tǒng)時(shí)，檢測到對應(yīng)于Y的解旋酶控制的DNA移動(dòng)以及對應(yīng)于構(gòu)建體X的顯著數(shù)量的移動(dòng)。實(shí)驗(yàn)數(shù)據(jù)顯示，在整個(gè)實(shí)驗(yàn)中檢測的解旋酶控制的DNA移動(dòng)的速率保持相當(dāng)恒定，通過向系統(tǒng)中加入構(gòu)建體Y，沒有額外的沖洗或解偶聯(lián)劑，兩個(gè)樣品都檢測到解旋酶控制的DNA移動(dòng)。

實(shí)施例3

該實(shí)施例說明當(dāng)將偶聯(lián)的DNA構(gòu)建體X加入到納米孔系統(tǒng)中時(shí)，不可能簡單地通過用大量體積的緩沖液沖洗系統(tǒng)來去除樣品。

材料和方法

如實(shí)施例2所述制備DNA構(gòu)建體X和Y。如實(shí)施例2所述，用酶預(yù)孵育DNA構(gòu)建體，用于產(chǎn)生構(gòu)建體X和構(gòu)建體Y預(yù)混物。

如實(shí)施例2中所述建立納米孔實(shí)驗(yàn)系統(tǒng)。將DNA構(gòu)建體X/酶預(yù)混物(總共300μL)加入到實(shí)驗(yàn)系統(tǒng)中，并且實(shí)驗(yàn)在120mV的保持電位下運(yùn)行2小時(shí)，監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后，停止實(shí)驗(yàn)方案，將電位設(shè)置為零，并將緩沖液(10mL，150mM亞鐵氰化鉀(II)，150mM鐵氰化鉀(III)，25mM磷酸鉀pH 8.0)流過納米孔系統(tǒng)以便試圖去除偶聯(lián)的DNA構(gòu)建體X。在緩沖液沖洗后，在沒有額外的DNA加入系統(tǒng)并在120mV的保持電位下進(jìn)行實(shí)驗(yàn)兩小時(shí)，并監(jiān)測解旋酶控制的DNA移動(dòng)。最后，將DNA構(gòu)建體Y/酶預(yù)混物(總共300μL)加入到實(shí)驗(yàn)系統(tǒng)中，并且在120mV的保持電位下運(yùn)行實(shí)驗(yàn)2小時(shí)，并監(jiān)測解旋酶控制的DNA移動(dòng)。

結(jié)果和討論

對于DNA構(gòu)建體X和Y，用T4Dda-E94C/A360C都觀察到解旋酶控制的DNA移動(dòng)。圖3顯示了納米孔處于未阻斷狀態(tài)(顯示為淺灰色)時(shí)相比于解旋酶DNA移動(dòng)發(fā)生且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程的一部分。對于第一個(gè)2400秒，沒有DNA存在于系統(tǒng)中，因此，納米孔處于未阻斷狀態(tài)。在2700秒時(shí)加入DNA構(gòu)建體X，約80％的時(shí)間發(fā)生解旋酶控制的DNA穿過納米孔移動(dòng)。在7500秒，使緩沖液(10mL)流過系統(tǒng)，然后監(jiān)測納米孔由于解旋酶控制的DNA移動(dòng)而被部分阻斷的時(shí)間百分比。用緩沖液沖洗后，約50％的時(shí)間發(fā)生解旋酶控制的DNA穿過納米孔移動(dòng)。這表明存在于系統(tǒng)中的偶聯(lián)的DNA構(gòu)建體X的量已經(jīng)通過緩沖液沖洗而減少，然而，仍然檢測到大量解旋酶控制的DNA移動(dòng)。在添加DNA構(gòu)建體Y時(shí)，檢測到對應(yīng)于Y的解旋酶控制的DNA移動(dòng)以及對應(yīng)于仍存在于系統(tǒng)中的構(gòu)建體X的大量的解旋酶控制的DNA移動(dòng)。

實(shí)施例4

該實(shí)施例說明了如何使用甲基-β-環(huán)糊精來將使用膽固醇TEG偶聯(lián)到膜上的DNA從膜上解偶聯(lián)。將甲基-β-環(huán)糊精的溶液加入到納米孔系統(tǒng)中，達(dá)1，10和30分鐘，并且在每次孵育后監(jiān)測在限定的時(shí)間段內(nèi)檢測到的解旋酶控制的DNA移動(dòng)的數(shù)量。該實(shí)驗(yàn)說明，即使使用僅一分鐘的孵育時(shí)間，也能檢測到DNA與膜的顯著解偶聯(lián)。

材料和方法

如實(shí)施例2所述制備DNA構(gòu)建體X和Y。如實(shí)施例2所述，用酶預(yù)孵育DNA構(gòu)建體，從而產(chǎn)生構(gòu)建體X和構(gòu)建體Y預(yù)混物。

如實(shí)施例2中所述設(shè)置納米孔實(shí)驗(yàn)系統(tǒng)。將DNA構(gòu)建體X/酶預(yù)混物(總共150μL)加入到實(shí)驗(yàn)系統(tǒng)中，并且實(shí)驗(yàn)在120mV的保持電位下運(yùn)行2小時(shí)，監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后，停止實(shí)驗(yàn)方案，將電位設(shè)置為零，并將甲基-β-環(huán)糊精(150μL，100μM)流至納米孔系統(tǒng)上，并孵育1，10或30分鐘，以嘗試去除偶聯(lián)的DNA構(gòu)建體X。在適當(dāng)?shù)姆跤龝r(shí)間后，將緩沖液(150μL，150mM亞鐵氰化鉀(II)，150mM鐵氰化鉀(III)，25mM磷酸鉀，pH 8.0)沖洗流過系統(tǒng)以去除任何解偶聯(lián)的DNA和過量的甲基-β-環(huán)糊精。在緩沖液沖洗之后，在沒有額外的DNA加入系統(tǒng)并在120mV的保持電位下進(jìn)行實(shí)驗(yàn)兩小時(shí)，并監(jiān)測解旋酶控制的DNA移動(dòng)。最后，將DNA構(gòu)建體Y/酶預(yù)混物(總共150μL)加入到實(shí)驗(yàn)系統(tǒng)中，并且在120mV的保持電位下運(yùn)行實(shí)驗(yàn)2小時(shí)，并監(jiān)測解旋酶控制的DNA移動(dòng)。然后對DNA構(gòu)建體Y重復(fù)相同的解偶聯(lián)過程。

結(jié)果和討論

對于DNA構(gòu)建體X和Y，用T4Dda-E94C/A360C都觀察到解旋酶控制的DNA移動(dòng)。圖4，圖5和圖6顯示了納米孔處于未阻斷狀態(tài)(顯示為淺灰色)時(shí)相比于解旋酶DNA移動(dòng)發(fā)生且納米孔被DNA鏈部分阻斷(顯示為黑色)時(shí)的時(shí)間百分比的實(shí)驗(yàn)時(shí)間進(jìn)程的一部分。圖4，5和6分別對應(yīng)于使用甲基-β-環(huán)糊精的孵育時(shí)間為1，10和30分鐘。對于所有三個(gè)實(shí)驗(yàn)，在添加DNA之前，很少觀察到或沒有觀察到解旋酶控制的DNA移動(dòng)。在添加構(gòu)建體X時(shí)，在約80％的時(shí)間內(nèi)發(fā)生解旋酶控制的DNA穿過納米孔移動(dòng)。在針對不同孵育期和相應(yīng)的緩沖液沖洗而加入甲基-β-環(huán)糊精后，納米孔由于解旋酶控制的DNA移動(dòng)而被部分阻斷的時(shí)間百分比急劇降低至約20％，并且當(dāng)孵育期為30分鐘時(shí)，降至小于10％。這表明甲基-β-環(huán)糊精成功地將使用膽固醇偶聯(lián)至膜的DNA從膜解偶聯(lián)。與用緩沖液沖洗相比，甲基-β-環(huán)糊精顯著地使更多偶聯(lián)的DNA解偶聯(lián)。

在向系統(tǒng)中加入DNA構(gòu)建體Y后，鑒定了對應(yīng)于構(gòu)建體Y的解旋酶控制的DNA移動(dòng)。小部分移動(dòng)被鑒定為對應(yīng)于構(gòu)建體X，然而，相比于其中構(gòu)建體X未從系統(tǒng)中沖洗(參見實(shí)施例2)或其中系鏈的構(gòu)建體X用10mL緩沖液處理以試圖將其從系統(tǒng)中去除(參見實(shí)施例3)的實(shí)驗(yàn)，被鑒定為X的事件的比例顯著減少。對構(gòu)建體Y重復(fù)甲基-β-環(huán)糊精解偶聯(lián)過程，并且還顯示使用該方法可以成功地將構(gòu)建體Y與膜解偶聯(lián)。

實(shí)施例5

該實(shí)施例說明了DNA如何通過結(jié)合有延伸鏈(extender)(其3′端還具有膽固醇)的5′脫硫生物素的鏈霉親和素偶聯(lián)到膜上，其中所述DNA已經(jīng)具有生物素系鏈雜交到其上并且已經(jīng)用鏈霉親和素預(yù)孵育(參見圖7的卡通示意圖)。然后可以通過用游離生物素沖洗系統(tǒng)將該DNA構(gòu)建體與膜解偶聯(lián)。由于生物素對鏈霉親和素比脫硫生物素對鏈霉親和素具有更強(qiáng)的結(jié)合親和力，因此，當(dāng)生物素加入到系統(tǒng)中時(shí)，生物素競爭掉脫硫生物素，這確保了鏈的有效去除。這使得延伸鏈偶聯(lián)到雙層上并可用于將第二DNA構(gòu)建體偶聯(lián)到膜上。

材料和方法

實(shí)施例5中使用的DNA構(gòu)建體顯示于圖7中。通過在50℃下雜交SEQ ID NO：45(50nM，其具有連接至其3′末端的6個(gè)iSp18間隔區(qū)，所述間隔區(qū)在相對端連接到兩個(gè)胸腺嘧啶和3′生物素TEG)與由SEQ ID NO：42組成的DNA鏈10分鐘，然后緩慢冷卻而制備DNA構(gòu)建體，其中所述SEQ ID NO：42在其3′端連接到四個(gè)iSpC3間隔區(qū)，所述間隔區(qū)在相對端連接到SEQ ID NO：43(50nM)的5′端。將鏈霉親和素(終濃度50nM)加入到DNA混合物中(終濃度25nM)，并在室溫下孵育10分鐘。該復(fù)合體將被稱為DNA構(gòu)建體P。

如實(shí)施例2中所述設(shè)置納米孔實(shí)驗(yàn)系統(tǒng)。在120mV的施加電位下、沒有向系統(tǒng)中添加DNA下進(jìn)行對照實(shí)驗(yàn)15分鐘。然后將脫硫生物素延伸鏈(SEQ ID NO：46，其5′端連接有脫硫生物素且3′端連接有膽固醇TEG)加入到納米孔系統(tǒng)中，實(shí)驗(yàn)運(yùn)行15分鐘，使其偶聯(lián)到膜。將DNA構(gòu)建體P加入到實(shí)驗(yàn)系統(tǒng)(25nM)中，并且實(shí)驗(yàn)在120mV的施加電位下運(yùn)行30分鐘。然后向系統(tǒng)中加入游離生物素(50μM)，實(shí)驗(yàn)進(jìn)行另外30分鐘。在生物素孵育后，使緩沖液流過系統(tǒng)(1mL，625mM KCl，100mM HEPES，pH8)以去除任何過量的生物素和解偶聯(lián)的DNA。

結(jié)果和討論

該實(shí)驗(yàn)說明了從膜上解偶聯(lián)DNA構(gòu)建體的另一種方法。圖8示出了上述完整實(shí)驗(yàn)的電流軌跡。圖9示出了前述實(shí)驗(yàn)步驟的幾個(gè)連續(xù)快照。圖9(A)顯示當(dāng)系統(tǒng)中不存在DNA時(shí)，納米孔是開放的并且顯示出幾個(gè)區(qū)塊(block)。*1標(biāo)記了實(shí)驗(yàn)中當(dāng)將延伸的脫硫生物素添加到系統(tǒng)中的點(diǎn)，未觀察到對應(yīng)于該短片段的電流區(qū)塊。*2標(biāo)記了將DNA構(gòu)建體P加入系統(tǒng)的點(diǎn)。DNA的添加導(dǎo)致DNA電流區(qū)塊，其一致地在70和100pA之間(參見圖9A(軌跡的最后部分，9B是軌跡的第一部分))。*3標(biāo)記了向系統(tǒng)中添加生物素(50μM)的點(diǎn)。顯然，在添加生物素后，觀察到的DNA電流區(qū)塊的數(shù)量急劇減少。最后，*4對應(yīng)于緩沖液沖洗步驟，其中DNA和生物素從系統(tǒng)中去除。該實(shí)驗(yàn)表明，通過將生物素沖洗到系統(tǒng)中，DNA構(gòu)建體P可以從膜上解偶聯(lián)。由于生物素對鏈霉親和素比對脫硫生物素對鏈霉親和素具有更強(qiáng)的結(jié)合親和力，因此當(dāng)生物素加入到系統(tǒng)中時(shí)，它競爭掉脫硫生物素，這確保了鏈的有效去除。生物素還與鏈霉親和素上的其他空白結(jié)合位點(diǎn)結(jié)合，并從系統(tǒng)中去除整個(gè)鏈霉親和素DNA復(fù)合體。這使得延伸鏈偶聯(lián)到雙層上并可用于將第二DNA構(gòu)建體偶聯(lián)到膜上。

實(shí)施例6

該實(shí)施例說明了如何使用(2-羥丙基)-β-環(huán)糊精從膜上解偶聯(lián)使用膽固醇TEG與膜偶聯(lián)的DNA。將各種不同濃度的(2-羥丙基)-β-環(huán)糊精加入到納米孔系統(tǒng)中，監(jiān)測對每個(gè)納米孔在規(guī)定時(shí)間內(nèi)檢測到的解旋酶控制的DNA移動(dòng)的數(shù)量的％變化。該實(shí)驗(yàn)說明，低至20mM(2-羥丙基)-β-環(huán)糊精的濃度導(dǎo)致孵育后對每個(gè)納米孔檢測到的解旋酶控制的DNA移動(dòng)的數(shù)量減少(參見表2)。

材料和方法

如實(shí)施例2所述制備DNA構(gòu)建體X。如實(shí)施例2所述，用酶預(yù)孵育DNA構(gòu)建體，來制備構(gòu)建體X預(yù)混物。

如實(shí)施例2所述設(shè)置納米孔實(shí)驗(yàn)系統(tǒng)。將DNA構(gòu)建體X/酶預(yù)混物(總共150μL)加入到實(shí)驗(yàn)系統(tǒng)中，并且實(shí)驗(yàn)在140mV的保持電位下運(yùn)行2小時(shí)，監(jiān)測解旋酶控制的DNA移動(dòng)。兩小時(shí)后，停止實(shí)驗(yàn)方案，將電位設(shè)置為零，并將(2-羥丙基)-β-環(huán)糊精(150μL，在500mM KCl中20mM，50mM，100mM或200mM，25mM磷酸鉀pH8)流到納米孔系統(tǒng)上并孵育10分鐘，以試圖去除偶聯(lián)的DNA構(gòu)建體X。在孵育后，將緩沖液(150μL，500mM KCl，25mM磷酸鉀pH8)沖洗流過系統(tǒng)以去除任何解偶聯(lián)的DNA和過量的(2-羥丙基)-β-環(huán)糊精。在緩沖液沖洗后，將緩沖液(含有燃料)加入系統(tǒng)(150uL 500mM KCl，25mM磷酸鉀，2mM ATP，2mM MgCl 2pH8)，沒有額外的DNA，在保持電位140mV下持續(xù)2小時(shí)，監(jiān)測解旋酶控制DNA移動(dòng)。

結(jié)果和討論

對于DNA構(gòu)建體X，用T4Dda-E94C/A360C觀察到解旋酶控制的DNA移動(dòng)。下表2顯示在系統(tǒng)用不同濃度的(2-羥丙基)-β-環(huán)糊精孵育后，對每個(gè)納米孔檢測到解旋酶控制的DNA移動(dòng)的數(shù)目的平均％變化。對于所有實(shí)驗(yàn)，在加入DNA之前，觀察到很少或沒有觀察到解旋酶控制的DNA移動(dòng)。添加構(gòu)建體X后，發(fā)生解旋酶控制的DNA移動(dòng)穿過納米孔。在加入不同濃度的(2-羥丙基)-β-環(huán)糊精和相應(yīng)的緩沖液沖洗后，對每個(gè)納米孔檢測的解旋酶控制的DNA移動(dòng)的數(shù)量的平均百分比變化為至少50％，并且當(dāng)在200mM濃度下孵育時(shí)高達(dá)90％。這表明(2-羥丙基)-β-環(huán)糊精成功地將使用膽固醇偶聯(lián)到膜上的DNA從膜上解偶聯(lián)。

表2

序列表

<110> 牛津納米孔技術(shù)公司

<120> 方法

<130> N402334WO

<150> GB1406155.0

<151> 2014-04-04

<150> PCT/GB2014/052737

<151> 2014-09-10

<160> 47

<170> PatentIn version 3.5

<210> 1

<211> 558

<212> DNA

<213> 人工序列

<220>

<223> 恥垢分枝桿菌孔蛋白A突變體(Mycobacterium smegmatis)

(D90N/D91N/D93N/D118R/D134R/E193K)

<400> 1

atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60

caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120

tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180

ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240

ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300

ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360

ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420

ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480

ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540

ccgtggaata tgaactaa 558

<210> 2

<211> 184

<212> PRT

<213> 人工序列

<220>

<223> 恥垢分枝桿菌孔蛋白A突變體

(D90N/D91N/D93N/D118R/D134R/E139K)

<400> 2

Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu

1 5 10 15

Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp

20 25 30

Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr

35 40 45

Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu

50 55 60

Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe

65 70 75 80

Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala

85 90 95

Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly

100 105 110

Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val

115 120 125

Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val

130 135 140

Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu

145 150 155 160

Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr

165 170 175

Tyr Gly Glu Pro Trp Asn Met Asn

180

<210> 3

<211> 885

<212> DNA

<213> 人工序列

<220>

<223> α-溶血素突變體 (E111N/K147N)

<400> 3

atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60

gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120

tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180

accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240

tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300

gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360

ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420

gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480

ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540

ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600

agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660

ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720

aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780

tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840

gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885

<210> 4

<211> 293

<212> PRT

<213> 人工序列

<220>

<223> α-溶血素突變體 (E111N/K147N)

<400> 4

Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser

1 5 10 15

Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn

20 25 30

Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His

35 40 45

Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln

50 55 60

Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp

65 70 75 80

Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala

85 90 95

Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr

100 105 110

Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp

115 120 125

Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His

130 135 140

Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro

145 150 155 160

Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn

165 170 175

Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly

180 185 190

Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp

195 200 205

Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe

210 215 220

Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys

225 230 235 240

Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr

245 250 255

Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp

260 265 270

Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys

275 280 285

Glu Glu Met Thr Asn

290

<210> 5

<211> 184

<212> PRT

<213> 恥垢分枝桿菌

<400> 5

Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu

1 5 10 15

Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp

20 25 30

Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr

35 40 45

Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu

50 55 60

Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe

65 70 75 80

Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala

85 90 95

Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly

100 105 110

Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val

115 120 125

Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val

130 135 140

Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu

145 150 155 160

Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr

165 170 175

Tyr Gly Glu Pro Trp Asn Met Asn

180

<210> 6

<211> 184

<212> PRT

<213> 恥垢分枝桿菌

<400> 6

Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu

1 5 10 15

Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp

20 25 30

Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr

35 40 45

Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu

50 55 60

Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe

65 70 75 80

Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly

85 90 95

Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly

100 105 110

Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val

115 120 125

Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val

130 135 140

Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu

145 150 155 160

Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr

165 170 175

Tyr Gly Glu Pro Trp Asn Met Asn

180

<210> 7

<211> 183

<212> PRT

<213> 恥垢分枝桿菌

<400> 7

Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr

1 5 10 15

Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg

20 25 30

Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His

35 40 45

Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly

50 55 60

Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser

65 70 75 80

Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro

85 90 95

Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val

100 105 110

Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala

115 120 125

Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser

130 135 140

Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg

145 150 155 160

Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr

165 170 175

Gly Glu Pro Trp Asn Met Asn

180

<210> 8

<211> 1830

<212> DNA

<213> 枯草芽孢桿菌噬菌體（Bacillus subtilis phage） phi29

<400> 8

atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60

gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120

ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180

cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240

tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300

tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360

gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420

gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480

gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540

tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600

atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660

gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720

gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780

cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840

tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900

accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960

ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020

gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080

aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140

ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200

ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260

acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320

accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380

catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440

ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500

atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560

tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620

gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680

gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740

tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800

tggagccacc cgcagtttga aaaataataa 1830

<210> 9

<211> 608

<212> PRT

<213> 枯草芽孢桿菌噬菌體 phi29

<400> 9

Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr

1 5 10 15

Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile

20 25 30

Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met

35 40 45

Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys

50 55 60

Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys

65 70 75 80

Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg

85 90 95

Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys

100 105 110

Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe

115 120 125

Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly

130 135 140

Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro

145 150 155 160

Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala

165 170 175

Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser

180 185 190

Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys

195 200 205

Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr

210 215 220

Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys

225 230 235 240

Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala

245 250 255

Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu

260 265 270

Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile

275 280 285

Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile

290 295 300

Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly

305 310 315 320

Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met

325 330 335

Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys

340 345 350

Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr

355 360 365

Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu

370 375 380

Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr

385 390 395 400

Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu

405 410 415

Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe

420 425 430

Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys

435 440 445

Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly

450 455 460

Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu

465 470 475 480

Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg

485 490 495

Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys

500 505 510

Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val

515 520 525

Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu

530 535 540

Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln

545 550 555 560

Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser

565 570 575

Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser

580 585 590

Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys

595 600 605

<210> 10

<211> 1390

<212> DNA

<213> 大腸桿菌

<400> 10

atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60

acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120

aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180

ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240

gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300

ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360

tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420

atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480

ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540

catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600

cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660

attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720

ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780

atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840

gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900

gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960

gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020

ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080

gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140

aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200

aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260

tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320

cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380

gtggcgctgc 1390

<210> 11

<211> 485

<212> PRT

<213> 大腸桿菌

<400> 11

Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr

1 5 10 15

Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala

20 25 30

Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val

35 40 45

Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val

50 55 60

Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn

65 70 75 80

Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys

85 90 95

Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr

100 105 110

Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp

115 120 125

Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys

130 135 140

Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly

145 150 155 160

Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu

165 170 175

His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala

180 185 190

Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu

195 200 205

Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro

210 215 220

Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg

225 230 235 240

Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg

245 250 255

Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu

260 265 270

Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr

275 280 285

Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn

290 295 300

Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala

305 310 315 320

Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile

325 330 335

Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala

340 345 350

Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr

355 360 365

Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu

370 375 380

Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp

385 390 395 400

Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro

405 410 415

Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg

420 425 430

Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln

435 440 445

Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu

450 455 460

Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His

465 470 475 480

His His His His His

485

<210> 12

<211> 804

<212> DNA

<213> 大腸桿菌

<400> 12

atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60

atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120

atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180

ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240

cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300

ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360

aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420

aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480

atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540

ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600

catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660

gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720

tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780

cccgtctggg cgaccttccg ccgc 804

<210> 13

<211> 268

<212> PRT

<213> 大腸桿菌

<400> 13

Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His

1 5 10 15

Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu

20 25 30

Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala

35 40 45

Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly

50 55 60

Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe

65 70 75 80

Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile

85 90 95

Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln

100 105 110

Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe

115 120 125

Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn

130 135 140

Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp

145 150 155 160

Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys

165 170 175

Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser

180 185 190

Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp

195 200 205

Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg

210 215 220

Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys

225 230 235 240

Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro

245 250 255

Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg

260 265

<210> 14

<211> 1275

<212> DNA

<213> 嗜熱棲熱菌（Thermus thermophilus）

<400> 14

atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60

cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120

ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180

ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240

atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300

attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360

gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420

ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480

catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540

attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600

cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660

ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720

ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780

ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840

cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900

ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960

gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020

gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080

ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140

gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200

ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260

gaaccgctgt tcctg 1275

<210> 15

<211> 425

<212> PRT

<213> 嗜熱棲熱菌

<400> 15

Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro

1 5 10 15

Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg

20 25 30

Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu

35 40 45

Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp

50 55 60

Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu

65 70 75 80

Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr

85 90 95

Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu

100 105 110

Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr

115 120 125

Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys

130 135 140

Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu

145 150 155 160

His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala

165 170 175

Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg

180 185 190

Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val

195 200 205

Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val

210 215 220

Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu

225 230 235 240

Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala

245 250 255

Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg

260 265 270

Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp

275 280 285

Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly

290 295 300

Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro

305 310 315 320

Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro

325 330 335

Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg

340 345 350

Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu

355 360 365

Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro

370 375 380

Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly

385 390 395 400

Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly

405 410 415

Glu Gly Asn Pro Glu Pro Leu Phe Leu

420 425

<210> 16

<211> 738

<212> DNA

<213> 噬菌體λ

<400> 16

tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60

gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120

gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180

cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240

ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300

ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360

agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420

aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480

aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540

tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600

cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660

gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720

tccggcagcg gttccgga 738

<210> 17

<211> 226

<212> PRT

<213> 噬菌體λ

<400> 17

Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala

1 5 10 15

Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile

20 25 30

Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys

35 40 45

Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu

50 55 60

Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp

65 70 75 80

Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser

85 90 95

Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met

100 105 110

Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu

115 120 125

Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu

130 135 140

Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr

145 150 155 160

Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp

165 170 175

Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp

180 185 190

Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu

195 200 205

Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln

210 215 220

Trp Arg

225

<210> 18

<211> 760

<212> PRT

<213> 布氏擬甲烷球菌(Methanococcoides burtonii)

<400> 18

Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr

1 5 10 15

Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile

20 25 30

Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr

35 40 45

Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile

50 55 60

Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala

65 70 75 80

Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys

85 90 95

Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly

100 105 110

Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu

115 120 125

Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp

130 135 140

Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val

145 150 155 160

Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala

165 170 175

Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly

180 185 190

Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly

195 200 205

Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile

210 215 220

Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile

225 230 235 240

Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys

245 250 255

Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp

260 265 270

Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser

275 280 285

Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys

290 295 300

Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu

305 310 315 320

Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr

325 330 335

Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile

340 345 350

Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro

355 360 365

Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu

370 375 380

Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe

385 390 395 400

Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp

405 410 415

Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr

420 425 430

Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe

435 440 445

Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu

450 455 460

Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser

465 470 475 480

Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr

485 490 495

Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly

500 505 510

Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly

515 520 525

Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr

530 535 540

Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln

545 550 555 560

Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val

565 570 575

Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr

580 585 590

Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu

595 600 605

Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn

610 615 620

Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu

625 630 635 640

Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser

645 650 655

Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu

660 665 670

Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala

675 680 685

Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly

690 695 700

Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr

705 710 715 720

Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn

725 730 735

Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn

740 745 750

Gln Lys Thr Phe Asn Asp Phe Gln

755 760

<210> 19

<211> 707

<212> PRT

<213> 海綿共生古菌(Cenarchaeum symbiosum)

<400> 19

Met Arg Ile Ser Glu Leu Asp Ile Pro Arg Pro Ala Ile Glu Phe Leu

1 5 10 15

Glu Gly Glu Gly Tyr Lys Lys Leu Tyr Pro Pro Gln Ala Ala Ala Ala

20 25 30

Lys Ala Gly Leu Thr Asp Gly Lys Ser Val Leu Val Ser Ala Pro Thr

35 40 45

Ala Ser Gly Lys Thr Leu Ile Ala Ala Ile Ala Met Ile Ser His Leu

50 55 60

Ser Arg Asn Arg Gly Lys Ala Val Tyr Leu Ser Pro Leu Arg Ala Leu

65 70 75 80

Ala Ala Glu Lys Phe Ala Glu Phe Gly Lys Ile Gly Gly Ile Pro Leu

85 90 95

Gly Arg Pro Val Arg Val Gly Val Ser Thr Gly Asp Phe Glu Lys Ala

100 105 110

Gly Arg Ser Leu Gly Asn Asn Asp Ile Leu Val Leu Thr Asn Glu Arg

115 120 125

Met Asp Ser Leu Ile Arg Arg Arg Pro Asp Trp Met Asp Glu Val Gly

130 135 140

Leu Val Ile Ala Asp Glu Ile His Leu Ile Gly Asp Arg Ser Arg Gly

145 150 155 160

Pro Thr Leu Glu Met Val Leu Thr Lys Leu Arg Gly Leu Arg Ser Ser

165 170 175

Pro Gln Val Val Ala Leu Ser Ala Thr Ile Ser Asn Ala Asp Glu Ile

180 185 190

Ala Gly Trp Leu Asp Cys Thr Leu Val His Ser Thr Trp Arg Pro Val

195 200 205

Pro Leu Ser Glu Gly Val Tyr Gln Asp Gly Glu Val Ala Met Gly Asp

210 215 220

Gly Ser Arg His Glu Val Ala Ala Thr Gly Gly Gly Pro Ala Val Asp

225 230 235 240

Leu Ala Ala Glu Ser Val Ala Glu Gly Gly Gln Ser Leu Ile Phe Ala

245 250 255

Asp Thr Arg Ala Arg Ser Ala Ser Leu Ala Ala Lys Ala Ser Ala Val

260 265 270

Ile Pro Glu Ala Lys Gly Ala Asp Ala Ala Lys Leu Ala Ala Ala Ala

275 280 285

Lys Lys Ile Ile Ser Ser Gly Gly Glu Thr Lys Leu Ala Lys Thr Leu

290 295 300

Ala Glu Leu Val Glu Lys Gly Ala Ala Phe His His Ala Gly Leu Asn

305 310 315 320

Gln Asp Cys Arg Ser Val Val Glu Glu Glu Phe Arg Ser Gly Arg Ile

325 330 335

Arg Leu Leu Ala Ser Thr Pro Thr Leu Ala Ala Gly Val Asn Leu Pro

340 345 350

Ala Arg Arg Val Val Ile Ser Ser Val Met Arg Tyr Asn Ser Ser Ser

355 360 365

Gly Met Ser Glu Pro Ile Ser Ile Leu Glu Tyr Lys Gln Leu Cys Gly

370 375 380

Arg Ala Gly Arg Pro Gln Tyr Asp Lys Ser Gly Glu Ala Ile Val Val

385 390 395 400

Gly Gly Val Asn Ala Asp Glu Ile Phe Asp Arg Tyr Ile Gly Gly Glu

405 410 415

Pro Glu Pro Ile Arg Ser Ala Met Val Asp Asp Arg Ala Leu Arg Ile

420 425 430

His Val Leu Ser Leu Val Thr Thr Ser Pro Gly Ile Lys Glu Asp Asp

435 440 445

Val Thr Glu Phe Phe Leu Gly Thr Leu Gly Gly Gln Gln Ser Gly Glu

450 455 460

Ser Thr Val Lys Phe Ser Val Ala Val Ala Leu Arg Phe Leu Gln Glu

465 470 475 480

Glu Gly Met Leu Gly Arg Arg Gly Gly Arg Leu Ala Ala Thr Lys Met

485 490 495

Gly Arg Leu Val Ser Arg Leu Tyr Met Asp Pro Met Thr Ala Val Thr

500 505 510

Leu Arg Asp Ala Val Gly Glu Ala Ser Pro Gly Arg Met His Thr Leu

515 520 525

Gly Phe Leu His Leu Val Ser Glu Cys Ser Glu Phe Met Pro Arg Phe

530 535 540

Ala Leu Arg Gln Lys Asp His Glu Val Ala Glu Met Met Leu Glu Ala

545 550 555 560

Gly Arg Gly Glu Leu Leu Arg Pro Val Tyr Ser Tyr Glu Cys Gly Arg

565 570 575

Gly Leu Leu Ala Leu His Arg Trp Ile Gly Glu Ser Pro Glu Ala Lys

580 585 590

Leu Ala Glu Asp Leu Lys Phe Glu Ser Gly Asp Val His Arg Met Val

595 600 605

Glu Ser Ser Gly Trp Leu Leu Arg Cys Ile Trp Glu Ile Ser Lys His

610 615 620

Gln Glu Arg Pro Asp Leu Leu Gly Glu Leu Asp Val Leu Arg Ser Arg

625 630 635 640

Val Ala Tyr Gly Ile Lys Ala Glu Leu Val Pro Leu Val Ser Ile Lys

645 650 655

Gly Ile Gly Arg Val Arg Ser Arg Arg Leu Phe Arg Gly Gly Ile Lys

660 665 670

Gly Pro Gly Asp Leu Ala Ala Val Pro Val Glu Arg Leu Ser Arg Val

675 680 685

Glu Gly Ile Gly Ala Thr Leu Ala Asn Asn Ile Lys Ser Gln Leu Arg

690 695 700

Lys Gly Gly

705

<210> 20

<211> 720

<212> PRT

<213> 科超嗜熱古菌(Thermococcus gammatolerans)

<400> 20

Met Lys Val Asp Glu Leu Pro Val Asp Glu Arg Leu Lys Ala Val Leu

1 5 10 15

Lys Glu Arg Gly Ile Glu Glu Leu Tyr Pro Pro Gln Ala Glu Ala Leu

20 25 30

Lys Ser Gly Ala Leu Glu Gly Arg Asn Leu Val Leu Ala Ile Pro Thr

35 40 45

Ala Ser Gly Lys Thr Leu Val Ser Glu Ile Val Met Val Asn Lys Leu

50 55 60

Ile Gln Glu Gly Gly Lys Ala Val Tyr Leu Val Pro Leu Lys Ala Leu

65 70 75 80

Ala Glu Glu Lys Tyr Arg Glu Phe Lys Glu Trp Glu Lys Leu Gly Leu

85 90 95

Lys Val Ala Ala Thr Thr Gly Asp Tyr Asp Ser Thr Asp Asp Trp Leu

100 105 110

Gly Arg Tyr Asp Ile Ile Val Ala Thr Ala Glu Lys Phe Asp Ser Leu

115 120 125

Leu Arg His Gly Ala Arg Trp Ile Asn Asp Val Lys Leu Val Val Ala

130 135 140

Asp Glu Val His Leu Ile Gly Ser Tyr Asp Arg Gly Ala Thr Leu Glu

145 150 155 160

Met Ile Leu Thr His Met Leu Gly Arg Ala Gln Ile Leu Ala Leu Ser

165 170 175

Ala Thr Val Gly Asn Ala Glu Glu Leu Ala Glu Trp Leu Asp Ala Ser

180 185 190

Leu Val Val Ser Asp Trp Arg Pro Val Gln Leu Arg Arg Gly Val Phe

195 200 205

His Leu Gly Thr Leu Ile Trp Glu Asp Gly Lys Val Glu Ser Tyr Pro

210 215 220

Glu Asn Trp Tyr Ser Leu Val Val Asp Ala Val Lys Arg Gly Lys Gly

225 230 235 240

Ala Leu Val Phe Val Asn Thr Arg Arg Ser Ala Glu Lys Glu Ala Leu

245 250 255

Ala Leu Ser Lys Leu Val Ser Ser His Leu Thr Lys Pro Glu Lys Arg

260 265 270

Ala Leu Glu Ser Leu Ala Ser Gln Leu Glu Asp Asn Pro Thr Ser Glu

275 280 285

Lys Leu Lys Arg Ala Leu Arg Gly Gly Val Ala Phe His His Ala Gly

290 295 300

Leu Ser Arg Val Glu Arg Thr Leu Ile Glu Asp Ala Phe Arg Glu Gly

305 310 315 320

Leu Ile Lys Val Ile Thr Ala Thr Pro Thr Leu Ser Ala Gly Val Asn

325 330 335

Leu Pro Ser Phe Arg Val Ile Ile Arg Asp Thr Lys Arg Tyr Ala Gly

340 345 350

Phe Gly Trp Thr Asp Ile Pro Val Leu Glu Ile Gln Gln Met Met Gly

355 360 365

Arg Ala Gly Arg Pro Arg Tyr Asp Lys Tyr Gly Glu Ala Ile Ile Val

370 375 380

Ala Arg Thr Asp Glu Pro Gly Lys Leu Met Glu Arg Tyr Ile Arg Gly

385 390 395 400

Lys Pro Glu Lys Leu Phe Ser Met Leu Ala Asn Glu Gln Ala Phe Arg

405 410 415

Ser Gln Val Leu Ala Leu Ile Thr Asn Phe Gly Ile Arg Ser Phe Pro

420 425 430

Glu Leu Val Arg Phe Leu Glu Arg Thr Phe Tyr Ala His Gln Arg Lys

435 440 445

Asp Leu Ser Ser Leu Glu Tyr Lys Ala Lys Glu Val Val Tyr Phe Leu

450 455 460

Ile Glu Asn Glu Phe Ile Asp Leu Asp Leu Glu Asp Arg Phe Ile Pro

465 470 475 480

Leu Pro Phe Gly Lys Arg Thr Ser Gln Leu Tyr Ile Asp Pro Leu Thr

485 490 495

Ala Lys Lys Phe Lys Asp Ala Phe Pro Ala Ile Glu Arg Asn Pro Asn

500 505 510

Pro Phe Gly Ile Phe Gln Leu Ile Ala Ser Thr Pro Asp Met Ala Thr

515 520 525

Leu Thr Ala Arg Arg Arg Glu Met Glu Asp Tyr Leu Asp Leu Ala Tyr

530 535 540

Glu Leu Glu Asp Lys Leu Tyr Ala Ser Ile Pro Tyr Tyr Glu Asp Ser

545 550 555 560

Arg Phe Gln Gly Phe Leu Gly Gln Val Lys Thr Ala Lys Val Leu Leu

565 570 575

Asp Trp Ile Asn Glu Val Pro Glu Ala Arg Ile Tyr Glu Thr Tyr Ser

580 585 590

Ile Asp Pro Gly Asp Leu Tyr Arg Leu Leu Glu Leu Ala Asp Trp Leu

595 600 605

Met Tyr Ser Leu Ile Glu Leu Tyr Lys Leu Phe Glu Pro Lys Glu Glu

610 615 620

Ile Leu Asn Tyr Leu Arg Asp Leu His Leu Arg Leu Arg His Gly Val

625 630 635 640

Arg Glu Glu Leu Leu Glu Leu Val Arg Leu Pro Asn Ile Gly Arg Lys

645 650 655

Arg Ala Arg Ala Leu Tyr Asn Ala Gly Phe Arg Ser Val Glu Ala Ile

660 665 670

Ala Asn Ala Lys Pro Ala Glu Leu Leu Ala Val Glu Gly Ile Gly Ala

675 680 685

Lys Ile Leu Asp Gly Ile Tyr Arg His Leu Gly Ile Glu Lys Arg Val

690 695 700

Thr Glu Glu Lys Pro Lys Arg Lys Gly Thr Leu Glu Asp Phe Leu Arg

705 710 715 720

<210> 21

<211> 799

<212> PRT

<213> 亨氏甲烷螺菌(Methanospirillum hungatei)

<400> 21

Met Glu Ile Ala Ser Leu Pro Leu Pro Asp Ser Phe Ile Arg Ala Cys

1 5 10 15

His Ala Lys Gly Ile Arg Ser Leu Tyr Pro Pro Gln Ala Glu Cys Ile

20 25 30

Glu Lys Gly Leu Leu Glu Gly Lys Asn Leu Leu Ile Ser Ile Pro Thr

35 40 45

Ala Ser Gly Lys Thr Leu Leu Ala Glu Met Ala Met Trp Ser Arg Ile

50 55 60

Ala Ala Gly Gly Lys Cys Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala

65 70 75 80

Ser Glu Lys Tyr Asp Glu Phe Ser Lys Lys Gly Val Ile Arg Val Gly

85 90 95

Ile Ala Thr Gly Asp Leu Asp Arg Thr Asp Ala Tyr Leu Gly Glu Asn

100 105 110

Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu Arg Asn

115 120 125

Arg Thr Pro Trp Leu Ser Gln Ile Thr Cys Ile Val Leu Asp Glu Val

130 135 140

His Leu Ile Gly Ser Glu Asn Arg Gly Ala Thr Leu Glu Met Val Ile

145 150 155 160

Thr Lys Leu Arg Tyr Thr Asn Pro Val Met Gln Ile Ile Gly Leu Ser

165 170 175

Ala Thr Ile Gly Asn Pro Ala Gln Leu Ala Glu Trp Leu Asp Ala Thr

180 185 190

Leu Ile Thr Ser Thr Trp Arg Pro Val Asp Leu Arg Gln Gly Val Tyr

195 200 205

Tyr Asn Gly Lys Ile Arg Phe Ser Asp Ser Glu Arg Pro Ile Gln Gly

210 215 220

Lys Thr Lys His Asp Asp Leu Asn Leu Cys Leu Asp Thr Ile Glu Glu

225 230 235 240

Gly Gly Gln Cys Leu Val Phe Val Ser Ser Arg Arg Asn Ala Glu Gly

245 250 255

Phe Ala Lys Lys Ala Ala Gly Ala Leu Lys Ala Gly Ser Pro Asp Ser

260 265 270

Lys Ala Leu Ala Gln Glu Leu Arg Arg Leu Arg Asp Arg Asp Glu Gly

275 280 285

Asn Val Leu Ala Asp Cys Val Glu Arg Gly Ala Ala Phe His His Ala

290 295 300

Gly Leu Ile Arg Gln Glu Arg Thr Ile Ile Glu Glu Gly Phe Arg Asn

305 310 315 320

Gly Tyr Ile Glu Val Ile Ala Ala Thr Pro Thr Leu Ala Ala Gly Leu

325 330 335

Asn Leu Pro Ala Arg Arg Val Ile Ile Arg Asp Tyr Asn Arg Phe Ala

340 345 350

Ser Gly Leu Gly Met Val Pro Ile Pro Val Gly Glu Tyr His Gln Met

355 360 365

Ala Gly Arg Ala Gly Arg Pro His Leu Asp Pro Tyr Gly Glu Ala Val

370 375 380

Leu Leu Ala Lys Asp Ala Pro Ser Val Glu Arg Leu Phe Glu Thr Phe

385 390 395 400

Ile Asp Ala Glu Ala Glu Arg Val Asp Ser Gln Cys Val Asp Asp Ala

405 410 415

Ser Leu Cys Ala His Ile Leu Ser Leu Ile Ala Thr Gly Phe Ala His

420 425 430

Asp Gln Glu Ala Leu Ser Ser Phe Met Glu Arg Thr Phe Tyr Phe Phe

435 440 445

Gln His Pro Lys Thr Arg Ser Leu Pro Arg Leu Val Ala Asp Ala Ile

450 455 460

Arg Phe Leu Thr Thr Ala Gly Met Val Glu Glu Arg Glu Asn Thr Leu

465 470 475 480

Ser Ala Thr Arg Leu Gly Ser Leu Val Ser Arg Leu Tyr Leu Asn Pro

485 490 495

Cys Thr Ala Arg Leu Ile Leu Asp Ser Leu Lys Ser Cys Lys Thr Pro

500 505 510

Thr Leu Ile Gly Leu Leu His Val Ile Cys Val Ser Pro Asp Met Gln

515 520 525

Arg Leu Tyr Leu Lys Ala Ala Asp Thr Gln Leu Leu Arg Thr Phe Leu

530 535 540

Phe Lys His Lys Asp Asp Leu Ile Leu Pro Leu Pro Phe Glu Gln Glu

545 550 555 560

Glu Glu Glu Leu Trp Leu Ser Gly Leu Lys Thr Ala Leu Val Leu Thr

565 570 575

Asp Trp Ala Asp Glu Phe Ser Glu Gly Met Ile Glu Glu Arg Tyr Gly

580 585 590

Ile Gly Ala Gly Asp Leu Tyr Asn Ile Val Asp Ser Gly Lys Trp Leu

595 600 605

Leu His Gly Thr Glu Arg Leu Val Ser Val Glu Met Pro Glu Met Ser

610 615 620

Gln Val Val Lys Thr Leu Ser Val Arg Val His His Gly Val Lys Ser

625 630 635 640

Glu Leu Leu Pro Leu Val Ala Leu Arg Asn Ile Gly Arg Val Arg Ala

645 650 655

Arg Thr Leu Tyr Asn Ala Gly Tyr Pro Asp Pro Glu Ala Val Ala Arg

660 665 670

Ala Gly Leu Ser Thr Ile Ala Arg Ile Ile Gly Glu Gly Ile Ala Arg

675 680 685

Gln Val Ile Asp Glu Ile Thr Gly Val Lys Arg Ser Gly Ile His Ser

690 695 700

Ser Asp Asp Asp Tyr Gln Gln Lys Thr Pro Glu Leu Leu Thr Asp Ile

705 710 715 720

Pro Gly Ile Gly Lys Lys Met Ala Glu Lys Leu Gln Asn Ala Gly Ile

725 730 735

Ile Thr Val Ser Asp Leu Leu Thr Ala Asp Glu Val Leu Leu Ser Asp

740 745 750

Val Leu Gly Ala Ala Arg Ala Arg Lys Val Leu Ala Phe Leu Ser Asn

755 760 765

Ser Glu Lys Glu Asn Ser Ser Ser Asp Lys Thr Glu Glu Ile Pro Asp

770 775 780

Thr Gln Lys Ile Arg Gly Gln Ser Ser Trp Glu Asp Phe Gly Cys

785 790 795

<210> 22

<211> 1756

<212> PRT

<213> 大腸桿菌

<400> 22

Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr

1 5 10 15

Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg

20 25 30

Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp

35 40 45

Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala

50 55 60

Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr

65 70 75 80

Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu

85 90 95

Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe

100 105 110

Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp

115 120 125

Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe

130 135 140

Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala

145 150 155 160

Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser

165 170 175

Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn

180 185 190

Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val

195 200 205

Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp

210 215 220

Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala

225 230 235 240

Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val

245 250 255

Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile

260 265 270

Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile

275 280 285

Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln

290 295 300

Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val

305 310 315 320

Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr

325 330 335

Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly

340 345 350

Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu

355 360 365

Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile

370 375 380

His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met

385 390 395 400

Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr

405 410 415

Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser

420 425 430

Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg

435 440 445

Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln

450 455 460

Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu

465 470 475 480

Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly

485 490 495

Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys

500 505 510

Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His

515 520 525

Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly

530 535 540

Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp

545 550 555 560

Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg

565 570 575

Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys

580 585 590

Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala

595 600 605

Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu

610 615 620

Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp

625 630 635 640

Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met

645 650 655

Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp

660 665 670

Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly

675 680 685

Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu

690 695 700

Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val

705 710 715 720

Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln

725 730 735

Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg

740 745 750

Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu

755 760 765

Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp

770 775 780

Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala

785 790 795 800

Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser

805 810 815

Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser

820 825 830

Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu

835 840 845

Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala

850 855 860

Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu

865 870 875 880

Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala

885 890 895

Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile

900 905 910

Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr

915 920 925

Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu

930 935 940

Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg

945 950 955 960

Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala

965 970 975

Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly

980 985 990

Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala

995 1000 1005

Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu

1010 1015 1020

Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val

1025 1030 1035

Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln

1040 1045 1050

Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu

1055 1060 1065

Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala

1070 1075 1080

Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly

1085 1090 1095

Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg

1100 1105 1110

Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu

1115 1120 1125

Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu

1130 1135 1140

Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val

1145 1150 1155

Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu

1160 1165 1170

His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala

1175 1180 1185

Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp

1190 1195 1200

Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly

1205 1210 1215

Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu

1220 1225 1230

Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg

1235 1240 1245

Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val

1250 1255 1260

Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser

1265 1270 1275

Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val

1280 1285 1290

Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr

1295 1300 1305

Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu

1310 1315 1320

Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg

1325 1330 1335

Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu

1340 1345 1350

Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser

1355 1360 1365

Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile

1370 1375 1380

Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr

1385 1390 1395

Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala

1400 1405 1410

Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly

1415 1420 1425

Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val

1430 1435 1440

Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn

1445 1450 1455

Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys

1460 1465 1470

Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala

1475 1480 1485

Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln

1490 1495 1500

Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro

1505 1510 1515

Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp

1520 1525 1530

Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr

1535 1540 1545

Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val

1550 1555 1560

Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg

1565 1570 1575

Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg

1580 1585 1590

Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala

1595 1600 1605

Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg

1610 1615 1620

Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly

1625 1630 1635

Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala

1640 1645 1650

Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile

1655 1660 1665

Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys

1670 1675 1680

Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg

1685 1690 1695

Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu

1700 1705 1710

Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg

1715 1720 1725

Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met

1730 1735 1740

Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp

1745 1750 1755

<210> 23

<211> 726

<212> PRT

<213> 布氏擬甲烷球菌(Methanococcoides burtonii)

<400> 23

Met Ser Asp Lys Pro Ala Phe Met Lys Tyr Phe Thr Gln Ser Ser Cys

1 5 10 15

Tyr Pro Asn Gln Gln Glu Ala Met Asp Arg Ile His Ser Ala Leu Met

20 25 30

Gln Gln Gln Leu Val Leu Phe Glu Gly Ala Cys Gly Thr Gly Lys Thr

35 40 45

Leu Ser Ala Leu Val Pro Ala Leu His Val Gly Lys Met Leu Gly Lys

50 55 60

Thr Val Ile Ile Ala Thr Asn Val His Gln Gln Met Val Gln Phe Ile

65 70 75 80

Asn Glu Ala Arg Asp Ile Lys Lys Val Gln Asp Val Lys Val Ala Val

85 90 95

Ile Lys Gly Lys Thr Ala Met Cys Pro Gln Glu Ala Asp Tyr Glu Glu

100 105 110

Cys Ser Val Lys Arg Glu Asn Thr Phe Glu Leu Met Glu Thr Glu Arg

115 120 125

Glu Ile Tyr Leu Lys Arg Gln Glu Leu Asn Ser Ala Arg Asp Ser Tyr

130 135 140

Lys Lys Ser His Asp Pro Ala Phe Val Thr Leu Arg Asp Glu Leu Ser

145 150 155 160

Lys Glu Ile Asp Ala Val Glu Glu Lys Ala Arg Gly Leu Arg Asp Arg

165 170 175

Ala Cys Asn Asp Leu Tyr Glu Val Leu Arg Ser Asp Ser Glu Lys Phe

180 185 190

Arg Glu Trp Leu Tyr Lys Glu Val Arg Ser Pro Glu Glu Ile Asn Asp

195 200 205

His Ala Ile Lys Asp Gly Met Cys Gly Tyr Glu Leu Val Lys Arg Glu

210 215 220

Leu Lys His Ala Asp Leu Leu Ile Cys Asn Tyr His His Val Leu Asn

225 230 235 240

Pro Asp Ile Phe Ser Thr Val Leu Gly Trp Ile Glu Lys Glu Pro Gln

245 250 255

Glu Thr Ile Val Ile Phe Asp Glu Ala His Asn Leu Glu Ser Ala Ala

260 265 270

Arg Ser His Ser Ser Leu Ser Leu Thr Glu His Ser Ile Glu Lys Ala

275 280 285

Ile Thr Glu Leu Glu Ala Asn Leu Asp Leu Leu Ala Asp Asp Asn Ile

290 295 300

His Asn Leu Phe Asn Ile Phe Leu Glu Val Ile Ser Asp Thr Tyr Asn

305 310 315 320

Ser Arg Phe Lys Phe Gly Glu Arg Glu Arg Val Arg Lys Asn Trp Tyr

325 330 335

Asp Ile Arg Ile Ser Asp Pro Tyr Glu Arg Asn Asp Ile Val Arg Gly

340 345 350

Lys Phe Leu Arg Gln Ala Lys Gly Asp Phe Gly Glu Lys Asp Asp Ile

355 360 365

Gln Ile Leu Leu Ser Glu Ala Ser Glu Leu Gly Ala Lys Leu Asp Glu

370 375 380

Thr Tyr Arg Asp Gln Tyr Lys Lys Gly Leu Ser Ser Val Met Lys Arg

385 390 395 400

Ser His Ile Arg Tyr Val Ala Asp Phe Met Ser Ala Tyr Ile Glu Leu

405 410 415

Ser His Asn Leu Asn Tyr Tyr Pro Ile Leu Asn Val Arg Arg Asp Met

420 425 430

Asn Asp Glu Ile Tyr Gly Arg Val Glu Leu Phe Thr Cys Ile Pro Lys

435 440 445

Asn Val Thr Glu Pro Leu Phe Asn Ser Leu Phe Ser Val Ile Leu Met

450 455 460

Ser Ala Thr Leu His Pro Phe Glu Met Val Lys Lys Thr Leu Gly Ile

465 470 475 480

Thr Arg Asp Thr Cys Glu Met Ser Tyr Gly Thr Ser Phe Pro Glu Glu

485 490 495

Lys Arg Leu Ser Ile Ala Val Ser Ile Pro Pro Leu Phe Ala Lys Asn

500 505 510

Arg Asp Asp Arg His Val Thr Glu Leu Leu Glu Gln Val Leu Leu Asp

515 520 525

Ser Ile Glu Asn Ser Lys Gly Asn Val Ile Leu Phe Phe Gln Ser Ala

530 535 540

Phe Glu Ala Lys Arg Tyr Tyr Ser Lys Ile Glu Pro Leu Val Asn Val

545 550 555 560

Pro Val Phe Leu Asp Glu Val Gly Ile Ser Ser Gln Asp Val Arg Glu

565 570 575

Glu Phe Phe Ser Ile Gly Glu Glu Asn Gly Lys Ala Val Leu Leu Ser

580 585 590

Tyr Leu Trp Gly Thr Leu Ser Glu Gly Ile Asp Tyr Arg Asp Gly Arg

595 600 605

Gly Arg Thr Val Ile Ile Ile Gly Val Gly Tyr Pro Ala Leu Asn Asp

610 615 620

Arg Met Asn Ala Val Glu Ser Ala Tyr Asp His Val Phe Gly Tyr Gly

625 630 635 640

Ala Gly Trp Glu Phe Ala Ile Gln Val Pro Thr Ile Arg Lys Ile Arg

645 650 655

Gln Ala Met Gly Arg Val Val Arg Ser Pro Thr Asp Tyr Gly Ala Arg

660 665 670

Ile Leu Leu Asp Gly Arg Phe Leu Thr Asp Ser Lys Lys Arg Phe Gly

675 680 685

Lys Phe Ser Val Phe Glu Val Phe Pro Pro Ala Glu Arg Ser Glu Phe

690 695 700

Val Asp Val Asp Pro Glu Lys Val Lys Tyr Ser Leu Met Asn Phe Phe

705 710 715 720

Met Asp Asn Asp Glu Gln

725

<210> 24

<211> 439

<212> PRT

<213> 腸桿菌噬菌體（Enterobacteria phage）T4

<400> 24

Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile

1 5 10 15

Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly

20 25 30

Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala

35 40 45

Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His

50 55 60

Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr

65 70 75 80

Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val

85 90 95

Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu

100 105 110

Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu

115 120 125

Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn

130 135 140

Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser

145 150 155 160

Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val

165 170 175

Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn

180 185 190

Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly

195 200 205

Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser

210 215 220

Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe

225 230 235 240

Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile

245 250 255

Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln

260 265 270

Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu

275 280 285

Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr

290 295 300

Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile

305 310 315 320

Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr

325 330 335

Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe

340 345 350

Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys

355 360 365

Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe

370 375 380

Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly

385 390 395 400

Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala

405 410 415

Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly

420 425 430

Arg Tyr Asp Val Phe Tyr Val

435

<210> 25

<211> 970

<212> PRT

<213> 肉毒桿菌(Clostridium botulinum)

<400> 25

Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr

1 5 10 15

Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly

20 25 30

Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val

35 40 45

Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly

50 55 60

Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu

65 70 75 80

Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys

85 90 95

Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu

100 105 110

His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly

115 120 125

Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln

130 135 140

His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val

145 150 155 160

Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys

165 170 175

Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met

180 185 190

Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro

195 200 205

Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln

210 215 220

Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg

225 230 235 240

Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala

245 250 255

Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser

260 265 270

Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg

275 280 285

Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly

290 295 300

Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His

305 310 315 320

Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys

325 330 335

Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val

340 345 350

Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr

355 360 365

Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu

370 375 380

Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys

385 390 395 400

Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu

405 410 415

Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro

420 425 430

Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu

435 440 445

Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg

450 455 460

Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala

465 470 475 480

Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg

485 490 495

Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val

500 505 510

Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg

515 520 525

Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala

530 535 540

Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu

545 550 555 560

Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg

565 570 575

Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg

580 585 590

Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln

595 600 605

Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg

610 615 620

Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val

625 630 635 640

Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly

645 650 655

Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu

660 665 670

Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser

675 680 685

Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile

690 695 700

Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr

705 710 715 720

Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu

725 730 735

Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr

740 745 750

Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp

755 760 765

Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly

770 775 780

Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile

785 790 795 800

His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly

805 810 815

Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys

820 825 830

Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp

835 840 845

Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His

850 855 860

Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser

865 870 875 880

Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr

885 890 895

Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu

900 905 910

Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu

915 920 925

Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp

930 935 940

Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg

945 950 955 960

Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile

965 970

<210> 26

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例1中使用的序列。

<400> 26

tttttttttt cttttttttc ttttttggtt ggttgttggt tgg 43

<210> 27

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例1中使用的序列。

<400> 27

tttttttttt cttttttttt 20

<210> 28

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例1中使用的序列。

<400> 28

ggttggttgt tggttgg 17

<210> 29

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例1中使用的序列。

<400> 29

ttaatgctaa tcgtgatagg ggt 23

<210> 30

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 30

gttctactaa accgtgtcaa tcagtgtc 28

<210> 31

<211> 3560

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 31

gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60

tttttgcgct aacaacctcc tgccgttttg cccgtgcata tcggtcacga acaaatctga 120

ttactaaaca cagtagcctg gatttgttct atcagtaatc gaccttattc ctaattaaat 180

agagcaaatc cccttattgg gggtaagaca tgaagatgcc agaaaaacat gacctgttgg 240

ccgccattct cgcggcaaag gaacaaggca tcggggcaat ccttgcgttt gcaatggcgt 300

accttcgcgg cagatataat ggcggtgcgt ttacaaaaac agtaatcgac gcaacgatgt 360

gcgccattat cgcctagttc attcgtgacc ttctcgactt cgccggacta agtagcaatc 420

tcgcttatat aacgagcgtg tttatcggct acatcggtac tgactcgatt ggttcgctta 480

tcaaacgctt cgctgctaaa aaagccggag tagaagatgg tagaaatcaa taatcaacgt 540

aaggcgttcc tcgatatgct ggcgtggtcg gagggaactg ataacggacg tcagaaaacc 600

agaaatcatg gttatgacgt cattgtaggc ggagagctat ttactgatta ctccgatcac 660

cctcgcaaac ttgtcacgct aaacccaaaa ctcaaatcaa caggcgccgg acgctaccag 720

cttctttccc gttggtggga tgcctaccgc aagcagcttg gcctgaaaga cttctctccg 780

aaaagtcagg acgctgtggc attgcagcag attaaggagc gtggcgcttt acctatgatt 840

gatcgtggtg atatccgtca ggcaatcgac cgttgcagca atatctgggc ttcactgccg 900

ggcgctggtt atggtcagtt cgagcataag gctgacagcc tgattgcaaa attcaaagaa 960

gcgggcggaa cggtcagaga gattgatgta tgagcagagt caccgcgatt atctccgctc 1020

tggttatctg catcatcgtc tgcctgtcat gggctgttaa tcattaccgt gataacgcca 1080

ttacctacaa agcccagcgc gacaaaaatg ccagagaact gaagctggcg aacgcggcaa 1140

ttactgacat gcagatgcgt cagcgtgatg ttgctgcgct cgatgcaaaa tacacgaagg 1200

agttagctga tgctaaagct gaaaatgatg ctctgcgtga tgatgttgcc gctggtcgtc 1260

gtcggttgca catcaaagca gtctgtcagt cagtgcgtga agccaccacc gcctccggcg 1320

tggataatgc agcctccccc cgactggcag acaccgctga acgggattat ttcaccctca 1380

gagagaggct gatcactatg caaaaacaac tggaaggaac ccagaagtat attaatgagc 1440

agtgcagata gagttgccca tatcgatggg caactcatgc aattattgtg agcaatacac 1500

acgcgcttcc agcggagtat aaatgcctaa agtaataaaa ccgagcaatc catttacgaa 1560

tgtttgctgg gtttctgttt taacaacatt ttctgcgccg ccacaaattt tggctgcatc 1620

gacagttttc ttctgcccaa ttccagaaac gaagaaatga tgggtgatgg tttcctttgg 1680

tgctactgct gccggtttgt tttgaacagt aaacgtctgt tgagcacatc ctgtaataag 1740

cagggccagc gcagtagcga gtagcatttt tttcatggtg ttattcccga tgctttttga 1800

agttcgcaga atcgtatgtg tagaaaatta aacaaaccct aaacaatgag ttgaaatttc 1860

atattgttaa tatttattaa tgtatgtcag gtgcgatgaa tcgtcattgt attcccggat 1920

taactatgtc cacagccctg acggggaact tctctgcggg agtgtccggg aataattaaa 1980

acgatgcaca cagggtttag cgcgtacacg tattgcatta tgccaacgcc ccggtgctga 2040

cacggaagaa accggacgtt atgatttagc gtggaaagat ttgtgtagtg ttctgaatgc 2100

tctcagtaaa tagtaatgaa ttatcaaagg tatagtaata tcttttatgt tcatggatat 2160

ttgtaaccca tcggaaaact cctgctttag caagattttc cctgtattgc tgaaatgtga 2220

tttctcttga tttcaaccta tcataggacg tttctataag atgcgtgttt cttgagaatt 2280

taacatttac aaccttttta agtcctttta ttaacacggt gttatcgttt tctaacacga 2340

tgtgaatatt atctgtggct agatagtaaa tataatgtga gacgttgtga cgttttagtt 2400

cagaataaaa caattcacag tctaaatctt ttcgcacttg atcgaatatt tctttaaaaa 2460

tggcaacctg agccattggt aaaaccttcc atgtgatacg agggcgcgta gtttgcatta 2520

tcgtttttat cgtttcaatc tggtctgacc tccttgtgtt ttgttgatga tttatgtcaa 2580

atattaggaa tgttttcact taatagtatt ggttgcgtaa caaagtgcgg tcctgctggc 2640

attctggagg gaaatacaac cgacagatgt atgtaaggcc aacgtgctca aatcttcata 2700

cagaaagatt tgaagtaata ttttaaccgc tagatgaaga gcaagcgcat ggagcgacaa 2760

aatgaataaa gaacaatctg ctgatgatcc ctccgtggat ctgattcgtg taaaaaatat 2820

gcttaatagc accatttcta tgagttaccc tgatgttgta attgcatgta tagaacataa 2880

ggtgtctctg gaagcattca gagcaattga ggcagcgttg gtgaagcacg ataataatat 2940

gaaggattat tccctggtgg ttgactgatc accataactg ctaatcattc aaactattta 3000

gtctgtgaca gagccaacac gcagtctgtc actgtcagga aagtggtaaa actgcaactc 3060

aattactgca atgccctcgt aattaagtga atttacaata tcgtcctgtt cggagggaag 3120

aacgcgggat gttcattctt catcactttt aattgatgta tatgctctct tttctgacgt 3180

tagtctccga cggcaggctt caatgaccca ggctgagaaa ttcccggacc ctttttgctc 3240

aagagcgatg ttaatttgtt caatcatttg gttaggaaag cggatgttgc gggttgttgt 3300

tctgcgggtt ctgttcttcg ttgacatgag gttgccccgt attcagtgtc gctgatttgt 3360

attgtctgaa gttgttttta cgttaagttg atgcagatca attaatacga tacctgcgtc 3420

ataattgatt atttgacgtg gtttgatggc ctccacgcac gttgtgatat gtagatgata 3480

atcattatca ctttacgggt cctttccggt gaaaaaaaag gtaccaaaaa aaacatcgtc 3540

gtgagtagtg aaccgtaagc 3560

<210> 32

<211> 85

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 32

gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60

tttttgcgct aacaacctcc tgccg 85

<210> 33

<211> 72

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 33

gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60

acccgtaaag tg 72

<210> 34

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 34

tttttttttt tttttttttt tttttttttt tttttttttt tttttt 46

<210> 35

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 35

ggttgtttct gttggtgctg atattgc 27

<210> 36

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 36

gccatcagat tgtgtttgtt agtcgct 27

<210> 37

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 37

acactgattg acacggttta gtagaac 27

<210> 38

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 38

gcttacggtt cactactcac gacgatg 27

<210> 39

<211> 3587

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 39

gccatcagat tgtgtttgtt agtcgctgcc atcagattgt gtttgttagt cgcttttttt 60

ttttggaatt ttttttttgg aatttttttt ttgcgctaac aacctcctgc cgttttgccc 120

gtgcatatcg gtcacgaaca aatctgatta ctaaacacag tagcctggat ttgttctatc 180

agtaatcgac cttattccta attaaataga gcaaatcccc ttattggggg taagacatga 240

agatgccaga aaaacatgac ctgttggccg ccattctcgc ggcaaaggaa caaggcatcg 300

gggcaatcct tgcgtttgca atggcgtacc ttcgcggcag atataatggc ggtgcgttta 360

caaaaacagt aatcgacgca acgatgtgcg ccattatcgc ctagttcatt cgtgaccttc 420

tcgacttcgc cggactaagt agcaatctcg cttatataac gagcgtgttt atcggctaca 480

tcggtactga ctcgattggt tcgcttatca aacgcttcgc tgctaaaaaa gccggagtag 540

aagatggtag aaatcaataa tcaacgtaag gcgttcctcg atatgctggc gtggtcggag 600

ggaactgata acggacgtca gaaaaccaga aatcatggtt atgacgtcat tgtaggcgga 660

gagctattta ctgattactc cgatcaccct cgcaaacttg tcacgctaaa cccaaaactc 720

aaatcaacag gcgccggacg ctaccagctt ctttcccgtt ggtgggatgc ctaccgcaag 780

cagcttggcc tgaaagactt ctctccgaaa agtcaggacg ctgtggcatt gcagcagatt 840

aaggagcgtg gcgctttacc tatgattgat cgtggtgata tccgtcaggc aatcgaccgt 900

tgcagcaata tctgggcttc actgccgggc gctggttatg gtcagttcga gcataaggct 960

gacagcctga ttgcaaaatt caaagaagcg ggcggaacgg tcagagagat tgatgtatga 1020

gcagagtcac cgcgattatc tccgctctgg ttatctgcat catcgtctgc ctgtcatggg 1080

ctgttaatca ttaccgtgat aacgccatta cctacaaagc ccagcgcgac aaaaatgcca 1140

gagaactgaa gctggcgaac gcggcaatta ctgacatgca gatgcgtcag cgtgatgttg 1200

ctgcgctcga tgcaaaatac acgaaggagt tagctgatgc taaagctgaa aatgatgctc 1260

tgcgtgatga tgttgccgct ggtcgtcgtc ggttgcacat caaagcagtc tgtcagtcag 1320

tgcgtgaagc caccaccgcc tccggcgtgg ataatgcagc ctccccccga ctggcagaca 1380

ccgctgaacg ggattatttc accctcagag agaggctgat cactatgcaa aaacaactgg 1440

aaggaaccca gaagtatatt aatgagcagt gcagatagag ttgcccatat cgatgggcaa 1500

ctcatgcaat tattgtgagc aatacacacg cgcttccagc ggagtataaa tgcctaaagt 1560

aataaaaccg agcaatccat ttacgaatgt ttgctgggtt tctgttttaa caacattttc 1620

tgcgccgcca caaattttgg ctgcatcgac agttttcttc tgcccaattc cagaaacgaa 1680

gaaatgatgg gtgatggttt cctttggtgc tactgctgcc ggtttgtttt gaacagtaaa 1740

cgtctgttga gcacatcctg taataagcag ggccagcgca gtagcgagta gcattttttt 1800

catggtgtta ttcccgatgc tttttgaagt tcgcagaatc gtatgtgtag aaaattaaac 1860

aaaccctaaa caatgagttg aaatttcata ttgttaatat ttattaatgt atgtcaggtg 1920

cgatgaatcg tcattgtatt cccggattaa ctatgtccac agccctgacg gggaacttct 1980

ctgcgggagt gtccgggaat aattaaaacg atgcacacag ggtttagcgc gtacacgtat 2040

tgcattatgc caacgccccg gtgctgacac ggaagaaacc ggacgttatg atttagcgtg 2100

gaaagatttg tgtagtgttc tgaatgctct cagtaaatag taatgaatta tcaaaggtat 2160

agtaatatct tttatgttca tggatatttg taacccatcg gaaaactcct gctttagcaa 2220

gattttccct gtattgctga aatgtgattt ctcttgattt caacctatca taggacgttt 2280

ctataagatg cgtgtttctt gagaatttaa catttacaac ctttttaagt ccttttatta 2340

acacggtgtt atcgttttct aacacgatgt gaatattatc tgtggctaga tagtaaatat 2400

aatgtgagac gttgtgacgt tttagttcag aataaaacaa ttcacagtct aaatcttttc 2460

gcacttgatc gaatatttct ttaaaaatgg caacctgagc cattggtaaa accttccatg 2520

tgatacgagg gcgcgtagtt tgcattatcg tttttatcgt ttcaatctgg tctgacctcc 2580

ttgtgttttg ttgatgattt atgtcaaata ttaggaatgt tttcacttaa tagtattggt 2640

tgcgtaacaa agtgcggtcc tgctggcatt ctggagggaa atacaaccga cagatgtatg 2700

taaggccaac gtgctcaaat cttcatacag aaagatttga agtaatattt taaccgctag 2760

atgaagagca agcgcatgga gcgacaaaat gaataaagaa caatctgctg atgatccctc 2820

cgtggatctg attcgtgtaa aaaatatgct taatagcacc atttctatga gttaccctga 2880

tgttgtaatt gcatgtatag aacataaggt gtctctggaa gcattcagag caattgaggc 2940

agcgttggtg aagcacgata ataatatgaa ggattattcc ctggtggttg actgatcacc 3000

ataactgcta atcattcaaa ctatttagtc tgtgacagag ccaacacgca gtctgtcact 3060

gtcaggaaag tggtaaaact gcaactcaat tactgcaatg ccctcgtaat taagtgaatt 3120

tacaatatcg tcctgttcgg agggaagaac gcgggatgtt cattcttcat cacttttaat 3180

tgatgtatat gctctctttt ctgacgttag tctccgacgg caggcttcaa tgacccaggc 3240

tgagaaattc ccggaccctt tttgctcaag agcgatgtta atttgttcaa tcatttggtt 3300

aggaaagcgg atgttgcggg ttgttgttct gcgggttctg ttcttcgttg acatgaggtt 3360

gccccgtatt cagtgtcgct gatttgtatt gtctgaagtt gtttttacgt taagttgatg 3420

cagatcaatt aatacgatac ctgcgtcata attgattatt tgacgtggtt tgatggcctc 3480

cacgcacgtt gtgatatgta gatgataatc attatcactt tacgggtcct ttccggtgaa 3540

aaaaaaggta ccaaaaaaaa catcgtcgtg agtagtgaac cgtaagc 3587

<210> 40

<211> 3560

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 40

gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc accggaaagg 60

acccgtaaag tgataatgat tatcatctac atatcacaac gtgcgtggag gccatcaaac 120

cacgtcaaat aatcaattat gacgcaggta tcgtattaat tgatctgcat caacttaacg 180

taaaaacaac ttcagacaat acaaatcagc gacactgaat acggggcaac ctcatgtcaa 240

cgaagaacag aacccgcaga acaacaaccc gcaacatccg ctttcctaac caaatgattg 300

aacaaattaa catcgctctt gagcaaaaag ggtccgggaa tttctcagcc tgggtcattg 360

aagcctgccg tcggagacta acgtcagaaa agagagcata tacatcaatt aaaagtgatg 420

aagaatgaac atcccgcgtt cttccctccg aacaggacga tattgtaaat tcacttaatt 480

acgagggcat tgcagtaatt gagttgcagt tttaccactt tcctgacagt gacagactgc 540

gtgttggctc tgtcacagac taaatagttt gaatgattag cagttatggt gatcagtcaa 600

ccaccaggga ataatccttc atattattat cgtgcttcac caacgctgcc tcaattgctc 660

tgaatgcttc cagagacacc ttatgttcta tacatgcaat tacaacatca gggtaactca 720

tagaaatggt gctattaagc atatttttta cacgaatcag atccacggag ggatcatcag 780

cagattgttc tttattcatt ttgtcgctcc atgcgcttgc tcttcatcta gcggttaaaa 840

tattacttca aatctttctg tatgaagatt tgagcacgtt ggccttacat acatctgtcg 900

gttgtatttc cctccagaat gccagcagga ccgcactttg ttacgcaacc aatactatta 960

agtgaaaaca ttcctaatat ttgacataaa tcatcaacaa aacacaagga ggtcagacca 1020

gattgaaacg ataaaaacga taatgcaaac tacgcgccct cgtatcacat ggaaggtttt 1080

accaatggct caggttgcca tttttaaaga aatattcgat caagtgcgaa aagatttaga 1140

ctgtgaattg ttttattctg aactaaaacg tcacaacgtc tcacattata tttactatct 1200

agccacagat aatattcaca tcgtgttaga aaacgataac accgtgttaa taaaaggact 1260

taaaaaggtt gtaaatgtta aattctcaag aaacacgcat cttatagaaa cgtcctatga 1320

taggttgaaa tcaagagaaa tcacatttca gcaatacagg gaaaatcttg ctaaagcagg 1380

agttttccga tgggttacaa atatccatga acataaaaga tattactata cctttgataa 1440

ttcattacta tttactgaga gcattcagaa cactacacaa atctttccac gctaaatcat 1500

aacgtccggt ttcttccgtg tcagcaccgg ggcgttggca taatgcaata cgtgtacgcg 1560

ctaaaccctg tgtgcatcgt tttaattatt cccggacact cccgcagaga agttccccgt 1620

cagggctgtg gacatagtta atccgggaat acaatgacga ttcatcgcac ctgacataca 1680

ttaataaata ttaacaatat gaaatttcaa ctcattgttt agggtttgtt taattttcta 1740

cacatacgat tctgcgaact tcaaaaagca tcgggaataa caccatgaaa aaaatgctac 1800

tcgctactgc gctggccctg cttattacag gatgtgctca acagacgttt actgttcaaa 1860

acaaaccggc agcagtagca ccaaaggaaa ccatcaccca tcatttcttc gtttctggaa 1920

ttgggcagaa gaaaactgtc gatgcagcca aaatttgtgg cggcgcagaa aatgttgtta 1980

aaacagaaac ccagcaaaca ttcgtaaatg gattgctcgg ttttattact ttaggcattt 2040

atactccgct ggaagcgcgt gtgtattgct cacaataatt gcatgagttg cccatcgata 2100

tgggcaactc tatctgcact gctcattaat atacttctgg gttccttcca gttgtttttg 2160

catagtgatc agcctctctc tgagggtgaa ataatcccgt tcagcggtgt ctgccagtcg 2220

gggggaggct gcattatcca cgccggaggc ggtggtggct tcacgcactg actgacagac 2280

tgctttgatg tgcaaccgac gacgaccagc ggcaacatca tcacgcagag catcattttc 2340

agctttagca tcagctaact ccttcgtgta ttttgcatcg agcgcagcaa catcacgctg 2400

acgcatctgc atgtcagtaa ttgccgcgtt cgccagcttc agttctctgg catttttgtc 2460

gcgctgggct ttgtaggtaa tggcgttatc acggtaatga ttaacagccc atgacaggca 2520

gacgatgatg cagataacca gagcggagat aatcgcggtg actctgctca tacatcaatc 2580

tctctgaccg ttccgcccgc ttctttgaat tttgcaatca ggctgtcagc cttatgctcg 2640

aactgaccat aaccagcgcc cggcagtgaa gcccagatat tgctgcaacg gtcgattgcc 2700

tgacggatat caccacgatc aatcataggt aaagcgccac gctccttaat ctgctgcaat 2760

gccacagcgt cctgactttt cggagagaag tctttcaggc caagctgctt gcggtaggca 2820

tcccaccaac gggaaagaag ctggtagcgt ccggcgcctg ttgatttgag ttttgggttt 2880

agcgtgacaa gtttgcgagg gtgatcggag taatcagtaa atagctctcc gcctacaatg 2940

acgtcataac catgatttct ggttttctga cgtccgttat cagttccctc cgaccacgcc 3000

agcatatcga ggaacgcctt acgttgatta ttgatttcta ccatcttcta ctccggcttt 3060

tttagcagcg aagcgtttga taagcgaacc aatcgagtca gtaccgatgt agccgataaa 3120

cacgctcgtt atataagcga gattgctact tagtccggcg aagtcgagaa ggtcacgaat 3180

gaactaggcg ataatggcgc acatcgttgc gtcgattact gtttttgtaa acgcaccgcc 3240

attatatctg ccgcgaaggt acgccattgc aaacgcaagg attgccccga tgccttgttc 3300

ctttgccgcg agaatggcgg ccaacaggtc atgtttttct ggcatcttca tgtcttaccc 3360

ccaataaggg gatttgctct atttaattag gaataaggtc gattactgat agaacaaatc 3420

caggctactg tgtttagtaa tcagatttgt tcgtgaccga tatgcacggg caaaacggca 3480

ggaggttgtt agcgcaaaaa aaaaattcca aaaaaaaaat tccaaaaaaa aaaagcgact 3540

aacaaacaca atctgatggc 3560

<210> 41

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 41

gcaatatcag caccaacaga aacaacctt 29

<210> 42

<211> 103

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例5中使用的序列。

<400> 42

tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 60

tttttttttt ttttttggtt gtttctgttg gtgctgatat tgc 103

<210> 43

<211> 606

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例5中使用的序列。

<400> 43

gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60

tttttgacgc tcagtaatgt gacgatagct gaaaactgta cgataaacgg tacgctgagg 120

gcggaaaaaa tcgtcgggga cattgtaaag gcggcgagcg cggcttttcc gcgccagcgt 180

gaaagcagtg tggactggcc gtcaggtacc cgtactgtca ccgtgaccga tgaccatcct 240

tttgatcgcc agatagtggt gcttccgctg acgtttcgcg gaagtaagcg tactgtcagc 300

ggcaggacaa cgtattcgat gtgttatctg aaagtactga tgaacggtgc ggtgatttat 360

gatggcgcgg cgaacgaggc ggtacaggtg ttctcccgta ttgttgacat gccagcgggt 420

cggggaaacg tgatcctgac gttcacgctt acgtccacac ggcattcggc agatattccg 480

ccgtatacgt ttgccagcga tgtgcaggtt atggtgatta agaaacaggc gctgggcatc 540

agcgtggtct gagtgtgaaa aaaaaggtac caaaaaaaac atcgtcgtga gtagtgaacc 600

gtaagc 606

<210> 44

<211> 606

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例5中使用的序列。

<400> 44

gcttacggtt cactactcac gacgatgttt tttttggtac cttttttttc acactcagac 60

cacgctgatg cccagcgcct gtttcttaat caccataacc tgcacatcgc tggcaaacgt 120

atacggcgga atatctgccg aatgccgtgt ggacgtaagc gtgaacgtca ggatcacgtt 180

tccccgaccc gctggcatgt caacaatacg ggagaacacc tgtaccgcct cgttcgccgc 240

gccatcataa atcaccgcac cgttcatcag tactttcaga taacacatcg aatacgttgt 300

cctgccgctg acagtacgct tacttccgcg aaacgtcagc ggaagcacca ctatctggcg 360

atcaaaagga tggtcatcgg tcacggtgac agtacgggta cctgacggcc agtccacact 420

gctttcacgc tggcgcggaa aagccgcgct cgccgccttt acaatgtccc cgacgatttt 480

ttccgccctc agcgtaccgt ttatcgtaca gttttcagct atcgtcacat tactgagcgt 540

caaaaaaaaa attccaaaaa aaaaattcca aaaaaaaaaa gcgactaaca aacacaatct 600

gatggc 606

<210> 45

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例5中使用的序列。

<400> 45

gcaatatcag caccaacaga aacaacct 28

<210> 46

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例5中使用的序列。

<400> 46

tttttttttt 10

<210> 47

<211> 3560

<212> DNA

<213> 人工序列

<220>

<223> 實(shí)施例2中使用的序列。

<400> 47