午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

用于通用分子識(shí)別的植物嵌合結(jié)合多肽的制作方法

文檔序號(hào):438372閱讀:205來(lái)源:國(guó)知局

專利名稱::用于通用分子識(shí)別的植物嵌合結(jié)合多肽的制作方法用于通用分子識(shí)別的植物嵌合結(jié)合多肽
背景技術(shù)
:蛋白對(duì)靶的結(jié)合特異性和親和性主要由一個(gè)或多個(gè)結(jié)合區(qū)域內(nèi)蛋白的氨基酸序列所決定。因此,改變相關(guān)區(qū)域的氨基酸序列重構(gòu)了蛋白的結(jié)合性質(zhì)。在自然界中,蛋白結(jié)合中的組合變化由免疫系統(tǒng)產(chǎn)生的免疫球蛋白的大量排列提供了最好的說(shuō)明。每個(gè)免疫球蛋白包含一組短的、事實(shí)上獨(dú)一無(wú)二的被稱為超變區(qū)(即蛋白結(jié)合結(jié)構(gòu)域)的氨基酸序列,以及另一組較長(zhǎng)的被稱為恒定區(qū)的不變的序列。盡管在免疫球蛋白群體中的超變區(qū)之間存在龐大的序列多樣性,但恒定區(qū)形成了/3片層,穩(wěn)定了蛋白的三維結(jié)構(gòu)。每組超變區(qū)都賦予結(jié)合特異性和親和性。兩條重鏈和兩條輕鏈免疫球蛋白裝配成大的蛋白復(fù)合物(即抗體),進(jìn)一步增加了具有多樣結(jié)合活性的組合數(shù)量??贵w的結(jié)合多樣性已經(jīng)被成功地用于許多生物醫(yī)學(xué)和工業(yè)應(yīng)用。例如,已經(jīng)構(gòu)建了表達(dá)帶有人工多樣化超變區(qū)域的免疫球蛋白的文庫(kù)。免疫球蛋白表達(dá)文庫(kù)對(duì)于鑒定針對(duì)靶分子(例如受體或受體的配體)的高親和性抗體是非常有用的。然后可以分離所鑒定的免疫球蛋白的編碼核酸,并將其在宿主細(xì)胞或生物體中表達(dá)。但是,盡管免疫球蛋白和抗體總體是有用的,它們?cè)谵D(zhuǎn)基因植物中的表達(dá)卻可能成問(wèn)題。因?yàn)樾枰纬啥鄠€(gè)二硫鍵,免疫球蛋白不能在植物細(xì)胞質(zhì)中適當(dāng)?shù)卣郫B。此外,免疫球蛋白的大尺寸也阻止了它們被某些植物害蟲(chóng)有效攝取。因此,免疫球蛋白通常來(lái)說(shuō)不像蛋白殺蟲(chóng)劑或殺蟲(chóng)劑耙向分子那樣有用。最后,在可食用植物中表達(dá)哺乳動(dòng)物蛋白例如免疫球蛋白(例如所謂的"植物抗體")也帶來(lái)了潛在的消費(fèi)者接受性的問(wèn)題,因此對(duì)商業(yè)化來(lái)說(shuō)是一個(gè)障礙。這可能有效地阻止了將植物抗體用于轉(zhuǎn)基因植物的許多輸入和輸出性狀。上面提到的免疫球蛋白的缺點(diǎn)可以通過(guò)產(chǎn)生來(lái)自其它類(lèi)別的結(jié)構(gòu)耐受蛋白、優(yōu)選為植物來(lái)源蛋白的結(jié)合蛋白多樣性文庫(kù)來(lái)克服。這些文庫(kù)可以被篩選,以鑒定可以與目的靶以所需的特異性和親和性結(jié)合的個(gè)體蛋白。然后,可以將鑒定的結(jié)合蛋白在轉(zhuǎn)基因植物中有效地表達(dá)。發(fā)明簡(jiǎn)述本文描述了編碼植物嵌合結(jié)合多肽的核酸的多樣性文庫(kù)以及產(chǎn)生它們的方法。嵌合結(jié)合多肽在概念上與免疫球蛋白類(lèi)似,在于它們的特點(diǎn)都是在編碼結(jié)構(gòu)牢靠的蛋白的不變序列構(gòu)成框架中具有高度可變的結(jié)合結(jié)構(gòu)域。但是,本文描述的嵌合的結(jié)合多肽具有來(lái)源于植物蛋白序列的顯著優(yōu)點(diǎn),因此避免了與在植物中表達(dá)免疫球蛋白有關(guān)的許多問(wèn)題。被編碼的植物嵌合結(jié)合蛋白的氨基酸序列源自包含了要變化的子序列的支架多肽序列。該變化的子序列對(duì)應(yīng)于植物嵌合結(jié)合多肽的推定的結(jié)合結(jié)構(gòu)域,在編碼的植物嵌合結(jié)合蛋白的文庫(kù)中是高度異源的。相反,在變化的子序列之外的編碼的嵌合結(jié)合蛋白的序列則與親本支架多肽序列基本上相同,并在整個(gè)編碼的植物嵌合結(jié)合蛋白的文庫(kù)中是高度同源的。這樣的文庫(kù)可以用作通用的分子識(shí)別平臺(tái),以篩選具有高度選擇性和親和性結(jié)合的蛋白,用于在轉(zhuǎn)基因植物中表達(dá)。因此,本文描述的一個(gè)方面是至少10種(例如至少1000、105或106種)不同的嵌合結(jié)合多肽的編碼核酸分子的文庫(kù)。每種多肽的氨基酸序列包括CrXrCrXrCVXrCp其中CrC4是選自紫色酸性磷酸酶(即分別為SEQIDNO:1-30、31-60、61-90和91-120)的骨架子序列,對(duì)于選定的紫色酸性磷酸酶序列,可以包含最多30個(gè)(例如20、10或5個(gè))單個(gè)氨基酸取代、缺失、插入或添加。d-Q子序列在文庫(kù)中編碼的許多多肽中是同源的。與CpC4骨架子序列相反,X!-X3子序列是由2-20個(gè)氨基酸構(gòu)成的獨(dú)立可變的子序列,這些子序列在文庫(kù)的許多多肽中是異源的。例如,嵌合多肽的文庫(kù)可以含有SEQIDNO:124-126任何一個(gè)中的氨基酸序列,包括對(duì)應(yīng)于SEQIDNO:124-126的23-39、51-49和79-84氨基酸位置的1個(gè)到10個(gè)單個(gè)氨基酸取代、缺失、插入或添加。本文描述的另一個(gè)方面是產(chǎn)生剛才描述的文庫(kù)的方法。該方法包括提供編碼含有上面定義的Q-XrCVX2-C3-X3-C4的植物支架多肽序列的親本核酸。該方法還包括在對(duì)親本XpX2或X3子序列導(dǎo)入最多10個(gè)單氨基酸取代、缺失、插入或添加的條件下復(fù)制親本核酸(例如XrX3子序列的至少一個(gè)從SEQIDNO:121-123中選擇),從而產(chǎn)生編碼Xi、X2或X3的隨機(jī)改變的子序列的異源群體。然后用改變的子序列群體在對(duì)應(yīng)于編碼X"X2或X3的核酸的位置取代進(jìn)入親本核酸群體??梢酝ㄟ^(guò)體外復(fù)制(例如使用純化的誘變聚合酶或核苷酸類(lèi)似物)或體內(nèi)復(fù)制(例如在大腸桿菌(E.coli)的誘變菌株中)將氨基酸取代、缺失、插入或添加導(dǎo)入到親本核酸子序列中。剛才描述的文庫(kù)可以導(dǎo)入到生物復(fù)制系統(tǒng)(例如大腸桿菌或噬菌體)中并擴(kuò)增。本文描述的一個(gè)相關(guān)方面是另一種產(chǎn)生上述核酸文庫(kù)的方法。該方法包括選擇含有上面定義的C廣XrC2-X2-C3-X3-C4的氨基酸序列。該方法還包括提供具有交疊的互補(bǔ)序列的第一和第二組寡核苷酸。第一組寡核苷酸編碼Q-C4子序列和多個(gè)異源的XrX3子序列。第二組寡核苷酸與編碼Q-Q子序列和多個(gè)異源XrX3子序列的核苷酸序列互補(bǔ)。混合這兩組寡核苷酸以形成第一混合物,并在允許交疊的互補(bǔ)序列雜交的條件下孵育。然后將獲得的雜交序列延伸,以形成含有上述文庫(kù)的第二混合物。本發(fā)明的另一個(gè)方面是編碼嵌合結(jié)合多肽的核酸的文庫(kù),該嵌合結(jié)合多肽的每一種都含有與SEQIDNO:127-129中任何一個(gè)具有至少70%(即70%到100%之間的任何百分率)同一性的氨基酸序列。每種編碼的多肽的氨基酸序列包括在14、15、33、35-36、38、47-48、66、68-69、71、80、81、99、101-102禾卩104位上與SEQIDNO:127-129的序列不同的氨基酸,并且氨基酸的差異在多種編碼的多肽中是異質(zhì)的。每種編碼的多肽在上面列出的位置之外的氨基酸序列在多種編碼的嵌合多肽中是同質(zhì)的。本文描述的一個(gè)相關(guān)方面是產(chǎn)生剛才描述的文庫(kù)的方法。該方法包括選擇對(duì)應(yīng)于SEQIDNO:127-129中任何一個(gè)的氨基酸序列,其中所選的序列與SEQIDNO:127-129在至少一個(gè)上面提到的位置上不同。該方法還包括提供具有交疊的互補(bǔ)序列的第一和第二組寡核苷酸。第一組寡核苷酸編碼選擇的氨基酸序列的子序列,該子序列在上面提到的位置上是異質(zhì)的。第二組寡核苷酸與選擇的氨基酸序列的子序列的編碼核苷酸序列互補(bǔ),該子序列在上面提到的位置上是異質(zhì)的。將兩組寡核苷酸混合以形成第一混合物,并在允許交疊的互補(bǔ)序列雜交的條件下孵育。然后將獲得的雜交序列延伸,以形成含有上述文庫(kù)的第二混合物。本發(fā)明的各種實(shí)施可以包含下面的一種或多種。例如,文庫(kù)中的每種核酸可以包含載體序列。另一個(gè)特點(diǎn)是任何從上述的文庫(kù)之一中分離的核酸、以及由它編碼的嵌合結(jié)合多肽,是純的形式。在一種實(shí)施中,提供了表達(dá)由文庫(kù)之一編碼的嵌合結(jié)合多肽的細(xì)胞群體(或選自細(xì)胞群體的個(gè)體細(xì)胞)。另一種實(shí)施的特點(diǎn)是由一種核酸文庫(kù)編碼的純化的嵌合結(jié)合多肽的文庫(kù)。另外一種實(shí)施提供了展示由核酸文庫(kù)之一編碼的嵌合結(jié)合多肽的絲狀噬菌體群體。在通過(guò)寡核苷酸裝配產(chǎn)生上述核酸文庫(kù)的各種實(shí)施方法中,可以包含下列的一種或多種。例如,在產(chǎn)生含有核酸文庫(kù)的第二個(gè)混合物之后,方法還可以包括對(duì)核酸群體進(jìn)行變性循環(huán),然后進(jìn)行雜交和延伸步驟。任選,該循環(huán)可以重復(fù)(例如最多100次)。核酸文庫(kù)可以通過(guò)聚合酶鏈反應(yīng)來(lái)擴(kuò)增,其中包括分別與文庫(kù)中所有核酸的5'和3'末端序列雜交的正向和反向引物。在一種實(shí)施中,在可變序列位置上編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、半胱氨酸和纈氨酸(20種天然存在的氨基酸)的亞組(例如僅僅4、6、8、10、12、14或16種)。在其它情況下,使用20種之中的19種(除去半胱氨酸)。在其它情況下所有20種都使用。在另一種實(shí)施中,氨基酸的亞組包括至少一種脂肪族、一種酸性、一種中性和一種芳香族氨基酸(例如丙氨酸、天冬氨酸、絲氨酸和酪氨酸)。這里描述了編碼至少I(mǎi)O種不同的多肽的核酸文庫(kù),每種多肽的氨基酸序列包含Q-X廣C2陽(yáng)X2-C3-X3-C4,其中(i)子序列C,選自SEQ.IDNO:1-30,子序列C2選自SEQIDNO:31-60,子序列Q選自SEQ.IDNO:61-90,子序列Q選自SEQ.IDNO:91-120,并且CrC4中的每一個(gè)含有對(duì)選擇的子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;(ii)C,-Q在多個(gè)編碼的多肽中是同質(zhì)的;(Hi)XrXs中的每個(gè)是由2-20個(gè)氨基酸構(gòu)成的獨(dú)立可變的子序列,并且XrX3中的每個(gè)在多個(gè)編碼多肽中是異質(zhì)的。還描述了編碼至少10種不同多肽的核酸文庫(kù),每個(gè)多肽的氨基酸序列含有C廣XKVX2-C3-X3-C4,其中(i)子序列d選自圖2或圖4,子序列C2選自圖2或圖4,子序列C3選自圖2或圖4,子序列C4選自圖2或圖4,并且d-C4的每一個(gè)都含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;(ii)C!-C4在多個(gè)編碼的多肽中是同質(zhì)的;(iii)X^X3的每個(gè)都是由2-20個(gè)氨基酸構(gòu)成的獨(dú)立可變的子序列,并且XrX3的每個(gè)在多個(gè)編碼多肽中是異質(zhì)的。22還描述了編碼至少I(mǎi)O種不同多肽的核酸文庫(kù),每種多肽的氨基酸序列含有Q-X!-C2-X2-C3-X3-C4,其中(i)子序列d選自圖3或圖5,子序列C2選自圖3或圖5,子序列C3選自圖3或圖5,子序列C4選自圖3XX,并且CrC4的每一個(gè)含有對(duì)所選子序列的最多30個(gè)單氨基酸取代、缺失、插入或添加;(ii)CrC4在多個(gè)編碼的多肽中是同質(zhì)的;(iii)XrX3的每個(gè)都是由2-20個(gè)氨基酸構(gòu)成的獨(dú)立可變的子序列,并且XrX3的每個(gè)在多個(gè)編碼多肽中是異質(zhì)的。在各種不同的實(shí)施方案中編碼了至少1,000種不同的多肽;編碼了至少100,000種不同的多肽;編碼了至少1,000,000種不同的多肽;d-C4的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多20個(gè)單氨基酸取代、缺失、插入或添加;C,-C4的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;Q-C4的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多5個(gè)單氨基酸取代、缺失、插入或添加;d-Q都不含有對(duì)所選子序列的氨基酸取代、缺失、插入或添加;X,-X3的氨基酸選自在植物中遺傳編碼的少于20種氨基酸;XrX3的氨基酸選自在植物中遺傳編碼的所有20種氨基酸;少于20種遺傳編碼的氨基酸包括至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸以及至少一種芳香族氨基酸;少于20種遺傳編碼的氨基酸包含丙氨酸、天冬氨酸、絲氨酸和酪氨酸。在某些情況下每種多肽的氨基酸序列選自(a).含有C廣X廣C2-X2-C3-X3-C4的多肽,其中C尸SEQ.IDN0:1,C2=SEQ.IDNO:31,C3=SEQ.IDNO:61,禾口C4=SEQ.IDNO:91;(b).含有d-X廣C2-X2-C3-X3-C4的多肽,其中Q=SEQ.IDNO:2,C2=SEQ.IDNO:32,C3=SEQ.IDNO:62,禾卩C4=SEQ.IDNO:92;以及(c).含有d-X廣CVX2-C3-X3-C4的多肽,其中C!=SEQ.IDNO:3,C2=SEQ.IDNO:33,C3=SEQ.IDNO:63,和C4=SEQ.IDNO:93。在某些情況下每種編碼的多肽含有CVXrC2-X2-C3-X3-C4,其中d=SEQ.IDNO:Xl,C2=SEQ.IDNO:X2,C3=SEQ.IDNO:X3,禾口C4=SEQ.IDNO:X4;命名為SEQ.IDNO:130。在某些情況下每種編碼的多肽含有d-X,-C2-X2-CrX3-C4,其中d=SEQ.IDNO:Xl,C2=SEQ.IDNO:X2,C3=SEQ.IDNO:X3,和C4=SEQ.IDNO:X4;命名為SEQ.IDNO:130。在某些實(shí)施方案中其中每種核酸含有載體序列。還描述了選自文庫(kù)的分離核酸和表達(dá)核酸的分離細(xì)胞,以及由文庫(kù)編碼的純化多肽的純化文庫(kù);以及展示了文庫(kù)編碼的多肽的絲狀噬菌體的群體。本文還描述了產(chǎn)生文庫(kù)的方法,包括(i)提供編碼含有下列氨基酸序列的親本多肽的親本核酸CVXi-C2-X2-C3-X3-Q,其中子序列C,選自SEQIDNO:1-30中選擇,子序列(32選自SEQIDNO:31-60中選擇,子序列C3選自SEQIDNO:61-90中選擇,子序列Ot選自SEQIDNO:91-120中選擇;d-C4的每個(gè)含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;XrX3的每個(gè)是由2-20個(gè)氨基酸組成的獨(dú)立的子序列;(ii)在對(duì)X"X2或X3子序列導(dǎo)入最多10個(gè)單氨基酸取代、缺失、插入或添加的條件下復(fù)制親本核酸,從而產(chǎn)生編碼X,'、X2,或X3'的隨機(jī)變化的子序列群體;以及(iii)隨機(jī)變化的子序列X,'、X2'或X3'的群體在對(duì)應(yīng)于編碼X,、X2或X3的位置上取代進(jìn)入親本核酸的群體中。在各種不同情況下XrX3子序列的至少一個(gè)選自SEQIDNO:121-123中選擇;d-C4的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多20個(gè)單氨基酸取代、缺失、插入或添加;CrC4的每個(gè)獨(dú)立地含有對(duì)所選24子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;d-Q的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多5個(gè)單氨基酸取代、缺失、插入或添加;CrQ都不含有對(duì)所選子序列的氨基酸取代、缺失、插入或添加;通過(guò)在X,、X2或X3的每個(gè)中導(dǎo)入最多5個(gè)氨基酸取代,復(fù)制產(chǎn)生隨機(jī)變化的子序列的異質(zhì)群體;該方法還包括通過(guò)將文庫(kù)導(dǎo)入生物復(fù)制系統(tǒng)并增殖生物復(fù)制系統(tǒng)來(lái)擴(kuò)增文庫(kù);生物復(fù)制系統(tǒng)是多種大腸桿菌細(xì)胞;生物復(fù)制系統(tǒng)是多種噬菌體;復(fù)制發(fā)生在體外;復(fù)制使用純化的誘變聚合酶來(lái)進(jìn)行;復(fù)制在核苷酸類(lèi)似物存在下進(jìn)行;復(fù)制發(fā)生在體內(nèi);體內(nèi)復(fù)制發(fā)生在大腸桿菌的誘變種類(lèi)中。還描述了產(chǎn)生權(quán)利要求1的文庫(kù)的方法,包括(i)選擇包含待編碼的氨基酸序列C,-XrC2-X2-C3-X3-C4的氨基酸序列,其中(a)子序列C!選自SEQIDNO:1-30,子序列Q選自SEQIDNO:31-60,子序列(33選自SEQIDNO:61-90,子序列Q選自SEQIDNO:91-120;(b)d-C4中的每個(gè)含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;(C)Xi、X2和X3的每個(gè)由長(zhǎng)度為2-20個(gè)氨基酸的氨基酸序列構(gòu)成;(ii)提供第一多個(gè)和第二多個(gè)寡核苷酸,其中(a)第一多個(gè)寡核苷酸編碼CrQ子序列和多個(gè)異質(zhì)的XrX3變異子序列X卩-X3';(b)第二多個(gè)寡核苷酸與編碼Q-C4子序列的核苷酸序列和編碼多個(gè)異質(zhì)的X卩-X3'子序列的核苷酸序列互補(bǔ);以及(C)第一和第二多個(gè)寡核苷酸具有彼此之間互補(bǔ)的交疊序列;(iii)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(v)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。在各種不同的情況下d-C4的每個(gè)都獨(dú)立地含有對(duì)所選子序列的最多20個(gè)單氨基酸取代、缺失、插入或添加;CrQ的每個(gè)都獨(dú)立地含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;d-C4中的每個(gè)都獨(dú)立地含有對(duì)所選子序列的從0到最多5個(gè)單氨基酸取代、缺失、插入或添加;本方法還包括進(jìn)行步驟的循環(huán),步驟的循環(huán)包括通過(guò)將第二個(gè)混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性,然后進(jìn)行步驟(iv)和(V);本方法還包括重復(fù)步驟的循環(huán)最多100次;本方法還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)基本上由文庫(kù)、正向引物和反向引物構(gòu)成,其中正向和反向引物可以與文庫(kù)中所有核酸的5'和3'末端序列分別雜交;在X"X2或X3子序列的每個(gè)位置中待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組;這里為每個(gè)單氨基酸取代選擇的氨基酸選自至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸和至少一種芳香族氨基酸的氨基酸組;氨基酸組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。本文還描述了產(chǎn)生文庫(kù)的方法,包括(i)提供編碼含有下列氨基酸序列的親本多肽的親本核酸Q-XrCVXrQ-XrCV其中子序列d選自圖2或圖4,子序列C2選自圖2或圖4,子序列C3選自圖2或圖4,子序列C4選自圖2或圖4;d-C4的每個(gè)都含有對(duì)所選子序列的最多IO個(gè)單氨基酸取代、缺失、插入或添加;XrX3的每個(gè)都是由2-20個(gè)氨基酸組成的獨(dú)立子序列;(ii)在對(duì)X,、乂2或X3子序列導(dǎo)入最多10個(gè)單氨基酸取代、缺失、插入或添加的條件下復(fù)制親本核酸,從而產(chǎn)生編碼X,'、X2'或X3'的隨機(jī)變化的子序列群體;以及(m)隨機(jī)變化的子序列Xr、X2'或X3'的群體在對(duì)應(yīng)于編碼XpX2或X3的位置上取代進(jìn)入親本核酸的群體。在各種不同的實(shí)施方案中X,-X3子序列的至少一個(gè)選自SEQIDNO:121-123中選擇;CrC4的每個(gè)都獨(dú)立地含有對(duì)所選子序列的最多20個(gè)單氨基酸取代、缺失、插入或添加;d-Q中的每個(gè)都獨(dú)立地含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;d-C4的每個(gè)都獨(dú)立地含有對(duì)所選子序列的最多5個(gè)單氨基酸取代、缺失、插入或添加;CrC4都不含有對(duì)所選子序列的氨基酸取代、缺失、插入或添加;通過(guò)在X,、X2或X3的每個(gè)中導(dǎo)入最多5個(gè)氨基酸取代,復(fù)制產(chǎn)生了隨機(jī)變化的子序列的異質(zhì)群體;該方法還包括通過(guò)將文庫(kù)導(dǎo)入生物復(fù)制系統(tǒng)并增殖生物復(fù)制系統(tǒng)來(lái)擴(kuò)增文庫(kù);生物復(fù)制系統(tǒng)是多種大腸桿菌細(xì)胞;生物復(fù)制系統(tǒng)是多種噬菌體;復(fù)制發(fā)生在體外;復(fù)制使用純化的誘變聚合酶來(lái)進(jìn)行;復(fù)制在核苷酸類(lèi)似物的存在下進(jìn)行;復(fù)制發(fā)生在體內(nèi);體內(nèi)復(fù)制發(fā)生在誘變大腸桿菌種類(lèi)中。還描述了產(chǎn)生文庫(kù)的方法,包括(i)選擇待編碼的含有Q-XrC2-X2-CVX3-C4的氨基酸序列,其中(a)子序列d選自圖2或圖4,子序列C2選自圖2或圖4,子序列C3選自圖2或圖4,子序列C4選自圖2或圖4;(b)d-C4的每個(gè)都含有對(duì)所選子序列的最多IO個(gè)單氨基酸取代、缺失、插入或添加;(c)X,、X2和X3的每個(gè)都由長(zhǎng)度為2-20個(gè)氨基酸的氨基酸序列組成;(ii)提供第一多個(gè)和第二多個(gè)寡核苷酸,其中(a)第一多個(gè)寡核苷酸編碼CrQ子序列和多個(gè)異質(zhì)的XrX3變異子序列X,'-X3';(b)第二多個(gè)寡核苷酸與編碼d-Q子序列的核苷酸序列和編碼多個(gè)異質(zhì)的Xi'-X3'子序列的核苷酸序列互補(bǔ);以及(c;)第一和第二多個(gè)寡核苷酸具有彼此互補(bǔ)的交疊序列;(iii)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(v)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。在各種不同的情況下CrC4的每個(gè)都獨(dú)立地含有對(duì)所選子序列的最多20個(gè)單氨基酸取代、缺失、插入或添加;d-Q的每個(gè)都獨(dú)立地含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;CrC4的每個(gè)都獨(dú)立地含有從0到最多5個(gè)單氨基酸取代、缺失、插入或添加;本方法還包括進(jìn)行步驟的循環(huán),步驟的循環(huán)包括通過(guò)將第二個(gè)混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性,然后進(jìn)行步驟(iv)和(V);本方法還包括重復(fù)步驟的循環(huán)最多100次;本方法還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)主要由文庫(kù)、正向引物和反向引物組成,其中正向和反向引物可以與文庫(kù)中所有核酸的5'和3'末端序列分別雜交;在X,、X2或X3子序列的每個(gè)位置中待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組;為每個(gè)單氨基酸取代選擇的氨基酸選自至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸和至少一種芳香族氨基酸的氨基酸組;氨基酸組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。還公開(kāi)了產(chǎn)生文庫(kù)的方法,包括(i)提供編碼含有下列的氨基酸序列的親本多肽的親本核酸d-XrC2-X2-CVX3-C4,其中子序列d選自圖3或圖5,子序列C2選自圖3或圖5,子序列C3選自圖3或圖5,子序列C4選自圖3或圖5;d-C4的每個(gè)都含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;X^X3的每個(gè)是由2-20個(gè)氨基酸組成的獨(dú)立子序列;(ii)在對(duì)X"X2或X3子序列導(dǎo)入最多IO個(gè)單氨基酸取代、缺失、插入或添加的條件下復(fù)制親本核酸,從而產(chǎn)生編碼X,'、X2'或X3'的隨機(jī)變化的子序列群體;以及(iii)隨機(jī)變化的子序列X^、X2'或X3'的群體在對(duì)應(yīng)于編碼X"X2或X3的位置出取代進(jìn)入親本核酸群體。在各種不同的情況下X,-X3子序列中的至少一個(gè)選自SEQIDNO:121-123;d-Ct的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多20個(gè)單氨基酸取代、缺失、插入或添加;Q-Q的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;d-C4的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多5個(gè)單氨基酸取代、缺失、插入或添加;d-C4都不含有對(duì)所選子序列的氨基酸取代、缺失、插入或添加;通過(guò)在X,、乂2或乂3的每個(gè)中導(dǎo)入最多5個(gè)氨基酸取代,復(fù)制產(chǎn)生了隨機(jī)變化的子序列的異質(zhì)群體;該方法還包括通過(guò)將文庫(kù)導(dǎo)入生物復(fù)制系統(tǒng)并增殖生物復(fù)制系統(tǒng)來(lái)擴(kuò)增文庫(kù);生物復(fù)制系統(tǒng)是多種大腸桿菌細(xì)胞;生物復(fù)制系統(tǒng)是多種噬菌體;復(fù)制發(fā)生在體外;復(fù)制使用純化的誘變聚合酶來(lái)進(jìn)行;復(fù)制在核苷酸類(lèi)似物存在下進(jìn)行;復(fù)制發(fā)生在體內(nèi);體內(nèi)復(fù)制發(fā)生在誘變大腸桿菌種類(lèi)中。還描述了產(chǎn)生文庫(kù)的方法,包括(i)選擇待編碼的含有Q-X,-C2-X2-C3-X3-C4的氨基酸序列,其中(a)子序列d選自圖3或圖5,子序列C2選自圖3或圖5,子序列C3選自圖3或圖5,子序列C4選自圖3或圖5;(b)C,-C4的每個(gè)含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;(c)X,、X2和X3的每個(gè)由長(zhǎng)度為2-20個(gè)氨基酸的氨基酸序列組成;(ii)提供第一多個(gè)和第二多個(gè)寡核苷酸,其中(a)第一多個(gè)寡核苷酸編碼Q-C4子序列和多個(gè)異質(zhì)的XrX3變異子序列X卩-X3';(b)第二多個(gè)寡核苷酸與編碼d-Q子序列的核苷酸序列和編碼多個(gè)異質(zhì)的X,'-X3'子序列的核苷酸序列互補(bǔ);以及(C)第一和第二多個(gè)寡核苷酸具有彼此互補(bǔ)的交疊序列;(iii)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(v)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。在各種不同的實(shí)施方案中C,-C4的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多20個(gè)單氨基酸取代、缺失、插入或添加;C,-C4的每個(gè)獨(dú)立地含有對(duì)所選子序列的最多10個(gè)單氨基酸取代、缺失、插入或添加;d-Ct的每個(gè)含有對(duì)所選子序列的從0到最多5個(gè)單氨基酸取代、缺失、插入或添加;本方法還包括進(jìn)行步驟的循環(huán),循環(huán)包括通過(guò)將第二個(gè)混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性,然后進(jìn)行步驟(iv)和(V);本方法還包括重復(fù)循環(huán)最多100次;本方法還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)主要由文庫(kù)、正向引物和反向引物組成,其中正向和反向引物可以與文庫(kù)中所有核酸的5'和3'末端序列分別雜交;在XpX2或X3子序列的每個(gè)位置中待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組;為每個(gè)單氨基酸取代選擇的氨基酸選自至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸和至少一種芳香族氨基酸的氨基酸組;氨基酸組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。還描述了編碼至少10個(gè)不同多肽的核酸文庫(kù),其中(i)每個(gè)編碼多肽的氨基酸序列含有與SEQIDNO:127-129中的任何一個(gè)具有至少70%同一性的氨基酸序列;(ii)每個(gè)編碼多肽的氨基酸序列在位置14、15、33、35-36、38、47-48、66、68-69、71、80、81、99、101-102和104上包含與SEQIDNO:127-129不同的氨基酸,并且氨基酸的差異在多個(gè)編碼的多肽中是異質(zhì)的;以及(iii)每個(gè)編碼多肽的氨基酸序列在對(duì)應(yīng)于SEQIDNO:127-129的位置14、15、33、35-36、38、47-48、66、68-69、71、80、81、99、101-102和104的殘基之外,在多個(gè)編碼多肽中是同質(zhì)的。在各種不同的實(shí)施方案中多肽的氨基酸序列與SEQIDNO127-129中的任何一個(gè)具有至少75%的同一性;多肽的氨基酸序列與SEQIDNO127-129中的任何一個(gè)具有至少80%的同一性;以及多肽的氨基酸序列與SEQIDNO127-129中的任何一個(gè)具有至少85%的同一性;每個(gè)核酸含有載體序列。還公開(kāi)了選自文庫(kù)的編碼多肽的分離核酸;核酸編碼的純化多肽;文庫(kù)所編碼的多肽的表達(dá)細(xì)胞群體;選自細(xì)胞群體的細(xì)胞;由文庫(kù)編碼的純化的多肽文庫(kù);展示文庫(kù)編碼的多肽文庫(kù)的絲狀噬菌體群體。還公開(kāi)了產(chǎn)生文庫(kù)的方法,包括(i)選擇待編碼的對(duì)應(yīng)于SEQIDNO:127-129中的任何一個(gè)的氨基酸序列,其中選擇的序列與SEQIDNO:127-129的序列在至少一個(gè)可變位置14、15、33、35-36、38、47-48、66、68-69、71、80、81、99、101-102和104上不同;(ii)化學(xué)提供第一和第二多個(gè)寡核苷酸,其中(a)第一多個(gè)寡核苷酸編碼選擇的氨基酸序列的氨基酸子序列,該子序列在編碼的可變位置上是異質(zhì)的;(b)第二多個(gè)寡核苷酸與為編碼選擇的氨基酸序列的子序列的核苷酸序列互補(bǔ),該子序列在編碼的可變位置上是異質(zhì)的;以及(c)第一和第二多個(gè)寡核苷酸具有彼此互補(bǔ)的交疊序列;(iii)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(v)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。在各種不同的情況下,本方法還包括進(jìn)行循環(huán),所述循環(huán)是通過(guò)將第二個(gè)混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性,然后進(jìn)行步驟(iv)和(V);本方法還包括重復(fù)循環(huán)最多IOO次;本方法還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)主要由文庫(kù)、正向引物和反向引物組成,其中正向和反向引物可以與文庫(kù)中所有核酸的5'和3'末端的序列分別雜交;可變位置上待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組;為可變位置選擇的氨基酸選自脂肪族氨基酸、酸性氨基酸、中性氨基酸和芳香族氨基酸的組;氨基酸組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。本發(fā)明的一個(gè)或多個(gè)實(shí)施方案的詳細(xì)情況將在下面的說(shuō)明書(shū)中提出。根據(jù)說(shuō)明書(shū)和附圖以及權(quán)利要求,本發(fā)明的其它特點(diǎn)、目標(biāo)和優(yōu)點(diǎn)將變得顯而易見(jiàn)。圖1是示意圖,描述了通過(guò)對(duì)編碼的多肽支架序列內(nèi)的子序列進(jìn)行多樣化而產(chǎn)生編碼嵌合結(jié)合多肽的核酸的文庫(kù)。圖2是具有可以用作支架的區(qū)域的眾多蛋白的序列比對(duì)。這些蛋白與水稻半胱氨酸蛋白酶抑制劑(oryzacystatin)同源。Cl、C2、C3和C4被加框并標(biāo)記。圖3是具有可以用作支架的區(qū)域的眾多蛋白的序列比對(duì)。這些蛋白與C2同源。Cl、C2、C3和C4被加框并標(biāo)記。圖4是具有可以用作支架的區(qū)域的眾多蛋白的序列比對(duì)。這些蛋白與水稻半胱氨酸蛋白酶抑制劑同源。Cl、C2、C3和C4被加框并標(biāo)記。圖5是具有可以用作支架的區(qū)域的眾多蛋白的序列比對(duì)。這些蛋白與C2同源。Cl、C2、C3和C4被加框并標(biāo)記。具體說(shuō)明下面描述了編碼植物嵌合結(jié)合多肽的核酸的多樣文庫(kù)(例如cDNA文庫(kù))以及產(chǎn)生它們的方法。編碼的植物嵌合結(jié)合蛋白的文庫(kù)的氨基酸序列源自包括可變化的子序列的支架多肽序列。變化的子序列對(duì)應(yīng)于植物嵌合結(jié)合蛋白的推斷的結(jié)合結(jié)構(gòu)域,并且在植物嵌合結(jié)合蛋白文庫(kù)中是高度異質(zhì)性的。相反,在變化的子序列之外的編碼的嵌合結(jié)合蛋白的序列基本上與親本支架多肽序列相同,并且在編碼的植物嵌合結(jié)合蛋白整個(gè)文庫(kù)中是高度同質(zhì)的。因此,植物嵌合結(jié)合蛋白的文庫(kù)可以用作通用的分子識(shí)別文庫(kù)平臺(tái),以篩選特異的結(jié)合蛋白,用于在轉(zhuǎn)基因植物中表達(dá)。植物嵌合結(jié)合蛋白的文庫(kù)可以由轉(zhuǎn)染的細(xì)胞表達(dá)(即成為表達(dá)文庫(kù)),并測(cè)試與目的分子靶的相互作用。例如,可以篩選表達(dá)文庫(kù)以鑒定與植物害蟲(chóng)包括線蟲(chóng)表達(dá)的多肽以高度特異性和親和性結(jié)合的多肽。最后,具有所需靶結(jié)合性質(zhì)的個(gè)體嵌合結(jié)合蛋白可以在轉(zhuǎn)基因植物中表達(dá)。I.植物支架多肽序列植物支架多肽序列是基于在一個(gè)或多個(gè)區(qū)域內(nèi)結(jié)構(gòu)上耐受極端序列變異的基于植物蛋白的氨基酸序列。在支架多肽序列內(nèi)待改變的區(qū)域在概念上類(lèi)似于免疫球蛋白的超變區(qū),并在嵌合結(jié)合多肽中形成了推定的結(jié)合結(jié)構(gòu)域。因此,通過(guò)對(duì)支架多肽序列內(nèi)的特定序列進(jìn)行多樣化,產(chǎn)生了多樣的植物嵌合結(jié)合多肽的編碼核酸序列的大文庫(kù),下面將要詳細(xì)描述。選擇的植物支架多肽序列具有許多性質(zhì),例如它們(i)衍生自植物來(lái)源的序列;(ii)編碼結(jié)構(gòu)上耐受導(dǎo)入序列多樣性的蛋白;(iii)只包含在植物中表達(dá)時(shí)不干擾多肽折疊的二硫鍵;(iv)在多種植物組織中高水平表達(dá);以及(V)能夠定向到不同的亞細(xì)胞位置(例如細(xì)胞質(zhì)、線粒體、質(zhì)體)或從細(xì)胞中分泌?;谶@些性質(zhì),植物支架多肽序列允許產(chǎn)生具有高度多樣結(jié)合活性的嵌合結(jié)合多肽的大文庫(kù)??梢葬槍?duì)與靶分子的結(jié)合,篩選嵌合結(jié)合多肽的文庫(kù)。然后可以將具有所需結(jié)合活性的嵌合結(jié)合蛋白在植物中表達(dá),以賦予輸入性狀(例如害蟲(chóng)或病原抗性,耐干旱)或輸出性狀(例如修飾的脂質(zhì)組成、用于植物修復(fù)的重金屬結(jié)合、醫(yī)藥用途)。這些結(jié)合蛋白也可以用于各種不同的基于親和性的應(yīng)用,例如使用夾心ELISA診斷性檢測(cè)抗原的、抗原的組織化學(xué)檢測(cè)、產(chǎn)生蛋白生物芯片、以及抗原的親和純化?;谌S結(jié)構(gòu)已知的植物蛋白或蛋白結(jié)構(gòu)域的序列來(lái)選擇支架多肽序列是有用的(參見(jiàn)例如Nygren等(2004)"來(lái)自可選支架的結(jié)合蛋白"J.ofImmun.Methods290:3-28)。但是,即使?jié)撛诘闹Ъ芏嚯男蛄袥](méi)有實(shí)驗(yàn)確定的結(jié)構(gòu)數(shù)據(jù),也可以從候選氨基酸序列的計(jì)算機(jī)結(jié)構(gòu)分析收集到有價(jià)值的推論??捎糜诎被嵝蛄薪Y(jié)構(gòu)預(yù)測(cè)的程序包括,例如,在萬(wàn)維網(wǎng)的ics.uci.edu/~baldig/scratch/index上公共可用的"SCRATCHProteinPredictor"程序套裝。重要的是序列變異的導(dǎo)入不使支架多肽序列的已知或預(yù)測(cè)的二級(jí)結(jié)構(gòu)不穩(wěn)定。因此,支架多肽序列的已知或預(yù)測(cè)的二級(jí)結(jié)構(gòu)告知了選擇在支架多肽序列內(nèi)可以改變以形成推定的結(jié)合結(jié)構(gòu)域的氨基酸子序列。特定的支架多肽序列的結(jié)構(gòu)適合性容易測(cè)試,例如通過(guò)本
技術(shù)領(lǐng)域
中通常了解的噬菌體展示表達(dá)分析方法。例如,可以測(cè)試含有0、1、2、3或更多二硫鍵的支架多肽序列折疊成穩(wěn)定的蛋白的能力。因?yàn)檎郫B不合適的蛋白將不會(huì)摻入到噬菌體的外殼中,它們將不會(huì)被展示。因此,無(wú)需過(guò)度的努力,就可以快速篩選許多候選支架多肽序列的一旦表達(dá)后就折疊成穩(wěn)定的蛋白的能力。植物支架多肽序列可以基于紫色酸性磷酸酶(PAP)的副結(jié)構(gòu)域。四季豆Phaseolusvulgaris的PAP副結(jié)構(gòu)域的晶體結(jié)構(gòu)已經(jīng)被確定(Strater等(1995),Science268(5216):1489-1492)。蛋白內(nèi)三個(gè)暴露的環(huán)使人聯(lián)想起在免疫球蛋白中發(fā)現(xiàn)的超變結(jié)構(gòu)域。該環(huán)由蛋白的剛性的反向平行/3-片層框架帶到一起。形成每個(gè)環(huán)的子序列形成了從PAP衍生的嵌合結(jié)合蛋白的推定結(jié)合結(jié)構(gòu)域。這些子序列通過(guò)取代、缺失、插入或添加最多10個(gè)(例如最多3、4、6、8個(gè))氨基酸而多樣化。形成推定結(jié)合結(jié)構(gòu)域的環(huán)特別適合于結(jié)合含有袋或裂縫(cleft)的耙分子。基于PAP的支架多肽序列具有下列的通用形式<formula>formulaseeoriginaldocumentpage34</formula>其中d、C2、Q和Q對(duì)應(yīng)于"骨架"子序列,其可以包括一些導(dǎo)入的變異,但是不是高度多樣化的。另一方面,Xp乂2和&對(duì)應(yīng)于高度可變子序列,該子序列形成每個(gè)基于PAP的嵌合結(jié)合蛋白的推定結(jié)合結(jié)構(gòu)域。表1顯示了從30個(gè)PAP的氨基酸序列衍生的適合的d-Q骨架子序列的列表。Cj、C2、<:3和C4分別對(duì)應(yīng)于表1中的SEQIDNO:1-30、31-60、61-90和91-120。Xj、乂2和X3可以基于相應(yīng)PAP序列的天然存在的變異體,例如在表2中顯示為SEQIDNO:121-123的那些。表2顯示了30種天然存在的PAP序列內(nèi),在分別對(duì)應(yīng)于X,、X2和X3的子序列中,每個(gè)氨基酸位置處的變異范圍?;蛘?,親本可變子序列XrX3可以是任意的長(zhǎng)度為2-20個(gè)氨基酸的序列。在某些實(shí)施中,支架多肽序列的Q、C2、Q和C4可以從表1列出的多種基于PAP的支架多肽序列的任何組合中選擇,例如Q(SEQIDNO:5)、C2(SEQIDNO:12)、C3(SEQIDNO:7)和C4(SEQIDNO:19);(SEQIDNO:5)、C2(SEQIDNO:12)、C3(SEQIDNO:5)和C4(SEQIDNO:12);C4(SEQIDNO:22);Q(SEQIDNO:17)、C2(SEQIDNO:17)、C3(SEQIDNO:19)禾卩C4(SEQIDNO:l)表l:基于PAP副結(jié)構(gòu)域的SPS<table>tableseeoriginaldocumentpage35</column></row><table><table>tableseeoriginaldocumentpage36</column></row><table>表2:在PAP子序列中對(duì)應(yīng)于X、乂2和乂3(SEQIDNO:121-123)的天然存在的殘基變異(SEQIDNO:121>x2(SEQIDNO:122)x3(SEQIDNO:123)位置位置位置abcdefgabcdefghiabcdefjMDEPGSS1VEAKPNJENKLKKPVDTQSHT1TAAYKVyNYTSGRFFTSPTHKNFDKEEVGLRNT1E1GHLVEDMEDQTKSsEE在對(duì)上面列出的支架多肽序列的子序列進(jìn)行多樣化后,多樣化的X2'和X3'子序列在編碼的植物嵌合結(jié)合多肽文庫(kù)中是高度異質(zhì)性的,并且分別相對(duì)于表1中列出的SEQIDNO:121-123每個(gè)可以含有最多10個(gè)(例如8、6、4、3個(gè))單氨基酸取代、缺失、插入或添加(參見(jiàn)例如圖1)。例如,對(duì)應(yīng)于X,、X2和X3區(qū)域的氨基酸序列的長(zhǎng)度相對(duì)于SEQIDNO:121-123可以不變、縮短或加長(zhǎng)。在推定的結(jié)合結(jié)構(gòu)域之外的區(qū)域被稱為"骨架"區(qū)域(即Q、C2、Q和C4)。與XhX2和X3的氨基酸序列不同,骨架區(qū)域的氨基酸序列在編碼的嵌合結(jié)合蛋白文庫(kù)中一般基本上不多樣化,盡管在文庫(kù)內(nèi)的這些區(qū)域中某些序列變異是允許的。植物支架多肽序列的骨架區(qū)域可以與SEQIDNO:1-120中的任何一個(gè)具有至少70%(即80、85、90、95、98或100%)的同一性?;蛘?,骨架區(qū)域可以含有最多30個(gè)(即28、26、24、22、20、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個(gè))單氨基酸取代、缺失、插入或添加。例如,d、C2、C3和C4每個(gè)可以含有0、1、2、3、4或5個(gè)或更多的單氨基酸變化。如果要在骨架區(qū)域中引入氨基酸取代,優(yōu)選進(jìn)行保守取代。保守取代是保持用具有同樣的化學(xué)性質(zhì)的氨基酸進(jìn)行氨基酸取代(例如用極性氨基酸例如蘇氨酸取代另一個(gè)極性氨基酸例如絲氨酸的取代)。在一個(gè)實(shí)施方案中,植物支架多肽序列是下面顯示的SEQIDNO:124-126中的一種。對(duì)應(yīng)于X^X2和X3的序列用粗體和下劃線表示。SE<2IDNO:124NYTSGYIHHCYIKGLEYDTKYYYWGIGNTSREFWFRSE<3H>NO:125PQQVHITQGDLVGKAVIVSWVTYMEQ^EVHYWSENSDKKKIAEGKLVTXEEFNYSSGFIHHTnRNLEYKTKYYYEVGLGNTTROFWFVSEQIDNO:126pqfWHTTrjnnr,vgramtiswvtmdepgssavrywsekngrkriakgkmstxeFFNYSSGFIHHTTIRKLKYNTKYYYEVGLRNTTRRFSFI在另一個(gè)實(shí)施方案中,植物支架多肽序列是基于具有類(lèi)似錨蛋白的重復(fù)序列的植物蛋白氨基酸序列。類(lèi)似錨蛋白的重復(fù)序列是由大約33個(gè)氨基酸組成的小的轉(zhuǎn)角-螺旋-螺旋(THH)重復(fù)序列。在支架多肽序列中THH重復(fù)序列的數(shù)量可以在2到20之間變化。THH重復(fù)序列中推定的結(jié)合位點(diǎn)一般是不連續(xù)的,但是在它們作為一部分的蛋白的同一側(cè)成簇。植物的含有THH重復(fù)序列的支架多肽序列可以具有基于下面列出的SEQIDNO:127-129中任何一個(gè)的氨基酸序列。在粗體/下劃線殘基處導(dǎo)入了高度的氨基酸序列變異。植物的含有THH重復(fù)序列的支架多肽序列在對(duì)應(yīng)于SEQIDNO:127-129的殘基12-13、33、35-36、38、46-47、66、68-69、71、79-80、99、101-102、104和112-113(用粗體和下劃線表示的殘基)的氨基酸位置處,可以含有最多3個(gè)氨基酸的取代,或者缺失。nr>r>T.fiKKT.WT.AAg^GHLEIVRVLVEAGADVNALDKFGRTALHIAASRGHLEVvkxlleagadvnXEdkfgrtalhlaasrghlewkllleagadvnaldkfgDTALHVSIDNGNEDlXJJlo—se(jh>no:128GDDLGKKLHLAA巡GHLEIVRVLVEAGADVNAiiDKEGSTPLHIAA巡GNEQVVKLLLEAGADPNALDKFGRTPLHIAASKGNEOWKLLLEAGADPNAQDKEGQtalhvsidngnediaeilose(jIDno:129GSDLGKKLLEAARAGODDEVRILMANGADVNALDKFGRTPLHIAAgKGNEQWKLLLEAGADPNALD迎GJB:TPLHIAASKGNEQ"WKLLLEAGADPNAQDig:GktafdisidngnedlXeilo支架多肽序列的序列可以與SEQIDNO:127-129的上述氨基酸位置(粗體)之外的序列具有至少70%(即80、85、90、95、98或100%)的同一性。或者,在SEQIDNO:127-129的上述氨基酸位置(粗體)之外,支架多肽序列的序列可以含有最多30個(gè)(即28、26、24、22、20、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個(gè))單氨基酸取代、缺失、插入或添加。在某些情況下可適宜包含附加的重復(fù)單位。SEQIDNO:127-129具有氨基末端帽、兩個(gè)內(nèi)部重復(fù)序列和羧基末端帽??赡苓m宜具有l(wèi)-6個(gè)內(nèi)部重復(fù)序列。氨基末端帽序列是氨基酸1-33。第一個(gè)內(nèi)部重復(fù)序列是34-66,第二個(gè)內(nèi)部重復(fù)序列是67-99。羧基末端帽序列是氨基酸100-123。第一或第二個(gè)內(nèi)部重復(fù)序列或兩者可以獨(dú)立地重復(fù)1、2、3、4、5或6次。推定的結(jié)合位點(diǎn)是由從支架多肽序列形成的剛性二級(jí)結(jié)構(gòu)突出的氨基酸側(cè)鏈所形成。這些蛋白一般可以形成較大較平坦的結(jié)合表面,特別適用于結(jié)合不具有深裂縫或袋的靶。另一種適合的支架可以基于水稻半胱氨酸蛋白酶抑制劑(JBiolChem262:16793(1987);Biochemistry39:14753(2000)),它是半胱氨酸蛋白酶抑制劑/木瓜蛋白酶家族(PfamIdentifierPF00031)的成員,被鑒定為水稻的半胱氨酸蛋白酶抑制劑。水稻半胱氨酸蛋白酶抑制劑的序列被描述在下面?;谒景腚装彼岬鞍酌敢种苿?,可以產(chǎn)生具有氨基酸序列C1-X1-C2-X2-C3-X3-C4的支架,其中XI、X2、X3和X4每個(gè)都是可變區(qū),而C1、C2、C3和C4是骨架區(qū)。MSSVGGPVLGGVEPVGNENDLHLVDLARFAVTEHNKKANSLLEFEKLVSVKqr)WAGTLYYFTLEVKEGDAKKLYEAKVWEKPWMDFKELOEFKPVDASANAC1-MSS(aa1-3)Xl-VGGP(aa4-7)C2-VLGGVEPVGNENDLHLVDLARFAVTEHNKKANSLLEFEKLVSV(幼-8-50)X2-KQQVVAGT(aa51-58)C3-LYYFTLEVKEGDAKKLYEAKVWE(aa59-81)X3-KPWM(aa82-85)C4-DFKELQEFKPVDASANA(aa86-102)圖2描繪了眾多植物蛋白的序列與水稻半胱氨酸蛋白酶抑制劑的比對(duì)。適合的Cl-C4區(qū)的例子被指出。圖4描繪了少數(shù)植物蛋白的序列與水稻半胱氨酸蛋白酶抑制劑的比對(duì)。適合的Cl-C4區(qū)的例子被指出??偟膩?lái)說(shuō),Xl可以是2-20個(gè)隨機(jī)氨基酸(例如3個(gè)氨基酸)的序列。X2可以是2-20個(gè)隨機(jī)氨基酸(例如4個(gè)氨基酸)的序列。X3可以是2-20個(gè)隨機(jī)氨基酸(例如4個(gè)氨基酸)的序列。另一種適合的可以基于水稻的C2蛋白(Biochemistry42:11625(2003)),這是C2結(jié)構(gòu)域家族(PfamIdentifierPFOO168)的成員,被認(rèn)為參與了植物的防御信號(hào)系統(tǒng)。水稻的C2序列被描述在下面?;谒镜腃2可以產(chǎn)生具有氨基酸序列C1-X1-C2-X2-C3-X3-C4的支架,其中XI、X2、X3和X4每個(gè)都是可變區(qū),Cl、C2、C3和C4是骨架區(qū)。MAGSGVLEVHLVDAKGLTGNDFLGKIDPYVWOYRSOERKSSVARDOnKNPSWNEVFKFOINSTAATGOHKXFLRLMDHDTFSRDDFLnRATTNVTDLISLSFROC1-MAGSGVLEVHLVDAKG(aa1-16)X1-LTGNDFLGKID(aa17-27)C2-PYWVQYRSQERK(aa28-40)X2-SSVARDQGKNP(aa41-51)C3-SWNEVFKFQINSTAATGQHKLFLRL(aa52-76)X3-MDHDTFSRDDFL(aa77-88)C4-GEATINVTDLISLGMEHGTWEMSESKHRWLADKTYHGEIRVSLTFTASAKAQDHAEQVGGWAHSFRQ(aa89-156)圖3描繪了眾多植物蛋白的序列與水稻C2的比對(duì)。適合的Cl-C4區(qū)的例子被指出。圖5描繪了少數(shù)植物蛋白的序列與水稻水稻半胱氨酸蛋白酶抑制劑的比對(duì)。適合的Cl-C4區(qū)的例子被指出??偟膩?lái)說(shuō),Xl可以是2-20個(gè)隨機(jī)氨基酸(例如ll個(gè)氨基酸)的序列。X2可以是2-20個(gè)隨機(jī)氨基酸(例如ll個(gè)氨基酸)的序列。X3可以是2-20個(gè)隨機(jī)氨基酸(例如12個(gè)氨基酸)的序列。下一節(jié)將公開(kāi)產(chǎn)生核酸文庫(kù)的方法,該核酸文庫(kù)編碼基于植物支架多肽序列的嵌合結(jié)合蛋白。II.產(chǎn)生基于植物支架多肽序列的核酸文庫(kù)基于一個(gè)或多個(gè)植物支架多肽序列產(chǎn)生了編碼植物支架多肽序列的核酸序列變異體的大文庫(kù)。核酸文庫(kù)編碼了至少5種(例如1,000、105、106、107、109、1012、1015或更多種)不同的嵌合結(jié)合蛋白序列。應(yīng)該認(rèn)識(shí)到不是每個(gè)通過(guò)本文描述的方法產(chǎn)生的文庫(kù)的成員都將編碼獨(dú)特的氨基酸序列。然而,理想的是文庫(kù)中出現(xiàn)的編碼的嵌合結(jié)合蛋白的至少10%(例如25%、30%、40%、50%、60%、70%、75%或90%)是獨(dú)特的。在對(duì)植物支架多肽序列進(jìn)行多樣化之前,通過(guò)計(jì)算機(jī)估算使用給41定的序列變異參數(shù)組將產(chǎn)生的預(yù)期序列多樣性可能是有用的。估算序列多樣性的方法被描述在例如Voiles等(2005),33(11):3667-3677中。例如,在通過(guò)PCR產(chǎn)生的核酸文庫(kù)中預(yù)計(jì)的不同序列的數(shù)量可以根據(jù)用于擴(kuò)增的誘變聚合酶的突變頻率來(lái)估算。可用于估算隨機(jī)的編碼蛋白的文庫(kù)中序列多樣性的算法也可以在萬(wàn)維網(wǎng)上找到,例如在guinevere.otago.ac.nz/mlrgd/STATS/index。編碼植物嵌合結(jié)合蛋白的核酸文庫(kù)可以通過(guò)多種已知的方法來(lái)產(chǎn)生。通過(guò)在上述支架多肽序列的高度可變位置上取代、缺失、插入或添加氨基酸,在植物支架多肽序列中導(dǎo)入序列多樣性。因?yàn)樵谥参镏羞z傳編碼的20種氨基酸的組具有略微冗余的化學(xué)和結(jié)構(gòu)性質(zhì),包涵這種結(jié)構(gòu)多樣性的氨基酸的亞組(例如4種類(lèi)型氨基酸的亞組)可以被采納用于取代。例如,可以選擇用于取代或插入的氨基酸,以包含酸性氨基酸、中性氨基酸、脂肪族氨基酸和芳香族氨基酸(參見(jiàn)表3)。例如,用于取代的氨基酸可以限制于天冬氨酸、絲氨酸、丙氨酸和酪氨酸。限制氨基酸取代的冗余性將增加嵌合結(jié)合蛋白的總體結(jié)構(gòu)和結(jié)合多樣性。表3:在植物中遺傳編碼的氨基酸的化學(xué)性質(zhì)酸性中性脂肪族芳香族堿性天冬氨酸,谷氨酸天冬酰胺,半胱氨酸,谷氨酰胺,甲硫氨酸,脯氨酸,絲氨酸,蘇氨酸丙氨酸,甘氨酸,異亮氨酸,亮氨酸,纈氨酸組氨酸,苯丙氨酸,色氨酸,酪氨酸精氨酸,賴氨酸核酸的文庫(kù)可以通過(guò)裝配具有交疊互補(bǔ)序列的寡核苷酸組來(lái)體外產(chǎn)生。首先,選擇將被裝配的寡核苷酸組編碼的支架多肽序列。按照上面的描述要產(chǎn)生的嵌合結(jié)合多肽的文庫(kù),在給定的支架多肽序列的可變區(qū)中待編碼的序列將包含許多含有取代、插入、缺失或添加的異質(zhì)序列。待編碼的支架多肽序列可以含有分別對(duì)應(yīng)于SEQIDNO:l-30、4231-60、61-90和91-120任何一個(gè)中的Cl-C4子序列。一組寡核苷酸編碼要導(dǎo)入多樣性的植物支架多肽序列的區(qū)域(例如在X1、X2禾卩X3處)。相反,要導(dǎo)入的變異很少或沒(méi)有的支架多肽序列的區(qū)域(例如在PAP支架多肽序列的骨架結(jié)構(gòu)域中),由與上面提到的支架多肽序列的任何一個(gè)具有不少于70%(即75%、80%、85%、90%、95%或100%)同一性的氨基酸序列的編碼寡核苷酸組所編碼。這種方法的詳細(xì)情況被描述在例如美國(guó)專利No.6,521,453中,在此引為參考。用于產(chǎn)生核酸文庫(kù)的序列變異的寡核苷酸一般來(lái)說(shuō)按照Beaucage和Caruthers(1981),TetrahedronLetts.,22(20):1859-1862中描述的固相亞磷酰胺三酯方法,使用自動(dòng)化合成儀,按照Needham-VanDevanter等(1984)NucleicAcidsRes.,12:6159-6168中的描述進(jìn)行化學(xué)合成。有多種多樣的用于自動(dòng)化寡核苷酸合成的設(shè)備可以商購(gòu)。在同上的討論的多核苷酸合成方法(例如三核苷酸合成)也可以使用。核酸可以從不同的商業(yè)化來(lái)源按照要求定制,例如Sigma-Genosys(sigma-genosys.com/oligo.asp)、MidlandCertifiedReagentCompany(mcrc@oligos.com)、TheGreatAmericanGeneCompany(genco.com)、ExpressGenInc.(expressgen.com)、OperonTechnologiesInc.(Alameda,Calif.)以及許多其它公司。寡核苷酸可以具有為在特定的細(xì)胞類(lèi)型中(例如在植物細(xì)胞、哺乳動(dòng)物細(xì)胞、酵母細(xì)胞或細(xì)菌細(xì)胞中)表達(dá)而優(yōu)化的密碼子用途。密碼子使用頻率表可以公開(kāi)獲得,例如在萬(wàn)維網(wǎng)的kazusa.or.jp/codon。密碼子偏倚可以用于優(yōu)化在要評(píng)估植物嵌合結(jié)合蛋白的結(jié)合的細(xì)胞中或細(xì)胞表面上的表達(dá),也可用于優(yōu)化嵌合結(jié)合蛋白在具有商業(yè)目的的轉(zhuǎn)基因生物體(例如轉(zhuǎn)基因植物)中的表達(dá)。一般來(lái)說(shuō),使用頻率低于10%的密碼子將不被使用。在合成之前,檢査寡核苷酸序列中可能有問(wèn)題的序列,例如用于亞克隆的限制性酶位點(diǎn)、可能的植物剪接受體或供體位點(diǎn)(參見(jiàn)例如cbs.dtu.dk/services/FeatureExtract/)、可能的mRNA去穩(wěn)定化序列(例如"ATTTA"),以及同樣的核苷酸出現(xiàn)超過(guò)4次的區(qū)段。因此,可能的有問(wèn)題的序列被改換。合成的寡核苷酸群體編碼選定的支架多肽序列的推定結(jié)合區(qū)域中(例如PAP支架多肽序列的區(qū)域X,、X2和X3中)的氨基酸變異。優(yōu)選所有具有選定長(zhǎng)度(例如大約10、12、15、20、30、40、50、60、70、80、90或100或更多的核苷酸)的、對(duì)應(yīng)于將在支架多肽序列中導(dǎo)入多樣性的區(qū)域的寡核苷酸,編碼了來(lái)自上面描述的氨基酸多樣組的所有可能的氨基酸變異。這包括了每N個(gè)序列變異N個(gè)寡核苷酸,其中N是基因座上不同序列的數(shù)量。N個(gè)寡核苷酸除了編碼變異的氨基酸的核苷酸之外,在序列中是相同的。在產(chǎn)生序列變異的寡核苷酸中,使用平行或合并的合成策略是有利的,所述策略中單個(gè)合成反應(yīng)或試劑組被用于制造每種寡核苷酸的共同的部分。這可以通過(guò)例如眾所周知的固相核酸合成技術(shù)或例如使用基于陣列的寡核苷酸合成方法來(lái)進(jìn)行(參見(jiàn),例如,F(xiàn)odor等(1991)Science,251:767-777;Fodor(1997)"基因、芯片和人類(lèi)基因組"(Gene,ChipsandtheHumanGenome)FASEBJournal.11:121-121;Fodor(1997)"大規(guī)模平行基因組學(xué)"CMassivelyParallelGenomics)Science.277:393-395;以及Cheeetal.(1996)"使用高密度DNA陣列評(píng)估遺傳信息"(AccessingGeneticInformationwithHigh-DensityDNAArray)Science274:610-614)。在典型的合成策略中,寡核苷酸與變異區(qū)域的任何一側(cè)具有至少大約IO個(gè)堿基的序列同一性以確保適度有效的重組。但是,帶有相同堿基的側(cè)翼區(qū)域可以具有較少的相同堿基(例如4、5、6、7、8或9個(gè)),并且當(dāng)然可以具有較大的相同區(qū)域(例如ll、12、13、14、15、16、17、18、19、20、25、30、50或更多個(gè))。孵育待裝配到一起的寡核苷酸,以允許含有交疊的互補(bǔ)序列的寡核苷酸之間進(jìn)行雜交。因而每組雜交的交疊寡核苷酸形成間有小間隙的連續(xù)核酸。這些小的間隙可以使用各種不同的聚合酶介導(dǎo)的裝配方法、例如本文描述的或?qū)I(yè)技術(shù)人員熟知的方法來(lái)填滿,以形成全長(zhǎng)的序列。最大的序列多樣性被導(dǎo)入到植物支架多肽序列的推定結(jié)合區(qū)域和殘基的編碼寡核苷酸中。但是,編碼特定序列變異的寡核苷酸可以以任何選擇的濃度被"摻"入重組混合物中,從而導(dǎo)致所需的修飾優(yōu)先摻入推定結(jié)合結(jié)構(gòu)域之外的區(qū)域中編碼的植物嵌合結(jié)合蛋白內(nèi)。例如,在寡核苷酸延伸過(guò)程中,雜交的寡核苷酸在核酸聚合酶例如Taq、Klenow等以及dNTP(即dATP、dCTP、dGTP和dTTP)存在下孵育。如果序列一致的區(qū)域較大,可以在大約室溫(即大約25°C)和例如大約65。C之間的雜交溫度下使用Taq或其它高溫聚合酶。如果一致的區(qū)域較小,可以在低于室溫的雜交溫度下使用Klenow、Taq或聚合酶。聚合酶可以在寡核苷酸雜交之前、同時(shí)或之后加入到裝配反應(yīng)中。然后,將獲得的延伸的雙鏈核酸序列變性、雜交并再次延伸。這個(gè)循環(huán)可以重復(fù)任何所需數(shù)量的次數(shù)。循環(huán)被重復(fù)例如從大約2次到大約100次。任選在組合式核酸裝配的多個(gè)循環(huán)之后,可以通過(guò)例如標(biāo)準(zhǔn)聚合酶鏈反應(yīng)(PCR)來(lái)擴(kuò)增獲得的產(chǎn)物。將一部分體積的上述的裝配反應(yīng)物與獨(dú)特的與核酸末端普遍雜交的正向和反向引物、以及dNTPs和適合的聚合酶(例如pfu聚合酶)一起孵育。然后進(jìn)行大約10到40個(gè)循環(huán)的PCR反應(yīng)。為了確定寡核苷酸摻入的程度,可以使用任何能夠鑒別類(lèi)似的核酸的方法。例如,核酸可以被克隆和測(cè)序,或者擴(kuò)增(體外或克隆到例如標(biāo)準(zhǔn)的克隆或表達(dá)載體中)并用特異識(shí)別特定的寡核苷酸序列變異體的限制性酶進(jìn)行剪切。在用于裝配或PCR反應(yīng)的大部分5'和3'引物的5'末端中包含稀有的限制性位點(diǎn)(例如NotI)是有用的。在這些引物中包含限制性位點(diǎn)有利于通過(guò)限制性消化和隨后的連接將核酸亞克隆到載體中?;蛘撸b配反應(yīng)或PCR產(chǎn)物也可以不用限制性消化而使用標(biāo)準(zhǔn)的方法例如"TA"克隆進(jìn)行亞克隆。用于在植物支架多肽序列中導(dǎo)入多樣性的其它方法也可以使用。例如,支架多肽序列可以被編碼在核酸模板例如質(zhì)粒構(gòu)建物中?;蛘撸瑏?lái)自適當(dāng)?shù)闹参锓N類(lèi)例如大豆的PCR產(chǎn)物、mRNA或基因組DNA也可以用作編碼植物支架多肽序列的模板。一個(gè)或多個(gè)將被多樣化的支架多肽序列子序列(例如PAP支架多肽序列的X2區(qū)域),可以通過(guò)多種易錯(cuò)PCR方法中的任何一種從支架多肽序列的核酸模板擴(kuò)增期間或之后被多樣化。易錯(cuò)PCR方法可以分為(a)通過(guò)不平衡的核苷酸濃度和/或加入化學(xué)化合物例如氯化鎂而降低聚合酶的保真度的方法(參見(jiàn)例如Lin-Goerke等(1997)Biotechniques,23,409-412),(b)使用核苷酸類(lèi)似物的方法(參見(jiàn)例如美國(guó)專利No.6,153,745),(c)使用"誘變"聚合酶的方法(參見(jiàn)例如Cline,J.和Hogrefe,H.H.(2000)Strategies(StratageneNewsletter),13,157-161),以及(d)組合的方法(參見(jiàn)例如Xu,H.,Petersen,E丄,Petersen,S.B.禾Bel-Gewely,M.R.(1999)Biotechniques,27,1102-1108)。其它的基于PCR的誘變方法包括例如OsunaJ,YanezJ,SoberonX,禾卩GaytanP.(2004),NucleicAcidsRes.2004,32(17):el36和WongTS,TeeKL,HauerB,禾BSchwaneberg,NucleicAcidsRes.2004Feb10;32(3):e26描述的方法,以及其它在本
技術(shù)領(lǐng)域
中熟知的方法。在產(chǎn)生了序列變異體的群體后,它們可以通過(guò)亞克隆取代到選擇的植物支架多肽序列核酸(例如含有支架多肽序列的質(zhì)粒)的適當(dāng)區(qū)域中,從而有效地作為載體用于多樣化序列的文庫(kù)。對(duì)特定的植物支架多肽序列區(qū)域進(jìn)行誘變的另一種方法是使用誘變的大腸桿菌(E.coli)菌株(參見(jiàn)例如Wu等(1999),PlantMol.Biol,39(2):381-386)。將含有待突變的靶序列的核酸載體導(dǎo)入到增變菌株中,然后進(jìn)行繁殖。在增變大腸桿菌菌株中易錯(cuò)DNA復(fù)制在導(dǎo)入耙序列中導(dǎo)入了突變。然后回收改變的靶序列群體,并亞克隆到編碼選定的植物支架多肽序列的核酸的適當(dāng)位置中,以產(chǎn)生編碼植物嵌合結(jié)合蛋白的核酸的多樣文庫(kù)。III.植物嵌合結(jié)合蛋白的表達(dá)和篩選基于植物支架多肽序列并編碼植物嵌合結(jié)合多肽的核酸文庫(kù)被亞克隆到表達(dá)載體中,并導(dǎo)入生物復(fù)制系統(tǒng)中以產(chǎn)生表達(dá)文庫(kù)。表達(dá)文庫(kù)可以被增殖和篩選,以鑒定與目的靶分子(TM)(例如線蟲(chóng)、昆蟲(chóng)、真菌、病毒或植物蛋白)結(jié)合的植物嵌合結(jié)合蛋白。要實(shí)行植物嵌合結(jié)合蛋白的篩選的生物復(fù)制系統(tǒng),在篩選了與耙的結(jié)合后,應(yīng)該能夠在適當(dāng)?shù)沫h(huán)境下生長(zhǎng)?;蛘?,編碼選定的植物嵌合結(jié)合蛋白的核酸可以通過(guò)體外擴(kuò)增來(lái)分離。在生物復(fù)制系統(tǒng)的至少一部分生長(zhǎng)過(guò)程中,數(shù)量的增加相對(duì)于時(shí)間來(lái)說(shuō)優(yōu)選為大約指數(shù)級(jí)的。表現(xiàn)出所需結(jié)合性質(zhì)的文庫(kù)成員的頻率可能相當(dāng)?shù)停?06中的l個(gè)或更低。生物復(fù)制系統(tǒng)可以是細(xì)菌DNA的病毒、植物性細(xì)菌細(xì)胞、細(xì)菌孢子。真核細(xì)胞(例如酵母細(xì)胞)也可以用作生物復(fù)制系統(tǒng)。在特別有用的實(shí)施方案中,在噬粒構(gòu)建體中編碼了嵌合的結(jié)合蛋白-噬菌體外殼蛋白融合。噬粒構(gòu)建體被轉(zhuǎn)化到宿主細(xì)菌中,然后用表達(dá)野生型外殼蛋白的輔助噬菌體感染。獲得的噬菌體后裔具有兼有融合蛋白和野生型外殼蛋白的蛋白外殼。這種方法的優(yōu)點(diǎn)是噬菌體的存活力與僅具有嵌合結(jié)合蛋白-外殼融合蛋白的噬菌體的存活力相比更高?;谑闪5恼故疚膸?kù)構(gòu)建和篩選試劑盒是可商購(gòu)的,例如EZnetTM47噬菌體展示cDNA文庫(kù)構(gòu)建試劑盒和篩選試劑盒(MaximBiotech,Inc.,SanFrancisco,CA)。但是,任何活細(xì)胞或病毒菌株都可能是有用的,如果菌株能夠1)用合適的設(shè)備進(jìn)行遺傳改變以編碼植物嵌合結(jié)合蛋白,2)在培養(yǎng)中維持和擴(kuò)增,3)操控以展示通過(guò)其可以與靶材料發(fā)生相互作用的可能的結(jié)合蛋白結(jié)構(gòu)域,以及4)篩選同時(shí)以可回收的形式保留編碼所表達(dá)的植物嵌合結(jié)合蛋白的遺傳信息。優(yōu)選,生物復(fù)制系統(tǒng)在基于親和性的篩選后仍保持存活。當(dāng)生物復(fù)制系統(tǒng)是細(xì)菌細(xì)胞或在細(xì)胞周質(zhì)中裝配的噬菌體時(shí),用于展示植物嵌合結(jié)合蛋白的表達(dá)載體編碼了本身與兩個(gè)其它成分融合的嵌合結(jié)合蛋白。第一個(gè)成分是分泌信號(hào),它指導(dǎo)最初的表達(dá)產(chǎn)物到達(dá)細(xì)胞的內(nèi)膜(在包裝噬菌體時(shí)是宿主細(xì)胞)。該分泌信號(hào)被信號(hào)肽酶切下,產(chǎn)生加工過(guò)的成熟的植物嵌合結(jié)合蛋白。第二個(gè)成分是外表面運(yùn)輸信號(hào),它指導(dǎo)生物復(fù)制系統(tǒng)將加工過(guò)的蛋白裝配到它的外表面中。該外表面運(yùn)輸信號(hào)可以源自生物復(fù)制系統(tǒng)天生的表面蛋白(例如M13噬菌體外殼蛋白gill)。例如,表達(dá)載體含有編碼植物嵌合結(jié)合蛋白的DNA,該DNA與信號(hào)序列(例如細(xì)菌phoA或bla基因的信號(hào)序列或M13噬菌體基因III的信號(hào)序列)和編碼絲狀噬菌體(例如M13)的外殼蛋白(例如M13基因III或基因VIII蛋白)的DNA可操作地連接。表達(dá)產(chǎn)物被運(yùn)輸?shù)剿拗骷?xì)胞的內(nèi)膜(脂質(zhì)雙層),在那里信號(hào)肽被切掉,留下加工過(guò)的雜交體蛋白。該雜交體蛋白的類(lèi)似外殼蛋白的成分的C末端被捕獲在脂質(zhì)雙層中,使得雜交體蛋白不能逸入到周質(zhì)空間中。由于初生的噬菌體顆粒的單鏈DNA進(jìn)入周質(zhì)空間,它收集野生型外殼蛋白和來(lái)自脂質(zhì)雙層的雜交體蛋白。因此雜交體蛋白被包裝到絲狀噬菌體的表面鞘中,留下植物嵌合結(jié)合蛋白暴露在它的外表面上。因此,在這個(gè)實(shí)施方案中,是絲狀噬菌體而不是宿主細(xì)菌細(xì)胞是生物復(fù)制系統(tǒng)。如果分48泌信號(hào)為展示植物嵌合結(jié)合蛋白所必需,可以使用"允許分泌的"細(xì)菌菌株用于絲狀噬菌體生物復(fù)制系統(tǒng)的生長(zhǎng)。當(dāng)生物復(fù)制系統(tǒng)是細(xì)菌孢子或外殼在細(xì)胞內(nèi)包裝的噬菌體時(shí),不是必需使用內(nèi)膜分泌信號(hào)。在這些情況下,展示工具僅僅是外表面運(yùn)輸信號(hào),一般為孢子或噬菌體外殼蛋白的衍生物。絲狀噬菌體總的來(lái)說(shuō)作為展示植物嵌合結(jié)合蛋白的生物復(fù)制系統(tǒng)是有吸引力的,特別是M13是特別有吸引力的,因?yàn)?)病毒粒子的三維結(jié)構(gòu)是已知的;2)對(duì)外殼蛋白的加工有明確的了解;3)基因組是可擴(kuò)展的;4)基因組??;5)基因組的序列已知;6)病毒粒子對(duì)剪切、熱、冷、尿素、鹽酸胍、低pH和高鹽具有物理抗性;7)噬菌體是測(cè)序載體,因此測(cè)序尤為容易;8)抗生素抗性基因已經(jīng)被克隆到基因組中;9)它易于培養(yǎng)和儲(chǔ)存,對(duì)于感染的細(xì)胞來(lái)說(shuō)不需要不常見(jiàn)的或昂貴的培養(yǎng)基;10)它具有高的噬菌體裂解量,每個(gè)感染細(xì)胞在感染后產(chǎn)生100到1000個(gè)M13子代;以及11)它易于通過(guò)標(biāo)準(zhǔn)方法收獲和濃縮。例如,當(dāng)生物復(fù)制系統(tǒng)是M13時(shí),基因III或基因VIII蛋白可以用作外表面尋靶信號(hào)。或者,來(lái)自基因VI、VII和IX的蛋白也可以使用。編碼的植物嵌合結(jié)合蛋白可以與表面尋靶信號(hào)(例如M13的基因III外殼蛋白)在其羧基或氨基末端融合。植物嵌合結(jié)合蛋白和尋靶信號(hào)之間的融合邊界也可以包括短的接頭序列(例如最多20個(gè)氨基酸長(zhǎng)),以避免嵌合結(jié)合蛋白和融合的尋靶信號(hào)之間的不利的相互作用。在某些實(shí)施方案中,在接頭序列中包含特定的蛋白酶水解剪切位點(diǎn)是有利的。此外,融合蛋白的氨基末端或羧基末端可以含有短的表位標(biāo)簽(例如紅細(xì)胞凝集素標(biāo)簽)。包含蛋白酶水解剪切位點(diǎn)或短的表位標(biāo)簽對(duì)于從進(jìn)行文庫(kù)表達(dá)的細(xì)胞群體中純化嵌合結(jié)合蛋白的文庫(kù)是特別有用的。帶有表位標(biāo)簽的嵌合結(jié)合蛋白可以通過(guò)對(duì)接頭序列進(jìn)行蛋白酶水解剪切、然后利用識(shí)別表位標(biāo)簽的抗體或其它結(jié)合劑進(jìn)行親和層析來(lái)方便地純化?,F(xiàn)有許多篩選噬菌體展示文庫(kù)的方法(參見(jiàn)例如Willats(2002),PlantMol.Biol,50:837-854)。正如通常實(shí)施的那樣,目的靶分子被吸附到支持物上,然后暴露于展示噬菌體的植物嵌合結(jié)合蛋白的溶液中。靶分子可以通過(guò)被動(dòng)吸附固定在支持介質(zhì)上,例如試管、板、柱子或磁珠。一般來(lái)說(shuō),吸附性支持介質(zhì)用例如牛血清白蛋白、牛奶或明膠預(yù)先阻斷,以減少在篩選過(guò)程中噬菌體的非特異性結(jié)合。或者,靶分子可以被生物素化,從而帶有嵌合結(jié)合蛋白的噬菌體和耙分子之間的相互作用可以在溶液中進(jìn)行。然后與靶結(jié)合的噬菌體可以使用結(jié)合在固相基體(例如珠子或柱子)上的親和素或鏈霉親和素來(lái)篩選。在使噬菌體與靶分子發(fā)生相互作用后,通過(guò)清洗除去未相互作用的噬菌體。然后用眾多處理方法之一將剩余的特異性結(jié)合的噬菌體洗脫,所述處理包括例如降低或提高pH、使用還原劑或使用去污劑。在一個(gè)實(shí)施方案中,特定的蛋白酶水解剪切位點(diǎn)被引入到植物結(jié)合蛋白序列和噬菌體外殼蛋白序列之間。因此,噬菌體洗脫可以簡(jiǎn)單地通過(guò)加入適當(dāng)?shù)牡鞍酌竵?lái)完成。然后通過(guò)感染宿主細(xì)胞來(lái)擴(kuò)增洗脫的噬菌體,進(jìn)而可以通過(guò)剛剛描述的方法對(duì)它們進(jìn)行重新篩選,以減少假陽(yáng)性結(jié)合子的數(shù)量。在每一輪噬菌體篩選過(guò)程中,應(yīng)該仔細(xì)地包含噬菌體在固體培養(yǎng)基上的生長(zhǎng),而不是只包含在液體培養(yǎng)基中的生長(zhǎng),因?yàn)檫@使得亞最適生長(zhǎng)的噬菌體克隆的損失最小化。也可以使用核糖體展示,僅僅在體外對(duì)植物嵌合結(jié)合蛋白進(jìn)行表達(dá)和結(jié)合的篩選。專門(mén)在體外進(jìn)行的方法克服了需要將編碼植物嵌合結(jié)合蛋白的核酸文庫(kù)導(dǎo)入到生物復(fù)制系統(tǒng)中。在體外通過(guò)核糖體蛋白展示篩選多肽的方法在例如美國(guó)專利No.6,589,741中有詳細(xì)描述。在上面的部分中描述的核酸可以通過(guò)加入能夠在體外轉(zhuǎn)錄的噬菌體啟動(dòng)子序列(例如T7啟動(dòng)子)、在編碼的植物嵌合結(jié)合蛋白的翻譯起點(diǎn)上游的核糖體結(jié)合序列、以及轉(zhuǎn)錄終止序列(例如來(lái)自噬菌體T3)進(jìn)行修飾。然后將修飾的核酸文庫(kù)在體外轉(zhuǎn)錄,以產(chǎn)生相應(yīng)的編碼植物嵌合結(jié)合蛋白的mRNA群體。然后通過(guò)在體外翻譯系統(tǒng)中、在允許多核糖體形成的條件下、以正確的閱讀框架翻譯不含終止密碼子的mRNA分子的群體,使植物嵌合結(jié)合蛋白在體外表達(dá)。然后將這樣形成的多核糖體在允許植物嵌合結(jié)合蛋白與靶分子發(fā)生相互作用的條件下與耙分子相接觸。然后將展示與靶分子相互作用的嵌合結(jié)合蛋白的多核糖體與不展示這些多肽的沒(méi)有相互作用的多核糖體分離開(kāi)來(lái);然后對(duì)與相互作用的多核糖體締合的mRNA進(jìn)行擴(kuò)增(例如通過(guò)PCR)和測(cè)序。植物嵌合結(jié)合蛋白與靶蛋白的相互作用也可以在遺傳篩選中檢測(cè)。在篩選中,在使用雙雜交分析或三雜交分析的結(jié)合分析中,靶蛋白的功能是作為"誘餌蛋白",而每個(gè)植物嵌合結(jié)合蛋白的功能是作為潛在的"獵食"蛋白(參見(jiàn)例如美國(guó)專利No.5,283,317;Zervos等(1993)Cell72:223-232;Madura等(1993)J.Biol.Chem.268:12046-12054;Bartel等(1993)Biotechniques14:920-924;Iwabuchi等(1993)Oncogene8:1693-1696;Hubsman等(2001)Nuc.AcidsRes.Feb15-,29(4):E18;以及Brent的WO94/10300)。雙雜交分析可以使用靶多肽作為誘餌蛋白來(lái)進(jìn)行。總的來(lái)說(shuō),將耙多肽與LexADNA結(jié)合結(jié)構(gòu)域融合并作為誘餌。獵食蛋白是植物嵌合結(jié)合蛋白文庫(kù),其被克隆到TrxA的活性位點(diǎn)環(huán)中作為與N-末端核定位信號(hào)、LexA活性結(jié)構(gòu)域和表位標(biāo)簽的融合蛋白(Colas等1996Nature380:548;以及Gyuris等Cell199375:791)。用誘館和獵食基因轉(zhuǎn)化酵母細(xì)胞。當(dāng)靶融合蛋白與植物嵌合結(jié)合蛋白融合蛋白結(jié)合時(shí),LexA活性結(jié)構(gòu)域被帶入到LexADNA結(jié)合結(jié)構(gòu)域附近,具有適當(dāng)定位的LexA結(jié)合位點(diǎn)的報(bào)告基因或選擇性標(biāo)記基因的表達(dá)增加了。適合的51報(bào)告基因包括熒光蛋白(例如EGFP)、酶(例如熒光素酶、^-半乳糖苷酶、堿性磷酸酶等)。適合的選擇性標(biāo)記基因包括例如酵母的LEU2基因。在鑒定了一種或多種與靶結(jié)合的嵌合結(jié)合蛋白之后,編碼嵌合結(jié)合蛋白的分離核酸可以通過(guò)本文描述的方法進(jìn)行誘變,以產(chǎn)生表達(dá)變異的嵌合結(jié)合蛋白的小表達(dá)文庫(kù)??梢詫?duì)嵌合結(jié)合蛋白-變異體表達(dá)文庫(kù)進(jìn)行篩選,以鑒定具有改進(jìn)的耙結(jié)合性質(zhì)(例如增加親和性或特異性)的嵌合結(jié)合蛋白變異體。下面的具體實(shí)施例的闡述僅僅是說(shuō)明性的,并不以任何方式對(duì)本公開(kāi)的其它內(nèi)容進(jìn)行限制。不用進(jìn)一步的精心設(shè)計(jì),可以相信對(duì)于本
技術(shù)領(lǐng)域
的專業(yè)技術(shù)人員來(lái)說(shuō),能夠在本說(shuō)明的基礎(chǔ)上在最大的程度上利用本發(fā)明。所有本文中引用的出版物在此以其全文引為參考。實(shí)施例實(shí)施例1、植物支架多肽序列的設(shè)計(jì)和表達(dá)對(duì)于幾個(gè)蛋白結(jié)構(gòu)域家族分析了它們用作支架的潛力。將輸出結(jié)果限制為植物界(Viridiplantae),進(jìn)行了PFAM結(jié)構(gòu)域搜索(pfam.wustl.edu;參見(jiàn)Bateman等(2004)),用于將結(jié)構(gòu)域僅限于綠色植物中存在的結(jié)構(gòu)域。選擇了4個(gè)蛋白結(jié)構(gòu)域家族來(lái)建立植物通用分子識(shí)別文庫(kù)紫色酸性磷酸酶(PAP)的副結(jié)構(gòu)域、植物半胱氨酸蛋白酶抑制劑、植物C2結(jié)構(gòu)域和在錨蛋白重復(fù)蛋白中發(fā)現(xiàn)的轉(zhuǎn)角-螺旋-螺旋(THH)基序。設(shè)計(jì)了3種紫色酸性磷酸酶支架,具有SEQIDNO:34-36中的序列。來(lái)自四季豆PAP的副結(jié)構(gòu)域的氨基酸序列被用作査詢序列對(duì)NCBI數(shù)據(jù)庫(kù)進(jìn)行BLAST。當(dāng)將輸出結(jié)果限制為在植物中發(fā)現(xiàn)的蛋白時(shí),鑒定到了62個(gè)獨(dú)特的序列。從這些序列的比對(duì)中,通過(guò)選擇在比對(duì)中每個(gè)位置上頻率最高的氨基酸,產(chǎn)生了共有的植物PAP序列(SEQIDNO:34)。四季豆(Phaseolusvulgaris)的PAP被選作親本支架(SEQIDNO:35),因?yàn)樗慕Y(jié)構(gòu)已知。來(lái)自大豆Glycinemax的PAP也被選中(SEQIDNO:36),因?yàn)樵撐锓N代表了其中產(chǎn)生轉(zhuǎn)基因產(chǎn)物的常見(jiàn)作物品種。也設(shè)計(jì)了含有類(lèi)似植物錨蛋白重復(fù)序列的支架多肽序列組。類(lèi)似錨蛋白的重復(fù)序列是由大約33個(gè)氨基酸構(gòu)成的小的轉(zhuǎn)角-螺旋-螺旋(THH)基序。它們是來(lái)自所有生物體的蛋白的共同元件,通常在蛋白中以2-20個(gè)重復(fù)序列的串聯(lián)排列被發(fā)現(xiàn)。產(chǎn)生了三個(gè)THH支架。這些蛋白在結(jié)構(gòu)上與GA結(jié)合蛋白(GABP-^)相似。該蛋白由類(lèi)似THH的氨基和羧基末端帽以及3個(gè)THH內(nèi)部重復(fù)序列構(gòu)成。在該蛋白中,據(jù)認(rèn)為帽通過(guò)遮蔽在內(nèi)部重復(fù)序列中發(fā)現(xiàn)的疏水殘基而幫助蛋白穩(wěn)定。對(duì)在PFAM中發(fā)現(xiàn)的312個(gè)植物錨蛋白重復(fù)序列蛋白進(jìn)行了比對(duì),以幫助設(shè)計(jì)植物特異性THH支架。通過(guò)選擇在每個(gè)位置上出現(xiàn)頻率最高的氨基酸,產(chǎn)生植物共有THH序列。該序列被命名為植物共有內(nèi)部重復(fù)序列。該序列被用于通過(guò)BLAST比對(duì)搜索NCBI數(shù)據(jù)庫(kù),以發(fā)現(xiàn)在植物中發(fā)現(xiàn)的最接近的天然THH序列。發(fā)現(xiàn)了來(lái)自小麥(Triticumaestivum)的序列?;谛←溤O(shè)計(jì)的重復(fù)序列包含用纈氨酸取代在小麥序列中出現(xiàn)的單個(gè)半胱氨酸。產(chǎn)生了兩組N和C末端帽。一組由源于GABP-Z3的序列組成,第二組源于植物THH共有序列,并被優(yōu)化以類(lèi)似GABP-Z3的結(jié)構(gòu)。具體來(lái)說(shuō),N末端帽具有延長(zhǎng)的a-螺旋結(jié)構(gòu),而C末端帽與典型的THH重復(fù)序列相比具有截短的螺旋。設(shè)計(jì)了三種THH支架,一種由植物共有的N和C帽以及兩種植物共有內(nèi)部THH重復(fù)序列組成(SEQIDNO:37)。另一種由植物共有的N和C帽以及兩種小麥的共有重復(fù)序列組成(SEQIDNO:38),第三種由類(lèi)似錨蛋白的N和C帽以及兩種小麥的內(nèi)部重復(fù)序列組成(SEQIDNO:39)。設(shè)計(jì)了編碼植物支架多肽序列的基因,用于在植物、細(xì)菌中和噬菌體表面上的表達(dá)測(cè)試。使用可公開(kāi)獲得的大豆(Glycinemax)密碼子使用表(kazusa.orjp/codon,從國(guó)際DNA序列數(shù)據(jù)庫(kù)整理成表格的密碼子使用2000年的狀態(tài),Nakamura.Y,Gojobori,T和Ikemura,T(2000)Nucl.AcidsRes.28:292),選擇了用于植物表達(dá)的密碼子。密碼子的選擇通過(guò)人工進(jìn)行,目的是使最終的密碼子頻率粗略地反映出大豆的天然頻率。沒(méi)有使用罕見(jiàn)使用的密碼子(頻率<10%)。檢查最終序列中可能有問(wèn)題的序列,包括除去克隆所需的限制性位點(diǎn)、可能的植物剪接受體或供體位點(diǎn)(參見(jiàn)網(wǎng)址cbs.dtu.dk/services/NetPgene/)、可能的mRNA去穩(wěn)定化序列(ATTTA),以及同樣的核苷酸出現(xiàn)超過(guò)4次的區(qū)段。通過(guò)修改密碼子使用來(lái)改變基因中任何可能的有問(wèn)題的序列。因?yàn)樵诿總€(gè)蛋白內(nèi)THH序列具有4個(gè)相似的重復(fù)序列,所以采取了步驟以減少重復(fù)序列中的核苷酸相似性;通過(guò)這些方法將平均的重復(fù)序列同一性降低了10-15%。使用合成基因裝配產(chǎn)生了7種構(gòu)建體(3種基于THH支架多肽序列,2種基于PAP支架多肽序列,l種植物半胱氨酸蛋白酶抑制劑和1種植物C2結(jié)構(gòu)域蛋白)。3種THH支架多肽序列被放置在噬粒載體中,作為在其羧基末端與基因III外殼蛋白(gill)融合的序列(Phage3.2,MaximBiotech,Inc.,SouthSanFrancisco,CA)。在基因的5'末端包含有6-His標(biāo)簽,以及在支架基因和gill的編碼氨基末端之間包含有c-Myc標(biāo)簽。然后將噬粒構(gòu)建體包裝到噬菌體顆粒中,并測(cè)試噬菌體對(duì)THH支架的表達(dá)和表面展示。使用抗His和抗Myc抗體進(jìn)行的噬菌體ELISA表明,在噬菌體ELISA中,THH支架蛋白在噬菌體的表面上表達(dá),表明所有3種THH支架多肽序列構(gòu)建體都在噬菌體表面上良好地折疊和表達(dá)。然后將選出的支架多肽序列用于產(chǎn)生表達(dá)載體,通過(guò)免疫印跡評(píng)估它們?cè)谵D(zhuǎn)基因植物中的表達(dá)。54將用含有THH的植物表達(dá)載體轉(zhuǎn)化的土壤桿菌(agrobacterium)LB4404注射煙草葉片。兩天后,收獲用土壤桿菌注射的葉片部分、在干冰上冷凍,然后用研棒碾磨成細(xì)的粉末。含有0.2%Tween-20的PBS以1:1的重量體積比加入到細(xì)粉末中,進(jìn)行進(jìn)一步碾磨。通過(guò)離心除去不溶性的材料,余留的上清液取10/iL上樣于4-12%丙烯酰胺SDS-PAGE凝膠上(NuPage,Intvitrogen)。將蛋白轉(zhuǎn)移到PVDF膜上。使用大鼠抗HA抗體(Roche)和抗大鼠HRP偶聯(lián)的第二抗體(Chemicon)來(lái)檢測(cè)蛋白。使用AmerhamLumigen試劑檢測(cè)HRP。發(fā)現(xiàn)所有3種THH支架都可以表達(dá),三種支架的相對(duì)表達(dá)水平是TA-THH〉CC陽(yáng)THH〉TC-THH。其它實(shí)施方案在本說(shuō)明書(shū)中公開(kāi)的所有特點(diǎn)可以以任何組合方式組合。在本說(shuō)明書(shū)中公開(kāi)的每種特點(diǎn)可以被起到同樣的、等價(jià)的或相似的目的的備選特點(diǎn)所代替。因此,除非另有明確的陳述,每個(gè)公開(kāi)的特點(diǎn)都僅僅是一系列通用的等價(jià)或相似特點(diǎn)的一個(gè)例子。從上面的描述中,本
技術(shù)領(lǐng)域
的專業(yè)人員可以容易地確定本發(fā)明的基本特征,并且在不背離其精神和范圍的情況下,可以對(duì)本發(fā)明進(jìn)行各種不同的改變和修飾,以使其適用于不同的應(yīng)用和情況。因此,其它的實(shí)施方案也在所附權(quán)利要求的范圍之內(nèi)。5權(quán)利要求1.編碼至少10種不同多肽的核酸的文庫(kù),每種多肽的氨基酸序列包括C1-X1-C2-X2-C3-X3-C4,其中(i)子序列C1選自SEQ.IDNO1-30,子序列C2選自SEQ.IDNO31-60,子序列C3選自SEQ.IDNO61-90,子序列C4選自SEQ.IDNO91-120,并且C1-C4的每個(gè)對(duì)于選定子序列含有最多10個(gè)單氨基酸取代、缺失、插入或添加;(ii)C1-C4在多種編碼的多肽中是同質(zhì)的;(iii)X1-X3的每一個(gè)是由2-20個(gè)氨基酸構(gòu)成的獨(dú)立可變的子序列;以及(iv)X1-X3的每一個(gè)在多種編碼的多肽中是異質(zhì)的。2.編碼至少10種不同多肽的核酸的文庫(kù),每種多肽的氨基酸序列包括C廣X廣C2-X2-C3曙X3-C4,其中(i)子序列Q選自圖2或圖4,子序列C2選自圖2或圖4,子序列C3選自圖2或圖4,子序列C4選自圖2或圖4,并且d-C4的每個(gè)對(duì)于選定子序列含有最多IO個(gè)單氨基酸取代、缺失、插入或添加;(ii)d-Q在多種編碼的多肽中是同質(zhì)的;(iii)XpX3的每一個(gè)是由2-20個(gè)氨基酸構(gòu)成的獨(dú)立可變的子序列;以及(iv)XrX3的每一個(gè)在多種編碼的多肽中是異質(zhì)的。3.編碼至少10種不同多肽的核酸的文庫(kù),每種多肽的氨基酸序列包括d-X廣C2-X2-C3-X3-C4,其中(i)子序列d選自圖3或圖5,子序列C2選自圖3或圖5,子序列C3選自圖3或圖5,子序列Q選自圖3XX,并且d-Ct的每個(gè)對(duì)于選定子序列含有最多30個(gè)單氨基酸取代、缺失、插入或添加;(ii)d-C4在多種編碼的多肽中是同質(zhì)的;(iii)XrX3的每一個(gè)是由2-20個(gè)氨基酸構(gòu)成的獨(dú)立可變的子序列;以及(iv)XrX3的每一個(gè)在多種編碼的多肽中是異質(zhì)的。4.權(quán)利要求l-3任一項(xiàng)的文庫(kù),其中至少編碼了1,000種不同的多肽。5.權(quán)利要求l-3任一項(xiàng)的文庫(kù),其中至少編碼了100,000種不同的多肽。6.權(quán)利要求l-3任一項(xiàng)的文庫(kù),其中至少編碼了1,000,000種不同的多肽。7.權(quán)利要求1-3任一項(xiàng)的文庫(kù),其中d-Q的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多20個(gè)單氨基酸取代、缺失、插入或添加。8.權(quán)利要求7的文庫(kù),其中Q-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多IO個(gè)單氨基酸取代、缺失、插入或添加。9.權(quán)利要求8的文庫(kù),其中d-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多5個(gè)單氨基酸取代、缺失、插入或添加。10.權(quán)利要求9中的文庫(kù),其中d-Q對(duì)于選定子序列都不含有氨基酸取代、缺失、插入或添加。11.權(quán)利要求l-3任一項(xiàng)的文庫(kù),其中X,-X3的氨基酸選自在植物中遺傳編碼的少于20種氨基酸。12.權(quán)利要求11的文庫(kù),其中少于20種遺傳編碼的氨基酸包括至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸和至少一種芳香族氨基酸。13.權(quán)利要求12的文庫(kù),其中少于20種遺傳編碼的氨基酸包括丙氨酸、天冬氨酸、絲氨酸和酪氨酸。14.權(quán)利要求l的文庫(kù),其中每種多肽的氨基酸序列選自(a).含有d-X廣C2陽(yáng)X2隱C3-X3-C4的多肽,其中C尸SEQ.IDNO:l,C2=SEQ.IDNO:31,C3=SEQ.IDNO:61,禾卩C4=SEQ.IDNO:91;(b).含有C廣X廣C2-X2-CVX3-C4的多肽,其中Q=SEQ.IDNO:2,C2=SEQ.IDNO:32,C3=SEQ.IDNO:62,和C4=SEQ.IDNO:92;以及(c).含有C廣X廣C2-X2-C3國(guó)X3-C4的多肽,其中d=SEQ.IDNO:3,C2=SEQ.IDNO:33,C3=SEQ.IDNO:63,和C4=SEQ.IDNO:93。15.權(quán)利要求2的文庫(kù),其中每種編碼的多肽含有CVX廣C2-X2-C3-X3-Q,其中C產(chǎn)SEQ.IDNO:Xl,C2=SEQ.IDNO:X2,C3=SEQ.IDNO:X3,和C4=SEQ.IDNO:X4;命名為SEQ.IDNO:130。16.權(quán)利要求3的文庫(kù),其中每種編碼的多肽含有C廣X廣C2-X2陽(yáng)C3-X3-C4,其中C!=SEQ.IDNO:Xl,C2=SEQ.IDNO:X2,C3=SEQ.IDNO:X3,和C4=SEQ.IDNO:X4;命名為SEQ.IDNO:130。17.權(quán)利要求l-3任一項(xiàng)的文庫(kù),其中每種核酸包含載體序列。18.分離的核酸,其選自權(quán)利要求l-3任一項(xiàng)的文庫(kù)。19.分離的核酸,其選自權(quán)利要求14-16任一項(xiàng)的文庫(kù)。20.細(xì)胞,其表達(dá)權(quán)利要求19的分離核酸。21.分離的核酸,其選自權(quán)利要求17的文庫(kù)。22.純化的多肽,其由權(quán)利要求18的分離的核酸編碼。23.細(xì)胞群體,其表達(dá)由權(quán)利要求l-3任一項(xiàng)的文庫(kù)編碼的多肽。24.細(xì)胞,其選自權(quán)利要求23的細(xì)胞群體。25.純化多肽的文庫(kù),其由權(quán)利要求l-3任一項(xiàng)的文庫(kù)編碼。26.絲狀噬菌體群體,其展示由權(quán)利要求1-3任一項(xiàng)的文庫(kù)編碼的多肽。27.產(chǎn)生權(quán)利要求1的文庫(kù)的方法,包括(i)提供編碼含有下列氨基酸序列的親本多肽的親本核酸d-X廣C2-X2-C3-X3-C4,其中子序列Q選自SEQIDNO:1-30,子序列C2選自SEQIDNO:31-60,子序列Q選自SEQIDNO:61-90,子序列Q選自SEQIDNO:91-120中選擇;C,-Q的每一個(gè)對(duì)于選定子序列含有最多IO個(gè)單氨基酸取代、缺失、插入或添加;并且XrX3的每一個(gè)是由2-20個(gè)氨基酸組成的獨(dú)立子序列;(ii)在對(duì)XpX2或X3子序列導(dǎo)入最多IO個(gè)單氨基酸取代、缺失、插入或添加的條件下復(fù)制親本核酸,從而產(chǎn)生編碼Xi'、X2'或X3'的隨機(jī)變異的子序列群體;以及(iii)隨機(jī)變異的子序列Xf、X或X3'的群體在對(duì)應(yīng)于編碼Xj、X2或X3的位置上取代進(jìn)入親本核酸的群體中。28.權(quán)利要求27的方法,其中X廣X3子序列中的至少一個(gè)選自SEQIDNO:121-123。29.權(quán)利要求27的方法,其中d-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多20個(gè)單氨基酸取代、缺失、插入或添加。30.權(quán)利要求29的方法,其中Q-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多IO個(gè)單氨基酸取代、缺失、插入或添加。31.權(quán)利要求30的方法,其中d-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多5個(gè)單氨基酸取代、缺失、插入或添加。32.權(quán)利要求31的方法,其中d-C4對(duì)于選定子序列都不含有氨基酸取代、缺失、插入或添加。33.權(quán)利要求27的方法,其中復(fù)制通過(guò)在每個(gè)X,、X2或Xg中導(dǎo)入最多5個(gè)氨基酸取代而產(chǎn)生隨機(jī)變異的子序列的異質(zhì)群體。34.權(quán)利要求27的方法,還包括通過(guò)將文庫(kù)導(dǎo)入生物復(fù)制系統(tǒng)并增殖生物復(fù)制系統(tǒng)來(lái)擴(kuò)增文庫(kù)。35.權(quán)利要求34的方法,其中生物復(fù)制系統(tǒng)是多種大腸桿菌細(xì)胞。36.權(quán)利要求34中的方法,其中生物復(fù)制系統(tǒng)是多種噬菌體。37.權(quán)利要求27的方法,其中復(fù)制在體外發(fā)生。38.權(quán)利要求37的方法,其中復(fù)制用純化的誘變聚合酶來(lái)進(jìn)行。39.權(quán)利要求37的方法,其中復(fù)制在核苷酸類(lèi)似物的存在下進(jìn)行。40.權(quán)利要求27中的方法,其中復(fù)制發(fā)生在體內(nèi)。41.權(quán)利要求40中方法,其中體內(nèi)復(fù)制發(fā)生在大腸桿菌(E.coli)的誘變菌種中。42.產(chǎn)生權(quán)利要求1的文庫(kù)的方法,包括(i)選擇含有待編碼的氨基酸序列d-Xt-CVX2-C3-X3-C4的氨基酸序列,其中(a)子序列Q選自SEQIDNO:1-30,子序列C2選自SEQIDNO:31-60,子序列C3選自SEQIDNO:61-90,和子序列Q選自SEQIDNO:91-120;(b)CrC4的每一個(gè)對(duì)于選定子序列含有最多10個(gè)單氨基酸取代、缺失、插入或添加;(c)X"乂2和乂3的每一個(gè)由長(zhǎng)度為2-20個(gè)氨基酸的氨基酸序列組成;(ii)提供第一多種和第二多種寡核苷酸,其中(a)第一多種寡核苷酸編碼CVQ子序列和多個(gè)異質(zhì)的&-&變異子序列X卩-X3';(b)第二多種寡核苷酸與編碼d-C4子序列的核苷酸序列和編碼多個(gè)異質(zhì)的X一X3'子序列的核苷酸序列互補(bǔ);以及(c)第一和第二多種寡核苷酸具有彼此互補(bǔ)的交疊序列;(iii)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(v)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。43.權(quán)利要求42的方法,其中d-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多20個(gè)單氨基酸取代、缺失、插入或添加。44.權(quán)利要求43的方法,其中d-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多10個(gè)單氨基酸取代、缺失、插入或添加。45.權(quán)利要求44的方法,其中Q-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有從0到最多5個(gè)單氨基酸取代、缺失、插入或添加。46.權(quán)利要求42的方法,還包含進(jìn)行步驟的循環(huán),步驟的循環(huán)包括通過(guò)將第二混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性,然后進(jìn)行步驟(iv)和(v)。47.權(quán)利要求46的方法,包括重復(fù)步驟的循環(huán)最多100次。48.權(quán)利要求42的方法,還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)主要由文庫(kù)、正向引物和反向引物組成,其中正向和反向引物能夠與文庫(kù)中所有核酸的5'和3'末端序列分別雜交。49.權(quán)利要求42的方法,其中在X,、X2或X3子序列的每個(gè)位置上待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組。50.權(quán)利要求49的方法,其中選擇用于每個(gè)單個(gè)氨基酸取代的氨基酸選自由至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸和至少一種芳香族氨基酸組成的氨基酸組。51.權(quán)利要求50的方法,其中氨基酸組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。52.產(chǎn)生權(quán)利要求2的文庫(kù)的方法,包括(i)提供編碼含有下列氨基酸序列的親本多肽的親本核酸d-XrC2-X2-C3-X3-C4,其中子序列d選自圖2或圖4,子序列。2選自圖2或圖4,子序列Q選自圖2或圖4,子序列C4選自圖2或圖4;CrC4的每一個(gè)對(duì)于選定子序列含有最多10個(gè)單氨基酸取代、缺失、插入或添加;并且XrX3的每一個(gè)是由2-20個(gè)氨基酸組成的獨(dú)立的子序列;(ii)在對(duì)XpX2或X3子序列導(dǎo)入最多IO個(gè)單氨基酸取代、缺失、插入或添加的條件下復(fù)制親本核酸,從而產(chǎn)生編碼Xi'、X2'或X3,的隨機(jī)變異的子序列群體;以及(iii)隨機(jī)變異的子序列X,'、XZ或X3'的群體在對(duì)應(yīng)于編碼X"乂2或X3的位置上取代進(jìn)入親本核酸的群體。53.權(quán)利要求52的方法,其中至少一個(gè)XrX3子序列選自SEQIDNO:121-123。54.權(quán)利要求52的方法,其中Q-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多20個(gè)單氨基酸取代、缺失、插入或添加。55.權(quán)利要求54的方法,其中d-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多IO個(gè)單氨基酸取代、缺失、插入或添加。56.權(quán)利要求55的方法,其中d-Q的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多5個(gè)單氨基酸取代、缺失、插入或添加。57.權(quán)利要求56的方法,其中Q-C4對(duì)于選定子序列都不含有氨基酸取代、缺失、插入或添加。58.權(quán)利要求52的方法,其中復(fù)制通過(guò)在每個(gè)Xp乂2或乂3中導(dǎo)入最多5個(gè)氨基酸取代,產(chǎn)生隨機(jī)變異的子序列的異質(zhì)群體。59.權(quán)利要求52的方法,還包括通過(guò)將文庫(kù)導(dǎo)入生物復(fù)制系統(tǒng)并增殖生物復(fù)制系統(tǒng)來(lái)擴(kuò)增文庫(kù)。60.權(quán)利要求59的方法,其中生物復(fù)制系統(tǒng)是多種大腸桿菌細(xì)胞。61.權(quán)利要求59的方法,其中生物復(fù)制系統(tǒng)是多種噬菌體。62.權(quán)利要求52的方法,其中復(fù)制在體外發(fā)生。63.權(quán)利要求62的方法,其中復(fù)制使用純化的誘變聚合酶來(lái)進(jìn)行。64.權(quán)利要求62的方法,其中復(fù)制在核苷酸類(lèi)似物的存在下進(jìn)行。65.權(quán)利要求52的方法,其中復(fù)制發(fā)生在體內(nèi)。66.權(quán)利要求65的方法,其中體內(nèi)復(fù)制發(fā)生在大腸桿菌的誘變菌種中。67.產(chǎn)生權(quán)利要求2的文庫(kù)的方法,包括(i)選擇待編碼的含有氨基酸序列d-XrCVXrQ-XrQ的氨基酸序列,其中(a)子序列Q選自圖2或圖4,子序列C2選自圖2或圖4,子序列C3選自圖2或圖4,和子序列Q選自圖2或圖4;(b)d-C4的每一個(gè)對(duì)于選定子序列含有最多10個(gè)單氨基酸取代、缺失、插入或添加;(c)XpX2和X3的每一個(gè)由長(zhǎng)度為2-20個(gè)氨基酸的氨基酸序列組成;(ii)提供第一多種和第二多種寡核苷酸,其中(a)第一多種寡核苷酸編碼Ct-C4子序列和多個(gè)異質(zhì)的X「X3變異子序歹ljXi'-X3';(b)第二多種寡核苷酸與編碼d-C4子序列的核苷酸序列和編碼多個(gè)異質(zhì)的X,'-X3'子序列的核苷酸序列互補(bǔ);以及(C)第一和第二多種寡核苷酸具有彼此互補(bǔ)的交疊序列;(iii)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(V)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。68.權(quán)利要求67的方法,其中d-Q的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多20個(gè)單氨基酸取代、缺失、插入或添加。69.權(quán)利要求68的方法,其中C廣Q的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多IO個(gè)單氨基酸取代、缺失、插入或添加。70.權(quán)利要求69的方法,其中Q-Q的每一個(gè)對(duì)于選定子序列獨(dú)立地含有從O到最多5個(gè)單氨基酸取代、缺失、插入或添加。71.權(quán)利要求67的方法,還包含進(jìn)行步驟的循環(huán),步驟的循環(huán)包括通過(guò)將第二混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性,然后進(jìn)行步驟(iv)和(v)。72.權(quán)利要求71的方法,包括重復(fù)步驟的循環(huán)最多IOO次。73.權(quán)利要求67的方法,還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)主要由文庫(kù)、正向引物和反向引物組成,其中正向和反向引物能夠與文庫(kù)中所有核酸的5'和3'末端序列分別雜交。74.權(quán)利要求67的方法,其中在XpX2或X3子序列的每個(gè)位置上待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組。75.權(quán)利要求74的方法,其中選擇用于每個(gè)單個(gè)氨基酸取代的氨基酸選自由至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸和至少一種芳香族氨基酸組成的氨基酸組。76.權(quán)利要求75的方法,其中氨基酸組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。77.產(chǎn)生權(quán)利要求3的文庫(kù)的方法,包括(i)提供編碼含有下列氨基酸序列的親本多肽的親本核酸Q-X,-C2-X2-C3-X3-C4,其中子序列C,選自圖3或圖5,子序列C2選自圖3或圖5,子序列C3選自圖3或圖5,子序列Q選自圖3或圖5;CVC4的每一個(gè)對(duì)于選定子序列含有最多10個(gè)單氨基酸取代、缺失、插入或添加;并且XpX3的每一個(gè)是由2-20個(gè)氨基酸組成的獨(dú)立的子序列;(ii)在對(duì)XpX2或X3子序列導(dǎo)入最多IO個(gè)單氨基酸取代、缺失、插入或添加的條件下復(fù)制親本核酸,從而產(chǎn)生編碼X,'、X2'或X3,的隨機(jī)變異的子序列群體;以及(m)隨機(jī)變異的子序列X、X2'或X3'的群體在對(duì)應(yīng)于編碼Xj、x2或x3的位置上取代進(jìn)入親本核酸的群體。78.權(quán)利要求77的方法,其中至少一個(gè)XrX3子序列選自SEQIDNO:121-123。79.權(quán)利要求27的方法,其中Q-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多20個(gè)單氨基酸取代、缺失、插入或添加。80.權(quán)利要求79的方法,其中Q-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多IO個(gè)單氨基酸取代、缺失、插入或添加。81.權(quán)利要求80的方法,其中C,-Q的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多5個(gè)單氨基酸取代、缺失、插入或添加。82.權(quán)利要求81的方法,其中d-Q對(duì)于選定子序列都不含有氨基酸取代、缺失、插入或添加。83.權(quán)利要求77的方法,其中復(fù)制通過(guò)在每個(gè)Xi、乂2或乂3中導(dǎo)入最多5個(gè)氨基酸取代,產(chǎn)生隨機(jī)變異的子序列的異質(zhì)群體。84.權(quán)利要求77的方法,還包括通過(guò)將文庫(kù)導(dǎo)入生物復(fù)制系統(tǒng)并增殖生物復(fù)制系統(tǒng)來(lái)擴(kuò)增文庫(kù)。85.權(quán)利要求84的方法,其中生物復(fù)制系統(tǒng)是多種大腸桿菌細(xì)胞。86.權(quán)利要求84的方法,其中生物復(fù)制系統(tǒng)是多種噬菌體。87.權(quán)利要求77的方法,其中復(fù)制在體外發(fā)生。88.權(quán)利要求87的方法,其中復(fù)制使用純化的誘變聚合酶來(lái)進(jìn)行。89.權(quán)利要求87的方法,其中復(fù)制在核苷酸類(lèi)似物的存在下進(jìn)行。90.權(quán)利要求77的方法,其中復(fù)制發(fā)生在體內(nèi)。91.權(quán)利要求90的方法,其中體內(nèi)復(fù)制發(fā)生在大腸桿菌的誘變菌種中。92.產(chǎn)生權(quán)利要求3的文庫(kù)的方法,包括(i)選擇待編碼的含有Q-XrC2-X2-C3-X3-C4的氨基酸序列,其中(a)子序列d選自圖3或圖5,子序列C2選自圖3或圖5,子序列C3選自圖3或圖5,以及子序列C4選自圖3或圖5;(b)CrC4的每一個(gè)對(duì)于選定子序列含有最多10個(gè)單氨基酸取代、缺失、插入或添加;(c)X"X2和X3的每一個(gè)由長(zhǎng)度為2-20個(gè)氨基酸的氨基酸序列組成;(ii)提供第一多種和第二多種寡核苷酸,其中(a)第一多種寡核苷酸編碼C,-Q子序列和多個(gè)異質(zhì)的X,-X3變異子序列XW;(b)第二多種寡核苷酸與編碼C,-C4子序列的核苷酸序列和編碼多個(gè)異質(zhì)的Xr-X3'子序列的核苷酸序列互補(bǔ);以及(C)第一和第二多種寡核苷酸具有彼此互補(bǔ)的交疊序列;(iii)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(v)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。93.權(quán)利要求92的方法,其中Q-Q的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多20個(gè)單氨基酸取代、缺失、插入或添加。94.權(quán)利要求93的方法,其中Q-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有最多IO個(gè)單氨基酸取代、缺失、插入或添加。95.權(quán)利要求94的方法,其中d-C4的每一個(gè)對(duì)于選定子序列獨(dú)立地含有從O到最多5個(gè)單氨基酸取代、缺失、插入或添加。96.權(quán)利要求92的方法,還包含進(jìn)行步驟的循環(huán),循環(huán)包括通過(guò)將第二混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性,然后進(jìn)行步驟(iv)和(v)。97.權(quán)利要求96的方法,包括重復(fù)循環(huán)最多IOO次。98.權(quán)利要求92的方法,還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)主要由文庫(kù)、正向引物和反向引物組成,其中正向和反向引物與文庫(kù)中所有核酸的5'和3'末端序列分別雜交。99.權(quán)利要求92的方法,其中在X,、X2或X3子序列的每個(gè)位置上待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組。100.權(quán)利要求99中的方法,其中選擇用于每個(gè)單個(gè)氨基酸取代的氨基酸選自由至少一種脂肪族氨基酸、至少一種酸性氨基酸、至少一種中性氨基酸和至少一種芳香族氨基酸組成的氨基酸組。101.權(quán)利要求100的方法,其中氨基酸組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。102.編碼至少I(mǎi)O種不同多肽的核酸的文庫(kù),其中(i)每個(gè)編碼的多肽的氨基酸序列含有與SEQIDNO:127-129的任何一個(gè)具有至少70%同一性的氨基酸序列;(ii)每個(gè)編碼的多肽的氨基酸序列在位置14、15、33、35-36、38、47-48、66、68-69、71、80、81、99、101-102和104上包含與SEQIDNO:127-129不同的氨基酸,并且氨基酸的差異在多種編碼的多肽中是異質(zhì)的;以及(iii)每個(gè)編碼的多肽的氨基酸序列在對(duì)應(yīng)于SEQIDNO:127-129的位置14、15、33、35-36、38、47-48、66、68-69、71、80、81、99、101-102和104的殘基之外,在多種編碼的多肽中是同質(zhì)的。103.權(quán)利要求102的文庫(kù),其中多肽的氨基酸序列與SEQIDNO127-129的任何一個(gè)具有至少75%的同一性。104.權(quán)利要求102的文庫(kù),其中多肽的氨基酸序列與SEQIDNO127-129中的任何一個(gè)具有至少80%的同一性。105.權(quán)利要求102的文庫(kù),其中的多肽的氨基酸序列與SEQIDNO127-129中的任何一個(gè)具有至少85%的同一性。106.權(quán)利要求102的文庫(kù),其中每個(gè)核酸含有載體序列。107.編碼多肽的分離核酸,其選自權(quán)利要求102-106任一項(xiàng)的文庫(kù)。108.純化的多肽,其由權(quán)利要求107的核酸編碼。109.細(xì)胞的群體,其表達(dá)權(quán)利要求102的文庫(kù)所編碼的多肽。110.細(xì)胞,其選自權(quán)利要求109的細(xì)胞群體。111.多肽的純化文庫(kù),其由權(quán)利要求102的文庫(kù)編碼。112.絲狀噬菌體的群體,其展示由權(quán)利要求102的文庫(kù)編碼的多肽文庫(kù)。113.產(chǎn)生權(quán)利要求102的文庫(kù)的方法,包括(i)選擇待編碼的對(duì)應(yīng)于SEQIDNO:127-129的任何一個(gè)的氨基酸序列,其中選擇的序列與SEQIDNO:127-129的序列在至少一個(gè)可變位置14、15、33、35-36、38、47-48、66、68-69、71、80、81、99、101-102和104上不同;(ii)化學(xué)提供第一和第二多種寡核苷酸,其中(a)第一多種寡核苷酸編碼選定的氨基酸序列的氨基酸子序列,該子序列在編碼的可變位置上是異質(zhì)的;(b)第二多種寡核苷酸與編碼選定氨基酸序列的子序列的核苷酸序列互補(bǔ),該子序列在編碼的可變位置上是異質(zhì)的;以及(C)第一和第二多種包含具有彼此互補(bǔ)的交疊序列的寡核苷酸;(m)將寡核苷酸群體合并以形成第一混合物;(iv)將混合物在使交疊的互補(bǔ)序列有效雜交以形成多個(gè)雜交互補(bǔ)序列的條件下孵育;以及(V)將多個(gè)雜交互補(bǔ)序列延伸以形成含有文庫(kù)的第二混合物。114.權(quán)利要求113的方法,還包含通過(guò)將第二混合物的溫度增加到有效變性雙鏈DNA的溫度來(lái)使文庫(kù)變性、然后進(jìn)行步驟(iv)和(v)的循環(huán)。115.權(quán)利要求114的方法,包括重復(fù)循環(huán)最多100次。116.權(quán)利要求115的方法,還包括通過(guò)聚合酶鏈反應(yīng)擴(kuò)增文庫(kù),該反應(yīng)主要由文庫(kù)、正向引物和反向引物組成,其中正向和反向引物與文庫(kù)中的所有核酸的5'和3'末端序列分別雜交。117.權(quán)利要求113的方法,其中為可變位置而待編碼的氨基酸選自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸和纈氨酸的亞組。118.權(quán)利要求117的方法,其中選擇用于可變位置的氨基酸選自由脂肪族、酸性、中性和芳香族氨基酸組成的組。119.權(quán)利要求118的方法,其中氨基酸的組由丙氨酸、天冬氨酸、絲氨酸和酪氨酸組成。全文摘要本發(fā)明提供了基于植物支架多肽序列的嵌合結(jié)合多肽的編碼核酸的文庫(kù)。也說(shuō)明了產(chǎn)生文庫(kù)的方法。文檔編號(hào)C12Q1/68GK101495653SQ200780013127公開(kāi)日2009年7月29日申請(qǐng)日期2007年2月13日優(yōu)先權(quán)日2006年2月13日發(fā)明者珍妮弗·瓊斯申請(qǐng)人:達(dá)沃股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1