午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

克勞氏芽孢桿菌的分泌、轉錄和芽孢形成基因的制作方法

文檔序號:447254閱讀:1141來源:國知局
專利名稱:克勞氏芽孢桿菌的分泌、轉錄和芽孢形成基因的制作方法
技術領域
本發(fā)明涉及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明涉及具有外源核酸序列導入其中的革蘭氏陽性微生物,以及用于在這些宿主細胞中生成蛋白質(zhì)的方法,諸如芽孢桿菌屬的成員。更具體的說,本發(fā)明涉及目的多肽的表達、生成和分泌,以及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明提供了微生物對所選擇多肽的增強表達。
背景技術
革蘭氏陽性微生物,諸如芽孢桿菌屬的成員,已經(jīng)被用于大規(guī)模工業(yè)發(fā)酵,這部分歸功于它們將發(fā)酵產(chǎn)物分泌到培養(yǎng)液中的能力。所分泌的蛋白質(zhì)輸出穿過細胞膜和細胞壁,隨后釋放到外部培養(yǎng)基中。是將多肽分泌到周質(zhì)空間還是培養(yǎng)基中,這受制于工業(yè)發(fā)酵需要仔細考慮的多種參數(shù)。
事實上,異源多肽的分泌是工業(yè)中廣泛使用的一種技術。通常,用編碼待表達的目的異源多肽的核酸轉化細胞,從而生成大量的期望多肽。這種技術可用于生成比天然生成數(shù)量多得多的多肽。這些表達多肽具有許多工業(yè)應用,包括治療和農(nóng)業(yè)用途,以及用于食品、化妝品、清潔組合物、動物飼料、等。因此,提高多肽表達在許多領域備受關注。
發(fā)明概述本發(fā)明涉及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明涉及具有外源核酸序列導入其中的革蘭氏陽性微生物,以及用于在這些宿主細胞中生成蛋白質(zhì)的方法,諸如芽孢桿菌屬的成員。更具體的說,本發(fā)明涉及目的多肽的表達、生成和分泌,以及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明提供了微生物對所選擇多肽的增強表達。
在有些實施方案中,本發(fā)明提供了編碼參與革蘭氏陽性宿主細胞中的肽分泌的蛋白質(zhì)的核苷酸序列,以及用于提高細胞的蛋白質(zhì)分泌的方法。
在有些實施方案中,本發(fā)明提供了用于提高多肽生成和/或分泌的方法。在一個優(yōu)選實施方案中,這些方法中所使用的細胞表達至少一種衍生自克勞氏芽孢桿菌(Bacillus clausii)的分泌相關蛋白質(zhì)。在特別優(yōu)選的方法中,細胞經(jīng)轉化而表達蛋白質(zhì)。在一個實施方案中,所述方法任選包括滅活細胞中的至少一種分泌相關蛋白質(zhì)。所述方法還包括在適合于表達并分泌多肽的條件下培養(yǎng)細胞。
本發(fā)明還提供了編碼分泌相關蛋白質(zhì)的核酸序列。在一個優(yōu)選實施方案中,核酸序列衍生自克勞氏芽孢桿菌。在其它實施方案中,提供了克勞氏芽孢桿菌分泌因子的變體。在另一些實施方案中,提供了由核酸序列編碼的分泌相關蛋白質(zhì)推定氨基酸序列的至少部分序列信息。
本發(fā)明還提供了用于在宿主細胞中生成堿性蛋白酶的方法。在一個實施方案中,將bcl2627的超表達用于誘導堿性蛋白酶的增強表達和/或分泌。
在另一個實施方案中,本發(fā)明提供了克勞氏芽孢桿菌spoIIE和degU核酸序列。在有些實施方案中,這些序列進行了體外誘變。在另一些實施方案中,將這些誘變序列重新導入宿主細胞。在一個實施方案中,宿主細胞是克勞氏芽孢桿菌;而在其它實施方案中,宿主細胞是其它生物體,包括但不限于枯草芽孢桿菌(Bacillus subtilis)。
本發(fā)明提供了包含克勞氏芽孢桿菌分泌因子的核酸序列,其中分泌因子選自下組SecA、SecD、SecE、SecF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV、和SipW。在有些優(yōu)選實施方案中,核酸序列選自下組SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ IDNO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO8、SEQID NO6、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、和SEQ ID NO28。在候選實施方案中,可雜交核苷酸序列在低嚴謹度、中嚴謹度、和高嚴謹度的嚴謹度條件下保持與SEQ ID NO10、SEQ IDNO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQID NO20、SEQ ID NO8、SEQ ID NO6、SEQ ID NO22、SEQID NO24、SEQ ID NO26、和SEQ ID NO28的核苷酸序列雜交。在其它實施方案中,本發(fā)明提供了包含SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO8、SEQ ID NO6、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、和SEQ ID NO28所示至少一種核苷酸序列的至少一部分的載體。在特別優(yōu)選的實施方案中,載體還包含編碼至少一種目的多肽的核苷酸序列。在另一些實施方案中,本發(fā)明提供了包含這些載體的表達盒。在有些優(yōu)選實施方案中,本發(fā)明提供了包含這些表達盒的芽孢桿菌屬的宿主細胞。在有些優(yōu)選實施方案中,宿主細胞分泌至少一種選自下組的克勞氏芽孢桿菌分泌因子SecA、SecD、SecE、secF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV、和SipW。在候選實施方案中,分泌因子包含選自下組的氨基酸序列SEQ IDNO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQID NO21、SEQ ID NO23、SEQ ID NO25、和SEQ ID NO27。在其它實施方案中,氨基酸序列包含選自下組的氨基酸序列的片段SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、和SEQ ID NO27。在另一些實施方案中,氨基酸序列包含選自下組的氨基酸序列的變體SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、和SEQ ID NO27。
本發(fā)明還提供了包含克勞氏芽孢桿菌轉錄因子的核苷酸序列,其中轉錄因子選自下組DegS、DegU、和Bcl2627。在有些優(yōu)選實施方案中,核苷酸序列選自下組SEQ ID NO4、SEQ ID NO30、和SEQ ID NO32。在其它實施方案中,本發(fā)明提供了在低嚴謹度、中嚴謹度、和高嚴謹度的嚴謹度條件下保持與權利要求15的核苷酸序列雜交的可雜交核苷酸序列。在另一些實施方案中,本發(fā)明提供了包含選自下組的核苷酸序列的至少一部分的載體SEQ ID NO4、SEQ IDNO30、和SEQ ID NO32。在有些優(yōu)選實施方案中,載體還包含編碼至少一種目的多肽的核苷酸序列。在另一些實施方案,本發(fā)明提供了包含這些載體的表達盒。在其它實施方案中,本發(fā)明提供了包含這些表達盒的芽孢桿菌屬的宿主細胞。在另一些實施方案中,宿主細胞分泌至少一種克勞氏芽孢桿菌轉錄因子。在其它實施方案中,轉錄因子包含選自下組的氨基酸序列SEQ ID NO3、SEQ ID NO29、和SEQ ID NO31。在有些實施方案中,氨基酸序列包含選自下組的氨基酸序列的片段SEQ ID NO3、SEQ ID NO29、和SEQ ID NO31。在有些候選實施方案中,氨基酸序列包含選自下組的氨基酸序列的變體SEQ ID NO3、SEQ ID NO29、和SEQ ID NO31。
本發(fā)明還提供了包含克勞氏芽孢桿菌芽孢形成因子SpoIIE蛋白質(zhì)的核苷酸序列。在有些實施方案中,序列包含SEQ ID NO2。在其它實施方案中,本發(fā)明提供了在低嚴謹度、中嚴謹度、和高嚴謹度的嚴謹度條件下保持與權利要求28的核苷酸序列雜交的可雜交核苷酸序列。本發(fā)明還提供了包含SEQ ID NO2的核苷酸序列的至少一部分的載體。在有些優(yōu)選實施方案中,載體還包含編碼至少一種目的多肽的核苷酸序列。在另一些實施方案中,本發(fā)明提供了包含這些載體的表達盒。在其它實施方案中,本發(fā)明提供了包含這些表達盒的芽孢桿菌屬的宿主細胞。在有些特別優(yōu)選的實施方案中,宿主細胞分泌至少一種克勞氏芽孢桿菌芽孢形成因子。在另一些實施方案中,芽孢形成因子包含SEQ ID NO1的氨基酸序列。在有些實施方案中,氨基酸序列包含SEQ ID NO1所示氨基酸序列的片段;而在候選實施方案中,氨基酸序列包含SEQ ID NO1所示氨基酸序列的變體。
本發(fā)明還提供了用于生成目的蛋白的方法,包括下列步驟在適當條件下培養(yǎng)芽孢桿菌宿主細胞,其中所述芽孢桿菌宿主細胞包含編碼目的蛋白的核苷酸序列,且其中所述宿主細胞經(jīng)過核苷酸序列的轉化,所述核苷酸序列編碼包含選自下組的氨基酸序列的蛋白質(zhì)SEQID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31;并容許所述目的蛋白表達。在有些實施方案中,氨基酸序列與具有選自下組的氨基酸序列的蛋白質(zhì)的序列至少85%相同SEQ IDNO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31。在其它實施方案中,氨基酸序列包含選自下組的氨基酸序列的變體氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31。在候選實施方案中,氨基酸序列包含選自下組的氨基酸序列的片段氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、和31。本發(fā)明還提供了包含雜合克勞氏芽孢桿菌序列的氨基酸序列。
附圖描述

圖1顯示了來自克勞氏芽孢桿菌的SpoIIE的推導氨基酸序列(SEQID NO1)。
圖2顯示了來自克勞氏芽孢桿菌的spoIIE的DNA序列(SEQ IDNO2)。
圖3A顯示了來自克勞氏芽孢桿菌的DegU的推導氨基酸序列(SEQID NO3)。
圖3B顯示了來自克勞氏芽孢桿菌的DegS的推導氨基酸序列(SEQID NO29)。
圖4A顯示了來自克勞氏芽孢桿菌的degU的DNA序列(SEQ IDNO4)。
圖4B顯示了來自克勞氏芽孢桿菌的degS的DNA序列(SEQ IDNO30)。
圖5顯示了來自克勞氏芽孢桿菌的FtsY的推導氨基酸序列(SEQID NO5)。
圖6顯示了來自克勞氏芽孢桿菌的ftsY的DNA序列(SEQ ID NO6)。
圖7顯示了來自克勞氏芽孢桿菌的Ffh的推導氨基酸序列(SEQ IDNO7)。
圖8顯示了來自克勞氏芽孢桿菌的ffh的DNA序列(SEQ ID NO8)。
圖9顯示了來自克勞氏芽孢桿菌的SecA的推導氨基酸序列(SEQID NO9)。
圖10顯示來自克勞氏芽孢桿菌的secA的DNA序列(SEQ ID NO10)。
圖11顯示了來自克勞氏芽孢桿菌的SecD的推導氨基酸序列(SEQID NO11)。
圖12顯示了來自克勞氏芽孢桿菌的secD的DNA序列(SEQ IDNO12)。
圖13顯示了來自克勞氏芽孢桿菌的SecE的推導氨基酸序列(SEQID NO13)。
圖14顯示了來自克勞氏芽孢桿菌的secE的DNA序列(SEQ IDNO14)。
圖15顯示了來自克勞氏芽孢桿菌的SecF的推導氨基酸序列(SEQID NO15)。
圖16顯示了來自克勞氏芽孢桿菌的secF的DNA序列(SEQ IDNO16)。以“M”表示的核苷酸殘基指該核苷酸可以是C或A。
圖17顯示了來自克勞氏芽孢桿菌的SecG的推導氨基酸序列(SEQID NO17)。
圖18顯示了來自克勞氏芽孢桿菌的secG的DNA序列(SEQ IDNO18)。
圖19顯示了來自克勞氏芽孢桿菌的SecY的推導氨基酸序列(SEQID NO19)。
圖20顯示了來自克勞氏芽孢桿菌的secY的DNA序列(SEQ IDNO20)。
圖21描繪了三個物種間spoOB區(qū)的同線性(synteny)。采用反相PCR的染色體步查來連接克勞氏芽孢桿菌spoOB區(qū)的兩個毗連群。由此產(chǎn)生的閉合容許我們檢查該區(qū)基因組織的保守性(或缺乏性),該區(qū)包含發(fā)育磷酸化(phosphorelay)信號轉導系統(tǒng)中心成分的基因。三個染色體中yrxA至spoOB區(qū)是保守的;克勞氏芽孢桿菌中的nifS位于至今未連上的第三個毗連群上。枯草芽孢桿菌spoOB上游區(qū)域的基因排列在這里比較的物種中是獨特的??藙谑涎挎邨U菌中spoOB毗連的hemEHY區(qū)在耐鹽芽孢桿菌(B.haloduran)中被ABC轉運子操縱子和轉座酶基因分開。這種情形在克勞氏/耐鹽比較中最有可能證明是共有的,因為這兩種物種具有過量的100個轉座酶基因。
圖22描繪了芽孢桿菌中的芽孢形成磷酸化。該系統(tǒng)是決定細胞是否進入芽孢形成的中心信號加工系統(tǒng)。它是由精巧的二元系統(tǒng)組成的,其中該系統(tǒng)由信號感覺組氨酸激酶和應答調(diào)節(jié)器組成。這一獨特系統(tǒng)應答多種信號的進一步精細調(diào)整是通過特定磷酸酶(Rap蛋白質(zhì))來實現(xiàn)的,而后者又是通過同源磷酸酶抑制肽(即Phr蛋白質(zhì)的加工形式)的作用來調(diào)節(jié)的。細菌物種中大量的二元系統(tǒng)(枯草芽孢桿菌中有至少35個)要求激酶/應答調(diào)節(jié)器蛋白質(zhì)對之間分子識別的靈敏的特異性,以確保信號不會錯誤的轉導給同源系統(tǒng)即所謂的串話干擾(cross-talk)。綠色箭頭指示轉錄或功能激活。紅線指示轉錄遏制或功能失活。
圖23描繪了枯草芽孢桿菌(Bsu)、克勞氏芽孢桿菌、和耐鹽芽孢桿菌(Bhalo)的磷酸化組分蛋白質(zhì)SpoOF、SpoOB和SpoOA的比對。在所有三個物種中都保守的殘基以星號指示;在枯草芽孢桿菌和克勞氏芽孢桿菌之間保守的殘基是紅色的,在克勞氏芽孢桿菌和耐鹽芽孢桿菌之間保守的殘基是藍色的,而在枯草芽孢桿菌和耐鹽芽孢桿菌之間保守的殘基是綠色的。蛋白質(zhì)的鑲嵌本性在較低同源性SpoOB蛋白質(zhì)之間尤其明顯,在非保守位置,在克勞氏芽孢桿菌與枯草芽孢桿菌之間以及克勞氏芽孢桿菌與耐鹽芽孢桿菌之間看到大約10%同一性,而在枯草芽孢桿菌/耐鹽芽孢桿菌比較中觀察到大約20%同一性。
活性位點D54(OF)、H30(OB)和D56(OA)殘基標有記號(Pi)。SpoOA的DNA結合螺旋-轉角-螺旋序列標有上劃線(_H-T-H_)。指示了SpoOF螺旋1(!)、環(huán)4(#)和螺旋5($)中賦予應答調(diào)節(jié)器之間相互作用特異性即防止串話干擾的殘基(Hoch和Varughese,J.Bacteriol.,1834941-4949,2001);以SpoOA中同源殘基的相應標識顯示了SpoOB中的接觸殘基。雖然這些特異性殘基在SpoOF和SpoOA中是完全保守的(除了耐鹽芽孢桿菌SpoOA中的保守E21D替代),但是SpoOB的11個接觸殘基中只有4個是完全保守的,額外的殘基44、45、67和100被保守替代。這可能反映了磷酸化信號轉導系統(tǒng)中配偶體分子識別的一定程度彈性,盡管這些相互作用確實必須保持高度特異。
圖24描繪了來自三個芽孢桿菌物種的假定Rap蛋白質(zhì)的多序列比對。比對是使用ClustalW進行的。樹形圖是使用Phylip軟件包構建的。為了計算距離矩陣,使用了Dayhoff PAM矩陣(“bh”指示來自耐鹽芽孢桿菌的序列,“bcl”指示來自克勞氏芽孢桿菌的序列,而“bs”指示來自枯草芽孢桿菌的序列)。
盡管不想將本發(fā)明限制于任何具體機制或理論,樹形圖提出早期獲得的共同祖先基因后來在三個基因組中分離。耐鹽芽孢桿菌在其基因組中編碼的少量Rap磷酸酶方面相對于枯草芽孢桿菌和克勞氏芽孢桿菌是獨特的??莶菅挎邨U菌RapD(來自其它枯草芽孢桿菌Rap序列)與同樣超出主要克勞氏芽孢桿菌分組的一對克勞氏芽孢桿菌Rap蛋白質(zhì)最緊密相關。與Rap磷酸酶相似且跟隨著潛在Phr編碼基因(但是目前注解為未知功能)的枯草芽孢桿菌YopK與克勞氏芽孢桿菌bcl80和耐鹽芽孢桿菌BH0061同源。克勞氏芽孢桿菌bcl80比YopK短得多,只與386個氨基酸的YopK的N端160個氨基酸共享同源性。BH0061注解為4-二磷酰胞苷-2-C-甲基-D-赤藻糖醇激酶,而且比YopK短100個氨基酸。
圖25顯示了來自克勞氏芽孢桿菌的SipS的推導氨基酸序列(SEQID NO21)。
圖26顯示了來自克勞氏芽孢桿菌的sipS的DNA序列(SEQ ID NO22) 。
圖27顯示了來自克勞氏芽孢桿菌的SipT的推導氨基酸序列(SEQID NO23)。
圖28顯示了來自克勞氏芽孢桿菌的sipT的DNA序列(SEQ ID NO24)。
圖29顯示了來自克勞氏芽孢桿菌的SipV的推導氨基酸序列(SEQID NO25)。
圖30顯示了來自克勞氏芽孢桿菌的sipV的DNA序列(SEQ ID NO26)。
圖31顯示了來自克勞氏芽孢桿菌的SipW的推導氨基酸序列(SEQID NO27)。
圖32顯示了來自克勞氏芽孢桿菌的sipW的DNA序列(SEQ IDNO28)。
圖33顯示了與來自嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)的轉錄激活子基因nprA同源的bcl2627的推導氨基酸序列(SEQ ID NO31)。
圖34顯示了來自克勞氏芽孢桿菌的基因bcl2627的DNA序列(SEQID NO32)。
發(fā)明描述只使用下列定義和實施例,現(xiàn)在將詳細的描述本發(fā)明作為參考。特意引用本文提及的所有專利和發(fā)表物,包括這些專利和發(fā)表物中公開的所有序列,作為參考。
本發(fā)明涉及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明涉及具有外源核酸序列導入其中的革蘭氏陽性微生物,以及用于在這些宿主細胞中生成蛋白質(zhì)的方法,諸如芽孢桿菌屬的成員。更具體的說,本發(fā)明涉及目的多肽的表達、生成和分泌,以及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明提供了微生物對所選擇多肽的增強表達。
定義特意引用本文提及的所有專利和發(fā)表物,包括這些專利和發(fā)表物中公開的所有序列,作為參考。除非本文另有定義,本文所使用的所有技術和科學術語具有與本發(fā)明所屬領域普通技術人員通常理解相同的含義(參閱如Singleton等人,《Dictionary of Microbiology andMolecular Biology》,第2版,John Wiley & Sons,紐約,1994;以及Hale和Marham,《The Harper Collins Dictionary of Biology》,HarperPerennial,紐約,1991;二者都為技術人員提供了本文所用許多術語的普通詞典)。雖然與本文所述相似或相當?shù)脑S多方法和材料都可用于實踐或測試本發(fā)明,然而本發(fā)明描述了優(yōu)選的方法和材料。數(shù)值范圍包括限定該范圍的端值。除非另有指示,核酸以由左至右書寫5′至3′方向;而氨基酸序列以由左至右書寫氨基至羧基方向。本文提供的標題并非對本發(fā)明各個方面或?qū)嵤┓桨傅南拗?,而是構成整個說明書。因此,下文定義的術語通過參考整個說明書得到更充分的定義。
在用于本文時,“宿主細胞”指有能力擔當宿主和表達載體用于表達依照本發(fā)明的表達盒的細胞。在一個實施方案中,宿主細胞是革蘭氏陽性微生物。在有些優(yōu)選實施方案中,該術語指芽孢桿菌屬的細胞。
在用于本文時,“芽孢桿菌屬”包括本領域技術人員知道的所有成員,包括但不限于枯草芽孢桿菌(Bacillus subtilis)、地衣芽孢桿菌(Bacillus licheniformis)、遲緩芽孢桿菌(Bacillus lentus)、短芽孢桿菌(Bacillus brevis)、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)、嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、克勞氏芽孢桿菌(Bacillusclausii)、耐鹽芽孢桿菌(Bacillus halodurans)、巨大芽孢桿菌(Bacillusmegaterium)、凝結芽孢桿菌(Bacillus coagulans)、環(huán)狀芽孢桿菌(Bacillus circulans)、燦爛芽孢桿菌(Bacillus lautus)、和蘇云金芽孢桿菌(Bacillus thuringiensis)。認識到芽孢桿菌屬仍在進行分類學改組。因此,該屬意欲包括已經(jīng)重新分類的物種,包括但不限于諸如現(xiàn)在命名為“嗜熱脂肪地芽孢桿菌(Geobacillusstearothermophilus)”的嗜熱脂肪芽孢桿菌等生物體。認為界定芽孢桿菌屬的特征是存在氧氣時生成抵抗性內(nèi)生孢子,盡管該特征也應用于最近命名的脂環(huán)酸芽孢桿菌屬(Alicyclobacillus)、雙芽孢芽孢桿菌屬(Amphibacillus)、解硫胺素芽孢桿菌屬(Aneurinibacillus)、無氧芽孢桿菌屬(Anoxybacillus)、短芽孢桿菌屬(Brevibacillus)、線狀芽孢桿菌屬(Filobacillus)、薄壁芽孢桿菌屬(Gracilibacillus)、鹽芽孢桿菌屬(Halobacillus)、類芽孢桿菌屬(Paenibacillus)、鹽水芽孢桿菌屬(Salibacillus)、熱芽孢桿菌屬(Thermobacillus)、尿芽孢桿菌屬(Ureibacillus)、和處女芽孢桿菌屬(Virgibacillus)。
在用于本文時,術語“多肽”指由氨基酸殘基通過肽鍵相連而成的化合物。在用于本文時,術語“蛋白質(zhì)”可以與術語“多肽”同義,或者可以另外指兩種或多種多肽的復合物。因此,術語“蛋白質(zhì)”、“肽”、和“多肽”可以互換使用。
另外,“目的蛋白”或“目的多肽”指將要由宿主細胞表達并分泌的蛋白質(zhì)/多肽。目的蛋白可以是至今考慮在原核細胞和/或真核細胞中表達的任何蛋白質(zhì)。在一個實施方案中,由宿主細胞所采用的分泌相關蛋白或系統(tǒng)轉移的目的蛋白包括包含信號肽的蛋白質(zhì)。目的蛋白對于宿主細胞而言可以是同源的或者是異源的。在有些實施方案中,目的蛋白是分泌性多肽,特別是選自下組的酶淀粉水解酶、蛋白水解酶、纖維素水解酶、氧化還原酶和植物壁降解酶。在其它實施方案中,這些酶包括淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角質(zhì)酶、纖維素酶、半纖維素酶、酯酶、過氧化物酶、過氧化氫酶、葡糖氧化酶、植酸酶、果膠酶、葡糖苷酶、異構酶、轉移酶、半乳糖苷酶和幾丁質(zhì)酶。在另一些實施方案中,所表達的多肽是激素、生長因子、受體、疫苗、抗體、諸如此類。盡管不想將本發(fā)明限于任何具體的蛋白質(zhì)/多肽,然而在有些最優(yōu)選的實施方案中,所表達的多肽是蛋白酶。
在用于本文時,術語“嵌合多肽”和“融合多肽”可以互換使用,指包含至少兩個分開且不同的區(qū)域的蛋白質(zhì),所述區(qū)域可以是或者不是來源于同一蛋白質(zhì)。例如,信號肽與目的蛋白相連可以稱為嵌合多肽或嵌合蛋白,其中信號肽與目的蛋白通常不相關。
在用于本文時,“分泌相關蛋白”指參與由宿主細胞分泌目的蛋白的蛋白質(zhì)。分泌相關蛋白可以幫助新生(即合成過程中或緊隨其后)蛋白質(zhì)正確折疊、幫助蛋白質(zhì)由胞內(nèi)移動到胞外環(huán)境(如穿過細胞質(zhì)到達細胞膜和/或穿過細胞膜/細胞壁到達胞外環(huán)境、等等)、適當加工、諸如此類。蛋白質(zhì)在胞內(nèi)合成直至它出現(xiàn)在細胞膜外表面上這一過程中,認為參與所述蛋白質(zhì)移動的任何方面的蛋白質(zhì)具有分泌相關活性或功能。在一個實施方案中,分泌相關蛋白包括參與幫助新生目的蛋白實現(xiàn)正確折疊構象的蛋白質(zhì)。在另一個實施方案中,分泌相關蛋白包括來自Sec途徑的蛋白質(zhì)。術語“分泌相關蛋白”、“分泌相關因子”、和“分泌因子”在本文中都可以互換使用。
在用于本文時,術語“雜合子”指包含衍生自兩種或多種直向同系物(ortholog)的序列(如分泌因子)。因此,“雜合基因”或“雜合蛋白”分別指所含兩個或多個片段序列衍生自兩種或多種芽孢桿菌菌株的基因或蛋白。
在一個實施方案中,直向同源序列包含來自單一直向同系物的序列。在另一個實施方案中,直向同源序列包含少于5個來自單一直向同系物的序列。在另一個實施方案中,直向同源序列包含來自兩個直向同系物的序列。在另一個實施方案中,直向同源序列包含單一氨基酸。在另一個實施方案中,直向同源序列包含2個至5、10、15、20個氨基酸。在另一個實施方案中,直向同源序列包含分泌因子序列總氨基酸殘基的大約2%至大約50%。
在另一個實施方案中,直向同源序列包含超過2個且少于5、10、15、20、25、30、35、40、45或50個氨基酸。在另一個實施方案中,與野生型克勞氏芽孢桿菌分泌因子相比,直向同源序列總計包含雜合分泌因子序列的少于大約50%。
在用于本文時,術語“嵌合多肽”和“融合多肽”可以互換使用,指包含至少兩個分開且不同的區(qū)域的蛋白質(zhì),它們可以是或者不是來源于同一蛋白質(zhì)。例如,信號肽與目的蛋白相連可以稱為嵌合多肽或嵌合蛋白,其中信號肽與目的蛋白通常不相關。
在用于本文時,術語“嵌合DNA構建物”和“異源核酸構建物”指由不同基因的部分包括調(diào)控元件構成的基因(即已經(jīng)導入宿主的)。因此,在有些實施方案中,嵌合基因指與非其天然啟動子可操作連接的內(nèi)源基因。用于轉化宿主細胞的嵌合基因構建物通常由可操作地連接蛋白質(zhì)編碼序列或(在可選擇標記嵌合基因中)可選擇標記基因(編碼賦予轉化細胞以抗菌劑抗性的蛋白質(zhì))的轉錄調(diào)控區(qū)(啟動子)構成。在一個實施方案中,可用于轉化宿主細胞的本發(fā)明典型嵌合基因構建物包含組成性或可誘導的轉錄調(diào)控區(qū)、信號肽編碼序列、蛋白質(zhì)編碼序列、和終止子序列。在其它實施方案中,嵌合基因包含可操作連接phr基因的啟動子。在其它實施方案中,嵌合基因包含可操作連接編碼目的蛋白的基因的啟動子。在還有一些實施方案中,若想分泌靶蛋白,嵌合基因構建物還包含編碼信號肽的第二種DNA序列。
因此,“雜合”用于描述分泌因子及其編碼核苷酸,而“嵌合”用于描述含調(diào)控元件的DNA構建物。因此,嵌合基因或嵌合DNA構建物可以編碼雜合分泌因子。
在用于本文時,“變體”指通過向C和N末端或其一添加一個或多個氨基酸、替代氨基酸序列中一個或一些不同位點的一個或多個氨基酸、刪除蛋白質(zhì)兩端或其一或氨基酸序列中一個或多個位點的一個或多個氨基酸、和/或在氨基酸序列中一個或多個位點插入一個或多個氨基酸而由蛋白質(zhì)前體(如克勞氏芽孢桿菌分泌因子)衍生的蛋白質(zhì)?!翱藙谑涎挎邨U菌分泌因子變體”指經(jīng)過上文所述修飾的克勞氏芽孢桿菌分泌因子。優(yōu)選如下實現(xiàn)克勞氏芽孢桿菌分泌因子變體的制備修飾編碼天然蛋白質(zhì)的DNA序列,將該DNA序列轉化到適當宿主中,并表達經(jīng)修飾DNA序列以形成衍生酶。本發(fā)明的變異克勞氏芽孢桿菌分泌因子包括與酶前體氨基酸序列相比包含變化的氨基酸序列的肽,其中變異克勞氏芽孢桿菌分泌因子保持克勞氏芽孢桿菌分泌因子前體的特征性分泌因子特性但在某些特定方面可能具有變化的特性。例如,在有些實施方案中,變異克勞氏芽孢桿菌分泌因子在氧化性條件下的穩(wěn)定性升高了且仍保持它們的特征性分泌因子活性。然而,變體的活性相對于分泌因子前體可能升高也可能降低。設想依照本發(fā)明的變體可以衍生自編碼克勞氏芽孢桿菌分泌因子變體的DNA片段,其中所表達克勞氏芽孢桿菌分泌因子變體的功能活性得到了保持。例如,在有些實施方案中,編碼克勞氏芽孢桿菌分泌因子的DNA片段還包含連接在克勞氏芽孢桿菌分泌因子DNA序列5′或3′末端的編碼鉸鏈或接頭的DNA序列或部分,其中所編碼克勞氏芽孢桿菌分泌因子結構域的功能活性得到了保持。
在用于本文時,術語“信號肽”指待分泌蛋白質(zhì)的氨基末端延伸?!靶盘栃蛄小痹诒疚闹锌梢曰Q使用。在最優(yōu)選的實施方案中,分泌性蛋白質(zhì)使用氨基末端蛋白質(zhì)延伸,這些延伸在將蛋白質(zhì)前體靶向并轉移穿過膜中發(fā)揮重要作用,并且在膜轉移過程中或緊隨其后被信號肽酶通過蛋白質(zhì)水解切除。在優(yōu)選實施方案中,信號序列是衍生自芽孢桿菌的Sec依賴性信號肽。
在用于本文時,術語“增強”指改善目的蛋白的生成。在優(yōu)選實施方案中,本發(fā)明提供了增強的(即改善的)目的蛋白生成和分泌。在這些實施方案中,“增強的”生成指與宿主(即野生型細胞)的正常生成水平相比得到了改善。因此,對于異源蛋白質(zhì)而言,基本上任何表達都是增強的,因為細胞通常不生成這些蛋白質(zhì)。
在用于本文時,術語“分離的”和“純化的”指除去了至少一種與其天然相關的成分的核酸或氨基酸。
在用于本文時,術語“異源蛋白質(zhì)”指通常在宿主細胞中非天然存在的蛋白質(zhì)或多肽。異源蛋白質(zhì)的實例包括諸如水解酶等酶,包括蛋白酶、纖維素酶、淀粉酶、其它糖酶、和脂肪酶;諸如消旋酶、差向酶、互變異構酶、或變位酶等異構酶;轉移酶、激酶和磷酸酶、激素、生長因子、細胞因子、抗體、諸如此類。因此,在有些實施方案中,異源蛋白質(zhì)包括重要的治療性蛋白質(zhì)或肽(如生長因子、細胞因子、配體、受體和抑制劑),以及疫苗和抗體。在候選實施方案中,蛋白質(zhì)指重要的商業(yè)性工業(yè)蛋白質(zhì)或肽。該術語意欲涵蓋由天然存在基因、突變基因、和/或合成基因編碼的蛋白質(zhì)。
在用于本文時,術語“異源核酸構建物”和“異源核酸序列”指對序列在其中表達的細胞而言并非天然的遺傳序列的一部分。就控制序列而言,“異源”指控制序列(即啟動子或增強子)原本不發(fā)揮調(diào)控現(xiàn)在所調(diào)控的同一基因的功能。一般而言,異源核酸序列對于它們所存在的細胞或基因組部分而言并非內(nèi)源的,而是通過感染、轉染、顯微注射、電穿孔、諸如此類添加到細胞中的。在有些實施方案中,“異源核酸構建物”包含的控制序列/DNA編碼序列聯(lián)合物與在天然細胞中發(fā)現(xiàn)的控制序列/DNA編碼序列聯(lián)合物相同或不同。
在用于本文時,術語“同源蛋白質(zhì)”指宿主細胞中天然或自然存在的蛋白質(zhì)或多肽。本發(fā)明涵蓋通過重組DNA技術生成同源蛋白質(zhì)的宿主細胞。本發(fā)明還涵蓋在編碼天然存在同源蛋白質(zhì)(諸如例如蛋白酶)的核酸中具有一處或多處刪除或者一處或多處中斷并重新導入重組形式(即表達盒)的同源蛋白質(zhì)編碼核酸的宿主細胞。在其它實施方案中,宿主細胞生成同源蛋白質(zhì)。
在用于本文時,術語“核酸分子”包括RNA、DNA和cDNA分子??梢岳斫?,由于遺傳密碼簡并性,可以生成編碼給定蛋白質(zhì)的多種核苷酸序列。
在用于本文時,術語“載體”指設計用于在不同宿主細胞之間進行轉移的核酸構建物?!氨磉_載體”指有能力在外源細胞中摻入并表達異源DNA片段的載體。許多原核和真核表達載體可以通過商業(yè)途徑獲得。適當表達載體的選擇屬于本領域技術人員知識范圍之內(nèi)。
在用于本文時,術語“表達盒”和“表達載體”指通過重組或合成方式生成的且含有容許在靶細胞中轉錄特定核酸的一系列特定核酸元件的核酸構建物。重組表達盒可以整合入質(zhì)粒、染色體、線粒體DNA、質(zhì)體DNA、病毒、或核酸片段。通常,除了其它序列,表達載體的重組表達盒部分還包含待轉錄的核酸序列和啟動子。
在用于本文時,術語“質(zhì)粒”指在許多細菌和一些真核細胞中用作克隆載體且形成染色體外自主復制遺傳元件的環(huán)狀雙鏈(ds)DNA構建物。
在用于本文時,術語“可選擇標記編碼核苷酸序列”指能夠在宿主細胞中表達并賦予所述細胞以在存在相應選擇劑或缺乏必需營養(yǎng)時生長的能力的核苷酸序列。
在用于本文時,術語“可選擇標記”指能夠在宿主細胞中表達并容許易于選擇包含載體的那些宿主的基因。這些可選擇標記的實例包括但不限于抗菌劑(如卡那霉素、紅霉素、放線菌素、氯霉素和四環(huán)素)。因此,術語“可選擇標記”指能顯示宿主細胞攝取了所引入的目的DNA或者發(fā)生了一些其它反應的基因。通常,可選擇標記指賦予宿主細胞以抗菌劑抗性或代謝優(yōu)勢從而容許將包含外源DNA的細胞與在轉化過程中未接受任何外源序列的細胞區(qū)分開來的基因。“駐留型可選擇標記”指位于待轉化微生物染色體上的可選擇標記。駐留型可選擇標記編碼與轉化用DNA構建物上可選擇標記不同的基因。
在用于本文時,術語“啟動子”指發(fā)揮指導下游基因轉錄的功能的核酸序列。在優(yōu)選實施方案中,啟動子對于將要表達靶基因的宿主細胞而言是適當?shù)摹幼优c其它轉錄和翻譯調(diào)控核酸序列(也稱為“控制序列”)一起都是表達指定基因所必需的。一般而言,轉錄和翻譯調(diào)控序列包括但不限于啟動子序列、核糖體結合位點、轉錄起始和終止序列、翻譯起始和終止序列、以及增強子或激活子序列。
當核酸與另一種核酸序列處于功能相關性位置時稱其為“可操作連接”。例如,若編碼分泌前導序列(即信號肽)的DNA表達成參與多肽分泌的前蛋白,則稱其可操作連接編碼多肽的DNA;若啟動子或增強子影響序列的轉錄,則稱其可操作連接編碼序列;或者若核糖體結合位點的定位促進翻譯,則稱其可操作連接編碼序列。一般而言,“可操作連接”指所連接的DNA序列是連續(xù)的,在分泌前導序列的情況中,既是連續(xù)的又處于讀碼狀態(tài)。然而,增強子不必是連續(xù)的。連接是通過便利限制性位點處的連接來實現(xiàn)的。如果不存在這些位點,那么依照常規(guī)實踐使用合成寡核苷酸銜接頭或接頭。
在用于本文時,術語“基因”指參與生成多肽鏈的DNA區(qū)段,它可以包含或者不含編碼區(qū)之前或之后的區(qū)域(例如5′非翻譯(5′UTR)或“前導”序列和3′UTR或“尾隨”序列)以及單個編碼區(qū)段(外顯子)之間的居間序列(內(nèi)含子)。
在有些實施方案中,基因編碼重要的治療性蛋白質(zhì)或肽,諸如生長因子、細胞因子、配體、受體和抑制劑,以及疫苗和抗體?;蜻€可以編碼重要的商業(yè)性工業(yè)蛋白質(zhì)或肽,諸如酶(如蛋白酶、糖酶諸如淀粉酶和葡糖淀粉酶、纖維素酶、氧化酶和脂肪酶)。然而,本發(fā)明不想限于任何具體的酶或蛋白質(zhì)。在有些實施方案中,目的基因是天然存在基因、突變基因或合成基因。
在用于本文時,“刪除”定義為核苷酸或氨基酸序列中一個或多個核苷酸或氨基酸殘基缺失的變化。
在用于本文時,“插入”或“添加”指與天然存在序列(如克勞氏芽孢桿菌分泌因子)相比核苷酸或氨基酸序列中導致一個或多個核苷酸或氨基酸殘基增加的變化。
在用于本文時,“替代”是指用不同的核苷酸或氨基酸取代一個或多個核苷酸或氨基酸。
在用于本文時,“同源基因”指來自不同但通常相關物種的一對基因,它們彼此對應且彼此相同或非常相似。該術語涵蓋由物種形成(即新物種的發(fā)展)所分離的基因(如直向同源基因),以及由遺傳復制分離的基因(如平行進化基因)。
在用于本文時,“直向同系物”和“直向同源基因”指由共同祖先基因通過物種形成而進化的不同物種中的基因(即同源基因)。通常,直向同系物在進化過程中保持相同功能。直向同系物的鑒定可用于在最新測序的基因組中可靠預測基因功能。
在用于本文時,“平行進化同系物”和“平行進化基因”指基因組內(nèi)因復制而相關的基因。雖然直向同系物在進化過程中保持相同功能,然而平行進化同系物進化得到了新的功能,盡管有些功能常常與原始功能有關。平行進化基因的實例包括但不限于編碼胰蛋白酶、胰凝乳蛋白酶、彈性蛋白酶、和凝血酶的基因,它們都是絲氨酸蛋白酶且一起存在于相同物種中。
在用于本文時,“同源性”指序列相似性或同一性,優(yōu)選同一性。此同源性是使用本領域已知標準技術測定的(參閱如Smith和Waterman,Adv.Appl.Math.,2482,1981;Needleman和Wunsch,J.Mol.Biol.,48443,1970;Pearson和Lipman,Proc.Natl.Acad.Sci.USA,852444,1988;諸如威斯康星遺傳學軟件包(遺傳學計算小組,麥迪遜,威斯康星州)中的GAP、BESTFIT、FASTA、和TFASTA等程序;以及Devereux等人,Nucl.Acids Res.,12387-395,1984)。
有用算法的一個實例是PILEUP。PILEUP使用漸進成對比對法由一組相關序列生成多序列比對。它還能夠繪制樹形圖,顯示用于生成比對的群集關系。PILEUP是Feng和Doolittle漸進比對法(Feng和Doolittle,J.Mol.Evol.,35351-360,1987)的簡化。該方法與Higgins和Sharp所述(Higgins和Sharp,CABIOS,5151-153,1989)相似。有用的FILEUP參數(shù)包括缺省缺口權3.00,缺省缺口長度權0.10,和加權末端缺口。
有用算法的另一個實例是由Altschul等人描述的BLAST算法(Altschul等人,J.Mol.Biol.,215403-410,1990;和Karlin等人,Proc.Natl.Acad.Sci.USA,905873-5787,1993)。特別有用的BLAST程序是WU-BLAST-2程序(參閱Altschul等人,Meth.Enzymol.,266460-480,1996)。WU-BLAST-2使用幾個搜索參數(shù),其中的大多數(shù)設置成缺省值??烧{(diào)節(jié)參數(shù)設置成如下數(shù)值交疊跨度=1,交疊分數(shù)=0.125,詞閾值(T)=11。HSP S和HSP S2參數(shù)是動態(tài)數(shù)值,而且是由程序自身根據(jù)具體序列的組成和用于搜索目的序列的具體數(shù)據(jù)庫的組成而確定的。然而,可以調(diào)整該數(shù)值以提高靈敏度。氨基酸序列同一性百分比值是將匹配相同殘基數(shù)目除以比對區(qū)中“較長”序列的殘基總數(shù)而得出的?!拜^長”序列指在比對區(qū)具有最多實際殘基的序列(忽略為了使比對得分最大化而通過WU-BLAST-2引入的缺口)。
因此,“核酸序列同一性百分比”定義為候選序列中與參照核酸序列的核苷酸殘基相同的核苷酸殘基所占的百分比。優(yōu)選方法使用WU-BLAST-2的BLASTN模塊,設置成缺省參數(shù),交疊跨度和交疊分數(shù)分別設成1和0.125。
比對可以包括在待比對序列中引入缺口。另外,對于比參照核酸序列包含更多或更少核苷酸的序列,可以理解將根據(jù)同源核苷酸數(shù)目與核苷酸總數(shù)相比來確定同源性百分比。因此,例如,將使用比本文所鑒定的和下文所討論的那些序列更短的序列的核苷酸數(shù)目來確定較短序列的同源性。
在用于本文時,術語“雜交”指本領域所知道的一條核酸鏈通過堿基配對而結合互補鏈的過程。
在用于本文時,“最高嚴謹度”指通常發(fā)生于大約Tm-5℃(比探針Tm低5℃)的雜交水平;“高嚴謹度”比Tm低大約5℃至10℃;“中嚴謹度”比Tm低大約10℃至20℃;而“低嚴謹度”比Tm低大約20℃至25℃。正如本領域技術人員將理解的,最高嚴謹度雜交可用于鑒定或檢測相同多核苷酸序列,而中或低嚴謹度雜交可用于鑒定或檢測多核苷酸序列同系物。
若核酸序列與參考核酸序列在中至高嚴謹度雜交和清洗條件下彼此特異雜交,則認為這兩種序列“選擇性可雜交”。雜交條件基于核酸結合復合物或探針的熔化溫度I。例如,“最高嚴謹度”通常發(fā)生于大約Tm-5℃(比探針Tm低5℃);“高嚴謹度”比Tm低大約5℃至10℃;“中嚴謹度”比探針Tm低大約10℃至20℃;而“低嚴謹度”比Tm低大約20℃至25℃。就功能而言,最高嚴謹度條件可用于鑒定與雜交探針具有嚴謹同一性或接近嚴謹同一性的序列;而中或低嚴謹度雜交可用于鑒定或檢測多核苷酸序列同系物。
中和高嚴謹度雜交條件在本領域是眾所周知的。高嚴謹度條件的實例包括于大約42℃在50%甲酰胺、5X SSC、5X Denhardt氏溶液、0.5%SDS和100μg/ml變性載體DNA中雜交,隨后在2X SSC和0.5%SDS中于室溫清洗兩次,在0.1X SSC和0.5%SDS中于42℃再清洗兩次。
在用于本文時,“重組體”包括通過導入異源核酸序列而經(jīng)過修飾的細胞或載體,或者由經(jīng)過如此修飾的細胞衍生的細胞。因此,例如,重組細胞表達在天然形式(即非重組)細胞中未發(fā)現(xiàn)相同形式的基因,或者出于慎重的人為干涉而表達在其它情況中異常表達、不足表達或根本不表達的天然基因?!爸亟M”核酸通常指裝配兩個或多個核酸片段而生成嵌合基因。
在用于本文時,術語“轉化”、“穩(wěn)定轉化”、和“轉基因”在用于指稱細胞時指細胞具有非天然(異源)核酸序列整合到其基因組中或作為游離質(zhì)粒維持兩個或多個世代。
在用于本文時,術語“表達”指根據(jù)基因的核酸序列生成多肽的過程。該包括包括轉錄和翻譯二者。
在用于本文時,術語“導入”在用于將核酸序列插入細胞時指“轉染”、“轉化”、或“轉導”,而且包括將核酸序列整合入原核或真核細胞,其中核酸序列可以整合入細胞的基因組(如染色體、質(zhì)粒、質(zhì)體、或線粒體DNA)、轉變成自主復制子、或瞬時表達(例如轉染的mRNA)。
在用于本文時,“轉化用DNA”、“轉化用序列”、和“DNA構建物”指用于將序列導入宿主細胞或生物體的DNA。轉化用DNA指用于將序列導入宿主細胞或生物體的DNA。該DNA可以是通過PCR在體外生成的,或者是通過任何其它適當技術生成的。在有些優(yōu)選實施方案中,轉化用DNA包含引入的序列;而在其它優(yōu)選實施方案中,它還包含側翼為同源盒的引入序列。在另一個實施方案中,轉化用DNA可以包含其它非同源序列添加在末端(即填充(stuffer)或側翼序列)。末端可以是閉合的,使得轉化用DNA形成閉合環(huán)狀,例如插入載體中。
在一個優(yōu)選實施方案中,突變DNA序列是通過至少一個密碼子的位點飽和誘變而生成的。在另一個優(yōu)選實施方案中,對兩個或多個密碼子進行位點飽和誘變。在另一個實施方案中,突變DNA序列與野生型序列具有超過40%、超過45%、超過50%、超過55%、超過60%、超過65%、超過70%、超過75%、超過80%、超過85%、超過90%、超過95%、或超過98%同源性。在候選實施方案中,通過任何已知突變方法在體內(nèi)生成突變DNA,諸如例如放射、亞硝基胍、諸如此類。然后分離期望DNA序列,并用于本文提供的方法。
在候選實施方案中,轉化用DNA序列包含同源盒而不存在引入序列。在該實施方案中,期望刪除兩個同源盒之間的內(nèi)源DNA序列。另外,在有些實施方案中,轉化用序列是野生型的;而在其它實施方案中,它們是突變型或經(jīng)修飾序列。另外,在有些實施方案中,轉化用序列是同源的;而在其它實施方案中,它們是異源的。
在用于本文時,術語“引入序列”指導入芽孢桿菌染色體或基因組的DNA序列。在優(yōu)選實施方案中,引入序列編碼一種或多種目的蛋白。在有些實施方案中,引入序列包含待轉化細胞基因組中可能早已存在或不存在的序列(即它可以是同源或異源序列)。在有些實施方案中,引入序列編碼一種或多種目的蛋白、基因、和/或經(jīng)突變或經(jīng)修飾基因。在有些實施方案中,引入序列包含可選擇標記,諸如賦予抗菌劑抗性的基因。
在一個實施方案中,引入序列編碼至少一種異源蛋白質(zhì),包括但不限于激素、酶、和生長因子。在另一個實施方案中,酶包括但不限于水解酶,諸如蛋白酶、酯酶、脂肪酶、酚氧化酶、通透酶、淀粉酶、支鏈淀粉酶、纖維素酶、葡萄糖異構酶、漆酶和蛋白質(zhì)二硫化物異構酶。
在候選實施方案中,引入序列編碼功能性野生型基因或操縱子、功能性突變基因或操縱子、或者非功能性基因或操縱子。在有些實施方案中,可以將非功能性序列插入基因以破壞基因的功能。
在用于本文時,術語“靶序列”指宿主細胞中編碼某一序列的DNA序列,其中在所述某一序列處期望將引入序列插入宿主細胞基因組。在有些實施方案中,靶序列編碼功能性野生型基因或操縱子;而在其它實施方案中,靶序列編碼功能性突變基因或操縱子或者非功能性基因或操縱子。
在用于本文時,術語“側翼序列”指位于所討論序列上游或下游的任何序列(如對于基因ABC,基因B的側翼是A和C基因序列)。在優(yōu)選實施方案中,引入序列的側翼是每邊一個的同源盒。在另一個實施方案中,引入序列和同源盒包含側翼為每邊一個填充序列的單元。在有些實施方案中,側翼序列只存在于一端(或是3′或是5′);但在優(yōu)選實施方案中,兩端都有側翼序列。每個同源盒的序列與芽孢桿菌染色體序列同源。這些序列指導芽孢桿菌染色體中哪里整合新構建物和芽孢桿菌染色體的哪些部分將被引入序列取代。
在用于本文時,術語“填充序列”指同源盒側翼的任何額外DNA(通常是載體序列)。然而,該術語涵蓋任何非同源DNA序列。不受任何理論的限制,填充序列為細胞提供了啟動DNA攝取的非重要靶標。
在用于本文時,術語“染色體整合”指將引入序列導入宿主細胞(如芽孢桿菌)染色體中的過程。轉化用DNA的同源盒與染色體的同源區(qū)比對。隨后,同源盒之間的序列在雙交換(即同源重組)中被引入序列取代。
在用于本文時,術語“同源重組”指兩個DNA分子或配對染色體(如在交換過程中)之間相同核苷酸序列位點處的DNA片段交換。在一個優(yōu)選實施方案中,染色體整合是通過同源重組實現(xiàn)的。
在用于本文時,術語“突變體庫”指基因組大部分相同但包含一個或多個基因的不同同系物的細胞群。這些庫可用于例如鑒定具有改善特性的基因或操縱子的方法。
在用于本文時,術語“超感受態(tài)”和“超級感受態(tài)”指超過1%的細胞群能夠用染色體DNA(如芽孢桿菌DNA)轉化?;蛘?,這些術語指超過10%的細胞群能夠用自主復制質(zhì)粒(如芽孢桿菌質(zhì)粒)轉化。優(yōu)選的是,超級感受態(tài)細胞以超過野生型或親本細胞群所觀察到的比率得到轉化。超感受態(tài)和超級感受態(tài)在本文中可以互換使用。
在用于本文時,術語“擴增”和“基因擴增”指特定DNA序列不成比例的復制使得擴增基因以高于基因組中最初存在的更高拷貝數(shù)目存在的過程。在有些實施方案中,通過在存在藥物(如可抑制酶的抑制劑)時的生長而對細胞的選擇導致編碼存在藥物時生長所需要的基因產(chǎn)物的內(nèi)源基因得到擴增,或者編碼該基因產(chǎn)物的外源(即輸入)序列的擴增,或二者兼有。
“擴增”是涉及模板特異性的核酸復制的特殊情況。它與非特異模板擴增(即依賴模板但不依賴特定模板的復制)形成對比。模板特異性與復制保真度(即合成正確多核苷酸序列)和核苷酸(核糖或脫氧核糖)特異性在本文中是有區(qū)別的。模板特異性經(jīng)常描述成術語“靶”特異性。靶序列指經(jīng)過搜索而從其它核酸中分揀出來的“靶”。擴增技術主要設計來用于這種分揀。
在用于本文時,術語“共擴增”指將可擴增標記連同其它基因序列(即包含一種或多種非可選擇基因諸如表達載體中所含的那些基因)一起導入單一細胞并應用適當選擇壓力使得細胞擴增可擴增標記和其它非可選擇基因序列??梢詫⒖蓴U增標記物理連接至其它基因序列上,或者可以將兩段分開的DNA導入相同細胞,一段包含可擴增標記,而另一段包含非可選擇標記。
在用于本文時,術語“可擴增標記”、“可擴增基因”、和“擴增載體”指基因或載體所編碼的基因容許該基因在適當生長條件下擴增。
“模板特異性”在大多數(shù)擴增技術中是通過酶的選擇來實現(xiàn)的。擴增酶指在其使用條件下只加工核酸異質(zhì)混合物中特定核酸序列的酶。例如,在Qβ復制酶的情況中,MDV-1 RNA是復制酶的特異模板(參閱如Kacian等人,Proc.Natl.Acad.Sci.USA,693038,1972)。其它核酸不會由該擴增酶得到復制。類似的,在T7 RNA聚合酶的情況中,該擴增酶對其自身啟動子具有嚴格特異性(參閱Chamberlin等人,Nature,228227,1970)。在T4 DNA連接酶的情況中,酶不會連接寡核苷酸或多核苷酸底物與模板之間在連接接合處存在錯配的兩段寡核苷酸或多核苷酸(參閱Wu和Wallace,Genomics,4560,1989)。最后,發(fā)現(xiàn)Taq和Pfu聚合酶由于它們在高溫下發(fā)揮功能的能力而對引物所結合并限定的序列展示高特異性;高溫產(chǎn)生支持引物與靶序列雜交而與非靶序列不雜交的熱力學條件。
在用于本文時,術語“可擴增核酸”指可以通過任何擴增方法進行擴增的核酸。設想“可擴增核酸”將通常包含“樣品模板”。
在用于本文時,術語“樣品模板”指源自用來分析“靶”(下文定義的)是否存在的樣品的核酸。相反,“背景模板”指樣品中可能存在或不存在的不同于樣品模板的核酸。最常見的背景模板是無意的。它可能是遺留的后果,或者它可能歸咎于需要由樣品純化除去的核酸污染的存在。例如,測試樣品中可能存在來自待檢測生物體以外生物體的核酸作為背景。
在用于本文時,術語“引物”指以純化的限制性消化產(chǎn)物形式天然存在的或通過合成而生成的寡核苷酸,在置于適當條件下時(即存在核苷酸和誘導劑諸如DNA聚合酶,而且處于適當溫度和pH),它能夠擔當合成的起始點,誘導與核酸鏈互補的引物延伸產(chǎn)物的合成。為了獲得最大擴增效率,引物優(yōu)選單鏈,但是也可以是雙鏈。如果是雙鏈,在用于制備延伸產(chǎn)物前首先處理引物將它的兩條鏈分開。優(yōu)選的是,引物是寡脫氧核糖核苷酸。引物必需足夠長,從而在存在誘導劑時引發(fā)延伸產(chǎn)物的合成。引物的精確長度將取決于許多因素,包括溫度、引物來源和所用方法。
在用于本文時,術語“探針”指以純化的限制性消化產(chǎn)物形式天然存在的或通過合成、重組或PCR擴增而生成的寡核苷酸(即核苷酸序列),它能夠與另一種目的寡核苷酸雜交。探針可以是單鏈的或雙鏈的。探針可用于特定基因序列的檢測、鑒定和分離。設想本文所用任何探針將用任何“報告分子”標記,從而在任何檢測系統(tǒng)中可檢測,包括但不限于酶(如ELISA以及基于酶的組織化學測定法)、熒光、放射性、和發(fā)光系統(tǒng)。本發(fā)明不想限于任何具體檢測系統(tǒng)或標記。
在用于本文時,術語“靶”在指稱聚合酶鏈式反應時指由聚合酶鏈式反應所用引物結合的核酸區(qū)域。因此,“靶”需要經(jīng)過搜索而從其它核酸中分揀出來?!皡^(qū)段”定義為靶序列內(nèi)的核酸區(qū)域。
在用于本文時,術語“聚合酶鏈式反應”(“PCR”)指美國專利號4,683,195、4,683,202、和4,965,188(收入本文作為參考)的方法,包括用于提高基因組DNA混合物中靶序列區(qū)段濃度而無需克隆或純化的方法。用于擴增靶序列的這種方法由下列步驟組成將大大過量的兩種寡核苷酸引物導入包含期望靶序列的DNA混合物,隨后在存在DNA聚合酶時進行精確順序的熱循環(huán)。兩種引物與雙鏈靶序列的對應鏈互補。為了實現(xiàn)擴增,將混合物變性,然后將引物與它們在靶分子內(nèi)的互補序列退火。退火后,用聚合酶延伸引物以形成一對新的互補鏈??梢詫⒆冃浴⒁锿嘶鸷途酆厦秆由爝@三個步驟重復多次(即變性、退火和延伸構成一個“循環(huán)”;可以進行許多“循環(huán)”)以獲得高濃度的期望靶序列擴增區(qū)段。期望靶序列擴增區(qū)段的長度是由引物的相對位置決定的,因此這種長度是可控參數(shù)。由于該過程的重復性,將該方法稱為“聚合酶鏈式反應”(下文的“PCR”)。因為靶序列的期望擴增區(qū)段成為混合物中的主要序列(就濃度而言),所以將它們稱為“經(jīng)PCR擴增”。
在用于本文時,術語“擴增試劑”指除了引物、核酸模板和擴增酶以外的擴增所需要的那些試劑(脫氧核糖核苷三磷酸、緩沖液、等)。通常,將擴增試劑及其它反應成分置于或裝在反應容器(試管、微孔、等)中。
通過PCR,有可能將基因組DNA中單一拷貝的特定靶序列擴增至用幾種不同方法(如與標記探針雜交;摻入生物素化引物隨后進行親和素-酶綴合物檢測;將32P標記脫氧核糖核苷三磷酸諸如dCTP或dATP摻入擴增區(qū)段)可檢測的水平。除了基因組DNA,使用適當引物分子組可以擴增任何寡核苷酸或多核苷酸序列。具體而言,通過PCR過程自身生成的擴增區(qū)段也是后續(xù)PCR擴增的有效模板。
在用于本文時,術語“PCR產(chǎn)物”、“PCR片段”、和“擴增產(chǎn)物”指完成兩個或多個循環(huán)的PCR步驟即變性、退火和延伸后得到的化合物混合物。這些術語涵蓋擴增一種或多種靶序列的一個或多個區(qū)段的情況。
在用于本文時,術語“RT-PCR”指RNA序列的復制和擴增。在該方法中,將逆轉錄與PCR偶聯(lián),最常見的是使用一種酶促流程,其中采用了熱穩(wěn)定聚合酶,正如美國專利號5,322,770中所述,收入本文作為參考。在RT-PCR中,通過聚合酶的逆轉錄酶活性將RNA模板轉變成cDNA,然后通過聚合酶的聚合活性進行擴增(即如在其它PCR方法中的)。
在用于本文時,術語“限制性內(nèi)切核酸酶”和“限制酶”指每一種能在特定核苷酸序列處或附近切割雙鏈DNA的細菌酶。
發(fā)明詳述本發(fā)明涉及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明涉及具有外源核酸序列導入其中的革蘭氏陽性微生物,以及用于在這些宿主細胞中生成蛋白質(zhì)的方法,諸如芽孢桿菌屬的成員。更具體的說,本發(fā)明涉及目的多肽的表達、生成和分泌,以及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明提供了微生物對所選擇多肽的增強表達。
許多工業(yè)重要產(chǎn)品(如酶、激素、生長因子、和其它蛋白質(zhì))是由芽孢桿菌屬成員在大規(guī)模發(fā)酵過程中生成的,包括但不限于蛋白酶、脂肪酶、淀粉酶、和β-葡聚糖酶。這些產(chǎn)品(即目的蛋白)對于宿主或是同源的或是異源的。對于同源蛋白質(zhì),“過度表達”指宿主細胞中超過正常水平的表達。對于異源蛋白質(zhì),任何表達當然都是“過度表達”。因此,有利的是得到不能形成芽孢但具有目的基因的增強表達的細胞。
為了解決本領域的一些需求,在一個實施方案中本發(fā)明提供了來自革蘭氏陽性宿主細胞的編碼參與蛋白質(zhì)分泌的分泌因子的核酸序列。在有些實施方案中,這些序列找到了用途,即用本發(fā)明提供的發(fā)明性克勞氏芽孢桿菌基因取代宿主芽孢桿菌物種基因以改變目的蛋白的分泌特征,使得經(jīng)轉化宿主芽孢桿菌細胞的蛋白質(zhì)生成水平更高。在一個優(yōu)選實施方案中,宿主芽孢桿菌細胞是枯草芽孢桿菌。在一個候選實施方案中,宿主細胞是克勞氏芽孢桿菌。在另一個實施方案中,本發(fā)明提供了用于增強任何目的蛋白的分泌(即生成和表達)的方法??藙谑涎挎邨U菌核苷酸序列在本發(fā)明的開發(fā)過程中,收集了來自極端環(huán)境的大量細菌菌株。根據(jù)16S RNA基因序列鑒定了一種專性嗜堿芽孢桿菌即克勞氏芽孢桿菌。將這種菌株稱為“PB92”。菌株PB92保存于ATCC保藏中心(編號ATCC 31408)、代爾夫特技術大學微生物學實驗室(the Laboratory forMicrobiology of the Technical University of Delft)保藏中心(編號OR60)、和日本工業(yè)科學和技術署發(fā)酵研究學院(the FermentationResearch Institute of the Agency of Industrial Science and Technology)保藏中心(編號FERM-P 3304)。
正如下文極為詳細討論的,將克勞氏芽孢桿菌(PB92)序列與枯草芽孢桿菌和耐鹽芽孢桿菌的基因組進行了比較。雖然克勞氏芽孢桿菌序列與來自芽孢桿菌屬的這兩個不同成員的序列高度相似,但是數(shù)據(jù)表明克勞氏芽孢桿菌與耐鹽芽孢桿菌的相關性比克勞氏芽孢桿菌與枯草芽孢桿菌的相關性更密切。然而,如圖21所示,也有清楚例子顯示克勞氏芽孢桿菌的基因與枯草芽孢桿菌比耐鹽芽孢桿菌更相似。
測序使用本領域知道的標準方法對克勞氏芽孢桿菌PB92基因組的鳥槍庫進行測序。隨后裝配單個序列,產(chǎn)生了450個無交疊毗連群,總長度4,345,345堿基對。使用Orpheus軟件(Frishman等人,Nuc.AcidsRes.,262941-7,1998)自動進行基因預測。根據(jù)外在證據(jù)手工細化所有預測的開放讀碼框(ORF)邊界。使用BLASTX再次評估在無冗余蛋白質(zhì)數(shù)據(jù)庫中未能找到匹配的基因組基因間區(qū)域和ORF。然后由比對區(qū)域推斷OFR。還注解了其它基因元件(tRNA、rRNA、scRNA、可轉座元件)。從數(shù)據(jù)組中更改或除去位于已知基因元件內(nèi)部或與其交疊的ORF。用于自動和手工注解基因產(chǎn)物的主要工具是Pedant-ProTMSequence Analysis Suite(Frishman等人,Bioinformatics,1744-57,2001)。將提取的蛋白質(zhì)進行詳盡的生物信息學分析,包括相似性搜索、蛋白質(zhì)基元鑒定、以及蛋白質(zhì)二級結構和特征預測,包括敏感ntg折疊識別。對每個ORF,依照MIPSFunctional Catalogue(Mewes等人,Nature,3877-65,1997)手工進行功能分類。
序列圖1-20和25-32顯示了多個調(diào)控和/或分泌相關蛋白質(zhì)的序列。圖1顯示了來自克勞氏芽孢桿菌的SpoIIE的推導氨基酸序列(SEQ IDNO1)。圖2顯示了來自克勞氏芽孢桿菌的spoIIE的DNA序列(SEQID NO2)。期望生產(chǎn)菌株具有芽孢形成缺陷的特征。因此,通過實驗來評估本發(fā)明開發(fā)過程中所鑒定的克勞氏芽孢桿菌的芽孢形成特征。
枯草芽孢桿菌能夠在存在巨大環(huán)境壓力時進入芽孢形成,諸如極度缺乏營養(yǎng)。作出這一決定后觸發(fā)了轉向芽孢形成發(fā)育狀態(tài)的非常精細且費能的轉變。芽孢形成所需要表達的超過50種基因處于8種芽孢形成控制基因的控制之下,即spoOA、spoOB、spoOIE、spoOF、spoOH、spoOJ、spoOK、和spoOL,其中spoOA是最關鍵的控制因子。芽孢形成控制基因的突變?nèi)菰S細胞不顧所處環(huán)境而不進入芽孢形成并繼續(xù)生成異源和/或同源蛋白質(zhì)。盡管并不想將本發(fā)明限制于任何具體的機制或理論,然而相信克勞氏芽孢桿菌spoIIE基因以與枯草芽孢桿菌同系物相似的方式發(fā)揮功能。因此,設想通過突變克勞氏芽孢桿菌的spoIIE基因來生成芽孢形成缺陷的有益菌株。
圖3顯示了來自克勞氏芽孢桿菌的DegS(SEQ ID NO29)和DegU(SEQ ID NO3)的推導氨基酸序列,而圖4A顯示了來自克勞氏芽孢桿菌的degS(SEQ ID NO30)和degU(SEQ ID NO4)的DNA編碼序列。枯草芽孢桿菌的deg S和degU基因?qū)儆诙{(diào)控系統(tǒng)家族,且編碼參與控制不同細胞功能表達的蛋白質(zhì),包括降解酶合成、DNA攝取能力和鞭毛存在。在這兩種基因中都鑒定了兩類突變。一類突變導致受調(diào)控基因(即受degU系統(tǒng)調(diào)控的基因)的表達降低(degU-突變),而另一類導致表達增強(degU(Hy)突變)(Msadeck等人,在Sonenshein等人編的《Bacillus subtillus and Other Gram-Positive Bacteria》,美國微生物學學會,華盛頓特區(qū),第729-745頁,1993)。這第二類突變與多效性表型有關,在枯草芽孢桿菌中包括在存在葡萄糖的情況下形成芽孢的能力、缺乏鞭毛、且遺傳能力降低。
已知幾種芽孢桿菌生產(chǎn)菌株在degS或degU基因中攜帶一個或多個突變從而賦予菌株某些特征,諸如較低的分解抑制和較好的酶分泌。因此,試圖為克勞氏芽孢桿菌degS和/或degU找到相似用途。因此,認為需要1)進行degS和/或degU基因的體外隨機誘變,用這些誘變?nèi)喝〈@兩種野生型基因或其中之一,并選擇賦予上文所述表型的突變體;2)在天然DegU基因的殘基中導入一個或多個突變,諸如H17X(X表示任何其它氨基酸)、T103X、E112X、V136X、等,其中“X”指任何氨基酸;和/或3)在天然DegS基因的殘基中導入一個或多個突變,諸如V238X,其中“X”指任何氨基酸。將攜帶一個或多個這些突變的突變基因用于取代克勞氏芽孢桿菌中的野生型基因。另外,本發(fā)明涵蓋提高磷酸化的任何degS和/或degU突變;和4)用多拷貝質(zhì)粒所攜帶的或較強啟動子所轉錄的克勞氏芽孢桿菌degS和/或degU基因轉化該桿菌自身以獲得這些基因的較高水平表達。在有些實施方案中,基因是野生型的;而在其它實施方案中,基因是突變型的。
本發(fā)明提供了另一種目的基因。圖33和圖34分別提供了“基因2627”的氨基酸序列(SEQ ID NO31)和DNA序列(SEQ ID NO32),它與來自嗜熱脂肪芽孢桿菌的轉錄激活子基因nprA同源。在嗜熱脂肪芽孢桿菌中,nprA基因位于編碼中性蛋白酶nprS的基因鄰近。已經(jīng)觀察到nprA基因的超表達(諸如將其克隆到多拷貝質(zhì)粒中)提高了鄰近的中性蛋白酶的表達(Nishiya和Imanaka,J.Bacteriol.,1724861-4869,1990)。因此希望在克勞氏中超表達基因2627,用多拷貝質(zhì)粒所攜帶的或整合在染色體中的處于較強啟動子轉錄控制下的基因2627轉化克勞氏芽孢桿菌,以獲得這種基因的較高表達水平。
Sec依賴性蛋白質(zhì)轉運途徑負責將含有氨基末端信號序列的蛋白質(zhì)轉運穿過細胞質(zhì)膜。Sec機制由細胞膜中的蛋白質(zhì)通道(由SecY、SecE、SecG和SecDF(在枯草芽孢桿菌中)或SecD和SecF(在耐鹽芽孢桿菌中)構成)和轉運馬達(SecA)組成。已知Sec機制使其未折疊狀態(tài)的底物“穿過”膜。因此,這種機制本質(zhì)上不能轉運胞液中折疊的蛋白質(zhì)。鑒定了來自克勞氏芽孢桿菌的這種轉運系統(tǒng)的許多成分。
幾乎所有的分泌型蛋白質(zhì)都使用稱為信號肽的氨基末端蛋白質(zhì)延伸,它在蛋白質(zhì)前體穿膜的靶向和轉移中發(fā)揮重要作用,而且在穿膜過程中或之后立即被信號肽酶通過蛋白水解切除。新合成的蛋白質(zhì)前體在細胞質(zhì)中得到統(tǒng)稱為“伴侶”(chaperone)的特定蛋白質(zhì)的識別。這些伴侶防止要轉移的多肽過早聚集或折疊而導致形成輸出不相容的構象。
大多數(shù)輸出蛋白是以未折疊構象通過一般分泌(Sec)途徑轉移的。細胞質(zhì)伴侶和靶向因子(像與哺乳動物信號識別顆粒(SRP)54kDa亞基同源的Ffh蛋白質(zhì)和與哺乳動物SRP受體α亞基同源的FtsY蛋白質(zhì))促進前蛋白靶向膜中的Sec移位酶。圖5-20分別提供了克勞氏芽孢桿菌的FtsY、Ffh、SecA、SecD、SecE、SecF、SecG、和SecY的氨基酸序列和DNA序列。在這些圖中,SecE、SecG和Ffh提供的是部分序列。然而,本發(fā)明意欲涵蓋這些基因和多肽的完整序列。
在轉移穿過膜后,信號肽被信號肽酶切除,這是由膜釋放所轉移蛋白質(zhì)并將其分泌到培養(yǎng)基中的先決條件。因此,在有些實施方案中,目的蛋白具有需要切除的信號肽。本文鑒定的信號肽酶稱為SipS、SipT、SipV、SipW(見圖25-32)。設想任何上述蛋白質(zhì)將找到與本領域已知直向同系物相似方式的用途。
雜交類似物在本發(fā)明的一個實施方案中,若蛋白質(zhì)幫助新生蛋白質(zhì)正確折疊或者由胞內(nèi)轉移至胞外環(huán)境,則將其稱為“分泌相關蛋白”。在本發(fā)明的一個實施方案中,分泌相關蛋白是野生型蛋白質(zhì)的變體,其中它與圖5、7、9、11、13、15、17、19、21、23、25或27的任一氨基酸序列具有超過大約40%、更優(yōu)選超過大約60%、更優(yōu)選至少75%、更優(yōu)選超過大約80%、甚至更優(yōu)選超過大約85%且最優(yōu)選超過大約90%的整體同源性。在有些實施方案中,同源性高達大約93-95%;或者在特別優(yōu)選的實施方案中達到98%。
因此,本發(fā)明提供了用于檢測革蘭氏陽性多核苷酸同系物的方法,包括使基因組或cDNA來源的革蘭氏陽性微生物核酸與編碼克勞氏芽孢桿菌調(diào)控和/或分泌相關蛋白的核酸序列的部分或整個雜交。
本發(fā)明的范圍還包括能夠在中等至最高嚴謹度條件下與編碼克勞氏芽孢桿菌調(diào)控和/或分泌相關蛋白的核苷酸序列雜交的革蘭氏陽性微生物多核苷酸序列。
本發(fā)明的范圍還包括能夠在中等至最高嚴謹度條件下與編碼圖1-20和25-32克勞氏芽孢桿菌調(diào)控和/或分泌相關蛋白的任一核苷酸序列的部分或整個雜交且編碼調(diào)控和/或分泌相關蛋白的新革蘭氏陽性微生物多核苷酸序列。
另外,本領域已知的擴增方法,諸如聚合酶鏈式反應(PCR),可用于擴增克勞氏芽孢桿菌序列。在有些實施方案中,將來自編碼圖1-20和25-32克勞氏芽孢桿菌調(diào)控和/或分泌相關蛋白的任一核苷酸序列的至少大約10個核苷酸且多達大約60個核苷酸、優(yōu)選大約12-30個核苷酸、且更優(yōu)選大約20-25個核苷酸的核酸序列用作探針或PCR引物。
在另一個實施方案中,本發(fā)明提供了編碼與野生型序列具有超過40%、超過45%、超過50%、超過55%、超過60%、超過65%、超過70%、超過75%、超過80%、超過85%、超過90%、超過95%、或超過98%同源性的調(diào)控和/或分泌相關蛋白的DNA序列。
雜合體本發(fā)明還提供了編碼雜合分泌因子的核酸和包含雜合分泌因子的氨基酸序列。在這些實施方案中,雜合分泌相關因子保持相應克勞氏芽孢桿菌分泌相關因子的功能。在有些實施方案中,本發(fā)明提供了克勞氏芽孢桿菌與其它物種之間的雜合體,包括但不限于枯草芽孢桿菌。因此,在有些實施方案中,微生物包含克勞氏芽孢桿菌序列以及來自另一種生物體的序列,諸如枯草芽孢桿菌。
在一個實施方案中,直向同源序列包含來自單一直向同系物的序列。在另一個實施方案中,直向同源序列包含來自單一直向同系物的少于5種序列。在另一個實施方案中,直向同源序列包含來自兩個直向同系物的序列。在另一個實施方案中,直向同源序列包含一個氨基酸。在另一個實施方案中,直向同源序列包含2個至5、10、15、20個氨基酸。在還有一個實施方案中,直向同源序列總計包含分泌因子序列的大約2%至大約50%。
在候選實施方案中,直向同源序列包含超過2個且少于5、10、15、20、25、30、35、40、45或50個氨基酸。在另一個實施方案中,與野生型克勞氏芽孢桿菌分泌因子相比,直向同源序列總計包含雜合分泌因子序列的少于大約50%。
目的蛋白本發(fā)明在增強胞內(nèi)和/或胞外蛋白質(zhì)生成方面特別有用。在有些實施方案中,蛋白質(zhì)是同源的;而在其它實施方案中,蛋白質(zhì)是異源的。本發(fā)明可用于生成多種蛋白質(zhì),包括但不限于激素、酶、生長因子、細胞因子、抗體、諸如此類。本發(fā)明具體可用于生成酶,包括但不限于水解酶,諸如蛋白酶、酯酶、脂肪酶、酚氧化酶、通透酶、淀粉酶、支鏈淀粉酶、纖維素酶、葡萄糖異構酶、漆酶和蛋白質(zhì)二硫化物異構酶。然而,本發(fā)明還可用于生成激素,包括但不限于促卵泡激素、促黃體素、促腎上腺皮質(zhì)激素釋放因子、生長激素抑制素、促性腺激素、血管加壓素、催產(chǎn)素、促紅細胞生成素、胰島素、諸如此類。
生長因子是結合細胞表面受體且主要結果為激活細胞增殖和/或分化的蛋白質(zhì)。除了酶和激素,本發(fā)明還可用于生成生長因子,包括但不限于血小板衍生生長因子、表皮生長因子、神經(jīng)生長因子、成纖維細胞生長因子、胰島素樣生長因子、轉化生長因子、等。細胞因子是生長因子的獨特家族。主要由白細胞分泌的細胞因子刺激體液和細胞免疫應答,以及激活吞噬細胞。細胞因子包括但不限于集落刺激因子、白介素(如IL-1[α和β]、IL-2至IL-13)和干擾素(α、β和γ)。人類白介素-3(IL-3)是包含133個氨基酸殘基的15kDa蛋白質(zhì)。IL-3是物種特異性集落刺激因子,刺激骨髓培養(yǎng)物形成巨核細胞、嗜中性粒細胞和巨噬細胞集落。
除了上述蛋白質(zhì),本發(fā)明還試圖用于涉及抗體的實施方案。抗體包括但不限于希望大量生成的來自任何物種的免疫球蛋白。尤其優(yōu)選的是抗體是人類抗體。免疫球蛋白可以來自任何類型(即IgG、IgA、IgM、IgE、或IgD)。
本發(fā)明在增強具有非極性或基本非極性羧基末端的蛋白質(zhì)的生成和分泌方面特別有用。因此,設想包含信號肽和非極性或基本非極性羧基末端的蛋白質(zhì)在本發(fā)明中找到具體用途。蛋白質(zhì)可以是同源的或異源的。
在本發(fā)明的有些實施方案中,目的蛋白融合了信號肽。本發(fā)明特別涉及了來自兩種分泌途徑的信號肽。第一種途徑是Sec依賴性途徑。該途徑已經(jīng)詳細表征,并且已經(jīng)描述了許多推定的信號肽。本發(fā)明意欲涵蓋所有Sec依賴性信號肽。具體實例包括但不限于AmyL和AprE序列。AmyL序列指α-淀粉酶的信號序列,而AprE指AprE信號肽序列(AprE是來自枯草芽孢桿菌的枯草桿菌蛋白酶(也稱為堿性蛋白酶))。只要在宿主細胞中有功能(即指導目的蛋白進入分泌途徑),就可以使用衍生自任何來源的任何信號序列。
宿主細胞本發(fā)明提供了用于在革蘭氏陽性微生物諸如芽孢桿菌屬成員中表達、生成和分泌期望蛋白質(zhì)的宿主微生物和表達手段。
在一般實施方案中,本發(fā)明方法可用于增強胞內(nèi)生成或經(jīng)Sec依賴性分泌途徑分泌的任何目的蛋白的表達和/或分泌。因此,可通過重組DNA方法融合Sec依賴性信號肽的任何目的蛋白都可用于本發(fā)明。
用編碼一種或多種本發(fā)明克勞氏芽孢桿菌分泌因子的核苷酸序列轉化宿主細胞,使得宿主細胞能夠增強目的蛋白的分泌。在有些實施方案中,目的蛋白是內(nèi)源的;而在其它實施方案中,目的蛋白是異源的。在有些實施方案中,目的蛋白是天然目的蛋白融合Sec依賴性信號序列的嵌合蛋白。在一個優(yōu)選實施方案中,克勞氏芽孢桿菌分泌因子基因可操作連接啟動子。啟動子可以是組成性的或可誘導的。在一個實施方案中,啟動子是枯草芽孢桿菌aprE啟動子。然而,優(yōu)選啟動子是宿主細胞中負責直向同系物基因轉錄的啟動子。例如,在枯草芽孢桿菌中secA啟動子可用于表達克勞氏芽孢桿菌secA基因,枯草芽孢桿菌secY啟動子可用于表達克勞氏芽孢桿菌secY基因,等等。
還設想了通過改變可誘導啟動子的誘導水平,有可能調(diào)控基因產(chǎn)物的表達,從而調(diào)控目的蛋白的分泌。
在有些實施方案中,宿主細胞是革蘭氏陽性細胞。在優(yōu)選實施方案中,革蘭氏陽性細胞是芽孢桿菌屬的成員。在用于本文時,芽孢桿菌屬包括本領域技術人員知道的所有成員,包括但不限于枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、解淀粉芽孢桿菌、耐鹽芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、環(huán)狀芽孢桿菌、巨大芽孢桿菌、燦爛芽孢桿菌、和蘇云金芽孢桿菌。在有些特別優(yōu)選的實施方案中,芽孢桿菌屬成員選自下組枯草芽孢桿菌、克勞氏芽孢桿菌、和地衣芽孢桿菌。
DNA構建物本發(fā)明提供了用于在宿主微生物中增強期望的異源或同源蛋白質(zhì)的生成和分泌的表達系統(tǒng)??梢酝ㄟ^任何合適方法將DNA構建物的各種成分裝配起來,包括PCR和/或連接。應當注意的是,只要DNA構建物具有期望的最終結構,就可以使用任何技術。在優(yōu)選實施方案中,將DNA構建物整合入載體,包括但不限于整合性單拷貝載體、整合性可擴增載體或多拷貝載體。
啟動子如上文所述,啟動子可以是可誘導的或組成性的。用于本文的優(yōu)選啟動子是與克勞氏芽孢桿菌分泌因子對應的來自宿主細胞的啟動子?;蛘撸梢允褂门c分泌因子通常相關的克勞氏芽孢桿菌啟動子。在另一個實施方案中,啟動子可以是在宿主細胞中有功能而并非克勞氏芽孢桿菌分泌因子的天然啟動子的任何啟動子。
信號序列/目的蛋白在本發(fā)明的有些優(yōu)選實施方案中,載體包含至少一個拷貝的編碼革蘭氏陽性微生物分泌因子的核酸,且優(yōu)選包含多個拷貝。在其它實施方案中,載體包含整合到宿主細胞基因組中的序列(如克勞氏芽孢桿菌),優(yōu)選單一拷貝。在其它實施方案中,提供了攜帶這兩種基因(即天然和導入序列)的宿主細胞。在其它實施方案中,本發(fā)明提供了包含天然目的基因的載體;而在其它實施方案中,載體包含雜合序列。因此,本發(fā)明提供了多個實施方案,其中導入序列、雜合體、和天然序列以任何合適組合存在。
在有些優(yōu)選實施方案中,革蘭氏陽性微生物是芽孢桿菌。在另一個優(yōu)選實施方案中,革蘭氏陽性微生物是枯草芽孢桿菌。在一個優(yōu)選實施方案中,將編碼克勞氏芽孢桿菌分泌相關因子或其片段或融合蛋白的多核苷酸或者編碼所述分泌因子氨基酸變體的多核苷酸同系物序列用于生成分別在革蘭氏陽性宿主細胞中指導分泌相關因子或其氨基酸變體表達的重組DNA分子。在一個優(yōu)選實施方案中,宿主細胞屬于芽孢桿菌屬。在另一個優(yōu)選實施方案中,宿主細胞是枯草芽孢桿菌。
正如本領域技術人員將理解的,生成具有非天然存在密碼子的多核苷酸序列可能是有益的。因此,例如,在有些實施方案中,選擇了特定革蘭氏陽性宿主細胞偏愛的密碼子(參閱Murray等人,Nuc.AcidsRes.,17477-508,1989)以提高表達速率或生成具有期望特性的重組RNA轉錄本,諸如與由天然存在序列生成的轉錄本相比較更長的半衰期。
可用于本發(fā)明的經(jīng)改變的克勞氏芽孢桿菌分泌因子多核苷酸序列包括導致多核苷酸編碼相同或功能相當分泌因子同系物的刪除、插入、和/或不同核苷酸殘基的替代。在候選實施方案中,所編碼蛋白質(zhì)包含產(chǎn)生沉默變化并導致功能相當克勞氏芽孢桿菌分泌因子變體的氨基酸殘基刪除、插入和/或替代。只要變體保持調(diào)控分泌的能力,就可以根據(jù)殘基極性、電荷、可溶性、疏水性、親水性、和/或兩性性質(zhì)的相似性來進行慎重的氨基酸替代。例如,帶負電的氨基酸包括天冬氨酸和谷氨酸;帶正電的氨基酸包括賴氨酸和精氨酸;而不帶電的極性頭部基團具有相似親水性數(shù)值的氨基酸包括亮氨酸、異亮氨酸、纈氨酸;甘氨酸、丙氨酸;天冬酰胺、谷氨酰胺;絲氨酸、蘇氨酸、苯丙氨酸、和酪氨酸。
在有些實施方案中,本發(fā)明的克勞氏芽孢桿菌分泌因子多核苷酸進行了改造以更改基因產(chǎn)物的克隆、加工和/或表達。例如,可以使用本領域眾所周知的技術來導入突變(如通過定點誘變來插入新的限制位點、改變糖基化模式、和/或改變密碼子偏愛)。
芽孢桿菌宿主細胞的轉化在本發(fā)明的有些實施方案中,通過能夠在宿主細胞內(nèi)復制的表達載體將編碼至少一種目的多肽的核酸導入宿主細胞。適用于芽孢桿菌的復制和整合質(zhì)粒在本領域是已知的(參閱如Harwood和Cutting編《Molecular Biological Methods for Bacillus》,John Wiley & Sons,1990,特別是第3章;適用于枯草芽孢桿菌的復制質(zhì)粒,包括第92頁所列)。雖然存在技術障礙,本領域技術人員知道有幾種策略可用于在芽孢桿菌中直接克隆DNA。
本領域知道的用于轉化芽孢桿菌的方法包括諸如質(zhì)粒標記挽救轉化等方法,涉及由攜帶部分同源駐留型質(zhì)粒的感受態(tài)細胞攝取供體質(zhì)粒(Contente等人,Plasmid,2555-571,1979;Haima等人,Mol.Gen.Genet.,223185-191,1990;Weinrauch等人,J.Bacteriol.,1541077-1087,1983;和Weinrauch等人,J.Bacteriol.,1691205-1211,1987)。在該方法中,在模擬染色體轉化的過程中,導入的供體質(zhì)粒與駐留型“輔助”質(zhì)粒的同源區(qū)進行重組。
本領域還知道涉及通過原生質(zhì)體轉化進行轉化的另一種方法(關于枯草芽孢桿菌參閱Chang和Cohen,Mol.Gen.Genet.,168111-115,1979;關于巨大芽孢桿菌參閱Vorobjeva等人,F(xiàn)EMS Microbiol.Lett.,7261-263,1980;關于解淀粉芽孢桿菌參閱Smith等人,Appl.Env.Microbiol.,51634,1986;關于蘇云金芽孢桿菌參閱Fisher等人,Arch.Microbiol.,139213-217,1981;關于球形芽孢桿菌(Bacillussphaericus)參閱McDonald,J.Gen.Microbiol.,130203,1984;而關于幼蟲芽孢桿菌(Bacillus larvae)參閱Bakhiet等人,49577,1985)。另外,Mann等人(Mann等人,Curr.Microbiol.,13131-135,1986)描述了芽孢桿菌原生質(zhì)體的轉化,而Holubova(Holubova,Microbiol.,3097,1985)描述了使用含DNA的脂質(zhì)體將DNA導入原生質(zhì)體的方法。在有些優(yōu)選實施方案中,使用標記基因來指示宿主細胞中是否存在目的基因。
除了這些方法,在其它實施方案中,直接轉化宿主細胞。在“直接轉化”中,在將DNA構建物導入宿主(即芽孢桿菌)細胞前,不使用中間細胞對DNA構建物進行擴增或其它處理。將DNA構建物導入宿主細胞包括本領域知道的將DNA導入宿主細胞而無需插入質(zhì)粒或載體的那些物理和化學方法。這些方法包括但不限于使用感受態(tài)細胞以及使用“人工手段”諸如氯化鈣沉淀、電穿孔、等等來將DNA導入細胞。因此,本發(fā)明可用于裸露DNA、脂質(zhì)體、諸如此類。在其它實施方案中,DNA構建物與質(zhì)粒共轉化而無需插入質(zhì)粒。
載體/質(zhì)粒為了在細胞中表達、生成和/或分泌目的蛋白,在適合于蛋白質(zhì)表達的條件下,將包含至少一個拷貝(優(yōu)選多個拷貝)的編碼異源和/或同源蛋白質(zhì)的核酸的表達載體轉化到細胞中。在有些特別優(yōu)選的實施方案中,將編碼目的蛋白的序列(以及載體中包含的其它序列)整合到宿主細胞基因組中;而在其它實施方案中,質(zhì)粒在細胞內(nèi)保持自主染色體外元件。因此,本發(fā)明既提供了染色體外元件又提供了整合到宿主細胞基因組中的導入序列。
在本發(fā)明的有些實施方案中,在與目的蛋白相同的載體上將本發(fā)明的任何一種或多種分泌因子導入宿主細胞。或者,在其它實施方案中,在分開的載體上將本發(fā)明的任何一種或多種分泌因子導入宿主細胞。在分泌因子位于分開載體上的有些實施方案中,與包含目的蛋白的載體同時將載體用于轉化宿主細胞。在候選實施方案中,順序(即先用一種載體然后用第二種載體)轉化宿主細胞。
在優(yōu)選實施方案中,用于在革蘭氏陽性微生物中表達本發(fā)明分泌因子的表達載體包含至少一種與革蘭氏陽性分泌因子相關的啟動子,該啟動子在宿主細胞中有功能。在本發(fā)明的一個實施方案中,啟動子對于所選擇分泌因子是野生型啟動子;而在本發(fā)明的另一個實施方案中,啟動子與分泌因子是異源的,但在宿主細胞中仍有功能。
與通過重組DNA方法導入的編碼期望蛋白質(zhì)或多肽的異源核酸相關的其它啟動子也可用于本發(fā)明。在本發(fā)明的一個實施方案中,宿主細胞能夠過度表達異源蛋白或多肽,而包含一種或多種分泌因子的核酸是重組導入的。在本發(fā)明的一個優(yōu)選實施方案中,將編碼克勞氏芽孢桿菌分泌相關蛋白的核酸穩(wěn)定整合到微生物基因組中。在另一個實施方案中,宿主細胞經(jīng)改造過度表達本發(fā)明的分泌因子,而編碼異源蛋白或多肽的核酸是通過重組DNA技術導入的。本發(fā)明涵蓋能夠過度表達本領域技術人員知道的其它分泌因子和/或本領域技術人員知道的或?qū)頃b定的其它分泌因子的革蘭氏陽性宿主細胞。
在一個優(yōu)選實施方案中,表達載體包含多克隆位點盒,優(yōu)選包含至少一個對載體而言獨特的限制性內(nèi)切核酸酶位點,以便于容易操作核酸。在一個優(yōu)選實施方案中,載體還包含一種或多種可選擇標記(如抗菌劑標記諸如紅霉素、放線菌素、氯霉素、和四環(huán)素)。在另一個實施方案中,使用本領域已知技術將多拷貝復制性質(zhì)粒用于將質(zhì)粒整合到芽孢桿菌基因組DNA中。
培養(yǎng)宿主細胞用于轉化子的表達和鑒定盡管標記基因表達的存在/缺乏指示目的基因也存在,還是應當確認其存在和表達情況。例如,在編碼分泌相關蛋白的核酸插入標記基因序列之內(nèi)的有些實施方案中,通過標記基因功能的缺乏來鑒定包含插入片段的重組細胞。或者,可以將標記基因與編碼分泌因子的核酸串聯(lián)安置且處于單一啟動子的控制之下。標記基因應答誘導或選擇的表達常常也指示分泌因子的表達。
或者,可以通過本領域技術人員知道的多種方法來鑒定包含分泌因子的編碼序列和/或表達目的蛋白的宿主細胞。這些方法包括但不限于DNA-DNA或DNA-RNA雜交以及蛋白質(zhì)生物測定法或免疫鑒定技術,包括用于檢測和/或定量核酸或蛋白質(zhì)的基于膜、基于溶液、或基于芯片的技術。
可以通過DNA-DNA或DNA-RNA雜交或使用由編碼任何一種分泌相關蛋白的克勞氏芽孢桿菌多核苷酸衍生的探針、部分或片段的擴增來檢測分泌相關蛋白多核苷酸序列的存在。
測量基因產(chǎn)物本領域技術人員知道多種測定法可用于檢測和測量分泌性多肽的活性。具體而言,對于蛋白酶而言有通過280nm吸光度測量或使用Folin法(參閱Bergmeyer等人,《Methods of Enzymatic Analysis》,第5卷,“Peptidases,Proteinases and their Inhibitors”,Verlag Chemie,Weinheim,1984)比色測量的基于由酪蛋白或血紅蛋白釋放的酸溶性肽的測定法。本領域知道的其它測定法包括呈色底物的增溶(Ward,在Fogarty編的《Microbial Enzymes and Biotechnology》中,AppliedScience,倫敦,1983,第251-317頁)。
用于測定宿主細胞中異源或同源蛋白質(zhì)分泌水平和檢測所分泌蛋白質(zhì)的方法包括使用對蛋白質(zhì)特異的多克隆或單克隆抗體的方法。實例包括酶聯(lián)免疫吸附測定法(ELISA)、放射免疫測定法(RIA)、熒光免疫測定法(FIA)、和熒光激活細胞分揀法(FACS)。這些和其它測定法在本領域是眾所周知的(參閱如Maddox等人,J.Exp.Med.,1581211,1983)。在本發(fā)明的一個優(yōu)選實施方案中,使用本文提供的方法和組合物引起的分泌高于使用相同方法和組合物但未導入肽轉運蛋白或肽轉運操縱子基因產(chǎn)物的情況。
蛋白質(zhì)純化在優(yōu)選實施方案中,在適合于表達和由細胞培養(yǎng)液回收所編碼蛋白質(zhì)的條件下,培養(yǎng)經(jīng)編碼異源或同源蛋白質(zhì)的多核苷酸序列轉化或者內(nèi)源具有所述蛋白質(zhì)的細胞。在有些實施方案中,其它重組構建物可以將異源或同源多核苷酸序列連接至編碼便于純化可溶性蛋白質(zhì)的多肽結構域的核苷酸序列(如多種標簽)上(Kroll等人,DNA Cell.Biol.,12441-53,1993)。
這些促進純化的結構域包括但不限于金屬螯合肽諸如容許在固定金屬上純化的組氨酸-色氨酸模塊(Porath,Prot.Expr.Purif.,3263-281,1992)、容許在固定免疫球蛋白上純化的蛋白A結構域、和FLAGS延伸/親和純化系統(tǒng)中利用的結構域(Immunex公司,西雅圖,華盛頓州)。在純化結構域與異源蛋白之間包含可切割接頭序列諸如因子XA或腸激酶(Invitrogen,圣迭戈,加利福尼亞州)可用于促進純化。
綜上所述,顯然本發(fā)明提供了經(jīng)遺傳改造而在至少一個編碼分泌相關蛋白的基因中包含優(yōu)選的不可逆突變(包括基因取代)的革蘭氏陽性宿主微生物。在有些實施方案中,宿主微生物包含額外的蛋白酶刪除,諸如成熟枯草桿菌蛋白酶和/或成熟中性蛋白酶的刪除(參閱如美國專利號5,264,366)。在有些優(yōu)選實施方案中,微生物還經(jīng)遺傳改造而生成期望蛋白或多肽。在一個優(yōu)選實施方案中,革蘭氏陽性微生物是芽孢桿菌屬的成員。
本文收入上文說明書提及的所有發(fā)表物和專利作為參考。對于本領域熟練技術人員顯而易見的是,可以對本發(fā)明所述方法和系統(tǒng)進行多種修改和更改而不偏離本發(fā)明的范圍和精神。盡管已經(jīng)參照具體的優(yōu)選實施方案而描述本發(fā)明,應當理解的是本發(fā)明不應當過度限于這些具體實施方案。事實上,對于本領域和/或相關領域熟練技術人員顯而易見的是,意欲將對用于執(zhí)行本發(fā)明的所述模式進行的多種修改歸于本發(fā)明的范圍之內(nèi)。
權利要求
1.包含克勞氏芽孢桿菌(Bacillus clausii)分泌因子的核苷酸序列,其中所述分泌因子選自下組SecA、SecD、SecE、SecF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV和SipW。
2.權利要求1的核苷酸序列,其中所述核苷酸序列選自下組SEQID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO8、SEQ ID NO6、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26和SEQ ID NO28。
3.在低嚴謹度、中嚴謹度和高嚴謹度的嚴謹度條件下保持與權利要求2的核苷酸序列雜交的可雜交核苷酸序列。
4.包含權利要求2的核苷酸序列的至少一部分的載體。
5.權利要求4的載體,還包含編碼至少一種目的多肽的核苷酸序列。
6.包含權利要求4的載體的表達盒。
7.包含權利要求5的載體的表達盒。
8.包含權利要求7的表達盒的芽孢桿菌屬的宿主細胞。
9.包含權利要求8的表達盒的芽孢桿菌屬的宿主細胞。
10.權利要求9的宿主細胞,其中所述細胞分泌至少一種選自下組的克勞氏芽孢桿菌分泌因子SecA、SecD、SecE、SecF、SecG、SecY、Ffh、FtsY、SipS、SipT、SipV和SipW。
11.權利要求10的分泌因子,其中所述分泌因子包含選自下組的氨基酸序列SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25和SEQ ID NO27。
12.權利要求11的分泌因子,其中所述氨基酸包含選自下組的氨基酸序列的片段SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25和SEQ ID NO27。
13.權利要求11的分泌因子,其中所述氨基酸包含選自下組的氨基酸序列的變體SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO7、SEQ ID NO5、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25和SEQ ID NO27。
14.包含克勞氏芽孢桿菌轉錄因子的核苷酸序列,其中所述轉錄因子選自下組DegS、DegU和Bcl2627。
15.權利要求14的核苷酸序列,其中所述核苷酸序列選自下組SEQ ID NO4、SEQ ID NO30和SEQ ID NO32。
16.在低嚴謹度、中嚴謹度和高嚴謹度的嚴謹度條件下保持與權利要求15的核苷酸序列雜交的可雜交核苷酸序列。
17.包含權利要求15的核苷酸序列的至少一部分的載體。
18.權利要求17的載體,還包含編碼至少一種目的多肽的核苷酸序列。
19.包含權利要求17的載體的表達盒。
20.包含權利要求18的載體的表達盒。
21.包含權利要求20的表達盒的芽孢桿菌屬的宿主細胞。
22.包含權利要求21的表達盒的芽孢桿菌屬的宿主細胞。
23.權利要求22的宿主細胞,其中所述細胞分泌至少一種克勞氏芽孢桿菌轉錄因子。
24.權利要求23的轉錄因子,其中所述轉錄因子包含選自下組的氨基酸序列SEQ ID NO3、SEQ ID NO29和SEQ ID NO31。
25.權利要求24的轉錄因子,其中所述氨基酸包含選自下組的氨基酸序列的片段SEQ ID NO3、SEQ ID NO29和SEQ ID NO31。
26.權利要求24的轉錄因子,其中所述氨基酸包含選自下組的氨基酸序列的變體SEQ ID NO3、SEQ ID NO29和SEQ ID NO31。
27.包含克勞氏芽孢桿菌芽孢形成因子SpoIIE蛋白質(zhì)的核苷酸序列。
28.權利要求27的核苷酸序列,其中所述序列包含SEQ ID NO2。
29.在低嚴謹度、中嚴謹度和高嚴謹度的嚴謹度條件下保持與權利要求28的核苷酸序列雜交的核苷酸序列。
30.包含權利要求28的核苷酸序列的至少一部分的載體。
31.權利要求30的載體,還包含編碼至少一種目的多肽的核苷酸序列。
32.包含權利要求30的載體的表達盒。
33.包含權利要求31的載體的表達盒。
34.包含權利要求32的表達盒的芽孢桿菌屬的宿主細胞。
35.包含權利要求33的表達盒的芽孢桿菌屬的宿主細胞。
36.權利要求35的宿主細胞,其中所述細胞分泌至少一種克勞氏芽孢桿菌芽孢形成因子。
37.權利要求36的芽孢形成因子,其中所述芽孢形成因子包含氨基酸序列SEQ ID NO1。
38.權利要求37的芽孢形成因子,其中所述氨基酸包含SEQ IDNO1所示氨基酸序列的片段。
39.權利要求37的芽孢形成因子,其中所述氨基酸包含SEQ IDNO1所示氨基酸序列的變體。
40.用于生成目的蛋白的方法,包括下列步驟(a)在適當條件下培養(yǎng)芽孢桿菌宿主細胞,其中所述芽孢桿菌宿主細胞包含編碼目的蛋白的核苷酸序列,且其中所述宿主細胞已經(jīng)用核苷酸序列進行了轉化,所述核苷酸序列編碼包含選自下組的氨基酸序列的蛋白質(zhì)SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31;和(b)容許所述目的蛋白表達。
41.權利要求40的方法,其中所述氨基酸序列與具有選自下組的氨基酸序列的蛋白質(zhì)的序列至少85%相同SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31。
42.權利要求41的方法,其中所述氨基酸序列包含選自下組的氨基酸序列的變體氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31。
43.權利要求41的方法,其中所述氨基酸序列包含選自下組的氨基酸序列的片段氨基酸序列SEQ ID NO1、3、5、7、9、11、13、15、17、19、21、23、25、27、29和31。
44.權利要求41的方法,其中所述氨基酸序列包含雜合克勞氏芽孢桿菌序列。
全文摘要
本發(fā)明涉及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明涉及具有外源核酸序列導入其中的革蘭氏陽性微生物,以及用于在這些宿主細胞中生成蛋白質(zhì)的方法,諸如芽孢桿菌屬的成員。更具體的說,本發(fā)明涉及目的多肽的表達、生成和分泌,以及經(jīng)遺傳操作而生成所表達蛋白質(zhì)的能力得到改變的細胞。具體而言,本發(fā)明提供了微生物對所選擇多肽的增強表達。
文檔編號C12Q1/68GK1639183SQ03804758
公開日2005年7月13日 申請日期2003年2月6日 優(yōu)先權日2002年2月8日
發(fā)明者E·福拉里, A·范基姆內(nèi)德 申請人:金克克國際有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1