專利名稱:人的乳鐵蛋基因全序列及其調(diào)控元件的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及DNA重組技術(shù)領(lǐng)域,具體地說涉及乳鐵蛋白表達(dá)的調(diào)控,將通過不同表達(dá)水平的物種間的序列進(jìn)行比較對(duì)乳蛋白基因的表達(dá)調(diào)控進(jìn)行研究,為乳蛋白基因乃至真核生物基因的表達(dá)調(diào)控提供一個(gè)很好的實(shí)驗(yàn)素材,同時(shí)也為轉(zhuǎn)基因動(dòng)物的制作、基因治療以及DNA疫苗的研制準(zhǔn)備一個(gè)更為有效的表達(dá)調(diào)控元件。
乳鐵蛋白(lactoferrin,Lf)是轉(zhuǎn)鐵蛋白基因家族非血紅素類鐵合糖蛋白的一員。主要存在于哺乳動(dòng)物乳汁及嗜中性白細(xì)胞的二級(jí)顆粒中,具有廣泛的生物學(xué)功能。乳鐵蛋白在嬰兒鐵代謝,抗微生物,調(diào)節(jié)炎癥反應(yīng),抗腫瘤,以及調(diào)節(jié)基因表達(dá)等方面發(fā)揮著重要的作用。
另外,乳鐵蛋白具有著廣泛的生物學(xué)活性,其主要表現(xiàn)在(1)促進(jìn)嬰兒的鐵吸收(2)廣譜抗微生物作用它對(duì)病原性的細(xì)菌,真菌,原生動(dòng)物,病毒均有殺傷作用(3)通過多種途徑調(diào)節(jié)炎癥反應(yīng)調(diào)節(jié)補(bǔ)體激活途徑;限制活性氧自由基的產(chǎn)生,并進(jìn)一步抑制了活性氧自由基對(duì)細(xì)胞的損害,阻止細(xì)胞膜脂類的過氧化;快速動(dòng)員多形核單核細(xì)胞遷移至炎癥部位;影響多種細(xì)胞因子的產(chǎn)生,如IL-1,IL-6和TNF-α,IL-1,GM-CSF,IL-8,這些細(xì)胞因子在炎癥反應(yīng)中發(fā)揮著極重要的作用;此外乳鐵蛋白可以與脂多糖結(jié)合,起到調(diào)節(jié)炎癥反應(yīng)的作用。
(4)其它作用在患有帕金森氏綜合癥鼠的腦中,檢測(cè)到乳鐵蛋白的增強(qiáng)表達(dá),說明乳鐵蛋白在機(jī)體防御帕金森氏綜合癥中發(fā)揮一定的作用(Fillebeen et al.,1999)。此外在多自身免疫疾病病人身上檢測(cè)了乳鐵蛋白的抗體,如類風(fēng)濕性關(guān)節(jié)炎、脈管炎、系統(tǒng)性狼瘡、初級(jí)硬化脈管炎,說明乳鐵蛋白在這些疾病的治療和診斷中具有一定的作用。最近,有人還發(fā)現(xiàn)乳鐵蛋白可以抑制腫瘤細(xì)胞的生長(zhǎng)和轉(zhuǎn)移(Lonnerdal et al.,1995)。最令人驚奇的是,1995年J.He等發(fā)現(xiàn)乳鐵蛋白還可以與DNA結(jié)合,誘導(dǎo)報(bào)告基因的表達(dá)。這暗示乳鐵蛋白可以作為調(diào)節(jié)因子調(diào)節(jié)基因的表達(dá)和細(xì)胞的生長(zhǎng)分化。因此,乳鐵蛋白可以作為營(yíng)養(yǎng)保健品和藥物的成分。
目前人、牛、鼠、豬的乳鐵蛋白基因的cDNA序列均已得到克隆測(cè)序(Powell et al.,1990;Rey et al.,1990;Mead et al.,1990;Wang et al.,1997)。人乳鐵蛋白cDNA序列與牛相比同源性為77%,與小鼠相比同源性為75%,與豬相比同源性為77%,與人轉(zhuǎn)鐵蛋白相比同源性為67%。人乳鐵蛋白基因位于第三號(hào)染色體(3q21-q23),牛Lf基因位于第22號(hào)染色體,小鼠Lf基因位于第9號(hào)染色體(Schwerin etal.,1994)。人乳鐵蛋白基因跨越基因組上約35kb的范圍,牛乳鐵蛋白在基因組上占約34.5kb的區(qū)域。
轉(zhuǎn)鐵蛋白基因家族有著共同的特征基因編碼區(qū)分散于17個(gè)外顯子,基因可被分為兩個(gè)不等的部分,與已知蛋白質(zhì)的結(jié)構(gòu)域一致(即N-端葉片,C-端葉片)。牛乳鐵蛋白基因組基因同樣有17個(gè)外顯子,其基因結(jié)構(gòu)如表1(Seyfert et al.,1994)。包含所有外顯子區(qū)域的序列都已知道。牛乳鐵蛋白基因與轉(zhuǎn)鐵蛋白基因家族的其他成員相比,外顯子的大小相似,但內(nèi)含子的大小差別很大。外顯子6、9、12的大小與轉(zhuǎn)鐵蛋白基因家族所有成員的情況相同,它與小鼠乳鐵蛋白基因結(jié)構(gòu)相比,有7個(gè)外顯子大小相同。其mRNA的5′,3′非翻譯區(qū)由兩端的外顯子編碼。第一個(gè)外顯子編碼含19個(gè)氨基酸殘基的前導(dǎo)肽的前14個(gè)氨基酸。外顯子2~4和9~12編碼每“葉”的第一個(gè)球狀域,外顯子4~7和12~15編碼第二個(gè)球狀域,外顯子9的起始處編碼鉸鏈區(qū)的11個(gè)氨基酸殘基。這些外顯子的大小和編碼區(qū)域的保守性進(jìn)一步證明了乳鐵蛋白是通過內(nèi)部的序列復(fù)制產(chǎn)生的。 目前已知人的乳鐵蛋白基因組基因3′端22kb序列,其中包括7-17外顯子(Genebank,U95626)。5′端的部分序列也已知。在已知序列中,除第2、11、14、15、17外顯子外,所有外顯子的大小均與牛乳鐵蛋白基因的外顯子大小相同。但內(nèi)含子大小差異很大。本實(shí)驗(yàn)室陳怡真同學(xué)也已得到了含有乳鐵蛋白全基因5’端啟動(dòng)區(qū)序列15kb的亞克隆,并進(jìn)行了部分測(cè)序工作(陳怡真,1998)。啟動(dòng)子序列相比較,牛乳鐵蛋白與人序列的同源性要高于人和小鼠的同源性。
乳鐵蛋白作為一種上皮細(xì)胞分泌的廣泛存在的免疫蛋白和乳蛋白,其表達(dá)調(diào)控是一個(gè)很復(fù)雜的過程,對(duì)該基因的表達(dá)調(diào)控機(jī)制的了解也處于灰箱狀態(tài)。
乳鐵蛋白在小鼠子宮的表達(dá)受雌激素的誘導(dǎo),在乳腺的表達(dá)則更大程度上受催乳素的影響。泌乳時(shí),乳腺乳鐵蛋白mRNA、乳鐵蛋白量與循環(huán)中雌激素水平不相關(guān);在妊娠中期,移植的小鼠乳腺乳鐵蛋白的分泌受到催乳素的刺激(Teng et al.,1989)。在小鼠的胚胎發(fā)育過程中,在2-4細(xì)胞期時(shí)可檢測(cè)到乳鐵蛋白的表達(dá),16細(xì)胞期后,乳鐵蛋白mRNA由內(nèi)細(xì)胞合成,然后被外細(xì)胞選擇性地吸收。在囊胚期時(shí)乳鐵蛋白不再表達(dá)。在懷孕期的后半程,即小鼠胚胎11.5天后,可以在中性粒細(xì)胞和呼吸、消化系統(tǒng)的上皮細(xì)胞中檢測(cè)到乳鐵蛋白。懷孕早期母體子宮內(nèi)膜的乳鐵蛋白表達(dá)與胚胎中乳鐵蛋白的表達(dá)有很大的一致性,可能是由母體的雌激素和孕激素調(diào)節(jié)的(Ward et al.,1998)。
乳鐵蛋白在乳腺中的表達(dá)調(diào)控應(yīng)與乳蛋白的調(diào)控機(jī)制有關(guān)。但遺憾的是目前對(duì)乳鐵蛋白表達(dá)調(diào)控的研究主要集中在乳鐵蛋白在血細(xì)胞及子宮細(xì)胞中的表達(dá),也有一些研究者報(bào)道了在其它組織中乳鐵蛋白的表達(dá)調(diào)控情況。但在乳腺中各種因子是如何起作用的及蛋白-DNA的互作機(jī)制目前仍不清楚。
人、鼠、牛和豬的乳鐵蛋白基因的啟動(dòng)子均已得到克隆和測(cè)序,并對(duì)其轉(zhuǎn)錄調(diào)節(jié)作用進(jìn)行了深入的研究。下面對(duì)分別這幾個(gè)物種乳鐵蛋白基因的研究情況進(jìn)行介紹。C.Teng等人對(duì)小鼠的乳鐵蛋白基因進(jìn)行了深入的研究。他們分離了小鼠的乳鐵蛋白基因啟動(dòng)子,發(fā)現(xiàn)啟動(dòng)子區(qū)包括1個(gè)TATA框,2個(gè)CAAT框,3個(gè)GC框,1個(gè)AP2位點(diǎn),7個(gè)PU框,1個(gè)B1系列(Liu et al.,1991)。進(jìn)一步的深入研究發(fā)現(xiàn)了多個(gè)調(diào)控序列(Teng,1999)。包括一雌激素應(yīng)答元件(estrogenresponse element,ERE)這一元件與另一種已知的轉(zhuǎn)錄調(diào)節(jié)元件—雞乳清蛋白上游啟動(dòng)子(chicken ovalbumin upstream promoter,COUP)相重疊。最近還發(fā)現(xiàn)視黃酸也能誘導(dǎo)乳鐵蛋白的表達(dá)(Geng etal.,1998)。其應(yīng)答元件(retinoic acid response element,RERE)與ERE相重疊。除ERE外,在小鼠的乳鐵蛋白基因啟動(dòng)子上還發(fā)現(xiàn)有一個(gè)上皮生長(zhǎng)因子應(yīng)答元件(epithelial growth factor response element,EGFRE)。它包括一個(gè)CAAT/GT框和一個(gè)cAMP應(yīng)答元件(cAMPresponse element,CRE)。最近在小鼠中還發(fā)現(xiàn)髓樣細(xì)胞的轉(zhuǎn)錄因子C/EBP∈(CCAAT enhancer binding protein)是乳鐵蛋白基因轉(zhuǎn)錄的正向調(diào)節(jié)因子,與鼠的EGFRE相重疊(Verbeek et al.,1999)。此外,在-103/-81處還有一個(gè)富含GC序列,其中包含一個(gè)CAAT/GT框,是乳鐵蛋白基因表達(dá)的抑制子。很多報(bào)道指出甲基化程度也影響基因的表達(dá)。
1992年,J.J.Johnston等克隆了人乳鐵蛋白基因的啟動(dòng)子,發(fā)現(xiàn)TATA元件位于-30處,CCAAT元件位于-59處,一個(gè)CACCC元件位于-68,Sp1結(jié)合位點(diǎn)在-24處,一個(gè)與急性反應(yīng)有關(guān)的六聚體,CTGGGA位于-280處,GATA-1結(jié)合位點(diǎn)位于-367,ERE位于-350,鼠-103/-81處的富含GC的抑制子序列位于-84。最近Nancy Berliner等人發(fā)現(xiàn)人乳鐵蛋白-858/-810處有一個(gè)CCAAT替代蛋白(CCAATdisplacement protein,CDP)結(jié)合位點(diǎn)(Khanna-Gupta et al.,1997)。在非乳鐵蛋白表達(dá)的細(xì)胞中CDP與其識(shí)別并結(jié)合,從而抑制了乳鐵蛋白基因的轉(zhuǎn)錄;在乳鐵蛋白表達(dá)的細(xì)胞中,則不與其結(jié)合。這一沉寂元件包括3個(gè)8bp的重復(fù),其序列如下ATGTATTTACGAGATGTATTCTAGAAGCAGTATTCTAGCTTTTGAATTTTAAAA這一區(qū)域與小鼠乳鐵蛋白基因啟動(dòng)子的同源性為82.5%,而從-950至轉(zhuǎn)錄起始位點(diǎn)的同源性為40%。
Seyfert等人于1994年對(duì)牛乳鐵蛋白編碼區(qū)基因和啟動(dòng)子進(jìn)行了測(cè)序。分析發(fā)現(xiàn),牛乳鐵蛋白啟動(dòng)區(qū)有3個(gè)潛在的CAAT框(-967,-910,-713),3個(gè)Sp1結(jié)合位點(diǎn)(CCGCCC)分別位于-196,-63和+95。與鼠乳鐵蛋白啟動(dòng)子的潛在的Sp1識(shí)別位點(diǎn)相似。在牛乳鐵蛋白基因啟動(dòng)子內(nèi)部沒有找到GATA-1,Oct-1,COUP,AP-2,糖皮質(zhì)激素應(yīng)答元件和急相應(yīng)答元件,也沒有發(fā)現(xiàn)乳腺特異性轉(zhuǎn)錄因子MGF/STAT5(mammary-gland-specific transcription factor)的識(shí)別位點(diǎn)。與人啟動(dòng)區(qū)序列比較,同源性大于80%的10bp以上片段有10個(gè)。
1998年,Shih-Rong Wang等人克隆并分析了豬乳鐵蛋白基因啟動(dòng)區(qū)。-156至轉(zhuǎn)錄起始位點(diǎn)對(duì)于基本的啟動(dòng)子活性已經(jīng)足夠了,但是要得到最大的轉(zhuǎn)錄活性則需要上游-780bp的序列。DNase I步跡和EMSA揭示了Sp1,AP2和MGF的結(jié)合位點(diǎn)。-130至-10序列與牛、鼠、人的同源性為65%。MGF或STAT5結(jié)合位點(diǎn)(TTCCTGGAA)位于-738/-730,一個(gè)1/2ERE(GGTCA)位于-43。此外,GATA-1,GATA-2及髓細(xì)胞鋅指蛋白(MZF1)結(jié)合位點(diǎn)也被發(fā)現(xiàn),揭示這些因子有可能調(diào)節(jié)豬乳鐵蛋白基因的轉(zhuǎn)錄活性。
關(guān)于乳鐵蛋白基因在翻譯水平上調(diào)控的機(jī)制報(bào)道很少。Goodman等對(duì)人和牛的mRNA進(jìn)行了分析。人乳鐵蛋白mRNA結(jié)構(gòu)與牛相比,在mRNA翻譯起始區(qū)附近,形成2個(gè)小的莖環(huán)結(jié)構(gòu)。牛mRNA在同一區(qū)域可形成強(qiáng)烈的二級(jí)結(jié)構(gòu)一個(gè)包含了翻譯起點(diǎn)和5′端的長(zhǎng)莖結(jié)構(gòu)。這個(gè)二級(jí)結(jié)構(gòu)可阻遏翻譯。相比之下,人乳鐵蛋白mRNA可阻遏翻譯的程度則弱。這可能就是兩個(gè)物種乳鐵蛋白表達(dá)差異的原因之一。另外,在翻譯起始共有序列比較中發(fā)現(xiàn),牛乳鐵蛋白mRNA在翻譯起始點(diǎn)AUG的上游-3處為C,與其它奶蛋白mRNA不同。由于在-3處有嘌呤存在,對(duì)有效俘獲核糖體很重要。這可能也是牛乳鐵蛋白表達(dá)量低的另一表現(xiàn)(Schanbacher et al.,1992)。
動(dòng)物生物反應(yīng)器是目前世界范圍內(nèi)轉(zhuǎn)基因研究的熱點(diǎn)之一,不僅各國(guó)政府投資,一些私人財(cái)團(tuán)也不惜投入大量資金加以研究和開發(fā)。
用相似的轉(zhuǎn)基因動(dòng)物制作程序,從動(dòng)物身上獲取外源藥用蛋白質(zhì)最可能的途徑有幾條,主要有血漿、精液和乳汁。從轉(zhuǎn)基因動(dòng)物血漿中提取重組蛋白質(zhì),這是一種可行的辦法,采血不需要?dú)⑺绖?dòng)物,這一方法的缺點(diǎn)一方面是采血量受到限制,另一方面一些具有生物活性的蛋白質(zhì)分泌進(jìn)血漿對(duì)動(dòng)物健康有一定的影響。而精液中表達(dá)外源基因經(jīng)常會(huì)給轉(zhuǎn)基因動(dòng)物的育性帶來不良影響。相比之下,泌乳是動(dòng)物的一種生理活動(dòng),對(duì)動(dòng)物健康沒有影響,加之乳腺攝取、合成、分泌蛋白質(zhì)的能力很強(qiáng),并且能對(duì)重組蛋白質(zhì)進(jìn)行多種翻譯后加工,包括β-羥基化,糖基化,γ羥基化等,同時(shí)能將重組蛋白質(zhì)折疊成有功能的構(gòu)象。因此乳腺成為公認(rèn)的生產(chǎn)重組蛋白質(zhì)的理想器官。應(yīng)用乳腺生產(chǎn)重組蛋白質(zhì),一般要求所使用的表達(dá)載體的啟動(dòng)子具有表達(dá)上的組織和器官以及發(fā)育時(shí)期的特異性。目前已有多種具有生物活性的人類蛋白質(zhì)可以從轉(zhuǎn)基因動(dòng)物的乳汁中獲得,這些動(dòng)物包括小鼠,大鼠,兔、豬、綿羊、山羊等,獲取的重組蛋白包括tPA,α1-AT,蛋白C,hSA,bGH,hAFP,LAtPA等,構(gòu)建乳腺特異性表達(dá)載體使用較多的啟動(dòng)子有牛、綿羊、山羊的珠蛋白上游調(diào)空區(qū),牛β-乳球蛋白基因啟動(dòng)子(bBLG),綿羊β-乳球蛋白基因啟動(dòng)子(oBLG),小鼠乳清酸性蛋白啟動(dòng)子(mWAP),大鼠乳清酸性蛋白啟動(dòng)子(rWAP)以及兔乳清酸性蛋白啟動(dòng)子(rWAP)。比較上述幾種上游調(diào)空區(qū),其特點(diǎn)為β-珠蛋白基因啟動(dòng)子驅(qū)動(dòng)下游基因的表達(dá)與轉(zhuǎn)基因插入位點(diǎn)無關(guān)、表達(dá)水平與整合的拷貝數(shù)正相關(guān),但其調(diào)控的表達(dá)特異性地發(fā)生在紅細(xì)胞內(nèi);bBLG、oBLG具有較強(qiáng)的驅(qū)動(dòng)下游基因表達(dá)的能力,所驅(qū)動(dòng)的表達(dá)似乎也不表現(xiàn)位置效應(yīng);小鼠、大鼠以及兔WAP基因具有很強(qiáng)的驅(qū)動(dòng)下游基因表達(dá)的能力,每ml乳汁中的表達(dá)量可達(dá)數(shù)mg甚至十多mg,但其缺點(diǎn)是表達(dá)的特異性較差,除了乳汁外,血液中也有相當(dāng)水平的表達(dá),對(duì)動(dòng)物可能會(huì)有某些不良的影響。轉(zhuǎn)基因動(dòng)物研究同時(shí)還存在著一個(gè)及其令人頭痛的問題就是大部分轉(zhuǎn)基因表達(dá)水平極低,而極少部分轉(zhuǎn)基因表達(dá)水平過高。由于位置效應(yīng)的影響,大部分轉(zhuǎn)基因(尤其是cDNA)表達(dá)水平低得難以檢測(cè),而個(gè)別轉(zhuǎn)基因的表達(dá)水平又太高。如Wright等(1991)制作的轉(zhuǎn)hα1AT基因綿羊,其中一只轉(zhuǎn)基因羊在產(chǎn)羔后泌乳時(shí),乳汁中hα1AT的水平高達(dá)60g/L,泌乳中期乳汁的hα1AT水平仍維持在35g/L,外源基因的這種高水平表達(dá)是宿主動(dòng)物難以承受的。
因此對(duì)乳蛋白基因的表達(dá)調(diào)控進(jìn)行廣泛深入的研究是非常必要的。對(duì)基因表達(dá)調(diào)控的研究方法很多,其中之一就是對(duì)具有不同表達(dá)效率的物種的基因表達(dá)的調(diào)控區(qū)成分進(jìn)行對(duì)比分析,從中獲取有用的信息。乳鐵蛋白在不同物種的乳腺中表達(dá)水平差異很大,人乳腺中表達(dá)量最高(3-10mg/ml),牛乳腺中表達(dá)較少(100ug/ml)。大鼠的乳中基本檢測(cè)不到乳鐵蛋白的存在。一般來說,乳中高乳鐵蛋白成分的物種轉(zhuǎn)鐵蛋白含量少,而乳中轉(zhuǎn)鐵蛋白含量高的物種則乳鐵蛋白含量少。但也有例外,如狗的乳中兩種蛋白含量都較低,而小鼠中兩種蛋白的含量都很高(Lonnerdal et al.,1995)。因?yàn)榇蠖鄶?shù)奶蛋白的乳腺特異性表達(dá)均需要基因的遠(yuǎn)上游序列,并且人乳鐵蛋白基因的完整序列并不已知,因此對(duì)乳鐵蛋白轉(zhuǎn)錄起始位點(diǎn)的遠(yuǎn)上游序列及基因組基因序列仍需作進(jìn)一步的研究。并開展對(duì)不同物種的乳鐵蛋白基因調(diào)控區(qū)序列的研究。
本發(fā)明的目的之一是克隆測(cè)定人乳鐵蛋白基因全序列,為實(shí)現(xiàn)通過真核表達(dá)系統(tǒng)生產(chǎn)人乳鐵蛋白等工作提供重要元件,也為與動(dòng)物抗病性能相關(guān)的遺傳標(biāo)記的篩選提供了重要的參考信息。
本發(fā)明的另一個(gè)目的是通過不同表達(dá)水平的物種間的序列進(jìn)行比較對(duì)乳蛋白基因的表達(dá)調(diào)控進(jìn)行更為深入的研究,找出了該全序列上的各個(gè)調(diào)控元件,為乳蛋白基因乃至真核生物基因的表達(dá)調(diào)控提供一個(gè)很好的實(shí)驗(yàn)素材,同時(shí)也為轉(zhuǎn)基因動(dòng)物的制作、基因治療以及DNA疫苗的研制準(zhǔn)備一個(gè)更為有效的表達(dá)調(diào)控元件。
本發(fā)明通過如下所述實(shí)現(xiàn)我們得到了人乳鐵蛋白基因的全長(zhǎng)核苷酸序列。包括轉(zhuǎn)錄起始位點(diǎn)上游9.3kb和外顯子1-17,內(nèi)含子1-16的全部序列(附
圖1)對(duì)啟動(dòng)區(qū)的分析發(fā)現(xiàn)了多個(gè)潛在的與乳蛋白產(chǎn)生有關(guān)的調(diào)控位點(diǎn)。兩個(gè)潛在的糖皮質(zhì)激素應(yīng)答元件,分別位于-7790/-7777,-2068/-2055處;五個(gè)潛在的雌激素應(yīng)答元件位于在-352/-340,-1437/-1425,-1411/-1400,-8216/-8202,-8190/-8176處;九個(gè)潛在的cAMP應(yīng)答元件分別位于-9222/-9209,-9116/-9109,-9045/-9038,-7290/-7183,-3299/-3291,-782/-773,+231/+239,+3937/+3944,+4127/+4134;九個(gè)潛在的STAT結(jié)合位點(diǎn)分別位于-8942/-8934,-7016/-7007,-5404/-5412,-5349/-5341,-4465/-4457,-845/-833,+1211/+1219,+1958/+1966,+1988/+1996。其中除-352/-340處的雌激素應(yīng)答元件外,其它元件為本實(shí)驗(yàn)首次發(fā)現(xiàn)。此外還發(fā)現(xiàn)多個(gè)AP1結(jié)合位點(diǎn)和Sp1結(jié)合位點(diǎn)。在轉(zhuǎn)錄起始位點(diǎn)上游-7650/-7585處還發(fā)現(xiàn)一個(gè)(TC)n(AC)n序列的的微衛(wèi)星,也許可以作為人乳鐵蛋白的一種分子標(biāo)記。1997年D.Paul報(bào)道了一種乳鐵蛋白mRNA的變形,ΔLf mRNA。這種mRNA在正常組織存在,而在腫瘤組織中檢測(cè)不到。其編碼的蛋白質(zhì)缺少信號(hào)肽和成熟蛋白質(zhì)N-端的25個(gè)氨基酸。此種蛋白的缺乏可能是腫瘤產(chǎn)生的原因之一。將此mRNA的序列與所得序列進(jìn)行比較,發(fā)現(xiàn)此序列起始于內(nèi)含子I中,其轉(zhuǎn)錄起始位點(diǎn)位于10599bp處,外顯子I結(jié)束于10759處,大小為160bp。
進(jìn)一步的分析表明,乳鐵蛋白基因轉(zhuǎn)錄起始位點(diǎn)上游的9.3kb有兩個(gè)區(qū)域調(diào)控元件比較集中。一個(gè)區(qū)域?yàn)?1至2.1kb,一個(gè)區(qū)域?yàn)?7.0kb至-9.3kb。第一個(gè)區(qū)域包括三個(gè)雌激素應(yīng)答元件,一個(gè)糖皮質(zhì)激素應(yīng)答元件,一個(gè)cAMP應(yīng)答元件和一個(gè)STAT結(jié)合位點(diǎn)。第二個(gè)區(qū)域包括兩個(gè)雌激素應(yīng)答元件,一個(gè)糖皮質(zhì)激素應(yīng)答元件,四個(gè)cAMP應(yīng)答元件和兩個(gè)STAT結(jié)合位點(diǎn)。這兩個(gè)區(qū)域的調(diào)控元件如此集中,推測(cè)可能是乳鐵蛋白在乳腺中表達(dá)的重要調(diào)控區(qū)域。令人感興趣的是,-1437/-1425和-1411/-1400,-8216/-8202和-8190/-8176處的雌激素應(yīng)答元件距離很近,可認(rèn)為是兩簇雌激素應(yīng)答元件,而每簇500-600bp附近均有一個(gè)糖皮質(zhì)激素應(yīng)答元件。由于乳蛋白的產(chǎn)生需要這兩種激素分泌的同時(shí)增加,因此我們推測(cè)糖皮質(zhì)激素受體和雌激素受體以及雌激素受體之間可能存在相互作用,以共同啟動(dòng)奶蛋白的表達(dá)。在+954/+967處還發(fā)現(xiàn)一個(gè)熱休克應(yīng)答元件(heatshock response element,HRE)。
對(duì)乳鐵蛋白全基因的分析表明人乳鐵蛋白基因外顯子1-17的大小分別為82,167,109,183,148,56,179,175,155,91,54,156,142,68,185,190,230bp。內(nèi)含子1-16的序列也全部獲得,內(nèi)含子剪切都符合GT-AG規(guī)則。可以據(jù)此數(shù)據(jù)構(gòu)建人乳鐵蛋白基因的任意酶切圖譜。
本發(fā)明進(jìn)一步開展的乳蛋白基因表達(dá)調(diào)控的研究提供了很好的實(shí)驗(yàn)素材,其基因的5’調(diào)控區(qū)為轉(zhuǎn)基因動(dòng)物的制作、基因治療以及DNA疫苗的研制提供了一個(gè)很好的表達(dá)調(diào)控元件。
乳鐵蛋白在人體中具有重要作用,可以作為營(yíng)養(yǎng)保健品和藥物的成分。本發(fā)明所克隆測(cè)定的人乳鐵蛋白基因全序列使乳鐵蛋白基因的利用變?yōu)榭赡?,可以?jù)此繪制人乳鐵蛋白基因的任意酶切圖譜,為實(shí)現(xiàn)通過真核表達(dá)系統(tǒng)生產(chǎn)人乳鐵蛋白等工作提供了重要元件。
再有該基因序列也為與動(dòng)物抗病性能相關(guān)的遺傳標(biāo)記的篩選提供了重要的參考信息。
附圖1是人乳鐵蛋白基因序列及分析(tsp代表轉(zhuǎn)錄起始位點(diǎn);潛在的調(diào)控元件及蛋白結(jié)合位點(diǎn)由下劃線標(biāo)出;黑體字為外顯子序列;CRE,ERE,GRE,STAT分別表示cAMP,雌激素,糖皮質(zhì)激素應(yīng)答元件和STAT結(jié)合位點(diǎn))。
附圖2是人乳鐵蛋白基因5’調(diào)控區(qū)的序列分析結(jié)果(CRE,ERE,GRE,STAT分別表示cAMP,雌激素,糖皮質(zhì)激素應(yīng)答元件和STAT結(jié)合位點(diǎn),粗體線表示應(yīng)答元件集中的兩個(gè)區(qū)域)。
實(shí)施例乳鐵蛋白基因組基因序列的測(cè)定一、實(shí)驗(yàn)材料1.1.菌株與載體
pGEM 7zf(+/-)vector Ampr購(gòu)自Promega公司1.2.酶與試劑各種限制性內(nèi)切酶和連接酶分別購(gòu)自華美生物工程公司、Biolab公司、Boeringeman公司和Promega公司。Geneclean II回收試劑盒購(gòu)自Bio101公司。Dye-Primer、BigDye-Terminator測(cè)序試劑盒購(gòu)自Perkin-Elmer公司。引物由上海生工公司合成,所有引物均經(jīng)PAGE純化。其它常規(guī)試劑來自本校物資供應(yīng)科。
1.3.DNA分析軟件同源性分析軟件GENETYX-MAC8.5,DNAMANPCR引物設(shè)計(jì)軟件OLIGO4.0二、實(shí)驗(yàn)方法2.1.緩沖液與常用試劑的配制TE緩沖液10mM Tris·Cl,1mM EDTA,pH8.0,高壓滅菌。
STE緩沖液0.1M NaCl,10mM Tris·Cl,1mMEDTA pH8.0,高壓滅菌。
50X TAE緩沖液Tris堿242g,冰乙酸57.1ml,0.5MEDTA(pH8.0)100ml,加水至1L。
5XTBE緩沖液Tris堿54g,硼酸27.5g,0.5M EDTA(pH8.0)20ml,加水至1L。
1M Tris·Cl121.14g Tris堿溶于800ml雙蒸水中,用鹽酸調(diào)pH值至8.0,定容至1000ml,高壓滅菌。
5M EDTAEDTA 186.1g溶于800ml雙蒸水中,用NaOH調(diào)pH值至8.0,定容至1000ml,高壓滅菌。
氨芐青霉素60mg/ml(溶于水),過濾滅菌,-20℃貯存。
氯霉素50mg/ml(溶于乙醇),-20℃保存。
質(zhì)粒DNA提取溶液I50mM葡萄糖,2.5mM Tris·Cl(pH8.0),10mMEDTA(pH8.0)。
質(zhì)粒DNA提取溶液II0.2M NaOH,1%SDS,現(xiàn)配現(xiàn)用。
質(zhì)粒DNA提取溶液III5M乙酸鉀溶液60ml,冰乙酸11.5ml,滅菌水28.5ml。
3M NaAcNaAc·3H2O 408.1g溶于800ml雙蒸水中,用冰乙酸調(diào)pH至5.2,定容至1000ml,高壓滅菌。
RNAseA溶液100mg/ml溶于10mM Tris·Cl(pH7.5),15mM NaCl中100℃煮沸10分鐘,室溫冷卻后,貯存于-20℃。
X-gal貯存液20mg/ml溶于二甲基甲酰胺中,遮光貯存于-20℃。
IPTG溶液將2g IPTG溶于8ml水中,用水調(diào)節(jié)體積到10ml,過濾除菌。分裝成1ml小份,貯存于-20℃2.2.BAC質(zhì)粒的提取和純化挑單克隆接種于1升含氯霉素(12.5μg/ml)的LB液體培養(yǎng)基中,37℃過夜培養(yǎng)。4000rpm離心15分鐘以收獲菌體。用50毫升TES充分的將細(xì)菌重新懸浮。加入50毫升新鮮配制的溶液II,輕柔但徹底地顛倒混勻。冰上放置5分鐘,混合物應(yīng)變清澈。加入50毫升溶液III,輕柔但徹底地顛倒混勻。冰上放置5分鐘。10000rpm離心20分鐘。上清用濾紙過濾至干凈的管子中。加入等體積的異丙醇,顛倒混勻,10000rpm離心20分鐘。小心去掉上清,加入8毫升70%乙醇,再離心。小心去掉上清,37℃烘干30分鐘。沉淀用1.2毫升TE溶解,加入50μlRNase A(10mg/ml),37℃消化1小時(shí)。酚,酚∶氯仿(1∶1),氯仿各抽提一次。上清加含13%(w/v)PEG8000的1.6mol/L NaCl,充分混合,12000g離心5分鐘,以回收DNA。吸出上清,加500μl TE,過夜溶解DNA沉淀。用酚,酚∶氯仿(1∶1),氯仿各抽提一次。上清加0.1倍體積的3mol/L乙酸鈉,充分混勻,加2倍體積乙醇,于室溫放置10分鐘,于4℃以12000g離心5分鐘,以回收沉淀的DNA。吸去上清,加200μl處于4攝氏度的70%乙醇。稍加振蕩,于4℃以12000g離心5分鐘。吸去上清,于37℃烘干30分鐘,用400μl滅菌水過夜溶解沉淀。
2.3.脈沖凝膠電泳A.電泳條件瓊脂糖凝膠濃度1%; 緩沖液0.5X TBE;起始切換時(shí)間1.0秒; 終止切換時(shí)間12秒;電壓6V/cm; 切換角度120°;循環(huán)水溫度14℃; 電泳時(shí)間14小時(shí)。
B.染色將凝膠浸在含溴化乙錠(0.5μg/ml)的電泳緩沖液或水中,于室溫染色20-30分鐘,在蒸餾水中脫色1-3小時(shí),凝膠成像。
2.4.質(zhì)粒提取與純化(堿裂解法)本章節(jié)的內(nèi)容參見《分子克隆》手冊(cè)。
測(cè)序模板的制備見博大公司質(zhì)粒提取試劑盒說明書進(jìn)行,調(diào)節(jié)DNA濃度至200ng/ul。
2.5.DNA濃度與純度的鑒定取一定量的DNA溶液稀釋至100μl,在260nm和280nm波長(zhǎng)下測(cè)定DNA溶液的OD值,OD260為1相當(dāng)于50ng/ml雙鏈DNA,可根據(jù)OD260/OD280的值估計(jì)核酸的純度,DNA純品的OD260/OD280值為1.8,如果樣品中污染有蛋白質(zhì)或酚,其OD260/OD280將明顯低于此值,此時(shí)無法對(duì)樣品中的DNA進(jìn)行精確定量。
如果樣品DNA含量很低或者含有顯著量雜質(zhì),則可根據(jù)電泳時(shí)樣品中溴化乙錠發(fā)射的熒光強(qiáng)度來估計(jì)DNA的含量。
2.6.DNA片段的回收玻璃奶回收按Bio101公司GeneCleanII試劑盒說明書進(jìn)行。
2.7.感受態(tài)細(xì)胞的制備1.CaCl2法制備大腸桿菌感受態(tài)細(xì)胞見《分子克隆》手冊(cè)2.電擊法轉(zhuǎn)化的感受態(tài)細(xì)胞的制備挑一個(gè)DH10B的單菌落接種于50ml液體LB中,過夜培養(yǎng),1%接種于1升液體LB中,37℃搖菌2~3小時(shí)(OD550在0.6-0.7之間)將細(xì)菌細(xì)胞置于冰上,4000rpm,4℃離心15分鐘,收集菌體,以下均需在冰上操作,用等體積的滅菌的由去離子水配制的10%的甘油徹底洗細(xì)菌沉淀,離心收集,重復(fù)上一步驟一次,加入20-30ml 10%的滅菌甘油洗細(xì)菌沉淀,離心收集,將細(xì)菌重懸于1-2ml 10%的甘油中,取5μl稀釋至1ml,OD550應(yīng)在0.7左右,用冰預(yù)冷的管分裝,每管30μl,-70℃凍存,備用。
2.8.轉(zhuǎn)化1.CaCl2法轉(zhuǎn)化見《分子克隆》手冊(cè)2.電擊法轉(zhuǎn)化電擊轉(zhuǎn)化條件18KV/cm,25μF,200Ω2.9.篩選重組子挑選白斑劃線過夜培養(yǎng),接菌于5ml氨芐青霉素抗性的LB液體培養(yǎng)基中。小規(guī)模提取質(zhì)粒DNA,酶切分析。
2.10.DNA序列的測(cè)定(按PE公司的說明書)A.依據(jù)已有的人乳鐵蛋白基因的序列信息設(shè)計(jì)并合成如下4對(duì)PCR引物引物I 引物II5’-CTG GGA CTA GAG GTG CTT GAC-3’5’-GGC AGA TGG TAG GAG GTA GGA-3’5’-GCA GTG TAG AGT AAG CGT CAG T-3’ 5’-CCT CGT GAC CTG GGA CTC GTG T-3’5’-GCC TGG GCA ACA AAG CGA GAC-3’5’-GCT ATG GCT CCT TCT CTA CTG-3’5’-GAG AAA GAA CAT CGC AGC AG-3’ 5’-AGC AGG ACG AGG AAG ACA AG-3’應(yīng)用PCR篩選人基因組BAC文庫(kù),獲得3個(gè)含有人的乳鐵蛋白基因的BAC克隆,選擇其中一個(gè)進(jìn)行序列測(cè)定。
B.根據(jù)乳鐵蛋白基因結(jié)構(gòu)在物種之間的保守性和人乳鐵蛋白已知的cDNA序列設(shè)計(jì)了如下引物
用PCR方法擴(kuò)增人乳鐵蛋白基因的內(nèi)含子2-16序列并測(cè)序。
C.用酶切的方法對(duì)該BAC克隆進(jìn)行亞克隆及亞克隆的序列測(cè)定首先根據(jù)已知的人乳鐵蛋白cDNA序列設(shè)計(jì)如下引物5’-GAG AAA GAA CAT CGC AGC AG-3’;5’-AGC AGG ACG AGG AAG ACA AG-3’預(yù)計(jì)擴(kuò)增片段為295bp。
用限制性內(nèi)切酶HindIII酶切該BAC克隆,將其分割成若干大小不同的小片段。將所有片段隨機(jī)克隆在3Zf載體上,藍(lán)白篩選。挑出所得白斑,用PCR方法鑒定陽(yáng)性克隆。陽(yáng)性克隆酶切結(jié)果證實(shí)外源插入大小為15kb。對(duì)陽(yáng)性克隆兩端測(cè)序,證實(shí)所得克隆包含人乳鐵蛋白基因5’端遠(yuǎn)上游序列。將此克隆命名為pH55。
用限制性內(nèi)切酶EcoRI酶切pH55的外源片段,將所有片段克隆到載體上。對(duì)比較小的片段可以直接測(cè)序,而對(duì)比較大的片段可以進(jìn)一步用限制性內(nèi)切酶XbaI酶切消化,制備亞克隆后再測(cè)序。對(duì)于一次不能測(cè)通的序列,首先進(jìn)行兩端測(cè)序,再根據(jù)已知序列設(shè)計(jì)引物,用PE公司的BigDye-Terminator測(cè)序試劑盒將其完全測(cè)序。最后根據(jù)這些序列設(shè)計(jì)引物對(duì)pH55直接測(cè)序,以確定各個(gè)片段的方向并補(bǔ)齊可能存在的中斷。
D.利用DNAman軟件將所測(cè)的序列連接起來,得到完整的人乳鐵蛋白基因序列。應(yīng)用Http//www.rwcp.or.jp/lab/pdappl/papia.html網(wǎng)站的TFSEARCHDNA Transcription Factor Binding SitePrediction軟件對(duì)人乳鐵蛋白基因的5′調(diào)控區(qū)進(jìn)行轉(zhuǎn)錄調(diào)控因子結(jié)合位點(diǎn)的預(yù)測(cè),并可利用DNAman軟件繪制人乳鐵蛋白基因組基因的任意酶切圖譜,見附圖1和2。其中tsp為轉(zhuǎn)錄起始位點(diǎn),GRE為兩個(gè)潛在的糖皮質(zhì)激素應(yīng)答元件,分別位于-7790/-7777,-2068/-2055處;五個(gè)潛在的雌激素應(yīng)答元件(ERE)位于在-352/-340,-1437/-1425,-1411/-1400,-8216/-8202,-8190/-8176處;九個(gè)潛在的cAMP應(yīng)答元件(CRE)分別位于-9222/-9209,-9116/-9109,-9045/-9038,-7290/-7183,-3299/-3291,-782/-773,+231/+239,+3937/+3944,+4127/+4134;九個(gè)潛在的STAT結(jié)合位點(diǎn)分別位于-8942/-8934,-7016/-7007,-5404/-5412,-5349/-5341,-4465/-4457,-845/-833,+1211/+1219,+1958/+1966,+1988/+1996。其中除-352/-340處的雌激素應(yīng)答元件外,其它元件為本實(shí)驗(yàn)首次發(fā)現(xiàn)。
乳鐵蛋白基因轉(zhuǎn)錄起始位點(diǎn)上游的9.3kb有兩個(gè)區(qū)域調(diào)控元件比較集中。一個(gè)區(qū)域?yàn)?1至2.1kb,一個(gè)區(qū)域?yàn)?7.0kb至-9.3kb。第一個(gè)區(qū)域包括三個(gè)雌激素應(yīng)答元件,一個(gè)糖皮質(zhì)激素應(yīng)答元件,一個(gè)cAMP應(yīng)答元件和一個(gè)STAT結(jié)合位點(diǎn)。第二個(gè)區(qū)域包括兩個(gè)雌激素應(yīng)答元件,一個(gè)糖皮質(zhì)激素應(yīng)答元件,四個(gè)cAMP應(yīng)答元件和兩個(gè)STAT結(jié)合位點(diǎn)。這兩個(gè)區(qū)域的調(diào)控元件如此集中,推測(cè)可能是乳鐵蛋白在乳腺中表達(dá)的重要調(diào)控區(qū)域。
令人感興趣的是,-1437/-1425和-1411/-1400,-8216/-8202和-8190/-8176處的雌激素應(yīng)答元件距離很近,可認(rèn)為是兩簇雌激素應(yīng)答元件,而每簇500-600bp附近均有一個(gè)糖皮質(zhì)激素應(yīng)答元件。由于乳蛋白的產(chǎn)生需要這兩種激素分泌的同時(shí)增加,因此我們推測(cè)糖皮質(zhì)激素受體和雌激素受體以及雌激素受體之間可能存在相互作用,以共同啟動(dòng)奶蛋白的表達(dá)。在+954/+967處還發(fā)現(xiàn)一個(gè)熱休克應(yīng)答元件(heat shock response element,HRE)。
權(quán)利要求
1.人乳鐵蛋白基因序列,它含有附圖1所述的DNA序列,包含人乳鐵蛋白基因的啟動(dòng)區(qū)、內(nèi)含子與外顯子序列及根據(jù)此序列得到的任何序列。
2.根據(jù)權(quán)利要求1所述序列為基礎(chǔ)生產(chǎn)的作為營(yíng)養(yǎng)和藥用蛋白的乳鐵蛋白。
3.根據(jù)權(quán)利要求1所述序列為基礎(chǔ)研制的真核表達(dá)調(diào)控元件。
4.根據(jù)權(quán)利要求1所述序列為基礎(chǔ)篩選的與動(dòng)物抗病性能相關(guān)的遺傳標(biāo)記。
5.人乳鐵蛋白基因的轉(zhuǎn)錄調(diào)控因子,分別是tsp為轉(zhuǎn)錄起始位點(diǎn)、糖皮質(zhì)激素應(yīng)答元件、雌激素應(yīng)答元件、cAMP應(yīng)答元件和STAT的結(jié)合位點(diǎn)。
6.根據(jù)權(quán)利要求5所述的人乳鐵蛋白基因的轉(zhuǎn)錄調(diào)控因子,其中糖皮質(zhì)激素應(yīng)答元件的結(jié)合位點(diǎn)具有附圖1所述序列的-7790/-7777或-2068/-2055處的序列。
7.根據(jù)權(quán)利要求5所述的人乳鐵蛋白基因的轉(zhuǎn)錄調(diào)控因子,其中雌激素應(yīng)答元件的結(jié)合位點(diǎn)具有附圖1所述序列的-352/-340、-1437/-1425、-1411/-1400、-8216/-8202或-8190/-8176處的序列。
8.根據(jù)權(quán)利要求5所述的人乳鐵蛋白基因的轉(zhuǎn)錄調(diào)控因子,其中糖皮質(zhì)激素應(yīng)答元件的結(jié)合位點(diǎn)具有附圖1所述的cAMP應(yīng)答元件的結(jié)合位點(diǎn)具有附圖1所述序列的-9222/-9209、-9116/-9109、-9045/-9038、-7290/-7183、-3299/-3291、-782/-773、+231/+239、+3937/+3944和+4127/+4134位點(diǎn)之間的序列。
9.根據(jù)權(quán)利要求5所述的人乳鐵蛋白基因的轉(zhuǎn)錄調(diào)控因子,其中STAT結(jié)合位點(diǎn)分別位于-8942/-8934、-7016/-7007、-5404/-5412、-5349/-5341、-4465/-4457或-845/-833的序列。
全文摘要
本發(fā)明提供了人乳鐵蛋白基因全序列,找出了該基因調(diào)控區(qū)上的部分調(diào)控元件,和所有內(nèi)含子、外顯示序列。本發(fā)明為實(shí)現(xiàn)通過真核表達(dá)系統(tǒng)生產(chǎn)人乳鐵蛋白等工作提供重要元件;為與動(dòng)物抗病性能相關(guān)的遺傳標(biāo)記的篩選提供了重要的參考信息;為乳蛋白基因乃至真核生物基因的表達(dá)調(diào)控提供一個(gè)很好的實(shí)驗(yàn)素材;同時(shí)也為轉(zhuǎn)基因動(dòng)物的制作、基因治療以及DNA疫苗的研制準(zhǔn)備一個(gè)更為有效的表達(dá)調(diào)控元件。
文檔編號(hào)C12N15/11GK1373215SQ0110907
公開日2002年10月9日 申請(qǐng)日期2001年2月28日 優(yōu)先權(quán)日2001年2月28日
發(fā)明者李寧, 劉兆良, 吳常信 申請(qǐng)人:李寧