時間:2023-09-28 15:45:05
引言:易發表網憑借豐富的文秘實踐,為您精心挑選了九篇生物信息學分析范例。如需獲取更多原創內容,可隨時聯系我們的客服老師。
>> 抗逆性轉錄因子NAC的生物信息學分析 酵母轉錄因子結合位點保守性的生物信息學分析 沙棘WRI1轉錄因子基因的生物信息學分析 白樺五個MYB轉錄因子的生物信息學分析 植物抗病WRKY轉錄因子生物信息學分析 蘋果TCP轉錄因子家族生物信息學分析 黃瓜DVR基因的生物信息學分析 黃芩葡萄糖醛酸水解酶基因的克隆、生物信息學分析及表達 人ALK-1近端啟動子的生物信息學分析 FZ6基因及其蛋白的生物信息學分析 玉米谷胱甘肽過氧化物酶的生物信息學分析 歐文氏桿菌鐵代謝相關基因的生物信息學分析 擬南芥和大白菜YABBY蛋白家族的生物信息學分析 丹參SmNAC1基因的克隆和生物信息學分析 小菜蛾p38MAPK基因的克隆與生物信息學分析 棉鈴蟲類胰蛋白酶的生物信息學分析 不結球白菜BcGAPDH的生物信息學分析 水稻2個F―box基因的生物信息學分析 小菜蛾PxALP1基因的克隆與生物信息學分析 斑馬魚TATA結合蛋白的生物信息學分析 常見問題解答 當前所在位置:l)對蛋白質序列進行二級結構預測(Secondary structure prediction)。通過WoLF PSORT工具(http://wolfpsort.seq.cbrc.jp/)基于其氨基酸序列預測蛋白質亞細胞定位點。
2 結果與分析
2.1 系統發生樹
通過系統進化分析,葡萄NAC轉錄因子家族共分5個大類(圖1),每大類也各有不同。第Ⅰ大類包含17個葡萄NAC基因,在6種發育相關的NAC基因中,除擬南芥NAC2[9]基因位于第Ⅵ大類外全部位于第Ⅰ大類,推斷第Ⅰ大類NAC基因與葡萄的生長發育相關。非生物逆境脅迫相關NAC基因全部位于第Ⅲ大類,位于此類的葡萄NAC基因共有12個,其中VvNAC45與VvNAC56兩個基因同源性相對較低。其余NAC基因位于第Ⅱ、Ⅳ、Ⅴ大類。其中第Ⅳ大類NAC基因數量最多。推測擬南芥NAC2基因位于第Ⅳ大類的原因可能是其序列特異性不強或參與逆境與發育兩種生命活動。
2.2 基因結構分析及染色體定位
葡萄71個NAC基因在染色體上數量分布不均勻,其中第5、第9號染色體未找到NAC基因。位于第19號染色體上的NAC基因數量最多(19個)。非生物脅迫相關NAC基因散亂分布在1、4、6、7、8、12、18、19共8條染色體上,未表現出集中性,VvNAC3基因未能定位到染色體上。葡萄的NAC基因N端都具有NAC保守結構域。
2.3 一級結構及理化性質分析
磷酸化位點分析顯示,葡萄非生物逆境脅迫相關NAC蛋白中絲氨酸磷酸化位點最多,酪氨酸磷酸化位點次之。通過ProtParam程序進行理化性質分析,結果顯示非逆境脅迫相關NAC蛋白既有酸性氨基酸,又有堿性氨基酸。從蛋白質穩定性上看,VvNAC26,VvNAC 42,VvNAC45為穩定蛋白,其余均為不穩定蛋白(表1)。
2.4 二級結構分析及亞細胞定位
在線二級結構預測結果顯示,非生物逆境脅迫NAC蛋白中隨機卷曲的比例很高(58.59%~70.35%),它起著鏈接其他二級結構原件的作用。此外,主要的二級結構原件為α螺旋(14.07%~30.81%)和延伸鏈(9.89%~20.83%),主要位于α螺旋和隨機卷曲之間。在線WOLF PSORT對蛋白亞細胞定位預測顯示,非生物脅迫相關NAC蛋白全部定位于細胞核。
3 結論與討論
對葡萄71種NAC蛋白進行了系統發生樹構建,染色體定位、理化性質分析,二級結構預測及亞細胞定位等方面的分析。系統發生樹顯示,所有的非生物逆境脅迫相關NAC蛋白都聚為一類,這與其他NAC類蛋白的研究結果相符合[10-11],也暗示在NAC家族成員中,脅迫相應NAC類轉錄因子之間具有密切聯系。非生物脅迫相關NAC蛋白全部定位于細胞核。由此推斷,具有相近生物學功能的NAC蛋白更可能定位于相同的亞細胞結構,這與其發揮特定生物學功能密切相關。非生物逆境脅迫類NAC蛋白既有其共同點也有不同點,這些分析與研究結果,有助于對葡萄NAC基因調控葡萄的生長與抗逆機制開展進一步研究。
參考文獻:
[1] Haake V, Cook D, Riechmannjl, et al.Transcription factor CBF4 is a regulator of drought adaptation in Arabidopsis [J]. Plant Physiology,2002,130(2):639.
[2] Abeh, Yamaguchi-shinozaki K, Urao T, et al. Role of Arabidopsis MYC and MYB homologs in drought and abscisic acid―regulated gene expression [J]. The Plant Cell Online, 1997,9(10):1859.
[3] Nuruzzaman M, Manimekalai R, Sharoni A M, et al. Genome-wide analysis of NAC transcription factor family in rice[J]. Gene,2010, 465:30-44.
[4] Kazuo N, Hironori T, Junya M, et al. NAC transcription factors in plant abiotic stress responses[J]. Biochimica et Biophysica Acta, 2012, 1 819:97-103.
[5] Wang N, Zheng Y, Xin H P, et al. Comprehensive analysis of NAC domain transcription factor gene family in Vitis vinifera[J]. Plant Cell Rep,2013,32:61-75.
[6] Fujita M, Fujita Y, Maruyama K, et al. A dehydration―induced NAC protein.RD26,is involved in a novel ABA dependent tress―signaling pathway [J]. The Plant Journal, 2004, 39(6):863-876.
[7] Tranlsp, Nakashima K. Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promoter [J]. The Plant Cell Online, 2004,16(9):2 481.
[8] Fang Y, You J, Xie K, et al. Systematic sequence analysis and identification of tissue-specific or stress-responsive genes of NAC transcription factor family in rice[J]. Molecular Genetics and Genomics,2008, 280(6):547-563.
[9] He X J, Mu R L, Cao W H, et al. AtNAC2, a transcription factor downstream of ethylene and auxin signaling pathways, is involved in salt stress response and lateral root development[J]. The Plant Journal ,2005, 44: 903-916.
>> 黃瓜DVR基因的生物信息學分析 斜紋夜蛾核型多角體病毒Ⅱ基因組DNA同源重復區生物信息學分析 人ALK-1近端啟動子的生物信息學分析 酵母轉錄因子結合位點保守性的生物信息學分析 FZ6基因及其蛋白的生物信息學分析 黔北麻羊RERGL基因cDNA克隆與生物信息學分析 不同物種GATA—2基因編碼區生物信息學分析 玉米谷胱甘肽過氧化物酶的生物信息學分析 石榴等觀賞植物DFR基因生物信息學分析 歐文氏桿菌鐵代謝相關基因的生物信息學分析 擬南芥和大白菜YABBY蛋白家族的生物信息學分析 丹參SmNAC1基因的克隆和生物信息學分析 小菜蛾p38MAPK基因的克隆與生物信息學分析 棉鈴蟲類胰蛋白酶的生物信息學分析 植物抗病WRKY轉錄因子生物信息學分析 葡萄NAC轉錄因子的生物信息學分析 抗逆性轉錄因子NAC的生物信息學分析 蘋果TCP轉錄因子家族生物信息學分析 黑麥草EST―SSR分子標記開發及生物信息學分析 不結球白菜BcGAPDH的生物信息學分析 常見問題解答 當前所在位置:l)在線工具。病毒基因組結構圖利用DNAStar Package中的SeqBuilder軟件繪制。
⑤蛋白質跨膜結構和理化性質的預測及分析 病毒蛋白質的跨膜結構利用TMpred ()在線工具預測。蛋白質理化性質利用ExPASy的ProtParam(http:///protparam/)在線工具進行分析。
2 結果與分析
2.1 采集樣品DNA病毒全長克隆和聚類分析
①TYLCV病毒分子鑒定 通過用TYLCV特異引物TYLCV-F/TYLCV-R對樣品DNA進行PCR鑒定,結果顯示,3個樣品TYLCV-SXYL2、SXYL3和SXYL4都為帶毒植株(圖1),并克隆測序得到519 bp序列。以雙生病毒DNA-B組分通用引物PCRc1/PBLv2040進行PCR擴增,未得到預期500~650 bp大小的條帶,以雙生病毒衛星DNA β鑒定通用引物Beta01/Beta02進行PCR反應,也未得到預期1 200~1 400 bp大小的條帶。結果表明,陜西楊凌地區侵染番茄的TYLCV為不含DNA-B且不伴隨衛星DNA β的單組分病毒,只含DNA-A。
②DNA-A全長的同源矩陣 選擇NCBI登錄的國內外不同地區分離的19個TYLCV分離物(表2),用DNAMAN多序列比對后構建同源矩陣(表3)。發現楊凌區3個分離物TYLCV-SXYL2、SXYL3、SXYL4核苷酸序列全長之間相似度為99.3%~99.4%,且和TYLCV-IS相似度為97.7%~97.8%。楊凌區的3個病毒分離物與山東壽光分離物TYLCV-SDSG的相似度都為99.6%,與陜西涇陽的分離物TYLCV-SX8的相似度都為99.1%。
③基于DNA-A全長的系統進化樹 陜西楊凌3個TYLCV分離物同19個不同國家地區的TYLCV通過MEGA5.05軟件中MUSCLE算法多序列比對后,用鄰近相連(Neighbor-Joining)法構建系統進化樹(圖2)發現,楊凌分離物和山東壽光分離物TYLCV-SDSG、河北石家莊分離物TYLCV-SJZ1、陜西涇陽分離物TYLCV-SX8、安徽分離物TYLCV-AH1、北京分離物TYLCV-Beijing3、美國分離物TYLCV-USA及浙江分離物TYLCV-ZJ8在同一小支上,且與山東壽光分離物TYLCV-SDSG親緣關系最近。上述分離物還與上海分離物TYLCV-SH2[9]、日本分離物TYLCV-Janpan、荷蘭分離物TYLCV-Netherlands和以色列株系TYLCV-IS在同一大支上。意大利撒丁島分離物TYLCSV和西班牙馬加拉分離物TYLCMalV在同一支。廣東分離物TYLCGV-G3和越南分離物TYLCVNV在同一支。新疆分離物TYLCV-XJ26-4和廣西分離物中國番茄黃化曲葉病毒TYLCCNV為同一支。云南分離物TYLTHV-Y72和泰國分離物TYLCTHV在同一支。由此可知,我國番茄黃化曲葉病毒的分布和種類同樣有較大的復雜性和多樣性,而楊凌番茄黃化曲葉病毒分離物很可能由最早發現的TYLCV-IS發展而來,且與山東壽光分離物親緣關系最近,基于楊凌地區與山東壽光種苗交易頻繁的現狀,推測很可能是因為感病幼苗交易帶來了病毒傳播與蔓延。
2.2 病毒DNA-A全長序列和基因組結構
設計背向引物PCR擴增并克隆得到病毒DNA-A全長。測序結果表明,TYLCV-SXYL2、SXYL3、SXYL4(GenBank登錄號依次為KC138545、KC138544、KC138543)全長都為2 781 nt,共編碼6個開放閱讀框(圖3),在病毒鏈上編碼外殼蛋白和AV2蛋白,在互補鏈上編碼復制相關蛋白、轉錄激活子、復制增強子和AC4蛋白。在AC1和AV2之間有313 nt的非編碼區,也叫基因間隔區。
①基因間隔區 基因間隔區(Intergenic Region,IR)位于1~147 nt和2 616~2 781 nt,共含313個核苷酸,有調控病毒復制和轉錄起始必須的元件,含有病毒復制和轉錄所必需的結構域以及莖環結構,莖環頂端有保守的九核苷酸TAATATT/AC序列。由于IR區相對于編碼區選擇壓小,也是病毒變異最活躍的區域。通過對TYLCV-SXYL2、SXYL3、SXYL4 和 TYLCV-IS的IR區核苷酸序列比較(圖4)發現,其特征序列中莖環頂端的九核苷酸TAATATT/AC(位于2 775~2 781 nt及1~2 nt)保守序列、TATA box和TATATA box,與TYLCV-IS一致,但CAAT box和5~8 nt短重復序列已表現出與TYLCV-IS有較大差異,其中短重復序列是Rep蛋白的結合位點。
②編碼蛋白的結構和性質分析 為進一步了解楊凌番茄黃化曲葉病毒分離物編碼蛋白質氨基酸序列的變異特點和更好地進行蛋白質性質分析,將TYLCV-SXYL4與19個其他地區分離物及TYLCV-SXYL2、SXYL3編碼的6個蛋白質氨基酸序列相似度進行比較分析(表5),結果顯示,楊凌3個分離物和越南番茄黃化曲葉病毒TYLCVNV、以色列TYLCV-IS轉錄激活子TrAP的氨基酸序列完全相同。TYLCV- SXYL3、 SXYL4和山東壽光分離物TYLCV-SDSG及河北石家莊分離物TYLCV-SJZ1復制增強子REn的氨基酸序列完全相同,且與TYLCV-IS的REn氨基酸序列相比,第58位由纈氨酸(Valine, V)突變為丙氨酸(Alanine,A)、第59位由甲硫氨酸(Methionine,M)突變為亮氨酸(Leucine,L)、第94位由天冬氨酸(Aspartic acid,D)突變為酪氨酸(Tyrosine,Y)、第124位由谷氨酸(Glutamic acid,E)突變為丙氨酸。TYLCV-SXYL2、SXYL3、SXYL4和日本分離物TYLCV-Japan、山東壽光分離物TYLCV-SDSG、上海分離物TYLCV-SH2、河北石家莊分離物TYLCV-SJZ1的C4蛋白氨基酸序列完全相同,與TYLCV-IS的C4蛋白氨基酸序列相比,第64位由脯氨酸(Proline,P)突變為絲氨酸(Ser,S)、第67位由甲硫氨酸突變為異亮氨酸(Isoleucine,I)、第84位由賴氨酸(Lysine,K)突變為精氨酸(Arginine,R)。
通過TMpred在線工具分別對楊凌3個病毒分離物編碼的6個蛋白進行跨膜結構預測發現,CP、 Rep、REn存在跨膜結構(圖5),而V2、TrAP、C4為胞內蛋白;楊凌3個病毒分離物的CP、V2、Rep和REn氨基酸序列有1~2個位點的區別,沒有影響蛋白質的跨膜結構的預測結果。
利用ExPasy的ProtParam在線工具對TYLCV-SXYL2、SXYL3、SXYL4和TYLCV-IS編碼蛋白的理論等電點、不穩定系數和親水性平均系數進行預測和比較分析(表6),發現楊凌番茄黃化曲葉病毒分離物和TYLCV-IS編碼AV2蛋白和REn的理論等電點差異較大。按不穩定系數40為不穩定蛋白推測,CP、V2、TrAP、C4為不穩定蛋白,Rep和REn為穩定蛋白。
3 討論與結論
為了進一步明確引起楊凌地區不同番茄主產區番茄黃化曲葉病害的病原種類和分子特征,依據Begomovirus分類中同時滿足外殼蛋白氨基酸序列相似度>90%和核苷酸全長相似性>89%才可能為同一病毒的不同分離物的標準[10],本研究在楊凌區3個不同番茄主產區調查采樣并對全基因組進行了測序和基因組結構分析。本研究表明,在楊凌區五泉、揉谷和李臺的番茄主產區引起番茄黃化曲葉病的病原確為TYLCV-IS株系的不同分離物(TYLCV-SXYL2、TYLCV-SXYL3、TYLCV-SXYL4),經鑒定,這3個分離物都為單組分雙生病毒且不伴隨衛星分子。李云洲等[11]克隆了楊凌地區西北農林科技大學園藝實驗場番茄黃化曲葉病毒外殼蛋白基因后發現,其氨基酸序列與以色列株系TYLCV-IS相似度>90%。
陜西省涇陽縣2010年暴發番茄黃化曲葉病
后[12],楊凌地區各大番茄主產區在2011年相繼發現番茄黃化曲葉病。但由系統進化樹構建及病毒編碼的6個蛋白氨基酸相似度比對結果發現,楊凌與山東壽光分離物TYLCV-SXSG親緣關系比與地理位置最近的涇陽分離物TYLCV-SX8的近,病毒蛋白特別是TYLCV-SXYL3、SXYL4編碼的REn的氨基酸序列相似度與TYLCV-SDSG達100%,與涇陽TYLCV-SX8僅為97.8%,這說明了植物病毒的傳播流行不僅受地理位置、氣候環境的影響,人為因素也起著越來越重要的作用。
雖然TYLCV基因組小,編碼的蛋白數量有限,但其與寄主的互作及致病機理仍然不清楚[13]。本研究對不同TYLCV編碼的蛋白質間的氨基酸相似度、蛋白質的理化特性和跨膜結構進行了生物信息學分析及比較,表明CP、Rep、REn為跨膜蛋白,V2、 TrAP、C4為胞內蛋白,Rep和REn為穩定蛋白,CP、 V2、TrAP、C4為不穩定蛋白。
參考文獻
[1] Foolad M R, Panthee D R. Marker-assisted selection in tomato breeding[J]. Critical Reviews in Plant Sciences, 2012, 31(2): 93-123.
[2] Lefeuvre P, Martin D P, Harkins G, et al. The spread of tomato yellow leaf curl virus from the Middle East to the world[J]. PLoS Pathogens, 2010, 6(10): e1001164.
[3] Pan H P, Chu D, Yan W Q, et al. Rapid spread of tomato yellow leaf curl virus in China is aided differentially by two invasive whiteflies[J]. PLoS One, 2012, 7(4): e34817.
[4] Liu B M, Preisser E L, Chu D, et al. Multiple forms of vector manipulation by a plant-infecting virus: Bemisia tabaci and tomato yellow leaf curl virus[J]. Journal of virology, 2013, 87(9): 4 929-4 937.
[5] 李常保,柴敏,李季,等.北京番茄黃化曲葉病毒病的發生及分子檢測[J].中國蔬菜, 2010(1):28-30.
[6] Rojas M R, Gilbertson R L, Maxwell D P. Use of degenerate primers in the polymerase chain reaction to detect whitefly-transmitted geminiviruses[J]. Plant Disease, 1993, 77(4): 340-347.
[7] Briddon R W, Bull S E, Mansoor S, et al. Universal primers for the PCR-mediated amplification of DNA β[J]. Molecular Biotechnology, 2002, 20(3): 315-318.
[8] Tamura K, Peterson D, Peterson N, et al. MEGA5: molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods[J]. Molecular biology and evolution, 2011, 28(10): 2 731-2 739.
[9] Zhang Y P, Zhu W M, Cui H M, et al. Molecular identification and the complete nucleotide sequence of TYLCV isolate from Shanghai of China[J]. Virus Genes, 2008, 36(3): 547-551.
[10] Fauquet C M, Bisaro D M, Briddon R W, et al. Revision of taxonomic criteria for species demarcation in the family Geminiviridae, and an updated list of begomovirus species[J]. Archives of Virology, 2003, 148(2): 405-421.
[11] DiazPendon J A, Truniger V, Nieto C, et al. Advances in understanding recessive resistance to plant viruses[J]. Molecular Plant Pathology, 2004, 5(3): 223-233.
關鍵詞:植物;WRKY轉錄因子;抗病;生物信息學
中圖分類號:S718.46;Q7 文獻標識碼:A 文章編號:0439-8114(2014)05-1191-05
植物在長期進化過程中形成了一系列機制,以適應和抵御各種生物和非生物逆境,在眾多的適應性機制中,基因表達的轉錄調節在植物應答環境信號刺激反應過程中起著重要作用。轉錄因子是植物中最重要的一類調節基因。WRKY是近年來新發現的植物特有的新型鋅指型轉錄調控因子, 是一類植物特有的轉錄因子家族,因在其N-端含有由WRKYGQK組成的高度保守的7個氨基酸序列而得名,WRKY基因首先被克隆于甘薯[1],隨后在約20多種植物中證實存在WRKY蛋白,并闡明了相應的分子生物學功能[2],WRKY家族轉錄因子主要與植物的抗逆性和衰老等生理過程有關。病原菌、傷害和植物激素類物質等多種外界因素均能誘導WRKY基因的表達[3]。本研究以GenBank上登錄的擬南芥(Arabidopsis thaliana)、歐芹(Petroselinum crispum)、辣椒(Capsicum annuum L.)、水稻(Oryza sativa L.)和毛白楊(Populus tomentosa)5個物種的22個WRKY家族抗病轉錄因子為材料,利用生物信息學方法研究該轉錄因子編碼區的變異,為其他植物WRKY抗病基因克隆及其研究提供理論依據。
1 材料與方法
1.1 供試材料
數據資料來源于美國國立生物技術信息中心NCBI(http://ncbi.nlm.nih.gov/)核苷酸數據庫和國家水稻數據中心(http:///),其中擬南芥有13種,AtWRKY40 NM_106732、 AtWRKY60 NM_128058、 AtWRKY48 NM_124329、AtWRKY25 NM_128578,對丁香假單胞菌起負調控作用[4-6];AtWRKY18NM_119329的中度水平表達會引起PR基因表達及對丁香假單胞菌的抗性增強[7];AtWRKY41 NM_117177具有雙重調控作用,能夠抵抗細菌和真菌病原物的重要下游基因的產物,抗丁香假單胞菌[8];AtWRKY70 NM_115498,參與兩條抗性信號轉導途徑的調控交叉點,即通過激活SA介導的抗病信號轉導途徑,同時又抑制JA介導的抗病信號轉導,調控擬南芥的抗病反應,主要對丁香假單胞菌起抗病作用[9];AtWRKY33 NM_129404作為JA/ET介導途徑中的正調控子,在抗真菌病原菌方面發揮作用,如防治灰霉病[10];AtWRKY3 NM_126385對抗腐生病原菌起正調控作用;AtWRKY4 AF425835可以抗青枯病與腐生病原菌,超表達時對假單胞菌有毒小種的抗性增強, 對軟腐病菌抗性減弱[11];AtWRKY29 NM_118486是MAPK通路中可作為典型的WRKY基因參與擬南芥植株的抗病信號的轉導[12];AtWRKY6 NM_104910可以抗細菌、病毒、卵菌和真菌[13];AtWRKY27 AF418310抗青枯病[14]。辣椒有3種,CaWRKY-a AY391747抗煙草花葉病毒[15];CaWRKY2 DQ402421抗丁香假單胞菌[16];CaWRKY1 AY229992通過負調控作用抗病菌[17]。歐芹3種,PcWRKY4 AF204925、PcWRKY5 AF204926均為抗大豆疫霉菌的激發子[18];PcWRKY1 PCU48831抗大豆疫霉菌[19]。毛白楊有1種,PtWRKY23 EF051079抗葉銹病[20]。水稻2種,OsWRKY71 AB190817參與赤霉素信號傳導,脫落酸介導的信號傳導,依賴于R基因的防衛反應信號途徑,抗白葉枯病;OsWRKY13 EF143611參與茉莉酸介導的信號傳導、水楊酸介導的信號途徑,抗白葉枯病和稻瘟病。
1.2 轉錄因子系統發育樹的構建
利用Maga 5.0軟件對NCBI數據庫中搜索到的對病原菌有調控作用的轉錄因子和基因全長序列進行系統進化樹的構建。采用Neighbor-Joining法構建系統發育樹,對生成的系統發育樹進行Bootstrap校正,得到最終的系統發育樹。
1.3 轉錄因子保守基序的分析
利用在線MEME 4.8.0軟件(http://meme.sdsc.edu)對轉錄因子的氨基酸序列進行保守基序分析。
1.4 轉錄因子編碼蛋白質的三級結構分析
利用在線CPHmodels工具對9種蛋白質進行同源建模,并利用高級結構預測軟件RasMol對各轉錄因子和基因編碼的蛋白質三維結構進行分析。
2 結果與分析
2.1 不同植物抗病WRKY轉錄因子系統發育樹的構建
對22個WRKY家族抗病轉錄因子進行系統發育樹構建,結果(圖1)表明,可以將這22個抗病WRKY轉錄因子分為2大類群,7個亞類群。第一大類群中的歐芹PcWRKY1,辣椒CaWRKY-a、CaWRKY2,擬南芥AtWRKY4、AtWRKY3、AtWRKY25、AtWRKY33都含有兩個WRKY結構域。擬南芥WRKY抗病轉錄因子中對腐生病原菌起正調控作用的為AtWRKY3和AtWRKY4,二者抗腐生病原菌,起正調控作用[12]。
歐芹PcWRKY1對大豆疫霉菌有抗性作用[19],擬南芥AtWRKY33對灰霉病起抗性作用[11],而辣椒CaWRKY-a對煙草花葉病毒起抗性作用。從系統發生樹(圖1)上可以看出,這3個轉錄因子組成第一個亞類群,其中擬南芥AtWRKY33與辣椒CaWRKY-a親緣性相近,而與歐芹PcWRKY1的親緣性次之,但目前的研究表明其在抗病原理上并不相同,有待進一步研究。
擬南芥AtWRKY25和辣椒CaWRKY2聚為第二亞類群,二者均對丁香假單胞菌起調控作用;擬南芥AtWRKY3和AtWRKY4聚為第三亞類群,二者均對腐生病原菌起調控作用。
擬南芥AtWRKY48、毛白楊PtWRKY23和辣椒CaWRKY1聚為第四亞類群。研究表明,擬南芥AtWRKY48對丁香假單胞菌起負調控作用[5],辣椒CaWRKY1對丁香假單胞菌、煙草花葉病毒等起負調控作用[17],毛白楊PtWRKY23對葉銹病起抗性作用。
擬南芥AtWRKY6、AtWRKY18、AtWRKY60、AtWRKY40,水稻OsWRKY71和歐芹PcWRKY4聚為第五亞類群,其中對細菌、真菌、卵菌、病毒起抗性作用的擬南芥AtWRKY6[13]單獨成一類,擬南芥AtWRKY18、AtWRKY60和AtWRKY40均對假單胞菌有抗性作用[4,7],而擬南芥AtWRKY18和水稻OsWRKY71均會引起R基因表達抗病,且都是通過SA代謝途徑起到抗病作用[4],而歐芹PcWRKY4為抗大豆疫霉菌因子。
擬南芥AtWRKY27、AtWRKY29和水稻OsWRKY13聚為第六亞類群。在抗病方面,擬南芥AtWRKY27抗青枯病,AtWRKY29是MAPK通路中能夠抵抗細菌和真菌病原物的重要下游基因的產物,水稻OsWRKY13參與茉莉酸介導的信號傳導、 水楊酸介導的信號途徑,抗白葉枯病和稻瘟病。
擬南芥AtWRKY41、AtWRKY70與歐芹PcWRKY5聚為第七亞類群。研究表明,它們均屬于鋅指結構C2-HC(C-X7-C-X23-H-X1-C)型[21],其中擬南芥AtWRKY41與AtWRKY70均對細菌具有抗病性,但抗病途徑并不相同[8,10],而歐芹PcWRKY5對大豆疫霉菌因子有抗性,它們在抗病方面并不完全相同。
2.2 不同植物抗病WRKY轉錄因子保守基序的分析
由圖2可知,22個抗病的WRKY轉錄因子都具有保守基序1和2,部分WRKY轉錄因子之間也有共性。系統發育樹中第一大類群的1、2、3亞類群中的歐芹PcWRKY1,辣椒CaWRKY-a、CaWRKY2,擬南芥AtWRKY4、AtWRKY3、AtWRKY25和AtWRKY33都具有基序9和基序12,而第一大類群的其他亞類群和第二大類群的其他 WRKY轉錄因子都不具有基序9和基序12。
第五亞類群的擬南芥AtWRKY6、AtWRKY18、AtWRKY60和AtWRKY40,水稻OsWRKY71,歐芹PcWRKY4都具有基序5和基序6,而第一大類群的其他亞類群和第二大類群的其他WRKY轉錄因子都不具有基序5和基序6。第四亞類群中辣椒CaWRKY1和毛白楊PtWRKY23特有的基序為基序18。第七亞類群的擬南芥AtWRKY41和AtWRKY70,歐芹PcWRKY5都具有基序17。研究表明,擬南芥AtWRKY18和水稻OsWRKY71通過水楊酸代謝途徑抗病[4],基序分析表明,二者共有基序1、2、4、5、6和14。擬南芥WRKY轉錄因子中對腐生病原菌抗性起正調控作用的AtWRKY4和AtWRKY3都具有基序11和基序10。許多擬南芥WRKY轉錄因子作為防衛信號的負調控因子起作用, 如AtWRKY18、AtWRKY25、AtWRKY27、AtWRKY40、AtWRKY41、AtWRKY48和AtWRKY 60,這些WRKY轉錄因子都具有基序1、2、6和5。擬南芥AtWRKY70編碼的蛋白質參與兩條抗性信號轉導途徑,一是通過激活SA介導的抗病信號轉導途徑,二是抑制JA介導的抗病信號轉導途徑,從而調控擬南芥的抗病反應[10],其僅有基序1、2、19和20。
2.3 不同植物抗病轉錄因子編碼蛋白質的三級結構分析
高級結構決定蛋白質生物學功能,對蛋白質高級結構的預測和分析,有助于理解蛋白質結構與功能之間的相關性[22]。由圖3可知,擬南芥AtWRKY4和AtWRKY25轉錄因子編碼的蛋白質三級結構相似,均屬于抗細菌型轉錄因子[6,12]。歐芹PcWRKY1和辣椒CaWRKY-a轉錄因子編碼的蛋白質三級結構相似,辣椒CaWRKY-a對煙草花葉病毒具有抗性作用,而歐芹PcWRKY1對大豆疫霉菌有抗性作用。水稻OsWRKY13、歐芹PcWRKY4和PcWRKY5、擬南芥AtWRKY18和AtWRKY40編碼的蛋白質三級結構相似。辣椒CaWRKY1和毛白楊PtWRKY23,擬南芥AtWRKY48和AtWRKY33編碼的蛋白質三級結構相似,但其功能不盡相同[5,10],有待進一步研究。研究表明,擬南芥AtWRKY18和AtWRKY6,歐芹PcWRKY1以及水稻OsWRKY13的C末端結構域可與(T)(T)TGAC(C/T)序列(W-box)相結合,產生特異性作用,參與植物防衛反應作用[23,24]。
3 小結
通過對22個抗病WRKY家族轉錄因子進行系統發生樹、基序以及蛋白質三級結構分析,得出22個抗病WRKY轉錄因子分為2個大類群,7個亞類群。第一大類群由歐芹PcWRKY1、PcWRKY4,辣椒CaWRKY1、 CaWRKY-a、 CaWRKY2,擬南芥AtWRKY4、 AtWRKY3、 AtWRKY25、 AtWRKY33、AtWRKY48、AtWRKY6、AtWRKY18、AtWRKY60和AtWRKY40,毛白楊PtWRKY23,水稻OsWRKY71組成。擬南芥AtWRKY41、AtWRKY70、AtWRKY27和AtWRKY29,歐芹PcWRKY5,水稻OsWRKY13組成第二大類群。22個轉錄因子都具有基序1和2,系統發育樹中第一大類群中的擬南芥AtWRKY4和AtWRKY25,歐芹PcWRKY1和辣椒CaWRKY-a具有相似的蛋白質三級結構,都具有基序9和基序12,擬南芥AtWRKY33和AtWRKY48具有相似的蛋白質三級結構,都具有基序18;系統發育樹中第四亞類群中的辣椒CaWRKY1和毛白楊PtWRKY23具有相似的蛋白質三級結構。
參考文獻:
[1] ISHIGURO S, NAKAMURA K.Characterization of a cDNA encoding a novel DNA-binding protein,SPF1,that recognizes SP8 sequences in the 5’upstream regions of genes coding for sporamin and β-amylase from sweet potato[J]. Mol Gen Genet.1994,244(6):563-571.
[2] WU K L,GUO Z J,WANG H H, et al. The WRKY family of transcription factors in rice and Arabidopsis and their origins[J].DNA Res,2005,12(1):9-26.
[3] EULGEM T, RUSHTON P J, ROBATZEK S, et al. The WRKY superfamily of plant transcription factors[J].Trends in Plant Science,2000,5(5):200-206.
[4] XU X P, CHEN C H, FAN B F,et al. Physical and functional interactions between pathogen-induced Arabidopsis WRKYl8,WRKY40 and WRKY60 transcription factors[J]. The Plant Cell,2006,18(5):1310-1326.
[5] XING D H, LAI Z B, ZHENG Z Y, et al. Stress-and pathogen-induced Arabidopsis WRKY48 is a transcriptional activator that represses plant basal defense[J]. Mol Plant,2008,1(3):459-470.
[6] ZHENG Z, QAMAR S A, CHEN Z, et al. Arabidopsis WRKY33 transcription factor is required for resistance to necrotrophic fungal pathogens[J].Plant J,2006,48(4):592-605.
[7] CHEN C, CHEN Z. Potentiation of developmentally regulated plant defense response by AtWRKY18,a pathogen-induced Arabidopsis transcription factor[J]. Plant Physiology,2002,129(2):706-716.
[8] ASAI T, TENA G, PLOTNIKOVA J, et al. MAP kinase signalling cascade in Arabidopsis innate immunity[J]. Nature,2002,415:977-983.
[9] LI J, BRADER G, PALVA E T. The WRKY70 transcription factor:A node of convergence for jasmonate-mediated and salicylate-mediated signals in plant defense[J].The Plant Cell,2004,16(2):319-331.
[10] ZHENG Z, MOSHER S L, FAN B, et al. Functional analysis of Arabidopsis WRKY25 transcription factor in plant defense against Pseudomonas syringae[J]. BMC Plant Biology,2007(7):1-13.
[11] RAMAMOORTHY R, JIANG S Y, KUMAR N,et al. A comprehensive transcriptional profiling of the WRKY gene family in rice under various abiotic and phytohormone treatments[J]. Plant Cell Physiology,2008,49(6):865-879.
[12] LAI Z B, VINOD K M, ZHENG Z Y, et al. Roles of Arabidnpsis WRKY3 and WRKY4 transcription factors in plant responses to pathogens[J]. BMC Plant Biology,2008(8):1-13.
[13] CHEN W Q, PROVART N J, GLAZEBROOK J, et al. Expression profile matrix of Arabidopsis transcription factor genes suggests their putative functions in response to environmental stresses[J]. The Plant Cell,2002,14(3):559-574.
[14] MUKHTAR M S, DESLANDES L, AURIAC M C, et al. The Arabidopsis transcription factor WRKY27 influences wilt disease symptom development caused by Ralstonia solanacearum[J].Plant J,2008,56(6):935-947.
[15] PARK C J, SHIN Y C, LEE B J, et a1. A hot pepper gene encoding WRKY transcription factor is induced during hypersensitive response to Tobacco mosaic virus and Xanthomonas campestris[J]. Planta,2006,223(2):168-179.
[16] OH S K, YI SY, YU S H, et a1. CaWRKY2,a chili pepper transcription factor,is rapidly induced by incompatible plant pathogens[J].Mol Cells,2006,22(1):58-64.
[17] OH S K, BAEK K H, YI S Y, et al. Capsicum annuum WRKY protein CaWRKY1 is a negative regulator of pathogen defense[J].New Phytologist,2008,177(4):977-989.
[18] CORMACK R S, EULGEM T, RUSHTON P J, et al. Leucine zipper-containing WRKY proteins widen the spectrum of immediate early elicitor-induced WRKY transcription factors in parsley[J]. Biochimica et Biophysica Acta,2002, 1576(1-2):92-100.
[19] ULGEMT, RUSHTON P J, SEHMELZER E, et al. Early nuclear events in plant defence signaling:Rapid gene activation by WRKY transcription factors[J]. EMBO J,1999(18):4689-4699.
[20] WIM G, MANSOUR K, KRZYSZTOF W, et al. A role for AtWRKY23 in feeding site establishment of plant-parasitic nematodes[J]. Plant Physiology,2008,148;358-368.
[21] 田 云,盧向陽,彭麗莎,等.植物WRKY轉錄因子結構特點及其生物學功能[J]. 遺傳,2006(12):1607-1612.
[22] 陳克克,武 雪.植物查耳酮異構酶生物信息學分析[J].生物信息學,2009,7(3):163-167.
(1.中國醫學科學院北京協和醫學院藥用植物研究所,北京 100193;2.中國醫學科學院藥用植物研究所云南分所,
云南 景洪 666100;3.廣西藥用植物園,南寧 530023;4.廣西中醫藥大學,南寧 530001)
摘要:FOS蛋白作為一類核蛋白轉錄因子,在調控細胞生長、分裂、增殖、分化乃至程序性死亡等方面具有重要的作用,它的表達影響了許多生命活動和過程,引起了人們的廣泛關注,并在學習記憶及的標記方面吸引了學者的眼球。對FOS蛋白的作用進行了綜述,并對人、大鼠及小鼠FOS蛋白進行了生物信息學分析,旨在為FOS蛋白在生理學方面的研究提供參考依據。
關鍵詞 :FOS蛋白;轉錄因子;生物信息學
中圖分類號:Q816;Q811.4 文獻標識碼:A 文章編號:0439-8114(2015)07-1537-06
DOI:10.14088/j.cnki.issn0439-8114.2015.07.001
FOS是c-fos基因轉錄產生的成熟mRNA編碼的一個核磷蛋白。c-fos基因是人或動物細胞中固有的正常基因,屬于即刻早期應答基因(Immediate early response genes,IEG),FOS作為一類核蛋白轉錄因子,在調控細胞生長、分裂、增殖、分化乃至程序性死亡等方面具有重要作用。FOS蛋白和c-fos基因受到廣泛的關注,研究不斷深入。本文就FOS蛋白的作用及其在性行為方面的研究進行了論述,對人、大鼠及小鼠的FOS蛋白進行了生物信息學分析。
1 FOS蛋白
c-fos基因高度保守,屬多基因家族,與其同族的還有fos-B,fos-1和fros-2。c-fos可在多種因素誘導下迅速地表達,其轉錄激活在5 min內即可產生,一般維持15~20 min,c-fos mRNA的蓄積在刺激后30~45 min可達高峰,半衰期為12 min。FOS蛋白合成后即刻轉入細胞核內,一般在刺激后20~90 min即可檢出,60~90 min達峰值,可持續2~5 h,半衰期為2 h[1]。
2 FOS蛋白的作用
在原癌基因的研究中對IEG產物的研究提示FOS蛋白可能是神經元被刺激激活的一種標志[2]。現代學者認為,FOS蛋白參與細胞的正常分化、生長以及學習、記憶等過程,在腦內與皮層、海馬、邊緣系統、背海馬、紋狀體內FOS蛋白的表達密切相關[3-7]。在病理狀態下與許多疾病的發生、發展有關,如宮頸癌[8]、癲癇[9]。目前FOS蛋白表達還用于偏頭痛治療藥物篩選、藥效評價和發病機理研究模型的建立[10]、鑒別生前電擊與死后電擊[11]、作為臨床提示腦部受傷時間的參考指標[12]。
FOS蛋白參與神經肽的調節,與神經元的可塑性有關,如細胞水平記憶的形成、神經元損傷后的再生等[1]。當受到如腦缺血、腦出血、血管性癡呆、癇性發作、熱應激、恐懼和憤怒應激等刺激后,其在數分鐘內做出反應,導致中樞神經系統不同區域出現不同數量的FOS蛋白表達[13],如室旁核[14,15]、下丘腦視上核、下丘腦、杏仁核[16]等,在對外界刺激-轉錄耦聯的信息傳遞過程中起著核內第三信使的重要作用[17],且各種急性應激所致小鼠空間學習記憶功能的改變與FOS蛋白表達的上調有關,其表達在應激后1 h明顯增加[18]。Moore等[19]研究發現,FOS蛋白的持續表達是細胞終末分化的標志及發生死亡的先兆[20],同時還能抑制使細胞維持生存的一些基因的表達,維持著隨后的細胞死亡過程并持續很長時間[21]。
3 FOS蛋白與性行為
多年的研究發現大腦接收相關的信號,FOS蛋白的表達可作為與性行為的各個方面尤其是相關的神經活動的標志物[22-24],并且FOS蛋白隨著性行為的增加而表達增高[25-27],其表達可能與感覺輸入或行為輸出有關,或者兩者都有,人們普遍認為誘導FOS蛋白表達與感覺信息的處理比觸發更相關[28]。
現在FOS蛋白已被用于雄性和雌性嚙齒動物大腦性行為的圖譜功能網絡的繪制[29,30],并且使用FOS蛋白作為標志物具有病變而不會影響細胞分辨率的優勢[31-35]。由于分辨率大,時FOS蛋白的增加發生在內側視前區、杏仁核、條紋終末核、中央被蓋區[36-39]、束旁丘腦核[26]、附屬嗅球、伏隔核、腹外側隔、條紋床核、內側視前區、下丘腦室旁核、腹內側核、杏仁核、杏仁海馬區、腹側被蓋區等。這些腦區域都是性行為調節下的神經網絡的部分[40]。總之插入和誘導了FOS蛋白在雄鼠大腦區域中的表達。研究中還發現許多性刺激后FOS蛋白表達的區域是控制雌性性行為和繁殖功能不同方面的區域。在大鼠中,當具有性經驗的雄性接觸雌性但還沒有開始騎跨時在內側視前區尾部內有FOS蛋白的感應現象[25],在密閉的容器中為雄性提供動情或者不動情雌性弄臟的墊料時該區也有感應[41]。相比之下,在大鼠、雄性倉鼠[33,42]、雄性沙鼠[32]和雪貂[34]中,隨著中的插入和可能減少了FOS蛋白陽性催產素神經元在前側和內側分泌性細胞分區中的數量[43]。研究還發現FOS蛋白離散集群只在特定的分區位置出現并且是在后而不是插入后就出現[26,32]。在大鼠中, 這些 FOS蛋白集群的神經元通常出現在杏仁核外側區、條紋終末核喙部、束旁丘腦核內側。表明后激活了特定的腦部亞分區,能誘導FOS蛋白在大腦特定區域有選擇性的表達[29]。
4 FOS蛋白的生物信息學分析
4.1 人類FOS蛋白
人類FOS蛋白(GenBank:CAA24756.1)的編碼基因定位于染色體的14q21-31,該基因有4個外顯子和3個內含子,FOS蛋白為380個氨基酸的不穩定核內磷酸化蛋白[44]。FOS蛋白存在一個由88個完全相同的氨基酸順序組成的區域,這個區域包括一個能與DNA結合的基本區和亮氨酸拉鏈結構。通過Expasy進行一級結構分析可知FOS蛋白的分子式為C1767H2774N480O586S18,相對分子質量為40 695.40,理論等電點pI4.77,帶正電殘基(Arg+Lys)為33個,帶負電殘基(Asp+Glu)為51個。該蛋白的不穩定系數為78.82,說明其不穩定。脂肪系數為65.32,親水性系數為- 0.37,消光系數為21 930,哺乳動物的網織紅細胞體外的半衰期為30 h。結構域預測發現其基本區域為亮氨酸拉鏈的BRLZ蛋白,屬于B-ZIP超家族。
利用SOPMA對FOS蛋白序列進行二級結構預測,結果表明,FOS蛋白二級結構中α-螺旋(Alpha helix)占26.84%,β-折疊(Beta turn)占1.05%,延伸鏈(Extended strand)占8.16%,無規則卷曲(Random coil)占63.95%(圖1)。
用Swissmodel對其進行了三級結構預測和可視化分析(圖2)。該三級結構模型中用于建立模型的氨基酸殘基范圍為138~200位,該模型以2wt7A(2.30A)蛋白為模板,序列同源性為100%,E-value為1.43e-28.
4.2 大鼠FOS蛋白
大鼠FOS蛋白(NCBI reference sequence:NP_071533.1),FOS蛋白的分子式為C1776H2791N4
83O592S17,肽鏈包含380aa,相對分子質量為40 926.60,理論等電點pI4.81,帶正電殘基(Arg+Lys)為33個,帶負電殘基(Asp+Glu)為50個。該蛋白的不穩定系數為76.60,說明其不穩定。脂肪系數為65.29,親水性系數為- 0.43,消光系數為23 420,哺乳動物的網織紅細胞體外的半衰期為30 h。結構域預測發現其基本區域為亮氨酸拉鏈的BRLZ蛋白,屬于B-ZIP超家族。
二級結構預測結果表明,FOS蛋白二級結構中α-螺旋(Alpha helix)占27.63%,β-折疊(Beta turn)占1.05%,延伸鏈(Extended strand)占8.68%,無規則卷曲(Random coil)占62.63%(圖3)。
用Swissmodel對FOS蛋白進行了三級結構預測(圖4)。該三級結構模型中用于建立模型的氨基酸殘基范圍為138~200位,該模型以2wt7A(2.30A)蛋白為模板,序列同源性為100%,E-value為1.26e-28.
4.3 小鼠FOS蛋白
該蛋白PDB ID為2WT7,相對分子質量為28 329.84,保守結構域基本區域為亮氨酸拉鏈的BRLZ蛋白,屬于B-zip1超家族。2WT7有4條鏈。第一條鏈為63個殘基的多肽,二級結構為96%的α-螺旋。第二條鏈為90個殘基的多肽,二級結構為84%的α-螺旋,其余兩條鏈均為16個殘基。從PDB上下載其三級結構(圖5)。
4.4 FOS蛋白的序列比對與系統進化樹的建立
對大鼠FOS蛋白進行Blastp比對,選擇同源性較高或研究較多的動物FOS蛋白序列進行分析。結果表明,與小鼠和金倉鼠(Mesocricetus aurarus)同源性最高,為97%,其次為猩猩(Pongo abelii)、野駱駝(Camelus ferus)各為95%、人(Homo sapiens)為94%、黑猩猩(Pan troglodytes)為94%。
從NCBI的數據庫中挑選23個物種的FOS蛋白序列用MEGA5.0繪制進化樹,結果顯示大鼠與小鼠直接聚為一類,親緣關系最近,這與序列Blastp的分析結果一致。因此通過以上對大鼠、人及小鼠的FOS蛋白進行對比可以看出,三者的同源性較高,結構和性質相似(圖6)。
5 討論
目前,關于FOS蛋白對細胞生命活動的研究取得了重要進展,尤其在各種應激反應對FOS蛋白表達的影響及FOS蛋白表達與一些疾病的相關方面,如冀群升等[1]研究發現FOS蛋白與神經元的可塑性有關,它可以通過參與神經肽的調節影響細胞水平記憶的形成,方向義等[13]在研究中也發現受到各種應激后在數分鐘內中樞神經系統不同區域出現不同數量的FOS蛋白表達,且各種急性應激所致小鼠空間學習記憶功能的改變與FOS蛋白表達的上調有關[18]。而在研究性行為中也發現時一些與學習記憶相關的區域中FOS蛋白也隨之增加,如室旁核[14,15]、下丘腦視上核、下丘腦、杏仁核[16]等,這提示FOS蛋白可能與性行為中的學習記憶有關。然而FOS蛋白在這些尤其在性行為這一神秘的過程中是如何發揮作用的,這些作用又與哪些基因和蛋白有關等問題還有待深入研究。
由于從人類腦部取樣困難,試驗往往選用大鼠腦部作為試驗材料,不僅因為大鼠基因組與人類基因組相似度達90%,且大鼠腦量較大,取材方便,生物信息學分析發現大鼠、人及小鼠的FOS蛋白的同源性較高,結構和性質相似。尤其是大鼠和人類的FOS蛋白、相對分子質量、等電點等均相差較小,立體結構高度相似,因此研究大鼠FOS蛋白對研究人類FOS蛋白的各種性質和功能有極大的參考意義,本次生物信息學分析也可為大鼠大腦作為人類FOS蛋白研究的替代材料提供證據。
參考文獻:
[1] 冀群升,章靜波. c-fos原癌基因的進展[J].國外醫學(分子生物學分冊),1994,16(4):152-156.
[2] 王曉明,韓濟生.原癌基因與核內第三信使.神經科學綱要[M].北京:北京醫科大學,中國協和醫科大學聯合出版社,1993.
[3] 張玉秋,梅 俊.學習記憶對腦內c-fos基因表達的影響[J].生命科學,2000,12(5):229-230.
[4] 張玉秋,梅 俊.學習和記憶對大鼠背海馬結構內c-fos表達的影響[J].中國神經科學雜志,2000,16(2):138-142.
[5] GILL K M, BERNSTEIN I L,MIZUMORI S J.Immediate early gene activation in hippocampus and dorsal striatum:effects of explicit place and response training[J]. Neurobiol Learn Mem, 2007,87(4):583-596.
[6] 舒 丹,吳 江,上官守琴,等.催產素抑制外周刺激誘發的大鼠海馬LTP及FOS蛋白表達[J].基礎醫學與臨床,2009,29(8):845-849.
[7] 于 芳,張安民,王根深,等.間歇性負重游泳訓練對大鼠杏仁基底外側核(BLA)FOS蛋白表達的影響[J].北京體育大學學報,2008,31(10):1357-1360.
[8] 熊 晶,劉鳳英,陶光實,等. c-fos和c-jun在宮頸癌、CIN及宮頸炎中的表達及意義[J].現代生物醫學進展,2009,9(4):687-689.
[9] 陳 功,江澄川. c-fos、c-jun與癲癇[J].中華神經醫學雜志,2005,4(8):853-854.
[10] 彭 成,任永欣,姚 干,等.實驗性偏頭痛動物模型c-fos、c-jun基因表達[J].中國實驗動物學報,2000,8(2):112-119.
[11] 王 曄,廖志鋼,王世春,等.大鼠電流損傷多器官c-fos表達研究[J].法醫學雜志,2005,21(3):171-176.
[12] 張 輝,李衛東,薄愛華,等.FOS蛋白在腦挫傷皮質和海馬中表達的研究[J].中國組織化學與細胞化學雜志,2004,13(1):110-113.
[13] 方向義,胡海濤.中樞神經系統FOS蛋白的表達與外周傷害性刺激[J].神經解剖學雜志,1996,12(3):281-283.
[14] 盧曉虹,李凌江,李昌琦,等.應激對中樞神經系統即刻早期基因c-fos表達及HPA軸的調節作用研究[J].中國心理衛生雜志,2000,14(1):10-13.
[15] 趙正卿,雷 輝,劉俊華,等.熱應激時下丘腦視上核和室旁核FOS蛋白的表達[J]. 神經解剖學雜志,2007,23(3):313-317.
[16] 劉曉偉,曲宏達,張紅梅,等.怒、恐應激大鼠腦內c-fos與CRHmRNA表達差異性分析[J].四川中醫,2006,24(1):11-13.
>> 人組蛋白去乙酰化酶11的克隆表達與生物信息學分析 FZ6基因及其蛋白的生物信息學分析 擬南芥和大白菜YABBY蛋白家族的生物信息學分析 斑馬魚TATA結合蛋白的生物信息學分析 黃瓜DVR基因的生物信息學分析 金鐵鎖糖基轉移酶PtT1的克隆與生物信息學分析 黃芩葡萄糖醛酸水解酶基因的克隆、生物信息學分析及表達 蓖麻油體固醇蛋白質的鑒定與生物信息學分析 結核分枝桿菌38kDa蛋白結構與功能的生物信息學分析 新疆細粒棘球絳蟲EgAgB8/3蛋白的生物信息學分析及意義 棉鈴蟲的巧防技術 太子參分解代謝關鍵酶8′羥化酶基因的克隆及生物信息學分析 紅白忍冬SABATH甲基轉移酶基因克隆及其生物信息學分析 希金斯炭疽菌腺苷酸環化酶生物信息學分析 丹參類貝殼杉烯氧化酶(SmKOL)基因全長克隆及其生物信息學分析 唇形科植物腳6基腳6基焦磷酸合酶編碼基因及其氨基酸序列的生物信息學分析 人ALK-1近端啟動子的生物信息學分析 酵母轉錄因子結合位點保守性的生物信息學分析 玉米谷胱甘肽過氧化物酶的生物信息學分析 歐文氏桿菌鐵代謝相關基因的生物信息學分析 常見問題解答 當前所在位置:l)分析棉鈴蟲類胰蛋白酶氨基酸序列的理化性質;運用DNAMAN軟件比對分析氨基酸序列同源性;運用MEGA 5.0中的Fhylogenetic Tree方法構建分子系統發育樹;運用在線工具ProtScale ()進行親、疏水性的分析;運用Psort在線工具()進行蛋白質二級結構的分析預測;運用NCBI數據庫中CDD在線工具(http://ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進行功能結構域的分析。
2 結果與分析
2.1 棉鈴蟲類胰蛋白酶氨基酸序列理化性質分析
運用ProtParam在線軟件分析棉鈴蟲7種類胰蛋白酶氨基酸序列理化性質,結果見表1。由表1可知,棉鈴蟲7種類胰蛋白酶在理論等電點、脂溶指數以及氨基酸組成等方面均表現出相似性。其相對分子質量約為70 000,等電點約為5.00,氨基酸數目為253~256,Ala、Cys、Gly和Thr殘基含量較高。7種類胰蛋白酶的不穩定系數均較高,其中類胰蛋白酶Ⅲ的不穩定指數最低,為52.08,表明類胰蛋白酶在棉鈴蟲細胞內的穩定性較差,推測類胰蛋白酶代謝較為活躍,代謝周轉的速度較快。棉鈴蟲7種類胰蛋白酶的脂溶指數均較低,屬于親水性蛋白質。
2.2 棉鈴蟲類胰蛋白酶氨基酸序列磷酸化位點預測分析
使用NetPhosk 2.0 Server在線工具對棉鈴蟲7種類胰蛋白酶的氨基酸序列分別進行預測Ser、Thr與Tyr位點處發生磷酸化的概率結果見表2。從表2可見,在氨基酸磷酸化位點中Ser的預測分值最高,表明Ser發生磷酸化的概率最高,并且發現類胰蛋白酶Ⅲ中不具有Thr磷酸化位點;只有類胰蛋白酶Ⅴ具有Tyr磷酸化位點。以類胰蛋白酶Ⅲ為例進行說明:其氨基酸序列在第83位、243位、246位、247位這4個Ser位點處都有可能發生磷酸化,但第247位Ser發生磷酸化的概率最大,為M3=0.973。
2.3 棉鈴蟲類胰蛋白酶氨基酸序列分子進化樹分析
使用MEGA 5.0中的Fhylogenetic Tree方法構建分子系統發育樹結果見圖1。由圖1可知,7種類胰蛋白酶分為兩個分支,類胰蛋白酶Ⅰ、Ⅱ、Ⅶ與Ⅴ處于一個分支,類胰蛋白酶Ⅳ、Ⅲ與Ⅵ處于另一個分支。其中,類胰蛋白酶Ⅰ和類胰蛋白酶Ⅱ進化關系較近,類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進化關系較近。
2.4 棉鈴蟲類胰蛋白酶的氨基酸序列分析
1)使用TMHMM 2.0在線工具對7種類胰蛋白酶的氨基酸序列跨膜結構進行預測分析,均不存在跨膜結構域。
2)使用ProtScale工具對7種蛋白酶的親、疏水性進行分析。7種類胰蛋白酶的總平均親水性為0.860~0.960,均表現為親水性。其中,多肽鏈靠近N末端區域親水性最強,最低分值為-0.500到-0.600,而C末端區域疏水性最強,最高分值為2.100到2.300。
3)用DNAMAN軟件比對分析7種類胰蛋白酶的氨基酸序列同源性(圖2)。在這7種蛋白酶氨基酸序列中,有較多保守的區域(如圖2中深顏色區域所示)。經過分析發現,7種類胰蛋白酶氨基酸序列結構相似,同源性最高為85.71%。7種類胰蛋白酶中均含有高度保守的必需氨基酸殘基,參與維持蛋白酶的空間結構及行使催化功能。比如第10、54、70、179、196、207與231位的Cys殘基,它們之間能夠形成二硫鍵以穩定蛋白酶的空間結構。第205位的Asp殘基與228、238位的Gly殘基能夠與底物形成離子鍵、氫鍵,參與類胰蛋白酶對底物的識別與結合。第69位的His殘基、114位的Asp殘基與211位的Ser殘基組成了類胰蛋白酶的催化基團,通過電子的傳遞,與底物分子中的Arg和(或)Lys殘基羧基端肽鍵發生親核反應,實現催化功能(氨基酸殘基位置以類胰蛋白酶Ⅲ為準)。
2.5 棉鈴蟲類胰蛋白酶的功能結構域分析
使用NCBI數據庫中CDD在線工具對類胰蛋白酶Ⅲ進行功能結構域分析(圖3)。結果表明,類胰蛋白酶Ⅲ屬于胰蛋白酶超家族,具有該家族特有的功能區域。類胰蛋白酶Ⅲ的16位(Ala)與17位(Arg)氨基酸殘基之間含有一個自剪切位點(Cleavage site),該位點與酶翻譯后的活化及轉運有關;69(His)位、114(Asp)位、211(Ser)位氨基酸殘基構成酶的催化位點(Active site);205(Asp)位、228(Gly)位、238(Gly)位氨基酸殘基形成3個底物結合位點(Substrate binding sites),參與酶對底物的識別與結合,其他類胰蛋白酶的分析也得到相似的結果。
2.6 棉鈴蟲類胰蛋白酶的亞細胞定位分析
亞細胞定位預測結果見表3。由表3可以看出,類胰蛋白酶Ⅰ、Ⅱ主要位于內質網中,類胰蛋白酶Ⅲ主要位于內質網、液泡及細胞外基質中,而類胰白酶Ⅳ、Ⅴ、Ⅵ與Ⅶ主要位于細胞外基質中。亞細胞定位的多樣性體現了類胰蛋白酶在棉鈴蟲生命活動過程中具有多樣性的生物學功能,其中類胰白酶Ⅲ、Ⅳ、Ⅴ、Ⅵ與Ⅶ主要發揮消化作用,因為棉鈴蟲對食物的消化場所主要位于中腸(細胞外)。而類胰蛋白酶Ⅰ、Ⅱ與Ⅲ可能主要行使免疫保護作用,參與棉鈴蟲對外界環境的免疫應答。
2.7 棉鈴蟲類胰蛋白酶的二級結構分析預測
利用NPSA在線工具預測類胰蛋白酶的二級結構(表4)。由表4可知,無規卷曲是該類胰蛋白酶整體結構中的主要組成結構元件,β轉角出現概率相對較小。α螺旋主要分布于氨基酸序列兩側,而無規卷曲、延伸鏈則主要分布在多肽鏈中間區段。
3 小結與討論
本研究以棉鈴蟲腸道內7種類胰蛋白酶為研究對象,運用在線工具對其進行生物信息學分析。結果表明,7種類胰蛋白酶理化性質較為相似,為親水性蛋白酶。Ser是類胰蛋白酶序列中磷酸化概率最大的氨基酸殘基。分子系統發育樹結果顯示類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進化關系較近,而類胰蛋白酶I和類胰蛋白酶Ⅱ在進化關系上更為接近。類胰蛋白酶不存在跨膜結構域,屬于基質類蛋白,這與其親水性的特點吻合。功能結構域分析發現類胰蛋白酶屬于胰蛋白酶超家族,其氨基酸序列中含有自切割位點、若干催化殘基與結合殘基。類胰蛋白酶的亞細胞定位具有多樣性,主要分布在細胞外與內質網中,這體現了類胰蛋白酶在棉鈴蟲生命活動過程中具有多樣性的生物學功能。二級結構分析預測表明無規卷曲在該類胰蛋白酶整體結構中所占比例最大,是其主要的結構元件。氨基酸序列同源性分析,7種類胰蛋白酶氨基酸序列的同源性較高,達到了85.71%,并且含有高度保守的必需殘基,參與維持蛋白酶的空間結構及行使催化功能,包括維持高級結構的Cys殘基,形成底物結合口袋的結合殘基及參與催化作用的催化殘基。依據此研究結果,能夠設計出與類胰蛋白酶活性中心特異性結合的抑制劑,抑制其活性,從而擾亂棉鈴蟲的正常消化,實現抗蟲目的。
參考文獻:
[1] 常團結,陳 蕾,路子顯,等. 棉鈴蟲幼蟲中腸類胰蛋白酶基因的克隆及在大腸桿菌中的表達[J]. 動物學報,2002,48(6):790-796.
[2] 任曉霞,韓召軍,王蔭長. 棉鈴蟲乙酰膽堿酯酶cDN段的克隆和序列分析[J]. 動物學報,2002,48(1):121-124.
[3] 郭線茹,蔣金煒,羅梅浩,等. 轉基因抗蟲煙草研究進展[J]. 昆蟲知識,2005,42(4):358-363.
[4] CHOUGULE N P, GIRI A P,SAINANI M N, et al. Gene expression patterns of Helicoverpa armigera gut proteases[J]. Insect Biochemistry and Molecular Biology,2005,35(4):355-367.
[5] KANG Z, JIANG J H, WANG D, et al. Kunitz-type trypsin inhibitor with high stability from Spinacia oleracea L. seeds[J]. Biochemistry (Moscow),2009,74(1):102-109.
[6] TELANG M A, GIRI A P, SAINANI M N, et al. Characterization of two midgut proteinases of Helicoverpa armigera and their interaction with proteinase inhibitors[J]. Journal of Insect Physiology,2005,51(5):513-522.
[7] TAMHANE V A, CHOUGULE N P, GIRI A P, et al. In vivo and in vitro effect of Capsicum annum proteinase inhibitors on Helicoverpa armigera gut proteinases[J]. Biochim Biophys Acta,2005,1772(2):156-167.
[8] BOWN D P, GATEHOUSE J A. Characterization of a digestive carboxypeptidase from the insect pest corn earworm (Helicoverpa armigera) with novel specificity towards C-terminal glutamate residues[J]. European Journal of Biochemistry,2004, 271(10):2000-2011.
>> 小菜蛾PxALP1基因的克隆與生物信息學分析 高叢越桔UFGT基因電子克隆和生物信息學分析 丹參類貝殼杉烯氧化酶(SmKOL)基因全長克隆及其生物信息學分析 小菜蛾p38MAPK基因的克隆與生物信息學分析 黃瓜DVR基因的生物信息學分析 沙棘WRI1轉錄因子基因的生物信息學分析 黔北麻羊RERGL基因cDNA克隆與生物信息學分析 玉米淹水誘導表達ZmERF5基因啟動子的克隆與生物信息學分析 茶陵野生稻冷響應基因OrCr3的克隆及其生物信息學分析 黃芩葡萄糖醛酸水解酶基因的克隆、生物信息學分析及表達 金鐵鎖糖基轉移酶PtT1的克隆與生物信息學分析 結核分枝桿菌pst S1基因的擴增及生物信息學分析 平邑甜茶MhWRKY15基因cDNA克隆及其生物信息學分析 紅白忍冬SABATH甲基轉移酶基因克隆及其生物信息學分析 子宮內膜異位癥相關基因和microRNA的挖掘及生物信息學分析 太子參分解代謝關鍵酶8′羥化酶基因的克隆及生物信息學分析 FZ6基因及其蛋白的生物信息學分析 歐文氏桿菌鐵代謝相關基因的生物信息學分析 水稻2個F―box基因的生物信息學分析 弓1蟲RH株SAG1基因序列體外擴增及生物信息學分析 常見問題解答 當前所在位置:l)對氨基酸序列進行多重比對,并用MEGA4 NJ法(bootstrap 1000)構建系統樹。在CCD數據庫()進行二硫鍵預測。在Swiss-Model(http:///)進行蛋白的三級結構預測。
2.4 丹參毛狀根中SmNAC1表達譜分析 采用SYBR Green Premix染料(TaKaRa公司)進行qRT-PCR分析,以丹參β-actin作管家基因,分別以特異性引物SmNAC F:5′-CTCCCAACATCAGTCAAG-3′,SmNAC R:5′-ATGGCGGTGACGAT-3′,檢測SmNAC1在YE+Ag+處理丹參毛狀根0,2,4,8,12,24 h的表達變化。PCR體系為 SYBR Premix TaqTM 5 μL,正反引物各0.2 μL,ROX Reference Dye II 0.2 μL,稀釋10倍的cDNA模板1.0 μL,加ddH2O至10 μL。PCR程序為,95 ℃ 30 s,95 ℃ 5 s,60 ℃ 34 s, 40個循環,增加溶解曲線。每個樣品設3個生物學重復。
3 結果
3.1 丹參SmNAC1基因序列分析 丹參SmNAC1基因全長591 bp,編碼196個氨基酸。Blastx檢索結果顯示,SmNAC1與野生馬鈴薯Solanum chacoense的NAC1,番茄S. lycopersicum NAC1-like,煙草Nicotiana benthamiana NAC1,水稻Oryza sativa Indica Group NAC-like,紫花苜蓿Medicago truncatula的相似度分別是84%,83%,84%,77%,73%。與SmBTF的相似度只有56%。SmNAC1蛋白55~120 位是NAC_AB(PS51151)的保守結構域。應用Softberry(http:///berry.phtml)分析調控元件和PLANTCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測,C-端氨基酸有23個順勢作用元件,包括TGGTTT厭氧響應順式調控元件,AAACAGA赤霉素響應元件,GTTTTCTTAC參與脅迫防御應答的順式作用元件以及TCTTTAC光應答元件等。使用NetPhos 2.0 Server(http://cbs.dtu.dk/services/NetPhos/)分析磷酸化位點,共發現10個磷酸化位點,其中絲氨酸位點7個,蘇氨酸位點2個,酪氨酸位點1個,沒有發現糖基化為點。
3.2 SmNAC1編碼蛋白質的基本性質分析 SmNAC1蛋白由196個氨基酸殘基組成,相對分子質量為21.66 kDa,等電點4.36。CFSSP 對SmNAC1蛋白進行二級結構預測,該蛋白包含87.8%的α螺旋結構, 36.7% 的β折疊結構和14.8%的無規卷曲,見圖1(由于α螺旋和β折疊交互計算,故幾種結構類型之和>100%)。無規則卷曲主要位于55~120個氨基酸功能區內,連接其他二級結構元件。在SWISS-MODEL用同源建模方法以人的NAC蛋白(3mcbA)為模板構建同源模型,對SmNAC1的NAC結構域氨基酸進行三級結構預測,結果見圖2。SignalP 4.0 Server和TMHMM 2.0分析顯示SmNAC1非氨基酸序列沒有信號肽,也不包含跨膜結構域,也不是分泌蛋白。亞細胞定位分析表明,該基因不定位于葉綠體或線粒體,推測可能定位在細胞核,具有DNA結合,激活,轉錄調控,乙酰化等功能。
以人的NAC蛋白(3mcbA)為模板,E=9.311 57e-17。將SmNAC1與Genbank中17個物種25種蛋白進行比對,應用MEGA4使用NJ法(bootstrap 1000)構建系統進化樹。SmNAC1與茄科馬鈴薯S. chacoense NAC2(ScNAC2, ACB32231.1),本氏煙N. benthamiana NAC(NbNAC,BAF46352.1)和番茄S.lycopersicum NAC(SINAC,XP_004249331.1)
親緣關系最近,見圖3。從圖中可以看出NAC的變異率是比較高的,同一植物的NAC蛋白并不聚在一起,如擬南芥中的擬南芥Arabidopsis thaliana中的5個蛋白NAC1-1(AtNAC1-1,NP_187845.1),NAC1-2(AtNAC1-2,NP_190516.1),NAC1-3(AtNAC1-3,NP_1196889.4),NAC1-4(AtNAC1-4,NP_001078369.1)和NAC1-5(AtNAC1-5,AEE31552.1),AtNAC1-1和AtNAC1-3聚為一小支,AtNAC1-4和AtNAC1-5聚為一小支,而AtNAC1-2則和蓖麻Ricinus communis NAC1-2(RcNAC1-2,XP_002521293.1)聚為一小支,三者間間隔距離較遠。玉米種的3個NAC蛋白中ZmNAC1-1(NP_001147422.1)和ZmNAC1-3(NP001148944.1)聚為一支,與ZmNAC1-2(NP_001147705.1)的距離較遠。水稻中的3個NAC蛋白則各自聚在不同的分支。可見NAC蛋白雖然具有保守的結構域,但是其結構的變異性非常大。
3.3 SmNAC1基因表達譜分析 對培養18 d的丹參毛狀根進行YE+Ag+處理,分析SmNAC1在處理后5個時間點的mRNA水平的相對表達量,見圖4。處理后2 h表達量上調至對照的1.4倍,處理后4 h表達量達到對照的2倍,8~12 h保持2倍的表達水平,處理后24 h SmNAC1下調至對照表達水平以下。說明SmNAC1響應YE+Ag+處理,參與了脅迫應答反應。
4 討論
NAC家族基因是陸生植物特異的轉錄因子家族,NAC蛋白參與植物的生長發育、形態建成及多馬鈴薯Solanum chacoense NAC2(ScNAC2, ACB32231. 1);本氏煙Nicotiana benthamiana NAC(NbNAC,BAF46352. 1);番茄S. lycopersicum NAC(SINAC,XP_004249331. 1);丹參Salviae miltiorrhizae NAC1(SmNAC1,kF006346);黃瓜Cucumis sativus(CsNAC, XP_004171778. 1);葡萄Vitis vinifera NAC2(VvNAC2,XP_003632619. 1);野草莓Fragaria vesca subsp. vesca NAC(Fvssp. vescaNAC,XP_004306474. 1);擬南芥Arabidopsis thaliana NAC1-3(AtNAC1-3,NP_1196889. 4);擬南芥A. thaliana NAC1-1(AtNAC1-1,NP_187845. 1);水稻Oryza sativa Japonica Group NAC1(OsNAC1,BAB89723. 1);水稻O. sativa NAC1-3(OsNAC1-3,AAT01337. 1);葡萄V. vinifera NAC1(VvNAC1,XP_002283581. 2);二穗短柄草Brachypodium distachyon NAC(BdNAC,XP_003557882. 1);玉米Zea mays NAC1-3(ZmNAC1-3,NP001148944. 1);玉米Z. mays NAC1-1(ZmNAC1-1,NP_001147422. 1);大豆Glycine max NAC(GmNAC,XP_003554096);蒺藜狀苜蓿Medicago truncatula NAC1(MtNAC1,XP_003624883. 1);火炬松Pinus taeda NAC(PtNAC,AAF27917. 1);Micromonas sp. RCC299(Msp. NAC1,ACO64924. 1);Coccomyxa subellipsoidea C-169(CsuNAC1,EIE21909. 1);擬南芥A. thaliana NAC1-5(AtNAC1-5,AEE31552. 1);擬南芥A. thaliana NAC1-4(AtNAC1-4,NP_001078369. 1);水稻O. sativa NAC1-2(OsNAC1-2,AAM52321. 1);玉米Z. mays NAC1-2(ZmNAC1-2,NP_001147705. 1);擬南芥A. thaliana NAC1-2(AtNAC1-2,NP_190516. 1);蓖麻Ricinus communis NAC1-2(RcNAC1-2,XP_002521293. 1)。
種生物和非生物脅迫應答過程。如玉米的ZmSNAC1基因在低溫、干旱、高鹽及脫落酸處理后表達量顯著上調,而水楊酸處理后表達下調[13]。葡萄中的VvNAC1基因響應病原菌、脫落酸、茉莉酸和乙烯處理表達上調[14]。在巴西橡膠樹HbNAC1啟動子序列中有多個CCAAT-box,EECCRCAH1,MYB2CONAENSUSAT元件識別MYB和MYC轉錄因子,在ABA信號通路和非生物脅迫答應中起重要作用[15]。SmBTF3與SmNAC1氨基酸序列的相似度只有56%,但是在N-端都具有NAC-AB保守結構域,二級結構都以α螺旋為主。熒光定量PCR分析表明SmBTF3在根中的表達量最高,對ABA誘導的響應不明顯,干旱脅迫短時間內抑制其表達。本研究發現SmNAC1在YE+Ag+聯合處理后2 h表達量上調至對照的1.4倍,4 h上調至對照的2倍,24 h表達量下調至對照表達水平一下,可見丹參中的這2個轉錄因子在丹參的抗逆脅迫中起作用。
[參考文獻]
[1] Phan Tran L S, Nakashima K, Sakuma Y, et al. Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promotor[J]. Plant cell, 2004, 16(9):2481.
[2] Park J, Kim Y S, Kim S G, et al. Integration of auxin and salt signals by the NAC transcription factor NTM2 during seed germination in Arabidopsis[J]. Plant Physiol, 2011, 156(2):537.
[3] Hu H H, You J, Fang Y J, et al. Characterization of transcription factor gene SNAC2 conferring cold and salt tolerance in rice[J]. Plant Mol Biol, 2008, 67(1/2):169.
[4] 孫欣,上官凌飛,房經貴,等. 葡萄NAC轉錄因子家族生物信息學分析[J]. 基因組學與應用生物學,2011,20(2):229.
[5] Hu R B, Qi G, Kong Y Z, et al. Comprehensive analysis of NAC domain transcription factor gene family in Populus trichocarpa[J]. BMC Plant Biol, 2010, 10(1):145.
[6] Rushton P J, Bokowiec M T, Han S C, et al. Tobacco transcription factors : novel insights into transcriptional regulation in the solanaceae[J]. Plant Physiol, 2008, 147(1):280.
[7] Le D T, Nishiyama R, Watanabe Y, et al. Genome-wide survey and expression analysis of the plant-specific NAC transcription factor family in soybean during development and dehydration stress[J]. DNA Res, 2011, 18(4): 263.
[8] Puranik S, Sahu P P, Srivastava P S, et al. NAC proteins: regulation and role in stress tolerance[J]. Trends Plant Sci, 2012, 17(6):369.
[9] 何煒,葉冰瑩,周平,等. 轉錄因子NAC的研究進展[J]. 亞熱帶農業研究,2008,4(4):311.
[10] 何苗,武雪,王喆之. 丹參BTF3基因的克隆及生物信息學分析[J]. 武漢植物學研究, 2009, 26(6):582.
[11] 張夏楠,崔光紅,蔣喜紅,等. 丹參轉基因毛狀根離體培養體系的建立及分析[J]. 中國中藥雜志,2012, 37(15):2257.
[12] 呂冬梅,袁媛,張東,等. 丹參毛狀根化學成分穩定性研究[J]. 中國中藥雜志,2008,33(6):653.
[13] Lu M, Ying S, Zhang D F, et al. A maize stress-responsive NAC transcription factor, ZmSNAC1, confers enhanced tolerance to dehydration in transgenic Arabidopsis[J]. Plant Cell Rep, 2012, 31(9):1701.
[14] Zhu Z, Shi J, He M, et al. Isolation and functional characterization of a transcription factor VpNAC1 from Chinese wild Vitis pseudoreticulata[J]. Biotechnol Lett, 2012, 34(7):1335.
[15] 康桂娟,黎瑜,夏可燦,等. 巴西橡膠樹HbNAC1基因啟動子的克隆及序列分析[J]. 基因組學與應用生物學, 2012, 31(5):447.
Cloning and bioinformatics analysis of SmNAC1 from Salvia miltiorrhiza hairy root
WANG Ya-jun1, JIANG Chao1, ZHAO Rong1, ZHAO Le2, SHEN Ye1*, HUANG Lu-qi1*
(1.National Resource Center for Chinese Materia Medica, China Academy of Chinese Medical Sciences, Beijing 100700, China;
2.College of Pharmaey, Henan University of Traditional Chinese medicine, Zhengzhou 450008, China)
[Abstract] In order to study function of NAC transcription in development, hormone regulation and the stress response of Salvia miltiorrhiza, the NAC transcription was cloned and analyzed. By retrieving cDNA database of S. miltiorrhiza hairy root one NAC unigene was found, then a full length of cDNA was cloned by designing specific primers and PCR amplifying. Using ORF finder it was found that the cDNA containing a NAC-AB conserved domain in N-terminal, so the cDNA was a NAC transcription factor, named as SmNAC1(kF006346). Bioinformatics analysis showed that SmNAC1 had an open reading frame (ORF) of 591 bp encoding 196 amino acids. The calculated protein had isoelectric point (pI) of 4.36 with molecular weight about 21.66 kDa. The transcription level of SmNAC1 after dealing with yeast extract (YE) and silver ion (Ag+) in S. miltiorrhiza hairy root was markedly stimulated up regulating. It was 1.4 fold compared with the control after induction 2 h, and maintained 2.0 fold on 4-12 h after induction. SmNAC1 may participate in regulation of stress response of YE+Ag+.
關鍵詞: 平邑甜茶; WRKY15; cDNA; 生物信息學
中圖分類號:S661.19 文獻標識碼:A 文章編號:1009-9980?穴2011?雪06-949-04
Cloning of MhWRKY15 gene in Malus hupehensis and its bioinformatics analysis
SUN Xiao-li, RAN Kun,YANG Hong-qiang*, LI Qiang, JIANG Qian-qian
(College of Horticulture Science and Engineering, Shandong Agricultural University? State Key Laboratory of Crop Biology; 3Shandong Provincial Key Laboratory of Fruit Biology, Tai’an,Shandong 271018 China)
Abstract: Full-length cDNA sequence of WRKY15 gene from roots of Malus hupehensis (Pamp.) Rehd. var. pinyiensis Jiang, which was tentatively designated as MhWRKY15, with GenBank accession number GU576874, was acquired by RT-PCR and RACE with primers designed respectively based on the EST sequence. Bioinformatics analysis indicated that MhWRKY15 was 1 091 bp in length, containing an open reading frame of 810 bp and encoding 269 amino acids, and it belonged to group II of WRKY transcription factors and was one member of WRKY15 family. The results also showed that the protein encoded by MhWRKY15 was a soluble protein, with the molecular formula C1263H1941N365O425S12, the relative molecular weight was 29 423.2 ku and the isoelectric point was 5.30. There was one conserved WRKY domain in the protein sequence. The protein might be located in nucleus, and there were many phosphorylation sites, N glycosylation sites and O glycosylation sites. The predicted secondary structure demonstrated that random coil was the most important structural conformation.
Key words: Malus hupehensis (Pamp.) Rehd.; WRKY15; cDNA; Bioinformatics
WRKY是植物特有的一種N端含有7個絕對保守的氨基酸序列(WRKYGQK)及鋅指結構(CX4-7 CX22-23HXH/C)的轉錄因子[1-2],它通過與核心序列為(T)(T)TGAC(T/C)的W-box順式元件特異結合而調節基因表達[3-4]。目前,在擬南芥和水稻等植物中已克隆了大量WRKY成員[5-6],根據WRKY結構域個數及鋅指結構特征,這些成員可以分為3類。第Ⅰ類含有2個WRKY結構域;第Ⅱ類含有1個WRKY結構域,其鋅指結構為C2H2型;第Ⅲ類含有1個WRKY結構域,其鋅指結構為C2HC型[7]。WRKY明顯受真菌、冷害、高溫、干旱及鹽脅迫等誘導,并參與胚胎形成、種皮及腺毛發育等多種過程[1-2,7]。平邑甜茶是蘋果的優良砧木,克隆其轉錄因子并進行生物信息學分析,對于蘋果砧木的分子調控及遺傳改良有重要意義。
1 材料和方法
1.1 總RNA的提取及檢測
取具4~6片真葉的平邑甜茶[Malus hupehensis (Pamp) Rehd. var Pinyiensis Jiang],采用改進快速CTAB法提取根系總RNA[8],瓊脂糖凝膠電泳及Eppendorf核酸蛋白測定儀檢測質量及濃度。
1.2 MhWRKY15基因的克隆
按照RNA PCR (AMV) Ver.3.0(TaKaRa)使用說明合成cDNA第1鏈,根據已知EST序列設計特異的上游引物P1: (5’-CAGATTATGAGCGACCAG GAG-3’)和下游引物P2: (5’-CGAGGAAACAAGTT GAAAG-3’),以cDNA為模板進行PCR擴增。產物回收后克隆入pMD-18T載體,轉化大腸桿菌DH5α,提取質粒后測序;根據測序結果設計3’-RACE上游引物P3: 5’-CATGGTGGTCCTGGAGT TCT-3’,下游引物為B26通用引物: 5’-GACTCGAG TCGACATCGATTTTTTTTTTTTTTTTT,擴增得到3’端序列。根據中間片段和3’端序列,設計5’-RACE上游引物P4(5’-CATTGCCCAGTGTAATCCT-3’)和下游引物P5(5’-CATCTTAACCCTCCTTTCT-3’),按照5’-Full RACE Kit(Takara Code: D315)使用說明,得到5’端序列。最后設計全長引物P6(5’-ATG GACCCCACATTCTTCAG-3’)和P7(5’-TCAACAGA ATCTGAGCTTGTG-3’),擴增得到MhWRKY15編碼區序列。
1.3 生物信息學分析
用DNAStar軟件中的EditSeq程序分析MhWRKY15全長序列,用ORF Finder ()、TMpred( ch. embnet. org/software/TMPRED_form. html)、SignalP3.0( cbs. dtu. dk/services/SignalP/)、CELLO(cello. life. nctu. edu. tw/)、NetPhos 2.0( cbs. dtu. dk/services/NetPhos/)、NetNGlyc 1.0( cbs. dtu. dk/services/NetNGlyc/)和NetOGlyc 3.1( cbs. dtu. dk/services/NetOGlyc/)對編碼蛋白進行保守域、氨基酸理化性質、跨膜區、信號肽分析、亞細胞定位、磷酸化位點、N-糖基化位點和O-糖基化位點分析。
2 結果與分析
2.1 平邑甜茶MhWRKY15基因cDNA全長序列的克隆
利用特異引物P1和P2,通過RT-PCR擴增得到長約350 bp的目的條帶(圖1-A),產物測序后確定為342 bp。通過RACE技術分別獲得330 bp的5’端(圖1-B)和741 bp的3’端(圖1-C)序列。在拼接序列起始密碼子和終止密碼子處分別設計引物P6和P7,擴增得到810 bp的條帶(圖1-D),測序結果與拼接的編碼區序列吻合。將該基因命名為MhWRKY15,GenBank登陸號為GU576874。
2.2 平邑甜茶MhWRKY15基因的核苷酸序列分析
EditSeq程序和ORF Finder分析顯示,MhWRKY15全長1 091 bp,含有810 bp的完整ORF,起始密碼子為ATG,終止密碼子為TGA,包括134 bp的5’非翻譯區(5’-UTR)和147 bp的3’非翻譯區(3’-UTR),共編碼269個氨基酸。
2.3 平邑甜茶MhWRKY15編碼蛋白的系統發生分析
2.3.1 蛋白保守域分析 Conserved Domains Database蛋白保守域分析顯示,MhWRKY15編碼蛋白在80~140位氨基酸之間含有一個WRKY保守功能域,其中WRKYGQK為7個絕對保守的氨基酸殘基;在該蛋白DNA結合域中具有一個C2H2型(C-X5-C-X23-H-X1-H)鋅指結構,表明該蛋白屬于第II組WRKY類轉錄因子;Blast分析確認該基因為WRKY15家族成員。
2.3.2 系統進化樹分析 以最大簡約法(MP)構建的多物種系統進化樹(圖2)顯示,與平邑甜茶(GU576874)進化關系最近的是蘋果(ADL36857.1),其次是大豆(ABS18444.1)和葡萄(XP002269267.1)。
2.4 平邑甜茶MhWRKY15編碼蛋白的性質分析
ProtParam Tool分析顯示MhWRKY15分子量為29 423.2 ku,分子式為C1263H1941N365O425S12,理論pI值為5.30,不穩定參數為52.50,屬于不穩定蛋白。TMPred跨膜區域分析表明,該蛋白從內到外及從外到內的跨膜區域均為0;SignalP 3.0信號肽分析顯示該蛋白沒有信號肽。NetPhos 2.0分析表明該蛋白存在15個絲氨酸位點、2個蘇氨酸位點和1個酪氨酸位點。NetNGlyc1.0分析顯示在22、30、40及152位氨基酸處存在4個N-糖基化位點;NetOGlyc 3.1分析表明存在16個O-糖基化位點。CELLO亞細胞定位分析表明該蛋白定位于細胞核。SOPMA分析表明,該蛋白α-螺旋、延伸鏈和β-轉角的比例分別為20.22%、11.61%和3.37%,無規則卷曲比例最高(64.79%);用SWISS-MODEL構建的三維結構模型也顯示MhWRKY15主要以無規則卷曲為主(圖3)。
3 討 論
轉錄因子是結合在目的基因特定DNA序列上的蛋白質,通過增強或抑制基因的轉錄效率來調控基因表達,真核生物基因表達調控主要是在轉錄水平進行。WRKY轉錄因子作為一種誘導型調節因子,參與植物的多種防衛反應、生長發育調節以及物質代謝調節等各種重要生理活動[3,7]。研究通過生物學信息學分析發現MhWRKY15編碼蛋白存在磷酸化、N糖基化和O糖基化位點,這表明磷酸化作用或糖基化作用能夠調節MhWRKY15轉錄因子。蛋白磷酸化作用由蛋白激酶催化完成,是細胞信號轉導過程中的作用環節;磷酸化位點的存在,表明MhWRKY15轉錄因子可受蛋白激酶調節,能夠在細胞信號轉導過程中發揮作用。事實上,WRKY通過與W-box元件發生特異性結合,可調節啟動子中含有該元件的基因的表達,能夠參與多種應答反應[2]。因此,MhWRKY15會在平邑甜茶轉錄調控、信號轉導及對脅迫應答等中起調節作用。
參考文獻 References:
[1] RUSHTON P J, SOMSSICH I E, RINGLER P, SHEN Q J. WRKY transcription factors[J]. Trends in Plant Science, 2010, 5(5): 247-258.
[2] PANDEY S P, SOMSSICH I E. The role of WRKY transcription factors in plant immunity[J]. Plant Physiology, 2009, 150: 1648-1655.
[3] CAI M, QIU D Y, YUAN T, DING X H, LI H J, DUAN L, XU C G, LI X H, WANG S P. Identification of novel pathogen-responsive cis-elements and their binding proteins in the promoter of OsWRKY13, a gene regulating rice disease resistance[J]. Plant, Cell & Environment, 2008, 31: 86-96.
[4] VAN-VERK M C, PAPPAIOANNOU D, NEELEMAN L, BOL J F, LINTHORST H J M. A novel WRKY transcription factor is required for induction of PR-1a gene expression by salicylic acid and bacterial elicitors[J]. Plant Physiology, 2008,146: 1983-1995.
[5] EULGEM T, SOMSSICH I E. Networks of WRKY transcription factors in defense signaling[J]. Current Opinion in Plant Biology, 2007, 10: 366-371.
[6] ROSS C A, LIU Y, SHEN Q J. The WRKY gene family in rice (Oryza sativa)[J]. Journal of Integrative Plant Biology, 2007, 49(6): 827-842.
[7] EULGEM T, RUSHTON P J, ROBATZEK S, SOMSSICH I E. The WRKY superfamily of plant transcription factors[J]. Trends in Plant Science, 2000, 5(5): 199-206.
>> 垂體腺苷酸環化酶激活肽在實驗性偏頭痛大鼠中的作用 棉鈴蟲類胰蛋白酶的生物信息學分析 唇形科植物腳6基腳6基焦磷酸合酶編碼基因及其氨基酸序列的生物信息學分析 黃瓜DVR基因的生物信息學分析 紅白忍冬SABATH甲基轉移酶基因克隆及其生物信息學分析 丹參類貝殼杉烯氧化酶(SmKOL)基因全長克隆及其生物信息學分析 人組蛋白去乙酰化酶11的克隆表達與生物信息學分析 金鐵鎖糖基轉移酶PtT1的克隆與生物信息學分析 黃芩葡萄糖醛酸水解酶基因的克隆、生物信息學分析及表達 太子參分解代謝關鍵酶8′羥化酶基因的克隆及生物信息學分析 人ALK-1近端啟動子的生物信息學分析 酵母轉錄因子結合位點保守性的生物信息學分析 FZ6基因及其蛋白的生物信息學分析 黔北麻羊RERGL基因cDNA克隆與生物信息學分析 不同物種GATA—2基因編碼區生物信息學分析 玉米谷胱甘肽過氧化物酶的生物信息學分析 石榴等觀賞植物DFR基因生物信息學分析 歐文氏桿菌鐵代謝相關基因的生物信息學分析 擬南芥和大白菜YABBY蛋白家族的生物信息學分析 丹參SmNAC1基因的克隆和生物信息學分析 常見問題解答 當前所在位置:l)在線進行分析預測AC相關蛋白序列的等電點、分子質量及氨基酸組成等特征。
1.2.3 蛋白質疏水性預測 利用Protscale程序(http:///protscale/)對希金斯炭疽菌中AC相關蛋白序列進行疏水性測定。
1.2.4 蛋白質轉運肽及信號肽預測 對蛋白質轉運肽(transit peptide)的預測利用TargetP 1.1 Server在線分析實現(http://cbs.dtu.dk/services/TargetP/)[14]。氨基酸信號肽(Signal peptide)的預測則是利用SignalP 3.0 Server[15]在線分析實現(http://cbs.dtu.dk/services/SignalP-3.0/)。在線預測信號肽使用神經網絡方法(Neural networks, NN)和隱馬可夫模型(Hidden markov models, HMM)進行操作,而根據算法不同得出的結果有所差別。
1.2.5 蛋白質二級結構及跨膜區結構預測 對蛋白質二級結構預測采用PHD[16]在線分析實現(http://sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)。同時,對希金斯炭疽菌中AC相關蛋白序列的跨膜區結構預測,利用TMHMM Server v. 2.0實現(http://cbs.dtu.dk/services/TMHMM-2.0/)[15]。
1.2.6 亞細胞定位分析 對希金斯炭疽菌中AC相關蛋白序列進行亞細胞定位分析,利用ProtComp v9.0(http:///berry.phtml?topic=protcompan&group=programs&subgroup=proloc)實現[17],以期獲得蛋白質的定位情況。
2 結果與分析
2.1 保守結構域預測結果
基于SMART分析網站,對ChCap1、ChCap2合并序列進行保守結構域分析。結果表明,Srv2在C端含有兩個相同的CARP保守結構域,合并序列也含有兩個CARP保守結構域,將其初步命名為腺苷酸環化酶蛋白(Adenylate cyclase protein),ChSrv2(圖1)。
2.2 ChSrv2與Srv2氨基酸組成分析結果
根據組成蛋白質的氨基酸殘基的理化性質,將其分為酸性氨基酸、堿性氨基酸、非極性R基氨基酸、不帶電荷的極性R基氨基酸等四大類。對ChSrv2與Srv2中氨基酸殘基組成進行對比分析。結果表明,ChSrv2與Srv2的氨基酸數量以及所占比例、所含最高(最低)比例氨基酸及其所占比例方面均具有較大的一致性(表2)。Srv2所含最高比例的氨基酸為絲氨酸(Ser),比例為11.00%,而ChSrv2含最高比例的氨基酸也為Ser,比例為9.60%;在所含最低比例的氨基酸方面,Srv2為半胱氨酸(Cys),比例為0.80%,ChSrv2也為Cys,最低比例為0.40%(表2)。
2.3 Srv2與ChSrv2理化性質分析結果
Srv2與ChSrv2在氨基酸數量、相對分子質量、理論等電點、負電荷氨基酸殘基數、正電荷氨基酸殘基數、分子式以及原子數量、脂肪族氨基酸指數、總平均親水性等方面均存在著較大的一致性,特別是在理論等電點、不穩定系數,ChCap2與Srv2相似,理論等電點屬于酸性范圍內,不穩定系數均大于40,屬于不穩定蛋白;ChCap1與Srv2則具有較大的差異,其理論等電點屬于偏堿性范圍,其不穩定系數小于40,為穩定蛋白(表3)。
2.4 轉運肽和信號肽特征
轉運肽是一種由12~60個氨基酸殘基所組成的前導序列,其功能為引導那些在細胞溶質中合成的蛋白質進入線粒體和葉綠體等細胞器。除了細胞信號蛋白外各種內在蛋白均利用導肽到達細胞器。通過分析,Srv2與ChCap1、ChCap2均定位于分泌途徑上,其預測值分別為0.883、0.701、0.660,所處的概率有所不同(表4)。就信號肽預測而言,無論是根據NN進行計算,還是根據HMM進行計算,Srv2與ChCap1、ChCap2均不含有信號肽。
2.5 蛋白疏水性預測結果
根據Protscale分析可知,ChCap1位于36位的絲氨酸(S),其親水性最強,為-1.926,而位于129位的脯氨酸(P),其疏水性最強(親水性最弱,下同),為1.626;ChCap2位于54位的蘇氨酸(T),其親水性最強,為-1.005,而位于174位的丙氨酸(A),其疏水性最強,為1.626。Srv2在親水性(疏水性)最強的氨基酸及其所在位置方面均存在著較大的不同(圖2)。
對Srv2與ChCap1、ChCap2的疏水性、親水性數值進行統計分析。結果表明,3種蛋白在親水性最強氨基酸殘基位置、數值,疏水性最強氨基酸殘基位置、數值,疏水性氨基酸殘基數值總和以及親水性氨基酸殘基數值總和等方面均存在著較大差異,惟一的相同點是均為親水性蛋白,這與通過GRAVY計算所得結果一致。
2.6 亞細胞定位特征
通過分析表明,希金斯炭疽菌ChSrv2亞細胞定位與Srv2相同,均定位于質膜上,這與前人對腺苷酸環化酶定位于細胞膜上的研究相一致。
2.7 Srv2在二級結構特征方面與ChCap1、ChCap2存在較大差異
通過分析表明,與Srv2相同,ChCap1、ChCap2均沒有典型的跨膜結構。對其二級結構進行分析表明,在二級結構組成方面,ChCap1、ChCap2與Srv2存在著較大差異(圖3)。
3 小結與討論
作為炭疽菌屬中重要的病原菌,希金斯炭疽菌主要危害十字花科蔬菜,造成重要的經濟損失,國內外學者對其開展了全面而深入的研究。然而,生產上對其引起的炭疽病多采用苯并咪唑類化學藥劑防治,而由于該藥劑作用靶標以及作用時間的特殊性,均容易引起炭疽菌抗藥性出現,嚴重地制約著上述藥劑的進一步使用,急需開發用于防治炭疽病的新作用機制化學藥劑,從而較好地挽回生產上的經濟損失。
近年來,關于AC在酵母[18]、稻瘟菌[19]、大豆疫霉[20]等真核生物中的功能研究已積累了較多的試驗數據,而對于危害禾本科植物造成嚴重損失的禾谷炭疽菌的AC研究卻鮮有報道,隨著該病菌全基因組序列的公布,國內外學者對其開展致病基因、抗藥性基因的研究將日趨深入。本研究基于釀酒酵母中已經報道的Srv2,利用Blast比對、關鍵詞搜索以及通過SMART保守結構域分析、細胞信號肽、跨膜區結構以及二級結構等生物信息學分析,明確該菌中ChCap1、ChCap2與Srv2在理化性質、二級結構、亞細胞定位方面均具有較大的差異性,同時,通過對上述兩個腺苷酸環化酶相關蛋白與其他物種中的同源序列進行Blast比對分析,明確ChCap1、ChCap2分別是希金斯炭疽菌腺苷酸環化酶蛋白序列的重要組成部分,其分別位于N端和C端。通過對其進行序列合并,并結合其SMART保守結構域分析、理化性質、細胞信號肽、跨膜區結構以及二級結構、亞細胞定位等生物信息學分析,結果表明合并后的序列在上述特征、性質方面與Srv2具有較大的相似性。該研究為進一步解析希金斯炭疽菌腺苷酸環化酶的序列以及功能研究提供重要的理論指導。
參考文獻:
[1] 沈瑞清,張 萍,郭成瑾,等.寧夏炭疽菌屬真菌資源研究[J].河南農業科學,2012,41(5):100-102,149.
[2] 梁惠凌,唐 輝.廣西常見花卉真菌性病害的防治[J].廣西園藝, 2002(2):18-19.
[3] HYDE K, CAI L, CANNON P, et al. Colletotrichum-names in current use[J]. Fungal Diversity, 2009, 39: 147-182.
[4] 盧博彬,楊 暹.菜心炭疽病研究進展[J].長江蔬菜,2009(24): 1-5.
[5] 張 華,周而勛,劉自珠,等.菜心炭疽病苗期抗病性鑒定技術[J].華南農業大學學報,1998,19(3):50-53.
[6] 張 華,劉自珠,鄭巖松,等.菜心品種資源炭疽病抗性鑒定[J]. 廣東農業科學,2000(3):47-49.
[7] 李 洋,劉長遠,陳秀蓉,等.遼寧省葡萄炭疽菌鑒定及對多菌靈敏感性研究[J].植物保護,2009(4):74-77.
[8] 韓國興,禮 茜,孫飛洲,等.杭州地區草莓炭疽病病原鑒定及其對多菌靈和乙霉威的抗藥性[J].浙江農業科學,2009(6): 1169-1172.
[9] 徐大高,潘汝謙,鄭 仲,等.芒果炭疽病菌對多菌靈的抗藥性監測[J].華南農業大學學報,2004,32(1):34-36.
[10] 楊 葉,何書海,張淑娟,等.海南芒果炭疽菌對多菌靈的抗藥性測定[J].熱帶作物學報,2008,29(1):73-77.
[11] 詹儒林,李 偉,鄭服叢.芒果炭疽病菌對多菌靈的抗藥性[J]. 植物保護學報,2005,32(1):71-76.
[12] 張令宏,李 敏,高兆銀,等.抗多菌靈的芒果炭疽病菌的殺菌劑篩選及其交互抗性測定[J].熱帶作物學報,2009,30(3): 347-352.
[13] ALTSCHUL S F, MADDEN T L, SCHAFFER A A, et al. Gapped BLAST and PSI-BLAST: A new generation of protein database search programs[J]. Nucleic Acids Res,1997,25(17): 3389-3402.
[14] EMANUELSSON O, BRUNAK S, VON H G, et al. Locating proteins in the cell using TargetP, SignalP and related tools[J]. Nature Protocols, 2007, 2(4): 953-971.
[15] BENDTSEN J D, NIELSEN H, VON H G, et al. Improved prediction of signal peptides: SignalP 3.0[J]. Journal of Molecular Biology, 2004, 340(4): 783-795.
[16] KELLEY L A, STERNBERG M J. Protein structure prediction on the Web: A case study using the Phyre server[J]. Nature Protocals, 2009, 4(3): 363-371.
[17] EMANUELSSON O, NIELSEN H, BRUNAK S, et al. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J]. Journal of Molecular Biology, 2000, 300(4): 1005-1016.
[18] GERST J E, FERGUSON K, VOJTEK A, et al. CAP is a bifunctional component of the Saccharomyces cerevisiae adenylyl cyclase complex[J]. Molecular and Cellular Biology, 1991, 11(3): 1248-1257.
關鍵詞:結核分枝桿菌;38kDa;生物信息學;結構;功能
Bioinformatics Analysis for the Structure and Fuction of 38kDa Protein of Mycobacterium Tuberculosis
ZHANG Yi-qing1,YANG Yuan-yuan2,DING Shu-qin1
(1.Ningxia Medical University,Yinchuan 750004,Ningxia,China;2.The First People's Hospital of Yinchuan,Yinchuan 750001,Ningxia,China)
Abstract:Objective To predict the structure and function of recombinant 38kDa of Mycobacterium tuberculosis using bioinformatics method . Methods By online analysis at bioinformatics websites such as NCBI and Expasy ,employing software packages such as DNAstar and Rasmolto do multi-sequence homological alignment, secondary structure and tertiary structure,antigenic epitope analysis,etc. Results Similarity of 38kDa of Mycobacterium tuberculos compared to phosphate-binding protein of Mycobacterium tuberculosis was 87% . Analysis of the predicted protein indicated a molecular mass of 39113.47 Da, PI was 11.779 , two transmembrane region, function sites and eight antigen epitope were found . Conclusion Bioinformatic is valuable to the study 38kDa 6 ofMycobacterium tuberculosis.
Key words:Mycobacterium tuberculosis ; 38kDa ; Bioinformatics;Structure and fuction
結核病是全球衛生問題之一。2012年WHO的數據顯示,全世界約有860萬人罹患結核病,130萬人死于結核病[1]。中國是全球22個結核病高負擔國家之一,衛計委已將結核病列為全國重點控制重大疾病之一。及時有效的診斷對結核病的防治具有重要的意義。結核分枝桿菌診斷抗原的篩選是目前研究的熱點。
38kDa 蛋白又名pab,是一種磷酸鹽轉運蛋白,是MTB分泌較多的抗原。研究表明其屬于分泌蛋白,結核病患者體內抗38kDa 蛋白抗體水平較高[2]。38KDa 蛋白廣泛用于結核病的血清學診斷試驗,檢測的敏感性和特異性均較高。有關報道38kDa 的診斷特異度在88%~100%之間,痰涂片陽性患者診斷靈敏度36%~89%,痰涂片陰性患者靈敏度16%~54%、肺外結核診斷靈敏度12%~56%[3]。Wu X[4]的研究成果表明:38KDa 蛋白診斷結核病的敏感性為73.6%,特異性為85.4%,并且發現PPD 陽性血清中的抗38KDa 抗體水平高于PPD 陰性。國內張萍等[5]研究重組38KDa 蛋白用于結核病血清學診斷,發現重組38KDa蛋白檢測結核病的敏感性為65.5%,特異性為98.4%,且與痰檢陽性的一致率為69.8%。38KDa 蛋白有較好的應用前景,重組38KDa 蛋白作為結核病皮試診斷試劑,其敏感性和特異性都優于目前的結核菌素試驗。然而有關38KDa蛋白的基本理化特性、二級結構等的研究報道很少。本研究擬先對其進行生物信息學預測分析,為后續更好的的實驗研究奠定基礎。
1 資料與方法
1.1一般資料 結核分枝桿菌38kDa蛋白全長基因序列源自GenBank(Sequence ID: lcl|4289)。
1.2方法 通過NCBI網站(http://ncbi.nlm.nih.gov/),進入blast 界面,進行核酸和蛋白質的同源性比較。利用Prot Param(http:///tools/protparam/html)預測蛋白質理化性質。通過PredictProtein (http: cubic.bioc. columbia. edu/predi ctprotein/)預測氨基酸序列的跨膜區,用DNAstar軟件預測其二級結構。通過SMART(http: //smart. embl-heidelberg.de/smart/show-motifs.pl)預測其結構域。
2 結果
2.1氨基酸序列及理化特性預測 38kDa基因序列由1124個bp組成,編碼368個氨基酸,其中50 個堿性氨基酸(K,R),13個酸性氨基酸 (D,E),112 個疏水性氨基酸 (A,I,L,F,W,V),106個 極性氨基酸(N,C,Q,S,T,,Y)。該蛋白的分子質量單位為39113.47 Da,理論等電點為11.779,堿性氨基酸殘基(Arg+Lys)百分比為15.6%,酸性氨基酸殘基(Asp+Glu)百分比為17.2%,在哺乳動物體外的半衰期為100h,在酵母、大腸埃希菌中的半衰期分別大于20h和10h,在溶液中的不穩定指數為60.32,脂溶性指數為62.72,兩親性指數為-0.436。
2.2氨基酸序列的同源性分析 如圖1所示,38kDa基因氨基酸序列與結核分枝桿菌磷酸鹽轉運蛋白(Sequence ID: ref|WP_052645811.1|)同源性達87%。
圖1 38kDa基因氨基酸序列的同源性分析
2.3二級結構預測 如圖2所示,經DNAstar軟件預測,38KDa蛋白的二級結構中α-螺旋占21%,β-片層占17%,轉角占51%,無規則卷曲占11%。
圖2 38kDa蛋白二級結構預測
2.4跨膜區域、結構域預測 跨膜區域如圖3所示,該蛋白跨膜區有2個,分別為7-23,7-105,該蛋白主要位于細胞外,說明其為分泌性蛋白。SMART預測結果顯示該蛋白的結構域有5個,分別位于8-22、35-47、48-79、214-232、233-286。
圖3 38kDa蛋白跨膜區域預測
2.5信號肽預測 如圖4所示,經Signal法預測顯示38kDa蛋白的信號肽長為20個氨基酸殘基,具于1-20,剪切位點位于20-21氨基酸殘基之間。
圖4 38 kDa蛋白信號肽預測
3 討論
隨著近年來生物學分子信息的發展,用較低的成本和較快的時間,通過計算機模擬相關的輔助信息可以獲得大量的結構和功能信息。本研究中根據對38kDa蛋白氨基酸序列及理化特性預測,我們得知38kDa基因序列由1124個bp組成,編碼368個氨基酸,其中50 個堿性氨基酸(K,R),13個酸性氨基酸 (D,E),112 個疏水性氨基酸 (A,I,L,F,W,V),106個 極性氨基酸(N,C,Q,S,T,,Y)。該蛋白的分子質量單位為39113.47 Da,理論等電點為11.779,堿性氨基酸殘基(Arg+Lys)百分比為15.6%,酸性氨基酸殘基(Asp+Glu)百分比為17.2%,在哺乳動物體外的半衰期為100h,在酵母、大腸埃希菌中的半衰期分別大于20h和10h,在溶液中的不穩定指數為60.32,脂溶性指數為62.72,兩親性指數為-0.436。氨基酸同源性比對發現其基因序列與Genbank公共數據庫檢索出的與結核分枝桿菌磷酸鹽轉運蛋白同源性達87%,說明結核分枝桿菌38kDa蛋白與磷酸鹽轉運蛋白有很高的同源性,但二者仍有差別[6]。經蛋白質二級結構分析, 該蛋白序列中α-螺旋占21%,β-片層占17%,轉角占51%,無規則卷曲占11%。該蛋白跨膜區有2個,分別為7-23,7-105,該蛋白主要位于細胞外,說明其為分泌性蛋白。SMART預測結果顯示該蛋白的結構域有5個,分別位于8-22、35-47、48-79、214-232、233-286。信號肽是一段連續的氨基酸序列,它能夠控制蛋白質分泌路徑和引導蛋白質到達特定的組織細胞[7]。研究信號肽問題對于了解蛋白質功能、研究疾病機理以及研制新藥物等方面都有著重要的作用。本實驗我們經Signal法預測結果顯示38kDa蛋白的信號肽長為20個氨基酸殘基,具于1~20,剪切位點位于20-21氨基酸殘基之間。
本研究我們通過生物信息學原理對結核分枝桿菌38 kDa蛋白有了初步的了解和認識,至于該蛋白的獲得及其在結核病診斷及治療中的價值究竟有多大?還需后續的實驗研究加以證實。
參考文獻:
[1]Organization, W.H.Global tuberculosis control epidemiology,strategy, financing WHO report,2012.
[2]CHAN ED, HEIFETS I, ISEMAN MD. Immunogic diagnosis of tuberculosis: a review[J].Tubercle and Lung Disease, 2000, 80(3): 131- 140.
[3]Julián E, Matas L, Alcaide J,et al. Comparison of antibody responses to a potential combination of specific glycolipids and proteins for test sensitivity improvement in tuberculosis serodiagnosis [J]. Clin Diagn Lab Immunol, 2004 ;11(1):70-76.
[4]Wu X,Yang Y,Zhang J,et al.Humoral immune responses against the Mycobacterium tuberculosis 38-kilodalton, MTB48, and CFP-10/ESAT-6 antigens in tuberculosis[J]. Clin Vaccine Immunol, 2010,17(3):372-375.
[5]Zhang Ping,Zeng Xiao-fan, Ding Jian-zhu, et al. Evaluation of thecell wall antigen and recombinant 38Kd protein of Mycobacterium
tuberculosis for serodiagnostic tests[J]. Chinese Journal of Microecology,2009,21(1):73-74.