青枯菌CysA蛋白功能的生物信息学研究
- 文件大小:1883 (KB)
- 文档格式:.docx
文档分类: 化学论文
关于本文
- 本文标题:青枯菌CysA蛋白功能的生物信息学研究.docx
- 链接地址:https://wk.sbvv.cn/view/21229.html
- 内容摘要:山西师范大学本科毕业论文青枯菌CysA蛋白功能的生物信息学研究姓名院系专业班级学号指导教师答辩日期成绩生命科学学院青枯菌CysA蛋白功能的生物信息学研究内容摘要CysA蛋白是一种ABC转运蛋白,可以将硫酸盐和硫代硫酸盐转运进入细胞。本论文通过对青枯菌CysA基因和CysA蛋白质进行生物信息方面的分析蛋白质的结构域、跨膜区域、亲疏性、卷曲螺旋区域、蛋白质的信号肽分别通过SMART、SOSUl和TMHMM、ProtScale、COILS、SignaIP等在线网站来预测。最后再预测CysA的二级结构和三级结构,同时也预测蛋白质的亚细胞定位,并构建该蛋白的系统发生树。结果分析该蛋白质有一段AAA结构域,为亲水性蛋白,无跨膜结构,位于细胞质中,不含卷曲螺旋,也没有信号肽。无规则卷曲与螺旋在CysA中占比最大,三级结构呈桶状。从系统发生树上可以看出青枯菌与蒲桃青枯菌、血液病原细菌亲缘关系很近。通过研究发现CysA蛋白与其它复合体亚基结合共同完成转运硫酸盐和硫代硫酸盐,对青枯菌的生命活动起重要作用,本论文主要分析CysA蛋白的功能,为更进一步了解青枯菌提供一些理论依据。【关键词】青枯菌;生物信息;CysA蛋白TheResearchontheFunctionofCysAProteiinRalstoniasolanacearumAbstractCysAisanABCtraporterthattraportssulfatesandthiosulfatesintocells。HerebiologicalinformationofbacterialCysAgeneandCysAproteinwasanalyzed。ThestructureoftheproteindomaitramembraneregionpropertycoiledcoilareaproteiignalpeptiderespectivelybySMARTTMHMMProtScaleSOSUICOILSandSignaIPonlinewebsitetopredict。FinallythesecondarystructuretertiarystructureandthesubcellularlocalizationoftheCysAproteinwerepredictedandthephylogenetictreeoftheproteinwascotructed。TheresultsshowedthatCysAhasaAAAdomain。Ithasnotramembranestructureandisahydrophilicprotein。Itdoesnthavecurlyspiralalsohavenosignalpeptide。Theahelixandrandomcoilaccountedforthelargestproportioninthesecondarystructureandthetertiarystructurewasbarrelshaped。Theproteinislocatedinthecytoplasm。FromthephylogenetictreeitcanbeseenthatRalstoniasolanacearumiscloselyrelatedtoralstoniasyzygiiandblooddiseasebacterium。FinallyitwasfoundthatCysAproteincombinedwithothercomplexsubunitstocompletethetraportofsulfateandthiosulfatewhichplayedanimportantroleinthelifeactivitiesofsolanacearum。ThispapermainlyanalyzedthefunctionofCysAproteinprovidingsometheoreticalbasisforfurtherundetandingofsolancearum。【KeyWords】RalstoniasolanacearumbioinformaticsCysAprotein目录内容摘要1目录31引言51。1青枯菌研究概述51。1。1青枯病概述51。1。2青枯菌概述及治病机理51。1。3ABC转运蛋白概述61。1。4CysA蛋白的研究进展61。2研究目的和意义61。3技术路线图72分析软件及序列获取72。1分析软件及网站72。2序列获取83分析方法83。1基因序列的基本信息83。2蛋白质的基本性质83。3结构域预测83。4亲疏性分析93。5预测跨膜区域93。6预测卷曲螺旋区域93。7信号肽分析93。8预测二级结构93。9三级结构预测93。10亚细胞定位93。11构建系统发生树94分析结果104。1基因序列的基本信息104。2蛋白质的基本性质114。3结构域预测114。4亲疏水性分析124。5预测膜整合蛋白的跨膜区134。6预测卷曲螺旋134。7信号肽分析144。8预测二级结构154。9三级结构预测164。10亚细胞定位174。11构建系统发生树175讨论176参考文献19致谢20青枯菌CysA蛋白功能的生物信息学研究学生姓名:冯静指导教师:罗永平1引言1。1青枯菌研究概述1。1。1青枯病概述青枯病是细菌性植物病,当细菌侵染植物后,会引起植株的枯萎,此时植株虽萎垂但呈现青绿色,所以被称为青枯病。[1]此病主要出现于热带、亚热带还有温暖的地区,在我们国家,很多地方比如山东、云南、河南、江苏等地普遍存在。[2]青枯病可以发生在450多种植物中,如烟草、番茄、马铃薯等,严重影响农作物的产量,导致极大的经济损失。[3]1。1。2青枯菌概述及治病机理青枯病主要是由茄科雷尔氏菌(Ralstoniasolanacearum,简称青枯菌)入侵植株造成的。青枯菌是一种好氧性的革兰氏阴性菌,杆状单细胞,两端呈钝圆状,通常有13根单极生鞭毛,大小约为(0。50。8)×(1。32。2)um,可以运动,没有荚膜。在培养基上观察到菌落呈现润滑有光泽的圆盘状,随着时间推移,菌落会由最初的乳白色变为褐色。细菌在温度为3035℃、PH值为6。6左右时生长状况最好。[4]温度的突然变化可以使细菌产生适应性休克反应,使他们可以在多种多样的环境中繁衍。[5]病菌可以在植株受感染部位或者混有病残体的土壤和肥料里越冬,等到第二年春天开始侵染植物,青枯菌适应环境能力强,可以在土壤中长时间存活,在高温潮湿的环境中有更强的生命力。病菌通过土壤、肥料、患病植株的组织渗出液等方式传播。[6]青枯菌从植物的伤口部位入侵到达木质部,然后在维管束扩散,影响导管正常的运输水分的功能,最终使植株枯萎。除此之外,当病菌的繁殖数量较多时,还可以入侵未受伤的植物,从植株的次生根的根冠进入,穿过一层鞘到达主根的表皮,病菌可以在根部繁殖26天,在此期间植株没有明显的症状。病菌继续繁殖穿过皮层到达细胞间隙,使得中胶层受到破坏,造成细胞空腔。此时植株只有薄壁组织和侵填体来防御病菌,当病菌大量增殖,穿过最后的这两道物理屏障后到达导管,会分泌一些致病因子,从而造成维管束堵塞,最终使植物体萎焉。[78]致病因子主要有胞外多糖、Hrp基因编码的III型分泌系统、细胞壁分解酶等,这些致病因子可以保护病菌自身并且帮助病菌侵入植物体。[9]1。1。3ABC转运蛋白概述自然生物体在吸取营养物质和排泄废物的过程中,腺苷三磷酸结合盒转运蛋白(简称ABC转运蛋白)发挥了重要的作用。[10]在结构上,ABC转运蛋白包含两个核苷酸结合区域和两个跨膜结合区域。核苷酸结合域的序列比较保守,包括ATP结合基序、WalkerA序列、WalkerB序列、Qloop序列、Hloop序列。该结构域存在于细胞质中,能够结合ATP并将其水解来为物质的转运提供必需的能量。而跨膜结构域序列没有那么保守,转运物质不同,序列也相应的改变。[1112]1。1。4CysA蛋白的研究进展M。Salanoubat等人[13]曾在2002年测出了青枯菌GMI1000的基因组序列,CysA基因编码的CysA是一种ABC转运蛋白。该复合物由一个CysP(溶质结合蛋白),一个CysT(跨膜蛋白)、一个CysW(跨膜蛋白)和两个CysA(ATP结合蛋白)组成。CysA蛋白负责能量与转运系统偶联,可以将硫酸盐硫代硫酸盐转运进入细胞。具体过程为:ATP+H2O+sulfatethiosulfate(out)=ADP+H++phosphate+sulfatethiosulfate(in)[13],如图11所示。AB图11ABC转运蛋白机制注:A:硫酸盐转运进入细胞。B:硫代硫酸盐中转运进入细胞(图片引自UniProt)1。2研究目的和意义在国内,该复合物很少被报道,国外学者对CysP蛋白做了些许研究[1417],CysA蛋白很少被研究。该论文主要对CysA蛋白做了生物信息学方面的分析,为更好的理解青枯菌,从而为预防青枯病提供一些理论依据。1。3技术路线图2分析软件及序列获取2。1分析软件及网站本论文的目的主要是对青枯菌的CysA蛋白进行生物信息分析,进而预测其功能。在此过程中,需要使用一些数据库来获取基因及蛋白的相关信息,同时还需要使用一些软件及网站来进行生物信息分析。数据库:①NCBI:https:www。ncbi。nlm。nih。gov,NCBI是一级核酸数据库,可以下载CysA基因和CysA蛋白的序列信息等。②UniProt:http:www。uniprot。org,UniProt是一级蛋白质序列数据库,可以查看CysA蛋白序列的相关信息。网站:①SMART网站http:smart。emblheidelberg。de,该网站可以预测CysA蛋白质的结构域。②ProtScale网站https:web。expasy。orgprotscale,可以预测CysA蛋白的亲疏性。③SOSUI网站http:harrier。nagahamaibio。ac。jpsosuisosui_submit。html,可以预测CysA蛋白的亲疏性。④TMHMMServer网站http:www。cbs。dtu。dkservicesTMHMM,可以预测CysA蛋白质中的跨膜螺旋。⑤CELLO网站http:cello。life。nctu。edu。tw,将蛋白质序列提交后可预测该CysA蛋白的亚细胞定位。⑥COILS网站https:www。ch。embnet。orgsoftwareCOILS_form。html,可以预测CysA蛋白的卷曲螺旋区域。⑦SignaIP网站http:www。cbs。dtu。dkservicesSignalPindex。php,是用来预测革兰氏阳性菌、古细菌、真核生物、革兰氏阴性菌的蛋白质中是否有信号肽,并且预测出信号肽切割位点的位置。⑧SOPMA网站http:psapbil。ibcp。frcgibinpsa_automat。plpage=PSApsa_sopma。html,可以用来预测CysA蛋白的二级结构。⑨Jpred4网站http:www。compbio。dundee。ac。ukjpred,将CysA蛋白的序列提交后,可以分析该蛋白的二级结构。⑩SWISSMODEL网站https:swissmodel。expasy。org,可以模拟CysA蛋白的三级结构。(3)软件:BioEdit2。2序列获取打开NCBI,选择AllDatabases中的Gene在后面一栏中输入基因ID号1220171,点击Search进行检索。下载基因序列的FASTA格式,再链接到蛋白质序列并将其下载。3分析方法3。1基因序列的基本信息BioEdit软件能够分析核苷酸序列。在BioEdit软件中打开已保存好的cysA基因序列,选用NucleotideComposition对基因的碱基分布进行分析。3。2蛋白质的基本性质使用BioEdit分析基因序列后,继续打开已保存好的CysA蛋白序列。选用AminoAcidComposition对CysA蛋白的碱基百分比进行分析。3。3结构域预测将CysA的序列提交到SMART网站来分析结构域。3。4亲疏性分析(1)将CysA蛋白序列提交到ProtScale网站来预测该蛋白的亲疏性,标度尺选用KyteDoolittle,其他参数保持默认值。(2)SOSUI网站也可以预测该蛋白的跨膜结构,将CysA蛋白的序列提交到该网站上。3。5预测跨膜区域将CysA蛋白的序列提交到TMHMM网站,来预测CysA蛋白是否有跨膜区域。3。6预测卷曲螺旋区域首先打开COILS网页,将蛋白质序列粘贴到对话框,其他保持默认值不变,点击“RunCoils”,保存其结果。3。7信号肽分析打开SignaIP网站,点击“UploadFastaFile”,将保存好的蛋白质序列上传,Organismgroup中选择Gramnegative,Outputformat中选择Longoutput,点击“submit”,保存其结果。3。8预测二级结构(1)打开SOPMA网站,在对话框输入蛋白质序列,提交后保存其结果。(2)打开Jpred4网站,在对话框中输入蛋白质序列,点击ResetForm保存其推测的结果。3。9三级结构预测将CysA序列提交到SWISSMODEL网站即可推测该蛋白质的三级结构。3。10亚细胞定位CELLO网站可以预测CysA蛋白的亚细胞定位,在“organisms”一栏中选择“Gramnegative”再将CysA蛋白质的序列提交进行预测。3。11构建系统发生树在系统发生树中,根据亲缘关系较近的并且已经被注释功能的蛋白质,来预测CysA蛋白的功能。将CysA蛋白序列提交到NCBI中的Blast,在结果页面中,选择15条序列并将其下载保存,命名为BD,再将之前保存好的CysA蛋白序列复制到BD文件中。将BD文件中的序列提交到MEGA软件中进行多序列比对,使用alignbyclustalW的比对方法,参数设置选择默认,最后将结果以MEGA形式保存下来命名为AF。接下来构建系统发生树,选用CotructTestNeighborjoinjingTree的方法,在参数设置中,TestofPhylogeny使用常用的Bootstrapmethod方法来对建树结果进行检验,在No。ofBootstrapReplicatio选择500的步长检测。在ModelMethod这一栏选用pdistance模型进行计算。在GapsMissingDataTreatment这一栏中选择Patialdeletion对含有空位的列进行部分删除,删除程度即SteCoverageCutoff设置成50%,将最终的建树结果保存下来。4分析结果4。1基因序列的基本信息图41核酸序列碱基分布注:绿色表示A碱基,蓝色表示C碱基,黑色表示G碱基,红色表示T碱基从图41上面的文字我们可以看出DNA分子完整序列长度为1119个碱基对,一条DNA链的分子量为341785。00道尔顿。从图中可以得知各个碱基的数量,如表41。C+G含量占71。05%,A+T含量占28。95%,可知该核酸结构较稳定。表41核酸序列碱基分布表NucleotideACGTC+GA+TNumberMol%16314。5738834。6740736。3716114。3954971。0532428。954。2蛋白质的基本性质图42氨基酸含量分布图由图42的文字可知,CysA序列长度为372个氨基酸,分子量为40759。24道尔顿,下方的表42中显示了各氨基酸的数量及占比具体数值如表,其中亮氨酸和丙氨酸占比最高,都达到12。10%,其它氨基酸的占比都较低,小于10%。表42蛋白质序列碱基分布表AminoAcidNumberMol%AlaLeuValArgGlyGluGlnAspProPheSerThrHisIleLysAsnTyrMetTrpCysALVRGEQDPFSTHIKNYMWC454537343128201917161515121287532112。1012。109。959。148。337。535。385。114。574。304。034。033。233。232。151。881。340。810。540。274。3结构域预测图43蛋白质结构域CysA蛋白在第27位氨基酸到第214位氨基酸之间存在一段AAA结构域。在AAA结构域中,有αβα核心域,在这里发现了P环NTPase的WalkerA与B基序。[18]该结构域的主要作用是使用ATP水解产生的能量,来将硫酸盐和硫代硫酸盐转运进入细菌。4。4亲疏水性分析图44CysA亲疏性分析注:纵坐标表示的是氨基酸的亲疏性的值,正值表示蛋白质的疏水性,负值表示的是蛋白质的亲水性,正值越大,反映蛋白质疏水性越强,负值越大,反映蛋白质的亲水性越强;横坐标表示氨基酸的位点。(1)使用ProtScale网站预测CysA蛋白亲疏性的结果如图44,结果显示CysA蛋白的第71位缬氨酸得分显示最低,说明该处的氨基酸亲水性是最强的,为2。644;第149位精氨酸得分显示最高,说明该处的氨基酸疏水性是最强的,为2。111。由图44,CysA蛋白的亲水性区域略大于疏水性区域,认定CysA为亲水性蛋白。(2)使用SOSUI网站预测的结果如图45。结果显示CysA蛋白为可溶性蛋白。图45CysA的亲水性分析4。5预测膜整合蛋白的跨膜区TMHMM网站预测的结果如图46:图46CysA的跨膜性分析注:红色表示的是跨膜结构,蓝色表示的是膜内结构,玫瑰红色表示的是膜外结构。从图46中可以看出CysA蛋白没有跨膜结构,预测此蛋白是外周膜蛋白。4。6预测卷曲螺旋从图47中可以看出CysA蛋白几乎不含有卷曲螺旋结构。卷曲螺旋是由27个螺旋形成,常常用于形成二聚体。CysA蛋白不含卷曲螺旋说明该蛋白是由一条亚基组成。图47CysA的卷曲螺旋预测注:纵坐标显示了该蛋白含有卷曲螺旋结构的可能性,横坐标表示的是氨基酸序列的位点,14残基、21残基、28残基读长的可能性结果分别用绿色,紫色,红色的线来表示。4。7信号肽分析图48CysA的信号肽分析注:纵坐标表示该蛋白中含有信号肽的可能性,红色实线表示蛋白中含有由sec转运并且被信号肽酶丨切割的分泌信号肽,蓝色虚线该蛋白含有由sec转运并且能够让信号肽酶2切割的脂蛋白信号肽,紫色虚线表示该蛋白中含有由TAT转运并被信号肽酶丨切割的TAT信号肽,黄色虚线表示该蛋白质中不含信号肽由图48可以看出,CysA蛋白中含有由sec转运并且被信号肽酶丨切割的分泌信号肽的概率为0。0031。该蛋白含有由sec转运并且能够让信号肽酶2切割的脂蛋白信号肽的概率为0。0057;该蛋白中含有由TAT转运并被信号肽酶丨切割的TAT信号肽的概率为0。0009,概率都非常低。所以可以推测出CysA蛋白中不含有任何信号肽,所以该蛋白不是分泌蛋白,与前面预测的蛋白定位相符合。4。8预测二级结构(1)使用SOPMA网站预测结果如图49:图49CysA的二级结构注:蓝色曲线代表无规则卷曲;绿色曲线代表β转角;蓝色曲线代表α-螺旋;红色曲线代表延伸链区根据图49,螺旋的数量是最多的,其次无规则卷曲含量也很高。CysA蛋白含有的二级结构具体情况见下表43:表43CysA二级结构及其百分比二级结构代表字母个数百分比α螺旋β折叠β转角无规则卷曲HETC133892013035。75%23。92%5。38%34。95%α螺旋,β折叠还有β转角可以提高蛋白质的稳定性,无规则卷曲可以用来连接其他二级结构,从图中可以看出α螺旋最多。(2)使用Jpred4网站进行蛋白质二级结构的预测结果如图410:图410CysA整体的二级结构分布CysA蛋白部分二级结构分布如图411所示:图411CysA部分二级结构分布注:绿色的箭头表示的是Beta折叠,而红色的管子则表示的是Alpha螺旋。其中,JNETCONF表示的是此次预测中的每个位点的可信度,值越高,反映该位置的预测出来的结果越可信;而JNETJURY一栏中的星号则表示的是采用不同途径预测,得到差异较大的结果,相应的该位置的可信度就越低。4。9三级结构预测SWISSMODEL网站对CysA蛋白建模,如图412:图412CysA三级结构及二级结构分布注:在ModelTemplateAlignment中,隐约可见的箭头表示的是beta折叠,直筒表示的是alpha螺旋。由图412得到的QMEAN值,LocalQualityEstimate图还有Comparison图都可知该结果是比较可靠的。图413为CysA的三级结构:图413CysA的三级结构4。10亚细胞定位CELLO网站预测的结果如表44:表44CysA亚细胞定位分析CELLOpredictionLocationreliableindexExtracellularOuterMembranePeriplasmicInnerMembraneCytoplasmic0。0170。0540。1580。3384。433从表44中可以看出,该蛋白位于细胞外基质、外膜、细胞周质、内膜的概率极小,有很大可能位于细胞质中。4。11构建系统发生树一般是利用统计概率的算法来构建系统发生树,树的节点上的值表示有百分之多少棵树含。。。
- 版权声明:知知范文网 本站所有内容的版权归相应内容作者或权利人所有,本站不对涉及的版权问题负法律责任。
- 内容来源:本站所有内容均有网络公开等合法途径整理而来,该资料仅作为交流学习使用,并无任何商业目的,任何访问,浏览本站,购买或者未购买的人,就代表已阅读,理解本条声明
- 免责声明:内容所标价格,是对本站搜集、整理资料以及本站运营必须费用支付的适当补偿,资料索取者尊重版权方的知识产权,谢谢!