蜜蜂vha16基因推測編碼蛋白質(zhì)的功能預(yù)測
摘 要:本文采用生物信息學(xué)的方法對蜜蜂(Apis mellifera)vha16基因的cDNA序列推測編碼蛋白(GenBank登記號為AAQ21381)進(jìn)行性質(zhì)分析和功能預(yù)測。分析表明該基因有一個(gè)ORF,起始密碼子在第59位,終止密碼子在第527位,推測編碼156個(gè)氨基酸,預(yù)測其理論相對分子量為15.97kDa,理論等電點(diǎn)pI=6.71。TMHMM-2.0軟件分析發(fā)現(xiàn),該基因的推測編碼蛋白質(zhì)序列的第15~34位、第55~77位、第92~114位和第127~149位分別有一個(gè)跨膜區(qū)。保守結(jié)構(gòu)功能域分析發(fā)現(xiàn)該推測編碼蛋白序列與目前已知的蛋白質(zhì)結(jié)構(gòu)功能域數(shù)據(jù)庫中許多物種的ATP合成酶具有相似的結(jié)構(gòu)功能域,在其第13~78位和第91~156位分別為ATP合成酶C亞基保守結(jié)構(gòu)功能域。據(jù)此可推測該基因編碼蛋白即為蜜蜂ATP合成酶16kDa蛋白脂質(zhì)C亞基。
關(guān)鍵詞:蜜蜂(Apis mellifera);vha16基因;生物信息學(xué);功能預(yù)測
生物信息學(xué)是當(dāng)前生物科學(xué)的研究熱點(diǎn)之一,蛋白質(zhì)結(jié)構(gòu)功能預(yù)測是其中一項(xiàng)重要的內(nèi)容。由于蛋白質(zhì)的生物學(xué)功能在很大程度上依賴其空間結(jié)構(gòu),因而進(jìn)行蛋白質(zhì)的結(jié)構(gòu)預(yù)測對于理解蛋白質(zhì)結(jié)構(gòu)與功能的關(guān)系具有重要的意義[1]。目前國際上正在研究通過完整基因組的數(shù)據(jù)采集來確定蛋白質(zhì)的功能。艾森伯格工作組(洛杉磯加利福尼亞大學(xué))根據(jù)某些物種間存在同源性蛋白質(zhì),且這些同源性蛋白質(zhì)可以相互作用這一原理發(fā)展了一種預(yù)測蛋白質(zhì)功能的方法[2]。最近,又發(fā)展了幾種計(jì)算機(jī)識別蛋白質(zhì)功能的新方法,這些方法的原理是根據(jù)相同特征的蛋白質(zhì)之間具有功能上的關(guān)聯(lián)或直接作用[3]。一般來說,對于蛋白質(zhì)功能預(yù)測分析而言,最為重要的莫過于分析目的蛋白質(zhì)是否和具有功能信息的已知蛋白質(zhì)相似。其中主要有兩個(gè)策略:同源序列分析和功能區(qū)相關(guān)的保守序列特點(diǎn)分析。
到目前為止,已經(jīng)從多種動物的質(zhì)膜上都發(fā)現(xiàn)了運(yùn)輸質(zhì)子的液泡型ATP合成酶(vacuolar-type ATPase,V-ATPase)[4-7]。陳大福也利用EST數(shù)據(jù)庫電子克隆了蜜蜂(Apis mellifera)vha16基因的cDNA序列(另文發(fā)表)。本文將采用生物信息學(xué)的方法分析蜜蜂vha16基因的cDNA序列(GenBank登記號為AY343324)推測編碼蛋白質(zhì)的基本性質(zhì),并與其他物種的同源蛋白比較,進(jìn)行同源序列和功能區(qū)相關(guān)的保守序列特點(diǎn)分析,初步推測其功能。
1方法
1.1基本性質(zhì)分析
本研究是使用Amersham公司的RESearch-version 1.0軟件分析蜜蜂vha16 cDNA序列推測編碼蛋白質(zhì)的氨基酸組成、理論分子量;聯(lián)網(wǎng)到http://au.expasy.org/tools/pi_tool.html用其Compute pI/MW工具分析其等電點(diǎn)(pI)[8]。
1.2跨膜區(qū)分析
蛋白質(zhì)的跨膜螺旋特征是可通過序列分析直接得到預(yù)測,并能獲得較為理想的結(jié)果。聯(lián)網(wǎng)至“http://genome.cbs.dtu.dk/services/TMHMM-2.0”或者“http://www.ch.embnet.org/software / TMPRED _form.html”可進(jìn)行蛋白質(zhì)序列的跨膜區(qū)分析。
1.3蛋白質(zhì)的結(jié)構(gòu)功能域分析
簡單模塊構(gòu)架搜索工具(Simple Modular Architecture Research Tool,SMART)是目前較為理想的蛋白質(zhì)結(jié)構(gòu)功能域分析工具[9]。該數(shù)據(jù)庫由EMBL建立,其中集成了大部分目前已知的蛋白質(zhì)結(jié)構(gòu)功能域的數(shù)據(jù),可用于蛋白質(zhì)結(jié)構(gòu)功能域的分析。1.4不同物種間蛋白質(zhì)同源性比較
從NCBI的蛋白質(zhì)庫中下載美洲煙夜蛾(Heliothis virescens,AAC37176)、煙草天蛾(Manduca sexta,CAA46187)、紅火蟻(Solenopsis invicta,AAG17394)、 2種果蠅(Drosophila melanogaster,NP_724476;Drosophila yakuba,AAR10032)、按蚊(Anopheles gambiae,XP_311406)、伊蚊(Aedes aegypti,AAB71660)等昆蟲的ATP合成酶16kDa蛋白脂質(zhì)C亞基蛋白序列,將蜜蜂vha16基因的推測蛋白序列(AAQ21381)與之進(jìn)行多重對齊。Clustal W/X軟件(http://www.ddbj.nig.ac.jp/E-mail/clustalw-e.html或http://www.ebi.ac.uk/clustalw/)是十分重要的序列多重對齊分析軟件。
2 結(jié)果與分析
2.1基本性質(zhì)
經(jīng)RESearch-version 1.0軟件分析蜜蜂vha16 cDNA序列,發(fā)現(xiàn)僅有一個(gè)ORF,起始密碼子在第59位,終止密碼子在第527位,推測編碼蛋白含有156個(gè)氨基酸,預(yù)測其理論相對分子量為15.97 kDa,理論等電點(diǎn)pI=6.71。
2.2跨膜區(qū)
將蜜蜂vha16基因推測蛋白輸入http://genome.cbs.dtu.dk/services/TMHMM-2.0/分析發(fā)現(xiàn),該蛋白質(zhì)序列的第15~34位、第55~77位、第92~114位和第127~149位分別含有一個(gè)跨膜區(qū)(圖1)。
圖 1 蜜蜂vha16推測編碼蛋白質(zhì)的跨膜區(qū)分析結(jié)果 跨膜:transmembrane; 膜內(nèi):inside; 膜外:outside
2.3蛋白質(zhì)的結(jié)構(gòu)功能域分析
輸入http://www.ncbi.nlm.nih.gov/BLAST/進(jìn)行保守結(jié)構(gòu)功能域分析,結(jié)果發(fā)現(xiàn)該推測編碼蛋白序列與目前已知的蛋白質(zhì)結(jié)構(gòu)功能域數(shù)據(jù)庫中許多物種的ATP合成酶具有相似的結(jié)構(gòu)功能域,在其第13~78位和第91~156位分別為ATP合成酶C亞基保守結(jié)構(gòu)功能域(圖2)。
圖 2 蜜蜂vha16 cDNA推測編碼蛋白保守結(jié)構(gòu)功能域的檢索結(jié)果
ATP-synt_C:ATP合成酶C亞基;頂部數(shù)字表示推測蛋白的氨基酸序列位
2.4不同物種間蛋白質(zhì)同源性比較
通過多重對齊分析發(fā)現(xiàn),將蜜蜂vha16基因的推測蛋白質(zhì)序列與美洲煙夜蛾、煙草天蛾、紅火蟻、2種果蠅、按蚊、伊蚊等昆蟲的ATP合成酶16kDa蛋白脂質(zhì)C亞基蛋白序列,其保守區(qū)域的一致性在85%以上,同源性都在90%以上(圖3)。
3 討論
推測未知蛋白的功能較好的方法是利用同源對比發(fā)現(xiàn)蛋白質(zhì)序列的保守區(qū)域。如果發(fā)現(xiàn)一個(gè)蛋白質(zhì)序列和較多不同種屬或者同一種屬的蛋白質(zhì)序列具有較高的同源性(大于30%),那么提示待分析的蛋白質(zhì)序列可能是相應(yīng)家族的成員[10]。所以,根據(jù)蛋白質(zhì)同源性和保守結(jié)構(gòu)功能域分析的結(jié)果,可以初步推測蜜蜂vha16基因的推測編碼蛋白與其他物種的ATP合成酶在功能上應(yīng)該存在著確實(shí)的相關(guān)性,屬于同一個(gè)蛋白質(zhì)家族,據(jù)此可推測該基因編碼蛋白即為蜜蜂ATP合成酶16kDa蛋白脂質(zhì)C亞基。
參考文獻(xiàn)
[1]來魯華. 蛋白質(zhì)結(jié)構(gòu)預(yù)測與分子設(shè)計(jì). 北京: 北京大學(xué)出版社, 1993
[2]Spengler S J. Bioinformatics in the information age. Science, 2000, 287(5456): 1221-1223
[3]劉秀艷, 滕勝. 應(yīng)用計(jì)算機(jī)識別蛋白質(zhì)功能. 生命的化學(xué), 2000, 20(3): 100-102
[4]Finbow M E, Goodwin S F, Meagher L, et al. Evidence that the 16 kDa proteolipid (subunit c) of the vacuolar H+-ATPase and ductin from gap junctions are the same polypeptide in Drosophila and Manduca: molecular cloning of the Vha16k gene from Drosophila. Journal of Cell Science, 1994, 107: 1817-1824
[5]Azuma M, Ohta Y. Changes in H+-translocating vacuolar-type ATPase in the anterior silk gland cell of Bombyx mori during metamorphosis. The Journal of Experimental Biology, 1998, 201: 479-486
[6]Wieczorek H, Gruber G, Harvey W R, et al. The plasma membrane H+-V-ATPase from tobacco hornworm midgut. Journal of Bioenergetics and Biomembranes, 1999, 31: 67-74
[7]Vitavska O, Wieczorek H, Merzendorfer H. A novel role for subunit C in mediating binding of the H+-V-ATPase to the actin cytoskeleton. The Journal of Biological Chemistry, 2003, 278: 18499-18505
[8]Bjellqvist B, Basse B, Olsen E, Celis J E. Reference points for comparisons of two-dimensional maps of proteins from different human cell types defined in a pH scale where isoelectric points correlate with polypeptide compositions. Electrophoresis, 1994, 15: 529-539
[9]Schultz J, Milpetz F, Bork P, Ponting C P. SMART, a simple modular architecture research tool: Identification of signalling domains. Proc Natl Acad Sci USA, 1998, 95: 5857-5864
[10]張成崗, 賀福初. 生物信息學(xué)方法與實(shí)踐. 北京: 科學(xué)出版社, 2002, 93
熊翠玲 陳大福 福建農(nóng)林大學(xué)蜂學(xué)學(xué)院
1126