常见问题欢迎来到大学堂论文网,权威的论文代写、论文发表平台,服务论文行业十二年,专业为您提供论文代写代发服务
点击咨询韦老师  点击咨询李老师
范文期刊如找不到所需论文资料、期刊 请您在此搜索查找
 
您当前的位置:主页 > 农业论文 >

陆地棉GhZIP家族基因及其生物信息学分析

发布时间:2019-09-29

 

  酵母( Saccharomyces cerevisiae) 中克隆的 ZRT1和 ZRT2 ( Zinc-regulated transporter) 蛋白是最早鉴定的具有锌离子高亲和性和低亲和性转运的蛋白[1 -2],植物中最早鉴定的 2 价铁离子转运蛋白是拟南芥( Arabidopsis thaliana) 根部受铁缺乏诱导表达的 IRT1( Iron-regulated transporter)[3],比较发现,这类蛋白均具有类似的功能结构域,因此被统称为“ZIP”家族,即“ZRT/IRT-like protein”.最初的研究发现,ZIP 蛋白只具有转运铁和锌离子的功能,随着研究的深入发现这类基因家族还可以转运铜、镉和锰等多种金属阳离子,是植物体内非常重要的金属阳离子转运蛋白,与植物的离子储运机制及胁迫耐受性均有直接关系,而且 ZIP 基因家族在动物、微生物等其他生物界分布也非常广泛[4].
  
  不同植物中 ZIP 基因的研究越来越多。拟南芥基因组存在 16 个 ZIP 成员,分别是 AtIRT1 ~AtIRT3 和 AtZIP1 ~ AtZIP13,各个基因的功能已经研究的比较明确[5]; 水稻( Oryza sativa) 全基因组中共预测有 17 个 ZIP 成员,其中有 8 个成员已经报道[6]; 大麦( Hordeum vulgare) 中 HvIRT1、HvZIP3、HvZIP5、HvZIP8 的定位和功能都有深入研究[7 -8];苜蓿( Medicago truncatula) ZIP 成员中的 MtZIP1、MtIRT3 ~ MtIRT7 通过酵母功能互补已明确了所转运的金属阳离子[9 -10]; 玉米( Zea mays) 基因组中预测有 9 个 ZIP 成员,但是还没有相关的功能研究报道[11]; 重金属超积累植物东景天( Sedum alfredii) 已经克隆了 SaZIP1、SaZIP4、SaZIP11 这3 个 ZIP 家族基因,对这 3 个基因的功能开展了一定的研究[12];在珍稀濒危兰科药用铁皮石斛 ( Dendrobium offici-nale) 中克隆的 DoZIP1 在根中的表达量最高[13].
  
  此外,在豌豆( Pisum sativum)[14]、番茄( Lycopersiconesculentum)[15]和葡萄( Vitis vinifera)[16]等植物中也有关于 ZIP 基因的报道。
  
  陆地棉( Gossypium hirsutum) 是当今最重要的棉花栽培品种,占全球棉花种植面积 90% 以上,但是因其基因组是异源四倍体( AADD) ,严重制约了全基因组测序工作。随着二倍体 D 亚组雷蒙德氏棉[17]和 A 亚组亚洲棉[18]测序工作的完成,陆地棉遗传标准系 TM-1 全基因组序列也在最近得以公布[19 -20],这势必加速棉花功能基因的研究进度。当前关于棉花 ZIP 基因的研究还很少,只有一个 GhZ-IP 基因有报道[21].本研究通过对陆地棉全基因组的搜索鉴定出可能的全部 GhZIP 家族基因,并通过对这些基因的生物信息学分析,为以后克隆及深入研究 GhZIP 基因的功能提供理论基础。
  
  1 材料和方法
  
  1. 1 材料
  
  陆地棉异源四倍体标准系 TM-1 基因组数据来自南京农业大学作物遗传与种质作物创新重点实验室 ,陆地棉 EST 数据库来自 NCBI.
  
  1. 2 GhZIP 家族成员鉴定及序列分析
  
  用 HMMER 及 Blast 程序搜索鉴定陆地棉全基因组中 GhZIP 家族的所有成员。用 Perl 程序从基因组数据库文件 Gossypium_hirsutum_v1. 1. cds. fa和 Gossypium_hirsutum_v1. 1. pep. fa 中提取 GhZIP基因的 CDS 序列和氨基酸序列。
  
  利用 ProtParam tool  在线分析获得陆地棉 GhZIP 蛋白氨基酸序列的分子量、等电点等信息; 蛋白家族结构域用InterProScan 5 进行在线分析; 用 Mega 4 采用最大似然法( MaximumLikelihood) 构建 ZIP 蛋白的系统进化树,校验参数Bootstrap = 1 000.
  
  1. 3 亚基因组定位
  
  用 Perl 解析陆地棉基因组信息文件 Gossypium_hirsutum_v1. 1. fa,获得染色体长度; 分析陆地棉基因组信息文件 Gossypium_hirsutum_v1. 1. gene. gff3,获得 GhZIP 基因在亚基因组上的位置; 用 MapIn-spect 软件绘制基因的染色体物理分布图。
  
  1. 4 跨膜结构及亚细胞定位
  
  用 TMHMM Server v. 2. 0 和 SMART进行跨膜结构预测,用 ProtComp9. 0进行植物细胞的亚细胞定位。
  
  1. 5 组织表达定位
  
  于 2015 年 6 月 3 日在 NCBI 下载陆地棉 EST数据库,共得到 310 162 条序列; 以陆地棉 GhZIP 基因的 CDS 序列为 Query 在 EST 数据库中通过 Blast搜索,获得 GhZIP 基因在不同组织表达的信息。
  
  2 结果与分析
  
  2. 1 棉花 GhZIP 基因家族鉴定及序列分析
  
  从陆地棉异源四倍体标准系 TM-1 基因组数据中共鉴定出 45 个 GhZIP 基因,根据这些基因在染色体出现的先后顺序分别命名为 GhZIP1 ~ GhZIP45( 表 1) .除了 A04、A09、D04 和 D09 号亚基因组,GhZIP 基因在其他的 22 个亚基因组都有分布( 详情见后面的染色体物理定位) .通过对鉴定出来的GhZIP 蛋白做进化分析,研究发现存在 16 对分别来源 A 亚组和 D 亚组的 GhZIP 基因存在一一对应关系( 图 1) .
  
  这 45 个 GhZIP 基因的编码区平均长度约为3 155 bp,最长的是 GhZIP11 的 16 034 bp,最短的是GhZIP31 的 405 bp; CDS 平均长度约为 1 118 bp,相对应的最长的 CDS 是 GhZIP11 的 2 175 bp,最短的CDS 是 GhZIP31 的 405 bp.这些基因的外显子个数从 1 ~26 不等,具有 1 个外显子的有 5 个基因,具有 2 个外显子的有 7 个基因,具有 3 个外显子的有19 个基因,具有 4 个外显子的有 4 个基因,具有 5个外显子的有 5 个基因,具有 7,8,11,12,26 个外显子的基因都只有 1 个基因。蛋白质理化性质分析表明,45 个 GhZIP 基因的蛋白质氨基酸序列个数从134( GhZIP31) ~ 724( GhZIP11) 不等,其中有 13 个基因集中到 350 个氨基酸左右; 平均分子量是 39. 778kDa,最大的是 80. 819 kDa ( GhZIP11 ) ,最小的是14. 811 kDa( GhZIP31) ; 理论等电点最大的是 GhZ-IP24 的 10. 18,最小的是 GhZIP1 的 5. 68( 表 1) .
  
  2. 2 棉花 GhZIP 基因亚基因组的物理定位
  
  陆地棉的这 45 个 GhZIP 基因在 A 和 D 亚基因组存在不均匀分布,在 A 亚组共有 20 个 GhZIP 基因,在 D 亚组共有 25 个基因,尽管 D 亚组总体长度比 A 亚组短很多,但是 GhZIP 基因的分布却是 D 亚组的多。在 A 亚组的 A04 和 A09 没有 GhZIP 基因,同样在对应的 D 亚组的 D04 和 D09 也没有 GhZIP基因存在。在 A 亚组和 D 亚组有 GhZIP 基因分布的对应亚组间,都存在有成对的平行进化同源基因,在 A01 和 D01、A05 和 D05、A08 和 D08、A10 和D10、A13 和 D13 这 5 对亚基因组中都有 2 对平行进化同源基因,其他成对的亚基因组只有 1 对平行同源进化基因( 图 2) .在 A07 和 A08 号亚基因组都有 1 个基因簇存在,这 2 个基因簇各有 2 个基因;12 个基因,第 2 个基因簇有 4 个基因。
  
  2. 3 棉花 GhZIP 蛋白功能结构域分析
  
  用 InterProScan 分析陆地棉45 个 GhZIP 蛋白的ZIP 功能结构域,根据蛋白质氨基酸序列的长度不同,ZIP 结构域出现的位置和长度也不同,GhZIP21从第一个氨基酸开始就已是 ZIP 结构域,而 GhZ-IP11 的 ZIP 结构域从 537 位氨基酸才开始; ZIP 结构域最短的有 105 个氨基酸( GhZIP24) ,最长的有369 个氨基酸 ( GhZIP8 和 GhZIP30 ) ,之间相差 264个氨基酸( 表 2) .
  
  亚细胞定位预测结果表明,除了 GhZIP32 定位在内质网,其他陆地棉 GhZIP 蛋白成员都定位到质膜上( 表 2) .跨膜结构预测结果显示,陆地棉 45 个GhZIP 蛋白中除了 GhZIP24 其余都是跨膜蛋白,跨膜数从 2 ~ 15 个不等,其中有 6,8,9 个跨膜数的GhZIP 蛋白都有 8 个,有 7 个跨膜数的 GhZIP 蛋白最多有 12 个。在这 44 个 GhZIP 跨膜蛋白中,有 10个 GhZIP 蛋白( GhZIP3/9/11/12/14/22/24/31/34/43) 不存在膜内侧可变区,其他 34 个 GhZIP 跨膜蛋白都存在这个膜内侧可变区; 可变区长度不一,最短的 26 个氨基酸( GhZIP32) ,最长的 177 个氨基酸( GhZIP8/30) .膜内侧可变区出现在哪 2 个跨膜结构域之间是不同的,不是膜蛋白具有相同的跨膜数膜内侧可变区就出现在相同的 2 个跨膜结构域之间,如 GhZIP6 和 GhZIP23 都具有 6 个跨膜结构,但是 GhZIP6 的可变区在第 3 和第 4 个跨膜结构域之间,而 GhZIP23 的可变区在第 2 和第 3 个跨膜结构域之间; 也不是膜蛋白不具有相同的跨膜数膜内侧可变区就不会出现在相同的 2 个跨膜结构域之间,如 GhZIP26 和 GhZIP35 的膜内侧可变区都在第4 和第 5 个跨膜结构域之间,而它们的跨膜数分别是 7,9 个( 图 3) .膜内侧可变区存在的 His 富集区( His-tidine-rich domain,HRD) 被认为可能参与金属离子的结合,该区的共有序列是( HX) n ( n = 3 ~ 6)[20].
  
  具有 His 富集区的 GhZIP 蛋白共有 25 个成员,其中His 富集区位于膜内侧可变区的只有 20 个成员( 表2) .在这 20 个 His 富集区位于膜内侧可变区的GhZIP 成员中,GhZIP8 和 GhZIP30 具有 3 个 His 富集区,GhZIP2/6/17/23/28/42 具有2 个 His 富集区,其余的 12 个 GhZIP 蛋白都只有 1 个 His 富集区; 这20 个 GhZIP 蛋白具有( HX)3His 富集区序列的有 17个成员,具有( HX)4His 富集区序列的有 8 个成员( GhZIP6/8/28 具有 2 个( HX)4His 富集区序列) ,GhZIP30 具有 1 个最长的( HX)7His 富集区序列( 表 2) .
  
  2. 4 棉花 GhZIP 基因组织表达
  
  从 NCBI 下载的陆地棉 EST 数据库中得到 124条与 GhZIP 基因相匹配的 EST 序列,分析发现,有21 个 GhZIP 基因没有可匹配的 EST 序列,其他 24个 GhZIP 基因在棉花的根、茎、叶、花、胚珠、纤维等组织中广泛表达( 表3) .其中,有13 个 GhZIP 基因( GhZIP2/6/7/8/10/11/14/17/18/28/30/32/34) 在根和茎中都有表达,GhZIP1/23/40 在根中有表达,GhZIP40 只在根中有表达,GhZIP26 显示只在茎中有表达,这些基因可能参与了根部对某些金属离子的吸收和/或茎部对某些金属离子的转运; 除了GhZIP16 /21 /25 /26 /40 这 5 个基因,其他 19 个基因在纤维中都有表达,表明这些基因可能参与纤维的发育过程; 在蕾铃脱落部位还检测到有 GhZIP43 表达,该基因可能参与了棉花的蕾铃脱落过程。
  
  3 讨论
  
  二倍体 D 亚组雷蒙德氏棉、A 亚组亚洲棉和四倍体陆地棉( 标准系 TM-1) 全基因组测序工作的完成,使得在全基因组层面分析棉花功能基因家族相对更加容易。四倍体陆地棉基因组属于 AADD 型,研究发现 A 亚组和 D 亚组的基因存在很高的共线性[18],本研究鉴定出的陆地棉 45 个 GhZIP 基因在A 亚组和 D 亚组中的分布就很好地体现了这一特性,有 GhZIP 基因分布的成对的 A、D 亚组都有共线性基因存在,共有 16 对 32 个共线性基因; A04 亚组和 D04 亚组,以及 A09 亚组和 D09 亚组都是成对的没有 GhZIP 基因分布; GhZIP 基因组织表达的结果也显示,A03 亚组和 D03 亚组,以及 A13 亚组和 D13亚组都是成对的没有检测到 GhZIP 基因表达。
  
  研究发现,陆地棉 A 亚组和 D 亚组是非对称进化,A 亚组相对于 D 亚组有更高的蛋白质进化速率,并且 A 亚组染色体重排发生频率及基因丢失和失活的频率均显着高于 D 亚组[20].本研究鉴定出的 45 个 GhZIP 基因在 A 亚组有 20 个,在 D 亚组有25 个,D 亚组比 A 亚组多 5 个 GhZIP 基因,这很有可能是 A 亚组相比于 D 亚组有较高的基因丢失和失活频率造成的结果。研究证实,陆地棉 A 亚组和D 亚组对陆地棉性状有互补性,A 亚组的正选择基因与纤维的长度发育有重要关系,而在 D 亚组的正选择基因多与抗性有关。本研究对 GhZIP 基因的组织表达研究发现,正常生长条件没有胁迫的情况下在棉纤维中不表达的 GhZIP 基因,A 亚组中有 1个( GhZIP16) ,而 D 亚组中有 4 个( GhZIP21/25/26 /40) .
  
  用 TopPred 预测 ZIP 家族绝大多数成员都有 8个跨膜结构域,在第 3 和第 4 个跨膜结构域之间存在可变区( Variable region) ,可变区存在的一个或几个组氨酸富集区( Histidine-rich domain,HRD) 参与金属离子的结合[22].而用 TMHMM 和 SMART 预测ZIP 家族绝大多数成员都有 6 个跨膜结构域,不同的预测软件会存在差异。本研究所鉴定的 45 个GhZIP 基因,既具有可变区,又具有组氨酸富集区的成员共有 20 个成员; 如果再考虑到具有 6 个跨膜结构域,以及可变区在第 3 和第 4 个跨膜结构域之间这2 个条件,只有 GhZIP6/8/28 符合条件; 再结合组织表达的结果,可以比较肯定地说这 3 个基因应该是有 ZIP 家族显着特点的基因。这 45 个 GhZIP 基因的氨基酸序列多重序列比对结果表明,GhZIP 间的同源率很低,存在较大差别( 结果未显示) ,这可能会造就 GhZIP 基因功能的多样性。
  
  先前对其他植物 ZIP 基因的组织表达研究发现,在拟南芥中,AtZIP1-5、AtZIP9-12 以及 AtIRT3 主要在拟南芥的根和茎中表达[23]; 在水稻中,OsZIP1-5 和 OsZIP8 主要在水稻的根部表达[24]; 在大麦中,HvZIP3、HvZIP5 和 HvZIP8 主要在大麦根部表达[8]等,ZIP 转运蛋白主要在根部对土壤中某些二价阳离子( Zn2 +、Fe2 +等) 的吸收以及通过茎部的长距离运输维持植物体这些二价阳离子的动态平衡。本研究对 GhZIP 基因的组织表达研究也发现,正常生长条件下有表达的 24 个 GhZIP 基因中有 18 个在根和/或茎中有表达,这符合 ZIP 基因家族的特点。
  
  有些 ZIP 基因受到二价阳离子缺乏时的诱导表达,如 AtZIP4、AtZIP5、AtZIP9、OsZIP4、HvZIP3、HvZIP5都受锌离子缺乏时的诱导表达,AtZIP2 和 AtZIP5 受缺铜诱导表达[25]等,本研究在正常条件下未检测到表达的 GhZIP 基因是否也是这种二价阳离子缺乏诱导标的基因,如果答案是肯定的,那么诱导条件又是什么,这些都需要以后的深入研究。
  
  参考文献:
  
  [1] Zhao H,Eide D. The yeast ZRT1 gene encodes the Zinctransporter protein of a high-affinity uptake system in-duced by Zinc limitation[J]. Proceedings of the NationalAcademy of Sciences of the United States of America,1996,93( 6) : 2454 - 2458.
  
  [2] Zhao H,Eide D. The ZRT2 gene encodes the low affinityZinc transporter in Saccharomyces cerevisiae[J]. The Jour-nal of Biological Chemistry,1996,271 ( 38 ) : 23203 -23210.
  
  [3] Eide D,Broderius M,Fett J,et al. A novel iron-regulatedmetal transporter from plants identified by functional ex-pression in yeast[J]. Proceedings of the National Acade-my of Sciences of the United States of America,1996,93( 11) : 5624 -5628.
  
  [4] Guerinot M L. The ZIP family of metal transporters[J].Biochimica et Biophysica Acta,2000,1465( 1 /2) : 190 -198.
  
  [5] M?ser P,Thomine S,Schroeder J I,et al. Phylogenetic re-lationships within cation transporter families of Arabidopsis[J]. Plant Physiology,2001,126( 4) : 1646 -1667.
  
  [6] 蒲 琦,李素贞,李 盼。 植物锌铁转运蛋白 ZIP 基因家族的研究进展[J]. 生物技术通报,2012( 10) : 15 -19.
  
  [7] Pedas P,Ytting C K,Fuglsang A T,et al. Manganese effi-ciency in barley: identification and characterization of themetal ion transporter HvIRT1[J]. Plant Physiology,2008,148( 1) : 455 - 466.

TAG标签: 陆地     GhZIP     家族    

相关论文