近日,beat365 手机版官方网站果蔬园艺作物种质创新与利用全国重点实验室、beat365 手机版官方网站孔秋生教授和别之龙教授团队在Plant Communications在线发表了题为“Complete genome assembly provides insights into centromere architecture of pumpkin (Cucurbita maxima)”的通讯论文。该研究利用HiFi、ONT三代测序数据及Hi-C技术,成功组装了第一个端粒到端粒无间隙(T2T and gap-free)的南瓜完整基因组,并基于该基因组剖析了南瓜中独特的着丝粒结构与特征。
该研究以耐盐南瓜材料HZAU(Cucurbita maxima)为研究对象,在PacBio HiFi和ONT ultra-long测序的基础上,结合Hi-C测序技术,组装了一个T2T and gap-free的完整基因组,其长度为345.14 Mb,contig N50为16.35 Mb。相比之前发布的基因组,新增了133.64 Mb新的序列,且每条染色体都有完整的端粒和着丝粒区域,是目前组装质量最高的南瓜基因组。
基于组装的南瓜完整基因组,共鉴定到227.43 Mb的重复序列,占整个基因组的65.89 %,显著高于之前发表的南瓜基因组中重复序列含量(40.00%)。其中,重复序列被分为串联重复和散在重复,串联重复主要包括端粒和着丝粒序列占据了整个基因组的24.19 %,散在重复包括LTR、TIR、non-TIR转座子占据了整个基因组的41.70 %。该基因组总共注释了214个抗性基因类似物,
40个NLR基因,及28329个蛋白编码基因,其中27717个基因被功能注释,功能注释率高达97.84 %。此外,南瓜基因组中共鉴定了1984对片段重复(Segmental duplications,SDs),其中包含了139个拷贝基因。通过比较分析发现,在南瓜和葫芦科的其他属作物中,只有南瓜的SDs内的基因显著富集到了与抗病相关的通路,这也许是南瓜比葫芦科蔬菜作物具有更高抗逆性的原因。着丝粒是一个重要的基因组元件,在真核生物的染色体分离中起着至关重要的作用。该研究在每条染色体中都鉴定到了着丝粒区域,长度在0.54 Mb至9.05 Mb之间,平均长
度为4.13 Mb。通过串联重复鉴定,在南瓜基因组共鉴定了6种长度不同的着丝粒单体,分别为CEN169,CEN253,CEN315,CEN324,CEN327,CEN654。根据每条染色体的单体组成及转座子分布,南瓜着丝粒被分为5种类型。此外,在整个基因组中共鉴定872个intact LTR-RTs,着丝粒区域共鉴定到138个intact LTR-RTs (长末端重复反转录转座子)。通过转座子插入时间分析表明,着丝粒区域intact LTR-RTs的平均插入时间 (0.55 MYA)这些结果表明着丝粒区域快速扩张的LTR-RTs也许驱动了着丝粒的进化。综上,该研究不仅提供了有价值的高质量基因组资源,还对南瓜基因组结构提供了重要见解。
beat365 手机版官方网站果蔬园艺作物种质创新与利用全国重点实验室孔秋生教授和别之龙教授为本文的共同通讯作者,beat365 手机版官方网站在读硕士生曾庆国为论文的第一作者。beat365 手机版官方网站在读博士生魏明华,在读硕士生李帅、汪海燕、莫嫦娟,杨丽副教授,以及河南科技学院园艺园林学院李新峥教授也参与了该项研究工作。本研究得到了国家重点研发计划项目、国家自然科学基金项目、新疆生产建设兵团科技计划项目、中央高校基本科研业务费专项基金项目、宁波市科技计划等项目资助。
论文链接:https://doi.org/10.1016/j.xplc.2024.100935
文字:曾庆国
审核:孔秋生