基金申请之系统发育研究系列篇植物线粒体体

目前正是基因申请的阶段,小编给各位老师助助力,用一种新的思路切入植物系统发育方向的研究,分享一篇利用线粒体基因组研究系统发育和重复序列组成与演化的案例,希望通过这篇文章给老师一些思路和方向,具体内容详见下文文章解读。

案例分享

老芒麦(E.sibiricus)线粒体基因组及基于植物线粒体基因组简单重复序列的进化模式洞察

文章简介

本文是年1月26日四川农业大学草业科技学院马老师团队发表在《FrontiersinPlantScience》(IF:5./Q1)题目为“TheCompleteMitogenomeofElymussibiricusanadInsightsIntoItsEvolutionaryPatternBasedonSimpleRepeatSequencesofSeedPlantMitogenomes”的文章

原文链接:doi.org/10./fpls..

主要内容植物线粒体最凸显的特征是序列和结构高度变异,广泛的基因水平转移(HGT)、子低氧适应中发挥重要作用。由于已测线粒体基因组数量有限,转移DNA的非编码性质,植物线粒体低氧适应和基因水平转移研究机制仍具挑战。本研究对青藏高原的老芒麦线粒体基因组进行组装,与禾本科其他八种植物线粒体基因组进行比较分析,与小麦属其他三种相比发现由于长期的高原适应老芒麦拥有独特的单倍型和高TE含量。本研究目的是发现线粒体基因组简单序列重复序列(SSR)和HGT之间的联系。研究预测并注释了老芒麦的SSR,基于mt-c-SSR的聚类结果显示,系统分类群内以及轴间存在预期的共线性。mt-c-SSRs注释到11个基因,其中“(ATA)3agtcaag(AAT)3”出现在8种植物的nad5基因中。mt-c-SSRs进一步证实了远缘种间的线粒体基因组序列的HGT。种子植物线粒体基因组中nad4和nad7的内含子区域拥有大量的SSR。老芒麦线粒体基因组的五对SSR是区分E.sibiricus和其近缘同域种E.nutans潜在标记。研究思路

二代(77.6X)三代(.7X)测序老芒麦基因组

老芒麦基因组组装注释

9种植物10个共有基因的RNA编辑位点分析

9种植物线粒体基因组TE分析

9种植物线粒体基因组11个共享基因的单倍型分析

9种植物线粒体基因组11个共有基因的ka/ka分析

9种植物的叶绿体和线粒体之间的基因转移分析

88个植物的线粒体基因组mt-c-SSR分析基因水平转移分析

系统发育及基于垂穗披碱草线粒体简单序列重复分析

79种植物线粒体全基因组系统发育分析

研究背景

植物线粒体基因组的特征是 同义替换率、相对丰富的重排、高水平的反转和重组。此外植物线粒体是 可以通过细胞内和水平基因转移整合外源序列的细胞器。高等植物线粒体基因在进化过程的早期进行水平转移大多数是核糖体蛋白编码基因,罕见的是呼吸基因,传递的遗传信息不止是完整的功能基因,还有一些非编码序列和基因片段。水平转移通过替换丢失的基因或形成嵌合基因来改善物种的遗传多样性。SSR在基因组中广泛分布,可用于遗传和进化研究,从mt-SSRs的角度为HGT提供新的证据;复杂SSR在进行遗传多样性分析时往往被忽略。mt-c-SSR既有c-SSR较低的跨物种转移率,又有线粒体特有的显著变异,似乎不可能在两个密切相关的物种之间找到mt-c-SSR序列的共同性。重复序列常用来揭示物种间遗传物质交换和重组所留下的历史印记。真核生物中只有少数研究将SSR与逆境耐受特定功能联系起来。自然进化和人工选择育种的驱动力是基因突变、重组和调控,其中调控可能起主导作用。控制结构基因重组和调控的主要因素之一是重复序列。然而,人们对这些重复序列的功能及其生物学意义知之甚少,大多数认为是有效的分子标记。低氧适应已证明与藏山羊中几个线粒体蛋白编码基因(atp6和Cytb)的单倍型相关。线粒体中的Cytb、cox和nad基因在选择下有助于高原鼠兔和藏羚羊的高原适应,因此青藏高原原生植物(QTP)的基因组作为研究高等植物重要适应机制的 资源。“川草2号”从QTP的野生材料中选育而来,本研究组装了“川草2号”的线粒体基因组,与八个禾本科线粒体基因组进行比较分析,利用5对多态性mt-SSR构建了60个野生老芒麦和32个垂穗披碱草的遗传结构。从NCBI下载线粒体基因组序列获取相应的mt-c-SSRs序列,首次研究88种种子植物之间的联系,可以提供通过跨物种转移获得有价值的特性信息。研究结果IlluminaMiseq和SingleMolecularNanopore分别测77.6X、.7X,三代测序获得,reads,平均长度15,bp。8条contigs组装成老芒麦线粒体基因组大小为bp,N50为bp,GC含量44.47%,含67个基因分别是20个tRNAs,6个rRNAs,33个PCGs和8个假基因。9个禾本科植物线粒体基因组的基因、GC含量、TE分析发现GC含量相对保守,但有高度可变的基因和假基因数量。老芒麦的假基因是最多的,基因组比甘蔗长,比其他7个短。与Aegilopsspeltoide比较获得一个nad5基因,丢失一个rps2基因。与甘蔗、玉米、高粱、牛筋草线粒体基因组比较发现,水稻缺失atp4基因。9个禾本科植物中,四个小麦科物种中TE分散分布,在其他物种中密集分布。老芒麦中TE分布相对集中,大小从,-,bp,对应mttB和trnP基因区间。9个禾本科植物中TE含量差异很大,从0.94%-5.46%。除老芒麦外Aegilopsspeltoides、Triticumtimopheevi、TriticumaestivumTE含量与其他禾本科植物比较低。9个禾本科线粒体基因组共有atp1、ccmB、ccmC、ccmFN、cox、,cox2、matR、nad6、nad7、nad9、rps个基因。根据这11个基因构建单倍型网络9个禾本科植物高度变异。值得注意的是Triticumtimopheevii、T.aestivum单倍型组成一样,水稻为独特的单倍型。老芒麦单倍型中rps7、ccmC、ccmB与小麦属共享。相对于其他物种,老芒麦是独特的单倍型。11个共有基因计算任意两个物种的ka/ka,ccmFN和matR的值高于其他基因,在水稻和牛筋草中除了ccmFN和nad7外,其他的值都小于1。9个禾本科植物叶绿体和线粒体局部共线块((LCBs)在整个基因组中分散分布,线粒体基因组中的18s与叶绿体特定区域同源;叶绿体基因组中的八个与线粒体基因组的特定区域同源。小麦属中的4个线粒体基因组的六个基因(rrn18、rrn26、trnF、trnN、trnS和TRNW)与对应的叶绿体基因组同源。片段转移从2.74%-7.11%,几乎是tRNA和rRNA,玉米中只有atp4的编码基因在线粒体和叶绿体基因组之间转移。鉴定88个已注释好的线粒体基因组简单重复序列(mt-SSRs).鉴定的mt-c-SSR因其保守性和可转移性被用于构建种间连接。根据长度将mt-c-SSR分为六种类型,其中71-bp和-bp为主要类型。为分析88个线粒体基因组之间的种间关系,用CD-HIT-EST在线对mt-c-SSR进行聚类分析,当两个物种等长的mt-c-SSR之间的相似性达%时,两个物种之间连成一条线。88个物种按系统发育分类排列,系统分类群内存在明显的共线性,同时也有分类群间的关系,21个物种与其他物种没有亲缘关系。但当序列相似性降低到90%时,Silenelatifolia与其他16个其他远缘物种有联系。其中atp1、ccmFN、nad4、nad5、nad9、rps1、rps2、rps3、rps10、rrn26、rrnL发现含有mt-c-SSRs,然而8个物种的nad5都含有(ATA)3agtcaagtcaag(AAT)3基序。对预测的SSR进行注释和汇总可分为10个亚目,SSR位于基因区域,大部分位于


转载请注明:http://www.apple4-chn.net/afhzz/2297.html


当前时间:

冀ICP备2020029325号-12