首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
李青  何斌  陈群利  游萍 《江苏农业科学》2022,50(3):28-35+48
为进一步丰富鲫鱼基因组数据,对肝脏、血液和卵巢组织进行高通量转录组测序。采用Illumina Hiseq高通量测序平台进行转录组测序,对所获得序列进行比对、基因注释、差异表达和SNP、SSR分析。结果提示,组装得到127 801条unigene,平均长度为735 bp。与相应数据库比对,最终获得117 414(91.87%)个有注释信息的unigene,有105条unigene获得GO注释,并分类到生物学过程、细胞组分和分子功能三大类42个功能中;有20 725条unigene被归纳到KOG的26个直系同源功能类型;获得KEGG注释的unigene共参与五大类32小类代谢通路。在鲫鱼肝脏、血液和卵巢组织中分别检测到307 740、343 516、348 795个SNP位点,共检测到48 808个SSR位点。提示获得有注释信息的unigene共117 414条,此外,获得一些SNP和SSR位点。结果可为进一步克隆和挖掘鲫鱼功能基因、多态性检测及群体遗传多样性分析等方面研究奠定基础。  相似文献   

2.
为了解红萍在不同氮浓度胁迫下红萍转录组中SSR、SNP分子标记的详细情况,分析转录组数据中分布的SSR和SNP位点。通过提取红萍根和叶的RNA,构建cDNA文库并利用二代测序平台进行高通量测序,利用MISA对测序数据进行SSR特征分析,同时采用软件STAR进行比对并通过GATK进行SNP识别。结果表明:红萍转录组共有9 009个SSR位点,SSR位点频率为30.12%。其中,以三核苷酸重复和单核苷酸重复为主,分别占总比例的43.66%和26.41%。SNP位点有439 217个,包括转换类型(282 532个)和颠换类型(156 685个);转换类型占比(64.33%)显著大于颠换类型(35.67%)。C/T在所有变异类型中所占比率最高,占总量的17.33%;G/A位居其次(17.01%)。红萍转录组SSR和SNP位点丰富,可为红萍遗传多样性、遗传结构与分化以及功能基因的开发利用等研究提供依据。  相似文献   

3.
为了挖掘罗氏沼虾免疫相关单核苷酸多态性(SNP),采用第二代高通量测序技术,对罗氏沼虾的肝胰腺进行转录组深度测序分析。结果发现SNP位点37 589个,其中转换25 188个,颠换12 401个。再对SNP所在的基因进行GO(gene ontology)分类和KOG注释,分别筛选到2 451个有GO注释和2 458个有KOG注释的SNP,并重点对4个重要免疫通路的145个免疫相关基因,筛选出129个SNP位点。相关研究结果将为进一步系统挖掘免疫相关SNP的分子遗传标记奠定基础,为罗氏沼虾疾病防控和选育抗病新品种提供科学参考。  相似文献   

4.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

5.
c-GMP诱导对盐胁迫下番茄的转录组分析   总被引:1,自引:0,他引:1  
以市场常见的番茄为材料,采用Illumina高通量测序技术对NaCl胁迫、c-GMP诱导以及两者组合处理下番茄幼苗进行转录组测序。结果表明:共获得83.35 Gb的原始数据,Q30碱基百分比在90.91%及以上,分别将各样品的原始读数与指定的参考基因组进行序列比对,比对效率从88.03%到92.74%不等。同时将得到的31 734条序列注释到不同的数据库(GO、KEGG、KOG、NR、Pfam、Swiss-Prot和egg NOG),通过GO数据库,将其划分到细胞组分、分子功能以及生物学过程三大注释类别下的51个亚功能组中,通过COG数据库与KEGG数据库将其分别注释到25个类别与128个代谢通路。在NaCl胁迫、c-GMP诱导以及两者组合处理下共发现SNP位点127 944个,其中仅有22.6%的SNP位点位于非编码区。差异基因结果显示,c-GMP能诱导盐胁迫下更多基因的表达。该转录组测序数据可靠,结果覆盖面广,为番茄c-GMP诱导盐胁迫下基因挖掘与功能研究提供了理论依据。  相似文献   

6.
【目的】开展红罗非鱼(Oreochromis spp.)低温体色变异全基因组关联分析(GWAS),为红罗非鱼低温变色的分子调控机制研究提供基础资料。【方法】通过Illumina HiSeq~(TM )4000测序平台,基于简化基因组测序(RAD-Seq)对低温处理后体色发生变异和不发生变异的红罗非鱼进行基因组测序,应用一般线性模型(GLM)和混合线性模型(MLM)算法进行GWAS分析,并利用BLAST程序对每个SNP位点在罗非鱼基因组中的位置进行在线定位,确定其周围的功能基因。【结果】应用RAD-Seq和GWAS技术,共筛选获得24个与红罗非鱼低温处理后体色发生变异显著相关的SNPs位点(P5.15E-08),在基于24个SNPs位点附近共找到19个已知的功能基因,且这些基因主要与细胞转录、代谢和免疫等功能相关。【结论】基于RAD-Seq和GWAS分析共筛选出24个与红罗非鱼低温体色变异性状显著相关的SNP位点,并注释到19个功能已知且均与信号转导、生物合成及免疫相关的基因,可作为后续开展红罗非鱼体色相关分子辅助育种研究的参考依据。  相似文献   

7.
【目的】利用转录组测序开发甘蔗SNP分子标记,为甘蔗建立一种高效和低成本的分子标记开发方法。【方法】以40个甘蔗栽培品种为试验材料,使用高通量测序平台获得其转录组数据,经质控后将其匹配到参考基因组,然后使用GATK软件检测和过滤SNP分子标记,并使用snpEff对SNP进行注释及统计分析。利用这些SNP分子标记进行系统发生分析、主成分分析和群体结构分析。最后,开发KASP标记并随机验证其有效性。【结果】转录组数据经质控后平均每个样本获得6.5 Gb的序列。通过变异分析和多重过滤筛选后,共获得220397个注释到染色体上的双等位基因SNP位点,平均密度为3 SNP/kb。SNP类型及分布特征分析结果表明,编码区错义突变与沉默突变的比值(N/S)为1.05,转换类型和颠换类型的比值(Ts/Tv)为1.89,杂合SNP占38.66%~49.91%,位于转录本的SNP比例为44.74%。系统发生分析、主成分分析和群体结构分析结果均表明,甘蔗栽培品种遗传来源较为单一,但群体分化较大。开发了11176个KASP分子标记,并随机合成25组KASP引物进行多态性验证,共有23组(92%)引物能检测到扩增产物,7组(28%)在40个甘蔗材料中呈现多态性,进一步验证了这些标记有效性。【结论】与传统SSR分子标记和基于GBS(Genotyping-by-sequencing)简化基因组测序的SNP分子标记开发方法相比,基于转录组测序的甘蔗SNP分子标记开发方法在保证质量和数量的情况下能获得更大比例的有效SNP,更有利于发掘功能SNP位点,为甘蔗分子SNP标记的开发提供了新的途径。  相似文献   

8.
【目的】挖掘菊叶香藜转录组数据中的SNP信息,对具有SNP位点的unigene(SNP-unigene)进行功能注释分析,为菊叶香藜SNP分子标记的开发提供理论依据。【方法】利用Samtools和VarScan v.2.2.7软件寻找候选的SNP位点,并对SNP-unigene进行GO注释、COG注释和KEGG注释。【结果】在菊叶香藜花和叶转录组中,分别鉴定出了889个和673个SNP位点,转换分别占63.0%和62.7%,颠换分别占37.0%和37.3%,转换和颠换的比值分别为1.70和1.68,非编码区分别占21.15%和21.10%,编码区分别占67.27%和67.46%。菊叶香藜所有SNP位点分布于643条SNP-unigene上,功能注释结果显示,总共有343条SNP-unigene具有GO注释,370条SNP-unigene具有COG注释,232条SNP-unigene具有KEGG注释,这些SNP-unigene涉及较多的功能主要与代谢、核糖体、次生代谢产物的生物合成相关。【结论】本研究通过大规模地筛选菊叶香藜中的候选SNP位点,可以为研究菊叶香藜基因分型、构建遗传图谱等方面奠定基础,对于开发利用菊叶香藜植物资源具有重要的价值。  相似文献   

9.
【目的】开展荸荠球茎发育过程转录组测序研究,为研究荸荠球茎发育过程相关基因表达信息提供参考。【方法】运用高通量测序技术,对荸荠球茎不同发育时期进行转录组测序研究。【结果】组装共得到223 182条转录本和90 542条Unigene,平均长度为809 bp,N50为1119。组装完整性较高,效果较好。对所得Unigene进行不同数据库注释,共有50 583条Unigene成功注释到7个数据库(NR、GO、NT、Pfam、KEGG、KOG及Swiss-prot)。对差异表达基因分析,发现球茎膨大初期的差异表达基因数目最多,为最活跃阶段。GO功能富集分析结果表明,33 205个基因获得功能注释,分为分子功能、细胞组分和生物学过程等3大类和54个亚类。COG功能分类结果表明,17 743个基因分布于25个功能区域,其中碳水化合物代谢占重要地位。KEGG代谢通路注释结果表明有20 667个基因获得功能注释,共有116条代谢途径,其中淀粉-蔗糖代谢占主要作用。【结论】利用高通量转录组测序技术首次建立了荸荠优良品种‘桂蹄3号’球茎的转录组数据库,为进一步研究荸荠球茎淀粉生物合成相关基因的功能及形成的分子机制提供了数据基础。  相似文献   

10.
通过对白腐菌偏肿革裥菌(Lenzites gibbosa)在木质和非木质环境下的转录组进行测序,从而预测和筛选出L.gibbosa与木材降解有关的基因。采用高通量测序技术对木屑和非木屑处理条件下的菌丝样本进行转录组测序。利用eggNOG、GO等数据库注释方法对转录本进行比较分析,预测和筛选出L.gibbosa与木材降解有关的基因。L.gibbosa转录组测序两组试验组分别设置3个生物学重复样本,共得到6个样本42.71 Gb Clean Data,各样品Clean Data平均达到7.11 Gb,各样品的Reads与参考基因组的比对效率在88.51~91.37%。差异表达分析得到差异表达基因1 120个,其中上调370个,下调750个。差异基因被注释到GO数据库的有493个,注释到eggNOG数据库的有857个。eggNOG分析表明,差异基因表达多聚集在翻译后修饰、蛋白质折叠、蛋白分子伴侣;碳水化合物的运输和代谢;能量产生和转化;次生代谢产物的生物合成、运输和分解代谢等功能分类下。GO分析表明,显著性富集与频率较高的生物过程是氧化还原过程、氧化还原酶活性和木质素代谢过程。L.gibbosa降解木材与木质素分解代谢过程(GO:0046274)、氧化还原过程(GO:0055114)和氧化还原酶活性(GO:0016491)等3个基因本体功能类目密切相关。根据基因功能注释的结果得到7个与白腐菌降解木质素相关的重要差异表达基因。  相似文献   

11.
【目的】筛选出凡纳滨对虾生长发育的功能基因及代谢调控网络,揭示其生长发育的分子机制,为后续开展凡纳滨对虾分子生物学研究提供宝贵的基因数据来源。【方法】以快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织为研究材料,通过Illumina HiSeqTM2500平台对构建的cDNA文库进行高通量测序分析,以StringTie进行拼接组装后利用DESeq2筛选差异表达基因,并基于KOG、GO、nr、COG、Swiss-Pro、KEGG和Pfam等数据库进行差异表达基因功能注释分析。【结果】经拼接组装共获得53458844条Clean reads,各样品Clean reads的Q30均在93.00%以上;Illumina测序获得的Clean reads与参考基因组的比对效率在87.75%~87.80%,说明转录组测序数据真实可靠。采用SnpEff进行SNP/InDel变异注释分析,结果显示,SNP位点中以A>G、G>A、C>T和T>C等4种类型的数量较多(14950~21562个),InDel位点则以SYNONYMOUS_CODING的数量最多(33630个)。使用StringTie对Mapped reads(比对到参考基因组的Reads)进行拼接,共发掘到4607个新基因,分别输入COG、GO、KEGG、KOG、Pfam、Swiss-Prot、eggNOG和nr数据库中进行序列比对,最终发现共有1098个新基因被注释,以被nr数据库注释的新基因数量最多(1077个),而被COG数据库注释的新基因数量最少(416个)。基于Q-value<0.05且Fold Change>2的筛选条件,共获得1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因);1408个差异表达基因被注释到53个GO功能条目中,其中,22条被注释到生物学过程(Biological process),16条被注释到细胞组分(Cellular component),15条被注释到分子功能(Molecular function);KEGG信号通路富集分析发现3条重要的信号通路,分别是溶酶体通路(Lysosome)、氨基糖和核苷酸糖新陈代谢(Amino sugar and nucleotide sugar metabolism)及鞘脂类代谢(Sphingolipid metabolism)。在溶酶体通路中,CTSL基因、Nramp基因、MyoG基因和Myf5基因在凡纳滨对虾快速生长群体肌肉组织中呈上调表达,而Trypsin基因呈下调表达。【结论】通过转录组测序分析从快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织中筛选出1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因),主要富集在溶酶体、氨基糖和核苷酸糖新陈代谢及鞘脂类代谢等通路上,在对虾肌肉生长发育过程中发挥重要作用。  相似文献   

12.
荞麦基因资源相对匮乏。以甜荞根和金荞根为材料,利用Illumina Hi SeqTM2000对其进行转录组测序,经过de novo从头组装得到64 618条Unigene,其中37 546条基因得到了有效注释。对甜荞根和金荞根中的差异基因进行筛选,共获得了4 709个差异基因,其中2 460个上调表达,2 249个下调表达。这些差异基因的GO注释集中在10个细胞组分(cellular component)、12个分子功能(molecular function)和22个生物学过程(biological process)中。对差异基因参与的代谢途径进行富集,上调基因中共有40个代谢途径显著富集,下调基因中共有18个代谢途径显著富集,这些显著富集的代谢途径参与甜荞根和金荞根的生物学调控。最后对转录组中注释到黄酮合成途径中的关键基因进行了分析,共有21个基因注释到黄酮合成途径中的关键酶。不仅丰富了荞麦的基因资源,为荞麦分子生物学研究提供数据基础,也为筛选甜荞根和金荞根中相关基因的表达趋势提供参考依据。  相似文献   

13.
【目的】探究不同外源糖对葡萄试管苗生长发育及蛋白激酶基因转录调控的影响,应用转录组测序挖掘蛋白质磷酸化过程中的基因,为葡萄蛋白激酶相关基因功能的验证奠定一定基础。【方法】在基本培养基中分别添加2%的蔗糖、葡萄糖和果糖,以无糖为对照,分别命名为S20、G20、F20和CK,经过37 d培养后,测定不同处理的地上和地下鲜重,并采用Illumina HiSeq TM 2000对各处理叶片进行转录组测序,通过综合生物信息学分析(参考基因组比对、差异基因(DEGs)筛选、COG(Cluster of Orthologous Groups of proteins)注释、GO(Gene Ontology)注释等)筛选出蛋白激酶相关基因,通过qRT-PCR分析该蛋白激酶相关基因的表达特性。【结果】F20、G20和S20处理下的葡萄(‘红地球’)试管苗与CK相比,地上鲜重具有明显差异,且F20最高,而G20地下鲜重最高。SNP统计发现,转换是主要的变异类型,颠换次之,且发生在基因间区的SNP数量最多,其次是下游;剪接位点供体和同义终止发生的基因数量最少且相等。4个样品中共获得了2 633个差异基因,3个处理与CK相比,共有差异基因180个且被聚类为3组,第一组中127个基因仅在CK中高表达,第二组19个基因仅在G20下高表达,而第三组34个基因在3个处理下表达模式不尽相同。这些共有的差异基因在COG中注释到了26个基因并分在11个功能类别中,且主要注释在一般的功能类别中。在GO分类中,共有的基因分别被注释在分子功能、生物学过程和细胞组分的14、22和13个功能类别中。共筛选出7种蛋白激酶,分别为葡萄糖激酶(Glucokinase,GK)、丝裂原活化蛋白激酶(Mitogen-activated protein kinases,MAPKs)、钙调蛋白激酶(Calcineurin protein kinase,CBL)、蛋白磷酸酶2(Protein phosphatase 2,PP2A)、己糖激酶(Hexokinase,HXK)、组氨酸蛋白激酶(Histidine protein kinase,HPK)和酪氨酸激酶(Tyrosine kinase,TK),其不同激酶的基因在不同处理中具有各自的表达模式,经qRT-PCR验证,选择的20个差异基因中有17个基因表达与转录组测序结果相一致。【结论】在葡萄试管苗培养中,果糖较葡萄糖和蔗糖相比对生长较好。测序得出180个差异基因对3种不同糖均作出响应,这些基因在COG数据库中主要富集在膜酯转运和代谢、次级代谢物和碳水化合物的合成、转运和分解;GO中大多注释在蛋白激酶和氧化还原酶的活性中;筛选出了7种蛋白激酶,这些差异基因在数量、功能分类和代谢通路上对糖的响应各不相同。  相似文献   

14.
氮素是小麦生长发育过程中重要的营养元素,利用转录组技术鉴定参与小麦低氮胁迫分子调控网络的基因,对揭示小麦耐低氮分子机理、开展耐低氮育种具有重要参考意义。采用Illumina HiseqTM 2500高通量测序技术,对小麦品种晋麦47正常生长和低氮胁迫下的叶片进行转录组测序,筛选差异表达基因并在GO、KEGG 数据库中进行比对注释,分析小麦低氮胁迫响应相关基因。结果显示,对照组与低氮组分别获得高质量序列52 383 726和52 192 061条,检测到差异表达基因1 267个,其中上调表达基因179个,下调表达基因1 088个。差异基因GO功能注释到3个大类的44个功能组。差异表达基因被注释到178个途径上,主要富集于氨基酸代谢、碳水化合物代谢、脂类代谢和信号传导等途径。转录因子分析发现,在低氮条件下变化明显的转录因子家族包括WRKY、MYB和NAC等。  相似文献   

15.
[目的]分析藤茶高通量转录组序列,从中挖掘出黄酮类化合物合成相关基因,为进一步揭示藤茶黄酮类化合物生物合成调控机制提供理论参考.[方法]分别采集藤茶的幼叶和成熟叶,提取其总RNA构建cDNA文库,采用Il-lumina HiSeqTM 4000高通量测序平台对藤茶叶片进行转录组测序,经过滤处理后运用Trinity组装,将获得的Unigene与Nr、Nt、Pfam、Swiss-Prot、GO、KO和KOG 7个数据库进行比对注释,并预测Unigenes的编码区序列(CDS);基于KEGG信号通路富集分析,发掘藤茶黄酮类化合物合成相关基因.[结果]藤茶叶片转录组测序获得82126236条原始测序序列(Raw reads),过滤处理后得到80156972条高质量序列(Clean reads),进一步组装拼接得到92472条Unige-nes,平均长度为1208 bp,N50长度为1780 bp,其中,至少在1个数据库注释的Unigenes有84217条,占Unigenes总数的91.07%,有8944条Unigenes在7个数据库均被注释,占Unigenes总数的9.67%.在GO数据库成功注释的41116条Unige-nes可分为生物学过程、细胞组分和分子功能三大类,共56个小类;在KOG数据库注释的14553条Unigenes可分成25类,其中,一般功能预测注释成功的Unigenes最多(1946条);其次是翻译后修饰、蛋白质翻转、分子伴侣(1776条),参与次生代谢物质的生物合成、转运和降解的Unigenes较少,仅有319条;KEGG信号通路富集分析发现,共有15262条Unigenes注释到128条KEGG信号通路,以注释为代谢的Unigenes最多,为8694条,其中筛选获得有98个黄酮类化合物合成相关基因,分别编码苯丙烷代谢通路的3种关键酶和类黄酮代谢通路的14种关键酶.藤茶叶片转录组Unigenes与Swiss-Prot和Nr数据库比对,获得52582条CDS序列,ESTScan 3.0.3预测获得35535条CDS序列.[结论]藤茶在细胞过程、代谢过程、单有机体过程、细胞和细胞部分、结合和催化活性能力分布的基因较丰富,在一般功能、翻译、翻译后修饰、蛋白质翻转及分子伴侣的基因表达量较高,具有较强的碳水化合物代谢能力.多种关键酶基因参与藤茶黄酮类化合物的生物合成,推测其生物合成途径存在多条分支,调控机制也较复杂.  相似文献   

16.
【目的】获取芋(Colocasia esculenta)全长转录本序列和结构信息,并挖掘淀粉生物合成相关基因和转录本的结构信息,为后续阐明芋淀粉生物合成的分子机制及深入利用芋基因资源提供科学依据。【方法】以荔浦芋1号为试材,采集其3月龄植株的不同组织(叶片、叶柄、球茎、匍匐茎和根)开展混合样三代全长转录组测序,对获得的转录本进行功能注释,通过生物信息学方法分析转录本可变剪接(AS)、可变多聚腺苷酸化(APA)、长链非编码RNA(lncRNA)、转录因子(TF)和简单重复序列(SSR)等的结构信息,通过京都基因和基因组百科全书(KEGG)注释获得芋淀粉生物合成相关的基因和转录本,并对其进行AS和APA分析。【结果】通过对芋叶片、叶柄、球茎、匍匐茎和根混合样开展三代全长转录组测序,共获得全长转录本序列38 043条;通过与参考基因组进行比对,鉴定出新转录本31 058条,其中28 785条获得功能注释;通过对转录本结构分析,共鉴定出9360个AS事件、6436个基因存在poly(A)位点、25 081个SSR位点、304个lncRNA、1911个融合转录本和1608个TF。通过KEGG注释...  相似文献   

17.
氮素是小麦生长发育过程中重要的营养元素,利用转录组技术鉴定参与小麦低氮胁迫分子调控网络的基因,对揭示小麦耐低氮分子机理、开展耐低氮育种具有重要参考意义。采用Illumina HiseqTM 2500高通量测序技术,对小麦品种晋麦47正常生长和低氮胁迫下的叶片进行转录组测序,筛选差异表达基因并在GO、KEGG 数据库中进行比对注释,分析小麦低氮胁迫响应相关基因。结果显示,对照组与低氮组分别获得高质量序列52 383 726和52 192 061条,检测到差异表达基因1 267个,其中上调表达基因179个,下调表达基因1 088个。差异基因GO功能注释到3个大类的44个功能组。差异表达基因被注释到178个途径上,主要富集于氨基酸代谢、碳水化合物代谢、脂类代谢和信号传导等途径。转录因子分析发现,在低氮条件下变化明显的转录因子家族包括WRKY、MYB和NAC等。  相似文献   

18.
[目的]通过对海岛棉不育系H276A及其育性恢复材料H268进行三角状五肽重复蛋白(PPR)家族基因鉴定及比对分析,获得序列存在差异的PPR基因,为后续育性恢复基因(Rf)的发掘提供理论基础.[方法]通过生物信息学分析海岛棉PPR基因,并对其进行亚细胞定位预测与功能注释分析;采用Illumina HiSeq 4000高通量测序技术对海岛棉H276A及H268对PPR蛋白家族基因进行转录组测序,将筛选获得的PPR蛋白与其他植物具有育性恢复的PPR蛋白进行氨基酸序列同源比对并构建系统发育进化树.[结果]鉴定获得912个PPR基因,其中有846个在海岛棉H276A和H268间存在序列差异,且分别存在7226个SNP差异位点和301个InDel差异位点,其中作用于线粒体的PPR基因有2143个SNP差异位点和134个InDel差异位点.转录组测序结果显示,共检测到表达基因数量为68197个,其中已知基因56311个、新基因11886个,可满足后续数据分析.GO功能注释结果显示,PPR基因主要富集于生物学过程,富集于分子功能的PPR基因最少.50.0%PPR蛋白定位于线粒体,29.0%PPR蛋白定位于叶绿体,0.9%PPR蛋白定位于细胞核,20.0%PPR蛋白定位于胞外,0.1%PPR蛋白定位于细胞质膜.xp_016708712(LOC107923023)和xp_016710013(LOC107924193)与多个具有育性恢复功能的PPR蛋白氨基酸序列相似性达33%,说明二者亲缘关系较近,且亚细胞定位于线粒体.[结论]xp_016708712和xp_0167100132个PPR蛋白可能与海岛棉不育系H276A育性恢复相关,可用于发掘海岛棉CMS的Rf基因.  相似文献   

19.
金钱松是中国特有的孑遗单种属裸子植物,现存的自然种群数量很少,多被引种栽培,也是著名的庭院观赏树种。迄今为止,其遗传背景和基因组信息并不清楚,对于金钱松的保护及其遗传结构研究迫切需要基因组资源。采用Illumina HiSeqTM2500高通量测序平台对金钱松叶片进行转录组测序,经de novo组装共获得70 761条Unigene,平均长度为699 bp,N50的长度为1 300 bp,Q20和Q30序列分别占96.59%和91.29%。通过对7个不同的蛋白质和功能域数据库进行比对和功能注释,有43 674条Unigene(61.72%)注释成功。在GO数据库中,有28 355条Unigene按功能被划分成3大类56个小类,以执行生物过程的类区所占比例最多。通过KEGG pathway分析,有14 623条Unigene注释成功,发现了显著性富集的32条代谢通路,以代谢相关的基因最多。在KOG数据库中,有15 931条Unigene被分配到26个基因功能大类中,其中以参与一般功能、转录、翻译、修饰及蛋白运输的基因最为丰富。此外,利用MISA软件对转录组序列进行EST-SSR位点搜索与分析,共检测到2 260条Unigene含有2 462个EST-SSR位点,分布频率为3.48%,其中有180条序列含有一个以上EST-SSR位点,83条序列含有复合EST-SSR位点,以三核苷酸重复基元类型最为丰富,占42.53%(1 047个EST-SSR),重复次数主要以5~8次为主。这些重要的转录组序列为进一步了解金钱松生物学过程的分子机制提供了有价值的信息,并为未来的功能基因组分析、分子标记开发和群体遗传学分析提供了丰富的资源。  相似文献   

20.
[目的]分析芒果不同花芽分化时期的转录组,了解成花过程相关基因的表达情况,为芒果开花时间的分子调控机制研究提供理论参考.[方法]以芒果品种南逗迈4号为材料,采用Illumina高通量测序技术,分别对其新梢停长期(I期)和基部膨大期(II期)2个不同花芽分化时期顶芽进行转录组测序,并利用基因功能注释、差异表达基因筛选等生物信息学方法对测序获得的高质量序列进行分析.通过实时荧光定量PCR(qPCR)检测差异表达基因的表达情况以验证转录组测序结果的可信度.[结果]共获得85691条Unigenes,平均长度为870 bp,N50为1077 bp,与UniProt数据库比对,发现48589条Unigenes有同源信息,注释比例为56.7%,广泛涉及细胞组分、生物过程和分子功能三大类,共55个小类,其中参与生物过程的Unigene数量最多(有21个小类),以参与分子功能的Unigene数量最少(有14个小类).以Fold-Change≥2为条件,筛选出花芽分化Ⅰ和Ⅱ期转录组间的2031个差异表达基因,其中1073个基因表达上调,958个基因表达下调,涉及247条代谢通路,富集的KEGG通路为内质网蛋白加工、次生物质的生物合成和积累、糖代谢和光合作用等,其中注释为内质网蛋白加工的基因数量最多.从2个不同时期顶芽的转录组数据中获得了春化、光周期、赤霉素(GA)、成花抑制、自主和年龄等途径的开花相关基因.将MiSOC1、MiVIN3、MiDof和MiMADS1的qPCR检测结果与其转录组测序结果进行比对,发现这4个基因虽然在II期的表达量比Ⅰ期上调差异倍数上存在一定差异,但表达量变化趋势一致,说明转录组测序结果的可信度较高.[结论]芒果花芽分化过程与内质网蛋白加工、次生代谢生物合成、植物激素信号转导、淀粉和蔗糖代谢等途径密切相关,可为芒果花期人工调控和产期调节提供参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号