首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
运用高通量技术对杂交鳢进行转录本测序和数据分析,经拼接与组装,最终获得52 065条unigenes,长度范围201~12 407 bp,序列平均长度为710 bp。从长度分布、GC含量和基因表达量等方面对unigenes进行评估,数据显示测序质量较好。进一步的数据分析,共鉴定出20 535个CDS,37 324个SNP位点和7 830个微卫星。用6大数据库Swiss–Prot、Nr、Pfam、KEGG、KOG和GO注释杂交鳢转录组unigenes,分别对应有20 955、28 938、19 339、14 052、19 358和18 635条unigenes获得注释。根据GO数据库的注释,可将这些unigenes分为生物过程、细胞组分和分子功能3大类共50亚类。KEGG代谢通路分析表明,这些unigenes参与了5大类30亚类共268个代谢通路,其中,参与信号转导通路的unigenes数量最多,有1 716条。  相似文献   

2.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

3.
为获得岩原鲤转录组信息,发掘功能基因,本研究采用Illumina高通量测序技术对岩原鲤全组织转录组进行测序。结果获得64 257 918个EST序列,经拼接和组装得到83 252条单基因序列(unigene),平均长度787 bp,长度范围201~16 572 bp。利用NCBI的蛋白质非冗余数据库(Nr)对所有unigene进行相似性搜索,共有37 157条unigene(44.63%)与数据库中的已知序列同源。利用Blast2GO v2.5软件对unigene进行注释,共得到29 919条(35.93%)注释基因,根据GO功能分类将其分为生物过程、细胞组分和分子功能3大类56亚类。经KOG注释及分类,共有17 869条(21.49%)unigene成功注释到真核直系同源组中,并将其分为26个功能组分。经KEGG代谢通路分析可分为5大类(细胞过程、环境信息处理、遗传信息处理、代谢和有机系统)32小类共267个代谢通路。本研究通过高通量测序技术,对岩原鲤转录组进行测序,获得了大量的转录组信息,为岩原鲤功能基因克隆及基因组学研究提供了基础。  相似文献   

4.
[目的]研究3种白鲫杂交子代转录组学特征,为揭示鲫鲤杂交优势的分子机理提供理论依据,同时为在生产上培育出生长速度快、肉质好、适应能力强的杂交品种提供技术参考.[方法]以白鲫(♀)×黑龙江野鲤(♂)杂交子代(简称HB)、白鲫(♀)×散鳞镜鲤(♂)杂交子代(简称SB)和白鲫(♀)×兴国红鲤(♂)杂交子代(简称XB)为研究对象,利用RNA-seq高通量测序技术构建3种白鲫杂交子代转录组文库,以HiSeq PE150进行测序分析,原始序列经Trinity组装后进行功能注释(E-value<1e-5);以DESeq2 R鉴定差异表达基因,利用GOseq R和KOBAS分别对差异表达的基因进行GO和KEGG富集分析;并采用MicroSAtellite对转录本中的SSR位点进行挖掘.[结果]共组装得225858条unigenes,平均长度为668 bp,N50为938 bp,有171461条unigenes可注释到蛋白质数据库(Nr)、非冗余核苷酸数据库(Nt)、蛋白质序列数据库(SwissPort)、基因本体论(GO)、直系同源基因簇(COG/KOG)和京都基因与基因组百科全书(KEGG)数据库中,注释比例为75.92%.其中,52630条unigenes注释到NR数据库,43659条unigenes注释到SwissPort数据库,35756条unigenes注释到COG/KOG数据库,包括生化代谢、信号转导机制、防御系统和细胞结构等.差异表达基因KEGG分析结果显示,较多的差异表达基因注释到内吞作用、Jak-STAT信号通路、溶酶体、吞噬体和Wnt信号通路等免疫相关及与生长发育相关的MAPK信号通路、Hippo信号通路和背腹轴形成等通路中.此外,从获得的转录组序列中共鉴定出20272个SSR位点,大多数为二核苷酸重复基元(占62.15%).[结论]不同白鲫杂交子代间存在较多的差异表达基因,从中获得参与抗氧化、免疫和生长发育相关的通路和基因序列,且挖掘出20272个SSR位点,有助于选择性育种、分子标记开发及开展遗传多样性、遗传图谱构建和QTL定位等研究.  相似文献   

5.
【目的】利用RNA seq技术对中华蜜蜂(Apis cerana cerana,简称中蜂)幼虫肠道参考转录组进行de novo组装,并进行功能及代谢通路注释,进而利用该转录组数据进行中蜂幼虫的SSR分子标记鉴定。【方法】实验室条件下饲养中蜂幼虫,将纯化的蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)孢子饲喂3日龄幼虫,剖取4、5和6日龄幼虫肠道,液氮速冻。将健康幼虫肠道与感染球囊菌的幼虫肠道同时进行Illumina测序。通过对raw reads的过滤得到clean reads,利用Trinity软件组装得到unigenes。通过BLASTx(E-value10-5)比对NCBI Nr、Swiss-Prot、KOG和KEGG数据库,对unigenes进行功能和代谢通路注释。利用MISA软件对所有unigenes进行SSR搜索,并利用Primer Premier 5软件设计特异性SSR引物,通过常规PCR对来源于北京、辽宁兴城和四川成都的中蜂幼虫肠道样本进行SSR位点鉴定。【结果】中蜂幼虫肠道的RNA seq共得到35 670 000条reads,de novo组装得到43 557个unigenes,平均长度为898 nt。共有18 225个unigenes可被注释到上述公共蛋白数据库,单独注释到NCBI Nr、Swiss-Prot、KOG和KEGG数据库的unigenes数分别为3 899、443、37和10个。KOG注释结果显示,11 442条unigenes分布于25个基因家族,其中注释到RNA加工和修饰家族的基因数最多,达1 249个。9 679个unigenes的GO分类结果显示,在生物学进程分类中,注释到细胞进程的基因最多,达4 201个,在分子功能和细胞组分类中,注释到结合与细胞的基因数最多,分别为4 935和2 900个。4 517个unigenes可注释到KEGG数据库中的216个代谢通路,注释到核糖体的基因数最多,达385个。利用MISA软件,可在7 763个unigenes搜索到13 448个SSR位点,随机选取20对SSR引物对国内3个不同来源的中蜂幼虫肠道样本的SSR位点进行扩增,有6对引物可鉴定出SSR分子标记。【结论】成功组装并注释了中蜂幼虫肠道参考转录组,可为中蜂及其幼虫的分子生物学及组学研究提供重要的参考信息,也可用于补充、丰富和检验东方蜜蜂的参考基因组,基于此转录组数据开发出6个中蜂的SSR分子标记,可应用于中蜂的基因图谱构建、基因多样性分析、基因定位等研究,也说明利用转录组数据开发非模式生物SSRs的方法可行。  相似文献   

6.
利用转录组技术对鰤诺卡氏菌(Nocardia seriolae)感染的乌鳢(Channa argus)进行分析与比较,以揭示可能的免疫机制,尤其在Toll样受体和Nod样受体的免疫反应.从乌鳢的头肾提取总RNA,采用lllumina HiSeqTM2500进行测序和de novo转录组分析.乌鳢感染鰤诺卡氏菌后,对照组和试验组的clean reads分别是33556284(93.79%)和34202766(93.52%).利用Trinity软件对unigenes进行注释,从133999条unigenes里,一共106319条unigenes得到注释,占79.34%;NR(NCBI non-redundant protein database)注释54886(40.97%)条unigenes;39795(29.69%)的Swiss-Prot注释;5885(4.39%)条unigenes被KEGG(Kyoto encyclopedia of genes and genomes)注释到335条通路;5753条(4.29%)被注释到GO(Gene ontology)里.3912条unigenes表达差异,其中1552条表达上调(39.67%)和2360条表达下调(60.33%).Toll样受体和Nod样受体的免疫信号通路分别有28和13条差别表达基因发现有调制,12和3个上调,11和6个下调,5和4个unigenes没有显著的变化.经过转录组测序分析显示,乌鳢感染鰤诺卡氏菌后的转录复杂程度高,导致感染个体重诱导表达的基因产品的验证发现,尤其在非特异性免疫系统方面.  相似文献   

7.
【目的】叉角厉蝽[Eocanthecona furcellata (Wolff)]是许多鳞翅目、鞘翅目和半翅目害虫的捕食性天敌,在其取食的过程中,唾液起到了至关重要的作用。为了解叉角厉蝽唾液腺的转录组特征,深入地研究唾液腺中基因表达的情况。【方法】利用Illumina测序技术检测成虫和三龄若虫唾液腺差异基因表达谱,并采用聚类及功能注释对检测结果进行分析。【结果】共获得唾液腺unigenes序列26 022条,平均长度1 365 bp。通过同源序列比对搜索,14 057条unigenes注释至Nr、Nt、Pfam、Swiss-prot、GO、KOG和KEGG数据库。差异基因数字表达谱分析发现3 437条差异表达基因,其中成虫和三龄若虫唾液腺相比有1 871条unigenes上调,1 566条unigenes下调,同时鉴定了3个组织蛋白酶B (Cathepsin B)和3个神经内分泌蛋白7b2 (Neuroendocrine protein 7b2)基因。【结论】本研究丰富了半翅目昆虫唾液腺的分子生物学数据,为后续唾液分泌相关的功能基因研究提供一定的数据支持。  相似文献   

8.
【目的】获得冬瓜转录组序列、遗传变异等信息,从中挖掘冬瓜基因数据及SSR分子标记,为冬瓜后续研究提供数据支撑。【方法】以冬瓜嫩叶为材料,利用Illumina HiSeq~(TM)2000技术对冬瓜进行转录组测序,构建数据库从中获得干净序列。经De novo拼接组装后,将获得的单基因簇(Unigene)数据在非冗余蛋白数据库(nonredundant protein database,Nr)、蛋白质序列数据库(Swiss Prot protein database,Swiss Prot)、基因本体论数据库(gene ontology,GO)、蛋白质真核同源数据库(eukaryotic orthologous groups,KOG)、东京基因与基金组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白质家族域数据库(protein families database,Pfam)6个公共数据库中进行比对,最终得到冬瓜单基因簇注释信息。利用MISA软件对转录组单基因簇进行搜索,获得单基因簇中的SSR位点。【结果】从冬瓜嫩叶中得到62 021 032条高品质序列,组装后获得40 611条单基因簇,平均长度955 bp。将所有单基因簇在Nr和Swiss Prot数据库中进行比对,结果分别比对到27 474及19 573条单基因簇;在GO数据库中,所注释到的10 659条单基因簇分别匹配到生物功能、分子功能和细胞组分3个本体的47个功能组中;与KOG数据库进行注释比对,根据其功能将注释到的单基因簇划分为25类;KEGG数据库比对注释到10 799条冬瓜的单基因簇,可分为5个大类、19个亚类、125条代谢途径;在Pfam数据库中比对到17 990条单基因簇,分属于369个类群。SSR位点搜索发现,有5 086条单基因簇包含SSR序列,获得5 474个SSR位点。【结论】利用高通量测序获得大量冬瓜转录组信息,有助于从分子水平对冬瓜进行深入研究。  相似文献   

9.
为探究月月竹竹秆受到光照由绿色变为紫色的分子机制,本研究采集月月竹同一竹节紫色部分(Z)、渐变部分(M)和绿色部分(L)的竹青,提取RNA,利用PacBio Sequel三代全长转录组测序技术,结合生物信息学方法对不同颜色的竹青进行全长转录组分析。结果表明,经过三代测序和数据质量控制,共获得非冗余转录本66 961条,长度为500~3 000 bp,平均长度1 389.22 bp,序列总长度为93.02 Mbp,N50为1 830 bp, G+C碱基含量为49.56%。利用NR、Swiss-Prot、COG、GO、KEGG和Pfam数据库对所有转录本进行功能注释,共有56 938条转录本被成功注释,占全部转录本的85.03%;49 115条转录本被GO注释,其中催化活性、细胞器、代谢过程分别是GO数据库分子功能、细胞组分和生物过程中含转录本最多的项目;28 231个转录本被KEGG数据库注释,其中与碳水化合物代谢和基因翻译相关的转录本最多。结合GO注释和KEGG注释,66 961条转录本中有381条转录本与光信号的感受、传递以及光调控相关,包括红光和远红光的受体蛋白PHYA、PHYB及...  相似文献   

10.
[目的]利用高通量测序技术解析红脚艾(Artemisia rubripes Nakai)的转录组信息特征.[方法]通过高通量测序平台Illumina HiSeq 2500对红脚艾进行转录组测序,通过Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到红脚艾的转录组信息.[结果]测序数据经过质控后共获得24126043条高质量的reads,通过de novo组装获得173093个转录本,对组装的转录本去冗余后共获得85991个Unigene,平均长度为616.87 bp,N50为925 bp.共有47216个Unigene在NR、KEGG、COG、KOG、GO数据库获得功能注释,40802个Unigene在NR数据库注释,显示红脚艾与向日葵(Helianthus annuus)的单基因匹配率最高,16846个Unigene被KEGG数据库注释到130条代谢途径中,26171个Unigene被注释到25个KOG功能分类中,23203个Unigene被GO注释到生物过程、细胞组成和分子功能三大类51个功能分类,12810个Unigene被注释到25个COG功能分类中.[结论]利用高通量测序技术获得了红脚艾转录组信息特征,这些数据将为后期开展功能基因鉴定、解析化合物次生代谢途径及其调控机制奠定研究基础.  相似文献   

11.
为探讨辣木叶营养价值形成的遗传基础,采用RNA-seq对不同发育时期的辣木叶混合样品进行转录组测序,获得44 056 449个reads,共组装得到75 452条unigene,平均长度为795.69nt,其中有15 824条unigene长度大于1 000nt。采用公共数据库进行同源比对,共有30 847条unigene得到注释。其中,有18 277条unigenes被注释到GO数据库的52个功能组,9 689条unigene在COG数据库中得到注释。有10 130条unigene被富集到129条KEGG途径,包括碳代谢、氨基酸生物合成和氧化磷酸化途径。  相似文献   

12.
【目的】开展荸荠球茎发育过程转录组测序研究,为研究荸荠球茎发育过程相关基因表达信息提供参考。【方法】运用高通量测序技术,对荸荠球茎不同发育时期进行转录组测序研究。【结果】组装共得到223 182条转录本和90 542条Unigene,平均长度为809 bp,N50为1119。组装完整性较高,效果较好。对所得Unigene进行不同数据库注释,共有50 583条Unigene成功注释到7个数据库(NR、GO、NT、Pfam、KEGG、KOG及Swiss-prot)。对差异表达基因分析,发现球茎膨大初期的差异表达基因数目最多,为最活跃阶段。GO功能富集分析结果表明,33 205个基因获得功能注释,分为分子功能、细胞组分和生物学过程等3大类和54个亚类。COG功能分类结果表明,17 743个基因分布于25个功能区域,其中碳水化合物代谢占重要地位。KEGG代谢通路注释结果表明有20 667个基因获得功能注释,共有116条代谢途径,其中淀粉-蔗糖代谢占主要作用。【结论】利用高通量转录组测序技术首次建立了荸荠优良品种‘桂蹄3号’球茎的转录组数据库,为进一步研究荸荠球茎淀粉生物合成相关基因的功能及形成的分子机制提供了数据基础。  相似文献   

13.
[目的]分析藤茶高通量转录组序列,从中挖掘出黄酮类化合物合成相关基因,为进一步揭示藤茶黄酮类化合物生物合成调控机制提供理论参考.[方法]分别采集藤茶的幼叶和成熟叶,提取其总RNA构建cDNA文库,采用Il-lumina HiSeqTM 4000高通量测序平台对藤茶叶片进行转录组测序,经过滤处理后运用Trinity组装,将获得的Unigene与Nr、Nt、Pfam、Swiss-Prot、GO、KO和KOG 7个数据库进行比对注释,并预测Unigenes的编码区序列(CDS);基于KEGG信号通路富集分析,发掘藤茶黄酮类化合物合成相关基因.[结果]藤茶叶片转录组测序获得82126236条原始测序序列(Raw reads),过滤处理后得到80156972条高质量序列(Clean reads),进一步组装拼接得到92472条Unige-nes,平均长度为1208 bp,N50长度为1780 bp,其中,至少在1个数据库注释的Unigenes有84217条,占Unigenes总数的91.07%,有8944条Unigenes在7个数据库均被注释,占Unigenes总数的9.67%.在GO数据库成功注释的41116条Unige-nes可分为生物学过程、细胞组分和分子功能三大类,共56个小类;在KOG数据库注释的14553条Unigenes可分成25类,其中,一般功能预测注释成功的Unigenes最多(1946条);其次是翻译后修饰、蛋白质翻转、分子伴侣(1776条),参与次生代谢物质的生物合成、转运和降解的Unigenes较少,仅有319条;KEGG信号通路富集分析发现,共有15262条Unigenes注释到128条KEGG信号通路,以注释为代谢的Unigenes最多,为8694条,其中筛选获得有98个黄酮类化合物合成相关基因,分别编码苯丙烷代谢通路的3种关键酶和类黄酮代谢通路的14种关键酶.藤茶叶片转录组Unigenes与Swiss-Prot和Nr数据库比对,获得52582条CDS序列,ESTScan 3.0.3预测获得35535条CDS序列.[结论]藤茶在细胞过程、代谢过程、单有机体过程、细胞和细胞部分、结合和催化活性能力分布的基因较丰富,在一般功能、翻译、翻译后修饰、蛋白质翻转及分子伴侣的基因表达量较高,具有较强的碳水化合物代谢能力.多种关键酶基因参与藤茶黄酮类化合物的生物合成,推测其生物合成途径存在多条分支,调控机制也较复杂.  相似文献   

14.
金钱松是中国特有的孑遗单种属裸子植物,现存的自然种群数量很少,多被引种栽培,也是著名的庭院观赏树种。迄今为止,其遗传背景和基因组信息并不清楚,对于金钱松的保护及其遗传结构研究迫切需要基因组资源。采用Illumina HiSeqTM2500高通量测序平台对金钱松叶片进行转录组测序,经de novo组装共获得70 761条Unigene,平均长度为699 bp,N50的长度为1 300 bp,Q20和Q30序列分别占96.59%和91.29%。通过对7个不同的蛋白质和功能域数据库进行比对和功能注释,有43 674条Unigene(61.72%)注释成功。在GO数据库中,有28 355条Unigene按功能被划分成3大类56个小类,以执行生物过程的类区所占比例最多。通过KEGG pathway分析,有14 623条Unigene注释成功,发现了显著性富集的32条代谢通路,以代谢相关的基因最多。在KOG数据库中,有15 931条Unigene被分配到26个基因功能大类中,其中以参与一般功能、转录、翻译、修饰及蛋白运输的基因最为丰富。此外,利用MISA软件对转录组序列进行EST-SSR位点搜索与分析,共检测到2 260条Unigene含有2 462个EST-SSR位点,分布频率为3.48%,其中有180条序列含有一个以上EST-SSR位点,83条序列含有复合EST-SSR位点,以三核苷酸重复基元类型最为丰富,占42.53%(1 047个EST-SSR),重复次数主要以5~8次为主。这些重要的转录组序列为进一步了解金钱松生物学过程的分子机制提供了有价值的信息,并为未来的功能基因组分析、分子标记开发和群体遗传学分析提供了丰富的资源。  相似文献   

15.
采用2代 Illumina Hi-Seq 测序技术对2年生杜鹃花白凤4号(Rhododendron pulchurum cv. BaiFeng 4)扦插苗叶片的转录组进行测序,获得了213 723 424条 Clean reads数据,经过质控和De novo。组装共获得平均长度为930 nt的53 568个Unigenes。与Nr、Swiss-Prot、KOG、KEGG四大数据库进行BLAST信息比对(E-value≤10-5),共获得28 877个注释基因。与Nr数据库序列同源性比较发现,杜鹃花与葡萄(Vitis vinifera)具有较高的同源性,而与其他物种的同源性较低。杜鹃花转录组的Unigenes在KOG数据库比对上30 508个注释,分为25类。在GO数据库比对上17 218个Unigenes,其中与抗逆有关的Unigenes有11 928个。在KEGG数据库的132条代谢通路中富集了6 475个杜鹃花Unigenes,其中注释到植物激素生物合成代谢途径和信号转导途径的有384个。同时,有1 062个Unigenes被注释为转录因子,有8 738条SSR标记被挖掘。  相似文献   

16.
采用Illumina Hiseq2000高通量测序技术对西藏黄牡丹授粉前后花蕾转录组测序,运用生物信息学分析基因表达谱研究和差异表达基因功能预测,以期了解西藏黄牡丹授粉前后花蕾生长发育分子机理,并为西藏黄牡丹的基因水平研究奠定基础。结果表明:对过滤得到的高质量序列进行拼装授粉前(A2-1)和授粉后(A3-1)平均得到了45453条和53742条unigenes,GC含量分别为41.64%和41.98%,Unigenes的平均长度为822bp和722bp。两个样品之间差异表达的上调基因有11321个,差异表达的下调基因有5585个。其中13288个差异表达基因(DGEs)分别注释到GO数据库,分别涉及到细胞组成成份(cellular component),生物学过程(biological process)和分子功能(molecular function)三大功能。KEGG数据库成功注释9842个DEGs,占总DEGs的58.22%。共涉及Cellular Processes(细胞过程)、Environmental Information Processing(环境信息处理)、Genetic Information Processing(遗传信息处理)、Human Diseases(人类疾病)、Metabolism(代谢)、Organismal Systems(生物系统)等6个大的功能类别。本研究首次对西藏黄牡丹转录组进行了分析,为黄牡丹的分子生物学研究提供了宝贵的基因组数据来源。  相似文献   

17.
【目的】利用第三代纳米孔(nanopore)长读段测序技术对蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)的纯化菌丝(Aam)和孢子(Aas)进行测序,构建和注释球囊菌的高质量全长转录组。【方法】通过Oxford Nanopore PromethION平台对Aam和Aas进行测序。利用Guppy软件对原始读段(raw reads)进行碱基识别(base calling),通过过滤短片段和低质量原始读段得到有效读段(clean reads)。通过识别两端引物鉴定全长转录本序列。通过比对Nr、Swissprot、KOG、eggNOG、Pfam、GO和KEGG数据库获得全长转录本的注释信息。分别利用CPC、CNCI、CPAT、Pfam 4种方法对长链非编码RNA(long non-coding RNA,lncRNA)进行预测,取四者的交集作为高可信度的lncRNA。【结果】Aam和Aas的纳米孔测序分别测得6 321 704和6 259 727条原始读段,经质控得到5 669 436和6 233 159条有效读段,其中包含的全长有效读段分别为4 497 102(79.32%)和4 963 101(79.62%)条。共鉴定到9 859和16 795条非冗余全长转录本,N50分别为1 482和1 658 bp,平均长度分别为1 187和1 303 bp,最大长度分别为6 472和6 815 bp。Venn分析结果显示有6 512条非冗余全长转录本为菌丝和孢子所共有,分别有3 347和10 283个非冗余全长转录本为二者特有。此外,在球囊菌菌丝和孢子中共鉴定到20 142条全长转录本,其中分别有20 809、11 151、17 723、12 164、11 340和9 833条全长转录本可注释到Nr、KOG、eggNOG、Pfam、GO和KEGG数据库。注释全长转录本数量最多的物种是球囊菌、Polytolypa hystricis和荚膜组织胞浆菌(Histoplasma capsulatum)。GO数据库注释结果显示,上述全长转录本可注释到45个功能条目,涉及细胞组件、细胞和细胞器等细胞组分相关条目;催化活性、结合和转运器活性等分子功能相关条目;以及细胞进程、代谢进程和单一组织进程等生物学进程相关条目。KEGG数据库注释结果显示,上述全长转录本还可注释到抗生素的生物合成、核糖体、氨基酸的生物合成、碳代谢和剪接体等49条通路。此外,鉴定到648条高可信度的lncRNA,包含480条基因间区lncRNA、119条反义链lncRNA和49条正义链lncRNA。【结论】构建和注释了球囊菌的首个高质量全长转录组,为探究球囊菌转录组的复杂性,完善参考基因组的序列和功能注释信息以及深入开展球囊菌可变剪接体的功能研究提供了关键依据。  相似文献   

18.
【目的】高通量测序获取金钱蒲(Acorus gramineus)7个不同组织转录组信息,为不同组织中类黄酮化学成分合成差异提供分子信息,进而在分子水平上研究金钱蒲不同组织内类黄酮化学成分合成差异。【方法】利用高通量测序技术平台完成金钱蒲7个不同部位的转录组测序,对unigenes进行功能注释,借助注释结果挖掘类黄酮生物合成通路,筛选通路中的差异表达基因(Differentially expressed genes,DEGs)并进行表达量分析。【结果】共获得高质量数据39.91~42.97 M,总碱基量为5.98~6.45 Gb,Q30碱基百分比大于94.05%,GC含量为47.81%~50.32%。18 616条unigenes在GO数据库中获得62 506个注释,根据功能划分为细胞组分、分子功能及生物过程三大类,分别对应6、14、21个亚类,大量基因分布在细胞解剖实体、连接、催化活性和细胞过程等亚类中。10 124条unigenes富集在KEGG数据库的5大类19个亚类中,从其中筛选出4条类黄酮生物合成途径,14个关键酶,63个差异表达酶基因。这些基因在金钱蒲7个组织中具有表达差异性...  相似文献   

19.
为了探究紫花苜蓿组成型抗蓟马转录调控机制,以自主培育的抗蓟马苜蓿品种草原4号为研究对象,以感蓟马苜蓿品种草原2号为对照,采用RNA-seq技术进行转录组测序分析。试验共获得82.34 Gb clean data,组装得到77 837个unigenes, 139 949个转录本,平均序列长度为830.17 bp;共有47 573个unigenes被注释到六大数据库中。与草原2号相比,草原4号共检测到差异基因2 388个,其中上调基因1 361个,下调基因1 027个。KEGG对相关差异基因的功能注释表明,上调基因主要注释到能量代谢、碳水化合物代谢等代谢过程以及遗传信息处理相关途径,下调基因主要注释到遗传信息处理、细胞过程和环境适应相关途径。qRT-PCR验证结果发现所选的8个基因在2个品种中的相对表达量同RNA-Seq测的结果一致,说明本试验中转录组的结果可靠。结果可为揭示苜蓿组成型抗蓟马机理奠定基础,进而为抗蓟马新品种培育及蓟马防治提供理论支撑。  相似文献   

20.
【目的】掌握不同生长规格墨瑞鳕个体间差异表达基因的表达特点,为其功能相关基因深度挖掘及分子遗传育种提供科学依据。【方法】挑选同一养殖条件下极大个体和极小个体的墨瑞鳕,构建肌肉组织cDNA文库后,采用Illumina HiSeqTM 4000测序平台对存在生长差异的墨瑞鳕肌肉组织进行转录组测序分析,获得的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等数据库中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行GO功能注释及KEGG信号通路富集分析,并采用MISA进行SSR鉴定分析。【结果】从墨瑞鳕肌肉组织中共测序获得39749条Unigenes,其长度范围在301~55230 bp,平均长度为1705 bp。注释到Nt、Nr、Swiss-Prot、Pfam数据库的Unigenes分别有27046、20824、18268和17772条,在7个数据库中均得到注释的Unigenes共计6742条,占Unigenes总数的16.96%。根据差异表达基因筛选条件P<0.05且|log2 Fold Change|>1,共筛选出722个差异表达基因,其中上调基因308个、下调基因414个。差异表达基因GO功能注释分析结果表明,注释基因数目较多的GO功能条目包括细胞过程、代谢过程、膜、细胞器及结合等;KEGG信号通路富集分析发现,差异表达基因被成功富集到234条信号通路上,主要涉及磷脂酰肌醇3激酶/蛋白激酶信号通路、MAPK信号通路、胰岛素信号通路及FoxO信号通路等。在39749条Unigenes中鉴定筛选出22120个SSRs,占Unigene总数的55.65%,SSR的平均间距为3063 bp。【结论】基于转录组测序分析获得的墨瑞鳕肌肉组织差异表达基因以发挥结合、细胞过程及代谢过程等功能为主,且主要富集在PI3K-Akt信号通路、核糖体信号通路、FoxO信号通路及细胞凋亡等能量代谢相关通路上,通过共同协调而对墨瑞鳕的生长发育起调控作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号