首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
利用RNA-seq技术对所构建的野生毛葡萄(Vitis quinquangularis Rehd)叶片的转录组进行测定,对原始reads进行过滤和组装,得到了35 238条质量较高的unigene,平均长度为1 081 nt,N50为1 735 nt。基于NCBI蛋白质数据库(Nr)、蛋白质序列数据库(Swiss-Prot)、京都基因与基因组百科全书(KEGG)数据库和直系同源基因簇(COG)进行相似性比对,共注释了26 751条unigene,另有8 487条unigene未被注释。物种同源性显示与葡萄的同源性最高为74.48%。利用COG数据库将unigene分成25类,通过GO分类和KEGG富集性分析,将unigene分别归类于44个GO类别和122个代谢途径。此外,在35 238条unigene中共搜索到4 428个SSR位点,二核苷酸的SSR数目最多(1 906条),其次为三核苷酸(1 762条)。这些信息为毛葡萄功能基因、相关候选基因的发掘以及分子标记辅助育种提供了重要依据。  相似文献   

2.
【目的】对银耳进行转录组测序分析,分析多糖生物合成途径和挖掘关键功能基因。【方法】采用Illumina Hiseq 2500测序平台对银耳菌丝体进行测序,组装得到unigene序列,并与公共数据库进行对比分析和注释,挖掘果糖和甘露糖代谢通路相关基因。【结果】本研究共得到4.72 Gb raw data,拼接后获得17 008条unigene序列,N50为2073 bp;注释结果表明,76.47%序列能够注释到Uniprot公共数据库,注释到GO分类和KEGG通路的unigene分别为10 152和5671条。进一步分析银耳果糖和甘露糖代谢途径相关基因,挖掘得到74条unigene;其中编码L-iditol 2-dehydrogenase的unigene最多,其次是butanol dehydrogenase。【结论】基于转录组测序数据解析及预测,为研究银耳多糖和其它产物的生物合成途径及分子机制提供了数据支持,也为银耳品质的形成提供理论依据。  相似文献   

3.
为获取入侵性检疫害虫椰子织蛾的基因信息,利用高通量测序技术对该害虫进行了转录组测序。结果表明:经拼接共获得了37 416条unigenes,平均长度为803 bp,N50为1 415 bp;通过BlastX比对,有19 154条unigenes (51.19%)成功在Nr中被注释。在Nr中成功注释的unigene,与黑脉金斑蝶同源性最高,达到68.45%;在GO注释中,共有14 131 (37.76%)条unigenes被成功注释到细胞组分、分子功能和生物过程3大类的54个分支;在COG数据库中,成功注释的8 606条unigenes被注释到26个分类;在KEGG中,共有6 171条(16.49%) unigenes被注释到5大类通路的260条途径上。基于构建的转录组数据库,鉴定得到3 248个微卫星。  相似文献   

4.
5.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

6.
为开展彩色马蹄莲基因功能分析、表型差异研究、分子标记开发和遗传多样性研究,通过Illumina HiSeq 4000高通量测序平台对2个彩色马蹄莲育成品种‘金丝绒’和‘梦幻’进行转录组测序分析,经de novo组装后获得76 060条unigene,进一步利用4个公共数据库(Nr、Swiss-Prot、KOG和KEGG)对其进行注释,注释了30 321条unigene;并基于转录组数据开展SSR位点预测和密码子使用偏好性分析。结果表明:有10 083个unigene参与了132条KEGG代谢通路,其中代谢途径和次生代谢产物的生物合成途径是unigene最为富集的2个途径; 9 721条unigene序列中共含有13 206个SSR位点;预测到1 115个转录因子,分属于54个家族。此外,彩色马蹄莲密码子使用偏好性较弱,高频密码子为AGG、CAG和AAG。  相似文献   

7.
李青  何斌  陈群利  游萍 《江苏农业科学》2022,50(3):28-35+48
为进一步丰富鲫鱼基因组数据,对肝脏、血液和卵巢组织进行高通量转录组测序。采用Illumina Hiseq高通量测序平台进行转录组测序,对所获得序列进行比对、基因注释、差异表达和SNP、SSR分析。结果提示,组装得到127 801条unigene,平均长度为735 bp。与相应数据库比对,最终获得117 414(91.87%)个有注释信息的unigene,有105条unigene获得GO注释,并分类到生物学过程、细胞组分和分子功能三大类42个功能中;有20 725条unigene被归纳到KOG的26个直系同源功能类型;获得KEGG注释的unigene共参与五大类32小类代谢通路。在鲫鱼肝脏、血液和卵巢组织中分别检测到307 740、343 516、348 795个SNP位点,共检测到48 808个SSR位点。提示获得有注释信息的unigene共117 414条,此外,获得一些SNP和SSR位点。结果可为进一步克隆和挖掘鲫鱼功能基因、多态性检测及群体遗传多样性分析等方面研究奠定基础。  相似文献   

8.
为获得岩原鲤转录组信息,发掘功能基因,本研究采用Illumina高通量测序技术对岩原鲤全组织转录组进行测序。结果获得64 257 918个EST序列,经拼接和组装得到83 252条单基因序列(unigene),平均长度787 bp,长度范围201~16 572 bp。利用NCBI的蛋白质非冗余数据库(Nr)对所有unigene进行相似性搜索,共有37 157条unigene(44.63%)与数据库中的已知序列同源。利用Blast2GO v2.5软件对unigene进行注释,共得到29 919条(35.93%)注释基因,根据GO功能分类将其分为生物过程、细胞组分和分子功能3大类56亚类。经KOG注释及分类,共有17 869条(21.49%)unigene成功注释到真核直系同源组中,并将其分为26个功能组分。经KEGG代谢通路分析可分为5大类(细胞过程、环境信息处理、遗传信息处理、代谢和有机系统)32小类共267个代谢通路。本研究通过高通量测序技术,对岩原鲤转录组进行测序,获得了大量的转录组信息,为岩原鲤功能基因克隆及基因组学研究提供了基础。  相似文献   

9.
采用2代 Illumina Hi-Seq 测序技术对2年生杜鹃花白凤4号(Rhododendron pulchurum cv. BaiFeng 4)扦插苗叶片的转录组进行测序,获得了213 723 424条 Clean reads数据,经过质控和De novo。组装共获得平均长度为930 nt的53 568个Unigenes。与Nr、Swiss-Prot、KOG、KEGG四大数据库进行BLAST信息比对(E-value≤10-5),共获得28 877个注释基因。与Nr数据库序列同源性比较发现,杜鹃花与葡萄(Vitis vinifera)具有较高的同源性,而与其他物种的同源性较低。杜鹃花转录组的Unigenes在KOG数据库比对上30 508个注释,分为25类。在GO数据库比对上17 218个Unigenes,其中与抗逆有关的Unigenes有11 928个。在KEGG数据库的132条代谢通路中富集了6 475个杜鹃花Unigenes,其中注释到植物激素生物合成代谢途径和信号转导途径的有384个。同时,有1 062个Unigenes被注释为转录因子,有8 738条SSR标记被挖掘。  相似文献   

10.
香榧具有重要的经济价值,但其基因组信息相对匮乏,限制了其分子生物学和基因功能的研究。本文以不同组织的香榧作为研究对象,采用新一代高通量测序技术平台Illumina Hi Seq?2000对香榧转录组进行测序和数据分析,共得到37,349,086个reads片段,总碱基数为4.35 G。利用组装软件,对获得的高质量序列进行组装,共得到104,636个Unigene,平均长度为784 nt,N50为1,702。将Unigene序列与公共数据库进行比对,28,766个Unigenes获得了注释。其中26,856个Unigene在NR蛋白数据库中获得注释,24,003个Unigenes在NT数据库中获得注释,21,401个Unigene在Swiss-Prot蛋白数据库中获得注释,16,137个Unigene在COG数据库中获得注释,11,410个Unigene在GO数据库中获得注释。根据KEGG注释信息,18,564个Unigene被划分到256个代谢途径中。SSR位点搜索发现,在4,217个Unigene中含有4,706个SSR位点。分析所获得的转录组数据,将为香榧功能基因的克隆,基因的表达,指纹图谱构建和分子标记辅助选育奠定基础。  相似文献   

11.
基于全长转录组测序(isoform sequencing, Iso-Seq)技术对野生马齿苋叶片(对照、干旱和低温胁迫3种处理的叶片)转录组进行测序及其转录组信息分析的结果显示,总共得到641 732条原始片段,质控后得到合格的插入片段26 758 071条,总碱基量为44 Gb,利用CCS软件获得442 760条一致性序列,根据smrtlink软件得到全长的插入片段和全长的去除嵌合体的插入片段分别为391 258条和301 412条,去除冗余得到103 298条转录本,最终得到39 717条unigene,预测出40 952条LncRNA和38 419条CDS序列;并将unigene与Uniprot、Pfam、GO、KEGG、eggNOG、Pathway和Nr等数据库进行同源比对,其中36 381条unigene被注释,从这些unigene里查找到25 898个简单重复序列标记(simple sequence repeats, SSR)位点。利用差异表达分析软件DESeq2筛选不同处理组间的差异表达基因,对照和干旱处理、对照和低温胁迫处理及干旱和低温胁迫处理间分别鉴定出16 194(...  相似文献   

12.
【目的】利用RNA seq技术对中华蜜蜂(Apis cerana cerana,简称中蜂)幼虫肠道参考转录组进行de novo组装,并进行功能及代谢通路注释,进而利用该转录组数据进行中蜂幼虫的SSR分子标记鉴定。【方法】实验室条件下饲养中蜂幼虫,将纯化的蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)孢子饲喂3日龄幼虫,剖取4、5和6日龄幼虫肠道,液氮速冻。将健康幼虫肠道与感染球囊菌的幼虫肠道同时进行Illumina测序。通过对raw reads的过滤得到clean reads,利用Trinity软件组装得到unigenes。通过BLASTx(E-value10-5)比对NCBI Nr、Swiss-Prot、KOG和KEGG数据库,对unigenes进行功能和代谢通路注释。利用MISA软件对所有unigenes进行SSR搜索,并利用Primer Premier 5软件设计特异性SSR引物,通过常规PCR对来源于北京、辽宁兴城和四川成都的中蜂幼虫肠道样本进行SSR位点鉴定。【结果】中蜂幼虫肠道的RNA seq共得到35 670 000条reads,de novo组装得到43 557个unigenes,平均长度为898 nt。共有18 225个unigenes可被注释到上述公共蛋白数据库,单独注释到NCBI Nr、Swiss-Prot、KOG和KEGG数据库的unigenes数分别为3 899、443、37和10个。KOG注释结果显示,11 442条unigenes分布于25个基因家族,其中注释到RNA加工和修饰家族的基因数最多,达1 249个。9 679个unigenes的GO分类结果显示,在生物学进程分类中,注释到细胞进程的基因最多,达4 201个,在分子功能和细胞组分类中,注释到结合与细胞的基因数最多,分别为4 935和2 900个。4 517个unigenes可注释到KEGG数据库中的216个代谢通路,注释到核糖体的基因数最多,达385个。利用MISA软件,可在7 763个unigenes搜索到13 448个SSR位点,随机选取20对SSR引物对国内3个不同来源的中蜂幼虫肠道样本的SSR位点进行扩增,有6对引物可鉴定出SSR分子标记。【结论】成功组装并注释了中蜂幼虫肠道参考转录组,可为中蜂及其幼虫的分子生物学及组学研究提供重要的参考信息,也可用于补充、丰富和检验东方蜜蜂的参考基因组,基于此转录组数据开发出6个中蜂的SSR分子标记,可应用于中蜂的基因图谱构建、基因多样性分析、基因定位等研究,也说明利用转录组数据开发非模式生物SSRs的方法可行。  相似文献   

13.
【目的】对青花菜花蕾进行转录组测序分析,并挖掘与蜡粉合成相关基因,为探明青花菜花球表面蜡粉形成的分子机制提供理论参考。【方法】分别提取野生型和蜡粉缺失型青花菜花球总RNA,采用Illumina HiSeqTM 2500平台进行转录组测序,获得高质量Clean reads,采用Trinity进行序列组装后获得青花菜Unigene库,将获得的Unigene序列与Nr、Nt、KEGG、Pfam、KOG/COG、Swiss-Prot和GO数据库比对,获得基因功能注释信息;使用DESeq2进行差异表达分析。【结果】共获得44.68 Gb Clean data,De novo组装得到41244条Unigenes,N50长度为1847 bp。从所获得的Unigenes中筛选出8685个差异表达基因(DEGs)(上调基因5747个,下调基因2938个),共有8038个基因被注释到不同数据库,其中,5220个基因注释到Pfam数据库; 2066个基因注释到COG数据库,3866个基因注释到KOG数据库; 2580个差异表达基因被注释到75个转录因子家族中,注释最多的是MYB家族(235个);GO数据库中6095个差异表达基因注释到细胞组分、分子功能和生物学过程三大类的52个功能分类; KEGG数据库中,1671个差异表达基因富集到138条代谢通路,其中13个差异表达基因与脂肪酸合成有关,7个差异表达基因与蜡粉生物合成途径有关。【结论】转录因子MYB家族在调控青花菜蜡粉合成中发挥重要作用。蜡粉合成过程中相关酶基因的差异表达是调控青花菜蜡粉合成的关键,尤其是野生型和蜡粉缺失突变体中特异性表达的差异表达基因,可作为后续研究青花菜花球表面蜡粉形成分子机制的对象。  相似文献   

14.
15.
以水杉原生种为材料,提取其幼嫩植株的根、茎和叶的总RNA,经m RNA纯化、反转录、全长转录组文库构建等过程,再采用SMRT技术测定其全长转录本序列,运用生物信息学对获得的原始转录组数据进行分析。结果显示:提取的总RNA符合建库要求;全长转录组测序共获得了包含5 914 711个亚读段(subreads)的14.0 Gb的数据,质量控制处理后包括236 130个全长非嵌合读段(reads)和97 626个一致性reads;转录本经去冗余处理后共获得61 057个全长一致性读段(unigenes),其中有54 099个被成功注释到7个数据库中,注释比达88.60%;对水杉unigenes作CDS(coding sequence)长度分布及转录因子分析,其CDS长度范围为144~6477 nt,平均长度约为679 nt;共检测到2386个转录因子,这些转录因子可以归类为29个家族。  相似文献   

16.
利用转录组技术对鰤诺卡氏菌(Nocardia seriolae)感染的乌鳢(Channa argus)进行分析与比较,以揭示可能的免疫机制,尤其在Toll样受体和Nod样受体的免疫反应.从乌鳢的头肾提取总RNA,采用lllumina HiSeqTM2500进行测序和de novo转录组分析.乌鳢感染鰤诺卡氏菌后,对照组和试验组的clean reads分别是33556284(93.79%)和34202766(93.52%).利用Trinity软件对unigenes进行注释,从133999条unigenes里,一共106319条unigenes得到注释,占79.34%;NR(NCBI non-redundant protein database)注释54886(40.97%)条unigenes;39795(29.69%)的Swiss-Prot注释;5885(4.39%)条unigenes被KEGG(Kyoto encyclopedia of genes and genomes)注释到335条通路;5753条(4.29%)被注释到GO(Gene ontology)里.3912条unigenes表达差异,其中1552条表达上调(39.67%)和2360条表达下调(60.33%).Toll样受体和Nod样受体的免疫信号通路分别有28和13条差别表达基因发现有调制,12和3个上调,11和6个下调,5和4个unigenes没有显著的变化.经过转录组测序分析显示,乌鳢感染鰤诺卡氏菌后的转录复杂程度高,导致感染个体重诱导表达的基因产品的验证发现,尤其在非特异性免疫系统方面.  相似文献   

17.
18.
运用高通量技术对杂交鳢进行转录本测序和数据分析,经拼接与组装,最终获得52 065条unigenes,长度范围201~12 407 bp,序列平均长度为710 bp。从长度分布、GC含量和基因表达量等方面对unigenes进行评估,数据显示测序质量较好。进一步的数据分析,共鉴定出20 535个CDS,37 324个SNP位点和7 830个微卫星。用6大数据库Swiss–Prot、Nr、Pfam、KEGG、KOG和GO注释杂交鳢转录组unigenes,分别对应有20 955、28 938、19 339、14 052、19 358和18 635条unigenes获得注释。根据GO数据库的注释,可将这些unigenes分为生物过程、细胞组分和分子功能3大类共50亚类。KEGG代谢通路分析表明,这些unigenes参与了5大类30亚类共268个代谢通路,其中,参与信号转导通路的unigenes数量最多,有1 716条。  相似文献   

19.
20.
【目的】掌握不同生长规格墨瑞鳕个体间差异表达基因的表达特点,为其功能相关基因深度挖掘及分子遗传育种提供科学依据。【方法】挑选同一养殖条件下极大个体和极小个体的墨瑞鳕,构建肌肉组织cDNA文库后,采用Illumina HiSeqTM 4000测序平台对存在生长差异的墨瑞鳕肌肉组织进行转录组测序分析,获得的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等数据库中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行GO功能注释及KEGG信号通路富集分析,并采用MISA进行SSR鉴定分析。【结果】从墨瑞鳕肌肉组织中共测序获得39749条Unigenes,其长度范围在301~55230 bp,平均长度为1705 bp。注释到Nt、Nr、Swiss-Prot、Pfam数据库的Unigenes分别有27046、20824、18268和17772条,在7个数据库中均得到注释的Unigenes共计6742条,占Unigenes总数的16.96%。根据差异表达基因筛选条件P<0.05且|log2 Fold Change|>1,共筛选出722个差异表达基因,其中上调基因308个、下调基因414个。差异表达基因GO功能注释分析结果表明,注释基因数目较多的GO功能条目包括细胞过程、代谢过程、膜、细胞器及结合等;KEGG信号通路富集分析发现,差异表达基因被成功富集到234条信号通路上,主要涉及磷脂酰肌醇3激酶/蛋白激酶信号通路、MAPK信号通路、胰岛素信号通路及FoxO信号通路等。在39749条Unigenes中鉴定筛选出22120个SSRs,占Unigene总数的55.65%,SSR的平均间距为3063 bp。【结论】基于转录组测序分析获得的墨瑞鳕肌肉组织差异表达基因以发挥结合、细胞过程及代谢过程等功能为主,且主要富集在PI3K-Akt信号通路、核糖体信号通路、FoxO信号通路及细胞凋亡等能量代谢相关通路上,通过共同协调而对墨瑞鳕的生长发育起调控作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号