首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 515 毫秒
1.
本研究采用Illumina高通量测序技术对3种不同倍性的桤木属植物混合样品进行转录组测序,利用生物信息学方法开展基因表达谱的研究、功能基因的预测。测序结果组装获得85 769个Unigene,总长50 200 910 bp,功能注释到NR、NT、Swiss-Prot、KEGG、COG、GO库的Unigene分别是45 172、38 673、29 181、25 096、14 968和30 675个,所有注释上的Unigene是48 204个。根据KEGG pathway数据库,对桤木转录组的Contig进行pathway生物学通路的注释和预测,共识别出25 096个Unigene具有对应的功能,并关联到128条生物学通路。SSR查找发现,从85 769个Unigene中找到8 678个SSR位点,占Unigene总数的比例为10.11%。其中,二核苷酸重复所占比例最高,达到65.87%,其次是三核苷酸重复,为28.36%,四、五、六核苷酸重复类型的数量很少,总计5.77%。SSR不同重复单元类型中,出现频率最高的为AG/CT,其次是AAG/CTT和AT/AT。  相似文献   

2.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

3.
大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用Illumina Hi Seq TM 2000高通量测序平台对1年生大花序桉根系转录组测序和de novo组装,将得到的Unigene与公共数据库比对,同时进行转录组分析。结果显示,组装获得53 433条Unigene,其平均长度890 bp,N50长度为1 587 bp;有34 700条Unigene获得注释信息,占全部Unigene的64.94%,其中19 327条Unigene注释到KOG数据库,被分到25个类别中,共得到32 302个KOG功能注释信息;有11 197条Unigene注释到GO数据库中,共获得了54 971个GO注释功能,归于细胞组分、分子功能和生物学过程三大类;有12 181条Unigene得到KEGG注释,其中6 493条Unigene归入128条代谢途径,发现有57条Unigene参与氮代谢途径。通过软件查找获得13 290个SSR位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。  相似文献   

4.
基于高通量测序的金钗石斛叶转录组数据分析   总被引:2,自引:0,他引:2  
本研究采用Illumina Hiseq4000对金钗石斛(Dendrobium nobile)叶转录组进行测序,共获得5.6 Gb数据。组装并去冗余后得到61 998个Unigene,其总长度,平均长度,N50以及GC含量分别为53 773 338 bp、867 bp、1 482 bp和43.09%。将Unigene比对到七大功能数据库进行注释,最终分别有34 250(NR:55.24%),28 010(NT:45.18%)、22 029(Swissprot:35.53%)、13 384(COG:21.59%)、25 754(KEGG:41.54%)、7 731(GO:12.47)以及25 407(Interpro:40.98%)个Unigene获得功能注释。在KEGG数据库中,注释上的与碳水化合物代谢、萜类和黄酮类化合物代谢、以及多糖合成相关的Unigene分别有2 819个、706个和559个。根据注释结果共检测出34 096个CDS,未注释上的Unigene使用ESTScan预测后获得2 108个CDS。检测出7 165个SSR分布于6 264个Unigene中,其中在不同重复基序类型中,出现频率最高的为AG/CT,其次是AAG/CTT、AT/AT和AGG/CCT。同时,预测出1 234个编码转录因子的Unigene。该转录组测序分析为金钗石斛次生代谢和转录组方面研究提供了一定的理论参考。  相似文献   

5.
为了获得罗布麻转录组信息,研究罗布麻中功能基因的表达以及分子标记的开发,本研究采用Illumina HiSeq2000高通量测序技术对罗布麻进行转录组测序及分析。通过过滤掉低质量的读序,共获得26148138个高质量的读序,组装得到61538个Unigene序列。其中,有25296个Unigene在公共数据库中得到注释。通过KEGG分析,共发现29个Unigene参与活性成分(黄酮类)生物合成。检测出单核苷酸至六核苷酸重复类型的SSR位点13524个。本研究结果分析了参与黄酮类化合物合成的相关基因以及潜在的SSR位点,为进一步研究罗布麻次生代谢产物合成的功能基因的挖掘、分子标记的开发以及资源利用提供有用的信息。  相似文献   

6.
本研究利用Illumina HiSeq~(TM)2000对马蓝转录组进行高通量测序,使用软件MicroSAtellite (MISA)分析转录组中的SSR位点信息。通过组装马蓝转录组数据获得了51 381条Unigene,并对获得的Unigene进行SSR检测,共检测到8 471个SSR位点,其分布在6 782条Unigene中,出现的频率为16.49%。SSR中以二核苷酸和三核苷酸重复类型为主,其中二核苷酸以重复单元AT/TA为主,占18.14%,其余类型的重复单元相对较少。SSR所在序列功能注释结果显示在Nr和SwissProt中分别有5 932和4 285条序列被注释,同时SSR所在序列还被注释到47个GO分类,25个KOG分类和29个KEGG代谢通路中。通过设计、筛选,共获得5 819对引物组合,随机挑选的18对引物中有13对引物扩增出符合预期大小的条带。马蓝SSR出现的频率高,重复种类丰富,为研究马蓝遗传多样性、基因定位和品质改良等提供了科学依据。  相似文献   

7.
为了开发马尾松SSR标记,本研究利用MISA软件对马尾松转录组测序获得的148 186条Unigene (序列总长约91 449.7 kb)进行全面分析,共搜索获得6 611个SSR位点,分布在6 003条Unigene上,SSR发生频率为4.05%,平均每13.83 kb出现1个SSR,结果发现单核苷酸重复出现的频率占总SSR的53.60%;二核苷酸为23.46%;三核苷酸为21.33%。通过对含SSR的Unigene的GO分析,显示生物过程包含的Unigene占40.60%;细胞组分包含的Unigene占35.45%,分子功能包含的Unigene占23.95%;转录组中有724个Unigene可被注释到110个KEGG通路中,其中被注释到新陈代谢的Unigene最多有312个,其次是遗传信息处理类有183个。根据含SSR的Unigene序列共设计了4 247对SSR引物,并随机挑选30对SSR引物进行PCR扩增验证,其中12对引物能够扩增出目标条带,引物的有效性为40%。本研究结果表明,马尾松转录组测序获得的Unigene序列可作为SSR标记开发的有效来源,所开发的SSR标记为马尾松的遗传图谱构建、分子标记辅助育种等研究提供丰富可靠的标记。  相似文献   

8.
本研究利用Illumina HiseqTM4000测序平台对柚木(Tectona grandis L. F.)边材组织进行转录组测序,获得39.65 Gb的数据。拼接组装共得到90 843个Unigene,平均长度、N50以及GC含量分别为1 415 bp,2 208 bp和41.28%。将获得的Unigene与七大功能数据库进行比对,分别有64 416 (NR:70.91%)、69 281 (NT:76.26%)、28 777 (COG:31.68%)、18 630 (GO:20.51%)、49 594 (KEGG:54.59%)、44 707 (Swissprot:49.21%)以及50 938 (Interpro:56.07%)个Unigene获得功能注释。经过GO数据库的比对分析,18 630个Unigene被注释到生物过程、细胞组分和分子功能3大类别55个亚类。与COG数据库进行比对分析,28 777个注释Unigene按功能被划分为25类。基于KEGG数据库,44 595个Unigene序列注释到6大类,21个亚类代谢通路中。根据注释结果预测出2 772个编码转录因子的Unigene,检测出26 773个SSR位点,以及39 856个SNP位点。本研究为柚木分子育种工作的开展提供数据和参考。  相似文献   

9.
本研究旨在揭示细叶百合在盐碱逆境中的基因表达表达情况,为合理利用盐碱地和大面积种植百合提供理论基础。以一年生的细叶百合鳞茎为材料,经过20 mmol/L NaHCO3处理24 h后,用Illumina HiSeqTM2000测序平台进行转录组测序。共测得56828个mRNA的注释信息,其中,55433个Unigene被注释到Nr数据库,26973条Unigene被注释到KOG数据库,23610条Unigene被注释到GO数据库,13142条Unigene被注释到KEGG数据库的五大类中。共鉴定出390个差异表达基因。选取了9个与盐碱胁迫密切相关的基因进行qPCR验证,9个基因的表达结果与转录组的结果基本趋于一致。通过细叶百合在碳酸盐(NaHCO3)逆境下的转录组对比数据,提供了许多的基因表达通路和表达量的差异,为合理利用盐碱地和大面积种植百合提供理论基础。  相似文献   

10.
以南酸枣雌株叶片和成熟果实为材料,利用Illumina Hi Seq TM 4 000测序平台对其转录组进行测序,共获得14.15 G有效数据,通过序列拼接组装得到46 936条Unigene,平均长度为1 287 bp。36 299条Unigene(77.33%)在7大数据库(NR,NT,KO,Swiss-Prot,PFAM,GO和KOG)中得到注释,其中与GO数据库比对上的26 014条Unigene可分为生物过程、细胞组分和分子功能3大类53分支,注释到KOG数据库中的8 459条Unigene依据功能可分为25类。与KEGG数据库比对,6 225条Unigene分属5大类246条代谢通路中。南酸枣叶片和果实转录组中共发现5 631个差异表达基因,包括1 930个上调基因和3 701个下调基因。本研究获得的转录组数据将有助于开展南酸枣功能基因挖掘与利用、分子辅助育种和其种质资源遗传改良等方面的研究。  相似文献   

11.
从组学水平分析盐胁迫下柳树内在分子机制,为柳树耐盐研究及耐盐基因的挖掘利用提供理论依据。本研究通过转录组测序技术对‘盐柳1号’(Salix psammophila’Yanliu No.1’)和‘渤海柳1号’(Salix matsudana’Bohailiu No.1’)经150 mmol/L NaCl胁迫处理后的叶片和正常叶片(对照)进行高通量转录组测序,并对获得的unigene进行从头组装和注释分析。结果表明:转录组测序共获得183987条Unigenes,平均长度为1080.18 bp,分别有120130条、140813条、98066条、88425条、47982条、83732条Unigenes被注释到NT、NR、COG、SwissProt、KEGG、COG和GO数据库,共有149864条(81.45%)Unigenes得到注释。在GO功能注释中,共得到55个GO功能小类,在KEGG代谢通路分析时,获得了135条KEGG通路。该转录组测序数据质量高,结果覆盖面广,为柳树耐盐基因挖掘和研究提供了一定的理论参考。  相似文献   

12.
为揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,本研究以盐胁迫处理的露地菊及其对照为材料,使用Illumina Hiseq2500高通量测序平台对转录组进行测序,分别获得了60370448和71415448条Clean reads,通过序列拼接组装得到45591条Unigene,平均长度724 bp。有37675条Unigene在七大数据库(COG,GO,KEGG,KOG,Pfam,Swiss-Prot,NR)中得到注释。通过比对露地菊盐胁迫处理组和对照组样品间Unigene的表达量及在各数据库中的注释情况,统计得到:有4143条差异表达基因获得注释;有2441条差异表达基因在GO数据库中获得功能注释;注释到COG数据库中的2281条差异表达基因依据功能可分为25类;有1062条差异基因映射到KEGGPathway数据库中,涉及了199个代谢通路,包括核糖体途径、植物激素信号传导途径、淀粉蔗糖代谢、碳代谢、氨基酸的生物合成等。本研究获得的转录组数据将有助于揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,及相关抗性基因的挖掘和分子辅助育种等方面的研究。  相似文献   

13.
从牡丹花色候选基因中开发一套SSR标记,为牡丹花色分子遗传学研究和分子标记辅助育种提供帮助。本研究基于高通量转录组测序技术(RNA-seq)获得了278条涉及调控牡丹花色形成的Unigenes序列,利用SSRIT在128条Unigenes中检测到215个SSR位点,出现频率为46.04%。其中优势重复基序为二核苷酸、三核苷酸和六核苷酸重复,分别占总SSR位点的18.60%、41.86%和36.28%,优势重复基元为TC/GA和AT/TA,分别占二核苷酸重复的30.00%和27.50%。在此基础上,从中选择100对SSR引物合成,以牡丹品种基因组DNA为模板,验证其有效性和多态性。结果表明,有效引物50对(占50%),多态性引物12对(占24%)。12对多态性引物在芍药属12个不同种质内进行通用性检测,转移率范围为83.33%~100%,平均转移率为96.53%,表明牡丹SSR标记在芍药属内具有较高的通用性。利用高通量RNA-seq开发牡丹候选基因SSR标记可为牡丹功能基因挖掘、品种分子身份证构建、遗传多样性分析和分子标记辅助选择育种等提供重要的遗传资源。  相似文献   

14.
山东栒子是中国山东省的特有种,现已处于极度濒危状态。目前,山东栒子的分子生物学研究较少,基因数据库资源极度缺乏,急需探究其生物学遗传信息,以加快对山东栒子的保护遗传学工作。本研究以山东栒子叶片、花、成熟果实为实验材料,利用PacBio Sequel测序平台对其转录组进行全长转录组测序。共得到高质量去冗余的转录本53932个,作为最终转录本序列。预测到的CDS区共52490个;对其SSR位点进行分析,对测序得到Unigenes进行单核苷酸至六核苷酸重复的SSR位点搜索,共搜索到26796个SSR位点。对非冗余转录本利用BLAST软件与NR、Swissprot、GO、COG、KOG、KEGG 6个数据库进行比对,一共成功注释了53319个Unigenes,其中与NR数据库进行比对中注释为苹果的的相关基因数量最多,其次是白梨和桃;在GO数据库中有33305条山东栒子Unigenes被注释分类,由生物学过程、细胞成分和分子功能三部分组成;在与COG数据库比对中,共有23910条比对到了同源序列,且一共被分为25类;在与KEGG数据库的一系列比对中,可将Unigenes映射到126条代谢通路中。本研究在高通量全长转录组水平对山东栒子进行了系统研究,这为进一步开展山东栒子的分子标记开发和挖掘优良基因提供了科学依据,从而推动山东栒子的保护与利用。  相似文献   

15.
为获得杭白芷转录组信息特征,本研究利用Illumina HiSeqⅩTen测序平台对杭白芷根进行高通量转录组测序,获得高质量序列(Clean reads)47742445条,Trinity denovo组装后得到47044条Unigenes,平均长度1164.20 nt。BLAST分析显示分别有32208(68.46%)、23049(48.99%)、10479(22.27%)、17883(38.01%)、28201(59.95%)、20731(44.07%)、55(0.12%)条Unigenes在数据库NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam中获得注释,可归为GO分类的生物过程、细胞组分和分子功能3大类57分支,涉及205个KEGG代谢通路,其中包括27个次生代谢通路。蛋白编码框序列32303个,高等植物转录因子58个家族,借助MISA软件发现10020个SSR,其中二碱基重复最丰富,有4336个,出现频率为43.27%;五碱基重复SSR最少仅占0.37%。本研究获得了大量基因序列信息以及SSR信息,为今后开展相关分子机制研究提供了数据资源和理论基础。  相似文献   

16.
花分生组织决定基因APETALA2(AP2)属于植物ABCDE模型基因,在花器官发育过程中起着重要的调控作用。为进一步了解芍药AP2基因的生物学功能,利用RACE扩增和测序技术克隆plAP2基因序列,利用生物信息学在线程序对其序列特征、蛋白结构及功能、亚细胞定位进行预测,并利用MEGA 5.0构建不同植物AP2分子进化树,最后利用qPCR检测其在内外花瓣中的差异表达情况。结果显示,克隆获得芍药AP2基因(plAP2)cDNA序列全长1 935 bp,其ORF全长为1 578 bp,编码525个氨基酸。蛋白结构与功能分析表明,plAP2蛋白为亲水性不稳定蛋白,无跨膜结构和信号肽,表明为非分泌蛋白;核定位信号位于氨基酸序列139-147(KKSRRGPRS);二级结构包括α-螺旋(24%)、β-折叠(19%)、β-转角(28%)和无规则卷曲(28%);plAP2蛋白存在8个糖基化位点和64个磷酸化位点,plAP2蛋白包含2个相同的保守结构域:AP2/(Ethylene-Responsive factors,ERF)(151-213aa和243-306aa)。亚细胞定位主要在细胞质(45.0%)中,少量分布于微体、线粒体基质间隙和溶酶体;进化树分析表明,芍药AP2基因与牡丹高度同源且亲缘关系最近;qPCR检测显示外瓣AP2表达量均极显著高于内瓣(P0.01)。克隆出芍药AP2全长cDNA序列,系统地揭示了plAP2蛋白基本结构、功能位点区域、细胞定位以及组织表达情况,为今后深入研究plAP2基因功能提供基础素材和理论参考。  相似文献   

17.
分析半枫荷转录组中的SSR位点信息,并设计简单重复序列(SSR)引物,以期为半枫荷EST-SSR分子标记提供有力工具。利用MISA工具筛选了半枫荷转录组测序获得的77629条Unigenes,对其SSR位点信息进行了分析;在此基础上利用Primer 3.0设计SSR引物,并随机选择50对SSR引物对4株不同来源的半枫荷进行多态性扩增分析。在半枫荷的转录组中,共找到15041个SSRs,分布于10669条Unigenes,SSR位点发生频率为13.74%,含多个位点的序列数为3114,占SSRs位点总数的29.19%,以复合形式出现的位点数2044个,占SSRs位点总数的19.16%,SSRs的平均距离是3.2 kb。SSRs位点中二碱基重复是主要类型,占总SSRs的42.17%;其次是单碱基重复基序(38.25%)SSRs。所包含的重复基元中,单碱基重复基元A/T(5572),二碱基重复基元AG/CT(4845)是优势重复基元类型,分别占总SSRs的37.05%、32.21%。利用Primer 3共设计出28590对SSR引物。随机选择50对引物进行PCR扩增,其中44对(88.0%)扩增出清晰、可重复的条带,15对(34.1%)扩增条带表现出多态性。半枫荷转录组SSR位点出现频率高,类型丰富;大量的SSR为其遗传多样性分析、分子标记辅助育种和遗传图谱构建提供了丰富的候选分子标记。  相似文献   

18.
旨在获得黄精转录组数据库并挖掘参与其种子发育和休眠解除相关基因,以休眠解除前后的黄精种胚为试材,利用新一代高通量测序手段对供试样品进行转录组测序,并进行系统的生物信息学分析。黄精种子休眠解除前后样品中共得到79716个差异表达基因,上调的表达基因有60074个,下调的表达基因有19642个。休眠解除前后的黄精种胚中共有130284个差异表达基因被GO功能注释到生物进程、分子功能和细胞组分3个大类56个亚类,注释的差异表达基因与代谢过程、生物调控、细胞组分合成和酶催化活性等密切相关。KEGG代谢通路结果表明,共有65038个差异表达基因,涉及138个代谢通路,主要参与碳代谢、次生代谢产物的生物合成和多糖的代谢。基于KEGG数据库中注释结果,共发现15条与黄精种胚休眠解除相关的代谢通路。黄精种子发育与休眠解除过程,大量的种胚形态建成、多糖分解及蛋白质合成差异基因参与表达,并涉及到多个代谢途径的相互作用,构成复杂的休眠解除调控网络。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号