首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为探索兔眼蓝莓品种‘园蓝’遗传信息,本研究利用高通量测序技术对贵州栽培的‘园蓝’幼叶转录组进行了测序和生物信息学分析。共获得约1.4 Gb的纯净数据,拼装了32 093条unigenes。GO数据库注释到的unigenes涉及生物学过程、细胞成分及分子功能相关的48种生理代谢功能;27 137条unigenes能被KOG数据库注释,涉及25条代谢通路;9 525条unigenes能被KEGG数据库成功注释,涉及5个功能大类、19个功能中类、128条代谢通路;25 418条unigenes可被NR数据库注释;18 309条unigenes可被SwissProt数据库注释。以上4个数据库共注释到25 447条unigenes,占全部unigenes的79.29%;被以上4个数据库均注释到的unigenes为8 846条,占全部unigenes的27.56%。同时,生物信息学分析还显示:全部unigenes中,有758条unigenes编码转录因子,涉及51个家族;2 085条unigenes编码抗性基因,涉及17个家族。共检测到4 827个SSR位点,其中二碱基重复的SSR位点达3 165...  相似文献   

2.
山东栒子是中国山东省的特有种,现已处于极度濒危状态。目前,山东栒子的分子生物学研究较少,基因数据库资源极度缺乏,急需探究其生物学遗传信息,以加快对山东栒子的保护遗传学工作。本研究以山东栒子叶片、花、成熟果实为实验材料,利用PacBio Sequel测序平台对其转录组进行全长转录组测序。共得到高质量去冗余的转录本53932个,作为最终转录本序列。预测到的CDS区共52490个;对其SSR位点进行分析,对测序得到Unigenes进行单核苷酸至六核苷酸重复的SSR位点搜索,共搜索到26796个SSR位点。对非冗余转录本利用BLAST软件与NR、Swissprot、GO、COG、KOG、KEGG 6个数据库进行比对,一共成功注释了53319个Unigenes,其中与NR数据库进行比对中注释为苹果的的相关基因数量最多,其次是白梨和桃;在GO数据库中有33305条山东栒子Unigenes被注释分类,由生物学过程、细胞成分和分子功能三部分组成;在与COG数据库比对中,共有23910条比对到了同源序列,且一共被分为25类;在与KEGG数据库的一系列比对中,可将Unigenes映射到126条代谢通路中。本研究在高通量全长转录组水平对山东栒子进行了系统研究,这为进一步开展山东栒子的分子标记开发和挖掘优良基因提供了科学依据,从而推动山东栒子的保护与利用。  相似文献   

3.
为获得杭白芷转录组信息特征,本研究利用Illumina HiSeqⅩTen测序平台对杭白芷根进行高通量转录组测序,获得高质量序列(Clean reads)47742445条,Trinity denovo组装后得到47044条Unigenes,平均长度1164.20 nt。BLAST分析显示分别有32208(68.46%)、23049(48.99%)、10479(22.27%)、17883(38.01%)、28201(59.95%)、20731(44.07%)、55(0.12%)条Unigenes在数据库NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam中获得注释,可归为GO分类的生物过程、细胞组分和分子功能3大类57分支,涉及205个KEGG代谢通路,其中包括27个次生代谢通路。蛋白编码框序列32303个,高等植物转录因子58个家族,借助MISA软件发现10020个SSR,其中二碱基重复最丰富,有4336个,出现频率为43.27%;五碱基重复SSR最少仅占0.37%。本研究获得了大量基因序列信息以及SSR信息,为今后开展相关分子机制研究提供了数据资源和理论基础。  相似文献   

4.
采用Illumina测序技术对在醋酸钙、硫酸铵和蔗糖处理后蓝莓不同发育阶段的果实进行转录组测序,获得Clean Reads 2723731442条,经组装得到平均长度为753.65 nt的87608条Unigene。将转录组Unigene进行基因功能注释,其中39867条Unigene能被NR数据库注释,与葡萄同源序列最多,占8.58%;与GO数据库比对发现,有29661条Unigene获得注释,分别匹配到生物过程、细胞组成和分子功能三大类共59个分支;与KOG数据库进行比对,发现有21992条Unigene具有功能信息,分别涉及25类;根据KEGG数据库的注释信息进行Pathway注释,参与的代谢通路共有246条;共检测到8704个SSR位点,其中双碱基重复的SSR占78.57%。本研究为探索外源物质调控蓝莓果实生长发育、生理代谢的分子机理提供了理论基础。  相似文献   

5.
《分子植物育种》2021,19(16):5342-5351
为了获得珍贵用材树种大花序桉顶芽转录组数据及预测关键基因功能,本研究基于Illumina HiSeq X Ten测序技术获得大花序桉顶芽转录组原始数据,经Trinity组装拼接获得高质量Unigene,并与NR、Swiss-Prot、GO、KOG、egg NOG和KEGG等生物信息数据库进行序列比对和功能注释,利用MISA软件进行SSR位点搜索和分析。从大花序桉顶芽中共获得26 587条高质量Unigene,平均长度为1 279.69 bp;共有22 099条Unigene至少在一个数据库中被成功注释,其中,11 507条Unigene被注释到KOG数据库中25个功能类别,以参与一般功能基因的数量最多;GO数据库中,所注释到的14 105条Unigene分别匹配到生物功能、细胞组分和分子功能3大类50个功能基因区,其中执行生物过程所占比例最多;KEGG功能注释共发现有7 117个Unigene参与127条代谢通路,以代谢相关的基因最丰富;共有1 021条Unigene注释到转录因子数据库,分布于65个家族,其中比例最大的是bHLH和MYB家族;3 274条Unigene注释到植物抗性基因数据库,分布于13个类别,相匹配基因数量最大的是RLP和TNL。MISA软件共检测到12 366个SSR位点,分布密度为1/2.75 kb,重复基元类型丰富,标记开发潜力大。本研究利用高通量测序获得丰富的顶芽转录组信息,可以为大花序桉分子辅助育种提供丰富的资源。  相似文献   

6.
紫红獐牙菜是重要的民族药,本研究采用高通量测序技术对紫红獐牙菜进行转录组测序并分析。结果显示,完成的15个样品的转录组测序,获得112.17 Gb Clean data,各样品Clean data均达到6.18 Gb,Q30碱基百分比在94.96%及以上。组装后共获得47 106条unigene,其中长度在1 kb以上的unigene有18 971条。通过与KEGG、GO、KOG、COG等多个数据库进行比对,对unigene进行功能注释,共获得35 375条unigene。GO数据库中注释到的26 570条unigene,可分为生物学过程、细胞组分和分子功能三大类共44个亚类。以KEGG数据库为参考,21 321条基因被注释,参与的代谢通路分为5大类,分别是细胞过程、环境信息处理、遗传信息处理、代谢和有机系统,其中与代谢相关的通路最多,约占所用通路的72.5%;KEGG代谢通路分析发现紫红獐牙菜中1 147条unigene参与到22个次生代谢标准通路中,有77条unigene参与编码环烯醚萜苷类合成通路中的25个关键酶。此外,紫红獐牙菜转录组中找到9 027个SSR重复位点,6种SSR...  相似文献   

7.
王冲  宋阳 《分子植物育种》2023,(4):1093-1102
大花君子兰是世界上重要的观赏植物,其花瓣颜色在花蕾不同发育时期具有显著差异。本研究通过对花蕾3个不同发育时期花瓣进行高通量转录组测序,进而探讨君子兰花瓣发育过程中与其花色相关的基因表达情况。结果表明,共获得167 078条转录本,平均长度为673 bp,有67 512条Unigenes在各数据中被注释。GO功能富集中有24 162条基因被注释,分为分子功能、细胞组分和生物过程3大类和50个亚类。KEGG代谢通路注释中,12 930条被成功注释,主要富集与花青素合成相关的通路,包括苯丙素生物合成途径、类黄酮生物合成途径、异黄酮生物合成途径、花青素生物合成途径和苯丙氨酸代谢生物合成途径。君子兰花蕾在3个发育时期时花青素合成途径中一些关键酶(如CHS, CHI, DFR)和调控基因(MYB和bHLH)的表达量出现了显著差异。  相似文献   

8.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

9.
本研究利用Illumina HiseqTM4000测序平台对柚木(Tectona grandis L. F.)边材组织进行转录组测序,获得39.65 Gb的数据。拼接组装共得到90 843个Unigene,平均长度、N50以及GC含量分别为1 415 bp,2 208 bp和41.28%。将获得的Unigene与七大功能数据库进行比对,分别有64 416 (NR:70.91%)、69 281 (NT:76.26%)、28 777 (COG:31.68%)、18 630 (GO:20.51%)、49 594 (KEGG:54.59%)、44 707 (Swissprot:49.21%)以及50 938 (Interpro:56.07%)个Unigene获得功能注释。经过GO数据库的比对分析,18 630个Unigene被注释到生物过程、细胞组分和分子功能3大类别55个亚类。与COG数据库进行比对分析,28 777个注释Unigene按功能被划分为25类。基于KEGG数据库,44 595个Unigene序列注释到6大类,21个亚类代谢通路中。根据注释结果预测出2 772个编码转录因子的Unigene,检测出26 773个SSR位点,以及39 856个SNP位点。本研究为柚木分子育种工作的开展提供数据和参考。  相似文献   

10.
本研究利用Illumina HiSeq~(TM)2000对马蓝转录组进行高通量测序,使用软件MicroSAtellite (MISA)分析转录组中的SSR位点信息。通过组装马蓝转录组数据获得了51 381条Unigene,并对获得的Unigene进行SSR检测,共检测到8 471个SSR位点,其分布在6 782条Unigene中,出现的频率为16.49%。SSR中以二核苷酸和三核苷酸重复类型为主,其中二核苷酸以重复单元AT/TA为主,占18.14%,其余类型的重复单元相对较少。SSR所在序列功能注释结果显示在Nr和SwissProt中分别有5 932和4 285条序列被注释,同时SSR所在序列还被注释到47个GO分类,25个KOG分类和29个KEGG代谢通路中。通过设计、筛选,共获得5 819对引物组合,随机挑选的18对引物中有13对引物扩增出符合预期大小的条带。马蓝SSR出现的频率高,重复种类丰富,为研究马蓝遗传多样性、基因定位和品质改良等提供了科学依据。  相似文献   

11.
为获得姜黄(Curcuma longa)的转录组特征信息,本研究采用Illumina HiSeqΧTen高通量测序平台对姜黄根茎进行高通量转录组测序并进行系统的生物信息学分析。共获得7.18Gb Clean数据,组装了50194条unigenes,平均长度961.3 bp,N50为1 339 bp。数据库比对显示,姜黄根茎转录组unigenes在NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam数据库中分别注释到38 802条(77.30%)、27 869条(55.52%)、14 725条(29.34%)、22 225条(44.28%)、37 317条(74.35%)、25 863条(51.53%)、26 137条(52.07%)。注释结果显示,姜黄与野生型马来西亚蕉的同源序列最多,unigenes在GO数据库中注释到参与生物过程、细胞组分和分子功能3个大类50小类,KOG功能分类获得25个不同的功能群,涉及128个KEGG代谢通路,其中包括21个次生代谢通路。在植物抗性基因(PRG)数据库中分别注释到3 718条unigenes;借助MISA软件发现7 183...  相似文献   

12.
铁筷子是毛茛科植物,既是重要中药材,也是新兴的高档宿根花卉。本研究以中国原产铁筷子幼嫩叶片为试材,采用二代测序技术对材料进行转录组测序,通过对原始数据进行质量控制,并用Trinity软件等对处理后数据进行拼接,获得了高质量转录本和Unigenes。对Unigenes进行序列比对、功能注释和分类、基因编码区预测及单核苷酸多肽标记(SSR)分析,结果显示,本次测序共获得转录本94 067条,代表的Unigene共有70 119条;Unigenes在非冗余蛋白数据库(Nr)比对,E值得分最高的物种中,睡莲占比最高;Unigenes在GO分类中注释到46个次级功能条目,在KOG功能分类中"翻译后修饰,蛋白开关和分子伴侣"功能注释到的基因最多;通过Nr数据库和软件分析,共有58 403个基因编码区被预测到;同时软件分析共获得SSR分子标记9 057条。本研究较早地为铁筷子的分子研究提供了转录组数据,相关研究结果对促进今后铁筷子基因发掘、分子标记育种等工作将产生积极意义。  相似文献   

13.
《种子》2021,(5)
为了更好地认识长瓣兜兰,并开发其园艺价值,以长瓣兜兰花器官为材料,利用RNA-seq技术对长瓣兜兰花蕾和花朵进行转录组测序。结果表明,共获得95 659条unigene。将unigene比对到NR、KOG、Swissprot、KEGG等数据库进行注释,共发现有61 629条unigene得到注释,占全部unigene的64.43%。长瓣兜兰转录组unigene在CDD、KOG、NR、NT、PFAM、Swissprot、TrEMBL、GO、KEGG等数据库中被注释的基因数目分别为33 589、28 405、45 568、56 635、23 870、52 141、44 973、54 934、4 893。注释结果显示,长瓣兜兰与油棕同源的序列最多。GO注释中可将其分成3大类71个小组,KOG数据库注释可将其分成25个功能类别;根据KEGG注释和通路富集结果,共有4 893条unigene参与了23类327个代谢途径。经MISA软件对unigene进行SSR检测,发现在95 659条unigene中有7 613条有SSR,共搜索到8 160个SSR位点,其长度范围分布在10~230 bp之间,平均长度为66.95 bp。SSR丰富度最高的是二核苷酸,占比为33.72%,其次为一核苷酸和三核苷酸,分别占比32.12%和26.11%。本研究通过对长瓣兜兰进行转录组测序,获得了大量基因序列,了解了长瓣兜兰花器官基因的大致表达情况,为长瓣兜兰花器官发育相关基因的发掘与利用、SSR分子标记的开发以及其基因组的测序与组装提供了参考,也为后续在分子生物学层面对长瓣兜兰开展深入研究奠定基础。  相似文献   

14.
应用新一代高通量测序技术,对紫薇金叶突变体的叶片进行转录组测序和生物信息学分析。本研究中共组装获得45 308条unigenes,平均长度987.51 bp。21 339(47.10%)条可以匹配到蛋白数据库获得注释信息。Unigenes在各数据库中注释的基因数分别为:在COG数据库中有11 512(25.41%)条,在GO数据库中有12 196条(26.92%),在KEGG数据库中有5 709条(27.73%)。通过与NCBI和Uniprot蛋白数据库的比对,共22条叶绿素代谢相关基因和17条类胡萝卜素代谢相关基因被鉴定出来,为突变体基因的筛选提供了候选基因。  相似文献   

15.
基于高通量测序的金钗石斛叶转录组数据分析   总被引:2,自引:0,他引:2  
本研究采用Illumina Hiseq4000对金钗石斛(Dendrobium nobile)叶转录组进行测序,共获得5.6 Gb数据。组装并去冗余后得到61 998个Unigene,其总长度,平均长度,N50以及GC含量分别为53 773 338 bp、867 bp、1 482 bp和43.09%。将Unigene比对到七大功能数据库进行注释,最终分别有34 250(NR:55.24%),28 010(NT:45.18%)、22 029(Swissprot:35.53%)、13 384(COG:21.59%)、25 754(KEGG:41.54%)、7 731(GO:12.47)以及25 407(Interpro:40.98%)个Unigene获得功能注释。在KEGG数据库中,注释上的与碳水化合物代谢、萜类和黄酮类化合物代谢、以及多糖合成相关的Unigene分别有2 819个、706个和559个。根据注释结果共检测出34 096个CDS,未注释上的Unigene使用ESTScan预测后获得2 108个CDS。检测出7 165个SSR分布于6 264个Unigene中,其中在不同重复基序类型中,出现频率最高的为AG/CT,其次是AAG/CTT、AT/AT和AGG/CCT。同时,预测出1 234个编码转录因子的Unigene。该转录组测序分析为金钗石斛次生代谢和转录组方面研究提供了一定的理论参考。  相似文献   

16.
为了深入了解甘葛藤转录组的整体水平及黄酮类生物合成通路基因。利用高通量测序PacBio Sequel平台,以甘葛藤根、茎、叶的混合样品为材料,使用单分子长读数测序技术(SMRT)对甘葛藤进行全长转录组测序及分析。平台共获得10 994 967个高质量reads和384 072条全长非嵌合序列(FLNC),测序数据经质控后获得90 856个转录本;获得的所有转录本经NR、SwissProt、KOG、KEGG、GO数据库进行注释和功能分类,结果有85 239个单基因被注释,NR注释数量最多为84 675个,占93.2%;KEGG注释的基因最少,22 330个基因被注释到132条途径,代谢途径分布的基因较多(9 368,41.95%)。预测到3 507个转录因子,bHLH转录因子家族的基因最多。14 127个基因被分配到17个R基因类别,主要为RLP类。检测到33 660个SSR序列,多为AG/CT类型。分析黄酮类生物合成途径,发现与黄酮类合成相关的基因110个,其中,26个编码HCT,3个编码CHS,7个编码CHI。PacBio测序平台能获得更长的转录本,SMRT技术能够深入挖掘甘葛藤转录数据,比第二代测序技术能够获得更高的转录本注释率。在高通量全长转录组水平对甘葛藤进行了研究,为甘葛藤的分子生物学研究提供了较可靠、全面的转录组数据,为进一步开发甘葛藤的分子标记和挖掘优良基因提供了科学依据。  相似文献   

17.
柳杉是中国南方重要的针叶用材树种,具有树形高大,纹理直等特点,已广泛用于板材和建筑生产中,研究柳杉木材形成过程中维管形成层及木质部区转录组特征,为木材形成主要过程的分子机理,木材形成有关基因调控,培育优良材质的林木提供理论参考。本研究以柳杉形成层组织为材料,通过Illumina Hiseq测序平台对4个不同发育阶段的柳杉维管形成层进行转录组测序;对Unigene进行了蛋白功能注释、分类及KEGG代谢通路分析等。测序数据参照无参转录组测序流程进行分析,一共产生105.9 Gb的数据,过滤后Clean reads均达到90%以上。Clean reads经Trinity软件进行组装,一共产生64 969个Unigene,对Unigene进行拼接,拼接后的Contigs序列有29 381条、Singletons有35 588条,总长度为83 003 836 bp。将Unigen与七大功能数据库(NR, NT, GO, COG, KEGG, Swissprot, Interpro)进行比对,共有42 836个Unigene得到注释,占总Unigene的66.05%。GO注释共有89 644个转录本得到注释。对GO注释转录本进行分类,其中有38 432个转录本(42.87%)注释为生物过程,有32 749个转录本(36.53%)注释为细胞组分,有18 463个转录本(20.6%)注释为分子功能。KEGG注释有31 580个Unigene得到注释。分为6大类为:细胞代谢过程、环境信息处理、遗传信息处理、人类疾病、代谢作用、生物体系统。其中代谢作用涉及的Unigene最多达18 580个,占KEGG总注释Unigene的58.83%。另有37 762个Unigene得到COG注释,被分为25类,其中注释数目最多的类型是仅预测一般功能的Unigene,占总数的16.9%;其次是转录,比例为8.8%;再次是复制、重组及修复,占总数的7.8%。本研究最后分析了可能参与木材形成重要功能基因,为探讨木材发育的分子机制及进行重要功能基因的挖掘提供了提供了依据。  相似文献   

18.
为了探讨海岛罗汉松(Podocarpus costalis)转录组功能基因信息,获取海岛罗汉松嫩叶叶色变化的相关基因,本研究对海岛罗汉松正常生长状态下的嫩叶进行转录组测序分析,去除低质量序列后得到52 189条Unigene,平均长度为1 609 bp,总长度为83 984 805 bp。52 189条Unigene注释到七大功能数据库,其中NR数据库中40 067个Unigene被注释到,注释率最高,占76.77%。在注释到的物种中,海岛罗汉松比对到的U nigene与北美云杉(Picea sitchensis)的相似度最高,共13 536条。通过5个时期的共同筛选,发现海岛罗汉松嫩叶有1 376个差异表达基因。1 376个差异表达基因通过GO分析注释到3个大类(生物过程,细胞组分,分子功能)的46个小类;KEGG分类可将1 376个差异表达基因分为5个大类19个小类。对与叶色变化相关的差异表达基因进行分析,发现与花青素合成相关的差异表达基因有9个,主要由苯丙烷类生物合成、类黄酮生物合成等机制影响海岛罗汉松嫩叶叶色变化;另外有3个差异表达基因涉及卟啉和叶绿素代谢途径。本研究结果为探究...  相似文献   

19.
大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用Illumina Hi Seq TM 2000高通量测序平台对1年生大花序桉根系转录组测序和de novo组装,将得到的Unigene与公共数据库比对,同时进行转录组分析。结果显示,组装获得53 433条Unigene,其平均长度890 bp,N50长度为1 587 bp;有34 700条Unigene获得注释信息,占全部Unigene的64.94%,其中19 327条Unigene注释到KOG数据库,被分到25个类别中,共得到32 302个KOG功能注释信息;有11 197条Unigene注释到GO数据库中,共获得了54 971个GO注释功能,归于细胞组分、分子功能和生物学过程三大类;有12 181条Unigene得到KEGG注释,其中6 493条Unigene归入128条代谢途径,发现有57条Unigene参与氮代谢途径。通过软件查找获得13 290个SSR位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。  相似文献   

20.
基于高通量测序的铁皮石斛叶片转录组分析   总被引:1,自引:0,他引:1  
采用新一代高通量测序技术Illumina Hi Seq 2000对铁皮石斛(Dendrobium officinale)转录组进行测序,共获得11 153 295 000 nt数据。对测序获得数据(reads)进行序列拼接组装,共获得121 596个单基因簇,序列平均长度为660 bp,整体序列信息达到了40.16 Mb。再应用生物信息学相关数据库进行比对,结果表明,本测定获得的52 345个Unigene能够在数据库中检索到相关功能注释。通过GO数据库比对,测序获得Unigene功能分类可分为3大类57个分支,其中有大量的Unigene与细胞、催化活性、细胞部分、细胞器等相关功能。通过COG数据库比对,测序获得Unigene功能注释到25类直系同源蛋白分类中如转录、复制,重组和修复、翻译,核糖体结构和生物起源等。以KEGG数据库作为参考,依测序获得Unigene可定位到128个代谢途径分支,如脂类代谢、氨基酸代谢、碳水化合物代谢等。进一步利用软件查找SSR位点发现,从Unigene中共找到9 892个SSR位点。SSR不同重复基序类型中,出现频率最高的为AG/CT,其次是AAG/CTT、CCG/CGG和AGG/CCT。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号