首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 43 毫秒
1.
为探索兔眼蓝莓品种‘园蓝’遗传信息,本研究利用高通量测序技术对贵州栽培的‘园蓝’幼叶转录组进行了测序和生物信息学分析。共获得约1.4 Gb的纯净数据,拼装了32 093条unigenes。GO数据库注释到的unigenes涉及生物学过程、细胞成分及分子功能相关的48种生理代谢功能;27 137条unigenes能被KOG数据库注释,涉及25条代谢通路;9 525条unigenes能被KEGG数据库成功注释,涉及5个功能大类、19个功能中类、128条代谢通路;25 418条unigenes可被NR数据库注释;18 309条unigenes可被SwissProt数据库注释。以上4个数据库共注释到25 447条unigenes,占全部unigenes的79.29%;被以上4个数据库均注释到的unigenes为8 846条,占全部unigenes的27.56%。同时,生物信息学分析还显示:全部unigenes中,有758条unigenes编码转录因子,涉及51个家族;2 085条unigenes编码抗性基因,涉及17个家族。共检测到4 827个SSR位点,其中二碱基重复的SSR位点达3 165...  相似文献   

2.
为探索白刺花(Sophora viciifolia)硬实形成的相关机制,采用Illumina Hi Seq TM 2000高通量测序技术对白刺花种子转录组进行测序,利用Trinity软件将数据组装形成转录本,对所有转录本进行Nr(NCBI nonredundant protein sequences)、Nt(NCBI nucleotide sequences)、Pfam(protein family)、KOG/COG(eu Karyotic ortholog groups/clusters of orthologous groups)、Swiss-Prot(A manually annotated and reviewed protein sequence database)、KEGG(kyoto encyclopedia of genes and genomes)和GO(gene ontology)分类和功能注释、Pathway注释,并对种子形成的代谢通路中的相关基因进行了分析。转录组共获得了333 339 724条初始序列,总长为335 557 bp,初始序列组装获得序列片段的平均长度与N50值分别为282 bp和537 bp;与KOG功能注释、GO分类及KEGG代谢通路分析后,获得了44 840个GO功能注释、46 126个KOG功能注释以及89 494个PFAM注释:并从KEGG通路中找到有色氨酸代谢、半胱氨酸和甲硫氨酸的代谢途径的编码基因片段分别有66和37个。  相似文献   

3.
《种子》2021,(3)
采用高通量测序技术平台Illumina Novaseq 6000对滇白前种子进行转录组测序,共获得平均长度为753.9 bp的43 663个Unigenes。注释到六大功能数据库(NR,COG,Pfam, Swiss-Prot, GO, KEGG)上的Unigene总数为29 177个。滇白前Unigenes比对到NR数据库共有26 688条,与甜菜、藜麦、栓皮栎、菠菜有较高同源性;25 657条Unigenes在COG数据库得到26 500个注释,分为23类;19 942条Unigenes在GO数据库得到79 481个注释,按功能分为细胞组分、分子功能和生物过程三大类,分别有13、16、23个亚类,其中参与的生物过程较多;11 527条Unigene富集在KEGG数据库的101条代谢通路中,代谢相关的通路占比最大。同时,有527个Unigenes被注释为转录因子;有3 995条SSR标记被挖掘。利用高通量测序获得滇白前转录组信息,有助于从分子水平对滇白前进行深入研究。  相似文献   

4.
从组学水平分析盐胁迫下柳树内在分子机制,为柳树耐盐研究及耐盐基因的挖掘利用提供理论依据。本研究通过转录组测序技术对‘盐柳1号’(Salix psammophila’Yanliu No.1’)和‘渤海柳1号’(Salix matsudana’Bohailiu No.1’)经150 mmol/L NaCl胁迫处理后的叶片和正常叶片(对照)进行高通量转录组测序,并对获得的unigene进行从头组装和注释分析。结果表明:转录组测序共获得183987条Unigenes,平均长度为1080.18 bp,分别有120130条、140813条、98066条、88425条、47982条、83732条Unigenes被注释到NT、NR、COG、SwissProt、KEGG、COG和GO数据库,共有149864条(81.45%)Unigenes得到注释。在GO功能注释中,共得到55个GO功能小类,在KEGG代谢通路分析时,获得了135条KEGG通路。该转录组测序数据质量高,结果覆盖面广,为柳树耐盐基因挖掘和研究提供了一定的理论参考。  相似文献   

5.
紫红獐牙菜是重要的民族药,本研究采用高通量测序技术对紫红獐牙菜进行转录组测序并分析。结果显示,完成的15个样品的转录组测序,获得112.17 Gb Clean data,各样品Clean data均达到6.18 Gb,Q30碱基百分比在94.96%及以上。组装后共获得47 106条unigene,其中长度在1 kb以上的unigene有18 971条。通过与KEGG、GO、KOG、COG等多个数据库进行比对,对unigene进行功能注释,共获得35 375条unigene。GO数据库中注释到的26 570条unigene,可分为生物学过程、细胞组分和分子功能三大类共44个亚类。以KEGG数据库为参考,21 321条基因被注释,参与的代谢通路分为5大类,分别是细胞过程、环境信息处理、遗传信息处理、代谢和有机系统,其中与代谢相关的通路最多,约占所用通路的72.5%;KEGG代谢通路分析发现紫红獐牙菜中1 147条unigene参与到22个次生代谢标准通路中,有77条unigene参与编码环烯醚萜苷类合成通路中的25个关键酶。此外,紫红獐牙菜转录组中找到9 027个SSR重复位点,6种SSR...  相似文献   

6.
《分子植物育种》2021,19(14):4610-4617
本研究基于新一代高通量测序技术平台Illumina Hi SeqTM4000对野百合进行转录组测序,对物种的转录组序列进行统计,并将得到的数据进行de novo组装,结果共获得47 605条Unigenes,总长度为33 972 306 bp,平均长度为713 bp,N50为1 204 bp。将获得的Unigenes与Nr、Swiss-Prot、KEGG以及KOG数据库进行比对,结果显示,分别有28 104、17 739、11 984及14 682条Unigenes成功注释。通过与KOG数据库进行比对,可分为25个不同的功能注释。与GO数据库进行比对,结果显示,共有33 254条Unigene获得注释,这些功能注释分为三大类50个功能亚类。其中,生物过程最多。以KEGG数据库参考,共有11 984条Unigenes参与133条代谢途径分支,以代谢相关的通路较为集中,找到了与花青素合成关键酶的Unigenes。本研究极大地丰富了野百合的基因资源,为进一步开展野百合功能基因及分子标记育种等方面的研究提供了一定理论支持与依据。  相似文献   

7.
应用新一代高通量测序技术,对紫薇金叶突变体的叶片进行转录组测序和生物信息学分析。本研究中共组装获得45 308条unigenes,平均长度987.51 bp。21 339(47.10%)条可以匹配到蛋白数据库获得注释信息。Unigenes在各数据库中注释的基因数分别为:在COG数据库中有11 512(25.41%)条,在GO数据库中有12 196条(26.92%),在KEGG数据库中有5 709条(27.73%)。通过与NCBI和Uniprot蛋白数据库的比对,共22条叶绿素代谢相关基因和17条类胡萝卜素代谢相关基因被鉴定出来,为突变体基因的筛选提供了候选基因。  相似文献   

8.
张小红  彭琼  鄢铮 《作物学报》2023,(5):1432-1444
为了获得甘薯耐盐转录组序列信息,挖掘差异表达基因及其相关代谢途径,本文以盐胁迫处理0 d、3 d和6d的耐盐甘薯品种‘榕薯819’以及不耐盐甘薯品种‘榕薯910’的叶片为材料,借助高通量测序技术进行转录组测序分析。结果表明, 2个品种共获得157,252条Unigenes,平均组装长度为576 bp。其中有83,264条Unigenes在七大数据库中得到注释,占总数的52.95%。NR注释分类结果显示,在牵牛花(Ipomoea nil)中比对到同源序列的Unigenes最多,共43,620条,占总数的57.05%。Unigenes在KOG数据库中的注释主要富集在普通功能预测(8752个)、信号转导机制(5067个)以及翻译后修饰、蛋白转换、分子伴侣(4471个)中。差异表达分析显示,在‘榕薯819’中,盐处理3 d和6d的样品差异表达基因数分别为323个和3752个,共参与了33个GO功能分类项和302条KEGG代谢通路。在‘榕薯910’中,差异表达基因数则分别为5554个和7395个,共参与了50个GO功能分类项,涉及了329条KEGG代谢通路。以部分差异表达基因的转录组数据为基础,...  相似文献   

9.
《分子植物育种》2021,19(16):5342-5351
为了获得珍贵用材树种大花序桉顶芽转录组数据及预测关键基因功能,本研究基于Illumina HiSeq X Ten测序技术获得大花序桉顶芽转录组原始数据,经Trinity组装拼接获得高质量Unigene,并与NR、Swiss-Prot、GO、KOG、egg NOG和KEGG等生物信息数据库进行序列比对和功能注释,利用MISA软件进行SSR位点搜索和分析。从大花序桉顶芽中共获得26 587条高质量Unigene,平均长度为1 279.69 bp;共有22 099条Unigene至少在一个数据库中被成功注释,其中,11 507条Unigene被注释到KOG数据库中25个功能类别,以参与一般功能基因的数量最多;GO数据库中,所注释到的14 105条Unigene分别匹配到生物功能、细胞组分和分子功能3大类50个功能基因区,其中执行生物过程所占比例最多;KEGG功能注释共发现有7 117个Unigene参与127条代谢通路,以代谢相关的基因最丰富;共有1 021条Unigene注释到转录因子数据库,分布于65个家族,其中比例最大的是bHLH和MYB家族;3 274条Unigene注释到植物抗性基因数据库,分布于13个类别,相匹配基因数量最大的是RLP和TNL。MISA软件共检测到12 366个SSR位点,分布密度为1/2.75 kb,重复基元类型丰富,标记开发潜力大。本研究利用高通量测序获得丰富的顶芽转录组信息,可以为大花序桉分子辅助育种提供丰富的资源。  相似文献   

10.
为了进一步阐明广藿香中药用活性成分生物合成的分子机制,本研究以海南广藿香幼叶及成熟叶片为材料,采用BGISEQ-500高通量测序平台进行转录组测序,分别获得了63 751 826条和65 949 390条clean reads,平均读长为90 nt。De novo组装后将All-unigene分别注释到Nr、KOG、GO、KEGG、Swiss-Prot、Inter Pro数据库,对每个数据库注释的Unigene数目进行统计,共有162 509条Unigene有对应的功能信息,其中105 430条Unigene被注释到Nr数据库,显示与芝麻有69.87%的相似度;有83 369条Unigene被注释到KOG数据库,根据功能将其分为25类;有12 261条Unigene与GO数据库中的基因具有相似性,将其归为3大类中49个功能组;有79 053条Unigene被注释到KEGG的代谢通路中,分属于124类代谢通路,包括次生代谢物质生物合成、倍半萜和三萜类化合物生物合成、黄酮和黄酮醇生物合成、花青素生物合成等。该研究结果对广藿香药用活性成分生物合成与代谢、关键酶基因克隆以及分子标记开发等研究有一定的帮助。  相似文献   

11.
为揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,本研究以盐胁迫处理的露地菊及其对照为材料,使用Illumina Hiseq2500高通量测序平台对转录组进行测序,分别获得了60370448和71415448条Clean reads,通过序列拼接组装得到45591条Unigene,平均长度724 bp。有37675条Unigene在七大数据库(COG,GO,KEGG,KOG,Pfam,Swiss-Prot,NR)中得到注释。通过比对露地菊盐胁迫处理组和对照组样品间Unigene的表达量及在各数据库中的注释情况,统计得到:有4143条差异表达基因获得注释;有2441条差异表达基因在GO数据库中获得功能注释;注释到COG数据库中的2281条差异表达基因依据功能可分为25类;有1062条差异基因映射到KEGGPathway数据库中,涉及了199个代谢通路,包括核糖体途径、植物激素信号传导途径、淀粉蔗糖代谢、碳代谢、氨基酸的生物合成等。本研究获得的转录组数据将有助于揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,及相关抗性基因的挖掘和分子辅助育种等方面的研究。  相似文献   

12.
以南酸枣雌株叶片和成熟果实为材料,利用Illumina Hi Seq TM 4 000测序平台对其转录组进行测序,共获得14.15 G有效数据,通过序列拼接组装得到46 936条Unigene,平均长度为1 287 bp。36 299条Unigene(77.33%)在7大数据库(NR,NT,KO,Swiss-Prot,PFAM,GO和KOG)中得到注释,其中与GO数据库比对上的26 014条Unigene可分为生物过程、细胞组分和分子功能3大类53分支,注释到KOG数据库中的8 459条Unigene依据功能可分为25类。与KEGG数据库比对,6 225条Unigene分属5大类246条代谢通路中。南酸枣叶片和果实转录组中共发现5 631个差异表达基因,包括1 930个上调基因和3 701个下调基因。本研究获得的转录组数据将有助于开展南酸枣功能基因挖掘与利用、分子辅助育种和其种质资源遗传改良等方面的研究。  相似文献   

13.
扁秆荆三棱是一种常见的稻田杂草,旨在补充其转录组信息,为相关防治工作提供支持。基于高通量测序技术,在Illumina Solexa HiSeq 2000平台上对扁秆荆三棱的茎、叶、根茎和球茎的混合样品进行转录组分析。经拼接组装共获得了59 788个Unigene,序列的平均长度842 bp,N50为1 402 bp。将获得的Unigene与5个通用公共数据库(NR、 Swiss-Prot、 KEGG、 GO、 KOG)进行比对(Evalue1e-5),35 221条Unigene获得了基因注释,占总Unigene的58.91%。在12 823个Unigene中共搜索到9 698个SSR位点,其中二核苷酸和三核苷酸的重复类型占所有SSR位点的95.93%。通过KEGG pathways分析,共有13 141个Unigene参与了291个代谢通路,获得了扁秆荆三棱淀粉合成功能相关Unigene 60个,根茎生长功能相关Unigene 14个。其中赤霉素相关基因、核糖体代谢通路等反映了地下根茎网络系统的扩张趋势以及活跃的能量需求,淀粉合成基因则说明其球茎中的营养储备开始于地下系统扩张的早期,这些发现为深入研究地下根茎网络调控机制,或杂草防治或湿地保护等实践工作提供了参考。  相似文献   

14.
大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用Illumina Hi Seq TM 2000高通量测序平台对1年生大花序桉根系转录组测序和de novo组装,将得到的Unigene与公共数据库比对,同时进行转录组分析。结果显示,组装获得53 433条Unigene,其平均长度890 bp,N50长度为1 587 bp;有34 700条Unigene获得注释信息,占全部Unigene的64.94%,其中19 327条Unigene注释到KOG数据库,被分到25个类别中,共得到32 302个KOG功能注释信息;有11 197条Unigene注释到GO数据库中,共获得了54 971个GO注释功能,归于细胞组分、分子功能和生物学过程三大类;有12 181条Unigene得到KEGG注释,其中6 493条Unigene归入128条代谢途径,发现有57条Unigene参与氮代谢途径。通过软件查找获得13 290个SSR位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。  相似文献   

15.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

16.
为获得杭白芷转录组信息特征,本研究利用Illumina HiSeqⅩTen测序平台对杭白芷根进行高通量转录组测序,获得高质量序列(Clean reads)47742445条,Trinity denovo组装后得到47044条Unigenes,平均长度1164.20 nt。BLAST分析显示分别有32208(68.46%)、23049(48.99%)、10479(22.27%)、17883(38.01%)、28201(59.95%)、20731(44.07%)、55(0.12%)条Unigenes在数据库NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam中获得注释,可归为GO分类的生物过程、细胞组分和分子功能3大类57分支,涉及205个KEGG代谢通路,其中包括27个次生代谢通路。蛋白编码框序列32303个,高等植物转录因子58个家族,借助MISA软件发现10020个SSR,其中二碱基重复最丰富,有4336个,出现频率为43.27%;五碱基重复SSR最少仅占0.37%。本研究获得了大量基因序列信息以及SSR信息,为今后开展相关分子机制研究提供了数据资源和理论基础。  相似文献   

17.
采用Illumina测序技术对在醋酸钙、硫酸铵和蔗糖处理后蓝莓不同发育阶段的果实进行转录组测序,获得Clean Reads 2723731442条,经组装得到平均长度为753.65 nt的87608条Unigene。将转录组Unigene进行基因功能注释,其中39867条Unigene能被NR数据库注释,与葡萄同源序列最多,占8.58%;与GO数据库比对发现,有29661条Unigene获得注释,分别匹配到生物过程、细胞组成和分子功能三大类共59个分支;与KOG数据库进行比对,发现有21992条Unigene具有功能信息,分别涉及25类;根据KEGG数据库的注释信息进行Pathway注释,参与的代谢通路共有246条;共检测到8704个SSR位点,其中双碱基重复的SSR占78.57%。本研究为探索外源物质调控蓝莓果实生长发育、生理代谢的分子机理提供了理论基础。  相似文献   

18.
云南火焰兰(Renanthera imschootiana Rolfe)是濒临灭绝的附生植物,关于其分子水平的研究少有报道。为了获得云南火焰兰相关基因组基础信息,本研究通过Illumina HiSeqTM4000技术对云南火焰兰叶片进行转录组测序,并利用相关生物信息学数据库对其进行序列比对和数据分析。分析结果表明:共获得77 888条功能基因(Unigenes),其N50为1 348 bp,平均长度为805 bp,Q20和Q30序列分别占98.04%和94.32%。经比对,在Nr、KEGG、KOG、Swiss-prot、GO等数据库中能得到注释的Unigene分别为31 298、29 356、14 852、15 697、17 645条。在GO数据库中,共得到24 473个GO功能,将其分为3个大类和47个亚类,以生物过程这一类别所注释的基因数最多;KOG功能注释信息有17 743个,将其分为25个基因功能大类,其中基因数目较多的分别是一般功能基因和信号传导机制的相关基因;在KEGG中涉及的相关通路可将其归为19个亚类,其中以代谢通路较为突出。此外,对云南火焰兰转录组Unigene进行CDS比对和预测,共预测到2 317条CDS,其大小主要集中在200~500 bp,占总CDS的79.41%。本研究可为云南火焰兰乃至火焰兰属植物功能基因的挖掘、利用以及遗传育种等方面的工作提供一定的科学依据。  相似文献   

19.
为了深入了解甘葛藤转录组的整体水平及黄酮类生物合成通路基因。利用高通量测序PacBio Sequel平台,以甘葛藤根、茎、叶的混合样品为材料,使用单分子长读数测序技术(SMRT)对甘葛藤进行全长转录组测序及分析。平台共获得10 994 967个高质量reads和384 072条全长非嵌合序列(FLNC),测序数据经质控后获得90 856个转录本;获得的所有转录本经NR、SwissProt、KOG、KEGG、GO数据库进行注释和功能分类,结果有85 239个单基因被注释,NR注释数量最多为84 675个,占93.2%;KEGG注释的基因最少,22 330个基因被注释到132条途径,代谢途径分布的基因较多(9 368,41.95%)。预测到3 507个转录因子,bHLH转录因子家族的基因最多。14 127个基因被分配到17个R基因类别,主要为RLP类。检测到33 660个SSR序列,多为AG/CT类型。分析黄酮类生物合成途径,发现与黄酮类合成相关的基因110个,其中,26个编码HCT,3个编码CHS,7个编码CHI。PacBio测序平台能获得更长的转录本,SMRT技术能够深入挖掘甘葛藤转录数据,比第二代测序技术能够获得更高的转录本注释率。在高通量全长转录组水平对甘葛藤进行了研究,为甘葛藤的分子生物学研究提供了较可靠、全面的转录组数据,为进一步开发甘葛藤的分子标记和挖掘优良基因提供了科学依据。  相似文献   

20.
梁山慈竹高通量转录组测序及差异表达基因分析   总被引:1,自引:0,他引:1  
分析梁山慈竹及其体细胞突变体的转录组,挖掘功能基因并对其差异表达基因进行筛选和分析,为梁山慈竹遗传改良提供理论依据。利用RNA-Seq技术进行转录组测序,对测序结果进行de novo拼接和功能注释;并对差异表达基因进行筛选及COG、GO、KEGG数据库中进行比对注释,此外,基于Swiss-Prot功能注释结果,分析纤维素和木质素相关功能基因的表达量差异。测序结果表明,共获得86 575 631条reads,de novo组装得到84 741条unigenes,共有49 829条被Nr、COG、GO、KEGG、Swiss-Prot注释。从梁山慈竹实生植株(对照)和体细胞突变体No.30这2个测序样本中,筛选出3 572条差异表达unigenes,757条差异表达unigenes在COG分类体系中具有详细的蛋白功能释义,2 213条差异表达unigenes在GO数据库具有功能定义,385条unigenes被注释到94条KEGG Pathways中。纤维素合成相关纤维素合酶、过氧化物酶、泛素连接酶和热休克蛋白在梁山慈竹体细胞突变体No.30中表达量升高,木质素合成相关MYB4、4-香豆酸CoA连接酶、肉桂醇脱氢酶、肉桂酰-CoA还原酶和漆酶在突变体中表达量降低。提供了全面的梁山慈竹转录组信息,获得了一批在梁山慈竹纤维素和木质素生物合成过程中有重要功能的基因序列。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号