首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
《分子植物育种》2021,19(16):5342-5351
为了获得珍贵用材树种大花序桉顶芽转录组数据及预测关键基因功能,本研究基于Illumina HiSeq X Ten测序技术获得大花序桉顶芽转录组原始数据,经Trinity组装拼接获得高质量Unigene,并与NR、Swiss-Prot、GO、KOG、egg NOG和KEGG等生物信息数据库进行序列比对和功能注释,利用MISA软件进行SSR位点搜索和分析。从大花序桉顶芽中共获得26 587条高质量Unigene,平均长度为1 279.69 bp;共有22 099条Unigene至少在一个数据库中被成功注释,其中,11 507条Unigene被注释到KOG数据库中25个功能类别,以参与一般功能基因的数量最多;GO数据库中,所注释到的14 105条Unigene分别匹配到生物功能、细胞组分和分子功能3大类50个功能基因区,其中执行生物过程所占比例最多;KEGG功能注释共发现有7 117个Unigene参与127条代谢通路,以代谢相关的基因最丰富;共有1 021条Unigene注释到转录因子数据库,分布于65个家族,其中比例最大的是bHLH和MYB家族;3 274条Unigene注释到植物抗性基因数据库,分布于13个类别,相匹配基因数量最大的是RLP和TNL。MISA软件共检测到12 366个SSR位点,分布密度为1/2.75 kb,重复基元类型丰富,标记开发潜力大。本研究利用高通量测序获得丰富的顶芽转录组信息,可以为大花序桉分子辅助育种提供丰富的资源。  相似文献   

2.
《种子》2021,(3)
采用高通量测序技术平台Illumina Novaseq 6000对滇白前种子进行转录组测序,共获得平均长度为753.9 bp的43 663个Unigenes。注释到六大功能数据库(NR,COG,Pfam, Swiss-Prot, GO, KEGG)上的Unigene总数为29 177个。滇白前Unigenes比对到NR数据库共有26 688条,与甜菜、藜麦、栓皮栎、菠菜有较高同源性;25 657条Unigenes在COG数据库得到26 500个注释,分为23类;19 942条Unigenes在GO数据库得到79 481个注释,按功能分为细胞组分、分子功能和生物过程三大类,分别有13、16、23个亚类,其中参与的生物过程较多;11 527条Unigene富集在KEGG数据库的101条代谢通路中,代谢相关的通路占比最大。同时,有527个Unigenes被注释为转录因子;有3 995条SSR标记被挖掘。利用高通量测序获得滇白前转录组信息,有助于从分子水平对滇白前进行深入研究。  相似文献   

3.
大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用Illumina Hi Seq TM 2000高通量测序平台对1年生大花序桉根系转录组测序和de novo组装,将得到的Unigene与公共数据库比对,同时进行转录组分析。结果显示,组装获得53 433条Unigene,其平均长度890 bp,N50长度为1 587 bp;有34 700条Unigene获得注释信息,占全部Unigene的64.94%,其中19 327条Unigene注释到KOG数据库,被分到25个类别中,共得到32 302个KOG功能注释信息;有11 197条Unigene注释到GO数据库中,共获得了54 971个GO注释功能,归于细胞组分、分子功能和生物学过程三大类;有12 181条Unigene得到KEGG注释,其中6 493条Unigene归入128条代谢途径,发现有57条Unigene参与氮代谢途径。通过软件查找获得13 290个SSR位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。  相似文献   

4.
为了开发马尾松SSR标记,本研究利用MISA软件对马尾松转录组测序获得的148 186条Unigene (序列总长约91 449.7 kb)进行全面分析,共搜索获得6 611个SSR位点,分布在6 003条Unigene上,SSR发生频率为4.05%,平均每13.83 kb出现1个SSR,结果发现单核苷酸重复出现的频率占总SSR的53.60%;二核苷酸为23.46%;三核苷酸为21.33%。通过对含SSR的Unigene的GO分析,显示生物过程包含的Unigene占40.60%;细胞组分包含的Unigene占35.45%,分子功能包含的Unigene占23.95%;转录组中有724个Unigene可被注释到110个KEGG通路中,其中被注释到新陈代谢的Unigene最多有312个,其次是遗传信息处理类有183个。根据含SSR的Unigene序列共设计了4 247对SSR引物,并随机挑选30对SSR引物进行PCR扩增验证,其中12对引物能够扩增出目标条带,引物的有效性为40%。本研究结果表明,马尾松转录组测序获得的Unigene序列可作为SSR标记开发的有效来源,所开发的SSR标记为马尾松的遗传图谱构建、分子标记辅助育种等研究提供丰富可靠的标记。  相似文献   

5.
[目的]获得白羊草(Bothriochloa ischaemum)转录组数据库和差异表达基因。[方法]选取对照组和干旱胁迫组作为受试材料,采用Illumina HiSeq 4000进行转录组测序,并进行系统的生物信息学分析。[结果]共获得25.23 Gb数据(118580条Unigenes)。将所得到的Unigenes与基因库数据进行比较,对Unigenes进行功能注释,共50070条Unigenes获得功能注释。白羊草转录组中的Unigene根据GO功能大致可分为细胞组分、分子功能和生物学过程三大类共54个分支。将Unigene与KOG数据库进行比对,根据其功能大致可分为25类。KEGG数据库作为参考,依据代谢途径可将Unigene定位到116个代谢途径分支。通过差异性分析发现,差异性表达基因共3987条,其中上调基因占39.45%,下调基因占60.55%,相差较大。[结论]本研究首次对白羊草转录组进行了分析,为白羊草分子生物学研究提供了宝贵的基因组数据库资源。  相似文献   

6.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

7.
基于高通量测序的铁皮石斛叶片转录组分析   总被引:1,自引:0,他引:1  
采用新一代高通量测序技术Illumina Hi Seq 2000对铁皮石斛(Dendrobium officinale)转录组进行测序,共获得11 153 295 000 nt数据。对测序获得数据(reads)进行序列拼接组装,共获得121 596个单基因簇,序列平均长度为660 bp,整体序列信息达到了40.16 Mb。再应用生物信息学相关数据库进行比对,结果表明,本测定获得的52 345个Unigene能够在数据库中检索到相关功能注释。通过GO数据库比对,测序获得Unigene功能分类可分为3大类57个分支,其中有大量的Unigene与细胞、催化活性、细胞部分、细胞器等相关功能。通过COG数据库比对,测序获得Unigene功能注释到25类直系同源蛋白分类中如转录、复制,重组和修复、翻译,核糖体结构和生物起源等。以KEGG数据库作为参考,依测序获得Unigene可定位到128个代谢途径分支,如脂类代谢、氨基酸代谢、碳水化合物代谢等。进一步利用软件查找SSR位点发现,从Unigene中共找到9 892个SSR位点。SSR不同重复基序类型中,出现频率最高的为AG/CT,其次是AAG/CTT、CCG/CGG和AGG/CCT。  相似文献   

8.
以南酸枣雌株叶片和成熟果实为材料,利用Illumina Hi Seq TM 4 000测序平台对其转录组进行测序,共获得14.15 G有效数据,通过序列拼接组装得到46 936条Unigene,平均长度为1 287 bp。36 299条Unigene(77.33%)在7大数据库(NR,NT,KO,Swiss-Prot,PFAM,GO和KOG)中得到注释,其中与GO数据库比对上的26 014条Unigene可分为生物过程、细胞组分和分子功能3大类53分支,注释到KOG数据库中的8 459条Unigene依据功能可分为25类。与KEGG数据库比对,6 225条Unigene分属5大类246条代谢通路中。南酸枣叶片和果实转录组中共发现5 631个差异表达基因,包括1 930个上调基因和3 701个下调基因。本研究获得的转录组数据将有助于开展南酸枣功能基因挖掘与利用、分子辅助育种和其种质资源遗传改良等方面的研究。  相似文献   

9.
为了获得罗布麻转录组信息,研究罗布麻中功能基因的表达以及分子标记的开发,本研究采用Illumina HiSeq2000高通量测序技术对罗布麻进行转录组测序及分析。通过过滤掉低质量的读序,共获得26148138个高质量的读序,组装得到61538个Unigene序列。其中,有25296个Unigene在公共数据库中得到注释。通过KEGG分析,共发现29个Unigene参与活性成分(黄酮类)生物合成。检测出单核苷酸至六核苷酸重复类型的SSR位点13524个。本研究结果分析了参与黄酮类化合物合成的相关基因以及潜在的SSR位点,为进一步研究罗布麻次生代谢产物合成的功能基因的挖掘、分子标记的开发以及资源利用提供有用的信息。  相似文献   

10.
为了进一步阐明广藿香中药用活性成分生物合成的分子机制,本研究以海南广藿香幼叶及成熟叶片为材料,采用BGISEQ-500高通量测序平台进行转录组测序,分别获得了63 751 826条和65 949 390条clean reads,平均读长为90 nt。De novo组装后将All-unigene分别注释到Nr、KOG、GO、KEGG、Swiss-Prot、Inter Pro数据库,对每个数据库注释的Unigene数目进行统计,共有162 509条Unigene有对应的功能信息,其中105 430条Unigene被注释到Nr数据库,显示与芝麻有69.87%的相似度;有83 369条Unigene被注释到KOG数据库,根据功能将其分为25类;有12 261条Unigene与GO数据库中的基因具有相似性,将其归为3大类中49个功能组;有79 053条Unigene被注释到KEGG的代谢通路中,分属于124类代谢通路,包括次生代谢物质生物合成、倍半萜和三萜类化合物生物合成、黄酮和黄酮醇生物合成、花青素生物合成等。该研究结果对广藿香药用活性成分生物合成与代谢、关键酶基因克隆以及分子标记开发等研究有一定的帮助。  相似文献   

11.
天目铁木为中国特有的珍稀濒危植物,5株原生株分布在浙江西天目山。随着环境条件的不断恶化,对濒危植物的保护变得尤为重要,从20世纪80年代初开始对天目铁木开展研究,然而到目前为止对于天目铁木分子生物学和基因功能方面的研究仍旧较少。为了获得天目铁木的基因数据和初步了解基因功能,本研究利用Illumina Hiseq高通量测序平台对天目铁木转录组进行测序,经Trinity软件组装得到58386条Unigene。利用BLAST软件将得到的Unigene与Nr、Swiss-Prot、Go等7大公共数据库进行同源比对。最终有36884条Unigene获得注释。另外利用MISA软件对所得到的Unigene进行SSR位点的发掘,共得到7670个SSR位点。利用高通量测序技术获得的天目铁木转录组信息将为后续该物种功能基因、基因表达、SSR分子标记等研究打下基础,同时能更好地指导天目铁木的保护、遗传多样性研究以及扩繁工作等。  相似文献   

12.
为揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,本研究以盐胁迫处理的露地菊及其对照为材料,使用Illumina Hiseq2500高通量测序平台对转录组进行测序,分别获得了60370448和71415448条Clean reads,通过序列拼接组装得到45591条Unigene,平均长度724 bp。有37675条Unigene在七大数据库(COG,GO,KEGG,KOG,Pfam,Swiss-Prot,NR)中得到注释。通过比对露地菊盐胁迫处理组和对照组样品间Unigene的表达量及在各数据库中的注释情况,统计得到:有4143条差异表达基因获得注释;有2441条差异表达基因在GO数据库中获得功能注释;注释到COG数据库中的2281条差异表达基因依据功能可分为25类;有1062条差异基因映射到KEGGPathway数据库中,涉及了199个代谢通路,包括核糖体途径、植物激素信号传导途径、淀粉蔗糖代谢、碳代谢、氨基酸的生物合成等。本研究获得的转录组数据将有助于揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,及相关抗性基因的挖掘和分子辅助育种等方面的研究。  相似文献   

13.
目前黑枣已有的分子标记比较匮乏,本研究基于转录组测序技术对黑枣品种进行SSR引物开发,为黑枣种质资源评价及分子标记辅助育种提供有力的技术支持。本研究对‘冀洪1号’黑枣转录组序列进行了分析筛选和开发,并利用开发出的引物进行了验证分析。结果表明:共得到52 537个Unigene序列,SSR位点总数22 327个,包含SSR的Unigene序列数为15 286条。黑枣SSR位点的重复单元中,二核苷酸重复类型的SSR最多(52.26%),其次为单核苷酸(25.84%)及三核苷酸(19.25%)。随机挑选90对EST-SSR引物进行验证,有效扩增率为77.78%(70对),多态性引物比例为18.57%(13对),对13个多态性位点进一步分析可得,共扩增了35个等位基因,PIC值介于0.233~0.677之间,平均为0.430。本研究开发出的EST-SSR分子标记,为后期进行黑枣良种的鉴别及分子育种提供了分子技术手段。  相似文献   

14.
霍山石斛叶转录组中SSR位点信息分析   总被引:1,自引:0,他引:1  
开发霍山石斛简单重复序列(SSR)分子标记,为霍山石斛遗传多样性和种质资源鉴定的研究提供技术支撑。利用Illumina HiSeq X10平台对霍山石斛叶片进行转录组测序,Microsatellite(MISA)软件分析霍山石斛转录组SSR的分布频率和重复基元的类型特征,软件Primer 5设计引物。从202080条Unigene中搜到43291个SSR位点,分布在36382条Unigene序列中,发生频率为18.00%,平均每6.08 kb含1个SSR位点,共有463种重复基元,单核苷酸重复占主要地位,发生频率为47.62%,在所有重复基元中,A/T出现频率最高(47.06%)。试验共获得13960条SSR引物。  相似文献   

15.
为了全面了解苦瓜转录组SSR位点特征和满足苦瓜分子育种对分子标记的需求,利用MISA软件对来自苦瓜材料‘大沥-11’6个组织的59740条转录组Unigene序列进行SSR位点搜索,共检测出31066个SSR位点,出现频率(发现的SSR个数与总Unigene数之比)为52.00%,平均每2.62 kb出现1个SSR位点。在苦瓜转录组SSR位点中,基元类型主要为三核苷酸,占总SSR位点的42.17%;其次是二核苷酸,占总SSR位点的31.66%。利用Primer 3软件对搜索到的苦瓜转录组SSR位点进行引物设计,然后把获得的引物序列比对回苦瓜的参考基因组,选择上下游引物序列都是唯一比对的序列并去除重复后共获得9135对特异SSR引物。选择MC00上的232对特异SSR引物对‘谭边大顶’和‘华艺320’两个苦瓜品种基因组DNA进行PCR扩增,其中有219对特异引物可扩增出清晰的条带,有效扩增率为94.40%;有31对特异引物扩增产物表现出多态性,多态率为13.36%。本研究开发的苦瓜转录组特异SSR引物为苦瓜的种质资源分析、基因定位、分子标记辅助选择等理论与应用研究提供了引物数据参考。  相似文献   

16.
山东栒子是中国山东省的特有种,现已处于极度濒危状态。目前,山东栒子的分子生物学研究较少,基因数据库资源极度缺乏,急需探究其生物学遗传信息,以加快对山东栒子的保护遗传学工作。本研究以山东栒子叶片、花、成熟果实为实验材料,利用PacBio Sequel测序平台对其转录组进行全长转录组测序。共得到高质量去冗余的转录本53932个,作为最终转录本序列。预测到的CDS区共52490个;对其SSR位点进行分析,对测序得到Unigenes进行单核苷酸至六核苷酸重复的SSR位点搜索,共搜索到26796个SSR位点。对非冗余转录本利用BLAST软件与NR、Swissprot、GO、COG、KOG、KEGG 6个数据库进行比对,一共成功注释了53319个Unigenes,其中与NR数据库进行比对中注释为苹果的的相关基因数量最多,其次是白梨和桃;在GO数据库中有33305条山东栒子Unigenes被注释分类,由生物学过程、细胞成分和分子功能三部分组成;在与COG数据库比对中,共有23910条比对到了同源序列,且一共被分为25类;在与KEGG数据库的一系列比对中,可将Unigenes映射到126条代谢通路中。本研究在高通量全长转录组水平对山东栒子进行了系统研究,这为进一步开展山东栒子的分子标记开发和挖掘优良基因提供了科学依据,从而推动山东栒子的保护与利用。  相似文献   

17.
采用转录组测序技术对三个时期的桑葚进行转录组测序,建立桑葚的EST数据库。基于生物信息学方法分析桑葚转录组数据库的简单重复序列位点。从51895条Unigenes中共检索出23641条Unigenes含有44867个简单重复序列位点,共计252种基序类型。在所有基序类型中,以A/T与AT/AT型出现次数最多。单核苷酸基序类型与二核苷酸基序类型出现频率最高,共计75.69%。基序长度以10~20 bp为主,重复次数集中5~18次。设计27149对引物,随机选择20对引物,通过PCR验证,在4个桑树品种中展现出良好的重现性与通用性。桑葚转录组SSR位点类型丰富,具备开发出适宜于果桑选育的分子标记的潜力。  相似文献   

18.
为获得杭白芷转录组信息特征,本研究利用Illumina HiSeqⅩTen测序平台对杭白芷根进行高通量转录组测序,获得高质量序列(Clean reads)47742445条,Trinity denovo组装后得到47044条Unigenes,平均长度1164.20 nt。BLAST分析显示分别有32208(68.46%)、23049(48.99%)、10479(22.27%)、17883(38.01%)、28201(59.95%)、20731(44.07%)、55(0.12%)条Unigenes在数据库NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam中获得注释,可归为GO分类的生物过程、细胞组分和分子功能3大类57分支,涉及205个KEGG代谢通路,其中包括27个次生代谢通路。蛋白编码框序列32303个,高等植物转录因子58个家族,借助MISA软件发现10020个SSR,其中二碱基重复最丰富,有4336个,出现频率为43.27%;五碱基重复SSR最少仅占0.37%。本研究获得了大量基因序列信息以及SSR信息,为今后开展相关分子机制研究提供了数据资源和理论基础。  相似文献   

19.
枳壳EST-SSR标记的开发   总被引:2,自引:0,他引:2  
GenBank上已公布的枳壳EST序列为开发新的SSR标记提供了宝贵的数据资源。本研究利用在线SSR鉴定软件SSRIT分析来自枳壳EST数据库的11029条Unigene序列。分析结果共发现327条EST序列含有348个SSR位点,占总数的2.96%。其中,三核苷酸重复的SSR类型最多,共有161个,占检索总数的46.26%。Primer 3.0设计合成58对EST-SSR引物,其中36对能扩增出产物,6对引物产生多态性分离,分别占所设计引物总数的62.07%和10.34%。本文研究成果为今后枳壳遗传多样性分析、遗传图谱构建及比较基因组等研究方面奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号