首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义]近代文献中的图像作为重要的历史史料,日益受到人文学者的重视,大规模图像资源的深度标注也随之成为图像数据基础设施建设的重要组成部分,利用深度学习对海量图像进行内容解析是图像研究的新方向。本文的研究目的,是通过基于EfficientNet的迁移学习在近代文献图像分类中的实证研究,解决大规模近代文献图像的自动分类问题,提高其在实际应用中的准确率和效率。[方法/过程]本文的研究方法,是根据近代文献图像中的特征分析,采用7 645张近代文献图像数据集,通过裁切、白平衡、色调分离、仿射变换等图像增强手段串行叠加,提高样本图像的多样性,并通过对深度学习算法的研究,使用微调的简化EfficientNet深度卷积神经网络模型进行迁移学习,最终得到了在近代文献图像分类上表现良好的模型。[结果/结论]本文的研究结论,是根据实验结果发现,该模型有效提高了图像分类效率和分类准确性,对于解决近代文献中大规模图像的自动分类具有一定的推广价值。  相似文献   

2.
[目的/意义]科技文献摘要往往由承担特定功能的部分构成,利用深度学习对科技文献摘要结构功能进行识别有助于实现科技文献文本深度分析。[方法/过程]本文将科技文献摘要特征功能识别任务转换为文本分类问题,将结构功能分为“引言-方法 -结果 -结论 (Introduction-Methods-Results-Conclusions,IMRC)”4类,基于摘要句内容及其上下文特征,利用BERT、BERT-Bi LSTM、BERT-TextCNN、ERNIE等模型构建分类器,实现摘要结构功能自动识别。[结果/结论]在eHealth领域3 130篇文献数据集上开展实验,结果表明:ERNIE模型的各项指标均高于其他模型,BERT-TextCNN模型在短句子上效果更好,而BERT-Bi LSTM模型对于长句子的识别效果更好。本研究有助于实现科技文献摘要文本的细粒度功能理解,对文献结构的解析能够服务于科技文献深度挖掘和基于文献的知识发现。  相似文献   

3.
[目的/意义]为实现对渔业专利文献的深度利用,在“渔业专业知识服务系统”的信息组织中尝试了设置专业化的分类体系并进行了标引试验。[方法/过程]首先,研究以筛选出的10 323条中文渔业专利元数据为分析样本,通过对元数据中国际专利分类号(IPC)4位类号和6位类号频次的统计分析,确定了用于渔业专利文献分类的12个分类类目;然后,通过对专利题名结构的分析,提出了由行业属性词、业务类型词、发明类型词构成的专利题名中,业务类型词最适合专利文献的分类与标引的观点;通过对题名关键词以及题尾词组的统计分析,列举了每一业务类型所包含的高频主题词或词组。最后,试验设计了利用IPC分类号结合高频主题词分步标引渔业专利文献的策略,通过计算机辅助实现了对绝大部分渔业专利文献的专业化标引。[结果/结论]经对样本数据中2016年文献的机器标引结果与人工标引结果的比对,得出机器标引总正确率为91.44%,漏标率为7.94%,达到了预期目标。研究表明,所设置的渔业专利文献分类类目切合实际,标引策略具有很强的实践应用价值。  相似文献   

4.
[目的/意义]智库报告是由独立研究机构提供的专业分析和政策建议,为决策者和公众提供决策支持和促进社会进步的重要工具。智库报告摘要可以为读者提供一个简洁明了的概述,以便他们能够快速了解报告的主要内容和结论,从而提高信息筛选、传播效果和知识传递的效率。目前的智库报告存在主题差异大导致生成摘要不准确的问题,亟需对现有的文本摘要方法进行改进。[方法/过程]针对上述问题,本文提出了一种融合关键词的智库报告摘要模型。首先使用关键词抽取算法抽取原文中的关键词信息,其次提出一种基于交叉注意力机制的融合关键词模块用于提升模型对于主题信息的感知能力,并且在训练的过程中使用了对比学习训练。[结果/结论]结果表明,融合关键词的摘要模型在智库报告文本摘要任务中的Rouge-1、Rouge-2和Rouge-L值优于其他文本摘要模型,分别达到了48.23、32.55和42.50,在智库报告文本摘要任务上具有更优的摘要效果。  相似文献   

5.
[目的/意义]随着面向典籍的数字人文研究的不断深入,对基于文本内容的细粒度分类要求不断提高,合理的分类已成为数字化典籍研究和有效利用的关键.[方法/过程]研究利用分面分类思想,以典籍文本数据及相关典籍词典为研究对象,结合概念语义信息,组织并描述典籍内容数据特征.[结果/结论]本文构建的分类体系突破典籍数量、体裁和种类的...  相似文献   

6.
为构建基于农业时空大数据的管理系统,实现田间养分精细化管理,提出了一种面向精准施肥的农业时空多模态知识图谱的构建及其控制与决策方法。通过基于深度学习的子图匹配方法,将地块待查询图和农业时空多模态知识图谱中的节点和关系嵌入表示;利用向量相似度计算获取候选子图,并从存储历史数据信息的子图中获取适合查询地块的施肥模型数据。结果显示,基于实例化后的待施肥地块查询图,在农业时空多模态知识图谱中可获取与给定地块查询图同构的子图,并从存储历史决策信息的子图中,获得适合当前地块的农业施肥模型。结果表明,基于农业时空多模态知识图谱的农业模型自动化选择结果可为精准施肥任务提供新思路和决策支撑。  相似文献   

7.
[目的/意义]随着农民信息需求和意识的不断提高,中国农村信息传播的针对性、及时性和有效性受到极大重视。研究不同主题下农村信息传播存在问题和影响因素,有助于农村各类信息精准传播,并为优化农村信息传播提供理论依据。[方法/过程]采用文献计量学的方法,通过关键词聚类进行主题分类,而后对不同主题的相关文献进行深度分析和梳理。[结果/结论]当前农村信息传播显现出健康、农业科技、政策、文化四大主题研究方向,主要理论包括使用满足理论、创新扩散理论等;各主题下的传播者、传播内容、传播媒介和受传者具有不同特征和问题,亟待解决是政府职能发挥不充分、受传者主体地位丧失等问题;传播者的信息素养、内容的形式和质量、农村的基础设施建设和人际关系网络等因素会在不同程度上影响信息的传播。  相似文献   

8.
[目的]探讨面向农业观光园区分布式服务的无线传感器网络节点布局优化方案,为提高农业观光园区服务质量及提升游客游园体验提供依据.[方法]利用社会力模型结合观光园区规划信息,采用Anylogic行人仿真平台获取游客在园中的空间分布数据,用传统K-means算法和改进K-means算法分别对游客空间分布数据进行聚类分析,并根据节点优化布局评价指标,计算节点最优位置.[结果]采用传统K-means算法和改进K-means算法对选取的12组游客空间分布数据进行单日游客聚类分析得到两组节点位置;改进K-means算法聚类得到的节点最终位置对节点被接入次数的均衡效果均优于传统K-means算法,其节点被接入次数均方差的均值降低约41.8%.因此,改进K-means算法更适合运用于观光园区节点的布局优化,得到的节点最终位置即为该观光园区节点最优位置.[建议]在面向农业观光服务的混合型无线传感器网络建设中,应基于社会力模型预估游客空间分布,实现观光服务优化;通过合理部署节点位置,延长融合智能设备的混合型无线传感器网络生存时间;更好地打造面向游客服务、整合移动智能设备的农业物联网系统.  相似文献   

9.
[目的/意义]从高校图书馆社交网络平台用户评论数据挖掘角度出发,对用户评论情感极性进行细粒度分析,为高校图书馆了解用户真实情感倾向并提升服务质量提供科学依据。[方法/过程]以国内高校图书馆社交网络平台用户中文评论数据为研究对象,通过Tensor Flow深度学习框架,利用Keras人工神经网络库,将卷积神经网络(Convolution Neural Network,CNN)和双向长短时记忆网络(Bidirectional Long Short Term Memory,BiLSTM)结合,并引入层次化注意力机制(Hierarchical Attention,HAN),构建基于CNN-BiLSTM-HAN混合神经网络的情感分析模型。[结果/结论]利用真实高校图书馆社交网络平台用户评论数据集进行实验,本文方法取得93.38%的准确率,结果表明本文模型的有效性。模型较为复杂,导致模型训练时间上较长,方法模型的普适性有待进一步检验,表情符号信息没有得到有效利用,参数设置尚需进一步研究。  相似文献   

10.
[目的/意义]调研近年来作者同名消歧相关研究,厘清发展脉络,为后续研究提供参考。[方法/过程]使用Web of Science、Scopus、谷歌学术、ACM、IEEE、Elsevier、Springer、中国知网、维普数据库和万方数据库检索作者姓名消歧相关文献,选择其中46篇代表性文献进行综述。从数据对作者同名消歧方法的影响的角度审视、梳理相关研究的发展脉络。[结果/结论]按照消歧任务所依据的数据特点将相关研究方法分为3类。随着技术的进步,深度学习方法得到广泛采用。相对于模型的改进,基于深度学习的特征学习和表示,对作者同名消歧算法效果的提高更为显著,同时,为充分利用数据中包含的各种信息,3类算法呈现出相互结合、互补增益的态势。从文献调研情况看,可以从增量消歧和跨语种消歧等角度开展后续研究。  相似文献   

11.
[目的]本文旨在探究基于电子鼻和高光谱成像技术实现冷鲜牛肉中微生物生长曲线拟合的可行性。[方法]采用平板计数法测定4℃恒温贮藏下冷鲜牛肉中的菌落总数,并采集其电子鼻和高光谱数据;采用Huang模型和Baranyi模型建立基于传统平板计数法、电子鼻和高光谱特征信息的生长模型,并对其进行比较。[结果]基于传统平板计数法构建的生长模型精度较高,模型决定系数R2高达0.993;与平板计数法相比,基于电子鼻特征信息的方法ⅰ和ⅱ所建的生长模型精度略低,R2大于0.871,二者之间的相关系数r为0.917~0.994。基于高光谱信息的方法Ⅰ所建模型R2与之相当,r高达0.998;而基于高光谱响应值的方法Ⅱ所建的模型表现稍差,R2为0.749~0.918,r为0.761~0.859。[结论]电子鼻和高光谱特征信息可用于冷鲜牛肉微生物生长曲线拟合,这为无损检测技术在预测微生物学领域的应用提供了理论支持和技术参考。  相似文献   

12.
[目的/意义]探讨Chat GPT等大规模预训练语言模型在网络健康信息识别中的应用效果,为人工智能在健康信息领域的应用提供参考。[方法/过程]以国内某权威辟谣平台与健康相关的信息为研究对象,使用“Chat GPT”和“讯飞星火”对其真实性进行鉴定,对其性能进行评估,并将鉴定结果与医学专家或权威机构的鉴定结果进行比较。[结果/结论] Chat GPT和讯飞星火的鉴别准确率分别为93.9%和92.9%,F1值分别为0.951和0.946,应用效果良好。两者生成的解释文本内容比较详细,语言比较流畅,文本长度和语义相似度与专家文本高度接近,但对个别信息的解释仍存在科学依据不够详细、逻辑错误等问题。实验结果表明,大规模预训练语言模型在辅助网络健康信息识别任务方面具有一定的优势,但仍需要人工干预以保证结果的准确性和可靠性。  相似文献   

13.
[目的 /意义]为资源化数据并支持智慧推荐服务多样化、提升用户交互体验,系统分析国内大数据赋能的用户兴趣建模、项目信息管理技术研究成果,阐述智慧推荐中用户及项目信息规范管理的技术体系。[方法 /过程]文章用文献研究法归纳了507篇文献内容,从用户兴趣建模、项目信息管理两方面对国内大数据赋能的智慧推荐资源管理技术进行总结分析:前者包括模型表示、初始化、进化,后者包括数据采集、挖掘、存储、更新、解释。[结果 /结论]大数据赋能的用户兴趣建模技术核心研究依托大数据技术在线、离线赋能用户兴趣数据分类采集及预处理、模型进化;大数据赋能的用户、项目信息管理技术核心研究用大数据技术赋能数据分类采集,并用大数据计算基础设施赋能数据离线挖掘、数据存储、数据更新、数据在线解释。现有研究需强化用户、数据双驱型的智慧推荐方案设计、实践研究,且需强化数据安全研究。  相似文献   

14.
[目的/意义]科技文献数据资源具有覆盖广、数量大、类型多、更新快、时效强等特点,为提高科技文献数据管理效果和数据安全,本文基于数据生命周期模型对科技文献管理体系进行研究。[方法/过程]对科技文献管理模式进行探索,基于数据管理流程,构建了科技文献的生命周期体系,并从数据创建、数据存储、数据预处理、数据计算、数据服务、数据归档、数据销毁等7个阶段对数据管理工具和数据管理方法进行阐述。[结果/结论]本文对科瑞唯安核心数据集WOS BP数据进行了基于科技文献生命周期的管理和实践,同时基于DAMA数据质量的6个评估维度对数据管理效果进行综合评价。  相似文献   

15.
[目的/意义]为实现文献资源的细粒度组织,满足用户日趋精准的信息服务需求,研究提出一种基于PDF版式特征的文献篇章结构细粒度自动抽取方法。[方法/过程]方法充分利用机器学习在信息分类方面的优势,针对非结构化的PDF文档,基于其版式特征对章节标题进行自动分析、识别与抽取。根据章节标题的坐标定位,将正文内容以段落为最小颗粒度自动匹配至所属标题的下级位置,最终实现文档全文结构的细粒度抽取和重组。[结果/结论]经实测,机器自动抽取平均正确率达80%,针对非结构化PDF文档的细粒度抽取工作具有较好的现实意义和应用前景,基于底层方法设计构建的数据处理系统现已投入实际应用,大幅解放人工进行篇章结构细粒度抽取的工作。  相似文献   

16.
刘军  马文丽  姚文娟  郑文岭 《安徽农业科学》2009,37(27):12884-12886
[目的]探讨基于CPN神经网络集成的蛋白质二级结构预测模型的效果。[方法]借助神经网络集成方法对从36个蛋白质提取的共4000个氨基酸进行预测研究,其数据集是从HSSP数据库中提取的数据经过处理后得到的评测数据库,同时在Profile编码中引进了CPN网络算法的概念。[结果]基于CNP网络的神经网络集成预测模型可以取得很好的预测结果,把蛋白质二级结构预测的平均精度提高了17.74%。同时,所用的Profile编码和CPN网络算法在很大程度上为系统模型引入较多的生物信息和联系,而这一点对蛋白质二级结构预测非常重要。[结论]该研究为蛋白质二级结构预测准确率的提高奠定了基础。  相似文献   

17.
[目的/意义]通过调研关联数据的研究文献,分析关联数据的研究的主题结构与研究进展。[方法/过程]综合采用文献综述方法、文献计量方法与可视化工具对Web of Science中的关联数据研究进行分析。其中,利用Citespace可视化软件分析了关联数据研究主体,利用VOSviewer将构建的关键词矩阵可视化。以关联数据的生命周期阶段为线索,结合关键词共现图谱,探寻了关联数据研究的主题结构与研究进展。[结果/结论]分析结果显示欧洲为关联数据研究的主阵地,Tim Berners-Lee等人在关联数据领域具备深厚的影响力。目前关联数据的研究覆盖了发布、优化、评价、应用等生命周期各个方面,但也存在一些薄弱环节,如在研究推动关联数据发布的进一步规范、实现实体自动丰富与链接、构建全面的质量评价体系与工具等方面存在挑战。  相似文献   

18.
[目的/意义]研究旅游问答社区用户的旅游信息需求,为优化在线社区服务,吸引和鼓励更多有旅游意向的人使用网络分享和获取旅游信息。[方法/过程]采用网络文本挖掘的方法,选取了途牛问答平台中有关北京的问答内容,将采集到的问答文本作为语料库,利用TF-IDF与TextRank两种不同原理的关键词抽取算法,对文本关键词进行逐一抽取,通过Gephi构建共现网络,采用Gephi的聚类功能明确关键词主题,从而掌握用户的旅游信息需求。[结果/结论]在线旅游问答社区用户的旅游信息需求大致可以分为7类:住宿信息、饮食信息、交通信息、景区信息、团游信息、气候信息以及规划建议;用户对于不同类别的旅游信息需求,并非相互割裂、独立的,不同的需求之间存在着交错关系。  相似文献   

19.
[目的/意义]开展面向数字人文的古籍触发动词识别及分类研究,对于古籍文本的深层次挖掘和内容揭示具有重大的意义。本文利用深度学习分类算法,探索依据古籍触发词进行事件句文本多元分类的自动化方法。[方法/过程]在构建了典籍事件触发词分类体系和触发词典的基础上,选取4个不同类别的事件句文本作为实验数据,利用Onehot和Tokenizer对类别标签和句子文本进行分别编码后,输入Bi-LSTM模型中训练分类器,并通过调整参数设置了对比实验,采取通用的评价指标分析了分类器的性能。[结果/结论]经过多次训练和调整之后得到的分类器,在测试集的评估中精确度达到了0.95,证明基于深度学习的实验方法和构建的触发词数据集能够有效的帮助我们实现古籍事件句文本的自动化多元分类。  相似文献   

20.
[目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和代表性的数据进行人工标注并构建标注数据集,提升农业新闻挖掘工作效率和效果。[方法/过程]将文本分类常用的机器学习模型结合主动学习方法分析提升效果,以及使用BERT模型结合3种采样策略进行深度主动学习训练,在共19 847条样本的新闻爬虫语料上以筛选出农业相关新闻为目标,通过每轮增加30个样本标注的迭代实验进行测试。[结果/结论]实验结果表明:主动学习方法的应用对各个模型的训练过程均有明显提升。其中BERT模型配合判别性主动学习采样函数,具有最优的新闻文本分类效果和最低的标注数据需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号