首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在农业领域中,农业知识问答系统以其能接受自然语言检索和直接返回精确答案而成为一种新的信息检索技术。针对农业领域,提出了一种多重信息融合的句子相似度算法。该算法结合了句子的结构信息、词法信息和语义信息,同时考虑农业知识问答系统中问句的特征,使其更适合应用在农业特定领域中,并通过实验验证了算法的可行性和准确性。  相似文献   

2.
本文提出了一种基于浅层语义的FAQ检索模型.该模型以自然语言为接口,利用"知网"和农业本体,首先从用户输入中抽取农业领域概念词,然后根据这些概念词从系统数据库中检索出一个候选QA对的小集合,通过计算输入问句与候选QA对的语义相似度,选择一些与输入问句接近的问题,以及对应的答案返给用户.  相似文献   

3.
本文采用一种新的改进语句相似度计算技术,设计出Web环境下农业实用技术FAQ系统平台,该平台通过对用户输入的自然语言问句进行处理、分析、计算,然后自动筛选出专业数据库中置信度高的答案,为用户提供实用农业技术信息服务。系统操作方便快捷,答案准确专业,能够较好地满足农业生产技术需求。  相似文献   

4.
提出一种基于领域本题概念相似度计算的语义Web服务发现方法。给出合理的概念相似度计算公式,通过领域本体概念相似度计算,最终获得请求和候选服务之间的相似度。传统的概念相似度计算方法只考虑继承关系,本文采用的单概念语义不但考虑继承关系,还考虑二元关系,使本体关系结构构成图结构,更加合理。计算语义距离时,适当处理多继承问题和环问题。实验证实,本算法使得匹配更加合理精确。  相似文献   

5.
[目的]水稻FAQ(frequently asked question,常问问题集)问答系统对农户在水稻种植过程中遇到的问题进行解答,问句相似度计算是其核心,用来匹配用户问题和FAQ中的问题。针对传统句子相似度算法准确率普遍较低的问题,本研究旨在用深度学习计算问句相似度,以提高系统回答的准确性。[方法]构建一个基于word2vec和LSTM(long-short term memory,长短期记忆)神经网络,包括输入层、嵌入层、LSTM层、全连接层和输出层的句子相似度模型。对水稻FAQ中的3 007个问题进行归类和组合得到32 072个问题对,并标注其相似性作为训练和测试数据。使用基于农业领域语料库训练得到的word2vec模型对训练数据向量化后作为输入,训练句子相似度模型。[结果]在测试集上对模型进行验证,并与基于How Net、基于词向量的余弦距离以及基于word2vec和卷积神经网络(convolutional neural network,CNN)的3种句子相似度算法进行对比。对句子相似度的计算结果进行抽样检查,该模型的计算结果更符合人的直观印象。从准确率和ROC(receiver operating characteristic curve)曲线进行分析,该模型也明显优于其他3种方法,准确率达到了93.1%。[结论]本研究构建的模型显著提升了句子相似度计算的准确率,基于该模型开发的水稻FAQ问答系统,能够准确匹配用户问题和水稻FAQ中的问题,帮助农户更好地解决水稻生产中遇到的问题。  相似文献   

6.
为了解决现有农业知识问答系统功能及业务流程中存在的一些问题,将隐含语义索引技术应用于吉林省农业知识问答系统中。该技术可以增强或消减词语在文档中语义的影响力,使文档之间的语义关系更为明晰,在一定程度上实现了自然语言检索,消除了词语同义性和多义性所造成的影响,从而取得更好的检索效果。  相似文献   

7.
目前,在基于HowNet进行语句语义相似度计算的算法中,没有考虑语句中的不同词语对语句之间相似度值的不同贡献程度,以致计算结果不理想.为了更好地解决上述缺陷,提出了一种频率增强语句语义相似度算法.该算法利用HowNet作为词典库,在同时考虑义原距离和义原深度的条件下,进行词语相似度计算;在此基础上算法进一步将词语在语料库中的频率函数作为权重值,引入至语句的语义相似度计算中,以降低高频率词语在语句相似度值中的比重.实验表明,改进的算法在语句相似度计算结果上与人们的主观判断更接近,结果更合理.  相似文献   

8.
问答系统是一种综合运用各种自然语言处理技术的新型信息检索系统,是目前自然语言处理领域的一项研究热点.本文简要介绍了问答系统的国内外研究现状,并提出了基于Web的农业知识问答系统的体系结构,主要包括四个组成部分:问句分析、信息检索、答案抽取及基于本体的农业知识库.  相似文献   

9.
植物病虫害智能问答系统是对农民用户的问题自动地给予专家解答。本文提出领域分词、问题分类和问题相似度的计算方法,利用自动和手工相结合的方法构建了一定规模的植物病虫害智能问答知识库,将自然语言处理方法和所建知识库结合,开发了一个实用的植物病虫害智能问答原型系统。该系统功能完善,可满足农民用户的一般问答需求。  相似文献   

10.
句子相似度度量在自然语言处理领域中有着广泛的应用。针对现有的句子相似度计算方法不能充分捕捉句子的语义结构特征信息的问题,提出一种基于字向量和LSTM (long-short term memory,长短期记忆)网络的句子相度计算方法。首先,通过Word2Vec模型对中文维基百科语料进行训练,得到中文字向量词典;然后根据字向量词典将句子映射为句向量,并输入LSTM网络,获得句子的特征向量;最后,通过相似度算法计算2个句子特征向量之间的相似度。通过在2个数据集上的试验结果表明,该方法能够提高句子相似度计算的准确性,效果好于传统的语句相似度计算方法和基于词向量的相似度计算方法。  相似文献   

11.
传统的基于本体概念的相似度算法过于依赖层次结构,且忽略了许多影响概念间语义相似度的因素。针对这一问题,通过引入边权重关系、语义相关度影响因素,提出1种新的基于森林病虫害本体的语义相似度的计算方法。结果表明:改进后的相似度算法比传统算法更接近林业相关领域的专家经验值,证明了该方法的准确性及有效性,体现了林业领域本体概念间的复杂关系。  相似文献   

12.
针对基于XML的农产品溯源平台中的数据集成问题,提出一种XML Schema模式匹配方法。该方法同时考虑元素的语义性和结构性,结合文档元素的名称、数据类型以及基数约束3个方面,通过相应的度量标准计算出元素的语义相似度,实现语义匹配;通过计算模式树中元素节点的祖先相似度,同时考元素本身的语义相似度,实现结构匹配。阐述了匹配算法的设计过程和试验评估结果。结果表明,相比较现有的几种方法,该方法能实现全自动化的匹配过程,提供更精确的匹配结果。  相似文献   

13.
本文针对不同本体间的本体概念映射提出了一种新的概念相似度的综合计算方法,从本概念间的语义方面讨论本体概念的相似度,在一定程度上增加了计算量,提高了概念映射的查全率。  相似文献   

14.
针对传统基于关键词匹配的中医药信息检索存在查全率和查准率低下的缺陷,将本体与潜在语义索引相结合,提出一种基于中医药领域本体的语义信息检索模型。该模型基于本体概念扩展树构建相应的查询扩展方法和语义向量空间模型,将用户查询和文档集映射到同一潜在语义空间,通过计算查询向量与文档之间的相似度返回检索结果。着重阐述了该模型的体系结构、实现过程和关键技术,并对其实用性进行论证。  相似文献   

15.
目前的中文问答系统主要是针对有关命名实体的问句进行回答,而对"为什么"开头的问句研究并不多。本研究主要是以搜索引擎返回的网络摘要,从摘要中取得因果关系的句子,再根据预先设定好的因果模式进行权重计算,将权重大的句子返回给用户。实验结果表明,该系统效果显著,对测试问句集的MRR值达到了0.52。  相似文献   

16.
为解决羊群疾病检索过程中出现的大量冗余数据及检索后仍需人工挑选准确答案造成的资源浪费,本研究通过以下3个步骤构建基于知识图谱的羊群疾病问答系统:(1)通过爬虫获取数据,人工提取部分信息,再进行自动化信息抽取,在命名实体识别任务中使用双向长短期记忆循环神经网络Bi-LSTM模型,并添加注意力机制提高识别效率,然后使用BIO规则进行实体标注,完成信息抽取,将数据融合后存储在Neo4j图数据库中,构建羊群疾病知识图谱。(2)针对属性映射,构建Bert-softmax模型;根据用户提问,采用Bert模型计算问句和属性的语义相似度,并通过softmax算法进行归一化处理,返回合适答案给用户,实现羊群疾病问答系统算法设计。(3)构建羊群疾病诊断平台,使用Bootstrap、Echarts、Vue组件实现羊群疾病问答系统的可视化,利用Python语言包含的flask框架搭建后台,封装疾病信息,通过web前端呈现给用户,并于后端建立连接,实现数据之间的交互。试验结果显示,基于Bi-LSTM+Attention+CRF模型实体识别的F1值为83.16%,构建的知识图谱包含实体4 576个,实体关系超13...  相似文献   

17.
鲍彤  罗瑞  郭婷  贵淑婷  任妮 《南方农业学报》2022,53(7):2068-2076
【目的】研究不同词向量和深度学习模型组合对农业问句分类结果的影响,为构建农业智能问答系统提供技术支撑。【方法】通过爬虫获取农业种植网等网站的问答数据,选择20000条问句进行人工标注,构建农业问句分类语料库。采用BERT对农业问句进行字符编码,利用文本卷积神经网络(TextCNN)提取问句高维度特征对农业问句进行分类。【结果】在词向量对比实验中,BERT字向量与TextCNN结合时农业问句分类F1值达93.32%,相比Word2vec字向量提高2.1%。在深度学习模型的分类精度对比方面,TextCNN与Word2vec和BERT字向量结合的F1值分别达91.22%和93.32%,均优于其他模型。在农业问句的细分试验中,BERT-TextCNN在栽培技术、田间管理、土肥水管理和其他4个类别中分类F1值分别为86.06%、90.56%、95.04%和85.55%,均优于其他深度学习模型。超参数设置方面,BERT-TextCNN农业问句分类模型卷积核大小设为[3,4,5]、学习率设为5e-5、迭代次数设为5时效果最优,该模型在数据样本不均衡的情况下,对于农业问句的平均分类准确率依然能达93.00%以上,可满足农业智能问答系统的问句分类需求。【建议】通过阿里NLP等开源平台提升数据标注质量;在分类过程中补充词频和文档特征,提高模型分类精度;农业相关政府职能部门加强合作,积极探索农业技术数字化推广和服务新模式。  相似文献   

18.
针对在实际的多属性语言群决策问题中属性之间往往具有相互关联作用这一问题,提出了一种考虑属性关联的TOPSIS语言群决策方法.该方法中决策者给出对方案的语言评价信息,并采用二元语义概念对语言评价信息进行处理.在传统理想点法的基础上引入λ模糊测度的概念,根据属性间的关联作用确定每个方案属性的权重并得到加权决策矩阵.然后计算每个方案与正、负理想点间在n维二元语义空间内的二元语义欧氏距离并得到相对贴近度,确定最优方案.该方法有效地避免了决策过程中语言评价信息的扭曲和损失,并能够考虑属性间的关联作用对于属性权重的影响,使得决策结果更加合理可信.通过一个实例验证了方法的有效性和实用性.  相似文献   

19.
递春  党育辉 《安徽农业科学》2012,40(8):4816-4817
首先探讨了水质分级评价影响因素及其权重确定方法,接着在分析了影响水质好坏的因素之间存在一定差异的情况下,提出在计算影响因素权重的后,利用样本均值与国家等级准限值的相似度来区分水质等级,给出一种带权模式识别的方法来对水质等级进行划分。  相似文献   

20.
微博搜索排序是近年来微博研究的热点之一。对于任意一个话题,它内容的生产者很容易达到成千上万个,甚至更多,产生的微博数更是不计其数,同时,也给关键字搜索的微博排序提出了更大的挑战。因此,本文提出了基于话题的用户权威值计算方法、基于WordNet的内容语义相似度方法,以及基于LDA的方法将输入关键词和所召回微博与其所属话题相关联,使用LearningToRank监督学习方法,学习一种排序策略。在此基础上,对提出的方案在实际数据集上分别对用户话题权威性、微博内容语义相似度、以及综合排序因素进行验证。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号