首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
[目的]水稻FAQ(frequently asked question,常问问题集)问答系统对农户在水稻种植过程中遇到的问题进行解答,问句相似度计算是其核心,用来匹配用户问题和FAQ中的问题。针对传统句子相似度算法准确率普遍较低的问题,本研究旨在用深度学习计算问句相似度,以提高系统回答的准确性。[方法]构建一个基于word2vec和LSTM(long-short term memory,长短期记忆)神经网络,包括输入层、嵌入层、LSTM层、全连接层和输出层的句子相似度模型。对水稻FAQ中的3 007个问题进行归类和组合得到32 072个问题对,并标注其相似性作为训练和测试数据。使用基于农业领域语料库训练得到的word2vec模型对训练数据向量化后作为输入,训练句子相似度模型。[结果]在测试集上对模型进行验证,并与基于How Net、基于词向量的余弦距离以及基于word2vec和卷积神经网络(convolutional neural network,CNN)的3种句子相似度算法进行对比。对句子相似度的计算结果进行抽样检查,该模型的计算结果更符合人的直观印象。从准确率和ROC(receiver operating characteristic curve)曲线进行分析,该模型也明显优于其他3种方法,准确率达到了93.1%。[结论]本研究构建的模型显著提升了句子相似度计算的准确率,基于该模型开发的水稻FAQ问答系统,能够准确匹配用户问题和水稻FAQ中的问题,帮助农户更好地解决水稻生产中遇到的问题。  相似文献   

2.
在互联网技术日益发展的今天,如何快速对海量的文本进行归类是数据挖掘的一项重要课题。提出了一种改进型的文本聚类算法,计算句子相似度时综合考虑基于词频统计的特征向量表示法和关键词之间的关系,减少了相似度对于输入次序和频数的敏感度,有效地提高了计算小文档和简单句子相似度的准确度和文本聚类结果的准确率、召回率。  相似文献   

3.
针对如何高效地发现农业舆情话题,提出了一种基于叙词表的舆情话题发现算法。该算法首先基于《农业叙词表》和综合性词表及网络新词构建叙词词典,作为中文分词软件的词典;然后运用TF-IDF计算特征词的权值,选取前P个特征词表示文本,并基于叙词间的关系计算词语相似度;最后,以叙词为节点构建无向图,通过对无向图聚类实现网络热点话题的发现。分析结果表明,该算法的最小识别代价为0.3534,算法运行效率相比传统算法较高。  相似文献   

4.
目前,在基于HowNet进行语句语义相似度计算的算法中,没有考虑语句中的不同词语对语句之间相似度值的不同贡献程度,以致计算结果不理想.为了更好地解决上述缺陷,提出了一种频率增强语句语义相似度算法.该算法利用HowNet作为词典库,在同时考虑义原距离和义原深度的条件下,进行词语相似度计算;在此基础上算法进一步将词语在语料库中的频率函数作为权重值,引入至语句的语义相似度计算中,以降低高频率词语在语句相似度值中的比重.实验表明,改进的算法在语句相似度计算结果上与人们的主观判断更接近,结果更合理.  相似文献   

5.
在群体性事件爆发后网络上会充斥着各式各样的言论,网民通过简短的句子反映了对某个事件的态度,常常带着浓烈的个人感情色彩和强烈的主观色彩,通过挖掘和分析包含网民情感的网络群体性事件的舆情信息,可以了解网络舆情的发展动向,从而进行有效的掌握和引导。本文在已有基础情感词典的基础上,构建针对群体性事件的网络用语情感词典、网络表情符号情感词典、否定词词典、领域词典,使用libsvm对微博评论文本分类、计算情感倾向,并对构建词典的有效性进行了分析验证。  相似文献   

6.
基于深度学习的渔业领域命名实体识别   总被引:2,自引:0,他引:2  
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

7.
针对传统协同过滤推荐算法存在推荐精度低的问题,提出了一种基于社会网络的协同推荐方法。该方法融合了社会网络中用户的相似度与信任度,首先计算用户间的评分相似度;再由直接信任度与间接信任度加权得出用户信任度;最后综合用户相似度与信任度得出用户间的推荐权重,并以推荐权重来选取最近邻居集,为目标用户形成推荐。试验结果证明,该方法可有效提高推荐系统的推荐精度。  相似文献   

8.
章慧 《安徽农业科学》2011,39(23):14406-14409
鉴于样本通常具有模糊特性且分布有稀疏的差别,在研究了现有的一些模糊支持向量机方法基础上,提出了基于模糊K近邻的模糊支持向量机方法。该方法首先针对每一类样本计算出样本均值,从而得到样本类中心点;然后计算出样本与中心点的距离,根据距离计算出样本的初始隶属度。计算每个样本的K个近邻点,按照模糊K近邻方法计算样本的隶属度,将初始隶属度和模糊K近邻隶属度以一定比例融合,得出样本的最终隶属度值。  相似文献   

9.
针对传统基于关键词匹配的中医药信息检索存在查全率和查准率低下的缺陷,将本体与潜在语义索引相结合,提出一种基于中医药领域本体的语义信息检索模型。该模型基于本体概念扩展树构建相应的查询扩展方法和语义向量空间模型,将用户查询和文档集映射到同一潜在语义空间,通过计算查询向量与文档之间的相似度返回检索结果。着重阐述了该模型的体系结构、实现过程和关键技术,并对其实用性进行论证。  相似文献   

10.
传统的SIFT向量图像检索法精度偏低、实用性较差,无法满足使用者的心理需求,为此提出一种基于尺寸不变特征转换向量的图像检索精度优化方法.采用倒排文件的图像检索方式,通过改良建树方法、检索方式和匹配度计算的优化,在满足实时性要求的前提下实现检索精度的提高;为SIFT特征向量构建新的聚类机制,以K均值聚类与分类相结合的方式...  相似文献   

11.
【目的】本研究旨在探究TCN-BiLSTM耦合模型与传统LSTM模型在径流模拟预测中的性能,为洪水风险管理和区域水资源规划提供准确有效的径流预测模型。【方法】以北洛河流域为研究区,基于双向长短期记忆网络(BiLSTM)和时域卷积网络(TCN)建立一种新的径流预测耦合模型TCN-BiLSTM。利用相关性分析,筛选预测径流的输入因子,确定4种不同的输入方案应用于TCN-BiLSTM耦合模型和传统LSTM模型,每个模型分别预测1、2、3 d的径流量。采用平均绝对误差(MAE)、均方根误差(RMSE)和拟合优度(R2)来评估模型的预测性能。【结果】(1)TCN-BiLSTM耦合模型整体预测性能优于LSTM模型,TCN-BiLSTM模型R2达到0.91,高于LSTM的0.89。相比于LSTM,TCN-BiLSTM对于峰值和突变点的捕捉能力更强,对于波动大的复杂数据预测效果更优;(2)在针对未来1~3 d径流量预测中,随着预见期的延长,4种方案下TCN-BiLSTM和LSTM模型的预测效果均有所下降,相较于预测1 d,预测3 d的TCNBiLSTM和LSTM模型的R2分别平均...  相似文献   

12.
提出一种基于左归词频向量空间模型的抄袭检测算法.通过左归处理将抄袭文本的指代还原,借助同义词链对所有同义词统一左对齐于同义词链首词,然后以直接统计词频构造文本词频特征,抛弃词频统计抄袭检测算法中以TF-IDF多步计算相对词频的处理,最后以词频特征构造向量空间模型,用余弦相似计算文本相似度.实验表明,算法在各种抄袭类型的数据集上综合性能更优、稳定性更好、效率更高.  相似文献   

13.
目的为了对在线考试系统中主观题进行更合理的评分,提出一种基于中文分词的算法对主观题进行评分。方法对中文分词进行了详细介绍,并对已有的算法进行研究和改进,利用基于中文分词技术并结合文本相似度对主观题进行自动评分,从文本串长度相似度、文本串词形相似度和文本串词序相似度,再结合影响因子,形成最终的综合相似度。结果通过综合考虑考试科目的特征,合理的设置3个相对影响因子的值,对试卷通过4个实验进行测试,试卷题目分别为4个Office简答题,标准答案控制在100字内,每个实验回收电子试卷50份,与使用原算法的实验结果进行比对。实验测试表明,优化后的算法准确率有了很大提高。结论优化后的算法准确率有明显提高,在词形相似度较高的情况下评分效果与原算法差距不大,依然有改进的空间。  相似文献   

14.
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary,DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection,SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection,SPI)进行语料库的数据增广,首先构建"水产品名称"同类词词典和领域同义词词典,通过两个词典分别对"水产品名称"类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力.结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果.研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果.  相似文献   

15.
基于超像素特征向量的果树冠层分割方法   总被引:1,自引:0,他引:1  
针对无人机精确植保过程中,果树冠层区域颜色特征和杂草相似度较高、难以分割等问题,采用基于超像素特征向量的果树冠层分割方法,以消除不同杂草特征对树冠分离的干扰,减小农药喷雾区域,节省农药使用量.通过分析无人机采集合成的样本图像在HSV彩色空间上色调与饱和度的分布情况,选取合适的阈值范围,提取样本图像中包含果树冠层与杂草的绿色区域,将提取的绿色区域RGB图像转换生成Lab和HSV彩色空间模型下的图像,然后运用简单的线性迭代聚类(Simple linear iterative clustering,SLIC)超像素分割算法将RGB图像预设分割成250个超像素单元,结合超像素的分割信息与RGB图像、Lab图像、HSV图像以及灰度图,提取超像素单元的特征向量,随机选取25%的超像素样本的特征向量作为SVM分类器的训练集,利用SVM分类器对所有样本进行预测分类,实现果树冠层与杂草分割.将基于超像素特征向量的方法和基于光谱阈值、K-means聚类的2种方法进行对比分析,结果显示,基于超像素特征向量的方法在识别果树冠层位置方面生产者精度为90.83%,在提取果树冠层轮廓上F测度值为87.62%,总体分割性能优于后两种方法.说明,基于超像素特征向量的方法能够较为准确地分割果树冠层与杂草,为实现无人机在果园中精确植保提供重要支撑.  相似文献   

16.
针对基于XML的农产品溯源平台中的数据集成问题,提出一种XML Schema模式匹配方法。该方法同时考虑元素的语义性和结构性,结合文档元素的名称、数据类型以及基数约束3个方面,通过相应的度量标准计算出元素的语义相似度,实现语义匹配;通过计算模式树中元素节点的祖先相似度,同时考元素本身的语义相似度,实现结构匹配。阐述了匹配算法的设计过程和试验评估结果。结果表明,相比较现有的几种方法,该方法能实现全自动化的匹配过程,提供更精确的匹配结果。  相似文献   

17.
提出一种基于领域本题概念相似度计算的语义Web服务发现方法。给出合理的概念相似度计算公式,通过领域本体概念相似度计算,最终获得请求和候选服务之间的相似度。传统的概念相似度计算方法只考虑继承关系,本文采用的单概念语义不但考虑继承关系,还考虑二元关系,使本体关系结构构成图结构,更加合理。计算语义距离时,适当处理多继承问题和环问题。实验证实,本算法使得匹配更加合理精确。  相似文献   

18.
基于实例推理的机械设计过程中,属性相似度计算和属性权重确定对于实例检索的有效性和可靠性具有决定性影响。采用区间值属性相似度计算模型,将各种类型属性的相似度计算统一起来;引入层次分析法和基于相似度离差信息法确定属性的组合权重。将实例推理技术应用在免耕播种机圆盘破茬装置的设计过程中,采用最近邻实例检索策略完成实例检索并根据设计要求进行修改,对设计方案进行三维造型。验证结果表明:区间值属性相似度计算模型使属性间的相似度比较具有统一标准,组合权重可综合反映设计者主观评价和属性信息量对决策结果的贡献,基于相似度的实例检索算法能得到符合设计要求的最佳匹配实例,具有较高的实例分辨能力和检索成功率  相似文献   

19.
【目的】解决由于模态参数辨别的不确定性,以及虚假模态干扰造成的风机叶片结构损伤识别精度不高的问题.【方法】采用以深度信念网络提取的模态参数特征向量作为标识量的损伤检测方法.首先分别获取ANSYS仿真和实验条件下风机叶片的模态参数;然后利用深度信念网络提取模态参数特征向量作为损伤标识量,检测多种工况下的风机叶片损伤,并与传统BP神经网络方法进行对比;最后搭建实验平台,在实验条件下验证方法的有效性.【结果】基于深度信念网络的损伤识别方法相比传统BP神经网络精度更高,网络训练时间更长.【结论】将深度信念网络提取的模态参数特征向量作为BP神经网络训练的输入向量,可以减小噪声和虚假模态信息等因素对损伤识别结果的影响,提高损伤识别的精度.  相似文献   

20.
为保证农业物联网传感器的数据感知质量,构建了基于滑动窗口和预测模型(支持向量回归、K近邻、梯度提升回归和随机森林)的异常农情数据在线检测框架,提出了基于数据特征的滑动窗口尺寸计算方法,运用熵权逼近最优排序法评价预测模型适用性。采用羊圈环境数据(空气温度、相对湿度、CO_2和H_2S体积分数)进行试验,结果表明,滑动窗口尺寸计算方法优于仅基于采样间隔和特征周期的计算方法;模型预测误差与其异常检测性能负相关,且对误检率影响更大;支持向量回归模型对空气温度和相对湿度异常数据检测适用性最好,贴近度达0.8以上,梯度提升回归和K近邻模型分别对CO_2和H_2S体积分数异常数据检测适用性较优,两者贴近度均在0.6左右。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号