首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的]水稻FAQ(frequently asked question,常问问题集)问答系统对农户在水稻种植过程中遇到的问题进行解答,问句相似度计算是其核心,用来匹配用户问题和FAQ中的问题。针对传统句子相似度算法准确率普遍较低的问题,本研究旨在用深度学习计算问句相似度,以提高系统回答的准确性。[方法]构建一个基于word2vec和LSTM(long-short term memory,长短期记忆)神经网络,包括输入层、嵌入层、LSTM层、全连接层和输出层的句子相似度模型。对水稻FAQ中的3 007个问题进行归类和组合得到32 072个问题对,并标注其相似性作为训练和测试数据。使用基于农业领域语料库训练得到的word2vec模型对训练数据向量化后作为输入,训练句子相似度模型。[结果]在测试集上对模型进行验证,并与基于How Net、基于词向量的余弦距离以及基于word2vec和卷积神经网络(convolutional neural network,CNN)的3种句子相似度算法进行对比。对句子相似度的计算结果进行抽样检查,该模型的计算结果更符合人的直观印象。从准确率和ROC(receiver operating characteristic curve)曲线进行分析,该模型也明显优于其他3种方法,准确率达到了93.1%。[结论]本研究构建的模型显著提升了句子相似度计算的准确率,基于该模型开发的水稻FAQ问答系统,能够准确匹配用户问题和水稻FAQ中的问题,帮助农户更好地解决水稻生产中遇到的问题。  相似文献   

2.
中文医疗领域分词比较困难,导致现有算法对于医疗问题特征提取不充分,针对中文分词的特点,提出基于LCN(Lattice CNN,格子卷积神经网络)的医疗知识问答模型.首先,利用某三甲医院提供的15 000份电子住院记录,基于电子住院记录利用Glove模型训练医学词向量.其次,通过各大医疗网站获得大量医学名词及名词间的关系,构建医学知识图谱,并提取知识图谱中的关系词,结合已训练的词向量获取关系向量.最终,以医学词向量作为模型输入端并利用LCN神经网络提取医疗问题特征,计算问题特征与关系向量的相似度,进而训练医疗知识问答模型.实验表明, LCN模型准确率可达89.0%,与同类问答模型比较,提高了2%.  相似文献   

3.
病虫害影响水稻质量和产量,快速、准确地检测出水稻病虫害有利于及时防治。针对传统图像识别方法存在特征提取繁琐、识别率低以及对田间环境下的作物病虫害识别困难等问题,本文提出一种以DenseNet121为基础网络,结合迁移学习与坐标注意力机制的水稻病虫害识别模型。该模型引入坐标注意力学习图像特征的通道间关系和空间位置的重要性以增强模型的特征提取能力,采用迁移学习策略训练模型以缓解模型在小数据集上的过拟合现象、减小计算资源以及提升模型的识别性能。利用从田间复杂环境收集的水稻病虫害数据集,对该模型与ResNet50、Xception、InceptionV3、InceptionResNetV2及原DenseNet121等卷积神经网络模型的识别效果进行比较,结果表明,该模型能有效识别出水稻常见8种病虫害和健康植株,识别准确率达到98.95%,模型参数量仅为7.23 M,识别效果优于其他模型。这可为田间环境下的其他作物病虫害识别提供参考。  相似文献   

4.
鲍彤  罗瑞  郭婷  贵淑婷  任妮 《南方农业学报》2022,53(7):2068-2076
【目的】研究不同词向量和深度学习模型组合对农业问句分类结果的影响,为构建农业智能问答系统提供技术支撑。【方法】通过爬虫获取农业种植网等网站的问答数据,选择20000条问句进行人工标注,构建农业问句分类语料库。采用BERT对农业问句进行字符编码,利用文本卷积神经网络(TextCNN)提取问句高维度特征对农业问句进行分类。【结果】在词向量对比实验中,BERT字向量与TextCNN结合时农业问句分类F1值达93.32%,相比Word2vec字向量提高2.1%。在深度学习模型的分类精度对比方面,TextCNN与Word2vec和BERT字向量结合的F1值分别达91.22%和93.32%,均优于其他模型。在农业问句的细分试验中,BERT-TextCNN在栽培技术、田间管理、土肥水管理和其他4个类别中分类F1值分别为86.06%、90.56%、95.04%和85.55%,均优于其他深度学习模型。超参数设置方面,BERT-TextCNN农业问句分类模型卷积核大小设为[3,4,5]、学习率设为5e-5、迭代次数设为5时效果最优,该模型在数据样本不均衡的情况下,对于农业问句的平均分类准确率依然能达93.00%以上,可满足农业智能问答系统的问句分类需求。【建议】通过阿里NLP等开源平台提升数据标注质量;在分类过程中补充词频和文档特征,提高模型分类精度;农业相关政府职能部门加强合作,积极探索农业技术数字化推广和服务新模式。  相似文献   

5.
【目的】水稻病虫害是引起水稻减产的重要因素。准确地识别水稻病虫害类型,及 时采取有效的针对性预防措施,有助于避免因水稻减产带来的经济损失。然而,聚焦于人 脸和花草等常见事物的识别技术,在农业领域特别是水稻病虫害识别领域应用较少,而 目前已有的水稻病虫害识别研究存在数据量小和数据种类不够丰富等问题。【方法】文 章搜集了2.0372 万张水稻病虫害图片,并以此构建了完整的水稻病虫害识别数据集,基 于迁移学习的思想,在ResNet50 的预训练模型基础上构建了一个针对16 种主要水稻病 虫害识别的深度模型。同时,考虑实际应用的需要,搜集了9 928 张其他图片(包括人 像、汽车等),结合9 675 张水稻病虫害图片,构建了一个二分类数据过滤模型,以此来 避免非水稻病虫害图片被识别为某一类病虫害的不合理结果。【结果】有预训练模型验 证结果的top-1 准确率达到了95.23%,F1 系数为77.83%,相较无预训练模型top-1 准确 率提升了24.51%,F1 系数提升了56.66%。数据过滤模型的过滤准确度达到了99.60%。 【结论】基于迁移学习的水稻病虫害识别模型,使水稻病虫害识别结果更加准确。非水稻病 虫害过滤模型,有效地解决了实际应用中非水稻病虫害图片被错分为某一类水稻病虫害的 问题。  相似文献   

6.
融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别   总被引:2,自引:0,他引:2  
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF (BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。  相似文献   

7.
【目的】针对在自然条件下水稻叶片病虫害的识别效率不高、准确率较低的问题,探索基于ResNet深度学习网络的水稻叶片病虫害识别模型(ResNet50-CA)。【方法】在ResNet-50的残差卷积模块下引入坐标注意力机制(CA),采用LeakyReLU激活函数替代ReLU激活函数,使用3个3×3的卷积核替换ResNet-50模型首层卷积层中的7×7卷积核。【结果】在使用传统卷积神经网络进行水稻叶片病虫害研究发现,ResNet-50能够较好地平衡识别准确率和模型复杂度之间的关系,因此选择在ResNet-50网络模型的基础上加以改进。使用改进后的网络通过微调参数进行水稻叶片病虫害对比性能试验,研究发现在批量样本数为16和学习率为0.000 1时,ResNet50-CA获得最高的识别准确率(99.21%),优于传统的深度学习算法。【结论】改进后的网络能够提取出水稻病虫害更加细微的特征信息,从而取得更高的识别准确率,为水稻叶片病虫害识别提供新思路和方法。  相似文献   

8.
针对棉花病虫害文本语料数据匮乏且缺少中文命名实体识别语料库,棉花病虫害实体内容复杂、类型多样且分布不均等问题,构建了包含11种类别的棉花病虫害中文实体识别语料库CDIPNER,提出了一种基于RoBERTa多特征融合的命名实体识别模型。该模型采用掩码学习能力更强的RoBERTa预训练模型进行字符级嵌入向量转换,通过BiLSTM和IDCNN模型联合抽取特征向量,分别捕捉文本的时序和空间特征,使用多头自注意力机制将抽取的特征向量进行融合,最后利用CRF算法生成预测序列。结果表明,该模型对于棉花病虫害文本中命名实体的识别精确率为96.60%,召回率为95.76%,F1值为96.18%;在ResumeNER等公开数据集上也有较好的效果。表明该模型能有效地识别棉花病虫害命名实体且具有一定的泛化能力。  相似文献   

9.
苹果叶片病害形态相似、斑点大小不同,依靠人工和农业专家识别的传统方式效率较低。为此提出一种基于改进残差网络的苹果病害识别模型REP-ResNet。该模型在基准模型ResNet-50的基础上通过采用批标准化、激活函数、卷积层的残差结构顺序,加入通道注意力机制和并行卷积的方式进行改进。训练过程中,将公开数据集PlantVillage预训练的模型权重参数迁移至上述网络模型中重新训练,达到加快网络的收敛速度和提高模型识别能力的目的。采用数据扩充的方式解决训练过程中样本不均的问题。结果表明,REP-ResNet模型与基准网络模型相比识别准确率提高2.41个百分点。模型使用迁移学习的方式进行训练,在复杂背景下的苹果叶片病害识别中准确率达到97.69%,与传统卷积神经网络相比识别效果有较大提高。  相似文献   

10.
针对人工诊断棉叶螨害分级准确率低、耗时长、成本高的问题,提出一种基于迁移学习和改进残差网络的棉花叶螨为害等级识别方法。以3种受害等级的棉花叶片与健康叶片图像作为对象,分别于单一背景和自然环境下采集图像,构建图像数据集。首先,利用PlantVillage数据集预训练模型,使用数据增强技术对数据集进行数据增强,扩充训练样本;然后,在ResNet50网络模型的基础上,引入焦点损失函数,在不同网络层嵌入注意力机制模块,并加入Dropout正则化构建改进的ResNet50模型;最后,对比不同模型的识别效果。结果表明:同时在深层和浅层引入注意力机制模块,设定动量为0.9、学习率为0.001时,改进的ResNet50模型具有最好的分类效果,优于ResNet50、VGG16、MobileNet、AlexNet和SENet模型,对棉叶螨危害等级的平均识别准确率达到97.8%。  相似文献   

11.
柑橘是我国种植面积最大、产量最高的水果作物,对我国的经济发展具有重要作用。柑橘病虫害侵染是导致柑橘产量及品质下降的重要原因之一,高效、准确的柑橘检测技术对柑橘产业的发展具有重要意义。因此,本研究提出一种基于注意力机制改进卷积神经网络的柑橘病虫害识别算法,以多尺度特征提取网络Inception v3为基础,在Inception结构间加入CBAM注意力机制,构建基于注意力机制的多尺度特征提取网络;然后融合残差注意力网络,提升模型的整体性能,以实现对柑橘病虫害的精准识别。试验结果表明,基于注意力机制改进卷积神经网络的柑橘病虫害识别算法从通道和空间维度提高了对输入有效特征的关注度,在融合残差注意力网络后,提高了模型的整体性能,实现对5种柑橘叶片(溃疡病、潜叶蛾、黑点病、红蜘蛛和健康叶片)的识别准确率达到98.49%,比基础模型提高4.02百分点,说明本研究提出的方法对柑橘病虫害的识别效果较好。最后将模型进行部署,设计柑橘病虫害识别系统,实现基于移动端的柑橘病虫害智能检测,为相关研究提供参考。  相似文献   

12.
基于注意力残差机制的细粒度番茄病害识别   总被引:2,自引:0,他引:2  
【目的】解决温室环境下细粒度番茄病害识别方法不足问题。【方法】以早、晚期5种番茄病害叶片为研究对象,提出一种基于注意力与残差思想相结合的新型卷积神经网络模型ARNet。通过引入多层注意力模块,层次化抽取病害分类信息,解决早期病害部位分散、特征难以提取难题;为避免网络训练出现退化现象,构建残差模块有效融合高低阶特征,同时引入数据扩充技术以防止模型过拟合。【结果】对44 295张早、晚期病害叶片数据集进行模型训练与测试的结果表明,与VGG16等现有模型相比,ARNet具有更好的分类表现,其平均识别准确率达到88.2%,显著高于其他模型。ARNet对早期病害识别准确率明显优于晚期病害,验证了注意力机制在提取细微区域特征上的有效性,且在训练过程中未发生过度抖动的状况。【结论】本文提出的模型具有较强鲁棒性和较高稳定性,在实际应用中可为细粒度番茄病害智能诊断提供参考。  相似文献   

13.
基于知识图谱的水稻病虫害智能诊断系统   总被引:2,自引:1,他引:1  
目的 利用知识图谱对水稻病虫害领域复杂的异构数据信息进行结构化存储,建立病虫害间语义关系,为水稻病虫害关联检索及智能诊断提供理论依据。方法 首先提出一种面向水稻病虫害的知识图谱构建方法和基于图的水稻病虫害检索算法,通过引入节气实体实现水稻病虫害的预警。其次提出基于确定性因子(Certainty factor,CF)模型和知识图谱相结合的知识推理方法,利用CF与水稻病株症状的结合实现水稻病虫害的诊断。结果 利用命名实体识别模型,得出病、虫害名称及危害症状实体的准确率分别为0.92、0.90及0.87,进一步构建包括1 972个实体及5 226个实体关系的垂直领域知识图谱。通过自主开发的智能诊断系统进行案例分析,试验表明,诊断算法正确率达到86.25%。结论 该系统有效地解决了水稻病虫害领域数据检索、预警与诊断中知识的复杂性及不确定性的问题,有较强的实用价值和推广前景。  相似文献   

14.
为建立不依赖时序数据的水稻生育期识别模型,基于四波段辐射计(SKYE)获取的水稻全生育期每日的冠层光谱反射率数据,利用K近邻(k-nearest neighbors, KNN)、决策树(Decision trees)、支持向量机(Support vector machines, SVM)、随机森林(Random forests, RF)和梯度提升决策树(Gradient boosted decision trees, GBDT)共5种机器学习算法开展水稻生育期识别研究。结果表明:RF算法的识别准确率最高,达93.00%,KNN算法的识别准确率也达到了91.92%,其他3种算法的准确率也都超过90%。在此基础上,将建立的水稻生育期识别模型应用至无人机(UAV)影像数据,KNN算法适用性最好,识别准确率为83.54%,RF算法的适用性一般,识别准确率为74.38%,SVM算法的适用性最差,识别准确率仅为62.92%,但5种机器学习算法都容易错误地将抽穗扬花期识别为拔节孕穗期;而新构建的KNN算法结合可见光大气修正指数(Visible atmospherically resistant index,VARI)的水稻生育期识别模型对无人机数据的识别准确率可达86.04%,与单独应用KNN算法相比,对水稻各个生育期的识别精度更加均衡。  相似文献   

15.
为提高土壤质地分类模型的准确率,本研究采用欧盟统计局的土壤近红外光谱数据来训练模型,实现砂土、 壤土、黏壤土和黏土的快速区分。将17939 个样本按6:2:2 的比例随机划分为训练集、验证集和测试集,建立卷积神经 网络(CNN)和长短时记忆网络(LSTM)分类模型。为避免模型梯度消失,采用ReLU、批标准化(Batch Normalization, BN)、Dropout 等方法。并采用早停法(Early Stopping)训练网络,防止模型过拟合。本文探讨了网络层数、网络类型 (CNN 和LSTM)、注意力机制对分类效果的影响规律。实验结果:模型的总体分类准确率随网络层数的增加而提高,4 层CNN 模型准确率达到76.58%,4 层LSTM 模型准确率达到77.86%,两类模型均能有效地对土壤质地进行分类。融 入SENet 注意力模块后,模型可重新分配权重,更有效地对光谱内部特征进行自动提取,得到更高且稳定的分类准确 率,CNN_4_Attention 模型准确率达到77.50%,LSTM_4_Attention 模型准确率达到78.39%。  相似文献   

16.
快速高效地识别水稻病害的种类并及时采取有效的防治措施对避免水稻减产具有重要意义,为解决人工识别水稻病害效率低、识别精度不高、深度学习样本不平衡导致识别准确率不高等问题,融合Focal Loss与4种典型卷积神经网络结构对7种水稻病害进行分类识别。利用TensorFlow的Keras深度学习框架搭建卷积神经网络的图像识别分类系统,使用Focal Loss损失函数解决数据集不平衡导致识别准确率低的问题,采用ResNet50、ResNet101、MobileNetV2、VGG16作为特征提取骨干,对7种水稻病害进行识别。通过imgaug库增强数据,将13 543张水稻病害图像按照9∶1的比例划分为训练集和验证集并参与训练模型,将1 404张水稻病害图像作为测试集来验证模型的准确性。结果表明,所搭建的数据集中ResNet50、ResNet101、MobileNetV2、VGG16的识别准确率分别为98.06%、94.26%、92.47%、97.83%。可见,在融合Focal Loss损失函数的情况下,ResNet50作为特征提取骨干训练出的模型在水稻病害图像分类中拥有最高的准确率,该成果可在实...  相似文献   

17.
为了快速、准确诊断和识别水稻氮素胁迫程度,对水稻进行大田栽培试验。以超级水稻‘两优培九’为试验对象,设置0、210、300和390 kg·hm-2共4个施氮水平处理,通过扫描采集幼穗分化期和齐穗期水稻顶1、顶2、顶3叶图像,在卷积神经网络(convolutional neural network,CNN)ResNet34的每个残差块中加入SE block(squeeze-and-excitation block)模块,并将在图像数据集ImageNet(ImageNet large scale visual recognition challenge)上训练得到的权重参数迁移到水稻氮素营养诊断的识别模型中,ResNet34的特征提取层保持原结构,模型结尾的池化层替换为全局平均池化层,利用改进后的网络对水稻图像进行特征提取,训练得到最优的权重参数。结果表明,改进后的网络对水稻幼穗分化期的模型测试准确率达到98.13%,齐穗期的准确率达到99.46%,且模型的收敛速度更快,相比于改进前的网络准确率均提升了7%以上。以上结果表明,通过在ResNet34残差块中加入SE b...  相似文献   

18.
针对目前当归产业病虫害识别方法缺失、人工提取特征存在主观因素及卷积神经网络训练需要大量数据等不足,提出1种基于多卷积神经网络融合的当归病虫害识别方法。构建当归常见病虫害数据集;选择在当归病虫害数据集中表现性能最好的ResNet50、InceptionNetV3、VGG19、DenseNet201 4个网络作为模型融合的基学习器;使用XGBoost(极度梯度提升)算法作为元学习器,得到基于多卷积神经网络融合的当归病虫害识别模型。结果表明,该融合模型比单个卷积神经网络模型具有更高的识别准确率,并优于其他融合方法融合的模型,对当归病虫害识别的查准率、查全率、F1值分别达到98.33%、97.14%、97.68%。本研究提出的基于XGBoost融合方法融合的模型实现了当归常见病虫害的精确分类,对常见病害的识别准确率达到98.33%,为当归产业提供了一种有效的病虫害识别方法。  相似文献   

19.
为提高南药叶片的分类和分拣效率,本研究对 EfficientNetv2网络模型进行改进,引入迁移学习机制训练模型,选取自适应矩估计优化算法,通过多次测试进行超参数优化,确定学习率;采用MultiMarginLoss损失函数改善复杂背景信息对识别效果的影响。应用改进后的EfficientNetv2模型与其他轻量级模型对实地采集的复杂背景下的8种南药叶片进行分类效果对比试验,试验结果显示,改进模型对复杂背景下的南药叶片图像样本识别准确率为99.12%,相较于初始模型EfficientNetv2-S,准确率提高1.17%,并且参数量和模型大小均下降约85%,平均训练时间下降47.62%。与DenseNet121、ShuffleNet和RegNet等模型相比,改进模型在模型存储空间大小、准确率和训练时间3个指标上有明显优势。研究结果表明,在多品种南药叶片分类任务中,改进模型取得优良表现,模型的轻量化程度和性能得到进一步的提升。  相似文献   

20.
命名实体识别是构建知识图谱的关键,在农业病虫害领域存在病虫害数据匮乏、实体结构复杂、实体类型识别困难等问题。针对于病虫害数据匮乏,本文采用网络爬虫技术以及扫描文本数据的方法,构建了玉米、小麦、水稻病虫害实体语料库。传统的命名实体识别方法无法解决农业病害实体结构复杂、实体类型识别困难等问题。本文提出一种基于GPT规则修正的LEBERT-BilSTM-CRF模型,LEBERT模型构建了字典树和Lexicon-Adapter结构,将原始字符进行扩充增加数据的丰富性,将经过BiLSTM-CRF的输出和GPT结果进行实体标签修正以此来提高准确率。在公开数据集训练得到合适的参数后,在自建文本语料库进行训练,通过条件随机场和GPT修正生成全局最优序列取得很好的识别效果,准确率为94.23%,召回率为92.34%,F1值为93.28%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号