首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
基于部首嵌入和注意力机制的病虫害命名实体识别   总被引:1,自引:0,他引:1  
郭旭超  唐詹  刁磊  周晗  李林 《农业机械学报》2020,51(S2):335-343
为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricultural diseases and pests named entity recognition with joint radical embedding and self attention, RS-ADP)。首先,该模型将部首嵌入集成到字符嵌入中作为输入,用以丰富语义信息。其中,针对部首嵌入设计了3种特征提取策略,即卷积神经网络(Convolutional neural network, CNN)、双向长短时记忆网络(Bidirectional long short term memory network, BiLSTM) 和CNN-BiLSTM;其次,采用多层不同窗口尺寸的CNNs层提取不同尺度的局部上下文信息;然后,在BiLSTM提取全局序列特征的基础上,采用自注意力机制进一步增强模型提取更长距离依赖的能力;最后,采用条件随机场(Conditional random field, CRF)联合识别实体边界和划分实体类别。在包含11个类别和24715条标注样本的农业病虫害自制语料上进行了实验。结果表明,本文模型RS-ADP在该数据集上精确率、召回率和F1值分别为94.16%、94.47%和94.32%;在具体实体类别上,RS-ADP在作物、病害、虫害等易识别实体上F1值高达95.81%、97.76%和97.23%。同时,RS-ADP在草害、病原等难以识别实体上F1值仍保持86%以上。实验结果表明,本文所提模型能够有效识别农业病虫害命名实体,其识别精度优于其他模型,且具有一定的泛化性。  相似文献   

2.
针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注意力(Multiple self-attention mechanisms,MHA)调整词集中不同词的权重;同时使用注意力机制忽略不可靠的词集,将注意力集中在重要的词集上,从而提高实体识别效果;在字符级别上,引入无监督的基于转换器的双向编码表征(Bidirectional encoder representations form transformers,BERT)预训练模型增强字的语义表示。在包含12477条标注样本和7个类别实体的猕猴桃种植领域自制语料上进行了实验,结果表明,本文模型与SoftLexicon模型相比,F1值提高1.58个百分点。此外,本文模型在公开数据集ResumeNER上与Lattice-LSTM、WC-LSTM等模型进行实验对比取得了最佳效果,F1值达到96.17%,表明本文模型具有一定的泛化能力。  相似文献   

3.
基于注意力机制的农业文本命名实体识别   总被引:4,自引:0,他引:4  
针对农业智能问答系统构建过程中传统的农业命名实体识别方法依赖人工特征模板、特征信息提取不充分、实体名称多样导致标注不一致等问题,提出一种基于注意力机制的农业文本命名实体识别方法。采用连续词袋模型(Continuous bag of words,CBOW)对输入字向量进行预训练,丰富字向量特征信息,缓解分词准确度对性能的影响;引入文档级的注意力(Attention)机制,获取实体间相似信息,保证实体在不同语境下的标签一致性;基于双向长短期记忆网络(Bi-directional long-short term memory,BiLSTM)和条件随机场(Conditional random field,CRF)模型,构建适合农业领域实体识别的模型框架。选取4604篇农业文本,针对病害、虫害、农药、农作物品种4类实体进行了识别实验。结果表明,模型能有效地辨别农业文本中的实体,缓解实体标记不一致的问题,在农业语料上达到了较好的结果,识别的准确率、召回率、F值分别为93.48%、90.60%、92.01%。与其他3种识别方法相比,模型在不同规模语料库的准确率均有一定提高,具有明显的性能优势。  相似文献   

4.
基于条件随机场的农作物病虫害及农药命名实体识别   总被引:3,自引:0,他引:3  
互联网农技问答平台现仅依靠人工提供答题服务,响应速度慢,回答质量难以保证。实现智能农技问题解答,构建农技知识库,需要从现有问答数据提取“农作物-病虫害-农药”命名实体三元组。现有对农业中文命名实体识别的研究较少,且准确率较低。根据农作物、病虫害及农药命名实体的特点,针对农技问答数据,提出基于条件随机场的农作物、病虫害及农药命名实体的识别方法。对数据集进行格式整理及自动分词,并对分词后的语料,针对是否包含特定界定词、是否含特定偏旁部首、是否是数量词、是否是特定左右指界词及词性等特征进行自动标注。利用标注后的数据训练CRF模型,可以对语料进行分类,包括判断语料是否属于农作物、病虫害、农药3类命名实体并识别该语料在复合命名实体中的位置,从而实现了对3类命名实体的识别,由此可自动构建关联三元组。通过试验选择特征组合和调整上下文窗口大小,提高了本方法的识别准确度,降低了模型训练时间,对农作物、病虫害、农药命名实体识别的准确度分别达97.72%、87.63%、98.05%,比现有方法有显著提高。  相似文献   

5.
随着信息化技术的快速发展,农户通过线上智能农业问答系统解决线下农业病虫害问题已成为趋势。问句分类在问答系统中发挥着至关重要的作用,其准确性直接决定了最终返回答案的正确性。传统的单标签文本分类模型难以直接准确捕捉到农业病虫害问句的确切意图,而且由于缺乏大规模公开的农业病虫害问句语料,使得现有研究具有一定的难度。为此,本文基于树状结构构建了一个农业病虫害问句层级分类体系,由问句模糊性向精确性逐层细化分类,旨在克服农业问句的语义复杂性;此外,引入对抗训练方法,通过构建对抗样本并将其与原始样本一同用于大规模语言模型的训练,以提高模型泛化能力,同时缓解了因语料不足而产生的问题。通过对真实问答语料库的实验验证,本文提出的方法能够提升农业病虫害问句的分类性能,可为农业病虫害自动问答系统提供有效的问句意图识别。  相似文献   

6.
随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针对中文农作物病虫害数据集缺失问题,提出了基于半远程监督的停等算法,利用该算法构建中文农作物病虫害领域语料库,大幅度减少标注过程的人工成本和时间成本;同时,提出了中文农作物病虫害命名实体识别模型(Agricultural information extraction, Agr-IE),该模型基于BERT-BILSTM-CRF,辅以多源信息融合(多源分词信息和全局词汇嵌入信息)丰富字符向量,使其充分结合字符级与词汇级的信息,以提高模型捕捉上下文信息的能力。实验表明,该模型可以有效地识别病害、虫害、药剂、作物等实体,F1值分别为96.56%、95.12%、94.48%、95.54%,并对识别难度较大的病原实体具有较好的识别效果,F1值为81.48%,高于BERT-BILSTM-CRF、BERT等模型的相应值。本文所提模型在MSRA和Weibo等其他领域数据集上与CAN-NER、Lattice-LSTM-CRF等模型进行了对比实验,并取得最佳的识别效果,F1值分别为95.80%、94.57%,表明该算法具有一定的泛化能力。  相似文献   

7.
为提高啤酒花产业的品质和产量,针对于传统人工识别鉴定难度大,效率低和客观性不够,以及啤酒花病虫害识别无大型公开数据集等问题。本文提出一种基于软注意力机制的小样本啤酒花病虫害识别方法,对传统深度残差网络ResNet模型进行改进,并使用图像增强技术-直方图均衡化处理图片得到新的数据集。实验结果表明,在小样本情况下,相比于传统的模型,改进过后的模型A-ResNet50和A-ResNet101都能准确识别不同类型的病虫害图像,在测试集上的准确率为93.27%和93.11%,Kappa指数达到了0.9027和0.8996,证实了A-ResNet50和A-ResNet101模型在啤酒花病虫害识别上的可行性以及可靠性。本文提出的方法识别精度高,实现了啤酒花病虫害的智能识别,同时也对小样本数据集的高精度识别提供了一种途径。  相似文献   

8.
植物病害是造成农作物减产的主要原因之一。针对传统的人工诊断方法存在成本高、效率低等问题,构建了一个自然复杂环境下的葡萄病害数据集,该数据集中的图像由农民在实际农业生产中拍摄,同时提出了一个新的网络模型MANet,该模型可以准确地识别复杂环境下的葡萄病害。在MANet中嵌入倒残差模块来构建网络,这极大降低了模型参数量和计算成本。同时,将注意力机制SENet模块添加到MANet中,提高了模型对病害特征的表示能力,使模型更加注意关键特征,抑制不必要的特征,从而减少图像中复杂背景的影响。此外,设计了一个多尺度特征融合模块(Multi-scale convolution)用来提取和融合病害图像的多尺度特征,这进一步提高了模型对不同病害的识别精度。实验结果表明,与其他先进模型相比,本文模型表现出了优越的性能,该模型在自建复杂背景病害数据集上的平均识别准确率为87.93%,优于其他模型,模型参数量为2.20×106。同时,为了进一步验证该模型的鲁棒性,还在公开农作物病害数据集上进行了测试,该模型依然表现出较好的识别效果,平均识别准确率为99.65%,高于其他模型。因此,本文模型...  相似文献   

9.
崔金荣  魏文钊  赵敏 《农业机械学报》2023,54(11):217-224,276
针对水稻病害识别方法准确度低、模型收敛速度缓慢的问题,本文提出了一种高性能的轻量级水稻病害识别模型,简称为CA(Coordinate attention)-MobileNetV3。通过微调的迁移学习策略完善了模型的训练,提升了模型收敛速度。首先创建10个种类的数据集,其中包含9种水稻病害和1种水稻健康叶片。其次使用CA模块,在通道注意力中嵌入空间坐标信息,提高模型的特征提取能力与泛化能力。最后,将改进后的MobileNetV3网络作为特征提取网络,并加入SVM多分类器,提高模型精度。实验结果表明,在本文构建的水稻病害数据集上,初始的MobileNetV3识别准确率仅为95.78%,F1值为95.36%;加入CA模块后识别准确率和F1值分别提高至96.73%和96.56%;再加入SVM多分类器,通过迁移学习后,改进模型的识别准确率和F1值分别达到97.12%和97.04%,参数量和耗时仅为2.99×106和0.91s,明显优于其他模型。本文提出的CA-MobileNetV3水稻病害识别模型能够有效识别水稻叶部病害,实现了轻量级、高性能、易部署的水稻病害分类识别算法。  相似文献   

10.
基于多层EESP深度学习模型的农作物病虫害识别方法   总被引:3,自引:0,他引:3  
为了提取图像高层语义特征、解决各种植物病虫害图像尺寸不相同的问题,提出了多层次增强高效空间金字塔(Extremely efficient spatial pyramid,EESP)卷积深度学习模型。首先,对图像进行预处理;其次,构建多层融合EESP网络模型,该模型通过对每层设置不同的空洞率进行空洞卷积,选择性地提取不同层次的特征信息,通过融合各层信息获得各种农作物病虫害图像的不同特征;最后,通过Softmax分类方法实现农作物病虫害识别。数据集包括10种农作物的61种病虫害类别,迭代训练300次,得到本文方法 Top1分类准确率最高达到了88.4%,且采用三阶EESP模型达到了最佳效果。  相似文献   

11.
为实现对柑橘叶片病虫药害种类的快速精准识别,针对多种类柑橘病叶设计一种融合注意力机制(Attention mechanism)的双向门控循环单元-循环神经网络(Attention-bidirectional gate recurrent unit-recurrent nural network, Att-BiGRU-RNN)分类模型。该模型在编解码模块分别采用BiGRU和RNN结构,能够利用高光谱数据前后波段光谱信息的关联性,有效提取光谱信息的深层特征;根据不同波段光谱信息的差异性引入注意力机制动态分配权重信息,提高重要光谱特征对分类模型的贡献率,提升模型的分类准确率。获取6类柑橘叶片高光谱信息,构建实验样本集,利用Att-BiGRU-RNN、VGG16、SVM和XGBoost分别建立柑橘病叶分类模型,Att-BiGRU-RNN模型总体分类准确率(Overall accuracy, OA)平均可达98.21%,相较于其他3种模型分别提高4.71、10.95、3.89个百分点,对光谱曲线重合度高的除草剂危害和煤烟病叶片的分类准确率有显著提升。实验结果表明,深度学习方法可有效利用高光谱不同...  相似文献   

12.
当前农业实体识别标注数据稀缺,部分公开的农业实体识别模型依赖手工特征,实体识别精度低。虽然有的农业实体识别模型基于深度学习方法,实体识别效果有所提高,但是存在模型推理延迟高、参数量大等问题。本研究提出了一种基于知识蒸馏的农业实体识别方法。首先,利用互联网的海量农业数据构建农业知识图谱,在此基础上通过远程监督得到弱标注语料。其次,针对实体识别的特点,提出基于注意力的BERT层融合模型(BERT-ALA),融合不同层次的语义特征;结合双向长短期记忆网络(BiLSTM)和条件随机场CRF,得到BERT-ALA+BiLSTM+CRF模型作为教师模型。最后,用BiLSTM+CRF模型作为学生模型蒸馏教师模型,保证模型预测耗时和参数量符合线上服务要求。在本研究构建的农业实体识别数据集以及两个公开数据集上进行实验,结果显示,BERT-ALA+BiLSTM+CRF模型的macro-F1相对于基线模型BERT+ BiLSTM+CRF平均提高1%。蒸馏得到的学生模型BiLSTM+CRF的macro-F1相对于原始数据训练的模型平均提高3.3%,预测耗时降低了33%,存储空间降低98%。试验结果验证了基于注意力机制的BERT层融合模型以及知识蒸馏在农业实体识别方面具有有效性。  相似文献   

13.
为解决文本特征提取不准确和因网络层次加深而导致模型分类性能变差等问题,提出基于深度卷积神经网络的水稻知识文本分类方法。针对水稻知识文本的特点,采用Word2Vec方法进行文本向量化处理,并与OneHot、TF-IDF和Hashing方法进行对比分析,得出Word2Vec方法具有较高的分类精度,正确率为86.44%,能够有效解决文本向量表示稀疏和信息不完整等问题。通过调整残差网络(Residual network,Res Net)结构,分析残差模块结构和网络层次对分类网络的影响,构建了9种分类网络结构,测试结果表明,具有4层残差模块结构的网络具有较好的特征提取精度,Top-1准确率为99.79%。采用优选出的4层残差模块结构作为基本结构,使用胶囊网络(Capsule network,Caps Net)替代其池化层,设计了水稻知识文本分类模型。与Fast Text、Bi LSTM、Atten-Bi GRU、RCNN、DPCNN和Text CNN等6种文本分类模型的对比分析表明,本文设计的文本分类模型能够较好地对不同样本量和不同复杂程度的水稻知识文本进行精准分类,模型的精准率、召回率和F1值分别不小于95.17%、95.83%和95.50%,正确率为98.62%。本文模型能够实现准确、高效的水稻知识文本分类,满足实际应用需求。  相似文献   

14.
张家瑜  朱锐  邱威  陈坤杰 《农业机械学报》2024,55(5):254-262,272
为了实现在复杂非结构环境下对木薯叶4种主要病害的高精度检测,提出一种基于选择性注意力机制的木薯叶病害神经网络检测改进算法MAISNet (Multiattention IBN Squareplus neural network)。以V2-ResNet-101为基础网络,先使用多重注意力算法优化加权系数,调整特征通道的语义表达,在特征图中初步构建显著性特征;然后在残差单元之后采用实例批归一化方法来抑制特征表达中的协变量偏移,在特征图中构建出显著性语义特征,实现高质量语义特征表达;最后在残差分支中采用Squareplus激活函数替代ReLU激活函数,保持语义特征在负数域的数值分布,减少特征拟合过程中的截断误差。对比试验结果显示,经过上述改进后构建出的MAISNet-101神经网络,对4种常见木薯叶病害检测的平均准确率达到95.39%,明显优于目前主流算法EfficientNet-B5和RepVGG-B3g4等。网络提取特征的可视化分析结果表明,高质量木薯叶病害显著性语义特征,是提高木薯叶病害检测准确率的关键。所提出的MAISNet神经网络模型可以完成实际场景下木薯叶病害高精度检测。  相似文献   

15.
月季病虫害严重影响月季产量和观赏性,将目标检测算法应用到月季病虫害检测中有利于提高月季病虫害检测效率,对实现月季智能化种植培育起到重要支撑作用。针对实际种植场景中复杂背景对病虫害检测的影响,以及病虫害形状大小特点,提出两阶段月季病虫害检测方法TSDDP,首先添加调优后的Inception模块改进YOLOv3模型特征提取与融合能力对自然环境下拍摄的月季多叶片图像进行叶片检测,去除复杂背景中存在的影响因素,然后通过K-means聚类Anchor box优化Faster R-CNN以满足月季病虫害目标检测需求,基于叶片检测结果对叶片病虫害进行检测。通过比较YOLOv3、Faster R-CNN和TSDDP对自然环境下的月季多叶片病虫害检测效果,试验结果表明TSDDP的检测精度和定位准确度均高于其他算法,最终病虫害平均检测精度达到82.26%,有效减少复杂背景造成误检的同时改善小尺度病虫害的检测和定位效果。  相似文献   

16.
为实时准确地检测到自然环境下背景复杂的荔枝病虫害,本研究构建荔枝病虫害图像数据集并提出荔枝病虫害检测模型以提供诊断防治。以YOLO v4为基础,使用更轻、更快的轻量化网络GhostNet作为主干网络提取特征,并结合GhostNet中的核心设计引入更低成本的卷积Ghost Module代替颈部结构中的传统卷积,得到轻量化后的YOLO v4-G模型。在此基础上使用新特征融合方法和注意力机制CBAM对YOLO v4-G进行改进,在不失检测速度和模型轻量化程度的情况下提高检测精度,提出YOLO v4-GCF荔枝病虫害检测模型。构建的数据集包含荔枝病虫害图像3725幅,其中病害种类包括煤烟病、炭疽病和藻斑病3种,虫害种类包括毛毡病和叶瘿蚊2种。试验结果表明,基于YOLO v4-GCF的荔枝病虫害检测模型,对于5种病虫害目标在训练集、验证集和测试集上的平均精度分别为95.31%、90.42%和89.76%,单幅图像检测用时0.1671s,模型内存占用量为39.574MB,相比改进前的YOLO v4模型缩小84%,检测速度提升38%,在测试集中检测平均精度提升4.13个百分点,同时平均精度比常用模型YOLO v4-tiny、EfficientDet-d2和Faster R-CNN分别高17.67、12.78、25.94个百分点。所提出的YOLO v4-GCF荔枝病虫害检测模型能够有效抑制复杂背景的干扰,准确且快速检测图像中荔枝病虫害目标,可为自然环境下复杂、非结构背景的农作物病虫害实时检测研究提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号