首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
2.
基于注意力机制的农业文本命名实体识别   总被引:4,自引:0,他引:4  
针对农业智能问答系统构建过程中传统的农业命名实体识别方法依赖人工特征模板、特征信息提取不充分、实体名称多样导致标注不一致等问题,提出一种基于注意力机制的农业文本命名实体识别方法。采用连续词袋模型(Continuous bag of words,CBOW)对输入字向量进行预训练,丰富字向量特征信息,缓解分词准确度对性能的影响;引入文档级的注意力(Attention)机制,获取实体间相似信息,保证实体在不同语境下的标签一致性;基于双向长短期记忆网络(Bi-directional long-short term memory,BiLSTM)和条件随机场(Conditional random field,CRF)模型,构建适合农业领域实体识别的模型框架。选取4604篇农业文本,针对病害、虫害、农药、农作物品种4类实体进行了识别实验。结果表明,模型能有效地辨别农业文本中的实体,缓解实体标记不一致的问题,在农业语料上达到了较好的结果,识别的准确率、召回率、F值分别为93.48%、90.60%、92.01%。与其他3种识别方法相比,模型在不同规模语料库的准确率均有一定提高,具有明显的性能优势。  相似文献   

3.
随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针对中文农作物病虫害数据集缺失问题,提出了基于半远程监督的停等算法,利用该算法构建中文农作物病虫害领域语料库,大幅度减少标注过程的人工成本和时间成本;同时,提出了中文农作物病虫害命名实体识别模型(Agricultural information extraction, Agr-IE),该模型基于BERT-BILSTM-CRF,辅以多源信息融合(多源分词信息和全局词汇嵌入信息)丰富字符向量,使其充分结合字符级与词汇级的信息,以提高模型捕捉上下文信息的能力。实验表明,该模型可以有效地识别病害、虫害、药剂、作物等实体,F1值分别为96.56%、95.12%、94.48%、95.54%,并对识别难度较大的病原实体具有较好的识别效果,F1值为81.48%,高于BERT-BILSTM-CRF、BERT等模型的相应值。本文所提模型在MSRA和Weibo等其他领域数据集上与CAN-NER、Lattice-LSTM-CRF等模型进行了对比实验,并取得最佳的识别效果,F1值分别为95.80%、94.57%,表明该算法具有一定的泛化能力。  相似文献   

4.
针对玉米育种文本数据中存在重叠三元组、实体表达方式多样等问题,提出一种嵌入词汇信息的BERT-CRF(Bidirectional encoder representations from transformers-conditional random field)玉米育种实体关系联合抽取方法。首先,分析了玉米育种语料表达特征,采用对实体边界、关系类别和实体位置信息同步标注的策略;其次,构建了嵌入词汇信息的BERT-CRF模型进行训练和预测,自建玉米育种知识词典,通过在BERT中嵌入词汇信息,融合字符特征和词汇特征,增强模型的语义能力,利用CRF模型输出全局最优标签序列,设计了实体关系三元组匹配算法(Entity and relation triple matching algorithm, ERTM),将标签进行匹配和映射来获取三元组;最后,为验证该方法的有效性,在玉米育种数据集上进行实验,结果表明,本文模型精确率、召回率和F1值分别为91.84%、95.84%、93.80%,与现有模型相比性能均有提升。说明该方法能够有效抽取玉米育种领域知识,为构建玉米育种知识图谱及其它下游任务提供数...  相似文献   

5.
[目的/意义]针对实体嵌套、实体类型混淆等问题导致的农业病害命名实体识别(Named Entities Recognition,NER)准确率不高的情况,以PointerNet为基准模型,提出一种基于RoFormer预训练模型的指针网络农业病害NER方法RoFormer-PointerNet。[方法]采用RoFormer预训练模型对输入的文本进行向量化,利用其独特的旋转位置嵌入方法来捕捉位置信息,丰富字词特征信息,从而解决一词多义导致的类型易混淆的问题。使用指针网络进行解码,利用指针网络的首尾指针标注方式抽取句子中的所有实体,首尾指针标注方式可以解决实体抽取中存在的嵌套问题。[结果和讨论]自建农业病害数据集,数据集中包含2 867条标注语料,共10 282个实体。为验证RoFormer预训练模型在实体抽取上的优越性,采用Word2Vec、BERT、RoBERTa等多种向量化模型进行对比试验,RoFormer-PointerNet与其他模型相比,模型精确率、召回率、F1值均为最优,分别为87.49%,85.76%和86.62%。为验证RoFormer-Pointer...  相似文献   

6.
针对农业领域问答系统面临的实体识别困难的问题,提出一种基于改进Bi-LSTM-CRF的实体识别方法。首先通过BERT预训练模型的预处理,生成基于上下文信息的词向量,然后将训练出的词向量输入Bi-LSTM-CRF做进一步的训练处理,最后,利用Python的Django框架设计农业领域的实体识别、实体查询、农知问答等子系统。经过试验对比,所提出的改进的Bi-LSTM-CRF在农业信息领域具有更好的实体识别能力,在农业信息语料库上的精确率、召回率和F1值分别为93.23%、91.08%和92.16%。实现农业领域实体识别和农业信息问答的知识图谱网站演示,对农业信息化的发展具有重要意义。  相似文献   

7.
基于部首嵌入和注意力机制的病虫害命名实体识别   总被引:1,自引:0,他引:1  
郭旭超  唐詹  刁磊  周晗  李林 《农业机械学报》2020,51(S2):335-343
为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricultural diseases and pests named entity recognition with joint radical embedding and self attention, RS-ADP)。首先,该模型将部首嵌入集成到字符嵌入中作为输入,用以丰富语义信息。其中,针对部首嵌入设计了3种特征提取策略,即卷积神经网络(Convolutional neural network, CNN)、双向长短时记忆网络(Bidirectional long short term memory network, BiLSTM) 和CNN-BiLSTM;其次,采用多层不同窗口尺寸的CNNs层提取不同尺度的局部上下文信息;然后,在BiLSTM提取全局序列特征的基础上,采用自注意力机制进一步增强模型提取更长距离依赖的能力;最后,采用条件随机场(Conditional random field, CRF)联合识别实体边界和划分实体类别。在包含11个类别和24715条标注样本的农业病虫害自制语料上进行了实验。结果表明,本文模型RS-ADP在该数据集上精确率、召回率和F1值分别为94.16%、94.47%和94.32%;在具体实体类别上,RS-ADP在作物、病害、虫害等易识别实体上F1值高达95.81%、97.76%和97.23%。同时,RS-ADP在草害、病原等难以识别实体上F1值仍保持86%以上。实验结果表明,本文所提模型能够有效识别农业病虫害命名实体,其识别精度优于其他模型,且具有一定的泛化性。  相似文献   

8.
基于卷积模型的农业问答语性特征抽取分析   总被引:1,自引:0,他引:1  
互联网农技推广社区每秒增衍问答数据近万组,这些海量数据具有隐性的词性、情感和冗余向量特征,实现数据聚合与数据块消减是该领域的难题。提出了一种基于卷积神经网络的农业问答情感极性特征抽取分析模型,结合农业分词字典,对数据集进行分词后使用Skip-gram模型转换为256维的词向量,利用批规范后的卷积神经网络对数据集进行训练,从而得到用于识别农技推广社区问答词性情感相似性的神经网络模型参数。试验结果表明,该方法能够准确识别测试样例集中的冗余队列,与其他5种文本分类方法进行比较,各项指标优势明显,针对测试集的语性特征抽取准确率达到82.7%。  相似文献   

9.
随着信息化技术的快速发展,农户通过线上智能农业问答系统解决线下农业病虫害问题已成为趋势。问句分类在问答系统中发挥着至关重要的作用,其准确性直接决定了最终返回答案的正确性。传统的单标签文本分类模型难以直接准确捕捉到农业病虫害问句的确切意图,而且由于缺乏大规模公开的农业病虫害问句语料,使得现有研究具有一定的难度。为此,本文基于树状结构构建了一个农业病虫害问句层级分类体系,由问句模糊性向精确性逐层细化分类,旨在克服农业问句的语义复杂性;此外,引入对抗训练方法,通过构建对抗样本并将其与原始样本一同用于大规模语言模型的训练,以提高模型泛化能力,同时缓解了因语料不足而产生的问题。通过对真实问答语料库的实验验证,本文提出的方法能够提升农业病虫害问句的分类性能,可为农业病虫害自动问答系统提供有效的问句意图识别。  相似文献   

10.
针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注意力(Multiple self-attention mechanisms,MHA)调整词集中不同词的权重;同时使用注意力机制忽略不可靠的词集,将注意力集中在重要的词集上,从而提高实体识别效果;在字符级别上,引入无监督的基于转换器的双向编码表征(Bidirectional encoder representations form transformers,BERT)预训练模型增强字的语义表示。在包含12477条标注样本和7个类别实体的猕猴桃种植领域自制语料上进行了实验,结果表明,本文模型与SoftLexicon模型相比,F1值提高1.58个百分点。此外,本文模型在公开数据集ResumeNER上与Lattice-LSTM、WC-LSTM等模型进行实验对比取得了最佳效果,F1值达到96.17%,表明本文模型具有一定的泛化能力。  相似文献   

11.
Overland water and salt flows in a set of rice paddies   总被引:1,自引:0,他引:1  
Cultivation of paddy rice in semiarid areas of the world faces problems related to water scarcity. This paper aims at characterizing water use in a set of paddies located in the central Ebro basin of Spain using experimentation and computer simulation. A commercial field with six interconnected paddies, with a total area of 5.31 ha, was instrumented to measure discharge and water quality at the inflow and at the runoff outlet. The soil was classified as a Typic Calcixerept, and was characterized by a mild salinity (2.5 dS m−1) and an infiltration rate of 5.8 mm day−1. The evolution of flow depth at all paddies was recorded. Data from the 2002 rice-growing season was elaborated using a mass balance approach to estimate the infiltration rate and the evolution of discharge between paddies. Seasonal crop evapotranspiration, estimated with the surface renewal method, was 731 mm (5.1 mm day−1), very similar to that of other summer cereals grown in the area, like corn. The irrigation input was 1874 mm, deep percolation was 830 mm and surface runoff was 372 mm. Irrigation efficiency was estimated as 41%. The quality of surface runoff water was slightly degraded due to evapoconcentration and to the contact with the soil. During the period 2001–2003, the electrical conductivity of surface runoff water was 54% higher than that of irrigation water. However, the runoff water was suitable for irrigation. A mechanistic mass balance model of inter-paddy water flow permitted to conclude that improvements in irrigation efficiency cannot be easily obtained in the experimental conditions. Since deep percolation losses more than double surface runoff losses, a reduction in irrigation discharge would not have much room for efficiency improvement. Simulations also showed that rice irrigation performance was not negatively affected by the fluctuating inflow hydrograph. These hydrographs are typical of turnouts located at the tail end of tertiary irrigation ditches. In fact, these are the sites where rice has been historically cultivated in the study area, since local soils are often saline-sodic and can only grow paddy rice taking advantage of the low salinity of the irrigation water. The low infiltration rate characteristic of these saline-sodic soils (an experimental value of 3.2 mm day−1 was obtained) combined with a reduced irrigation discharge resulted in a simulated irrigation efficiency of 60%. Paddy rice irrigation efficiency can attain reasonable values in the local saline-sodic soils, where the infiltration rate is clearly smaller than the average daily rice evapotranspiration.  相似文献   

12.
车用发动机润滑油失效规律与更换周期研究   总被引:7,自引:0,他引:7  
研究在正常使用条件下10W/30-QC级润滑油用于某型车用发动机时所表现的失效规律,确认期服从两参数Weibull分布,并给出分布的尺度参数η和形状参数m之最佳线性无偏估计(BLUE)同时,还为定量分析,计算车用发动机润滑油的使用可靠性和合理确定其更换周期提供了一套可供借鉴的方法,并给出了具体的计算实例。  相似文献   

13.
论述了我国农村剩余劳动力就业的意义,并针对我国农村剩余劳动力的现状,提出多渠道促进农村剩余劳动力就业的途径和办法。  相似文献   

14.
乡(镇)农技推广体系是农业发展的关键。介绍朝阳市农业技术推广体系的现状,针对目前体制及运行机制、服务手段等方面存在的问题,提出适合朝阳市乡(镇)农技推广体系改革与发展的对策,以期对全省农技推广体系改革和发展起到一些借鉴作用。  相似文献   

15.
草莓果味酸甜爽口,营养价值高,为人们所喜爱的应市鲜果之一。由于草莓易受损伤和微生物侵染,因此其采收、贮藏过程极为重要。介绍草莓采收过程中的注意事项以及11种贮藏保鲜技术的实施步骤和操作方法,推介9种加工方式,为草莓产业化提供技术支持。  相似文献   

16.
瓦房店市是我国重要的水果生产基地,在国内水果生产领域占有重要地位。随着水果市场化的不断深入,如何满足和适应国内外市场需求成为瓦房店市水果生产的关键问题。从瓦房店市水果生产实际出发,阐述了实施水果生产标准化的必要性,提出了发展水果生产标准化的具体措施。  相似文献   

17.
对引进的谷子新品种金谷子耐旱TG118进行品种比较试验和多点试种。结果表明:该品种抗旱、耐瘠、适应性强,稳产、高产、抗病抗风抗倒伏强,品质优良,粮草兼用,种植简单,省工易管;一般产量在6000kg/hm2以上,比当地主栽品种增产20%以上。最高产量达9450kg/hm2,适于在辽西北地区推广应用。  相似文献   

18.
对《种子法》存在问题的探讨   总被引:1,自引:0,他引:1  
《种子法》是我国种植业第一部法律。自实施以来,为依法加强种子管理提供了有力的法律支撑,促进我国种子产业发生翻天覆地的变化。但随着依法管理工作的深入和种子产业的快速发展,《种子法》及配套规章的一些问题逐步显现出来。对《种子法》及配套规章存在的问题进行深入分析,对需要进一步补充的章节以及需要调整的内容进行深入探讨,以求更加完善和明确。  相似文献   

19.
赵异 《湖南农机》2007,(3):31-32
在新世纪,面对机遇和挑战,党的十六大把“社会更加和谐”作为全面建设更高水平的小康社会的一个重要目标。中国人素有社会和谐的理想;西方人自古也向往社会和谐;借鉴东西方两种和谐社会思想的经验、教训,构建社会主义和谐社会理论。  相似文献   

20.
About 30 years have passed since the Government of Egypt embarked on implementing a series of large scale drainage projects. At present, about 3.8 million acres have been provided with drainage systems on the basis of systematic pre-drainage investigations and designs. The target is to provide drains in approximately 6.4 million acres in the Nile Valley and Delta.The implementation of the subsurface drainage system is carried out by the public sector and private contractors under direct supervision of governmental regional departments. The implementation process depends on many factors related to the drainage material, machinery, manpower, site requirements, farmers and organizations involved. Problems and constraints are sometimes challenging, however, the annual rate of implementation has gradually increased to 170,000 acre/year.This paper discusses the different aspects involved in the implementation process of drainage systems. The development in materials, machinery and construction technologies will be reviewed. Institutional and management factors are going to be also considered.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号