首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
[目的/意义]开展面向数字人文的古籍触发动词识别及分类研究,对于古籍文本的深层次挖掘和内容揭示具有重大的意义。本文利用深度学习分类算法,探索依据古籍触发词进行事件句文本多元分类的自动化方法。[方法/过程]在构建了典籍事件触发词分类体系和触发词典的基础上,选取4个不同类别的事件句文本作为实验数据,利用Onehot和Tokenizer对类别标签和句子文本进行分别编码后,输入Bi-LSTM模型中训练分类器,并通过调整参数设置了对比实验,采取通用的评价指标分析了分类器的性能。[结果/结论]经过多次训练和调整之后得到的分类器,在测试集的评估中精确度达到了0.95,证明基于深度学习的实验方法和构建的触发词数据集能够有效的帮助我们实现古籍事件句文本的自动化多元分类。  相似文献   

2.
提出一种基于训练集分解的不平衡分类算法,该算法使用能输出后验概率的支持向量机作为分类器,使用基于测度层次信息源合并规则实现分类器的集成.在4个不同领域的不平衡数据集上的仿真实验表明:该算法有效提高分类器对正类样本的正确率,同时尽量减少对负类样本的误判.实验结果验证集成学习算法处理不平衡分类问题的有效性.  相似文献   

3.
植物病害影响农业生产的产量和质量。针对现有小样本植物病害识别方法大多数都是基于监督式学习模型以及少数半监督学习方法未判别伪标注样本的可信度的问题,提出一种基于实例置信度推断的半监督学习小样本植物病害图像识别方法。首先构建ResNet-12网络提取有标注样本和无标注样本的特征;其次利用极少数有标签的植物病害样本训练SVM分类器,用分类器推断无标注样本的类别并赋予伪标签;然后采用实例置信度推断(ICI)算法获取伪标注样本的置信度,迭代选择可信的伪标签样本加入训练拓展支持集;最后应用训练后的网络模型对植物病害图像进行识别。该方法能够反映无标注病害样本的真实分布,迭代选择最可信的伪标注样本进行模型训练,从而提高模型的识别性能。试验采用Plant Village公开数据集进行10-way-5-shot试验。结果显示:在unlabel=50的情况下识别准确率为89.34%,病害的各项评价指标均随着无标注样本数量的增加而增加。结果表明本研究提出的方法从无标注样本中获取到的信息是鲁棒的,且识别准确率优于传统迁移学习,能有效提升小样本条件下植物病害图像的识别效果。  相似文献   

4.
传统的基于支持向量机的单类分类器因计算复杂度高而无法满足大规模数据实时处理的需求,在线学习方法为解决该问题提供了一种有效途径.本文在挖掘样本数据在特征空间分布性状的基础上,提出了一种基于凸壳的在线单类学习机(One-class Online Classifier based on Convex Hull,OOCCH).该方法首先使用凸壳的定义选择能代表特征空间中数据分布的凸壳向量对应的原始样本作为训练样本来缩减训练集的规模;其次在分类器在线更新阶段利用凸壳向量动态地调整分类器的训练样本.理论分析证明了OOCCH的有效性,与现有的在线单类分类器的实验比较,OOCCH在训练时间和分类性能方面有显著优势.  相似文献   

5.
提出了基于Bayes(贝叶斯)与SVM(支持向量机)的玉米彩色图像分割新算法.统计原始RGB图像中的玉米和土壤背景的均值向量和协方差矩阵,利用正态分布的Bayes分类器计算每个像素的目标和背景的判别函数值,用训练好的SVM对判别函数值进行分类,实现彩色图像分割.Matlab试验结果表明,该方法能够实现高光强下彩色图像分割,平均错分率为9.1%,平均漏分率为12.0%,平均相似度为80.8%.  相似文献   

6.
在训练样本中,某些类与其他类的一些样本混杂或距离很近,后者被称为边界异类。此时,类中心离边界异类也近,从而影响最小类中心分类器的识别率。基于大间距思想,提出了一种新的分类算法,旨在改进最小类中心分类器。新分类算法为每类求解一个虚拟样本,使其尽可能排斥异类样本,并让每类虚拟样本取代该类中心点做分类。与类中心相比,虚拟样本离边界异类更远,因此增强了分类的可靠性。在CENPARMI手写阿拉伯数字库和Yale B人脸数据库上的实验表明,新分类算法的分类效果优于最小类中心分类器。  相似文献   

7.
针对水稻种子相似度高、识别困难等问题,提出一种线性判别分析(Linear discriminant analysis,LDA)和贝叶斯分类(Bayes)相结合的分类识别方法,以提高水稻种子分类识别速度和识别准确率.通过对4类水稻种子(楚粳7号、马坝油粘、玉杨糯、玉针香)的图像进行裁剪和分割等预处理操作,提取出水稻种子图像的颜色特征、几何特征和纹理特征.利用线性判别分析、主成分分析、因子分析和局部线性嵌入对特征数据进行分析降维,并分别选择Bayes、K-邻近、支持向量机、多层感知机分类器对原始特征数据和降维数据进行分类识别研究.为提高模型泛化能力,通过图像增强技术对稻种原始数据集进行样本扩充,利用图像增强技术模拟多种环境对水稻种子图片数据集进行增强处理,结果显示,基于数据增强后的LDA Bayes模型运行时间为0.019 s,识别准确率为99.4%.与其他模型比较,该模型具有更强的鲁棒性和适用性,能高效地分类识别不同环境下的水稻种子,可为水稻种子分类识别提供一种新方法.  相似文献   

8.
改进了面向分类数据的重叠子空间聚类算法(ROCAT),提出了面向分类数据的重叠子空间聚类算法(SCCAT).利用数据凝聚力模型(DCC)代替ROCAT的数据压缩模型以提高算法精度;将源数据集分为样本内数据集和样本外数据集,采取对样本内数据聚类,对样本外数据分类的方法完成聚类来降低算法复杂度.实验结果表明SCCAT在提高算法精度的同时,也降低了算法的时间复杂度和空间复杂度,适用于大规模数据的处理.  相似文献   

9.
针对烟草化学成分与烟草品质之间难以建立确定的数学模型的问题,提出了一种基于改进模糊聚类的烟草品质评价方法。该方法以烟叶样品的化学成分的差异性为依据,以模型分类结果与专家评吸结果的一致性为目标,利用模拟退火算法对现有的模糊聚类算法进行优化改进,建立基分类器;在此基础上,利用Ada Boost将基分类器对于不同样本集的多个分类结果进行集成,形成最终的烟草品质评价模型。以130组烟叶作为烟草样本,测定了各烟叶样品中总糖、还原糖、总氮、烟碱、氧化钾、氯离子、蛋白质7种化学成分含量,并采用改进的模糊聚类方法与神经网络算法、模糊聚类算法进行对比试验,该方法的误检率为6.7%,具有提升小样本数据的辨识能力,优于所比较的其他2种方法。  相似文献   

10.
把图像的自动标注过程转化为图像分类的过程,首先按照视觉特征对图像进行分割,提取训练图像每个区域的底层特征信息,构成训练集;然后采用AdaBoost集成分类算法,建立相应特征区域与类标签值的对应关系;再利用训练集中的分类模型对待标注区域进行分类,得到各个区域的类标签值,实现图像的自动标注.基于Corel-5k数据集的实验表明,相比其它经典算法,AdaBoost集成算法提高了运算速度,且能保持稳定的分类精度,在图像标注方面有良好的应用.  相似文献   

11.
模糊分类是近年来在遥感影像分类中引入的一种新的研究方法,是一种针对不确定性事物的分析方法。它以模糊集合论作为基础,运用数学模型计算它对于所有集合的隶属度,然后根据隶属度的大小,确定归属。笔者把“模糊分类”方法运用于吉林省白山市八道江区土地利用/覆盖变更调查中,从试验结果发现“模糊分类”在复杂地块影像分类中较传统的贝叶斯分类有更好的分类结果。  相似文献   

12.
在对面向对象遥感分类方法的基本原理与基本算法阐述的基础上,以山东省微山湖湿地植被分类为实验区数据,进行湿地植被分类训练和精度评定。结果表明,实验区居民区、水域、陆生植被、水生植被的面向对象的分类精度分别为:92.81%、93.78%、96.29%、95.38%,明显高于监督分类的分类精度92.13%、88.36%、89.24%、86.55%,充分展示出在湿地植被分类中面向对象遥感分类的优势。  相似文献   

13.
Moshou  D.  Ramon  H.  De Baerdemaeker  J. 《Precision Agriculture》2002,3(3):209-223
A new neural network architecture for classification purposes is proposed. The Self-Organizing Map (SOM) neural network is used in a supervised way for a classification task. The neurons of the SOM become associated with local linear mappings (LLM). Error information obtained during training is used in a novel learning algorithm to train the classifier. The proposed method achieves fast convergence and good generalization. The classification method is then applied in a precision farming application, the classification of crops and different kinds of weeds by using spectral reflectance measurements. The classification performance of the proposed method is proven superior compared to other neural classifiers. Also, the proposed method compares favorably with the results obtained by using an optimal Bayesian classifier.  相似文献   

14.
基于Google Earth的ETM~+遥感图像自动分类方法   总被引:1,自引:0,他引:1  
为了快速准确识别地物、设计野外路线并减少踏勘后对前期解译工作的修改,本文参考Google Earth软件提供的高分辨率遥感图像,利用ETM+解译生成训练样本,然后采用最大似然监督分类算法进行ETM+图像分类。结果表明:与非监督分类和非监督-监督混合分类方法相比,基于Google Earth高分辨率遥感图像的ETM最大似然监督分类方法效果好、精度高,是一种经济、高效的技术手段,可用于初步识别地物分布情况、设计野外路线和勘查点等工作,对野外工作具有一定的指导意义;不同融合方式、不同波段组合的图像分类结果明显不同,该区域ETM+图像R(5)G(4)B(3)波段组合、PCA融合图像的分类总精度最好。  相似文献   

15.
本模糊支持向量分类机的构建特点是,训练点输出的类型和最终的模糊分类函数的函数值均为反映其模糊类别的实数。以模糊系数规划为基础,将模糊分类问题转化为求解模糊系数规划问题,求出模糊系数规划的γ-最优规划,据此给出模糊支持向量分类机(算法);用2个例子说明该算法的合理性;最后给出模糊支持向量分类机中最佳阈值的确定方法。  相似文献   

16.
提出了一种基于禁忌搜索的模糊神经网络分类器设计算法.该方法首先从训练样本中自动获取分类规则,构成模糊神经网络的初始网络结构,然后采用基于禁忌搜索和梯度下降法的混合算法同时优化模糊神经网络的结构和参数.使用IRIS数据集对所提出的方法进行性能测试,结果表明该方法能使用较少的分类规则获得很好的分类效果.  相似文献   

17.
[目的/意义]当前农业新闻分类研究中的模型训练以被动学习方式居多,普遍存在数据无法即时标注及标注成本过高的问题,对农业新闻分析工作也造成了一定阻碍。为解决该问题,运用主动学习或者深度主动学习技术从未标注数据中选择更有价值和代表性的数据进行人工标注并构建标注数据集,提升农业新闻挖掘工作效率和效果。[方法/过程]将文本分类常用的机器学习模型结合主动学习方法分析提升效果,以及使用BERT模型结合3种采样策略进行深度主动学习训练,在共19 847条样本的新闻爬虫语料上以筛选出农业相关新闻为目标,通过每轮增加30个样本标注的迭代实验进行测试。[结果/结论]实验结果表明:主动学习方法的应用对各个模型的训练过程均有明显提升。其中BERT模型配合判别性主动学习采样函数,具有最优的新闻文本分类效果和最低的标注数据需求。  相似文献   

18.
施明登  周鹏  白铁成 《安徽农业科学》2014,(29):10381-10383
针对干果图像信息量大、分类精度低和耗时多的特点,提出利用Bag of Words模型提取图片的代表特征,并采用朴素贝叶斯分类器指导特征矩阵分类。结果表明,图像分类精度能达到80%,分类处理时间约为2 s。通过增加学习样本来进一步提高分类精度,将Bag of Words应用于干果图像识别和分类是可行的。  相似文献   

19.
在新经济时代的今天 ,文献信息资源浩如烟海 ,如何对其进行更加合理、科学的分类加工 ,是图书馆界的重要课题。文章概述了现代文献资料的特点 ,从理论上阐述现代文献信息场中图书分类的目的、原则和分编人员的素质要求 ,重点揭示了文献编目的发展趋势  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号