首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
大量的商业、色情和反动垃圾邮件和邮件病毒的泛滥给互联网用户带来很多烦恼和侵害,也给社会带来了极大的负面影响,邮件系统的安全问题引起业界的重点关注。作者提出了一种基于规则方法和基于统计方法相结合的中文垃圾邮件过滤方案,通过机器学习解决了邮件训练集和中文过滤规则的自动更新问题,并利用Linux下的多种开源软件,设计与实现了一款基于Linux的中文垃圾邮件过滤系统。  相似文献   

2.
英文垃圾邮件过滤效果良好的开源软件Spam Assassin,在Windows下的应用研究较少。在Windows下安装配置Spa-m Assassin,针对中文邮件添加规则与学习贝叶斯库,基于真实邮件测试,取得了良好过滤效果。  相似文献   

3.
分析了贝叶斯垃圾邮件过滤器的工作原理、分词、特征提取等相关技术,研究了Java Mail以及邮件相关标准和协议,设计了基于贝叶斯的垃圾邮件过滤系统;实现了服务器端的训练集管理器和客户端的邮件分类器、简易的邮件收发系统三大功能模块;在对邮件的处理中增加了人工复检和特征串匹配降噪的二次处理来完善过滤系统。  相似文献   

4.
Spam Assassin作为LinuxVPS上拦击垃圾邮件的利器,一直广受用户的欢迎,但在Windows下以SpamAssassin和其它邮件服务器相结合,过滤垃圾邮件的应用较少。本文在Windows操作系统下,安装Spam Assassin for Windows作为服务,以Axigen作为MTA和Webmail,设计与实现了垃圾邮件过滤系统,并对中文垃圾邮件过滤提出改进方法,为中小企业提供了Windows下安全高效的电子邮件系统解决方案。  相似文献   

5.
为了改进已有邮件过滤算法的不足之处,提出一种新的邮件过滤算法。以往的大部分过滤算法采用的都是邮件属性精确匹配算法,并未使用模糊匹配思想,因此邮件的漏检率较高,并且发现未知邮件的效率较低。针对以往邮件过滤算法中漏检率比较高的不足之处,文中提出的邮件过滤算法的改进思路是:首先使用传统的黑白名单过滤技术对已知的邮件进行分类,那些是正常邮件,那些是垃圾邮件。在此基础之上使用相似性算法来计算未知邮件与已知邮件的相似度,从而达到对未知邮件分类目的,最后使用MMTD算法对的邮件相似度的好坏做出衡量,并且以此为邮件过滤提供有效的依据,经过以上的三个步骤之后,最后进行邮件的过滤。  相似文献   

6.
针对目前基于规则和基于统计的文本分类方法存在的不足,提出了一种新颖的基于规则和K-近邻分类相融合的文本分类方法。首先,对描述文本特征的传统向量空间模型进行了扩充,给出了具体的扩展模型。然后,基于扩展模型提出了一种规则的表示方法,并为每一条规则赋予了一个强弱系数,根据这个系数可以对识别的文本按级别排序。最后,通过设定一个阀值,将级别低于阀值的文本过滤掉。该方法可有效地排除被K-近邻分类误识别的那些文本,从而在一定程度上提高了分类的正确率。通过小数据集测试实验结果表明,该方法是有效的、可行的。  相似文献   

7.
Windows操作系统下的邮件服务器由于其配置简单、功能完善的特点而拥有大量的用户。本系统基于开源软件hMailServer搭建邮件服务器,配置Foxmai提供webmail功能,安装配置SpamAssassin完成垃圾邮件过滤。在Windows操作系统下搭建了具有垃圾邮件过滤功能的页面电子邮件服务器,为中小企业提供了方便高效的选择。  相似文献   

8.
KNN和SVM算法在中文文本自动分类技术上的比较研究   总被引:3,自引:0,他引:3  
中文文本分类技术在中文信息智能处理方面具有十分重要的作用,比如:中文信息检索和搜索引擎等,KNN、贝叶斯、SVM等算法都可以应用到中文文本分类技术上,本研究分析和比较了KNN和SVM两种分类算法,并通过实验比较这两种算法对中文文本分类技术的效果。结果表明:SVM算法较优,是一种较好的中文文本分类算法。  相似文献   

9.
垃圾邮件过滤技术概述   总被引:1,自引:0,他引:1  
概述了三代垃圾邮件过滤技术中的主要方法,通过对各种过滤技术原理的阐述与分析,总结了各种技术手段的优势与缺陷。提出将基于内容的垃圾邮件过滤技术与基于行为的垃圾邮件过滤技术进行结合,以解决单一技术及算法在具体应用中的局限性,从而达到更理想的过滤效果。  相似文献   

10.
电子邮件已成为因特网上最基本、最重要的应用之一。但利用电子邮件进行诈骗、反动宣传等犯罪现象也日益严重。因此采用研究中文电子邮件作者身份挖掘的方法,以识别邮件作者的真实身份,为计算机取证提供依据。通过分析邮件作者的语言特征、结构特征和格式特征,利用支持向量机算法,自动把邮件文档分类到预定的作者类别中,并对有限数据集的试验取得了满意的结果。  相似文献   

11.
针对垃圾短信过滤中的垃圾短信判别问题,对垃圾短信基于内容过滤识别算法中的Bayes分类方法进行了较深入的研究.经研究发现,把基于贝叶斯分类算法的垃圾短信识别过程移植到云计算平台上通过MapReduce编程模型来实现,把海量短信的过滤任务转移到可提供无限存储能力和处理能力的云端,利用云计算技术防范垃圾短信,从而实现对垃圾短信的智能、高效过滤.  相似文献   

12.
基于改进蚁群算法的分类规则挖掘   总被引:1,自引:0,他引:1  
数据分类是数据挖掘中的一个重要课题,研究各种高效的分类算法是数据挖掘的重要问题之一.本文将蚁群算法与分类规则抽取问题相结合,提出了一种基于蚁群算法的具有自适应和变异杂交特征的分类规则挖掘方法,自适应地调整信息素增量,在规则构造中进行杂交变异,有效地节省了计算时间,并优化了生成的分类规则.实验结果表明:该算法可以有效克服停滞,提高搜索效率,有效地挖掘出简洁分类规则.  相似文献   

13.
本文针对当前垃圾邮件泛滥的现状,分析了目前常用的反垃圾邮件技术取得的成果和不足之处,提出反垃圾邮件的策略和解决方法。  相似文献   

14.
一种基于粗糙集理论的特征选择方法   总被引:3,自引:3,他引:0  
目的 特征集中特征质量的好坏能够影响到文本分类的精度,所以选择一种好的特征选择方法对于文本分类的效果起着重要的作用.方法 粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具.提出了一种基于粗糙集的特征选择方法.结果 通过实验结果表明该方法利用粗糙集的约简理论降低了特征维数,同时保证了分类性能.使用该方法进行特征选择时比目前常用的特征选择方法获得较好的分类效果.结论 粗糙集的属性约简理论可以用在规则提取和特征选择上,利用粗糙集的属性约简理论进行特征选择时能够获得较理想的分类效果.  相似文献   

15.
采用推拉技术防止垃圾邮件的电子邮件服务器系统模型   总被引:3,自引:0,他引:3  
传统的电子邮件系统采用推技术,能够向客户机传送数据而无需客户机发出请求.而结合推拉技术的电子邮件系统邮件接收者必须发出请求,所需邮件才能被传送回来,从而防止垃圾邮件的出现.  相似文献   

16.
对SVM分类器进行了分析,提取了汉语动词短语的静态特征和动态特征,构造了动词短语的向量空间模型,提出了基于SVM的汉语动词短语分类算法.实验表明:与基于规则的分类方法比较,SVM方法大大减少分类器更新所需要的学习步骤和时间,是一种较好的分类算法.  相似文献   

17.
提出基于Apriori关联规则的大学语文阅读材料体裁分类方法,以便于大学语文阅读材料的检索。从大学语文阅读材料中初步提取符号、词性、词汇特征,通过分析各类特征的关联度、差异度,准确选择阅读材料特征,经极差正规化无量纲处理后,构建阅读材料体裁分类的样本数据,通过Predictive Apriori算法挖掘分类样本数据中特征与体裁类别间的强关联规则,并根据影响度指标值筛选强关联规则,选择其中全部正关联规则构建阅读材料体裁分类器,将待分类大学语文阅读材料特征作为体裁分类器的输入,通过关联规则匹配确定分类精度最大的关联规则,该规则对应类别即为大学语文阅读材料体裁的分类结果。实验结果表明:大学语文阅读材料的符号、词性、词汇特征可反映其体裁类别特点;该方法可实现大学语文阅读材料体裁分类,分类误差小。  相似文献   

18.
针对网络信息空间出现的大量短文本具有长度短、信息量少、特征稀疏、语法不规则等特点,传统信息检索技术无法有效地对其进行处理的问题,本研究以语义关联度为出发点,基于当前主流的语义知识源Wikipedia来研究短文本检索技术。根据Wikipedia页面中包含的分类结构信息,提出一种显式语义特征选择及关联度计算方法。在此基础上,提出一种低维显式语义空间下的短文本检索方法,并通过实验测试验证了该方法的可行性和有效性。研究结果表明,本研究与当前基于图论的方法和基于链接的方法相比,分别在评估指标MAP上提高了6%和4. 1%,在P@30上提高了10. 4%和5. 8%,在R-Prec上提高了6. 1%和3%。  相似文献   

19.
以国产GF-2卫星影像对北京市鹫峰国家森林公园主要植被类型进行面向对象分类,通过光谱、纹理、植被指数、季相特征属性的筛选并建立规则集,采用3种分类方法(四季时相知识规则结合CART决策树、四季时相的最邻近法、单季时相的最邻近法)进行植被类型分类。结果显示:3种分类方法的总体分类精度分别为85.6%、79.0%、60.1%。充分证明了在植被类型较复杂的区域内,利用GF-2影像多季时相特征,采用分层逐步分类法与多种分类方法相结合能够提高植被类型的分类精度,为国产高分遥感影像在森林资源监测与管理上的应用提供了技术支持。  相似文献   

20.
本文介绍了网络垃圾邮件的危害方法及手段,对垃圾邮件或附带有病毒的具有破坏性的电子邮件从理论上做出了分析,探讨了对网络垃圾邮件的防范、过滤对策,及对垃圾邮件发件人的地址解析方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号