基于文本分类的中文垃圾邮件过滤技术研究 |
| |
引用本文: | 朱军,饶元,傅雷扬,张宁,刘锴.基于文本分类的中文垃圾邮件过滤技术研究[J].长江大学学报,2012(1):102-105. |
| |
作者姓名: | 朱军 饶元 傅雷扬 张宁 刘锴 |
| |
作者单位: | [1]安徽农业大学信息与计算机学院,安徽合肥230036 [2]安徽农业大学网络中心,安徽合肥230036 |
| |
基金项目: | 国家自然科学基金项目(30971691);安徽省高校省级自然科学研究项目(KJ2007B248). |
| |
摘 要: | 由于语言上的差异,中文垃圾邮件过滤与英文邮件在信息处理技术上差别较大.针对中文垃圾邮件过滤的邮件训练集、过滤规则和分类器特征库更新不及时,经常出现误判和漏判等问题,以文本分类技术为基础,将基于规则方法和Bayes分类方法相结合,设计了一种中文垃圾邮件过滤方法,详细阐述了中文邮件过滤的邮件预处理、中文分词、特征选取等技术.试验结果表明,该方法可以明显改善中文垃圾邮件过滤效果.
|
关 键 词: | 中文垃圾邮件 过滤 文本分类 Bayes分类 特征选取 |
本文献已被 维普 等数据库收录! |
|