首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于变型B-树的中文自动分词词典机制
引用本文:吴昊,潘无名,王硕,杨博.一种基于变型B-树的中文自动分词词典机制[J].技术与市场,2007(4):37-38.
作者姓名:吴昊  潘无名  王硕  杨博
作者单位:四川大学计算机学院 成都610065
摘    要:中文自动分词技术是许多中文智能领域尤其是中文信息的数据净化和数据挖掘的基础技术,而分词词典又是影响到中文自动分词的重要因素.本文针对中文地址数据净化和挖掘的具体需要提出了一种新的词典机制,即基于首字HASH,逐字二分和变型B-树的词典,从而明显提高了对短词的处理速度.

关 键 词:分词  B-树  二分查找  变型  中文地址  中文自动分词  速度  处理  短词  词典机制  HASH  数据挖掘  因素  影响  分词词典  基础技术  数据净化  中文信息  智能  分词技术
文章编号:24159694
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号