首页
|
本学科首页
官方微博
|
高级检索
全部专业
林业
农学(农艺学)
农业工程
农业基础科学
农作物
水产、渔业
畜牧、动物医学、狩猎、蚕、蜂
学报及综合类
园艺
植物保护
按
中文标题
英文标题
中文关键词
英文关键词
中文摘要
英文摘要
作者中文名
作者英文名
单位中文名
单位英文名
基金中文名
基金英文名
杂志中文名
杂志英文名
栏目英文名
栏目英文名
DOI
责任编辑
分类号
杂志ISSN号
检索
一种基于变型B-树的中文自动分词词典机制
引用本文:
吴昊,潘无名,王硕,杨博.一种基于变型B-树的中文自动分词词典机制[J].技术与市场,2007(4):37-38.
作者姓名:
吴昊
潘无名
王硕
杨博
作者单位:
四川大学计算机学院 成都610065
摘 要:
中文自动分词技术是许多中文智能领域尤其是中文信息的数据净化和数据挖掘的基础技术,而分词词典又是影响到中文自动分词的重要因素.本文针对中文地址数据净化和挖掘的具体需要提出了一种新的词典机制,即基于首字HASH,逐字二分和变型B-树的词典,从而明显提高了对短词的处理速度.
关 键 词:
分词
B-树
二分查找
变型
中文地址
中文自动分词
速度
处理
短词
词典机制
HASH
数据挖掘
因素
影响
分词词典
基础技术
数据净化
中文信息
智能
分词技术
文章编号:
24159694
本文献已被
CNKI
维普
万方数据
等数据库收录!
设为首页
|
免责声明
|
关于勤云
|
加入收藏
Copyright
©
北京勤云科技发展有限公司
京ICP备09084417号